Identificação de Voz
Marcelo Lucena
André Palhares
Roteiro
•
•
•
•
•
Problema
Hidden Markov Models (HMMs)
Sistema de identificação de voz
Resultados
Conclusão
Problema
• Controlar o acesso a um determinado
sistema a partir do teste biométrico de
voz.
• Controlar o acesso a lugares restritos.
• Identificar pessoas em um ambiente.
Problema
• Não confundir identificação com
reconhecimento de voz
– Reconhecimento: apenas verificar se o sinal
de entrada do sistema pertence a uma
pessoa (no caso, já se sabe a qual pessoa da
base de dados comparar)
– Identificação: descobrir qual das pessoas da
base de dados foi responsável por emitir o
sinal de entrada do sistema
Problema
• Identificação dependente de texto
– Para se dar acesso a pessoa, ela tem que
dizer a frase correta
• No caso, o seu próprio nome
• Assim, deve ser rejeitada qualquer pessoa
que disser algo diferente do seu próprio
nome (se for usuária do sistema)
Hidden Markov Models
• Modelos probabilísticos de sinais
• Geralmente utilizados na modelagem de
sinais que variam durante o tempo
– Voz, escrita, gestos, etc.
• Quando se usa HMM para aprendizagem,
o principal trabalho é estimar seus
parâmetros
– probabilidades de transição, distribuições de
observações, etc.
Hidden Markov Models
• Consistem de N estados e probabilidades
de transição de um estado para o outro
• Cada estado possui uma distribuição de
probabilidade das M observações de
saída do sistema (HMM discreta)
• Além disto, temos a distribuição de
probabilidade inicial para a HMM
Hidden Markov Models
• Problema das moedas
– Não se sabe quantas moedas foram
lançadas, apenas o resultado dos
lançamentos
• Pode ser modelado com HMMs supondo
apenas 1 moeda, 2 moedas, 3 moedas,
etc.
Hidden Markov Models
Hidden Markov Models
• Tipos de HMMs
– Ergódico
• Todos os estados são ligados a qualquer outro
estado
– Esquerda-direita
• Utilizados em problemas cujos sinais são variáveis
temporais (voz, por exemplo)
– Misto
• Mais versátil
Hidden Markov Models
Sistema de identificação de voz
• Arquitetura
Sistema de identificação de voz
• Conjunto de treinamento
– Amostras coletadas
• Análise Espectral
Sistema de identificação de voz
• Vector quantization
– Como são utilizadas HMMs discretas, devemos
discretizar os vetores de características
– Um vetor pertencerá a classe que lhe é mais
próxima, baseado na distância euclidiana
• HMMs
– Foi utilizado o modelo esquerda-direita com variação
de 5 a 15 estados
– O número de iterações do algoritmo Baum-Welch
variou entre 10 e 30.
Sistema de identificação de voz
• Seletor
– Responsável por definir o limiar de aquele
sinal ter sido emitido ou não pela mesma
pessoa da HMM que está sendo comparado
– O limiar é diferente para cada HMM, definido
através log da probabilidade do conjunto de
treinamento somado ao dobro do desvio
padrão
Resultados
• Cenário 1
–
–
–
–
2 pessoas cadastradas no sistema (2 HMMs)
21 amostras de entrada
5 amostras de pessoas cadastradas
16 amostras aleatórias
• Cenário 2
–
–
–
–
3 pessoas cadastradas no sistema (3HMMs)
30 amostras de entrada
8 amostras de pessoas cadastradas
22 amostras aleatórias
Cenário 1
25
20
20
15
15
Modelo 1 /
Cenario 1
10
10
Modelo 2 /
Cenario 1
5
5
0
0
Acertos
Erros
Acertos
20
15
10
Modelo 2 /
Cenario 1
5
0
Acertos
Erros
Erros
Cenário 2
25
30
20
25
20
15
Modelo 1 /
Cenario 2
10
15
Modelo 2 /
Cenario 2
10
5
5
0
Acertos
0
Erros
Acertos
25
20
15
Modelo 3 /
Cenario 2
10
5
0
Acertos
Erros
Erros
Conclusão e Trabalhos Futuros
• HMM dá bons resultados também para
identificação de voz.
• Um estudo sobre qual a melhor
característica espectral para as
observações pode melhorar o
desempenho.
• Melhorar a quantização dos vetores.
Perguntas
?
Download

Identificação de Voz