Identificação de Voz Marcelo Lucena André Palhares Roteiro • • • • • Problema Hidden Markov Models (HMMs) Sistema de identificação de voz Resultados Conclusão Problema • Controlar o acesso a um determinado sistema a partir do teste biométrico de voz. • Controlar o acesso a lugares restritos. • Identificar pessoas em um ambiente. Problema • Não confundir identificação com reconhecimento de voz – Reconhecimento: apenas verificar se o sinal de entrada do sistema pertence a uma pessoa (no caso, já se sabe a qual pessoa da base de dados comparar) – Identificação: descobrir qual das pessoas da base de dados foi responsável por emitir o sinal de entrada do sistema Problema • Identificação dependente de texto – Para se dar acesso a pessoa, ela tem que dizer a frase correta • No caso, o seu próprio nome • Assim, deve ser rejeitada qualquer pessoa que disser algo diferente do seu próprio nome (se for usuária do sistema) Hidden Markov Models • Modelos probabilísticos de sinais • Geralmente utilizados na modelagem de sinais que variam durante o tempo – Voz, escrita, gestos, etc. • Quando se usa HMM para aprendizagem, o principal trabalho é estimar seus parâmetros – probabilidades de transição, distribuições de observações, etc. Hidden Markov Models • Consistem de N estados e probabilidades de transição de um estado para o outro • Cada estado possui uma distribuição de probabilidade das M observações de saída do sistema (HMM discreta) • Além disto, temos a distribuição de probabilidade inicial para a HMM Hidden Markov Models • Problema das moedas – Não se sabe quantas moedas foram lançadas, apenas o resultado dos lançamentos • Pode ser modelado com HMMs supondo apenas 1 moeda, 2 moedas, 3 moedas, etc. Hidden Markov Models Hidden Markov Models • Tipos de HMMs – Ergódico • Todos os estados são ligados a qualquer outro estado – Esquerda-direita • Utilizados em problemas cujos sinais são variáveis temporais (voz, por exemplo) – Misto • Mais versátil Hidden Markov Models Sistema de identificação de voz • Arquitetura Sistema de identificação de voz • Conjunto de treinamento – Amostras coletadas • Análise Espectral Sistema de identificação de voz • Vector quantization – Como são utilizadas HMMs discretas, devemos discretizar os vetores de características – Um vetor pertencerá a classe que lhe é mais próxima, baseado na distância euclidiana • HMMs – Foi utilizado o modelo esquerda-direita com variação de 5 a 15 estados – O número de iterações do algoritmo Baum-Welch variou entre 10 e 30. Sistema de identificação de voz • Seletor – Responsável por definir o limiar de aquele sinal ter sido emitido ou não pela mesma pessoa da HMM que está sendo comparado – O limiar é diferente para cada HMM, definido através log da probabilidade do conjunto de treinamento somado ao dobro do desvio padrão Resultados • Cenário 1 – – – – 2 pessoas cadastradas no sistema (2 HMMs) 21 amostras de entrada 5 amostras de pessoas cadastradas 16 amostras aleatórias • Cenário 2 – – – – 3 pessoas cadastradas no sistema (3HMMs) 30 amostras de entrada 8 amostras de pessoas cadastradas 22 amostras aleatórias Cenário 1 25 20 20 15 15 Modelo 1 / Cenario 1 10 10 Modelo 2 / Cenario 1 5 5 0 0 Acertos Erros Acertos 20 15 10 Modelo 2 / Cenario 1 5 0 Acertos Erros Erros Cenário 2 25 30 20 25 20 15 Modelo 1 / Cenario 2 10 15 Modelo 2 / Cenario 2 10 5 5 0 Acertos 0 Erros Acertos 25 20 15 Modelo 3 / Cenario 2 10 5 0 Acertos Erros Erros Conclusão e Trabalhos Futuros • HMM dá bons resultados também para identificação de voz. • Um estudo sobre qual a melhor característica espectral para as observações pode melhorar o desempenho. • Melhorar a quantização dos vetores. Perguntas ?