BIOMETRIA - VOICEPRINTS Universidade Federal do Rio de Janeiro Trabalho de Redes II (2007/2) Professores: Luís Henrique Maciel Kosmalski Costa Otto Carlos Muniz Bandeira Duarte Viviane de França Oliveira [email protected] Sumário 1. 2. 3. 4. 5. 6. 7. Introdução O Sinal de Voz Sistemas de Verificação de Locutor Métodos de Classificação Verificação Estatística Conclusões Perguntas 1. Introdução Biometria de voz ◦ Processo de autenticação de um indivíduo através da comparação de uma elocução de entrada à modelos guardados em uma base de dados (voiceprints); Duas aplicações: ◦ Verificação de Locutor; ◦ Identificação de Locutor; 1. Introdução Implementação de um sistema de biometria por voz ◦ ◦ ◦ ◦ Geração de base de dados Pré-processamento do sinal Extração de parâmetros do sinal Uso de algoritmos de classificação 2. O sinal de Voz Fala representada através de um sinal (forma de onda acústica); Identificação de características “dependentes de locutor” ◦ Característica Física: forma do trato vocal; ◦ Características adquiridas: “hábitos e maneiras de falar”. 2. O Sinal de Voz Forma do trato vocal estimada através do espectro do sinal de voz; Extração de parâmetros do sinal ◦ Extração de coeficientes através de um modelo; ◦ Adição de outras características Frequência fundamental de vibração das cordas vocais Geração de vetores de características para entradas do sistema. 2. O Sinal de Voz LPC (Linear Predictive Coding) ◦ Método efetivo e simples para extração de parâmetros do sinal; ◦ Amostras do sinal modeladas como combinações lineares de amostras anteriores; 2. O Sinal de Voz MFCC (Mel-Frequency Cepstrum Coefficients) ◦ Coeficientes derivados de um tipo de representação cepstral do sinal; ◦ Escala logarítmica para posicionar as bandas de frequência; Menos ênfase para frequências mais altas; Modelo mais próximo do sistema auditivo humano. ◦ Derivações (Delta-Cepstra). 3. Sistemas de Verificação de Locutor 3. Sistemas de Verificação de Locutor Duas aplicações ◦ Sistemas dependentes de texto ◦ Sistemas não-dependentes de texto 4. Métodos de Classificação Sistemas dependentes de texto ◦ DTW (Dinamic Time Warping); ◦ HMMs (Hidden Markov Models); Sistemas não-dependentes de texto ◦ Quantização Vetorial; ◦ GMMs (Gaussian Mixture Models); 4. Métodos de Classificação Métodos estocásticos ◦ Problema de Classificação Supervisionada ◦ Regra de Decisão de Bayes 4. Métodos de Classificação GMMs (Gaussian Mixture Models) ◦ Funções densidade de probabilidade (fdps)dos vetores acústicos modeladas através de misturas de gaussianas; ◦ Modelo não temporal; 4. Métodos de Classificação HMMs (Hidden Markov Models) ◦ Modelo temporal; ◦ Cada estado representa um GMM. 5.Verificação Estatística Problema de Classificação binária Medida de acurácia do sistema ◦ Taxa de aceitações falsas ◦ Taxa de rejeições falsas 6. Conclusões Biometria por voz ◦ Vantagens Método realizado de forma remota Método não invasivo Método mais viável e econômico Pode ser aplicado a todo tipo de rede ◦ Desvantagens Sensibilidade a ruído e mudanças de canal Mudanças na voz do locutor devido a condições emocionais extremas Entrada de senha (Verificação de Locutor) 7. Perguntas 1. Quais são as vantagens e desvantagens do método de biometria de voz quando comparado a outros métodos de biometria? Vantagens: O método de biometria por voz consiste em um método remoto de autenticação, não-invasivo e mais econômico, quando comparado a outros métodos, uma vez que não necessita de nenhum hardware adicional, além de um microfone, podendo também fazer uso de uma linha telefônica. Além disso, a voz pode ser processada através de qualquer tipo de rede de comunicação, incluindo telefones móveis e VOIP. Desvantagens: Algumas desvantagens desses sistemas envolvem sensibilidade ao ruído, variações de canal e variações comportamentais humanas, que podem diminuir a acurácia do sistema. Além disso, sistemas de verificação de locutor necessitam da entrada de um pedido de identificação prévia (uma senha), o que pode tornar o sistema menos seguro e fazer com que o usuário demore mais tempo para efetuar sua autenticação. 7. Perguntas 2. Que tipo de características físicas e comportamentais de um indivíduo são usadas para distinguir sua voz da voz de outros locutores? A característica física mais importante de um indivíduo usada na identificação pela sua voz é a forma do seu trato vocal. Características comportamentais envolvem a velocidade da fala, efeitos prosódicos e dialetos. 7. Perguntas 3. No que consiste a extração de parâmetros do sinal de voz? Como ela é usada em um sistema de verificação de locutor? Após o pré-processamento do sinal de voz, aplica-se um modelo ao mesmo para extração de vetores de coeficientes que modelam a forma do trato vocal humano. Outras características como a frequência fundamental (de vibração das cordas vocais) podem ainda ser usadas como parâmetros importantes para a distinção entre indivíduos. Os vetores compostos por parâmetros, também chamados vetores de características serão usados como entradas, tanto para a fase de treino, quanto para a fase de teste de um sistema de verificação de locutor. 7. Perguntas 4. Quais são as etapas envolvidas na implementação de um sistema de biometria por voz? Gravação de elocuções para geração de uma base de dados, préprocessamento, extração de parâmetros do sinal de voz e aplicação de algoritmos de classificação para reconhecimento de padrões. 7. Perguntas 5. Quais são os métodos para geração de modelos usados para reconhecimento de padrões em sistemas de verificação de locutor dependentes de texto? E naqueles independentes de texto? Quais deles correspondem a métodos estocásticos? Em sistemas dependentes de texto, são usados os métodos DTW (Dinamic Time Warping) e HMMs (Hidden Markov Models). Em sistemas independentes de texto, são usados os métodos de codebooks e GMMs (Gaussian Mixture Models). Os métodos HMM e GMM correspondem aos métodos estocásticos.