BIOMETRIA - VOICEPRINTS
Universidade Federal do Rio de Janeiro
Trabalho de Redes II (2007/2)
Professores: Luís Henrique Maciel Kosmalski Costa
Otto Carlos Muniz Bandeira Duarte
Viviane de França Oliveira
[email protected]
Sumário
1.
2.
3.
4.
5.
6.
7.
Introdução
O Sinal de Voz
Sistemas de Verificação de Locutor
Métodos de Classificação
Verificação Estatística
Conclusões
Perguntas
1. Introdução

Biometria de voz
◦ Processo de autenticação de um indivíduo
através da comparação de uma elocução de
entrada à modelos guardados em uma base
de dados (voiceprints);

Duas aplicações:
◦ Verificação de Locutor;
◦ Identificação de Locutor;
1. Introdução

Implementação de um sistema de
biometria por voz
◦
◦
◦
◦
Geração de base de dados
Pré-processamento do sinal
Extração de parâmetros do sinal
Uso de algoritmos de classificação
2. O sinal de Voz
Fala representada através de um sinal
(forma de onda acústica);
 Identificação de características
“dependentes de locutor”

◦ Característica Física: forma do trato vocal;
◦ Características adquiridas: “hábitos e
maneiras de falar”.
2. O Sinal de Voz
Forma do trato vocal estimada através do
espectro do sinal de voz;
 Extração de parâmetros do sinal

◦ Extração de coeficientes através de um
modelo;
◦ Adição de outras características
 Frequência fundamental de vibração das cordas
vocais

Geração de vetores de características
para entradas do sistema.
2. O Sinal de Voz

LPC (Linear Predictive Coding)
◦ Método efetivo e simples para extração de
parâmetros do sinal;
◦ Amostras do sinal modeladas como
combinações lineares de amostras anteriores;
2. O Sinal de Voz

MFCC (Mel-Frequency Cepstrum
Coefficients)
◦ Coeficientes derivados de um tipo de
representação cepstral do sinal;
◦ Escala logarítmica para posicionar as bandas
de frequência;
 Menos ênfase para frequências mais altas;
 Modelo mais próximo do sistema auditivo humano.
◦ Derivações (Delta-Cepstra).
3. Sistemas de Verificação de Locutor
3. Sistemas de Verificação de Locutor

Duas aplicações
◦ Sistemas dependentes de texto
◦ Sistemas não-dependentes de texto
4. Métodos de Classificação

Sistemas dependentes de texto
◦ DTW (Dinamic Time Warping);
◦ HMMs (Hidden Markov Models);

Sistemas não-dependentes de texto
◦ Quantização Vetorial;
◦ GMMs (Gaussian Mixture Models);
4. Métodos de Classificação

Métodos estocásticos
◦ Problema de Classificação Supervisionada
◦ Regra de Decisão de Bayes
4. Métodos de Classificação

GMMs (Gaussian Mixture Models)
◦ Funções densidade de probabilidade (fdps)dos
vetores acústicos modeladas através de
misturas de gaussianas;
◦ Modelo não temporal;
4. Métodos de Classificação

HMMs (Hidden Markov Models)
◦ Modelo temporal;
◦ Cada estado representa um GMM.
5.Verificação Estatística

Problema de Classificação binária

Medida de acurácia do sistema
◦ Taxa de aceitações falsas
◦ Taxa de rejeições falsas
6. Conclusões

Biometria por voz
◦ Vantagens




Método realizado de forma remota
Método não invasivo
Método mais viável e econômico
Pode ser aplicado a todo tipo de rede
◦ Desvantagens
 Sensibilidade a ruído e mudanças de canal
 Mudanças na voz do locutor devido a condições
emocionais extremas
 Entrada de senha (Verificação de Locutor)
7. Perguntas
1.
Quais são as vantagens e desvantagens do método de
biometria de voz quando comparado a outros
métodos de biometria?
Vantagens: O método de biometria por voz consiste em um método
remoto de autenticação, não-invasivo e mais econômico, quando
comparado a outros métodos, uma vez que não necessita de nenhum
hardware adicional, além de um microfone, podendo também fazer uso de
uma linha telefônica. Além disso, a voz pode ser processada através de
qualquer tipo de rede de comunicação, incluindo telefones móveis e VOIP.
Desvantagens: Algumas desvantagens desses sistemas envolvem
sensibilidade ao ruído, variações de canal e variações comportamentais
humanas, que podem diminuir a acurácia do sistema. Além disso, sistemas
de verificação de locutor necessitam da entrada de um pedido de
identificação prévia (uma senha), o que pode tornar o sistema menos
seguro e fazer com que o usuário demore mais tempo para efetuar sua
autenticação.
7. Perguntas
2.
Que tipo de características físicas e comportamentais de
um indivíduo são usadas para distinguir sua voz da voz
de outros locutores?
A característica física mais importante de um indivíduo usada na
identificação pela sua voz é a forma do seu trato vocal.
Características comportamentais envolvem a velocidade da fala,
efeitos prosódicos e dialetos.
7. Perguntas
3.
No que consiste a extração de parâmetros do sinal de
voz? Como ela é usada em um sistema de verificação de
locutor?
Após o pré-processamento do sinal de voz, aplica-se um modelo ao
mesmo para extração de vetores de coeficientes que modelam a
forma do trato vocal humano. Outras características como a
frequência fundamental (de vibração das cordas vocais) podem
ainda ser usadas como parâmetros importantes para a distinção
entre indivíduos.
Os vetores compostos por parâmetros, também chamados vetores
de características serão usados como entradas, tanto para a fase de
treino, quanto para a fase de teste de um sistema de verificação de
locutor.
7. Perguntas
4.
Quais são as etapas envolvidas na implementação de um
sistema de biometria por voz?
Gravação de elocuções para geração de uma base de dados, préprocessamento, extração de parâmetros do sinal de voz e
aplicação de algoritmos de classificação para reconhecimento de
padrões.
7. Perguntas
5.
Quais são os métodos para geração de modelos usados
para reconhecimento de padrões em sistemas de
verificação de locutor dependentes de texto? E naqueles
independentes de texto? Quais deles correspondem a
métodos estocásticos?
Em sistemas dependentes de texto, são usados os métodos DTW
(Dinamic Time Warping) e HMMs (Hidden Markov Models).
Em sistemas independentes de texto, são usados os métodos de
codebooks e GMMs (Gaussian Mixture Models).
Os métodos HMM e GMM correspondem aos métodos
estocásticos.
Download

BIOMETRIA - VOICEPRINTS