PONTIFÍCIA UNIVERSIDADE CATÓLICA DE GOIÁS
DEPARTAMENTO DE COMPUTAÇÃO
Trabalho de Conclusão de Curso
Orientando: Jailton Alkimin Louzada
Orientador: Prof. Alexandre Ribeiro
Jailton Alkimin Louzada - [email protected]









Introdução
Objetivo
Estrutura do trabalho
Reconhecimento de fala
Reconhecimento de fala por computador
Reconhecimento baseado em análise estatística
Demonstração do sistema
Resultados
Conclusão
Jailton Alkimin Louzada - [email protected]
O que é
reconhecimento
de fala?
Reconhecimento
de fala por
computador
Jailton Alkimin Louzada - [email protected]

Demonstrar técnicas de reconhecimento de
fala, mostrar sua aplicabilidade no mundo
real e implementar uma das técnicas.
Jailton Alkimin Louzada - [email protected]



Capítulo I – Introdução
Capítulo II – Reconhecimento de
fala
Capítulo III – Recursos para um
sistema de reconhecimento de fala
Jailton Alkimin Louzada - [email protected]


Capítulo IV – Aplicação
desenvolvida
Capítulo V – Conclusão
Jailton Alkimin Louzada - [email protected]
Jailton Alkimin Louzada - [email protected]



Reconhecedores baseados em
análise acústico fonética
Baseado em inteligência artificial
Reconhecedores por comparações de
padrões
Jailton Alkimin Louzada - [email protected]

Aquisição do sinal da fala

Extração de parâmetros

Reconhecimento do padrão
Jailton Alkimin Louzada - [email protected]
Jailton Alkimin Louzada - [email protected]

FRONT-END

MODELO ACÚSTICO

MODELO DE LINGUAGEM

RECONHECEDOR
Jailton Alkimin Louzada - [email protected]
Jailton Alkimin Louzada - [email protected]
Jailton Alkimin Louzada - [email protected]
Jailton Alkimin Louzada - [email protected]
Teste de níveis de confiança para locutores masculinos
FRENTE
TRÁS
DIREITA
ESQUERDA
PARAR
CASA
ENGENHO
CACHORRO
0.942226
0.906761
0.7225596
0.9726312
0.8047706
0.5923843
0.676384
0.5192723
0.886034
0.8970461
0.9767500
0.9968700
0.9156567
0.5972344
0.5446800
0.4392121
0.913943
0.9540179
0.8496834
0.9976766
0.7835052
0.4636432
0.5564411
0.4157359
0.887634
0.9944343
0.987986
0.9890701
0.8781567
0.3996932
0.4424377
0.4457201
Locutor 1
Locutor 2
Locutor 3
Locutor 4
Jailton Alkimin Louzada - [email protected]
Teste de níveis de confiança em ambientes ruidosos
5db
10db
15db
0.8496834
0.7010467
0.676384
Locutor 1
Jailton Alkimin Louzada - [email protected]


No reconhecimento dos comandos de fala, o sistema
se mostrou bem funcional tendo em média taxas de
92% de confidência para as palavras da gramática,
tanto ditas por mulheres como por homens.
Palavras fora do vocabulário, o sistema também se
mostrou bem eficiente, trazendo em média taxas de
48% de confiança para as palavras tanto ditas por
mulheres como por homens, que graças a limitação
do grau mínimo de confiança para se transcrever uma
palavra, que nesse projeto foi definido como acima
de 70%, não permitia que palavras fora do
vocabulário pudessem ser transcritas.
Jailton Alkimin Louzada - [email protected]
Jailton Alkimin Louzada - [email protected]
Download

Reconhecimento de fala por computador