PONTIFÍCIA UNIVERSIDADE CATÓLICA DE GOIÁS DEPARTAMENTO DE COMPUTAÇÃO Trabalho de Conclusão de Curso Orientando: Jailton Alkimin Louzada Orientador: Prof. Alexandre Ribeiro Jailton Alkimin Louzada - [email protected] Introdução Objetivo Estrutura do trabalho Reconhecimento de fala Reconhecimento de fala por computador Reconhecimento baseado em análise estatística Demonstração do sistema Resultados Conclusão Jailton Alkimin Louzada - [email protected] O que é reconhecimento de fala? Reconhecimento de fala por computador Jailton Alkimin Louzada - [email protected] Demonstrar técnicas de reconhecimento de fala, mostrar sua aplicabilidade no mundo real e implementar uma das técnicas. Jailton Alkimin Louzada - [email protected] Capítulo I – Introdução Capítulo II – Reconhecimento de fala Capítulo III – Recursos para um sistema de reconhecimento de fala Jailton Alkimin Louzada - [email protected] Capítulo IV – Aplicação desenvolvida Capítulo V – Conclusão Jailton Alkimin Louzada - [email protected] Jailton Alkimin Louzada - [email protected] Reconhecedores baseados em análise acústico fonética Baseado em inteligência artificial Reconhecedores por comparações de padrões Jailton Alkimin Louzada - [email protected] Aquisição do sinal da fala Extração de parâmetros Reconhecimento do padrão Jailton Alkimin Louzada - [email protected] Jailton Alkimin Louzada - [email protected] FRONT-END MODELO ACÚSTICO MODELO DE LINGUAGEM RECONHECEDOR Jailton Alkimin Louzada - [email protected] Jailton Alkimin Louzada - [email protected] Jailton Alkimin Louzada - [email protected] Jailton Alkimin Louzada - [email protected] Teste de níveis de confiança para locutores masculinos FRENTE TRÁS DIREITA ESQUERDA PARAR CASA ENGENHO CACHORRO 0.942226 0.906761 0.7225596 0.9726312 0.8047706 0.5923843 0.676384 0.5192723 0.886034 0.8970461 0.9767500 0.9968700 0.9156567 0.5972344 0.5446800 0.4392121 0.913943 0.9540179 0.8496834 0.9976766 0.7835052 0.4636432 0.5564411 0.4157359 0.887634 0.9944343 0.987986 0.9890701 0.8781567 0.3996932 0.4424377 0.4457201 Locutor 1 Locutor 2 Locutor 3 Locutor 4 Jailton Alkimin Louzada - [email protected] Teste de níveis de confiança em ambientes ruidosos 5db 10db 15db 0.8496834 0.7010467 0.676384 Locutor 1 Jailton Alkimin Louzada - [email protected] No reconhecimento dos comandos de fala, o sistema se mostrou bem funcional tendo em média taxas de 92% de confidência para as palavras da gramática, tanto ditas por mulheres como por homens. Palavras fora do vocabulário, o sistema também se mostrou bem eficiente, trazendo em média taxas de 48% de confiança para as palavras tanto ditas por mulheres como por homens, que graças a limitação do grau mínimo de confiança para se transcrever uma palavra, que nesse projeto foi definido como acima de 70%, não permitia que palavras fora do vocabulário pudessem ser transcritas. Jailton Alkimin Louzada - [email protected] Jailton Alkimin Louzada - [email protected]