Flávia Viegas de Andrade
ANÁLISE DE PARÂMETROS ESPECTRAIS DA VOZ EM
CRIANÇAS SAUDÁVEIS DE 4 A 8 ANOS
Dissertação apresentada ao curso de pósgraduação
em
Fonoaudiologia
da
Universidade Veiga de Almeida, como
requisito parcial para a obtenção do grau
de Mestre.
Orientadora: Profª Dra. Heidi Elisabeth Baeck
Rio de Janeiro
2009
UNIVERSIDADE VEIGA DE ALMEIDA
SISTEMA DE BIBLIOTECAS
Rua Ibituruna, 108 – Maracanã
20271-020 – Rio de Janeiro – RJ
Tel.: (21) 2574-8845 Fax.: (21) 2574-8891
FICHA CATALOGRÁFICA
A553a
Andrade,
Flávia Viegas de
FICHA
CATALOGRÁFICA
Análise de parâmetros espectrais da voz em
crianças saudáveis de 4 a 8 anos/ Flávia Viegas de
Andrade, 2009.
71p. ; 30 cm.
Dissertação (Mestrado) – Universidade Veiga de
Almeida, Mestrado em Fonoaudiologia, Rio de
Janeiro, 2009.
Orientação: Heidi Elisabeth Baeck
1. Crianças - voz. 2. Acústica da fala. I. Baeck, Heidi
Elisabeth. (orientador). II. Universidade Veiga de
Almeida, Mestrado em Fonoaudiologia. III. Título.
CDD – 616.855
DeCS
Ficha Catalográfica elaborada pela Biblioteca Setorial Tijucal/UVA
FLÁVIA VIEGAS DE ANDRADE
ANÁLISE DE PARÂMETROS ESPECTRAIS DA VOZ EM CRIANÇAS SAUDÁVEIS
DE 4 A 8 ANOS.
Dissertação apresentada ao curso de pós-graduação em
Fonoaudiologia da Universidade Veiga de Almeida, como
requisito parcial para a obtenção do grau de Mestre.
Aprovada em 07 de agosto de 2009.
BANCA EXAMINADORA
Profa. Heidi Elisabeth Baeck, D. Sc.
Universidade Veiga de Almeida – UVA/RJ
Prof. Ciríaco Cristovão Tavares Atherino, D. Sc.
Universidade Veiga de Almeida – UVA/RJ
Prof. Domingos Sávio Ferreira de Oliveira, D. Sc.
Universidade Veiga de Almeida – UVA/RJ
Profa. Zuleica Antonia de Camargo, D. Sc.
Pontifícia Universidade Católica de São Paulo - PUC/SP
ii
Esta pesquisa não poderia ter sido realizada se não a colaboração e
amor incondicionais de meus queridos pais, irmã gêmea e noivo.
iii
Meus profundos agradecimentos
A Deus e a todos os espíritos de luz que me acompanham, por me darem saúde e força para
realização deste estudo.
Aos meus amados pais, Norma e Hélio, que estão sempre presentes e, cuja formação que me
proporcionaram, ajudou a trilhar meu caminho até aqui.
À minha querida irmã gêmea e fonoaudióloga, Danieli, por estar sempre ao meu lado e
trilhar sua trajetória dentro da fonoaudiologia junto comigo.
Ao meu querido noivo, Marcos, pelo amor incondicional e paciência nas diversas horas em
que estive ausente.
À Profa. Dra. Heidi Elisabeth Baeck por me incentivar com seus conhecimentos de
engenharia aplicados à análise acústica de voz e por todo apoio, dedicação e disposição em toda
trajetória de elaboração deste trabalho.
Ao Prof. Dr. Ciríaco Cristovão Tavares Atherino por todo carinho e disposição em todos os
momentos.
Agradeço com imenso carinho
À Profa. Dra. Sílvia Maria Rebelo Pinho, por ter me conquistado desde sua primeira aula e,
pelo incentivo constante em basear meu raciocínio clínico na fisiologia vocal.
À Profa. Dra. Zuleica Camargo, por me ajudar a percorrer o fascinante mundo da análise
acústica da voz.
iv
Agradeço ainda
Ao Prof. Dr. Domingos Sávio Ferreira de Oliveira pelas sugestões feitas na banca de
qualificação deste trabalho e ao professor Dr. John Van Borsel pelo auxílio na documentação da
viagem até a Universidade de Ghent, na Bélgica, durante o curso de mestrado.
À toda equipe da Policlínica Maria Cristina Roma Paugartten e às equipes de professores e
direção das escolas pelo encaminhamento das crianças e grande parceria formada.
Às amigas da turma de mestrado pelo companheirismo, apoio e entusiasmo com que me
acompanharam por todo o curso.
Às crianças e seus responsáveis por permitirem a realização deste trabalho.
v
“Um cientista precisa manter a veneração pelo desconhecido. Se perder esse frescor, vai com ele
a flexibilidade que faz a criação científica”.
Marcelo Gleiser
vi
RESUMO
A presente pesquisa teve como objetivo investigar parâmetros espectrais descritivos da
voz de crianças saudáveis entre quatro e oito anos. Foram selecionadas 207 crianças sem
transtornos da expressão oral, de ambos os sexos, divididas por faixa etária. Os sinais de fala
foram obtidos a partir das gravações de sentenças-veículo. Foram selecionados segmentos das
sete vogais orais do português falado no Brasil em posição tônica para a estimação das medidas
de frequência fundamental (f0) e frequências dos formantes (F1, F2 e F3). Foi ainda estimada a
largura de banda de F1 da vogal [i]. O recorte e processamento dos sinais foram realizados com o
auxílio do software Praat. Os achados mostraram valores médios de cada parâmetro investigado,
sendo observado um decréscimo na frequência fundamental e nas frequências dos formantes com
o aumento da idade. A idade de seis anos foi apontada como determinante para as mudanças
acústicas das vocalizações infantis. Diferenças de gênero, no qual o sexo feminino tende a
mostrar freqüências mais elevadas também foram apontadas. O presente estudo refere-se a uma
investigação ampla, diferenciada em termos número de vogais investigadas e número de crianças
participantes e, portanto, os valores paramétricos apontados consistem em uma importante
contribuição para a língua portuguesa falada no Brasil.
Palavras-chave: análise acústica, processamento digital, crianças
vii
ABSTRACT
The aim of this study was to investigate spectral parameters on voices of healthy children
between four and eight years old. Two hundred and seven children of both genders without
speech or voice disorders were selected and separated by age groups. Recordings were obtained
from carrier phrases and segments of the seven oral vowels of Brazilian Portuguese in the
stressed syllable were selected to estimate the fundamental frequency (f0) and the frequencies of
the first three formants (F1, F2 e F3), and also the bandwidth of F1 of vowel [i]. Software Praat
was used to cut and process these recordings. Our findings showed medium values for each
parameter investigated and we observed that the formant frequency and fundamental frequency
values decreased as age increased. We pointed out that acoustical changes on voice of children
can be determinate at the age of six years old. We found gender differences which females
presented higher frequencies in these parameters. The present study refers to a wide investigation
which differs from others in number of vowels investigated and number of subjects. For this
reason, these parametric values consist in an important contribution to the Portuguese language
spoken in Brazil
Key Words: acoustic analysis, digital processing, children
viii
SUMÁRIO
1. INTRODUÇÃO, p.11
2. OBJETIVO, p.15
3. FUNDAMENTOS TEÓRICOS, p.16
3.1 PROCESSAMENTO DIGITAL DO SINAL, p.16
3.2 PARÂMETROS DESCRITIVOS DA VOZ, p.17
3.2.1 Frequência fundamental e frequências dos formantes, p.17
3.2.2 Largura de banda, p.18
3.3 TRATO VOCAL INFANTIL, p.19
4. REVISÃO DA LITERATURA, p.20
4.1 A VOZ ENQUANTO OBJETO DE PESQUISA, p. 20
4.2 A VOZ INFANTIL, p.22
4.3 O ESTADO DA ARTE, p.27
5. METODOLOGIA, p.31
5.1 CASUÍSTICA, p.31
5.2 MATERIAIS, p.32
5.2.1 Materiais de seleção de participantes, p.32
5.2.2 Materiais de aquisição e análise de dados, p.32
ix
5.3. PROCEDIMENTOS, p.32
5.3.1 Procedimentos de seleção dos participantes, p.32
5.3.2 Aquisição de Dados, p.33
5.3.3 Processamento de Sinais, p.34
5.3.4 Análise estatística, p.35
6. RESULTADOS, p.36
7. DISCUSSÃO, p.49
7.1 MEDIDAS DOS PARÂMETROS ESPECTRAIS, p.49
7.2 DIFERENÇAS ENTRE FAIXAS ETÁRIAS E GÊNEROS, p.54
8. CONCLUSÃO, p.61
REFERÊNCIAS BIBLIOGRÁFICAS, p.62
ANEXO, p.67
(A) Escala RASATI, p.67
APÊNDICES, p.64
(A) Termo de Consentimento Livre e Esclarecido, p.68
(B) Roteiro de Avaliação do Sistema Ressonantal, p.71
x
11
1. INTRODUÇÃO
A voz sempre exerceu fascínio em seus estudiosos, sendo por vezes, considerada um
mistério a ser desvendado. Assim como comumente ocorre na ciência, avanços tecnológicos
representaram marcos na evolução da pesquisa de voz. Em 1877 Thomas Edison fez o que é
mundialmente reconhecida como a primeira gravação da voz humana, embora, recentemente,
já se discuta a possibilidade deste feito ter sido realizado 17 anos antes (em abril de 1860), por
um parisiense pouco conhecido, Édouard-Léon Scott de Martinville (The New York Times,
Nov 2008). A possibilidade de registrar vozes e produzi-las tantas vezes quanto necessário
introduziu um importante fator de confiabilidade aos resultados obtidos na pesquisa da voz
humana.
O século XX marca o período moderno da avaliação da voz. Avaliações vocais que
eram realizadas com base exclusivamente na percepção auditiva do avaliador, passaram a
contar com o auxílio de equipamentos capazes de relacionar diferentes características do som.
Os oscilógrafos, a partir da década de 1920, possibilitaram observar a amplitude do som em
função do tempo, enquanto os espectrógrafos analógicos, a partir de 1940, auxiliaram a
determinar a composição de frequências do som (BEHLAU e col., 2001). Ambos
contribuíram significativamente para o desenvolvimento da avaliação do som da voz, porém
tornaram-se obsoletos após o surgimento da avaliação computadorizada (JOTZ e col., 2001).
Um dos mais importantes avanços ocorreu em 1970, com a introdução do processamento
digital de sinais. Sistemas baseados em circuitos analógicos de tempo contínuo passaram a ser
12
implementados através de sistemas digitais de tempo discreto (MITRA, 2001). Os
computadores passaram a produzir espectrogramas semelhantes aos espectrógrafos, porém
com diversas vantagens, tais como a visualização do gráfico na tela do computador e o
armazenamento digital, além do significativo incremento na velocidade e confiabilidade de
obtenção dos parâmetros acústicos (BEHLAU e col., 2001).
Atualmente a avaliação da voz é basicamente realizada de duas formas: avaliação
perceptivo-auditiva e avaliação espectrográfica computadorizada. A avaliação perceptivoauditiva, por vezes denominada análise psicoacústica (JOTZ e col., 2001), se caracteriza por
não utilizar qualquer ferramenta além da sensibilidade auditiva. Capaz de avaliar detalhes de
sonoridade, em termos metodológicos, a subjetividade inerente a este tipo de avaliação vocal
pode ser considerada uma desvantagem. A avaliação perceptivo-auditiva é amplamente
utilizada na prática clínica fonoaudiológica e é base para seleção de amostras em diversas
pesquisas relativamente recentes (DORNELLES e col.; 2001; CARRARA-DE-ANGELIS e
col.; 2001; BENETON e col.; 2004; CORAZZA e col.; 2004; NEMR e col.; 2005). A análise
espectrográfica tem relevância e aplicabilidade indiscutíveis, porém não deixa de impor certo
grau de subjetividade à avaliação vocal, uma vez que a leitura dos espectrogramas depende do
avaliador que, necessariamente, deve apresentar um considerável grau de conhecimento
específico (CARRARA-DE-ANGELIS e col., 2001).
A partir de 1980, além do método matemático de estimação espectral que gera o
espectrograma (Short Time Fourier Transformer STFT / Fast Fourier Transformer FFT),
outros estimadores espectrais (como o Linear Predictive Coding - LPC) e diversos algoritmos
de extração de parâmetros acústicos (KENT e READ, 1996) ampliaram a análise acústica da
voz. Abriu-se, portanto, a possibilidade de realizar análises vocais exclusivamente
quantitativas, resultando em valores numéricos promediados. A objetividade concedida por
estes métodos viabiliza o uso dos parâmetros acústicos obtidos em sistemas de
13
reconhecimento automático de padrões vocais (BAECK e SOUZA, 2003; 2004). Sistemas
estes, que consistem na base do desenvolvimento de ferramentas de auxílio diagnóstico e
terapêutico.
Apesar da diversidade nas formas de avaliação vocal e da extensa possibilidade de
aplicação das mesmas, pode ser observada na literatura uma tendência de se investigar
parâmetros espectrográficos em uma população predominantemente adulta (PETERSON e
BARNEY, 1952; BEHLAU, 1984; BEHLAU e col.; 1988; ANDRIANOPOULOS e col.,
2001; NEMR e col.; 2005; GELFER e MIKOS, 2005). A população infantil é pesquisada de
forma mais restrita, tanto no que se refere à quantidade de pesquisas, quanto à diversidade de
parâmetros acústicos investigados.
Dentre as pesquisas que investigaram a voz infantil observa-se um número maior de
publicações que mostram achados referentes à fonte glótica, tais como medidas de frequência
fundamental e intensidade, com seus valores absolutos e/ou índices de perturbação
(NIEDZIELSKA, 2001; NIEDZIELSKA e col., 2001; WERTZNER e col., 2005,
NICOLLAS e col., 2008; CAPPELLARI e CIELO, 2008, BRAGA e col., 2009; SCHOTT e
col. 2009). Em número menor, algumas pesquisas apontam parâmetros descritivos do trato
vocal infantil (frequências dos formantes) (BEHLAU, 1984; BEHLAU e col.; 1988; BUSBY
e PLANT, 1995; HUBER e col., 1999). A amplitude dos formantes é pouco descrita na
literatura de vozes infantis (HUBER e col., 1999) enquanto que medidas de banda dos
formantes não foram encontradas nesta população.
A relevância de se buscar a padronização de parâmetros acústicos da voz infantil pode
ser apontada, no mínimo, em duas direções. A primeira refere-se ao potencial de aplicação
dos padrões em questão, no campo do auxílio diagnóstico de patologias vocais na infância. A
segunda está associada ao estudo das emissões orais (choro/vocalizações) em bebês. A
carência, na literatura, de padrões vocais em crianças que possam dar suporte às discussões de
14
relação entre o comportamento evolutivo das oralizações de bebês e o desenvolvimento dos
movimentos articulatórios na criança, tem sido apontada por grupos desta linha de pesquisa
(ROTHGÄNGER, 2003; BAECK e SOUZA, 2007).
Parece evidente a importância de se realizar pesquisas que contemplem as
características acústicas da voz infantil de forma ampla, gerando resultados cada vez mais
consistentes, que possam contribuir para a compreensão global do comportamento evolutivo
da voz humana.
15
2. OBJETIVO
Aplicando métodos de processamento digital de sinais, o presente estudo teve como
objetivo investigar as medidas de parâmetros espectrais (frequência fundamental, frequência
dos três primeiros formantes e largura de banda de F1 da vogal [i]) descritivos da voz de
crianças saudáveis entre quatro e oito anos. Com amostras significativamente mais
consistentes do que aquelas até então apresentadas na literatura, pretendeu-se contribuir para a
determinação de padrões acústicos vocais infantis do português brasileiro.
16
3. FUNDAMENTOS TEÓRICOS
Os conceitos relacionados ao processamento digital do sinal, parâmetros descritivos da
voz e particularidades anatômicas do trato vocal infantil consistem em pontos importantes
para a compreensão do conteúdo global deste trabalho. Desta forma, tais conceitos serão
adequadamente abordados neste capítulo.
3.1 PROCESSAMENTO DIGITAL DO SINAL
Podem ser encontradas, na literatura da engenharia elétrica, diversas ferramentas
matemáticas essencialmente de tempo contínuo, como as transformadas de Laplace e de
Fourier (RABINER, 1978). Porém o advento da tecnologia digital gerou a necessidade de
obter ferramentas equivalentes no tempo discreto, como as Transformada Z e a Transformada
Discreta de Fourier. Os conhecimentos em torno destas e de diversas outras ferramentas
foram agrupados sob o nome de Processamento Digital de Sinais (Digital Signal Processing DSP) (NEBEKER, 1998).
São relativamente numerosos os métodos de estimação espectral e algoritmos de
extração de parâmetros (processados no tempo ou na frequência), aplicáveis à análise vocal.
Em geral, os nomes são associados aos procedimentos do método em si ou ao pesquisador que
os desenvolveu (como a Função de Autocorrelação para extração de f0 ou o algoritmo de
McCandless para extração de formantes, respectivamente).
17
3.2 PARÂMETROS DESCRITIVOS DA VOZ
Os parâmetros capazes de descrever uma voz consistem nas características físicas do
som desta voz. Tais características são domínio da área de conhecimento da física acústica,
motivo pelo qual os parâmetros descritivos da voz são comumente denominados de
“parâmetros acústicos”. Da mesma forma, a análise que envolve obtenção de parâmetros
acústicos foi particularmente denominada de “análise acústica”, termo unânime na literatura
correlata.
É grande o número de parâmetros acústicos que podem ser estimados de um segmento
vocal, porém, a busca é sempre no caminho de definir quais parâmetros, associados ou
isolados, carregam informações a respeito da voz investigada. Os parâmetros temporais
(processados exclusivamente no domínio do tempo) estão associados à duração, de parte ou
de todo o segmento analisado, enquanto os espectrais (processados no domínio da frequência)
estão associados aos componentes da onda complexa (espectro da voz). A seguir serão
comentados os parâmetros investigados no presente trabalho.
3.2.1 Frequência Fundamental (f0) e Frequência dos Formantes (Fn)
É amplamente conhecido que a voz é resultante do som produzido na glote a partir da
vibração das pregas vocais, acrescido de modificações nas cavidades de ressonância, que
funcionam como um filtro atenuando e enfatizando faixas de frequências (CARRARA-DEANGELIS e col., 2001; PINHO, 2003). A frequência fundamental (f0) e as frequências dos
formantes são parâmetros clássicos que caracterizam a fonte glótica e o filtro ressonantal,
respectivamente. Mais especificamente, a frequência fundamental corresponde ao
componente periódico mais baixo (grave) do som produzido na glote (GOLDFIELD, 2000) e
as faixas de frequência que apresentam picos de energia (determinados pelo filtro) são
denominadas de formantes (Fn) (CARRARA-DE-ANGELIS e col., 2001; PINHO, 2003;
GREGIO, 2006; BAECK e SOUZA, 2007).
18
Em geral, os três primeiros formantes são os mais relevantes para os estudos da voz,
contudo, os dois primeiros, F1 e F2, são os que apresentam uma associação clara com a
geometria do trato vocal, conferindo identidade fonética às vogais. (PINHO e CAMARGO,
2001; GREGIO, 2006; LIMA e col., 2007; MAGRI e col., 2007). A frequência do primeiro
formante está relacionada ao deslocamento da língua no plano vertical (altura da língua) e
com a abertura da mandíbula e a frequência do segundo formante relaciona-se ao
deslocamento ântero-posterior da língua (plano horizontal) (GREGIO, 2006). O terceiro
formante (F3) possui relação com as duas cavidades formadas pela posição da língua, ou seja,
uma cavidade atrás e outra à frente da constrição da língua (LIMA e col., 2007). No entanto,
correlações com os órgãos fonoarticulatórios ainda geram controvérsia na literatura.
A qualidade vocal de um indivíduo sofre influência da fonte sonora e do filtro, no
entanto, frequentemente a avaliação da fonte sonora é mais contemplada pelos pesquisadores
(STEFFEN e MOSCHETTI, 1997; NIEDZIELSKA, 2001; NIEDZIELSKA e col., 2001;
JOTZ e col., 2001; WERTZNER e col., 2005; FELIPPE e col., 2006; BRAGA e col., 2009,
SCHOTT e col., 2009).
3.2.2 Largura de Banda
A largura de banda do formante, simplesmente denominada de largura de banda ou
banda de formante consiste na extensão da faixa de frequência efetiva de resposta do
ressoador (MAGRI e col., 2009). Uma vez que a banda é variável em função da magnitude do
formante, em uma relação inversamente proporcional, os métodos de estimação da largura de
banda têm como base o intervalo entre dois pontos na envoltória espectral, que antecedem e
sucedem o pico, determinados por cortes onde a intensidade decresce 3 dB em relação à
frequência central do formante (pico da envoltória).
19
3.3 TRATO VOCAL INFANTIL
As bases anatômicas e fisiológicas da laringe infantil são relativamente pouco
conhecidas se comparadas às bases da laringe adulta. No entanto, sabe-se que a laringe
infantil não corresponde a uma miniatura da laringe do adulto, uma vez que existem diversas
diferenças entre elas (HERSAN, 2003).
O tamanho e o formato do trato vocal são fatores determinantes nas características do
som a ser emitido e dependem diretamente da idade e gênero. O trato vocal infantil é mais
curto que o trato vocal do adulto e, assim como nos adultos, observa-se uma diferença nas
medidas de comprimento se considerado o gênero da criança. Tendo como referência o trato
vocal adulto masculino, o trato infantil (oito anos) apresenta, em média, medidas 25% e 42%
menores, para meninos e meninas, respectivamente. Desta forma, as frequências dos
formantes são mais agudas em crianças do que em adultos, e mais agudas em meninas do que
nos meninos (BEHLAU e col., 2001).
Assim como o comprimento do trato vocal, o comprimento das pregas vocais infantis
também mostra suas particularidades. Hersan (2003) especifica que as medidas de
comprimento das pregas vocais mantêm-se bastante próximas, para ambos os gêneros, até a
idade de dez anos, quando começam a se diferenciar.
20
4. REVISÃO DA LITERATURA
4.1 A VOZ ENQUANTO OBJETO DE PESQUISA
As primeiras pesquisas de voz baseavam-se na percepção auditiva da mesma. As
avaliações da qualidade vocal eram realizadas através de julgadores treinados que, na maioria
das vezes, se concentravam nos aspectos glóticos e no campo das alterações vocais
(CAMARGO e MADUREIRA, 2004).
Embora a pesquisa sobre as alterações vocais exigisse grupos controle, ou seja,
indivíduos com as estruturas laríngeas saudáveis, a investigação da voz normal era
relativamente pouco enfocada. Com o surgimento de novas tecnologias de avaliação vocal
(análise acústica computadorizada) a possibilidade de investigar a voz patológica com um
conjunto de parâmetros sistemáticos, gerou a necessidade de se definir padrões paramétricos
de normalidade, motivando diversos pesquisadores a desenvolverem estudos focados na
produção da voz de indivíduos saudáveis (BUSBY e PLANT, 1995; HUBER e col., 1999;
CORAZZA e col., 2004; FELLIPE e col., 2006; BAECK e SOUZA, 2007, NICOLLAS e
col.; 2008, CAPPELLARI e CIELO, 2008, BRAGA e col., 2009, SCHOTT e col., 2009).
O uso da espectrografia na pesquisa da voz rendeu à literatura algumas publicações
fundamentais que deram luz a diversos estudos que se seguiram ao longo do tempo. Em 1952,
Peterson e Barney (citados em Behlau e col.,1988) investigaram parâmetros supraglóticos, ou
seja, as frequências dos três primeiros formantes de dez vogais do inglês americano em uma
amostra de 76 sujeitos (61 adultos e 15 crianças). Com base nos resultados deste trabalho, os
21
autores elaboraram o polígono acústico das vogais do inglês e formam historicamente
reconhecidos por tal contribuição. No entanto, quatro anos antes, 1948, Delattre (citado em
Behlau e col.,1988) já havia apresentado um triângulo acústico das vogais do francês,
elaborado com frequências dos dois primeiros formantes. Além do polígono vocálico francês,
Delattre desenvolveu um trabalho notável sobre a interpretação fisiológica dos
espectrogramas, relacionando as frequências dos três primeiros formantes com seus locais de
configuração no trato vocal (Delattre,1951).
As frequências dos dois primeiros formantes das vogais do português de Portugal
foram pesquisadas por Martins, em 1971 (citado em Behlau e col.,1988) a partir das vozes
normais de oito adultos do sexo masculino.
Os achados de um estudo envolvendo o
português do Brasil, falado na cidade de São Paulo, foram publicados em 1984 (BEHLAU,
1984).
Com diversos objetivos específicos, vozes normais e/ou patológicas, aspectos glóticos
e/ou supraglóticos, a partir da década de 80, cresceu o número de publicações que utilizaram a
espectrografia computadorizada como ferramenta de avaliação da voz (GLAZE e col., 1988;
1990; BUSBY e PLANT, 1995; ANDRIANOPOULOS e col.; 2001; NEMR e col.; 2005). E,
a partir da década de 90, surgem os trabalhos com base na estimação de parâmetros
quantitativos com processamento digital de sinais e estimadores espectrais diferentes dos
implementados no espectrograma (HUBER e col., 1999, BAECK e SOUZA, 2004; 2007;
MAGRI e col., 2007, LIMA e col., 2007). Estas ferramentas vêm motivando pesquisadores
que apresentam um interesse especial pelo caráter objetivo proporcionado por essa
metodologia.
22
4.2 A VOZ INFANTIL
A voz infantil foi investigada de forma mais restrita em relação ao adulto. Os
primeiros estudos nesta população foram desenvolvidos na linha de estabelecer análises
comparativas com a voz adulta.
Já citados, Peterson e Barney, em 1952, desenvolveram um estudo que possivelmente
represente um dos pioneiros no que se refere à investigação da voz infantil (amostra de 61
adultos e 15 crianças). Além da análise perceptivo-auditiva com 76 julgadores, as frequências
dos três primeiros formantes das vogais da língua inglesa [a], [i], [u], [æ] foram analisadas a
partir do espectrograma. A amostra de falantes infantis foi composta por 15 crianças de ambos
os sexos na faixa etária de nove anos. Os resultados apontaram que as frequências dos
formantes diferiram substancialmente entre os indivíduos analisados de acordo com o sexo.
Eguchi e Hirsh (1969), citados em Busby e Plant (1995), pesquisaram através de análise
espectrográfica, as frequências dos dois primeiros formantes de vozes de 84 crianças entre
três e treze anos e adultos falantes do inglês americano. As vogais pesquisadas foram as
mesmas do estudo anterior, no entanto foram utilizadas sentenças no lugar de monossílabos.
O estudo mostrou decréscimo nas frequências dos formantes à medida que a idade da criança
aumentou e que estas mudanças foram mais significativas para crianças menores de cinco
anos e também para crianças de seis a treze anos.
Os estudos que se seguiram ao longo das décadas de 80 e 90 confirmaram, em linhas
gerais, tais achados, mostrando particularidades apenas nas faixas etárias. Behlau (1984)
investigou as frequências dos três primeiros formantes das sete vogais orais e cinco nasais do
português brasileiro a partir de espectrogramas gerados com tecnologia analógica. As vogais
foram emitidas de forma isolada e sustentada por 30 crianças entre oito e doze anos e 60
adultos entre 18 a 45 anos, todos pareados por sexo. A autora apontou que não foi possível o
registro espectrográfico da frequência do terceiro formante da vogal [u] em 37,7% das
23
emissões e apontou ainda que as relações entre as frequências de F2 e F1 foram praticamente
constantes para todas as vogais nos dois grupos de falantes. Segundo a autora, a constância
desta relação é que preserva a identidade fonética das vogais, mesmo que os valores absolutos
dos formantes sejam muito diferentes entre as idades e sexo. Os valores absolutos das
frequências dos formantes mostraram-se significativamente mais altos em crianças, em
relação aos 60 adultos. A diferença entre os formantes apresentados por crianças e adultos foi
atribuída às diferenças no tamanho do trato vocal destas populações. A autora não mencionou
ter investigado, nas crianças, diferenças nos parâmetros em função do gênero. Behlau refere
ter estimado também a frequência fundamental nessa mesma população, no entanto, somente
da vogal [a].
Glaze e col. (1988) investigaram os efeitos da idade, sexo, estatura e peso sobre a
produção vocal de 121 crianças com idades entre cinco e onze anos. A frequência
fundamental, jitter, shimmer e proporção harmônico-ruído foram estimados da vogal [a]
sustentada. Os autores obtiveram significância estatística na correlação entre frequência
fundamental e sexo, com valores maiores para as meninas. Num estudo semelhante,
envolvendo os mesmos parâmetros e faixa etária dos participantes, porém incluindo a vogal
[i] e três intensidades diferentes na emissão das vogais: fraca, normal e forte, os mesmos
autores investigaram uma amostra de 97 crianças (GLAZE e col., 1990). Os resultados
mostraram diferenças estatisticamente significantes com o aumento da intensidade, para os
quatro parâmetros investigados.
Em uma abordagem que incluiu vozes patológicas, Steffen e Moschetti (1997)
investigaram as medidas de jitter e shimmer em 131 crianças saudáveis e 117 disfônicas, entre
seis e dez anos. Os autores concluíram que estes parâmetros não foram eficazes para
determinar normalidade ou patologia vocal nestas crianças. Niedzielska e col. (2001), em
oposição, referiram que jitter, shimmer, assim como os demais parâmetros investigados,
24
frequência fundamental (f0), tremor da frequência fundamental e proporção harmônico-ruído,
se revelaram parâmetros relevantes na tarefa de diferenciar vozes normais e patológicas.
Neste estudo foram investigadas 46 crianças entre quatro e quatorze anos, nas condições pré e
pós-tratamento de nódulos vocais. No mesmo ano, a autora investigou os mesmos parâmetros
em desordens orgânicas e funcionais da voz, comparando 112 crianças portadoras de
diferentes distúrbios do aparelho fonador e 31 crianças sem alterações vocais (grupo
controle), com idades entre três e dezesseis anos (NIEDZIELSKA, 2001). Divergindo de suas
próprias conclusões, apontadas no trabalho anterior (NIEDZIELSKA e col., 2001), os achados
deste trabalho confirmaram diferença estatisticamente significante apenas para a proporção
harmônico-ruído.
Entre os trabalhos que priorizaram a investigação dos parâmetros acústicos
supraglóticos, as autoras chinesas Yang e Mu (1989) investigaram a frequência do terceiro
formante (F3) da vogal [a] em indivíduos saudáveis, sendo 209 crianças entre três e doze anos
(104 meninos e 105 meninas) e 40 adultos pareados por sexo. Contrariamente aos conceitos
tradicionais consagrados pela literatura, os resultados deste estudo mostraram que existe uma
significante diferença na frequência do terceiro formante da vogal [a] entre crianças do sexo
masculino e feminino. De acordo com as autoras, esta diferença começa a se desenvolver aos
três anos e se torna substancial aos seis anos de idade.
Em 1995, Busby e Plant estimaram a frequência fundamental e as frequências dos três
primeiros formantes do inglês australiano das vozes de 40 crianças divididas em quatro
grupos: cinco, sete, nove e onze anos, sendo cinco meninos e cinco meninas em cada grupo.
Os resultados mostraram que os valores da frequência fundamental decresceram com o
aumento da idade, porém não foram encontradas diferenças significativas deste parâmetro
entre os sexos. As frequências dos três primeiros formantes, da mesma forma, mostraram um
decréscimo em função do aumento da idade, sendo este decréscimo mais consistente nas
25
faixas de cinco a sete anos e nove a onze anos.
Frequências mais altas para meninas
(diferenças entre sexos) foram observadas em F1, para vogais [æ], [a] e [u], e em F2 para quase
todas as vogais.
Gilbert e col. (1997) inovaram no que se refere à faixa etária e ao delineamento
longitudinal da pesquisa. Foram investigadas as frequências dos dois primeiros formantes em
vocalizações espontâneas de quatro meninos entre 15 e 36 meses de vida. As gravações foram
realizadas em cinco momentos: aos 15, 18, 21, 24 e 36 meses de vida. Os resultados
indicaram que tanto o F1 quanto o F2 permaneceram relativamente imutáveis antes dos 24
meses de vida, porém passaram a assumir um comportamento descendente entre o 24º e 36º
mês.
Huber e col. (1999) desenvolveram um estudo abrangente envolvendo a f0 e as
frequências e amplitudes dos três primeiros formantes em vozes de crianças e adultos falantes
do inglês norte americano. Cento e oitenta indivíduos foram pareados por sexo e dispostos em
grupos de 20 participantes cada, nas seguintes faixas etárias: 4,6,8,10,12,14,16,18 anos e 20 a
30 anos (adultos). A vogal [a] foi produzida três vezes por cada sujeito e as frequências dos
formantes foram obtidas através da análise de LPC (Linear Predictive Coding). As amplitudes
dos formantes foram medidas pela mais alta amplitude harmônica na área de cada formante.
Os resultados mostraram que a frequência do primeiro formante aumenta com a intensidade e
muda em função da idade e do sexo. As frequências de F2 e F3 mudam em função da idade e
do sexo. As amplitudes dos formantes seguiram as tendências das diferenças de níveis de
pressão sonora e não apresentaram mudanças em função do sexo e idade. A f0 diminuiu com o
aumento da idade.
Lee e col. (1999) analisaram a variabilidade da duração, da frequência fundamental,
das frequências dos formantes e do envelope espectral em função do sexo e idade.
Participaram do estudo 436 crianças com idades entre cinco e dezessete anos e 56 adultos
26
(com idades entre 25 e 50 anos), falantes do inglês americano. Para obtenção das medidas, foi
utilizada uma sentença-veículo, porém para as crianças de cinco e seis anos foram utilizadas
repetições de palavras isoladas. As crianças foram divididas em grupos com intervalo de faixa
etária de um ano. Os resultados mostraram que a redução na variabilidade intra-sujeito dos
aspectos acústicos (temporais e espectrais) com a idade, é a maior tendência associada ao
desenvolvimento da fala/voz em crianças normais. Os autores ainda referiram que a
diferenciação entre a frequência fundamental masculina e feminina e entre os padrões de
frequências dos formantes, inicia-se aos onze anos e se torna totalmente estabelecida aos
quinze anos. Durante este período de tempo, as mudanças nas frequências dos formantes de
falantes masculinos mantêm uma relação aproximadamente linear com a idade, enquanto que
tal tendência é menos óbvia nos falantes do sexo feminino.
Perry e col. (2001) analisaram as medidas de frequência fundamental e frequência dos
três primeiros formantes de 80 crianças com idades de quatro a dezesseis anos. Os
participantes foram divididos em quatro grupos, nas seguintes faixas etárias: 4,8,12 e 16 anos,
sendo 20 em cada grupo, pareados por sexo. Os objetivos do estudo foram examinar estas
medidas acústicas e a habilidade de ouvintes em identificar os gêneros das vozes. Foram
analisadas sete vogais do inglês americano, sendo que as amostras vocais foram coletadas a
partir de uma sentença-veículo, na qual foram completados vocábulos com estas vogais. Num
segundo momento, 20 adultos tiveram a tarefa de identificar os gêneros das vozes gravadas.
Os resultados mostraram que a análise das frequências dos formantes pôde diferenciar os
gêneros, mesmo em crianças muito jovens (faixa etária de quatro anos), enquanto que a
análise da frequência fundamental pôde diferenciar os sexos após os doze anos.
27
4.3 O ESTADO DA ARTE
Nos últimos anos cresceu consideravelmente o número de publicações que
investigaram a voz infantil, sob seu aspecto patológico (BENETTON e col., 2004;
WERTZNER e col.; 2005; MOURA e col., 2008; HAMDAN e col., 2009; ANDRADE, 2009)
ou, em condições de normalidade (VANZELLA, 2006; FUCHS e col., 2007; NICOLLAS e
col., 2008; BAKER e col., 2008; CAPPELLARI e CIELO, 2008; SCHOTT e col., 2009;
BRAGA e col., 2009), mostrando que o estudo dessa população é uma tendência atual. Os
métodos utilizados para avaliar as vozes das crianças nestes estudos mostram-se
diversificados.
Benetton e col. (2004) investigaram os efeitos da rinite alérgica sobre a qualidade da
voz de 40 crianças alérgicas entre sete e doze anos, baseados exclusivamente em parâmetros
psicoacústicos. A análise comparativa com o grupo controle não confirmou diferenças
estatisticamente significantes para nenhum parâmetro investigado. Wertzner e col. (2005)
avaliaram 20 crianças com transtorno fonológico e 20 crianças sem o transtorno entre quatro e
dez anos, a partir das emissões isoladas e sustentadas das vogais [a], [ε] e [i]. A frequência
fundamental da vogal [ε] e as médias de intensidade vocal apresentaram-se menores no grupo
com transtorno fonológico em relação ao grupo controle. Andrade (2009) investigou a f0 e as
frequências de F1, F2 e F3 das vogais [a], [i] e [u] em 50 crianças respiradoras orais de cinco a
dez anos e comparou ao grupo controle. A autora encontrou diferenças estatísticas na f0 das
vogais [i] e [u], no entanto diferenças estatísticas nas frequências dos formantes não foram
encontradas entre os dois grupos.
Os parâmetros acústicos e psicoacústicos das vozes de crianças portadoras da
síndrome de Down (MOURA e col., 2008) e síndrome de déficit de atenção e hiperatividade
(HAMDAN e col., 2009) apontaram uma frequência fundamental mais grave para as crianças
com as síndromes, ao serem comparadas com os grupos controle. Além da diferença
28
observada na frequência fundamental, a pesquisa que envolveu crianças com síndrome de
Down, ainda apontou diferenças significativas nas frequências de F1 e F2, sendo que a relação
entre as frequências de F1 e F2 revelou um prejuízo na distinção das vogais no grupo com a
síndrome, refletindo uma diminuição na inteligibilidade da fala.
Entre os autores que contribuíram para a compreensão das características da voz em
crianças normais, encontra-se Vanzella (2006), que investigou 182 crianças entre sete a dez
anos, de ambos os gêneros, frequentadores de escolas públicas e particulares de São Carlos
(SP). A partir de uma análise acústica computadorizada da vogal sustentada [a], a autora
referiu ter obtido, entre outros parâmetros pouco descritos na literatura, uma frequência
fundamental média de 237 Hz para os participantes.
Fuchs e col. (2007) analisaram vozes de 21 meninos que cantavam profissionalmente
em um coral, com objetivo de verificar o potencial da análise acústica para estimar o início da
muda vocal. Com um delineamento longitudinal, a mesma criança teve sua voz falada gravada
mensalmente, durante um período de três anos, entre nove e doze anos, e reavaliada uma vez
entre treze e quinze anos. Os resultados mostraram mudanças significativas nas medidas de
irregularidade da frequência fundamental e intensidade (jitter e shimmer, repectivamente) em
torno de seis meses antes da muda vocal, levando os autores a concluírem pela efetividade
destes parâmetros acústicos na detecção do início da muda vocal.
Nicollas e col. (2008) investigaram as vozes de 212 crianças entre seis e doze anos
com o objetivo de investigar mudanças nas vozes de crianças normais antes da muda vocal.
Além da estimação da frequência fundamental (f0), do jitter e do shimmer, foram estimados
outros parâmetros pouco descritos na literatura. Os participantes foram divididos nas
seguintes faixas etárias: seis anos (9 crianças); sete anos (24 crianças); oito anos (18 crianças);
nove anos (24 crianças); dez anos (27 crianças); onze anos (55 crianças); doze anos (54
crianças). Os sinais analisados referem-se a trechos de um segundo recortados da emissão
29
sustentada da vogal [a]. Os resultados mostraram que a f0 decresceu de 268 Hz para 234 Hz
em meninos e 260 Hz para 239 Hz em meninas e que as medidas de jitter e shimmer não
variaram significantemente com o sexo e a idade. Os autores concluíram que a f0 diminuiu
com a idade e foi menor para os meninos em relação às meninas mesmo antes do período de
mutação da voz.
Baker e col. (2008) investigaram a influência do tipo de tarefa vocal na medida da
frequência fundamental (f0), em 48 crianças saudáveis falantes do inglês americano, com
idades entre cinco anos e sete anos e onze meses. A frequência fundamental da vogal [a] foi
estimada em quatro situações vocais diferenciadas: a) sustentada por cinco segundos; b)
sustentada dentro de uma palavra, no final de uma frase; c) repetição de uma frase e d)
contagem de um até dez. Cada criança foi avaliada por dois julgadores treinados, sendo que os
resultados revelaram uma significante diferença neste parâmetro entre as tarefas. A contagem
apontou valores maiores de f0 quando comparada com a sustentação da vogal no final da frase
e a repetição da frase, no entanto, não foram observados efeitos significativos das tarefas em
relação à idade e ao sexo. Os autores não mencionaram comparação com a vogal sustentada.
No mesmo ano, Cappellari e Cielo realizaram uma pesquisa que analisou medidas
acústicas de vozes saudáveis de 23 crianças brasileiras, dividas em três faixas etárias: 4,0 a
4,11 (n=7), 5,0 a 5,11 (n=11), 6,0 a 6,8 (n=5). Foram analisadas as medidas de f0, proporção
harmônico-ruído (PHR), índice de turbulência vocal e medidas de perturbação da intensidade
e f0, a partir da vogal [a] sustentada por no mínimo três segundos. Para seleção das crianças,
as autoras utilizaram questionário com os pais, triagem auditiva e avaliação perceptivoauditiva (Escala RASAT). Os resultados das médias mínimas e máximas para determinação
do intervalo de normalidade da frequência fundamental, por faixa etária, foram: 4 anos, sexo
masculino (M): 266 Hz a 375 Hz; 4 anos, sexo feminino (F): 285 Hz a 355 Hz; 5 anos, sexo
M: 247 Hz a 350 Hz; 5 anos, sexo F: 247 Hz a 355 Hz; 6 anos, sexo M: 274 Hz a 325 Hz e 6
30
anos, sexo F: 247 a 315 Hz. Os resultados mostraram ainda que no grupo de quatro anos de
idade, a f0 foi discretamente menor em relação à literatura, o índice de variação da f0 foi maior
em relação aos outros grupos e que houve significante diferença na PHR entre esse grupo e os
demais.
Um estudo realizado no estado do Rio de Janeiro (SCHOTT e col., 2009) avaliou a
frequência fundamental de 122 crianças normais de seis a oito anos, de ambos os sexos.
Foram realizadas análise perceptivo-auditiva, através da escala RASAT e análise acústica
computadorizada. Foi investigada a frequência fundamental da vogal [ε] sustentada. Os
resultados mostraram que a média da f0 foi 239 Hz para as meninas e 237 Hz para os meninos,
obtendo-se desta forma, uma média geral de 238 Hz. O estudo também contemplou valores de
moda de f0, sendo 237 Hz no sexo feminino e 233 Hz no sexo masculino, obtendo-se a média
da moda de 235 Hz.
BRAGA e col. (2009) analisaram a frequência fundamental da vogal [ε] do português
brasileiro em 100 crianças, na faixa etária de seis a oito anos, pareadas por sexo. Os
participantes passaram por uma triagem vocal realizada através de avaliação perceptivoauditiva (escala RASAT) e a investigação da f0 foi realizada a partir de análise
computadorizada (com o auxílio do programa Voxmetria). Os resultados mostraram uma f0
média de 249 Hz, com tendência significantemente decrescente à medida que a idade da
criança aumentou. Os autores ainda apontaram para diferenças estatísticas entre os sexos, de
forma que, aos seis anos, observaram-se valores de f0 mais elevados nos meninos. A tendência
decrescente de f0, frente ao aumento da idade, mostrou-se mais significativa nos meninos, do
que nas meninas.
31
5. METODOLOGIA
O projeto deste trabalho foi aprovado pelo Comitê de Ética em Pesquisa da Secretaria
Municipal de Saúde da Prefeitura do Rio de Janeiro sob número: 180/2008, com necessidade
de assinatura do Termo de Consentimento Livre e Esclarecido (apêndice A). O estudo foi
realizado pela autora em uma sala do setor de fonoaudiologia da Policlínica Maria Cristina
Roma Paugartten (SMS - CAP. 3.1).
5.1 CASUÍSTICA
A amostra do presente trabalho foi constituída por segmentos vocais de crianças de
quatro a oito anos. Obteve-se uma amostra de 1.449 segmentos vocais de 207 crianças
divididas por sexo e idade. Esses segmentos geraram 13.041 valores numéricos relativos aos
parâmetros investigados.
As crianças foram pré-selecionadas nos setores de pediatria e odontologia da
Policlínica Maria Cristina Roma Paugartten e em duas escolas. A pré-seleção foi realizada
pelos profissionais de saúde e educação destas unidades, respeitando os critérios: condições
de expressão oral e saúde geral dentro dos padrões de normalidade, idade entre quatro e oito
anos.
Uma vez pré-selecionadas, as crianças foram encaminhadas para o setor de
fonoaudiologia da Policlínica Maria Cristina Roma Paugartten onde foram submetidas a
32
procedimentos de seleção (item 5.3.1). Foram selecionadas crianças cuja expressão oral e
qualidade vocal apresentaram-se dentro dos padrões de normalidade.
5.2 MATERIAIS
5.2.1 Materiais de seleção de participantes
- Escala RASATI (anexo A): Consiste em um protocolo de avaliação perceptivo-auditiva da
fonte glótica proposto por Pinho e Pontes (2008);
- Roteiro de avaliação do sistema ressonantal (apêndice B): Consiste em uma adaptação do
roteiro de avaliação perceptivo-auditiva do som nas cavidades supraglóticas proposto por
Pinho (2003).
5.2.2 Materiais de aquisição e análise de dados
- Um notebook, marca HP, modelo DV 1000, com sistema operacional Windows XP;
- Software de análise acústica Praat versão 5008 disponível on line no site:
http://www.fon.hum.uva.nl/praat/
- Microfone marca SHURE, modelo SM 58.
- Software aplicativo de análise estatística SAS versão 6.04
5.3 PROCEDIMENTOS
5.3.1 Procedimentos de seleção dos participantes
Assim como descrito na casuística, as crianças da presente pesquisa foram incluídas
mediante procedimentos de seleção. Neste item serão descritos os procedimentos realizados
após a pré-seleção e encaminhamento ao setor de fonoaudiologia.
No setor citado as crianças foram recebidas, juntamente com seus pais ou
responsáveis, em uma entrevista individual com a fonoaudióloga autora da presente pesquisa,
onde foram submetidas a uma triagem da expressão oral através do exame fonético REALFA.
A triagem teve como objetivo a exclusão de crianças com expressão oral desviante do padrão
33
adequado à faixa etária. Concomitantemente, a fala espontânea e as sentenças-veículo foram
gravadas com objetivo de dar suporte à posterior análise perceptivo-auditiva, fase de
prosseguimento seletivo, caso a criança não tivesse sido excluída por inadequação da
expressão oral. Os pais ou responsáveis assinaram o Termo de Consentimento Livre e
Esclarecido durante a entrevista.
A análise perceptivo-auditiva foi realizada por duas fonoaudiólogas especialistas em
voz com aplicação da Escala RASATI e roteiro de avaliação do sistema ressonantal (item
5.2.1). Foram incluídas as crianças que apresentaram resultados dentro dos padrões de
normalidade em ambas as avaliações. Foram consideradas normais na avaliação da fonte
glótica crianças que apresentaram: grau 0 nos seis itens avaliados, com exceção do item
soprosidade que poderia apresentar grau 0 ou 1. Esta tolerância foi permitida uma vez que a
população infantil pode apresentar soprosidade em grau 1 (discreto) como padrão de
normalidade (Behlau e col., 2001). Foram consideradas normais na avaliação de ressonância
as crianças que apresentaram ressonância equilibrada.
5.3.2 Aquisição de Dados
O protocolo de aquisição especificado a seguir é semelhante ao aplicado nos estudos
de Jorge e col. (2004); Lima e col. (2007) e Magri e col. (2007).
Os sinais de fala dos quais foram extraídos os segmentos analisados foram obtidos a
partir das gravações de sentenças-veículo (“Fale____ para mim”), que foram preenchidas com
os vocábulos “pápa”, “pépe”, “pêpe”, “pípi”, “pópo”, “pôpo” e “púpu”, de forma que estes
estímulos fossem registrados por meio de repetições destas frases. Foram selecionados
segmentos das sete vogais orais em posição tônica para a estimação das medidas de
frequência fundamental (f0), frequência dos formantes (F1, F2 e F3) e largura de banda de F1
da vogal [i].
34
As emissões foram gravadas em uma sala silenciosa, em mono canal, com uma taxa de
amostragem de 22.050 Hz, em formato “.wav”, através do software Praat versão 5008 em um
notebook com sistema operacional Windows XP, com um microfone da marca SHURE,
modelo SM 58, posicionado a distância de 10 cm dos lábios da criança.
5.3.3 Processamento de sinais
Os dados foram submetidos a procedimentos de pré-processamento (recorte dos
segmentos vocálicos), processamento (estimação de parâmetros acústicos) e análise
estatística. O pré-processamento e processamento foram realizados com auxílio do software
Praat (item 5.2.2.), enquanto que a análise estatística foi realizada com o software SAS 6.04
(SAS Institute, Inc., Cary, North Carolina)
O recorte das vogais foi realizado de forma manual, porém houve a preocupação em
definir e seguir critérios de recorte passíveis de serem implementados em um futuro sistema
de recorte automático. O marco inicial foi definido no trecho do sinal onde a energia
apresentava-se acima de 20% da energia máxima. Da mesma forma, o marco final foi
estabelecido onde a energia apresentava-se abaixo de 20% da mesma. Tal porcentagem foi
estabelecida empiricamente com base em investigação experimental. Este procedimento é
conservador no sentido de reduzir a probabilidade de obtenção de trechos não estacionários.
Foram estimados os parâmetros espectrais clássicos: frequência fundamental e
frequência dos três primeiros formantes, representantes da fonte glótica e de ressonância,
respectivamente. Além destes, foi estimada a largura de banda do primeiro formante da vogal
[i]. Esta análise não foi estendida aos demais segmentos vocálicos pesquisados por se tratar de
uma investigação complementar de caráter exploratório. A vogal [i] foi definida, em especial,
devido ao afastamento característico dos dois primeiros formantes observado na envoltória
espectral da mesma.
35
Devido ao grande número de estimações envolvidas, foi utilizado um script
(ferramenta que extrai automaticamente, de forma padronizada, as medidas paramétricas)
criado pelos autores, que viabilizou a otimização do tempo de processamento e evitou
possíveis erros de manuseio na sequência dos procedimentos de estimação.
5.3.4 Análise estatística
A análise estatística foi composta pelos seguintes métodos:
Para comparação das medidas de frequência fundamental e frequência dos formantes
entre os sexos foi utilizado o teste de Mann-Whitney e para comparação entre as quatro faixas
etárias foi realizada a análise de variância de Kruskal-Wallis e o teste de comparações
múltiplas de Duncan. Foi usado teste não paramétrico, pois a maioria das medidas de
frequências não apresentou distribuição normal (Gaussiana), devido à dispersão dos dados,
falta de simetria da distribuição e pela rejeição da hipótese de normalidade segundo o teste de
Shapiro-Wilk (W). O critério de determinação de significância adotado foi o nível de 5%, ou
seja, valor de p menor ou igual a 0,05.
36
6. RESULTADOS
Os achados da presente pesquisa encontram-se sumarizados nas tabelas expostas a
seguir. Além da descrição dos dados, testes estatísticos foram aplicados com o objetivo de
verificar a existência de diferenças estatisticamente significantes entre os valores paramétricos
obtidos para os sexos masculino e feminino, assim como para as quatro diferentes faixas
etárias investigadas.
São expostos os valores referentes à análise espectral, sendo que todos os valores
expostos referem-se à estimação de médias. A opção por expor diretamente valores médios
deu-se em função do grande número de estimações obtidas neste trabalho, um total de 13.041
valores numéricos. Pelo mesmo motivo, os achados referentes aos parâmetros acústicos foram
divididos em 23 tabelas, de acordo com cada vogal, para facilitar a visualização direta do
comportamento do parâmetro acústico ao longo do desenvolvimento infantil.
Tabela I - Distribuição dos informantes por faixa etária e sexo.
4-5 anos
5-6 anos
6-7 anos
7-8 anos
Masculino
n = 22
n = 28
n = 24
n = 24
Feminino
n = 21
n = 33
n = 29
n = 26
37
A seguir encontram-se expostos os valores referentes à análise da frequência
fundamental (f0) e das frequências dos três primeiros formantes das sete vogais orais do
português e os achados referentes aos testes de diferença estatística (Tabelas II a XXIIII).
Tabela II - Média e Desvio Padrão de Frequência Fundamental e Frequências do Primeiro,
Segundo e Terceiro Formantes da vogal [a]
4-5 anos
Parâmetros
f0 (Hz)
5-6 anos
6-7 anos
7-8 anos
Sexo
ME
(±DP)
ME
(±DP)
ME
(±DP)
ME
(±DP)
masc
270
26,1
259
24,5
258
25,3
243
22,4
fem
259
24,1
247
22,1
256
27,5
246
28,0
masc
1093
193,9
1010
219,8
984
88,5
870
195,4
fem
1187
163,3
1256
154,3
1131
175,6
1048
132,1
masc
2003
156,4
1889
180,5
1814
157,6
1668
201,3
fem
2157
190,0
2141
143,8
2063
174,8
1914
187,2
masc
3593
408,7
3536
404,2
3480
224,0
3326
211,8
fem
3661
357,7
3528
310,5
3476
316,9
3402
276,0
F1 (Hz)
F2 (Hz)
F3 (Hz)
Tabela III - Teste de Diferença Estatística para a Variável Sexo na Vogal [a]
Parâmetros
p valor
[a] f0
0,099
[a] F1
0,0001*
[a] F2
0,0001*
[a] F3
0,24
p=nível descritivo do teste de Mann-Whitney; *expressa diferença significativa (nível de 5%).
38
Tabela IV - Teste de Diferença Estatística para a Variável Faixa Etária (Gn) na Vogal [a]
Comparações Múltiplas de Duncan
Parâmetros
p valor
[a] f0
0,001*
[a] F1
0,0001*
[a] F2
0,0001*
[a] F3
0,001*
G1/G2
G1/G3
G1/G4
G2/G3
G2/G4
G3/G4
*
*
*
*
*
*
*
*
*
*
*
*
*
p=nível descritivo da ANOVA de Kruskal-Wallis; *expressa diferença significativa (nível de 5%);
G1=4 a 5 anos; G2=5 a 6 anos ; G3=6 a 7 anos; G4=7 a 8 anos.
Tabela V - Média e Desvio Padrão de Frequência Fundamental e Frequências do Primeiro,
Segundo e Terceiro Formantes da vogal [ε]
4-5 anos
Parâmetros
f0 (Hz)
5-6 anos
6-7 anos
7-8 anos
Sexo
ME
(±DP)
ME
(±DP)
ME
(±DP)
ME
(±DP)
masc
266
21,5
248
34,2
266
21,9
245
23,5
fem
258
19,1
250
19,1
252
23,9
246
29,0
masc
719
106,6
666
125,6
735
86,0
656
108,4
fem
735
134,9
734
91,1
728
94,7
713
105,8
masc
2688
205,4
2659
157,2
2585
187,5
2521
187,8
fem
2850
128,0
2851
183,1
2721
233,3
2647
135,6
masc
3652
329,8
3656
278,3
3641
255,6
3519
268,1
fem
3824
357,8
3790
246,7
3678
240,6
3579
168,2
F1 (Hz)
F2 (Hz)
F3 (Hz)
39
Tabela VI - Teste de Diferença Estatística para a Variável Sexo na Vogal [ε]
Parâmetros
p valor
[ε] f0
0,092
[ε] F1
0,048*
[ε] F2
0,0001*
[ε] F3
0,007*
p=nível descritivo do teste de Mann-Whitney; *expressa diferença significativa (nível de 5%).
Tabela VII - Teste de Diferença Estatística para a Variável Faixa Etária (Gn) na Vogal [ε]
Comparações Múltiplas de Duncan
Parâmetros
p valor
[ε] f0
0,0003*
[ε] F1
0,15
[ε] F2
0,0001*
[ε] F3
0,0005*
G1/G2
G1/G3
G1/G4
*
*
*
*
G2/G3
G2/G4
G3/G4
*
*
*
*
*
*
p=nível descritivo da ANOVA de Kruskal-Wallis; *expressa diferença significativa (nível de 5%);
G1=4 a 5 anos; G2=5 a 6 anos ; G3=6 a 7 anos; G4=7 a 8 anos.
40
Tabela VIII - Média e Desvio Padrão de Frequência Fundamental e Frequências do Primeiro,
Segundo e Terceiro Formantes da vogal [e]
4-5 anos
Parâmetros
f0 (Hz)
5-6 anos
6-7 anos
7-8 anos
Sexo
ME
(±DP)
ME
(±DP)
ME
(±DP)
ME
(±DP)
masc
275
24,5
258
25,3
271
20,9
252
25,1
fem
267
15,1
252
18,3
260
24,1
247
27,3
masc
534
52,7
496
55,4
530
46,0
493
54,1
fem
528
43,0
496
45,2
515
58,1
482
62,9
masc
2929
167,4
2924
184,1
2830
212,0
2739
164,6
fem
3043
162,6
3096
187,6
2913
226,9
2832
179,6
masc
3814
273,4
3806
213,6
3656
228,0
3553
232,0
fem
3837
256,8
3844
272,6
3728
236,5
3665
195,9
F1 (Hz)
F2 (Hz)
F3 (Hz)
Tabela IX - Teste de Diferença Estatística para a Variável Sexo na Vogal [e]
Parâmetros
p valor
[e] f0
0,038*
[e] F1
0,24
[e] F2
0,0001*
[e] F3
0,048*
p=nível descritivo do teste de Mann-Whitney; *expressa diferença significativa (nível de 5%).
41
Tabela X - Teste de Diferença Estatística para a Variável Faixa Etária (Gn) na Vogal [e]
Comparações Múltiplas de Duncan
Parâmetros
p valor
[e] f0
G1/G2
G1/G3
G1/G4
G2/G3
G2/G4
0,0001*
*
*
*
*
[e] F1
0,0001*
*
*
*
*
[e] F2
0,0001*
*
*
*
*
[e] F3
0,0001*
*
*
*
*
G3/G4
*
p=nível descritivo da ANOVA de Kruskal-Wallis; *expressa diferença significativa (nível de 5%);
G1=4 a 5 anos; G2=5 a 6 anos ; G3=6 a 7 anos; G4=7 a 8 anos.
Tabela XI - Média e Desvio Padrão de Frequência Fundamental, Frequências do Primeiro,
Segundo e Terceiro Formantes e Largura de Banda de F1 da vogal [i]
4-5 anos
Parâmetros
f0 (Hz)
5-6 anos
6-7 anos
7-8 anos
Sexo
ME
(±DP)
ME
(±DP)
ME
(±DP)
ME
(±DP)
masc
301
30,8
279
30,6
288
24,1
275
34,0
fem
287
30,2
276
22,7
282
27,3
272
37,3
masc
354
46,3
363
57,2
325
28,1
319
26,4
fem
375
64,6
351
61,7
355
52,4
360
60,9
masc
3094
208,6
3073
167,0
3014
209,7
2999
172,3
fem
3233
142,8
3176
208,1
3105
257,3
3036
130,0
masc
3868
294,4
3849
285,7
3665
246,3
3738
250,6
fem
4077
341,8
3945
308,2
3856
271,6
3760
258,5
85
52,7
66
37,7
69
32,9
68
32,4
73
46,8
80
40,9
90
45,1
76
38,5
F1 (Hz)
F2 (Hz)
F3 (Hz)
masc
Larg. Banda
fem
42
Tabela XII - Teste de Diferença Estatística para a Variável Sexo na Vogal [i]
Parâmetros
p valor
[i] f0
0,081
[i] F1
0,050*
[i] F2
0,002*
[i] F3
0,003*
[i] Larg Banda
0,12
p=nível descritivo do teste de Mann-Whitney; *expressa diferença significativa (nível de 5%).
Tabela XIII - Teste de Diferença Estatística para a Variável Faixa Etária (Gn) na Vogal [i]
Comparações Múltiplas de Duncan
Parâmetros
p valor
[i] f0
0,003*
[i] F1
0,080
[i] F2
[i] F3
Larg Banda
G1/G2
G1/G3
G1/G4
*
*
0,0004*
*
*
0,0008*
*
*
G2/G3
G2/G4
G3/G4
*
*
*
0,78
p=nível descritivo da ANOVA de Kruskal-Wallis; *expressa diferença significativa (nível de 5%);
G1=4 a 5 anos; G2=5 a 6 anos ; G3=6 a 7 anos; G4=7 a 8 anos.
43
Tabela XIV - Média e Desvio Padrão de Frequência Fundamental e Frequências do Primeiro,
Segundo e Terceiro Formantes da vogal []
4-5 anos
Parâmetros
f0 (Hz)
5-6 anos
6-7 anos
7-8 anos
Sexo
ME
(±DP)
ME
(±DP)
ME
(±DP)
ME
(±DP)
masc
271
24,2
254
26,4
263
19,9
256
26,1
fem
256
24,2
250
18,0
255
25,6
251
26,7
masc
733
117,4
691
112,1
753
107,0
755
140,5
fem
696
140,2
766
130,3
752
108,6
741
119,7
masc
1285
146,7
1158
162,0
1180
135,4
1177
157,8
fem
1255
170,1
1277
138,8
1246
143,2
1214
168,6
masc
3581
395,3
3528
413,7
3565
207,1
3512
308,2
fem
3843
276,7
3760
329,1
3659
278,1
3475
211,2
F1 (Hz)
F2 (Hz)
F3 (Hz)
Tabela XV - Teste de Diferença Estatística para a Variável Sexo na Vogal []
Parâmetros
p valor
[] f0
0,013*
[] F1
0,46
[] F2
0,010*
[] F3
0,001*
p=nível descritivo do teste de Mann-Whitney; *expressa diferença significativa (nível de 5%).
44
Tabela XVI - Teste de Diferença Estatística para a Variável Faixa Etária (Gn) na Vogal []
Comparações Múltiplas de Duncan
Parâmetros
p valor
[] f0
0,050*
[] F1
0,43
[] F2
0,10
[] F3
0,004*
G1/G2
G1/G3
G1/G4
*
*
G2/G3
G2/G4
*
G3/G4
*
p=nível descritivo da ANOVA de Kruskal-Wallis; *expressa diferença significativa (nível de 5%);
G1=4 a 5 anos; G2=5 a 6 anos; G3=6 a 7 anos; G4=7 a 8 anos.
Tabela XVII - Média e Desvio Padrão de Frequência Fundamental e Frequências do
Primeiro, Segundo e Terceiro Formantes da vogal [o]
4-5 anos
Parâmetros
f0 (Hz)
5-6 anos
6-7 anos
7-8 anos
Sexo
ME
(±DP)
ME
(±DP)
ME
(±DP)
ME
(±DP)
masc
281
26,3
261
22,7
267
22,4
257
23,8
fem
259
40,5
260
21,0
260
23,2
253
30,4
masc
572
65,6
532
59,8
552
55,8
512
83,2
fem
543
53,7
534
74,6
568
85,8
518
63,6
masc
1129
129,9
953
124,0
1049
126,0
1029
203,9
fem
1126
113,8
1040
124,1
1064
151,1
1022
141,9
masc
3652
314,7
3651
295,0
3578
251,8
3583
259,7
fem
3829
297,8
3778
282,1
3714
336,9
3592
248,0
F1 (Hz)
F2 (Hz)
F3 (Hz)
45
Tabela XVIII - Teste de Diferença Estatística para a Variável Sexo na Vogal [o]
Parâmetros
p valor
[o] f0
0,046*
[o] F1
0,99
[o] F2
0,12
[o] F3
0,005*
p=nível descritivo do teste de Mann-Whitney; *expressa diferença significativa (nível de 5%).
Tabela XIX - Teste de Diferença Estatística para a Variável Faixa Etária (Gn) na Vogal [o]
Comparações Múltiplas de Duncan
Parâmetros
p valor
G1/G2
[o] f0
0,008*
*
[o] F1
0,001*
*
[o] F2
0,0001*
[o] F3
0,038*
*
G1/G3
*
G1/G4
G2/G3
G2/G4
G3/G4
*
*
*
*
p=nível descritivo da ANOVA de Kruskal-Wallis; *expressa diferença significativa (nível de 5%);
G1=4 a 5 anos; G2=5 a 6 anos ; G3=6 a 7 anos; G4=7 a 8 anos.
46
Tabela XX - Média e Desvio Padrão de Frequência Fundamental e Frequências do Primeiro,
Segundo e Terceiro Formantes da vogal [u]
4-5 anos
Parâmetros
f0 (Hz)
5-6 anos
6-7 anos
7-8 anos
Sexo
ME
(±DP)
ME
(±DP)
ME
(±DP)
ME
(±DP)
masc
313
35,5
282
40,4
299
34,8
279
26,5
fem
295
25,9
298
39,9
284
27,8
277
40,7
masc
474
79,2
482
71,8
462
76,4
433
80,0
fem
476
65,3
478
97,5
495
57,8
453
59,0
masc
1515
905,8
1580
1015,7
1604
1053,8
1630
1078,1
fem
1596
880,1
1539
965,3
1771
1061,4
1583
1043,8
masc
3815
495,5
3850
513,4
3797
511,3
3708
439,9
fem
3808
347,4
3948
472,6
3976
457,0
3796
469,0
F1 (Hz)
F2 (Hz)
F3 (Hz)
Tabela XXI - Teste de Diferença Estatística para a Variável Sexo na Vogal [u]
Parâmetros
p valor
[u] f0
0,42
[u] F1
0,24
[u] F2
0,90
[u] F3
0,066
p=nível descritivo do teste de Mann-Whitney
47
Tabela XXII - Teste de Diferença Estatística para a Variável Faixa Etária (Gn) na Vogal [u]
Comparações Múltiplas de Duncan
Parâmetros
p valor
G1/G2
G1/G3
G1/G4
[u] f0
0,008*
*
[u] F1
0,052*
*
[u] F2
0,90
[u] F3
0,33
G2/G3
G2/G4
G3/G4
*
*
p=nível descritivo da ANOVA de Kruskal-Wallis; *expressa diferença significativa (nível de 5%);
G1=4 a 5 anos; G2=5 a 6 anos ; G3=6 a 7 anos; G4=7 a 8 anos.
Embora os valores de diferença estatística já tenham sido expostos, a tabela XXIII
mostra uma visão global de tais achados para todos os parâmetros e vogais investigados no
presente trabalho.
48
Tabela XXIII – Análise Comparativa entre os Sexos e entre as Faixas Etárias
das Medidas de f0 e Frequências dos Formantes para todas as Vogais Investigadas
e Largura de Banda de F1 da vogal [i]
Sexo
Fx etárias
Parâm.
p valor
p valor
[a] f0
0,099
0,001*
[a] F1
0,0001*
0,0001*
[a] F2
0,0001*
0,0001*
[a] F3
0,24
[ε] f0
Comparações Múltiplas de Duncan
G1 x G3
G1 x G4
*
*
*
*
*
*
*
*
*
*
0,001*
*
*
*
0,092
0,0003*
*
*
*
[ε] F1
0,048*
0,15
[ε] F2
0,0001*
0,0001*
*
*
[ε] F3
0,007*
0,0005*
[e] f0
0,038*
0,0001*
*
*
*
*
[e] F1
0,24
0,0001*
*
*
*
*
[e] F2
0,0001*
0,0001*
*
*
*
*
[e] F3
0,048*
0,0001*
*
*
*
*
[i] f0
0,081
0,003*
*
*
[i] F1
0,050*
0,080
[i] F2
0,002*
0,0004*
*
*
[i] F3
0,003*
0,0008*
*
*
0,12
0,78
[] f0
0,013*
0,050*
*
*
[] F1
0,46
0,43
[] F2
0,010*
0,10
[] F3
0,001*
0,004*
*
[o] f0
0,046*
0,008*
*
[o] F1
0,99
0,001*
*
[o] F2
0,12
0,0001*
[o] F3
0,005*
0,038*
*
[u] f0
0,42
0,008*
*
[u] F1
0,24
0,052*
*
[u] F2
0,90
0,90
[u] F3
0,066
0,33
Larg Bd
a
a
b
G1 x G2
G2 x G3
*
*
*
*
G2 x G4
G3 x G4
*
*
*
*
*
*
*
*
*
*
*
*
*
nível descritivo do teste de Mann-Whitney; b nível descritivo da ANOVA de Kruskal-Wallis; *: expressa
diferença significativa, ao nível de 5%; G1=4 a 5 anos; G2=5 a 6 anos ; G3=6 a 7 anos; G4=7 a 8 anos.
49
7. DISCUSSÃO
A presente discussão foi desenhada de forma a contemplar dois itens principais: a
discussão sobre as medidas dos parâmetros espectrais da voz infantil e a discussão sobre a
hipótese da existência de diferenças paramétricas atribuídas à faixa etária e ao gênero da
criança.
7.1 MEDIDAS DOS PARÂMETROS ESPECTRAIS
Os parâmetros espectrais investigados no presente trabalho, frequência fundamental,
formantes e largura de banda serão comentados isoladamente, nesta sequência.
Frequência Fundamental
As medidas da frequência fundamental estimadas no presente estudo mostraram
valores que variam em torno de: vogal [a]: 243 a 270 Hz (média: 254 Hz), vogal [ε] 245 a 266
Hz (média: 253 Hz), vogal [e] 247 a 275 Hz (média: 260 Hz), vogal [i] 272 a 301 Hz (média:
282 Hz), vogal [] 250 a 271 Hz (média: 257 Hz), vogal [o] 253 a 281 Hz (média: 262 Hz) e
vogal [u] 277 a 313 Hz (média: 290 Hz). A literatura que investiga a voz infantil saudável
apresenta diversas publicações que contemplam a vogal [a] e algumas que contemplam a
50
vogal [ε]. De forma geral, os valores obtidos para a vogal [a] e [ε] no presente trabalho
corroboram aqueles descritos na literatura.
Cappellari e Cielo (2008) investigaram a frequência fundamental exclusivamente da
vogal [a] da voz de crianças de quatro a seis anos e oito meses falantes do português e
apontaram uma média de f0 na amostra de 252 Hz. Além da convergência no que se refere ao
valor médio da f0 de [a], podem ser observados valores semelhantes ao comparar os achados
das duas pesquisas, divididos por faixa etária e gênero. Enquanto os autores da literatura
mostraram intervalos de: 266-375 Hz e 285-355 Hz (4 anos); 247-350 Hz e 247-355 Hz (5
anos); 247-325 Hz e 247-315 Hz (6 anos) para os sexos masculino e feminino,
respectivamente, os dados do presente estudo mostraram valores médios de: 270 Hz e 259 Hz
(4 anos); 259 Hz e 247 Hz (5 anos); 258 Hz e 256 Hz (6 anos) masculino e feminino,
respectivamente.
Os resultados apresentados para a vogal [a] por Behlau (1984) mostram uma
frequência fundamental média mais grave, 235 Hz. Uma vez que a faixa etária investigada
pela autora, de oito a doze anos, não corresponde à faixa etária investigada no presente
trabalho, não é possível afirmar que os dois trabalhos não se corroboram entre si.
Autores internacionais também investigaram a frequência fundamental da vogal [a].
Ao contemplar vozes de crianças de seis a doze anos, Nicollas e col. (2008) observaram que a
f0 decresceu de 268 Hz para 234 Hz em meninos e 260 Hz para 239 Hz em meninas. É
interessante observar que os valores iniciais, que correspondem à faixa etária mais próxima de
6 anos, encontram-se próximos aos resultados apontados no presente trabalho e os valores
finais correspondentes à faixa de 12 anos, corroboram os valores obtidos por Behlau (1984).
Busby e Plant (1995) investigaram a f0 em crianças de cinco a onze anos em diversas vogais
do inglês e os resultados apontaram valores de frequência fundamental decrescentes com o
aumento da idade. Ainda no que se refere ao valor médio de f0 da vogal [a] Baker e col.
51
(2008) encontraram uma média de 240 Hz na emissão sustentada em crianças de cinco a oito
anos, sendo este valor proximal à estimação mais baixa de f0 para a vogal [a] obtida no
presente trabalho. Huber e col. (1999) apontaram valores médios de f0 para ambos os sexos,
masculino e feminino, de: 266 Hz e 256 Hz (4 a 6 anos); 246 Hz e 261 Hz (6 a 8 anos). Se os
valores do presente trabalho forem agrupados com as mesmas faixas etárias poderão ser
observados achados basicamente convergentes: 263 Hz e 253 Hz (4 e 6 anos); 250 e 251 Hz
(6 e 8 anos), sendo o valor correspondente ao sexo feminino na faixa de 6 a 8 anos, sutilmente
mais elevado nos achados dos autores comentados.
Assim como a vogal [a], a medida de f0 da vogal [ε] da voz infantil também foi
apresentada na literatura. Schott e col. (2009) investigaram valores de f0 da vogal [ε] em
crianças de seis a oito anos. Os valores apontados variam entre: 233 Hz e 251 Hz, com média
de 238 Hz. Em estudo semelhante em termos de faixa etária e vogal analisada, Braga e col.
(2009) obtiveram variações de f0 entre 226 Hz e 277 Hz, com média de 249 Hz. Os resultados
para a vogal [ε] do presente trabalho foram: 245 a 266 Hz, com média de 253 Hz. Os valores
apontados pelos dois autores da literatura não convergem entre si, sendo que o primeiro grupo
de autores citado mostra valores mais baixos. A outra pesquisa mostra um valor médio de f0
semelhante ao valor apontado no presente estudo, porém apresenta uma faixa dinâmica
consideravelmente mais larga, tanto no que se refere à frequência fundamental mínima quanto
à máxima. Os trabalhos em questão apresentam algumas diferenças referentes ao tamanho da
amostra e metodologia de estimação da frequência fundamental.
Frequência de Formantes
As médias das frequências dos três primeiros formantes estimadas no presente estudo
foram: vogal [a] 1078 Hz, 1961 Hz e 3497 Hz; vogal [ε] 710 Hz, 2694 Hz e 3669 Hz; vogal
52
[e] 507 Hz, 2918 Hz e 3740 Hz; vogal [i] 350 Hz, 3092 Hz e 3845 Hz; vogal [] 737 Hz, 1224
Hz e 3616 Hz; vogal [o] 541 Hz, 1047 Hz e 3674 Hz e vogal [u] 470 Hz, 1603 Hz e 3845 Hz.
Dentro da língua portuguesa falada no Brasil, Behlau (1984) foi um dos pesquisadores
que investigou mais amplamente, em termos da quantidade de vogais analisadas, as
frequências dos três primeiros formantes da voz infantil. Além de ter apontado a existência de
diferenças nas medidas dos formantes entre adultos e crianças, a autora contribuiu apontando
valores médios das frequências dos três primeiros formantes para a voz infantil saudável:
vogal [a] 1086 Hz, 1721 Hz e 2873 Hz; vogal [ε] 902 Hz, 2606 Hz e 3243 Hz; vogal [e] 698
Hz, 2825 Hz e 3637 Hz; vogal [i] 465 Hz, 3176 Hz e 3980 Hz; vogal [] 913 Hz, 1371 Hz e
2793 Hz; vogal [o] 682 Hz, 1295 Hz e 2823 Hz e vogal [u] 505 Hz, 1350 Hz e 2667 Hz.
Muitas destas medidas não convergem com os resultados obtidos no presente trabalho, mesmo
que considerado um desvio padrão médio de 15%. No presente trabalho as medidas de F1 se
mostram mais baixas, enquanto as de F3, mais altas. As medidas de F2 variaram
aleatoriamente. Diferenças na faixa etária investigada (oito a doze anos), no tamanho da
amostra (N=30) e na ferramenta de análise do sinal (espectrografia analógica), no estudo da
autora, estão entre os principais aspectos que poderiam justificar a divergência de resultados.
Huber e col. (1999) estimaram as frequências dos três primeiros formantes da vogal
[a] em vozes de crianças falantes do inglês norte americano, entre quatro a oito anos. Os
resultados, para o gênero masculino e feminino, para F1 foram: 981 Hz e 1139 Hz (4 a 6
anos); 992 Hz e 1030 Hz (6 a 8 anos). Para F2: 1676 Hz e 1817 Hz (4 a 6 anos); 1681 Hz e
1817 Hz (6 a 8 anos). Finalmente, para F3: 3902 Hz e 4064 Hz (4 a 6 anos), 3603 Hz e 3735
Hz (6 a 8 anos). Assim como na frequência fundamental, os valores do presente trabalho para
a vogal [a] foram agrupados com as mesmas faixas etárias propostas pelo autor. O presente
trabalho mostrou os seguintes valores, no gênero masculino e feminino, para F1: 1051 Hz e
1221 Hz (4 a 6 anos); 927 Hz e 1089 Hz (6 a 8 anos). Para F2: 1946 Hz e 2149 Hz (4 a 6
53
anos); 1741 Hz e 1988 Hz (6 a 8 anos). Finalmente, para F3: 3564 Hz e 3594 Hz (4 a 6 anos);
3403 Hz e 3439 Hz (6 a 8 anos). Na comparação é possível observar que há uma
convergência parcial dos valores absolutos apontados nos dois trabalhos.
Se observados os achados de Behlau (1984), Huber e col. (1999) e os do presente
trabalho pode ser observado que os valores absolutos dos formantes se mostram pouco
consistentes, com variações aleatórias entre um trabalho e outro. Embora haja diferenças
metodológicas, principalmente de técnicas de estimação paramétrica, que, por si só, poderiam
justificar as divergências entre os três trabalhos, a alta variabilidade que os formantes
apresentam frente à variabilidade intra-sujeitos (FIGUEIREDO, 1994) e inter-sujeitos parece
ser um fator relevante. Os grupos de diferentes faixas etárias são compostos por crianças
diferentes, uma vez que os três estudos citados apresentam um delineamento transversal.
Largura de Banda
A largura de banda do primeiro formante (B1) não representa um parâmetro clássico
da análise espectral. Tal parâmetro foi investigado no presente trabalho em caráter
exploratório, motivo pelo qual apenas a banda do primeiro formante (F1) de uma única vogal
foi pesquisada. Em especial, foi definida a vogal [i], por ser a vogal que apresenta o envelope
espectral com maior distanciamento entre os picos do primeiro e segundo formantes,
minimizando, portanto, a possibilidade de obter erro de estimação em função da eventual
fusão de picos. Não foram encontrados na literatura trabalhos que tenham investigado este
parâmetro na voz infantil, inviabilizando comparação de valores.
54
7.2 DIFERENÇAS ENTRE FAIXAS ETÁRIAS E GÊNEROS
Faixas Etárias
A análise de diferenças nos valores dos parâmetros espectrais para as diferentes faixas
etárias pesquisadas consiste em uma parte fundamental do presente trabalho, uma vez que a
definição da existência ou não de subgrupos dentro da voz infantil poderá contribuir para uma
metodologia concisa de futuros trabalhos que pretendam investigar vozes infantis patológicas.
Se observado o conjunto de resultados dos testes de diferença estatística para as faixas
etárias (Tabela XXIII) pode ser observado um aumento gradativo na ocorrência de
confirmações de diferenças estatísticas à medida que G1 (4 a 5 anos) foi sendo comparado
com os demais grupos G2, G3 e G4, de faixas etárias maiores. Entre G1 e G2 foi obtida
apenas 1 significância em 29 testes, enquanto na comparação entre G1 e G3 e G1 e G4 foram
obtidas 14 e 22 significâncias em 29 testes, respectivamente.
Tais achados mostram a
existência de uma diferença clara entre os valores dos parâmetros espectrais da voz das
crianças entre 4 e 8 anos de idade. No entanto, não é tão definido o comportamento dos
parâmetros acústicos ao longo deste período. Pode-se dizer que entre 4 e 6 anos de idade não
ocorrem mudanças, uma vez que 96,55% dos testes de diferença estatística aplicados não
mostraram significância, dando suporte a tal conclusão. A partir dos seis anos, mudanças
significativas passam a ocorrer, porém de forma inconsistente em relação ao parâmetro, vogal
e faixa etária. Em especial, na vogal [e] pode ser observada uma predominância de diferenças
significativas das faixas G1 e G2 contra as faixas G3 e G4 sugerindo, além do agrupamento
G1 e G2 já comentado, o agrupamento da G3 com o G4. Nas demais vogais o agrupamento
G3 e G4 não é tão evidente, porém se observado o número reduzido de significâncias
envolvendo especificamente G3 contra G4 parece razoável concluir pelo agrupamento dos
55
mesmos. Assim sendo, a idade de seis anos parece ser determinante para as mudanças
acústicas das vocalizações infantis.
Alguns autores internacionais já haviam apontado a faixa etária em torno dos seis anos
de vida da criança como uma fase de transição, no que se refere a mudanças nas medidas
espectrais da voz. Apontando a existência de decréscimos nas frequências dos formantes
frente ao aumento da idade, Eguchi e Hirsh (1969) referiram ter observado mudanças mais
significativas em crianças menores de cinco anos e também em crianças de seis a treze anos.
Busby e Plant (1995) apontaram um decréscimo mais consistente dos formantes nas faixas de
cinco a sete anos e nove a onze anos. Yang e Mu (1989) observaram diferença substancial na
frequência de F3 aos 6 anos de idade.
Além do apontamento com relação à idade de 6 anos, como marco importante para as
mudanças acústicas na voz infantil, os resultados do presente trabalho apontam, de uma forma
geral, a existência de uma relação decrescente dos parâmetros espectrais com a faixa etária,
ou seja, quanto maior a faixa etária, menor a medida de frequência observada. Tal
comportamento da frequência fundamental e dos formantes é descrito na literatura (EGUCHI
e HIRSH, 1969; BUSBY e PLANT, 1995, HUBER e col., 1999). Um estudo que se destaca
por seu delineamento longitudinal, investigou os dois primeiros formantes em quatro meninos
entre 15 e 36 meses de vida e mostrou um comportamento descendente das frequências dos
parâmetros investigados com o aumento da idade a partir do 24º mês de vida. (GILBERT e
col. 1997).
A seguir são expostas tabelas com medidas de média e desvio padrão dos parâmetros
analisados, nas quais os 4 grupos etários investigados foram divididos em 2 grupos (4 a 6 anos
e 6 a 8 anos), apresentando como limite entre eles a idade de 6 anos.
56
Tabela XXIV - Média e Desvio Padrão de Frequência Fundamental e Frequências do
Primeiro, Segundo e Terceiro Formantes das vogais [a] e [ε]
[a]
4-6 anos
Parâmetros
f0 (Hz)
[ε]
6-8 anos
4-6 anos
6-8 anos
Sexo
ME
(±DP)
ME
(±DP)
ME
(±DP)
ME
(±DP)
masc
264
25,3
250
23,8
257
27,8
255
22,7
fem
253
23,1
251
27,7
254
19,1
249
26,4
masc
1051
206,8
927
141,9
692
116,1
695
97,2
fem
1221
158,8
1089
153,8
734
113,0
720
100,2
masc
1946
168,4
1741
179,4
2673
181,3
2553
187,6
fem
2149
166,9
1988
181,0
2850
155,5
2684
184,4
masc
3564
406,4
3403
217,9
3654
304,0
3580
261,8
fem
3594
334,1
3439
296,4
3807
302,2
3628
204,4
F1 (Hz)
F2 (Hz)
F3 (Hz)
57
Tabela XXV - Média e Desvio Padrão de Frequência Fundamental e Frequências do
primeiro, Segundo e Terceiro Formantes das vogais [e] e [i]
[e]
4-6 anos
Parâmetros
f0 (Hz)
[i]
6-8 anos
4-6 anos
6-8 anos
Sexo
ME
(±DP)
ME
(±DP)
ME
(±DP)
ME
(±DP)
masc
266
24,9
261
23,0
290
30,7
281
29,0
fem
259
16,7
253
25,7
281
26,4
277
32,3
masc
515
54,0
511
50,05
358
51,7
322
27,2
fem
512
44,1
498
60,5
363
63,1
357
56,6
masc
2926
175,7
2784
188,3
3083
187,8
3006
191,0
fem
3069
175,1
2872
203,2
3204
175,4
3070
193,6
masc
3810
243,5
3604
230,0
3858
290,0
3701
248,4
fem
3840
264,7
3696
216,2
4011
325,0
3808
265,0
F1 (Hz)
F2 (Hz)
F3 (Hz)
58
Tabela XXVI - Média e Desvio Padrão de Frequência Fundamental e Frequências do
primeiro, Segundo e Terceiro Formantes das vogais [] e [o]
[]
4-6 anos
Parâmetros
f0 (Hz)
[o]
6-8 anos
4-6 anos
6-8 anos
Sexo
ME
(±DP)
ME
(±DP)
ME
(±DP)
ME
(±DP)
masc
262
25,3
259
23,0
271
24,5
262
23,1
fem
253
21,1
253
26,1
259
30,7
256
26,8
masc
712
114,7
754
123,7
552
62,7
532
69,5
fem
731
135,2
746
114,1
538
64,1
543
74,7
masc
1221
154,3
1178
146,6
1041
126,9
1039
164,9
fem
1266
154,4
1230
155,9
1083
118,9
1043
146,5
masc
3554
404,5
3538
257,6
3651
304,8
3580
255,7
fem
3801
302,9
3567
244,6
3803
289,9
3653
292,4
F1 (Hz)
F2 (Hz)
F3 (Hz)
59
Tabela XXVII - Média e Desvio Padrão de Frequência Fundamental e Frequências do
primeiro, Segundo e Terceiro Formantes da vogal [u]
[u]
4-6 anos
Parâmetros
f0 (Hz)
6-8 anos
Sexo
ME
(±DP)
ME
(±DP)
masc
297
37,9
289
30,6
fem
296
32,9
280
34,2
masc
478
75,5
447
78,2
fem
477
81,4
474
58,4
masc
1547
960,7
1617
1065,9
fem
1567
922,7
1677
1052,6
masc
3832
504,4
3752
475,6
fem
3878
410,0
3886
463,0
F1 (Hz)
F2 (Hz)
F3 (Hz)
Gêneros
Embora a ocorrência de significâncias estatísticas não tenha se mostrado consistente
(Tabela XXIII) ao ponto de que pudesse levar à generalização do conceito de que a emissão
vocálica de meninos é diferente de meninas, os resultados do presente estudo apontam várias
diferenças pontuais, distribuídas de forma dispersa em termos de parâmetro e vogal,
mostrando que as meninas apresentaram medidas espectrais significativamente maiores que
os meninos.
Na literatura, é possível observar que a hipótese da existência de diferenças entre os
gêneros em parâmetros acústicos vem sendo descrita há anos. Corroborando os resultados do
60
presente trabalho, o estudo pioneiro de Peterson e Barney (1952) apontou diferenciação entre
os sexos nas frequências dos formantes, mesmo como uma amostra infantil pequena (15
crianças). Glaze e col. (1988) encontraram significância estatística entre os diferentes gêneros
na f0 de vozes de crianças de cinco a onze com valores maiores para as meninas. Yang e Mu
(1989) investigaram a frequência do terceiro formante (F3) da vogal [a] em crianças três a
doze anos e observaram diferença significante deste parâmetro entre meninos e meninas.
Busby e Plant (1995) não encontraram diferenças significativas na f0, no entanto, observaram
frequências dos formantes mais altas para meninas em F1, para vogais [æ], [a] e [u] e em F2
para quase todas as vogais. Corroborando esse estudo, no presente trabalho foi possível
observar diferenças entre os sexos nas frequências de F2 em quase todas as vogais e nas
frequências de F1 na vogal [a]. No entanto, na vogal [u], os resultados do presente trabalho
não mostraram diferenças entre os gêneros em nenhum parâmetro investigado. Ao estimar as
frequências de F1, F2 e F3 da vogal [a] em vozes de crianças e adultos, Huber e col. (1999)
encontraram diferenças entre os gêneros nos parâmetros investigados. Recentemente, Braga e
col. (2009) observaram diferenças significantes na f0 entre os sexos em crianças de seis a oito
anos.
Alguns autores referiram ter encontrado diferenças de gênero apenas após uma
determinada idade. Ao avaliar a f0 e frequências dos três primeiros formantes, Lee e col.
(1999) apontaram diferenças entre os sexos somente a partir dos onze anos de idade. Perry e
col. (2001) concluíram que embora a análise das frequências dos formantes tivesse permitido
a diferenciação entre os gêneros em crianças a partir quatro anos de idade, a análise da f0 só
pôde diferenciar os sexos a partir dos doze anos.
61
8. CONCLUSÃO
Com base nos resultados do presente trabalho pode-se concluir que, de uma forma
geral, as meninas apresentaram medidas de frequência significativamente maiores que os
meninos e que existe uma relação decrescente com a faixa etária, ou seja, quanto maior a
faixa etária menor a medida de frequência observada.
Dentre as conclusões mais importantes está o apontamento de que a idade de seis anos
parece ser determinante para as mudanças acústicas das vocalizações infantis. Assim sendo,
as médias apresentadas para G1 e G2 podem ser agrupadas em uma única faixa etária. Da
mesma forma as médias paramétricas para G3 e G4 também podem ser agrupadas. Trabalhos
futuros que pretendam investigar vozes infantis patológicas possivelmente apresentarão
resultados mais consistentes se considerarem a divisão das faixas etárias em função da idade
de seis anos.
62
REFERÊNCIAS BIBLIOGRÁFICAS
ANDRIANOPOULOS, M. V.; DARROW, K.; CHEN, J. Multimodal standardization of voice
among four multicultural populations formants structures. J Voice, v. 15, n. 1, p. 61-77, 2001.
ANDRADE, Danieli Viegas de. Análise de parâmetros espectrais clássicos da voz em
crianças respiradoras orais de 5 a 10 anos. Rio de Janeiro, RJ, 2009. Dissertação de
mestrado. Universidade Veiga de Almeida, 2009.
BAECK, H. E.; SOUZA, M. N. A Bayesian classifier for babies’ cry pain and non-pain
contexts. In: Proceedings of 25th International Conference on the IEEE Engineering in
Medicine and Biology Society, Cancun, v. 1, p. 2944-2946, 2003.
BAECK, H. E.; SOUZA, M. N. “Sistema de Análise Automática da Dinâmica do Sinal de
Choro de Bebês”. In: Anais do III Congresso Latino Americano de Engenharia
Biomédica, João Pessoa, v. 5, p. 17-20, 2004.
BAECK, H. E.; SOUZA, M. N. Longitudinal study of the fundamental frequency of hunger
cries along the first 6 months of healthy babies. J Voice, v. 21, n. 5, p. 551- 559, 2007.
BAKER, S. e col. The effect of task type on fundamental frequency in children. Int J Pediatr
Otorhinol, v. 72, p. 885-889, 2008.
BEHLAU, Mara Suzana. Uma análise das vogais do português brasileiro falado em São
Paulo: perceptual, espectrográfica de formantes e computadorizada de frequência
fundamental. São Paulo, SP. Dissertação de Mestrado. Escola Paulista de Medicina, 1984.
BEHLAU, M. S. e col. Análise espectrográfica de formantes das vogais do português
brasileiro. ACTA AWHO, v. 7, n. 2, p. 74-85, 1988.
63
BELHAU, M. S. e col. Avaliação de voz. In:_________.Voz: O livro do especialista. Rio de
Janeiro: Revinter, 2001. cap. 3, p. 85 -180.
BENETON, G. e col. Comparação dos parâmetros vocais em crianças com e sem rinite
alérgica. Rev Fono Atual, v. 7, n. 29, p. 30-35, 2004.
BUSBY, P. A.; PLANT, G. L. Formant frequency values of vowels produced by
preadolescent boys and girls. J Acoust Soc Am., v. 97, n.4, p. 2603-2606, 1995.
BRAGA, J. N.; OLIVEIRA, D. S. F.; SAMPAIO, T. M. M. Frequência fundamental da voz
de crianças. Rev Cefac, v. 11, n. 1, p. 119-126, 2009.
CAMARGO, Z. A.; MADUREIRA, S. Análise acústica: revisão crítica de estudos no campo
das disfonias. In: FERREIRA, L. P.; BEFI-LOPES, D. M.; LIMONGI, S. C. O. (Org).
Tratado de Fonoaudiologia. São Paulo: Roca, 2004. cap. 3, p.25-33.
CAPPELLARI, V. M.; CIELO, C. A. Características vocais acústicas de crianças préescolares. Rev Bras Otorrinolaringol., v. 74, n. 2, p. 265-272, 2008.
CARRARA-DE-ANGELIS, E.; CERVANTES, O.; ABRAHÃO, M. Necessidade de medidas
objetivas da função vocal: avaliação acústica da voz. In: FERREIRA, L. P.; COSTA, H. O.
Voz ativa: falando sobre a clínica fonoaudiológica. São Paulo: Roca, 2001. cap. 5, p. 53-72.
CORAZZA, V. R. e col. Correlação entre os achados estroboscópicos, perceptivo-auditivos e
acústicos em adultos sem queixa vocal. Rev Bras Otorrinolaringol., v. 70, n. 1, p. 30-34,
2004.
DORNELLES, S.; JOTZ, G. P.; GUILHERME, A. Capacidade discriminatória e
confiabilidade da análise perceptiva da voz de crianças institucionalizadas. In: FERREIRA, L.
P.; COSTA, H. O. Voz ativa: falando sobre a clínica fonoaudiológica. São Paulo: Roca,
2001. cap. 14, p. 167-181.
FELLIPE, A. C. N.; GRILLO, M. H. M. M.; GRECHI, T. H. Normatização de medidas
acústicas para vozes normais. Rev Bras Otorrinolaringol., v. 75, n. 2, p. 659-664, 2006.
FIGUEIREDO, Ricardo Molina. Identificação de falantes: aspectos teóricos e
metodológicos. Campinas, SP, 1994. Tese de doutorado. Universidade Estadual de Campinas,
1994.
64
FUCHS, M. e col. Predicting mutational change in the speaking voice of boys. J Voice, v. 21,
n. 2, p. 169-178, 2007.
GILBERT, H. R.; ROBB, M. P.; CHEN, Y. Formant frequency development: 15 to 36
months. J Voice, v. 11, n. 3, p. 260-266, 1997.
GELFER, M. P.; MIKOS, V. A. The relative contributions of speaking fundamental
frequency and formant frequencies to gender identification based on isolated vowels. J Voice,
v. 19, n. 4, p. 544-554, 2004.
GLAZE, L. E. e col. Acoustic characteristics of children’s voice. J Voice, v. 2, n. 4, p. 312319, 1988.
GLAZE, L. E.; BLESS, D. M.; SUSSER, R. D. Analysis of vowel and loudness differences
in children’s voice. J Voice, v. 4, n. 1, p. 321-323, 1990.
GOLDFIELD, E. C. Exploration of vocal tract properties during serial production of vowels
by fill term and preterm infants. Infant Behavior & Development, v. 23, p. 421-439, 2000.
GREGIO, Fabiana Nogueira. Configuração do trato vocal supraglótico na produção das
vogais do português brasileiro: dados de imagens de ressonância magnética. São Paulo,
SP, 2006. Dissertação de Mestrado. Pontifícia Universidade Católica de São Paulo, 2006.
HAMDAN, A. L. e col. Vocal characteristics in children with attention deficit hyperactivity
disorder. J Voice, v. 23, n. 2, p. 190-194, 2009.
HERSAN, R. C. P. G. A laringe infantil. In: PINHO, S. M. R. Fundamentos em
fonoaudiologia: Tratando os distúrbios da voz. 2ª. ed. Rio de Janeiro: Guanabara Koogan,
2003. cap. 3, p. 59-66.
HUBER, J. E. e col. Formants of children, women and men: the effects of vocal intensity
variation. J Acoustic Soc Am., v. 106, n. 3, p. 1532-1542, 1999.
JORGE, M. S.; GREGIO, F. N.; CAMARGO, Z. Qualidade vocal de indivíduos submetidos à
laringectomia total: aspectos acústicos de curto e de longo termo em modalidades de fonação
esofágica e traqueoesofágica. Rev Cefac, v. 6, n. 3, p. 319-328, 2004.
JOTZ, G. P. e col. Avaliação vocal na infância. In: FERREIRA, L. P.; COSTA, H. O. Voz
ativa: falando sobre a clínica fonoaudiológica. São Paulo: Roca, 2001. cap. 15, p. 183-194.
65
KENT, R. D.; READ, D. The Acoustic Analysis of Speech. London, Singular Publishing
Group, 1996
LEE, S. e col. Acoustic of children’s speech: developmental changes of temporal and spectral
parameters. J Acoustic Soc Am., v. 105, n. 3, p. 1455-1468, 1999.
LIMA, M. F. B. e col. Qualidade vocal e formantes das vogais de falantes adultos da cidade
de João Pessoa. Rev Cefac, v. 9, n. 1, p. 99-109, 2007.
MAGRI, A. e col. Correlatos perceptivos e acústicos dos ajustes supraglóticos na disfonia.
Rev Cefac, v. 9, n. 4, p. 512-518, 2007.
MAGRI, A.; STAMATO, T.; CAMARGO, Z. A. Influência da largura de banda de formantes
na qualidade vocal. Rev Cefac, v.11, n. 2, p. 296-304, 2009.
MITRA, S. K. Digital Signal Processing – A Computer-Based Approach. New York:
McGrawHill, 2001.
MOURA, C. P. e col. Voice parameters in children with Down syndrome. J Voice, v. 22, n. 1,
p. 34-42, 2008.
NEBEKER, F. Signal Processing – the emergence of a discipline - 1948 to 1998. New Jersey:
IEEE History Center, 1998.
NEMR, K. e col. Análise comparativa entre avaliação fonoaudiológica perceptivo-auditiva,
análise acústica e laringoscopias indiretas para avaliação vocal em população com queixa
vocal. Rev Bras Otorrinolaringol., v. 71, n. 1, p.13-17, 2005.
NICOLLAS, R. e col. Normal voice in children between 6 and 12 years of age: database and
nonliner analysis. J Voice, v. 22, n. 6, p. 671-675, 2008.
NIEDZIELSKA, G. Acoustic analysis in the diagnosis of voice disorders in children. Int J
Pediatr Otorhinol., v. 57, n. 3, p.189-193, 2001.
NIEDZIELSKA, G.; GLIJER, E.; NIEDZIELSKI, A. Acoustic analysis of voice in children
with noduli vocales. Int J Pediatr Otorhinol., v. 60, n. 2, p.119-122, 2001.
66
PINHO, S. M. R.; CAMARGO, Z. Introdução à análise acústica da voz e da fala. In: PINHO,
S. M. R. Tópicos em Voz. Rio de Janeiro: Guanabara Koogan, 2001. cap. 2, p. 19-44.
PINHO, S. M. R. Avaliação e tratamento da voz. In: ________. Fundamentos em
fonoaudiologia: Tratando os distúrbios da voz. 2ª. ed. Rio de Janeiro: Guanabara Koogan,
2003. Parte I, p. 3-40.
PINHO, S. M. R; PONTES, P. Desvendando os segredos da voz: Músculos intrínsecos da
laringe e dinâmica vocal. Vol. I. Rio de Janeiro: Revinter, 2008. p. 1-77.
PERRY, T. L. e col. The acoustic bases for gender identification from children’s voices. J
Acoustic Soc Am., v. 109, n. 6, p. 2988-2998, 2001.
RABINER, L. R.; SCHAFER, R. W. Digital Processing of Speech Signal. New Jersey,
Prentice Hall, 1978.
ROTHGÄNGER, H. Analysis of the sounds of the child in the first year of age and a
comparison to the language. Early Human Development, v. 75, p. 55-69, 2003.
SCHOTT, T. C. A.; SAMPAIO, T. M. M.; OLIVEIRA, D. S. F. Frequência fundamental de
crianças da cidade de Niterói. Rev Cefac, v. 12, n. 2, p. 290-295, 2009.
STEFFEN, N.; MOSCHETTI, M. B. Parâmetros acústicos de jitter e shimmer de 248 crianças
de 6 a 10 anos, estudantes de Porto Alegre. Rev Bras Otorrinolaringol., v. 63, n. 4, p. 329334, 1997.
VANZELLA, Thaís Perez. Normatização dos parâmetros acústicos vocais em crianças em
idade escolar. Ribeirão Preto, SP, 2006. Dissertação de Mestrado. Universidade de São
Paulo, 2006.
YANG, S.; MU, L. An investigation of the third formant of /a/ in prepuberal children. J
Voice, v. 3, n. 4, p. 321-323, 1989.
WERTZNER, H. F.; SCHREIBER, S.; AMARO, L. Análise da frequência fundamental,
jitter, shimmer e intensidade vocal em crianças com transtorno fonológico. Rev Bras
Otorrinolaringol., v. 71, n. 5, p. 582-588, 2005.
67
ANEXO A
ESCALA RASATI
(Pinho e Pontes, 2008)
Nome: ______________________________________________________
Data de nascimento: ___/__/__ Idade: __________
GRADUAÇÃO
-Rouquidão:
( )0
( ) 1-2
( )2
( ) 2-3
( )3
- Aspereza:
( )0
( ) 1-2
( )2
( ) 2-3
( )3
- Soprosidade:
( )0
( ) 1-2
( )2
( ) 2-3
( )3
- Astenia:
( )0
( ) 1-2
( )2
( ) 2-3
( )3
- Tensão:
( )0
( ) 1-2
( )2
( ) 2-3
( )3
- Instabilidade:
( )0
( ) 1-2
( )2
( ) 2-3
( )3
Graduação:
0 – ausente
1- grau leve
1-2 – grau leve a moderado
2 – grau moderado
2-3 – grau moderado a intenso
3 – grau intenso
Data: ___/___/___
______________________
Fonoaudióloga
68
APÊNDICE A
CARTA PARA OBTENÇÃO DO CONSENTIMENTO LIVRE E ESCLARECIDO
Caro(a) Senhor(a),
Eu, Flávia Viegas de Andrade, fonoaudióloga, vou desenvolver uma pesquisa cujo
título é ANÁLISE DE PARÂMETROS ESPECTRAIS DA VOZ EM CRIANÇAS
SAUDÁVEIS DE 4 A 8 ANOS.
O presente estudo consiste em minha dissertação de mestrado em fonoaudiologia,
linha de pesquisa voz, da Universidade Veiga de Almeida.
O objetivo deste estudo é investigar medidas de frequência fundamental, frequências
dos três primeiros formantes e largura de banda da vogal [i] em crianças saudáveis de quatro a
oito anos, através do processamento digital do sinal da voz. Necessito que o (a) Sr.(a). forneça
informações à respeito de seu (sua) filho (a), devendo ocupá-lo(a) por 30 minutos para
avaliação de seu (sua) filho (a), através dos seguintes procedimentos:
Entrevista com a criança que deverá conversar com a autora da pesquisa de forma
espontânea, na qual será realizada uma triagem da expressão oral. Depois será solicitado que a
criança fale o próprio nome, idade e o que gosta de brincar. Em seguida a criança deverá
repetir a seguinte frase “Fale _____ para mim”, que será preenchida com os vocábulos
“pápa”, “pépe”, “pêpe”, “pípi”, “pópo” “pôpo” e “púpu”. Estes procedimentos serão gravados
com o auxílio de um microfone em um programa de computador que processa os sinais de
fala e de voz. Posteriormente serão avaliados os parâmetros vocais de fonte glótica e
ressonância através da análise das amostras de voz colhidas.
A participação do (a) seu (sua) filho (a) nesta pesquisa é voluntária e a avaliação
clínica não determinará qualquer risco. A participação do (a) seu (sua) filho (a) não trará
qualquer benefício direto para ele (a), mas proporcionará um melhor conhecimento a respeito
das mudanças que ocorrem nos parâmetros vocais investigados ao longo do crescimento. I
Informo que o (a) Sr. (a). tem a garantia de acesso, em qualquer etapa do estudo, sobre
qualquer esclarecimento de eventuais dúvidas. Se tiver alguma consideração ou dúvida sobre
a ética da pesquisa, entre em contato com o Comitê de Ética em Pesquisa da Secretaria
Municipal de Saúde da Prefeitura do Rio de Janeiro, situado à Rua Afonso Cavalcante, 455,
69
sala 701 - Cidade Nova - Rio de Janeiro - RJ – Cep: 20.211-901 ou através do e-mail:
[email protected].
Também é garantida a liberdade da retirada deste consentimento a qualquer momento,
sem qualquer prejuízo ao (a) senhor (a) ou seu (sua) filho (a).
Garanto que as informações obtidas serão analisadas em conjunto com outras crianças,
não sendo divulgado a identificação de nenhum dos participantes.
O Sr. (a) tem o direito de ser mantido (a) atualizado (a) sobre os resultados parciais da
pesquisa e caso seja solicitado, darei todas as informações que solicitar.
Não existirão despesas ou compensações pessoais para o (a) participante em qualquer
fase do estudo, incluindo exames e consultas. Também não há compensação financeira
relacionada à participação do (a) seu (sua) filho (a). Se existir qualquer despesa adicional, ela
será absorvida pelo orçamento da pesquisa.
Eu me comprometo a utilizar os dados coletados somente para pesquisa e os resultados
serão veiculados através de artigos científicos em revistas especializadas e/ou em encontros
científicos e congressos, sem nunca tornar possível a identificação do (a) seu (sua) filho (a).
Anexo está o consentimento livre e esclarecido para ser assinado caso não tenha ficado
qualquer dúvida.
Termo de Consentimento Livre e Esclarecido
Acredito ter sido suficiente informado a respeito das informações que li ou que foram
lidas para mim, descrevendo o estudo “Análise de parâmetros espectrais da voz em crianças
saudáveis de quatro a oito anos”.
Eu discuti com a fonoaudióloga Flávia Viegas de Andrade a minha decisão em
permitir a participação de meu (minha) filho (a) nesse estudo. Ficaram claros para mim quais
são os propósitos do estudo, os procedimentos a serem realizados, seus desconfortos e riscos,
as garantias de confidencialidade e de esclarecimentos permanentes.
Ficou claro também que a participação do (a) meu (minha) filho (a) é isenta de
despesas e que tenho garantia do acesso aos resultados e de esclarecer minhas dúvidas a
qualquer tempo. Concordo voluntariamente em permitir a participação do (a) meu (minha)
filho (a) neste estudo e poderei retirar o meu consentimento a qualquer momento, antes ou
70
durante o mesmo, sem penalidade ou prejuízo ou perda de qualquer benefício que eu possa ter
adquirido.
___________________________________ Data:_______/______/______
Assinatura do pai, mãe ou responsável
Nome:
Endereço:
RG.
Telefone: ( )
__________________________________ Data _______/______/______
Assinatura da pesquisadora
Nome da criança: _____________________________________________
Contato:
Pesquisadora: Flávia Viegas de Andrade – [email protected]
71
APÊNDICE B
ROTEIRO DE AVALIAÇÃO DO SISTEMA RESSONANTAL
(Adaptado de Pinho, 2003)
FOCO DE RESSONÂNCIA:
a) ( ) nasal
Divisão: ( ) rinofonia aberta ( ) rinofonia fechada
( ) hiponasalidade ( ) denasalidade
b) ( ) faríngeo
c) ( ) cul de sac
d) ( ) laringo-faríngeo
e) ( ) equilibrado
Data: ___/___/___
______________________
Fonoaudióloga