Flávia Viegas de Andrade ANÁLISE DE PARÂMETROS ESPECTRAIS DA VOZ EM CRIANÇAS SAUDÁVEIS DE 4 A 8 ANOS Dissertação apresentada ao curso de pósgraduação em Fonoaudiologia da Universidade Veiga de Almeida, como requisito parcial para a obtenção do grau de Mestre. Orientadora: Profª Dra. Heidi Elisabeth Baeck Rio de Janeiro 2009 UNIVERSIDADE VEIGA DE ALMEIDA SISTEMA DE BIBLIOTECAS Rua Ibituruna, 108 – Maracanã 20271-020 – Rio de Janeiro – RJ Tel.: (21) 2574-8845 Fax.: (21) 2574-8891 FICHA CATALOGRÁFICA A553a Andrade, Flávia Viegas de FICHA CATALOGRÁFICA Análise de parâmetros espectrais da voz em crianças saudáveis de 4 a 8 anos/ Flávia Viegas de Andrade, 2009. 71p. ; 30 cm. Dissertação (Mestrado) – Universidade Veiga de Almeida, Mestrado em Fonoaudiologia, Rio de Janeiro, 2009. Orientação: Heidi Elisabeth Baeck 1. Crianças - voz. 2. Acústica da fala. I. Baeck, Heidi Elisabeth. (orientador). II. Universidade Veiga de Almeida, Mestrado em Fonoaudiologia. III. Título. CDD – 616.855 DeCS Ficha Catalográfica elaborada pela Biblioteca Setorial Tijucal/UVA FLÁVIA VIEGAS DE ANDRADE ANÁLISE DE PARÂMETROS ESPECTRAIS DA VOZ EM CRIANÇAS SAUDÁVEIS DE 4 A 8 ANOS. Dissertação apresentada ao curso de pós-graduação em Fonoaudiologia da Universidade Veiga de Almeida, como requisito parcial para a obtenção do grau de Mestre. Aprovada em 07 de agosto de 2009. BANCA EXAMINADORA Profa. Heidi Elisabeth Baeck, D. Sc. Universidade Veiga de Almeida – UVA/RJ Prof. Ciríaco Cristovão Tavares Atherino, D. Sc. Universidade Veiga de Almeida – UVA/RJ Prof. Domingos Sávio Ferreira de Oliveira, D. Sc. Universidade Veiga de Almeida – UVA/RJ Profa. Zuleica Antonia de Camargo, D. Sc. Pontifícia Universidade Católica de São Paulo - PUC/SP ii Esta pesquisa não poderia ter sido realizada se não a colaboração e amor incondicionais de meus queridos pais, irmã gêmea e noivo. iii Meus profundos agradecimentos A Deus e a todos os espíritos de luz que me acompanham, por me darem saúde e força para realização deste estudo. Aos meus amados pais, Norma e Hélio, que estão sempre presentes e, cuja formação que me proporcionaram, ajudou a trilhar meu caminho até aqui. À minha querida irmã gêmea e fonoaudióloga, Danieli, por estar sempre ao meu lado e trilhar sua trajetória dentro da fonoaudiologia junto comigo. Ao meu querido noivo, Marcos, pelo amor incondicional e paciência nas diversas horas em que estive ausente. À Profa. Dra. Heidi Elisabeth Baeck por me incentivar com seus conhecimentos de engenharia aplicados à análise acústica de voz e por todo apoio, dedicação e disposição em toda trajetória de elaboração deste trabalho. Ao Prof. Dr. Ciríaco Cristovão Tavares Atherino por todo carinho e disposição em todos os momentos. Agradeço com imenso carinho À Profa. Dra. Sílvia Maria Rebelo Pinho, por ter me conquistado desde sua primeira aula e, pelo incentivo constante em basear meu raciocínio clínico na fisiologia vocal. À Profa. Dra. Zuleica Camargo, por me ajudar a percorrer o fascinante mundo da análise acústica da voz. iv Agradeço ainda Ao Prof. Dr. Domingos Sávio Ferreira de Oliveira pelas sugestões feitas na banca de qualificação deste trabalho e ao professor Dr. John Van Borsel pelo auxílio na documentação da viagem até a Universidade de Ghent, na Bélgica, durante o curso de mestrado. À toda equipe da Policlínica Maria Cristina Roma Paugartten e às equipes de professores e direção das escolas pelo encaminhamento das crianças e grande parceria formada. Às amigas da turma de mestrado pelo companheirismo, apoio e entusiasmo com que me acompanharam por todo o curso. Às crianças e seus responsáveis por permitirem a realização deste trabalho. v “Um cientista precisa manter a veneração pelo desconhecido. Se perder esse frescor, vai com ele a flexibilidade que faz a criação científica”. Marcelo Gleiser vi RESUMO A presente pesquisa teve como objetivo investigar parâmetros espectrais descritivos da voz de crianças saudáveis entre quatro e oito anos. Foram selecionadas 207 crianças sem transtornos da expressão oral, de ambos os sexos, divididas por faixa etária. Os sinais de fala foram obtidos a partir das gravações de sentenças-veículo. Foram selecionados segmentos das sete vogais orais do português falado no Brasil em posição tônica para a estimação das medidas de frequência fundamental (f0) e frequências dos formantes (F1, F2 e F3). Foi ainda estimada a largura de banda de F1 da vogal [i]. O recorte e processamento dos sinais foram realizados com o auxílio do software Praat. Os achados mostraram valores médios de cada parâmetro investigado, sendo observado um decréscimo na frequência fundamental e nas frequências dos formantes com o aumento da idade. A idade de seis anos foi apontada como determinante para as mudanças acústicas das vocalizações infantis. Diferenças de gênero, no qual o sexo feminino tende a mostrar freqüências mais elevadas também foram apontadas. O presente estudo refere-se a uma investigação ampla, diferenciada em termos número de vogais investigadas e número de crianças participantes e, portanto, os valores paramétricos apontados consistem em uma importante contribuição para a língua portuguesa falada no Brasil. Palavras-chave: análise acústica, processamento digital, crianças vii ABSTRACT The aim of this study was to investigate spectral parameters on voices of healthy children between four and eight years old. Two hundred and seven children of both genders without speech or voice disorders were selected and separated by age groups. Recordings were obtained from carrier phrases and segments of the seven oral vowels of Brazilian Portuguese in the stressed syllable were selected to estimate the fundamental frequency (f0) and the frequencies of the first three formants (F1, F2 e F3), and also the bandwidth of F1 of vowel [i]. Software Praat was used to cut and process these recordings. Our findings showed medium values for each parameter investigated and we observed that the formant frequency and fundamental frequency values decreased as age increased. We pointed out that acoustical changes on voice of children can be determinate at the age of six years old. We found gender differences which females presented higher frequencies in these parameters. The present study refers to a wide investigation which differs from others in number of vowels investigated and number of subjects. For this reason, these parametric values consist in an important contribution to the Portuguese language spoken in Brazil Key Words: acoustic analysis, digital processing, children viii SUMÁRIO 1. INTRODUÇÃO, p.11 2. OBJETIVO, p.15 3. FUNDAMENTOS TEÓRICOS, p.16 3.1 PROCESSAMENTO DIGITAL DO SINAL, p.16 3.2 PARÂMETROS DESCRITIVOS DA VOZ, p.17 3.2.1 Frequência fundamental e frequências dos formantes, p.17 3.2.2 Largura de banda, p.18 3.3 TRATO VOCAL INFANTIL, p.19 4. REVISÃO DA LITERATURA, p.20 4.1 A VOZ ENQUANTO OBJETO DE PESQUISA, p. 20 4.2 A VOZ INFANTIL, p.22 4.3 O ESTADO DA ARTE, p.27 5. METODOLOGIA, p.31 5.1 CASUÍSTICA, p.31 5.2 MATERIAIS, p.32 5.2.1 Materiais de seleção de participantes, p.32 5.2.2 Materiais de aquisição e análise de dados, p.32 ix 5.3. PROCEDIMENTOS, p.32 5.3.1 Procedimentos de seleção dos participantes, p.32 5.3.2 Aquisição de Dados, p.33 5.3.3 Processamento de Sinais, p.34 5.3.4 Análise estatística, p.35 6. RESULTADOS, p.36 7. DISCUSSÃO, p.49 7.1 MEDIDAS DOS PARÂMETROS ESPECTRAIS, p.49 7.2 DIFERENÇAS ENTRE FAIXAS ETÁRIAS E GÊNEROS, p.54 8. CONCLUSÃO, p.61 REFERÊNCIAS BIBLIOGRÁFICAS, p.62 ANEXO, p.67 (A) Escala RASATI, p.67 APÊNDICES, p.64 (A) Termo de Consentimento Livre e Esclarecido, p.68 (B) Roteiro de Avaliação do Sistema Ressonantal, p.71 x 11 1. INTRODUÇÃO A voz sempre exerceu fascínio em seus estudiosos, sendo por vezes, considerada um mistério a ser desvendado. Assim como comumente ocorre na ciência, avanços tecnológicos representaram marcos na evolução da pesquisa de voz. Em 1877 Thomas Edison fez o que é mundialmente reconhecida como a primeira gravação da voz humana, embora, recentemente, já se discuta a possibilidade deste feito ter sido realizado 17 anos antes (em abril de 1860), por um parisiense pouco conhecido, Édouard-Léon Scott de Martinville (The New York Times, Nov 2008). A possibilidade de registrar vozes e produzi-las tantas vezes quanto necessário introduziu um importante fator de confiabilidade aos resultados obtidos na pesquisa da voz humana. O século XX marca o período moderno da avaliação da voz. Avaliações vocais que eram realizadas com base exclusivamente na percepção auditiva do avaliador, passaram a contar com o auxílio de equipamentos capazes de relacionar diferentes características do som. Os oscilógrafos, a partir da década de 1920, possibilitaram observar a amplitude do som em função do tempo, enquanto os espectrógrafos analógicos, a partir de 1940, auxiliaram a determinar a composição de frequências do som (BEHLAU e col., 2001). Ambos contribuíram significativamente para o desenvolvimento da avaliação do som da voz, porém tornaram-se obsoletos após o surgimento da avaliação computadorizada (JOTZ e col., 2001). Um dos mais importantes avanços ocorreu em 1970, com a introdução do processamento digital de sinais. Sistemas baseados em circuitos analógicos de tempo contínuo passaram a ser 12 implementados através de sistemas digitais de tempo discreto (MITRA, 2001). Os computadores passaram a produzir espectrogramas semelhantes aos espectrógrafos, porém com diversas vantagens, tais como a visualização do gráfico na tela do computador e o armazenamento digital, além do significativo incremento na velocidade e confiabilidade de obtenção dos parâmetros acústicos (BEHLAU e col., 2001). Atualmente a avaliação da voz é basicamente realizada de duas formas: avaliação perceptivo-auditiva e avaliação espectrográfica computadorizada. A avaliação perceptivoauditiva, por vezes denominada análise psicoacústica (JOTZ e col., 2001), se caracteriza por não utilizar qualquer ferramenta além da sensibilidade auditiva. Capaz de avaliar detalhes de sonoridade, em termos metodológicos, a subjetividade inerente a este tipo de avaliação vocal pode ser considerada uma desvantagem. A avaliação perceptivo-auditiva é amplamente utilizada na prática clínica fonoaudiológica e é base para seleção de amostras em diversas pesquisas relativamente recentes (DORNELLES e col.; 2001; CARRARA-DE-ANGELIS e col.; 2001; BENETON e col.; 2004; CORAZZA e col.; 2004; NEMR e col.; 2005). A análise espectrográfica tem relevância e aplicabilidade indiscutíveis, porém não deixa de impor certo grau de subjetividade à avaliação vocal, uma vez que a leitura dos espectrogramas depende do avaliador que, necessariamente, deve apresentar um considerável grau de conhecimento específico (CARRARA-DE-ANGELIS e col., 2001). A partir de 1980, além do método matemático de estimação espectral que gera o espectrograma (Short Time Fourier Transformer STFT / Fast Fourier Transformer FFT), outros estimadores espectrais (como o Linear Predictive Coding - LPC) e diversos algoritmos de extração de parâmetros acústicos (KENT e READ, 1996) ampliaram a análise acústica da voz. Abriu-se, portanto, a possibilidade de realizar análises vocais exclusivamente quantitativas, resultando em valores numéricos promediados. A objetividade concedida por estes métodos viabiliza o uso dos parâmetros acústicos obtidos em sistemas de 13 reconhecimento automático de padrões vocais (BAECK e SOUZA, 2003; 2004). Sistemas estes, que consistem na base do desenvolvimento de ferramentas de auxílio diagnóstico e terapêutico. Apesar da diversidade nas formas de avaliação vocal e da extensa possibilidade de aplicação das mesmas, pode ser observada na literatura uma tendência de se investigar parâmetros espectrográficos em uma população predominantemente adulta (PETERSON e BARNEY, 1952; BEHLAU, 1984; BEHLAU e col.; 1988; ANDRIANOPOULOS e col., 2001; NEMR e col.; 2005; GELFER e MIKOS, 2005). A população infantil é pesquisada de forma mais restrita, tanto no que se refere à quantidade de pesquisas, quanto à diversidade de parâmetros acústicos investigados. Dentre as pesquisas que investigaram a voz infantil observa-se um número maior de publicações que mostram achados referentes à fonte glótica, tais como medidas de frequência fundamental e intensidade, com seus valores absolutos e/ou índices de perturbação (NIEDZIELSKA, 2001; NIEDZIELSKA e col., 2001; WERTZNER e col., 2005, NICOLLAS e col., 2008; CAPPELLARI e CIELO, 2008, BRAGA e col., 2009; SCHOTT e col. 2009). Em número menor, algumas pesquisas apontam parâmetros descritivos do trato vocal infantil (frequências dos formantes) (BEHLAU, 1984; BEHLAU e col.; 1988; BUSBY e PLANT, 1995; HUBER e col., 1999). A amplitude dos formantes é pouco descrita na literatura de vozes infantis (HUBER e col., 1999) enquanto que medidas de banda dos formantes não foram encontradas nesta população. A relevância de se buscar a padronização de parâmetros acústicos da voz infantil pode ser apontada, no mínimo, em duas direções. A primeira refere-se ao potencial de aplicação dos padrões em questão, no campo do auxílio diagnóstico de patologias vocais na infância. A segunda está associada ao estudo das emissões orais (choro/vocalizações) em bebês. A carência, na literatura, de padrões vocais em crianças que possam dar suporte às discussões de 14 relação entre o comportamento evolutivo das oralizações de bebês e o desenvolvimento dos movimentos articulatórios na criança, tem sido apontada por grupos desta linha de pesquisa (ROTHGÄNGER, 2003; BAECK e SOUZA, 2007). Parece evidente a importância de se realizar pesquisas que contemplem as características acústicas da voz infantil de forma ampla, gerando resultados cada vez mais consistentes, que possam contribuir para a compreensão global do comportamento evolutivo da voz humana. 15 2. OBJETIVO Aplicando métodos de processamento digital de sinais, o presente estudo teve como objetivo investigar as medidas de parâmetros espectrais (frequência fundamental, frequência dos três primeiros formantes e largura de banda de F1 da vogal [i]) descritivos da voz de crianças saudáveis entre quatro e oito anos. Com amostras significativamente mais consistentes do que aquelas até então apresentadas na literatura, pretendeu-se contribuir para a determinação de padrões acústicos vocais infantis do português brasileiro. 16 3. FUNDAMENTOS TEÓRICOS Os conceitos relacionados ao processamento digital do sinal, parâmetros descritivos da voz e particularidades anatômicas do trato vocal infantil consistem em pontos importantes para a compreensão do conteúdo global deste trabalho. Desta forma, tais conceitos serão adequadamente abordados neste capítulo. 3.1 PROCESSAMENTO DIGITAL DO SINAL Podem ser encontradas, na literatura da engenharia elétrica, diversas ferramentas matemáticas essencialmente de tempo contínuo, como as transformadas de Laplace e de Fourier (RABINER, 1978). Porém o advento da tecnologia digital gerou a necessidade de obter ferramentas equivalentes no tempo discreto, como as Transformada Z e a Transformada Discreta de Fourier. Os conhecimentos em torno destas e de diversas outras ferramentas foram agrupados sob o nome de Processamento Digital de Sinais (Digital Signal Processing DSP) (NEBEKER, 1998). São relativamente numerosos os métodos de estimação espectral e algoritmos de extração de parâmetros (processados no tempo ou na frequência), aplicáveis à análise vocal. Em geral, os nomes são associados aos procedimentos do método em si ou ao pesquisador que os desenvolveu (como a Função de Autocorrelação para extração de f0 ou o algoritmo de McCandless para extração de formantes, respectivamente). 17 3.2 PARÂMETROS DESCRITIVOS DA VOZ Os parâmetros capazes de descrever uma voz consistem nas características físicas do som desta voz. Tais características são domínio da área de conhecimento da física acústica, motivo pelo qual os parâmetros descritivos da voz são comumente denominados de “parâmetros acústicos”. Da mesma forma, a análise que envolve obtenção de parâmetros acústicos foi particularmente denominada de “análise acústica”, termo unânime na literatura correlata. É grande o número de parâmetros acústicos que podem ser estimados de um segmento vocal, porém, a busca é sempre no caminho de definir quais parâmetros, associados ou isolados, carregam informações a respeito da voz investigada. Os parâmetros temporais (processados exclusivamente no domínio do tempo) estão associados à duração, de parte ou de todo o segmento analisado, enquanto os espectrais (processados no domínio da frequência) estão associados aos componentes da onda complexa (espectro da voz). A seguir serão comentados os parâmetros investigados no presente trabalho. 3.2.1 Frequência Fundamental (f0) e Frequência dos Formantes (Fn) É amplamente conhecido que a voz é resultante do som produzido na glote a partir da vibração das pregas vocais, acrescido de modificações nas cavidades de ressonância, que funcionam como um filtro atenuando e enfatizando faixas de frequências (CARRARA-DEANGELIS e col., 2001; PINHO, 2003). A frequência fundamental (f0) e as frequências dos formantes são parâmetros clássicos que caracterizam a fonte glótica e o filtro ressonantal, respectivamente. Mais especificamente, a frequência fundamental corresponde ao componente periódico mais baixo (grave) do som produzido na glote (GOLDFIELD, 2000) e as faixas de frequência que apresentam picos de energia (determinados pelo filtro) são denominadas de formantes (Fn) (CARRARA-DE-ANGELIS e col., 2001; PINHO, 2003; GREGIO, 2006; BAECK e SOUZA, 2007). 18 Em geral, os três primeiros formantes são os mais relevantes para os estudos da voz, contudo, os dois primeiros, F1 e F2, são os que apresentam uma associação clara com a geometria do trato vocal, conferindo identidade fonética às vogais. (PINHO e CAMARGO, 2001; GREGIO, 2006; LIMA e col., 2007; MAGRI e col., 2007). A frequência do primeiro formante está relacionada ao deslocamento da língua no plano vertical (altura da língua) e com a abertura da mandíbula e a frequência do segundo formante relaciona-se ao deslocamento ântero-posterior da língua (plano horizontal) (GREGIO, 2006). O terceiro formante (F3) possui relação com as duas cavidades formadas pela posição da língua, ou seja, uma cavidade atrás e outra à frente da constrição da língua (LIMA e col., 2007). No entanto, correlações com os órgãos fonoarticulatórios ainda geram controvérsia na literatura. A qualidade vocal de um indivíduo sofre influência da fonte sonora e do filtro, no entanto, frequentemente a avaliação da fonte sonora é mais contemplada pelos pesquisadores (STEFFEN e MOSCHETTI, 1997; NIEDZIELSKA, 2001; NIEDZIELSKA e col., 2001; JOTZ e col., 2001; WERTZNER e col., 2005; FELIPPE e col., 2006; BRAGA e col., 2009, SCHOTT e col., 2009). 3.2.2 Largura de Banda A largura de banda do formante, simplesmente denominada de largura de banda ou banda de formante consiste na extensão da faixa de frequência efetiva de resposta do ressoador (MAGRI e col., 2009). Uma vez que a banda é variável em função da magnitude do formante, em uma relação inversamente proporcional, os métodos de estimação da largura de banda têm como base o intervalo entre dois pontos na envoltória espectral, que antecedem e sucedem o pico, determinados por cortes onde a intensidade decresce 3 dB em relação à frequência central do formante (pico da envoltória). 19 3.3 TRATO VOCAL INFANTIL As bases anatômicas e fisiológicas da laringe infantil são relativamente pouco conhecidas se comparadas às bases da laringe adulta. No entanto, sabe-se que a laringe infantil não corresponde a uma miniatura da laringe do adulto, uma vez que existem diversas diferenças entre elas (HERSAN, 2003). O tamanho e o formato do trato vocal são fatores determinantes nas características do som a ser emitido e dependem diretamente da idade e gênero. O trato vocal infantil é mais curto que o trato vocal do adulto e, assim como nos adultos, observa-se uma diferença nas medidas de comprimento se considerado o gênero da criança. Tendo como referência o trato vocal adulto masculino, o trato infantil (oito anos) apresenta, em média, medidas 25% e 42% menores, para meninos e meninas, respectivamente. Desta forma, as frequências dos formantes são mais agudas em crianças do que em adultos, e mais agudas em meninas do que nos meninos (BEHLAU e col., 2001). Assim como o comprimento do trato vocal, o comprimento das pregas vocais infantis também mostra suas particularidades. Hersan (2003) especifica que as medidas de comprimento das pregas vocais mantêm-se bastante próximas, para ambos os gêneros, até a idade de dez anos, quando começam a se diferenciar. 20 4. REVISÃO DA LITERATURA 4.1 A VOZ ENQUANTO OBJETO DE PESQUISA As primeiras pesquisas de voz baseavam-se na percepção auditiva da mesma. As avaliações da qualidade vocal eram realizadas através de julgadores treinados que, na maioria das vezes, se concentravam nos aspectos glóticos e no campo das alterações vocais (CAMARGO e MADUREIRA, 2004). Embora a pesquisa sobre as alterações vocais exigisse grupos controle, ou seja, indivíduos com as estruturas laríngeas saudáveis, a investigação da voz normal era relativamente pouco enfocada. Com o surgimento de novas tecnologias de avaliação vocal (análise acústica computadorizada) a possibilidade de investigar a voz patológica com um conjunto de parâmetros sistemáticos, gerou a necessidade de se definir padrões paramétricos de normalidade, motivando diversos pesquisadores a desenvolverem estudos focados na produção da voz de indivíduos saudáveis (BUSBY e PLANT, 1995; HUBER e col., 1999; CORAZZA e col., 2004; FELLIPE e col., 2006; BAECK e SOUZA, 2007, NICOLLAS e col.; 2008, CAPPELLARI e CIELO, 2008, BRAGA e col., 2009, SCHOTT e col., 2009). O uso da espectrografia na pesquisa da voz rendeu à literatura algumas publicações fundamentais que deram luz a diversos estudos que se seguiram ao longo do tempo. Em 1952, Peterson e Barney (citados em Behlau e col.,1988) investigaram parâmetros supraglóticos, ou seja, as frequências dos três primeiros formantes de dez vogais do inglês americano em uma amostra de 76 sujeitos (61 adultos e 15 crianças). Com base nos resultados deste trabalho, os 21 autores elaboraram o polígono acústico das vogais do inglês e formam historicamente reconhecidos por tal contribuição. No entanto, quatro anos antes, 1948, Delattre (citado em Behlau e col.,1988) já havia apresentado um triângulo acústico das vogais do francês, elaborado com frequências dos dois primeiros formantes. Além do polígono vocálico francês, Delattre desenvolveu um trabalho notável sobre a interpretação fisiológica dos espectrogramas, relacionando as frequências dos três primeiros formantes com seus locais de configuração no trato vocal (Delattre,1951). As frequências dos dois primeiros formantes das vogais do português de Portugal foram pesquisadas por Martins, em 1971 (citado em Behlau e col.,1988) a partir das vozes normais de oito adultos do sexo masculino. Os achados de um estudo envolvendo o português do Brasil, falado na cidade de São Paulo, foram publicados em 1984 (BEHLAU, 1984). Com diversos objetivos específicos, vozes normais e/ou patológicas, aspectos glóticos e/ou supraglóticos, a partir da década de 80, cresceu o número de publicações que utilizaram a espectrografia computadorizada como ferramenta de avaliação da voz (GLAZE e col., 1988; 1990; BUSBY e PLANT, 1995; ANDRIANOPOULOS e col.; 2001; NEMR e col.; 2005). E, a partir da década de 90, surgem os trabalhos com base na estimação de parâmetros quantitativos com processamento digital de sinais e estimadores espectrais diferentes dos implementados no espectrograma (HUBER e col., 1999, BAECK e SOUZA, 2004; 2007; MAGRI e col., 2007, LIMA e col., 2007). Estas ferramentas vêm motivando pesquisadores que apresentam um interesse especial pelo caráter objetivo proporcionado por essa metodologia. 22 4.2 A VOZ INFANTIL A voz infantil foi investigada de forma mais restrita em relação ao adulto. Os primeiros estudos nesta população foram desenvolvidos na linha de estabelecer análises comparativas com a voz adulta. Já citados, Peterson e Barney, em 1952, desenvolveram um estudo que possivelmente represente um dos pioneiros no que se refere à investigação da voz infantil (amostra de 61 adultos e 15 crianças). Além da análise perceptivo-auditiva com 76 julgadores, as frequências dos três primeiros formantes das vogais da língua inglesa [a], [i], [u], [æ] foram analisadas a partir do espectrograma. A amostra de falantes infantis foi composta por 15 crianças de ambos os sexos na faixa etária de nove anos. Os resultados apontaram que as frequências dos formantes diferiram substancialmente entre os indivíduos analisados de acordo com o sexo. Eguchi e Hirsh (1969), citados em Busby e Plant (1995), pesquisaram através de análise espectrográfica, as frequências dos dois primeiros formantes de vozes de 84 crianças entre três e treze anos e adultos falantes do inglês americano. As vogais pesquisadas foram as mesmas do estudo anterior, no entanto foram utilizadas sentenças no lugar de monossílabos. O estudo mostrou decréscimo nas frequências dos formantes à medida que a idade da criança aumentou e que estas mudanças foram mais significativas para crianças menores de cinco anos e também para crianças de seis a treze anos. Os estudos que se seguiram ao longo das décadas de 80 e 90 confirmaram, em linhas gerais, tais achados, mostrando particularidades apenas nas faixas etárias. Behlau (1984) investigou as frequências dos três primeiros formantes das sete vogais orais e cinco nasais do português brasileiro a partir de espectrogramas gerados com tecnologia analógica. As vogais foram emitidas de forma isolada e sustentada por 30 crianças entre oito e doze anos e 60 adultos entre 18 a 45 anos, todos pareados por sexo. A autora apontou que não foi possível o registro espectrográfico da frequência do terceiro formante da vogal [u] em 37,7% das 23 emissões e apontou ainda que as relações entre as frequências de F2 e F1 foram praticamente constantes para todas as vogais nos dois grupos de falantes. Segundo a autora, a constância desta relação é que preserva a identidade fonética das vogais, mesmo que os valores absolutos dos formantes sejam muito diferentes entre as idades e sexo. Os valores absolutos das frequências dos formantes mostraram-se significativamente mais altos em crianças, em relação aos 60 adultos. A diferença entre os formantes apresentados por crianças e adultos foi atribuída às diferenças no tamanho do trato vocal destas populações. A autora não mencionou ter investigado, nas crianças, diferenças nos parâmetros em função do gênero. Behlau refere ter estimado também a frequência fundamental nessa mesma população, no entanto, somente da vogal [a]. Glaze e col. (1988) investigaram os efeitos da idade, sexo, estatura e peso sobre a produção vocal de 121 crianças com idades entre cinco e onze anos. A frequência fundamental, jitter, shimmer e proporção harmônico-ruído foram estimados da vogal [a] sustentada. Os autores obtiveram significância estatística na correlação entre frequência fundamental e sexo, com valores maiores para as meninas. Num estudo semelhante, envolvendo os mesmos parâmetros e faixa etária dos participantes, porém incluindo a vogal [i] e três intensidades diferentes na emissão das vogais: fraca, normal e forte, os mesmos autores investigaram uma amostra de 97 crianças (GLAZE e col., 1990). Os resultados mostraram diferenças estatisticamente significantes com o aumento da intensidade, para os quatro parâmetros investigados. Em uma abordagem que incluiu vozes patológicas, Steffen e Moschetti (1997) investigaram as medidas de jitter e shimmer em 131 crianças saudáveis e 117 disfônicas, entre seis e dez anos. Os autores concluíram que estes parâmetros não foram eficazes para determinar normalidade ou patologia vocal nestas crianças. Niedzielska e col. (2001), em oposição, referiram que jitter, shimmer, assim como os demais parâmetros investigados, 24 frequência fundamental (f0), tremor da frequência fundamental e proporção harmônico-ruído, se revelaram parâmetros relevantes na tarefa de diferenciar vozes normais e patológicas. Neste estudo foram investigadas 46 crianças entre quatro e quatorze anos, nas condições pré e pós-tratamento de nódulos vocais. No mesmo ano, a autora investigou os mesmos parâmetros em desordens orgânicas e funcionais da voz, comparando 112 crianças portadoras de diferentes distúrbios do aparelho fonador e 31 crianças sem alterações vocais (grupo controle), com idades entre três e dezesseis anos (NIEDZIELSKA, 2001). Divergindo de suas próprias conclusões, apontadas no trabalho anterior (NIEDZIELSKA e col., 2001), os achados deste trabalho confirmaram diferença estatisticamente significante apenas para a proporção harmônico-ruído. Entre os trabalhos que priorizaram a investigação dos parâmetros acústicos supraglóticos, as autoras chinesas Yang e Mu (1989) investigaram a frequência do terceiro formante (F3) da vogal [a] em indivíduos saudáveis, sendo 209 crianças entre três e doze anos (104 meninos e 105 meninas) e 40 adultos pareados por sexo. Contrariamente aos conceitos tradicionais consagrados pela literatura, os resultados deste estudo mostraram que existe uma significante diferença na frequência do terceiro formante da vogal [a] entre crianças do sexo masculino e feminino. De acordo com as autoras, esta diferença começa a se desenvolver aos três anos e se torna substancial aos seis anos de idade. Em 1995, Busby e Plant estimaram a frequência fundamental e as frequências dos três primeiros formantes do inglês australiano das vozes de 40 crianças divididas em quatro grupos: cinco, sete, nove e onze anos, sendo cinco meninos e cinco meninas em cada grupo. Os resultados mostraram que os valores da frequência fundamental decresceram com o aumento da idade, porém não foram encontradas diferenças significativas deste parâmetro entre os sexos. As frequências dos três primeiros formantes, da mesma forma, mostraram um decréscimo em função do aumento da idade, sendo este decréscimo mais consistente nas 25 faixas de cinco a sete anos e nove a onze anos. Frequências mais altas para meninas (diferenças entre sexos) foram observadas em F1, para vogais [æ], [a] e [u], e em F2 para quase todas as vogais. Gilbert e col. (1997) inovaram no que se refere à faixa etária e ao delineamento longitudinal da pesquisa. Foram investigadas as frequências dos dois primeiros formantes em vocalizações espontâneas de quatro meninos entre 15 e 36 meses de vida. As gravações foram realizadas em cinco momentos: aos 15, 18, 21, 24 e 36 meses de vida. Os resultados indicaram que tanto o F1 quanto o F2 permaneceram relativamente imutáveis antes dos 24 meses de vida, porém passaram a assumir um comportamento descendente entre o 24º e 36º mês. Huber e col. (1999) desenvolveram um estudo abrangente envolvendo a f0 e as frequências e amplitudes dos três primeiros formantes em vozes de crianças e adultos falantes do inglês norte americano. Cento e oitenta indivíduos foram pareados por sexo e dispostos em grupos de 20 participantes cada, nas seguintes faixas etárias: 4,6,8,10,12,14,16,18 anos e 20 a 30 anos (adultos). A vogal [a] foi produzida três vezes por cada sujeito e as frequências dos formantes foram obtidas através da análise de LPC (Linear Predictive Coding). As amplitudes dos formantes foram medidas pela mais alta amplitude harmônica na área de cada formante. Os resultados mostraram que a frequência do primeiro formante aumenta com a intensidade e muda em função da idade e do sexo. As frequências de F2 e F3 mudam em função da idade e do sexo. As amplitudes dos formantes seguiram as tendências das diferenças de níveis de pressão sonora e não apresentaram mudanças em função do sexo e idade. A f0 diminuiu com o aumento da idade. Lee e col. (1999) analisaram a variabilidade da duração, da frequência fundamental, das frequências dos formantes e do envelope espectral em função do sexo e idade. Participaram do estudo 436 crianças com idades entre cinco e dezessete anos e 56 adultos 26 (com idades entre 25 e 50 anos), falantes do inglês americano. Para obtenção das medidas, foi utilizada uma sentença-veículo, porém para as crianças de cinco e seis anos foram utilizadas repetições de palavras isoladas. As crianças foram divididas em grupos com intervalo de faixa etária de um ano. Os resultados mostraram que a redução na variabilidade intra-sujeito dos aspectos acústicos (temporais e espectrais) com a idade, é a maior tendência associada ao desenvolvimento da fala/voz em crianças normais. Os autores ainda referiram que a diferenciação entre a frequência fundamental masculina e feminina e entre os padrões de frequências dos formantes, inicia-se aos onze anos e se torna totalmente estabelecida aos quinze anos. Durante este período de tempo, as mudanças nas frequências dos formantes de falantes masculinos mantêm uma relação aproximadamente linear com a idade, enquanto que tal tendência é menos óbvia nos falantes do sexo feminino. Perry e col. (2001) analisaram as medidas de frequência fundamental e frequência dos três primeiros formantes de 80 crianças com idades de quatro a dezesseis anos. Os participantes foram divididos em quatro grupos, nas seguintes faixas etárias: 4,8,12 e 16 anos, sendo 20 em cada grupo, pareados por sexo. Os objetivos do estudo foram examinar estas medidas acústicas e a habilidade de ouvintes em identificar os gêneros das vozes. Foram analisadas sete vogais do inglês americano, sendo que as amostras vocais foram coletadas a partir de uma sentença-veículo, na qual foram completados vocábulos com estas vogais. Num segundo momento, 20 adultos tiveram a tarefa de identificar os gêneros das vozes gravadas. Os resultados mostraram que a análise das frequências dos formantes pôde diferenciar os gêneros, mesmo em crianças muito jovens (faixa etária de quatro anos), enquanto que a análise da frequência fundamental pôde diferenciar os sexos após os doze anos. 27 4.3 O ESTADO DA ARTE Nos últimos anos cresceu consideravelmente o número de publicações que investigaram a voz infantil, sob seu aspecto patológico (BENETTON e col., 2004; WERTZNER e col.; 2005; MOURA e col., 2008; HAMDAN e col., 2009; ANDRADE, 2009) ou, em condições de normalidade (VANZELLA, 2006; FUCHS e col., 2007; NICOLLAS e col., 2008; BAKER e col., 2008; CAPPELLARI e CIELO, 2008; SCHOTT e col., 2009; BRAGA e col., 2009), mostrando que o estudo dessa população é uma tendência atual. Os métodos utilizados para avaliar as vozes das crianças nestes estudos mostram-se diversificados. Benetton e col. (2004) investigaram os efeitos da rinite alérgica sobre a qualidade da voz de 40 crianças alérgicas entre sete e doze anos, baseados exclusivamente em parâmetros psicoacústicos. A análise comparativa com o grupo controle não confirmou diferenças estatisticamente significantes para nenhum parâmetro investigado. Wertzner e col. (2005) avaliaram 20 crianças com transtorno fonológico e 20 crianças sem o transtorno entre quatro e dez anos, a partir das emissões isoladas e sustentadas das vogais [a], [ε] e [i]. A frequência fundamental da vogal [ε] e as médias de intensidade vocal apresentaram-se menores no grupo com transtorno fonológico em relação ao grupo controle. Andrade (2009) investigou a f0 e as frequências de F1, F2 e F3 das vogais [a], [i] e [u] em 50 crianças respiradoras orais de cinco a dez anos e comparou ao grupo controle. A autora encontrou diferenças estatísticas na f0 das vogais [i] e [u], no entanto diferenças estatísticas nas frequências dos formantes não foram encontradas entre os dois grupos. Os parâmetros acústicos e psicoacústicos das vozes de crianças portadoras da síndrome de Down (MOURA e col., 2008) e síndrome de déficit de atenção e hiperatividade (HAMDAN e col., 2009) apontaram uma frequência fundamental mais grave para as crianças com as síndromes, ao serem comparadas com os grupos controle. Além da diferença 28 observada na frequência fundamental, a pesquisa que envolveu crianças com síndrome de Down, ainda apontou diferenças significativas nas frequências de F1 e F2, sendo que a relação entre as frequências de F1 e F2 revelou um prejuízo na distinção das vogais no grupo com a síndrome, refletindo uma diminuição na inteligibilidade da fala. Entre os autores que contribuíram para a compreensão das características da voz em crianças normais, encontra-se Vanzella (2006), que investigou 182 crianças entre sete a dez anos, de ambos os gêneros, frequentadores de escolas públicas e particulares de São Carlos (SP). A partir de uma análise acústica computadorizada da vogal sustentada [a], a autora referiu ter obtido, entre outros parâmetros pouco descritos na literatura, uma frequência fundamental média de 237 Hz para os participantes. Fuchs e col. (2007) analisaram vozes de 21 meninos que cantavam profissionalmente em um coral, com objetivo de verificar o potencial da análise acústica para estimar o início da muda vocal. Com um delineamento longitudinal, a mesma criança teve sua voz falada gravada mensalmente, durante um período de três anos, entre nove e doze anos, e reavaliada uma vez entre treze e quinze anos. Os resultados mostraram mudanças significativas nas medidas de irregularidade da frequência fundamental e intensidade (jitter e shimmer, repectivamente) em torno de seis meses antes da muda vocal, levando os autores a concluírem pela efetividade destes parâmetros acústicos na detecção do início da muda vocal. Nicollas e col. (2008) investigaram as vozes de 212 crianças entre seis e doze anos com o objetivo de investigar mudanças nas vozes de crianças normais antes da muda vocal. Além da estimação da frequência fundamental (f0), do jitter e do shimmer, foram estimados outros parâmetros pouco descritos na literatura. Os participantes foram divididos nas seguintes faixas etárias: seis anos (9 crianças); sete anos (24 crianças); oito anos (18 crianças); nove anos (24 crianças); dez anos (27 crianças); onze anos (55 crianças); doze anos (54 crianças). Os sinais analisados referem-se a trechos de um segundo recortados da emissão 29 sustentada da vogal [a]. Os resultados mostraram que a f0 decresceu de 268 Hz para 234 Hz em meninos e 260 Hz para 239 Hz em meninas e que as medidas de jitter e shimmer não variaram significantemente com o sexo e a idade. Os autores concluíram que a f0 diminuiu com a idade e foi menor para os meninos em relação às meninas mesmo antes do período de mutação da voz. Baker e col. (2008) investigaram a influência do tipo de tarefa vocal na medida da frequência fundamental (f0), em 48 crianças saudáveis falantes do inglês americano, com idades entre cinco anos e sete anos e onze meses. A frequência fundamental da vogal [a] foi estimada em quatro situações vocais diferenciadas: a) sustentada por cinco segundos; b) sustentada dentro de uma palavra, no final de uma frase; c) repetição de uma frase e d) contagem de um até dez. Cada criança foi avaliada por dois julgadores treinados, sendo que os resultados revelaram uma significante diferença neste parâmetro entre as tarefas. A contagem apontou valores maiores de f0 quando comparada com a sustentação da vogal no final da frase e a repetição da frase, no entanto, não foram observados efeitos significativos das tarefas em relação à idade e ao sexo. Os autores não mencionaram comparação com a vogal sustentada. No mesmo ano, Cappellari e Cielo realizaram uma pesquisa que analisou medidas acústicas de vozes saudáveis de 23 crianças brasileiras, dividas em três faixas etárias: 4,0 a 4,11 (n=7), 5,0 a 5,11 (n=11), 6,0 a 6,8 (n=5). Foram analisadas as medidas de f0, proporção harmônico-ruído (PHR), índice de turbulência vocal e medidas de perturbação da intensidade e f0, a partir da vogal [a] sustentada por no mínimo três segundos. Para seleção das crianças, as autoras utilizaram questionário com os pais, triagem auditiva e avaliação perceptivoauditiva (Escala RASAT). Os resultados das médias mínimas e máximas para determinação do intervalo de normalidade da frequência fundamental, por faixa etária, foram: 4 anos, sexo masculino (M): 266 Hz a 375 Hz; 4 anos, sexo feminino (F): 285 Hz a 355 Hz; 5 anos, sexo M: 247 Hz a 350 Hz; 5 anos, sexo F: 247 Hz a 355 Hz; 6 anos, sexo M: 274 Hz a 325 Hz e 6 30 anos, sexo F: 247 a 315 Hz. Os resultados mostraram ainda que no grupo de quatro anos de idade, a f0 foi discretamente menor em relação à literatura, o índice de variação da f0 foi maior em relação aos outros grupos e que houve significante diferença na PHR entre esse grupo e os demais. Um estudo realizado no estado do Rio de Janeiro (SCHOTT e col., 2009) avaliou a frequência fundamental de 122 crianças normais de seis a oito anos, de ambos os sexos. Foram realizadas análise perceptivo-auditiva, através da escala RASAT e análise acústica computadorizada. Foi investigada a frequência fundamental da vogal [ε] sustentada. Os resultados mostraram que a média da f0 foi 239 Hz para as meninas e 237 Hz para os meninos, obtendo-se desta forma, uma média geral de 238 Hz. O estudo também contemplou valores de moda de f0, sendo 237 Hz no sexo feminino e 233 Hz no sexo masculino, obtendo-se a média da moda de 235 Hz. BRAGA e col. (2009) analisaram a frequência fundamental da vogal [ε] do português brasileiro em 100 crianças, na faixa etária de seis a oito anos, pareadas por sexo. Os participantes passaram por uma triagem vocal realizada através de avaliação perceptivoauditiva (escala RASAT) e a investigação da f0 foi realizada a partir de análise computadorizada (com o auxílio do programa Voxmetria). Os resultados mostraram uma f0 média de 249 Hz, com tendência significantemente decrescente à medida que a idade da criança aumentou. Os autores ainda apontaram para diferenças estatísticas entre os sexos, de forma que, aos seis anos, observaram-se valores de f0 mais elevados nos meninos. A tendência decrescente de f0, frente ao aumento da idade, mostrou-se mais significativa nos meninos, do que nas meninas. 31 5. METODOLOGIA O projeto deste trabalho foi aprovado pelo Comitê de Ética em Pesquisa da Secretaria Municipal de Saúde da Prefeitura do Rio de Janeiro sob número: 180/2008, com necessidade de assinatura do Termo de Consentimento Livre e Esclarecido (apêndice A). O estudo foi realizado pela autora em uma sala do setor de fonoaudiologia da Policlínica Maria Cristina Roma Paugartten (SMS - CAP. 3.1). 5.1 CASUÍSTICA A amostra do presente trabalho foi constituída por segmentos vocais de crianças de quatro a oito anos. Obteve-se uma amostra de 1.449 segmentos vocais de 207 crianças divididas por sexo e idade. Esses segmentos geraram 13.041 valores numéricos relativos aos parâmetros investigados. As crianças foram pré-selecionadas nos setores de pediatria e odontologia da Policlínica Maria Cristina Roma Paugartten e em duas escolas. A pré-seleção foi realizada pelos profissionais de saúde e educação destas unidades, respeitando os critérios: condições de expressão oral e saúde geral dentro dos padrões de normalidade, idade entre quatro e oito anos. Uma vez pré-selecionadas, as crianças foram encaminhadas para o setor de fonoaudiologia da Policlínica Maria Cristina Roma Paugartten onde foram submetidas a 32 procedimentos de seleção (item 5.3.1). Foram selecionadas crianças cuja expressão oral e qualidade vocal apresentaram-se dentro dos padrões de normalidade. 5.2 MATERIAIS 5.2.1 Materiais de seleção de participantes - Escala RASATI (anexo A): Consiste em um protocolo de avaliação perceptivo-auditiva da fonte glótica proposto por Pinho e Pontes (2008); - Roteiro de avaliação do sistema ressonantal (apêndice B): Consiste em uma adaptação do roteiro de avaliação perceptivo-auditiva do som nas cavidades supraglóticas proposto por Pinho (2003). 5.2.2 Materiais de aquisição e análise de dados - Um notebook, marca HP, modelo DV 1000, com sistema operacional Windows XP; - Software de análise acústica Praat versão 5008 disponível on line no site: http://www.fon.hum.uva.nl/praat/ - Microfone marca SHURE, modelo SM 58. - Software aplicativo de análise estatística SAS versão 6.04 5.3 PROCEDIMENTOS 5.3.1 Procedimentos de seleção dos participantes Assim como descrito na casuística, as crianças da presente pesquisa foram incluídas mediante procedimentos de seleção. Neste item serão descritos os procedimentos realizados após a pré-seleção e encaminhamento ao setor de fonoaudiologia. No setor citado as crianças foram recebidas, juntamente com seus pais ou responsáveis, em uma entrevista individual com a fonoaudióloga autora da presente pesquisa, onde foram submetidas a uma triagem da expressão oral através do exame fonético REALFA. A triagem teve como objetivo a exclusão de crianças com expressão oral desviante do padrão 33 adequado à faixa etária. Concomitantemente, a fala espontânea e as sentenças-veículo foram gravadas com objetivo de dar suporte à posterior análise perceptivo-auditiva, fase de prosseguimento seletivo, caso a criança não tivesse sido excluída por inadequação da expressão oral. Os pais ou responsáveis assinaram o Termo de Consentimento Livre e Esclarecido durante a entrevista. A análise perceptivo-auditiva foi realizada por duas fonoaudiólogas especialistas em voz com aplicação da Escala RASATI e roteiro de avaliação do sistema ressonantal (item 5.2.1). Foram incluídas as crianças que apresentaram resultados dentro dos padrões de normalidade em ambas as avaliações. Foram consideradas normais na avaliação da fonte glótica crianças que apresentaram: grau 0 nos seis itens avaliados, com exceção do item soprosidade que poderia apresentar grau 0 ou 1. Esta tolerância foi permitida uma vez que a população infantil pode apresentar soprosidade em grau 1 (discreto) como padrão de normalidade (Behlau e col., 2001). Foram consideradas normais na avaliação de ressonância as crianças que apresentaram ressonância equilibrada. 5.3.2 Aquisição de Dados O protocolo de aquisição especificado a seguir é semelhante ao aplicado nos estudos de Jorge e col. (2004); Lima e col. (2007) e Magri e col. (2007). Os sinais de fala dos quais foram extraídos os segmentos analisados foram obtidos a partir das gravações de sentenças-veículo (“Fale____ para mim”), que foram preenchidas com os vocábulos “pápa”, “pépe”, “pêpe”, “pípi”, “pópo”, “pôpo” e “púpu”, de forma que estes estímulos fossem registrados por meio de repetições destas frases. Foram selecionados segmentos das sete vogais orais em posição tônica para a estimação das medidas de frequência fundamental (f0), frequência dos formantes (F1, F2 e F3) e largura de banda de F1 da vogal [i]. 34 As emissões foram gravadas em uma sala silenciosa, em mono canal, com uma taxa de amostragem de 22.050 Hz, em formato “.wav”, através do software Praat versão 5008 em um notebook com sistema operacional Windows XP, com um microfone da marca SHURE, modelo SM 58, posicionado a distância de 10 cm dos lábios da criança. 5.3.3 Processamento de sinais Os dados foram submetidos a procedimentos de pré-processamento (recorte dos segmentos vocálicos), processamento (estimação de parâmetros acústicos) e análise estatística. O pré-processamento e processamento foram realizados com auxílio do software Praat (item 5.2.2.), enquanto que a análise estatística foi realizada com o software SAS 6.04 (SAS Institute, Inc., Cary, North Carolina) O recorte das vogais foi realizado de forma manual, porém houve a preocupação em definir e seguir critérios de recorte passíveis de serem implementados em um futuro sistema de recorte automático. O marco inicial foi definido no trecho do sinal onde a energia apresentava-se acima de 20% da energia máxima. Da mesma forma, o marco final foi estabelecido onde a energia apresentava-se abaixo de 20% da mesma. Tal porcentagem foi estabelecida empiricamente com base em investigação experimental. Este procedimento é conservador no sentido de reduzir a probabilidade de obtenção de trechos não estacionários. Foram estimados os parâmetros espectrais clássicos: frequência fundamental e frequência dos três primeiros formantes, representantes da fonte glótica e de ressonância, respectivamente. Além destes, foi estimada a largura de banda do primeiro formante da vogal [i]. Esta análise não foi estendida aos demais segmentos vocálicos pesquisados por se tratar de uma investigação complementar de caráter exploratório. A vogal [i] foi definida, em especial, devido ao afastamento característico dos dois primeiros formantes observado na envoltória espectral da mesma. 35 Devido ao grande número de estimações envolvidas, foi utilizado um script (ferramenta que extrai automaticamente, de forma padronizada, as medidas paramétricas) criado pelos autores, que viabilizou a otimização do tempo de processamento e evitou possíveis erros de manuseio na sequência dos procedimentos de estimação. 5.3.4 Análise estatística A análise estatística foi composta pelos seguintes métodos: Para comparação das medidas de frequência fundamental e frequência dos formantes entre os sexos foi utilizado o teste de Mann-Whitney e para comparação entre as quatro faixas etárias foi realizada a análise de variância de Kruskal-Wallis e o teste de comparações múltiplas de Duncan. Foi usado teste não paramétrico, pois a maioria das medidas de frequências não apresentou distribuição normal (Gaussiana), devido à dispersão dos dados, falta de simetria da distribuição e pela rejeição da hipótese de normalidade segundo o teste de Shapiro-Wilk (W). O critério de determinação de significância adotado foi o nível de 5%, ou seja, valor de p menor ou igual a 0,05. 36 6. RESULTADOS Os achados da presente pesquisa encontram-se sumarizados nas tabelas expostas a seguir. Além da descrição dos dados, testes estatísticos foram aplicados com o objetivo de verificar a existência de diferenças estatisticamente significantes entre os valores paramétricos obtidos para os sexos masculino e feminino, assim como para as quatro diferentes faixas etárias investigadas. São expostos os valores referentes à análise espectral, sendo que todos os valores expostos referem-se à estimação de médias. A opção por expor diretamente valores médios deu-se em função do grande número de estimações obtidas neste trabalho, um total de 13.041 valores numéricos. Pelo mesmo motivo, os achados referentes aos parâmetros acústicos foram divididos em 23 tabelas, de acordo com cada vogal, para facilitar a visualização direta do comportamento do parâmetro acústico ao longo do desenvolvimento infantil. Tabela I - Distribuição dos informantes por faixa etária e sexo. 4-5 anos 5-6 anos 6-7 anos 7-8 anos Masculino n = 22 n = 28 n = 24 n = 24 Feminino n = 21 n = 33 n = 29 n = 26 37 A seguir encontram-se expostos os valores referentes à análise da frequência fundamental (f0) e das frequências dos três primeiros formantes das sete vogais orais do português e os achados referentes aos testes de diferença estatística (Tabelas II a XXIIII). Tabela II - Média e Desvio Padrão de Frequência Fundamental e Frequências do Primeiro, Segundo e Terceiro Formantes da vogal [a] 4-5 anos Parâmetros f0 (Hz) 5-6 anos 6-7 anos 7-8 anos Sexo ME (±DP) ME (±DP) ME (±DP) ME (±DP) masc 270 26,1 259 24,5 258 25,3 243 22,4 fem 259 24,1 247 22,1 256 27,5 246 28,0 masc 1093 193,9 1010 219,8 984 88,5 870 195,4 fem 1187 163,3 1256 154,3 1131 175,6 1048 132,1 masc 2003 156,4 1889 180,5 1814 157,6 1668 201,3 fem 2157 190,0 2141 143,8 2063 174,8 1914 187,2 masc 3593 408,7 3536 404,2 3480 224,0 3326 211,8 fem 3661 357,7 3528 310,5 3476 316,9 3402 276,0 F1 (Hz) F2 (Hz) F3 (Hz) Tabela III - Teste de Diferença Estatística para a Variável Sexo na Vogal [a] Parâmetros p valor [a] f0 0,099 [a] F1 0,0001* [a] F2 0,0001* [a] F3 0,24 p=nível descritivo do teste de Mann-Whitney; *expressa diferença significativa (nível de 5%). 38 Tabela IV - Teste de Diferença Estatística para a Variável Faixa Etária (Gn) na Vogal [a] Comparações Múltiplas de Duncan Parâmetros p valor [a] f0 0,001* [a] F1 0,0001* [a] F2 0,0001* [a] F3 0,001* G1/G2 G1/G3 G1/G4 G2/G3 G2/G4 G3/G4 * * * * * * * * * * * * * p=nível descritivo da ANOVA de Kruskal-Wallis; *expressa diferença significativa (nível de 5%); G1=4 a 5 anos; G2=5 a 6 anos ; G3=6 a 7 anos; G4=7 a 8 anos. Tabela V - Média e Desvio Padrão de Frequência Fundamental e Frequências do Primeiro, Segundo e Terceiro Formantes da vogal [ε] 4-5 anos Parâmetros f0 (Hz) 5-6 anos 6-7 anos 7-8 anos Sexo ME (±DP) ME (±DP) ME (±DP) ME (±DP) masc 266 21,5 248 34,2 266 21,9 245 23,5 fem 258 19,1 250 19,1 252 23,9 246 29,0 masc 719 106,6 666 125,6 735 86,0 656 108,4 fem 735 134,9 734 91,1 728 94,7 713 105,8 masc 2688 205,4 2659 157,2 2585 187,5 2521 187,8 fem 2850 128,0 2851 183,1 2721 233,3 2647 135,6 masc 3652 329,8 3656 278,3 3641 255,6 3519 268,1 fem 3824 357,8 3790 246,7 3678 240,6 3579 168,2 F1 (Hz) F2 (Hz) F3 (Hz) 39 Tabela VI - Teste de Diferença Estatística para a Variável Sexo na Vogal [ε] Parâmetros p valor [ε] f0 0,092 [ε] F1 0,048* [ε] F2 0,0001* [ε] F3 0,007* p=nível descritivo do teste de Mann-Whitney; *expressa diferença significativa (nível de 5%). Tabela VII - Teste de Diferença Estatística para a Variável Faixa Etária (Gn) na Vogal [ε] Comparações Múltiplas de Duncan Parâmetros p valor [ε] f0 0,0003* [ε] F1 0,15 [ε] F2 0,0001* [ε] F3 0,0005* G1/G2 G1/G3 G1/G4 * * * * G2/G3 G2/G4 G3/G4 * * * * * * p=nível descritivo da ANOVA de Kruskal-Wallis; *expressa diferença significativa (nível de 5%); G1=4 a 5 anos; G2=5 a 6 anos ; G3=6 a 7 anos; G4=7 a 8 anos. 40 Tabela VIII - Média e Desvio Padrão de Frequência Fundamental e Frequências do Primeiro, Segundo e Terceiro Formantes da vogal [e] 4-5 anos Parâmetros f0 (Hz) 5-6 anos 6-7 anos 7-8 anos Sexo ME (±DP) ME (±DP) ME (±DP) ME (±DP) masc 275 24,5 258 25,3 271 20,9 252 25,1 fem 267 15,1 252 18,3 260 24,1 247 27,3 masc 534 52,7 496 55,4 530 46,0 493 54,1 fem 528 43,0 496 45,2 515 58,1 482 62,9 masc 2929 167,4 2924 184,1 2830 212,0 2739 164,6 fem 3043 162,6 3096 187,6 2913 226,9 2832 179,6 masc 3814 273,4 3806 213,6 3656 228,0 3553 232,0 fem 3837 256,8 3844 272,6 3728 236,5 3665 195,9 F1 (Hz) F2 (Hz) F3 (Hz) Tabela IX - Teste de Diferença Estatística para a Variável Sexo na Vogal [e] Parâmetros p valor [e] f0 0,038* [e] F1 0,24 [e] F2 0,0001* [e] F3 0,048* p=nível descritivo do teste de Mann-Whitney; *expressa diferença significativa (nível de 5%). 41 Tabela X - Teste de Diferença Estatística para a Variável Faixa Etária (Gn) na Vogal [e] Comparações Múltiplas de Duncan Parâmetros p valor [e] f0 G1/G2 G1/G3 G1/G4 G2/G3 G2/G4 0,0001* * * * * [e] F1 0,0001* * * * * [e] F2 0,0001* * * * * [e] F3 0,0001* * * * * G3/G4 * p=nível descritivo da ANOVA de Kruskal-Wallis; *expressa diferença significativa (nível de 5%); G1=4 a 5 anos; G2=5 a 6 anos ; G3=6 a 7 anos; G4=7 a 8 anos. Tabela XI - Média e Desvio Padrão de Frequência Fundamental, Frequências do Primeiro, Segundo e Terceiro Formantes e Largura de Banda de F1 da vogal [i] 4-5 anos Parâmetros f0 (Hz) 5-6 anos 6-7 anos 7-8 anos Sexo ME (±DP) ME (±DP) ME (±DP) ME (±DP) masc 301 30,8 279 30,6 288 24,1 275 34,0 fem 287 30,2 276 22,7 282 27,3 272 37,3 masc 354 46,3 363 57,2 325 28,1 319 26,4 fem 375 64,6 351 61,7 355 52,4 360 60,9 masc 3094 208,6 3073 167,0 3014 209,7 2999 172,3 fem 3233 142,8 3176 208,1 3105 257,3 3036 130,0 masc 3868 294,4 3849 285,7 3665 246,3 3738 250,6 fem 4077 341,8 3945 308,2 3856 271,6 3760 258,5 85 52,7 66 37,7 69 32,9 68 32,4 73 46,8 80 40,9 90 45,1 76 38,5 F1 (Hz) F2 (Hz) F3 (Hz) masc Larg. Banda fem 42 Tabela XII - Teste de Diferença Estatística para a Variável Sexo na Vogal [i] Parâmetros p valor [i] f0 0,081 [i] F1 0,050* [i] F2 0,002* [i] F3 0,003* [i] Larg Banda 0,12 p=nível descritivo do teste de Mann-Whitney; *expressa diferença significativa (nível de 5%). Tabela XIII - Teste de Diferença Estatística para a Variável Faixa Etária (Gn) na Vogal [i] Comparações Múltiplas de Duncan Parâmetros p valor [i] f0 0,003* [i] F1 0,080 [i] F2 [i] F3 Larg Banda G1/G2 G1/G3 G1/G4 * * 0,0004* * * 0,0008* * * G2/G3 G2/G4 G3/G4 * * * 0,78 p=nível descritivo da ANOVA de Kruskal-Wallis; *expressa diferença significativa (nível de 5%); G1=4 a 5 anos; G2=5 a 6 anos ; G3=6 a 7 anos; G4=7 a 8 anos. 43 Tabela XIV - Média e Desvio Padrão de Frequência Fundamental e Frequências do Primeiro, Segundo e Terceiro Formantes da vogal [] 4-5 anos Parâmetros f0 (Hz) 5-6 anos 6-7 anos 7-8 anos Sexo ME (±DP) ME (±DP) ME (±DP) ME (±DP) masc 271 24,2 254 26,4 263 19,9 256 26,1 fem 256 24,2 250 18,0 255 25,6 251 26,7 masc 733 117,4 691 112,1 753 107,0 755 140,5 fem 696 140,2 766 130,3 752 108,6 741 119,7 masc 1285 146,7 1158 162,0 1180 135,4 1177 157,8 fem 1255 170,1 1277 138,8 1246 143,2 1214 168,6 masc 3581 395,3 3528 413,7 3565 207,1 3512 308,2 fem 3843 276,7 3760 329,1 3659 278,1 3475 211,2 F1 (Hz) F2 (Hz) F3 (Hz) Tabela XV - Teste de Diferença Estatística para a Variável Sexo na Vogal [] Parâmetros p valor [] f0 0,013* [] F1 0,46 [] F2 0,010* [] F3 0,001* p=nível descritivo do teste de Mann-Whitney; *expressa diferença significativa (nível de 5%). 44 Tabela XVI - Teste de Diferença Estatística para a Variável Faixa Etária (Gn) na Vogal [] Comparações Múltiplas de Duncan Parâmetros p valor [] f0 0,050* [] F1 0,43 [] F2 0,10 [] F3 0,004* G1/G2 G1/G3 G1/G4 * * G2/G3 G2/G4 * G3/G4 * p=nível descritivo da ANOVA de Kruskal-Wallis; *expressa diferença significativa (nível de 5%); G1=4 a 5 anos; G2=5 a 6 anos; G3=6 a 7 anos; G4=7 a 8 anos. Tabela XVII - Média e Desvio Padrão de Frequência Fundamental e Frequências do Primeiro, Segundo e Terceiro Formantes da vogal [o] 4-5 anos Parâmetros f0 (Hz) 5-6 anos 6-7 anos 7-8 anos Sexo ME (±DP) ME (±DP) ME (±DP) ME (±DP) masc 281 26,3 261 22,7 267 22,4 257 23,8 fem 259 40,5 260 21,0 260 23,2 253 30,4 masc 572 65,6 532 59,8 552 55,8 512 83,2 fem 543 53,7 534 74,6 568 85,8 518 63,6 masc 1129 129,9 953 124,0 1049 126,0 1029 203,9 fem 1126 113,8 1040 124,1 1064 151,1 1022 141,9 masc 3652 314,7 3651 295,0 3578 251,8 3583 259,7 fem 3829 297,8 3778 282,1 3714 336,9 3592 248,0 F1 (Hz) F2 (Hz) F3 (Hz) 45 Tabela XVIII - Teste de Diferença Estatística para a Variável Sexo na Vogal [o] Parâmetros p valor [o] f0 0,046* [o] F1 0,99 [o] F2 0,12 [o] F3 0,005* p=nível descritivo do teste de Mann-Whitney; *expressa diferença significativa (nível de 5%). Tabela XIX - Teste de Diferença Estatística para a Variável Faixa Etária (Gn) na Vogal [o] Comparações Múltiplas de Duncan Parâmetros p valor G1/G2 [o] f0 0,008* * [o] F1 0,001* * [o] F2 0,0001* [o] F3 0,038* * G1/G3 * G1/G4 G2/G3 G2/G4 G3/G4 * * * * p=nível descritivo da ANOVA de Kruskal-Wallis; *expressa diferença significativa (nível de 5%); G1=4 a 5 anos; G2=5 a 6 anos ; G3=6 a 7 anos; G4=7 a 8 anos. 46 Tabela XX - Média e Desvio Padrão de Frequência Fundamental e Frequências do Primeiro, Segundo e Terceiro Formantes da vogal [u] 4-5 anos Parâmetros f0 (Hz) 5-6 anos 6-7 anos 7-8 anos Sexo ME (±DP) ME (±DP) ME (±DP) ME (±DP) masc 313 35,5 282 40,4 299 34,8 279 26,5 fem 295 25,9 298 39,9 284 27,8 277 40,7 masc 474 79,2 482 71,8 462 76,4 433 80,0 fem 476 65,3 478 97,5 495 57,8 453 59,0 masc 1515 905,8 1580 1015,7 1604 1053,8 1630 1078,1 fem 1596 880,1 1539 965,3 1771 1061,4 1583 1043,8 masc 3815 495,5 3850 513,4 3797 511,3 3708 439,9 fem 3808 347,4 3948 472,6 3976 457,0 3796 469,0 F1 (Hz) F2 (Hz) F3 (Hz) Tabela XXI - Teste de Diferença Estatística para a Variável Sexo na Vogal [u] Parâmetros p valor [u] f0 0,42 [u] F1 0,24 [u] F2 0,90 [u] F3 0,066 p=nível descritivo do teste de Mann-Whitney 47 Tabela XXII - Teste de Diferença Estatística para a Variável Faixa Etária (Gn) na Vogal [u] Comparações Múltiplas de Duncan Parâmetros p valor G1/G2 G1/G3 G1/G4 [u] f0 0,008* * [u] F1 0,052* * [u] F2 0,90 [u] F3 0,33 G2/G3 G2/G4 G3/G4 * * p=nível descritivo da ANOVA de Kruskal-Wallis; *expressa diferença significativa (nível de 5%); G1=4 a 5 anos; G2=5 a 6 anos ; G3=6 a 7 anos; G4=7 a 8 anos. Embora os valores de diferença estatística já tenham sido expostos, a tabela XXIII mostra uma visão global de tais achados para todos os parâmetros e vogais investigados no presente trabalho. 48 Tabela XXIII – Análise Comparativa entre os Sexos e entre as Faixas Etárias das Medidas de f0 e Frequências dos Formantes para todas as Vogais Investigadas e Largura de Banda de F1 da vogal [i] Sexo Fx etárias Parâm. p valor p valor [a] f0 0,099 0,001* [a] F1 0,0001* 0,0001* [a] F2 0,0001* 0,0001* [a] F3 0,24 [ε] f0 Comparações Múltiplas de Duncan G1 x G3 G1 x G4 * * * * * * * * * * 0,001* * * * 0,092 0,0003* * * * [ε] F1 0,048* 0,15 [ε] F2 0,0001* 0,0001* * * [ε] F3 0,007* 0,0005* [e] f0 0,038* 0,0001* * * * * [e] F1 0,24 0,0001* * * * * [e] F2 0,0001* 0,0001* * * * * [e] F3 0,048* 0,0001* * * * * [i] f0 0,081 0,003* * * [i] F1 0,050* 0,080 [i] F2 0,002* 0,0004* * * [i] F3 0,003* 0,0008* * * 0,12 0,78 [] f0 0,013* 0,050* * * [] F1 0,46 0,43 [] F2 0,010* 0,10 [] F3 0,001* 0,004* * [o] f0 0,046* 0,008* * [o] F1 0,99 0,001* * [o] F2 0,12 0,0001* [o] F3 0,005* 0,038* * [u] f0 0,42 0,008* * [u] F1 0,24 0,052* * [u] F2 0,90 0,90 [u] F3 0,066 0,33 Larg Bd a a b G1 x G2 G2 x G3 * * * * G2 x G4 G3 x G4 * * * * * * * * * * * * * nível descritivo do teste de Mann-Whitney; b nível descritivo da ANOVA de Kruskal-Wallis; *: expressa diferença significativa, ao nível de 5%; G1=4 a 5 anos; G2=5 a 6 anos ; G3=6 a 7 anos; G4=7 a 8 anos. 49 7. DISCUSSÃO A presente discussão foi desenhada de forma a contemplar dois itens principais: a discussão sobre as medidas dos parâmetros espectrais da voz infantil e a discussão sobre a hipótese da existência de diferenças paramétricas atribuídas à faixa etária e ao gênero da criança. 7.1 MEDIDAS DOS PARÂMETROS ESPECTRAIS Os parâmetros espectrais investigados no presente trabalho, frequência fundamental, formantes e largura de banda serão comentados isoladamente, nesta sequência. Frequência Fundamental As medidas da frequência fundamental estimadas no presente estudo mostraram valores que variam em torno de: vogal [a]: 243 a 270 Hz (média: 254 Hz), vogal [ε] 245 a 266 Hz (média: 253 Hz), vogal [e] 247 a 275 Hz (média: 260 Hz), vogal [i] 272 a 301 Hz (média: 282 Hz), vogal [] 250 a 271 Hz (média: 257 Hz), vogal [o] 253 a 281 Hz (média: 262 Hz) e vogal [u] 277 a 313 Hz (média: 290 Hz). A literatura que investiga a voz infantil saudável apresenta diversas publicações que contemplam a vogal [a] e algumas que contemplam a 50 vogal [ε]. De forma geral, os valores obtidos para a vogal [a] e [ε] no presente trabalho corroboram aqueles descritos na literatura. Cappellari e Cielo (2008) investigaram a frequência fundamental exclusivamente da vogal [a] da voz de crianças de quatro a seis anos e oito meses falantes do português e apontaram uma média de f0 na amostra de 252 Hz. Além da convergência no que se refere ao valor médio da f0 de [a], podem ser observados valores semelhantes ao comparar os achados das duas pesquisas, divididos por faixa etária e gênero. Enquanto os autores da literatura mostraram intervalos de: 266-375 Hz e 285-355 Hz (4 anos); 247-350 Hz e 247-355 Hz (5 anos); 247-325 Hz e 247-315 Hz (6 anos) para os sexos masculino e feminino, respectivamente, os dados do presente estudo mostraram valores médios de: 270 Hz e 259 Hz (4 anos); 259 Hz e 247 Hz (5 anos); 258 Hz e 256 Hz (6 anos) masculino e feminino, respectivamente. Os resultados apresentados para a vogal [a] por Behlau (1984) mostram uma frequência fundamental média mais grave, 235 Hz. Uma vez que a faixa etária investigada pela autora, de oito a doze anos, não corresponde à faixa etária investigada no presente trabalho, não é possível afirmar que os dois trabalhos não se corroboram entre si. Autores internacionais também investigaram a frequência fundamental da vogal [a]. Ao contemplar vozes de crianças de seis a doze anos, Nicollas e col. (2008) observaram que a f0 decresceu de 268 Hz para 234 Hz em meninos e 260 Hz para 239 Hz em meninas. É interessante observar que os valores iniciais, que correspondem à faixa etária mais próxima de 6 anos, encontram-se próximos aos resultados apontados no presente trabalho e os valores finais correspondentes à faixa de 12 anos, corroboram os valores obtidos por Behlau (1984). Busby e Plant (1995) investigaram a f0 em crianças de cinco a onze anos em diversas vogais do inglês e os resultados apontaram valores de frequência fundamental decrescentes com o aumento da idade. Ainda no que se refere ao valor médio de f0 da vogal [a] Baker e col. 51 (2008) encontraram uma média de 240 Hz na emissão sustentada em crianças de cinco a oito anos, sendo este valor proximal à estimação mais baixa de f0 para a vogal [a] obtida no presente trabalho. Huber e col. (1999) apontaram valores médios de f0 para ambos os sexos, masculino e feminino, de: 266 Hz e 256 Hz (4 a 6 anos); 246 Hz e 261 Hz (6 a 8 anos). Se os valores do presente trabalho forem agrupados com as mesmas faixas etárias poderão ser observados achados basicamente convergentes: 263 Hz e 253 Hz (4 e 6 anos); 250 e 251 Hz (6 e 8 anos), sendo o valor correspondente ao sexo feminino na faixa de 6 a 8 anos, sutilmente mais elevado nos achados dos autores comentados. Assim como a vogal [a], a medida de f0 da vogal [ε] da voz infantil também foi apresentada na literatura. Schott e col. (2009) investigaram valores de f0 da vogal [ε] em crianças de seis a oito anos. Os valores apontados variam entre: 233 Hz e 251 Hz, com média de 238 Hz. Em estudo semelhante em termos de faixa etária e vogal analisada, Braga e col. (2009) obtiveram variações de f0 entre 226 Hz e 277 Hz, com média de 249 Hz. Os resultados para a vogal [ε] do presente trabalho foram: 245 a 266 Hz, com média de 253 Hz. Os valores apontados pelos dois autores da literatura não convergem entre si, sendo que o primeiro grupo de autores citado mostra valores mais baixos. A outra pesquisa mostra um valor médio de f0 semelhante ao valor apontado no presente estudo, porém apresenta uma faixa dinâmica consideravelmente mais larga, tanto no que se refere à frequência fundamental mínima quanto à máxima. Os trabalhos em questão apresentam algumas diferenças referentes ao tamanho da amostra e metodologia de estimação da frequência fundamental. Frequência de Formantes As médias das frequências dos três primeiros formantes estimadas no presente estudo foram: vogal [a] 1078 Hz, 1961 Hz e 3497 Hz; vogal [ε] 710 Hz, 2694 Hz e 3669 Hz; vogal 52 [e] 507 Hz, 2918 Hz e 3740 Hz; vogal [i] 350 Hz, 3092 Hz e 3845 Hz; vogal [] 737 Hz, 1224 Hz e 3616 Hz; vogal [o] 541 Hz, 1047 Hz e 3674 Hz e vogal [u] 470 Hz, 1603 Hz e 3845 Hz. Dentro da língua portuguesa falada no Brasil, Behlau (1984) foi um dos pesquisadores que investigou mais amplamente, em termos da quantidade de vogais analisadas, as frequências dos três primeiros formantes da voz infantil. Além de ter apontado a existência de diferenças nas medidas dos formantes entre adultos e crianças, a autora contribuiu apontando valores médios das frequências dos três primeiros formantes para a voz infantil saudável: vogal [a] 1086 Hz, 1721 Hz e 2873 Hz; vogal [ε] 902 Hz, 2606 Hz e 3243 Hz; vogal [e] 698 Hz, 2825 Hz e 3637 Hz; vogal [i] 465 Hz, 3176 Hz e 3980 Hz; vogal [] 913 Hz, 1371 Hz e 2793 Hz; vogal [o] 682 Hz, 1295 Hz e 2823 Hz e vogal [u] 505 Hz, 1350 Hz e 2667 Hz. Muitas destas medidas não convergem com os resultados obtidos no presente trabalho, mesmo que considerado um desvio padrão médio de 15%. No presente trabalho as medidas de F1 se mostram mais baixas, enquanto as de F3, mais altas. As medidas de F2 variaram aleatoriamente. Diferenças na faixa etária investigada (oito a doze anos), no tamanho da amostra (N=30) e na ferramenta de análise do sinal (espectrografia analógica), no estudo da autora, estão entre os principais aspectos que poderiam justificar a divergência de resultados. Huber e col. (1999) estimaram as frequências dos três primeiros formantes da vogal [a] em vozes de crianças falantes do inglês norte americano, entre quatro a oito anos. Os resultados, para o gênero masculino e feminino, para F1 foram: 981 Hz e 1139 Hz (4 a 6 anos); 992 Hz e 1030 Hz (6 a 8 anos). Para F2: 1676 Hz e 1817 Hz (4 a 6 anos); 1681 Hz e 1817 Hz (6 a 8 anos). Finalmente, para F3: 3902 Hz e 4064 Hz (4 a 6 anos), 3603 Hz e 3735 Hz (6 a 8 anos). Assim como na frequência fundamental, os valores do presente trabalho para a vogal [a] foram agrupados com as mesmas faixas etárias propostas pelo autor. O presente trabalho mostrou os seguintes valores, no gênero masculino e feminino, para F1: 1051 Hz e 1221 Hz (4 a 6 anos); 927 Hz e 1089 Hz (6 a 8 anos). Para F2: 1946 Hz e 2149 Hz (4 a 6 53 anos); 1741 Hz e 1988 Hz (6 a 8 anos). Finalmente, para F3: 3564 Hz e 3594 Hz (4 a 6 anos); 3403 Hz e 3439 Hz (6 a 8 anos). Na comparação é possível observar que há uma convergência parcial dos valores absolutos apontados nos dois trabalhos. Se observados os achados de Behlau (1984), Huber e col. (1999) e os do presente trabalho pode ser observado que os valores absolutos dos formantes se mostram pouco consistentes, com variações aleatórias entre um trabalho e outro. Embora haja diferenças metodológicas, principalmente de técnicas de estimação paramétrica, que, por si só, poderiam justificar as divergências entre os três trabalhos, a alta variabilidade que os formantes apresentam frente à variabilidade intra-sujeitos (FIGUEIREDO, 1994) e inter-sujeitos parece ser um fator relevante. Os grupos de diferentes faixas etárias são compostos por crianças diferentes, uma vez que os três estudos citados apresentam um delineamento transversal. Largura de Banda A largura de banda do primeiro formante (B1) não representa um parâmetro clássico da análise espectral. Tal parâmetro foi investigado no presente trabalho em caráter exploratório, motivo pelo qual apenas a banda do primeiro formante (F1) de uma única vogal foi pesquisada. Em especial, foi definida a vogal [i], por ser a vogal que apresenta o envelope espectral com maior distanciamento entre os picos do primeiro e segundo formantes, minimizando, portanto, a possibilidade de obter erro de estimação em função da eventual fusão de picos. Não foram encontrados na literatura trabalhos que tenham investigado este parâmetro na voz infantil, inviabilizando comparação de valores. 54 7.2 DIFERENÇAS ENTRE FAIXAS ETÁRIAS E GÊNEROS Faixas Etárias A análise de diferenças nos valores dos parâmetros espectrais para as diferentes faixas etárias pesquisadas consiste em uma parte fundamental do presente trabalho, uma vez que a definição da existência ou não de subgrupos dentro da voz infantil poderá contribuir para uma metodologia concisa de futuros trabalhos que pretendam investigar vozes infantis patológicas. Se observado o conjunto de resultados dos testes de diferença estatística para as faixas etárias (Tabela XXIII) pode ser observado um aumento gradativo na ocorrência de confirmações de diferenças estatísticas à medida que G1 (4 a 5 anos) foi sendo comparado com os demais grupos G2, G3 e G4, de faixas etárias maiores. Entre G1 e G2 foi obtida apenas 1 significância em 29 testes, enquanto na comparação entre G1 e G3 e G1 e G4 foram obtidas 14 e 22 significâncias em 29 testes, respectivamente. Tais achados mostram a existência de uma diferença clara entre os valores dos parâmetros espectrais da voz das crianças entre 4 e 8 anos de idade. No entanto, não é tão definido o comportamento dos parâmetros acústicos ao longo deste período. Pode-se dizer que entre 4 e 6 anos de idade não ocorrem mudanças, uma vez que 96,55% dos testes de diferença estatística aplicados não mostraram significância, dando suporte a tal conclusão. A partir dos seis anos, mudanças significativas passam a ocorrer, porém de forma inconsistente em relação ao parâmetro, vogal e faixa etária. Em especial, na vogal [e] pode ser observada uma predominância de diferenças significativas das faixas G1 e G2 contra as faixas G3 e G4 sugerindo, além do agrupamento G1 e G2 já comentado, o agrupamento da G3 com o G4. Nas demais vogais o agrupamento G3 e G4 não é tão evidente, porém se observado o número reduzido de significâncias envolvendo especificamente G3 contra G4 parece razoável concluir pelo agrupamento dos 55 mesmos. Assim sendo, a idade de seis anos parece ser determinante para as mudanças acústicas das vocalizações infantis. Alguns autores internacionais já haviam apontado a faixa etária em torno dos seis anos de vida da criança como uma fase de transição, no que se refere a mudanças nas medidas espectrais da voz. Apontando a existência de decréscimos nas frequências dos formantes frente ao aumento da idade, Eguchi e Hirsh (1969) referiram ter observado mudanças mais significativas em crianças menores de cinco anos e também em crianças de seis a treze anos. Busby e Plant (1995) apontaram um decréscimo mais consistente dos formantes nas faixas de cinco a sete anos e nove a onze anos. Yang e Mu (1989) observaram diferença substancial na frequência de F3 aos 6 anos de idade. Além do apontamento com relação à idade de 6 anos, como marco importante para as mudanças acústicas na voz infantil, os resultados do presente trabalho apontam, de uma forma geral, a existência de uma relação decrescente dos parâmetros espectrais com a faixa etária, ou seja, quanto maior a faixa etária, menor a medida de frequência observada. Tal comportamento da frequência fundamental e dos formantes é descrito na literatura (EGUCHI e HIRSH, 1969; BUSBY e PLANT, 1995, HUBER e col., 1999). Um estudo que se destaca por seu delineamento longitudinal, investigou os dois primeiros formantes em quatro meninos entre 15 e 36 meses de vida e mostrou um comportamento descendente das frequências dos parâmetros investigados com o aumento da idade a partir do 24º mês de vida. (GILBERT e col. 1997). A seguir são expostas tabelas com medidas de média e desvio padrão dos parâmetros analisados, nas quais os 4 grupos etários investigados foram divididos em 2 grupos (4 a 6 anos e 6 a 8 anos), apresentando como limite entre eles a idade de 6 anos. 56 Tabela XXIV - Média e Desvio Padrão de Frequência Fundamental e Frequências do Primeiro, Segundo e Terceiro Formantes das vogais [a] e [ε] [a] 4-6 anos Parâmetros f0 (Hz) [ε] 6-8 anos 4-6 anos 6-8 anos Sexo ME (±DP) ME (±DP) ME (±DP) ME (±DP) masc 264 25,3 250 23,8 257 27,8 255 22,7 fem 253 23,1 251 27,7 254 19,1 249 26,4 masc 1051 206,8 927 141,9 692 116,1 695 97,2 fem 1221 158,8 1089 153,8 734 113,0 720 100,2 masc 1946 168,4 1741 179,4 2673 181,3 2553 187,6 fem 2149 166,9 1988 181,0 2850 155,5 2684 184,4 masc 3564 406,4 3403 217,9 3654 304,0 3580 261,8 fem 3594 334,1 3439 296,4 3807 302,2 3628 204,4 F1 (Hz) F2 (Hz) F3 (Hz) 57 Tabela XXV - Média e Desvio Padrão de Frequência Fundamental e Frequências do primeiro, Segundo e Terceiro Formantes das vogais [e] e [i] [e] 4-6 anos Parâmetros f0 (Hz) [i] 6-8 anos 4-6 anos 6-8 anos Sexo ME (±DP) ME (±DP) ME (±DP) ME (±DP) masc 266 24,9 261 23,0 290 30,7 281 29,0 fem 259 16,7 253 25,7 281 26,4 277 32,3 masc 515 54,0 511 50,05 358 51,7 322 27,2 fem 512 44,1 498 60,5 363 63,1 357 56,6 masc 2926 175,7 2784 188,3 3083 187,8 3006 191,0 fem 3069 175,1 2872 203,2 3204 175,4 3070 193,6 masc 3810 243,5 3604 230,0 3858 290,0 3701 248,4 fem 3840 264,7 3696 216,2 4011 325,0 3808 265,0 F1 (Hz) F2 (Hz) F3 (Hz) 58 Tabela XXVI - Média e Desvio Padrão de Frequência Fundamental e Frequências do primeiro, Segundo e Terceiro Formantes das vogais [] e [o] [] 4-6 anos Parâmetros f0 (Hz) [o] 6-8 anos 4-6 anos 6-8 anos Sexo ME (±DP) ME (±DP) ME (±DP) ME (±DP) masc 262 25,3 259 23,0 271 24,5 262 23,1 fem 253 21,1 253 26,1 259 30,7 256 26,8 masc 712 114,7 754 123,7 552 62,7 532 69,5 fem 731 135,2 746 114,1 538 64,1 543 74,7 masc 1221 154,3 1178 146,6 1041 126,9 1039 164,9 fem 1266 154,4 1230 155,9 1083 118,9 1043 146,5 masc 3554 404,5 3538 257,6 3651 304,8 3580 255,7 fem 3801 302,9 3567 244,6 3803 289,9 3653 292,4 F1 (Hz) F2 (Hz) F3 (Hz) 59 Tabela XXVII - Média e Desvio Padrão de Frequência Fundamental e Frequências do primeiro, Segundo e Terceiro Formantes da vogal [u] [u] 4-6 anos Parâmetros f0 (Hz) 6-8 anos Sexo ME (±DP) ME (±DP) masc 297 37,9 289 30,6 fem 296 32,9 280 34,2 masc 478 75,5 447 78,2 fem 477 81,4 474 58,4 masc 1547 960,7 1617 1065,9 fem 1567 922,7 1677 1052,6 masc 3832 504,4 3752 475,6 fem 3878 410,0 3886 463,0 F1 (Hz) F2 (Hz) F3 (Hz) Gêneros Embora a ocorrência de significâncias estatísticas não tenha se mostrado consistente (Tabela XXIII) ao ponto de que pudesse levar à generalização do conceito de que a emissão vocálica de meninos é diferente de meninas, os resultados do presente estudo apontam várias diferenças pontuais, distribuídas de forma dispersa em termos de parâmetro e vogal, mostrando que as meninas apresentaram medidas espectrais significativamente maiores que os meninos. Na literatura, é possível observar que a hipótese da existência de diferenças entre os gêneros em parâmetros acústicos vem sendo descrita há anos. Corroborando os resultados do 60 presente trabalho, o estudo pioneiro de Peterson e Barney (1952) apontou diferenciação entre os sexos nas frequências dos formantes, mesmo como uma amostra infantil pequena (15 crianças). Glaze e col. (1988) encontraram significância estatística entre os diferentes gêneros na f0 de vozes de crianças de cinco a onze com valores maiores para as meninas. Yang e Mu (1989) investigaram a frequência do terceiro formante (F3) da vogal [a] em crianças três a doze anos e observaram diferença significante deste parâmetro entre meninos e meninas. Busby e Plant (1995) não encontraram diferenças significativas na f0, no entanto, observaram frequências dos formantes mais altas para meninas em F1, para vogais [æ], [a] e [u] e em F2 para quase todas as vogais. Corroborando esse estudo, no presente trabalho foi possível observar diferenças entre os sexos nas frequências de F2 em quase todas as vogais e nas frequências de F1 na vogal [a]. No entanto, na vogal [u], os resultados do presente trabalho não mostraram diferenças entre os gêneros em nenhum parâmetro investigado. Ao estimar as frequências de F1, F2 e F3 da vogal [a] em vozes de crianças e adultos, Huber e col. (1999) encontraram diferenças entre os gêneros nos parâmetros investigados. Recentemente, Braga e col. (2009) observaram diferenças significantes na f0 entre os sexos em crianças de seis a oito anos. Alguns autores referiram ter encontrado diferenças de gênero apenas após uma determinada idade. Ao avaliar a f0 e frequências dos três primeiros formantes, Lee e col. (1999) apontaram diferenças entre os sexos somente a partir dos onze anos de idade. Perry e col. (2001) concluíram que embora a análise das frequências dos formantes tivesse permitido a diferenciação entre os gêneros em crianças a partir quatro anos de idade, a análise da f0 só pôde diferenciar os sexos a partir dos doze anos. 61 8. CONCLUSÃO Com base nos resultados do presente trabalho pode-se concluir que, de uma forma geral, as meninas apresentaram medidas de frequência significativamente maiores que os meninos e que existe uma relação decrescente com a faixa etária, ou seja, quanto maior a faixa etária menor a medida de frequência observada. Dentre as conclusões mais importantes está o apontamento de que a idade de seis anos parece ser determinante para as mudanças acústicas das vocalizações infantis. Assim sendo, as médias apresentadas para G1 e G2 podem ser agrupadas em uma única faixa etária. Da mesma forma as médias paramétricas para G3 e G4 também podem ser agrupadas. Trabalhos futuros que pretendam investigar vozes infantis patológicas possivelmente apresentarão resultados mais consistentes se considerarem a divisão das faixas etárias em função da idade de seis anos. 62 REFERÊNCIAS BIBLIOGRÁFICAS ANDRIANOPOULOS, M. V.; DARROW, K.; CHEN, J. Multimodal standardization of voice among four multicultural populations formants structures. J Voice, v. 15, n. 1, p. 61-77, 2001. ANDRADE, Danieli Viegas de. Análise de parâmetros espectrais clássicos da voz em crianças respiradoras orais de 5 a 10 anos. Rio de Janeiro, RJ, 2009. Dissertação de mestrado. Universidade Veiga de Almeida, 2009. BAECK, H. E.; SOUZA, M. N. A Bayesian classifier for babies’ cry pain and non-pain contexts. In: Proceedings of 25th International Conference on the IEEE Engineering in Medicine and Biology Society, Cancun, v. 1, p. 2944-2946, 2003. BAECK, H. E.; SOUZA, M. N. “Sistema de Análise Automática da Dinâmica do Sinal de Choro de Bebês”. In: Anais do III Congresso Latino Americano de Engenharia Biomédica, João Pessoa, v. 5, p. 17-20, 2004. BAECK, H. E.; SOUZA, M. N. Longitudinal study of the fundamental frequency of hunger cries along the first 6 months of healthy babies. J Voice, v. 21, n. 5, p. 551- 559, 2007. BAKER, S. e col. The effect of task type on fundamental frequency in children. Int J Pediatr Otorhinol, v. 72, p. 885-889, 2008. BEHLAU, Mara Suzana. Uma análise das vogais do português brasileiro falado em São Paulo: perceptual, espectrográfica de formantes e computadorizada de frequência fundamental. São Paulo, SP. Dissertação de Mestrado. Escola Paulista de Medicina, 1984. BEHLAU, M. S. e col. Análise espectrográfica de formantes das vogais do português brasileiro. ACTA AWHO, v. 7, n. 2, p. 74-85, 1988. 63 BELHAU, M. S. e col. Avaliação de voz. In:_________.Voz: O livro do especialista. Rio de Janeiro: Revinter, 2001. cap. 3, p. 85 -180. BENETON, G. e col. Comparação dos parâmetros vocais em crianças com e sem rinite alérgica. Rev Fono Atual, v. 7, n. 29, p. 30-35, 2004. BUSBY, P. A.; PLANT, G. L. Formant frequency values of vowels produced by preadolescent boys and girls. J Acoust Soc Am., v. 97, n.4, p. 2603-2606, 1995. BRAGA, J. N.; OLIVEIRA, D. S. F.; SAMPAIO, T. M. M. Frequência fundamental da voz de crianças. Rev Cefac, v. 11, n. 1, p. 119-126, 2009. CAMARGO, Z. A.; MADUREIRA, S. Análise acústica: revisão crítica de estudos no campo das disfonias. In: FERREIRA, L. P.; BEFI-LOPES, D. M.; LIMONGI, S. C. O. (Org). Tratado de Fonoaudiologia. São Paulo: Roca, 2004. cap. 3, p.25-33. CAPPELLARI, V. M.; CIELO, C. A. Características vocais acústicas de crianças préescolares. Rev Bras Otorrinolaringol., v. 74, n. 2, p. 265-272, 2008. CARRARA-DE-ANGELIS, E.; CERVANTES, O.; ABRAHÃO, M. Necessidade de medidas objetivas da função vocal: avaliação acústica da voz. In: FERREIRA, L. P.; COSTA, H. O. Voz ativa: falando sobre a clínica fonoaudiológica. São Paulo: Roca, 2001. cap. 5, p. 53-72. CORAZZA, V. R. e col. Correlação entre os achados estroboscópicos, perceptivo-auditivos e acústicos em adultos sem queixa vocal. Rev Bras Otorrinolaringol., v. 70, n. 1, p. 30-34, 2004. DORNELLES, S.; JOTZ, G. P.; GUILHERME, A. Capacidade discriminatória e confiabilidade da análise perceptiva da voz de crianças institucionalizadas. In: FERREIRA, L. P.; COSTA, H. O. Voz ativa: falando sobre a clínica fonoaudiológica. São Paulo: Roca, 2001. cap. 14, p. 167-181. FELLIPE, A. C. N.; GRILLO, M. H. M. M.; GRECHI, T. H. Normatização de medidas acústicas para vozes normais. Rev Bras Otorrinolaringol., v. 75, n. 2, p. 659-664, 2006. FIGUEIREDO, Ricardo Molina. Identificação de falantes: aspectos teóricos e metodológicos. Campinas, SP, 1994. Tese de doutorado. Universidade Estadual de Campinas, 1994. 64 FUCHS, M. e col. Predicting mutational change in the speaking voice of boys. J Voice, v. 21, n. 2, p. 169-178, 2007. GILBERT, H. R.; ROBB, M. P.; CHEN, Y. Formant frequency development: 15 to 36 months. J Voice, v. 11, n. 3, p. 260-266, 1997. GELFER, M. P.; MIKOS, V. A. The relative contributions of speaking fundamental frequency and formant frequencies to gender identification based on isolated vowels. J Voice, v. 19, n. 4, p. 544-554, 2004. GLAZE, L. E. e col. Acoustic characteristics of children’s voice. J Voice, v. 2, n. 4, p. 312319, 1988. GLAZE, L. E.; BLESS, D. M.; SUSSER, R. D. Analysis of vowel and loudness differences in children’s voice. J Voice, v. 4, n. 1, p. 321-323, 1990. GOLDFIELD, E. C. Exploration of vocal tract properties during serial production of vowels by fill term and preterm infants. Infant Behavior & Development, v. 23, p. 421-439, 2000. GREGIO, Fabiana Nogueira. Configuração do trato vocal supraglótico na produção das vogais do português brasileiro: dados de imagens de ressonância magnética. São Paulo, SP, 2006. Dissertação de Mestrado. Pontifícia Universidade Católica de São Paulo, 2006. HAMDAN, A. L. e col. Vocal characteristics in children with attention deficit hyperactivity disorder. J Voice, v. 23, n. 2, p. 190-194, 2009. HERSAN, R. C. P. G. A laringe infantil. In: PINHO, S. M. R. Fundamentos em fonoaudiologia: Tratando os distúrbios da voz. 2ª. ed. Rio de Janeiro: Guanabara Koogan, 2003. cap. 3, p. 59-66. HUBER, J. E. e col. Formants of children, women and men: the effects of vocal intensity variation. J Acoustic Soc Am., v. 106, n. 3, p. 1532-1542, 1999. JORGE, M. S.; GREGIO, F. N.; CAMARGO, Z. Qualidade vocal de indivíduos submetidos à laringectomia total: aspectos acústicos de curto e de longo termo em modalidades de fonação esofágica e traqueoesofágica. Rev Cefac, v. 6, n. 3, p. 319-328, 2004. JOTZ, G. P. e col. Avaliação vocal na infância. In: FERREIRA, L. P.; COSTA, H. O. Voz ativa: falando sobre a clínica fonoaudiológica. São Paulo: Roca, 2001. cap. 15, p. 183-194. 65 KENT, R. D.; READ, D. The Acoustic Analysis of Speech. London, Singular Publishing Group, 1996 LEE, S. e col. Acoustic of children’s speech: developmental changes of temporal and spectral parameters. J Acoustic Soc Am., v. 105, n. 3, p. 1455-1468, 1999. LIMA, M. F. B. e col. Qualidade vocal e formantes das vogais de falantes adultos da cidade de João Pessoa. Rev Cefac, v. 9, n. 1, p. 99-109, 2007. MAGRI, A. e col. Correlatos perceptivos e acústicos dos ajustes supraglóticos na disfonia. Rev Cefac, v. 9, n. 4, p. 512-518, 2007. MAGRI, A.; STAMATO, T.; CAMARGO, Z. A. Influência da largura de banda de formantes na qualidade vocal. Rev Cefac, v.11, n. 2, p. 296-304, 2009. MITRA, S. K. Digital Signal Processing – A Computer-Based Approach. New York: McGrawHill, 2001. MOURA, C. P. e col. Voice parameters in children with Down syndrome. J Voice, v. 22, n. 1, p. 34-42, 2008. NEBEKER, F. Signal Processing – the emergence of a discipline - 1948 to 1998. New Jersey: IEEE History Center, 1998. NEMR, K. e col. Análise comparativa entre avaliação fonoaudiológica perceptivo-auditiva, análise acústica e laringoscopias indiretas para avaliação vocal em população com queixa vocal. Rev Bras Otorrinolaringol., v. 71, n. 1, p.13-17, 2005. NICOLLAS, R. e col. Normal voice in children between 6 and 12 years of age: database and nonliner analysis. J Voice, v. 22, n. 6, p. 671-675, 2008. NIEDZIELSKA, G. Acoustic analysis in the diagnosis of voice disorders in children. Int J Pediatr Otorhinol., v. 57, n. 3, p.189-193, 2001. NIEDZIELSKA, G.; GLIJER, E.; NIEDZIELSKI, A. Acoustic analysis of voice in children with noduli vocales. Int J Pediatr Otorhinol., v. 60, n. 2, p.119-122, 2001. 66 PINHO, S. M. R.; CAMARGO, Z. Introdução à análise acústica da voz e da fala. In: PINHO, S. M. R. Tópicos em Voz. Rio de Janeiro: Guanabara Koogan, 2001. cap. 2, p. 19-44. PINHO, S. M. R. Avaliação e tratamento da voz. In: ________. Fundamentos em fonoaudiologia: Tratando os distúrbios da voz. 2ª. ed. Rio de Janeiro: Guanabara Koogan, 2003. Parte I, p. 3-40. PINHO, S. M. R; PONTES, P. Desvendando os segredos da voz: Músculos intrínsecos da laringe e dinâmica vocal. Vol. I. Rio de Janeiro: Revinter, 2008. p. 1-77. PERRY, T. L. e col. The acoustic bases for gender identification from children’s voices. J Acoustic Soc Am., v. 109, n. 6, p. 2988-2998, 2001. RABINER, L. R.; SCHAFER, R. W. Digital Processing of Speech Signal. New Jersey, Prentice Hall, 1978. ROTHGÄNGER, H. Analysis of the sounds of the child in the first year of age and a comparison to the language. Early Human Development, v. 75, p. 55-69, 2003. SCHOTT, T. C. A.; SAMPAIO, T. M. M.; OLIVEIRA, D. S. F. Frequência fundamental de crianças da cidade de Niterói. Rev Cefac, v. 12, n. 2, p. 290-295, 2009. STEFFEN, N.; MOSCHETTI, M. B. Parâmetros acústicos de jitter e shimmer de 248 crianças de 6 a 10 anos, estudantes de Porto Alegre. Rev Bras Otorrinolaringol., v. 63, n. 4, p. 329334, 1997. VANZELLA, Thaís Perez. Normatização dos parâmetros acústicos vocais em crianças em idade escolar. Ribeirão Preto, SP, 2006. Dissertação de Mestrado. Universidade de São Paulo, 2006. YANG, S.; MU, L. An investigation of the third formant of /a/ in prepuberal children. J Voice, v. 3, n. 4, p. 321-323, 1989. WERTZNER, H. F.; SCHREIBER, S.; AMARO, L. Análise da frequência fundamental, jitter, shimmer e intensidade vocal em crianças com transtorno fonológico. Rev Bras Otorrinolaringol., v. 71, n. 5, p. 582-588, 2005. 67 ANEXO A ESCALA RASATI (Pinho e Pontes, 2008) Nome: ______________________________________________________ Data de nascimento: ___/__/__ Idade: __________ GRADUAÇÃO -Rouquidão: ( )0 ( ) 1-2 ( )2 ( ) 2-3 ( )3 - Aspereza: ( )0 ( ) 1-2 ( )2 ( ) 2-3 ( )3 - Soprosidade: ( )0 ( ) 1-2 ( )2 ( ) 2-3 ( )3 - Astenia: ( )0 ( ) 1-2 ( )2 ( ) 2-3 ( )3 - Tensão: ( )0 ( ) 1-2 ( )2 ( ) 2-3 ( )3 - Instabilidade: ( )0 ( ) 1-2 ( )2 ( ) 2-3 ( )3 Graduação: 0 – ausente 1- grau leve 1-2 – grau leve a moderado 2 – grau moderado 2-3 – grau moderado a intenso 3 – grau intenso Data: ___/___/___ ______________________ Fonoaudióloga 68 APÊNDICE A CARTA PARA OBTENÇÃO DO CONSENTIMENTO LIVRE E ESCLARECIDO Caro(a) Senhor(a), Eu, Flávia Viegas de Andrade, fonoaudióloga, vou desenvolver uma pesquisa cujo título é ANÁLISE DE PARÂMETROS ESPECTRAIS DA VOZ EM CRIANÇAS SAUDÁVEIS DE 4 A 8 ANOS. O presente estudo consiste em minha dissertação de mestrado em fonoaudiologia, linha de pesquisa voz, da Universidade Veiga de Almeida. O objetivo deste estudo é investigar medidas de frequência fundamental, frequências dos três primeiros formantes e largura de banda da vogal [i] em crianças saudáveis de quatro a oito anos, através do processamento digital do sinal da voz. Necessito que o (a) Sr.(a). forneça informações à respeito de seu (sua) filho (a), devendo ocupá-lo(a) por 30 minutos para avaliação de seu (sua) filho (a), através dos seguintes procedimentos: Entrevista com a criança que deverá conversar com a autora da pesquisa de forma espontânea, na qual será realizada uma triagem da expressão oral. Depois será solicitado que a criança fale o próprio nome, idade e o que gosta de brincar. Em seguida a criança deverá repetir a seguinte frase “Fale _____ para mim”, que será preenchida com os vocábulos “pápa”, “pépe”, “pêpe”, “pípi”, “pópo” “pôpo” e “púpu”. Estes procedimentos serão gravados com o auxílio de um microfone em um programa de computador que processa os sinais de fala e de voz. Posteriormente serão avaliados os parâmetros vocais de fonte glótica e ressonância através da análise das amostras de voz colhidas. A participação do (a) seu (sua) filho (a) nesta pesquisa é voluntária e a avaliação clínica não determinará qualquer risco. A participação do (a) seu (sua) filho (a) não trará qualquer benefício direto para ele (a), mas proporcionará um melhor conhecimento a respeito das mudanças que ocorrem nos parâmetros vocais investigados ao longo do crescimento. I Informo que o (a) Sr. (a). tem a garantia de acesso, em qualquer etapa do estudo, sobre qualquer esclarecimento de eventuais dúvidas. Se tiver alguma consideração ou dúvida sobre a ética da pesquisa, entre em contato com o Comitê de Ética em Pesquisa da Secretaria Municipal de Saúde da Prefeitura do Rio de Janeiro, situado à Rua Afonso Cavalcante, 455, 69 sala 701 - Cidade Nova - Rio de Janeiro - RJ – Cep: 20.211-901 ou através do e-mail: [email protected]. Também é garantida a liberdade da retirada deste consentimento a qualquer momento, sem qualquer prejuízo ao (a) senhor (a) ou seu (sua) filho (a). Garanto que as informações obtidas serão analisadas em conjunto com outras crianças, não sendo divulgado a identificação de nenhum dos participantes. O Sr. (a) tem o direito de ser mantido (a) atualizado (a) sobre os resultados parciais da pesquisa e caso seja solicitado, darei todas as informações que solicitar. Não existirão despesas ou compensações pessoais para o (a) participante em qualquer fase do estudo, incluindo exames e consultas. Também não há compensação financeira relacionada à participação do (a) seu (sua) filho (a). Se existir qualquer despesa adicional, ela será absorvida pelo orçamento da pesquisa. Eu me comprometo a utilizar os dados coletados somente para pesquisa e os resultados serão veiculados através de artigos científicos em revistas especializadas e/ou em encontros científicos e congressos, sem nunca tornar possível a identificação do (a) seu (sua) filho (a). Anexo está o consentimento livre e esclarecido para ser assinado caso não tenha ficado qualquer dúvida. Termo de Consentimento Livre e Esclarecido Acredito ter sido suficiente informado a respeito das informações que li ou que foram lidas para mim, descrevendo o estudo “Análise de parâmetros espectrais da voz em crianças saudáveis de quatro a oito anos”. Eu discuti com a fonoaudióloga Flávia Viegas de Andrade a minha decisão em permitir a participação de meu (minha) filho (a) nesse estudo. Ficaram claros para mim quais são os propósitos do estudo, os procedimentos a serem realizados, seus desconfortos e riscos, as garantias de confidencialidade e de esclarecimentos permanentes. Ficou claro também que a participação do (a) meu (minha) filho (a) é isenta de despesas e que tenho garantia do acesso aos resultados e de esclarecer minhas dúvidas a qualquer tempo. Concordo voluntariamente em permitir a participação do (a) meu (minha) filho (a) neste estudo e poderei retirar o meu consentimento a qualquer momento, antes ou 70 durante o mesmo, sem penalidade ou prejuízo ou perda de qualquer benefício que eu possa ter adquirido. ___________________________________ Data:_______/______/______ Assinatura do pai, mãe ou responsável Nome: Endereço: RG. Telefone: ( ) __________________________________ Data _______/______/______ Assinatura da pesquisadora Nome da criança: _____________________________________________ Contato: Pesquisadora: Flávia Viegas de Andrade – [email protected] 71 APÊNDICE B ROTEIRO DE AVALIAÇÃO DO SISTEMA RESSONANTAL (Adaptado de Pinho, 2003) FOCO DE RESSONÂNCIA: a) ( ) nasal Divisão: ( ) rinofonia aberta ( ) rinofonia fechada ( ) hiponasalidade ( ) denasalidade b) ( ) faríngeo c) ( ) cul de sac d) ( ) laringo-faríngeo e) ( ) equilibrado Data: ___/___/___ ______________________ Fonoaudióloga