4º Colóquio Brasileiro de Prosódia da Fala Miguel Oliveira, Jr. Ayane Almeida René Almeida Projeto Gráfico, diagramação e capa M. Cicera Costa Catalogação na fonte É permitida a reprodução total ou parcial desta obra, por quaisquer meios, desde que citada a fonte. 4º Colóquio Brasileiro de Prosódia da Fala Agradecimentos À Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) e à Fundação de Amparo à Pesquisa do Estado de Alagoas (FAPEAL), pelo auxílio financeiro concedido. À Faculdade de Letras (FALE), ao Programa de Pós-Graduação em Letras e Linguística (PPGLL), e à Pró-Reitoria de Pesquisa e Pós-Graduação (PROPEP) da Universidade Federal de Alagoas, pelo auxílio financeiro e apoio para a execução do evento. Aos palestrantes Albert Rilliard e Carlos Gussenhoven, por aceitarem o convite para participar do evento, partilhando resultados de suas pesquisas recentes. Aos debatedores Alexsando Meireles, Camila Leite, Juan Sosa, Letícia Rebollo, Luciana Lucente, Pablo Arantes, Plínio Barbosa e Regina Cruz, pela disponibilidade de atuar na condução das discussões dos trabalhos apresentados no Colóquio. A Dermeval da Hora, pelo apoio em prestar informações fundamentais para a realização do evento. Aos professores Elizabeth Couper-Kuhlen, Anne Wichmann, Marc Swerts, Mariapaola d'Imperio, Albert Rilliard, Carlos Gussenhoven, Lorna Fadden, Zuleica Camargo e Juan Manuel Sosa, por terem, muito gentilmente, aceitado o convite para lecionar na Escola de Altos Estudos “Interfaces Prosódicas”. À Comissão Científica do evento, nomeadamente Adriana Bodolay, Albert Rilliard, Alexsandro Meireles, Anne Wichmann, Camila Leite, César Reis, Carlos Gussenhoven, Eleonora Albano, Ester Scarpa, Izabel Seara, João Antônio de Moraes, José Olímpio de Magalhães, Juan Manuel Sosa, Letícia Rebollo, Lorna Fadden, Luciana, Marc Swerts, Mariapaola D'Imperio, Pablo Arantes, Plínio Barbosa, Regina Cruz, Sandra Madureira, Vera Pacheco, Waldemar Ferreira Netto e Zuleica Camargo, por terem lido os resumos que foram submetidos para avaliação e emitido pareceres. À Luso Brazilian Association of Speech Sciences (LBASS), pelo apoio na organização do evento. Caderno de Resumos Aos membros Grupo de Estudos de Prosódia da Fala, da Faculdade de Letras / UFAL, pelo apoio na realização do evento. Ao PET/Letras da UFAL, pelo apoio na organização do evento. Em particular, aos petianos Natália Momberg e Victor Mata, pelo design do logo do evento. Aos participantes do IV Colóquio Brasileiro de Prosódia da Fala, por terem submetido seus trabalhos e prestigiado o evento com suas valiosas contribuições. A Comissão Organizadora: Miguel Oliveira, Jr., Camila Leite, Letícia Rebollo, Luciana Lucente, Pablo Arantes e Regina Cruz 4º Colóquio Brasileiro de Prosódia da Fala Introdução A importância dada à pesquisa sobre a prosódia do português brasileiro tem sido traduzida em uma série de iniciativas realizadas nos últimos anos. Em agosto de 2007, com o objetivo de reunir pesquisadores nacionais que se debruçavam no estudo da prosódia da fala sob diferentes perspectivas, João Moraes (Universidade Federal do Rio de Janeiro) organizou, na Universidade Federal do Rio de Janeiro, o I Colóquio Brasileiro de Prosódia da Fala. O evento reuniu pesquisadores de vários centros universitários do país e resultou em uma excelente oportunidade de diálogo entre esses estudiosos. O evento também serviu como uma prévia para o Speech Prosody 2008, quarta edição do evento internacional mais importante na área de prosódia da fala, que seria sediado no ano seguinte na Universidade Estadual de Campinas. Naquele mesmo ano de 2007 um grupo de investigadores nacionais propõe a criação de uma associação científica com objetivo de promover, estimular e divulgar os estudos nas Ciências da Fala no Brasil e em Portugal, bem como estabelecer um canal de contato direto entre os estudos na área no Brasil, em Portugal e no Exterior. Assim, surge a Luso Brazilian Association of Speech Sciences (LBASS). A associação apoiou oficialmente o evento Speech Prosody 2008. O Speech Prosody 2008, organizado por Plínio Barbosa (Universidade Estadual de Campinas), César Reis (Universidade Federal de Minas Gerais) e Sandra Madureira (Pontifícia Universidade Católica de São Paulo) reuniu pesquisadores de 30 países distintos e 54 pesquisadores brasileiros de prosódia experimental. No ano seguinte, em 2009, ocorreu o II Colóquio Brasileiro de Prosódia da Fala na Universidade Estadual de Campinas. Esse evento, promovido pela LBASS, foi organizado pelo Grupo de Estudos de Prosódia da Fala, liderado por Plínio Barbosa. Um total de 40 trabalhos foram apresentados nesse evento. O resumo das apresentações foram publicados em CD-ROM. Nesse colóquio, surgiu a proposta de se organizar a I Escola de Prosódia com a missão de possibilitar um espaço de formação que congregasse pesquisadores juniores e seniores em torno do estudo da Prosódia. Caderno de Resumos Também em 2009, teve lugar na Universidade de São Paulo o Simpósio "Em torno da Prosódia", evento promovido pelo Programa de Pós-graduação em Semiótica e Linguística Geral daquela IES, e organizado por Beatriz Raposo de Medeiros, Evani Viotti José Roberto do Carmo Jr e Paulo Chagas de Souza. Essas primeiras iniciativas (o I Colóquio Brasileiro de Prosódia da Fala, o Speech Prosody 2008, o II Colóquio Brasileiro de Prosódia da Fala e o Simpósio "Em torno da Prosódia") não apenas impulsionaram os estudos de prosódia da fala no Brasil, mas também estimularam a divulgação desses estudos internacionalmente. Na edição seguinte do Speech Prosody, em 2010, realizada em Chicago, o número de participantes brasileiros passou para 15, um número bastante expressivo, sobretudo se se leva em conta o fato de que a primeira edição do evento, realizado na França, em 2002, contara apenas com 5 participantes brasileiros no total. Por ocasião do Simpósio "Em torno da Prosódia", foi anunciada a I Escola de Prosódia, evento que seria realizada em 2010, na PUC-SP, organizado pelas professoras Sandra Madureira e Zuleica Camargo (Pontifícia Universidade Católica de São Paulo). Durante este evento, foi lançado o periódico JoSS (Journal Speech Sciences), editado por Plínio Barbosa e Sandra Madureira. Trata-se de um periódico de livre acesso, com uma chamada para o primeiro número sobre Prosódia Experimental e publicado regularmente desde então. Em 2011, foi realizado o III Colóquio Brasileiro de Prosódia da Fala, na Universidade Federal de Minas Gerais, organizado por César Reis, com o apoio do Núcleo de Estudos em Linguagem, Cognição e Cultura, Laboratório de Estudos Empíricos e Experimentais da Linguagem e Grupo Interfaces Linguagem, Cognição e Cultura. O evento contou com a participação de vários pesquisadores nacionais, entre os quais professores, doutorandos, mestrandos e graduandos. Um total de 40 trabalhos foram apresentados nesse evento. Os artigos completos das apresentações foram publicados online nos Anais do Colóquio Brasileiro de Prosódia da Fala. Em fevereiro de 2012, Tommaso Raso e Heliana Mello (Universidade Federal de Minas Gerais) organizam na UFMG o GSCP2012, reunindo pesquisadores nacionais e internacionais dedicados à área da prosódia, e lançando o corpus C-Oral-BRASIL I: Corpus de Referência do Português Brasileiro Falado Informal. Em outubro de 2012 foi realizada a II Escola de Prosódia na Universidade Federal do Espírito Santo, organizado por Alexsandro Meireles, e 4º Colóquio Brasileiro de Prosódia da Fala promovido pela LBASS. O evento teve 140 pessoas inscritas em 21 diferentes cursos, oferecidos ao longo de quatro dias. Os cursos variavam de 4h a 12h e foram oferecidos por pesquisadores brasileiros e estrangeiros, todos especialistas em prosódia da fala. O objetivo principal do IV Colóquio Brasileiro de Prosódia da Fala é dar continuidade à realização de colóquios que reúnem pesquisadores na área. Neste sentido o evento contribui para a consolidação da realização de eventos que oportunizam a reunião de pesquisadores brasileiros e estrangeiros da área de prosódia da fala e na divulgação e socialização de sua produção acadêmica. A característica marcante do IV Colóquio Brasileiro de Prosódia da Fala, organizado por Miguel Oliveira, Jr. (Universidade Federal de Alagoas), Camila Leite (Universidade Federal de Alagoas), Letícia Rebollo (Universidade Federal do Rio de Janeiro), Luciana Lucente (Universidade Federal de Minas Gerais), Pablo Arantes (Universidade Federal de São Carlos) e Regina Cruz (Universidade Federal do Pará), com o apoio da Faculdade de Letras da Universidade Federal de Alagoas e do Programa de Pós-Graduação em Letras e Linguística dessa mesma IES, é a escolha de uma sede localizada fora do eixo formado pelos centros tradicionais, na sua imensa maioria nos estados do sudeste brasileiro. Esta escolha teve por objetivo facilitar o acesso dos grupos de pesquisa que começam a ganhar força na região nordeste ao fórum acadêmico de alto nível em que o Colóquio vem se constituindo. O evento será composto de duas palestras proferidas por convidados internacionais: Albert Rilliard (LIMSI-CNRS, França) e Carlos Gussenhoven (Radboud University Nijmegen, Holanda) e onze sessões de apresentações orais de trabalhos – 46 ao todo – abordando temas bastante variados na área da prosódia da fala. Pesquisadores de diferentes regiões do país e do exterior estarão reunidos com o objetivo de apresentar resultados de estudos concluídos e em andamento, que serão debatidos por especialistas na área, nomeadamente Alexsando Meireles, Camila Leite, Juan Sosa, Letícia Rebollo, Luciana Lucente, Pablo Arantes, Plínio Barbosa e Regina Cruz. O IV Colóquio Brasileiro de Prosódia da Fala foi financiado pela Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES), através do Edital PAEP (Processo 4053/2013-09) e pela Fundação de Amparo à Pesquisa do Estado de Alagoas (FAPEAL), atráves to Edital FAPEAL No. 05/2012 (Processo 20130419-003-0034-0033). Outro elemento inovador desta edição do Colóquio é a organização de um evento satélite – A Escola de Altos Estudos “Interfaces Prosódicas” – com Caderno de Resumos o propósito de oferecer uma gama variada de cursos de média duração em diferentes áreas de interface entre a prosódia e outros campos de investigação, como o direito, o ensino de línguas e a investigação das emoções, por exemplo. Os cursos serão ministrados por pesquisadores convidados que são autoridades reconhecidas internacionalmente por seu trabalho, o que constituirá uma oportunidade de grande valor não só para os grupos de pesquisa nacionais, mas também para pesquisadores de outros países. Serão nove cursos ao todo: (i) Prosódia e Conversação, com Elizabeth Couper-Kuhlen (Universidade de Helsinki); (ii) Prosódia e Discurso, com Anne Wichmann (Universidade de Central Lancashire); (iii) Prosódia Audiovisual na interação Humano-Humano e Humano-Máquina, com Marc Swerts (Universidade de Tilburg); (iv) Prosódia e Sintaxe, com Mariapaola d'Imperio (Universidade de AixMarseille); (v) Prosódia e Expressividade, com Albert Rilliard (Centro Nacional de Pesquisa Científica, França); (vi) Prosódia e Tipologia, com Carlos Gussenhoven (Universidade de Radboud); (vii) Prosódia e Direito, com Lorna Fadden (Universidade Simon Fraser); (viii) Prosódia e Fonoaudiologia, Zuleica Camargo (USP); e (ix) Prosódia e Entoação no Ensino de Língua Estrangeira (inglês, francês e espanhol) no contexto brasileiro, com Juan Manuel Sosa (Universidade Simon Fraser). A Escola de Altos Estudos “Interfaces Prosódicas” foi completamente financiada pela Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES), através do Edital Escola de Altos Estudos (Processo 23038.008493/2013-27). Espera-se com a realização da quarta edição do Colóquio fortalecer a posição do evento como o principal fórum de discussão de prosódia no cenário brasileiro e colaborar para a disseminação de conhecimento de ponta sobre prosódia, de forma a colocar o Brasil em posição competitiva no cenário internacional de pesquisa na área. A Comissão Organizadora: Miguel Oliveira, Jr., Camila Leite, Letícia Rebollo, Luciana Lucente, Pablo Arantes e Regina Cruz 4º Colóquio Brasileiro de Prosódia da Fala Programação 16 de outubro 8h-8h30 Credenciamento 8h30-9h Sessão de Abertura 9h-10h Palestra: Cross-Cultural Perception of Attitudes and Concepts Albert Rilliard (LIMSI-CNRS, França) 10h-10h30 Pausa para café 10h30-12h: Sessão de Apresentações 1 1. Prosody analysis of positive and negative laughter: a multicultural study Laurence Devillers (Université Paris Sorbonne - Paris 4) Mariette Soury (Université Paris XI Orsay) 2. A expressão da ironia no Português Brasileiro: um estudo prosódico Wisla Madaleni Alves Cabral Ferreira (UFOP) 3. A velocidade de fala na expressão da raiva: um estudo com dados de elocução espontânea René Alain Santana de Almeida (UFAL) Ayane Nazarela Santos de Almeida (UFAL) Miguel Oliveira, Jr. (UFAL) Ebson Wilkerson Rocha da Silva (UFAL) DEBATEDORES: Letícia Rebollo & Juan Sosa 12h-14h Almoço Caderno de Resumos 14h-16h: Sessão de Apresentações 2 4. A expressividade na locução do telejornal: uma questão prosódica Dilma Tavares Luciano (UFPE) 5. Ênfase prosódica em estruturas narrativas: Um estudo preliminar Jeylla Salomé Barbosa dos Santos (UFAL) Ana Maria Santos de Mendonça (UFAL) 6. Constraints prosódicos para os Marcadores Discursivos Amanda Aleixo (UFMG) Diego Malachias (UFMG) Priscila Osório (UFMG) Tommaso Raso (UFMG) 7. Pistas prosódicas de fronteiras discursivas em narrativas espontâneas: um estudo de percepção Ebson Wilkerson da Silva (UFAL) Júlia Lopes (UFPA) Miguel Oliveira, Jr. (UFAL) Regina Cruz (UFPA) Francisca Carvalho (UFMG) 8. Estrutura discursiva como limitadora de padrões entoacionais, e vice-versa Luciana Lucente (UFMG) DEBATEDORES: Regina Cruz & Leticia Rebollo 16h-16h30 Pausa para café 16h30-19h: Sessão de Apresentações 3 9. Desenvolvimento de algoritmo de análise automática da curva de frequência por meio de convoluções gaussianas do histograma de alturas Waldemar Ferreira Netto (USP/CNPq) André Ricardo de Souza (Faculdade de Artes do Paraná/USP) Maressa de Freitas Vieira (FSP) Daniel Oliveira Peres (USP) Marcus Vinicius Moreira Martins (USP) 10. Individualização de características prosódicas em diferentes relações sinalruído Ana Carolina Constantini (UNICAMP) Plinio Almeida Barbosa (UNICAMP) 4º Colóquio Brasileiro de Prosódia da Fala 11. Uso de técnicas acústicas para verificação de locutor em simulação experimental Aline de Paula Machado (Unicamp) 12. Exclamativas WH em português brasileiro: metodologia para montagem de experimentos de produção e aceitabilidade Karina Zendron da Cunha (UFSC) 13. Desviando da própria fala: implicações para a verificação de locutor por falantes e não-falantes do português brasileiro Renata Regina Passetti (Unicamp) DEBATEDORES: Alexsando Meireles & Pablo Arantes 17 de outubro 8h-9h Palestra: Comparing the word and sentence prosody of British and Nigerian English Carlos Gussenhoven (Radboud University Nijmegen, Holanda) 9h-10h: Sessão de Apresentações 4 14. A combinação de pistas acústicas melódicas, de duração silábica e de intensidade relativa prevê melhor a percepção da proeminência em português brasileiro Plínio A. Barbosa (Unicamp) 15. Estudo articulatório de reorganizações rítmicas da fala devido ao aumento da taxa de elocução Alexsandro Rodrigues Meireles (UFES) Plínio Almeida Barbosa (Unicamp) DEBATEDORES: Pablo Arantes & Luciana Lucente 10h-10h30 Pausa para café 10h30-12h: Sessão de Apresentações 5 16. A(s) pronúncia(s) do R final em canções do início do século XX (1902-1920) Karilene Xavier (UFRJ) Caderno de Resumos 17. O apagamento do rótico no português brasileiro e no português europeu: o lido e o dito Aline de Jesus Farias Oliveira (UFRJ) Ingrid da Costa Oliveira (UFRJ) 18. A relação entre a compreensão e os aspectos prosódicos na leitura em voz alta de falantes do PE e do PB Camila Tavares Leite (UFAL) DEBATEDORES: Juan Sosa & Regina Cruz 12h-14h Almoço 14h-16h: Sessão de Apresentações 6 19. Preenchimentos dos níveis prosódicos inferiores: dados de aquisição do PB Luzia Miscow da Cruz Payão (UNCISAL) 20. A prosódia como ponto de partida para a segmentação do fluxo da fala por bebês brasileiros Ícaro Oliveira Silva (UFJF) Maria Cristina Name (UFJF) 21. Caracterização da frequência fundamental da voz de adultos que gaguejam Ayslan Melo de Oliveira (UFS) Jeane Bezerra de Melo e Silva (UFS) Kleuvencleiton José dos Santos Oliveira (UFS) Mayra Cristina Jorge Oliveira (UFS) Suelen Glaucia (UFS) Tarcya Sibele Bastos Santos (UFS) Thiago Gonçalves de Jesus (UFS) Susana de Carvalho (UFS) 22. Características prosódicas dos números telefônicos no português brasileiro Oyedeji Musiliyu (UFAL) Miguel Oliveira Jr. (UFAL) 23. Experimento de produção sobre a prosódia da não exaustividade semântica no português brasileiro Daise Ribeiro Pereira Carpes (UFSC) Juan Manuel Sosa (Simon Fraser University) Izabel Christine Seara (UFSC) DEBATEDORES: Camila Leite & Luciana Lucente 4º Colóquio Brasileiro de Prosódia da Fala 16h-16h30 Pausa para café 16h30-19h: Sessão de Apresentações 7 24. Towards Focus Typology in Turkish Jane Kühn (University of Potsdam) 25. Status referencial no Português Brasileiro: Estudo das pistas acústicas de novo, dado e acessível Alexandre Delfino (Unicamp) 26. A interação prosódia-sintaxe em dados de produção e de compreensão de estruturas de Tópico e de SVO Carolina Garcia de Carvalho Silva (UFJF) Maria Cristina Name (UFJF) 27. Percepção de correlatos prosódicos da distinção dado-novo em português brasileiro Pablo Arantes (UFSCar) Cíntia Santana (UFMG) Luciana Lucente (UFMG) 28. Marcação prosódica e status referencial em português brasileiro Cíntia Antão (UFMG) Luciana Lucente (UFMG) Pablo Arantes (UFSCar) Maria Luiza Cunha Lima (UFMG) DEBATEDORES: Plínio Barbosa & Alexsandro Meireles 18 de outubro 8h-10h: Sessão de Apresentações 8 29. Percepção de padrões entoacionais do alemão: um estudo preliminar Adelaide Herciìlia Pescatori Silva (UFPR) Maria do Socorro Gonc¸alves Gabriel (UFPR) Rafael Klassen Martens (UFPR) 30. A Entoação do Português do Brasil: uma descrição perceptiva Luma da Silva Miranda (UFRJ) Caderno de Resumos 31. Relação entre a prosódia e seus constituintes e a realização de sândi vocálico externo na leitura Ceriz Graça Bicalho Cruz Costa (UFMG/CNPq) Camila Tavares Leite (UFAL) 32. Aspectos temporais envolvidos na sobreposição de vozes em diálogos da língua Yaathe Fábia Pereira da Silva (UFAL) Miguel Oliveira Jr. (UFAL) Januacele da Costa (UFAL) 33. A prosódia como recurso para marcar tempo em Kaingang Márcia Nascimento (UFRJ) Marcus Maia (UFRJ) Leticia Rebollo Couto (UFRJ) DEBATEDORES: Pablo Arantes & Luciana Lucente 10h-10h30 Pausa para café 10h30-12h: Sessão de Apresentações 9 34. Formulações na corte: a prosódia em ações de checagem de entendimento e de requisição de prestação de contas Daniela Negraes P. Andrade (UNISINOS) Ana Cristina Ostermann (UNISINOS) Minéia Frezza(UNISINOS) 35. Um estudo comparativo do acento ¡H+L* entre uma variedade brasileira nordestina e uma italiana meridional: uma hipótese de lexicalização suprassegmental e uma reflexão sobre o conceito de foco Marco Barone (UFPE) 36. Enunciados Interrogativos Totais neutros em ELE: antes e depois da sistematização no processo de ensino-aprendizagem Maristela da Silva Pinto (UFRRJ) Roberto Botelho Rondinini (UFRRJ) Natacha Dionisio de Souza (IC/UFRRJ) DEBATEDORES: Letícia Rebollo & Juan Sosa 12h-14h Almoço 4º Colóquio Brasileiro de Prosódia da Fala 14h-16h: Sessão de Apresentações 10 37. Entoação das interrogativas totais e parciais do espanhol produzidas por um professor de espanhol, falante de português brasileiro de Curitiba Pollianna Milan (UFPR) 38. Análise entonacional e pragmática de conversas telefônicas coloquiais: os enunciados interrogativos totais nas variedades de Buenos Aires e Santiago do Chile Carolina Gomes da Silva (PG-UFRJ/CNPq) Maristela da Silva Pinto (UFFRJ) Natalia dos Santos Figueiredo (UNILA/PG-UFRJ) 39. Descendo ou subindo? Padrões entonacionais de interrogativas totais da língua inglesa e do português brasileiro por falantes brasileiros Leonice Passarella dos Reis (EAMSC/UFSC) 40. Produção e percepção de sentenças interrogativas totais em dados de falantes nativas e não nativas de espanhol: um estudo experimental Eva Christina Orzechowski Dias (UFSC) Izabel Christine Seara (UFSC) Juan Manuel Sosa (Simon Fraser University) 41. Prosódia acústica e prosódia visual de enunciados interrogativos no espanhol de Montevidéu Priscila Cristina Ferreira de Sá (UFRJ) Leticia Rebollo Couto (UFRJ) DEBATEDORES: Alexsando Meireles & Plínio Barbosa 16h-16h30 Pausa para café 16h30-19h: Sessão de Apresentações 11 42. Pistas prosódicas para a segmentação da entrevista sociolinguística Raquel Meister Ko. Freitag (Universidade Federal de Sergipe) 43. Contribuições para o Atlas do Projeto Amper – Norte: Variedade Linguística de Baião (PA) Rosinele Lemos e Lemos (UFPA) Regina Célia Fernandes Cruz (UFPA/CNPq) 44. A prosódia das frases declarativas e interrogativas totais: um comparativo entre as falas de Maués, no Amazonas e Cametá, no Pará Ilma Pinto do Espírito Santo (UFPA) Suzana Pinto do Espírito Santo (UFAM) Caderno de Resumos 45. Pelos cantos do Brasil: uma análise prosódica da asserção neutra em falares das capitais e do interior do Brasil Aline Ponciano dos Santos Silvestre (UFRJ) Gizelly Fernades Maia dos Reis (UFRJ) Priscila Francisca dos Santos (UFRJ) 46. Características prosódicas de sete dialetos brasileiros Ana Carolina Constantini (UNICAMP) Plinio Almeida Barbosa (UNICAMP) DEBATEDORES: Regina Cruz & Camila Leite 4º Colóquio Brasileiro de Prosódia da Fala Sumário Percepção de padrões entoacionais do Alemão: um estudo preliminar 21 Status referencial no português brasileiro: estudo das pistas acústicas de novo, dado e acessível 26 Estudo articulatório de reorganizações rítmicas da fala devido ao aumento da taxa de elocução 30 Uso de técnicas acústicas para verificação de locator em simulação experimental 34 O apagamento do rótico no português brasileiro e no português europeu: o lido e o dito 38 Pelos cantos do Brasil: uma análise prosódica da asserção neutra em falares das capitais e do interior do Brasil 42 Restrições prosódicas para os marcadores discursivos 48 Individualização de características prosódicas em diferentes relações sinal-ruído 56 Características prosódicas de sete dialetos brasileiros 60 Ênfase prosódica em estruturas narrativas: um estudo preliminar 66 Caracterização da frequência fundamental da voz de adultos que gaguejam 71 A relação entre a compreensão e os aspectos prosódicos na leitura em voz alta de falantes do PE e do PB 76 Caderno de Resumos A interação prosódia-sintaxe em dados de produção e de compreensão de estruturas de Tópico e de SVO 80 Análise entonacional e pragmática de conversas telefônicas coloquiais: os enunciados interrogativos totais nas variedades de Buenos Aires e Santiago do Chile 84 Relação entre prosódia e seus constituintes e a realização de sândi vocálico externo na leitura 89 Marcação prosódica e status referencial em português brasileiro 92 Experimento de produção sobre a prosódia da não exaustividade semântica no português brasileiro 97 Formulações na Corte: a prosódia em ações de checagem de entendimento e de requisição de prestação de contas 103 A Expressividade na locução do telejornal: uma questão prosódica 107 Pistas Prosódicas de Fronteiras Discursivas em Narrativas Espontâneas: um estudo de percepção 112 Produção e percepção de sentenças interrogativas totais em dados de falantes de espanhol como L1 e L2: um estudo experimental 118 Aspectos temporais envolvidos na sobreposição de vozes em diálogos da língua Yaathe 123 A prosódia como ponto de partida para a segmentação do fluxo da fala por bebês brasileiros 127 a prosódia das frases declarativas e interrogativas totais: um comparativo entre as falas de Maués, no Amazonas e Cametá, no Pará 131 Towards a Focus Typology in Turkish 135 A(s) pronúncia(s) do R final em canções do início do século XX (19021920) 141 4º Colóquio Brasileiro de Prosódia da Fala Exclamativas WH em português brasileiro: metodologia para montagem de experimentos de produção e aceitabilidade 145 Prosody analysis of positive and negative laughter: a multicultural study 149 Descendo ou subindo? Padrões entonacionais de interrogativas totais da língua inglesa e do português brasileiro por falantes brasileiros 154 Estrutura discursiva como limitadora de padres entoacionais, e viceversa 158 A Entoação do Português do Brasil: uma descrição perceptiva 162 Preenchimentos dos níveis prosódicos inferiores: dados de aquisição do Português Brasileiro (PB) 168 A prosódia como recurso para marcar tempo em kangang 173 Um estudo comparativo do acento ¡H+L* entre uma variaedade brasileira nordestina e uma italiana meridional: uma hipótese de lexicalização suprassegmental e uma reflexão sobre o conceito de foco 180 Enunciados interrogativos totais neutros em ELE: antes e depois da sistematização no processo de ensino-aprendizagem 187 Características prosódicas dos números telefônicos no português brasileiro 194 Percepção de correlatos prosódicos da distinção dado-novo em português brasileiro 199 A combinação de pistas acústicas melódicas, de duração silábica e de intensidade relativa prevê melhor a percepção da proeminência em português brasileiro 205 Entoação das interrogativas e parciais do espanhor produzidas por um professor de espanhor, falante de Português Brasileiro de Curitiba. 209 Prosódia acústica e prosódia visual de enunciados interrogativos no espanhol de Montevidéu 213 Caderno de Resumos Pistas prosódicas para a segmentação da entrevista sociolinguística 217 Desviando da própria fala: implicações para a verificação de locutor por falantes e não-falantes do português brasileiro 222 A velocidade de fala na expressão da raiva: um estudo com dados de elocução espontânea 226 Contribuições para o Atlas do Projeto Amper-Norte: variedade linguística de Baião (PA) 230 Desenvolvimento de algoritmo de análise automática da curva de frequência por meio de convoluções gaussianas do histograma de alturas 235 A expressão da ironia no Português Brasileiro: um estudo prosódico 241 4º Colóquio Brasileiro de Prosódia da Fala Percepção de padrões entoacionais do Alemão: um estudo preliminar Adelaide Hercília Pescatori Silva, Maria do S. Gonçalves Gabriel, Rafael K. Martens Departamento de Linguística, Letras Clássicas e Vernáculas, Universidade Federal do Paraná, Brasil [email protected], [email protected], [email protected] A experiência docente e discente com alemão como língua estrangeira revela um tratamento recorrente nos materiais didáticos dos aspectos sintáticos, lexicais e culturais. O tratamento aos aspectos fonéticos, porém, é mais superficial e focaliza sobretudo a qualidade vocálica, a diferença entre vogais longas e breves, ou os sons de /r/. Pouco ou quase nada se diz sobre o nível prosódico da língua a ser aprendida: informa-se apenas ao estudante que sentenças interrogativas – quaisquer que sejam elas - devem apresentar curva entoacional ascendente no final, contraposta à curva entoacional descendente, que supostamente caracteriza quaisquer sentenças assertivas. Desta forma, praticamente igualam-se as línguas materna e estrangeira sob o ponto de vista prosódico. Entretanto, é sabido que as línguas apresentam diferenças relacionadas a aspectos prosódicos como, por exemplo, o ritmo: línguas como o alemão apresentam uma natureza acentual para o ritmo; outras, como o francês, uma natureza silábica. Essa distinção se faz tomando-se ritmo silábico como aquele em que as sílabas são produzidas com duração aproximadamente igual e ritmo acentual como aquele característico de línguas em que a duração dos eventos de fala entre os acentos tônicos é aproximadamente igual (Massini-Cagliari 1992: 41,42). O português brasileiro (PB), por outro lado, é caracterizado por alguns autores (Barbosa 1999) como uma língua de ritmo misto, ou seja, apresenta características tanto de línguas acentuais como de línguas silábicas. As diferenças observadas no nível prosódico não se dão, contudo, apenas no âmbito do ritmo. A entonação das línguas também as diferencia entre si, o que se atesta, por exemplo, com a observação de Cortés (2002: 28) sobre as 21 Caderno de Resumos interpretações inadequadas dos aprendizes de espanhol quanto às intenções comunicativas do falante nativo. Tendo isso em vista, pode-se assumir, com base nos estudos de Eckman (1981) sobre a interlíngua, que os aprendizes de alemão como língua estrangeira, falantes nativos de PB, transferirão à língua alemã características prosódicas de sua língua materna, durante o processo de aquisição da língua estrangeira. Por isso decidiu-se conduzir um estudo sistemático desse nível, que desempenha um papel crucial na comunicação, já que curvas entoacionais não default podem levar o interlocutor a uma interpretação do enunciado distinta daquela intencionada pelo falante a exemplo do que argumentam FontRotchés e Mateo-Ruiz (2011). Desde 2011, então, tem-se caracterizado acusticamente os contornos entoacionais do alemão em sentenças interrogativas e assertivas. Para fazer a caracterização acústica, recorreu-se à seguinte metodologia: recortaram-se sentenças de fala espontânea em alemão a partir de vídeos da televisão alemã disponíveis na internet. A análise segue o método de base acústico-perceptiva de Font-Rotchés e Cantero (2009), que têm se empenhado em diversas investigações sobre a entonação de diferentes línguas. O Melodic Analysis of Speech (MAS) é um método formal baseado em análises acústico-perceptivas da fala espontânea, o que possibilita que a entonação seja descrita do ponto de vista fonético. Além disso, o modelo permite obter valores relativos que constituem as curvas entoacionais de maneira que se possa compará-las, classificá-las, reproduzi-las, usá-las em síntese de fala e estabelecer generalizações linguísticas através delas. O MAS aplica-se, assim, aos objetivos desta pesquisa, tendo em vista, que é pensado especificamente para estudos comparativos entre línguas, o que lhe confere grande aplicabilidade ao ensino de Língua Estrangeira. Através do software Praat analisaram-se acusticamente os enunciados coletados: mediu-se a frequência fundamental (F0) das vogais de cada sílaba do enunciado recortado. Com os valores obtidos, os valores de F0 foram normalizados através de metodologia desenvolvida por Cantero e FontRotchés (2009): calcula-se com uma regra de três a porcentagem da variação de cada valor absoluto em relação ao valor anterior. Quando o valor é maior que o anterior, obtém-se uma porcentagem positiva e quando o valor é menor, uma porcentagem negativa. É com este cálculo que se conseguem os valores relativos de cada contorno. Para gerar o gráfico dos contornos entoacionais, convertem-se as porcentagens obtidas em valores estandardizados a partir do valor arbitrário 100. Lançando mão deste processo de normalização, pode-se 22 4º Colóquio Brasileiro de Prosódia da Fala representar graficamente cada contorno com o fim de comparação com outra curva. Esse procedimento analítico, baseando-se na inflexão final (a curva obtida desde a última sílaba tônica da sentença até o seu final), permite classificar os contornos entoacionais do alemão em grupos semelhantes. Após as primeiras análises das curvas entoacionais, constataram-se relações significativas entre a configuração da inflexão final dos enunciados com a sua função comunicativa. Tanto para as sentenças interrogativas quanto para as sentenças assertivas estabeleceram-se dois padrões entoacionais com base na inflexão final. Quanto aos enunciados interrogativos, o primeiro padrão apresenta um contorno de inflexão final descendente-ascendente, implicando em sentenças interrogativas absolutas, ou seja, perguntas às quais somente cabem respostas imediatas 'sim' ou 'não'. Exemplo: ,,Kann ich wieder gehen?''(“Eu já posso ir?”). O segundo padrão entoacional, por sua vez, consiste num contorno de inflexão final ascendente. Nos enunciados interrogativos com este padrão, como em ,,Was?'' (“Certo?”), espera-se como função comunicativa um pedido de confirmação. Nos enunciados assertivos, o primeiro padrão apresenta um contorno de inflexão final descendente, implicando em sentenças assertivas em que o informante conclui um raciocínio. A sentença ,,Tja, stimmt'' (“Sim, está certo”) apresenta tal contorno. O segundo padrão entoacional encontrado consiste num contorno de inflexão final ascendente-ascendente. Nos enunciados declarativos com este padrão, o locutor anuncia parte de uma ideia a ser completada pelo ouvinte. É a suspensão entoacional que dá pistas ao interlocutor de que a ideia veiculada não está de todo completa. Um exemplo para esse padrão é ,,Den Bart haben Sie zwar nicht...'' (“A barba, o senhor não tem...”). A função comunicativa depreendeu-se pela análise do contexto conversacional dos enunciados, recuperado tanto nos vídeos como nas fichas catalográficas, elaboradas com o fim de identificação detalhada de cada enunciado analisado. Após mais uma rodada de análise das sentenças coletadas, observou-se a necessidade de expansão do corpus, já que se julgava necessário um número maior de observações para uma caracterização mais precisa dos padrões prosódicos encontrados. Assim, com novas sentenças submetidas ao mesmo processo metodológico mencionado acima, tomou-se como objetivo, com base no corpus estendido, a revisão dos dados para verificar se os padrões encontrados inicialmente se sustentam e se novos padrões surgem nos dados. 23 Caderno de Resumos Apesar da expansão do corpus em 70%, não se verificaram novos padrões entoacionais, mas as curvas entoacionais encontradas reforçam os padrões já existentes. Os resultados obtidos durante todas as etapas da pesquisa trouxeram à tona a seguinte questão: em que medida as diferenças no valor da frequência fundamental encontradas nas análises dos dados são realmente percebidas como funções comunicativas distintas? Ou seja, o quanto é necessário que a frequência fundamental mude para que os falantes identifiquem as diferentes funções associadas às curvas entoacionais? Para que se possa verificar e analisar tal fenômeno, fez-se necessária a elaboração e aplicação de um teste perceptual. O teste foi aplicado com o software TP -Teste/Treinamento de Percepção - (Rauber et al. 20121), que é um aplicativo gratuito desenvolvido para a realização de experimentos de Percepção da Fala, de plataforma user-friendly. 2 Diferentemente da proposta desenvolvida por Font-Rotchés (2013 ), que prevê a manipulação das sentenças com o auxílio do software Praat, cogitou-se para o teste perceptual deste projeto a utilização de sentenças sem manipulações na frequência fundamental. Isto é, de sentenças não-sintetizadas, devido ao fato de que Cantero e Font-Rotchés (2009), na fase de produção, trabalham com dados da fala espontânea, mas na fase de percepção, os ouvintes interpretam sentenças manipuladas no Praat. Por considerarmos esta estratégia uma limitação metodológica e após discussões sobre essa 'discrepância', optou-se por uma metodologia mais robusta, à medida que se trabalhe tanto na produção quanto na percepção com dados de mesma natureza (sentenças espontâneas e não manipuladas). Os resultados alcançados através do teste perceptual elaborado e aplicado para esta pesquisa serão expostos e discutidos neste trabalho. Referências Barbosa, P. A. 1999. “Revelar a estrutura rítmica de uma língua construindo máquinas falantes: pela integração de ciência e tecnologia de fala”. In Scarpa, E. M. (org.) Estudos de Prosódia. Campinas, SP: Editora da Unicamp. 1 O software pode ser acessado em: http://www.worken.com.br/tp_regfree.php Comunicação individual no VIII Congresso Internacional da ABRALIN. 2 24 4º Colóquio Brasileiro de Prosódia da Fala Cantero, F. J. & Font-Rotchés, D. 2009. Protocolo para el análisis melódico del habla, Estudios de Fonética Experimental XVIII: 17-32. ______. 2002. Teoría y análisis de la entonación. Edicions de la Universitat de Barcelona. Cortés, M. 2002. Didáctica de la prosodia del español: la acentuación y la entonación. Ednumen. Eckman, F. R. 1981. On the naturalness of interlanguage phonological rules. Font-Rotchés, D. & Cantero Serena, F. J. 2009. Melodyc Analysis of Speech Method applied to Spanish and Catalan. Phonica, 5: 33-47. Font-Rotchés, D. 2011. “Melodyc Analysis of Speech (MAS): aplicaciones en la comparación de lenguas”. Revista da Abrallin (especial): 333-366. Font-Rotchés, D. & Mateo-Ruiz, M. 2011. “Absolute interrogatives in Spanish, a new melodic pattern”. Anais do VII Congresso Internacional da Abralin. Curitiba. Massini-Cagliari, G. 1992. Acento e ritmo. São Paulo: Contexto. 25 Caderno de Resumos Status referencial no português brasileiro: Estudo das pistas acústicas de novo, dado e acessível Alexandre Delfino Faculdade de Letras, Universidade Federal de Minas Gerais, Brasil [email protected] Na área de estrutura informacional, sabe-se que referentes possuem um estado mental temporário baseado no seu grau de disponibilidade para os interlocutores no discurso. Esse estado mental (ou status referencial) é tradicionalmente visto como uma dicotomia entre referentes novos e dados (ou velhos) no discurso. Propostas recentes (Prince 1981; Gundel et al. 1993; inter alia) sugerem que, na verdade, o status referencial é um contínuo cujos extremos são os status novo e dado. Chafe (1976; 1994) propõe uma divisão baseada no grau de ativação do referente na memória de trabalho do ouvinte. Referentes novos são 'inativos', ao passo que referentes dados já estão 'ativados'. Um terceiro estado, acessível, é associado aos referentes 'semiativados'. O status referencial é muitas vezes codificado gramaticalmente, ou seja, há uma relação razoavelmente previsível entre o status de um referente e a sua forma. Muito tem-se observado sobre a distribuição da marcação morfossintática do status referencial nas línguas. Contudo, apenas recentemente há estudos que investigam a relação entre o status de um referente no discurso e a sua marcação prosódica. Baumann (2006) observou que falantes de alemão conseguem produzir pistas que podem distinguir pelo menos três status: novo, dado e acessível. Referentes novos são geralmente marcados por uma proeminência entonacional; referentes dados são geralmente "desacentuados", ao passo que referentes acessíveis são geralmente marcados por uma proeminência intermediária. A maioria dos estudos em PB, contudo, tem enfatizado a investigação de outras categorias da estrutura informacional que não o status referencial (foco, tópico, contraste). Trabalhos recentes (Arantes 2010; Delfino et al. 2012; Antão et al. 2013) mostram que a prosódia é sensível à codificação do status referencial. Delfino et al. (2012) analisou a marcação prosódica em três níveis (novo, dado e acessível). Os resultados mostraram que referentes novos são distintos acusticamente de referentes 26 4º Colóquio Brasileiro de Prosódia da Fala dados e acessíveis, mas não há diferença entre esses dois últimos. Os autores concluíram que a falta de controle semântico dos itens acessíveis pode ter influenciado nos resultados. Antão et al. (2013) analisou a relação entre marcação acústica do status referencial e a posição do referente na sentença. Resumidamente, falantes tendem a marcar melhor o status referencial na posição inicial de sentença. Esse estudo, contudo, considerou apenas os status novo e dado. O objetivo este trabalho, portanto, é aprofundar-se em algumas questões relacionadas à manifestação prosódica do status referencial considerando a posição relativa do referente na sentença e a relação semântica, mais especificamente do status acessível. Para este experimento, foram criados dois corpora com 72 sentenças, distribuídas em três condições: dado, novo e acessível. O contexto das sentenças determinava o status referencial da palavraalvo. No primeiro corpus, as palavras-alvo estão em posição final de palavra, e no segundo corpus as palavras-alvo estão em posição inicial não absoluta. As sentenças abaixo ilustram a construção do status referencial pelo contexto (palavras-alvo entre asteriscos): Primeira etapa: Novo: O homem foi à loja para comprar *uma bateria*. Dado: O rapaz comprou uma bateria nova para o seu notebook. Quando ele sentiu um cheiro de queimado, ele foi à loja devolver *a bateria*. Acessível: Ao sair de casa, o rapaz não conseguiu ligar o carro. O frio havia congelado a *bateria*. Segunda etapa: Novo: De acordo com o manual, *uma bateria* é o suficiente para ligar o brinquedo novo. Dado: O rapaz comprou uma bateria para o aparelho. Depois de alguns minutos, *a bateria* apresentou um cheiro de queimado. Acessível: Ao sair de casa, o rapaz não conseguiu ligar o carro. Durante a madrugada, *a bateria* havia congelado. Todas as palavras-alvo possuem quatro sílabas e são paroxítonas. Arantes (2010) mostrou que à medida em que o número de sílabas da palavra aumenta, os parâmetros acústicos se tornam mais evidentes, como se a curva melódica tivesse mais material acústico para se projetar. A relação semântica entre o antecedente e a palavra-alvo na condição acessível foi controlada. Baumann (2006) observou no alemão que a marcação prosódica de referentes acessíveis é mais estável quando a relação entre as palavras é 'parte-pelo-todo'. 27 Caderno de Resumos O traço 'animacidade' também foi controlado em todos os itens. O experimento foi realizado em duas etapas, utilizando-se um corpus diferente por vez. Em cada etapa, os participantes tiveram como tarefa a leitura da lista de sentenças, que foram apresentadas uma a uma em uma apresentação de slides. Os participantes controlavam a velocidade de transição entre os slides. Eles foram instruídos a realizar uma leitura silenciosa antes da gravação de cada sentença. Durante a análise acústica, foram considerados os seguintes parâmetros (a) duração da palavra-alvo, (b) média da curva de F0, (c) desvio-padrão, (d) gama e (e) contorno de F0 normalizado pelo tempo. Os dados dos participantes foram analisados separadamente. Para a análise estatística, foram feitas Análises de Variância (ANOVAs) para determinar se as diferenças nos valores médios dos parâmetros (a)-(d) eram estatisticamente diferentes. A análise de (e) permitiu uma observação visual do comportamento da curva de F0 como um todo. Os resultados mostram que o status referencial afeta de forma significativa a duração e o nível de F0 nas palavras-alvo na maioria dos participantes. Comparando-se os dados das duas etapas, podemos observar que em PB a marcação acústica dos referentes é afetada pela sua relativa posição na sentença. Os resultados da primeira etapa mostraram que não houve qualquer diferença entre as três condições na posição final da sentença. Os resultados da segunda etapa, contudo, mostram que os falantes produziram uma diferença significativa na duração e no nível de F0 entre referentes novos e referentes dados e acessíveis. Nas duas etapas, não foram observadas nenhuma diferença nas médias de desvio-padrão e gama dos referentes. A análise do contorno entonacional normalizado pelo tempo mostra que, em posição inicial, referentes novos podem ser caracterizados por dois picos no contorno, um alinhado às sílabas pretônicas e outro alinhado à sílaba tônica. Referentes dados e acessíveis mostram contornos muito similares e tendem a ter apenas um pico alinhado à sílaba tônica ou um contono relativamente achatado. De forma geral, os dados mostram que os falantes utilizam de pistas acústicas para marcar o status dos referentes no discurso aumentando o pitch e a duração dos referentes novos. Referentes dados e acessíveis não são distintos em si, pelo menos pelos parãmetros observados. Dado o nível de controle semântico para os itens acessíveis, podemos sugerir que, ao contrário do alemão pelo menos, os falantes de PB não marcam distintivamente referentes dados de acessíveis. 28 4º Colóquio Brasileiro de Prosódia da Fala Referências Antão, C., Cunha Lima, M. L. & Arantes, P. 2013. Interrelation between subjecthood, referential status and prosody. In Proceedings of 35th Annual Conference of the German Linguistic Society – DGfS. Potsdam, Germany. Arantes, P. 2010. Integrating production and perception of secundary prominences in a dynamical perspective of rhythm. PhD thesis. Campinas, Unicamp. Baumann, S. 2006. The Intonation of Givenness - Evidence from German. PhD thesis. Saarland University. Linguistische Arbeiten 508. Tübingen: Niemeyer. Chafe, W. L. 1976. Givenness, contrastiveness, definiteness, subjects, topics and point of view. In Charles, N. Li ed. Subject and topic. New York: Academic Press: 25-55. Chafe, W. L. 1994. Discourse, consciousness, and time. Chicago: The University of Chicago Press. Delfino, A., Cunha Lima, M. L. & Arantes, P. 2012. Prosodic marking of referential status in Brazilian Portuguese. In Proceedings of the Glow 35 - Production and perception of prosodically-encoded information structure workshop. Postdam, Germany. Gundel, J. K., Hedberg, N. & Zacharski, R. 1993. Cognitive status and the form of referring expressions in discourse. Language 69 (2): 274-307. Prince, E. 1981. Towards a taxonomy of given-new information. In Cole, P. Radical Pragmatics, New York, Academic Press: 223-256. 29 Caderno de Resumos 30 4º Colóquio Brasileiro de Prosódia da Fala 31 Caderno de Resumos 32 4º Colóquio Brasileiro de Prosódia da Fala 33 Caderno de Resumos Uso de técnicas acústicas para verificação de locator em simulação experimental 1 1 Aline de Paula Machado , Plínio Almeida Barbosa 1 Departamento de Linguística/IEL/Universidade Estadual de Campinas/Brasil [email protected], [email protected] Esta pesquisa propõe o uso de técnicas de análise acústica para reconhecer um indivíduo dentro de um grupo de dez falantes do português paulista e assinalar quais parâmetros acústicos são relevantes para o reconhecimento naquele grupo. A identificação de um indivíduo dentro do grupo se dará a partir das análises de trechos de suas falas, durante os quais se quantificarão as frequências dos dois primeiros formantes das vogais orais, a frequência fundamental, a duração de unidades do tamanho da sílaba e da vogal, a intensidade relativa (ênfase espectral), a frequência fundamental de base de cada sujeito, a taxa de movimento de formantes e o ÄC (desvio padrão de durações de intervalos consonânticos). Todos os trechos escolhidos são de entrevistados divididos em dois grupos, (i) entrevistas ao ar livre e (ii) gravações telefônicas (de celular para celular). A fala é um elo, uma cadeia cujas informações são trocadas e a cooperação é negociada (Pardo & Remez 2006). O locutor tem a expectativa que o ouvinte compreenda toda a (complexa) dimensão da mensagem emitida e, é justamente a percepção e o reconhecimento da fala pelos sujeitos, que são os pontos principais de muitos estudos relacionados à fonética acústica, psicoacústica, visando a entender o que do acústico contribui para a percepção da diferença entre indivíduos. O reconhecimento de locutor pode ser definido como uma sequência de operações pela qual uma amostra de fala é atribuída a uma pessoa com base em suas propriedades fonético-acústicas ou perceptuais. Para a identificação de um sujeito na situação forense habitual, no entanto, as questões visuais podem ser colocadas de lado. O foco da pesquisa é na voz do falante a ser reconhecido. 34 4º Colóquio Brasileiro de Prosódia da Fala Além de modificações impostas pelo canal externo, algumas características que tornam nossas vozes diferentes correspondem a diferenças na anatomia resultante de consequências de patologias relacionadas ao funcionamento do trato vocal, de atos articulatórios involuntários, de características sociais, de diferenças educacionais, do uso particular da língua (idioleto), entre outros. Até estados emocionais diferenciam as vozes (a raiva, por exemplo, gera tensão na laringe, que traz uma voz “soprosa”, irregular). Por isso, há uma dificuldade de associar padrões de fala do mesmo sujeito ao próprio sujeito. Esta pesquisa segue os padrões, etapa por etapa, de como uma análise forense deve ser feita. O primeiro passo, depois de extraídos todos os parâmetros acústicos das gravações (para cada vogal oral) é diminuir o número de “suspeitos” em categorias de características semelhantes ao “criminoso”. Incluimos falantes de outros dialetos do PB para que esse fator possa ser usado no afastamento ou aproximação dos falantes (“suspeitos”) do “criminoso”. A técnica utilizada para este trabalho é a auditiva acompanhada de análise acústica via programa de software especializado. Utilizando o software PRAAT1 para medir parâmetros acústicos, será feito um quadro com as características de cada sujeito, comparando com os dados de uma gravação feita em laboratório (com alta relação sinal-ruído, portanto) de um deles (sorteado sem que a pesquisadora saiba). Depois disto realizado, é analisado, estatisticamente, cada parâmetro acústico dos falantes (inclusive do sujeito gravado em laboratório, o “criminoso”) no programa R, calculando o p-valor (probabilidade de aceitação da hipótese nula), com o teste estatístico ANOVA, entre cada sujeito e o “criminoso”. Com isso, é decido quais dos participantes está mais próximo ao “criminoso”. Os parâmetros acústicos analisados serão: frequências dos dois primeiros formantes das vogais orais, a frequência fundamental, a duração de unidades do tamanho da sílaba e da vogal, a intensidade relativa (ênfase espectral), a frequência fundamental de base de cada sujeito, a taxa de movimento de formantes e o ? C (desvio padrão de durações de intervalos consonânticos) Em muitas situações forenses cientistas têm em suas mãos, como material de avaliação, escutas telefônicas, em sua grande maioria de péssima 1 http://www.fon.hum.uva.nl/praat/ 35 Caderno de Resumos qualidade e sendo a única fonte sonora para extrair parâmetros e apresentar algum resultado substancial para o júri. Como esta pesquisa usa de situações reais para se aproximar da Fonética Forense simulamos um episódio de “crime” com escuta telefônica. Para este tipo de trabalho, é bem comum a análise de propriedades acústicas como a de características de filtro de banda, porém pouco se estuda sobre o efeito deste para os parâmetros de fala. A complexidade da análise de gravações de escuta telefônica é algo que os pesquisadores já se deparam há algum tempo. Bellman et al, (1994) discutem uma revisão do próprio trabalho cujas gravações originais são da década de 1980, com o objetivo de tentar determinar as diferenças dialetais geradas (devido à degradação de sinal, que hoje se apresenta ainda mais significantemente com a presença da tecnologia GSM para celulares. Alguns efeitos de telefone foram evidenciados por Byrne & Foulkes (2004) e que presenciamos nesta pesquisa; uma degradação ao sinal de fala das gravações coletadas: efeitos do ambiente, efeitos do falante e efeitos técnicos. Enfrentamos todos esses problemas na pesquisa, tendo como conhecimento alguns dos obstáculos e desafios que este tipo de gravação pode causar. De acordo com dados analisados intra-falantes, com um sujeito da pesquisa, o parâmetro acústico que menos é afetado pelo celular é o segundo formante (F2). F2 Rate F0 Baseline Ênfase F2 Espectral 1,88E- 0.3138 1,85E- 1.58e2.2e-16 05 03 07 Tabela 1: Resultado do teste ANOVA entre gravações de celular e por gravador do sujeito 1. Esta pesquisa é feita com intuito de aprender procedimentos experimentais que possam ser automatizados (através de procedimentos nos softwares PRAAT e R) e servir à área de Fonética Forense. Levantamos questões como (i) quais parâmetros acústicos são eficazes para a verificação de locutor? (ii) Os mesmos são eficazes em uma situação forense? Por isso duas situações de degradação serão utilizadas, entrevista ao ar 36 4º Colóquio Brasileiro de Prosódia da Fala livre e gravação via celular. (iii) Quão robustos são os parâmetros analisados entre as situações? (iv) As técnicas de análise estatística escolhidas são eficazes para a verificação do sujeito? Com base nisso, propomo-nos, neste trabalho, avaliar os seguintes parâmetros acústicos das vogais orais para avaliação de diferenças/ semelhanças entre indivíduos: frequências dos dois primeiros formantes das vogais orais, a frequência fundamental, a duração de unidades do tamanho da sílaba e da vogal, a intensidade relativa (ênfase espectral), a frequência fundamental de base de cada sujeito, a taxa de movimento de formantes e o ? C (desvio padrão de durações de intervalos consonânticos). Também lidamos com outras formas de gravações para análise, simulando uma situação de escuta telefônica, procurando aproximar a pesquisa à realidade forense. Referências Bellmann, G., Herrgen, J. & Schmidt, J. E. 1994–99. Mittelrheinischer Sprachatlas (MRhSA), Band 13: Vokalismus. Tübingen. Byrne, C. & Foulke, P. 2004. The 'Mobile Phone Effect' on Vowel Formants. Pardo, J. S., & Remez, R. E. 2006. “The perception of speech”. In M. Traxler and M. A. Gernsbacher (Eds.), Handbook of Psycholinguistics, 2nd Edition (pp. 201-248). New York: Academic Press. pdf D. B. Pisoni and R. E. Remez (Eds.), The Handbook of Speech Perception. Oxford: Blackwell. 37 Caderno de Resumos O apagamento do rótico no português brasileiro e no português europeu: o lido e o dito 1 2 Aline de Jesus Farias Oliveira e Ingrid da Costa Oliveira 3 4 Orientadores: Dinah Callou e Carolina Serra 1 Universidade Federal do Rio de Janeiro/FAPERJ, Brasil 2 Universidade Federal do Rio de Janeiro/PIBIC, Brasil 3 Universidade Federal do Rio de Janeiro/CNPq, Brasil 4 Universidade Federal do Rio de Janeiro, Brasil [email protected], [email protected], [email protected], [email protected] Os róticos são conhecidos por sua considerável variabilidade entre as línguas do mundo. Neste trabalho, será focalizado o apagamento variável do R, em posição de coda silábica final, através da comparação entre fala espontânea e leitura,com base em amostrasde fala espontânea -- entrevistas informais -- e deleitura de trechos extraídos dessas entrevistas, realizadas com indivíduos cultos, nascidos no Rio de Janeiro e em Lisboa. Os registros magnetofônicos foram feitos em três etapas. A primeira etapa corresponde à gravação da fala espontânea produzida por dez informantes do sexo feminino da primeira faixa etária (25 a 35 anos), sendo cinco informantes oriundos do Rio de Janeiro/BR e cinco de Lisboa/PT. Em seguida, na segunda etapa, os próprios falantes realizaram a pontuação da transcrição de seus trechos de fala com o auxílio do áudio de sua entrevista e, por último, numa terceira etapa, foi feita agravação de leitura da transcrição grafemática da fala espontânea pelos seus respectivos locutores. As entrevistas com os informantes cariocas foram realizadas neste ano de 2013 e as realizadas com os informantes lisboetas, entre 2007 e 2008. O objetivo deste trabalho é 1) estabelecer um confronto das elocuções, nesses dois estilos de fala -- espontânea e leitura --, a partir da hipótese de que esses estilos de fala envolvem processos específicos distintos, e 2) verificar se os resultados obtidos em trabalhos anteriores, para a fala espontânea, se confirmam na leitura. 38 4º Colóquio Brasileiro de Prosódia da Fala Na análise do processo de apagamento do R, é necessário considerar os contextos em que ocorre o segmento -- coda externa ou interna à palavra -- e seu tipo de realização -- [+/-vibrante] e [+/- anterior]: o apagamento do segmento é mais frequente em posição de coda final que em posição de coda medial e o fenômeno ocorre de forma menos expressiva nos dialetos em que a consoante mantém ainda o seu caráter de vibrante ápico-alveolar (Callou, Leite & Moraes 1996, Monaretto 2010, Leite 2011). Estudos recentes (Callou & Serra 2012) demonstraram que o apagamento do R em posição de coda final apresenta, na sua implementação, além de condicionamentos morfo-fonológicos e sociais, também condicionamentos prosódicos. No Português Brasileiro,observou-se que, na fala espontânea, o processo de apagamento do segmento em coda final é gradiente e os dialetos que mantêm a realização anterior da vibrante, em outras posições, apresentam uma frequência mais baixa de cancelamento, como mencionado, enquanto os dialetos cuja norma de pronúncia é a fricativa velar estão numa posição intermediária. Dialetos que realizam o R como uma fricativa laríngea (aspiração) estão no outro extremo, com índices significativos de apagamento do segmento em posição de coda final. Investigase ainda a relação entre presença/ausência de R e fronteira prosódica (Selkirk 1984, Nespor & Vogel 1986/2007): quanto mais alta a fronteira maior a tendência à preservação, o que poderia explicar a diferença de índices diferenciados de apagamento em fronteira interna e externa à própria palavra (Callou & Serra 2012). Em relação ao PB, as análises têm revelado que, em termos gerais, (i) a fronteira de sintagma entonacional (IP) desfavorece a queda do segmento; (ii) há um processo gradual de apagamento; e (iii) da década de 1970 para a de 1990, mesmo a fronteira mais alta de IP não mais inibe o apagamento do segmento, pelo menos, na faixa mais jovem, de 25 a 35 anos. A análise alia, portanto, o aparato teórico-metodológico da sociolinguística quantitativa laboviana (Labov 1994) ao da teoria da hierarquia prosódica (Selkirk 1984, Nespor & Vogel 1986/2007). O fato de serem observados altos índices de apagamento do segmento em final de vocábulo em contraste com os baixos valores de apagamento no interior de vocábulo tem levado à interpretação de que o fenômeno de apagamento do R estaria relacionado com o tipo de fronteira prosódica em que este segmento se encontra. Em variedades como as do Nordeste do Brasil, entretanto, em que o apagamento do R em coda final já é categórico, pelo menos entre os indivíduos mais jovens (Serra & Callou 2012), o tipo de fronteira prosódica já não é mais um fator atuante, em final de palavra, e o cancelamento já atinge, inclusive, a coda silábica interna à palavra. Levando em conta que o apagamento se caracteriza como um processo 39 Caderno de Resumos gradiente, sensível ao tipo de realização do rótico -- por sua vez, diretamente relacionado à origem geográfica dos falantes --, à classe morfológica do item lexical e ao tipo de fronteira prosódica em que o segmento se encontra, é possível postular três regras, de caráter regional, que mapeariam o cancelamento do R no Português do Brasil: 1) regra categórica de apagamento sensível à classe morfológica, como em Porto Alegre 2) regra variável de apagamento, como no Rio de Janeiro e 3) regra categórica de apagamento, que atua, independentemente de classe morfológica, em variedades em que a realização frequente é uma fricativa posterior, laríngea – aspiração, como em Salvador e João Pessoa. A hipótese é a de que, na leitura, em que o planejamento e a produção da fala não são realizados simultaneamente, a preservação do segmento seja mais frequente. Os resultados relativos ao PB são confrontados com novos dados do português europeu (PE), variedade em que a articulação posterior do Ré atestada há muito tempo, embora as etapas relativas à aspiração e cancelamento do rótico sejam até certo ponto inibidas e o cancelamento esteja restrito ainda à fronteira de palavra. A frequência geral de apagamento, entre jovens adultos, no PB (90%) e no PE (30%), mostra ainda que em um processo quase completo, como o do português brasileiro, a variável gênero é neutra, enquanto em um processo novo e vigoroso, como o do português europeu, gênero é uma variável significativa, tal como atestado em Labov (1994: 65), a propósito da estratificação de mudanças sonoras. Neste trabalho, estendemos a análise a um novo conjunto de dados, cotejando fala espontânea e leitura, nas duas variedades do português supramencionadas, a fim de verificar em dados recentes de diferentes estilos de fala quais são os condicionamentos atuantes nesse processo de diferenciação do rótico em posição de coda silábica final. Referências Monaretto, V. 2010. “Descrição da vibrante no português do sul do Brasil”. In: Bisol, L.; Collischonn, G. (Orgs). Português do Sul do Brasil. Porto Alegre: EDIPUCRS: 119-127. Leite, C. M. B. 2011. “Estudo do /R/ em coda silábica medial e final no falar campineiro”. In: Anais do VII Congresso Internacional da Abralin ISSN 21797145. Curitiba. Callou, D., Leite, Y. & MORAES, J. 1996. “Variação e diferenciação dialetal: a pronúncia do /r/ no português do Brasil.” In Gramática do Português Falado VI (I): 465-493. Campinas: UNICAMP. 40 4º Colóquio Brasileiro de Prosódia da Fala Callou, D. & Serra, C. 2012. “Variação do rótico e estrutura prosódica”. Revista do GELNE, 14 (Especial): 41-58. Nespor, M. & Vogel, I. 2007. Prosodic phonology. Berlin: Mouton De Gruyter. Originally published in 1986 (Dordrecht: Foris). Labov, W. 1994. Principles of linguistic change. Internal factors. Cambridge, Blackwell. Serra, C. & Callou, D. 2012. “A interrelação de fenômenos segmentais e prosódicos: confrontando três comunidades.” In XXVIII Encontro Nacional da APL, Universidade do Algarve. Selkirk, E. 1984. Phonology and syntax: the relation between sound and structure. Cambridge: M.I.T. Press 41 Caderno de Resumos Pelos cantos do Brasil: uma análise prosódica da asserção neutra em falares das capitais e do interior do Brasil Aline Ponciano dos Santos Silvestre, Gizelly Fernandes Maia dos Reis, Priscila Francisca dos Santos Universidade Federal do Rio de Janeiro, Brasil [email protected], [email protected] [email protected] 1. Introdução Sob a ótica de diversas teorias, o padrão assertivo neutro é comumente caracterizado por uma altura melódica média na porção inicial e medial do enunciado e por uma queda da freqüência fundamental na última sílaba tônica do sintagma entoacional. Verifica-se também uma queda moderada e constante da frequência fundamental (F0) ao longo das asserções, chamada linha de declinação, que por vezes é interrompida na última sílaba pré-tônica (a qual recebe entoação ascendente), de forma a conferir maior destaque à posterior queda melódica localizada na tônica final (cf. Moraes 1998; Cunha, 2000). Considerando o anteriormente postulado por outros autores como padrão para o Português do Brasil, o presente trabalho objetiva descrever a variação regional da entoação em enunciados assertivos neutros, com base nos falares de municípios brasileiros que são contemplados pelo Projeto Atlas Linguístico do Brasil. Serão apresentados os resultados da dissertação de Silvestre (2012), que descreve o contorno melódico da asserção neutra em 25 capitais brasileiras; os resultados da investigação feita por Dos Reis (2010, 2011), que descreve o contorno melódico das asserções nos municípios de Brejo, Bacabal, Imperatriz e Alto Parnaíba, localizados no interior do estado do Maranhão; e os resultados obtidos por Santos (2012) sobre a asserção neutra em Soure, município localizado no interior do estado do Pará. Assim, a descrição dos contornos melódicos de enunciados assertivos produzidos por informantes de municípios do interior do Brasil vem somando-se à descrição dos contornos já descritos para 25 capitais. 42 4º Colóquio Brasileiro de Prosódia da Fala 2. Corpus e metodologia A fim de conhecer as realizações fonéticas das asserções neutras nas variedades do PB, fez-se, nas capitais, uma descrição melódica de 500 dados selecionados do corpus do projeto ALiB que esboçam esse tipo de modalidade. Para os municípios do interior maranhense, foram descritos 50 dados extraídos do mesmo corpus e, para o município do interior paraense, descreveram-se 80 dados. Foram ouvidos quatro informantes por localidade, distribuídos equitativamente por duas faixas etárias - 18 a 30 anos e 50 a 65 anos. Para análise, os dados devem se enquadrar nas seguintes condições: a) constituir um único sintagma entoacional (I), de acordo com a hierarquia prosódica apresentada em Nespor e Vogel (1994); b) possuir pronúncia neutra, isto é, ausente de manifestações emocionais ou atitudinais; e c) possuir uma qualidade sonora adequada para a segmentação silábica e medição dos valores da Frequência Fundamental. Além disso, a fim de homogeneizar o padrão acentual e facilitar a observação das marcas regionais apresentadas por meio da variação da F0, selecionamos os dados que continham o acento na penúltima sílaba do enunciado (padrão paroxítono). Este padrão é priorizado por possibilitar a observação do comportamento da frequência fundamental nas sílabas átonas que estão em posição adjacentes à última tônica de I. A fim de iniciar o enriquecimento da análise a partir da observação de outros padrões acentuais, no município de Soure foram analisados 40 enunciados monossílabos, tônicos ou átonos. Deste modo, poderá ser também investigado em que medida o tamanho dos enunciados afeta a configuração do contorno entoacional. O programa computacional PRAAT foi utilizado para segmentar e medir os valores da F0 nas sílabas e a interpretação dos dados teve por suporte teóricometodológico o modelo autossegmental e métrico, na linha do que propõem Pierrumbert (1980) e Ladd (2008). 3. Resultados Os resultados indicam que o índice de regionalidade é manifestado na relação entre as alturas do acento pré-nuclear e do acento nuclear – há localidades que se diferenciam por possuir tons mais proeminentes no acento pré-nuclear - e entre os movimentos de F0 nas sílabas que compõem o acento nuclear – não há declive da F0 na tônica de todas as asserções. Nas capitais, foram três os padrões encontrados. 43 Caderno de Resumos O primeiro, observado nas capitais do norte e nordeste do país, é relativo à realização de um tom alto na primeira sílaba tônica de I (no acento pré-nuclear), tom este que se apresenta nas sílabas adjacentes e prossegue à sílaba pretônica do acento nuclear, ficando o movimento descendente restrito às sílabas tônica e postônica final: Figura1:Enunciado Você está me devendo quinhentos reais, produzido pelo informante da segunda faixa etária de Maceió Ao padrão observado nas capitais nortistas e nordestinas, atribui-se a mesma notação que Cunha (2005) propôs para a asserção neutra em Recife, com base no corpus do projeto NURC: H*___H+L*L%. O segundo padrão, observado majoritariamente nas capitais do centrooeste e sudeste do país, também apresenta tom alto na primeira sílaba tônica do enunciado, contudo este tom não se manifesta nas sílabas adjacentes e só é visto de novo na sílaba pré-tônica do acento nuclear, dando vez ao movimento descente final: Figura2: Enunciado o sol tá nascendo, produzido pela informante jovem do Rio de Janeiro 44 4º Colóquio Brasileiro de Prosódia da Fala Para o padrão majoritariamente observado nas capitais do centro-oeste e do sudeste do Brasil, atribui-se notação semelhante a de Cunha (2005) e Moraes (2008) para a asserção neutra, ambos com base na fala carioca: L+H*____ H+L*L%. O terceiro padrão, por fim, foi encontrado nas capitais da região Sul do país e é particularmente caracterizado por uma subida melódica da F0 na sílaba tônica do acento nuclear, dando à asserção um contorno final aparentemente circunflexo: Figura 3:Enunciado Manda pelo correio, produzida pelo informante jovem de Porto Alegre Ao padrão encontrado nas capitais sulistas, atribui-se notação também semelhante a de Cunha (2005), com base na fala gaúcha : L+H*_____L+H*L%. Em comparação às demais regiões, o norte e o nordeste apresentaram um maior número de enunciados cujo pico do acento pré-nuclear encontra-se em um nível mais alto que o pico do acento nuclear; e o sul apresentou um maior número de dados em que o movimento descendente não predominou na última sílaba tônica do enunciado. Quanto aos municípios do interior do Maranhão, encontramos um nível tonal alto no acento pré-nuclear nos quatro municípios, o que corrobora o observado na capital maranhense. No entanto, também foi possível encontrar um nível tonal baixo na configuração do acento pré-nuclear em Imperatriz e Alto Parnaíba, o que nos mostra que a ocorrência de um padrão não exclui a possibilidade da ocorrência de outro. Para o município do interior do Pará, os resultados mostram que os enunciados cujo acento se encontra na penúltima sílaba apresentaram mais frequentemente um contorno marcado por uma descida, a qual é mais 45 Caderno de Resumos acentuada entre a sílaba pretônica e a sílaba tônica. Esse comportamento pode ser representado pelo padrão H L*L%, como descrito por outros autores para a asserção neutra no Português do Brasil. Quanto aos enunciados que possuíam um monossílabo no acento nuclear, embora haja pouco material segmental, os resultados também se alinharam ao comportamento caracteristicamente descrito para a asserção neutra: um início com uma altura melódica média e um movimento decrescente no final, representado pela notação: HL%. 4. Conclusão O movimento descendente final, já anteriormente descrito como padrão para o Português do Brasil, é predominante. Na região Sul do país, contudo, o acento nuclear da asserção neutra foi predominantemente caracterizado por um movimento de aparência circunflexa: a F0 ascende na sílaba tônica final e o movimento de queda fica restrito à última sílaba pós-tônica do sintagma entoacional. Nossos resultados encontrados para as capitais do país alinham-se a resultados de outras descrições, feitas por diversos autores, como Cunha (2000), Lira (2009), Reis, Antunes e Pinha (2011), Nunes (2011). Além disso, o observado até o momento em capitais do interior do país corrobora o encontrado nas capitais. Referências Cunha, C. S. 2000. Entoação regional no português do Brasil. Tese de doutoramento em língua portuguesa. Rio de Janeiro, Faculdade de Letras, UFRJ. _______. 2005. “Corpus ALiB: uma base de dados para pesquisas atuais e futuras”. In CUNHA, C. S. (org.). Estudos geo-sociolinguísticos. Rio de Janeiro: Programa de Pós Graduação em Letras Vernáculas, UFRJ: 67- 81. Cruz, R. 2007. “Atlas prosódico multimédia do Português do Norte do Brasil: aspectos preliminares” In Moutinho, L. C. & Coimbra R. L. (Org.). I Jornadas Científicas AMPER-POR: 33-39. Actas, Aveiro. Ladd, R. 2008. Intonational phonology. Cambrige: Cambridge University Press. Lira, Z. 2009. A entoação modal em cinco falares do nordeste brasileiro. Tese de doutoramento em linguística. João Pessoa, Centro de Ciências Humanas, Letras e Artes, UFP. 46 4º Colóquio Brasileiro de Prosódia da Fala Moraes, J. A. 1998. “Intonation in Brazilian Portuguese”. In Hirst, D.; Di Cristo, A. (Eds.) Intonation systems: a survey of twenty languages: 179-194. Cambridge: Cambridge University Press. Moraes, J. A. & Colamarco, M. 2008. Accomodation of intonational patterns in126 Brazilian Portuguese short utterances: compression or truncation? In Bisol, L. & Brescancini, C. (org.). Contemporary phonology in Brazil: 2-21. Cambridge: Cambridge Scholars Publishing. Nespor, M.; Vogel, I. 1994. La prosodia. Madrid: Visor Distribuciones. Pierrehumbert, J. 1980. The phonology and phonetics of English intonation. PhD Thesis. Massachussets: M.I.T. Silvestre, A.P.S. 2012. A entoação regional de enunciados assertivos nos falares das capitais brasileiras. Dissertação de mestrado em Língua Portuguesa. Rio de Janeiro, Faculdade de Letras, UFRJ. 47 Caderno de Resumos Restrições prosódicas para os marcadores discursivos Amanda Aleixo¹; Diego Malachias;¹ Priscila Osório¹; Tommaso Raso¹ ¹Laboratório de Estudos Empíricos da Linguagem, Faculdade de Letras; Universidade Federal de Minas Gerais; Brasil [email protected], [email protected], [email protected], [email protected] Este trabalho tem como objetivos: 1. mostrar como identificar os Marcadores Discursivos (MD) na fala espontânea através de fatores prosódicos; 2. mostrar como identificar a função desempenhada pelos MD através de parâmetros prosódicos. Os MDs tradicionalmente são definidos como itens lexicais: 1. não composicionais semântica e sintaticamente com o resto da locução; 2. que perdem seu valor lexical para adquirir um outro valor, definido pragmaticamente; 3. com distribuição livre. Mas nenhuma proposta identifica quando um item lexical funciona como MD e porque. Do mesmo jeito, não existe acordo na literatura sobre quantas e quais seriam as funções dos MDs, e como identificar essas funções (Fischer 2006; Schourup 1999; Traugott 2007). Este trabalho se baseia em dados extraídos de dois corpora comparáveis de fala espontânea: o C-ORAL-BRASIL (Raso-Mello 2012) e o C-ORALROM (Cresti-Moneglia 2005); foram analisados os dois minicorpora etiquetados informacionalmente retirados dos corpora italiano e brasileiro (Cresti-Raso 2012) através da base de dados IPIC (Panunzi-Gregori 2012; Gregori-Panunzi 2012). Os corpora foram segmentados em enunciados (definidos como as unidades mínimas interpretáveis pragmaticamente em autonomia) e unidades tonais. A validação da segmentação mostrou um acordo Kappa de 0.86 (Mello et al. 2012). Com base na Teoria da Língua em Ato (Cresti 2000; Moneglia 2011; Raso 2012), a cada unidade tonal corresponde uma unidade informacional. 48 4º Colóquio Brasileiro de Prosódia da Fala Cada enunciado possui obrigatoriamente uma unidade nuclear, o comentário, que veicula a força ilocucionária (e, portanto a interpretabilidade do enunciado), e outras unidades opcionais. Essas outras unidades podem ser de natureza textual (tópico, apêndices, parentético e introdutor locutivo) ou de natureza dialógica. As unidades dialógicas correspondem exatamente aos que tradicionalmente são chamados de MDs: não constroem o texto do enunciado propriamente dito (não são composicionais), mas servem para regular a interação. A não composicionalidade é marcada por uma quebra prosódica antes e depois de cada unidade dialógica, que portanto fica dentro de uma unidade tonal dedicada (que não hospeda nenhum outro item). A quebra prosódica, interrompendo a linearidade, impede a relação sintática. Assim, um item lexical pode ter três tipos de realizações: a) constituir a ilocução; nesse caso é interpretável pragmaticamente em isolamento; b) ser parte de unidade textual; nesse caso possui composicionalidade com outros itens da unidade; 3) constituir uma unidade dialógica; nesse caso não possui composicionalidade com o resto do enunciado e não é interpretável em isolamento. Um exemplo que poderia ser apreciado facilmente na oitiva é o item não nas três seguintes realizações (precedidas pela sigla do texto, número do enunciado e sigla do informante): 1) bpubdl01-14: *PAU: não // Nesse caso, não possui força ilocucionária (recusa) e é interpretável em isolamento. 2) bpubdl01-119: *PAU: ah / não acaba não / acaba // Nesse caso, não é composicional com o verbo. 3) bpubdl01-197: *PAU: ah / não / ea disse que é pa ficar / por algum tempo // Nesse caso, não é isolado dentro de uma unidade tonal por duas quebras que interrompem a linearização e, portanto a composicionalidade; não é possível interpretar o não em isolamento, já que a unidade não é ilocucionária. A interpretabilidade em isolamento é veiculada pela prosódia, cujos parâmetros geram a percepção da força ilocucionária. A quebra prosódica interrompe a composicionalidade. Por isso é a prosódia que permite a 49 Caderno de Resumos identificação dos MDs. Mas a prosódia é responsável também por veicular as diferentes funções dos MDs. Nos minicorpora etiquetados, de aproximadamente 32.500 palavras e 5000 enunciados cada um, foram identificados 1089 MDs no PB e 1419 MD no italiano, correspondentes, respectivamente a 3,47% e 4,14% das unidades informacionais. Foi possível diferenciar os MDs em 6 grupos (Raso, no prelo) que possuem características funcionais diferentes veiculadas através de características prosódicas. Cada grupo apresenta também um comportamento distribucional diferente. 1. Incipitários (Figura 1). Funções: tomar o turno ou começar um enunciado marcando o contraste afetivo (não lógico) com respeito ao enunciado anterior. Essas unidades se posicionam obrigatoriamente em posição inicial de enunciado. Características prosódicas: perfil de F0 ascendente-descendente com valores de F0 muito altos; duração curta; intensidade alta; taxa de variação de F0 muito alta. Frequentes em italiano, mas raros em PB. Figura 1 2. Conectores Textuais (Figura 2). Função: começar um enunciado marcando continuidade com o anterior. Essas unidades se posicionam obrigatoriamente em início de enunciado. Características prosódicas: perfil de F0 ascendente com valores de F0 médio-altos; duração longa; intensidade alta; taxa de variação de F0 baixa. Frequente em ambas as línguas. A unidade é preenchida por preposições, conjunções e advérbios. 50 4º Colóquio Brasileiro de Prosódia da Fala Figura 2 3. Conativo (Figura 3). Função: pressionar o interlocutor a fazer ou desistir de algo. A posição é livre, mas preferencialmente inicial ou final. Características prosódicas: perfil descendente; duração média ou curta; intensidade alta. Raro em ambas as línguas. O exemplo mostra 2 conativos em sucessão. Figura 3 51 Caderno de Resumos 4. Alocutivo. Função: identificar o interlocutor mas principalmente marcar a coesão social através de nomes próprios, adjetivos e hepítetos. Distribucionalmente é livre, mas cada língua prefere posições diferentes. Características prosódicas: perfil descendente; duração curta; intensidade baixa. A frequência varia nas línguas: em PB é muito frequente, em italiano é relativamente pouco frequente, em espanhol europeu é frequente, em PE a frequência aparentemente é muito baixa (Raso-Leite, 2010). O alocutivo não deve ser confundido com a ilocução de chamamento, que possui características prosódicas muito diferentes. As figuras 4 e 5 mostram respectivamente uma ilocução e um alocutivo realizados com o mesmo conteúdo locutivo (Rena) pelo mesmo falante: Figura 4 Figura 5 52 4º Colóquio Brasileiro de Prosódia da Fala 5. Fático. Função: sinalizar a abertura do canal. Distribucionalmente é absolutamente livre. È a unidade mais frequente em todas as línguas analisadas. Características prosódicas: perfil descendente ou nivelado; duração curta ou muito curta; intensidade baixa. A figura 6 mostra um exemplo na segunda unidade segmentada (né). Nesse exemplo se observa também o típico perfil do incipitário na primeira unidade segmentada: Figura 6 6. Expressivo (Figura 7). Funções: tomar o turno e apoiar emocionalmente a ilocução; a distribuição é livre mas cerca de 70% das unidades está em posição inicial em ambas as línguas. Características prosódicas: perfil modulado ou ascendente com taxa de variação de F0 baixa; duração média; intensidade média. A unidade é muito frequente em PB e pouco Figura 7 53 Caderno de Resumos Essas características mostram que: 1. a função do MD é veiculada através de características prosódicas próprias; 2. nem sempre o MD possui distribuição livre; 3. nem sempre o léxico perde seu valor semântico. Isso não acontece nos alocutivos e acontece parcialmente nos conectores textuais. A validação estatística está em curso. Esse processo é complexo porque deve diferenciar 6 objetos com base na combinação de pelo menos 3 parâmetros acústicos que são medidos e avaliados com relação aos parâmetros da ilocução presente no enunciado. Na fala espontânea os enunciados são realizados com uma variação prosódica muito grande, e uma determinada unidade só pode ser avaliada pelo papel relacional que desempenha no contexto do seu enunciado. A ilocução é o único termo de comparação possível porque é o único elemento presente em todos os enunciados. Contudo, também a ilocução varia prosodicamente. Além disso, vários enunciados devem ser descartados porque a presença de sobreposição ou a qualidade acústica não permitem uma mensuração confiável. Referências Cresti, E. 2000. Corpus di Italiano parlato. Firenze: Accademia della Crusca, 2 vol. Cresti, E.; Moneglia, M. (Ed.). 2005. C-ORAL-ROM: integrated reference corpora for spoken Romance languages. Amsterdam: John Benjamins. Cresti, E.; Raso, T. 2012. Information Tagging of the Italian Corpus and the Brazilian Minicorpus. Disponível em: http://lablita.dit.unifi.it/ipic/. Fischer, K. (Ed.). 2006. Approaches to discourse particles: studies in pragmatics 1. Bingley: Emerald Group Publishing. Gregori, L.; Panunzi, A. 2012. “DBIPIC: An XML database for information patterning analysis”. In: H. Mello; M. Pettorino; T. Raso. Proceedings of the GSCP 2012. Speech and Corpora. Mello, H.; Raso, T.; Mittmann, M.; Vale, H..; Cõrtes, P. O. 2012. “Transcrição e segmentação prosódica do corpus C-ORAL-BRASIL: critérios de implementação e validação”. In: T. Raso; H. Mello (Eds.). C-ORAL-BRASIL I: Corpus de referência do português brasileiro falado informal. Belo Horizonte: UFMG. Moneglia, M. 2011. “Spoken corpora and pragmatics”. Revista Brasileira de Linguística Aplicada. Panunzi, A.; Gregori, L. 2012. “An XML model for multi-layer representation of spoken Language”. In H. Mello; A. Panunzi; T. Raso. (Eds.). Illocution, modality, 54 4º Colóquio Brasileiro de Prosódia da Fala attitude,information patterning and speech annotation. Firenze: Firenze University Press. Raso, T. 2012. “O corpus C-ORAL-BRASIL”. In: T. Raso; H. Mello (Eds.). C-ORALBRASIL I: Corpus de referência do português brasileiro falado informal. Belo Horizonte: UFMG. Raso, T. Prosodic Constraints for Discourse Markers. In: Raso, T.; Mello, H. Speech Corpora and Linguistic Studies. Amsterdam-New York: John Benjamins, Forthcoming. Raso, T.; Leite, F. 2010. Estudo contrastivo do uso de alocutivos em italiano, português e espanhol europeus e português brasileiro. Domínios de Lingu@gem. Raso, T.; Mello, H. (Eds.). 2012. C-ORAL-BRASIL I. Corpus de referência do português brasileiro falado informal. Belo Horizonte: UFMG. Schourup, L. 1999. “Discourse markers”. Lingua. Traugott, E. C. 2007. “Discourse markers, modal particles, and contrastive analysis, synchronic and diachronic”. Catalan Journal of Linguistics. 55 Caderno de Resumos 56 4º Colóquio Brasileiro de Prosódia da Fala 57 Caderno de Resumos 58 4º Colóquio Brasileiro de Prosódia da Fala 59 Caderno de Resumos Características prosódicas de sete dialetos brasileiros Ana Carolina Constantini1, Plinio Almeida Barbosa1 1 Departamento de Linguística/IEL/Universidade Estadual de Campinas/Brasil [email protected], [email protected] O objetivo deste trabalho é descrever e comparar características prosódicas de sujeitos de diferentes localidades brasileiras. A prosódia contribui para caracterizar diferentes dialetos e é pouco estudada quando se busca encontrar diferenças inter-dialetais. A divisão dialetal brasileira mais conhecida é de Nascentes (1953), um trabalho importante para a área, que usa uma linha horizontal para dividir o Brasil, separando Norte e Sul em dois grupos: Meridional e Setentrional. Nascentes baseou-se na abertura das vogais pré-tônicas e na “cadência” do falar das regiões brasileiras para essa divisão. Em 1986, Cardoso estudou mapas dialetológicos do estado da Bahia e confirmou que a divisão proposta por Nascentes estava adequada para aquela região. Visto que a divisão das regiões dialetais que temos como base até os dias de hoje é impressionística, é importante analisar aspectos prosódicos que possam caracterizar diferentes dialetos brasileiros. Foram analisados oito parâmetros acústicos em amostras de fala de 35 sujeitos de sete localidades brasileiras: Região Norte (2 sujeitos, estado do Amazonas), Região Nordeste (Ceará, Rio Grande do Norte, Paraíba, Pernambuco e Sergipe, totalizando 6 sujeitos), São Paulo (6 sujeitos), Minas Gerais (6 sujeitos), Paraná (4 sujeitos), Rio de Janeiro (6 sujeitos) e Distrito Federal (5 sujeitos). As amostras de fala são de um banco de dados da Polícia Federal de Brasília. As gravações são de oficiais da PF, sexo masculino, idade média de 35,4 anos. Para inclusão na pesquisa os sujeitos precisavam ter nascido e morado até a idade adulta na mesma região. O grau de escolaridade variou de ensino superior completo até pós-graduação completa. Os sujeitos da Região Nordeste (NE) não foram rotulados pelos seus estados de origem (como as outras regiões), pois a hipótese é que os diferentes estados da Região Nordeste (exceto a Bahia) possuem as 60 4º Colóquio Brasileiro de Prosódia da Fala mesmas características prosódicas, fato confirmado pelos desvios-padrão obtidos dos parâmetros analisados: a Região Nordeste apresentou menor ou igual variabilidade intra-dialeto que outras regiões dialetais estudadas. As gravações foram segmentadas em unidades do tamanho da sílaba guiadas pelo início da vogal (unidade VV) com auxílio do script BeatExtractor (Barbosa 2006). Após etiquetagem dessas unidades, o script ProsodicDescriptorExtractor (Barbosa 2011) foi utilizado para extrair oito medidas acústicas: taxa de elocução (unidades VV/s), média de z-score suavizado de duração de unidade VV, desvio-padrão de z-score suavizado de duração de unidade VV, assimetria de z-score suavizado de duração de unidade VV, taxa de saliência duracional (picos de z-score/s), mediana da frequência fundamental (Hz), ênfase espectral (dB) e taxa de unidades VV não proeminentes/s. Utilizamos o teste One-Way Anova (nível de significância 0,05) para analisar diferenças entre as regiões. Ao serem atestadas diferenças entre os grupos, utilizamos o Teste Tukey (p<0,05), para checar entre quais grupos estavam as diferenças apontadas. A partir de testes de ANOVA com fator DIALETO e testes post-hoc TukeyHSD, os parâmetros ênfase espectral e mediana da frequência fundamental foram os que melhor diferenciaram as regiões. Para ênfase espectral, os falantes do DF e Região Norte (N) não se diferenciaram entre si e apresentaram valores médios mais elevados que os outros dialetos. O esquema abaixo mostra como as regiões se diferenciaram quanto à ênfase espectral (p<0,05): Pelos resultados, podemos concluir, inicialmente, que DF e N, utilizam maior esforço vocal (correlato da ênfase espectral) que falantes de outras regiões brasileiras, pois esse parâmetro é capaz de diferenciar os falantes dessas regiões de outras, com valores médios maiores. O dialeto NE apresentou os menores valores médios de ênfase espectral e pequena variação desses valores. Concluímos que nesse corpus, o dialeto NE utiliza pouco esforço vocal, diferenciando-o de N e DF. Ainda, além da região Norte, DF não se diferenciou do PR em relação à ênfase espectral. 61 Caderno de Resumos Resultados obtidos para a mediana da frequência fundamental permitiram separar o DF e N de todas as outras regiões estudadas (p<0,01), porém, novamente, DF e N não apresentaram diferenças estatisticamente significativas entre si. A figura 1 mostra que N e DF apresentam valores mais elevados para este parâmetro do que as outras regiões (tabela 1), em torno de 140 a 150 Hz, que é considerado um valor limítrofe para homens nessa faixa etária (Behlau 2001). Os dois dialetos são os que apresentam maior variabilidade nos resultados. Figura 1. Valores de mediana da frequência fundamental dos dialetos estudados. F0 Dialeto Média (Hz) DP DF 144 29,34 MG 119 9,04 N 149 31,69 NE 119 11,16 PR 121 9,65 RJ 117 14,11 SP 125 13,35 Tabela 1: Média e desvio-padrão da frequência fundamental para os dialetos estudados. 62 4º Colóquio Brasileiro de Prosódia da Fala Dois parâmetros diferenciaram N e DF: assimetria de z-score suavizado (p=0,04) e taxa de unidades VV não-proeminentes/s (p=0,02). Os resultados referentes à assimetria (Figura 2) mostram que N aumenta mais a duração de algumas unidades VV que DF, isto é, faz mais alongamentos, tendo assimetria de valor positivo mais elevado. Figura 2. Valores de assimetria de z-score suavizado para os dialetos estudados A taxa de unidades não-proeminentes/s distinguiu N do DF e de SP, sendo que DF e SP apresentam menor taxa que N, o que pode significar que os falantes da Região Norte tem a fala com maior cadência que DF e SP. No desvio-padrão de z-score de duração de unidade VV, o ANOVA apontou diferenças entre as regiões (p=0,01), porém, o Teste Tukey, por ser mais conservador que o ANOVA não conseguiu identificar tais diferenças com o nível de significância adotado (p<0,05). Por isso, adotamos, para esse parâmetro, p<0,15, que aponta diferenças marginalmente significativas. Os resultados obtidos utilizando p<0,15 são: 63 Caderno de Resumos Falantes da região Norte apresentaram maior variação de z-score de duração de unidade VV que DF, NE e SP. Falantes de SP variaram menos em suas produções, fato que os diferenciou marginalmente de N e PR. Três parâmetros não apresentaram diferenças significativas entre os dialetos: taxa de elocução, média de duração de z-score de unidade VV e taxa de produção de saliência duracional. Os resultados mostram que alguns parâmetros prosódicos são capazes de diferenciar as regiões estudadas e consequentemente, o dialeto falado nesses locais. A ênfase espectral divide N e DF do restante das localidades analisadas, exceto pela não diferenciação entre DF e PR. A mediana da frequência fundamental criou um grupo parecido com o da ênfase espectral, diferenciando N e DF do restante dos dialetos. Da mesma forma que algumas medidas acústicas juntam esses dialetos em um mesmo grupo, algumas delas os separam como é o caso da assimetria de z-score e taxa de unidades VV não-proeminentes e o desvio-padrão (este último apresentou diferenças marginalmente significativas). Os resultados ajudam a descrever melhor as características prosódicas de alguns dialetos do português brasileiro, principalmente DF e N. Dois parâmetros diferenciaram dialetos falados na região Sul do Brasil (considerando a linha horizontal traçada por Nascentes): desvio-padrão de zscore suavizado de duração de unidade VV, que foi capaz de distinguir SP do PR e taxa de unidades VV não-proeminentes/s, que diferenciou o dialeto de SP da região Norte. Os resultados certamente acrescentam conhecimento em diversas áreas afins, como a Fonética Forense, em que a tarefa de identificar o local de origem de um falante contribui para a resolução de um caso. Os resultados apontam para diferenciação do dialeto falado no DF que atualmente tem 53 anos de fundação e é considerado como um dialeto em formação. Os cinco falantes do DF que participaram deste estudo nasceram, viveram até a idade adulta na cidade e tem idade média de 31 anos. Os resultados mostram que DF parece se aproximar do dialeto da região Norte em algumas medidas e se diferenciar em outras, evidenciando que, mesmo sendo uma região dialetal nova, apresenta características próprias. Os parâmetros analisados não revelaram diferenças entre os dialetos de SP, RJ e MG. A utilização dos parâmetros prosódicos analisados em conjunto com outras análises contribuirá para a diferenciação dessas (e de outras) regiões dialetais. Ressaltamos que, mesmo que alguns parâmetros tenham sido capazes de 64 4º Colóquio Brasileiro de Prosódia da Fala diferenciar os grupos e outros não, a análise geral de todos os parâmetros é fundamental para caracterizar cada dialeto. Poderíamos dizer que a região Nordeste se diferencia do DF e do N por utilizar menos esforço vocal e variar menos na duração das unidades VV que a região Norte. As características prosódicas são, muitas vezes, menos abordadas que variações lexicais e diferenças fonológicas em estudos que buscam caracterizar determinadas regiões dialetais. Nosso estudo mostra que a prosódia também contribui para diferenciar e caracterizar os dialetos brasileiros. Na próxima etapa, um teste perceptivo avaliará se os ouvintes conseguem dizer a região de procedência dos sujeitos que participaram do estudo e correlacionar esses resultados com a análise dos parâmetros prosódicos. Referências Nascentes, A. 1953. O linguajar carioca. Rio de Janeiro: Organização Simões. Cardoso, S.A.M. 1986. “Tinha Nascentes razão? (Considerações sobre a divisão dialetal do Brasil)”. In Estudos: Lingüísticos e Literários, 5: 47-59. Barbosa, P.A. 2006. Incursões em torno de ritmo da fala. Campinas: Editora Pontes. Barbosa, P.A. 2011. ProsodicDescriptorExtractor. Script disponível com autor. Behlau, M. 2001. A voz do especialista. Vol I. 65 Caderno de Resumos Ênfase prosódica em estruturas narrativas: um estudo preliminar Ana Maria Santos de Mendonça ¹, Jeylla Salomé Barbosa dos Santos ¹ ¹ Faculdade de Letras/PPGLL/Universidade Federal de Alagoas/Brasil [email protected], [email protected] O objetivo desta pesquisa é apresentar uma análise experimental da ênfase prosódica, em seções consideradas essenciais em uma narrativa espontânea, do português falado na comunidade de Porto da Rua, litoral Norte de Alagoas. A análise baseia-se em estudos realizados sobre a ênfase prosódica, tais como Cagliari (1992); Gonçalves (1997); Reis (2005). Labov (1972) considera a narrativa um tipo de discurso que pode ser segmentado tomando-se como princípio a função informacional de suas partes constituintes. De acordo com Labov (1972), a estrutura de uma narrativa “bem formada” pode conter as seguintes seções: resumo, orientação, seção de complicação, avaliação, resolução e coda. Segundo Oliveira Jr. (2000), o modelo laboviano, como exemplo de modelo teórico estrutural de narrativas orais, pode ser empiricamente validado se se tomar em consideração o nível suprassegmental do discurso narrativo. Para uma melhor explicação dos elementos citados, temos: Orientação (informação sobre atores, tempo, lugar e situações); Complicação (o corpo principal da narrativa, ou ação); Avaliação (o ponto da história); Resolução (o resultado da ação); e Coda (retorno ao momento atual da história). Aqui nos delimitamos a trabalhar apenas com as seções consideradas, por Labov (1972), como essenciais numa narrativa; a avaliação, a complicação e a resolução, a fim de analisar em quais dessas seções o fenômeno da ênfase prosódica se faz mais presente. Analisaremos, seguindo a literatura, os seguintes elementos prosódicos, comumente associados à ênfase prosódica: o tom e a duração. 66 4º Colóquio Brasileiro de Prosódia da Fala Dada a importância dessas seções para o texto narrativo, espera-se que elas sejam associadas a elementos prosódicos que as ressaltem das demais seções. O uso da prosódia da prática de distinguir partes mais relevantes na fala 1 tem sido observado por vários autores, como, por exemplo, : Uhman, S. (1992) . Segundo Cagliari (1992), a duração pode ser usada para distinguir significados em itens lexicais (valor fonêmico). Nestes casos, a duração é uma propriedade dos segmentos (consoantes e vogais). De acordo com Cagliari (1992), a duração está sistematizada ao nível da sílaba em todas as línguas, independentemente dos segmentos e, neste caso, ganha o nome de “moras”. Todas as palavras de todas as línguas têm suas durações previstas no léxico: são as chamadas “durações intrínsecas” das sílabas. Estas durações atribuem valores e pesos às sílabas, que serão importantes para a aplicação ou não de determinados processos fonológicos. A duração que se refere a questões fonológicas significa alongamentos ou encurtamentos de segmentos. Os outros tipos de duração delimitam unidades duracionais maiores, a partir da sílaba em diante. Neste caso, a duração é medida levando-se em consideração as durações dos segmentos e seu efeito em unidades maiores. Uma língua como o Português usa, às vezes, do recurso do alongamento excessivo, como aponta Cagliari (1992) em “prosódia: algumas funções dos supras-segmentos”, a pronúncia de certas palavras para significar qualidades atributivas, que normalmente são expressas por itens lexicais. Como em um dos trechos analisados: Tem carência no setor de educação (çãaaao), no setor de saúde (saúuude). Temos aqui um alongamento excessivo da sílaba acentuada por parte do falante. O que acontece devido a esse alongamento saberemos na seção de resultados. Ainda segundo Cagliari (1992), os tons entoacionais (padrões) podem ser classificados em dois tipos, segundo suas funções. Um prevê uma classificação primária e outro uma classificação secundária. A primária refere-se a certas características melódicas que são portadoras de distinções sintáticas de frases. A segunda refere-se a significados semânticos relacionados com as atitudes do falante. Em nossa pesquisa, nos detemos à segunda clasificação dos tons. 1 Contextualizing relevance: on some forms and functions of speech rate changes in everyday conversation. In P.Auer & A. d. Luzio. The Contextualization of Language. Amsterdam, Benjamins. 297-336. 67 Caderno de Resumos Diversos estudos têm sido feitos sobre a ênfase prosódica e, em muitos deles, tal fenômeno se diferencia no que diz respeito à definição. Reis (2005) a define como uma manifestação acentual. Dar ênfase à fala é aquele recurso quando, além da informação presente no significado proposicional da sentença, ressaltamos intencionalmente um segmento a fim de expressarmos sentimentos tais como indignação, incredulidade, segurança, ou apenas para chamar a atenção do alocutário. Gonçalves (1997) concluiu em sua pesquisa intitulada “ênfase prosódica e variação (sócio) linguística”, que a ênfase dada a um determinado constituinte do enunciado tende a realçar o seu status informacional dentro do evento de fala que se realiza. Dessa forma, os segmentos mais enfatizados na fala são aqueles que possuem uma carga informacional relativamente mais alta e, consequentemente, requer do falante uma atenção maior em sua produção. Segundo Oliveira Júnior (2010), qualquer tipo de discurso é formado por conjuntos de frases que possuem uma relação semântica coerente entre si. Em geral, a estrutura do discurso escrito é clara por conta do uso de convenções tipográficas, tais como a pontuação e a organização do texto em parágrafos. O discurso falado faz uso de outros mecanismos para sinalizar sua estrutura. Ainda segundo o autor, certas variáveis prosódicas exercem papel crucial na estruturação discursiva, dividindo o texto narrativo em seções semanticamente independentes. Estudando a estrutura de algumas narrativas, percebemos em nossos dados que alguns locutores ao narrar sobre determinado assunto iniciam sua fala de forma neutra, ou seja, uma queda da frequência fundamental no final do 2 enunciado . Porém, passados alguns minutos na mesma narrativa, dependendo do conteúdo da conversa, esses locutores modificam o modo de se expressar, modificam a voz a ponto de atrair o ouvinte para ele ou para o conteúdo do discurso. Embora a proeminência de elementos do enunciado possa ser produzida por diversos recursos linguísticos e prosódicos, a escolha pelo estudo da ênfase foi fundamentada no modo como os falantes das narrativas escolhidas para análise se expressam, e, portanto, na sua importância no processo 2 Segundo Cunha (2011), o padrão assertivo neutro caracteriza-se, na maior parte das línguas estudadas, por uma proeminência da F0 (lê-se F zero) no acento pré-nuclear e uma queda da frequência fundamental no fim do enunciado, mais particularmente na sua última tônica. 68 4º Colóquio Brasileiro de Prosódia da Fala comunicativo, regulamentando o discurso e, consequentemente, a própria interação linguística (Gonçalves 1997). O material utilizado foi composto por narrativas, extraída de gravações feitas de fala espontânea. Esses dados já foram gravados e pertencem ao corpus do trabalho de dissertação de Santos (2010). Como esses dados não foram controlados, ao ouvi-los, percebemos que, em suas diferentes narrativas e locutores, poderíamos encontrar o que nos propomos a descrever. Nossos dados apresentam diferentes histórias, diferentes discursos, como “carnaval”, “conselho tutelar”, “a cidade onde vive”, dentre outros. Analisamos seis narrativas, entre homens e mulheres, todos residentes ao município de São Miguel dos Milagres, litoral Norte de Alagoas, desde que nasceram. Os dados foram selecionados, recortados e submetidos à análise experimental no software PRAAT. Dos trechos selecionados, extraímos sílabas que foram segmentadas para em seguida, proceder à análise do comportamento da frequência fundamental, ou seja, a evolução da F0 ao longo do enunciado. Com objetivo de descrevermos os parâmetros prosódicos, como o tom e a duração que se apresentam nas narrativas causando a ênfase prosódica. Nas sílabas analisadas observou-se o comportamento melódico variado, não havendo uma única caracterização, uma vez que diferentes padrões de frequência fundamental se alternam, dependendo do ponto de vista da sílaba tônica e da pós-tônica no final ou no meio dos enunciados. Quanto aos elementos essenciais de uma narrativa, percebemos que há uma maior proeminência de um dos elementos prosódicos que leva à ênfase, nesse caso a duração, na seção avaliação. Referências Cagliari, L. C. Prosódia.1992: algumas funções dos suprassegmentos. UNICAMP, IEL. Gonçalves, C. A. 1997. Ênfase prosódica e variação (socio)linguística. Rio de Janeiro. UFRJ. Labov, W. e Waletzky, J. 1972. Narrative Analysis: Oral versions of personal experience. Columbia University. Oliveira, Jr. 2010. O uso da prosódia na sinalização da estrutura do discurso em Kisedjê. UFAL. Maceió. Reis, C. 2005. Prosódia e telejornalismo. IN: Gama, A. C. C.; Kyrillos, L.; Feijó, D. 69 Caderno de Resumos (Org.). Fonoaudiologia e Telejornalismo. Relatos do IV encontro nacional de Fonoaudiologia da Central Globo de Jornalismo. Rio de Janeiro: Revinter. ROACH. Santos, J. S. B. 2010. As realizações de /r/ em coda silábica na comunidade de Porto da Rua, litoral norte de Alagoas. Análise linguística e sociolinguística. Dissertação de mestrado. Maceió. UFAL. Uhmann, S. 1992. Contextualizing relevance: on some forms and functions of speechrate changes in everyday conversation. In P. Auer & A. d. Luzio. The Contextualization of Language. Amsterdam, Benjamins. 297-336. 70 4º Colóquio Brasileiro de Prosódia da Fala Caracterização da frequência fundamental da voz de adultos que gaguejam Ayslan Melo de Oliveira, Jeane Bezerra de Melo e Silva, Kleuvencleiton José dos Santos Oliveira, Mayra Cristina Jorge Oliveira, Suelen Glaucia Castro dos Santos de Jesus, Tarcya Sibele Bastos Santos, Thiago Gonçalves de Jesus 1, Susana de Carvalho2 1 2 Curso de Fonoaudiologia, Universidade Federal de Sergipe, Brasil Departamento de Fonoaudiologia, Universidade Federal de Sergipe, Brasil [email protected], [email protected], [email protected], [email protected], [email protected], [email protected], [email protected], [email protected] 1. Introdução A fluência pode ser definida como o fluxo contínuo e suave de produção da fala. Contrapondo-se, a gagueira é caracterizada por ocorrências frequentes de repetições, prolongamentos de sons, interjeições, palavras partidas, bloqueios audíveis ou silenciosos, circunlocuções e excesso de tensão física (Andrade 2003; APA 2002). A tensão muscular tem sido apontada como um dos fenômenos fisiológicos que afetam a fala e considerada um fator importante, que influencia ou provoca a gagueira. Esta tensão muscular, no nível glótico, compromete a mobilidade natural da laringe e altera o fluxo de ar de tal forma que a fala é diretamente afetada (Jakubovicz 2009). A frequência fundamental (F0) é a primeira emissão determinada, fisiologicamente, pelo número de ciclos que as pregas vocais realizam em um segundo. Sabe-se que a F0 varia de acordo com a idade e o gênero, com uma distribuição média entre 80 a 250 Hz, para adultos jovens. Nos homens, encontram-se valores situados entre 80 a 150 Hz e, nas mulheres, entre 150 a 250 Hz (Behlau et al 2008). 71 Caderno de Resumos As características biodinâmicas das pregas vocais e a sua integração com a pressão subglótica determinam a F0. Sendo assim, qualquer ajuste que interfira nos ciclos glóticos, irá interferir também nos valores da frequência fundamental (Behlau et al. 2008). O principal objetivo deste estudo foi caracterizar a frequência fundamental da voz de adultos que gaguejam. Hipotetiza-se que a frequência estará elevada, em virtude da tensão muscular e dos diferentes ajustes que ocorrem durante a produção da fala. 2. Material e método O presente estudo, observacional e descritivo, é um dos aspectos investigados na pesquisa “Intervenção fonoaudiológica na gagueira: perfil dos pacientes atendidos no Laboratório de Voz, Fala e Fluência”, aprovada pelo Comitê de Ética em Pesquisa, sob o no. CAAE 0181.0.107.000-11, não implicando em nenhum procedimento invasivo ou experimental e caracterizada como sem riscos para os participantes. O estudo contou com 57 participantes, voluntários, adultos, de ambos os gêneros, com queixa de gagueira e que haviam procurado, voluntariamente, por atendimento fonoaudiológico no laboratório citado. Após a assinatura do Termo de Compromisso Livre e Esclarecido, os participantes foram convidados a realizar duas tarefas: primeiro, responder a questão “Por que você gostaria de se tratar agora?” e, posteriormente, proceder a leitura oral de um texto padronizado para o português brasileiro, contendo 100 palavras (Jakubovicz 2002). As tarefas foram gravadas por meio de um microfone profissional, instalado em pedestal e acoplado a um conversor e amplificador de audio Shure®, o que possibilitou que as amostras de fala fossem captadas, digitalizadas e armazenadas no formato wav. As amostras de fala foram analisadas por meio do Praat (software de livre acesso, desenvolvido por Boersma e Weenink, em sua versão 5.3.51) para determinação da frequência fundamental. O cálculo da frequência fundamental foi realizado, automaticamente, pelo software, com pitch mínimo de 75Hz e máximo de 500Hz. Os dados, coletados e tabulados, foram analisados por meio de estatística descritiva, para determinação dos valores máximo, mínimo, média e desvio padrão; a comparação entre os dados foi realizada por meio do Teste T Student para amostras pareadas, com significância em p<0,05. 72 4º Colóquio Brasileiro de Prosódia da Fala 3. Resultados e discussão De maneira geral, estudos com adultos que gaguejam contam com um número reduzido de participantes, o que restringe a possibilidade de generalização. Neste estudo, buscou-se analisar uma amostra maior a fim de ampliar a discussão sobre os parâmetros acústicos para essa população específica. Dentre os 57 participantes, 43 eram do gênero masculino e 14 do gênero feminino. É importante destacar que há um consenso, na literatura especializada, no que diz respeito a prevalência de casos de gagueira no gênero masculino, em uma relação de 3/1 (Wittke-Thompson et al. 2007). A idade dos participantes variou entre 18 a 56 anos, com idade média de 25,3 anos. A procura por atendimento fonoaudiológico para a gagueira coincide com achados de outros estudos, nos quais a idade média dos pacientes adultos situa-se entre os 20 e 30 anos (Andrade 2003; Duarte et al. 2009).p Gênero N F0 (Hz) mínima Fala encadeada máxima média DP mínima Leitura oral máxima média DP masculino 43 99,00 221,70 144,03 27,30 102,78 216,99 145,05 27,60 feminino 14 152,51 342,00 218,65 45,32 113,59 262,60 205,44 44,92 Tabela 1: Valores mínimo, máximo e médias de frequência fundamental, de acordo com o gênero e tarefa realizada Considerando a análise da frequência fundamental da voz dos participantes do gênero masculino, na tarefa de fala espontânea, percebe-se uma variação entre o valor mínimo de 99 Hz e o valor máximo de 221,7 Hz, com média em 144,03 Hz (DP = 27,3). Para a tarefa de leitura oral, a frequência fundamental variou entre 102,78 e 216,99 Hz, com média em 145,05 Hz (DP = 27,6). Comparando os resultados por meio do Teste T Student para amostras pareadas, não há diferença significativa entre as tarefas. As vozes femininas, na tarefa de fala espontânea, revelaram valores entre 152,51 e 342 Hz, com média em 218,65 Hz (DP = 45,32). Para a tarefa de leitura oral, os valores variaram entre 113,592 e 262,6 Hz e média de 205,44 Hz (DP = 44,92). Comparando os resultados por meio do Teste T Student para amostras pareadas, também não existem diferenças significativas entre as tarefas. 73 Caderno de Resumos O valor médio da frequência fundamental para a voz feminina é de 204,91 Hz. Quando se compara com os resultados deste estudo, percebe-se não existir uma diferença significativa. Estudos sobre a frequência fundamental da voz masculina estabelecem, como parâmetro, valores situados entre 80 a 150 Hz. Oliveira et al (2009) analisaram a F0 da voz de 15 homens com quadro de gagueira e idade média de 26,6 anos e concluíram não existir diferenças, nesse aspecto, entre adultos fluentes e adultos que gaguejam. Considerando os participantes do gênero masculino, deste estudo, identifica-se um valor médio de F0 (144,03 Hz) e, portanto, ainda dentro dos parâmetros para vozes masculinas. Esse valor, entretanto, situa-se muito próximo do valor máximo, ou seja, 150 Hz. Além disso, percebe-se que há uma variabilidade maior entre os valores mínimo e máximo. Nesse sentido, pode-se argumentar que há uma elevação nos valores da frequência fundamental da voz de homens que gaguejam, não o suficiente para descaracterizá-la como uma voz masculina, mas indicativa da presença de tensão laríngea. Utilizando a eletromiografia de superfície, um estudo investigou a atividade da musculatura laríngea de quatro homens, durante o discurso fluente e disfluente. Os resultados demonstraram níveis elevados de atividade muscular e uma relação positiva entre essa atividade anormal da musculatura laríngea e os momentos de disfluência (Andrade et al. 2008). 4. Conclusão Conclui-se que há elevação da frequência fundamental da voz de adultos, do gênero masculino, que gaguejam. É provável que tal fenômeno ocorra em função da tensão laríngea presente. Tal constatação pode contribuir para a tomada de decisões e reformulações importantes na abordagem terapêutica de adultos que gaguejam. Referências Andrade, C.R.F. et al. 2008. Modelamento da fluência com o uso da eletromiografia de superfície: estudo piloto. Pró-Fono Rev Atual Científica. 20(2):129-32. 74 4º Colóquio Brasileiro de Prosódia da Fala Andrade, C.R.F. de 2003. A gagueira e o processo da comunicação humana. In: LIMONGI, S.C.O. Linguagem: desenvolvimento normal, alterações e distúrbios. Série: Fonoaudiologia: Informação para Formação. Rio de Janeiro: GuanabaraKoogan. APA Associação Psiquiátrica Americana 1995. Manual Diagnóstico e Estatístico de Transtornos Mentais -DSM-IV. (Trad. de Dayse Batista). Porto Alegre: Artes Médicas. Behlau, M et al. 2008. Avaliação de voz. In: Behlau, M. (org.). Voz: o livro do especialista. Rio de Janeiro: Revinter. Boersma,P. e Weenink, D. Praat: doing phonetics by computer (versão 5.3.51.). Software. Disponível em: http://www.praat.org. Acesso em 18/05/2013. Duarte, T.F. et al. 2009. Caracterização dos indivíduos com distúrbios da fluência, atendidos na clínica-escola do curso de fonoaudiologia da USP-Bauru. Rev. CEFAC. 11(3): 396-405. Jakubovicz, R. 2009. Gagueira. 6. ed. rev. e ampl. Rio de Janeiro: Revinter. _____ 2002. A técnica surdo-sonoro para descondicionar bloqueios. In: MEIRA, I. (org.) Tratando gagueira: diferentes abordagens. São Paulo: Cortez. Oliveira, B. F. V. et al. 2009. Análise de parâmetros perceptivo-auditivos e acústicos em indivíduos gagos. Rev Soc Bras Fonoaudiol. 14(3):323-31. Wittke-Thompson, J.K. et al. 2007. Genetic studies of stuttering in a founder population. J Fluency Disord. 32(1):33-50. 75 Caderno de Resumos A relação entre a compreensão e os aspectos prosódicos na leitura em voz alta de falantes do PE e do PB Camila Tavares Leite1 1 Faculdade de Letras, Universidade Federal de Alagoas, Brasil [email protected] A leitura é um processo tão usual para o bom leitor que, dificilmente, ele se pergunta sobre como ocorre este intricado e complexo processo. Mas qual é o conceito de bom leitor? Gabriel (2006) afirma que o leitor proficiente, ou o bom leitor, por definição é aquele para o qual a decifração do código não é mais um obstáculo e que, por isso, pode voltar toda sua atenção para a produção de sentido. Soares (2004) completa, ainda, que esse nível de proficiência em leitura não é uma característica inata, comum a todos os seres humanos, mas sim uma habilidade construída através de um longo processo de alfabetização e letramento, que vai modificando a forma de “ver” o código. Outros pesquisadores apontam a fluência como um bom indicador global de competência em leitura. De acordo com essa análise, ler um texto com atenção implica processar palavras individuais e parsear seus grupos frasais (Levasseur, Macaruso, Palumbo & Shankweiler 2006). Mas qual é o conceito de fluência? De acordo com Finn e Ingham (1991), a fluência parece ser um fenômeno de fácil compreensão – já que todos os falantes de uma determinada língua são capazes de dizer se dada leitura é fluente ou não, pois sabem identificar a fluência quando a ouvem –, mas cuja noção é resistente a uma definição direta e não ambígua. Normalmente, a definição de fluência está vinculada à sua negativa. Segundo Hedge (1978), “fluência é melhor definida como uma unidade de resposta destituída de disfluências e pausas”. Esta definição, conforme Finn e Ingham (1991), não deixa claro se ela identifica uma fala que os ouvintes interpretariam como fluente nem se tal definição se refere à fala normalmente fluente. Com interesse em avaliar a fluência, o presente trabalho tem como objetivo observar e analisar a leitura em voz alta de sujeitos de diferentes idades/escolaridades do Português Europeu – variedade falada na cidade de Lisboa – e do Português Brasileiro – variedade falada na cidade de Belo 76 4º Colóquio Brasileiro de Prosódia da Fala Horizonte – e sua relação com a compreensão do material lido. Foram selecionados 30 sujeitos de cada variedade, como especificado na tabela 1, totalizando 60 sujeitos participantes. IDADE ESCOLARIDADE 11 (onze) anos 6º ano do Ensino Básico 15 (quinze) anos 10º ano do Ensino Secundário 20 (vinte) anos 1º ano da graduação TOTAL de Portugueses IDADE ESCOLARIDADE 11 (onze) anos 6º ano do Ensino Fundamental 15 (quinze) anos 1º ano do Ensino Médio 20 (vinte) anos 1º ano da graduação TOTAL de Brasileiros Nº de sujeitos Portugueses 10 10 10 30 Nº de sujeitos Brasileiros 10 10 10 30 Tabela 1 – Sujeitos participantes da pesquisa Cada sujeito realizou, em voz alta, duas leituras de dois textos: o primeiro texto, “O ratinho Dadá” é um texto infantil, com vocabulário acessível a todos os participantes. Esse texto, em sua versão original, foi adaptado para o Português Europeu – PE –, visto que se encontravam nele alguns termos incomuns nesta variedade. Por se tratar de um texto que, aparentemente, não apresenta dificuldades de processamento, um segundo texto, com maior complexidade, foi também selecionado, o texto “A Amazónia” – versão original do PE, texto utilizado por Costa (1991) em seu trabalho de mestrado sobre leitura, compreensão e processamento sintático e por Condelipes (2010) em seu trabalho de mestrado sobre produção de fala por indivíduos gagos. O texto “A Amazónia”, em sua versão original, foi adaptado para o Português Brasileiro, PB, visto que nele havia termos incomuns nesta variedade. Entre a primeira e a segunda leitura em voz alta de cada texto, o participante respondeu, no computador, a um questionário de compreensão, realizado no programa DMDX. As questões do teste realizado pelos sujeitos foram elaboradas levando-se em consideração os níveis hierárquicos de análise da compreensão, propostos por Salasoo (2007). No nível de palavra, encontram-se cinco questões: duas sobre palavras que não estão no texto, duas sobre palavras que estão no texto, mas não na idéia central e uma sobre uma palavra que está na 77 Caderno de Resumos idéia central do texto. No nível das inferências, para cada inferência havia uma afirmativa verdadeira e uma falsa. Ao todo, analisamos as respostas dadas a 9 (nove) questões de compreensão. Uma leitura pode ser ou não considerada fluente quando comparada com outra que seja tida como controle. Portanto, para classificar as leituras realizadas pelos sujeitos da pesquisa, comparamo-las a uma leitura considerada fluente, tanto em relação às suas características prosódicas quanto em relação às suas características entoacionais. A leitura de um sujeito de 30 anos de idade, do sexo feminino, aluno de doutorado da Faculdade de Letras da Universidade de Lisboa e a de um sujeito de 30 anos de idade, também do sexo feminino, aluno de doutorado da Faculdade de Letras da Universidade Federal de Minas Gerais foram gravadas e analisadas. Foram ainda segmentadas de acordo com os constituintes prosódicos (Nespor & Vogel 1986) e foram feitas marcações de acentos tonais e de tons de fronteira. Essas leituras foram consideradas como “controle” para análise dos dados dos sujeitos analisados nesta pesquisa. Dos textos, observamos: tempo e taxa de elocução. Selecionamos alguns enunciados de cada texto para análise – sendo três enunciados do texto “O ratinho Dada” e dois do texto “A Amazônia” – e desses observamos: tempo e taxa de elocução, tempo e taxa de articulação, tempo e porcentagem de pausa e número de sintagmas entoacionais. Como resultado, observamos que, quando comparados com o leitor fluente, em PE podemos considerar fluentes apenas os sujeitos de 15 e 20 anos. Todos os dados dos sujeitos de 11 anos, em PE, apresentaram diferença significativa com relação aos dados dos demais sujeitos. Em PB, obtivemos um resultado diferenciado. Os sujeitos de 11, 15 e 20 anos, quando comparados com o leitor controle, não apresentaram diferença no comportamento leitor, exceto no que diz respeito aos dados de pausa. Esse dado parece ser um distintor das variedades e dos sujeitos. A partir dos dados analisados nesta pesquisa, a pausa parece ter sido utilizada diferentemente em PE e em PB: em PE ela parece apontar a fluência ou a não fluência do sujeito, já em PB, ela limita o sintagma entoacional – marcado, mais frequentemente, nos dados do PE, com o tom de fronteira alto H%. A observação dos dados de compreensão nos mostrou que a diferenciação do gênero textual pode apresentar resultados diferentes para um mesmo grupo. O texto mais complexo possibilitou-nos perceber que há uma relação inversamente proporcional entre idade/escolaridade e o erro ao responder às questões de compreensão. Quanto maior a idade, menor o número de erro. Chamamos a atenção para algo que veio de encontro ao que esperávamos no início da pesquisa: inicialmente, esperávamos que a 78 4º Colóquio Brasileiro de Prosódia da Fala compreensão do texto estivesse diretamente relacionada com a fluência de leitura em voz alta, ou seja, uma leitura fluente seria uma consequência de uma boa compreensão. Os resultados desta pesquisa apontam o fato de que essa relação deve ser repensada. Os sujeitos de 20 anos, do PE e do PB, apresentaram leituras fluentes; entretanto, os resultados do teste de compreensão do texto mais simples apresentaram elevados números de erro. Referências Condelipes, T. 2010. Produção de fala por indivíduos gagos. Dissertação (Mestrado em Lingüística) – Faculdade de Letras, Universidade de Lisboa, Lisboa. Costa, A. 1991. Leitura: compreensão e processamento sintático. Dissertação (Mestrado em Lingüística) – Faculdade de Letras, Universidade de Lisboa, Lisboa: 1-76. Finn, P. & Ingham, R. 1991. “The selection of “fluent” samples in research on stuttering: conceptual and methodological considerations”. In Healey, C. (org.). Readings on research in stuttering. Nova Iorque: Longman Publishing Group: 91109. Hedge. 1978. “Fluency and fluency disorders: their definition, measurement and modification”. Journal of fluency disorders 3: 51–71. Gabriel, R. 2006. “A compreensão em leitura enquanto processo cognitive”. Revista Signo. 31 (52): 73-83. Levasseur, Macaruso, Palumbo & Shankweiler. 2006. “Syntactically cued text facilitates oral reading fluency in developing readers”. Applied Psycholinguistics 27: 423-445. Nespor M. & Vogel, I. 1986. Prosodic Phonology. Dordrecht: Foris. Salasoo, A. 2007. “Cognitive processing in oral and silent reading comprehension”. Reading Research Quarterly 21 (1): 58-69. Soares, M. 2004. “Letramento e alfabetização: as muitas facetas”. Revista Brasileira de Educação. 25. Jan/Fev/Mar/Abr. 79 Caderno de Resumos A interação prosódia-sintaxe em dados de produção e de compreensão de estruturas de Tópico e de SVO 1 2 Carolina Garcia de Carvalho Silva , Maria Cristina Name 1 Faculdade de Letras/Programa de Pós-Graduação em Linguística, Universidade Federal de Juiz de Fora, Brasil 2 Faculdade de Letras/Programa de Pós-Graduação em Linguística, Universidade Federal de Juiz de Fora, Brasil [email protected], [email protected] Nosso estudo tem como objetivo investigar se a prosódia poderia guiar o processamento sintático, não simplesmente desfazendo uma ambiguidade, mas fornecendo pistas para a construção da estrutura sintática no curso do processamento. Elegemos como objeto de análise a oposição das estruturas de Tópico e de SVO porque, no português brasileiro, as construções de tópico são altamente recorrentes (Pontes 1987; Orsini e Vasco 2007) e se caracterizam por um contorno melódico próprio (Moraes e Orsini 2003). Tomamos como referencial teórico o modelo de Corrêa e Augusto (2007) de integração entre teoria linguística (Programa Minimalista: Chomsky 1995), e processamento on-line, denominado Modelo Integrado de Computação Online (MINC). De acordo com o MINC, projeções top-down e bottom-up se organizam paralelamente. Nesse sentido, nossa hipótese é a de que algumas projeções poderiam ser conduzidas pela prosódia, através das pistas de fronteiras de constituintes prosódicos. Mais especificamente, as fronteiras de sintagmas fonológicos (? ) e de sintagmas entoacionais (I) seriam pistas prosódicas relevantes, porque coincidem com fronteiras sintáticas (Nespor e Vogel 1986). Com a finalidade de testarmos tal hipótese, foram aplicadas duas atividades experimentais, uma de produção e outra de compreensão. Selecionamos 12 palavras que podem pertencer tanto à categoria Verbo, quanto à categoria Adjetivo: dissílabas – cega, limpa, muda, paga, salva, suja; e trissílabas – aceita, estranha, expulsa, liberta, oculta, segura. Construímos sentenças com dois tipos de estruturas sintáticas: Tópico – [A criança SUJA]I a madrinha mandou ela para o banho; e SVO – [A criança]? [SUJA a madrinha] com a comida do almoço. 80 4º Colóquio Brasileiro de Prosódia da Fala Em todos os pares de sentenças, foi controlado, o máximo possível, o número de sílabas da sentença toda e de cada constituinte prosódico. Ainda, a palavra-alvo admite o mesmo nome como antecedente e o sintagma seguinte à palavra-alvo também é o mesmo nas duas condições, funcionando como sujeito na primeira condição e como complemento na segunda. Todos os nomes que antecedem as palavras ambíguas têm o traço [+ humano], e os nomes que as seguem, [+animado]. Temos em cada sentença coincidência entre fronteira sintática e fronteira prosódica, sendo que, até o sintagma seguinte à palavra ambígua, as estruturas sintáticas só diferem através da pista prosódica. Na sentença com estrutura de Tópico, há uma fronteira de sintagma entoacional (I) após a palavra ambígua; já na condição SVO, há uma fronteira de sintagma fonológico (? ) antes da palavra ambígua. Portanto, desde o início das sentenças há pistas prosódicas que as diferenciam. A primeira atividade experimental teve como objetivo verificar se, diante de uma estrutura ambígua, há um tipo de prosódia default. A tarefa consistia no seguinte: na tela do computador aparecia uma frase. Imediatamente, o participante deveria fazer a leitura em voz alta, sem nenhuma leitura prévia. Em seguida, o participante lia cada frase mais duas vezes. O total de 24 sentenças-teste foi distribuído em dois grupos, a fim de que o sujeito que visse, por exemplo, a palavra suja como verbo, não a visse como adjetivo. Cada participante leu 12 sentenças-teste, apresentadas em meio a 16 distratoras. Participaram dessa tarefa 8 voluntárias. Comparamos a primeira e a terceira leituras, observando o tipo de envelope prosódico produzido para cada estrutura ambígua. Na primeira leitura, na condição Tópico, 41 frases (do total de 48 gravadas) e na condição SVO, 44 (de 48) foram lidas com prosódia de SVO. Não houve, portanto, diferença significativa do tipo de envelope prosódico para os dois tipos de estrutura sintática (X2(1)=0.41, p=0.521), pois os participantes preferiram majoritariamente a prosódia de SVO. Por outro lado, na última leitura, 40 frases com estrutura de Tópico foram lidas com prosódia de Tópico, e todas as 48 com estrutura de SVO foram lidas com prosódia de SVO. Houve uma diferença significativa (X2(1)=65.185, p<0.00001), o que revela que, após conhecer o sentido da frase, os falantes diferenciaram as duas estruturas com os dois tipos de envelopes prosódicos adequados. Verificamos as propriedades de duração e f0 das sílabas tônicas da palavra ambígua e do nome antecedente nas duas estruturas sintáticas. Na estrutura de Tópico, há um alongamento da sílaba tônica do adjetivo e a f0 é 81 Caderno de Resumos mais alta na sílaba tônica do nome antecedente. Já na estrutura de SVO, o alongamento ocorre na sílaba tônica do nome e o valor de f0 é mais alto no verbo. Tendo em vista que tais pistas prosódicas são produzidas pelos falantes, a segunda atividade experimental foi desenvolvida a fim de verificarmos se tais pistas são captadas pelos ouvintes, possibilitando-os diferenciar os dois tipos de estruturas a partir do tipo de envelope prosódico. Usamos a técnica de escuta auto-monitorada, em que o ouvinte controla o tempo de escuta das frases. Através do software PsyScope, medimos o tempo de escuta de cada parte das frases, pressupondo que o tempo de reação é maior no momento em que houver necessidade de um tempo maior de processamento. Usamos as mesmas frases do experimento anterior, mas gravadas por uma única falante. Analisamos novamente os parâmetros acústicos de duração e f0 nas sílabas tônicas do nome antecedente e da palavra ambígua. Observamos que ocorre um alongamento das sílabas tônicas em final de fronteiras prosódicas (no adjetivo, na condição Tópico, e no nome, na condição SVO) com diferenças estatisticamente significativas. Comparando-se as médias da duração da sílaba tônica do nome nas duas condições (189 x 406 ms), tem-se t(11)=10.503, p<0.0001; e do adjetivo e do verbo (427 x 241 ms): t(11)=12.531, p<0.0001. Com respeito aos valores de f0 nas sílabas tônicas, comparando-se as médias do nome nas duas condições (259 x 219 Hz), tem-se: t(11)=5.16, p=0.0003. Comparando-se as palavras ambíguas (adjetivo 254 x verbo 309 Hz), também há resultado significativo: t(11) =3.46, p=0.005. Constatadas as diferenças prosódicas entre as estruturas de Tópico e de SVO, buscou-se verificar, através de experimento de compreensão, se os ouvintes captam essas diferentes propriedades prosódicas que sinalizam duas estruturas sintáticas diferentes. As sentenças gravadas foram cortadas em quatro partes: A criança suja / a madrinha / mandou ela / para o banho; A criança suja / a madrinha / com a comida / do almoço. Fizemos uma combinação dessas partes, de modo a colocar a estrutura de Tópico com prosódia de SVO, e a de SVO com prosódia de Tópico. Assim, totalizamos quatro condições experimentais: dois tipos de estruturas sintáticas com dois tipos de envelope prosódico (congruente ou incongruente com a sintaxe). Participaram do experimento 32 sujeitos. A tarefa consistia em apertar uma tecla para ouvir cada parte das frases. Ao final das frases, aparecia na tela uma pergunta para garantir a atenção do ouvinte durante a escuta. Cada 82 4º Colóquio Brasileiro de Prosódia da Fala participante ouviu 12 sentenças-teste em meio a 32 distratoras. Tomamos como medida de análise o tempo de escuta da terceira parte das sentenças, pois é nesse momento que o ouvinte percebe se a prosódia o levou a interpretar a frase de um modo equivocado (no caso de haver incongruência entre prosódia e sintaxe). Os tempos de escuta foram maiores nas condições com incongruência entre sintaxe e prosódia. Os resultados revelaram um efeito principal do tipo de estrutura sintática (F(1,31)=17.6, p<0.001) e também do tipo de prosódia (F(1,31)=5.70, p<0.02). Houve ainda um efeito significativo da interação entre sintaxe e prosódia (F(1,31) = 8.34, p<0.007). Portanto, os resultados sugerem que a prosódia poderia guiar o parser na construção das estruturas. Assim, ao ouvir o início da frase com prosódia SVO, o ouvinte tende a processar a palavra ambígua como verbo e, no caso da prosódia de Tópico, processaria a palavra ambígua como adjetivo. Contudo, se, ao escutar o restante da sentença, o ouvinte se depara com uma incongruência entre o tipo de prosódia e a estrutura sintática, ocorre um estranhamento, sendo necessária a reanálise, o que acarreta um tempo maior de processamento revelado através dos tempos de escuta mais altos. Em conjunto, os resultados revelam que, por um lado, parece haver uma estrutura default SVO, mas, por outro, a prosódia de Tópico parece impedir, em certa medida, a ativação desse default. Isso sugere, de acordo com nossa hipótese inicial, que a prosódia poderia não só impedir a ambiguidade, mas também guiar o parser na formulação da estrutura sintática. Referências Chomsky, N. 1995. The Minimalist Program. Cambridge, MA: MIT Press. Corrêa, L.M.S. and AUGUSTO, M.R.A. 2007. "Computação linguística no processamento on-line: soluções formais para a incorporação de uma derivação minimalista em modelos de processamento". Cadernos de Estudos Linguísticos (Unicamp) 49: 167-183. Moraes, J.A. and Orsini, M.T. 2003. "Análise prosódica das construções de tópico no português do Brasil: estudo preliminar". Letras de Hoje 38(4): 261-272. Nespor, M. and Vogel, I. 1986. Prosodic phonology. Dordrecht: Foris Publications. Orsini, M.T. and Vasco, S.L. 2007. "Português do Brasil: língua de tópico e de sujeito". Diadorim - Revista de Estudos Linguísticos e Literários 2(2): 83-98. Pontes, E. 1987. O tópico no português do Brasil. Campinas: Pontes. 83 Caderno de Resumos Análise entonacional e pragmática de conversas telefônicas coloquiais: os enunciados interrogativos totais nas variedades de Buenos Aires e Santiago do Chile 1 2 Carolina Gomes da Silva , Maristela da Silva Pinto , Natalia dos Santos Figueiredo3 1 Faculdade de Letras, Universidade Federal do Rio de Janeiro, Brasil 2 Instituto Multidisciplinar, Universidade Federal Rural do Rio de Janeiro, Brasil 3 Instituto Latino-americano de Arte, Cultura e História, Universidade Federal de Integração Latino-americana [email protected], [email protected], [email protected] 1.Introdução Este trabalho pretende apresentar uma descrição fonética e uma análise fonológica de enunciados interrogativos totais realizados em conversas telefônicas coloquiais, por falantes de espanhol da variedade de Buenos Aires (Argentina) e Santiago do Chile (Chile). Embora já existam trabalhos que tratem sobre a entoação de enunciados interrogativos tanto do espanhol argentino como do chileno, como Sosa (1999), Gabriel et al. (2010), Ortiz et al. (2010), destacamos a originalidade de nossa proposta de estudo de fala espontânea, conversacional e coloquial uma vez que tais trabalhos descrevem os contornos melódicos sobretudo em contextos de fala lida ou representada. Pretendemos expandir o enfoque dos estudos entonacionais por meio de investigações no contexto de fala espontânea conversacional (BlancheBenveniste 1998; Briz 2002). Estudos recentes de diferentes variedades do espanhol descrevem os contornos entonacionais de enunciados assertivos, interrogativos, imperativos e outros, obtidos através de um questionário adaptado a cada variedade (Sosa 1999; Prieto & Roseano 2010). Dentre esses trabalhos, apresenta-se a entoação 84 4º Colóquio Brasileiro de Prosódia da Fala do espanhol chileno cujos estudos começaram a desenvolver-se a partir da década de 50 (ORTIZ et al. 2010). Assim como a entoação do espanhol chileno, estudos sobre a entoação do espanhol argentino têm sido foco de intensa investigação desde a segunda metade do século XX. Segundo Gabriel et al. (2010) muitos deles buscam descrever os padrões entonacionais de enunciados interrogativos, embora tratem as interrogativas totais e as parciais como um todo, ou seja, não apresentam distinções claras entre esses dois subtipos de enunciados que possuem uma característica em comum: uma incógnita (Escandell Vidal 1999). Na interrogativa total, foco do nosso trabalho, a incógnita é respondida afirmativamente ou negativamente — “¿Tiene mermelada?”; diferentemente das parciais, cuja incógnita é assinalada por um pronome, adjetivo ou advérbio interrogativo — “¿De dónde vienes?”. Em relação às interrogativas totais, na variedade argentina (Buenos Aires), Sosa (1999) propõe um padrão melódico descendente para o prénúcleo, o primeiro vocábulo tônico do enunciado, e para o núcleo, último vocábulo tônico do enunciado final, um padrão ascendente: H*+L _____ L+H*H%. Diferentemente de Sosa (1999), Gabriel et al. (2010) propõem, para esta mesma variedade, um padrão entonacional distinto tanto para o pré-núcleo como para o núcleo. Segundo tais autores, o contorno entonacional apresenta pré-núcleo ascendente e o núcleo, escalonamento ascendente. O tom de fronteira final é ascendente-descendente – L+H* _____ L+¡H*HL%. Já para as interrogativas totais na variedade chilena, o contorno entonacional apresenta um acento pré-nuclear ascendente (Ortiz et al. 2010). O acento nuclear também é ascendente e o tom de fronteira é alto-ascendente – L+H* _____ L+H*HH%. Em vista disso, nos perguntamos: (i) quais são os contornos entonacionais encontrados em conversas coloquiais dos enunciados interrogativos totais nas variedades argentina (Buenos Aires) e chilena (Santiago do Chile)?; (ii) que diferenças entonacionais há entre os enunciados interrogativos do espanhol argentino (Buenos Aires) e do espanhol chileno (Santiago do Chile)? e (iii) haverá diferenças entonacionais nos enunciados interrogativos em relação ao seu uso no discurso? 2. Corpus e Métodos Do ponto de vista metodológico, estudaremos a entoação inserida em um contexto comunicativo espontâneo, isto é, sem nenhum planejamento prévio 85 Caderno de Resumos (Blanche-Benveniste 1998). Nosso corpus é composto por conversas que, segundo Briz (2002) e Kerbrat-Orecchioni (2006), é o protótipo do discurso oral e coloquial. A partir disso, é possível caracterizar a conversação como um discurso oral, dialogal, imediato, cooperativo e, sobretudo, um discurso que não possui alternância de turnos pré-determinada (BRIZ 2002), em outras palavras, cada participante da conversa fala alternadamente sem que haja um momento planejado para que um comece o seu turno ou que o mesmo seja interrompido. Esta alternância de turnos se rege por princípios e regras que controlam o desenvolvimento da conversação, que deve ser entendida como um negócio social uma vez que é regulada socialmente por princípios e máxima: regras de cooperação, regras de cortesia e regras de pertinência situacional. No entanto, numa conversação coloquial, nem sempre tais regras são cumpridas visto que os participantes de uma conversação podem intervir e se sobrepor à fala do outro. Isto ocorre não por desrespeito às regras supracitadas, mas como uma tentativa de colaborar com a negociação ou demonstrar interesse pelo que se está dizendo. É importante destacar também que a conversação coloquial se estabelece entre interlocutores que possuem uma relação vivencial de proximidade, uma experiência compartilhada. Além disso, entre os interlocutores deve haver uma relação de igualdade bem como o tema em discussão deve fazer parte do cotidiano dos mesmos e o tom deve ser informal. O corpus FISCHER é composto por setenta e nove gravações de conversas telefônicas, realizadas por ligações de longa distância desde os Estados Unidos, do ano de 1995, entre pessoas que se conhecem (amigos, familiares, etc.). Vale mencionar que a fala não é limpa e o vocabulário das conversas não é restrito, isto é, pode apresentar ruídos de fundo. Dessas setenta e nove gravações, selecionamos quatro gravações que constituirão o corpus da nossa pesquisa, sendo duas gravações entre falantes de espanhol da variedade de Buenos Aires e duas da variedade de espanhol de Santiago do Chile, totalizando oito informantes, quatro para cada variedade estudada – dois informantes do sexo masculino e dois, do sexo feminino. Totalizando, assim, 75 enunciados interrogativos, sendo 38 enunciados da variedade de Buenos Aires e 37, da variedade de Santiago do Chile. Estes 75 enunciados foram submetidos ao programa computacional de análise acústica PRAAT (Boersma & Weenink 1993-2013) para que possamos encontrar o contorno melódico dos mesmos. Para dar conta da análise fonética, analisamos o comportamento da frequência fundamental (F0) no pré-núcleo e 86 4º Colóquio Brasileiro de Prosódia da Fala no núcleo dos enunciados interrogativos. Para a análise fonológica, nos baseamos na versão do modelo Sp_ToBI, Spanish Tones and Break Indices (Estebas Vilaplana & Prieto 2008), que se baseia no modelo métricoautossegmental (AM) de Pierrehumbert (1980). Neste modelo a letra H (high) representa um tom alto e a letra L (low), um tom baixo. O SP_ToBI constitui uma nova proposta de etiquetagem prosódica da língua espanhola capaz de representar os contrastes entonacionais encontrados em cada variedade. Finalmente, os enunciados foram classificados pragmaticamente de acordo com a função que os mesmos ocupam no discurso. Consideramos em nossa investigação o modelo adotado por Hedberg et al. (2010) que prevê cinco dimensões pragmáticas de acordo com cada instância em que se usam as interrogativas – busca de informação (IS); mudança de turno (FP); mudança de tópico (TC); interrupção (INT) e conteúdo proposicional (IR) – e nove categorias pragmáticas utilizadas para classificar a função de cada pergunta no discurso, a saber detalhe de elaboração, mudança de turno de fala, diretor do fluxo de informação, pergunta retórica, pedido de informação suplementar, iniciador de tópico, pergunta recíproca, pergunta esclarecedora e retomada de tópico. Cada categoria foi identificada minimamente para que fosse diferente das outras categorias em pelo menos uma das cinco dimensões. 3. Resultados Parciais Os resultados parciais demonstram diferenças significativas entre os enunciados interrogativos da variedade de Buenos Aires e de Santiago do Chile. Para a primeira variedade, 47% dos 38 enunciados analisados apresentam contorno melódico final com sílaba tônica alta seguida de tom de fronteira altodescendente (L+¡H*HL%). Ao passo que na variedade de Santiago do Chile, 78% dos 37 apresentam contorno melódico final com sílaba tônica alta seguida de tom de fronteira ascendente (L+H*HH%). Referências Aguilar, L.; De-La-Mota, C.; Prieto, P. (coords). 2009. Sp_ToBI Training Materials. Disponível em: http://prosodia.upf.edu/sp_tobi/en/ Blanche Benveniste, C. 1998. Estudios lingüísticos sobre la relación entre oralidad y escritura. Barcelona: Gedisa Lea. 87 Caderno de Resumos Briz, A. 2002. El español coloquial en la clase de E/LE. Madrid: SGEL. B o e r s m a , P. & We e n i n k , D . 1 9 9 3 - 2 0 1 0 . P r a a t . D i s p o n í v e l e m : http://www.fon.hum.uva.nl/praat/ Escandell Vidal, M. V. 1999. “Los enunciados interrogativos. Aspectos semánticos y pragmáticos”. In: Bosque, I. & Demonte, V. Gramática Descriptiva de la Lengua Española. Madrid: Espasa. Estebas Vilaplana, E. Y Prieto, P. 2008. “La notación prosódica del español: una revisión del Sp_ToBI”. In: Estudios de fonética experimental XVII. Barcelona: Laboratori de Fonética de la Universidad de Barcelona. Gabriel, C. et al.. 2010. “Argentinean Spanish Intonation”. In: Pietro, P. & Roseano, P. (org.). Transcription of Intonation of the Spanish Language. Lincom Europa: München. Hedberg, N. et al.. 2010. Prosody and pragmatics of wh-interrogatives. In: HEIJL, M. 2 0 1 0 C L A C o n f e re n c e P ro c e e d i n g s . C a n a d á . D i s p o n í v e l e m : http://homes.chass.utoronto.ca/~cla-acl/actes2010/actes2010.html Kerbrat-Orecchioni, C. 2006 [1996]. Análise da conversação: princípios e métodos. Tradução: Carlos Piovezani Filho. São Paulo: Parábola. Ladd, D. R. 1996. Intonational phonology. Cambridge: CUP. Ortiz, H. et al.. 2010. “Chilean Spanish Intonation”. In: Pietro, P & Roseano, P. (org.). Transcription of Intonation of the Spanish Language. Lincom Europa: München. Pierrehumbert, J. B. 1980. The phonology and Phonetics of English Intonation. Tesis doctoral, MIT, Cambridge, Massachusetts. Sosa, J. M. 1999. La entonación del español. Su estructura fónica, variabilidad y dialectología. Madrid: Cátedra. 88 4º Colóquio Brasileiro de Prosódia da Fala Relação entre prosódia e seus constituintes e a realização de sândi vocálico externo na leitura Ceriz Graça Bicalho Costa1, Camila Tavares Leite2 1 Faculdade de Letras, Universidade Federal de Minas Gerais, Brasil 2 Faculdade de Letras, Universidade Federal de Alagoas, Brasil [email protected], [email protected] Nosso trabalho tem como objetivo principal tratar a relação entre leitura, organização prosódica e eventos de sândi vocálico externo. Em experimentos com leitura em voz alta, Leite e Costa (2011) observaram que a velocidade de leitura e a entoação são fatores que influenciam tanto a realização de sândi quanto a organização dos constituintes prosódicos. No experimento realizado, foi considerada como variável independente a velocidade de leitura e como variáveis dependentes a quantidade de realizações do sândi em cada leitura, a quantidade de sintagmas entoacionais em cada leitura e a organização temporal de cada leitura. Participaram de tal experimento cinco informantes do sexo feminino, pós-graduandas da Faculdade de Letras da UFMG. O corpus foi constituído de três diferentes condições de leitura: a) na leitura 1, foi solicitado às participantes que realizassem a leitura com velocidade normal; b) na leitura 2, as pesquisadoras pediram que as participantes lessem o texto em uma velocidade rápida e c) na leitura 3, as participantes foram instruídas a realizar a leitura como se fosse destinada a crianças. A preferência pelo termo “velocidade” em detrimento de “entoação” se deveu ao fato de as informants não terem conhecimento específico sobre a terminologia da Fonologia Entoacional. Esse experimento gerou um total de quinze leituras. Inicialmente, as informantes leram o texto várias vezes para que se familiarizassem com ele. As gravações foram realizadas na cabine acústica do LABFON/FALE da Universidade Federal de Minas Gerais, em uma única sessão. Como resultados, as pesquisadoras observaram que: a) o número de sintagmas entoacionais (Nespor & Vogel 1986) realizados em cada leitura não sofreu variação relevante, entretanto notaram que nas leituras 1 e 2, as participantes 89 Caderno de Resumos apresentaram maior coincidência com relação à formação dos sintagmas. Na leitura 1, foram encontrados 19 (dezenove) sintagmas entoacionais com formação igual para todas as participantes, na leitura 2, esse número cai para 5 (cinco) sintagmas entoacionais iguais, e na leitura 3, sobe para 18 (dezoito) – as autoras chamaram de sintagmas entoacionais iguais aqueles compostos pelas mesmas palavras –; b) o número de ocorrência de sândi é maior na Leitura 2 (em média temos, na leitura 1 um total de 12; na leitura 2, 15; e na leitura 3, 13). c) A taxa de articulação é maior na leitura 2, o que justifica o maior número de sândi nesta leitura. Observando dados apresentados, Leite e Costa (2011) não encontraram diferenças substanciais entre as três leituras, principalmente no que diz respeito às leituras 1 e 3. Entretanto, sabe-se que há diferenças importantes entre uma leitura considerada normal e uma destinada a crianças. Vidal e Frota (2007) apresentam, como característica de um discurso destinado a crianças, o fato de este discurso apresentar um menor número de palavras por frase, um maior número de repetições e expansões, melhor articulação e menor complexidade estrutural, além de uma prosódia particular, onde se verifica um nível de F0 globalmente elevado, uma gama de variação estendida e movimentos acentuados de F0, diminuição da velocidade do discurso, pausas mais longas e frases mais curtas. No trabalho que ora propomos, temos como objetivo apresentar as diferenças prosódicas existentes entre as leituras 1 e 3 e as consequências dessas diferenças para a realização de sândi. Para isso, analisamos as pausas e os tons de fronteira dos dados do experimento de Leite e Costa (2011), além de contextos específicos nos quais há possibilidade de realização de sândi. Devido ao fato de a leitura 3 ser destinada a crianças, nossa hipótese se baseia no fato de que a principal diferença entre as leituras 1 e 3 está na atribuição de tons de fronteira, mais especificamente, esperamos encontrar maior número de tons de fronteira alto, H%, em sintagmas entoacionais intermediários, além de pausas mais longas entre estes sintagmas. Visto isso, nossa análise se centra na observação do local e da duração das pausas e dos tons de fronteira (Pierrehumbert 1980; Beckman & Pierrehumbert 1986; Ladd 1996), levando em consideração que estes tons estão associados a fronteiras de sintagmas entoacionais. Ademais, foram destacados seis pontos do texto analisado anteriormente por Leite e Costa (2011). · Então o cacique Itaki… · Até que um dia a filha do cacique… · Ficou vários dias enclausurada em sua tenda e pediu à Tupã que… 90 4º Colóquio Brasileiro de Prosódia da Fala · Aproximou-se da porta de sua oca e viu sua linda filhinha sorridente… · Iaçã, inconsolável, chorou muito até desfalecer · …porém no rosto trazia ainda um sorriso de felicidade e seus olhos negros fitavam... Trata-se de ambientes específicos nos quais há possibilidade de ocorrência de sândi e de segmentação de sintagma entoacional. Portanto, é um contexto em que o sândi pode ou não ocorrer. Neste caso, interessa-nos também analisar o porquê da não-ocorrência dos fenômenos de sândi nesses ambientes. Como considerações a respeito de nossas análises, apontamos que de todos os dados analisados (número de pausas no enunciado, número de sintagmas entoacionais no enunciado, tempo de pausa entre os sintagmas entoacionais, tempo de elocução do enunciado, tempo total de pausa no enunciado, porcentagem de pausa no enunciado e tons de fronteira), apenas os tons de fronteira e a pausa apresentaram diferença ao compararmos as leituras 1 e 3. Ao contrário do que era esperado, encontramos maior porcentagem de tons baixos, L%, na leitura 3 – leitura destinada a crianças – e, ao nosso ver, parece que esse fator influenciou o tempo de pausa realizado durante a leitura. O tom de fronteira baixo, por já ser um indicador de final de Enunciado, é suficiente para apontar fronteira intermediária, não exigindo maior tempo de pausa. Referências Beckman, M. & Pierrehumbert, J. 1986. Intonational structure in English and Japanese. Phonology Yearbook 3: 255-310. Ladd, D. R. 1996. Intonational Phonology. Cambridge: Cambridge University Press. Leite, C.T. & Costa, C. B. 2011. “O papel da prosódia na organização dos constituintes prosódicos e sua importância na realização de sândi vocálico externo na leitura”. In Anais do Colóquio Brasileiro de Prosódia da Fala: 18-21. Nespor, M. & Vogel, I. 1986. Prosodic Phonology. Dordrecht: Foris. Vidal,Maria M. & Frota,Sónia (a aparecer). 2007. “Influência da entoação na compreensão do discurso em crianças com desenvolvimento normal e atraso de desenvolvimento da linguagem”. In Revista Re-Habilitar, ESSA. 91 Caderno de Resumos Marcação prosódica e status referencial em português brasileiro Cíntia Antão¹, Luciana Lucente ², Pablo Arantes³, Maria Luiza Cunha Lima4 1 Faculdade de Letras, Universidade de Minas Gerais, Brasil Departamento de Letras, Universidade Federal de Minas Gerais, Brasil 3 Departamento de Letras, Universidade de São Carlos, Brasil 2,4 [email protected],[email protected], [email protected], [email protected] Este trabalho tem por objetivo analisar como diferentes posições sintáticas podem influenciar na marcação prosódica do status informacional. O status informacional, ou status da informação, de uma palavra ou expressão, é definido em um contexto discursivo pelo fato de uma palavra estar inserindo uma informação nova ou já presente neste contexto. Por exemplo, em uma comunicação, os participantes vão gradativamente inserindo novas informações em seu discurso. Essas informações podem ser totalmente novas, sem nunca terem sido mencionadas no discurso ou podem se relacionar com informações anteriormente já mencionadas. A estrutura da informação, de acordo com Chafe (1976) e Haviland e Clark (1974), foi no início das pesquisas nessa área tradicionalmente dividida da seguinte forma: a) informação dada: previamente mencionada no discurso; b) informação nova: ainda não apresentada no discurso. Essa classificação, por definir o status informativo em apenas duas classes possíveis reflete apenas ideias opostas, sem itens intermediários de catalogação. Trabalhos mais recentes, como o de Gundel et al. (1993), propõem um refinamento a mais nessa divisão. A autora apresenta em sua proposta de taxonomia níveis intermediários de acessibilidade. Por basear-se na saliência do referente em relação aos interlocutores, foi possível uma classificação ampla e aplicável a diferentes idiomas, como o inglês, o espanhol e o japonês. Ainda 92 4º Colóquio Brasileiro de Prosódia da Fala segundo a autora, o estabelecimento do status referencial de um sintagma envolve diversos fatores linguísticos e discursivos, entre os quais, os contornos prosódicos. Como novidade, em sua taxonomia, para além das informações novas e dadas, Gundel apresenta, entre outros, o referente acessível - que não chega a ser uma informação nova, mas também não funciona como uma informação dada, uma vez que pode ser acessado com o auxílio do contexto. Para melhor exemplificar, temos as frases, retiradas de Delfino et al. (2013), a seguir: a) Ninguém visitou a praça durante a reforma. O monumento custou muitos recursos públicos. (acessível) b) Os vândalos quebraram o monumento durante a noite. O monumento custou muitos recursos públicos. (dado) c) O jornal denunciou a corrupção na secretaria. O monumento custou muitos recursos públicos. (novo) Algumas línguas têm esta interação entre prosódia e status informacional muito bem descritas, como é o caso do alemão. Baumann (2006) e Baumann e Riester (2010) verificaram que, como esperado, as informações novas são prosodicamente mais proeminentes e as informações dadas menos. No caso dos referentes acessíveis, a marcação se dá em níveis intermediários. Schumacher e Baumann (2010) foram um pouco além e investigaram como é processado o status informacional de um referente combinado com três diferentes tipos de realizações prosódicas – uma entoação apropriada e duas inapropriadas. Os dados comprovaram que os participantes do experimento utilizavam as informações prosódicas para interpretar as sentenças. O ouvinte pode estranhar, por exemplo, a prosódia de um referente novo em um sintagma cujo status informacional fosse dado. Já em português brasileiro (PB), pesquisas realizadas por Arantes et al. (2012) e Delfino et al. (2013) descreveram os parâmetros prosódicos do status referencial em PB e observou-se diferença de saliência entre referentes novos e dados, mas não entre aqueles tipos de referentes e os acessíveis. Dado e acessível se comportam de maneira extremamente parecida e, por isso, nesta pesquisa não trabalharemos com os referentes acessíveis. Além da saliência referencial, também deve-se levar em conta a contribuição da posição sintática do referente para a saliência informacional. Sujeito e objeto tem diferenças de saliência e referentes dos dois tipos podem acontecer nas duas posições sintáticas. 93 Caderno de Resumos Além do objetivo supracitado de investigar o comportamento do contorno prosódico de referentes novos e dados em posições sintáticas distintas, este trabalho visa analisar se a posição no início absoluto da sentença para sujeitos em condição de novo altera o efeito prosódico. Para tanto, construimos estímulos iniciados com um sintagma adverbial, como exemplificado a seguir: d) Um casamento pouco ortodoxo foi prestigiado pelos frequentadores da paróquia. O casamento foi lindo. e) Recentemente, um casamento pouco ortodoxo foi prestigiado pelos frequentadores da paróquia. O casamento foi lindo. Apresentaremos dois tipos de experimentos: um de produção e outro de percepção. No experimento de produção relataremos os resultados combinando duas variáveis, a sintática (sujeito, sujeito não inicial e objeto) e a referencial (novo e dado). Para realização do experimento foram criadas 144 pequenas narrativas formadas por duas frases em sequência. Os referentes são palavras paroxítonas com 4, 5 e 6 sílabas. Referentes novos foram introduzidos no sujeito, depois de um sintagma adverbial ou no objeto da primeira frase e retomados na frase seguinte tanto no sujeito quanto no predicado. Ao todo, foram gravados quatro sujeitos, dois do sexo feminino e dois do sexo masculino, com idades entre 21 e 32 anos. Todos são de Belo Horizonte e realizaram a tarefa voluntariamente. Cada um deles gravou duas versões das sentenças em uma cabine anecóica no Labfon - Laboratório de Fonética da FALE/UFMG. As frases eram introduzidas através de uma apresentação de Powerpoint e depois de lida o próprio sujeito deveria clicar na tecla para que a outra sentença aparecesse. Cada gravação durou em média 90 minutos, por isso, foram realizados algumas pausas – normalmente 3, com intuito de não alterar o ritmo de leitura do participante. Gravamos, analisamos e fizemos as segmentações das sentenças com o programa Praat. Os resultados mostram que, na posição de objeto, o contorno entoacional dos referentes é bastante semelhante qualquer que seja seu status referencial. Os referentes novos, tanto em posição de sujeito quanto em posição de sujeito não inicial, tendem a apresentar um movimento tonal de maior amplitude em relação àquele observado quando o referente está em posição de objeto. Referentes dados tendem a apresentar um contorno pouco expressivo. As diferenças de proeminência prosódica apontadas na literatura podem ser encontradas em português, mas parecem ser próprias da posição de sujeito. A 94 4º Colóquio Brasileiro de Prosódia da Fala posição de objeto parece neutralizar a ação da prosódia no sentido de distinguir os dois valores de status referencial. A verificação desta interação põe um desafio para as teorias de saliência, que precisarão explicar as causas subjacentes deste fenômeno. O outro experimento realizado foi o de percepção. Foram utilizadas as mesmas frases do experimento anterior, mas em número um pouco reduzido, 48 sentenças no total. Com o script já montado na plataforma Sgizmo, era pedido ao participante que fizesse uma leitura silenciosa das sentenças e imaginasse que estaria lendo-as em voz alta. Por fim, deveria marcar qual das duas ocorrências falaria de forma mais proeminente. De maneira geral, estes resultados corroboram com os resultados do primeiro experimento. A posição sintática de sujeito, sendo ele inicial ou não, parece prevalecer. Ela se destaca como detentora da proeminência prosódica, independente do status informacional de novo ou dado. Ao se comparar as sentenças com objeto novo e objeto dado percebe-se que os resultados são muito parecidos e não apresentaram diferença significativa. Fazendo a mesma comparação com a posição sintática de sujeito, observou-se que em todos os casos em que ele é dado a curva entoacional é mais proeminente do que quando ele é novo. Resultado também encontrado no trabalho de Lucente (2012), que pesquisou, dentre outros, os aspectos dinâmicos da fala e da entoação em relação ao dado e novo em fala espontânea. Podemos perceber que há uma certa coerência entre a fala espontânea e a fala de laboratório em relação à interação entre prosódia e status informacional. Referências Arantes, P. et al. 2012. Some prosodic correlates of referential status in Brazilian Portuguese. Diadorim (Rio de Janeiro) 12 (1). Baumann, S. 2006. The Intonation of Givenness – Evidence from German. Linguistische Arbeiten, 508. Tübingen: Niemeyer. Baumann, S. & Riester, A. 2010. “Referential and Lexical Givenness: Semantic, Prosodic and Cognitive Aspects”. In Elordieta, G. & Prieto, P. (eds.) Prosody and Meaning. Berlin, New York: Mounton de Gruyter. Trends in Linguistics. Chafe, W. 1976. Givenness, Contrastiveness, Definiteness, Subjects, Topics and Pointi of View. In Li, C. (Ed.), Subject and Topic. New York: Academic Press: 25-26. Delfino et al. 2013. “Prosodic marking of referential status in Brazilian Portuguese”. In Proceedings of Production and perception of prosodically-encoded information structure. Workshop. Postdam, Alemanha. 95 Caderno de Resumos Gundel, J. et al. 1993. Cognitive Status and the Form of Referring Expressions. In Discourse. Language 69 (2): 274-307. Haviland, S. E. & Clark, H. 1974. What's New? Acquiring New Information as a Process in Comprehension. Journal of Verbal Learning and Verbal Behavior 13: 512-521. Lucente, L. 2012. Aspectos dinâmicos da fala e da entoação do português brasileiro. 2012. Tese (Doutorado) – Instituto de Estudos da Linguagem, Universidade Estadual de Campinas, São Paulo. Schumacher, P. & Baumann, S. 2010. Pitch accent type affects the N400 during referential processing. In NeuroReport 21 (9): 618-622. 96 4º Colóquio Brasileiro de Prosódia da Fala Experimento de produção sobre a prosódia da não exaustividade semântica no português brasileiro 1 2 Daise Ribeiro Pereira Carpes , Juan Manuel Sosa , Izabel Christine Seara 1 1 2 Pós-Graduação em Linguística, UFSC, Brasil Pós-Graduação em Linguística, UFSC, Brasil / Simon Fraser University, Canadá [email protected], [email protected], [email protected] 1. Introdução Este estudo configura-se em um experimento sobre a prosódia da não exaustividade semântica no português brasileiro (PB). Neste experimento, analisamos curvas de pitch de sentenças com foco não exaustivo, comparandoas com curvas de sentenças com focos exaustivo e contrastivo. 2. Os focos investigados Uma sentença com foco não exaustivo é aquela cuja proposição não é a única afirmação verdadeira para o que se está dizendo. Quando um falante oferece uma resposta não exaustiva a uma pergunta, essa resposta informa aquilo que o falante tem certeza de ser verdade, sem excluir outras possíveis respostas que possam também preencher o que está em aberto. Vejamos um exemplo. Um falante enuncia: (1) “Hoje eu almocei filé mignon.” Com a sentença em (1), o falante não está necessariamente afirmando que comeu apenas filé mignon e mais nada. Ele certamente comeu outras coisas, mas quis destacar o filé mignon em sua enunciação. Ele poderia ter dito: 97 Caderno de Resumos (2) “Eu almocei filé mignon, além de outras coisas.” Todavia, acreditamos que, no contexto em que ocorreu a sentença em (1), a entoação seja suficiente para evidenciar que o complemento “além de outras coisas” é desnecessário. Isso é o que nos propusemos a verificar empiricamente nesta pesquisa. Para que possamos investigar se há entoação particular para o foco não exaustivo, vamos comparar sua curva de pitch com as de sentenças com focos exaustivo e contrastivo, para averiguar se as curvas não se confundem. O foco exaustivo cancela todas as demais alternativas ou asserções para a situação a que se refere. Por exemplo, na sentença: (3) “Eu nasci em Florianópolis.” temos foco exaustivo, porque o falante que enuncia essa sentença não pode ter nascido em Florianópolis e em outra cidade. Já o foco contrastivo corrige uma asserção ou um pressuposto do interlocutor. Vejamos um exemplo. Um falante diz a outro: (4) “Tu és filho do Pedro.” Se não for verdade que o ouvinte é irmão do Pedro, então ele vai corrigir a afirmação, dizendo: (5) “Eu sou filho do João.” Em (5), temos foco contrastivo. Assim, pretendemos investigar se a compreensão do foco não exaustivo e, por conseguinte, do exaustivo e do contrastivo, é de caráter puramente pragmático ou se a prosódia também tem papel preponderante nesse processo. Esse é um tema ainda pouco explorado nos estudos linguísticos do português, seja ele brasileiro ou europeu. Para avaliar as curvas apresentadas por esses três tipos de foco, bem como observar semelhanças e diferenças entre eles, montamos um experimento de produção em que as situações gravadas eram adequadamente contextualizadas. Sem nos aprofundarmos muito, podemos dizer que o foco semântico é um recurso que o falante usa para dar destaque a um trecho do seu enunciado ao qual deseja que o ouvinte dê atenção especial (Klein, 2003; Menuzzi, 2012). 98 4º Colóquio Brasileiro de Prosódia da Fala Falantes de línguas como o português, o inglês, o espanhol, o italiano e o francês, por exemplo, utilizam algum tipo de marcador prosódico/melódico para fazer indicações aos seus interlocutores a respeito das entidades focadas nas sentenças que proferem. Além de a prosódia marcar o elemento focalizado na sentença, ela parece indicar o tipo de foco desse elemento. Para uma melhor compreensão, tomemos a situação em (6): (6) (a) Maria chegou a [MACEIÓ] em outubro. (b) Maria chegou a Maceió em [OUTUBRO]. Se o acento prosódico incidir sobre Maceió (6a), a sentença veicula a informação de que Maria chegou a Maceió e não a outra cidade. Se, por outro lado, o acento estiver sobre outubro (6b), então a informação nova e focalizada será referente a quando Maria chegou. Os casos ilustrados em (6) podem representar foco exaustivo ou contrastivo. Isso porque não temos aqui o contexto em que essas frases foram enunciadas. O foco será exaustivo se a informação focalizada for nova no contexto conversacional. Tal foco ocorre, por exemplo, quando (6b) for resposta a uma pergunta como “Quando Maria chegou a Maceió?”, pois a informação nova (outubro) está focalizada. Mas o foco poderá ser contrastivo se a informação focalizada estiver corrigindo uma informação dada pelo interlocutor. Por exemplo, corrigindo uma afirmação como “Maria chegou a Maceió em agosto”. Ao proferir (6b), o falante estará retificando uma asserção de seu interlocutor. Há uma relação entre o foco de uma sentença e o seu acento principal, que é também chamado de acento nuclear. Nesse caso, há uma proeminência do pitch nos constituintes focalizados. Qualquer que seja o tipo de foco, o constituinte focalizado da sentença deve conter a palavra com maior proeminência da frase. 3. Perguntas de pesquisa e hipóteses Nossa pergunta de pesquisa principal é: a curva entonacional seria suficiente para marcar a não exaustividade, ou um elemento lexical seria imprescindível para a sua percepção por parte do interlocutor? Nossa hipótese é a de que o foco não exaustivo seria marcado pela prosódia, por meio de uma curva específica para esse caso. 99 Caderno de Resumos Uma segunda questão é colocada: os três tipos de foco aqui investigados teriam uma curva entonacional particular que os caracterizasse ou seria necessário o uso de um marcador lexical? Nossa hipótese é a de que haveria a necessidade de um marcador lexical para os focos contrastivo (“não”) e exaustivo (“só”). 4. Metodologia Assim, para investigar aquilo que identifica uma sentença como tendo foco não exaustivo, exaustivo ou contrastivo, coletamos sentenças com os três tipos de foco nas quais se tem o mesmo conteúdo segmental (mesmas palavras), na modalidade declarativa, e na mesma ordem sintática. Para essa coleta, os sujeitos ouviam, para cada sentença a ser produzida, três situações que contextualizavam, respectivamente, uma sentença com foco não exaustivo, outra com foco exaustivo e uma terceira com foco contrastivo. Essa estratégia metodológica foi repetida quatro vezes, a partir de situações que levavam à geração de sentenças com os três tipos de foco. Isso resultou em 12 frases – quatro para cada tipo de foco analisado. Esse teste foi aplicado a oito sujeitos, perfazendo um total de 96 sentenças (8 sujeitos × 4 situações × 3 tipos de foco). 5. Resultados Os resultados mostraram que, de forma geral, todas as curvas apresentam um importante movimento descendente final com tom de fronteira L%, semelhante aos contornos finais das declarativas. No entanto, diferentemente das declarativas neutras, essas curvas exibem um pitch range muito mais amplo, frequentemente chegando a uma oitava entre a pré-tônica e a tônica do núcleo. Na análise detalhada dos dados, observamos separadamente o pré-núcleo, considerado a primeira sílaba acentuada do enunciado (no presente corpus, sempre o sujeito das sentenças), e o núcleo, visto como o movimento na última sílaba acentuada das sentenças (no sintagma nominal focalizado na sentença) e o tom de fronteira. Os dados mostraram dois padrões que ocorrem predominantemente. O primeiro, para sentenças com foco não exaustivo, apresenta o pré-núcleo baixo 100 4º Colóquio Brasileiro de Prosódia da Fala (L*) e o núcleo ascendente–descendente, com o movimento concentrado na sílaba tônica (¡H*L%). O segundo, para sentenças com foco exaustivo ou contrastivo, exibe um pré-núcleo alto (H*) e um núcleo com uma sílaba pré-tônica com um tom muito alto (H) em sua maioria, bem como um movimento descendente na sílaba tônica, com tom nuclear L*L%, conforme ilustra a Figura 1. a) b) 101 Caderno de Resumos c) Figura 1. Produções referentes às curvas de pitch de sentenças com: (a) foco não exaustivo; (b) foco exaustivo; (c) foco contrastivo. 6. Considerações finais Esses resultados vão ao encontro das hipóteses levantadas, ou seja, para a identificação do foco não exaustivo, parece que apenas a curva entonacional já é suficiente. No caso de sentenças com foco exaustivo ou contrastivo, parece haver a necessidade do uso de itens lexicais para a sua diferenciação e também do contexto em que a sentença foi produzida. Paralelamente, estamos dando andamento a testes de percepção para avaliarmos como os ouvintes identificam e classificam as sentenças que foram produzidas neste estudo. Referências Klein, S. 2003. “Foco no português brasileiro.” In Müller, A. L., Negrão, E. V. & Foltrão, M. J. (Org.) Semântica formal. São Paulo: Contexto. Menuzzi, S. M. 2012. “Algumas observações sobre foco, contraste e exaustividade.” In Revista Letras. 86. jul./dez. Curitiba: Editora UFPR: 95-121. Disponível em: <http://ojs.c3sl.ufpr.br/ojs2/index.php/letras/article/viewFile/29909/19907>. Acesso em: 2 mai. 2013. 102 4º Colóquio Brasileiro de Prosódia da Fala Formulações na Corte: a prosódia em ações de checagem de entendimento e de requisição de prestação de contas Daniela Negraes P. Andrade1, Ana Cristina Ostermann1 , Minéia Frezza1 1 Programa de Pós-Graduação em Linguística Aplicada, UNISINOS, Brasil [email protected], [email protected], [email protected] Como se sabe, o/a juiz/a é o/a representante institucional do poder judiciário a quem cabe o dever de dizer o direito em caso de crime concreto. A decisão do/a juiz/a é tomada com base em provas. Como resume Tourinho Filho (2008), “o objetivo ou finalidade da prova é formar a convicção do juiz sobre os elementos necessários para a decisão da causa” (p. 327). Em casos de crimes penais que não atentam contra a vida, é nas audiências de instrução e nas audiências de interrogatórios que a prova é construída. A construção da prova, nesses eventos, é realizada por meio da fala-em-interação no momento em que os/as depoentes são interrogados. Em determinadas ocasiões, ao inquirir depoentes, o/a juiz/a pode desafiá-los/as acerca de suas versões dos fatos. Tanto em contextos de fala mundana (também conhecida como “fala cotidiana”), quanto em contextos de fala institucional, a análise prosódica interacional tem-se provado “indispensável para a descrição da organização e funcionamento da interação social” por duas razões fundamentais: (a) “porque a prosódia sempre coocorre com a gramática (morfossintaxe) e o léxico” e, portanto, “é sempre coconstitutiva da expressão e realização dos significados interacionais” e (b) [porque] “em alguns casos, a prosódia cumpre uma função 'distinta' na produção de significados interacionais” (Selting 2010: 5-6; nossa tradução, ênfase da autora). Alinhado a essa perspectiva, este trabalho investiga, à luz dos pressupostos teórico-metodológicos interacionais da Análise da Conversa de base Etnometodológica (Sacks et al. 1974; Garfinkel 1967) e da Linguística Interacional (Couper-Kuhlen e Selting 1996), e por meio da análise prosódica baseada em dados interacionais (Couper-Kuhlen e Selting 1996; Szczepek Reed, 2011; Steensig e Larsen 2008), o fenômeno específico da 103 Caderno de Resumos “formulação” (Heritage e Watson 1979; Deppermann 2011) em ocorrência no ambiente institucional jurídico. A formulação é uma prática que “possibilita aos coparticipantes estabelecer uma entre as muitas possibilidades de interpretação daquilo que eles estiveram falando” (Heritage e Watson 1979: 123, nossa tradução). A ação de formular, conforme descrevem Heritage e Watson (1979), pode ser realizada, tanto pelo/a participante que está informando algo (news deliver), quanto pelo/a participante que está sendo informado/a de algo (news recipient). Além disso, ainda de acordo com esses autores, as formulações podem ser de dois tipos: gist e upshot. Na formulação do tipo gist, o falante preserva, apaga e transforma algo que foi dito no(s) turno(s) anterior(es). Ostermann e Silva (2009) sustentam que a “preservação” está ligada à conservação do sentido geral daquilo que foi dito, enquanto o “apagamento” e a “transformação” incidem sobre, pelo menos, parte do que foi falado. Em relação à formulação do tipo upshot, Antaki et al. (2005) argumentam que as ações de fala são direcionadas de modo a extrair uma implicação daquilo que foi dito. Quando comparadas às formulações do tipo gist, as formulações do tipo upshot se caracterizam por apresentarem maior grau de interpretação (i.e. de menor “preservação” do sentido geral). Ambos os tipos de formulação são de interesse do presente estudo. Acreditamos que a compreensão de como a prática da formulação é coconstruída também em seus padrões prosódicos, pode contribuir para os estudos de fala-em-interação em língua portuguesa. Quando investigada em ambientes institucionais jurídicos, a compreensão sobre como os interagentes operam com esse recurso interacional pode ter efeitos práticos para os expedientes dos profissionais do Direito. Argumentamos que a prática interacional de formular, no contexto investigado, performa duas ações específicas: (1) checar entendimentos e (2) desafiar o interlocutor a prestar contas, em particular, quanto à veracidade de suas asserções. A análise evidencia que a construção do turno onde reside a formulação varia em termos prosódicos e demostra ser marcada de acordo com a ação desempenhada local e situadamente na interação. Para o desenvolvimento das análises interacionais e prosódicas investigamos a fala de uma juíza em interação com três depoentes diferentes. O caráter desafiador que a formulação pode assumir, passível de ser observado na sequencialidade da conversa, dá-se em função do espaço interacional aberto a partir da construção do turno onde a formulação ocorre, cuja ação feita relevante – no próximo turno, do/a próximo/a falante – é justamente a de prestar contas. O termo 104 4º Colóquio Brasileiro de Prosódia da Fala “prestação de contas” é uma tradução tentativa para o termo correlato em língua inglesa accountability (GARCEZ, 2008: 27). O termo accountability foi cunhado por Garfinkel (1967: 225) para referir-se ao fato de que os atores sociais, enquanto membros/as pertencentes a uma sociedade organizada, orientam-se para “a ordem moral percebida como cursos normais de ação.” Conforme explica Heritage (1984: 191), “os fatos sociais são tratados como 'factuais', 'naturais' e 'regulares' e como fenômenos para os quais é esperado que o/a membro/a atente-se, e que os leve em consideração e respeite” nossa tradução, ênfase no original) quando em situação de interação com outrem. Sempre que a ordem social baseada no senso comum for quebrada, seja pela sequencialidade interacional ou por motivos morais, cria-se uma expectativa de que o/a falante tome esse espaço para prestar contas de modo a reconstituir a regularidade interacional e/ou moral. A ação de prestar contas, segundo explica Garcez (2004: 27), baseado em Sacks (1992), está relacionada com a “produção de conduta que seja evidentemente razoável, para todos os efeitos práticos, segundo o julgamento que outros membros fariam se estivessem na conjuntura em que se encontra o autor.” Em outras palavras, prestar contas significa justificar-se, explicar-se, pedir desculpas ou empreender alguma outra fala que demonstre a orientação dos/as participantes para um possível problema, seja de ordem moral, seja de ordem racional ou, ainda, de ordem prática, frente ao que foi dito. Nos dados aqui investigados, percebe-se que as palavras-chave para o entendimento ou confrontação dos turnos da juíza foram produzidas de forma prosodicamente proeminente em relação ao contexto anterior e posterior de sua ocorrência. Especificadamente, no contexto local e situado das interações analisadas, as palavras-chave, as que denotam o centro da checagem de entendimento e/ou o requisição de prestação de contas nas formulações da juíza, são produzidas em tons consideravelmente maiores do que as palavras de menor valor semântico para cada ação em questão. Os/as ouvintes, dessa forma, foram direcionados/as a interpretar os turnos da juíza baseados no valor semântico que a prosódia dos termos salientes indicara. Assim, ousamos afirmar que as características prosódicas observadas, quais sejam, picos de tons ascendentes nas palavras-chave das ações das formulações nos turnos da juíza, operam como “contextualizadoras” (Gumperz 1982) das ações que estão sendo performadas, quais sejam, (1) formular para checar entendimento e (2) formular para solicitar prestação de contas como forma de confrontação. Isso foi percebido, primeiramente, pelo indício de que as ações interacionais estão embasadas na ênfase dos termos a serem confirmados ou desconfirmados 105 Caderno de Resumos pelos/as interrogados/as e, em seguida, pela orientação dos/as interrogados/as a proverem a segunda parte do par adjacente conforme a expectativa gerada pelos turnos antecedentes. Para finalizar, embora entendamos que o estudo proposto inaugura a incorporação da análise prosódica às análises conduzidas pelo viés da Análise da Conversa de base Etnometodológica no Brasil, que tem negligenciado essa parte constituinte tão essencial das ações sociais empreendidas na fala-eminteração, reconhecemos suas limitações. Dentre algumas perguntas que possam surgir com relação ao fenômeno observado no contexto do uso do português brasileiro, propomos as seguintes: (a) Como, em termos comparativos, se dão as marcas prosódicas em situações em que um/uma falante desafia o/a outro/a através do uso da formulação que requer prestações de conta, porém em contexto de fala-em-interação cotidiana (e.g. um pai ou uma mãe desafiando o/a filho/a); (b) As marcas prosódicas observadas na fala da juíza ocorrem em situações semelhantes experienciadas por outros/as juízes/as ou essa é uma marca característica da fala dessa juíza em particular?; (c) Como se dão as marcas prosódicas em situações afins, porém em outro contexto institucional (e.g. entrevistas jornalísticas)? Sendo assim, a partir desse estudo, esperamos alavancar a discussão envolvendo análise prosódica e a Análise da Conversa Etnometodológica em conjunto com a Linguística Interacional sinalizando algumas linhas de investigação que se encontram em aberto no Brasil. Referências Couper-Kuhlen, E.; Selting, M. (eds). 1996. Prosody in conversation: interactional studies. New York: Cambridge University Press. Ehrlich, S.; Sidnell, J. 2006. “I think that's not an assumption you ought to make”: challenging presuppositions in inquiry testimony. Language in Society 35 (5): 655676. Freed, A. F.; Ehrlich, S. (eds). 2010. Why do you ask: the function of questions in institutional discourse. New York: Oxford University Press. Reed, B. S. 2011. Analyzing conversation: an introduction to prosody. New York: Palgrave Macmillan. Sacks, H. 1992. Lectures on conversation. Oxford: Blackwell. 106 4º Colóquio Brasileiro de Prosódia da Fala A expressividade na locução do telejornal: uma questão prosódica Dilma Tavares Luciano¹ ¹Departamento de Letras/Centro de Artes e Comunicação, Universidade Federal de Pernambuco, Brasil [email protected] 1. Introdução Este estudo trata da prosódia na locução do telejornal e das implicações na compreensão de telespectadores. Para tanto, propõe uma primeira caracterização do comportamento prosódico de locutores dos principais telejornais brasileiros, objetivando responder a questão de como a prosódia participa do processo de textualização das notícias com a leitura em voz alta (LVA), vindo a influir na compreensão do ouvinte. Parte dos pressupostos de que usar a língua é uma atividade estratégica e intencional, mesmo em uma LVA, e de que a compreensão é um processo interpretativo que instancia uma construção de sentido possível, para o qual concorrem fatores objetivos e subjetivos (cf Marcuschi 1989). 2. Aparato teórico Os modelos teóricos de Bennett e Dressler (1982), Brazil (1985) e Gumperz (1982), revisitados à luz de Barth-Weingarten, Dehé e Wichmann (2009), permitiram a identificação da expressividade na voz dos locutores, observada em seus efeitos semântico-discursivos. Entende-se que a expressividade na LVA reflete a legibilidade do texto no processo de textualização durante a locução das notícias. Assim, por um lado, a expressividade é um atributo do texto que tem assegurada a textualidade (cf. Beaugrande & Dressler 1981) na superfície textual e, por outro, está no texto e é percebida ao longo do processamento online durante a leitura (em voz 107 Caderno de Resumos alta ou não). Neste caso, a ilegibilidade decorre de lacunas nos domínios de conhecimento do leitor (cf. Koch 1997; Van Dijk 1992), quando o texto demonstrar equilíbrio em ambos os domínios de estratégias de processamento, o de formulação textual e o de envolvimento (cf. Chafe 1982). Na locução do telejornal, a legibilidade consiste, pois, num processo complexo que envolve a estrutura textual (forma e funções dentro do sistema, diz respeito à estrutura gramatical) e o uso consciente que o leitor/locutor faz das estratégias de manipulação desse sistema (processo metalinguístico, envolve a estrutura ilocutória e a interacional) e está intrinsecamente relacionada aos tipos de padrões expressivos usados na leitura. Para a LVA ser expressiva, o locutor terá a sua disposição duas formas de ação sobre o objetivamente inscrito no texto: estruturando de modo particular a matéria fônica; e realçando/acrescentando significados por meio da substância fônica e do jogo de pausas. Desse modo, acredita-se que a LVA dos telejornais fundamenta-se no princípio da expressividade, proposto por Searle (1969), o qual estabelece que é possível ao falante dizer exatamente o que ele desejar e demonstrar sua atitude para com o dito. E o leitor/locutor reconhece esta condição do escrito. Tomando os atos de fala como unidade básica da comunicação, Searle reconhece a existência de regras constitutivas e de regras regulativas no uso da língua, a partir das quais é possível perceber a habilidade que todo e qualquer falante possui de operar com a língua por meio de atos enunciativos, proposicionais e ilocucionários, suscetíveis às condições de produção e de comunicação. As regras constitutivas permitem a criação ou definição de novas formas de comportamento linguístico adequado às situações comunicativas, enquanto as regulativas são aquelas que controlam/regulam as formas existentes, independentemente da situação. Com base nesse princípio, assume-se a LVA como um processo de retextualização e busca-se entender que aspectos da elocução são constitutivos da fluência discursiva do leitor, aquela que colabora com a compreensão do ouvinte, juntamente à fluência sintática. De certa forma, a fluência no plano sintático revela um conjunto de convenções da língua, ao passo que no plano discursivo, a fluência na LVA resulta de decisões de atribuição de sentido situativamente condicionada, o que significa que está subordinada mais diretamente à compreensão do próprio leitor e ao seu envolvimento com o texto, marcando-lhe uma expressão (cf. Chafe 1982). Para identificar esse aspecto na locução, a análise dos dados seguiu o modelo de Brazil (1985), com base no qual se observa a incidência de proeminências que são determinadas no domínio de três variáveis - a base, a terminação e o tom - e as quais se constituem de dois traços distintivos: a 108 4º Colóquio Brasileiro de Prosódia da Fala diversidade de tons (dois tons ascendentes, denominados tons alusivos - r e r+; dois descendentes, ou tons informativos - p e p+; e um tom neutro, ou no nível o) e a variação de nível tonal. Distribuídos em unidades tonais (TU), a cada um desses tons são atribuídos valores comunicativos de natureza informativa ou interacional. Os tons descendentes recaem sobre elementos considerados pelo falante como informação nova, ficando os tons ascendentes para as alusões a conteúdos partilhados pelos interactantes, servindo de ancoragem textual para os conhecimentos novos. A esses tons podem ser atribuídas funções específicas, que podem ser: (a) informativa da natureza do dito; (b) indicativa de entrega de turno; (c) informativa da natureza da contribuição a ser dada pelo ouvinte; e (d) avaliativa da contribuição do ouvinte. Resumidamente, são as funções organizacional, social e informativa (propriamente dita). Acredita-se, assim, com Bennett e Dressler (1981), na existência de uma forma prosódica em harmonia com o nível léxico-gramatical do discurso, capaz de determinar a intenção comunicativa do falante/leitor. Esses pesquisadores propõem uma teoria da compreensão com base na identificação das funções comunicativas exercidas pelos aspectos prosódicos, sugerindo duas dimensões gerais de análise, as quais acreditam serem válidas também para a LVA: a dimensão horizontal e a dimensão vertical. Na dimensão horizontal da prosódia, observam-se os efeitos causados pela segmentação em níveis tonais e pela diferença de um grupo para outro em volume (crescendo/decrescendo). A dimensão vertical, por sua vez, refere-se à segmentação em unidades tonais, às proeminências e à tonicidade dos grupos tonais. Assim, foram assumidas duas ordens de observação da prosódia: (i) as determinações sintáticas e semânticas, caracterizando a coesão prosódica, e (ii) na perspectiva funcional, a caracterização do contorno entoacional. 3. Metodologia Compôs o banco de dados para análise prosódica, gravações de duas edições dos noticiários televisivos exibidos em Recife e 14 edições dos telejornais exibidos em rede nacional, distribuídas equitativamente entre as quatro emissoras de maior audiência brasileira. Esse material permitiu a identificação tipológica da composição textual das notícias e do comportamento prosódico peculiar a cada tipo, o qual foi submetido a teste preliminar de compreensão, consistindo na exibição uma a uma das notícias 109 Caderno de Resumos prototípicas a cada um dos informantes, após o que se indagou acerca do conteúdo da notícia. Em seguida à síntese de cada participante, foram feitas perguntas pontuais fundadas em palavras-chave ou expressão primordial para a compreensão de cada notícia. Para a composição do corpus, os resultados preliminares obtidos serviram à produção de uma pequena edição de telejornal (no laboratório de Comunicação do Centro de Artes e Comunicação, da UFPE), dessa vez com a manipulação da LVA, feita por locutores convidados para participar da construção do material de teste de compreensão final. Essa edição manipulada compôs-se de cinco notícias, com dois locutores, após observação e exercício da LVA, conforme os padrões prosódicos encontrados na análise. Com essa edição de telejornal, os informantes foram submetidos a novo teste de compreensão. 4. Resultados A análise prosódica permitiu verificar a existência de dois tipos básicos de expressividade na locução, que foram denominadas leitura natural (LN) e leitura padrão (LP), observados com base na noção de contextos interativos entoacionais, de Brazil (1985) e na análise das proeminências no eixo horizontal e das estratégias de oralidade no eixo vertical, conforme Bennett e Dressler (1982). Esses tipos foram submetidos a teste de compreensão com 72 informantes, distribuídos em dois grupos em função do grau de escolaridade, verificando a menor suscetibilidade ao comportamento prosódico para a compreensão das notícias por parte dos informantes com maior grau de escolaridade. Desse modo, a prosódia na LN colaborou para a compreensão do grupo de informantes com baixo grau de escolaridade. Destaque-se, no entanto, que os resultados obtidos com essa pesquisa não se fecham neste trabalho, nem se esgotam as possibilidades analíticas, mas pretende abrir o leque a novas pesquisas que possam explicar o que ocorre quando a prosódia encontra a pragmática e o discurso, estabelecendo recortes de sentido. 110 4º Colóquio Brasileiro de Prosódia da Fala Referências Barth-Weingarten, D; Dehé, N. & Wichmann, A. 2009. Where prosody meets pragmatics. NL: Brill. Series Studies in Pragmatics, 8. Beaugrande, R. & Dressler, W. 1981. Introduction to text linguistics. Londres: Longman. Bennett, R. & Dressler, W. 1982. “Melodies bristling with change: prosody and understanding conversation.” Journal Sociological Methodos & Research 11 (2): 195-212. Disponível em: http://smr.sagepub.com/content/11/2/195 Brazil, D. 1985. “The communicative value of intonation in English”. Discourse Analyses Monograph, 8, Birmingham, English Language Research. Chafe, W. 1982. “Integration and involvement in speaking, writing, and oral literature”. In Tannen, D. (ed.) Spoken and written language: exploring orality and literacy. Norwood, N.J.: Ablex. Gumperz, J. 1982. Discourse strategies. Cambridge, Cambridge University Press. Koch, I. 1997. O texto e a construção e sentido. São Paulo: Contexto. Marcuschi, L. A. 1989. O processo inferencial na compreensão de textos. Relatório final do projeto de pesquisa - CNPq., UFPE. Searle, J. 1969. Speech acts: an essay in the philosophy of language. Cambridge: Cambridge University Press. Van Dijk, T. 1992. Cognição, discurso e interação. São Paulo: Contexto. 111 Caderno de Resumos Pistas prosódicas de fronteiras discursivas em narrativas espontâneas: um estudo de percepção 1 2 1 Ebson Wilkerson , Júlia Lopes Pereira , Miguel Oliveira, Jr. , 2 2 Regina Fernandes Cruz , Francisca Carvalho 1 Faculdade de Letras, Universidade Federal de Alagoas, Brasil 2 Faculdade de Letras, Universidade Federal do Pará, Brasil [email protected], [email protected], [email protected], [email protected], [email protected] 1. Introdução O presente artigo trata de um estudo experimental e perceptual baseado em fenômenos prosódicos observados na fala produzida espontaneamente. Estudos dessa natureza, em prosódia do português falado no Brasil, têm encontrado maior espaço, nos últimos anos, pela sua relevância no que diz respeito ao aprimoramento de estudos sobre os aspectos prosódicos da fala. Entretanto a maior parte deles é feita com dados de fala não espontâneos/induzidos. Nesta perspectiva, Oliveira Jr. (2000) demonstrou que a prosódia constitui um fator relevante segmental em estudo de produção que analisa o papel delimitador de algumas variáveis prosódicas na estruturação discursiva de narrativas orais espontâneas. Mais tarde, Silva e Oliveira (2011) constataram a mesma hipótese e reforçaram-na com a ideia de que as variáveis prosódicas também facilitam a percepção da estrutura do texto narrativo. Sendo assim, este estudo tem como principal objetivo analisar as pistas prosódicas pausa e tom, no que diz respeito à percepção da delimitação da estrutura de narrativas orais espontâneas. Especificamente, o estudo busca, entre outros objetivos, examinar, por meio de uma análise acústica, se os elementos prosódicos pausa e tom estão, recorrentemente, associados a fronteiras discursivas estabelecidas perceptualmente e avaliar a importância que esses elementos prosódicos têm, isoladamente e em conjunto, na compreensão do texto narrativo. 112 4º Colóquio Brasileiro de Prosódia da Fala Desse modo, conforme a proposta de Oliveira Jr. (2000), consideram-se as variáveis (i) pausa e (ii) tom como corolário, pelas seguintes razões: a) as pausas encontradas em fronteiras discursivas designadas perceptualmente são maiores que aquelas localizadas em outras posições e; b) o tom baixo ocorre com maior frequência diante de fronteiras discursivas, enquanto os tons médio e alto ocorrem com mais frequência em outras posições. 2. Material Este experimento é composto de quatro narrativas que foram extraídas de um corpus de gravações feitas de fala espontânea (Oliveira Jr. 2000). Para a análise, primeiramente o material foi transcrito ortograficamente, de modo linear, sem marca de pontuação e sem indicação de paragrafeamento. Em seguida, as narrativas foram apresentadas a 112 participantes convocados voluntariamente, estudantes da graduação ou pessoas já graduadas, de faixa etária variando entre 18 e 53 anos, sendo 70 informantes do sexo feminino e 42, do sexo masculino. 3. Método Os participantes foram submetidos à tarefa de indicar, nas narrativas, as pistas prosódicas que eles julgavam finalizar uma unidade comunicativa. Em seguida, foram instruídos a julgar quais seriam as fronteiras dessas unidades, em caráter puramente subjetivo. Nenhuma definição para a noção de unidade comunicativa foi apresentada ao participante. Cada narrativa foi apresentada em quatro diferentes condições. Na Condição um (C1), os participantes tiveram acesso apenas à transcrição da narrativa, sendo solicitada a segmentação em unidades comunicativas por meio de uma barra transversal (/). Na Condição dois (C2), a transcrição da narrativa acompanhada do áudio foi apresentada aos participantes. De igual modo, eles foram solicitados a segmentar a narrativa na transcrição, por meio de uma barra transversal. Na terceira Condição (C3), apenas o áudio da narrativa foi apresentado aos participantes. Eles foram solicitados a segmentar a narrativa utilizando-se, para isso,da tecla Enter do computador. Na Condição quatro (C4), uma versão deslexicalizada da narrativa foi apresentada. Os arquivos de 113 Caderno de Resumos áudio originais foram filtrados com filtro passa-banda, resultando em uma fala ininteligível, mas com a informação prosódica preservada. Novamente, para segmentar a narrativa, foi utilizada a tecla Enter do computador. Ressaltamos que a fronteira neste trabalho é a palavra prosódica. Desse modo, a análise acústica dos elementos prosódicos nas narrativas foi realizada por meio do uso dos Programas PRAAT e ELAN. Este é um aplicativo computacional desenvolvido pelo Max Planck Institute for Psycholinguistics:http//tla.mpi.nl/tools/tla-tools/élan/. O Programa PRAAT foi consultado para se verificar o Get Pitch (Tom Médio) e o Get Maximum Pitch (Tom Máximo) de cada vocábulo que constitui as Narrativas 1, 2, 3 e 4. Conferências concluídas, os resultados foram lançados em planilhas do Programa Excel, primeiramente, para especificar o total de registros nas palavras consideradas fronteiras pelos participantes. Em outra planilha, foram lançados os números referentes aos tons médio e máximo (Get Pitch e Get Maximum Pitch, respectivamente) de cada palavra das narrativas, a fim de registrar a diferença de tom entre uma palavra da narrativa e a sua subsequente. Definimos a diferença de tom (Pitch Reset) médio de 150 Hz a 550 Hz para mulheres e, para homens, de 30 Hz a 200 Hz, os quais foram medidos acusticamente, a partir da segmentação feita no teste de percepção. Na análise, apenas consideramos pausas silenciosas maiores que 250 ms, seguindo uma tradição dos estudos desse elemento prosódico. O critério estabelecido para fins de comparação e análise de uma fronteira discursiva foi a marcação de uma palavra prosódica como o final de uma unidade comunicativa por, no mínimo, 10% dos participantes do experimento, em qualquer uma das quatro condições analisadas. Finalmente, comparamos as fronteiras, os valores de duração de pausa e os valores de diferença de tom (Pitch Reset) nas segmentações realizadas sob o prisma perceptual. Todos os informantes leram e assinaram um Termo de Consentimento Livre e Esclarecido (TCLE), de acordo com a exigência do Ministério da Saúde e do Comitê de Ética em Pesquisa3. Após a assinatura, os informantes receberam instruções gerais impressas acerca do experimento, seguidas de exemplos: duas narrativas adicionais, extraídas do corpus supramencionado. 3 Estudo avaliado pelo Comitê de Ética em Pesquisa, aprovado para realização em 24/11/2010 (Processo n. 013526/2010-01). 114 4º Colóquio Brasileiro de Prosódia da Fala Neste estudo, fizemos uso do modelo estrutural proposto por Passonneau e Litman (1997), o de que os falantes segmentam as narrativas que contam com o propósito – ou intenção – de deixar claro para o ouvinte a sua organização estrutural. Verificamos a validade desse modelo para o português brasileiro. 4. Resultados Preliminares A análise dos dados não está concluída, mas os resultados preliminares já apontam que há concordância entre os informantes quanto à localização de fronteiras discursivas, como demonstrado no estudo piloto de Oliveira Jr. (2000), e que a pausa, embora seja uma variável prosódica bastante significativa para a percepção dessas fronteiras, não detém o maior número de casos da segmentação no experimento, conforme mostra a figura1, abaixo. “Figura 1:Fronteiras” . Neste caso, estuda-se a hipótese de que a diferença de tom (Pitch Reset) é uma pista forte de fronteira perceptual, visto que, ao compararmos os valores médios das diferenças de tom médio (Get Pitch) e de tom máximo (Get Maximum Pitch), em situações com e sem registro de pausa, observamos que há 115 Caderno de Resumos uma tendência maior em baixar o tom, todavia sugerimos que a predisposição para esse limite de tom não represente apenas uma pista prosódica adicional, mas seja uma variável prosódica relevante para os participantes, na marcação de fronteira. Nestes termos, os dados confirmam o que já foi debatido na literatura (Grozs e Hisrchberg 1992; Passonneau e Litman 1993) a respeito da duração da pausa. Assim sendo, os resultados demonstram que esta pista prosódica representa fator importante para a percepção da segmentação do discurso narrativo, uma vez que há indicação de um valor médio maior para a percepção de fronteiras, mesmo quando as informações lexical, sintática e semântica são suprimidas. Segundo os resultados, quando a pausa é mais longa, a ruptura discursiva tem mais chances de constar nas quatro condições apresentadas para a análise. 5. Considerações Finais Ao verificar que o ouvinte poderá beneficiar-se das marcas prosódicas na segmentação da narrativa espontânea, tomando como base o modelo de intenções proposto por Passonneau e Litman (1997), parece-nos fundamental analisar esses elementos numa abordagem acústico-experimental. Desse modo, esse suporte teórico nos ajudará a caminhar por um domínio ainda pouco trilhado: o da análise perceptual da prosódia e o da correlação entre segmentos prosódicos e segmentação do discurso narrativo. Nesse sentido, nosso interesse é suscitar questionamentos para discussões futuras. Vale ressaltar, ainda, que, sob uma perspectiva de aplicação, os resultados provenientes de um estudo como o aqui proposto têm imediata relevância para o desenvolvimento e/ou aperfeiçoamento de produtos relacionados à tecnologia da fala, por exemplo, reconhecedores automáticos e sintetizadores de fala. Referências Grosz, B.;Hirschberg, J. S. 1992. “Some intonational characteristics of discourse structure.” In International Conference on Spoken Language Processing, Banff. Oliveira Jr, M., 2000. Prosodic Features in Spontaneous Narratives. 291 fl. Tese (Doutorado em Linguística) - Simon Fraser University, Vancouver. 116 4º Colóquio Brasileiro de Prosódia da Fala ______. 2002. “O uso do tom de limite como marca de segmentação da Narrativa espontânea.” In Revista Gelne 4 (1). Passonneau,R. J.; Litman, D. J.1993. “Intention-based segmentation: Human reliability and correlation with linguistic cues.” In Proceddings of the 3ist annual Meeting of the Association for computacional Linguistics (ACL-93), Columbus, Ohio. Passonneau, R.J.; Litman, D.J.1997. “Discourse Segmentation by Human and Automated Means.” Computational Linguistics 23 (1): 103–139. Silva, E. W.; Oliveira Jr. M. 2011. “A percepção dos elementos prosódicos como marca de estruturação de narrativas espontâneas.” In: Resumo do III Colóquio Brasileiro de Prosódia da Fala. Belo Horizonte. 117 Caderno de Resumos Produção e percepção de sentenças interrogativas totais em dados de falantes de espanhol como L1 e L2: um estudo experimental 1 2 Eva Christina Orzechowski Dias , Izabel Christine Seara , Juan Manuel Sosa3 1 Pós-Graduação em Linguística, Universidade Federal de Santa Catarina, Brasil 2 Universidade Federal de Santa Catarina, Brasil 3 Simon Fraser University, Canadá [email protected], [email protected], [email protected] 1. Introdução Neste trabalho, analisaram-se as sentenças interrogativas totais em dados de duas falantes de espanhol/L1, da variedade de Bogotá, e duas falantes brasileiras de espanhol/L2, que aprenderam espanhol informalmente, durante um período de residência em Bogotá de um ano e seis meses. O objetivo foi observar uma possível transferência do padrão entoacional da língua materna (PB), considerando o tipo de aprendizado não formal, em ambiente natural. Foi realizado também um teste perceptual de identificação, a partir de dados sintetizados, com o intuito de verificar se essas participantes identificariam como perguntas as sentenças interrogativas totais realizadas em espanhol/L1, 1 em português/L1 e em espanhol/LE . 1 Para o teste de percepção, foram utilizados dados de falantes de espanhol como LE (aprendidos formalmente), uma vez que, no momento de elaborar os testes, não se dispunha de dados de falantes de espanhol como L2 (aprendido informalmente). 118 4º Colóquio Brasileiro de Prosódia da Fala 2. Revisão teórica Para a modalidade interrogativa total, estudos apontam que o espanhol colombiano e o português brasileiro apresentam diferentes padrões entoacionais, de modo que, no primeiro caso, a curva entoacional apresenta final ascendente e, no segundo, final circunflexo (Sosa 1999; Moraes 2006, respectivamente). Conforme apontam Flege e Bohn (1989), a prosódia é um elemento linguístico complexo, que pode marcar a fala estrangeira mesmo nos aprendizes com alto nível de proficiência. Diferentes autores têm apontado que há transferência de padrões entoacionais da primeira língua (L1) para a língua estrangeira (LE) (Pinto 2009; Silva 2009; Oliveira e Cantero Serena 2011). Estudos sobre entoação com dados de falantes de espanhol como segunda língua (L2), aprendido informalmente, em situação de imersão, são escassos no Brasil. A transferência linguística se relaciona com a presença de características da L1na produção e percepção da L2 e pode ser entendida como uma estratégia comunicativa, decorrente de um processo natural de aprendizagem, em que os conhecimentos existentes facilitam o processo de aprendizagem (Odlin 2008). No entanto, há divergências conceituais com relação a esse conceito, sobretudo devido a dificuldades metodológicas para observar esse fenômeno (Vilela 2009). A aprendizagem informal e a experiência de residência em região de L2 constituem fatores que podem afetar a pronúncia na L2; no entanto, os estudos não são conclusivos (Piske et al. 2001). Características prosódicas (suprassegmentais) podem afetar a compreensão e inteligibilidade na fala dos falantes de L2, muitas vezes, mais do que características segmentais (Derwing e Munro 1997; Jilka 2000). 3. Metodologia Participaram desta pesquisa quatro mulheres com faixa etária entre 30 e 60 anos, sendo duas falantes de espanhol como L1, naturais e residentes em Bogotá, e duas falantes de espanhol como L2, naturais de Belo Horizonte e Florianópolis, residentes em Bogotá durante um período de um ano e seis meses. Foram feitas sessões de gravação de frases contextualizadas, a partir de um corpus baseado no Atlas interactivo de la entonación del español (Prieto e Roseano 2009-2013). Nessas sessões, as participantes liam silenciosamente as 119 Caderno de Resumos situações conversacionais e as sentenças interrogativas correspondentes, individualmente, e, em seguida, visualizavam uma ilustração da correspondente situação e produziam, então, as perguntas. As sessões foram realizadas em Bogotá em uma sala silenciosa. Foram analisadas 44 sentenças, sendo 24 referentes às falantes de espanhol/L1 e 20 referentes às falantes de espanhol/L2. Foi feita uma análise de produção, observando os padrões melódicos das sentenças atribuídas pelos algoritmos MOMEL/INTSINT (Hirst 2007). O teste perceptual de identificação foi realizado com as mesmas participantes do experimento de produção. Para montar o teste de percepção, foram utilizados estímulos sintetizados, coletados em outro estudo (Dias e Alves 2013). Esses estímulos correspondem a frases interrogativas totais terminadas em palavras paroxítonas produzidas por uma falante de espanhol/L1, da variedade colombiana, uma falante de português/L1, e duas falantes de espanhol/LE, aprendido formalmente, em ambiente da língua materna (PB). As sentenças em espanhol L1 apresentavam padrão final ascendente (tons BHH e LUT); as referentes ao português L1 apresentavam padrão final circunflexo (tons UL), e as referentes ao espanhol/LE alternavam entre padrão final ascendente (DHH) e circunflexo (STL). A síntese dos dados consistiu em uma filtragem, realizada através do Praat2, de modo que ficaram audíveis apenas as frequências na faixa de F0 das locutoras. Esse teste de identificação foi realizado pelo programa TP (Rauber et al. 2012). Obteve-se um conjunto de 72 respostas, escolhidas entre: (1) É ou parece uma pergunta ou (2) Não parece uma pergunta. 4. Resultados Nos resultados referentes à análise melódica, elaborada através dos 3 algoritmos MOMEL/INTSINT , observou-se que as falantes de espanhol/L1 realizaram exclusivamente a curva melódica com final ascendente (tons T ou H). Na produção das sentenças pelas falantes de espanhol/L2, houve 81% de 2 Praat version 5.2.53 copyright 1992-2013, Paul Boersma and David Weenink. Tons absolutos: T (top); B (bottom); M (mid) e tons relativos: H (mais alto); S (igual); L (mais baixo); U (subida suave); D (descida suave) (Celeste 2007). 3 120 4º Colóquio Brasileiro de Prosódia da Fala casos com curva com final ascendente (tons H ou T) e 19% com padrão final descendente (tons L ou D). As Figuras 1 e 2 ilustram uma sentença interrogativa total produzida por uma falante de espanhol/L1 e outra de L2, respectivamente. Os resultados do teste de percepção mostraram diferenças na frequência de ocorrência entre os grupos com relação às respostas (1) é ou parece uma pergunta e (2) não parece uma pergunta. Os estímulos em espanhol/L1 (padrão final ascendente) foram identificados como perguntas em 92% dos casos pelas falantes de espanhol/L1 e, em 100% dos casos, pelas falantes de espanhol/L2. Já os estímulos em português/L1 (padrão final circunflexo) foram identificados, pelas falantes de espanhol/L1, como perguntas em 42% dos casos, e em 100% para as brasileiras (falantes de espanhol L2). No caso dos estímulos em espanhol/LE, tanto as falantes de espanhol/L1 quanto as de espanhol/L2 tiveram percentual de acerto mais alto para aqueles estímulos terminados com curva final ascendente (67% e 100%, respectivamente) do que os terminados com padrão final circunflexo (50% e 67%, respectivamente). Conclui-se, dessa forma, que os dados de produção das falantes de espanhol/L2 ainda apresentam o padrão entoacional de sua L1 (padrão final circunflexo), o que parece evidenciar um fenômeno de transferência da L1 para a L2. Destaca-se, no entanto, que a ocorrência de curva melódica com final ascendente em sentenças interrogativas totais (81%) pelas falantes de espanhol/L2 pode indicar que o padrão entoacional da L2 pode ser aprendido/adquirido informalmente. O período de imersão também pode constituir um dos fatores que influenciaram nesse resultado. Com relação ao teste de percepção, foi observado que as diferenças nos padrões entoacionais afetam a interpretação dos estímulos pelas falantes de espanhol/L1. Figura 1: Sentença ¿Tiene mermelada?, produzida por uma falante de espanhol/L1. 121 Caderno de Resumos Figura 2: Sentença ¿Tiene mermelada?, produzida por uma falante de espanhol/L2. Referências Celeste, L. 2007. MOMEL e INTSINT: uma contribuição à metodologia do estudo prosódico do PB. Dissertação de Mestrado, Universidade Federal de Minas Gerais. Derwing, T.M. e Munro, M.J. 1997. “Accent, intelligibility, and comprehensibility”. Studies in Second Language Acquisition (1): 1-16. Dias, E.C.O. e Alves, M.A. 2013. “Análise de produção de sentenças interrogativas totais em aprendizes brasileiros de espanhol como língua estrangeira”. Journal of Speech Sciences (2): 43-63. Flege, J.E. e Bohn, O.S. 1989. “An instrumental study of vowel reduction and stress placement in Spanish-accented English”. Studies in Second Language Acquisition, 11 (1): 35-62. Jilka, M. 2000. The contribution of intonation to the perception of foreign accent. Unpublished PhD thesis, University of Stuttgart. Moraes, J.A. 2006. “Melodic contours of yes/no questions in Brazilian Portuguese”. In Proc. of ISCA Tutorial and Research Workshop on Experimental Linguistics: 117120. Odlin, T. 1989. Language transfer: cross-linguistic influence in language learning. Cambridge: Cambridge University Press. Oliveira, A.F.D. e Cantero Serena, F. J. 2011. “Características da entonação do espanhol falado por brasileiros”. In Anais do VII Congresso Internacional da Abralim: 84-98. Pinto, M.S. 2009. Transferências prosódicas do português do Brasil/LM na aprendizagem do espanhol/LE: enunciados assertivos e interrogativos totais. Tese de Doutorado. Universidade Federal do Rio de Janeiro. Piske, T., Mackay, I.R.A. e Flege, J.E. 2001. “Factors affecting degree of foreign accent in an L2: a review”. Journal of Phonetics (29): 191-215. 122 4º Colóquio Brasileiro de Prosódia da Fala Aspectos temporais envolvidos na sobreposição de vozes em diálogos da língua Yaathe 1 1 1 Fábia Pereira da Silva , Miguel Oliveira Jr. , Januacele da Costa 1 PPGLL/Faculdade de Letras, UFAL, Brasil [email protected], [email protected], [email protected] O presente estudo se propõe a analisar o papel da prosódia na negociação de turno, a partir da observação do que ocorre em relação à sobreposição de vozes em diálogos da língua brasileira Yaathe, observando quais os elementos ou traços prosódicos que desencadeiam tal fenômeno. De acordo com a literatura (Reed 2011, 2012, Ogden 2012, Selting & Couper-Kuhlen 2001, entre outros), os elementos prosódicos que, geralmente, caracterizam a sobreposição de vozes durante o turno ou na mudança de turno são o pitch, a qualidade de voz, a velocidade de fala, o ritmo e a intensidade. Neste estudo, iremos observar os aspectos temporais no que diz respeito ao desencadeamento da sobreposição de vozes e às estratégias de negociação do turno – manutenção ou tomada de turno. Usaremos uma abordagem experimental ancorada ao quadro teórico da análise da conversação a partir do que propõem os trabalhos acima citados. Os dados aqui analisados são da língua Yaathe, conforme já mencionado, que é falada pelos índios Fulni-ô. Esses índios vivem no município de Águas Belas, localizado nas regiões do Agreste Meridional e Sertão de Pernambuco, com uma 1 população de 4.336 indivíduos . Uma das características mais notáveis da situação dos índios Fulni-ô é a sobrevivência da língua, uma vez que todas as outras línguas indígenas faladas no Nordeste do Brasil já desapareceram. Os estudos feitos sobre o Yaathe até o momento consideraram aspectos segmentais, como os trabalhos de Boudin (1950), Meland (1968), Meland e Meland (1967; 1968) Lapenda (1968), Costa (1999) e Silva (2011), ou ainda, suprassegmentais, mas no nível da palavra, e não do discurso, como é o caso do 1 Dados da Funasa (2010). 123 Caderno de Resumos trabalho de Cabral (2009) e também não existem pesquisas acerca da língua Yaathe que levem em conta a fala espontânea ou semi-espontânea. Pesquisas que tratam da interação verbal definem a linguagem como a realização de ações individuais e sociais. A conversa, nesse sentido, é um tipo de interação verbal que desenvolvemos logo cedo, assim que começamos a falar. (Marcuschi 1986). A conversa espontânea se forma a cada intervenção e interação que ocorre entre os interlocutores. A elaboração e a produção, desse modo, acontecem de forma simultânea no mesmo eixo temporal, o que, de forma alguma, quer dizer que essa formação da conversa seja aleatória e desorganizada. As definições comumente aceitas no campo da análise da conversação a respeito do que é uma conversação afirmam que um diálogo envolve pelo menos duas pessoas e uma troca de turno. O turno conversacional, de acordo com a literatura, é definido como situações em que os membros de um grupo, envolvidos em uma conversação, se alternam ou se sucedem em uma conversa. Para Levinson (2007: 376), "é evidente que a conversação é caracterizada pela alternância de turnos: um participante A, fala e para; outro, B, começa, fala e para". Em seguida, o próprio autor chama a atenção para o fato de que essa alternância de turno não é tão evidente assim e nem tão organizada, no sentido de que um fala enquanto o outro espera a sua vez. É constatado que em situações de interação o fenômeno da sobreposição de vozes é bastante comum. Diante desse fato, é possível tecermos algumas considerações a respeito da organização prosódica, verificando quais as pistas prosódicas que favorecem ou desencadeiam a sobreposição de vozes e a continuidade do diálogo sem quebra abrupta do tópico discursivo ou assunto da conversação. Essas pistas prosódicas agrupam-se em termos de certos parâmetros mais gerais, como tempo, a intensidade, etc. O tempo, por exemplo, afeta de várias maneiras e em vários trechos a conversação. Ele pode tornar-se relevante através do alongamento de sons individuais ou sílabas, mudanças na velocidade de fala e ritmo de entonação de enunciados e turnos, e em pausas relevantes do ponto de vista interacional. O tempo e o uso do tempo desempenham um papel importante na negociação dos participantes durante o ato conversacional. (Reed 2011) Trabalhos na área da prosódia têm apontado aspectos temporais, tais como a velocidade de fala, como sendo fundamental para o processo de interação tanto para produção quanto para a interpretação por parte dos interlocutores (Oliveira Jr. 2002, Coutinho & Rocha 2010 e LIMA 2007). O que ocorre em relação à velocidade de fala nos enunciados que antecedem a sobreposição de voz em diálogos é o que buscaremos investigar nos dados sob estudo, averiguando de que 124 4º Colóquio Brasileiro de Prosódia da Fala forma velocidade de fala está associada às estratégias da interação verbal, no que se refere ao favorecimento da negociação do turno. A velocidade de fala diz respeito à forma como os participantes são rápidos ou lentos falando. Essa medição é geralmente feita considerando-se a produção de sílabas por segundo. Neste trabalho, utilizamos quatro diálogos proferidos por quatro falantes de Yaathe. Os dados utilizados fazem parte do banco de dados do projeto Documentação da Língua Indígena Brasileira Yaathe (Fulni-ô). Duas duplas de colaboradores foram formadas (dois homens e duas mulheres) e gravamos dois diálogos com cada uma dessas duplas. As duplas foram formadas dessa forma para que tivéssemos a representação da voz masculina e da voz feminina, pois sabemos que há uma diferença no que diz respeito a elementos que se referem à prosódia. O assunto não foi sugerido ou dado aos falantes e a gravação foi realizada em um ambiente informal para que se garantisse a maior naturalidade possível. Em um primeiro momento, dividimos o texto de cada falante em Unidades Entoacionais. De acordo com Cole et al. (2010), há uma tendência de as Unidades Entoacionais estarem encapsuladas pelas unidades sintáticas e, por sua vez, podem representar uma unidade de planejamento para o falante ou de apresentação para o ouvinte. Os ouvintes são orientados em sua percepção por sinais acústicos / prosódicos e contexto sintático e, independentemente do contexto sintático, a duração da vogal final é a pista acústica principal para a percepção de fronteiras de unidades prosódicas. Cruttenden (1986) sugere que em 40% dos casos as Unidades Entoacionais correspondem a uma oração. Entretanto, em vários casos as IUs podem corresponder a algo menor que uma oração (advérbios, locuções adverbiais...). Há uma flexibilidade na delimitação de Unidades Entoacionais, mas a coesão sintática parece ser um forte fator por trás disso. Neste trabalho, a velocidade de fala foi calculada levando-se em conta cada unidade entoacional e, depois, calculamos a média global de velocidade de fala de cada falante em cada diálogo. É evidente também que entre os falantes há uma variação em termos da velocidade de articulação, razão pela qual são necessários valores globais da velocidade de fala dos participantes do ato interacional para que se possa fazer algum tipo de consideração a respeito desse aspecto e, assim, poderse verificar se há uma intenção no uso mais rápido ou menos rápido da fala, considerando-se a negociação do turno. É a partir de tais observações que iremos tecer nossas considerações em relação ao uso do tempo para marcar a sobreposição de vozes e a negociação do turno em diálogos da língua Yaathe. 125 Caderno de Resumos Referências Barbosa, E. 1991. Aspectos fonológicos da língua Yatê. Dissertação de Mestrado, Universidade de Brasília. Boudin, M. H. 1950. Singularidades da língua ía-té. Verbum (Rio de Janeiro), 7 (1): 66-73. Cole, J.; Mo, Y. & Baek, S. 2010. The role of syntactic structure in guiding prosody perceptio with ordinary listeners and everyday speech. Language and Cognitive Processes 25: 7-9. Costa, J. F. 1999. Ya:the, a n ltima língua nativa no Nordeste do Brasil. Aspectos morfofonológicos e morfo-sintáticos. (Tese de Doutorado). Recife: UFPE. Cruttenden, A. 1986. Intonation. Cambridge: Cambridge University Press. Dionísio, A. P. 2001. Análise da Conversação. In Mussalim, F. & Bentes, A. C. (orgs.) Introdução à linguística: domínios e fronteiras 2. São Paulo: Cortez. Disponível em: http://pib.socioambiental. org/pt/povo/fulni-o/489 Lapenda, G. 1968. Estrutura da língua Yatê, falada pelos índios Fulni-ôs em Pernambuco. Recife: UFPE, Imprensa Universitária. Levinson, S. C. 2007. Pragmática. Tradução Luís Carlos Borges, Aníbal Mari. São Paulo: Martins Fontes. Lima, M. L. 2007. Análise de Elementos Prosódicos que justificam sobreposições de vozes ocorridas no turno conversacional de entrevistas. Disponível em: http://bl152w.blu152.mail.live.com. Marcuschi, L. A. 1986. Análise da Conversação. São Paulo: Ática. Meland, D. & Meland, D. 1967. 'Fulni-ô (Yahthe) phonology statement'. Arquivo linguístico n. 025. Brasília, D.F: Summer Institute of Linguistics. Meland, D. & Meland, D. 1968. Word and morpheme list of the Fulni-ô indian language. Dallas/Texas: Summer Institute of Linguistics. Ogden, R. 2012. “Prosodies in conversation”. Journal of Linguistics. Oliveira Jr., M. & Cunha, D. A. C. 2002. Prosody As Marker of Direct Reported Speech Boundary. Reed, B. S. 2011. Analysing Conversation. An introduction to prosody. New York: Palgrave macmillan. Reed, B. S. 2012. Beyond the Particular: Prosody and the Coordination of Actions. Language and Speech. Selting, M.; Couper-Kuhlen, E. 2001. Studies in Interactional Linguistics. John Benjamins Publishing Company. Amsterdam: Philadelphia. Silva, F. P. 2011. A sílaba em Yaathe. Dissertação de Mestrado - Universidade Federal de Alagoas, Maceió. 126 4º Colóquio Brasileiro de Prosódia da Fala A prosódia como ponto de partida para a segmentação do fluxo da fala por bebês brasileiros Ícaro Oliveira Silva e Maria Cristina Name ¹ ¹ PPG - Linguística, Universidade Federal de Juiz de Fora, Brasil [email protected], [email protected] O presente trabalho tem como objetivo investigar se bebês brasileiros, com idade média de treze meses, são sensíveis a fronteiras de sintagma fonológico (? ). Estudos anteriores evidenciaram que infantes adquirindo o inglês fazem uso de pistas acústicas disponíveis nas fronteiras desse constituinte prosódico para segmentar o fluxo da fala em unidades significativas (Gout et al. 2004). Desse modo, investigamos se esse fenômeno ocorre também no Português Brasileiro (PB). Dada a possibilidade de relação entre os constituintes prosódicos e aqueles de natureza morfossintática, a pesquisa em questão é norteada pela hipótese de que as informações acústicas presentes nas fronteiras de constituintes prosódicos facilitam a segmentação da fala por crianças em processo de aquisição da linguagem, uma vez que há um mapeamento, embora nem sempre obrigatório, entre unidades prosódicas e unidades morfológicas e sintáticas. (Nespor & Vogel 2007; Christophe et al. 2008). Em concordância com o que propõem Nespor & Vogel (2007), os enunciados linguísticos podem ser organizados em constituintes fonológicos dispostos hierarquicamente. Esses constituintes são definidos tomando-se como base regras de mapeamento, que consideram as informações oferecidas pelos demais componentes da gramática, e regras fonológicas, cuja aplicação ou restrição no interior ou na fronteira de constituintes oferece evidências para a postulação dos domínios prosódicos. Os sete constituintes prosódicos previstos na hierarquia proposta pelas autoras são, em ordem crescente: Sílaba (ó), Pé Métrico (Ó), Palavra Prosódica (ù), Grupo Clítico (C), Sintagma Fonológico (? ), Sintagma Entoacional (I) e, por fim, o Enunciado Fonológico (U). O sintagma fonológico, constituinte investigado na pesquisa em questão, caracteriza-se por apresentar um ou dois itens lexicais junto com os itens funcionais associados aos primeiros e possui de quatro a sete sílabas. Destaca127 Caderno de Resumos se, ainda, pela existência de alongamento antes de sua fronteira e por haver um contorno melódico por sintagma (Gout & Christophe 2006). É o constituinte mais relevante para o mapeamento entre fonologia e sintaxe, uma vez que fronteiras de sintagma fonológico podem coincidir com fronteiras sintáticas. As pistas prosódicas contidas no domínio das fronteiras de sintagma fonológico, tais como alongamento da tônica antes da fronteira e diferentes valores para a frequência fundamental e intensidade, são utilizadas também pelos adultos no processamento sintático (Gout & Christophe 2006; Millotte et al. 2007; Silva 2009) e no acesso lexical (Alves 2010), o que sugere a existência de uma continuidade entre os mecanismos utilizados tanto pelas crianças, em processo de aquisição da linguagem, quanto por adultos, no processamento linguístico (Gout & Christophe 2006). Isso implica dizer que, para adultos e crianças, o fluxo da fala é percebido através de constituintes prosódicos que facilitam a identificação, e também a segmentação, das palavras e o processamento sintático. Considerando que o bebê, durante os primeiros anos de vida, só tem acesso ao material fonológico, defendemos a hipótese do Boostrapping Fonológico, segundo a qual pistas de natureza fonológica/prosódica seriam utilizadas pelos infantes para o desencadeamento da aquisição do léxico e da sintaxe (Christophe et al. 1997). Segundo Christophe et al. (1997), existem fortes evidências experimentais de que os bebês, desde o nascimento, possuem habilidades perceptuais que os capacitam, primeiramente, a segmentar o continuum da fala e, posteriormente, a constituir o léxico do idioma em aquisição. Uma das pistas utilizadas pelo bebê é a prosódia da língua, principalmente a percepção das fronteiras que existem entre os constituintes prosódicos. Diante dessa perspectiva, os enunciados de uma determinada língua natural seriam perceptualmente acessíveis à criança, em termos de unidades prosódicas (Maye & Gerken 2001). Nesse sentido, cabe à criança, como tarefa inicial do processo de aquisição de linguagem, segmentar o fluxo da fala em unidades significativas para o processamento linguístico, mesmo não possuindo um sistema fonológico consolidado e nem um léxico da língua que está sendo adquirida. Isso implica assumir que os infantes, desde os primeiros anos de vida, são predispostos biologicamente a perceber propriedades que sinalizam padrões recorrentes do idioma em aquisição. A fim de observar se os bebês são sensíveis às informações acústicas contidas nas fronteiras do constituinte prosódico analisado, utilizamos a técnica de Olhar Preferencial (Preferential Looking). Conforme apresentado por Name (2012), o Olhar Preferencial (variação da técnica de Escuta 128 4º Colóquio Brasileiro de Prosódia da Fala Preferencial - Headturn Preference Procedure) é um tipo de técnica utilizado com crianças de até 18 meses e é adequado para avaliação de habilidades perceptuais. Inicialmente, a criança ouve durante um período de tempo, aproximadamente dois minutos, determinado estímulo linguístico apresentando o fator que está sendo investigado. Em seguida, apresentam-se dois tipos de estímulo linguísticos, em três ensaios para cada tipo, coerentes ou não com o que foi anteriormente apresentado. Utiliza-se um alto-falante, centralizado junto a uma tela maior, a qual exibe uma imagem – a mesma durante todos os ensaios. A apresentação do estímulo é dependente do comportamento do bebê, que o escuta enquanto estiver olhando para a imagem/direção do som. Se ele desvia o olhar, o som para e um novo evento começa. Mede-se, assim, o tempo de olhar da criança para a imagem na tela, que corresponde ao tempo de escuta do estímulo e, consequentemente, a seu interesse pelo que ouve. A despeito do nome, a medida usada é de preferência pelo enunciado ouvido. A aferição do tempo de olhar/escuta permite verificar se a criança percebeu a distinção entre os estímulos que lhe foram oferecidos. Uma atividade experimental foi desenvolvida utilizando o Olhar Preferencial, em que um grupo de bebês é familiarizado durante dois minutos à palavra BAR (grupo A), e outro grupo familiarizado a BARCO (grupo B). Na fase de teste, todos os bebês são expostos a sentenças com as palavras BARCO (condição 1) e BAR (condição 2) seguida de fronteira de sintagma fonológico; porém, a palavra seguinte a BAR começa com a sílaba CO (BAR ? COMEÇA...), conforme o exemplo abaixo: 1. a. [O dono daquele BARCO] ? [mora perto da minha casa]. b. [O dono daquele BAR] ? [começa a trabalhar cedo]. Foram construídas doze sentenças teste. Seis das sentenças apresentam a palavra “barco” e as outras seis apresentam a mesma palavra separada por uma fronteira de sintagma fonológico. Nossa hipótese é que, nessa idade, o bebê é sensível a pistas de fronteira de sintagma fonológico, utilizando-se delas na segmentação do fluxo da fala. Dessa forma, nossa previsão é que bebês do grupo A reconhecerão a palavra familiarizada nas sentenças da condição 2, e bebês do grupo B reconhecerão na condição 1. Essa previsão justifica-se pela suposição de que as pistas disponíveis nos domínios da fronteira de sintagma fonológico são fortes o suficiente para impedir que a criança acesse a palavra BARCO na condição em 129 Caderno de Resumos que ela esteja presente apenas “virtualmente”, isto é, na condição em que a fronteira está justamente entre a palavra BAR e a primeira sílaba da palavra subsequente COMEÇA. A atividade encontra-se em andamento, e espera-se que haja uma diferença estatisticamente significativa entre os tempos de olhar/escuta das condições nos dois grupos de bebês. Referências Alves, D. P. 2010. Pistas prosódicas no acesso lexical on-line de falantes adultos do português brasileiro. Dissertação de mestrado. Universidade Federal de Juiz de Fora. Christophe, A., Guasti, T., Nespor, M., Dupoux, E. & Ooyen, B.V. 1997. Reflections on phonological bootstrapping: it's role for lexical and syntactic acqusition. Language and Cognitive Processes, 12 (5/6): 585-612. Christophe, A., Millotte, S., Bernal, S. & Lidz, J. 2008. Bootstrapping Lexical and Syntactic Acquisition. Language and speech, 51 (1 & 2): 61-75. Gout, A., Christophe, A. & Morgan, J. 2004. Phonological phrase boundaries constrain lexical Access: II Infant data. Journal of Memory and Language, 51: 548-567. Gout, A. & Christophe, A. 2006. O papel do bootstrapping prosódico na aquisição da sintaxe e do léxico. 2006 In: Corrêa, L. M. S. (Org.). Aquisição da Linguagem e problemas do desenvolvimento linguístico. Rio de Janeiro: Ed. PUC-Rio; São Paulo: Loyola: 103-127. Maye, J. & Gerken, L. A. 2001. Learning phonemes: How far can the input take us? Proceedings of the 21st Boston University Conference on Language Development. Boston, MA: Cascadilla Press. Millotte, S., Wales, R. & Christophe, A. 2007. Phrasal prosody disambiguates syntax. Language and Cognitive Processes, 22 (6): 898-909. Name, M. C. 2012. O que nos dizem os resultados experimentais sobre a percepção da fala pelo bebê. Revista Veredas, Edição Especial VIII ENAL – II EIAL: 282-295. Nespor, M. & Vogel, I. 2007. Prosodic Phonology. Dordrecht-Holland: Foris Publications. Silva, C. G. C. 2009. O papel das fronteiras de sintagma fonológico na restrição do processamento sintático e na delimitação das categorias lexicais. Dissertação de mestrado. Universidade Federal de Juiz de Fora. 130 4º Colóquio Brasileiro de Prosódia da Fala 131 Caderno de Resumos 132 4º Colóquio Brasileiro de Prosódia da Fala 133 Caderno de Resumos 134 4º Colóquio Brasileiro de Prosódia da Fala Towards a Focus Typology in Turkish Jane Kühn1 1 Department of Linguistics/ University of Potsdam, Germany [email protected] This work in progress presents a production experiment conducted in order to classify Turkish concerning its focus typology. Turkish is claimed to have two distinct focus marking strategies: syntactic movement and prosodic focus marking in-situ (Erguvanlý 1984; Göksel & Özsoy 2000; Iºsever 2003). Studies on prosodic focus marking in Turkish understand focus as prominence in the original sense of Jackendoff (1972) as an equivalent to stress and pitch accent implementation. Correspondingly, Özge & Bozºahin (2010) describe the implementation of H*L- for focused and L*H- for given constituents, remaining unsure if H- and L- are part of a bi-tonal pitch accent, or independently implemented as intermediate phrase boundary tones. In an acoustic analysis, Ýpek (2011) cannot find reliable acoustic cues of pitch accent modification for in-situ focus, but a change in default F0 contour: a focused verb in SOV declaratives reveals “immediately pre-focal rising” on the ultimate syllable of the object. Furthermore post-focal compression (PFC) is observed after initial focus1. Cross-linguistic studies showed that focus prominence is not always expressed by pitch accent, but also by alignment. Alignment is understood as correspondence between the edge of a syntactic and/or phonological constituent and the focused part of a sentence (McCarthy & Prince 1993; Selkirk 1986). In Focus Prominence Theory (FPT) (Truckenbrodt 1995; Büring 2010) focus becomes prominent by introducing/deleting boundaries. In Focus as Alignment Theory (FAT) (Féry 2013a), focus alignment may be obtained even in the absence of prominence. 1 Note that åpek´s (2011) results are based on Turkish- English bilingual speakers. Interferences cannot be excluded. 135 Caderno de Resumos Based on previous studies, which did not succeed in identifying pitch accent implementation as a focus marker in Turkish, the research question of the present experiment is, if Turkish Information Structure uses alignment in the prosodic expression of focus according to FPT and FAT. Considering cross-linguistic focus typology, I expect that focus in Turkish is expressed by alignment and not by pitch accent implementation. Turkish does not modify pitch accent, but phrasing when Information Structure changes. Corresponding to FPT, I expect the introduction and/ or deletion of prosodic boundaries. I expect “immediately pre-focal rise” and PFC (Ýpek 2011) to be results of boundary insertion/ deletion to fulfill alignment. For each pre-focal Ö, I expect the implementation of pre-nuclear high boundary tones (Kan 2009, Güneº 2013) including boundary introduction on the object in verb focus, causing a change in default phrasing in favor of AlignFocus. Phrasing is also expected to change post-focally by PFC as a consequence of AlignFocus. For the focused constituent, I expect the implementation of H* (Özge& Bozºahin 2010), but no boundary tone (Kan 2009; Güneº 2013). Adopting the methodology of Xu (1999), I designed five Turkish simple SOV target sentences, each containing the same number of comparable segments. Since Turkish word stress is final (Kornfilt 1979), it coincides with the syllable designated for the implementation of boundary tones for focus alignment. To avoid tonal clash, only words with initial word stress were considered. Each target sentence was preceded by a question eliciting contrastive focus on different constituents: subject-, object-, verb and broad focus. Targets and preceding questions were presented on a slide, accompanied by a picture. Six monolingual native speakers of Turkish were asked to read out aloud the questions and following answers. A list of the target sentences is provided in (1): (1) Targets (1) Nasrettin babasýný üzüyor. Nasrettin father-POSS-ACC sadden-3SG-PRS. Nasrettin saddens his father. (2) Macide kardeºini çiziyor. Macide sibling-POSS-ACC draw-3SG-PRS. Macide draws her sibling. (3) Nadide ablasýný özlüyor. Nadide sister-POSS-ACC miss-3SG-PRS. Nadide misses her sister. 136 4º Colóquio Brasileiro de Prosódia da Fala (4) Fahýre Nacasýný seviyor. Fahýre Nacý-POSS-ACC love-3SG-PRS. Fahýre loves her Nacý. (5) Yasemin aynacýyý dinliyor. Yasemin mirror dealer-ACC listen-3SG-PRS. Yasemin listens to the mirror dealer. Analysis was done time-normalized in order to enable comparison across all target sentences, focus conditions, and speakers. In a first step analyses are reduced to F0 and will later include further acoustic correlates of focus. Phonological description of the F0 contour among the different focus conditions of the whole ? -phrase was done. Special attention was paid on boundary tone implementation under the changing foci. All targets of all speakers were annotated manually in Praat on the syllable level. Suprasegmental labeling of all targets for all speakers among all focus conditions follows Kan (2009) using general ToBi labeling advices. Analyses include a total of 120 sentences: 5 target sentences x 4 focus conditions x 6 speakers. The descriptive phonological analyses of Turkish SOV declaratives under changing foci reveal surprising issues which so far only partly fulfill the previous expectations concerning the deletion and/or insertion of prosodic boundaries to align focus. Results highly benefit the establishment of a general intonation grammar of Turkish. The production experiment shows that (i) speakers do not necessarily modify overall F0 under manipulated focus conditions. Phonological descriptions reveal (ii) that phrasing does not change under the manipulated factor focus. Each pre-nuclear constituent is associated with a high tone H-. Surprisingly, nuclear constituents, unless verbs, are associated with the same high tone, which conflicts with Kan`s (2009) function of H- to delimit domains and tonal units, rather representing a phrase tone. Since general mapping in Turkish requires straight forward phrasing of verb and object into one vP (Kan 2009), the function of H- can alternatively be interpreted as an indicator of HeadProminence. Hence, in contrast to previous descriptions of Turkish F0 contours, the analysis shows (iii) that the prosodic heads of all Ö are aligned with H- on the ultimate syllable, including the heads of nuclear Ö´s. H- does not represent the supposed H* of nuclear items since it is not aligned to metrically strong syllables. In (2) the F0 contours of target sentence (2) of a male speaker are provided. Overall F0 does not change phonologically for subject, object, verb and broad focus. 137 Caderno de Resumos (2) Phrasing of target sentence (2) with modified foci The analyses furthermore show (iv) speaker variation in the phonetic implementation of H- by not implementing downstep on the object, or implementation of PFC. The F0 contour of (3) provides verb focus realization in which general phrasing is maintained, but downstep not. (3) Downstep blocking in verb focus of target sentence (3) 138 4º Colóquio Brasileiro de Prosódia da Fala The phonological analysis of the experiment supports a new approach on the prosodic structure of Turkish, based primarily on properties of prosodic phrasing and less on pitch accent. The results indicate that focus is not expressed by pitch accent implementation, but that constant phrasing takes place under modified foci. Variation in pitch due to Information Structure takes place on higher prosodic domains than syllables or ù. The implementation of H- on heads of pre-nuclear and nuclear phrases shows that Turkish is strictly left headed. Even if the focused constituent is aligned with the right edge of Ö, HeadProminence overrides FocusProminence in the way that within the vP the verb is not more prominent than the object. If expressed by means of F0 at all, focus is preferably aligned with the edges of a higher prosodic domain than Öphrase. To further examine the statistical relevance of the impact of focus on downstepping phrase tones in ? , maximum F0 of the crucial syllables are currently measured. Further acoustic cues accompanying phrasing, such as break introduction (Féry 2013b) are also checked in the acoustic analyses. References Büring, D. 2010. “Towards a typology of focus realization”. In M. Zimmermann and C. Féry (eds.). Information Structure. Theoretical, Typological and Experimental Perspectives. Oxford: Oxford University Press: 177-205. Erguvanlý, E. 1984. The function of word order in Turkish grammar. Berkeley: University of California Publications. Féry, C. 2013a. “Focus as prosodic alignment”. In: Natural Language and Linguistic Theory 31. 3: 683–734. Féry, C. 2013b. Final compression in French as a phrasal phenomenon. University of Frankfurt: http://web.uni-frankfurt.de/fb10/fery/publications/French-PFC-final%20copy.pdf Göksel, A. and Özsoy, S. 2000: “Is there a focus position in Turkish?” In. Studies on Turkish and Turkic Languages; Proceedings of the 9th International Conference on Turkish Linguistics. Wiesbaden: Harrassowitz : 219–228. Güneº, G. 2013. “Limit on syntax- prosody mapping in Turkish prosody of finite and non-finite clausal parentheticals”. In: E. Erguvanli Taylan. Dibilim Arastirmalari Dergisi. Istanbul: Boðaziçi University Press. Ipek, C. 2011. “Phonetic realization of focus with no on-focus pitch range expansion in Turkish”. In Proceedings of ICPhS XVI. Hong Kong. Iºsever, S. 2003. “Information Structure in Turkish: The word order-prosody interface”. In Lingua 113: 1025–1053. Jackendoff, R. 1972. Semantic interpretation in generative grammar. Cambridge Mass.: MIT Press. 139 Caderno de Resumos Kan, S. 2009. Prosodic domains and the syntax-prosody mapping in Turkish. Master's thesis. Bogazici University Istanbul. Kornflit, J. 1979. Turkish. New York: Routledge. McCarthy, J. and Prince, A. 1993. “Prosodic morphology”. In: J. Goldsmith. Handbook of phonology. Blackwell: Oxford: 318-366. Özge, U. & Bozºahin, C. 2010. “Intonation in the grammar of Turkish”. In Lingua 120: 132-175. Selkirk, E. O. 1986. “On derived domains in sentence phonology”. In Phonology Yearbook 3: 371–405. Truckenbrodt, H. 1995. Phonological phrases: their relation to syntax, focus & prominence. Doctoral Dissertation. Cambridge, Mass.: MIT Press. Xu, Y. 1999. “Effects of Tone and Focus on the Formation and Alignment of F0 Contours”. Journal of Phonetics 27: 55–105. 140 4º Colóquio Brasileiro de Prosódia da Fala A(s) pronúncia(s) do R final em canções do início do século XX (1902-1920) 1 Karilene da Silva Xavier 1 Universidade Federal do Rio de Janeiro, Brasil [email protected] Este trabalho focaliza a realização variável do R, em posição de coda silábica final, trazendo uma nova abordagem desse fenômeno no qual é muito estudado no PB, pois o corpus é constituído a partir registros musicais dos primeiros anos do século XX, quando a atividade musical iniciou seu procedimento de expansão, divulgação e popularização no Rio de Janeiro. Assim, as canções foram gravadas entre 1902 e 1920, por intérpretes de três diferentes naturalidades -- Rio de Janeiro, Bahia e Rio Grande do Sul. O registro sonoro foi disponibilizado pelo Instituto Moreira Salles, na série A canção do tempo1 e pelo site Cifrantiga2, com o intuito de preservar a memória radiofônica brasileira. Devido ao escasso recurso técnico da fase mecânica da música brasileira, a qualidade dos dados pode estar comprometida hoje em dia. Canções com a qualidade de áudio péssima tiveram de ser excluídas da análise, porém há inúmeras gravações com a qualidade de áudio boa. Elas representam um valor histórico e cultural incalculável, pois são registros no tempo, ou seja, são verdadeiros documentos, que mostram as diferentes criações, gêneros musicais, ritmos, temas e performances, características e estilos de diversos intérpretes, alguns deles desconhecidos pela cultura da música popular brasileira. Constituem, ainda, fonte de pesquisa sobre o comportamento linguístico de indivíduos habitantes de centros urbanos importantes no país, numa época em que o registro de voz se restringia às ondas do rádio. A partir dessas gravações musicais, é analisada a variabilidade de http://ims.uol.com.br/radiobatuta http://cifrantiga3.blogspot.com.br 141 Caderno de Resumos realização do R final, inclusive a possibilidade de apagamento. Interessa-nos a investigação desse fenômeno, pois o R apresenta "um elevado grau de polimorfismo, prestando-se, exemplarmente, à caracterização da variação no português do Brasil" (Callou et al. 1996). No que se refere à realização deste segmento, de acordo com o que se lê na literatura, havia, no início do século XX, uma grande predominância de realização da vibrante ápico-alveolar múltipla pelos intérpretes da música popular brasileira (Anais do primeiro Congresso de língua nacional cantada, 1938). Além de condicionamentos fonológicos e morfológicos, mais recentemente tem sido verificado também o papel do tipo de fronteira prosódica para a preservação/cancelamento do segmento (Callou & Serra 2012). Nesse sentido, este trabalho também levará em conta uma hipótese prosódica para a variabilidade de realização do R e, como em propostas anteriores (Bisol 2002; Callou & Serra 2012; Serra &Callou, no prelo), combinará o aparato teórico-metodológico da sociolinguística quantitativa laboviana (Labov 1994) ao da teoria da hierarquia prosódica (Selkirk 1984; Nespor & Vogel 1986, 2007). Para a análise do processo de variação do R, é necessário considerar o contexto em que ocorre o segmento, se em ataque -- início de palavra ou intervocálico, se em coda silábica -- medial ou final, e seu tipo de realização -[+/-vibrante] e [+/- anterior] (Callou et al. 1996; Monaretto 2010). Nesse trabalho será levada em consideração a posição específica de coda silábica final, na qual as múltiplas realizações do R vão desde uma vibrante (simples ou múltipla) ápico-alveolar, uma fricativa velar, uma fricativa laríngea surda (aspiração) até a um zero fonético [Ø], gerando a tendência de produção do padrão silábico básico CV: R x h Ø. Segundo Labov (1972), “também é possível obter dados sistemáticos nas transmissões de rádio e televisão embora aqui a seleção e os condicionamentos estilísticos sejam em geral muito fortes”. É importante mencionar que, nas gravações já analisadas até o momento, notou-se que a forma de interpretação dos cantores era bastante padronizada, podendo ser realizada de forma artificial, assim, diferentemente da sua fala espontânea. Todavia, mesmo com tanta formalidade, havia também momentos em que o intérprete distancia-se desta forma padronizada. Recuando no tempo, pretendemos capturar esse processo gradual de diferenciação do rótico em coda final, a fim de verificar a atuação da regra de posteriorização aliada à passagem de vibrante à fricativa, passando progressivamente a zero. 142 4º Colóquio Brasileiro de Prosódia da Fala Nossa hipótese é a de que, além de fatores linguísticos, como a classe morfológica, as vogais antecedentes, os contextos subsequentes, a tonicidade, a dimensão do vocábulo, e também extralinguísticos, como a idade, a naturalidade, o gênero (feminino e masculino) dos cantores e a temática musical, a estrutura prosódica também desempenharia um papel relevante no processo de diferenciação do R, já que a fronteira de sintagma entoacional (IP) favoreceria a manutenção da realização vibrante [+anterior], as fronteiras mais baixas favorecendo o processo de diferenciação do rótico em outras variantes, tendência já apontada em trabalhos recentes (Callou & Serra 2012). Alguns resultados preliminares desse estudo, referentes à análise de 23 canções gravadas por intérpretes naturais do Rio de Janeiro disponibilizadas pelo IMS, já têm sido analisados. As ocorrências do R final foram ouvidas e anotadas foneticamente com o auxílio de programas de computador como o PRAAT e o Sound Forge. Assim, até o momento atual da pesquisa, pudemos observar que 1) ocorreu predominantemente, em 89% da distribuição total, a realização da vibrante ápico-alveolar (múltipla ou simples), que era considerada a forma padrão básica para a linguagem do rádio, teatro, televisão, em outras palavras, a variante de prestígio, ou seja, aquela que deveria ser difundida. Todavia, a realização do R como tepe (vibrante simples) ocorreu em maioria, 68%, mostrando que nas primeiras décadas do século passado já estaria ocorrendo um processo de enfraquecimento da realização do segmento em questão – de vibrante múltipla à simples. Cabe ressaltar ainda que também já ocorriam realizações mais posteriores do R, nomeadamente a fricativa glotal, em 7% da distribuição total, o que indiciaria o início do processo de posteriorização/ mudança de modo de articulação -- de vibrante para fricativa. Ainda a partir desse corpus piloto, foi também verificada a não realização do R final, em 4% das ocorrências de contexto de coda final, tendo ocorrido o apagamento somente em verbos dissílabos e dentro da temática sertaneja. A supressão total do R final podia estar associada à caracterização da linguagem popular, da vida rural, o que, em termos labovianos, poderia indicar uma mudança de baixo para cima (registro popular -> registro culto). Em relação ao fator prosódico, não pudemos ainda postular um mesmo condicionamento prosódico para a fala espontânea e a fala cantada. Pretendemos, nessa etapa do trabalho, analisar um número maior de canções gravadas entre 1902 e 1920, a fim de termos um quadro robusto das realizações possível do R em coda silábica final, no início do século XX. 143 Caderno de Resumos Referências Bisol, L. 2002. “A degeminação e a elisão no VARSUL”. In: Bisol, L. & Brescancini, C. (org.). Fonologia e variação: recortes do português brasileiro. Porto Alegre: EDIPUCRS: 231-250. Callou, D. ; Leite, Y. & Moraes, J. 1996. “Variação e diferenciação dialetal: a pronúncia do /r/ no português do Brasil”. In Gramática do Português Falado vol. VI, I. Koch, (ed.), 465-493. Campinas: UNICAMP. Callou, D. & Serra, C. 2012. “Variação do rótico e estrutura prosódica”. In Revista do GELNE 14 (Especial): 41-58. Labov, W. 1994. Principles of linguistic change. Internal factors. Cambridge, Blackwell. Monaretto, V. 2010. “Descrição da vibrante no português do sul do Brasil”. In: Bisol, L.; Collischonn, G. (Orgs). Português do Sul do Brasil. Porto Alegre: EDIPUCRS: 119-127. Nespor, M. & Vogel, I. 1986. Prosodic phonology. Dordrecht: Foris. Selkirk, E. 1984. Phonology and syntax: the relation between sound and structure. Cambridge: M.I.T. Press. Serra, C & Callou, D. 2013. A interrelação de fenômenos segmentais e prosódicos: confrontando três comunidades. (no prelo) Textos Selecionados do XXVIII Encontro Nacional da APL -- Universidade do Faro (Algarve-Portugal). 144 4º Colóquio Brasileiro de Prosódia da Fala Exclamativas WH em português brasileiro: metodologia para montagem de experimentos de produção e aceitabilidade Karina Zendron da Cunha 1 1 Programa de Pós-Graduação em Linguística, Universidade Federal de Santa Catarina, Brasil [email protected] Esta pesquisa tem por objetivo responder se há dois tipos de sentenças exclamativas WH em português brasileiro (doravante PB). O interesse por esse tema surgiu a partir do artigo de Zanuttini e Portner (2003), no qual os autores afirmam que, em paduano, italiano e inglês, há dois tipos de exclamativas WH: as com WH do tipo E-only e as com WH do tipo non-E-only. Para esses autores, o WH do tipo E-only pode estar presente apenas nas sentenças exclamativas, enquanto o WH non-E-only pode estar presente em exclamativas e interrogativas. Zanuttini e Portner (2003) afirmam que há similaridades entre as sentenças exclamativas e as interrogativas nas línguas e que, uma vez que ambas denotam um conjunto de proposições, sua sintaxe é semelhante no que diz respeito a esse aspecto de seus significados. As diferenças sutis entre exclamativas e interrogativas são explicadas pela presença, nas exclamativas, do morfema abstrato que expressa factividade. Dessa forma, o operador factivo e o constituinte WH das exclamativas correspondem a dois componentes semânticos que distinguem as exclamativas de outros tipos de sentença. Mas os constituintes WH presentes nas exclamativas nem sempre são idênticos. Os autores argumentam que há um WH que ocorre apenas nas exclamativas, enquanto um outro tipo pode ocorrer tanto nas exclamativas quanto nas interrogativas. Esse WH que ocorre apenas nas exclamativas contém um morfema que não está presente nos outros WHs e tem uma relação “especial” com o operador factivo. Além disso, esse WH ocupa uma posição bastante alta no CP, enquanto os outros ocupam uma posição mais baixa. Zanuttini e Portner chamam esse WH que ocorre apenas 145 Caderno de Resumos nas exclamativas de E-only e o WH que ocorre tanto em exclamativas quanto em interrogativas de non-E-only. Para mostrar qual é a diferença entre as exclamativas com WH E-only e as exclamativas com WH non-E-only, os autores fornecem dados do italiano, do paduano e do inglês. Nos dados do italiano, por exemplo, o WH E-only coocorre obrigatoriamente com o complementizador che e permite um constituinte à direita do WH, enquanto, nas sentenças com WH non-E-only, encontramos o mesmo comportamento das interrogativas, ou seja, o verbo segue imediatamente o WH (em Cº) e nenhum elemento deslocado pode seguir o WH. Já nos dados do inglês, não há um complementizador visível e elementos deslocados à esquerda não podem seguir o WH. Nessa língua, os casos claros de WH E-only acontecem nos seguintes contextos: how very many+NP, how very+AP/AdvP e what a+NP. Os elementos a e very que não estão presentes na contraparte interrogativa do WH representam, segundo os autores, a natureza E-only da sentença. Com base nessa literatura, pretende-se verificar se algo parecido acontece com os dados do PB. Dados preliminares, apresentados em Zendron da Cunha (2012), podem indicar que as exclamativas que contêm o elemento WH “como”, por exemplo em: “Como é lindo aquele homem!” e “Como é lindo o Léo e a Maria!”, são do tipo E-only, enquanto as exclamativas com os WHs “que” e “quanto”, por exemplo em: “Que alto que ele é!” e “Quanto homem nesse lugar”, são do tipo non-E-only. Ainda em Zendron da Cunha (2012), verificou-se se, entre esses dois tipos possíveis de exclamativas WH, existem diferenças de padrão entoacional. Os resultados preliminares mostraram que o padrão entoacional das exclamativas com WH do tipo E-only se assemelha ao padrão de outro tipo de exclamativa, as small clauses livres. Já as exclamativas com o WH non-E-only tem um padrão entoacional mais próximo do padrão de um dos tipos de sentença interrogativa descrita por Moraes (1998), como “Quando você soube?”. Para o autor, nesse tipo de sentença, há um aumento de pitch na primeira sílaba acentuada e também na última sílaba acentuada do enunciado. Com o objetivo de refutar ou comprovar esses resultados, proponho este estudo que investigará, entre outras coisas, se os resultados alcançados por Zendron da Cunha (2012) até o momento podem estar relacionados a efeitos microprosódicos. Para isso, dois experimentos serão realizados: um de produção de fala e outro de aceitabilidade. No primeiro, serão gravados 4 repetições de 24 146 4º Colóquio Brasileiro de Prosódia da Fala sentenças, 12 exclamativas e 12 interrogativas, para verificar se há semelhança no padrão entoacional das exclamativas non-E-only com as interrogativas. Nesse experimento, serão gravados 5 informantes do sexo feminino, falantes nativas de PB. Os dados serão apresentados aos informantes aleatoriamente dentro de contextos, como por exemplo em: “Maria está em um restaurante esperando atendimento. Passa por ela um garçom muito bonito. Maria então comenta com Joana: - Como é lindo aquele homem!” A análise dos dados será feita com o auxílio do programa PRAAT, versão 5.1.38 e do script MOMEL/INTSINT for PRAAT, versão 10.3. O MOMEL, proposto por Hirst em 1983, tem como propósito reduzir a curva de frequência fundamental a pontos-alvo. Esses dados, por sua vez, podem ser passados através do INTSINT para representações qualitativas. O INTSINT, segundo Celeste (2007), foi desenvolvido com o objetivo de se postular um sistema de códigos para análise prosódica capaz de representar qualquer distinção entonativa significativa. A transcrição prosódica seguirá o modelo autossegmental e métrico. Depois de feita a gravação e a análise dos dados, no experimento de aceitabilidade, objetiva-se responder à seguinte questão (já proposta em Zendron da Cunha 2012): a presença do complementizador é obrigatória em pelo menos algumas construções exclamativas? Para responder a essa questão, o complementizador “que” será inserido nas exclamativas e interrogativas e alguns falantes nativos do PB farão uma avaliação, considerando aceitável ou não-aceitável tal inclusão. Veja nos exemplos (1) e (2): (1) a. Como que é lindo aquele homem! b. Como que tá madura a laranja! c. Quanta barata que nessa casa! d. Quanto doce que a Maria come! (2) a. Como que você conheceu aquele homem? b. Como que você faz bolo de laranja? c. Quantas vezes que você limpou a casa? d. Quanto doce que você come? 147 Caderno de Resumos O último teste pretende verificar se é possível não haver movimento do elemento WH em exclamativas e também em interrogativas, como mostram os exemplos abaixo: (3) a. Aquele homem como é lindo! b. A laranja como que tá madura! c. Nessa casa quanta barata! (4) a. Você conheceu aquele homem como? b. Você faz bolo de laranja como? c. Você limpou a casa quantas vezes? Se os dados de produção mostrarem resultados relevantes, também será realizado um experimento de percepção, no qual as sentenças serão filtradas e os informantes deverão responder se se trata de uma interrogativa ou de uma exclamativa. Para esse teste, também será utilizado o programa PRAAT, versão 5.1.38. Espera-se, portanto, que, com a metodologia aqui proposta, seja possível coletar resultados que confirmem a hipótese já levantada em Zendron da Cunha (2012), qual seja, a de que há dois tipos de exclamativas WH em PB. Referências Celeste, L. C. 2007. MOMEL e INTSINT: uma contribuição à metodologia do estudo prosódico do Português Brasileiro. 2007. 222 f. Dissertação (Mestrado em Linguística) – Faculdade de Letras, Universidade Federal de Minas Gerais, Belo Horizonte. Moraes, J. A. 1998. Intonation in Brazilian Portuguese. In: HIRST, D.; Di Cristo (Org.). Intonation systems: a survey of twenty languages. Cambridge University Press, Cambridge. Zanuttini, R. & Portner, P. 2003. Exclamative clauses: at the syntax-semantics interface. Language 79 (1): 39–81. Disponível em: <http://www9.georgetown.edu/faculty/portnerp/nsfsite/excl-paper.pdf>. Acesso em: 21 jul. 2013. Zendron da Cunha, K. 2012. Sentenças exclamativas em português brasileiro: padrão entoacional e sintaxe. 2012. 146 f. Dissertação (Mestrado em Letras) – Programa de Pós-Graduação em Letras, Setor de Ciências Humanas Letras e Artes, Universidade Federal do Paraná, Curitiba. Disponível em: <http://dspace.c3sl.ufpr.br:8080//dspace/handle/1884/27360>. Acesso em: 04 jul. 2013. 148 4º Colóquio Brasileiro de Prosódia da Fala 149 Caderno de Resumos 150 4º Colóquio Brasileiro de Prosódia da Fala Context of elicitation / Positive laughs % Funny videos 76% (A: 83, E: 65, U: 87) NAO laughs 42% (A: 23, E:45, U: 62 ) Tongue-twisters game 18% (A: 29, E: 18, U: 0) Jokes 42% (A: 29, E:40, U: 63) Negative laughs No laughs 4% (A: 0, E: 9, U:0) 22% (A: 23, E: 30, U:0 ) 62% (A: 64, E: 65, U:50 ) 24% (A: 21, E: 26, U:25) 20% (A:17, E: 26, U:12) 36% (A: 54,E:25,U: 38) 20% (A: 7, E:17,U: 50) 34% (A:50,E: 30,U: 12) Table1: Repartition of laughs (A : Asian, E : European, A: U: American) 151 Caderno de Resumos We can see that Positive laughs were elicited with funny videos, NAO laughs and jokes. Negative laughs mostly occurred during the tongue-twisters game. Sense of humor is both personal and cultural. We asked subjects to fill three after the experiment questionnaires: one about their sense of humor, on about their personality (OCEAN) and one about the experience. 94% of the subjects enjoyed the experiments: most (49%) preferred the tongue-twister games, then the videos and then the jokes. 4. Audio analysis The ComParE Interspeech Challenge 2013 [Schuller et al., 2013] on social signals detection in natural conversations used brute force strategy for training model with a huge number of features (# 6373) which are not easy to analyze. Here we use a different strategy trying to explain which kind of features seems more adequate to distinguish between positive and negative laughter. For this first analysis, we use acoustic parameters extracted with PRAAT: duration of the segment, range pitch, range mean pitch, zero-crossing rate, intensity range, intensity mean range, pourcent of voice breaks, jitter_rap, jitter_fac, shimmer_apq11 and mean_hnr. 5. First experiment and Conclusion First prosodic analysis was carried out on positive/negative laughs. As a first conclusion, we can say that positive laughter has more voiced parts in our corpus than negative laughter, regardless of the culture of the participants. A lot of these laughs have a noisy background and are sometimes superposed to speech. There is also a lot of variability in acoustic expression of laughs in the different contexts of elicitation. A perceptive test will be carried out to verify the annotations. Future experiments will attempt to correlate acoustic cues with answers to the questionnaires. References Bachorowski, J., Smoski, M, Owren, M. 2001. The acoustic features of human laughter. Journal of the Acoustical Society of America, 110: 1581–1597. 152 4º Colóquio Brasileiro de Prosódia da Fala Carter, A. 2000. Automatic acoustic laughter detection. Master Thesis, Keele University. Devillers, L. Vidrascu L. 2007. Positive and negative emotional states behind the laughs in spontaneous spoken dialogs. Workshop Laughter 2007 of ICPHs. McKeown, G. Cowie, R., Curran, W., Ruch, W., Douglas-Cowie E. 2012. ILHAIRE Laughter Database. Proceedings of the 4th International Workshop on EMOTION SENTIMENT & SOCIAL SIGNALS, LREC 2012, May 2012, Istanbul, Turkey, ELRA. Knox T. & Mirghafori W. 2007. Automatic Laughter Detection Using Neural Networks, Proceedings of Interspeech. Krumhuber E. & Scherer, K. 2011. “Affect bursts: Dynamic patterns of facial expressions”. Journal of Emotion. Aug ; 11 (4):742. Schuller, B., Steidl S., Batliner, A., Alessandro Vinciarelli A., Scherer K., Ringeval, F., Chetouani, M., Weninger, F., Eyben, F., Marchi, E., Mortillaro, M., Salamin, H., Polychroniou, A., Valente F., Kim, S. 2013. The INTERSPEECH 2013 Computational Paralinguistics Challenge Social Signals, Conflict, Emotion, Autism; Interspeech. Schröder, M. 2003. Experimental study of affect bursts, Speech Communication – Special session on speech and emotion, 40, Issue 1-2. Soury, M., Gossart, C., Adda, M., Devillers L. 2013. “A tool to elicit and collect multicultural and multimodal laughter”, Show & Tell, Proceedings of Interpseech, Szameitat, Diana P. et al. 2009. Differentiation of Emotions in Laughter at the Behavioral Level. Emotion 9 (3): 399. Tahon, M., Devillers, L. 2010. Acoustic measures characterizing anger across corpora collected in artificial or natural context. In Speech Prosody. Chicago, USA. Trouvain, J. 2003. “Segmenting phonetic units in laughter”. In Proc. Intern. Confer. on the Phonetic Sciences: 2793-2796. Barcelona. 153 Caderno de Resumos Descendo ou subindo? Padrões entonacionais de interrogativas totais da língua inglesa e do português brasileiro por falantes brasileiros 1 Leonice Passarella dos Reis Programa de Pós-Graduação em Inglês, UFSC, Brasil. [email protected] Os benefícios do ensino de pronúncia no processo de aquisição de uma língua adicional são inquestionáveis. No entanto, determinar a quantidade adequada e os aspectos da pronúncia mais importantes a serem ensinados é não só uma necessidade, mas também um desafio (Berns 2008; Jenkins 2003). De acordo com Berns (2008), esses aspectos da pronúncia devem ser considerados dentro de uma comunidade específica de falantes. No Brasil, algumas pesquisas foram conduzidas principalmente no nível segmental, mas muita pesquisa ainda é necessária para determinar que aspectos de pronúncia (no nível segmental ou suprassegmental) podem comprometer a comunicação de falantes de português brasileiro (PB) em inglês. Com o intuito de colaborar com pesquisas na área, este estudo tem como objetivo investigar os padrões entonacionais de interrogativas totais neutras realizadas por falantes do PB em inglês e em português, uma vez que tais padrões diferem nas duas línguas. Neste estudo, o termo “neutra” indica que a pergunta é feita buscando uma informação desconhecida, ou seja, a resposta à pergunta é um dado completamente novo ao locutor. Para Moraes (2008), o contorno melódico do núcleo das interrogativas totais neutras do PB é traduzido pela notação /LH*L%/. Já, para o inglês americano, a notação é /L*HH%/ (HEDBERG, SOSA & FADDEN, 2004). A principal diferença entre os dois padrões está no tom de fronteira que é descendente para o PB e ascendente para o inglês. Esta pesquisa busca entender se essa diferença no padrão das interrogativas afeta a maneira como os falantes brasileiros produzem os padrões das interrogativas totais em inglês. Para isso, contou com 13 participantes: um falante de inglês (americano), nove brasileiros falantes de inglês e três 154 4º Colóquio Brasileiro de Prosódia da Fala avaliadores brasileiros. Os nove participantes brasileiros, todos cariocas do sexo masculino, participaram de três sessões de coleta de dados. Na primeira sessão, os participantes preencheram um Termo de Consentimento, responderam a um questionário, gravaram a descrição de figuras e receberam duas versões impressas de um diálogo entre Mary e John em inglês, criado pela autora para o presente estudo, a ser gravado na sessão seguinte. Na segunda sessão, solucionaram dúvidas de pronúncia e fizeram a gravação do diálogo em inglês. Na terceira, realizaram a gravação de duas versões de um diálogo entre Mari e João em português. O participante americano (da Califórnia) preencheu o Termo de Consentimento, respondeu a um questionário e fez a gravação das duas versões do diálogo em inglês, em um momento de interação com sua esposa, sob o acompanhamento de uma pesquisadora colaboradora no Canadá, onde residem atualmente. A leitura realizada para a gravação dos diálogos pelos 10 participantes foi feita com alternância, de modo que cada participante lesse todas as falas em que houvesse perguntas, ou seja, as falas do John e as da Mary, para o inglês, e as falas do João e as da Mari, em português (excetuando-se o participante americano para este último). Para isso, adequações no diálogo foram feitas, de modo a criar as duas versões, como, por exemplo, no momento da resposta à pergunta “What's your name?”. A partir da produção oral realizada pelos nove participantes brasileiros através da descrição de figuras, o Teste de Proficiência foi desenvolvido e submetido a três avaliadoras altamente proficientes em inglês, todas com pósgraduação em inglês na área de Fonética e Fonologia. Tendo como base a discussão trazida por Silveira (2011), nenhum treinamento sistemático foi oferecido às avaliadoras, de modo a garantir que suas avaliações refletissem os critérios subjetivos que elas costumam empregar em tal prática. As avaliadoras ouviram o áudio contendo uma amostra de cada informante e avaliaram o nível de proficiência oral com o uso de uma escala tipo likert que vai de 0 (zero) – nível de proficiência oral muito baixo – a 10 (dez) – nível de proficiência semelhante à do falante de inglês como língua materna. Após análise do resultado do Teste de Proficiência, apenas os dados referentes aos participantes com o mesmo nível de proficiência foram analisados. As 115 amostras de áudio com interrogativas totais foram recortadas e os padrões entonacionais foram descritos através da notação do sistema métrico autossegmental (L e H) com o auxílio do software de análise de fala - Praat, como 155 Caderno de Resumos explicado a seguir: (1) as interrogativas totais produzidas pelo falante americano foram analisadas de modo a descrever os padrões entonacionais por ele produzidos para futura referência/comparação com os padrões encontrados pelos falantes brasileiros; (2) as interrogativas produzidas pelos falantes do PB foram analisadas de modo a descrever os padrões entonacionais por eles produzidos nas duas línguas. Os padrões encontrados foram analisados comparativamente: (1) de acordo com a língua (inglês ou PB), considerando as versões do diálogo em português e em inglês, com vias a investigar se os padrões produzidos pelos falantes de PB diferiam ou não nas duas línguas e (2) de acordo com o status da língua (materna, para o falante americano, e internacional, para os falantes brasileiros), considerando as produções em inglês do falante americano e dos falantes do PB, com vias a investigar se os padrões dos dois falantes se assemelhavam ou não. A análise buscou responder às seguintes perguntas de pesquisa: (1) Há diferenças nos padrões entonacionais das interrogativas totais em inglês com contornos ascendentes produzidos por falantes do PB quando comparados com aqueles produzidos por falantes de inglês? Se sim, quais são? (2) Os resultados encontrados podem ser explicados à luz da transferência linguística? As hipóteses foram as seguintes: (1) a produção dos padrões entonacionais das interrogativas totais dos falantes de PB serão diferentes dos produzidos pelo falante americano; e (2) essa diferença coincidirá com os padrões produzidos pelos falantes de PB em suas interrogativas totais no português, próprio do processo conhecido como transferência linguística (influência da língua materna sobre a língua adicional). Os resultados preliminares, obtidos a partir de dois informantes com nível de proficiência semelhante, apontam para dois comportamentos distintos. No primeiro, considerando os dados de um informante que não estuda inglês atualmente, a análise fonológica das amostras em inglês indicou que a produção dos padrões entonacionais do falante do PB é a mesma dos produzidos pelo falante americano (L*H%) e diferente das amostras em português, que respeita os padrões entonacionais do PB (LH*L%). Isso sugere que esse informante parece haver adquirido os padrões entonacionais do inglês e não parece possuir interferência da L1 nas produções desses padrões na língua adicional. No segundo, considerando os dados de um informante que estuda inglês atualmente, a análise fonológica confirma a primeira hipótese e parcialmente confirma a 156 4º Colóquio Brasileiro de Prosódia da Fala segunda, ou seja, há diferenças entre a produção do falante americano e a do falante do PB, mas a produção dos padrões entonacionais do último não é a mesma nas duas línguas. Isso sugere que parece haver uma interferência da L1, mas essa interferência não se faz através da transferência direta dos padrões entonacionais da L1 para os da língua adicional. Futuras pesquisas poderão investigar o impacto no ouvinte (falantes de inglês como língua materna e falantes de inglês como língua adicional de outras línguas maternas) ao perceber tais padrões entonacionais e que interferências reais esses desvios poderiam trazer à interação mútua/comunicação. Referências Berns, M. 2008. “World Englishes, English as a lingua franca, and intelligibility”. World Englishes, 27(3): 327-334. Hedberg, N., Sosa, J. M. & Fadden, L. 2004. "Meanings and Configurations of Questions in English". Proceedings of Speech Prosody 2004, Nara, Japan. Paper (PDF) Jenkins, J. 2003. “Community, Currency and the Lingua Franca Core”. TESOL Spain Newsletter. 26, Spring. Moraes, J. A. 2008. “The pitch accents in Brazilian Portuguese : analysis by synthesis”, S p e e c h P ro s o d y , C a m p i n a s . D i s p o n í v e l e m : < h t t p : / / w w w. i s c a speech.org/archive/sp2008/papers/sp08_389.pdf> Silveira, R. 2011. “Avaliando a proficiência oral em língua inglesa: o papel dos avaliadores e dos informantes”. In Mota, M. B., Bergsleithner, J. M. & Weissheimer, J. (Org.). Produção Oral em LE: Múltiplas Perspectivas. Campinas: Pontes, 19: 73-96. 157 Caderno de Resumos Estrutura discursiva como limitadora de padres entoacionais, e vice-versa Luciana Lucente Departamento de Linguística, Universidade Federal de Minas Gerais, Brasil [email protected] A relação entre prosódia e discurso é bastante discutida, porém são poucos os trabalhos experimentais que mostram essa relação, sobre tudo no português brasileiro (PB). Em Lucente (2012) essa relação é explorada ao investigar o alinhamento entre fronteiras entoacionais, acentos frasais e unidades discursivas. Neste trabalho, para dar conta da organização discursiva foi adotado o modelo de Grosz e Sidner (1986), que se baseia nos pressupostos: atenção, intenção e estrutura discursiva. Aplicando esse modelo à análise da estrutura discursiva da fala espontânea (de acordo com a definição apresentada no mesmo trabalho) pode-se observar que para cada segmento discursivo estão alinhados fronteiras de grupos acentuais (Barbosa 2006) e contornos entoacionais específicos, que são componentes prosódicos. Os grupos acentuais referem-se ao intervalo entre dois acentos frasais, que são segmentos em que ocorre maior duração das vogais. Os contornos entoacionais são definidos de acordo com o sistema DaTo de notação entoacional (Lucente 2008; 2012) e se referem a codificação de informações comunicativas pela frequência fundamental (f0) e tem um alvo linguístico a ser atingido. Esse alinhamento pode ser explicado ao se adotar o modelo de produção a fala presente em Lucente (2012) a partir de um acréscimo de um oscilador glotal ao modelo proposto originalmente por Barbosa (2006). A proposta do presente trabalho foi aplicar um experimento que pudesse atestar essa ocorrência e verificar que outros elementos podem estar presentes nessa estrutura discursivo-prosódica auxiliando nosso entendimento sobre o fenômeno. Para tanto, na primeira etapa do experimento foram selecionados quatro arquivos de áudio com exemplos de fala espontânea, sendo uma em taxa de elocução lenta, uma normal e uma rápida. O terceiro exemplo se trata de uma 158 4º Colóquio Brasileiro de Prosódia da Fala fala nonsense, porém como estrutura sintática preservada. Foi proposto primeiramente a um grupo de 12 estudantes de letras (todos nascidos em Belo Horizonte com faixa etária entre 20 e 25 anos) a indicação de proeminências na transcrição das falas em formato impresso ao mesmo tempo em que lhes eram apresentadas as respectivas gravações dos textos. Essa marcação de locais de ocorrência de proeminências foi comparada a marcação de grupos acentuais feita automaticamente pelo programa SG Detector (Barbosa 2006). Na segunda etapa do experimento foi proposto para seis estudantes (um subgrupo do grupo anterior), em um intervalo de 10 dias após o primeiro experimento, a segmentação dos mesmos textos em unidades discursivas, seguindo o modelo de segmentação de Grosz e Sidner. Antes da realização no segundo experimento os alunos foram submetidos a um treinamento de 6 horas para aprendizagem da segmentação segundo o modelo referido. Para a primeira parte foi feita uma contagem da porcentagem de ocorrências por item marcado como proeminente, sendo consideradas relevantes as marcações que continham mais de 50% de ocorrências (igual ou mais que seis marcações). Para a segunda parte do experimento também foi analisada a concordância entre os sujeitos quanto à segmentação em unidades discursivas, sendo que as marcações que obtiveram valor acima de 50% de ocorrências como fronteiras na segmentação discursiva foram consideradas “marcações fortes”, ou ocorrendo em “palavras fortes”. A partir das indicações de proeminência e segmentação foi feito um cruzamento desses dados a fim de verificar o quanto a estrutura discursiva e a prosódica estão inter-relacionadas, como nos exemplos: a) segmentação em unidades discursivas com palavras fortes em negrito: olha eu queria chorar porque eu não tenho assim ahh condição de prever o meu futuro além do ponto final se tornando uma outra língua brasileira porque eu acho que o futuro a Deus pertence e Aton então o futuro pertence ao ponto Aton porque eu acho que o nosso futuro é muito reluzente que no futuro a gente pira não vai ter mais a que se reportar então as réplicas elas são constantes (...) 159 Caderno de Resumos b) marcação de proeminências : olha(8) eu queria chorar(6) porque eu não tenho assim(3) ahh(4) condição(8) de prever o meu futuro(10) além do ponto(3) final se tornando uma(1) outra língua brasileira(6) porque eu acho que o futuro(10) a deus pertence(8) e aton(9) então o futuro pertence(1) ao ponto(4) aton(6) porque eu acho que o nosso futuro é muito reluzente(6) que no futuro a gente pira(8) não(2) vai(7) ter(3) mais a que(3) se reportar(4) então as réplicas(4) elas são constantes(10) (...) Os resultados preliminares mostraram: i) probabilidade alta de ocorrer o alinhamento entre as marcações de proeminências feitas pelos sujeitos e pelo programa SG Detector; ii) probabilidade alta de alinhamento entre as palavras marcadas como mais proeminente (tanto manualmente quanto automaticamente) e fronteiras de segmentos discursivos quando ocorrem nas chamadas fronteiras fortes, como mostra a Figura 1. Quanto à taxa de elocução, foi observada menor concordância no alinhamento entre as marcações de proeminências no áudio que apresentava taxa de elocução mais rápida e as fronteiras de seus segmentos discursivos marcados pelas palavras fortes. Em relação à marcação dos contornos entoacionais, como previsto, estes acompanham a marcação de proeminências, e são predominantemente contornos de fronteira LHL e HL, o que indica a estrutura discursiva influenciando a prosódica, e vice versa. Os outros tipos de contornos, como LH, >LH e HLH ficam restritos à marcação de foco, e raramente ocorrem em posição de fronteira. Tais contornos ficam marcam os itens marcados como proeminentes que não se alinham discursivamente com fronteiras, como se pode ver nas palavras “chorar” e “futuro” assinaladas na figura abaixo: 160 4º Colóquio Brasileiro de Prosódia da Fala Pitch (Hz) 600 LH >LH olha eu queria chorar HLH porque eu não tenho assim ahh condição LH ::: de prever o meu futuro :: 0 0 6.441 Time (s) Figura 1: contornos LH marcando fronteiras discursivas em palavras fortes. A discussão a que o experimento conduz é sobre o fato de as estruturas discursiva e prosódica estarem ligadas de forma bastante intrínseca e como partes de um sistema dinâmico de produção da fala, podendo ter como atrator os grupos acentuais. Outro ponto a ser discutido é em que nível se dá essa interação, pois de acordo com o modelo de Barbosa (2006) e Lucente (2012), o processamento do discurso está em um nível superior na produção da fala, juntamente com a sintaxe e a semântica, como um componente cognitivo, e a prosódia em um nível executivo, ou cognitivo-executivo. Referências Barbosa, P. A. 2006. Incursões em torno do ritmo da fala. Campinas: Pontes. Grosz, B. J., & Sidner, C. L. 1986. “Attention, Intentions, and the Structure of Discourse”, Computational Linguistics, p. 12:3. Lucente, L. 2008. DaTo: Um sistema de notação entoacional do português brasileiro baseado em princípios dinâmicos. Ênfase no foco e na fala espontânea. Dissertação de Mestrado. Unicamp. ________. 2012. Aspectos Dinâmicos da Fala e da Entoação no Português Brasileiro. Tese de Doutorado, Unicamp. 161 Caderno de Resumos A entoação do português do Brasil: uma descrição perceptiva 1 Luma da Silva Miranda 1 Faculdade de Letras, Universidade Federal do Rio de Janeiro, Brasil [email protected] 1. Introdução O inventário de padrões melódicos de uma língua pode ser estabelecido através de várias abordagens. No presente trabalho, adota-se uma perspectiva perceptiva para a descrição dos padrões melódicos do Português Brasileiro. A teoria do modelo IPO (Institute for Perception Research) entende que uma abordagem perceptiva proporciona um filtro que resulta numa redução necessária dos dados de origem acústica ou fisiológica. Tais dados “filtrados” contêm as informações mais relevantes da entoação para o propósito da comunicação. Utilizando o aporte teórico-metodológico do modelo IPO, um grupo de contornos melódicos da entoação do Português do Brasil foi analisado no intuito de se descrever os padrões entoacionais de acordo com a metodologia elaborada pelo modelo. Dessa forma, foram considerados oito padrões melódicos, a saber: asserção, questão total, questão parcial, exclamação, pedido, ordem, sugestão e desafio. O objetivo do presente trabalho é apresentar uma descrição desses contornos melódicos de acordo com a metodologia proposta pelo modelo IPO. Por isso, a pesquisa segue os seguintes passos para essa investigação: (i) descrever as propriedades prosódicas dos contornos melódicos da entoação do Português do Brasil; (ii) identificar as propriedades fundamentais dos contornos através do método da Escola Holandesa e (iii) verificar a tolerância desses contornos às modificações feitas através de testes de percepção com ouvintes que são falantes nativos da língua. Nessa pesquisa são levantadas as seguintes indagações quanto à relação das propriedades fonológicas da entoação e seus correspondentes no contínuo fonético: 162 4º Colóquio Brasileiro de Prosódia da Fala (i) Quais são as unidades melódicas que caracterizam os contornos melódicos? (ii) As informações de ordem melódica recaem em quais pontos-chave de cada contorno analisado? (iii) As técnicas de descrição do modelo IPO são suficientes para descrever os padrões entoacionais do Português do Brasil? 2. O modelo IPO Segundo 't Hart, J., Collier, R., Cohen, A. (1990), a abordagem do modelo IPO considera a curva melódica observável na superfície como o resultado de padrões melódicos de dois diferentes níveis que se superpõem: um nível global (a linha de declínio da F0) e um nível local (configurações melódicas). A descrição da curva melódica, no primeiro nível de análise, possui uma orientação mais fonética do que fonológica, pois a investigação concentra-se no estudo dos fenômenos acústicos baseados em tolerâncias perceptuais. A Escola Holandesa postula que as configurações são compostas por movimentos melódicos ascendentes e descendentes além de alguns movimentos “planos”, que seguem a linha de declínio, que são modelados como segmentos de retas. O contorno final gerado com essa modelagem “artificial” deve ser idêntico, do ponto de vista perceptivo, ao contorno original, o que se convencionou chamar na teoria de “close copy stylization”, isto é, uma estilização da curva melódica que apresenta equivalência perceptiva com a curva original. 3. Metodologia A metodologia do trabalho, de maneira geral, consiste em simplificar a curva melódica para que se obtenha a “forma fonológica” do padrão entoacional através dos movimentos melódicos relevantes perceptivamente. Ao utilizar a técnica de ressíntese, incluída em alguns pacotes de análise acústica, como o Praat (Boersma & Weenink 2009), geraram-se, em pequenos passos, padrões melódicos alternativos, minimamente modificados, e foram 163 Caderno de Resumos verificados, junto a um grupo de ouvintes, que tipo de alteração melódica é ainda aceita como natural, e que alteração já começa a comprometer a percepção e o significado do padrão entoacional. Por meio desse procedimento, conhecido na literatura como “estilização” do contorno melódico, buscou-se chegar a uma curva bastante simplificada, “ideal”, de cada padrão entoacional analisado. Os movimentos melódicos locais, que constituem os componentes básicos do modelo, são caracterizados pela atribuição binária de 4 traços: (i) [RISE] - Ascendente/descendente: direção do movimento; (ii) [EARLY] and [LATE] - Antecipado/retardado: o movimento acaba no início, meio ou final da parte sonora da sílaba; (iii) [SPREAD] - Estendido: atinge mais de uma sílaba ou apenas uma; (iv) [FULL] - Completo: abarca todo o campo tonal. Dessa forma, esses movimentos se combinam para formar configurações prototípicas, que, por sua vez, vão formar o contorno melódico final. Após a fase de ressíntese já mencionada acima, as frases manipuladas artificialmente geraram um número relativamente grande de variantes, e que foram, posteriormente, submetidas à avaliação de um grupo de ouvintes (entre 20 e 30). Os ouvintes então se manifestaram quanto à naturalidade/ aceitabilidade das referidas variantes. A estrutura do método inclui a manipulação da F0, estilização dos contornos melódicos baseada nos critérios da igualdade perceptiva, verificação experimental através de testes de percepção, sistematização dos padrões dos movimentos melódicos perceptivamente relevantes e a busca por unidades descritivas dos contornos melódicos que geram uma combinatória dos movimentos melódicos. Dessa forma, uma gramática pode ser elaborada na qual são gerados os tipos de contornos que são encontrados na língua em questão. O corpus é constituído de frases em diferentes modalidades que foram ditas e gravadas em laboratório por um informante masculino e um informante feminino. Para cada padrão melódico, uma situação controlada de produção foi criada através de uma descrição das características pragmáticas da eliciação (fala atuada) a fim de que oito tipos diferentes de frases fossem produzidas. A partir dessas gravações, foram geradas diversas frases estilizadas através da técnica de ressíntese que foram, posteriormente, incluídas no corpus. 164 4º Colóquio Brasileiro de Prosódia da Fala 4. Resultados preliminares À título de ilustração, essas são as “close copy stylizations” dos contornos extraídos pela técnica de ressíntese: m a r i n a c an t a v a 0 1.192 Time (s) “Figura . Asserção “Marina cantava” m a r i n a c an t a v a 0 1.203 Time (s) “Figura 2. Questão total “Marina cantava” c o m o v o c ê s 0 a b e 1.102 Time (s) “Figura 3. Questão parcial “Como você sabe?” 165 Caderno de Resumos c on v e rs a c om e l e 0 1.427 Time (s) “Figura 4. Pedido “Como você sabe?” A tabela abaixo resume os traços encontrados nos movimentos melódicos do grupo de contornos analisados de acordo com a configuração local: Configuração RISE EARLY LATE SPREAD FULL /1/ + - /2/ + + + + /3/ + + + - /4/ + + + + /5/ + + + - /A/ + + /B/ + + + + + /C/ + + + /D/ - /E/ + - /F/ + + + + - /G/ + + - “Tabela . Traços binários dos movimentos melódicos locais” Os movimentos melódicos de cada contorno podem ser classificados pelo conjunto de traços reunidos em cada coluna (de 1 a G) ou pela combinação desses traços, como por exemplo, 2A, 4C, etc. 5. Considerações finais O presente trabalho apresenta resultados preliminares de uma dissertação de mestrado que ainda está em curso. Neste trabalho, pretende-se chegar ao inventário de movimentos melódicos perceptivamente relevantes no conjunto de contornos melódicos analisados do Português do Brasil. Para isso, é preciso levar em conta os efeitos perceptivos que vão sendo gerados ao longo do processo de estilização em que os estímulos são criados e, em seguida, testados com ouvintes. Os resultados dessa investigação contribuem para os 166 4º Colóquio Brasileiro de Prosódia da Fala estudos fonológicos da língua especificamente no campo da fonologia entonacional, e espera-se que possam proporcionar subsídios teóricos para o desenvolvimento da pesquisa na área. Referências Boersma, P. and Weenink, D. 2009. Praat: doing phonetics by computer (Version 5.1.05) [Computer program]. Garrido Almiñana, J. M. 2003. “La escuela holandesa: el modelo IPO”. In: P. Prieto (eds.). Teorías de La entonacíon. Barcelona: Ariel. Garrido Almiñana, J. M. 1996. Modelling Spanish Intonation for Text-to-Speech Applications. PhD Thesis, Universitat Autónoma de Barcelona. Hermes, D. J. “Stylization of pitch contours”. 2006. In: Methods in Empirical Prosody Research, edited by S. Sudhoff, D. Lenertová, R. Meyer, S. Pappert, P. Augurzky, I. Mleinek, N. Richter & J. Schlieber: Berlin, New York: De Gruyter (= Language, Context and Cognition): 29-62. Ladd, D. R. 2008. Intonational phonology. New York: 2nd edition Cambridge University Press. Miranda, L. S. 2010. Em busca da naturalidade da entoação da fala sintetizada. In: XXXII Jornada Giulio Massarini de Iniciação Científica, Artística e Cultural, 2010, Rio de Janeiro. XXXII Jornada Giulio Massarini de Iniciação Científica, Artística e Cultural, v. 1: 74-74. Moraes, J. 1999. F0 declination in Brazilian Portuguese in read and spontaneous speech, Proceedings of the 14th International Congress of Phonetic Sciences, San Francisco, 1-7 August 1999: 2323-2326. Moraes, J. 2008. The pitch accents in Brazilian Portuguese: analysis by synthesis. In: Barbosa, P., Madureira, S. and Reis, C. (eds.) Proceedings of the Speech Prosody 2008: Fourth Conference on Speech Prosody, Campinas, 6 a 9 de maio de 2008: 389397. Moraes, J. 2011. A entoação de atos de fala diretivos no português do Brasil. In: III Colóquio Brasileiro de Prosódia da Fala, 2011, Belo Horizonte. Resumos do III Colóquio Brasileiro de Prosódia da Fala. 't Hart, J., Collier, R. and Cohen, A. 1990. A Perceptual Study of Intonation: An experimental-phonetic approach to speech melody. Cambridge: Cambridge University Press. 167 Caderno de Resumos Preenchimentos dos níveis prosódicos inferiores: dados de aquisição do português brasileiro (PB) Luzia Miscow da Cruz Payão Universidade Estadual de Ciências da Saúde de Alagoas – Brasil [email protected] 1. Introdução Observa-se na aquisição a segmentação da sílaba proeminente, como unidade da hierarquia prosódica representativa do enunciado, mediante análise gramatical de direção centrípeta. Essa sílaba proeminente é segmentada para dar início aos processos fonológicos de preenchimento segmental e estruturação silábica da palavra. A segmentação é favorecida pela sensibilidade gramatical da criança para as proeminências acentuais do enunciado – a unidade prosódica que representa o fluxo contínuo da fala –, desencadeando análises de direção centrípeta norteadoras da estruturação silábica da palavra. Em seguida ocorre um movimento de direção oposta e coocorrente, centrífuga, partindo da sílaba acentuada, já produzida na fala, com todas as posições silábicas preenchidas ou não, para as análises gramaticais que visam ao preenchimento segmental da sequência sonora de palavras, frases e enunciados da língua-alvo (Payão 2010). Os pressupostos teóricos da fonologia prosódica (Nespor e Vogel 1986; Scarpa 1999) e da autossegmental (Clements e Hume 1995; Mota 1996) fundamentam a descrição e a análise dos preenchimentos segmentais nas unidades prosódicas menores, que correspondem às primeiras produções de sequência de fala na aquisição fonológica: a sílaba, o pé métrico e as palavras inicialmente produzidas pelas crianças. De acordo com a fonologia prosódica de Nespor e Vogel (1986) as sete unidades prosódicas estão organizadas numa disposição hierárquica, constituída pelo enunciado, a frase entonacional, a frase fonológica, o grupo clítico, a palavra fonológica, o pé métrico e, por fim, a sílaba. A prosódia, portanto, fornece as estruturas básicas para a percepção da fala e a organização da sequência de sons em palavras (Scarpa 1997; Santos 2001; Santos e Scarpa 2005). 168 4º Colóquio Brasileiro de Prosódia da Fala 2. Objetivo Descrever a organização prosódica e segmental inicial da aquisição fonológica a partir da sílaba segmentada em amostra do PB falado em Maceió e Recife. 3. Métodos Estudo de caso observacional e descritivo da aquisição fonológica, seguindo os preceitos éticos, baseando-se nas produções de fala espontânea de criança do sexo feminino entre 1;6.28~1;7 e 2;1.10 de idade em fase de aquisição do PB falado em Maceió e Recife, durante sete meses de gravações áudio digitais. As análises de base auditivo-perceptual se restringiram ao preenchimento fonológico-fonético da sílaba segmentada, da delimitação do pé métrico e da palavra registrados em cada mês e comparados nos sete meses de acompanhamento. Os dados obtidos no preenchimento segmental das posições silábicas pré-tônicas, tônicas e pós-tônicas foram submetidos à análise de variância (Anova) (p<0,05) e teste post hoc de Tukey para comparações múltiplas. A quantidade e a qualidade de consoantes e vogais manipuladas nos preenchimentos silábicos foram as variáveis dependentes analisadas ao longo do tempo. Os dados coletados originam-se de situações lúdicas e comunicativas durante a manipulação de brinquedos adequados para a faixa etária da criança, explorados em conjunto com um dos pais ou ambos. Os registros foram gravados em áudio digital, com intervalos de aproximadamente trinta dias, por um período máximo de quarenta e cinco minutos de gravação a cada visita. 4. Resultados No inventário consonantal há predominância das obstruintes plosivas e das fricativas, enquanto os segmentos da classe de sonorantes restringem-se à líquida lateral [+anterior], às nasais e aos glides, concentrando-se nas duas sílabas – a tônica e a pós-tônica, que, sob a ação do preenchimento segmental de direção centrífuga, estabelecem a formação binária do pé métrico, construindo o nível prosódico destinado a colocar em evidência o acento da palavra. Notase, inicialmente, que há um número maior de segmentos consonantais na sílaba 169 Caderno de Resumos pós-tônica, comportando-se como uma sílaba mais favorável ao preenchimento com consoantes. Em relação às vogais há maior diversidade na posição tônica. 5. Discussão Esse comportamento de preenchimento segmental diferenciado entre a sílaba tônica e a pós-tônica sugere uma fase de definição do pé métrico, na qual a predominância de vogal ou da consoante parece desempenhar funções específicas desses segmentos nas sílabas que compõem o pé métrico. O preenchimento da sílaba pré-tônica comporta-se com menos diferenciação segmental. Os segmentos consonantais mais marcados, como por exemplo, as fricativas e as líquidas, aparecem primeiro na tônica e na pós-tônica para em seguida surgirem na pré-tônica. Observa-se um aumento significativo no número de palavras, tanto dissílabas como trissílabas, refletindo a possibilidade de manipular maior número de sílabas e de segmentos mais marcados pelo contraste. Os segmentos fricativos, mais marcados em relação aos sons já presentes no sistema dessa criança, concentram-se na sílaba tônica e na átona pós-tônica, constituindo sílabas no padrão CV. A especificação de valor de traços do segmento, a qualidade de tonicidade da sílaba que o hospeda e a localização dessa sílaba dentro da palavra parecem interagir e influenciar a efetividade da produção da palavra-alvo. As informações fonológicas do nível prosódico e do segmental se organizam para a produção das palavras. Quanto ao preenchimento vocálico observa-se que o número de preenchimentos vocálicos se destaca na tônica durante todo o período de análise, enquanto que entre as sílabas pré-tônicas e pós-tônicas não há diferença estatística relevante entre os preenchimentos de segmentos vocálicos nessas posições átonas. A partir da delimitação prévia do pé binário como palavra mínima de alvos polissílabos, as sílabas pré-tônicas começam a ser preenchidas com o núcleo, tornando a sequência silábica da palavra produzida mais próxima do alvo. A sílaba receptora do acento primário forma com uma átona de uma mesma palavra um constituinte binário preparatório para o preenchimento de outras sílabas dessa palavra. A presença do acento secundário reflete a expansão prosódica e segmental manifestada na fala dessa criança. Observam-se três aspectos relevantes para o preenchimento impulsionado pela ação centrífuga originária da sílaba acentuada: 1º) a qualidade de marcação de traços na 170 4º Colóquio Brasileiro de Prosódia da Fala constituição dos segmentos, que devem preencher as posições silábicas específicas; 2º) a influência da qualidade acentual da própria sílaba – se é tônica ou átona –; e 3º) a delimitação do pé métrico, formando uma base de sílabas que sustentará a transição para a palavra-alvo (Payão 2010). A tarefa de aquisição torna-se mais desafiante à medida que a estrutura silábica necessite ser preenchida por segmentos mais complexos em termos dos traços constituintes. 6. Conclusão Os dados evidenciados mostram que a sílaba acentuada é produzida desde o início das primeiras palavras reduzidas da criança. As aquisições e expansão do sistema segmental são influenciadas pela sílaba acentuada, corroborando estudos em aquisição, funcionando como um sinalizador prosódico de acordo com Scarpa (1997, 1999), Santos (2001) e FerreiraGonçalves (2009), possibilitando a transferência de segmentos e padrões silábicos para as outras posições átonas da palavra-alvo. As sequências silábicas incompletas observadas em algumas palavras refletem, especificamente, a dependência da aquisição de traços no nível segmental (Mota 1996, 2007), que parecem favorecidos perceptualmente nas posições silábicas tônica e pós-tônica, sob a influência e predomínio de palavras com o padrão de acento trocaico. Os dados mostram evidências de análises centrípetas que partem de referenciais prosódicos, ainda sob efeito do enunciado fonológico (Scarpa 1997, 1999); e de análises coocorrentes de direção centrífuga de preenchimento que operam nos aspectos silábicos, segmentais e métricos. Referências Clements G. N. e Hume E. 1995. The internal organization of speech sounds. In: Goldsmith J. (ed.)1995. The Handbook of Phonological Theory: 245-306. Cambridge: Blackwell. Ferreira-Gonçalves G. 2009. Unidades prosódicas – sílaba e acento – no processo de aquisição da linguagem. In: Ferreira-Gonçalves, G.; Keske-Soares, M.; Brum-dePaula, M. R. (orgs.) 2009. Estudos em Aquisição Fonológica 2: 203-224. Santa Maria: Sociedade Vicente Pallotti. 171 Caderno de Resumos Mota, H. B. 1996. Aquisição segmental do português: um modelo implicacional de complexidade de traços. Porto Alegre, 221 p. Tese (Doutorado em Letras). Instituto de Letras e Artes, Pontifícia Universidade Católica do Rio Grande do Sul. ______. 2007. Modelo Implicacional de Complexidade de Traços – os caminhos na aquisição segmental do português. In: Bonilha, G. F. G. e Keske-Soares, M. (orgs.). 2007. Estudos em Aquisição Fonológica: 123-136. Santa Maria: UFSM, PPGL – Editores. Nespor , m.e Vogel, I. 1986. Prosodic Phonology. Dordrecht: Foris Publications. Payão, L. M. C. 2010. Aquisição de fonologia: a influência do acento e o preenchimento de unidades prosódicas em dados de fala de duas crianças entre 1;0.4 e 2;1.10 de idade, em contato com o português brasileiro falado em Alagoas e Pernambuco. Maceió. 192 p. Tese (Doutorado em Linguística). Programa de PósGraduação em Letras e Linguística. Faculdade de Letras. Universidade Federal de Alagoas, 2010. Santos, R. S. 2001. A aquisição do acento primário no português brasileiro. Campinas – SP, 2001. 316 p. Tese (Doutorado em Linguística). Instituto de Estudos da Linguagem, Universidade Estadual de Campinas. Santos, R. S. e Scarpa, E. M. 2005. The phonological bootstrapping of determiners. Linguistics in the Netherlands 22 (1): 165-178(14). Netherlands. Scarpa, E. 1997. Learning external sandhi: evidence for a Top-down hypothesis of prosodic acquisition. In: Sorace, A., Heycok, C., Shillcock, R. (org.). 1997. Proceedings of GALA 1997: 272-277. Conference on Language Acquisition: Knowledge Representation and Processing. ______. 1999. Sons preenchedores e guardadores de lugar: relações entre fatos sintáticos e prosódicos na aquisição de linguagem. In: Scarpa, E. (org.) 1999. Estudos de Prosódia: 253-284. Campinas: Editora da UNICAMP. 172 4º Colóquio Brasileiro de Prosódia da Fala A prosódia como recurso para marcar tempo em Kangang Márcia Nascimento, Marcus Maia, Leticia Rebollo Couto Universidade Federal do Rio de Janeiro, Brasil [email protected], [email protected], [email protected] 1.Introdução O presente estudo diz respeito à descrição das categorias de Tempo, Modo e Aspecto em Kaingang. Identificamos um processo suprassegmental atuante em relação à categoria de Tempo nesta língua: em um grupo específico de verbos, a prosódia opera como traço distintivo de passado e de futuro, tanto em enunciados assertivos quanto em interrogativos. Demonstra-se que a língua Kaingang, além de explicitar construções temporais através de unidades lexicais, partículas e morfemas gramaticais, apresenta a ocorrência de fatores prosódicos, que influenciam a marcação de tempo, como constatado em estudos realizados através de procedimentos psico-experimentais e também através de análises acústicas. Esse fenômeno prosódico foi inicialmente observado através da aplicação de teste perceptual formulado no âmbito da Psicolinguística Experimental (LAPEX/UFRJ). Projetamos e implementamos um experimento psicolinguístico de julgamento de compatibilidade, que consistiu em um teste comportamental a fim de verificar a hipótese de que a flexão melódica atua como traço opositivo temporal na oralidade Kaingang, opondo passado e futuro em verbos do tipo “não-flexionais”. Os verbos denominados não-flexionais são todos terminados em consoantes, diferentes dos demais que terminam em vogais. Caracterizam-se pelo fato de não admitirem nenhum tipo de flexão morfológica quanto a tempo e sim flexão prosódica, ou mais especificamente a inflexão da frequência fundamental F0 para expressar passado e futuro. Trata-se de uma função da inflexão de F0 ou da altura melódica que não corresponde exatamente à descrição do tom (nível lexical), nem da entoação (nível do enunciado), uma vez que a oposição se dá no nível da morfologia verbal, conforme propomos em 173 Caderno de Resumos nossa análise, o que será mais bem demonstrado através da análise acústico experimental. 2.Experimento pisco-linguístico de julgamento e de compatibilidade Participaram do experimento 32 falantes nativos da língua Kaingang. 22 do sexo masculino e 10 do sexo feminino. Foram elaboradas 32 sentenças interrogativas, 16 com prosódia indicando passado (PP) e 16 com prosódia indicando futuro (PF). Da mesma forma, elaboramos 32 frases respostas, metade indicando noção de passado (RP) e outra metade indicando futuro (RF). Assim, geramos as 4 condições testadas em sentenças simétricas e assimétricas: PP + RP (sentença interrogativa com prosódia indicando passado + resposta indicando passado); PP + RF (sentença interrogativa com prosódia indicando passado + resposta indicando futuro); PF + RF (sentença interrogativa com prosódia indicando futuro + resposta indicando futuro); PF + RP (sentença interrogativa com prosódia indicando futuro + resposta indicando passado). As sentenças foram distribuídas em um desenho do tipo quadrado latino, dividindo-se os materiais em 4 versões, de modo que os sujeitos do experimento sejam expostos a todas as condições, mas não às diferentes versões das mesmas frases, que são comparadas “entre sujeitos” (design between subjects). Cada versão foi aplicada a 8 pessoas. O experimento baseouse no paradigma de audição automonitorada de sentença interrogativa, seguida de sentença resposta, também auditiva, consistindo a tarefa experimental em avaliar a compatibilidade entre as duas sentenças, registrando-se, além dos índices de julgamento, também os tempos médios de decisão. Os resultados obtidos no experimento confirmam que o índice de concordância de respostas das sentenças interrogativas, bem como os tempos médios de resposta demonstram que a flexão prosódica é realmente um recurso utilizado para expressão de Tempo na língua Kaingang, como demonstrado nos dados abaixo. 174 4º Colóquio Brasileiro de Prosódia da Fala Tabela 1. Tabela de resultados dos índices e tempos de decisão. 3. Resultados do experimento psico-linguístico 3.1 Futuro simétrico x Futuro assimétrico Variável categórica: índices de aceitabilidade A condição simétrica de futuro (PFRF) obteve 109 observações positivas, enquanto que a condição assimétrica de futuro (PFRP) obteve apenas 52 observações positivas, diferença que produz resultados altamente 2 significativos no test Chi quadrado: X =40, 4, p=0,0001***. Ou seja, a probabilidade dessa distribuição ter sido randômica é ínfima, o que garante que a preferência pela decisão simétrica deveu-se, de fato, à variável prosódica manipulada no experimento. Variável contínua: tempos médios de decisão A condição simétrica de futuro (PFRF) obteve 109 observações positivas respondidas em um tempo médio de 2288ms, enquanto que a condição assimétrica de futuro (PFRP) obteve apenas 52 observações positivas, que foram respondidas em um tempo médio de 3347ms. Esta diferença de tempos médios de resposta produz resultados significativos no teste-T: t(159)=2,08, p=0,04* . Assim, observe-se que dizer sim para a condição simétrica foi significativamente mais rápido do que dizer sim para a condição assimétrica, conforme predito em nossas hipóteses. 175 Caderno de Resumos 3.2. Passado simétrico x Passado assimétrico Variável categórica: índices de aceitabilidade A condição simétrica de passado (PPRP) obteve 109 observações positivas, enquanto que a condição assimétrica de passado (PPRF) obteve apenas 55 observações positivas, diferença que produz resultados altamente 2 significativos no test Chi quadrado: X =35, 6, p=0,0001***. Ou seja, a probalidade dessa distribuição ter sido randômica é ínfima, o que garante que a preferência pela decisão simétrica no passado deveu-se, de fato, à variável prosódica manipulada no experimento. Variável contínua: tempos médios de decisão A condição simétrica de passado (PPRP) obteve 109 observações positivas respondidas em um tempo médio de 3040ms, enquanto que a condição assimétrica de passado (PPRF) obteve apenas 55 observações positivas, que foram respondidas em um tempo médio de 5293 ms. Esta diferença de tempos médios de resposta produz resultados significativos no teste-T: t(162)=2,235, P=0,0268*. Assim, observe-se que dizer sim para a condição simétrica no passado foi significativamente mais rápido do que dizer sim para a condição assimétrica, conforme predito em nossas hipóteses. Figura 1: Índices de decisão para as condições simétricas e assimétricas. 176 4º Colóquio Brasileiro de Prosódia da Fala Figura 2. Tempos médios de decisão para as condições simétricas e assimétricas. De acordo com nossas hipóteses, as condições simétricas tanto para futuro quanto para passado obtiveram o maior índice de aceitabilidade, sendo elas também mais rápidas de processar, quando comparadas com as condições assimétricas. Inclusive, obtivemos resultados de índices de decisões positivas idênticos. Houve um nível insignificante de aceitabilidade das condições assimétricas nos índices de decisão. Igualmente, os tempos médios de decisão (latências em milésimos de segundos) foram significativamente mais rápidos na aceitabilidade das condições simétricas do que nas assimétricas. Os resultados acima comprovam que a flexão prosódica, de fato, está sendo utilizada como recurso para distinguir passado e futuro em Kaingang. Essa influencia prosódica para o Kaingang tem, portanto, consequências interessantes no nível morfológico (marcação de tempo), diferentemente de outras línguas onde a prosódia atua restrita ao nível lexical, por exemplo. Temos, portanto, um caso que parece ser muito particular e sem dúvida merece uma investigação mais aprofundada. 4. Análise acústico experimental: resultados Nossa hipótese é que a altura melódica seja o traço distintivo para a oposição passado e futuro que estamos descrevendo. Os 64 enunciados de nosso corpus foram assim distribuídos: 32 enunciados interrogativos formando 16 pares mínimos com oposição de noções temporais de passado e futuro, os mesmos do experimento psicolinguístico no 177 Caderno de Resumos teste comportamental exposto anteriormente. A segunda metade compõe-se de 32 enunciados assertivos, também formando pares mínimos com oposição de passado e futuro que foram especialmente elaborados para este trabalho piloto. O total de 64 enunciados foram gravados por um falante nativo da língua kaingang e foram analisados com o programa Praat em quatro níveis de segmentação, a saber: sílaba, vogal, tom e enunciado. Aplicamos para a análise o modelo métrico autossegmental proposto por Pierrehumbert (1980). Nesse sistema abstrato das representações temos basicamente dois tons que são H (high) para tom alto e L (low) para tom baixo. Os acentos tonais (pitch accents) para a silaba tônica se representam por um tom H ou L marcado pelo diacritico (*), e os tons de fronteira (Boundary Tones) H ou L são marcados pelo diacrítico %. Em nossas análises levamos em conta o acento nuclear (último acento tônico do enunciado) e também o primeiro acento pré-nuclear (primeiro acento tônico do enunciado antes do núcleo). O contorno ascendente de F0 (que marcamos com o acento nuclear H*H%) é 100% recorrente nos 32 enunciados em contexto de futuro, seja em enunciados interrogativos ou assertivos. Enquanto que, o contorno descendente de F0 (que marcamos com o acento nuclear L*L%) é 100% recorrente nos 32 enunciados em contexto de passado, seja em enunciados interrogativos ou assertivos. Figura 3. Enunciado assertivo e interrogativo no passado. APP3 (Fóg ag t? nãn kãtá nugnur) X PP3 (Fóg ag m? nãn kãtá nugnur) Figura 4. Enunciado assertivo e interrogativo no futuro. APF3 (Fóg ag t? nãn kãtá nugnur') X PF3 (Fóg ag m? nãn kãtá nugnur') 178 4º Colóquio Brasileiro de Prosódia da Fala 5. Discussão Estes resultados nos levam a considerar que a oposição de tons em Kaingang é funcional em alguns pontos específicos do sistema, neste caso para a oposição de passado (L*L%) e futuro (H*H%) no núcleo, mas também para a oposição assertiva e interrogativa no pré-núcleo, uma vez que as partículas, interrogativa e de sujeito, se opõem também pelo movimento melódico e pelos acentos tonais atribuídos (H* pré-núcleo e H* ou ¡H* partícula de sujeito para assertivo, H* pré-núcleo e L+H* partícula interrogativa). Tais oposições tonais, numa língua que não pode ser classificada como tonal, nos leva a pensar na possibilidade da emergência de um sistema tonal ou no resquício de um sistema tonal, em termos de evolução da linguagem. Os resultados da análise acústica confirmam a oposição contrastante entre o acento nuclear passado L*L% e o acento nuclear futuro H*H%. Referências Nascimento, M. 2012. Tempo, modo, aspecto e evidencialidade. Dissertação de Mestrado, Programa de Pós-Graduação em Linguística, UFRJ. 179 Caderno de Resumos Um estudo comparativo do acento ¡H+L* entre uma variaedade brasileira nordestina e uma italiana meridional: uma hipótese de lexicalização suprassegmental e uma reflexão sobre o conceito de foco 1,2] Marco Barone 1 Departamento de Matemática, Universidade Federal de Pernambuco, Recife, Brasil 2 Departament de Traducció i Ciències del Llenguatge, Universitat Pompeu Fabra, Barcelona, Espanha [email protected] A entoação do português brasileiro falado no Nordeste apresenta um típico acento nuclear em certos enunciados declarativos, composto por uma subida da frequência na sílaba pré-tônica e uma queda na sílaba tônica. A presença de tal acento se faz normalmente corresponder à presença de um foco estreito e uma etiquetagem ToBI encontrada na literatura por este acento é ¡H+L* (Morães 2008; Dabkowski 2012), ou seja uma queda de um alvo tonal muito alto, para marcar contraste com a queda simples H+L* presente nas declarativas sem foco de muitas variedades italianas e românicas (D'Imperio 2002; D'Imperio et al. 2005, entre outros). Um recente estudo sobre a variedade centro-meridional de italiano falada em Pescara (Barone et al., em preparação) encontra este mesmo acento (Fig. 1) na elicitação das declarativas sem foco afirmativas SVO e das declarativas com foco não contrastivo, utilizando a metodologia do Discourse Completion Task (Blum-Kulka et al. 1989) para elicitar vários tipos de sentenças-alvo. O foco contrastivo apresenta outro contorno. Esta homogeneidade entre foco amplo e foco estreito não contrastivo sugeriu que de fato os participantes colocassem obrigatoriamente um foco não contrastivo “de default” no objeto das sentenças, mesmo onde o Task prevê uma resposta sem focalização (ex. resposta a perguntas genéricas de tipo “O que está acontecendo?”, “O que o sujeito na foto está fazendo?”). Haveria basicamente uma marcação prosódica de proeminência obrigatória, não correspondendo ao 180 4º Colóquio Brasileiro de Prosódia da Fala valor semântico-informativo de foco ou de nova informação. As frases negativas não permitem esta marcação e são pronunciadas com uma queda nuclear simples H+L*. 0 0.5 1 200 175 )z 150 H ( 0 125 F 100 75 Beve una bibita. be ve u na b:i b:i ta ¡H+L* LL% Figura 1 Italiano de Pescara: constituinte nuclear simples Quando o constituente sintático nuclear é composto, o acento ¡H+L* se desdobra em uma subida (L+H*) na sua primeira sílaba tônica, um plateau alto e uma queda (H+L*) na sua última sílaba tônica (Fig. 2). 0 0.5 1 1.5 200 F0 (Hz) 164 128 92 56 20 Maria beve una tazza di latte. ma ria L+H*L- be veu ? na ta L+H* ts:a di la H+L* t:e L-L% Figura 2 Italiano de Pescara: constituinte nuclear composto 181 Caderno de Resumos Isto sugere que o acento ¡H+L* seja produto de um choque entre dois eventos entoacionais, um acento pré-nuclear L+H*, marcador de foco de default, e um nuclear declarativo H+L* e que, em ausência de suficiente material segmental (caso de um constituinte nuclear simples: Fig. 1) o acento ascendente L+H* seja adiado até a sílaba pré-tônica nuclear. Observar a ocorrência deste desdobramento pode nos ajudar a discernir, por exemplo, compostos VN recém-formados (“porta-oggetti”) que contêm duas unidades prosódicas, de outros morfológicos, já lexicalizados, que constituem uma única palavra prosódica (“portafogli”). Por outro lado, é impossível encontrar, no italiano falado em Pescara, esta subida na sílaba pré-tônica nuclear (e por isto o acento ¡H+L*) quando o constituinte objeto é composto, como mostra a tabela abaixo. Tabela 1 Configurações permitidas no italiano de Pescara. O mesmo estudo analisa a língua românica falada na cidade de Pescara (dialeto Pescarese) antes da chegada do Italiano, onde a queda simples H+L* não se encontra em nenhum caso, nem nas declarativas negativas: as frases negativas SVO introduzem um pronome proclítico catafórico para colocar o acento nuclear ¡H+L* no sintagma verbal e tornar o objeto pós-nuclear e desacentuado. Ex. “Ngi'a jite, a la fatije” (lit. “Ele não aí-fui, para o trabalho”); “Nnì so lett, lu libbre” (lit. “Eu não o li, o livro”) 182 4º Colóquio Brasileiro de Prosódia da Fala O italiano regional parece reproduzir esta tendência, e para evitar recorrer ao H+L* simples insere o pronome catafórico, às vezes em detrimento à norma. Ex. “Non ci sono andato, al lavoro” Tudo isto mostra uma tendência da língua a evitar, por um lado, situações em que não é possível colocar uma marca de ênfase em nenhum constituinte, e por outro lado a adaptar a sintaxe de maneira a colocar em posicão nuclear o único constituinte que pode receber esta focalização default. O objetivo do nosso trabalho é estudar o comportamento do acento nuclear ¡H+L* na variedade do português brasileiro falado em Recife, comparar seu comportamento com o mesmo acento encontrado em Pescara, observando como a realização de tal acento muda com respeito à estrutura sintática, em frases declarativas afirmativas SVO, com o constituinte nuclear apresentando vários graus de complexidade morfossintática, assim como em frases negativas, com negação simples e reduplicada (não...não). Queremos também entender em que medida se pode falar, em termos semânticos, de foco estreito em correspondência de um tal acento. Foram coletadas entrevistas de 7 informantes recifenses (4 mulheres e 3 homens, com idade entre 23 e 31 anos, de classe média e com ensino superior completo) assim como cerca de 4 horas de fala espontânea. Os participantes foram submetidos a um questionário, visando elicitar 29 sentenças-alvo (22 declarativas afirmativas, 5 declarativas negativas e 2 imperativas negativas) em que o constituinte nuclear varia em tamanho e grau de complexidade sintática (palavras simples ou compostas, neo-compostos, nomes geográficos: com número de unidades e distância entre possíveis proeminências variáveis). Os dados foram analisados com Praat (Boersma & Weeninck 2010) e etiquetados conforme o sistema ToBI (Silverman et al. 1992). Os resultados mostram que o acento ¡H+L*, em correspondência do núcleo, prevalece em todo tipo de declarativa simples, SV e SVO, mesmo quando o constituinte nuclear é composto ou possui uma estrutura morfossintática interna articulada (Fig. 3), o que não é permitido no italiano de Pescara. 183 Caderno de Resumos 0 0.5 1 1.5 2 350 F0 (Hz) 285 220 155 90 25 Ele veio para comprar cadeira de rodas. E L* li ve H- ju L* pa H- ra kom L* pra ka de r? di x? ¡H+L* da? L-L% Figura 3 Recife Brazilian Portuguese: constituinte composto Encontramos também ocorrências de plateau alto ao longo do constituinte, como acontece no italiano de Pescara, embora se trate de uma minoria de casos (segunda linha da tabela 2). Tabela 2 Configurações permitidas no português de Recife. O upstep adiado no núcleo é mais recorrente na fala espontânea do que na semi-espontânea, o parâmetro de sexo feminino favorece decisivamente sua ocorrência e não parece acompanhar um valor semântico de focalização ou de nova informação do constituinte menor que delimita. As ocorrências de plateau ao longo do constituinte confirmam que existe a possibilidade de realizar o foco no início do sintagma, embora não seja a escolha mais frequente. 184 4º Colóquio Brasileiro de Prosódia da Fala Tabela 3 Os dados dos dois tipos de marcação de foco de default nos enunciados afirmativos. Nos enunciados negativos SVO também encontramos o uso de ¡H+L*, diferentemente do italiano: o plateau ocorre apenas em certos enunciados SV quando o constituinte focalizado é um verbo finito simples, começando sobre o advérbio de negação e terminando no verbo. Uma proposta de interpretação dos resultados, que deverá ser confirmada com estudos e considerações históricas, é que tenha havido uma 185 Caderno de Resumos reinterpretação do choque ¡H+L*, encontrado nos constituintes simples, como evento único e uma extensão de seu uso a todo tipo de constituinte, com perda do significado composicional fonológico da combinação (L+H*) + (H+L*). Podemos concluir que há em Recife, assim como em Pescara, uma tendência a colocar, na fala espontânea, um foco não contrastivo de default, sem valor semântico-informativo. Esta mesma tendência poderia concorrer ao uso comum da dupla negação que permite a colocação do segundo advérbio não e do acento ¡H+L* em posição nuclear. Enquanto em Pescara esta marcação de foco é localizada no início do constituinte nominal de objeto, em Recife se realiza prevalentemente na sua última silaba tônica e na precedente. Se esta se tornar no futuro a única solução possível, a informação sintática sobre estes enunciados não será mais resgatável pela prosódia. Referências Barone, M., Gili Fivela, B. & Prieto, P. (em preparação). Intonational change in Pescara: sociolinguistic and linguistic factors. Presented in PaPI 2013. Blum-Kulka, S., House, J., & Kasper, G. (1989). Cross-cultural pragmatics: Requests and apologies. Norwood, NJ: Ablex. Dabkowski, M. (2012). Transcription of the intonation of Northeastern Brazilian Portuguese, MA Thesis. D'Imperio, M. (1999). Tonal structure and pitch targets in Italian focus constituents. In J. Ohala (Ed.), Proceedings of the 14th International Congress of Phonetic Sciences, 3: 1757–1760, San Francisco, USA. D'Imperio, M. (2002). Italian intonation: An overview and some questions. Probus 14 (1): 37-69. D'Imperio, M., G. Elordieta, S. Frota, P. Prieto & M. Vigário. 2005. Intonational Phrasing in Romance: The role of prosodic and syntactic structure. In S. Frota, M. Vigário & M. J. Freitas (eds) Prosodies, Phonetics & Phonology Series: 59-97, Berlin: Mouton de Gruyter. Lucente, L, & Barbosa, P. A. (2007). Notação entoacional do português brasileiro em corpora de fala semi-espontânea e espontânea. Em Intercâmbio, XVI, São Paulo. Moraes, J. A. (2008). The Pitch Accents in Brazilian Portuguese. Proceedings of Speech Prosody 2008: 389-397. Campinas. Silverman, K., Beckman, M., Pitrelli, J., Ostendorf, M., Wightman, C., Price, P., et al. (1992). TOBI: A Standard for Labeling English Prosody. Proceedings of ICSLP. 186 4º Colóquio Brasileiro de Prosódia da Fala Enunciados interrogativos totais neutros em ELE: antes e depois da sistematização no processo de ensinoaprendizagem Maristela da Silva Pinto1, Roberto Botelho Rondinini1, Natacha 1 Dionisio de Souza 1 Departamento de Letras, UFRRJ, Brasil [email protected], [email protected], [email protected] Pretendemos com este trabalho descrever foneticamente e analisar fonologicamente a entoação de enunciados interrogativos totais neutros em Português do Brasil, língua materna (PB/LM), fala carioca; em Espanhol, língua materna (E/LM), nas variedades de Castela, do México e Centroamérica e do Caribe; e em Espanhol como língua estrangeira (ELE). Para tanto, (i) comparamos os contornos entonacionais de enunciados interrogativos totais neutros em PB/LM, fala carioca e em E/LM, nas três variedades estudadas, (ii) descrevemos como os aprendizes de ELE implementam a F0, a duração e o acento tonal nuclear desses enunciados em dois momentos distintos de coleta. Desse modo, verificamos se esses aprendizes, após serem expostos a uma sistematização - a partir de um trabalho de descrição, percepção, repetição mimética e produção calcada na atenção transferem o sistema prosódico de sua LM para a LE, conforme já comprovado por Pinto (2009), ou se deixam de transferí-lo. Segundo Gil (2007), na própria história do ensino de línguas estrangeiras, a importância que foi dada à pronúncia variou enormemente. No método de gramática e tradução, a pronúncia não tinha a mínima relevância, já no método audiolingual, ela passou a ocupar o papel principal, tendo como objetivo final a reprodução do falante nativo. Depois desse método, a pronúncia passou por um período de esquecimento. Foi somente a partir dos anos 90, que essa recuperou relativamente sua importância, sendo que o sotaque nativo não era mais o foco e sim a inteligibilidade comunicativa. No entanto, para que haja inteligibilidade, a prosódia é indispensável. Muitas das vezes, a comunicação na língua estrangeira não é bem sucedida 187 Caderno de Resumos devido a problemas na entoação, pois é a partir dessa que o falante expressa sua intenção comunicativa e também é ela que permite distinguir modalidades. Segundo McLaughlin (1987), é comum o aprendiz de LE fazer transferências da LM quando os conhecimentos da LE não são suficientes para produzir enunciados. Portanto, nossa hipótese é a de que no processo de aprendizagem da língua estrangeira, os alunos transferem para a língua alvo os traços prosódicos da LM como uma forma de facilitar o aprendizado, o que acreditamos possa prejudicar a inteligibilidade entre aprendizes e nativos. Pinto (2009) já evidenciou a ocorrência da transferência prosódica nas modalidades assertiva e interrogativa total no par linguístico portuguêsespanhol. Na presente pesquisa, pretendemos verificar se tal transferência se mantém quando há um ensino sistematizado dos contornos entonativos, pautado em um trabalho de descrição, percepção, repetição mimética e uma produção oral calcada na atenção. Optamos por uma produção calcada na atenção, baseando-nos na proposta da demanda atencional de Fortkamp (2000), que, por sua vez, é pautada no modelo de Levelt (1989). Em tal modelo, o autor afirma que a produção oral requer, pelo menos, três estágios: (i) conceitualização; (ii) formulação; e (iii) articulação. Fortkamp (2000) sinaliza que, no caso da LM, o primeiro estágio requer atenção, já os demais são automatizados. Por outro lado, no caso da LE, a demanda atencional se estende aos três estágios. Desse modo, reiteramos a importância da sistematização no processo de ensino-aprendizagem da produção oral em LE. A fim de verificar se a metodologia por nós proposta é capaz de minimizar a transferência prosódica da LM para a LE, comparamos os contornos entonativos de enunciados interrogativos totais neutros nas variedades linguísticas mencionadas anteriormente. Nas análises feitas ao longo da pesquisa, levamos em consideração as propostas de Moraes (2008) para o PB/LM, fala carioca e as de Prieto e Roseano (2010) para as três variedades do E/LM. Cabe ressaltar que obtivemos os contornos através do programa computacional PRAAT. Para a análise fonética do núcleo, descrevemos o comportamento dos parâmetros acústicos: F0 e duração. Na análise fonológica, seguimos o modelo Métrico Autossegmental (AM), proposto por Pierrehumbert (1980) e Ladd (2008) e o modelo Sp_ToBI (Estebas & Prieto 2008). O corpus é constituído por 12 enunciados interrogativos totais neutros, sendo 3 em PB/LM, fala carioca, 1 em E/LM, variedade de Castela, 1 em E/LM, 188 4º Colóquio Brasileiro de Prosódia da Fala variedade do México e Centroamérica e 1 em E/LM, variedade do Caribe, 3 em ELE, oriundos da primeira gravação, antes da sistematização, e 3 em ELE, oriundos da segunda gravação, depois da sistematização, referentes a cada uma das variedades do ELM estudadas nesse trabalho. Os enunciados em PB/LM e ELE, das duas gravações, foram produzidos por 3 informantes do sexo feminino, cariocas, adultas, entre 18 e 24 anos, do curso de Letras – Português/Espanhol da UFRRJ. Já os enunciados em ELM foram extraídos do Atlas Interactivo de la Entonación del Español, de Estevas & Roseano (2009-2010). Neste estudo, observamos que, antes da sistematização (primeira gravação), as informantes produziam o contorno entonativo em ELE, em todas as variedades analisadas, como em PB/LM, fala carioca, sua língua materna, ou seja, com uma subida da pretônica para a tônica, seguida de uma queda da tônica para a postônica (L+ <H*L%), conforme se vê nas figuras 1 e 2. 500 400 300 Pitch (Hz) 200 100 0 Tem mar me e a e la da? a a L+<H*L% 0 1.213 Time (s) Figura 1: Contorno circunflexo com alinhamento tardio (L+<H*L%), no enunciado “Tem marmelada?”, PB/LM, fala carioca. Figura 2: Contorno circunflexo (L+<H*L%), no enunciado “¿Tiene mermelada?”, E/LE, todas as variedades, antes da sistematização. 189 Caderno de Resumos Após a sistematização (segunda gravação), a informante que treinou a variedade de Castela passou a produzir o contorno entonativo de acordo com o padrão de E/LM, ou seja, uma subida da tônica para a postônica (L*HH%), conforme se vê nas figuras 3 e 4. A informante treinou esse padrão 60 vezes ao longo de um mês. Figura 3: Contorno ascendente (L*HH%), no enunciado “¿Tiene mermelada?”, E/LM, variedade de Castela. 500 400 300 200 z) (H h cit P 100 0 ¿Tie ie ne e mer e me e la a da? a L*HH% 0 0.9149 Time (s) Figura 4: Contorno ascendente (L*HH%), no enunciado “¿Tiene mermelada?”, ELE, variedade de Castela. A informante que treinou a variedade do México e Centroamérica passou a produzir o contorno entonativo de acordo com o padrão de E/LM, ou seja, uma subida da tônica para a postônica, apenas no final desta (L*LH%), conforme se vê nas figuras 5 e 6. A informante treinou esse padrão 40 vezes em um mês. 190 4º Colóquio Brasileiro de Prosódia da Fala Figura 5: Contorno ascendente (L*LH%), no enunciado “¿Tiene mermelada?”, E/LM, variedade de México e Centroamérica. 500 400 300 200 ) z H ( h tci P 100 0 ¿Tie ie ne e e mer me e a la da? a L*LH% 0 1.306 Time (s) Figura 6: Contorno ascendente (L*LH%), no enunciado “¿Tiene mermelada?”, E/LE, na variedade do México e Centroamérica. No entanto, a informante que treinou a variedade do Caribe não realizou o padrão esperado, ou seja, uma queda da pretônica para tônica seguida de outra queda da tônica para a postônica (H+L*L%) e sim manteve o padrão de sua língua materna, conforme se vê nas figuras 7 e 8. Acreditamos que isso tenha se dado em função desta informante ter treinado apenas 12 vezes. 191 Caderno de Resumos Figura 7: Contorno descendente (H+L*L%), no enunciado “¿Hay reunión mañana?”, E/LM, variedade do Caribe. 500 400 300 Pitch (Hz) 200 100 0 ¿Tie ie ne e mer e me la e da? a a L+<H*L% 0 1.077 Time (s) Figura 8: Contorno circunflexo (L+<H*L%), no enunciado “¿Tiene mermelada?”, ELE, na variedade do Caribe. Acreditamos, desse modo, que quando o aprendiz dedica mais tempo a essa repetição mimética, a transferência prosódica é minimizada e, quando dedica menos tempo, essa se mantém. A partir do que foi exposto, concluímos que com um estudo sistematizado do aprendizado do contorno entonativo, a transferência prosódica pode ser minimizada ou até mesmo deixar de existir. Em outras palavras, o aprendiz, quando exposto a uma formalização das questões da entoação, a um treinamento exaustivo e a uma produção atenta e consciente, deixa de produzir o contorno e de implementar parâmetros acústicos (F0 e duração) de sua LM, passando a produzi-lo e implementá-los como o da língua alvo. 192 4º Colóquio Brasileiro de Prosódia da Fala Esperamos, com a presente pesquisa, contribuir para o desenvolvimento dos estudos acerca da prosódia e também para o aprimoramento do processo de ensino/aprendizagem de E/LE, principalmente no que concerne ao ensino da produção oral. Referências Vilaplana, E. E. & Prieto, Pilar. 2008. La notación prosódica del español: una revisión del Sp_ToBI. In: Estudios de fonética experimental XVII. Barcelona: Laboratorio de Fonética de la Universidad de Barcelona. Flege, J. 2002. Interactions between the native and second-language phonetic systems. IN Burmeister, P.; Pirske, T.; Rhode, A.. An integrated view of language development: papers in honor of Henning Wode. Trier: Wissens chaftliger Verlag: 217-243. Fortkamp, M. 2000. Working memory capacity and L2 speech production: an exploratory study. UFSC, Tese de Doutorado, Florianópolis. Gil, J. 2007. Fonética para profesores de español: de la teoria a la práctica. Madrid: Ed. Arco/Libros. Ladd, R. 2008. Intonational Phonology. Cambridge: Cambridge University Press. Levelt, W. J. M. 1989. Speaking: from intention to articulation. The Speaker as Information Processor. Cambridge, MA: MIT Press. McLaughlin, B. 1987. Theories of second language learning. Edward Arnold. Moraes, J. A. 2008. “The Pitch Accents in Brazilian Portuguese: analysis by synthesis”. The Fourth International Conference in Speech Prosody, Campinas, IEL. Fernández, F. M. 2000. Qué español enseñar. Madrid, Arco Libros. Pierrehumbert, J. 1980. The phonology and Phonetics of English Intonation. Tesis doctoral, MIT, Cambridge, Massachusetts. Pinto, M. 2009. Transferências prosódicas do português do Brasil/LM na aprendizagem do espanhol/LE: Enunciados Assertivos e Interrogativos Totais. UFRJ, Tese de Doutorado, Rio de Janeiro. Prieto, P. & Roseano, P. (coord.). 2009-2010. Atlas interactivo de la entonación del español. Disponível em: http://prosodia.upf.edu/atlasentonacion/ 193 Caderno de Resumos Características prosódicas dos números telefônicos no português brasileiro Oyedeji Musiliyu 11, Miguel Oliveira Junior 1 1 Faculdade de Letras, UFAL, Brasil [email protected], [email protected] O desenvolvimento da tecnologia da fala tornou o uso de sistemas automatizados de reconhecimento e de síntese de voz bastante frequente com aplicações múltiplas. Sistemas TTS (text-to-speech), ou conversores textofala, por exemplo, produzem fala sintetizada correspondente à leitura de um texto. Diversos serviços baseados nesses sistemas automatizados fazem uso de dígitos numéricos concatenados para os mais variados fins, tais como: ativação de cartões de crédito, informações bancárias, consultas a listas telefônicas e marcações de reservas, serviços de auxílio a deficientes visuais, etc. Serviços que fazem uso de agrupamentos numéricos como dados de entrada dependem de um bom sistema de processamento de informações de unidades sonoras e textuais correspondentes a dígitos alfanuméricos. Um sistema eficiente produzirá fala sintetizada ou dados numéricos correspondentes à pronúncia adequada do agrupamento numérico desejado. Em muitos casos, entretanto, a performance desses sistemas é considerada sofrível, ora por não processarem corretamente a fala espontânea (no caso de sistemas de reconhecimento de fala), ora por não apresentarem, em sua produção, características de ritmo e entonação próximas às da fala natural (no caso dos sistemas de síntese de fala). Isso se deve em parte ao fato de serem tais sistemas na maioria das vezes baseados em dados impressionísticos (ou muito antigos), não em dados de fala natural e corrente. Avanços nessa área foram obtidos em decorrência da descrição da enunciação de números naturais nas mais diversas línguas, tais como o alemão (Baumann & Trouvain 2001) e o francês (Bartkova & Jouvet 1999). Até o momento, entretanto, não há para o português do Brasil (PB) nenhum estudo que descreva, de forma sistemática e abrangente, as várias características acústicas da organização de números naturais em estruturas pré-estabelecidas. 194 4º Colóquio Brasileiro de Prosódia da Fala O objetivo deste estudo é descrever as características prosódicas de um tipo de agrupamento numérico bastante comum: aquele associado a números telefônicos. Para isso, a partir de um corpus coletado especificamente para este estudo, realizamos, num primeiro momento, uma análise segmental, com o propósito de investigar a estratégia padrão de agrupamento e de distribuição sonora aplicada aos números telefônicos de diferentes tamanhos no PB. Seguidamente, procedemos a uma análise prosódica para determinar as características entonacionais típicas de números telefônicos comuns, tais como enunciados por falantes nativos do PB. O corpus consiste em um total de 30 números telefônicos. Todos os números são reais e foram extraídos de uma lista telefônica local. Os números, sem código regional, foram escolhidos aleatoriamente, de forma a abranger (a) os números convencionais e de telefone celular com oito dígitos, (b) os números de serviços especiais com trés dígitos e (c) os números de ligação gratuita com onze dígitos. No intuito de testar uma possível relação entre a apresentação gráfica dos números e a maneira como eles são enunciados, os números convencionais de 8 dígitos foram apresentados de três maneiras diferentes, (i) divididos em dois grupos de quatro dígitos (NNNN NNNN), (ii) divididos em um grupo de quatro e dois grupos de dois dígitos (NNNN NN NN) e (iii) sem qualquer tipo de divisão (NNNNNNNN). Os catálogos telefônicos trazem números com esses três tipos de disposição, embora a do tipo (i) seja a mais frequente. Oitenta e cinco pessoas (quarenta e oito mulheres e trinta e sete homens) participaram do experimento. Os participantes leram uma breve instrução, seguindo-se a isso um rápido ensaio, contendo um total de seis números telefônicos representativos. Depois do ensaio, a gravação era imediatamente feita. Os participantes foram instruídos a ler os números da maneira como habitualmente o fazia e foram alertados de que não existe uma maneira correta para se dizer um número telefônico, de forma que não estavam sendo testados por isso. Os números foram apresentados um após outro, aleatoriamente, em slideshow, com intervalos regulares de sete segundos. A gravação foi feita em um equipamento de minidisc Sony, modelo MZ-R700, com um microfone digital Sony, modelo ECM-MS907, localizado a 15 centímetros da boca dos informantes. Os enunciados produzidos pelos participantes foram segmentados e transcritos no software PRAAT (Boersma & Weenink 2013), em agrupamentos representados pelo dígito 1 (unário), 2 (binário), 3 (ternário) ou 4 (quaternário), e em distribuições sonoras representadas pela letra U (unidade), D (dezena), C 195 Caderno de Resumos (centena) ou M (milhar). A descrição do contorno entonacional na enunciação dos números telefônicos foi obtida através de uma análise semiautomática das variações melódicas nas distribuições sonoras por meio do script MOMEL/INTSINT for PRAAT, versão 10.3 (Hirst 2007). Figura 1: Janela do PRAAT ilustrando a segmentação e a transcrição de um enunciado. O MOMEL (MOdélisation de MELodie) é um algoritmo proposto por Hirst e automatizado por Hirst e Espesser (1993), que tem por objetivo reduzir a curva de frequência fundamental a pontos-alvo. Esses pontos-alvo são seguidamente representados no niìvel fonoloìgico de superfiìcie utilizando o sistema de transcrição INTSINT (INternacional Transcription System for INTonation). O INTSINT, desenvolvido a partir de um estudo entonacional de 20 liìnguas, foi idealizado como um sistema de códigos para análise prosoìdica capaz de representar qualquer distinca?Þo entonativa significativa (Hirst & Di Cristo 1998). O INTSINT utiliza oito símbolos ortográficos abstratos para representar os pontos alvos obtidos através da estilização feita pelo MOMEL: T (topo), M (médio), B (base), H (mais alto), S (igual), L (mais baixo), U (subida suave) e D (descida suave). Os resultados desse trabalho permitiram identificar um padrão no agrupamento, na distribuição sonora e no contorno entonacional na enunciação dos números telefônicos no português brasileiro. As análises mostraram uma tendência a enunciar os números telefônicos de três dígitos em um agrupamento ternário 3 (NNN) com uma distribuição sonora em centena (C). Assim, por 196 4º Colóquio Brasileiro de Prosódia da Fala exemplo, a preferência na enunciação do número telefônico “190” é “cento e noventa”. O contorno entonacional observado nesse caso é de uma acentuação melódica M (médio), seguida de U (subida suave) e de D (descida suave): MUD. A tendência dos números de 8 dígitos, por sua vez, é ser organizado em um conjunto de quatro agrupamentos binários 2-2-2-2-2 (NN-NN-NN-NN), com uma distribuição sonora em unidades (UU(1)-UU(2)-UU(3)-UU(4)). Assim, por exemplo, o número telefônico “3445 2348” é enunciado preferencialmente “três quatro quatro cinco dois três quatro oito”. O contorno entonacional observado mostrou as seguintes características: na distribuição sonora UU(1), a acentuação melódica apresentou o tom M (médio), seguido de U (subida suave) e de D (descida suave); na distribuição UU(2), a acentuação melódica apresentou o tom D (descida suave) seguido de U (subida suave); na distribuição UU(3), a acentuação melódica apresentou o tom U (subida suave) seguido de D (descida suave); e na distribuição UU(4), a acentuação melódica apresentou o tom U (subida suave) seguido de um tom final B (baixo): MUDDU-UD-UB. Figura 2: Curva típica de um número de oito dígitos. A preferência de enunciação de números de 11 dígitos é um conjunto de um agrupamento quaternário, um agrupamento ternário e dois agrupamentos binários 4-3-2-2 (NNNN-NNN-NN-NN), com distribuição sonora em unidades e em centenas (UC-UUU-UU(5)-UU(6)). Assim, por exemplo, o número telefônico “0800 2812112” é enunciado preferencialmente da seguinte forma: “zero oitocentos - dois oito um - dois um - um dois. O contorno entonacional mostrou as seguintes características: na distribuição UC, a acentuação melódica apresentou o tom M (médio), seguido de U (subida suave), D (descida suave) e mais um U (subida suave); na distribuição UUU, a acentuação melódica apresentou o tom M (médio) e seguido de D (descida 197 Caderno de Resumos suave); na distribuição UU(5), a acentuação melódica apresentou o tom U (subida suave) e o D (descida suave); na distribuição UU(6), a acentuação melódica apresentou o tom U (subida suave), seguido de um tom final B (baixo): MUDU-MD-UD-UB. O propósito deste trabalho foi descrever a prosódia na enunciação dos números telefônicos no PB. Os objetivos centrais foram: realizar uma análise segmental para investigar a estratégia padrão de agrupamento e de distribuição sonora aplicada a números telefônicos de diferentes tamanhos e proceder a uma análise prosódica para estabelecer o padrão entonacional desses números, tais como enunciados por falantes nativos do PB. Embora alguns parâmetros prosódicos, tais como a duração e intensidade, não tenham sido considerados na presente análise, foi possível, ainda assim, encontrar um padrão entonacional na enunciação desses números telefônicos suficiente para caracterizá-los prosodicamente. Referências Bartkova, K. & Jouvet, D. 1999. “Selective prosodic post-processing for improving recognition of French telephone numbers”. In Proceedings of THE 6TH EUROSPEECH. Budapest, Hungary. Baumann, S. & Trouvain, J. 2001. “On the prosody of German telephone numbers.” In Proceedings of THE 7TH CONFERENCE ON SPEECH COMMUNICATION AND TECHNOLOGY. Aalborg, Denmark: 557-560. Boersma, P. & Weenink, D. Praat: doing phonetics by computer. Versão 5.3.53. Disponível em: http://www.praat.org/ Hirst, D.J & Di Cristo, A. 1986. Modelling French micromelody: analyses and synthesis. Phonetica, 43: 11-30. Hirst, D.J & Espesser, R. 1993. Automatic Modeling of Fundamental Frequency Using a Quandratic Spline Function. Aix-Provence: Travaux de l'Institut de Phoneìtique. Hirst, D.J. 2007. “A Praat plugin for Momel and INTSINT with improved algorithms for modelling and coding intonation.” In Proceedings International Conference on Phonetic Sciences, Saarbruc̈ken. 198 4º Colóquio Brasileiro de Prosódia da Fala Percepção de correlatos prosódicos da distinção dadonovo em português brasileiro 1 2 2 Pablo Arantes , Cíntia Antão , Luciana Lucente 1 Departamento de Letras, UFSCar 2 Faculdade de Letras, UFMG [email protected], [email protected], [email protected] 1. Introdução Estudos descritivos mostram que o português brasileiro usa contornos de frequência fundamental e a duração das palavras como correlatos acústicos da distinção entre referentes novos e dados (Arantes et al. 2012; Delfino et al. 2012; Antão et al. 2013): referentes novos tendem a apresentar contornos entoacionais com média e desvio-padrão maiores e com movimentos ascendentes nas sílabas pré-tônicas, que não estão presentes em referentes dados. Além disso, referentes novos tendem a ter maior duração acústica do que referentes dados. O objetivo do presente trabalho é tentar obter evidências para a hipótese segundo a qual as pistas prosódicas da distinção entre referentes novos e dados presentes na produção são usadas pelos ouvintes na percepção da fala. Relataremos os resultados de um experimento que usou os estímulos do estudo de percepção descrito em (Arantes et al. 2012) em um teste de percepção. 2. Materiais e métodos No experimento, testou-se a hipótese que prevê que os ouvintes exploram pistas entoacionais e duracionais para a distinção entre referentes novos e dados, descritas em [1], quando processam a fala. Na produção, encontra-se um padrão prosódico típico em cadeias de correferência como as descritas em [1], nas quais um referente novo é seguido por sua repetição, como mostrado no exemplo (1) abaixo. 199 Caderno de Resumos (1) [Uma peregrinação] reuniu muitas pessoas em volta da igreja. [A peregrinação] durou o dia todo. NOVO DADO O contorno entoacional da repetição mais típica desta frase é mostrado na Figura 1c e os trechos correspondentes ao referente novo (new) e dado (given) estão marcados por linhas verticais pontilhadas. Note-se que há uma proeminência no início do referente novo, em contraste com a curva correspondente ao referente dado. Para o experimento de percepção, as frases originais foram experimentalmente manipuladas de forma a obter todas as combinações possíveis de referentes 'novos' e 'dados', além da sequência nãomanipulada, Novo-Dado (1c): Dado-Dado (1a), Dado-Novo (1b) e Novo-Novo (1d). Para obter estas sequências, as duas ocorrências do substantivo peregrinação no exemplo (1) foram cortadas e coladas conforme a necessidade, preservando os contornos de duração, F0 e intensidade da primeira e da segunda ocorrências do referente. Todas as frases-veículo contendo cada uma das 18 palavras-chave do corpus do experimento descrito em Arantes (2012), que tinham 2, 3 ou 4 sílabas pré-tônicas, foram submetidas a este procedimento, que gera 4 estímulos experimentais para cada frase – Dado-Dado (DD), Dado-Novo (DN), NovoDado (ND) e Novo-Novo (NN) –, obtendo-se, assim, 72 estímulos experimentais. As 18 palavras-chave tinham. O procedimento experimental consistiu em apresentar aos sujeitos cada uma das frases-veículo na forma escrita e, a seguir, apresentar duas versões lidas, em áudio, da mesma frase. Uma das versões é sempre a original, isto é, a condição Novo-Dado (ND), e a outra é uma das versão manipuladas, isto é, DD, DN ou NN. A tarefa dos sujeitos era ler silenciosamente a frase apresentada na forma escrita, imaginar como ele pronunciaria aquela frase e, em seguida, escutar as duas versões apresentadas em áudio. Os sujeitos não foram informados de que um dos estímulos sonoros era uma versão manipulada do outro, apenas que os dois estímulos não eram iguais. Depois de escutar as duas opções, o sujeito indicava qual das duas versões ele julgava mais apropriada como uma leitura da frase. Um script do programa Praat desenvolvido para essa finalidade apresentou os estímulos aos sujeitos em ordem aleatória e registrou suas respostas. 200 4º Colóquio Brasileiro de Prosódia da Fala (a) 200 ) z H ( 0 F 80 Given Given (b) 200 )z H ( 0 F 80 Given New (c) 200 ) z H ( 0 F 80 New Given (d) 200 ) z H ( 0 F 80 New New Figura 1 201 Caderno de Resumos A hipótese testada é que as frases originais, isto é, aquelas na condição ND, seriam julgadas como leituras mais apropriadas das frases escritas. Se este resultado se verificasse, ele poderia ser interpretado como evidência de que quando um referente é introduzido no discurso e logo depois retomado, os ouvintes esperam que a primeira ocorrência tenha um grau de proeminência, expresso pela duração e por F0, maior do que a segunda ocorrência. A estranheza a respeito do status referencial das duas ocorrências da palavrachave evocada pelos estímulos manipulado seria causada, assim, pelo conflito entre as pistas prosódicas de um lado e, do outro, as pistas morfossintáticas (definitude do artigo e repetição do referente). Os dados de preferência pela leitura original ou manipulada, foram analisados por meio da aplicação de testes binomiais. Duas análises foram feitas. Na primeira, os dados de todas as palavras-chave foram agrupados e na segunda os dados foram segregados em função do tamanho da palavra-chave. Esta segunda análise se justifica pelo fato das pistas prosódicas que sinalizam a diferença de proeminência entre os referentes novos e dados serem mais fortes nas palavras de tamanho maior, conforme mostrado em (Arantes 2012). Testouse a hipótese nula segundo a qual a proporção de preferência pela versão nãomanipulada das frases (estímulos Novo-Dado) seria resultado de uma escolha aleatória, isto é, 50%. Fixou-se em 5% o nível de significância para todas as análises. Participaram do experimento 27 sujeitos, alunos de graduação da UFMG, com idade média de 23 anos e ingênuos em relação aos objetivos do experimento. A aplicação consistiu de duas etapas, treinamento e sessão experimental. 3. Resultados A Tabela 1 resume os resultados da análise em que os dados de todas as palavras-chave foram agrupados. A segunda coluna mostra a porcentagem de escolhas da condição não-manipulada (Novo-Dado) quando esta era comparada com as demais condições, mostradas na primeira coluna. A terceira coluna mostra o valor de p do teste binomial exato. Em todos os casos, testou-se se a proporção de escolhas da condição Novo-Dado poderia ser considerada maior do que 50%, aquela que se obteria caso os sujeitos escolhessem aleatoriamente. 202 4º Colóquio Brasileiro de Prosódia da Fala Condição Dado-Dado Dado-Novo Novo-Novo Todas % NovoDado 56 58 54 56 p n.s. < 0.05 n.s. < 0.05 Tabela 1 Os resultados mostram que, quando as condições são consideradas separadamente, apenas quando os sujeitos comparam a condição Dado-Novo com a condição não-manipulada é que a escolha por esta versão (Novo-Dado) tem uma porcentagem acima do nível aleatório, resultado que também se repete quando todas as condições são comparadas em conjunto com a versão nãomanipulada. Uma das explicações para este resultado é que esta análise, ao juntar todos os grupos de palavras-chave, pode mascarar o fato de que, nas palavras de menor tamanho (duas sílabas pré-tônicas), o efeito de estranheza causado pela manipulação prosódica pode ser menos forte em função da pouca diferença de proeminência entre os dois tipos de referentes observada na produção. A Tabela 2 exibe os resultados de forma semelhante à tabela anterior, mas separa os dados por tamanho da palavra-chave (medido em número de sílabas pré-tônicas). O exame da tabela mostra que, a situação em cada um dos três grupos é diferente. No grupo de palavras com duas pré-tônicas não se verifica nenhuma significância, o que sugere que os sujeitos consideram as versões manipuladas indistinguíveis das versões não-manipuladas. Esse resultado poderia ser interpretado como resultado da menor diferenciação prosódica dos referentes novos e dados, verificado nas palavras-chave com este tamanho. Essa interpretação é reforçada pelo fato de haver uma preferência pela versão natural no grupo das palavras-chave com 3 pré-tônicas em duas das quatro condições testadas (Dado-Dado e todas as condições agrupadas) e uma preferência marginalmente significativa na condição Dado-Novo. Contra esta interpretação, entretanto, pesa o fato de no grupo de palavras-chave com 4 prétônicas, haver uma preferência apenas marginalmente significativa (no caso em que as condições são reunidas), sendo as demais porcentagens comparáveis com respostas aleatórias. 203 Caderno de Resumos Nº de sílabas pré-tônicas 2 3 4 Condição % Novo-Dado p Dado-Dado Dado-Novo Novo-Novo Todas Dado-Dado Dado-Novo Novo-Novo Todas Dado-Dado Dado-Novo Novo-Novo Todas 47 53 51 50 64 60 56 60 56 59 56 57 n.s. n.s. n.s. n.s. < 0.05 < 0.1 n.s. < 0.05 n.s. n.s. n.s. < 0.1 Tabela 2 4. Discussão Os resultados mostrados na Tabela 1 mostram a presença de uma preferência geral de baixa magnitude (56%), mas significativa do ponto de vista estatístico, pelo padrão prosódico não-manipulado, dando suporte para a hipótese de que as diferenças prosódicas verificadas entre referentes novos e dados na produção da fala são relevantes para a percepção da boa-formação dos enunciados. Os resultados modestos podem ser explicados em parte pelo fato de que as diferenças prosódicas encontradas na produção, por mais que sejam sistemáticas em sua ocorrência, podem não ser muito robustamente perceptíveis. Além disso, o possível estranhamento que a manipulação prosódica supostamente criaria pode ter sido encoberto pela presença de redundâncias na marcação dos status referenciais nos estímulos, como as pistas morfossintáticas. Referências Antão, C.; Arantes, P.; Cunha Lima, M. L. 2013. “Interrelation between subjecthood, referential status and prosody”. Abstract Book of the 35th Annual Conference of the German Linguistic Society (DGfS), March 12-15, Potsdam, Alemanha. Arantes, P.; Lima, M. L. C.; Barbosa, P. A. 2012. “Some prosodic correlates of referential status in Brazilian Portuguese”. Revista Diadorim, 12: 1-25. Delfino, A.; Cunha Lima, M. L.; Arantes, P. 2012. “Prosodic marking of referential status in Brazilian Portuguese: a preliminary study”. Proceedings of the VIIth GSCP International Conference: Speech and Corpora: 186-190. 204 4º Colóquio Brasileiro de Prosódia da Fala A combinação de pistas acústicas melódicas, de duração silábica e de intensidade relativa prevê melhor a percepção da proeminência em português brasileiro Plínio A. Barbosa Dep. de Linguística, Inst. de Estudos da Linguagem, Univ. de Campinas, Brasil [email protected] Na pesquisa prosódica de base fonética, a proeminência percebida é vista como uma função comunicativa associada ao destaque de uma unidade linguística na cadeia de fala (Terken 1994; Xu e Xu 2005). As unidades mais comumente descritas no estudo da proeminência são palavras e sílabas. Para esses casos, as tarefas mais usadas para avaliar a proeminência são testes de percepção com ouvintes aos quais se solicita que palavras ou sílabas se destacam de sua vizinhança ao ouvirem frases isoladas e passagens de fala encadeada. Este trabalho toma a proeminência como uma função comunicativa avaliada por ouvintes leigos. A proeminência da palavra foi avaliada em português brasileiro (PB) em parágrafos lidos em duas taxas de elocução bem como em uma narrativa lida por uma atriz profissional (Camila Pitanga). A proeminência pode ser avaliada tanto de uma forma binária quanto de forma gradiente. Um exemplo de tarefa do ultimo tipo foi utilizada por Eriksson et al. (2001). Os autores solicitaram a um grupo de 18 ouvintes adultos suecos que avaliassem um conjunto de 20 enunciados pronunciados por 10 locutores suecos sob três esforços vocais distintos. Esses enunciados foram obtidos ao pronunciar as mesmas frases de 13 sílabas com diferentes esforços vocais resultado de comunicações a distâncias distintas entre locutor e experimentador. A proeminência silábica foi avaliada pelo deslocamento de 13 barras deslizantes, uma para cada sílaba, num mostrador gráfico que permitia atribuir de 0 a 100% a proeminência de cada sílaba de forma contínua entre os dois extremos. Parâmetros acústicos relativos ao esforço vocal, altura (pitch) e duração predisseram, quando usados individualmente, o grau médio de proeminência com uma correlação de 50%. Quando combinados linearmente, 205 Caderno de Resumos os três fatores predisseram a proeminência avaliada pelos ouvintes com uma correlação de 70 %. A contribuição de cada um desses fatores para predizer a proeminência foi praticamente de mesma extensão. Também para o sueco, Moubayed e Beskow (2010) usaram um método similar para predizer o grau de proeminência média a partir de pistas acústicas. No trabalho deles a proeminência da palavra foi avaliada por 4 especialistas que avaliaram um subcorpus formado por 200 sentenças lidas por um ator profissional. As sentenças foram obtidas de um corpus maior sobre notícias e literatura. Alguns parâmetros acústicos foram calculados para cada sílaba. O máximo valor de cada parâmetro acústico entre as sílabas de uma palavra foi usado como parâmetro acústico relativo à palavra com exceção da duração, que foi relativa à palavra como um todo. Com relação às palavras, o parâmetro que melhor predisse o grau de proeminência média foi a duração, enquanto com relação à sílaba foram gama de F0 seguida de duração silábica. Recentemente, Barbosa et al. (2013) apontaram o papel mais importante da duração da vogal para assinalar acento lexical em palavras proeminentes tanto em PB quanto em sueco, confirmando alguns resultados anteriores do PB e revendo outros (Massini 1991, Moraes 1987; Fernandes 1976). Nos trabalhos de Cole et al. (2008) e Barbosa (2010), tanto a proeminência de palavra quanto a marcação de fronteiras foram considerados de forma binária. No trabalho que reportamos aqui somente a função de proeminência foi avaliada. Essa foi obtida a partir da percentagem de ouvintes que avaliaram de forma binária a proeminência das palavras ao ouvir quatro leituras de um excerto de 110 palavras. As leituras foram feitas por um locutor masculino e outro feminino em taxas de elocução normal e rápida. Os ouvintes foram 10 estudantes de Graduação em Linguística sem treinamento em Fonética. Cada ouvinte foi instruído para ouvir os excertos tantas vezes quantas foram necessárias a fim de marcar todas as palavras no texto escrito que considerassem destacadas pelo locutor. Outro grupo de 10 estudantes de Graduação avaliou as palavras proeminentes de uma narração de um mito amazônico sobre a origem do Uirapuru feita por Camila Pitanga no CD Lendas Brasileiras. Segundo um teste z de proporções, nenhum clítico pode ser considerado proeminente pela população subjacente de ouvintes, o que nos habilitou a considerar a palavra fonológica (clítico e palavra lexical correspondente) como lugar de manifestação da proeminência. Dessa forma, decidiu-se calcular um conjunto de 7 parâmetros acústicos em cada palavra fonológica. O software Praat (Boersma e Weenink 2013) foi usado para anotação e como plataforma para o cálculo dos parâmetros acústicos. Duas camadas de 206 4º Colóquio Brasileiro de Prosódia da Fala anotação foram empregadas para segmentar e etiquetar os 4 excertos e a narração. Na primeira camada delimitaram-se os intervalos correspondentes a todas as sílabas fonéticas definidas por dois inícios de vogal consecutivos (unidade VV). Cada rótulo contém a sequência dos fones da unidade VV. A segunda camada, por sua vez, contém os intervalos correspondentes às palavras fonológicas, etiquetadas pela forma ortográfica da cabeça do domínio. Um script para o Praat foi elaborado para gerar 7 parâmetros acústicos para cada palavra fonológica: duas medidas relativas à duração que são o inverso da taxa de elocução em sílabas por segundo, isto é, a duração média das sílabas fonéticas no intervalo correspondente à palavra fonológica, além do máximo da duração normalizada da unidade VV no mesmo intervalo, obtida pela técnica de normalização por z-score; quatro medidas relativas à curva de F0 de cada palavra fonológica: mediana, amplitude de variação (máximo menos mínimo), máximo e mínimo; e uma última medida, de ênfase espectral, tal como definida por Traunmüller e Eriksson (1995). A última medida é um parâmetro que assinala a intensidade relativa que se correlaciona com o esforço vocal. Um conjunto de modelos de regressão logística foi preparado para prever a percentagem de resposta dos ouvintes segundo cada palavra lexical a partir dos sete parâmetros acústicos para o corpus em estudo aqui. Os modelos de regressão logística foram montados no pacote R (R-project 2008) segundo uma distribuição quase-binomial. Para a leitura em taxa normal, o melhor modelo de regressão para explicar o grau de proeminência foi aquele com a duração média da unidade VV em conjunto com a ênfase espectral, em ordem de importância. Os dois parâmetros predizem, juntos, a proeminência percebida com uma correlação de 50 %. Para a leitura rápida os melhores preditores foram o máximo da duração normalizada de unidade VV na palavra fonológica juntamente com a ênfase espectral com correlação de 44 %. Para a narrativa, por sua vez, o melhor modelo conjugou a duração média da unidade VV, a ênfase espectral e o máximo de F0 na palavra fonológica com correlação de 42 %. Nenhuma diferença de gênero foi encontrada quando considerados modelos separando excertos de homens e de mulheres. Ao menos quando analisada considerando apenas a informação local da palavra fonológica, independentemente de seu contexto, a contribuição dos parâmetros prosódico-acústicos para a proeminência é parcialmente realizada pela duração do tamanho da sílaba (média ou pico de duração normalizada), ênfase espectral (um correlato de esforço vocal) e, num menor grau, o máximo de F0 na narração. Esses resultados confirmam a relevância dos dois primeiros parâmetros 207 Caderno de Resumos para assinalar o acento lexical em palavras proeminentes em PB (Barbosa et al. 2013), estabelecendo um vínculo entre saliência acústica e proeminência percebida. Referências Barbosa, P. A. 2010. “Automatic duration-related salience detection in Brazilian Portuguese read and spontaneous speech”, Proc. Speech Prosody 2010, Chicago ( 1 0 0 0 6 7 : 1 - 4 ) . A v a i l a b l e o n l i n e a t : http://www.speechprosody2010.illinois.edu/papers/100067.pdf Barbosa, P.A., Eriksson, A. e Akesson, J. 2013. “Cross-linguistic similarities and differences of lexical stress realisation in Swedish and Brazilian Portuguese”, In E.L. Asu e P. Lippus (eds.) Nordic prosody. Proceedings from the XIth conference, Tartu 2012 (pp. 97-106). Frankfurt am Main: Peter Lang, Boersma, P. e Weenink, D. 2013. “Praat: doing phonetics by computer” [Computer program], Available online at: http://www.praat.org Cole, J., Goldstein, L., Katsika, A., Mo, Y., Nava, E. e Tiede, M. 2008. “Perceived prosody: Phonetic bases of prominence and boundaries”, J. Acoust. Soc. Am. 24(4): 2496-2496. Eriksson, A., G. C. Thunberg e H. Traunmller. 2001. “Syllable prominence: A matter of vocal effort, phonetic distinctness and top-down processing”, Proceedings of EuroSpeech-2001, Aalborg, Dinamarca, 399-402. Fernandes, N. H. 1976. Contribuição para uma análise instrumental da acentuação e intonação do português. Mestrado (Dissertação). Universidade de São Paulo. Massini, G. 1991. A duração no estudo do acento e do ritmo em português. Mestrado (Dissertação). Universidade de Campinas. Moraes, J. A. 1987. “Corrélats acoustiques de l'accent de mot en portugais brésilien”, Proc. XIth International Congress of Phonetic Sciences, 3, Tallinn: Estonia, 313-316. Moubayed, S. Al e J. Beskow. 2010. “Prominence Detection in Swedish Using Syllable Correlates”. Proc. Interspeech 2010, Makuhara, Japan, 1784-1787. R-Project. 2008. The R foundation for statistical computing. “The R project for statistical computing”, Available online at: http://www.r-project.org Terken, J. 1994. “Fundamental frequency and perceived prominence of accented Syllables”, J. Acoust. Soc. Am., 95(6): 3662-3665. Traunmüller, H. e Eriksson, A. 1995. “The frequency range of the voice fundamental in the speech of male and female adults”. Unpublished manuscript. Available online at: http://www.ling.su.se/sta_/hartmut/aktupub.htm Xu, Y. e C. X.. Xu. 2005. “Phonetic realization of focus in English declarative intonation”, J. Phon., 33:159-195. 208 4º Colóquio Brasileiro de Prosódia da Fala Entoação das interrogativas totais e parciais do espanhol produzidas por um professor de espanhol, falante de português brasileiro de Curitiba Pollianna Milan¹ ¹Universidade Federal do Paraná (UFPR), Brasil [email protected] O aprendizado de uma língua estrangeira (LE) exige uma série de requisitos para que o aluno consiga aprender essa nova língua a ponto de ser um falante proficiente. Um deles, e até mesmo um dos maiores desafios nessa aquisição, é o aprendiz ser capaz de produzir a LE sem sotaque estrangeiro. Para isso, ele precisa perceber que há diferenças tanto no nível segmental quanto suprassegmental entre a LE e a sua língua materna (LM), pois, a prosódia da LE (seu nível suprassegmental), foco da presente pesquisa, normalmente não é a mesma da LM. Dessa forma, o objetivo dessa pesquisa é analisar a produção de interrogativas espanholas feitas por um brasileiro (curitibano), professor de espanhol, que se considera um falante da variedade madrilenha, para verificar se ele é capaz de reproduzir adequadamente a entoação dessas interrogativas na LE. Sobre o português brasileiro (PB), é importante lembrar que o padrão da interrogativa total tem a seguinte configuração: L+H*L% (chamada também de circunflexo, porque apresenta ascensão seguida de queda), de acordo com estudos de Moraes (2007). Já as interrogativas parciais, como em wh-questions, segundo Moraes (2008), apresentam também queda no final da pergunta, mas com a seguinte configuração H+L*L%. Sosa (1999) indica que as interrogativas totais madrilenhas apresentam no final o seguinte movimento: L*H%. Já as interrogativas parciais madrilenhas costumam ter no núcleo a forma H*L%. Sosa (2003) mostra ainda que as interrogativas com wh, em fala espontânea, tem o movimento rising-falling. As configurações dos núcleos das interrogativas, assim, parecem distintas nas duas línguas – PB e espanhol de Madri -, por isso poderá haver interferências da LM na LE. 209 Caderno de Resumos No caso de falantes do PB que aprendem a língua espanhola (ou castelhana) como LE, diversos estudos (por exemplo, Pinto 2009; Font-Rotchés 2011; Dias 2012) têm demonstrado as dificuldades desses aprendizes em conseguir reproduzir a entoação da língua espanhola adequadamente. Essa dificuldade está relacionada, principalmente, às interrogativas totais e parciais, que exibem uma maior distinção quando comparadas às interrogativas do PB. Pinto (2009) mostra que contornos entoacionais característicos do PB às vezes são reproduzidos indevidamente em interrogativas do espanhol. Font-Rotchés (2011) aponta que os brasileiros que vivem em Goiás não produzem adequadamente a entoação de interrogativas espanholas, pois, na curva melódica, a ascensão final fica abaixo do esperado. Dias (2012) analisou as interrogativas totais produzidas por aprendizes do sexo feminino, florianopolitanas do curso de Letras-Espanhol. Seus resultados mostraram que, para algumas perguntas (dependendo se o núcleo finalizava por palavra oxítona, paroxítona ou proparoxítona), houve a produção do padrão circunflexo (que não existe na variedade colombiana de Bogotá, a variedade produzida pelas aprendizes). Isso pode ser reflexo, segundo Dias, da influência da língua materna ou da interferência de outras variedades do espanhol. Não se tem conhecimento, pelo menos por enquanto, de pesquisas nessa área de entoação com falantes curitibanos, por isso, a intenção do trabalho é analisar esse público para contribuir com o mapeamento prosódico do espanhol como língua estrangeira no Brasil e, assim, apontar as dificuldades no processo de aquisição dessa LE. Além disso, parte-se do princípio de que os curitibanos, como os aprendizes de alguns outros estados brasileiros, repetirão as dificuldades prosódicas no momento de produzir interrogativas totais e parciais. Estudos têm mostrado que os brasileiros normalmente apresentam uma curva entoacional com um range mais baixo; o pré-núcleo e o núcleo com valores de pitch também abaixo do esperado (Pinto 2009; Font-Rotchés 2011; Dias 2012). O piloto dessa pesquisa contou com um informante curitibano, ou seja, que nasceu e vive até hoje em Curitiba (PR), do sexo masculino e com 24 anos, que aprendeu espanhol como LE no curso de Letras-Espanhol da Universidade Federal do Paraná (UFPR). Atualmente esse informante é professor de espanhol no Centro de Línguas da mesma instituição (Celin). Para esta pesquisa, primeiramente foram gravadas cerca de doze horas de aulas ministradas pelo informante e, dessas aulas, foram retiradas as falas que contêm interrogativas totais e parciais (ao menos 35 de cada). Posteriormente foram gravadas, com esse informante, 70 interrogativas (35 totais e 35 parciais) em 210 4º Colóquio Brasileiro de Prosódia da Fala uma sala silenciosa, ou seja, sem a presença dos alunos. Nessa segunda coleta, foram entregues ao informante pequenos fragmentos de textos escritos e, a partir de cada um dos contextos descritos, ele deveria fazer a interrogativa necessária, imaginando-se na situação narrada. Por exemplo, a partir da citação: “Quieres hacer una sorpresa a Juan antes que él viaje. Pero estás en duda si Juan viajará hoy. Pregúntale eso a la madre de Juan”. A escolha pelos dois tipos de coleta de dados foi feita para conseguir ter gravações mais próximas da fala espontânea, que é a ideal para estudos prosódicos. Os dados foram registrados em um gravador digital da marca Olympus e foram baixados em programa específico do próprio gravador para, depois, serem tratados no Programa Audacity. Em seguida, para a análise dos dados, será utilizado o programa Praat. Serão analisados: os movimentos ascendentes e descendentes dos tons a partir do modelo AM para se observar, principalmente, o movimento do acento nuclear, que corresponde à parte final das sentenças em que se encontra a sílaba de maior proeminência frasal (núcleo). Além desse movimento, serão observados ainda os valores de pitch e o alinhamento da curva entoacional no núcleo e, também, no pré-núcleo dos enunciados. Além da análise de produção das interrogativas totais e parciais desse informante, também será rodado um teste de percepção com as 140 interrogativas (totais e parciais) intercaladas com declarativas (desse mesmo informante que foram coletadas durante as aulas). Esse teste será aplicado em um falante nativo de espanhol que está em intercâmbio em Curitiba: ele é madrilenho, uma vez que é a variedade que o informante da pesquisa diz reproduzir. Nesse teste de percepção, a intenção é saber se o professor brasileiro é capaz de reproduzir adequadamente as interrogativas totais e parciais a ponto de serem percebidas como tais por falantes nativos madrilenhos. Esse teste de percepção será rodado no Praat e aplicado ao madrilenho com a presença da pesquisadora. Os resultados serão tabulados e confrontados com os resultados obtidos nas análises de produção. Observações preliminares mostram que o informante produz, no núcleo, interrogativas totais na configuração L+H*L% e parciais com movimento L+H*H%, ou seja, parece produzir o contrário do que deveria fazer para cada um dos tipos de interrogativas. Além disso, o pré-núcleo das interrogativas apresentam pouca ou nenhuma diferença de altura de pitch, o que quer dizer que parecem não ter a mesma diferença de pitch/range da fala dos madrilenhos. 211 Caderno de Resumos Referências Dias, Eva.C.O.; Alves, M.A. 2012. “Análise de produção de sentenças interrogativas totais em aprendizes brasileiros de espanhol como língua estrangeira”. In Journal of Speech Sciences: 43-63. Font-Rotchés, D. 2011. “Melodic Analysis of speech (MAS): aplicaciones en la comparación de lenguas”. Revista da Abralin eletrônico (especial): 333-366, 1ª parte. Moraes, J. 2008. “The Pitch Accents in Brazilian Portuguese: analysis by synthesis”. In Speech Prosody, Campinas. Moraes, J.; Colamarco, M. 2007. “Você está pedindo ou está perguntando? Uma análise entonacional de pedidos e perguntas no português do Brasil”. Revista de Estudos Linguísticos. Pinto, M.S. 2009. Transferências prosódicas do português do Brasil/LM na aprendizagem do espanhol/LE: enunciados assertivos e interrogativos totais. 355 f. Tese (doutorado em Estudos Linguísticos Neolatinos), Universidade Federal do Rio de Janeiro, Rio de Janeiro. Pietro, P.; Estebas, E. 2008. La notación prosódica en español. Una revisión del Sp_ToBI. Estudios de Fonética Experimental XVII: 263-283. Sosa, J. 1999. La entonación del español: su estructura fónica, variabilidad y dialectología. Madrid: Cátedra. Sosa, J. 2003. Wh-questions in Spanish: meanings and configuration variability. Simon Fraser University, Canada. In Catalan Journal of Linguistics: 2: 229-247. 212 4º Colóquio Brasileiro de Prosódia da Fala Prosódia acústica e prosódia visual de enunciados interrogativos no espanhol de Montevidéu Priscila Cristina Ferreira de Sá1, Leticia Rebollo Couto1 1 Universidade Federal do Rio de Janeiro, Brasil [email protected], [email protected] 1. Introdução O presente estudo propõe uma descrição acústica e visual de enunciados interrogativos totais com diferentes atitudes proposicionais no espanhol de Montevidéu/Uruguai. Nossa hipótese é que 4 atitudes proposicionais sejam contrastivas do ponto de vista prosódico na enunciação de perguntas. Foram gravados dados de fala atuada, ou seja, interpretação de fala a partir de contextos pragmaticamente controlados, com quatro informantes, dois homens e duas mulheres. Todos os informantes, nascidos e criados na cidade, têm entre 20 e 45 anos e representaram em quatro diferentes contextos pragmáticos o enunciado “Marcela cenaba” em sua modalidade interrogativa. No que se refere à prosódia acústica, foi medida a variação dos valores de frequência fundamental e de duração nas sílabas e foi realizada a atribuição de acentos tonais nuclear e pré-nuclear a partir do modelo de notação Sp_ToBI (Spanish Tones and Break Indices). No que se refere às atitudes proposicionais controlamos quatro tipos de enunciados interrogativos, com relação ao grau de certeza do conteúdo proposicional do enunciado. Na pergunta confirmativa, pede-se uma informação com o objetivo de certificar-se que essa informação está correta, maior grau de certeza, certeza que a resposta é sim, com relação às quatro atitudes. O contexto: o entrevistador diz ao informante que viu Marcela numa churrascaria à noite, e o informante enuncia a pergunta confirmativa, “Marcela cenaba”, sem a partícula ¿no? Na pergunta neutra, pede-se uma informação esperando receber como resposta tanto um sim como um não, o grau de certeza proposicional é 213 Caderno de Resumos considerado neutro, porque a enunciação não é nem mais nem menos certa. O contexto: o entrevistador afirma que viu Marcela numa churrascaria e o informante pergunta “Marcela cenaba”, esperando tanto um sim como um não como resposta. Na pergunta incrédula, pede-se uma informação esperando receber como resposta apenas um não, o grau de certeza é maior no sentido de que se espera que a resposta seja negativa, é provável que o conteúdo proposicional seja negativo. O contexto: o entrevistador afirma que viu Marcela numa churrascaria à noite e o informante pergunta “Marcela cenaba”, esperando um não como resposta, já que ambos sabem que Marcela estava fazendo dieta e não jantava. Na pergunta retórica, pede-se uma informação esperando receber como resposta apenas um não, o grau de certeza é maior no sentido de que se tem certeza de que a resposta seja negativa, é certo que o conteúdo proposicional seja negativo. O contexto: o entrevistador afirma que viu Marcela num restaurante japonês à noite e o informante pergunta “Marcela cenaba”, esperando um não como resposta, já que ambos sabem que Marcela detesta comida japonesa. Neste contexto usamos como frase equivalente e de controle “Lavaste los platos”, numa cena doméstica um dos membros do casal chega em casa e pergunta ao outro se lavou a louça tendo certeza de que o outro não tinha lavado. Trata-se de um contexto para o qual a frase pivô do experimento parece menos adequada, o contexto deve evocar um certo conflito entre a informação dada e a pergunta ou entre os dois interlocutores, uma ligeira recriminação. 2. Prosódia auditiva: análise acústica da produção Nos enunciados interrogativos totais propomos dois acentos tonais no núcleo para quatro diferentes atitudes. Sendo assim propomos o mesmo acento tonal para interrogativos neutros (sem atitude proposicional) e para interrogativos retóricos: L+>H*________L+H*HL%. E o mesmo acento tonal para interrogativos confirmativos e incrédulos: L+>H*________L+H*L%. As diferenças entre os enunciados interrogativos com o mesmo tipo de acento tonal estão na implementação da duração. No núcleo das perguntas neutras, a sílaba tônica é a mais longa: “ceNAba” e no núcleo das retóricas é a pretônica a mais longa: “CEnaba”, o que permite distinguir uma da outra. Igualmente, no núcleo das perguntas confirmativas, a sílaba tônica é a mais 214 4º Colóquio Brasileiro de Prosódia da Fala longa: “ceNAba” e no núcleo das incrédulas é a pretônica a mais longa: “CEnaba”, o que permite distinguir uma da outra. 3. Prosódia auditiva: teste de reconhecimento O teste de reconhecimento das quatro atitudes interrogativas analisadas serviu-se de oito enunciados, ou seja, de duas realizações de cada atitude, uma com voz de homem e uma com voz de mulher. O teste de reconhecimento foi aplicado a um grupo de 20 ouvintes, 10 homens e 10 mulheres de Montevidéu, todos com ensino médio completo. Dos 40 enunciados interrogativos neutros, 33 foram reconhecidos como tal, o que nos dá um percentual alto de reconhecimento de 82,5%. Dos 40 enunciados interrogativos incrédulos, 33 foram reconhecidos como tal, o que nos dá um percentual alto de reconhecimento de 82,5%. Dos 40 enunciados interrogativos confirmativos, 32 foram reconhecidos como tal, o que nos dá um percentual alto de reconhecimento de 80%. Dos 40 enunciados interrogativos neutros, apenas 16 foram reconhecidos como tal, o que nos dá um percentual mais baixo de reconhecimento de 40%. 4. Prosódia visual: análise dos componentes gestuais Analisamos os movimentos de face, ombros e mãos dos quatro informantes ao enunciar as quatro atitudes proposicionais descritas. Usamos o software ELAN (Eudico Linguistic Annotator) para identificar e anotar os gestos realizados pelos informantes. Foram considerados 13 movimentos descritos no sistema FACS (7 movimentos de face, 5 movimentos de cabeça e 1 movimento de ombros) mais 1 movimento das mãos. Nos enunciados interrogativos neutros: levantamento da parte externa da sobrancelha e levantamento da pálpebra superior, homens e mulheres. Nos enunciados interrogativos confirmativos: levantamento da parte externa da sobrancelha e levantamento da pálpebra superior, mais movimento da cabeça para baixo, homens e mulheres. Nos enunciados interrogativos incrédulos: levantamento da parte externa da sobrancelha e levantamento da pálpebra superior, mais movimento 215 Caderno de Resumos projeção da cabeça para a frente, homens e mulheres e caimento da mandíbula, somente mulheres. Nos enunciados interrogativos retóricos: levantamento da parte externa da sobrancelha e levantamento da pálpebra superior, mais inclinação da cabeça e levantamento das mãos, homens e mulheres. 5. Discussão Os quatro tipos de atitudes proposicionais analisadas mostraram-se contrastivas em enunciados interrogativos, seja pela configuração tonal, pela implementação da duração ou pelos movimentos gestuais que lhe dão suporte visual. A próxima etapa desta pesquisa deverá controlar com testes de reconhecimento o embricamento da prosódia acústica e visual, procurando verificar se os padrões menos reconhecidos acusticamente são mais reconhecidos visualmente, no caso da pergunta retórica. No caso das perguntas neutra, confirmativa e incrédula, os padrões prosódicos são suficientemente contrastivos, com relação à pergunta neutra e apresentam um alto percentual de reconhecimento sem o apoio da prosódia visual, nossa hipótese é que com a pontuação da prosódia visual esse percentual de reconhecimento aumentaria. Referências Cestero Mancera, A. M. 1999. Repertorio básico de signos no verbales del español. Madrid: Arco Libros. Ekmam, P., Friesen, W. & Hager, J. 2002. Facial Action Coding System. Salt lake City, UT: The Manual on CD ROM., Research Nexus Division of Network Information Research Corporation. Moraes, J. A. 2008. “A entoação dita expressiva: fenômeno discreto ou contínuo”. Congresso Nacional de Fonética e de Fonologia. Niterói: UFF. Wichmann, A. 2002. “Attitudinal intonation and the inferential process”. In: Proceedings of I Speech Prosody. Aix-en-Provence. 216 4º Colóquio Brasileiro de Prosódia da Fala Pistas prosódicas para a segmentação da entrevista sociolinguística Raquel Meister Ko. Freitag1 1 Departamento de Letras Vernáculas/Universidade Federal de Sergipe, Brasil [email protected] 1.Introdução Gênero do discurso acadêmico, especificamente da Sociolinguística Variacionista (Bell 2007; Freitag et al. 2009), a entrevista sociolinguística se configura como um protocolo que visa fazer emergir o vernáculo de um indivíduo representativo de uma dada comunidade de fala (Labov 2008 [1972]). A realização de uma coleta de dados com entrevistas sociolinguísticas é um modo relativamente rápido e altamente eficaz para se constituir uma amostra de uma comunidade de fala, garantindo a confiabilidade e a intersubjetividade da análise. Apesar das críticas que vêm sendo feitas a este modelo de coleta de dados – Schilling-Estes (2007) aponta que a entrevista sociolinguística é menos natural ainda que outros tipos de entrevista, já que o entrevistado espera uma situação formal e que segue um questionário; além da intransponível relação assimétrica estabelecida entre o pesquisador de campo (da universidade) e o falante, os tipos de texto/sequência discursiva que emergem em uma entrevista sociolinguística são muito diferentes daqueles de uma conversação natural –, a entrevista sociolinguística pode ser considerada uma fonte produtiva para se obter diferentes estilos de fala, na medida em que seu roteiro permite que haja uma transição entre distintos tópicos discursivos e sequências discursivas, desde que sejam controladas as pistas sobre o que poderia delinear esses diferentes estilos. Dando continuidade à discussão acerca de estratégias metodológicas para captar nuanças de mudança de estilo dentro da entrevista sociolinguística (Freitag, a sair; Freitag et al. 2009), especificamente quanto ao controle de 217 Caderno de Resumos sequências/tipos de texto e ao controle do tópico e complexidade do assunto, neste trabalho enfocamos as pistas prosódicas significativas produzidas pelos falantes que podem auxiliar na definição de uma trilha de segmentação da entrevista sociolinguística, articuladas às segmentações baseadas em critérios textuais-discursivos. Assumimos os pressupostos de Gumperz (2002 [1982]), para quem o controle de pistas de contextualização – que podem ser linguísticas, como a alternância de código, de dialeto ou de estilo, paralinguísticas, como pausas, tempo da fala, hesitações, e prosódicas, como entonação, acento, tom, ritmo, entre outros – auxilia na observação de pressuposições contextuais. A correlação entre a regularidade de padrões prosódicos e segmentação de sequências discursivas/tipos de texto é sugerida por Guy et al. (1986) que, ao buscarem motivações para a mudança entonacional em curso no inglês australiano (elevação crescente final, conhecida como Australian Question Intonation), analisaram, dentre os fatores linguísticos, o controle do tipo de sequência discursiva (text type no original). A motivação para a escolha, segundo os autores, foi o fato de que em investigações preliminares a ocorrência de elevação crescente final em frases declarativas foi predominante em narrativas, sugerindo que o tipo de sequência discursiva exercia influência no fenômeno. Em termos prosódicos, os tipo textuais/sequências discursivas correspondem a fonoestilos; a distribuição de pausas e disfluências, articulada ao controle do tipo de tópico temático, pode dar pistas para a sua segmentação em entrevistas sociolinguísticas, colaborando também para a caracterização das suas dimensões de formalidade/informalidade. 2. Metodologia Com base em estudos que avaliaram aspectos prosódicos de narrativas (Matte 2006), buscamos averiguar se pistas prosódicas podem auxiliar no balizamento para a segmentação de entrevistas sociolinguísticas no português. Para tanto, procedemos ao cálculo da frequência de pausas e disfluências (hesitações, repetições de palavras ou repetições de segmentos) por segmento de tipo textual/sequência discursiva (narrativa episódica, narrativa habitual, relato de procedimento, explanação e opinião), conforme explicitado em Freitag et al. (2009), além do tópico temático discorrido e o seu grau de subjetividade. 218 4º Colóquio Brasileiro de Prosódia da Fala Como corpus, foram tomadas 2 entrevistas sociolinguísticas extraídas da amostra Fala Culta, estratificadas quanto ao sexo do falante, gravadas em campo (Marantz PMD661), com duração entre 50-60 minutos. Inicialmente, foram identificadas as sequências discursivas prototípicas e consensuais (casos 1 ambíguos ou de interação foram descartados neste momento) . 3. Resultados e discussão Os dados foram coletados, tabulados em números absolutos e submetidos à análise estatística do teste ANOVA (p <0,05). Foram analisados 70 segmentos de entrevistas sociolinguísticas, divididos quanto ao tipo de sequência (29 explanação, 18 opinião, 10 habitual, 7 narrativa e 6 procedimento), grau de subjetividade (34 subjetivo, 21 intersubjetivo e 15 extrasubjetivo) e tópico temático discorrido (29 trabalho, 28 estudo, 4 lazer, 3 cidade, 2 viagem, 2 família e 2 rotina), aos quais foram cotejadas as ocorrências de disfluências e pausas, conforme resultados dos gráficos 1-3. Gráfico 1: Grau de subjetividade 1 Os dados sob análise foram coletados segundo a metodologia da Sociolinguística Variacionista, em campo, e não em estúdio, o que traz sensíveis prejuízos à qualidade acústica, inviabilizando uma análise prosódica mais aprofundada. Tais limitações impuseram a restrição da análise aos fatores prosódicos mais salientes, como as pausas e as disfluências. 219 Caderno de Resumos Gráfico 2: Tipo de texto/sequência discursiva Gráfico 3: Tópico discursivo discorrido Os resultados apontam que, na amostra analisada, há correlação na ocorrência de pausas e disfluências com o tópico discursivo discorrido (p<0,01): tópicos mais formais, relacionados ao trabalho e ao estudo, tendem a favorecer mais a ocorrência de disfluências. Tipos de textos mais formais também estão correlacionados à maior ocorrência de disfluências. Já as pausas tendem a ser associadas a contextos de maior subjetividade e informalidade, na medida em que sua recorrência é mais significativa em tópicos mais informais, como lazer, e em sequências narrativas e relatos de procedimento, possivelmente decorrentes do relaxamento promovido pelas estratégias de minimizar os efeitos do paradoxo do observador que são adotadas na realização da entrevista sociolinguística. 220 4º Colóquio Brasileiro de Prosódia da Fala 4. Conclusão Os resultados obtidos respaldam a hipótese assumida, de que pistas prosódicas podem também auxiliar na segmentação de tipos de texto/sequências discursivas dentro da entrevista sociolinguística. A sistematização do controle da distribuição de frequências destes traços pode colaborar para automatização do processo de segmentação, ainda realizada de modo manual e impressionístico pelos pesquisadores, ou, ao menos, auxiliando no refinamento do controle. Referências Bell, A. 2007. “Style in dialogue: Bakhtin and sociolinguistic theory”. In: R. Bailey, R. and C. Lucas (eds.). Sociolinguistic variation: theories, methods, and applications. Cambridge: Cambridge University Press. Freitag, R. M. K (in coming). Dissecando a entrevista sociolinguística: estilo, sequência discursiva e tópico. Freitag, R. M. K. et al. 2009. “O controle do gênero textual/sequências discursivas na motivação da variação linguística: apontamentos metodológicos”. Odisseia, 3 (1): 1 - 1 5 . A v a i l a b l e o n l i n e a t : http://www.periodicos.ufrn.br/index.php/odisseia/article/view/2051/1485 Gumperz, J. J. 2002 (1982). “Convenções de contextualização”. In: B. T. Ribeiro and P. M. Garcez. (eds.). Sociolinguística Interacional. São Paulo: Loyola. Guy, G. et al. 1986. “An intonational change in progress in Australian English”. Language in Society 15(1): 23-51. Labov, W. 2008 (1972). Padrões sociolinguísticos. São Paulo: Parábola Editorial. Matte, A. C. F. 2006. “Taxa de elocução, grupo acentual, pausas e fonoestilística: temporalidade na prosa e na poesia com interpretação livre”. Estudos Linguísticos 3 5 ( 1 ) : 2 7 6 - 2 8 5 . A v a i l a b l e o n l i n e a t : http://www.gel.org.br/estudoslinguisticos/edicoesanteriores/4publica-estudos2006/sistema06/28.pdf Schilling-Estes, N. 2007. “Variation and the Sociolinguistic Interview: a reconsideration”. 25th International AESLA Conference (Spanish Society for Applied Linguistics), University of Murcia, . Available online at http://www.um.es/lacell/aesla/contenido/pdf/9/schilling.pdf 221 Caderno de Resumos Desviando da própria fala: implicações para a verificação de locutor por falantes e não-falantes do português brasileiro Renata Regina Passetti¹, Plínio Almeida Barbosa¹ e Anders Eriksson² ¹Departamento de Linguística, Universidade Estadual de Campinas, Brasil ²Departamento de Linguística, Universidade de Gotemburgo, Suécia [email protected], [email protected], [email protected] O principal objetivo deste trabalho é avaliar a taxa de reconhecimento de locutor entre grupos de ouvintes brasileiros e suecos e analisar qual o tipo de informação (acústica e/ou lexical) empregada durante a tarefa de verificação de locutor, além de tecer considerações sobre as possíveis pistas acústicas que estariam interferindo na decisão de falantes e não-falantes do português brasileiro. O desempenho de reconhecimento de locutor em estudos envolvendo língua e sotaques estrangeiros na verificação de locutor parece estar mais propenso a ser afetado pela familiaridade do ouvinte com a língua, como atestado por Schiller e Köster (1996) e Köster e Schiller (1997), cujos resultados de seus estudos indicaram que a não familiaridade com a língua-alvo afetava a habilidade de reconhecimento de locutor. O corpus utilizado neste estudo foi composto por 7 gravações de locutores brasileiros, três homens e quatro mulheres, com idade média de 21 anos. As gravações consistiam em diferentes sessões de leitura de um discurso do apresentador de televisão Sílvio Santos, evocando dois tipos diferentes de elocução: primeiramente, com o estilo natural de fala dos sujeitos e depois utilizando o disfarce vocal “lápis na boca” (utilização de um lápis posicionado firmemente entre os dentes frontais). As gravações foram utilizadas na elaboração de 6 filas de reconhecimento, três com amostras de fala masculinas e três com amostras de fala femininas. Cada fila de reconhecimento era composta por uma amostra de referência (voz disfarçada), com duração de 40 segundos, separada por um beep de outras 6 amostras de fala não-disfarçadas, 222 4º Colóquio Brasileiro de Prosódia da Fala cujas durações variavam entre 6,5 a 8 segundos que, por sua vez, estavam separadas entre si por um período de silêncio de 4 segundos. Das amostras de fala não-disfarçadas, uma consistia na voz do locutor-alvo, ou seja, aquela ouvida anteriormente com o disfarce vocal e as outras 5 consistiam em vozes distratoras. Estas amostras de fala distratoras eram formadas por diferentes sessões do mesmo texto enunciado por diferentes locutores e/ou por diferentes amostras de fala de um mesmo locutor (chamadas de “versões”). Os participantes do teste de percepção pertenciam a dois grupos: (1) ouvintes nativos de sueco, sem nenhum conhecimento em português brasileiro (10 homens e 10 mulheres) e (2) ouvintes nativos de português brasileiro, que moravam na Suécia há, pelo menos, 1 ano (7 homens e 3 mulheres). O teste de percepção foi apresentado por meio de uma apresentação de slides, iniciada pela simulação de um crime, no qual esses ouvintes haviam sido supostamente vítimas, seguida de instruções sobre a condução da tarefa de verificação de locutor. A tarefa dos ouvintes era, inicialmente, ouvir a amostra de fala disfarçada com a voz do locutor-alvo e, em seguida, tentar descobrir qual dentre as seis amostras de fala sem disfarce vocal pertencia ao locutor-alvo. A duração total do teste foi de, aproximadamente, 15 minutos. A análise do desempenho dos ouvintes no teste de percepção considerou três etapas. Primeiramente, as respostas foram avaliadas de acordo com 4 diferentes tipos de análises: (1) análise da taxa de reconhecimento do locutoralvo pela porcentagem de identificações falsas e corretas em cada fila de reconhecimento; (2) análise das falsas identificações por distrator; (3) análise das falsas identificações pela posição da amostra de fala na fila de reconhecimento e (4) análise das falsas identificações pelas amostras de fala de um mesmo distrator (versão). A segunda etapa da análise consistiu em um estudo acerca da duração relativa (z-score suavizado) de saliência duracional de unidade VV e da taxa de elocução em unidades Vogal-Vogal (unidades VV) por segundo entre as amostras de fala do locutor-alvo e do distrator erroneamente escolhido com maior frequência para cada uma das filas de reconhecimento. Esta análise tinha como objetivo investigar se estes parâmetros poderiam ser considerados como pistas acústicas, nas quais os ouvintes estariam apoiando suas (falsas) escolhas. Por fim, foi conduzida uma análise da mediana da frequência fundamental (f0) entre os pares de locutores (alvo e distrator erroneamente escolhido) para cada fila de reconhecimento, cujo objetivo era aprimorar os resultados estabelecidos para a duração das unidades VV e para a duração relativa de saliência duracional de unidade VV, e também auxiliar na compreensão das falsas identificações de ambos os grupos de ouvintes. 223 Caderno de Resumos Quanto ao desempenho entre os dois grupos de ouvintes (suecos e brasileiros), os resultados mostraram que não houve diferenças significativas em relação à média percentual de identificações corretas (msuecos= 36,6%, mbrasileiros= 45%). Apesar de os ouvintes brasileiros terem obtido um desempenho melhor, os resultados revelaram que o teste mostrou-se difícil para ambos os grupos de ouvintes, atestando nível baixo de concordância entre os ouvintes de um mesmo grupo (kappasuecos= 0,12; kappabrasileiros= 0,02). A fila de reconhecimento identificada corretamente com maior frequência, para ambos os grupos, foi a número 2, com porcentagem de acertos de 70% para os ouvintes suecos e 80% para os ouvintes brasileiros. O melhor desempenho dos ouvintes para esta fila de reconhecimento pode ser explicado pela posição do locutoralvo na fila de reconhecimento. Este se encontrava na primeira posição, logo após a amostra de referência (voz disfarçada), o que pode ter auxiliado na decisão dos ouvintes, devido a maior retenção de características perceptuais da voz do locutor-alvo na memória acústica desses ouvintes. O distrator que obteve maior número de falsas identificações para os ouvintes suecos foi o locutor 1, tendo a versão 1.3 escolhida mais vezes dentre suas outras versões. Para os ouvintes brasileiros, o distrator falsamente escolhido mais vezes foi o número 4, em sua versão 4.3. A posição erroneamente escolhida na maioria das vezes foi a número 3 para ambos os grupos, representando para os ouvintes suecos, aproximadamente 26% sobre a quantidade total de posições erroneamente escolhidas e para os ouvintes brasileiros, aproximadamente 34%. A análise comparativa da duração relativa da saliência duracional e da taxa de elocução em unidades VV/s teve como objetivo aprimorar a análise da taxa de reconhecimento de locutor pela avaliação das falsas identificações, já que permitiam avaliar se a não-diferença estatística entre os valores médios entre os distratores escolhidos e o locutor-alvo era suficiente para justificar uma falsa escolha. A análise comparativa da duração de unidades VV e da duração do grupo acentual, delimitados pelos picos de duração relativa, foi calculada pelo script SGdetector (Barbosa 2006) entre cada amostra de fala do locutor-alvo e do distrator falsamente escolhido com maior frequência, em cada fila de reconhecimento, para ambos os grupos de ouvintes (suecos e brasileiros). Um teste T de variáveis independentes, com um nível de significância de 0,05, foi conduzido com a finalidade de testar a hipótese nula de que as duas amostras comparadas possuíam a mesma média para a duração das unidades VV e para o grupo acentual. Os resultados mostraram que, na maioria das filas de 224 4º Colóquio Brasileiro de Prosódia da Fala reconhecimento, o locutor-alvo e o distrator comumente escolhido (falsa identificação) produziram a mesma quantidade de unidades VV/s, isto é, têm a mesma taxa de elocução. Todos os locutores comparados (alvo e distratores comumente escolhidos) produziram as mesmas taxas de duração relativa para o grupo acentual. A conservação da hipótese nula (p > 0,05), para ambos os parâmetros de análise, indica uma possível explicação para a escolha incorreta dos locutores, que podiam estar apoiando suas escolhas nestas pistas rítmicas. Os resultados obtidos para a mediana de f0 (Hz) para os pares de locutores (alvo e distrator falsamente escolhido) em todas as filas de reconhecimento permitiram uma melhor compreensão das falsas escolhas dos ouvintes. O resultado mais importante deste parâmetro estava relacionado aos valores obtidos para os pares de locutores das filas de reconhecimento 5 (para os ouvintes suecos) e 1 (para os ouvintes brasileiros) que, apesar de não terem atestado resultados significativos no teste T para a duração das unidades VV/s, apresentou valores muito próximos para a mediana de f0 destes locutores, o que também pode ser uma possível explicação para as escolhas incorretas dos ouvintes. Apesar de os resultados não terem apresentado diferenças significativas na média percentual de escolhas corretas entre os dois grupos de ouvintes, o fato de os ouvintes brasileiros apresentarem uma tendência em alcançar melhor desempenho no teste de percepção, concorda com discussões anteriores de Schiller e Köster's (1996) que afirmam que a prática de reconhecimento de locutor parece não envolver apenas características puramente fonéticas, mas também a incorporação de informação linguística, desde que esse grupo de ouvintes possua um conhecimento prévio da língua do locutor-alvo. A análise da taxa em unidades VV/s, da saliência duracional e, posteriormente, da mediana de f0 entre os pares de locutores (alvo e distrator) permitiu melhor compreender as escolhas incorretas dos ouvintes, visto que eles poderiam estar apoiando suas (falsas) escolhas nestas pistas rítmicas e entoacionais. Referências Barbosa, P. A. 2006. Incursões em torno do ritmo da fala. Campinas, Brasil: Pontes/FAPESP: 170. Köster, O. & Schiller, N.O. 1997. “Different influences of the native language of a listener on speaker recognition”. In Forensic Linguistic, 4 (1): 176-185. Schiller, N.O. & Köster, O. 1996. “Evaluation of a foreign speaker in forensic phonetics: a report”. In Forensic Linguistics, 3 (1): 176-185. 225 Caderno de Resumos A velocidade de fala na expressão da raiva: um estudo com dados de elocução espontânea René Almeida1, Ayane Almeida1, Miguel Oliveira, Jr.1, Ebson Silva2 1 Faculdade de Letras - PPGLL, Universidade Federal de Alagoas, Brasil 2 Faculdade de Letras, Universidade Federal de Alagoas, Brasil [email protected], [email protected], [email protected], [email protected] O estudo da expressão acústica das emoções consiste, em geral, na análise de como variáveis prosódicas, tais como a entoação (F0), a velocidade de fala, pausas, ritmo, intensidade e duração, podem fornecer pistas do estado emocional da pessoa que está falando. A classificação e o conceito de emoção são, no entanto, bastante controversos na literatura (Cowie & Cornelius 2003). Apesar disso, há pontos comuns em vários trabalhos sobre o tema, tais como o fato de quase sempre serem as emoções dirigidas ao objeto, serem ativadas por estímulos internos ou externos e serem estados atuais de pessoas, tendo curta duração (Paescke 2003). Concensual também parece ser a estipulação de três emoções básicas: tristeza, alegria e raiva (Paescke 2003; Sawamura et al. 2007). Cada uma das emoções, tal como classificadas pela literatura, está associada a características prosódicas específicas, que a individualiza. Bezooyen (1984), Leon (1993) e Paescke (2003) em estudos sobre o holandês, o francês e o alemão respectivamente, procuraram associar padrões emotivos nessas línguas a parâmetros acústicos, tais como, nível melódico médio global, extensão vocal, intensidade média global e duração total do enunciado. Nas três pesquisas, os autores observaram que a tristeza é geralmente caracterizada por uma F0 menor, uma voz mais baixa e uma velocidade mais lenta, enquanto que a raiva e a alegria apresentam uma F0 maior, uma voz mais alta e uma velocidade mais rápida. Pereira (2009), por outro lado, observa que nem sempre os falantes de uma língua expressam as emoções da mesma maneira, com o mesmo grau de ativação. A partir desta afirmação, podemos hipotetizar que também haverá variação em diferentes variedades de uma língua. 226 4º Colóquio Brasileiro de Prosódia da Fala No Português do Brasil, Pereira (2009) investigou de que forma a manifestação de três emoções primárias afeta os contornos melódicos característicos de quatro atos de fala, cruzando quatro atos de fala (asserção, pergunta, pedido e ordem) e quatro emoções (três emoções primárias, tristeza, alegria e raiva, acrescidas da forma “neutra”), com a finalidade de responder se essas duas categorias são dimensões prosódicas realmente independentes ou se a interação entre elas causa alterações substanciais nos padrões entoacionais descritos para os atos de fala. A autora constatou que atos de fala e padrões emotivos afiguram-se como categorias independentes do ponto de vista da produção. No que diz respeito à percepção, porém, há algumas interferências entre as duas categorias. Conclui que entoação e qualidade vocal devem ser vistas como categorias complementares, ambas conjuntamente necessárias para o reconhecimento dos estados emotivos do falante. Entretanto, Pereira utiliza dois atores da região sudeste que, de forma monitorada, gravaram os enunciados. A maior parte dos trabalhos que aborda a prosódia das emoções no português falado no Brasil baseia-se na fala das regiões sul e sudeste, e utiliza enunciações monitoradas, produzidas por atores. No entanto, não se sabe até que ponto a fala monitorada reflete verdadeiramente uma emoção que se caracteriza por ser involuntária e imprevisível. Essa é, na verdade, uma das mais importantes limitações em estudos de fala emotiva (Swerts & Hirschberg 2010). O presente estudo enfoca a velocidade de fala, uma vez que a literatura prévia a associa frequentemente aos estudos sobre prosódia e emoção (Pereira 2009; Paescke 2003; Leon 1993; Bezooyen 1984) e objetiva verificar a relação entre esta variável prosódica e a expressão de raiva em falas espontâneas de indivíduos da região nordeste do Brasil, variação ainda muito pouco estudada. A relevância desta pesquisa, portanto, concentra-se no fato de apresentar análise a partir de gravações espontâneas de falantes da região nordeste, no intuito de obter máxima aproximação de uma realização fidedigna da emoção em estudo. Sabe-se que a utilização de um corpus de fala espontânea requer cuidados, pois, conforme Paescke (2003), é tarefa difícil garantir a qualidade acústica e o controle dos enunciados nesse tipo de material. Os dados utilizados no presente estudo consistem em pequenos trechos de gravações de fala espontânea, extraídas do programa radialístico “A Hora do Mução”. Trata-se de um programa humorístico bastante popular, em que o radialista natalense Rodrigo Vieira Emerenciano encarna a personagem Mução. O radialista liga para populares no nordeste, a partir de sugestões feitas por amigos e parentes dos mesmos, com o propósito de irritá-los mediante a menção de uma 227 Caderno de Resumos característica física, de um apelido previamente conhecido pelo radialista, por descrição do solicitante, ou de um fato esdrúxulo. Nas gravações, há uma clara diferença entre a fala dos telefonados na primeira metade das ligações telefônicas e na segunda metade, quando o motivo das ligações já é conhecido. Na segunda metade, a fala dos telefonados está claramente associada à expressão de raiva. Trata-se, portanto, de um rico material para a análise de características prosódicas associadas à expressão da raiva, uma vez que é possível cotejar a fala de um mesmo indivíduo em situações associadas àquilo que se considera “fala neutra” com àquela associada à expressão de raiva. Ademais, o uso desse material justificase pelo fato de ser ecologicamente válido, ao contrário do que acontece com a maioria dos dados usados em pesquisas sobre a relação entre prosódia e emoção. Os trechos das gravações serão selecionados a partir de um teste de percepção realizado com vinte estudantes da graduação em Letras da Universidade Federal de Alagoas, nascidos em Maceió. Os dados utilizados neste teste de percepção consistirão em fragmentos de gravações disponíveis no CD “Pegadinhas do Mução” [2010?], que serão selecionados a partir dos seguintes critérios: (i) qualidade acústica (sinal inteligível e sem ruídos), (ii) sexo do falante (todos os trechos deverão ser proferidos por homens), e (iii) conteúdo das informações lexicais (não devem fornecer pistas muito evidentes de nenhuma emoção). Neste teste, serão disponibilizadas, em um formulário, as três opções de emoções básicas: “raiva”, “alegria” e “tristeza”, além do “neutro”, para que os sujeitos identifiquem a qual dessas categorias o estímulo auditivo apresentado corresponde. Será fornecida a transcrição de cada trecho. Os participantes poderão ouvir cada estímulo quantas vezes desejarem, antes de responder o formulário. Somente os trechos identificados em mais de 75% dos casos como associados à categoria “raiva” e à categoria “neutro” serão selecionados para análise. A velocidade de fala nesses trechos será analisada a partir do critério de número de sílabas por segundo, seguindo a tendência da literatura. Análises preliminares baseadas em um experimento piloto realizado no grupo de pesquisa do qual os autores do presente trabalho fazem parte indicaram que, em dados de fala espontânea representando a variedade do português falado no nordeste brasileiro, não se verifica uma associação entre a emoção básica “raiva” e um aumento na velocidade de fala, conforme aponta a literatura. Pelo contrário, muitos trechos identificados como sendo representativos da emoção “raiva” pelos participantes do experimento piloto foram enunciados com uma velocidade de fala mais lenta do que a apresentada nos trechos considerados “neutros”, conforme explicita a Tabela 1 abaixo, que 228 4º Colóquio Brasileiro de Prosódia da Fala evidencia as médias aproximadas de velocidade de fala de trechos considerados, por meio do experimento piloto, “neutros” e representativos da emoção “raiva”. Velocidade de fala Neutro Raiva Nº de sílabas/seg. 6 4 Tabela 1: Velocidade de fala associada à fala “neutra” e à fala representativa da emoção “raiva” Os dados analisados serão tratados estatisticamente para verificarmos possíveis dissonâncias entre o que a literatura estabelece enquanto padrão prosódico da emoção “raiva” e o que foi identificado a partir da análise realizada com base em gravações espontâneas. Dessa forma, pretendemos contribuir para a caracterização acústica de padrões emotivos no Português do Brasil. Referências Bezooyen, R. 1984. Characteristics and recognizability of vocal expression of emotion. Dordrecht: Foris. Cowie, R. e Cornelius, R. R. 2003. “Describing the emotional states that are expressed in speech”. Speech Communication 40 (1): 5-32. Emerenciano, R. V. 2010?. Pegadinhas do Mução. Rio de Janeiro: Polysom. 1 disco compacto: digital, estéreo. Leon, P. 1993. Précis de phonostylistique parole et expressivité. Paris: Natan. Paescke, A. 2003. Prosodische Analyse emotionaler Sprechweise. Berlin: Logos Verlag. Pereira, M. C. C. 2009. A expressão das emoções em atos de fala no português do Brasil: produção e percepção. Dissertação de Mestrado em Letras Vernáculas, Universidade Federal do Rio de Janeiro. Disponível em http://www.letras.ufrj.br/posverna/mestrado/PereiraMCC.pdf. Sawamura, K., Deng, J., Akagi, M., Erickson, D., Li, A., Sakuraba, K., Minematsu, N. E Hirose, K. 2007. “Common factors in emotion perception among different cultures”. Proceedings of 16th ICPhS, Saarbrücken: 2113-2116. Swerts, M. E Hirschberg, J. 2010. “Prosodic predictors of upcoming positive or negative content in spoken messages”. J. Acoust. Soc. Am. 128 (3): 1337. 229 Caderno de Resumos Contribuições para o Atlas do Projeto Amper-Norte: variedade linguística de Baião (PA) Rosinele Lemos e Lemos 1 2 Regina Célia Fernandes Cruz 1 CML/UFPA, Brasil / ILC UFPA, Brasil 2 [email protected], [email protected] 1.Introdução O objetivo deste trabalho, vinculado ao projeto internacional Atlas 1 Multimédia Prosodique de l'Espace Romain , é caracterizar prosodicamente a variedade linguística de Baião (PA) apresentando aqui os resultados preliminares da pesquisa da Dissertação de Mestrado de mestrado de Lemos (em andamento) sobre um informante do sexo feminino, de baixa escolaridade 2 (BF91) . A Universidade Federal do Pará participa do projeto desde 2007, com a responsabilidade de confeccionar o Atlas Prosódico do Português do Norte do Brasil. Atualmente, estão formados corpora das seguintes localidades paraenses: a) Cametá (Santo 2011); b) Belém (Santos Jr. 2008; Silva 2011; Brito 2012); c) Bragança (Castilho 2009); d) Abaetetuba (Remédios 2013); e) Mosqueiro (Guimarães 2013); f) Curralinho (Freitas 2013); g) Mocajuba (Costa em andamento); e h) Baião (Lemos em andamento) cujos dados compõem este trabalho. As análises dos dados foram realizadas considerando os parâmetros físicos: frequência fundamental (F0), intensidade e duração, com o objetivo de verificar qual(is) parâmetro(s) contribui(em) na distinção entre as modalidades frasais declarativas e interrogativas na variedade investigada e se considerou 1 2 <http://w3.u-grenoble3.fr/dialecto/AMPER/AMPERfr_fichiers/frame.htm>. B- Português Brasileiro; F- Pará; 9- Baião; 1- sexo feminino Ensino Fundamental. 230 4º Colóquio Brasileiro de Prosódia da Fala apenas as médias dos parâmetros físicos investigados, obtidos com a análise acústica das frases com sintagmas nominais finais simples contendo 10 vogais: O pássaro gosta do pássaro (pwp), O Renato gosta do Renato (twk) e O bisavô gosta do bisavô (kwk), porque representam as três pautas acentuais do português (proparoxítona, paroxítona e oxítona). 2. Metodologia Foram adotados todos os procedimentos metodológicos determinados pelo projeto AMPER quanto à formação, organização e tratamento dos dados. Como um dos objetivos do projeto compreende uma análise contrastiva dos dialetos estudados; o corpus-base para a língua portuguesa é formado por 66 3 frases gravadas . Sintaticamente, as frases foram montadas de forma a apresentar SujeitoVerbo-Complemento. Com relação à entoação, elas contemplam as modalidades declarativas e interrogativas globais e suas expansões com a inclusão de Sintagmas Preposicionais. Quanto à estrutura sintática, todas as frases possuem: 1) três personagens: Renato, pássaro e bisavô; 2) três sintagmas adjetivais: nadador, bêbado e pateta; três sintagmas preposicionais indicadores de lugar: de Mônaco, de Veneza e de Salvador; 4) um único verbo: gostar. Para a seleção dos informantes, levaram-se em consideração os seguintes critérios: 1) faixa etária (acima de 30 anos); 2) escolaridade (Fundamental, Médio e Superior); 3) tempo de residência na localidade (nativos do local). A gravação dos dados ocorreu na casa dos informantes para garantir a espontaneidade do discurso, utilizou-se gravador digital dinâmico e de cabeça para a captura do áudio e notebook para a projeção das imagens e controle da qualidade das gravações no software Soundforge. As figuras formadoras das 66 frases foram exibidas pelo computador no programa PowerPoint aos informantes, que repetiram seis vezes a série de 3 Para a variedade de Baião, utilizou-se ainda o corpus antigo de 66 frases. O corpus ampliado de 102 frases está sendo utilizado por REMÉDIOS (em andamento), FREITAS (em andamento) e COSTA (em andamento). 231 Caderno de Resumos frases (em ordem aleatória), no momento da gravação sem interrupção até a última frase. Ao todo, foram obtidos seis sinais sonoros de 6h33min15s de gravação. A taxa de amostragem de cada sinal é de 44.100 Hz, 16 bits, sinal mono. Cada informante recebeu um código com informações sobre seu perfil. O material gravado de BF91 sofreu seis etapas de tratamento: a) codificação das repetições; b) isolamento das repetições em arquivos de áudio individuais; c) segmentação fonética dos sinais selecionados no programa PRAAT 5.0; d) aplicação do script praat; e) seleção das três melhores repetições e f) aplicação da interface Matlab para obtenção das médias dos parâmetros das três melhores repetições. Na codificação das repetições do informante analisado, acrescentou-se o código de cada frase com as indicações sintáticas, fonéticas e prosódicas, e um número de ordem cronológica da repetição para, em seguida, isolar as 396 frases do sinal original em um arquivo sonoro específico. Na segmentação fonética utilizou-se o programa PRAAT, apenas um nível de segmentação fonética é criado: Vogais, assinalando no sinal as realizações vocálicas, transcritas como letra v (vogais plenas) e f (vogais fracas ou elididas). Durante a segmentação fonética, estabeleceu-se a escala de pitch que ficou entre 120 a 350 Hz por se tratar de dados de um informante do sexo feminino. Concluída a segmentação, um script praat foi aplicado a cada uma das 396 repetições que gerou um arquivo.TXT contendo as medidas dos parâmetros acústicos das vogais de cada repetição. Antes de se proceder a análise acústica na interface Matlab, foram selecionadas as três melhores repetições de cada frase em termos de qualidade sonora e de similaridade de distribuição de vogais plenas (v) e elididas (f). A aplicação da Matlab forneceu a média dos parâmetros físicos em um arquivo fono.txt das três melhores repetições de cada frase e das duas modalidades. A interface gerou mais outros arquivos em formato de imagem contendo gráficos das médias de F0, duração e intensidade de cada modalidade individualmente. Utilizou-se os dados dos arquivos fono, organizados no Excel para comparar as realizações das pautas acentuais consideradas e das duas modalidades, uma vez que o Matlab fornece as informações de cada frase individualmente. A interface gerou igualmente arquivos ton contendo uma síntese de cada modalidade sem a parte segmental, entretanto, esses arquivos não são utilizados aqui. 232 4º Colóquio Brasileiro de Prosódia da Fala 3.Resultados e Discussão A análise preliminar dos dados incidiu sobre as variações dos parâmetros físicos controlados sobre as sílabas tônicas do núcleo dos sintagmas nominais para verificar a hipótese, base do projeto Norte Vogais, de que as variações mais importantes de F0 ocorrem justamente na sílaba tônica do núcleo do sintagma final do enunciado analisado. Assim, a hipótese apresentada é reforçada (Santo e Cruz 2011), uma vez que, é na última sílaba tônica da frase que se evidencia o movimento mais importante de F0. “Figura 1. Médias de variação de F0 nas sentenças pwp (azul), twt (laranja) e kwk (verde) em ambas as modalidades – declarativa (linha plena) e interrogativa (linha tracejada).” As médias de variação de F0 nas sentenças pwp O pássaro gosta do pássaro (azul), twt O Renato gosta do Renato (laranja) e kwk O bisavô gosta do bisavô (verde) representam as três pautas acentuais do português: proparoxítona, paroxítona e oxítona. Observaram-se nos dados, os contornos de F0 de cada uma dessas frases e nas modalidades-alvo Declarativa e Interrogativa com o mesmo vocábulo nas duas posições sintática – sujeito e objeto indireto no início e final, que os movimentos mais importantes de F0 concentram-se justamente no final das vogais 7, 8 e 9 dos vocábulos analisados. 233 Caderno de Resumos 4. Conclusão Os resultados preliminares de Lemos (em andamento), do informante BF91, quanto aos parâmetros físicos, relacionados à pauta acentual do português para a variedade investigada, permitem concluir que apenas o parâmetro físico de frequência fundamental F0 é relevante para a distinção entre as modalidades declarativas e interrogativas do português falado no município. Os parâmetros de duração de ms e de intensidade dB não se configuram relevantes para a distinção das duas modalidades frasais na variedade linguística de Baião. Referências Carvalho, F.C. 2009. Formação de Corpora para o Atlas Dialetal Prosódico Multimédia do Norte do Brasil: Variedade Linguística de Bragança (PA). Trabalho de Conclusão de Curso não publicado, UFPA. Contini, M. et al. 2002. “Un Projet d'Atlas Multimédia Prosodique de l'Espace Roman”. In: Bel, B. e Marlien, I. (eds.) Proceedings of the 1st International Conference on Speech Prosody: 227-230. Aix-en-Provence: Laboratoire Parole et Langage. Costa, M.S.S. 2013. Contribuições para o Atlas do Projeto Amper – Norte: variedade linguística de Mocajuba (PA). Dissertação de mestrado no prelo, UFPA. Cruz, R. e Brito, C. 2011. “Atlas Prosódico Multimédia da Cidade de Belém (PA): uma visão geral”. In V Congresso de Fonética Experimental. Universidad de Extremadura; Cáceres (Espanha). Freitas, J. 2013. Atlas Prosódico Multimédia do Município da Ilha do Marajó (PA). Dissertação de mestrado não publicada, UFPA. Guimarães, E. 2013. Contribuições para o Atlas do Projeto Amper-Norte: variedade linguística de Mosqueiro (PA). Dissertação de mestrado não publicada, UFPA. Lemos, R. 2013. Contribuições para o Atlas do Projeto Amper-Norte: variedade linguística de Baião (PA). Dissertação de mestrado no prelo, UFPA. Moutinho, L.C. et al. 2001. “Contribuição para o estudo da variação prosódica do Português Europeu”. In Sánchez, F.M. (ed.). Actas do XXIII CILFR 1: 245-252. Remédios, I. 2013. Atlas Prosódico Multimédia do Município de Abaetetuba (PA). Dissertação de mestrado não publicada, UFPA. Santo, I. e Cruz, R. 2011. “Atlas Prosódico Multimédia do Município de Cametá (PA): uma visão geral”. In III Colóquio de Prosódia da Fala. Santo, I. 2011. Atlas Prosódico Multimédia do Município de Cametá (PA). Dissertação de mestrado não publicada, UFPA. Santos Jr. e Manoel F. 2008. Formação de corpora para o Atlas Dialetal Prosódico Multimédia do Norte do Brasil: variedade lingüística de Belém. Trabalho de Conclusão de Curso não publicado, UFPA. Silva, A. 2011. Atlas prosódico multimédia do Português do Norte do Brasil: variedade lingüística da zona rural de Belém (PA). Plano PIBIC/CNPq/UFPA. Orientadora: Regina Célia Fernandes Cruz. 234 4º Colóquio Brasileiro de Prosódia da Fala Desenvolvimento de algoritmo de análise automática da curva de frequência por meio de convoluções gaussianas do histograma de alturas 1 2 Waldemar Ferreira Netto , André Ricardo de Souza , Maressa de Freitas Vieira3, Daniel Oliveira Peres4, Marcus Vinícius Moreira 5 Martins 1,4,5 DLCV/FFLCH/Universidade de São Paulo, Brasil 2 Universidade Estadual do Paraná, Brasil 3 Faculdade Sudoeste Paulista, Brasil [email protected],[email protected], [email protected], [email protected], [email protected] 1. Introdução A convolução de um histograma por meio da função normal de Gauss é um dos inúmeros métodos de prospecção de dados que visam a encontrar possíveis pontos de concentração dos dados em uma amostra (clusters) e, portanto, possíveis alvos recorrentes do sistema que produziu aquela amostra. A convolução suaviza o “ruído” presente no histograma da amostra, permitindo identificar picos de probabilidade correspondentes a certos valores da variável aleatória por meio da estimativa da função densidade de probabilidade (probability density function, doravante PDF). No caso particular da análise automática da curva de frequência em amostras de fala, a PDF nos permite identificar alturas preferenciais empregadas pelo falante, o que pode contribuir para um aperfeiçoamento dos modelos teóricos da entoação. Este trabalho apresenta o desenvolvimento e a implementação de um método de análise de amostras de fala baseado no conceito de convolução gaussiana, acoplado ao algoritmo ExProsodia (Ferreira Netto 2006). O método de convolução empregado neste trabalho é conhecido como “janela de Parzen” (Parzen 1962). Segundo o método de Parzen, a PDF é 235 Caderno de Resumos estimada por meio de uma função nuclear — comumente a função normal de Gauss — estabelecida em cada ponto da escala a que pertencem os dados da amostra. Cada um destes pontos é um candidato a centroide desta amostra. Empregando-se a função normal de Gauss, o cálculo da probabilidade de cada resultado da amostra pertencer ao centroide c é feito pela fórmula: Nessa fórmula, x é o valor da variável aleatória correspondente àquele resultado, c é o valor do centroide na escala e s é o parâmetro de suavização, que corresponde aproximadamente à largura da janela do histograma. Depois de calculadas as probabilidades de cada resultado da amostra pertencer a cada candidato a centroide, calcula-se a média dessas probabilidades para cada um desses possíveis centroides, que será o valor da PDF para cada ponto da escala. O resultado desta função depende, portanto, do estabelecimento de uma escala à qual pertencem os valores da amostra e do parâmetro suavizador s, correspondente ao desvio padrão do kernel gaussiano aplicado. O programa ExProsodia parte da hipótese de que alguns fatos prosódicos têm restrições mecânico-fisiológicas e outros decorrem das necessidades expressivas dos falantes (Xu e Wang 1997). Segundo Ferreira Netto (2006; 2008) e Peres e seus colegas (2009; 2011), a produção da fala exige esforço para sustentar a voz com uma frequência relativamente estável, definida aqui como tom médio ideal (TM) de F0, que se repete nos momentos Z(t) mensurados de F0. A supressão desse esforço desencadeia uma declinação pontual que exige a retomada da tensão inicial. A sustentação (S) é consequência do esforço que se acrescenta a cada um dos momentos da fala, incluindo-se o inicial, para compensar a declinação pontual de finalização (F). A componente F associa-se ao fato de que se trata do tom alvo da declinação pontual, estabelecida por um intervalo ideal decrescente de 7 st do TM obtido até o momento Z(t). TM é a tendência central dos valores válidos de F0 calculada como a média aritmética acumulada no tempo. Os valores válidos mensurados são os momentos de F0 que cumprem as restrições de altura, intensidade e duração. A série temporal se configura aditivamente como Z(t)=S(t)+F(t)+E(t). A seleção das unidades Z(t) — ora chamadas de UBI (Unit of Base of Intonation) — para análise é feita pelo 236 4º Colóquio Brasileiro de Prosódia da Fala aplicativo ExProsodia® (Ferreira Netto 2010). O aplicativo faz a análise automática de porções da curva de frequência estabelecida por autocorrelação pelo software Speech Filing System® (Huckvale et al. 1985). Três parâmetros são considerados para essa definição: frequência maior do que 50 Hz e menor do que 700 Hz; intensidade suficiente para ser percebida e, garantidos os critérios anteriores, duração maior do que 20 ms. Esses valores podem ser modificados pelo usuário. 2. Metodologia Para a realização do experimento consideraram-se as variáveis: (a) gênero — masculino e feminino — e (b) tipo de fala — leitura, colérica, neutra e triste — combinadas entre si. Os dados foram coletados na internet em sites que disponibilizam podcasts (Webcombrasil 2013; A Voz... 2013; Podcast 2013). Também foram coletadas gravações de vídeos no site (Youtube 2013). Para a análise das variáveis gênero e manifestação emocional, foram selecionados 80 arquivos sonoros, distribuídos em grupos de 10. Os grupos compreendiam: leitura masculina (HL), leitura feminina (ML), fala masculina colérica (HC), fala feminina colérica (MC), fala masculina neutra (HN), fala feminina neutra (MN), fala masculina triste (HT) e fala feminina triste (MT). A avaliação das falas como colérica, neutra e triste decorreu de interpretação semântica feita pelos membros da equipe de pesquisa. Não houve restrições quanto à qualidade da gravação. 3. Resultados Na Tabela 1 abaixo, são apresentados os resultados relativos obtidos com a análise das convoluções gaussianas. A análise feita mostrou que a maioria significativa dos intervalos utilizados pelos locutores permaneceu entre 1% e 2% no que diz respeito à variação média das frequências utilizadas nas UBIs, sendo que variações de frequência entre UBIs de até 2%, representam mais das metade das variações verificadas (ver Figura 1). 237 Caderno de Resumos ]-.01 [.01-.02[ [.02-.03[ [.03-.04[ [.04-.05[ [.05- HL ML HC MC HT MT HN MN 0,01 0,28 0,33 0,16 0,11 0,11 0,09 0,42 0,25 0,09 0,07 0,08 0,20 0,43 0,17 0,09 0,04 0,07 0,33 0,40 0,14 0,06 0,02 0,05 0,05 0,30 0,29 0,14 0,09 0,14 0,18 0,37 0,22 0,10 0,04 0,08 0,12 0,40 0,23 0,12 0,06 0,06 0,20 0,39 0,21 0,10 0,04 0,06 Tabela1: Dados intervalares (linhas) referentes às frequências das variáveis de sexo e emoção dispostas nas colunas Figura 1: Curva da média acumulada das frequências da Tabela 1 referente aos intervalos obtidos com o cálculo das convoluções gaussianas. Em relação às categorias de ocorrência, foi possível verificar que, comparando os coeficientes de variação (cv) de cada categoria, os intervalos de frequências com variação entre 1% e 2%, têm uma dispersão muito reduzida (cv=,015, z<0,01) e que os intervalos de frequência com variação abaixo de 1% são os que têm a maior dispersão (cv=0,68, z<0,01). Em relação às emoções, foi possível verificar que, a partir de um teste z aplicado às frequências em relação às das demais emoções, todas as categorias frequência de HL e de HT apresentaram diferenças significativas em relação ao valores das demais categorias (z<0,01 em todos os casos). Também foi possível verificar que MC teve um aumento significativo da categoria de intervalos menores do que 1% (z<0,01), e um redução, também siginificativa dos intervalos maiores do que 2% (z<0,01 em todos os casos). Essa diferença pode ser observada na Fig. 2 abaixo. 238 4º Colóquio Brasileiro de Prosódia da Fala Fig 2.: Histograma ocorrência (eixo vertical) das categorias dos intervalos de frequências, agrupados por tipo d das e manifestação emocional (eixo horizontal). A descrição das categorias vai apresentada por código de cores na legenda à esquerda. 5. Discussão A análise das variações das emoções por meio da aplicação do teste de convoluções gaussianas do histograma de alturas apontou diferenças significativas entre os intervalos dos picos de probabilidades. De maneira geral, a tendência desses intervalos acentuou-se de forma significativa nos intervalos entre 1% e 2%. Esse fato se deu em praticamente todas as manifestações emocionais. Nas leituras masculinas e das manifestação de tristeza masculina, houve um aumento significativo na ocorrência dos intervalos entre 2% e 3%. A manifestação feminina da cólera, entretanto, mostrou um comportamento invertido, estabelecendo intervalos menores do que 2%. Esse fato é compreensível pois, na manifestação de cólera há o aumento significativo do TM, e, portanto, uma tensão extrema das pregas vocais, impossibilitando variações maiores. Referências Ferreira Netto, W. Decomposição da entoação frasal em componentes estruturadoras e em componentes semântico-funcionais. In: Congresso Nacional de Fonética e Fonologia / Congresso Internacional de Fonética e Fonologia, 10/4, 2008, Niterói. Ferreira Netto, W. 2010. ExProsodia. Revista da Propriedade Industrial – RPI , 2038, pág. 167, item 120. Ferreira Netto, W. , 2006. Variação de frequência e constituição da prosódia da língua portuguesa. Tese (Livre-Docência em Fonética da Língua Portuguesa)–USP, São Paulo. 239 Caderno de Resumos Huckvale, M.A.; Brookes, D.M.; Dworkin, L.T.; Johnson, M.E.; Pearce, D.J.; Whitaker, L.; The SPAR Speech Filing System, In: European Conference on Speech Technology, 1987, Edinburgh. Parzen, E. 1962. On Estimation of a Probability Density Function and Mode. Annals of Math. Statistics, 33: 1065–1076. Peres, D.; Consoni, F; Ferreira Netto, W. 2011. A influência da cadeia segmental na percepção de variações tonais. LLJournal, v. 6, n. 1. Peres, D.O.; Consoni, F.; Ferreira Netto, W. Decomposição da entoação frasal em componentes estruturais e semântico-funcionais: um teste com análise da variação de gênero. In: Osuchil - The Ohio State University Congress on Hispanic and Lusophone Linguistics, 12, 2009, Ohio. Xu, Yi; Wang, Q.E. 1997. Component of intonation: what are linguistic, what are mechanical/physiological? International Conference on Voice Physiology and Biomechanics, , Evanston Illinois. 240 4º Colóquio Brasileiro de Prosódia da Fala A expressão da ironia no português brasileiro: um estudo prosódico 1 Wisla Madaleni Alves Cabral Ferreira 1 Departamento de Letras / Universidade Federal de Ouro Preto UFOP, Brasil [email protected] O objetivo do estudo foi investigar acusticamente como os parâmetros prosódicos se comportam na expressão da atitude de ironia, na interface com as práticas discursivas. Alguns autores, tais como Couper-Kuhlen (1986), Wichmann (2000), Aubergé (2002), Fónagy (2003), acreditam que aspectos prosódicos relacionados, principalmente, à curva melódica - variações de frequência fundamental (F0), influenciam na percepção do sentido de crenças, atitudes e intenções do locutor. Nesse sentido, este trabalho trata de um estudo piloto acerca da prosódia como uma das pistas para construção do significado da ironia expressa no Português Brasileiro. O termo ironia tem significados diversos, porém levamos em consideração, a princípio, as definições estabelecidas pelo dicionário: “figura com que se diz o contrário do que as palavras significam”. (Michaelis 2007). O conceito de ironia, já discutido anteriormente por Paula (2012), designa, em geral, algo expressado em estado de significado figurativo, relacionando-se com seus significados literais; mais especificamente em sua acepção retórica, que a pontua como dizer o contrário daquilo que se pensa, deixando entender uma distância intencional entre aquilo que dizemos e aquilo que realmente pensamos. Focamos esse conceito, também, em sua visão estratégica no discurso, uma vez que ela permite ao locutor escapar às normas de coerência que toda argumentação impõe: o autor de uma enunciação irônica produz um enunciado que, a um só tempo, possui dois valores contraditórios, sem, no entanto, ser submetido às sanções que isso deveria acarretar. A ironia parece então “uma armadilha que permite frustrar o assujeitamento dos enunciadores às regras da racionalidade e da conveniência públicas” (Berrendonner 1981). 241 Caderno de Resumos Partindo da hipótese de que há distinção prosódica entre a expressão da atitude ironia e a fala neutra, ou não atitudinal, objetivamos verificar o papel da prosódia na construção da atitude de ironia, descrevendo os aspectos prosódicos utilizados na expressão dessa atitude. Embasamo-nos, teoricamente, na definição de prosódia como a variação de parâmetros de duração, pausa e altura melódica ao longo da expressão da fala, incluindo, ainda, ritmo e acento. Dessa forma, verificamos as características acústicas de frequência fundamental, de duração, pausas e velocidade de articulação, na tentativa de distinguir e caracterizar os enunciados que expressam essa atitude. Buscamos, também, descrever os contextos de realização dos enunciados, embasados pelo escopo comunicacional de Charaudeau (1984), que discute as relações do contrato de comunicação, as funções do eu – sujeito comunicante e do tu, assim como os modos de organização do discurso. O estudo usou como corpus uma seleção de enunciados retirados do Programa CQC, no intuito de compor dados de fala espontânea. Após a audição de duas edições do programa, selecionamos 5 enunciados de dois locutores do sexo masculino, apresentadores do programa CQC, que expressassem a atitude estudada, totalizando 10 enunciados de fala espontânea. Com o objetivo de comparação, instruímos dois atores, também do sexo masculino, estudantes do Curso de Artes Cênicas da Universidade Federal de Ouro Preto (UFOP), com idade entre 20 a 30 anos, os quais cursam o 8º período do referido curso, a expressarem a atitude de ironia, percebida nos enunciados selecionados para a fala espontânea; totalizando 10 enunciados de fala atuada. O roteiro baseou-se nos próprios enunciados do programa, de acordo com a descrição discursiva. Dessa forma, o corpus foi composto por 20 enunciados: 10 de fala espontânea e 10 de fala atuada. As gravações foram realizadas diretamente no programa PRAAT (Boersma e Weenink), visando a realização das análises acústicas, nesse sentido, podemos quantificar dados de frequência fundamental, duração, pausas e velocidade de articulação. Para as medidas de F0, buscamos os valores de F0 máxima, mínima, inicial do enunciado e final do enunciado, os quais foram obtidos em Hz. Também verificamos movimentos de F0 que possam ser característicos da expressão da atitude de ironia, em contraste com a fala não atitudinal ou neutra. A medida da taxa de articulação da fala aqui foi considerada como a divisão do número de sílabas pronunciadas pela duração total do enunciado, dada em sílabas por segundo. Os valores de duração foram considerados em nível segmental, marcando, também, a tônica proeminente e em nível do enunciado, em 242 4º Colóquio Brasileiro de Prosódia da Fala segundos; nessa mesma proposta foram medidas as pausas em segundos, buscando contrastes entre a fala atuada e a fala espontânea. Realizamos, ainda, análise estatística descritiva dos dados coletados - média, desvio padrão - e estatística inferencial – teste T de diferença entre médias, sendo adotado o nível de significância de 5%. As análises acústicas e estatísticas nos proporcionaram resultados significantes no que tange aos estudos prosódicos da entonação da atitude de ironia. As medidas de F0 revelaram parâmetros que foram muito relevantes no estudo dessa atitude. Os valores de F0 inicial, F0 final, F0 média e F0 máxima do enunciado foram significativamente maiores na atitude de ironia na fala espontânea do que na fala atuada. Ao passo que na F0 mínima, os valores nos enunciados de fala atuada foram maiores do que nos enunciados de fala espontânea. Em relação à duração do enunciado e da tônica saliente, apresentaram-se com menor variação, dessa forma não pontuamos considerações contrativas em comparação da fala atuada com a fala espontânea. As audições e análises nos mostraram, ainda, que os informantes fizeram uso de prolongamentos, risos, e interjeições durante a expressão da ironia, o que interferiu no aumento da duração. No que tange ao estudo discursivo dos enunciados analisados, percebemos que a função comunicacional dos sujeitos envolvidos na enunciação da atitude de ironia é bem definida, embora muitas das vezes a intenção do sujeito comunicante pode não coincidir com a percepção do sujeito interpretante. O que nos mostra que a ironia depende do contexto de comunicação, assim como da entonação para ser construída como tal. Assim, constatamos que este estudo piloto atingiu os objetivos pretendidos, evidenciando as formas de expressão de ironia e seus contextos de realização, evidenciando, ainda, as estratégias comunicacionais e as escolhas entoacionais como agentes da construção do significado da atitude de ironia. Referências Aubergé, V. 2002. A Gestalt Morphology of Prosody Directed by Functions: the Example of a Step Model Developed at ICP. In Proceedings of the 1st Conference on Speech Prosody: 151-155. Berrendonner, A. 1981. Eléments de pragmatique linguistique. Paris: Minuit. Boersma, P. & Weenink, D. PRAAT: software de análise acústica. Disponível em: http://www.fon.hum.uva.nl/praat/ 243 Caderno de Resumos Charaudeau, P. 1984. Le discours propaganiste. In Le français dans Le monde. 182. Paris, Hachette. Couper-Kuhlen, E. 1986. Introduction to English Prosody. Tübingen. Niemeyer. FÓNAGY, I. 2003. Des fonctions de l'intonation: essay de synthèse. In Flambeau 29: 120, Tokyo. Paula, K. M. 2012. O papel da prosódia na ironia como expressão de atitude. 92 f. Dissertação (Mestrado) Universidade Federal de Minas gerais. Faculdade de Letras – Belo Horizonte: UFMG/FALE. Wichmann, A. 2000. The attitudinal effects of prosody, and how they relate to emotion. In Proceedings of ISCA Workshop on Speech and Emotion: A Conceptual Framework for Research, Belfast. 244 APOIO