4º Colóquio Brasileiro de Prosódia da Fala
Miguel Oliveira, Jr.
Ayane Almeida
René Almeida
Projeto Gráfico, diagramação e capa
M. Cicera Costa
Catalogação na fonte
É permitida a reprodução total ou parcial desta obra, por quaisquer meios, desde que citada a fonte.
4º Colóquio Brasileiro de Prosódia da Fala
Agradecimentos
À Coordenação de Aperfeiçoamento de Pessoal de Nível Superior
(CAPES) e à Fundação de Amparo à Pesquisa do Estado de Alagoas
(FAPEAL), pelo auxílio financeiro concedido.
À Faculdade de Letras (FALE), ao Programa de Pós-Graduação em
Letras e Linguística (PPGLL), e à Pró-Reitoria de Pesquisa e Pós-Graduação
(PROPEP) da Universidade Federal de Alagoas, pelo auxílio financeiro e apoio
para a execução do evento.
Aos palestrantes Albert Rilliard e Carlos Gussenhoven, por aceitarem o
convite para participar do evento, partilhando resultados de suas pesquisas
recentes.
Aos debatedores Alexsando Meireles, Camila Leite, Juan Sosa, Letícia
Rebollo, Luciana Lucente, Pablo Arantes, Plínio Barbosa e Regina Cruz, pela
disponibilidade de atuar na condução das discussões dos trabalhos
apresentados no Colóquio.
A Dermeval da Hora, pelo apoio em prestar informações fundamentais
para a realização do evento.
Aos professores Elizabeth Couper-Kuhlen, Anne Wichmann, Marc
Swerts, Mariapaola d'Imperio, Albert Rilliard, Carlos Gussenhoven, Lorna
Fadden, Zuleica Camargo e Juan Manuel Sosa, por terem, muito gentilmente,
aceitado o convite para lecionar na Escola de Altos Estudos “Interfaces
Prosódicas”.
À Comissão Científica do evento, nomeadamente Adriana Bodolay,
Albert Rilliard, Alexsandro Meireles, Anne Wichmann, Camila Leite, César
Reis, Carlos Gussenhoven, Eleonora Albano, Ester Scarpa, Izabel Seara, João
Antônio de Moraes, José Olímpio de Magalhães, Juan Manuel Sosa, Letícia
Rebollo, Lorna Fadden, Luciana, Marc Swerts, Mariapaola D'Imperio, Pablo
Arantes, Plínio Barbosa, Regina Cruz, Sandra Madureira, Vera Pacheco,
Waldemar Ferreira Netto e Zuleica Camargo, por terem lido os resumos que
foram submetidos para avaliação e emitido pareceres.
À Luso Brazilian Association of Speech Sciences (LBASS), pelo apoio
na organização do evento.
Caderno de Resumos
Aos membros Grupo de Estudos de Prosódia da Fala, da Faculdade de
Letras / UFAL, pelo apoio na realização do evento.
Ao PET/Letras da UFAL, pelo apoio na organização do evento. Em
particular, aos petianos Natália Momberg e Victor Mata, pelo design do logo do
evento.
Aos participantes do IV Colóquio Brasileiro de Prosódia da Fala, por
terem submetido seus trabalhos e prestigiado o evento com suas valiosas
contribuições.
A Comissão Organizadora:
Miguel Oliveira, Jr., Camila Leite, Letícia Rebollo, Luciana Lucente,
Pablo Arantes e Regina Cruz
4º Colóquio Brasileiro de Prosódia da Fala
Introdução
A importância dada à pesquisa sobre a prosódia do português brasileiro
tem sido traduzida em uma série de iniciativas realizadas nos últimos anos. Em
agosto de 2007, com o objetivo de reunir pesquisadores nacionais que se
debruçavam no estudo da prosódia da fala sob diferentes perspectivas, João
Moraes (Universidade Federal do Rio de Janeiro) organizou, na Universidade
Federal do Rio de Janeiro, o I Colóquio Brasileiro de Prosódia da Fala. O evento
reuniu pesquisadores de vários centros universitários do país e resultou em uma
excelente oportunidade de diálogo entre esses estudiosos. O evento também
serviu como uma prévia para o Speech Prosody 2008, quarta edição do evento
internacional mais importante na área de prosódia da fala, que seria sediado no
ano seguinte na Universidade Estadual de Campinas.
Naquele mesmo ano de 2007 um grupo de investigadores nacionais
propõe a criação de uma associação científica com objetivo de promover,
estimular e divulgar os estudos nas Ciências da Fala no Brasil e em Portugal,
bem como estabelecer um canal de contato direto entre os estudos na área no
Brasil, em Portugal e no Exterior. Assim, surge a Luso Brazilian Association of
Speech Sciences (LBASS). A associação apoiou oficialmente o evento Speech
Prosody 2008.
O Speech Prosody 2008, organizado por Plínio Barbosa (Universidade
Estadual de Campinas), César Reis (Universidade Federal de Minas Gerais) e
Sandra Madureira (Pontifícia Universidade Católica de São Paulo) reuniu
pesquisadores de 30 países distintos e 54 pesquisadores brasileiros de prosódia
experimental.
No ano seguinte, em 2009, ocorreu o II Colóquio Brasileiro de Prosódia
da Fala na Universidade Estadual de Campinas. Esse evento, promovido pela
LBASS, foi organizado pelo Grupo de Estudos de Prosódia da Fala, liderado
por Plínio Barbosa. Um total de 40 trabalhos foram apresentados nesse evento.
O resumo das apresentações foram publicados em CD-ROM. Nesse colóquio,
surgiu a proposta de se organizar a I Escola de Prosódia com a missão de
possibilitar um espaço de formação que congregasse pesquisadores juniores e
seniores em torno do estudo da Prosódia.
Caderno de Resumos
Também em 2009, teve lugar na Universidade de São Paulo o Simpósio
"Em torno da Prosódia", evento promovido pelo Programa de Pós-graduação
em Semiótica e Linguística Geral daquela IES, e organizado por Beatriz
Raposo de Medeiros, Evani Viotti José Roberto do Carmo Jr e Paulo Chagas de
Souza.
Essas primeiras iniciativas (o I Colóquio Brasileiro de Prosódia da Fala,
o Speech Prosody 2008, o II Colóquio Brasileiro de Prosódia da Fala e o
Simpósio "Em torno da Prosódia") não apenas impulsionaram os estudos de
prosódia da fala no Brasil, mas também estimularam a divulgação desses
estudos internacionalmente. Na edição seguinte do Speech Prosody, em 2010,
realizada em Chicago, o número de participantes brasileiros passou para 15, um
número bastante expressivo, sobretudo se se leva em conta o fato de que a
primeira edição do evento, realizado na França, em 2002, contara apenas com 5
participantes brasileiros no total.
Por ocasião do Simpósio "Em torno da Prosódia", foi anunciada a I
Escola de Prosódia, evento que seria realizada em 2010, na PUC-SP,
organizado pelas professoras Sandra Madureira e Zuleica Camargo (Pontifícia
Universidade Católica de São Paulo). Durante este evento, foi lançado o
periódico JoSS (Journal Speech Sciences), editado por Plínio Barbosa e Sandra
Madureira. Trata-se de um periódico de livre acesso, com uma chamada para o
primeiro número sobre Prosódia Experimental e publicado regularmente desde
então.
Em 2011, foi realizado o III Colóquio Brasileiro de Prosódia da Fala, na
Universidade Federal de Minas Gerais, organizado por César Reis, com o apoio
do Núcleo de Estudos em Linguagem, Cognição e Cultura, Laboratório de
Estudos Empíricos e Experimentais da Linguagem e Grupo Interfaces
Linguagem, Cognição e Cultura. O evento contou com a participação de vários
pesquisadores nacionais, entre os quais professores, doutorandos, mestrandos e
graduandos. Um total de 40 trabalhos foram apresentados nesse evento. Os
artigos completos das apresentações foram publicados online nos Anais do
Colóquio Brasileiro de Prosódia da Fala.
Em fevereiro de 2012, Tommaso Raso e Heliana Mello (Universidade
Federal de Minas Gerais) organizam na UFMG o GSCP2012, reunindo
pesquisadores nacionais e internacionais dedicados à área da prosódia, e
lançando o corpus C-Oral-BRASIL I: Corpus de Referência do Português
Brasileiro Falado Informal.
Em outubro de 2012 foi realizada a II Escola de Prosódia na
Universidade Federal do Espírito Santo, organizado por Alexsandro Meireles, e
4º Colóquio Brasileiro de Prosódia da Fala
promovido pela LBASS. O evento teve 140 pessoas inscritas em 21 diferentes
cursos, oferecidos ao longo de quatro dias. Os cursos variavam de 4h a 12h e
foram oferecidos por pesquisadores brasileiros e estrangeiros, todos
especialistas em prosódia da fala.
O objetivo principal do IV Colóquio Brasileiro de Prosódia da Fala é dar
continuidade à realização de colóquios que reúnem pesquisadores na área.
Neste sentido o evento contribui para a consolidação da realização de eventos
que oportunizam a reunião de pesquisadores brasileiros e estrangeiros da área
de prosódia da fala e na divulgação e socialização de sua produção acadêmica.
A característica marcante do IV Colóquio Brasileiro de Prosódia da Fala,
organizado por Miguel Oliveira, Jr. (Universidade Federal de Alagoas), Camila
Leite (Universidade Federal de Alagoas), Letícia Rebollo (Universidade
Federal do Rio de Janeiro), Luciana Lucente (Universidade Federal de Minas
Gerais), Pablo Arantes (Universidade Federal de São Carlos) e Regina Cruz
(Universidade Federal do Pará), com o apoio da Faculdade de Letras da
Universidade Federal de Alagoas e do Programa de Pós-Graduação em Letras e
Linguística dessa mesma IES, é a escolha de uma sede localizada fora do eixo
formado pelos centros tradicionais, na sua imensa maioria nos estados do
sudeste brasileiro. Esta escolha teve por objetivo facilitar o acesso dos grupos
de pesquisa que começam a ganhar força na região nordeste ao fórum
acadêmico de alto nível em que o Colóquio vem se constituindo.
O evento será composto de duas palestras proferidas por convidados
internacionais: Albert Rilliard (LIMSI-CNRS, França) e Carlos Gussenhoven
(Radboud University Nijmegen, Holanda) e onze sessões de apresentações
orais de trabalhos – 46 ao todo – abordando temas bastante variados na área da
prosódia da fala. Pesquisadores de diferentes regiões do país e do exterior
estarão reunidos com o objetivo de apresentar resultados de estudos concluídos
e em andamento, que serão debatidos por especialistas na área, nomeadamente
Alexsando Meireles, Camila Leite, Juan Sosa, Letícia Rebollo, Luciana
Lucente, Pablo Arantes, Plínio Barbosa e Regina Cruz. O IV Colóquio
Brasileiro de Prosódia da Fala foi financiado pela Coordenação de
Aperfeiçoamento de Pessoal de Nível Superior (CAPES), através do Edital
PAEP (Processo 4053/2013-09) e pela Fundação de Amparo à Pesquisa do
Estado de Alagoas (FAPEAL), atráves to Edital FAPEAL No. 05/2012
(Processo 20130419-003-0034-0033).
Outro elemento inovador desta edição do Colóquio é a organização de
um evento satélite – A Escola de Altos Estudos “Interfaces Prosódicas” – com
Caderno de Resumos
o propósito de oferecer uma gama variada de cursos de média duração em
diferentes áreas de interface entre a prosódia e outros campos de investigação,
como o direito, o ensino de línguas e a investigação das emoções, por exemplo.
Os cursos serão ministrados por pesquisadores convidados que são autoridades
reconhecidas internacionalmente por seu trabalho, o que constituirá uma
oportunidade de grande valor não só para os grupos de pesquisa nacionais, mas
também para pesquisadores de outros países. Serão nove cursos ao todo: (i)
Prosódia e Conversação, com Elizabeth Couper-Kuhlen (Universidade de
Helsinki); (ii) Prosódia e Discurso, com Anne Wichmann (Universidade de
Central Lancashire); (iii) Prosódia Audiovisual na interação Humano-Humano
e Humano-Máquina, com Marc Swerts (Universidade de Tilburg); (iv)
Prosódia e Sintaxe, com Mariapaola d'Imperio (Universidade de AixMarseille); (v) Prosódia e Expressividade, com Albert Rilliard (Centro
Nacional de Pesquisa Científica, França); (vi) Prosódia e Tipologia, com Carlos
Gussenhoven (Universidade de Radboud); (vii) Prosódia e Direito, com Lorna
Fadden (Universidade Simon Fraser); (viii) Prosódia e Fonoaudiologia,
Zuleica Camargo (USP); e (ix) Prosódia e Entoação no Ensino de Língua
Estrangeira (inglês, francês e espanhol) no contexto brasileiro, com Juan
Manuel Sosa (Universidade Simon Fraser). A Escola de Altos Estudos
“Interfaces Prosódicas” foi completamente financiada pela Coordenação de
Aperfeiçoamento de Pessoal de Nível Superior (CAPES), através do Edital
Escola de Altos Estudos (Processo 23038.008493/2013-27).
Espera-se com a realização da quarta edição do Colóquio fortalecer a
posição do evento como o principal fórum de discussão de prosódia no cenário
brasileiro e colaborar para a disseminação de conhecimento de ponta sobre
prosódia, de forma a colocar o Brasil em posição competitiva no cenário
internacional de pesquisa na área.
A Comissão Organizadora:
Miguel Oliveira, Jr., Camila Leite, Letícia Rebollo, Luciana Lucente,
Pablo Arantes e Regina Cruz
4º Colóquio Brasileiro de Prosódia da Fala
Programação
16 de outubro
8h-8h30
Credenciamento
8h30-9h
Sessão de Abertura
9h-10h
Palestra: Cross-Cultural Perception of Attitudes and Concepts
Albert Rilliard (LIMSI-CNRS, França)
10h-10h30
Pausa para café
10h30-12h: Sessão de Apresentações 1
1. Prosody analysis of positive and negative laughter: a multicultural study
Laurence Devillers (Université Paris Sorbonne - Paris 4)
Mariette Soury (Université Paris XI Orsay)
2. A expressão da ironia no Português Brasileiro: um estudo prosódico
Wisla Madaleni Alves Cabral Ferreira (UFOP)
3. A velocidade de fala na expressão da raiva: um estudo com dados de elocução
espontânea
René Alain Santana de Almeida (UFAL)
Ayane Nazarela Santos de Almeida (UFAL)
Miguel Oliveira, Jr. (UFAL)
Ebson Wilkerson Rocha da Silva (UFAL)
DEBATEDORES: Letícia Rebollo & Juan Sosa
12h-14h
Almoço
Caderno de Resumos
14h-16h: Sessão de Apresentações 2
4. A expressividade na locução do telejornal: uma questão prosódica
Dilma Tavares Luciano (UFPE)
5. Ênfase prosódica em estruturas narrativas: Um estudo preliminar
Jeylla Salomé Barbosa dos Santos (UFAL)
Ana Maria Santos de Mendonça (UFAL)
6. Constraints prosódicos para os Marcadores Discursivos
Amanda Aleixo (UFMG)
Diego Malachias (UFMG)
Priscila Osório (UFMG)
Tommaso Raso (UFMG)
7. Pistas prosódicas de fronteiras discursivas em narrativas espontâneas: um
estudo de percepção
Ebson Wilkerson da Silva (UFAL)
Júlia Lopes (UFPA)
Miguel Oliveira, Jr. (UFAL)
Regina Cruz (UFPA)
Francisca Carvalho (UFMG)
8. Estrutura discursiva como limitadora de padrões entoacionais, e vice-versa
Luciana Lucente (UFMG)
DEBATEDORES: Regina Cruz & Leticia Rebollo
16h-16h30
Pausa para café
16h30-19h: Sessão de Apresentações 3
9. Desenvolvimento de algoritmo de análise automática da curva de frequência
por meio de convoluções gaussianas do histograma de alturas
Waldemar Ferreira Netto (USP/CNPq)
André Ricardo de Souza (Faculdade de Artes do Paraná/USP)
Maressa de Freitas Vieira (FSP)
Daniel Oliveira Peres (USP)
Marcus Vinicius Moreira Martins (USP)
10. Individualização de características prosódicas em diferentes relações sinalruído
Ana Carolina Constantini (UNICAMP)
Plinio Almeida Barbosa (UNICAMP)
4º Colóquio Brasileiro de Prosódia da Fala
11. Uso de técnicas acústicas para verificação de locutor em simulação
experimental
Aline de Paula Machado (Unicamp)
12. Exclamativas WH em português brasileiro: metodologia para montagem de
experimentos de produção e aceitabilidade
Karina Zendron da Cunha (UFSC)
13. Desviando da própria fala: implicações para a verificação de locutor por
falantes e não-falantes do português brasileiro
Renata Regina Passetti (Unicamp)
DEBATEDORES: Alexsando Meireles & Pablo Arantes
17 de outubro
8h-9h
Palestra: Comparing the word and sentence prosody of British and Nigerian
English
Carlos Gussenhoven (Radboud University Nijmegen, Holanda)
9h-10h: Sessão de Apresentações 4
14. A combinação de pistas acústicas melódicas, de duração silábica e de
intensidade relativa prevê melhor a percepção da proeminência em português
brasileiro
Plínio A. Barbosa (Unicamp)
15. Estudo articulatório de reorganizações rítmicas da fala devido ao aumento da
taxa de elocução
Alexsandro Rodrigues Meireles (UFES)
Plínio Almeida Barbosa (Unicamp)
DEBATEDORES: Pablo Arantes & Luciana Lucente
10h-10h30
Pausa para café
10h30-12h: Sessão de Apresentações 5
16. A(s) pronúncia(s) do R final em canções do início do século XX (1902-1920)
Karilene Xavier (UFRJ)
Caderno de Resumos
17. O apagamento do rótico no português brasileiro e no português europeu: o lido
e o dito
Aline de Jesus Farias Oliveira (UFRJ)
Ingrid da Costa Oliveira (UFRJ)
18. A relação entre a compreensão e os aspectos prosódicos na leitura em voz alta
de falantes do PE e do PB
Camila Tavares Leite (UFAL)
DEBATEDORES: Juan Sosa & Regina Cruz
12h-14h
Almoço
14h-16h: Sessão de Apresentações 6
19. Preenchimentos dos níveis prosódicos inferiores: dados de aquisição do PB
Luzia Miscow da Cruz Payão (UNCISAL)
20. A prosódia como ponto de partida para a segmentação do fluxo da fala por
bebês brasileiros
Ícaro Oliveira Silva (UFJF)
Maria Cristina Name (UFJF)
21. Caracterização da frequência fundamental da voz de adultos que gaguejam
Ayslan Melo de Oliveira (UFS)
Jeane Bezerra de Melo e Silva (UFS)
Kleuvencleiton José dos Santos Oliveira (UFS)
Mayra Cristina Jorge Oliveira (UFS)
Suelen Glaucia (UFS)
Tarcya Sibele Bastos Santos (UFS)
Thiago Gonçalves de Jesus (UFS)
Susana de Carvalho (UFS)
22. Características prosódicas dos números telefônicos no português brasileiro
Oyedeji Musiliyu (UFAL)
Miguel Oliveira Jr. (UFAL)
23. Experimento de produção sobre a prosódia da não exaustividade semântica no
português brasileiro
Daise Ribeiro Pereira Carpes (UFSC)
Juan Manuel Sosa (Simon Fraser University)
Izabel Christine Seara (UFSC)
DEBATEDORES: Camila Leite & Luciana Lucente
4º Colóquio Brasileiro de Prosódia da Fala
16h-16h30
Pausa para café
16h30-19h: Sessão de Apresentações 7
24. Towards Focus Typology in Turkish
Jane Kühn (University of Potsdam)
25. Status referencial no Português Brasileiro: Estudo das pistas acústicas de
novo, dado e acessível
Alexandre Delfino (Unicamp)
26. A interação prosódia-sintaxe em dados de produção e de compreensão de
estruturas de Tópico e de SVO
Carolina Garcia de Carvalho Silva (UFJF)
Maria Cristina Name (UFJF)
27. Percepção de correlatos prosódicos da distinção dado-novo em português
brasileiro
Pablo Arantes (UFSCar)
Cíntia Santana (UFMG)
Luciana Lucente (UFMG)
28. Marcação prosódica e status referencial em português brasileiro
Cíntia Antão (UFMG)
Luciana Lucente (UFMG)
Pablo Arantes (UFSCar)
Maria Luiza Cunha Lima (UFMG)
DEBATEDORES: Plínio Barbosa & Alexsandro Meireles
18 de outubro
8h-10h: Sessão de Apresentações 8
29. Percepção de padrões entoacionais do alemão: um estudo preliminar
Adelaide Herciìlia Pescatori Silva (UFPR)
Maria do Socorro Gonc¸alves Gabriel (UFPR)
Rafael Klassen Martens (UFPR)
30. A Entoação do Português do Brasil: uma descrição perceptiva
Luma da Silva Miranda (UFRJ)
Caderno de Resumos
31. Relação entre a prosódia e seus constituintes e a realização de sândi vocálico
externo na leitura
Ceriz Graça Bicalho Cruz Costa (UFMG/CNPq)
Camila Tavares Leite (UFAL)
32. Aspectos temporais envolvidos na sobreposição de vozes em diálogos da
língua Yaathe
Fábia Pereira da Silva (UFAL)
Miguel Oliveira Jr. (UFAL)
Januacele da Costa (UFAL)
33. A prosódia como recurso para marcar tempo em Kaingang
Márcia Nascimento (UFRJ)
Marcus Maia (UFRJ)
Leticia Rebollo Couto (UFRJ)
DEBATEDORES: Pablo Arantes & Luciana Lucente
10h-10h30
Pausa para café
10h30-12h: Sessão de Apresentações 9
34. Formulações na corte: a prosódia em ações de checagem de entendimento e de
requisição de prestação de contas
Daniela Negraes P. Andrade (UNISINOS)
Ana Cristina Ostermann (UNISINOS)
Minéia Frezza(UNISINOS)
35. Um estudo comparativo do acento ¡H+L* entre uma variedade brasileira
nordestina e uma italiana meridional: uma hipótese de lexicalização
suprassegmental e uma reflexão sobre o conceito de foco
Marco Barone (UFPE)
36. Enunciados Interrogativos Totais neutros em ELE: antes e depois da
sistematização no processo de ensino-aprendizagem
Maristela da Silva Pinto (UFRRJ)
Roberto Botelho Rondinini (UFRRJ)
Natacha Dionisio de Souza (IC/UFRRJ)
DEBATEDORES: Letícia Rebollo & Juan Sosa
12h-14h
Almoço
4º Colóquio Brasileiro de Prosódia da Fala
14h-16h: Sessão de Apresentações 10
37. Entoação das interrogativas totais e parciais do espanhol produzidas por um
professor de espanhol, falante de português brasileiro de Curitiba
Pollianna Milan (UFPR)
38. Análise entonacional e pragmática de conversas telefônicas coloquiais: os
enunciados interrogativos totais nas variedades de Buenos Aires e Santiago do
Chile
Carolina Gomes da Silva (PG-UFRJ/CNPq)
Maristela da Silva Pinto (UFFRJ)
Natalia dos Santos Figueiredo (UNILA/PG-UFRJ)
39. Descendo ou subindo? Padrões entonacionais de interrogativas totais da
língua inglesa e do português brasileiro por falantes brasileiros
Leonice Passarella dos Reis (EAMSC/UFSC)
40. Produção e percepção de sentenças interrogativas totais em dados de falantes
nativas e não nativas de espanhol: um estudo experimental
Eva Christina Orzechowski Dias (UFSC)
Izabel Christine Seara (UFSC)
Juan Manuel Sosa (Simon Fraser University)
41. Prosódia acústica e prosódia visual de enunciados interrogativos no espanhol
de Montevidéu
Priscila Cristina Ferreira de Sá (UFRJ)
Leticia Rebollo Couto (UFRJ)
DEBATEDORES: Alexsando Meireles & Plínio Barbosa
16h-16h30
Pausa para café
16h30-19h: Sessão de Apresentações 11
42. Pistas prosódicas para a segmentação da entrevista sociolinguística
Raquel Meister Ko. Freitag (Universidade Federal de Sergipe)
43. Contribuições para o Atlas do Projeto Amper – Norte: Variedade Linguística
de Baião (PA)
Rosinele Lemos e Lemos (UFPA)
Regina Célia Fernandes Cruz (UFPA/CNPq)
44. A prosódia das frases declarativas e interrogativas totais: um comparativo
entre as falas de Maués, no Amazonas e Cametá, no Pará
Ilma Pinto do Espírito Santo (UFPA)
Suzana Pinto do Espírito Santo (UFAM)
Caderno de Resumos
45. Pelos cantos do Brasil: uma análise prosódica da asserção neutra em falares
das capitais e do interior do Brasil
Aline Ponciano dos Santos Silvestre (UFRJ)
Gizelly Fernades Maia dos Reis (UFRJ)
Priscila Francisca dos Santos (UFRJ)
46. Características prosódicas de sete dialetos brasileiros
Ana Carolina Constantini (UNICAMP)
Plinio Almeida Barbosa (UNICAMP)
DEBATEDORES: Regina Cruz & Camila Leite
4º Colóquio Brasileiro de Prosódia da Fala
Sumário
Percepção de padrões entoacionais do Alemão: um estudo preliminar
21
Status referencial no português brasileiro: estudo das pistas acústicas
de novo, dado e acessível
26
Estudo articulatório de reorganizações rítmicas da fala devido ao
aumento da taxa de elocução
30
Uso de técnicas acústicas para verificação de locator em simulação
experimental
34
O apagamento do rótico no português brasileiro e no português
europeu: o lido e o dito
38
Pelos cantos do Brasil: uma análise prosódica da asserção neutra em
falares das capitais e do interior do Brasil
42
Restrições prosódicas para os marcadores discursivos
48
Individualização de características prosódicas em diferentes relações
sinal-ruído
56
Características prosódicas de sete dialetos brasileiros
60
Ênfase prosódica em estruturas narrativas: um estudo preliminar
66
Caracterização da frequência fundamental da voz de adultos que
gaguejam
71
A relação entre a compreensão e os aspectos prosódicos na leitura em
voz alta de falantes do PE e do PB
76
Caderno de Resumos
A interação prosódia-sintaxe em dados de produção e de compreensão de
estruturas de Tópico e de SVO
80
Análise entonacional e pragmática de conversas telefônicas coloquiais:
os enunciados interrogativos totais nas variedades de Buenos Aires e
Santiago do Chile
84
Relação entre prosódia e seus constituintes e a realização de sândi
vocálico externo na leitura
89
Marcação prosódica e status referencial em português brasileiro
92
Experimento de produção sobre a prosódia da não exaustividade
semântica no português brasileiro
97
Formulações na Corte: a prosódia em ações de checagem de
entendimento e de requisição de prestação de contas
103
A Expressividade na locução do telejornal: uma questão prosódica
107
Pistas Prosódicas de Fronteiras Discursivas em Narrativas Espontâneas:
um estudo de percepção
112
Produção e percepção de sentenças interrogativas totais em dados de
falantes de espanhol como L1 e L2: um estudo experimental
118
Aspectos temporais envolvidos na sobreposição de vozes em diálogos da
língua Yaathe
123
A prosódia como ponto de partida para a segmentação do fluxo da fala
por bebês brasileiros
127
a prosódia das frases declarativas e interrogativas totais: um comparativo
entre as falas de Maués, no Amazonas e Cametá, no Pará
131
Towards a Focus Typology in Turkish
135
A(s) pronúncia(s) do R final em canções do início do século XX (19021920)
141
4º Colóquio Brasileiro de Prosódia da Fala
Exclamativas WH em português brasileiro: metodologia para montagem
de experimentos de produção e aceitabilidade
145
Prosody analysis of positive and negative laughter: a multicultural study
149
Descendo ou subindo? Padrões entonacionais de interrogativas totais da
língua inglesa e do português brasileiro por falantes brasileiros
154
Estrutura discursiva como limitadora de padres entoacionais, e viceversa
158
A Entoação do Português do Brasil: uma descrição perceptiva
162
Preenchimentos dos níveis prosódicos inferiores: dados de aquisição do
Português Brasileiro (PB)
168
A prosódia como recurso para marcar tempo em kangang
173
Um estudo comparativo do acento ¡H+L* entre uma variaedade
brasileira nordestina e uma italiana meridional: uma hipótese de
lexicalização suprassegmental e uma reflexão sobre o conceito de foco
180
Enunciados interrogativos totais neutros em ELE: antes e depois da
sistematização no processo de ensino-aprendizagem
187
Características prosódicas dos números telefônicos no português
brasileiro
194
Percepção de correlatos prosódicos da distinção dado-novo em
português brasileiro
199
A combinação de pistas acústicas melódicas, de duração silábica e de
intensidade relativa prevê melhor a percepção da proeminência em
português brasileiro
205
Entoação das interrogativas e parciais do espanhor produzidas por um
professor de espanhor, falante de Português Brasileiro de Curitiba.
209
Prosódia acústica e prosódia visual de enunciados interrogativos no
espanhol de Montevidéu
213
Caderno de Resumos
Pistas prosódicas para a segmentação da entrevista sociolinguística
217
Desviando da própria fala: implicações para a verificação de locutor por
falantes e não-falantes do português brasileiro
222
A velocidade de fala na expressão da raiva: um estudo com dados de
elocução espontânea
226
Contribuições para o Atlas do Projeto Amper-Norte: variedade
linguística de Baião (PA)
230
Desenvolvimento de algoritmo de análise automática da curva de
frequência por meio de convoluções gaussianas do histograma de alturas
235
A expressão da ironia no Português Brasileiro: um estudo prosódico
241
4º Colóquio Brasileiro de Prosódia da Fala
Percepção de padrões entoacionais do Alemão: um
estudo preliminar
Adelaide Hercília Pescatori Silva, Maria do S. Gonçalves Gabriel,
Rafael K. Martens
Departamento de Linguística, Letras Clássicas e Vernáculas,
Universidade Federal do Paraná, Brasil
[email protected], [email protected], [email protected]
A experiência docente e discente com alemão como língua estrangeira
revela um tratamento recorrente nos materiais didáticos dos aspectos sintáticos,
lexicais e culturais. O tratamento aos aspectos fonéticos, porém, é mais
superficial e focaliza sobretudo a qualidade vocálica, a diferença entre vogais
longas e breves, ou os sons de /r/. Pouco ou quase nada se diz sobre o nível
prosódico da língua a ser aprendida: informa-se apenas ao estudante que
sentenças interrogativas – quaisquer que sejam elas - devem apresentar curva
entoacional ascendente no final, contraposta à curva entoacional descendente,
que supostamente caracteriza quaisquer sentenças assertivas. Desta forma,
praticamente igualam-se as línguas materna e estrangeira sob o ponto de vista
prosódico.
Entretanto, é sabido que as línguas apresentam diferenças relacionadas a
aspectos prosódicos como, por exemplo, o ritmo: línguas como o alemão
apresentam uma natureza acentual para o ritmo; outras, como o francês, uma
natureza silábica. Essa distinção se faz tomando-se ritmo silábico como aquele
em que as sílabas são produzidas com duração aproximadamente igual e ritmo
acentual como aquele característico de línguas em que a duração dos eventos de
fala entre os acentos tônicos é aproximadamente igual (Massini-Cagliari 1992:
41,42). O português brasileiro (PB), por outro lado, é caracterizado por alguns
autores (Barbosa 1999) como uma língua de ritmo misto, ou seja, apresenta
características tanto de línguas acentuais como de línguas silábicas.
As diferenças observadas no nível prosódico não se dão, contudo, apenas
no âmbito do ritmo. A entonação das línguas também as diferencia entre si, o
que se atesta, por exemplo, com a observação de Cortés (2002: 28) sobre as
21
Caderno de Resumos
interpretações inadequadas dos aprendizes de espanhol quanto às intenções
comunicativas do falante nativo.
Tendo isso em vista, pode-se assumir, com base nos estudos de Eckman
(1981) sobre a interlíngua, que os aprendizes de alemão como língua
estrangeira, falantes nativos de PB, transferirão à língua alemã características
prosódicas de sua língua materna, durante o processo de aquisição da língua
estrangeira. Por isso decidiu-se conduzir um estudo sistemático desse nível,
que desempenha um papel crucial na comunicação, já que curvas entoacionais
não default podem levar o interlocutor a uma interpretação do enunciado
distinta daquela intencionada pelo falante a exemplo do que argumentam FontRotchés e Mateo-Ruiz (2011).
Desde 2011, então, tem-se caracterizado acusticamente os contornos
entoacionais do alemão em sentenças interrogativas e assertivas. Para fazer a
caracterização acústica, recorreu-se à seguinte metodologia: recortaram-se
sentenças de fala espontânea em alemão a partir de vídeos da televisão alemã
disponíveis na internet. A análise segue o método de base acústico-perceptiva
de Font-Rotchés e Cantero (2009), que têm se empenhado em diversas
investigações sobre a entonação de diferentes línguas. O Melodic Analysis of
Speech (MAS) é um método formal baseado em análises acústico-perceptivas
da fala espontânea, o que possibilita que a entonação seja descrita do ponto de
vista fonético. Além disso, o modelo permite obter valores relativos que
constituem as curvas entoacionais de maneira que se possa compará-las,
classificá-las, reproduzi-las, usá-las em síntese de fala e estabelecer
generalizações linguísticas através delas.
O MAS aplica-se, assim, aos objetivos desta pesquisa, tendo em vista,
que é pensado especificamente para estudos comparativos entre línguas, o que
lhe confere grande aplicabilidade ao ensino de Língua Estrangeira.
Através do software Praat analisaram-se acusticamente os enunciados
coletados: mediu-se a frequência fundamental (F0) das vogais de cada sílaba do
enunciado recortado. Com os valores obtidos, os valores de F0 foram
normalizados através de metodologia desenvolvida por Cantero e FontRotchés (2009): calcula-se com uma regra de três a porcentagem da variação de
cada valor absoluto em relação ao valor anterior. Quando o valor é maior que o
anterior, obtém-se uma porcentagem positiva e quando o valor é menor, uma
porcentagem negativa. É com este cálculo que se conseguem os valores
relativos de cada contorno. Para gerar o gráfico dos contornos entoacionais,
convertem-se as porcentagens obtidas em valores estandardizados a partir do
valor arbitrário 100. Lançando mão deste processo de normalização, pode-se
22
4º Colóquio Brasileiro de Prosódia da Fala
representar graficamente cada contorno com o fim de comparação com outra
curva. Esse procedimento analítico, baseando-se na inflexão final (a curva
obtida desde a última sílaba tônica da sentença até o seu final), permite
classificar os contornos entoacionais do alemão em grupos semelhantes.
Após as primeiras análises das curvas entoacionais, constataram-se
relações significativas entre a configuração da inflexão final dos enunciados
com a sua função comunicativa. Tanto para as sentenças interrogativas quanto
para as sentenças assertivas estabeleceram-se dois padrões entoacionais com
base na inflexão final.
Quanto aos enunciados interrogativos, o primeiro padrão apresenta um
contorno de inflexão final descendente-ascendente, implicando em sentenças
interrogativas absolutas, ou seja, perguntas às quais somente cabem respostas
imediatas 'sim' ou 'não'. Exemplo: ,,Kann ich wieder gehen?''(“Eu já posso
ir?”). O segundo padrão entoacional, por sua vez, consiste num contorno de
inflexão final ascendente. Nos enunciados interrogativos com este padrão,
como em ,,Was?'' (“Certo?”), espera-se como função comunicativa um pedido
de confirmação.
Nos enunciados assertivos, o primeiro padrão apresenta um contorno de
inflexão final descendente, implicando em sentenças assertivas em que o
informante conclui um raciocínio. A sentença ,,Tja, stimmt'' (“Sim, está certo”)
apresenta tal contorno. O segundo padrão entoacional encontrado consiste num
contorno de inflexão final ascendente-ascendente. Nos enunciados
declarativos com este padrão, o locutor anuncia parte de uma ideia a ser
completada pelo ouvinte. É a suspensão entoacional que dá pistas ao
interlocutor de que a ideia veiculada não está de todo completa. Um exemplo
para esse padrão é ,,Den Bart haben Sie zwar nicht...'' (“A barba, o senhor não
tem...”).
A função comunicativa depreendeu-se pela análise do contexto
conversacional dos enunciados, recuperado tanto nos vídeos como nas fichas
catalográficas, elaboradas com o fim de identificação detalhada de cada
enunciado analisado.
Após mais uma rodada de análise das sentenças coletadas, observou-se a
necessidade de expansão do corpus, já que se julgava necessário um número
maior de observações para uma caracterização mais precisa dos padrões
prosódicos encontrados. Assim, com novas sentenças submetidas ao mesmo
processo metodológico mencionado acima, tomou-se como objetivo, com base
no corpus estendido, a revisão dos dados para verificar se os padrões
encontrados inicialmente se sustentam e se novos padrões surgem nos dados.
23
Caderno de Resumos
Apesar da expansão do corpus em 70%, não se verificaram novos padrões
entoacionais, mas as curvas entoacionais encontradas reforçam os padrões já
existentes.
Os resultados obtidos durante todas as etapas da pesquisa trouxeram à
tona a seguinte questão: em que medida as diferenças no valor da frequência
fundamental encontradas nas análises dos dados são realmente percebidas
como funções comunicativas distintas? Ou seja, o quanto é necessário que a
frequência fundamental mude para que os falantes identifiquem as diferentes
funções associadas às curvas entoacionais? Para que se possa verificar e
analisar tal fenômeno, fez-se necessária a elaboração e aplicação de um teste
perceptual.
O teste foi aplicado com o software TP -Teste/Treinamento de Percepção
- (Rauber et al. 20121), que é um aplicativo gratuito desenvolvido para a
realização de experimentos de Percepção da Fala, de plataforma user-friendly.
2
Diferentemente da proposta desenvolvida por Font-Rotchés (2013 ), que prevê
a manipulação das sentenças com o auxílio do software Praat, cogitou-se para o
teste perceptual deste projeto a utilização de sentenças sem manipulações na
frequência fundamental. Isto é, de sentenças não-sintetizadas, devido ao fato de
que Cantero e Font-Rotchés (2009), na fase de produção, trabalham com dados
da fala espontânea, mas na fase de percepção, os ouvintes interpretam sentenças
manipuladas no Praat. Por considerarmos esta estratégia uma limitação
metodológica e após discussões sobre essa 'discrepância', optou-se por uma
metodologia mais robusta, à medida que se trabalhe tanto na produção quanto
na percepção com dados de mesma natureza (sentenças espontâneas e não
manipuladas). Os resultados alcançados através do teste perceptual elaborado e
aplicado para esta pesquisa serão expostos e discutidos neste trabalho.
Referências
Barbosa, P. A. 1999. “Revelar a estrutura rítmica de uma língua construindo máquinas
falantes: pela integração de ciência e tecnologia de fala”. In Scarpa, E. M. (org.)
Estudos de Prosódia. Campinas, SP: Editora da Unicamp.
1
O software pode ser acessado em: http://www.worken.com.br/tp_regfree.php
Comunicação individual no VIII Congresso Internacional da ABRALIN.
2
24
4º Colóquio Brasileiro de Prosódia da Fala
Cantero, F. J. & Font-Rotchés, D. 2009. Protocolo para el análisis melódico del habla,
Estudios de Fonética Experimental XVIII: 17-32.
______. 2002. Teoría y análisis de la entonación. Edicions de la Universitat de
Barcelona.
Cortés, M. 2002. Didáctica de la prosodia del español: la acentuación y la entonación.
Ednumen.
Eckman, F. R. 1981. On the naturalness of interlanguage phonological rules.
Font-Rotchés, D. & Cantero Serena, F. J. 2009. Melodyc Analysis of Speech Method
applied to Spanish and Catalan. Phonica, 5: 33-47.
Font-Rotchés, D. 2011. “Melodyc Analysis of Speech (MAS): aplicaciones en la
comparación de lenguas”. Revista da Abrallin (especial): 333-366.
Font-Rotchés, D. & Mateo-Ruiz, M. 2011. “Absolute interrogatives in Spanish, a new
melodic pattern”. Anais do VII Congresso Internacional da Abralin. Curitiba.
Massini-Cagliari, G. 1992. Acento e ritmo. São Paulo: Contexto.
25
Caderno de Resumos
Status referencial no português brasileiro:
Estudo das pistas acústicas de novo, dado e acessível
Alexandre Delfino
Faculdade de Letras, Universidade Federal de Minas Gerais, Brasil
[email protected]
Na área de estrutura informacional, sabe-se que referentes possuem um
estado mental temporário baseado no seu grau de disponibilidade para os
interlocutores no discurso. Esse estado mental (ou status referencial) é
tradicionalmente visto como uma dicotomia entre referentes novos e dados (ou
velhos) no discurso. Propostas recentes (Prince 1981; Gundel et al. 1993; inter
alia) sugerem que, na verdade, o status referencial é um contínuo cujos
extremos são os status novo e dado. Chafe (1976; 1994) propõe uma divisão
baseada no grau de ativação do referente na memória de trabalho do ouvinte.
Referentes novos são 'inativos', ao passo que referentes dados já estão
'ativados'. Um terceiro estado, acessível, é associado aos referentes 'semiativados'. O status referencial é muitas vezes codificado gramaticalmente, ou
seja, há uma relação razoavelmente previsível entre o status de um referente e a
sua forma. Muito tem-se observado sobre a distribuição da marcação
morfossintática do status referencial nas línguas. Contudo, apenas
recentemente há estudos que investigam a relação entre o status de um referente
no discurso e a sua marcação prosódica. Baumann (2006) observou que falantes
de alemão conseguem produzir pistas que podem distinguir pelo menos três
status: novo, dado e acessível. Referentes novos são geralmente marcados por
uma proeminência entonacional; referentes dados são geralmente
"desacentuados", ao passo que referentes acessíveis são geralmente marcados
por uma proeminência intermediária. A maioria dos estudos em PB, contudo,
tem enfatizado a investigação de outras categorias da estrutura informacional
que não o status referencial (foco, tópico, contraste). Trabalhos recentes
(Arantes 2010; Delfino et al. 2012; Antão et al. 2013) mostram que a prosódia é
sensível à codificação do status referencial. Delfino et al. (2012) analisou a
marcação prosódica em três níveis (novo, dado e acessível). Os resultados
mostraram que referentes novos são distintos acusticamente de referentes
26
4º Colóquio Brasileiro de Prosódia da Fala
dados e acessíveis, mas não há diferença entre esses dois últimos. Os autores
concluíram que a falta de controle semântico dos itens acessíveis pode ter
influenciado nos resultados. Antão et al. (2013) analisou a relação entre
marcação acústica do status referencial e a posição do referente na sentença.
Resumidamente, falantes tendem a marcar melhor o status referencial na
posição inicial de sentença. Esse estudo, contudo, considerou apenas os status
novo e dado. O objetivo este trabalho, portanto, é aprofundar-se em algumas
questões relacionadas à manifestação prosódica do status referencial
considerando a posição relativa do referente na sentença e a relação semântica,
mais especificamente do status acessível. Para este experimento, foram criados
dois corpora com 72 sentenças, distribuídas em três condições: dado, novo e
acessível. O contexto das sentenças determinava o status referencial da palavraalvo. No primeiro corpus, as palavras-alvo estão em posição final de palavra, e
no segundo corpus as palavras-alvo estão em posição inicial não absoluta. As
sentenças abaixo ilustram a construção do status referencial pelo contexto
(palavras-alvo entre asteriscos):
Primeira etapa:
Novo: O homem foi à loja para comprar *uma bateria*.
Dado: O rapaz comprou uma bateria nova para o seu notebook. Quando
ele sentiu um cheiro de queimado, ele foi à loja devolver *a bateria*.
Acessível: Ao sair de casa, o rapaz não conseguiu ligar o carro. O frio
havia congelado a *bateria*.
Segunda etapa:
Novo: De acordo com o manual, *uma bateria* é o suficiente para ligar o
brinquedo novo.
Dado: O rapaz comprou uma bateria para o aparelho. Depois de alguns
minutos, *a bateria* apresentou um cheiro de queimado.
Acessível: Ao sair de casa, o rapaz não conseguiu ligar o carro. Durante a
madrugada, *a bateria* havia congelado.
Todas as palavras-alvo possuem quatro sílabas e são paroxítonas.
Arantes (2010) mostrou que à medida em que o número de sílabas da palavra
aumenta, os parâmetros acústicos se tornam mais evidentes, como se a curva
melódica tivesse mais material acústico para se projetar. A relação semântica
entre o antecedente e a palavra-alvo na condição acessível foi controlada.
Baumann (2006) observou no alemão que a marcação prosódica de referentes
acessíveis é mais estável quando a relação entre as palavras é 'parte-pelo-todo'.
27
Caderno de Resumos
O traço 'animacidade' também foi controlado em todos os itens. O experimento
foi realizado em duas etapas, utilizando-se um corpus diferente por vez. Em
cada etapa, os participantes tiveram como tarefa a leitura da lista de sentenças,
que foram apresentadas uma a uma em uma apresentação de slides. Os
participantes controlavam a velocidade de transição entre os slides. Eles foram
instruídos a realizar uma leitura silenciosa antes da gravação de cada sentença.
Durante a análise acústica, foram considerados os seguintes parâmetros (a)
duração da palavra-alvo, (b) média da curva de F0, (c) desvio-padrão, (d) gama
e (e) contorno de F0 normalizado pelo tempo. Os dados dos participantes foram
analisados separadamente. Para a análise estatística, foram feitas Análises de
Variância (ANOVAs) para determinar se as diferenças nos valores médios dos
parâmetros (a)-(d) eram estatisticamente diferentes. A análise de (e) permitiu
uma observação visual do comportamento da curva de F0 como um todo. Os
resultados mostram que o status referencial afeta de forma significativa a
duração e o nível de F0 nas palavras-alvo na maioria dos participantes.
Comparando-se os dados das duas etapas, podemos observar que em PB a
marcação acústica dos referentes é afetada pela sua relativa posição na
sentença. Os resultados da primeira etapa mostraram que não houve qualquer
diferença entre as três condições na posição final da sentença. Os resultados da
segunda etapa, contudo, mostram que os falantes produziram uma diferença
significativa na duração e no nível de F0 entre referentes novos e referentes
dados e acessíveis. Nas duas etapas, não foram observadas nenhuma diferença
nas médias de desvio-padrão e gama dos referentes. A análise do contorno
entonacional normalizado pelo tempo mostra que, em posição inicial,
referentes novos podem ser caracterizados por dois picos no contorno, um
alinhado às sílabas pretônicas e outro alinhado à sílaba tônica. Referentes dados
e acessíveis mostram contornos muito similares e tendem a ter apenas um pico
alinhado à sílaba tônica ou um contono relativamente achatado. De forma geral,
os dados mostram que os falantes utilizam de pistas acústicas para marcar o
status dos referentes no discurso aumentando o pitch e a duração dos referentes
novos. Referentes dados e acessíveis não são distintos em si, pelo menos pelos
parãmetros observados. Dado o nível de controle semântico para os itens
acessíveis, podemos sugerir que, ao contrário do alemão pelo menos, os
falantes de PB não marcam distintivamente referentes dados de acessíveis.
28
4º Colóquio Brasileiro de Prosódia da Fala
Referências
Antão, C., Cunha Lima, M. L. & Arantes, P. 2013. Interrelation between subjecthood,
referential status and prosody. In Proceedings of 35th Annual Conference of the
German Linguistic Society – DGfS. Potsdam, Germany.
Arantes, P. 2010. Integrating production and perception of secundary prominences in a
dynamical perspective of rhythm. PhD thesis. Campinas, Unicamp.
Baumann, S. 2006. The Intonation of Givenness - Evidence from German. PhD thesis.
Saarland University. Linguistische Arbeiten 508. Tübingen: Niemeyer.
Chafe, W. L. 1976. Givenness, contrastiveness, definiteness, subjects, topics and
point of view. In Charles, N. Li ed. Subject and topic. New York: Academic Press:
25-55.
Chafe, W. L. 1994. Discourse, consciousness, and time. Chicago: The University of
Chicago Press.
Delfino, A., Cunha Lima, M. L. & Arantes, P. 2012. Prosodic marking of referential
status in Brazilian Portuguese. In Proceedings of the Glow 35 - Production and
perception of prosodically-encoded information structure workshop. Postdam,
Germany.
Gundel, J. K., Hedberg, N. & Zacharski, R. 1993. Cognitive status and the form of
referring expressions in discourse. Language 69 (2): 274-307.
Prince, E. 1981. Towards a taxonomy of given-new information. In Cole, P. Radical
Pragmatics, New York, Academic Press: 223-256.
29
Caderno de Resumos
30
4º Colóquio Brasileiro de Prosódia da Fala
31
Caderno de Resumos
32
4º Colóquio Brasileiro de Prosódia da Fala
33
Caderno de Resumos
Uso de técnicas acústicas para verificação de locator em
simulação experimental
1
1
Aline de Paula Machado , Plínio Almeida Barbosa
1
Departamento de Linguística/IEL/Universidade Estadual de
Campinas/Brasil
[email protected], [email protected]
Esta pesquisa propõe o uso de técnicas de análise acústica para
reconhecer um indivíduo dentro de um grupo de dez falantes do português
paulista e assinalar quais parâmetros acústicos são relevantes para o
reconhecimento naquele grupo.
A identificação de um indivíduo dentro do grupo se dará a partir das
análises de trechos de suas falas, durante os quais se quantificarão as
frequências dos dois primeiros formantes das vogais orais, a frequência
fundamental, a duração de unidades do tamanho da sílaba e da vogal, a
intensidade relativa (ênfase espectral), a frequência fundamental de base de
cada sujeito, a taxa de movimento de formantes e o ÄC (desvio padrão de
durações de intervalos consonânticos). Todos os trechos escolhidos são de
entrevistados divididos em dois grupos, (i) entrevistas ao ar livre e (ii)
gravações telefônicas (de celular para celular).
A fala é um elo, uma cadeia cujas informações são trocadas e a
cooperação é negociada (Pardo & Remez 2006). O locutor tem a expectativa
que o ouvinte compreenda toda a (complexa) dimensão da mensagem emitida
e, é justamente a percepção e o reconhecimento da fala pelos sujeitos, que são os
pontos principais de muitos estudos relacionados à fonética acústica,
psicoacústica, visando a entender o que do acústico contribui para a percepção
da diferença entre indivíduos.
O reconhecimento de locutor pode ser definido como uma sequência de
operações pela qual uma amostra de fala é atribuída a uma pessoa com base em
suas propriedades fonético-acústicas ou perceptuais.
Para a identificação de um sujeito na situação forense habitual, no
entanto, as questões visuais podem ser colocadas de lado. O foco da pesquisa é
na voz do falante a ser reconhecido.
34
4º Colóquio Brasileiro de Prosódia da Fala
Além de modificações impostas pelo canal externo, algumas
características que tornam nossas vozes diferentes correspondem a diferenças
na anatomia resultante de consequências de patologias relacionadas ao
funcionamento do trato vocal, de atos articulatórios involuntários, de
características sociais, de diferenças educacionais, do uso particular da língua
(idioleto), entre outros. Até estados emocionais diferenciam as vozes (a raiva,
por exemplo, gera tensão na laringe, que traz uma voz “soprosa”, irregular). Por
isso, há uma dificuldade de associar padrões de fala do mesmo sujeito ao
próprio sujeito.
Esta pesquisa segue os padrões, etapa por etapa, de como uma análise
forense deve ser feita. O primeiro passo, depois de extraídos todos os
parâmetros acústicos das gravações (para cada vogal oral) é diminuir o número
de “suspeitos” em categorias de características semelhantes ao “criminoso”.
Incluimos falantes de outros dialetos do PB para que esse fator possa ser usado
no afastamento ou aproximação dos falantes (“suspeitos”) do “criminoso”.
A técnica utilizada para este trabalho é a auditiva acompanhada de
análise acústica via programa de software especializado. Utilizando o software
PRAAT1 para medir parâmetros acústicos, será feito um quadro com as
características de cada sujeito, comparando com os dados de uma gravação
feita em laboratório (com alta relação sinal-ruído, portanto) de um deles
(sorteado sem que a pesquisadora saiba).
Depois disto realizado, é analisado, estatisticamente, cada parâmetro
acústico dos falantes (inclusive do sujeito gravado em laboratório, o
“criminoso”) no programa R, calculando o p-valor (probabilidade de aceitação
da hipótese nula), com o teste estatístico ANOVA, entre cada sujeito e o
“criminoso”. Com isso, é decido quais dos participantes está mais próximo ao
“criminoso”.
Os parâmetros acústicos analisados serão: frequências dos dois
primeiros formantes das vogais orais, a frequência fundamental, a duração de
unidades do tamanho da sílaba e da vogal, a intensidade relativa (ênfase
espectral), a frequência fundamental de base de cada sujeito, a taxa de
movimento de formantes e o ? C (desvio padrão de durações de intervalos
consonânticos)
Em muitas situações forenses cientistas têm em suas mãos, como
material de avaliação, escutas telefônicas, em sua grande maioria de péssima
1
http://www.fon.hum.uva.nl/praat/
35
Caderno de Resumos
qualidade e sendo a única fonte sonora para extrair parâmetros e apresentar
algum resultado substancial para o júri. Como esta pesquisa usa de situações
reais para se aproximar da Fonética Forense simulamos um episódio de “crime”
com escuta telefônica.
Para este tipo de trabalho, é bem comum a análise de propriedades
acústicas como a de características de filtro de banda, porém pouco se estuda
sobre o efeito deste para os parâmetros de fala.
A complexidade da análise de gravações de escuta telefônica é algo que
os pesquisadores já se deparam há algum tempo. Bellman et al, (1994) discutem
uma revisão do próprio trabalho cujas gravações originais são da década de
1980, com o objetivo de tentar determinar as diferenças dialetais geradas
(devido à degradação de sinal, que hoje se apresenta ainda mais
significantemente com a presença da tecnologia GSM para celulares.
Alguns efeitos de telefone foram evidenciados por Byrne & Foulkes
(2004) e que presenciamos nesta pesquisa; uma degradação ao sinal de fala das
gravações coletadas: efeitos do ambiente, efeitos do falante e efeitos técnicos.
Enfrentamos todos esses problemas na pesquisa, tendo como
conhecimento alguns dos obstáculos e desafios que este tipo de gravação pode
causar.
De acordo com dados analisados intra-falantes, com um sujeito da
pesquisa, o parâmetro acústico que menos é afetado pelo celular é o segundo
formante (F2).
F2
Rate
F0
Baseline Ênfase
F2
Espectral
1,88E- 0.3138 1,85E- 1.58e2.2e-16
05
03
07
Tabela 1: Resultado do teste ANOVA entre gravações de celular e por gravador do sujeito 1.
Esta pesquisa é feita com intuito de aprender procedimentos
experimentais que possam ser automatizados (através de procedimentos nos
softwares PRAAT e R) e servir à área de Fonética Forense.
Levantamos questões como (i) quais parâmetros acústicos são eficazes
para a verificação de locutor? (ii) Os mesmos são eficazes em uma situação
forense? Por isso duas situações de degradação serão utilizadas, entrevista ao ar
36
4º Colóquio Brasileiro de Prosódia da Fala
livre e gravação via celular. (iii) Quão robustos são os parâmetros analisados
entre as situações? (iv) As técnicas de análise estatística escolhidas são eficazes
para a verificação do sujeito?
Com base nisso, propomo-nos, neste trabalho, avaliar os seguintes
parâmetros acústicos das vogais orais para avaliação de diferenças/
semelhanças entre indivíduos: frequências dos dois primeiros formantes das
vogais orais, a frequência fundamental, a duração de unidades do tamanho da
sílaba e da vogal, a intensidade relativa (ênfase espectral), a frequência
fundamental de base de cada sujeito, a taxa de movimento de formantes e o ? C
(desvio padrão de durações de intervalos consonânticos). Também lidamos
com outras formas de gravações para análise, simulando uma situação de escuta
telefônica, procurando aproximar a pesquisa à realidade forense.
Referências
Bellmann, G., Herrgen, J. & Schmidt, J. E. 1994–99. Mittelrheinischer Sprachatlas
(MRhSA), Band 13: Vokalismus. Tübingen.
Byrne, C. & Foulke, P. 2004. The 'Mobile Phone Effect' on Vowel Formants.
Pardo, J. S., & Remez, R. E. 2006. “The perception of speech”. In M. Traxler and M. A.
Gernsbacher (Eds.), Handbook of Psycholinguistics, 2nd Edition (pp. 201-248).
New York: Academic Press. pdf D. B. Pisoni and R. E. Remez (Eds.), The Handbook
of Speech Perception. Oxford: Blackwell.
37
Caderno de Resumos
O apagamento do rótico no português brasileiro e no
português europeu: o lido e o dito
1
2
Aline de Jesus Farias Oliveira e Ingrid da Costa Oliveira
3
4
Orientadores: Dinah Callou e Carolina Serra
1
Universidade Federal do Rio de Janeiro/FAPERJ, Brasil
2
Universidade Federal do Rio de Janeiro/PIBIC, Brasil
3
Universidade Federal do Rio de Janeiro/CNPq, Brasil
4
Universidade Federal do Rio de Janeiro, Brasil
[email protected], [email protected], [email protected],
[email protected]
Os róticos são conhecidos por sua considerável variabilidade entre as
línguas do mundo. Neste trabalho, será focalizado o apagamento variável do R,
em posição de coda silábica final, através da comparação entre fala espontânea
e leitura,com base em amostrasde fala espontânea -- entrevistas informais -- e
deleitura de trechos extraídos dessas entrevistas, realizadas com indivíduos
cultos, nascidos no Rio de Janeiro e em Lisboa. Os registros magnetofônicos
foram feitos em três etapas. A primeira etapa corresponde à gravação da fala
espontânea produzida por dez informantes do sexo feminino da primeira faixa
etária (25 a 35 anos), sendo cinco informantes oriundos do Rio de Janeiro/BR e
cinco de Lisboa/PT. Em seguida, na segunda etapa, os próprios falantes
realizaram a pontuação da transcrição de seus trechos de fala com o auxílio do
áudio de sua entrevista e, por último, numa terceira etapa, foi feita agravação de
leitura da transcrição grafemática da fala espontânea pelos seus respectivos
locutores. As entrevistas com os informantes cariocas foram realizadas neste
ano de 2013 e as realizadas com os informantes lisboetas, entre 2007 e 2008.
O objetivo deste trabalho é 1) estabelecer um confronto das elocuções,
nesses dois estilos de fala -- espontânea e leitura --, a partir da hipótese de que
esses estilos de fala envolvem processos específicos distintos, e 2) verificar se
os resultados obtidos em trabalhos anteriores, para a fala espontânea, se
confirmam na leitura.
38
4º Colóquio Brasileiro de Prosódia da Fala
Na análise do processo de apagamento do R, é necessário considerar os
contextos em que ocorre o segmento -- coda externa ou interna à palavra -- e seu
tipo de realização -- [+/-vibrante] e [+/- anterior]: o apagamento do segmento é
mais frequente em posição de coda final que em posição de coda medial e o
fenômeno ocorre de forma menos expressiva nos dialetos em que a consoante
mantém ainda o seu caráter de vibrante ápico-alveolar (Callou, Leite & Moraes
1996, Monaretto 2010, Leite 2011). Estudos recentes (Callou & Serra 2012)
demonstraram que o apagamento do R em posição de coda final apresenta, na
sua implementação, além de condicionamentos morfo-fonológicos e sociais,
também condicionamentos prosódicos. No Português Brasileiro,observou-se
que, na fala espontânea, o processo de apagamento do segmento em coda final é
gradiente e os dialetos que mantêm a realização anterior da vibrante, em outras
posições, apresentam uma frequência mais baixa de cancelamento, como
mencionado, enquanto os dialetos cuja norma de pronúncia é a fricativa velar
estão numa posição intermediária. Dialetos que realizam o R como uma
fricativa laríngea (aspiração) estão no outro extremo, com índices
significativos de apagamento do segmento em posição de coda final. Investigase ainda a relação entre presença/ausência de R e fronteira prosódica (Selkirk
1984, Nespor & Vogel 1986/2007): quanto mais alta a fronteira maior a
tendência à preservação, o que poderia explicar a diferença de índices
diferenciados de apagamento em fronteira interna e externa à própria palavra
(Callou & Serra 2012). Em relação ao PB, as análises têm revelado que, em
termos gerais, (i) a fronteira de sintagma entonacional (IP) desfavorece a queda
do segmento; (ii) há um processo gradual de apagamento; e (iii) da década de
1970 para a de 1990, mesmo a fronteira mais alta de IP não mais inibe o
apagamento do segmento, pelo menos, na faixa mais jovem, de 25 a 35 anos. A
análise alia, portanto, o aparato teórico-metodológico da sociolinguística
quantitativa laboviana (Labov 1994) ao da teoria da hierarquia prosódica
(Selkirk 1984, Nespor & Vogel 1986/2007). O fato de serem observados altos
índices de apagamento do segmento em final de vocábulo em contraste com os
baixos valores de apagamento no interior de vocábulo tem levado à
interpretação de que o fenômeno de apagamento do R estaria relacionado com o
tipo de fronteira prosódica em que este segmento se encontra. Em variedades
como as do Nordeste do Brasil, entretanto, em que o apagamento do R em coda
final já é categórico, pelo menos entre os indivíduos mais jovens (Serra &
Callou 2012), o tipo de fronteira prosódica já não é mais um fator atuante, em
final de palavra, e o cancelamento já atinge, inclusive, a coda silábica interna à
palavra. Levando em conta que o apagamento se caracteriza como um processo
39
Caderno de Resumos
gradiente, sensível ao tipo de realização do rótico -- por sua vez, diretamente
relacionado à origem geográfica dos falantes --, à classe morfológica do item
lexical e ao tipo de fronteira prosódica em que o segmento se encontra, é
possível postular três regras, de caráter regional, que mapeariam o
cancelamento do R no Português do Brasil: 1) regra categórica de apagamento
sensível à classe morfológica, como em Porto Alegre 2) regra variável de
apagamento, como no Rio de Janeiro e 3) regra categórica de apagamento, que
atua, independentemente de classe morfológica, em variedades em que a
realização frequente é uma fricativa posterior, laríngea – aspiração, como em
Salvador e João Pessoa. A hipótese é a de que, na leitura, em que o planejamento
e a produção da fala não são realizados simultaneamente, a preservação do
segmento seja mais frequente. Os resultados relativos ao PB são confrontados
com novos dados do português europeu (PE), variedade em que a articulação
posterior do Ré atestada há muito tempo, embora as etapas relativas à aspiração
e cancelamento do rótico sejam até certo ponto inibidas e o cancelamento esteja
restrito ainda à fronteira de palavra. A frequência geral de apagamento, entre
jovens adultos, no PB (90%) e no PE (30%), mostra ainda que em um processo
quase completo, como o do português brasileiro, a variável gênero é neutra,
enquanto em um processo novo e vigoroso, como o do português europeu,
gênero é uma variável significativa, tal como atestado em Labov (1994: 65), a
propósito da estratificação de mudanças sonoras. Neste trabalho, estendemos a
análise a um novo conjunto de dados, cotejando fala espontânea e leitura, nas
duas variedades do português supramencionadas, a fim de verificar em dados
recentes de diferentes estilos de fala quais são os condicionamentos atuantes
nesse processo de diferenciação do rótico em posição de coda silábica final.
Referências
Monaretto, V. 2010. “Descrição da vibrante no português do sul do Brasil”. In: Bisol,
L.; Collischonn, G. (Orgs). Português do Sul do Brasil. Porto Alegre: EDIPUCRS:
119-127.
Leite, C. M. B. 2011. “Estudo do /R/ em coda silábica medial e final no falar
campineiro”. In: Anais do VII Congresso Internacional da Abralin ISSN 21797145.
Curitiba.
Callou, D., Leite, Y. & MORAES, J. 1996. “Variação e diferenciação dialetal: a
pronúncia do /r/ no português do Brasil.” In Gramática do Português Falado VI (I):
465-493. Campinas: UNICAMP.
40
4º Colóquio Brasileiro de Prosódia da Fala
Callou, D. & Serra, C. 2012. “Variação do rótico e estrutura prosódica”. Revista do
GELNE, 14 (Especial): 41-58.
Nespor, M. & Vogel, I. 2007. Prosodic phonology. Berlin: Mouton De Gruyter.
Originally published in 1986 (Dordrecht: Foris).
Labov, W. 1994. Principles of linguistic change. Internal factors. Cambridge,
Blackwell.
Serra, C. & Callou, D. 2012. “A interrelação de fenômenos segmentais e prosódicos:
confrontando três comunidades.” In XXVIII Encontro Nacional da APL,
Universidade do Algarve.
Selkirk, E. 1984. Phonology and syntax: the relation between sound and structure.
Cambridge: M.I.T. Press
41
Caderno de Resumos
Pelos cantos do Brasil: uma análise prosódica da
asserção neutra em falares das capitais e do interior do
Brasil
Aline Ponciano dos Santos Silvestre, Gizelly Fernandes Maia dos
Reis, Priscila Francisca dos Santos
Universidade Federal do Rio de Janeiro, Brasil
[email protected], [email protected]
[email protected]
1. Introdução
Sob a ótica de diversas teorias, o padrão assertivo neutro é comumente
caracterizado por uma altura melódica média na porção inicial e medial do
enunciado e por uma queda da freqüência fundamental na última sílaba tônica
do sintagma entoacional. Verifica-se também uma queda moderada e constante
da frequência fundamental (F0) ao longo das asserções, chamada linha de
declinação, que por vezes é interrompida na última sílaba pré-tônica (a qual
recebe entoação ascendente), de forma a conferir maior destaque à posterior
queda melódica localizada na tônica final (cf. Moraes 1998; Cunha, 2000).
Considerando o anteriormente postulado por outros autores como
padrão para o Português do Brasil, o presente trabalho objetiva descrever a
variação regional da entoação em enunciados assertivos neutros, com base nos
falares de municípios brasileiros que são contemplados pelo Projeto Atlas
Linguístico do Brasil.
Serão apresentados os resultados da dissertação de Silvestre (2012), que
descreve o contorno melódico da asserção neutra em 25 capitais brasileiras; os
resultados da investigação feita por Dos Reis (2010, 2011), que descreve o
contorno melódico das asserções nos municípios de Brejo, Bacabal, Imperatriz
e Alto Parnaíba, localizados no interior do estado do Maranhão; e os resultados
obtidos por Santos (2012) sobre a asserção neutra em Soure, município
localizado no interior do estado do Pará. Assim, a descrição dos contornos
melódicos de enunciados assertivos produzidos por informantes de municípios
do interior do Brasil vem somando-se à descrição dos contornos já descritos
para 25 capitais.
42
4º Colóquio Brasileiro de Prosódia da Fala
2. Corpus e metodologia
A fim de conhecer as realizações fonéticas das asserções neutras nas
variedades do PB, fez-se, nas capitais, uma descrição melódica de 500 dados
selecionados do corpus do projeto ALiB que esboçam esse tipo de modalidade.
Para os municípios do interior maranhense, foram descritos 50 dados extraídos
do mesmo corpus e, para o município do interior paraense, descreveram-se 80
dados. Foram ouvidos quatro informantes por localidade, distribuídos
equitativamente por duas faixas etárias - 18 a 30 anos e 50 a 65 anos.
Para análise, os dados devem se enquadrar nas seguintes condições: a)
constituir um único sintagma entoacional (I), de acordo com a hierarquia
prosódica apresentada em Nespor e Vogel (1994); b) possuir pronúncia neutra,
isto é, ausente de manifestações emocionais ou atitudinais; e c) possuir uma
qualidade sonora adequada para a segmentação silábica e medição dos valores
da Frequência Fundamental. Além disso, a fim de homogeneizar o padrão
acentual e facilitar a observação das marcas regionais apresentadas por meio da
variação da F0, selecionamos os dados que continham o acento na penúltima
sílaba do enunciado (padrão paroxítono). Este padrão é priorizado por
possibilitar a observação do comportamento da frequência fundamental nas
sílabas átonas que estão em posição adjacentes à última tônica de I.
A fim de iniciar o enriquecimento da análise a partir da observação de
outros padrões acentuais, no município de Soure foram analisados 40
enunciados monossílabos, tônicos ou átonos. Deste modo, poderá ser também
investigado em que medida o tamanho dos enunciados afeta a configuração do
contorno entoacional.
O programa computacional PRAAT foi utilizado para segmentar e medir
os valores da F0 nas sílabas e a interpretação dos dados teve por suporte teóricometodológico o modelo autossegmental e métrico, na linha do que propõem
Pierrumbert (1980) e Ladd (2008).
3. Resultados
Os resultados indicam que o índice de regionalidade é manifestado na
relação entre as alturas do acento pré-nuclear e do acento nuclear – há
localidades que se diferenciam por possuir tons mais proeminentes no acento
pré-nuclear - e entre os movimentos de F0 nas sílabas que compõem o acento
nuclear – não há declive da F0 na tônica de todas as asserções. Nas capitais,
foram três os padrões encontrados.
43
Caderno de Resumos
O primeiro, observado nas capitais do norte e nordeste do país, é relativo à
realização de um tom alto na primeira sílaba tônica de I (no acento pré-nuclear),
tom este que se apresenta nas sílabas adjacentes e prossegue à sílaba pretônica
do acento nuclear, ficando o movimento descendente restrito às sílabas tônica e
postônica final:
Figura1:Enunciado Você está me devendo quinhentos reais,
produzido pelo informante da segunda faixa etária de Maceió
Ao padrão observado nas capitais nortistas e nordestinas, atribui-se a
mesma notação que Cunha (2005) propôs para a asserção neutra em Recife,
com base no corpus do projeto NURC: H*___H+L*L%.
O segundo padrão, observado majoritariamente nas capitais do centrooeste e sudeste do país, também apresenta tom alto na primeira sílaba tônica do
enunciado, contudo este tom não se manifesta nas sílabas adjacentes e só é visto
de novo na sílaba pré-tônica do acento nuclear, dando vez ao movimento
descente final:
Figura2: Enunciado o sol tá nascendo, produzido pela
informante jovem do Rio de Janeiro
44
4º Colóquio Brasileiro de Prosódia da Fala
Para o padrão majoritariamente observado nas capitais do centro-oeste e do
sudeste do Brasil, atribui-se notação semelhante a de Cunha (2005) e Moraes
(2008) para a asserção neutra, ambos com base na fala carioca: L+H*____
H+L*L%.
O terceiro padrão, por fim, foi encontrado nas capitais da região Sul do país e
é particularmente caracterizado por uma subida melódica da F0 na sílaba tônica
do acento nuclear, dando à asserção um contorno final aparentemente
circunflexo:
Figura 3:Enunciado Manda pelo correio,
produzida pelo informante jovem de Porto Alegre
Ao padrão encontrado nas capitais sulistas, atribui-se notação também
semelhante a de Cunha (2005), com base na fala gaúcha :
L+H*_____L+H*L%.
Em comparação às demais regiões, o norte e o nordeste apresentaram um
maior número de enunciados cujo pico do acento pré-nuclear encontra-se em
um nível mais alto que o pico do acento nuclear; e o sul apresentou um maior
número de dados em que o movimento descendente não predominou na última
sílaba tônica do enunciado.
Quanto aos municípios do interior do Maranhão, encontramos um nível tonal
alto no acento pré-nuclear nos quatro municípios, o que corrobora o observado
na capital maranhense. No entanto, também foi possível encontrar um nível
tonal baixo na configuração do acento pré-nuclear em Imperatriz e Alto
Parnaíba, o que nos mostra que a ocorrência de um padrão não exclui a
possibilidade da ocorrência de outro.
Para o município do interior do Pará, os resultados mostram que os
enunciados cujo acento se encontra na penúltima sílaba apresentaram mais
frequentemente um contorno marcado por uma descida, a qual é mais
45
Caderno de Resumos
acentuada entre a sílaba pretônica e a sílaba tônica. Esse comportamento pode
ser representado pelo padrão H L*L%, como descrito por outros autores para a
asserção neutra no Português do Brasil. Quanto aos enunciados que possuíam
um monossílabo no acento nuclear, embora haja pouco material segmental, os
resultados também se alinharam ao comportamento caracteristicamente
descrito para a asserção neutra: um início com uma altura melódica média e um
movimento decrescente no final, representado pela notação: HL%.
4. Conclusão
O movimento descendente final, já anteriormente descrito como padrão
para o Português do Brasil, é predominante. Na região Sul do país, contudo, o
acento nuclear da asserção neutra foi predominantemente caracterizado por um
movimento de aparência circunflexa: a F0 ascende na sílaba tônica final e o
movimento de queda fica restrito à última sílaba pós-tônica do sintagma
entoacional.
Nossos resultados encontrados para as capitais do país alinham-se a
resultados de outras descrições, feitas por diversos autores, como Cunha
(2000), Lira (2009), Reis, Antunes e Pinha (2011), Nunes (2011). Além disso, o
observado até o momento em capitais do interior do país corrobora o
encontrado nas capitais.
Referências
Cunha, C. S. 2000. Entoação regional no português do Brasil. Tese de doutoramento em
língua portuguesa. Rio de Janeiro, Faculdade de Letras, UFRJ.
_______. 2005. “Corpus ALiB: uma base de dados para pesquisas atuais e futuras”. In
CUNHA, C. S. (org.). Estudos geo-sociolinguísticos. Rio de Janeiro: Programa de
Pós Graduação em Letras Vernáculas, UFRJ: 67- 81.
Cruz, R. 2007. “Atlas prosódico multimédia do Português do Norte do Brasil: aspectos
preliminares” In Moutinho, L. C. & Coimbra R. L. (Org.). I Jornadas Científicas
AMPER-POR: 33-39. Actas, Aveiro.
Ladd, R. 2008. Intonational phonology. Cambrige: Cambridge University Press.
Lira, Z. 2009. A entoação modal em cinco falares do nordeste brasileiro. Tese de
doutoramento em linguística. João Pessoa, Centro de Ciências Humanas, Letras e
Artes, UFP.
46
4º Colóquio Brasileiro de Prosódia da Fala
Moraes, J. A. 1998. “Intonation in Brazilian Portuguese”. In Hirst, D.; Di Cristo, A.
(Eds.) Intonation systems: a survey of twenty languages: 179-194. Cambridge:
Cambridge University Press.
Moraes, J. A. & Colamarco, M. 2008. Accomodation of intonational patterns in126
Brazilian Portuguese short utterances: compression or truncation? In Bisol, L. &
Brescancini, C. (org.). Contemporary phonology in Brazil: 2-21. Cambridge:
Cambridge Scholars Publishing.
Nespor, M.; Vogel, I. 1994. La prosodia. Madrid: Visor Distribuciones.
Pierrehumbert, J. 1980. The phonology and phonetics of English intonation. PhD
Thesis. Massachussets: M.I.T.
Silvestre, A.P.S. 2012. A entoação regional de enunciados assertivos nos falares das
capitais brasileiras. Dissertação de mestrado em Língua Portuguesa. Rio de Janeiro,
Faculdade de Letras, UFRJ.
47
Caderno de Resumos
Restrições prosódicas para os marcadores discursivos
Amanda Aleixo¹; Diego Malachias;¹ Priscila Osório¹; Tommaso Raso¹
¹Laboratório de Estudos Empíricos da Linguagem, Faculdade de
Letras; Universidade Federal de Minas Gerais; Brasil
[email protected], [email protected], [email protected],
[email protected]
Este trabalho tem como objetivos:
1. mostrar como identificar os Marcadores Discursivos (MD) na fala
espontânea através de fatores prosódicos;
2. mostrar como identificar a função desempenhada pelos MD através de
parâmetros prosódicos.
Os MDs tradicionalmente são definidos como itens lexicais:
1. não composicionais semântica e sintaticamente com o resto da
locução;
2. que perdem seu valor lexical para adquirir um outro valor, definido
pragmaticamente;
3. com distribuição livre.
Mas nenhuma proposta identifica quando um item lexical funciona como
MD e porque. Do mesmo jeito, não existe acordo na literatura sobre quantas e
quais seriam as funções dos MDs, e como identificar essas funções (Fischer
2006; Schourup 1999; Traugott 2007).
Este trabalho se baseia em dados extraídos de dois corpora comparáveis
de fala espontânea: o C-ORAL-BRASIL (Raso-Mello 2012) e o C-ORALROM (Cresti-Moneglia 2005); foram analisados os dois minicorpora
etiquetados informacionalmente retirados dos corpora italiano e brasileiro
(Cresti-Raso 2012) através da base de dados IPIC (Panunzi-Gregori 2012;
Gregori-Panunzi 2012). Os corpora foram segmentados em enunciados
(definidos como as unidades mínimas interpretáveis pragmaticamente em
autonomia) e unidades tonais. A validação da segmentação mostrou um acordo
Kappa de 0.86 (Mello et al. 2012).
Com base na Teoria da Língua em Ato (Cresti 2000; Moneglia 2011;
Raso 2012), a cada unidade tonal corresponde uma unidade informacional.
48
4º Colóquio Brasileiro de Prosódia da Fala
Cada enunciado possui obrigatoriamente uma unidade nuclear, o comentário,
que veicula a força ilocucionária (e, portanto a interpretabilidade do
enunciado), e outras unidades opcionais. Essas outras unidades podem ser de
natureza textual (tópico, apêndices, parentético e introdutor locutivo) ou de
natureza dialógica. As unidades dialógicas correspondem exatamente aos que
tradicionalmente são chamados de MDs: não constroem o texto do enunciado
propriamente dito (não são composicionais), mas servem para regular a
interação.
A não composicionalidade é marcada por uma quebra prosódica antes e
depois de cada unidade dialógica, que portanto fica dentro de uma unidade
tonal dedicada (que não hospeda nenhum outro item). A quebra prosódica,
interrompendo a linearidade, impede a relação sintática. Assim, um item lexical
pode ter três tipos de realizações: a) constituir a ilocução; nesse caso é
interpretável pragmaticamente em isolamento; b) ser parte de unidade textual;
nesse caso possui composicionalidade com outros itens da unidade; 3)
constituir uma unidade dialógica; nesse caso não possui composicionalidade
com o resto do enunciado e não é interpretável em isolamento.
Um exemplo que poderia ser apreciado facilmente na oitiva é o item não
nas três seguintes realizações (precedidas pela sigla do texto, número do
enunciado e sigla do informante):
1) bpubdl01-14: *PAU: não //
Nesse caso, não possui força ilocucionária (recusa) e é interpretável em
isolamento.
2) bpubdl01-119: *PAU: ah / não acaba não / acaba //
Nesse caso, não é composicional com o verbo.
3) bpubdl01-197: *PAU: ah / não / ea disse que é pa ficar / por algum
tempo //
Nesse caso, não é isolado dentro de uma unidade tonal por duas quebras
que interrompem a linearização e, portanto a composicionalidade; não é
possível interpretar o não em isolamento, já que a unidade não é ilocucionária.
A interpretabilidade em isolamento é veiculada pela prosódia, cujos
parâmetros geram a percepção da força ilocucionária. A quebra prosódica
interrompe a composicionalidade. Por isso é a prosódia que permite a
49
Caderno de Resumos
identificação dos MDs. Mas a prosódia é responsável também por veicular as
diferentes funções dos MDs.
Nos minicorpora etiquetados, de aproximadamente 32.500 palavras e
5000 enunciados cada um, foram identificados 1089 MDs no PB e 1419 MD no
italiano, correspondentes, respectivamente a 3,47% e 4,14% das unidades
informacionais. Foi possível diferenciar os MDs em 6 grupos (Raso, no prelo)
que possuem características funcionais diferentes veiculadas através de
características prosódicas. Cada grupo apresenta também um comportamento
distribucional diferente.
1. Incipitários (Figura 1). Funções: tomar o turno ou começar um
enunciado marcando o contraste afetivo (não lógico) com respeito ao
enunciado anterior. Essas unidades se posicionam obrigatoriamente em
posição inicial de enunciado. Características prosódicas: perfil de F0
ascendente-descendente com valores de F0 muito altos; duração curta;
intensidade alta; taxa de variação de F0 muito alta. Frequentes em italiano, mas
raros em PB.
Figura 1
2. Conectores Textuais (Figura 2). Função: começar um enunciado
marcando continuidade com o anterior. Essas unidades se posicionam
obrigatoriamente em início de enunciado. Características prosódicas: perfil de
F0 ascendente com valores de F0 médio-altos; duração longa; intensidade alta;
taxa de variação de F0 baixa. Frequente em ambas as línguas. A unidade é
preenchida por preposições, conjunções e advérbios.
50
4º Colóquio Brasileiro de Prosódia da Fala
Figura 2
3. Conativo (Figura 3). Função: pressionar o interlocutor a fazer ou
desistir de algo. A posição é livre, mas preferencialmente inicial ou final.
Características prosódicas: perfil descendente; duração média ou curta;
intensidade alta. Raro em ambas as línguas. O exemplo mostra 2 conativos em
sucessão.
Figura 3
51
Caderno de Resumos
4. Alocutivo. Função: identificar o interlocutor mas principalmente
marcar a coesão social através de nomes próprios, adjetivos e hepítetos.
Distribucionalmente é livre, mas cada língua prefere posições diferentes.
Características prosódicas: perfil descendente; duração curta; intensidade
baixa. A frequência varia nas línguas: em PB é muito frequente, em italiano é
relativamente pouco frequente, em espanhol europeu é frequente, em PE a
frequência aparentemente é muito baixa (Raso-Leite, 2010). O alocutivo não
deve ser confundido com a ilocução de chamamento, que possui características
prosódicas muito diferentes. As figuras 4 e 5 mostram respectivamente uma
ilocução e um alocutivo realizados com o mesmo conteúdo locutivo (Rena)
pelo mesmo falante:
Figura 4
Figura 5
52
4º Colóquio Brasileiro de Prosódia da Fala
5. Fático. Função: sinalizar a abertura do canal. Distribucionalmente é
absolutamente livre. È a unidade mais frequente em todas as línguas analisadas.
Características prosódicas: perfil descendente ou nivelado; duração curta ou
muito curta; intensidade baixa. A figura 6 mostra um exemplo na segunda
unidade segmentada (né). Nesse exemplo se observa também o típico perfil do
incipitário na primeira unidade segmentada:
Figura 6
6. Expressivo (Figura 7). Funções: tomar o turno e apoiar
emocionalmente a ilocução; a distribuição é livre mas cerca de 70% das
unidades está em posição inicial em ambas as línguas. Características
prosódicas: perfil modulado ou ascendente com taxa de variação de F0 baixa;
duração média; intensidade média. A unidade é muito frequente em PB e pouco
Figura 7
53
Caderno de Resumos
Essas características mostram que:
1. a função do MD é veiculada através de características prosódicas
próprias;
2. nem sempre o MD possui distribuição livre;
3. nem sempre o léxico perde seu valor semântico. Isso não acontece
nos alocutivos e acontece parcialmente nos conectores textuais.
A validação estatística está em curso. Esse processo é complexo porque
deve diferenciar 6 objetos com base na combinação de pelo menos 3 parâmetros
acústicos que são medidos e avaliados com relação aos parâmetros da ilocução
presente no enunciado. Na fala espontânea os enunciados são realizados com
uma variação prosódica muito grande, e uma determinada unidade só pode ser
avaliada pelo papel relacional que desempenha no contexto do seu enunciado.
A ilocução é o único termo de comparação possível porque é o único elemento
presente em todos os enunciados. Contudo, também a ilocução varia
prosodicamente. Além disso, vários enunciados devem ser descartados porque
a presença de sobreposição ou a qualidade acústica não permitem uma
mensuração confiável.
Referências
Cresti, E. 2000. Corpus di Italiano parlato. Firenze: Accademia della Crusca, 2 vol.
Cresti, E.; Moneglia, M. (Ed.). 2005. C-ORAL-ROM: integrated reference corpora for
spoken Romance languages. Amsterdam: John Benjamins.
Cresti, E.; Raso, T. 2012. Information Tagging of the Italian Corpus and the Brazilian
Minicorpus. Disponível em: http://lablita.dit.unifi.it/ipic/.
Fischer, K. (Ed.). 2006. Approaches to discourse particles: studies in pragmatics 1.
Bingley: Emerald Group Publishing.
Gregori, L.; Panunzi, A. 2012. “DBIPIC: An XML database for information patterning
analysis”. In: H. Mello; M. Pettorino; T. Raso. Proceedings of the GSCP 2012.
Speech and Corpora.
Mello, H.; Raso, T.; Mittmann, M.; Vale, H..; Cõrtes, P. O. 2012. “Transcrição e
segmentação prosódica do corpus C-ORAL-BRASIL: critérios de implementação e
validação”. In: T. Raso; H. Mello (Eds.). C-ORAL-BRASIL I: Corpus de referência
do português brasileiro falado informal. Belo Horizonte: UFMG.
Moneglia, M. 2011. “Spoken corpora and pragmatics”. Revista Brasileira de
Linguística Aplicada.
Panunzi, A.; Gregori, L. 2012. “An XML model for multi-layer representation of
spoken Language”. In H. Mello; A. Panunzi; T. Raso. (Eds.). Illocution, modality,
54
4º Colóquio Brasileiro de Prosódia da Fala
attitude,information patterning and speech annotation. Firenze: Firenze University
Press.
Raso, T. 2012. “O corpus C-ORAL-BRASIL”. In: T. Raso; H. Mello (Eds.). C-ORALBRASIL I: Corpus de referência do português brasileiro falado informal. Belo
Horizonte: UFMG.
Raso, T. Prosodic Constraints for Discourse Markers. In: Raso, T.; Mello, H. Speech
Corpora and Linguistic Studies. Amsterdam-New York: John Benjamins,
Forthcoming.
Raso, T.; Leite, F. 2010. Estudo contrastivo do uso de alocutivos em italiano, português
e espanhol europeus e português brasileiro. Domínios de Lingu@gem.
Raso, T.; Mello, H. (Eds.). 2012. C-ORAL-BRASIL I. Corpus de referência do
português brasileiro falado informal. Belo Horizonte: UFMG.
Schourup, L. 1999. “Discourse markers”. Lingua.
Traugott, E. C. 2007. “Discourse markers, modal particles, and contrastive analysis,
synchronic and diachronic”. Catalan Journal of Linguistics.
55
Caderno de Resumos
56
4º Colóquio Brasileiro de Prosódia da Fala
57
Caderno de Resumos
58
4º Colóquio Brasileiro de Prosódia da Fala
59
Caderno de Resumos
Características prosódicas de sete dialetos brasileiros
Ana Carolina Constantini1, Plinio Almeida Barbosa1
1
Departamento de Linguística/IEL/Universidade Estadual de
Campinas/Brasil
[email protected], [email protected]
O objetivo deste trabalho é descrever e comparar características
prosódicas de sujeitos de diferentes localidades brasileiras. A prosódia
contribui para caracterizar diferentes dialetos e é pouco estudada quando se
busca encontrar diferenças inter-dialetais. A divisão dialetal brasileira mais
conhecida é de Nascentes (1953), um trabalho importante para a área, que usa
uma linha horizontal para dividir o Brasil, separando Norte e Sul em dois
grupos: Meridional e Setentrional. Nascentes baseou-se na abertura das vogais
pré-tônicas e na “cadência” do falar das regiões brasileiras para essa divisão.
Em 1986, Cardoso estudou mapas dialetológicos do estado da Bahia e
confirmou que a divisão proposta por Nascentes estava adequada para aquela
região.
Visto que a divisão das regiões dialetais que temos como base até os dias
de hoje é impressionística, é importante analisar aspectos prosódicos que
possam caracterizar diferentes dialetos brasileiros. Foram analisados oito
parâmetros acústicos em amostras de fala de 35 sujeitos de sete localidades
brasileiras: Região Norte (2 sujeitos, estado do Amazonas), Região Nordeste
(Ceará, Rio Grande do Norte, Paraíba, Pernambuco e Sergipe, totalizando 6
sujeitos), São Paulo (6 sujeitos), Minas Gerais (6 sujeitos), Paraná (4 sujeitos),
Rio de Janeiro (6 sujeitos) e Distrito Federal (5 sujeitos). As amostras de fala
são de um banco de dados da Polícia Federal de Brasília. As gravações são de
oficiais da PF, sexo masculino, idade média de 35,4 anos. Para inclusão na
pesquisa os sujeitos precisavam ter nascido e morado até a idade adulta na
mesma região. O grau de escolaridade variou de ensino superior completo até
pós-graduação completa. Os sujeitos da Região Nordeste (NE) não foram
rotulados pelos seus estados de origem (como as outras regiões), pois a hipótese
é que os diferentes estados da Região Nordeste (exceto a Bahia) possuem as
60
4º Colóquio Brasileiro de Prosódia da Fala
mesmas características prosódicas, fato confirmado pelos desvios-padrão
obtidos dos parâmetros analisados: a Região Nordeste apresentou menor ou
igual variabilidade intra-dialeto que outras regiões dialetais estudadas.
As gravações foram segmentadas em unidades do tamanho da sílaba
guiadas pelo início da vogal (unidade VV) com auxílio do script BeatExtractor
(Barbosa 2006). Após etiquetagem dessas unidades, o script
ProsodicDescriptorExtractor (Barbosa 2011) foi utilizado para extrair oito
medidas acústicas: taxa de elocução (unidades VV/s), média de z-score
suavizado de duração de unidade VV, desvio-padrão de z-score suavizado de
duração de unidade VV, assimetria de z-score suavizado de duração de
unidade VV, taxa de saliência duracional (picos de z-score/s), mediana da
frequência fundamental (Hz), ênfase espectral (dB) e taxa de unidades VV não
proeminentes/s.
Utilizamos o teste One-Way Anova (nível de significância 0,05) para
analisar diferenças entre as regiões. Ao serem atestadas diferenças entre os
grupos, utilizamos o Teste Tukey (p<0,05), para checar entre quais grupos
estavam as diferenças apontadas.
A partir de testes de ANOVA com fator DIALETO e testes post-hoc
TukeyHSD, os parâmetros ênfase espectral e mediana da frequência
fundamental foram os que melhor diferenciaram as regiões. Para ênfase
espectral, os falantes do DF e Região Norte (N) não se diferenciaram entre si e
apresentaram valores médios mais elevados que os outros dialetos. O esquema
abaixo mostra como as regiões se diferenciaram quanto à ênfase espectral
(p<0,05):
Pelos resultados, podemos concluir, inicialmente, que DF e N, utilizam
maior esforço vocal (correlato da ênfase espectral) que falantes de outras
regiões brasileiras, pois esse parâmetro é capaz de diferenciar os falantes dessas
regiões de outras, com valores médios maiores. O dialeto NE apresentou os
menores valores médios de ênfase espectral e pequena variação desses valores.
Concluímos que nesse corpus, o dialeto NE utiliza pouco esforço vocal,
diferenciando-o de N e DF. Ainda, além da região Norte, DF não se diferenciou
do PR em relação à ênfase espectral.
61
Caderno de Resumos
Resultados obtidos para a mediana da frequência fundamental
permitiram separar o DF e N de todas as outras regiões estudadas (p<0,01),
porém, novamente, DF e N não apresentaram diferenças estatisticamente
significativas entre si. A figura 1 mostra que N e DF apresentam valores mais
elevados para este parâmetro do que as outras regiões (tabela 1), em torno de
140 a 150 Hz, que é considerado um valor limítrofe para homens nessa faixa
etária (Behlau 2001). Os dois dialetos são os que apresentam maior
variabilidade nos resultados.
Figura 1. Valores de mediana da frequência fundamental dos dialetos estudados.
F0
Dialeto
Média (Hz)
DP
DF
144
29,34
MG
119
9,04
N
149
31,69
NE
119
11,16
PR
121
9,65
RJ
117
14,11
SP
125
13,35
Tabela 1: Média e desvio-padrão da frequência fundamental para os dialetos estudados.
62
4º Colóquio Brasileiro de Prosódia da Fala
Dois parâmetros diferenciaram N e DF: assimetria de z-score suavizado
(p=0,04) e taxa de unidades VV não-proeminentes/s (p=0,02). Os resultados
referentes à assimetria (Figura 2) mostram que N aumenta mais a duração de
algumas unidades VV que DF, isto é, faz mais alongamentos, tendo assimetria
de valor positivo mais elevado.
Figura 2. Valores de assimetria de z-score suavizado para os dialetos estudados
A taxa de unidades não-proeminentes/s distinguiu N do DF e de SP,
sendo que DF e SP apresentam menor taxa que N, o que pode significar que os
falantes da Região Norte tem a fala com maior cadência que DF e SP.
No desvio-padrão de z-score de duração de unidade VV, o ANOVA
apontou diferenças entre as regiões (p=0,01), porém, o Teste Tukey, por ser
mais conservador que o ANOVA não conseguiu identificar tais diferenças com
o nível de significância adotado (p<0,05). Por isso, adotamos, para esse
parâmetro, p<0,15, que aponta diferenças marginalmente significativas. Os
resultados obtidos utilizando p<0,15 são:
63
Caderno de Resumos
Falantes da região Norte apresentaram maior variação de z-score de
duração de unidade VV que DF, NE e SP. Falantes de SP variaram menos em
suas produções, fato que os diferenciou marginalmente de N e PR.
Três parâmetros não apresentaram diferenças significativas entre os
dialetos: taxa de elocução, média de duração de z-score de unidade VV e taxa de
produção de saliência duracional.
Os resultados mostram que alguns parâmetros prosódicos são capazes de
diferenciar as regiões estudadas e consequentemente, o dialeto falado nesses
locais. A ênfase espectral divide N e DF do restante das localidades analisadas,
exceto pela não diferenciação entre DF e PR. A mediana da frequência
fundamental criou um grupo parecido com o da ênfase espectral, diferenciando
N e DF do restante dos dialetos. Da mesma forma que algumas medidas
acústicas juntam esses dialetos em um mesmo grupo, algumas delas os separam
como é o caso da assimetria de z-score e taxa de unidades VV não-proeminentes
e o desvio-padrão (este último apresentou diferenças marginalmente
significativas).
Os resultados ajudam a descrever melhor as características prosódicas de
alguns dialetos do português brasileiro, principalmente DF e N. Dois
parâmetros diferenciaram dialetos falados na região Sul do Brasil
(considerando a linha horizontal traçada por Nascentes): desvio-padrão de zscore suavizado de duração de unidade VV, que foi capaz de distinguir SP do PR
e taxa de unidades VV não-proeminentes/s, que diferenciou o dialeto de SP da
região Norte.
Os resultados certamente acrescentam conhecimento em diversas áreas
afins, como a Fonética Forense, em que a tarefa de identificar o local de origem
de um falante contribui para a resolução de um caso. Os resultados apontam
para diferenciação do dialeto falado no DF que atualmente tem 53 anos de
fundação e é considerado como um dialeto em formação. Os cinco falantes do
DF que participaram deste estudo nasceram, viveram até a idade adulta na
cidade e tem idade média de 31 anos. Os resultados mostram que DF parece se
aproximar do dialeto da região Norte em algumas medidas e se diferenciar em
outras, evidenciando que, mesmo sendo uma região dialetal nova, apresenta
características próprias.
Os parâmetros analisados não revelaram diferenças entre os dialetos de
SP, RJ e MG. A utilização dos parâmetros prosódicos analisados em conjunto
com outras análises contribuirá para a diferenciação dessas (e de outras) regiões
dialetais.
Ressaltamos que, mesmo que alguns parâmetros tenham sido capazes de
64
4º Colóquio Brasileiro de Prosódia da Fala
diferenciar os grupos e outros não, a análise geral de todos os parâmetros é
fundamental para caracterizar cada dialeto. Poderíamos dizer que a região
Nordeste se diferencia do DF e do N por utilizar menos esforço vocal e variar
menos na duração das unidades VV que a região Norte.
As características prosódicas são, muitas vezes, menos abordadas que
variações lexicais e diferenças fonológicas em estudos que buscam caracterizar
determinadas regiões dialetais. Nosso estudo mostra que a prosódia também
contribui para diferenciar e caracterizar os dialetos brasileiros. Na próxima
etapa, um teste perceptivo avaliará se os ouvintes conseguem dizer a região de
procedência dos sujeitos que participaram do estudo e correlacionar esses
resultados com a análise dos parâmetros prosódicos.
Referências
Nascentes, A. 1953. O linguajar carioca. Rio de Janeiro: Organização Simões.
Cardoso, S.A.M. 1986. “Tinha Nascentes razão? (Considerações sobre a divisão
dialetal do Brasil)”. In Estudos: Lingüísticos e Literários, 5: 47-59.
Barbosa, P.A. 2006. Incursões em torno de ritmo da fala. Campinas: Editora Pontes.
Barbosa, P.A. 2011. ProsodicDescriptorExtractor. Script disponível com autor.
Behlau, M. 2001. A voz do especialista. Vol I.
65
Caderno de Resumos
Ênfase prosódica em estruturas narrativas: um estudo
preliminar
Ana Maria Santos de Mendonça ¹, Jeylla Salomé Barbosa dos
Santos ¹
¹ Faculdade de Letras/PPGLL/Universidade Federal de
Alagoas/Brasil
[email protected], [email protected]
O objetivo desta pesquisa é apresentar uma análise experimental da
ênfase prosódica, em seções consideradas essenciais em uma narrativa
espontânea, do português falado na comunidade de Porto da Rua, litoral Norte
de Alagoas. A análise baseia-se em estudos realizados sobre a ênfase prosódica,
tais como Cagliari (1992); Gonçalves (1997); Reis (2005). Labov (1972)
considera a narrativa um tipo de discurso que pode ser segmentado tomando-se
como princípio a função informacional de suas partes constituintes.
De acordo com Labov (1972), a estrutura de uma narrativa “bem
formada” pode conter as seguintes seções: resumo, orientação, seção de
complicação, avaliação, resolução e coda. Segundo Oliveira Jr. (2000), o
modelo laboviano, como exemplo de modelo teórico estrutural de narrativas
orais, pode ser empiricamente validado se se tomar em consideração o nível
suprassegmental do discurso narrativo.
Para uma melhor explicação dos elementos citados, temos: Orientação
(informação sobre atores, tempo, lugar e situações); Complicação (o corpo
principal da narrativa, ou ação); Avaliação (o ponto da história); Resolução (o
resultado da ação); e Coda (retorno ao momento atual da história).
Aqui nos delimitamos a trabalhar apenas com as seções consideradas,
por Labov (1972), como essenciais numa narrativa; a avaliação, a complicação
e a resolução, a fim de analisar em quais dessas seções o fenômeno da ênfase
prosódica se faz mais presente. Analisaremos, seguindo a literatura, os
seguintes elementos prosódicos, comumente associados à ênfase prosódica: o
tom e a duração.
66
4º Colóquio Brasileiro de Prosódia da Fala
Dada a importância dessas seções para o texto narrativo, espera-se que
elas sejam associadas a elementos prosódicos que as ressaltem das demais
seções. O uso da prosódia da prática de distinguir partes mais relevantes na fala
1
tem sido observado por vários autores, como, por exemplo, : Uhman, S. (1992) .
Segundo Cagliari (1992), a duração pode ser usada para distinguir
significados em itens lexicais (valor fonêmico). Nestes casos, a duração é uma
propriedade dos segmentos (consoantes e vogais).
De acordo com Cagliari (1992), a duração está sistematizada ao nível da
sílaba em todas as línguas, independentemente dos segmentos e, neste caso,
ganha o nome de “moras”. Todas as palavras de todas as línguas têm suas
durações previstas no léxico: são as chamadas “durações intrínsecas” das
sílabas. Estas durações atribuem valores e pesos às sílabas, que serão
importantes para a aplicação ou não de determinados processos fonológicos.
A duração que se refere a questões fonológicas significa alongamentos
ou encurtamentos de segmentos. Os outros tipos de duração delimitam
unidades duracionais maiores, a partir da sílaba em diante. Neste caso, a
duração é medida levando-se em consideração as durações dos segmentos e seu
efeito em unidades maiores.
Uma língua como o Português usa, às vezes, do recurso do alongamento
excessivo, como aponta Cagliari (1992) em “prosódia: algumas funções dos
supras-segmentos”, a pronúncia de certas palavras para significar qualidades
atributivas, que normalmente são expressas por itens lexicais. Como em um dos
trechos analisados: Tem carência no setor de educação (çãaaao), no setor de
saúde (saúuude).
Temos aqui um alongamento excessivo da sílaba acentuada por parte do
falante. O que acontece devido a esse alongamento saberemos na seção de
resultados.
Ainda segundo Cagliari (1992), os tons entoacionais (padrões) podem ser
classificados em dois tipos, segundo suas funções. Um prevê uma classificação
primária e outro uma classificação secundária. A primária refere-se a certas
características melódicas que são portadoras de distinções sintáticas de frases. A
segunda refere-se a significados semânticos relacionados com as atitudes do
falante. Em nossa pesquisa, nos detemos à segunda clasificação dos tons.
1
Contextualizing relevance: on some forms and functions of speech rate changes in everyday
conversation. In P.Auer & A. d. Luzio. The Contextualization of Language. Amsterdam,
Benjamins. 297-336.
67
Caderno de Resumos
Diversos estudos têm sido feitos sobre a ênfase prosódica e, em muitos
deles, tal fenômeno se diferencia no que diz respeito à definição. Reis (2005) a
define como uma manifestação acentual. Dar ênfase à fala é aquele recurso
quando, além da informação presente no significado proposicional da sentença,
ressaltamos intencionalmente um segmento a fim de expressarmos sentimentos
tais como indignação, incredulidade, segurança, ou apenas para chamar a
atenção do alocutário. Gonçalves (1997) concluiu em sua pesquisa intitulada
“ênfase prosódica e variação (sócio) linguística”, que a ênfase dada a um
determinado constituinte do enunciado tende a realçar o seu status
informacional dentro do evento de fala que se realiza. Dessa forma, os
segmentos mais enfatizados na fala são aqueles que possuem uma carga
informacional relativamente mais alta e, consequentemente, requer do falante
uma atenção maior em sua produção.
Segundo Oliveira Júnior (2010), qualquer tipo de discurso é formado por
conjuntos de frases que possuem uma relação semântica coerente entre si. Em
geral, a estrutura do discurso escrito é clara por conta do uso de convenções
tipográficas, tais como a pontuação e a organização do texto em parágrafos. O
discurso falado faz uso de outros mecanismos para sinalizar sua estrutura.
Ainda segundo o autor, certas variáveis prosódicas exercem papel
crucial na estruturação discursiva, dividindo o texto narrativo em seções
semanticamente independentes.
Estudando a estrutura de algumas narrativas, percebemos em nossos
dados que alguns locutores ao narrar sobre determinado assunto iniciam sua
fala de forma neutra, ou seja, uma queda da frequência fundamental no final do
2
enunciado . Porém, passados alguns minutos na mesma narrativa, dependendo
do conteúdo da conversa, esses locutores modificam o modo de se expressar,
modificam a voz a ponto de atrair o ouvinte para ele ou para o conteúdo do
discurso.
Embora a proeminência de elementos do enunciado possa ser produzida
por diversos recursos linguísticos e prosódicos, a escolha pelo estudo da ênfase
foi fundamentada no modo como os falantes das narrativas escolhidas para
análise se expressam, e, portanto, na sua importância no processo
2
Segundo Cunha (2011), o padrão assertivo neutro caracteriza-se, na maior parte das línguas
estudadas, por uma proeminência da F0 (lê-se F zero) no acento pré-nuclear e uma queda da
frequência fundamental no fim do enunciado, mais particularmente na sua última tônica.
68
4º Colóquio Brasileiro de Prosódia da Fala
comunicativo, regulamentando o discurso e, consequentemente, a própria
interação linguística (Gonçalves 1997).
O material utilizado foi composto por narrativas, extraída de gravações
feitas de fala espontânea. Esses dados já foram gravados e pertencem ao corpus
do trabalho de dissertação de Santos (2010). Como esses dados não foram
controlados, ao ouvi-los, percebemos que, em suas diferentes narrativas e
locutores, poderíamos encontrar o que nos propomos a descrever.
Nossos dados apresentam diferentes histórias, diferentes discursos,
como “carnaval”, “conselho tutelar”, “a cidade onde vive”, dentre outros.
Analisamos seis narrativas, entre homens e mulheres, todos residentes ao
município de São Miguel dos Milagres, litoral Norte de Alagoas, desde que
nasceram.
Os dados foram selecionados, recortados e submetidos à análise
experimental no software PRAAT. Dos trechos selecionados, extraímos sílabas
que foram segmentadas para em seguida, proceder à análise do comportamento
da frequência fundamental, ou seja, a evolução da F0 ao longo do enunciado.
Com objetivo de descrevermos os parâmetros prosódicos, como o tom e a
duração que se apresentam nas narrativas causando a ênfase prosódica.
Nas sílabas analisadas observou-se o comportamento melódico variado,
não havendo uma única caracterização, uma vez que diferentes padrões de
frequência fundamental se alternam, dependendo do ponto de vista da sílaba
tônica e da pós-tônica no final ou no meio dos enunciados. Quanto aos
elementos essenciais de uma narrativa, percebemos que há uma maior
proeminência de um dos elementos prosódicos que leva à ênfase, nesse caso a
duração, na seção avaliação.
Referências
Cagliari, L. C. Prosódia.1992: algumas funções dos suprassegmentos. UNICAMP,
IEL.
Gonçalves, C. A. 1997. Ênfase prosódica e variação (socio)linguística. Rio de Janeiro.
UFRJ.
Labov, W. e Waletzky, J. 1972. Narrative Analysis: Oral versions of personal
experience. Columbia University.
Oliveira, Jr. 2010. O uso da prosódia na sinalização da estrutura do discurso em
Kisedjê. UFAL. Maceió.
Reis, C. 2005. Prosódia e telejornalismo. IN: Gama, A. C. C.; Kyrillos, L.; Feijó, D.
69
Caderno de Resumos
(Org.). Fonoaudiologia e Telejornalismo. Relatos do IV encontro nacional de
Fonoaudiologia da Central Globo de Jornalismo. Rio de Janeiro: Revinter.
ROACH.
Santos, J. S. B. 2010. As realizações de /r/ em coda silábica na comunidade de Porto da
Rua, litoral norte de Alagoas. Análise linguística e sociolinguística. Dissertação de
mestrado. Maceió. UFAL.
Uhmann, S. 1992. Contextualizing relevance: on some forms and functions of
speechrate changes in everyday conversation. In P. Auer & A. d. Luzio. The
Contextualization of Language. Amsterdam, Benjamins. 297-336.
70
4º Colóquio Brasileiro de Prosódia da Fala
Caracterização da frequência fundamental da voz de
adultos que gaguejam
Ayslan Melo de Oliveira, Jeane Bezerra de Melo e Silva,
Kleuvencleiton José dos Santos Oliveira, Mayra Cristina Jorge
Oliveira, Suelen Glaucia Castro dos Santos de Jesus, Tarcya Sibele
Bastos Santos, Thiago Gonçalves de Jesus 1, Susana de Carvalho2
1
2
Curso de Fonoaudiologia, Universidade Federal de Sergipe, Brasil
Departamento de Fonoaudiologia, Universidade Federal de Sergipe,
Brasil
[email protected], [email protected],
[email protected], [email protected],
[email protected], [email protected],
[email protected], [email protected]
1. Introdução
A fluência pode ser definida como o fluxo contínuo e suave de produção
da fala. Contrapondo-se, a gagueira é caracterizada por ocorrências frequentes
de repetições, prolongamentos de sons, interjeições, palavras partidas,
bloqueios audíveis ou silenciosos, circunlocuções e excesso de tensão física
(Andrade 2003; APA 2002).
A tensão muscular tem sido apontada como um dos fenômenos
fisiológicos que afetam a fala e considerada um fator importante, que influencia
ou provoca a gagueira. Esta tensão muscular, no nível glótico, compromete a
mobilidade natural da laringe e altera o fluxo de ar de tal forma que a fala é
diretamente afetada (Jakubovicz 2009).
A frequência fundamental (F0) é a primeira emissão determinada,
fisiologicamente, pelo número de ciclos que as pregas vocais realizam em um
segundo. Sabe-se que a F0 varia de acordo com a idade e o gênero, com uma
distribuição média entre 80 a 250 Hz, para adultos jovens. Nos homens,
encontram-se valores situados entre 80 a 150 Hz e, nas mulheres, entre 150 a
250 Hz (Behlau et al 2008).
71
Caderno de Resumos
As características biodinâmicas das pregas vocais e a sua integração com
a pressão subglótica determinam a F0. Sendo assim, qualquer ajuste que
interfira nos ciclos glóticos, irá interferir também nos valores da frequência
fundamental (Behlau et al. 2008).
O principal objetivo deste estudo foi caracterizar a frequência
fundamental da voz de adultos que gaguejam. Hipotetiza-se que a frequência
estará elevada, em virtude da tensão muscular e dos diferentes ajustes que
ocorrem durante a produção da fala.
2. Material e método
O presente estudo, observacional e descritivo, é um dos aspectos
investigados na pesquisa “Intervenção fonoaudiológica na gagueira: perfil dos
pacientes atendidos no Laboratório de Voz, Fala e Fluência”, aprovada pelo
Comitê de Ética em Pesquisa, sob o no. CAAE 0181.0.107.000-11, não
implicando em nenhum procedimento invasivo ou experimental e
caracterizada como sem riscos para os participantes.
O estudo contou com 57 participantes, voluntários, adultos, de ambos os
gêneros, com queixa de gagueira e que haviam procurado, voluntariamente, por
atendimento fonoaudiológico no laboratório citado.
Após a assinatura do Termo de Compromisso Livre e Esclarecido, os
participantes foram convidados a realizar duas tarefas: primeiro, responder a
questão “Por que você gostaria de se tratar agora?” e, posteriormente, proceder
a leitura oral de um texto padronizado para o português brasileiro, contendo 100
palavras (Jakubovicz 2002).
As tarefas foram gravadas por meio de um microfone profissional,
instalado em pedestal e acoplado a um conversor e amplificador de audio
Shure®, o que possibilitou que as amostras de fala fossem captadas,
digitalizadas e armazenadas no formato wav.
As amostras de fala foram analisadas por meio do Praat (software de livre
acesso, desenvolvido por Boersma e Weenink, em sua versão 5.3.51) para
determinação da frequência fundamental. O cálculo da frequência fundamental
foi realizado, automaticamente, pelo software, com pitch mínimo de 75Hz e
máximo de 500Hz. Os dados, coletados e tabulados, foram analisados por meio
de estatística descritiva, para determinação dos valores máximo, mínimo,
média e desvio padrão; a comparação entre os dados foi realizada por meio do
Teste T Student para amostras pareadas, com significância em p<0,05.
72
4º Colóquio Brasileiro de Prosódia da Fala
3. Resultados e discussão
De maneira geral, estudos com adultos que gaguejam contam com um
número reduzido de participantes, o que restringe a possibilidade de
generalização. Neste estudo, buscou-se analisar uma amostra maior a fim de
ampliar a discussão sobre os parâmetros acústicos para essa população
específica.
Dentre os 57 participantes, 43 eram do gênero masculino e 14 do gênero
feminino. É importante destacar que há um consenso, na literatura
especializada, no que diz respeito a prevalência de casos de gagueira no gênero
masculino, em uma relação de 3/1 (Wittke-Thompson et al. 2007).
A idade dos participantes variou entre 18 a 56 anos, com idade média de
25,3 anos. A procura por atendimento fonoaudiológico para a gagueira coincide
com achados de outros estudos, nos quais a idade média dos pacientes adultos
situa-se entre os 20 e 30 anos (Andrade 2003; Duarte et al. 2009).p
Gênero
N
F0 (Hz)
mínima
Fala encadeada
máxima média
DP
mínima
Leitura oral
máxima média
DP
masculino
43
99,00
221,70
144,03
27,30
102,78
216,99
145,05
27,60
feminino
14
152,51
342,00
218,65
45,32
113,59
262,60
205,44
44,92
Tabela 1: Valores mínimo, máximo e médias de frequência
fundamental, de acordo com o gênero e tarefa realizada
Considerando a análise da frequência fundamental da voz dos
participantes do gênero masculino, na tarefa de fala espontânea, percebe-se
uma variação entre o valor mínimo de 99 Hz e o valor máximo de 221,7 Hz, com
média em 144,03 Hz (DP = 27,3).
Para a tarefa de leitura oral, a frequência fundamental variou entre
102,78 e 216,99 Hz, com média em 145,05 Hz (DP = 27,6). Comparando os
resultados por meio do Teste T Student para amostras pareadas, não há
diferença significativa entre as tarefas.
As vozes femininas, na tarefa de fala espontânea, revelaram valores entre
152,51 e 342 Hz, com média em 218,65 Hz (DP = 45,32). Para a tarefa de leitura
oral, os valores variaram entre 113,592 e 262,6 Hz e média de 205,44 Hz (DP =
44,92). Comparando os resultados por meio do Teste T Student para amostras
pareadas, também não existem diferenças significativas entre as tarefas.
73
Caderno de Resumos
O valor médio da frequência fundamental para a voz feminina é de
204,91 Hz. Quando se compara com os resultados deste estudo, percebe-se não
existir uma diferença significativa.
Estudos sobre a frequência fundamental da voz masculina estabelecem,
como parâmetro, valores situados entre 80 a 150 Hz. Oliveira et al (2009)
analisaram a F0 da voz de 15 homens com quadro de gagueira e idade média de
26,6 anos e concluíram não existir diferenças, nesse aspecto, entre adultos
fluentes e adultos que gaguejam.
Considerando os participantes do gênero masculino, deste estudo,
identifica-se um valor médio de F0 (144,03 Hz) e, portanto, ainda dentro dos
parâmetros para vozes masculinas. Esse valor, entretanto, situa-se muito
próximo do valor máximo, ou seja, 150 Hz. Além disso, percebe-se que há uma
variabilidade maior entre os valores mínimo e máximo.
Nesse sentido, pode-se argumentar que há uma elevação nos valores da
frequência fundamental da voz de homens que gaguejam, não o suficiente para
descaracterizá-la como uma voz masculina, mas indicativa da presença de
tensão laríngea.
Utilizando a eletromiografia de superfície, um estudo investigou a
atividade da musculatura laríngea de quatro homens, durante o discurso fluente
e disfluente. Os resultados demonstraram níveis elevados de atividade
muscular e uma relação positiva entre essa atividade anormal da musculatura
laríngea e os momentos de disfluência (Andrade et al. 2008).
4. Conclusão
Conclui-se que há elevação da frequência fundamental da voz de
adultos, do gênero masculino, que gaguejam. É provável que tal fenômeno
ocorra em função da tensão laríngea presente.
Tal constatação pode contribuir para a tomada de decisões e
reformulações importantes na abordagem terapêutica de adultos que gaguejam.
Referências
Andrade, C.R.F. et al. 2008. Modelamento da fluência com o uso da eletromiografia de
superfície: estudo piloto. Pró-Fono Rev Atual Científica. 20(2):129-32.
74
4º Colóquio Brasileiro de Prosódia da Fala
Andrade, C.R.F. de 2003. A gagueira e o processo da comunicação humana. In:
LIMONGI, S.C.O. Linguagem: desenvolvimento normal, alterações e distúrbios.
Série: Fonoaudiologia: Informação para Formação. Rio de Janeiro: GuanabaraKoogan.
APA Associação Psiquiátrica Americana 1995. Manual Diagnóstico e Estatístico de
Transtornos Mentais -DSM-IV. (Trad. de Dayse Batista). Porto Alegre: Artes
Médicas.
Behlau, M et al. 2008. Avaliação de voz. In: Behlau, M. (org.). Voz: o livro do
especialista. Rio de Janeiro: Revinter.
Boersma,P. e Weenink, D. Praat: doing phonetics by computer (versão 5.3.51.).
Software. Disponível em: http://www.praat.org. Acesso em 18/05/2013.
Duarte, T.F. et al. 2009. Caracterização dos indivíduos com distúrbios da fluência,
atendidos na clínica-escola do curso de fonoaudiologia da USP-Bauru. Rev. CEFAC.
11(3): 396-405.
Jakubovicz, R. 2009. Gagueira. 6. ed. rev. e ampl. Rio de Janeiro: Revinter.
_____ 2002. A técnica surdo-sonoro para descondicionar bloqueios. In: MEIRA, I.
(org.) Tratando gagueira: diferentes abordagens. São Paulo: Cortez.
Oliveira, B. F. V. et al. 2009. Análise de parâmetros perceptivo-auditivos e acústicos em
indivíduos gagos. Rev Soc Bras Fonoaudiol. 14(3):323-31.
Wittke-Thompson, J.K. et al. 2007. Genetic studies of stuttering in a founder
population. J Fluency Disord. 32(1):33-50.
75
Caderno de Resumos
A relação entre a compreensão e os aspectos prosódicos
na leitura em voz alta de falantes do PE e do PB
Camila Tavares Leite1
1
Faculdade de Letras, Universidade Federal de Alagoas, Brasil
[email protected]
A leitura é um processo tão usual para o bom leitor que, dificilmente, ele
se pergunta sobre como ocorre este intricado e complexo processo. Mas qual é o
conceito de bom leitor? Gabriel (2006) afirma que o leitor proficiente, ou o bom
leitor, por definição é aquele para o qual a decifração do código não é mais um
obstáculo e que, por isso, pode voltar toda sua atenção para a produção de
sentido. Soares (2004) completa, ainda, que esse nível de proficiência em
leitura não é uma característica inata, comum a todos os seres humanos, mas
sim uma habilidade construída através de um longo processo de alfabetização e
letramento, que vai modificando a forma de “ver” o código. Outros
pesquisadores apontam a fluência como um bom indicador global de
competência em leitura. De acordo com essa análise, ler um texto com atenção
implica processar palavras individuais e parsear seus grupos frasais (Levasseur,
Macaruso, Palumbo & Shankweiler 2006). Mas qual é o conceito de fluência?
De acordo com Finn e Ingham (1991), a fluência parece ser um fenômeno de
fácil compreensão – já que todos os falantes de uma determinada língua são
capazes de dizer se dada leitura é fluente ou não, pois sabem identificar a
fluência quando a ouvem –, mas cuja noção é resistente a uma definição direta e
não ambígua. Normalmente, a definição de fluência está vinculada à sua
negativa. Segundo Hedge (1978), “fluência é melhor definida como uma
unidade de resposta destituída de disfluências e pausas”. Esta definição,
conforme Finn e Ingham (1991), não deixa claro se ela identifica uma fala que
os ouvintes interpretariam como fluente nem se tal definição se refere à fala
normalmente fluente.
Com interesse em avaliar a fluência, o presente trabalho tem como
objetivo observar e analisar a leitura em voz alta de sujeitos de diferentes
idades/escolaridades do Português Europeu – variedade falada na cidade de
Lisboa – e do Português Brasileiro – variedade falada na cidade de Belo
76
4º Colóquio Brasileiro de Prosódia da Fala
Horizonte – e sua relação com a compreensão do material lido. Foram
selecionados 30 sujeitos de cada variedade, como especificado na tabela 1,
totalizando 60 sujeitos participantes.
IDADE
ESCOLARIDADE
11 (onze) anos
6º ano do Ensino Básico
15 (quinze) anos
10º ano do Ensino Secundário
20 (vinte) anos
1º ano da graduação
TOTAL de Portugueses
IDADE
ESCOLARIDADE
11 (onze) anos
6º ano do Ensino Fundamental
15 (quinze) anos
1º ano do Ensino Médio
20 (vinte) anos
1º ano da graduação
TOTAL de Brasileiros
Nº de sujeitos
Portugueses
10
10
10
30
Nº de sujeitos
Brasileiros
10
10
10
30
Tabela 1 – Sujeitos participantes da pesquisa
Cada sujeito realizou, em voz alta, duas leituras de dois textos: o
primeiro texto, “O ratinho Dadá” é um texto infantil, com vocabulário acessível
a todos os participantes. Esse texto, em sua versão original, foi adaptado para o
Português Europeu – PE –, visto que se encontravam nele alguns termos
incomuns nesta variedade. Por se tratar de um texto que, aparentemente, não
apresenta dificuldades de processamento, um segundo texto, com maior
complexidade, foi também selecionado, o texto “A Amazónia” – versão
original do PE, texto utilizado por Costa (1991) em seu trabalho de mestrado
sobre leitura, compreensão e processamento sintático e por Condelipes (2010)
em seu trabalho de mestrado sobre produção de fala por indivíduos gagos. O
texto “A Amazónia”, em sua versão original, foi adaptado para o Português
Brasileiro, PB, visto que nele havia termos incomuns nesta variedade. Entre a
primeira e a segunda leitura em voz alta de cada texto, o participante respondeu,
no computador, a um questionário de compreensão, realizado no programa
DMDX. As questões do teste realizado pelos sujeitos foram elaboradas
levando-se em consideração os níveis hierárquicos de análise da compreensão,
propostos por Salasoo (2007). No nível de palavra, encontram-se cinco
questões: duas sobre palavras que não estão no texto, duas sobre palavras que
estão no texto, mas não na idéia central e uma sobre uma palavra que está na
77
Caderno de Resumos
idéia central do texto. No nível das inferências, para cada inferência havia uma
afirmativa verdadeira e uma falsa. Ao todo, analisamos as respostas dadas a 9
(nove) questões de compreensão.
Uma leitura pode ser ou não considerada fluente quando comparada com
outra que seja tida como controle. Portanto, para classificar as leituras
realizadas pelos sujeitos da pesquisa, comparamo-las a uma leitura considerada
fluente, tanto em relação às suas características prosódicas quanto em relação
às suas características entoacionais. A leitura de um sujeito de 30 anos de idade,
do sexo feminino, aluno de doutorado da Faculdade de Letras da Universidade
de Lisboa e a de um sujeito de 30 anos de idade, também do sexo feminino,
aluno de doutorado da Faculdade de Letras da Universidade Federal de Minas
Gerais foram gravadas e analisadas. Foram ainda segmentadas de acordo com
os constituintes prosódicos (Nespor & Vogel 1986) e foram feitas marcações de
acentos tonais e de tons de fronteira. Essas leituras foram consideradas como
“controle” para análise dos dados dos sujeitos analisados nesta pesquisa.
Dos textos, observamos: tempo e taxa de elocução. Selecionamos alguns
enunciados de cada texto para análise – sendo três enunciados do texto “O
ratinho Dada” e dois do texto “A Amazônia” – e desses observamos: tempo e
taxa de elocução, tempo e taxa de articulação, tempo e porcentagem de pausa e
número de sintagmas entoacionais. Como resultado, observamos que, quando
comparados com o leitor fluente, em PE podemos considerar fluentes apenas os
sujeitos de 15 e 20 anos. Todos os dados dos sujeitos de 11 anos, em PE,
apresentaram diferença significativa com relação aos dados dos demais
sujeitos. Em PB, obtivemos um resultado diferenciado. Os sujeitos de 11, 15 e
20 anos, quando comparados com o leitor controle, não apresentaram diferença
no comportamento leitor, exceto no que diz respeito aos dados de pausa. Esse
dado parece ser um distintor das variedades e dos sujeitos. A partir dos dados
analisados nesta pesquisa, a pausa parece ter sido utilizada diferentemente em
PE e em PB: em PE ela parece apontar a fluência ou a não fluência do sujeito, já
em PB, ela limita o sintagma entoacional – marcado, mais frequentemente, nos
dados do PE, com o tom de fronteira alto H%.
A observação dos dados de compreensão nos mostrou que a
diferenciação do gênero textual pode apresentar resultados diferentes para um
mesmo grupo. O texto mais complexo possibilitou-nos perceber que há uma
relação inversamente proporcional entre idade/escolaridade e o erro ao
responder às questões de compreensão. Quanto maior a idade, menor o número
de erro. Chamamos a atenção para algo que veio de encontro ao que
esperávamos no início da pesquisa: inicialmente, esperávamos que a
78
4º Colóquio Brasileiro de Prosódia da Fala
compreensão do texto estivesse diretamente relacionada com a fluência de
leitura em voz alta, ou seja, uma leitura fluente seria uma consequência de uma
boa compreensão. Os resultados desta pesquisa apontam o fato de que essa
relação deve ser repensada. Os sujeitos de 20 anos, do PE e do PB, apresentaram
leituras fluentes; entretanto, os resultados do teste de compreensão do texto
mais simples apresentaram elevados números de erro.
Referências
Condelipes, T. 2010. Produção de fala por indivíduos gagos. Dissertação (Mestrado em
Lingüística) – Faculdade de Letras, Universidade de Lisboa, Lisboa.
Costa, A. 1991. Leitura: compreensão e processamento sintático. Dissertação
(Mestrado em Lingüística) – Faculdade de Letras, Universidade de Lisboa, Lisboa:
1-76.
Finn, P. & Ingham, R. 1991. “The selection of “fluent” samples in research on
stuttering: conceptual and methodological considerations”. In Healey, C. (org.).
Readings on research in stuttering. Nova Iorque: Longman Publishing Group: 91109.
Hedge. 1978. “Fluency and fluency disorders: their definition, measurement and
modification”. Journal of fluency disorders 3: 51–71.
Gabriel, R. 2006. “A compreensão em leitura enquanto processo cognitive”. Revista
Signo. 31 (52): 73-83.
Levasseur, Macaruso, Palumbo & Shankweiler. 2006. “Syntactically cued text
facilitates oral reading fluency in developing readers”. Applied Psycholinguistics
27: 423-445.
Nespor M. & Vogel, I. 1986. Prosodic Phonology. Dordrecht: Foris.
Salasoo, A. 2007. “Cognitive processing in oral and silent reading comprehension”.
Reading Research Quarterly 21 (1): 58-69.
Soares, M. 2004. “Letramento e alfabetização: as muitas facetas”. Revista Brasileira de
Educação. 25. Jan/Fev/Mar/Abr.
79
Caderno de Resumos
A interação prosódia-sintaxe em dados de produção e de
compreensão de estruturas de Tópico e de SVO
1
2
Carolina Garcia de Carvalho Silva , Maria Cristina Name
1
Faculdade de Letras/Programa de Pós-Graduação em Linguística,
Universidade Federal de Juiz de Fora, Brasil
2
Faculdade de Letras/Programa de Pós-Graduação em Linguística,
Universidade Federal de Juiz de Fora, Brasil
[email protected], [email protected]
Nosso estudo tem como objetivo investigar se a prosódia poderia guiar o
processamento sintático, não simplesmente desfazendo uma ambiguidade, mas
fornecendo pistas para a construção da estrutura sintática no curso do
processamento. Elegemos como objeto de análise a oposição das estruturas de
Tópico e de SVO porque, no português brasileiro, as construções de tópico são
altamente recorrentes (Pontes 1987; Orsini e Vasco 2007) e se caracterizam por
um contorno melódico próprio (Moraes e Orsini 2003).
Tomamos como referencial teórico o modelo de Corrêa e Augusto (2007)
de integração entre teoria linguística (Programa Minimalista: Chomsky 1995),
e processamento on-line, denominado Modelo Integrado de Computação Online (MINC). De acordo com o MINC, projeções top-down e bottom-up se
organizam paralelamente. Nesse sentido, nossa hipótese é a de que algumas
projeções poderiam ser conduzidas pela prosódia, através das pistas de
fronteiras de constituintes prosódicos. Mais especificamente, as fronteiras de
sintagmas fonológicos (? ) e de sintagmas entoacionais (I) seriam pistas
prosódicas relevantes, porque coincidem com fronteiras sintáticas (Nespor e
Vogel 1986).
Com a finalidade de testarmos tal hipótese, foram aplicadas duas
atividades experimentais, uma de produção e outra de compreensão.
Selecionamos 12 palavras que podem pertencer tanto à categoria Verbo, quanto
à categoria Adjetivo: dissílabas – cega, limpa, muda, paga, salva, suja; e
trissílabas – aceita, estranha, expulsa, liberta, oculta, segura. Construímos
sentenças com dois tipos de estruturas sintáticas: Tópico – [A criança SUJA]I a
madrinha mandou ela para o banho; e SVO – [A criança]? [SUJA a madrinha]
com a comida do almoço.
80
4º Colóquio Brasileiro de Prosódia da Fala
Em todos os pares de sentenças, foi controlado, o máximo possível, o
número de sílabas da sentença toda e de cada constituinte prosódico. Ainda, a
palavra-alvo admite o mesmo nome como antecedente e o sintagma seguinte à
palavra-alvo também é o mesmo nas duas condições, funcionando como sujeito
na primeira condição e como complemento na segunda. Todos os nomes que
antecedem as palavras ambíguas têm o traço [+ humano], e os nomes que as
seguem, [+animado].
Temos em cada sentença coincidência entre fronteira sintática e fronteira
prosódica, sendo que, até o sintagma seguinte à palavra ambígua, as estruturas
sintáticas só diferem através da pista prosódica. Na sentença com estrutura de
Tópico, há uma fronteira de sintagma entoacional (I) após a palavra ambígua; já
na condição SVO, há uma fronteira de sintagma fonológico (? ) antes da palavra
ambígua. Portanto, desde o início das sentenças há pistas prosódicas que as
diferenciam.
A primeira atividade experimental teve como objetivo verificar se,
diante de uma estrutura ambígua, há um tipo de prosódia default. A tarefa
consistia no seguinte: na tela do computador aparecia uma frase.
Imediatamente, o participante deveria fazer a leitura em voz alta, sem nenhuma
leitura prévia. Em seguida, o participante lia cada frase mais duas vezes. O total
de 24 sentenças-teste foi distribuído em dois grupos, a fim de que o sujeito que
visse, por exemplo, a palavra suja como verbo, não a visse como adjetivo. Cada
participante leu 12 sentenças-teste, apresentadas em meio a 16 distratoras.
Participaram dessa tarefa 8 voluntárias.
Comparamos a primeira e a terceira leituras, observando o tipo de
envelope prosódico produzido para cada estrutura ambígua. Na primeira
leitura, na condição Tópico, 41 frases (do total de 48 gravadas) e na condição
SVO, 44 (de 48) foram lidas com prosódia de SVO. Não houve, portanto,
diferença significativa do tipo de envelope prosódico para os dois tipos de
estrutura sintática (X2(1)=0.41, p=0.521), pois os participantes preferiram
majoritariamente a prosódia de SVO. Por outro lado, na última leitura, 40 frases
com estrutura de Tópico foram lidas com prosódia de Tópico, e todas as 48 com
estrutura de SVO foram lidas com prosódia de SVO. Houve uma diferença
significativa (X2(1)=65.185, p<0.00001), o que revela que, após conhecer o
sentido da frase, os falantes diferenciaram as duas estruturas com os dois tipos
de envelopes prosódicos adequados.
Verificamos as propriedades de duração e f0 das sílabas tônicas da
palavra ambígua e do nome antecedente nas duas estruturas sintáticas. Na
estrutura de Tópico, há um alongamento da sílaba tônica do adjetivo e a f0 é
81
Caderno de Resumos
mais alta na sílaba tônica do nome antecedente. Já na estrutura de SVO, o
alongamento ocorre na sílaba tônica do nome e o valor de f0 é mais alto no
verbo.
Tendo em vista que tais pistas prosódicas são produzidas pelos falantes, a
segunda atividade experimental foi desenvolvida a fim de verificarmos se tais
pistas são captadas pelos ouvintes, possibilitando-os diferenciar os dois tipos de
estruturas a partir do tipo de envelope prosódico.
Usamos a técnica de escuta auto-monitorada, em que o ouvinte controla
o tempo de escuta das frases. Através do software PsyScope, medimos o tempo
de escuta de cada parte das frases, pressupondo que o tempo de reação é maior
no momento em que houver necessidade de um tempo maior de processamento.
Usamos as mesmas frases do experimento anterior, mas gravadas por uma
única falante. Analisamos novamente os parâmetros acústicos de duração e f0
nas sílabas tônicas do nome antecedente e da palavra ambígua.
Observamos que ocorre um alongamento das sílabas tônicas em final de
fronteiras prosódicas (no adjetivo, na condição Tópico, e no nome, na condição
SVO) com diferenças estatisticamente significativas. Comparando-se as
médias da duração da sílaba tônica do nome nas duas condições (189 x 406 ms),
tem-se t(11)=10.503, p<0.0001; e do adjetivo e do verbo (427 x 241 ms):
t(11)=12.531, p<0.0001.
Com respeito aos valores de f0 nas sílabas tônicas, comparando-se as
médias do nome nas duas condições (259 x 219 Hz), tem-se: t(11)=5.16,
p=0.0003. Comparando-se as palavras ambíguas (adjetivo 254 x verbo 309
Hz), também há resultado significativo: t(11) =3.46, p=0.005.
Constatadas as diferenças prosódicas entre as estruturas de Tópico e de
SVO, buscou-se verificar, através de experimento de compreensão, se os
ouvintes captam essas diferentes propriedades prosódicas que sinalizam duas
estruturas sintáticas diferentes.
As sentenças gravadas foram cortadas em quatro partes: A criança suja /
a madrinha / mandou ela / para o banho; A criança suja / a madrinha / com a
comida / do almoço. Fizemos uma combinação dessas partes, de modo a
colocar a estrutura de Tópico com prosódia de SVO, e a de SVO com prosódia
de Tópico. Assim, totalizamos quatro condições experimentais: dois tipos de
estruturas sintáticas com dois tipos de envelope prosódico (congruente ou
incongruente com a sintaxe).
Participaram do experimento 32 sujeitos. A tarefa consistia em apertar
uma tecla para ouvir cada parte das frases. Ao final das frases, aparecia na tela
uma pergunta para garantir a atenção do ouvinte durante a escuta. Cada
82
4º Colóquio Brasileiro de Prosódia da Fala
participante ouviu 12 sentenças-teste em meio a 32 distratoras. Tomamos como
medida de análise o tempo de escuta da terceira parte das sentenças, pois é nesse
momento que o ouvinte percebe se a prosódia o levou a interpretar a frase de um
modo equivocado (no caso de haver incongruência entre prosódia e sintaxe).
Os tempos de escuta foram maiores nas condições com incongruência
entre sintaxe e prosódia. Os resultados revelaram um efeito principal do tipo de
estrutura sintática (F(1,31)=17.6, p<0.001) e também do tipo de prosódia
(F(1,31)=5.70, p<0.02). Houve ainda um efeito significativo da interação entre
sintaxe e prosódia (F(1,31) = 8.34, p<0.007).
Portanto, os resultados sugerem que a prosódia poderia guiar o parser na
construção das estruturas. Assim, ao ouvir o início da frase com prosódia SVO,
o ouvinte tende a processar a palavra ambígua como verbo e, no caso da
prosódia de Tópico, processaria a palavra ambígua como adjetivo. Contudo, se,
ao escutar o restante da sentença, o ouvinte se depara com uma incongruência
entre o tipo de prosódia e a estrutura sintática, ocorre um estranhamento, sendo
necessária a reanálise, o que acarreta um tempo maior de processamento
revelado através dos tempos de escuta mais altos.
Em conjunto, os resultados revelam que, por um lado, parece haver uma
estrutura default SVO, mas, por outro, a prosódia de Tópico parece impedir, em
certa medida, a ativação desse default. Isso sugere, de acordo com nossa
hipótese inicial, que a prosódia poderia não só impedir a ambiguidade, mas
também guiar o parser na formulação da estrutura sintática.
Referências
Chomsky, N. 1995. The Minimalist Program. Cambridge, MA: MIT Press.
Corrêa, L.M.S. and AUGUSTO, M.R.A. 2007. "Computação linguística no
processamento on-line: soluções formais para a incorporação de uma derivação
minimalista em modelos de processamento". Cadernos de Estudos Linguísticos
(Unicamp) 49: 167-183.
Moraes, J.A. and Orsini, M.T. 2003. "Análise prosódica das construções de tópico no
português do Brasil: estudo preliminar". Letras de Hoje 38(4): 261-272.
Nespor, M. and Vogel, I. 1986. Prosodic phonology. Dordrecht: Foris Publications.
Orsini, M.T. and Vasco, S.L. 2007. "Português do Brasil: língua de tópico e de sujeito".
Diadorim - Revista de Estudos Linguísticos e Literários 2(2): 83-98.
Pontes, E. 1987. O tópico no português do Brasil. Campinas: Pontes.
83
Caderno de Resumos
Análise entonacional e pragmática de conversas
telefônicas coloquiais: os enunciados interrogativos
totais nas variedades de
Buenos Aires e Santiago do Chile
1
2
Carolina Gomes da Silva , Maristela da Silva Pinto , Natalia dos
Santos Figueiredo3
1
Faculdade de Letras, Universidade Federal do Rio de Janeiro, Brasil
2
Instituto Multidisciplinar, Universidade Federal Rural do Rio de
Janeiro, Brasil
3
Instituto Latino-americano de Arte, Cultura e História, Universidade
Federal de Integração Latino-americana
[email protected], [email protected], [email protected]
1.Introdução
Este trabalho pretende apresentar uma descrição fonética e uma análise
fonológica de enunciados interrogativos totais realizados em conversas
telefônicas coloquiais, por falantes de espanhol da variedade de Buenos Aires
(Argentina) e Santiago do Chile (Chile). Embora já existam trabalhos que
tratem sobre a entoação de enunciados interrogativos tanto do espanhol
argentino como do chileno, como Sosa (1999), Gabriel et al. (2010), Ortiz et al.
(2010), destacamos a originalidade de nossa proposta de estudo de fala
espontânea, conversacional e coloquial uma vez que tais trabalhos descrevem
os contornos melódicos sobretudo em contextos de fala lida ou representada.
Pretendemos expandir o enfoque dos estudos entonacionais por meio de
investigações no contexto de fala espontânea conversacional (BlancheBenveniste 1998; Briz 2002).
Estudos recentes de diferentes variedades do espanhol descrevem os
contornos entonacionais de enunciados assertivos, interrogativos, imperativos
e outros, obtidos através de um questionário adaptado a cada variedade (Sosa
1999; Prieto & Roseano 2010). Dentre esses trabalhos, apresenta-se a entoação
84
4º Colóquio Brasileiro de Prosódia da Fala
do espanhol chileno cujos estudos começaram a desenvolver-se a partir da
década de 50 (ORTIZ et al. 2010). Assim como a entoação do espanhol chileno,
estudos sobre a entoação do espanhol argentino têm sido foco de intensa
investigação desde a segunda metade do século XX. Segundo Gabriel et al.
(2010) muitos deles buscam descrever os padrões entonacionais de enunciados
interrogativos, embora tratem as interrogativas totais e as parciais como um
todo, ou seja, não apresentam distinções claras entre esses dois subtipos de
enunciados que possuem uma característica em comum: uma incógnita
(Escandell Vidal 1999). Na interrogativa total, foco do nosso trabalho, a
incógnita é respondida afirmativamente ou negativamente — “¿Tiene
mermelada?”; diferentemente das parciais, cuja incógnita é assinalada por um
pronome, adjetivo ou advérbio interrogativo — “¿De dónde vienes?”.
Em relação às interrogativas totais, na variedade argentina (Buenos
Aires), Sosa (1999) propõe um padrão melódico descendente para o prénúcleo, o primeiro vocábulo tônico do enunciado, e para o núcleo, último
vocábulo tônico do enunciado final, um padrão ascendente: H*+L _____
L+H*H%. Diferentemente de Sosa (1999), Gabriel et al. (2010) propõem, para
esta mesma variedade, um padrão entonacional distinto tanto para o pré-núcleo
como para o núcleo. Segundo tais autores, o contorno entonacional apresenta
pré-núcleo ascendente e o núcleo, escalonamento ascendente. O tom de
fronteira final é ascendente-descendente – L+H* _____ L+¡H*HL%.
Já para as interrogativas totais na variedade chilena, o contorno
entonacional apresenta um acento pré-nuclear ascendente (Ortiz et al. 2010). O
acento nuclear também é ascendente e o tom de fronteira é alto-ascendente –
L+H* _____ L+H*HH%.
Em vista disso, nos perguntamos: (i) quais são os contornos
entonacionais encontrados em conversas coloquiais dos enunciados
interrogativos totais nas variedades argentina (Buenos Aires) e chilena
(Santiago do Chile)?; (ii) que diferenças entonacionais há entre os enunciados
interrogativos do espanhol argentino (Buenos Aires) e do espanhol chileno
(Santiago do Chile)? e (iii) haverá diferenças entonacionais nos enunciados
interrogativos em relação ao seu uso no discurso?
2. Corpus e Métodos
Do ponto de vista metodológico, estudaremos a entoação inserida em um
contexto comunicativo espontâneo, isto é, sem nenhum planejamento prévio
85
Caderno de Resumos
(Blanche-Benveniste 1998). Nosso corpus é composto por conversas que,
segundo Briz (2002) e Kerbrat-Orecchioni (2006), é o protótipo do discurso
oral e coloquial. A partir disso, é possível caracterizar a conversação como um
discurso oral, dialogal, imediato, cooperativo e, sobretudo, um discurso que
não possui alternância de turnos pré-determinada (BRIZ 2002), em outras
palavras, cada participante da conversa fala alternadamente sem que haja um
momento planejado para que um comece o seu turno ou que o mesmo seja
interrompido.
Esta alternância de turnos se rege por princípios e regras que controlam o
desenvolvimento da conversação, que deve ser entendida como um negócio
social uma vez que é regulada socialmente por princípios e máxima: regras de
cooperação, regras de cortesia e regras de pertinência situacional. No entanto,
numa conversação coloquial, nem sempre tais regras são cumpridas visto que
os participantes de uma conversação podem intervir e se sobrepor à fala do
outro. Isto ocorre não por desrespeito às regras supracitadas, mas como uma
tentativa de colaborar com a negociação ou demonstrar interesse pelo que se
está dizendo.
É importante destacar também que a conversação coloquial se estabelece
entre interlocutores que possuem uma relação vivencial de proximidade, uma
experiência compartilhada. Além disso, entre os interlocutores deve haver uma
relação de igualdade bem como o tema em discussão deve fazer parte do
cotidiano dos mesmos e o tom deve ser informal.
O corpus FISCHER é composto por setenta e nove gravações de
conversas telefônicas, realizadas por ligações de longa distância desde os
Estados Unidos, do ano de 1995, entre pessoas que se conhecem (amigos,
familiares, etc.). Vale mencionar que a fala não é limpa e o vocabulário das
conversas não é restrito, isto é, pode apresentar ruídos de fundo. Dessas setenta
e nove gravações, selecionamos quatro gravações que constituirão o corpus da
nossa pesquisa, sendo duas gravações entre falantes de espanhol da variedade
de Buenos Aires e duas da variedade de espanhol de Santiago do Chile,
totalizando oito informantes, quatro para cada variedade estudada – dois
informantes do sexo masculino e dois, do sexo feminino. Totalizando, assim, 75
enunciados interrogativos, sendo 38 enunciados da variedade de Buenos Aires
e 37, da variedade de Santiago do Chile.
Estes 75 enunciados foram submetidos ao programa computacional de
análise acústica PRAAT (Boersma & Weenink 1993-2013) para que possamos
encontrar o contorno melódico dos mesmos. Para dar conta da análise fonética,
analisamos o comportamento da frequência fundamental (F0) no pré-núcleo e
86
4º Colóquio Brasileiro de Prosódia da Fala
no núcleo dos enunciados interrogativos. Para a análise fonológica, nos
baseamos na versão do modelo Sp_ToBI, Spanish Tones and Break Indices
(Estebas Vilaplana & Prieto 2008), que se baseia no modelo métricoautossegmental (AM) de Pierrehumbert (1980). Neste modelo a letra H (high)
representa um tom alto e a letra L (low), um tom baixo. O SP_ToBI constitui
uma nova proposta de etiquetagem prosódica da língua espanhola capaz de
representar os contrastes entonacionais encontrados em cada variedade.
Finalmente, os enunciados foram classificados pragmaticamente de
acordo com a função que os mesmos ocupam no discurso. Consideramos em
nossa investigação o modelo adotado por Hedberg et al. (2010) que prevê cinco
dimensões pragmáticas de acordo com cada instância em que se usam as
interrogativas – busca de informação (IS); mudança de turno (FP); mudança de
tópico (TC); interrupção (INT) e conteúdo proposicional (IR) – e nove
categorias pragmáticas utilizadas para classificar a função de cada pergunta no
discurso, a saber detalhe de elaboração, mudança de turno de fala, diretor do
fluxo de informação, pergunta retórica, pedido de informação suplementar,
iniciador de tópico, pergunta recíproca, pergunta esclarecedora e retomada de
tópico. Cada categoria foi identificada minimamente para que fosse diferente
das outras categorias em pelo menos uma das cinco dimensões.
3. Resultados Parciais
Os resultados parciais demonstram diferenças significativas entre os
enunciados interrogativos da variedade de Buenos Aires e de Santiago do Chile.
Para a primeira variedade, 47% dos 38 enunciados analisados apresentam
contorno melódico final com sílaba tônica alta seguida de tom de fronteira altodescendente (L+¡H*HL%). Ao passo que na variedade de Santiago do Chile,
78% dos 37 apresentam contorno melódico final com sílaba tônica alta seguida
de tom de fronteira ascendente (L+H*HH%).
Referências
Aguilar, L.; De-La-Mota, C.; Prieto, P. (coords). 2009. Sp_ToBI Training Materials.
Disponível em: http://prosodia.upf.edu/sp_tobi/en/
Blanche Benveniste, C. 1998. Estudios lingüísticos sobre la relación entre oralidad y
escritura. Barcelona: Gedisa Lea.
87
Caderno de Resumos
Briz, A. 2002. El español coloquial en la clase de E/LE. Madrid: SGEL.
B o e r s m a , P. & We e n i n k , D . 1 9 9 3 - 2 0 1 0 . P r a a t . D i s p o n í v e l e m :
http://www.fon.hum.uva.nl/praat/
Escandell Vidal, M. V. 1999. “Los enunciados interrogativos. Aspectos semánticos y
pragmáticos”. In: Bosque, I. & Demonte, V. Gramática Descriptiva de la Lengua
Española. Madrid: Espasa.
Estebas Vilaplana, E. Y Prieto, P. 2008. “La notación prosódica del español: una
revisión del Sp_ToBI”. In: Estudios de fonética experimental XVII. Barcelona:
Laboratori de Fonética de la Universidad de Barcelona.
Gabriel, C. et al.. 2010. “Argentinean Spanish Intonation”. In: Pietro, P. & Roseano, P.
(org.). Transcription of Intonation of the Spanish Language. Lincom Europa:
München.
Hedberg, N. et al.. 2010. Prosody and pragmatics of wh-interrogatives. In: HEIJL, M.
2 0 1 0 C L A C o n f e re n c e P ro c e e d i n g s . C a n a d á . D i s p o n í v e l e m :
http://homes.chass.utoronto.ca/~cla-acl/actes2010/actes2010.html
Kerbrat-Orecchioni, C. 2006 [1996]. Análise da conversação: princípios e métodos.
Tradução: Carlos Piovezani Filho. São Paulo: Parábola.
Ladd, D. R. 1996. Intonational phonology. Cambridge: CUP.
Ortiz, H. et al.. 2010. “Chilean Spanish Intonation”. In: Pietro, P & Roseano, P. (org.).
Transcription of Intonation of the Spanish Language. Lincom Europa: München.
Pierrehumbert, J. B. 1980. The phonology and Phonetics of English Intonation. Tesis
doctoral, MIT, Cambridge, Massachusetts.
Sosa, J. M. 1999. La entonación del español. Su estructura fónica, variabilidad y
dialectología. Madrid: Cátedra.
88
4º Colóquio Brasileiro de Prosódia da Fala
Relação entre prosódia e seus constituintes e a realização
de sândi vocálico externo na leitura
Ceriz Graça Bicalho Costa1, Camila Tavares Leite2
1
Faculdade de Letras, Universidade Federal de Minas Gerais, Brasil
2
Faculdade de Letras, Universidade Federal de Alagoas, Brasil
[email protected], [email protected]
Nosso trabalho tem como objetivo principal tratar a relação entre leitura,
organização prosódica e eventos de sândi vocálico externo. Em experimentos
com leitura em voz alta, Leite e Costa (2011) observaram que a velocidade de
leitura e a entoação são fatores que influenciam tanto a realização de sândi
quanto a organização dos constituintes prosódicos. No experimento realizado,
foi considerada como variável independente a velocidade de leitura e como
variáveis dependentes a quantidade de realizações do sândi em cada leitura, a
quantidade de sintagmas entoacionais em cada leitura e a organização temporal
de cada leitura. Participaram de tal experimento cinco informantes do sexo
feminino, pós-graduandas da Faculdade de Letras da UFMG. O corpus foi
constituído de três diferentes condições de leitura: a) na leitura 1, foi solicitado
às participantes que realizassem a leitura com velocidade normal; b) na leitura
2, as pesquisadoras pediram que as participantes lessem o texto em uma
velocidade rápida e c) na leitura 3, as participantes foram instruídas a realizar a
leitura como se fosse destinada a crianças. A preferência pelo termo
“velocidade” em detrimento de “entoação” se deveu ao fato de as informants
não terem conhecimento específico sobre a terminologia da Fonologia
Entoacional.
Esse experimento gerou um total de quinze leituras. Inicialmente, as
informantes leram o texto várias vezes para que se familiarizassem com ele. As
gravações foram realizadas na cabine acústica do LABFON/FALE da
Universidade Federal de Minas Gerais, em uma única sessão. Como resultados,
as pesquisadoras observaram que: a) o número de sintagmas entoacionais
(Nespor & Vogel 1986) realizados em cada leitura não sofreu variação
relevante, entretanto notaram que nas leituras 1 e 2, as participantes
89
Caderno de Resumos
apresentaram maior coincidência com relação à formação dos sintagmas. Na
leitura 1, foram encontrados 19 (dezenove) sintagmas entoacionais com
formação igual para todas as participantes, na leitura 2, esse número cai para 5
(cinco) sintagmas entoacionais iguais, e na leitura 3, sobe para 18 (dezoito) – as
autoras chamaram de sintagmas entoacionais iguais aqueles compostos pelas
mesmas palavras –; b) o número de ocorrência de sândi é maior na Leitura 2
(em média temos, na leitura 1 um total de 12; na leitura 2, 15; e na leitura 3, 13).
c) A taxa de articulação é maior na leitura 2, o que justifica o maior número de
sândi nesta leitura. Observando dados apresentados, Leite e Costa (2011) não
encontraram diferenças substanciais entre as três leituras, principalmente no
que diz respeito às leituras 1 e 3. Entretanto, sabe-se que há diferenças
importantes entre uma leitura considerada normal e uma destinada a crianças.
Vidal e Frota (2007) apresentam, como característica de um discurso destinado
a crianças, o fato de este discurso apresentar um menor número de palavras por
frase, um maior número de repetições e expansões, melhor articulação e menor
complexidade estrutural, além de uma prosódia particular, onde se verifica um
nível de F0 globalmente elevado, uma gama de variação estendida e
movimentos acentuados de F0, diminuição da velocidade do discurso, pausas
mais longas e frases mais curtas. No trabalho que ora propomos, temos como
objetivo apresentar as diferenças prosódicas existentes entre as leituras 1 e 3 e
as consequências dessas diferenças para a realização de sândi. Para isso,
analisamos as pausas e os tons de fronteira dos dados do experimento de Leite e
Costa (2011), além de contextos específicos nos quais há possibilidade de
realização de sândi.
Devido ao fato de a leitura 3 ser destinada a crianças, nossa hipótese se
baseia no fato de que a principal diferença entre as leituras 1 e 3 está na
atribuição de tons de fronteira, mais especificamente, esperamos encontrar
maior número de tons de fronteira alto, H%, em sintagmas entoacionais
intermediários, além de pausas mais longas entre estes sintagmas. Visto isso,
nossa análise se centra na observação do local e da duração das pausas e dos
tons de fronteira (Pierrehumbert 1980; Beckman & Pierrehumbert 1986; Ladd
1996), levando em consideração que estes tons estão associados a fronteiras de
sintagmas entoacionais. Ademais, foram destacados seis pontos do texto
analisado anteriormente por Leite e Costa (2011).
·
Então o cacique Itaki…
·
Até que um dia a filha do cacique…
·
Ficou vários dias enclausurada em sua tenda e pediu à Tupã que…
90
4º Colóquio Brasileiro de Prosódia da Fala
·
Aproximou-se da porta de sua oca e viu sua linda filhinha
sorridente…
·
Iaçã, inconsolável, chorou muito até desfalecer
·
…porém no rosto trazia ainda um sorriso de felicidade e seus olhos
negros fitavam...
Trata-se de ambientes específicos nos quais há possibilidade de ocorrência
de sândi e de segmentação de sintagma entoacional. Portanto, é um contexto em
que o sândi pode ou não ocorrer. Neste caso, interessa-nos também analisar o
porquê da não-ocorrência dos fenômenos de sândi nesses ambientes.
Como considerações a respeito de nossas análises, apontamos que de todos
os dados analisados (número de pausas no enunciado, número de sintagmas
entoacionais no enunciado, tempo de pausa entre os sintagmas entoacionais,
tempo de elocução do enunciado, tempo total de pausa no enunciado,
porcentagem de pausa no enunciado e tons de fronteira), apenas os tons de
fronteira e a pausa apresentaram diferença ao compararmos as leituras 1 e 3. Ao
contrário do que era esperado, encontramos maior porcentagem de tons baixos,
L%, na leitura 3 – leitura destinada a crianças – e, ao nosso ver, parece que esse
fator influenciou o tempo de pausa realizado durante a leitura. O tom de
fronteira baixo, por já ser um indicador de final de Enunciado, é suficiente para
apontar fronteira intermediária, não exigindo maior tempo de pausa.
Referências
Beckman, M. & Pierrehumbert, J. 1986. Intonational structure in English and Japanese.
Phonology Yearbook 3: 255-310.
Ladd, D. R. 1996. Intonational Phonology. Cambridge: Cambridge University Press.
Leite, C.T. & Costa, C. B. 2011. “O papel da prosódia na organização dos constituintes
prosódicos e sua importância na realização de sândi vocálico externo na leitura”. In
Anais do Colóquio Brasileiro de Prosódia da Fala: 18-21.
Nespor, M. & Vogel, I. 1986. Prosodic Phonology. Dordrecht: Foris.
Vidal,Maria M. & Frota,Sónia (a aparecer). 2007. “Influência da entoação na
compreensão do discurso em crianças com desenvolvimento normal e atraso de
desenvolvimento da linguagem”. In Revista Re-Habilitar, ESSA.
91
Caderno de Resumos
Marcação prosódica e status referencial em português
brasileiro
Cíntia Antão¹, Luciana Lucente ², Pablo Arantes³, Maria Luiza Cunha
Lima4
1
Faculdade de Letras, Universidade de Minas Gerais, Brasil
Departamento de Letras, Universidade Federal de Minas Gerais,
Brasil
3
Departamento de Letras, Universidade de São Carlos, Brasil
2,4
[email protected],[email protected], [email protected],
[email protected]
Este trabalho tem por objetivo analisar como diferentes posições
sintáticas podem influenciar na marcação prosódica do status informacional. O
status informacional, ou status da informação, de uma palavra ou expressão, é
definido em um contexto discursivo pelo fato de uma palavra estar inserindo
uma informação nova ou já presente neste contexto. Por exemplo, em uma
comunicação, os participantes vão gradativamente inserindo novas
informações em seu discurso. Essas informações podem ser totalmente novas,
sem nunca terem sido mencionadas no discurso ou podem se relacionar com
informações anteriormente já mencionadas. A estrutura da informação, de
acordo com Chafe (1976) e Haviland e Clark (1974), foi no início das pesquisas
nessa área tradicionalmente dividida da seguinte forma: a) informação dada:
previamente mencionada no discurso; b) informação nova: ainda não
apresentada no discurso. Essa classificação, por definir o status informativo em
apenas duas classes possíveis reflete apenas ideias opostas, sem itens
intermediários de catalogação.
Trabalhos mais recentes, como o de Gundel et al. (1993), propõem um
refinamento a mais nessa divisão. A autora apresenta em sua proposta de
taxonomia níveis intermediários de acessibilidade. Por basear-se na saliência
do referente em relação aos interlocutores, foi possível uma classificação ampla
e aplicável a diferentes idiomas, como o inglês, o espanhol e o japonês. Ainda
92
4º Colóquio Brasileiro de Prosódia da Fala
segundo a autora, o estabelecimento do status referencial de um sintagma
envolve diversos fatores linguísticos e discursivos, entre os quais, os contornos
prosódicos. Como novidade, em sua taxonomia, para além das informações
novas e dadas, Gundel apresenta, entre outros, o referente acessível - que não
chega a ser uma informação nova, mas também não funciona como uma
informação dada, uma vez que pode ser acessado com o auxílio do contexto.
Para melhor exemplificar, temos as frases, retiradas de Delfino et al. (2013), a
seguir:
a) Ninguém visitou a praça durante a reforma. O monumento custou
muitos recursos públicos. (acessível)
b) Os vândalos quebraram o monumento durante a noite. O
monumento custou muitos recursos públicos. (dado)
c) O jornal denunciou a corrupção na secretaria. O monumento custou
muitos recursos públicos. (novo)
Algumas línguas têm esta interação entre prosódia e status informacional
muito bem descritas, como é o caso do alemão. Baumann (2006) e Baumann e
Riester (2010) verificaram que, como esperado, as informações novas são
prosodicamente mais proeminentes e as informações dadas menos. No caso
dos referentes acessíveis, a marcação se dá em níveis intermediários.
Schumacher e Baumann (2010) foram um pouco além e investigaram como é
processado o status informacional de um referente combinado com três
diferentes tipos de realizações prosódicas – uma entoação apropriada e duas
inapropriadas. Os dados comprovaram que os participantes do experimento
utilizavam as informações prosódicas para interpretar as sentenças. O ouvinte
pode estranhar, por exemplo, a prosódia de um referente novo em um sintagma
cujo status informacional fosse dado.
Já em português brasileiro (PB), pesquisas realizadas por Arantes et al.
(2012) e Delfino et al. (2013) descreveram os parâmetros prosódicos do status
referencial em PB e observou-se diferença de saliência entre referentes novos e
dados, mas não entre aqueles tipos de referentes e os acessíveis. Dado e
acessível se comportam de maneira extremamente parecida e, por isso, nesta
pesquisa não trabalharemos com os referentes acessíveis. Além da saliência
referencial, também deve-se levar em conta a contribuição da posição sintática
do referente para a saliência informacional. Sujeito e objeto tem diferenças de
saliência e referentes dos dois tipos podem acontecer nas duas posições
sintáticas.
93
Caderno de Resumos
Além do objetivo supracitado de investigar o comportamento do
contorno prosódico de referentes novos e dados em posições sintáticas
distintas, este trabalho visa analisar se a posição no início absoluto da sentença
para sujeitos em condição de novo altera o efeito prosódico. Para tanto,
construimos estímulos iniciados com um sintagma adverbial, como
exemplificado a seguir:
d) Um casamento pouco ortodoxo foi prestigiado pelos frequentadores
da paróquia. O casamento foi lindo.
e) Recentemente, um casamento pouco ortodoxo foi prestigiado pelos
frequentadores da paróquia. O casamento foi lindo.
Apresentaremos dois tipos de experimentos: um de produção e outro de
percepção. No experimento de produção relataremos os resultados
combinando duas variáveis, a sintática (sujeito, sujeito não inicial e objeto) e a
referencial (novo e dado). Para realização do experimento foram criadas 144
pequenas narrativas formadas por duas frases em sequência. Os referentes são
palavras paroxítonas com 4, 5 e 6 sílabas. Referentes novos foram introduzidos
no sujeito, depois de um sintagma adverbial ou no objeto da primeira frase e
retomados na frase seguinte tanto no sujeito quanto no predicado.
Ao todo, foram gravados quatro sujeitos, dois do sexo feminino e dois do
sexo masculino, com idades entre 21 e 32 anos. Todos são de Belo Horizonte e
realizaram a tarefa voluntariamente. Cada um deles gravou duas versões das
sentenças em uma cabine anecóica no Labfon - Laboratório de Fonética da
FALE/UFMG. As frases eram introduzidas através de uma apresentação de
Powerpoint e depois de lida o próprio sujeito deveria clicar na tecla para que a
outra sentença aparecesse. Cada gravação durou em média 90 minutos, por
isso, foram realizados algumas pausas – normalmente 3, com intuito de não
alterar o ritmo de leitura do participante. Gravamos, analisamos e fizemos as
segmentações das sentenças com o programa Praat.
Os resultados mostram que, na posição de objeto, o contorno entoacional
dos referentes é bastante semelhante qualquer que seja seu status referencial.
Os referentes novos, tanto em posição de sujeito quanto em posição de sujeito
não inicial, tendem a apresentar um movimento tonal de maior amplitude em
relação àquele observado quando o referente está em posição de objeto.
Referentes dados tendem a apresentar um contorno pouco expressivo. As
diferenças de proeminência prosódica apontadas na literatura podem ser
encontradas em português, mas parecem ser próprias da posição de sujeito. A
94
4º Colóquio Brasileiro de Prosódia da Fala
posição de objeto parece neutralizar a ação da prosódia no sentido de distinguir
os dois valores de status referencial. A verificação desta interação põe um
desafio para as teorias de saliência, que precisarão explicar as causas
subjacentes deste fenômeno.
O outro experimento realizado foi o de percepção. Foram utilizadas as
mesmas frases do experimento anterior, mas em número um pouco reduzido, 48
sentenças no total. Com o script já montado na plataforma Sgizmo, era pedido
ao participante que fizesse uma leitura silenciosa das sentenças e imaginasse
que estaria lendo-as em voz alta. Por fim, deveria marcar qual das duas
ocorrências falaria de forma mais proeminente. De maneira geral, estes
resultados corroboram com os resultados do primeiro experimento. A posição
sintática de sujeito, sendo ele inicial ou não, parece prevalecer. Ela se destaca
como detentora da proeminência prosódica, independente do status
informacional de novo ou dado. Ao se comparar as sentenças com objeto novo e
objeto dado percebe-se que os resultados são muito parecidos e não
apresentaram diferença significativa. Fazendo a mesma comparação com a
posição sintática de sujeito, observou-se que em todos os casos em que ele é
dado a curva entoacional é mais proeminente do que quando ele é novo.
Resultado também encontrado no trabalho de Lucente (2012), que pesquisou,
dentre outros, os aspectos dinâmicos da fala e da entoação em relação ao dado e
novo em fala espontânea. Podemos perceber que há uma certa coerência entre a
fala espontânea e a fala de laboratório em relação à interação entre prosódia e
status informacional.
Referências
Arantes, P. et al. 2012. Some prosodic correlates of referential status in Brazilian
Portuguese. Diadorim (Rio de Janeiro) 12 (1).
Baumann, S. 2006. The Intonation of Givenness – Evidence from German.
Linguistische Arbeiten, 508. Tübingen: Niemeyer.
Baumann, S. & Riester, A. 2010. “Referential and Lexical Givenness: Semantic,
Prosodic and Cognitive Aspects”. In Elordieta, G. & Prieto, P. (eds.) Prosody and
Meaning. Berlin, New York: Mounton de Gruyter. Trends in Linguistics.
Chafe, W. 1976. Givenness, Contrastiveness, Definiteness, Subjects, Topics and Pointi
of View. In Li, C. (Ed.), Subject and Topic. New York: Academic Press: 25-26.
Delfino et al. 2013. “Prosodic marking of referential status in Brazilian Portuguese”. In
Proceedings of Production and perception of prosodically-encoded information
structure. Workshop. Postdam, Alemanha.
95
Caderno de Resumos
Gundel, J. et al. 1993. Cognitive Status and the Form of Referring Expressions. In
Discourse. Language 69 (2): 274-307.
Haviland, S. E. & Clark, H. 1974. What's New? Acquiring New Information as a
Process in Comprehension. Journal of Verbal Learning and Verbal Behavior 13:
512-521.
Lucente, L. 2012. Aspectos dinâmicos da fala e da entoação do português brasileiro.
2012. Tese (Doutorado) – Instituto de Estudos da Linguagem, Universidade
Estadual de Campinas, São Paulo.
Schumacher, P. & Baumann, S. 2010. Pitch accent type affects the N400 during
referential processing. In NeuroReport 21 (9): 618-622.
96
4º Colóquio Brasileiro de Prosódia da Fala
Experimento de produção sobre a prosódia da não
exaustividade semântica no português brasileiro
1
2
Daise Ribeiro Pereira Carpes , Juan Manuel Sosa , Izabel Christine
Seara 1
1
2
Pós-Graduação em Linguística, UFSC, Brasil
Pós-Graduação em Linguística, UFSC, Brasil / Simon Fraser
University, Canadá
[email protected], [email protected], [email protected]
1. Introdução
Este estudo configura-se em um experimento sobre a prosódia da não
exaustividade semântica no português brasileiro (PB). Neste experimento,
analisamos curvas de pitch de sentenças com foco não exaustivo, comparandoas com curvas de sentenças com focos exaustivo e contrastivo.
2. Os focos investigados
Uma sentença com foco não exaustivo é aquela cuja proposição não é a
única afirmação verdadeira para o que se está dizendo. Quando um falante
oferece uma resposta não exaustiva a uma pergunta, essa resposta informa
aquilo que o falante tem certeza de ser verdade, sem excluir outras possíveis
respostas que possam também preencher o que está em aberto. Vejamos um
exemplo. Um falante enuncia:
(1) “Hoje eu almocei filé mignon.”
Com a sentença em (1), o falante não está necessariamente afirmando
que comeu apenas filé mignon e mais nada. Ele certamente comeu outras coisas,
mas quis destacar o filé mignon em sua enunciação. Ele poderia ter dito:
97
Caderno de Resumos
(2) “Eu almocei filé mignon, além de outras coisas.”
Todavia, acreditamos que, no contexto em que ocorreu a sentença em (1),
a entoação seja suficiente para evidenciar que o complemento “além de outras
coisas” é desnecessário. Isso é o que nos propusemos a verificar empiricamente
nesta pesquisa.
Para que possamos investigar se há entoação particular para o foco não
exaustivo, vamos comparar sua curva de pitch com as de sentenças com focos
exaustivo e contrastivo, para averiguar se as curvas não se confundem.
O foco exaustivo cancela todas as demais alternativas ou asserções para a
situação a que se refere. Por exemplo, na sentença:
(3) “Eu nasci em Florianópolis.”
temos foco exaustivo, porque o falante que enuncia essa sentença não
pode ter nascido em Florianópolis e em outra cidade.
Já o foco contrastivo corrige uma asserção ou um pressuposto do
interlocutor. Vejamos um exemplo. Um falante diz a outro:
(4) “Tu és filho do Pedro.”
Se não for verdade que o ouvinte é irmão do Pedro, então ele vai corrigir a
afirmação, dizendo:
(5) “Eu sou filho do João.”
Em (5), temos foco contrastivo. Assim, pretendemos investigar se a
compreensão do foco não exaustivo e, por conseguinte, do exaustivo e do
contrastivo, é de caráter puramente pragmático ou se a prosódia também tem
papel preponderante nesse processo. Esse é um tema ainda pouco explorado
nos estudos linguísticos do português, seja ele brasileiro ou europeu.
Para avaliar as curvas apresentadas por esses três tipos de foco, bem
como observar semelhanças e diferenças entre eles, montamos um experimento
de produção em que as situações gravadas eram adequadamente
contextualizadas.
Sem nos aprofundarmos muito, podemos dizer que o foco semântico é
um recurso que o falante usa para dar destaque a um trecho do seu enunciado ao
qual deseja que o ouvinte dê atenção especial (Klein, 2003; Menuzzi, 2012).
98
4º Colóquio Brasileiro de Prosódia da Fala
Falantes de línguas como o português, o inglês, o espanhol, o italiano e o
francês, por exemplo, utilizam algum tipo de marcador prosódico/melódico
para fazer indicações aos seus interlocutores a respeito das entidades focadas
nas sentenças que proferem. Além de a prosódia marcar o elemento focalizado
na sentença, ela parece indicar o tipo de foco desse elemento. Para uma melhor
compreensão, tomemos a situação em (6):
(6) (a) Maria chegou a [MACEIÓ] em outubro.
(b) Maria chegou a Maceió em [OUTUBRO].
Se o acento prosódico incidir sobre Maceió (6a), a sentença veicula a
informação de que Maria chegou a Maceió e não a outra cidade. Se, por outro
lado, o acento estiver sobre outubro (6b), então a informação nova e focalizada
será referente a quando Maria chegou. Os casos ilustrados em (6) podem
representar foco exaustivo ou contrastivo. Isso porque não temos aqui o
contexto em que essas frases foram enunciadas. O foco será exaustivo se a
informação focalizada for nova no contexto conversacional. Tal foco ocorre,
por exemplo, quando (6b) for resposta a uma pergunta como “Quando Maria
chegou a Maceió?”, pois a informação nova (outubro) está focalizada. Mas o
foco poderá ser contrastivo se a informação focalizada estiver corrigindo uma
informação dada pelo interlocutor. Por exemplo, corrigindo uma afirmação
como “Maria chegou a Maceió em agosto”. Ao proferir (6b), o falante estará
retificando uma asserção de seu interlocutor.
Há uma relação entre o foco de uma sentença e o seu acento principal,
que é também chamado de acento nuclear. Nesse caso, há uma proeminência do
pitch nos constituintes focalizados. Qualquer que seja o tipo de foco, o
constituinte focalizado da sentença deve conter a palavra com maior
proeminência da frase.
3. Perguntas de pesquisa e hipóteses
Nossa pergunta de pesquisa principal é: a curva entonacional seria
suficiente para marcar a não exaustividade, ou um elemento lexical seria
imprescindível para a sua percepção por parte do interlocutor? Nossa hipótese é
a de que o foco não exaustivo seria marcado pela prosódia, por meio de uma
curva específica para esse caso.
99
Caderno de Resumos
Uma segunda questão é colocada: os três tipos de foco aqui investigados
teriam uma curva entonacional particular que os caracterizasse ou seria
necessário o uso de um marcador lexical? Nossa hipótese é a de que haveria a
necessidade de um marcador lexical para os focos contrastivo (“não”) e
exaustivo (“só”).
4. Metodologia
Assim, para investigar aquilo que identifica uma sentença como tendo
foco não exaustivo, exaustivo ou contrastivo, coletamos sentenças com os três
tipos de foco nas quais se tem o mesmo conteúdo segmental (mesmas palavras),
na modalidade declarativa, e na mesma ordem sintática.
Para essa coleta, os sujeitos ouviam, para cada sentença a ser produzida,
três situações que contextualizavam, respectivamente, uma sentença com foco
não exaustivo, outra com foco exaustivo e uma terceira com foco contrastivo.
Essa estratégia metodológica foi repetida quatro vezes, a partir de situações que
levavam à geração de sentenças com os três tipos de foco. Isso resultou em 12
frases – quatro para cada tipo de foco analisado. Esse teste foi aplicado a oito
sujeitos, perfazendo um total de 96 sentenças (8 sujeitos × 4 situações × 3 tipos
de foco).
5. Resultados
Os resultados mostraram que, de forma geral, todas as curvas apresentam
um importante movimento descendente final com tom de fronteira L%,
semelhante aos contornos finais das declarativas. No entanto, diferentemente
das declarativas neutras, essas curvas exibem um pitch range muito mais
amplo, frequentemente chegando a uma oitava entre a pré-tônica e a tônica do
núcleo.
Na análise detalhada dos dados, observamos separadamente o pré-núcleo,
considerado a primeira sílaba acentuada do enunciado (no presente corpus,
sempre o sujeito das sentenças), e o núcleo, visto como o movimento na última
sílaba acentuada das sentenças (no sintagma nominal focalizado na sentença) e o
tom de fronteira.
Os dados mostraram dois padrões que ocorrem predominantemente. O
primeiro, para sentenças com foco não exaustivo, apresenta o pré-núcleo baixo
100
4º Colóquio Brasileiro de Prosódia da Fala
(L*) e o núcleo ascendente–descendente, com o movimento concentrado na sílaba
tônica (¡H*L%). O segundo, para sentenças com foco exaustivo ou contrastivo,
exibe um pré-núcleo alto (H*) e um núcleo com uma sílaba pré-tônica com um
tom muito alto (H) em sua maioria, bem como um movimento descendente na
sílaba tônica, com tom nuclear L*L%, conforme ilustra a Figura 1.
a)
b)
101
Caderno de Resumos
c)
Figura 1. Produções referentes às curvas de pitch de sentenças com: (a)
foco não exaustivo; (b) foco exaustivo; (c) foco contrastivo.
6. Considerações finais
Esses resultados vão ao encontro das hipóteses levantadas, ou seja, para a
identificação do foco não exaustivo, parece que apenas a curva entonacional já
é suficiente. No caso de sentenças com foco exaustivo ou contrastivo, parece
haver a necessidade do uso de itens lexicais para a sua diferenciação e também
do contexto em que a sentença foi produzida.
Paralelamente, estamos dando andamento a testes de percepção para
avaliarmos como os ouvintes identificam e classificam as sentenças que foram
produzidas neste estudo.
Referências
Klein, S. 2003. “Foco no português brasileiro.” In Müller, A. L., Negrão, E. V. &
Foltrão, M. J. (Org.) Semântica formal. São Paulo: Contexto.
Menuzzi, S. M. 2012. “Algumas observações sobre foco, contraste e exaustividade.” In
Revista Letras. 86. jul./dez. Curitiba: Editora UFPR: 95-121. Disponível em:
<http://ojs.c3sl.ufpr.br/ojs2/index.php/letras/article/viewFile/29909/19907>.
Acesso em: 2 mai. 2013.
102
4º Colóquio Brasileiro de Prosódia da Fala
Formulações na Corte: a prosódia em ações de checagem
de entendimento e de requisição de prestação de contas
Daniela Negraes P. Andrade1, Ana Cristina Ostermann1 , Minéia
Frezza1
1
Programa de Pós-Graduação em Linguística Aplicada, UNISINOS,
Brasil
[email protected], [email protected], [email protected]
Como se sabe, o/a juiz/a é o/a representante institucional do poder
judiciário a quem cabe o dever de dizer o direito em caso de crime concreto. A
decisão do/a juiz/a é tomada com base em provas. Como resume Tourinho Filho
(2008), “o objetivo ou finalidade da prova é formar a convicção do juiz sobre os
elementos necessários para a decisão da causa” (p. 327). Em casos de crimes
penais que não atentam contra a vida, é nas audiências de instrução e nas
audiências de interrogatórios que a prova é construída. A construção da prova,
nesses eventos, é realizada por meio da fala-em-interação no momento em que
os/as depoentes são interrogados. Em determinadas ocasiões, ao inquirir
depoentes, o/a juiz/a pode desafiá-los/as acerca de suas versões dos fatos.
Tanto em contextos de fala mundana (também conhecida como “fala
cotidiana”), quanto em contextos de fala institucional, a análise prosódica
interacional tem-se provado “indispensável para a descrição da organização e
funcionamento da interação social” por duas razões fundamentais: (a) “porque
a prosódia sempre coocorre com a gramática (morfossintaxe) e o léxico” e,
portanto, “é sempre coconstitutiva da expressão e realização dos significados
interacionais” e (b) [porque] “em alguns casos, a prosódia cumpre uma função
'distinta' na produção de significados interacionais” (Selting 2010: 5-6; nossa
tradução, ênfase da autora). Alinhado a essa perspectiva, este trabalho
investiga, à luz dos pressupostos teórico-metodológicos interacionais da
Análise da Conversa de base Etnometodológica (Sacks et al. 1974; Garfinkel
1967) e da Linguística Interacional (Couper-Kuhlen e Selting 1996), e por meio
da análise prosódica baseada em dados interacionais (Couper-Kuhlen e Selting
1996; Szczepek Reed, 2011; Steensig e Larsen 2008), o fenômeno específico da
103
Caderno de Resumos
“formulação” (Heritage e Watson 1979; Deppermann 2011) em ocorrência no
ambiente institucional jurídico.
A formulação é uma prática que “possibilita aos coparticipantes
estabelecer uma entre as muitas possibilidades de interpretação daquilo que
eles estiveram falando” (Heritage e Watson 1979: 123, nossa tradução). A ação
de formular, conforme descrevem Heritage e Watson (1979), pode ser
realizada, tanto pelo/a participante que está informando algo (news deliver),
quanto pelo/a participante que está sendo informado/a de algo (news recipient).
Além disso, ainda de acordo com esses autores, as formulações podem ser de
dois tipos: gist e upshot. Na formulação do tipo gist, o falante preserva, apaga e
transforma algo que foi dito no(s) turno(s) anterior(es). Ostermann e Silva
(2009) sustentam que a “preservação” está ligada à conservação do sentido
geral daquilo que foi dito, enquanto o “apagamento” e a “transformação”
incidem sobre, pelo menos, parte do que foi falado. Em relação à formulação do
tipo upshot, Antaki et al. (2005) argumentam que as ações de fala são
direcionadas de modo a extrair uma implicação daquilo que foi dito. Quando
comparadas às formulações do tipo gist, as formulações do tipo upshot se
caracterizam por apresentarem maior grau de interpretação (i.e. de menor
“preservação” do sentido geral). Ambos os tipos de formulação são de interesse
do presente estudo.
Acreditamos que a compreensão de como a prática da formulação é
coconstruída também em seus padrões prosódicos, pode contribuir para os
estudos de fala-em-interação em língua portuguesa. Quando investigada em
ambientes institucionais jurídicos, a compreensão sobre como os interagentes
operam com esse recurso interacional pode ter efeitos práticos para os
expedientes dos profissionais do Direito.
Argumentamos que a prática interacional de formular, no contexto
investigado, performa duas ações específicas: (1) checar entendimentos e (2)
desafiar o interlocutor a prestar contas, em particular, quanto à veracidade de
suas asserções. A análise evidencia que a construção do turno onde reside a
formulação varia em termos prosódicos e demostra ser marcada de acordo com
a ação desempenhada local e situadamente na interação. Para o
desenvolvimento das análises interacionais e prosódicas investigamos a fala de
uma juíza em interação com três depoentes diferentes. O caráter desafiador que
a formulação pode assumir, passível de ser observado na sequencialidade da
conversa, dá-se em função do espaço interacional aberto a partir da construção
do turno onde a formulação ocorre, cuja ação feita relevante – no próximo
turno, do/a próximo/a falante – é justamente a de prestar contas. O termo
104
4º Colóquio Brasileiro de Prosódia da Fala
“prestação de contas” é uma tradução tentativa para o termo correlato em língua
inglesa accountability (GARCEZ, 2008: 27). O termo accountability foi
cunhado por Garfinkel (1967: 225) para referir-se ao fato de que os atores
sociais, enquanto membros/as pertencentes a uma sociedade organizada,
orientam-se para “a ordem moral percebida como cursos normais de ação.”
Conforme explica Heritage (1984: 191), “os fatos sociais são tratados como
'factuais', 'naturais' e 'regulares' e como fenômenos para os quais é esperado que
o/a membro/a atente-se, e que os leve em consideração e respeite” nossa
tradução, ênfase no original) quando em situação de interação com outrem.
Sempre que a ordem social baseada no senso comum for quebrada, seja pela
sequencialidade interacional ou por motivos morais, cria-se uma expectativa de
que o/a falante tome esse espaço para prestar contas de modo a reconstituir a
regularidade interacional e/ou moral.
A ação de prestar contas, segundo explica Garcez (2004: 27), baseado em
Sacks (1992), está relacionada com a “produção de conduta que seja
evidentemente razoável, para todos os efeitos práticos, segundo o julgamento
que outros membros fariam se estivessem na conjuntura em que se encontra o
autor.” Em outras palavras, prestar contas significa justificar-se, explicar-se,
pedir desculpas ou empreender alguma outra fala que demonstre a orientação
dos/as participantes para um possível problema, seja de ordem moral, seja de
ordem racional ou, ainda, de ordem prática, frente ao que foi dito.
Nos dados aqui investigados, percebe-se que as palavras-chave para o
entendimento ou confrontação dos turnos da juíza foram produzidas de forma
prosodicamente proeminente em relação ao contexto anterior e posterior de sua
ocorrência. Especificadamente, no contexto local e situado das interações
analisadas, as palavras-chave, as que denotam o centro da checagem de
entendimento e/ou o requisição de prestação de contas nas formulações da
juíza, são produzidas em tons consideravelmente maiores do que as palavras de
menor valor semântico para cada ação em questão. Os/as ouvintes, dessa forma,
foram direcionados/as a interpretar os turnos da juíza baseados no valor
semântico que a prosódia dos termos salientes indicara. Assim, ousamos
afirmar que as características prosódicas observadas, quais sejam, picos de tons
ascendentes nas palavras-chave das ações das formulações nos turnos da juíza,
operam como “contextualizadoras” (Gumperz 1982) das ações que estão sendo
performadas, quais sejam, (1) formular para checar entendimento e (2)
formular para solicitar prestação de contas como forma de confrontação. Isso
foi percebido, primeiramente, pelo indício de que as ações interacionais estão
embasadas na ênfase dos termos a serem confirmados ou desconfirmados
105
Caderno de Resumos
pelos/as interrogados/as e, em seguida, pela orientação dos/as interrogados/as a
proverem a segunda parte do par adjacente conforme a expectativa gerada pelos
turnos antecedentes.
Para finalizar, embora entendamos que o estudo proposto inaugura a
incorporação da análise prosódica às análises conduzidas pelo viés da Análise
da Conversa de base Etnometodológica no Brasil, que tem negligenciado essa
parte constituinte tão essencial das ações sociais empreendidas na fala-eminteração, reconhecemos suas limitações. Dentre algumas perguntas que
possam surgir com relação ao fenômeno observado no contexto do uso do
português brasileiro, propomos as seguintes: (a) Como, em termos
comparativos, se dão as marcas prosódicas em situações em que um/uma
falante desafia o/a outro/a através do uso da formulação que requer prestações
de conta, porém em contexto de fala-em-interação cotidiana (e.g. um pai ou
uma mãe desafiando o/a filho/a); (b) As marcas prosódicas observadas na fala
da juíza ocorrem em situações semelhantes experienciadas por outros/as
juízes/as ou essa é uma marca característica da fala dessa juíza em particular?;
(c) Como se dão as marcas prosódicas em situações afins, porém em outro
contexto institucional (e.g. entrevistas jornalísticas)? Sendo assim, a partir
desse estudo, esperamos alavancar a discussão envolvendo análise prosódica e
a Análise da Conversa Etnometodológica em conjunto com a Linguística
Interacional sinalizando algumas linhas de investigação que se encontram em
aberto no Brasil.
Referências
Couper-Kuhlen, E.; Selting, M. (eds). 1996. Prosody in conversation: interactional
studies. New York: Cambridge University Press.
Ehrlich, S.; Sidnell, J. 2006. “I think that's not an assumption you ought to make”:
challenging presuppositions in inquiry testimony. Language in Society 35 (5): 655676.
Freed, A. F.; Ehrlich, S. (eds). 2010. Why do you ask: the function of questions in
institutional discourse. New York: Oxford University Press.
Reed, B. S. 2011. Analyzing conversation: an introduction to prosody. New York:
Palgrave Macmillan.
Sacks, H. 1992. Lectures on conversation. Oxford: Blackwell.
106
4º Colóquio Brasileiro de Prosódia da Fala
A expressividade na locução do telejornal: uma questão
prosódica
Dilma Tavares Luciano¹
¹Departamento de Letras/Centro de Artes e Comunicação,
Universidade Federal de Pernambuco, Brasil
[email protected]
1. Introdução
Este estudo trata da prosódia na locução do telejornal e das implicações
na compreensão de telespectadores. Para tanto, propõe uma primeira
caracterização do comportamento prosódico de locutores dos principais
telejornais brasileiros, objetivando responder a questão de como a prosódia
participa do processo de textualização das notícias com a leitura em voz alta
(LVA), vindo a influir na compreensão do ouvinte.
Parte dos pressupostos de que usar a língua é uma atividade estratégica e
intencional, mesmo em uma LVA, e de que a compreensão é um processo
interpretativo que instancia uma construção de sentido possível, para o qual
concorrem fatores objetivos e subjetivos (cf Marcuschi 1989).
2. Aparato teórico
Os modelos teóricos de Bennett e Dressler (1982), Brazil (1985) e
Gumperz (1982), revisitados à luz de Barth-Weingarten, Dehé e Wichmann
(2009), permitiram a identificação da expressividade na voz dos locutores,
observada em seus efeitos semântico-discursivos.
Entende-se que a expressividade na LVA reflete a legibilidade do texto
no processo de textualização durante a locução das notícias. Assim, por um
lado, a expressividade é um atributo do texto que tem assegurada a textualidade
(cf. Beaugrande & Dressler 1981) na superfície textual e, por outro, está no
texto e é percebida ao longo do processamento online durante a leitura (em voz
107
Caderno de Resumos
alta ou não). Neste caso, a ilegibilidade decorre de lacunas nos domínios de
conhecimento do leitor (cf. Koch 1997; Van Dijk 1992), quando o texto
demonstrar equilíbrio em ambos os domínios de estratégias de processamento,
o de formulação textual e o de envolvimento (cf. Chafe 1982). Na locução do
telejornal, a legibilidade consiste, pois, num processo complexo que envolve a
estrutura textual (forma e funções dentro do sistema, diz respeito à estrutura
gramatical) e o uso consciente que o leitor/locutor faz das estratégias de
manipulação desse sistema (processo metalinguístico, envolve a estrutura
ilocutória e a interacional) e está intrinsecamente relacionada aos tipos de
padrões expressivos usados na leitura. Para a LVA ser expressiva, o locutor terá
a sua disposição duas formas de ação sobre o objetivamente inscrito no texto:
estruturando de modo particular a matéria fônica; e realçando/acrescentando
significados por meio da substância fônica e do jogo de pausas.
Desse modo, acredita-se que a LVA dos telejornais fundamenta-se no
princípio da expressividade, proposto por Searle (1969), o qual estabelece que
é possível ao falante dizer exatamente o que ele desejar e demonstrar sua atitude
para com o dito. E o leitor/locutor reconhece esta condição do escrito. Tomando
os atos de fala como unidade básica da comunicação, Searle reconhece a
existência de regras constitutivas e de regras regulativas no uso da língua, a
partir das quais é possível perceber a habilidade que todo e qualquer falante
possui de operar com a língua por meio de atos enunciativos, proposicionais e
ilocucionários, suscetíveis às condições de produção e de comunicação. As
regras constitutivas permitem a criação ou definição de novas formas de
comportamento linguístico adequado às situações comunicativas, enquanto as
regulativas são aquelas que controlam/regulam as formas existentes,
independentemente da situação. Com base nesse princípio, assume-se a LVA
como um processo de retextualização e busca-se entender que aspectos da
elocução são constitutivos da fluência discursiva do leitor, aquela que colabora
com a compreensão do ouvinte, juntamente à fluência sintática. De certa forma,
a fluência no plano sintático revela um conjunto de convenções da língua, ao
passo que no plano discursivo, a fluência na LVA resulta de decisões de
atribuição de sentido situativamente condicionada, o que significa que está
subordinada mais diretamente à compreensão do próprio leitor e ao seu
envolvimento com o texto, marcando-lhe uma expressão (cf. Chafe 1982).
Para identificar esse aspecto na locução, a análise dos dados seguiu o
modelo de Brazil (1985), com base no qual se observa a incidência de
proeminências que são determinadas no domínio de três variáveis - a base, a
terminação e o tom - e as quais se constituem de dois traços distintivos: a
108
4º Colóquio Brasileiro de Prosódia da Fala
diversidade de tons (dois tons ascendentes, denominados tons alusivos - r e r+;
dois descendentes, ou tons informativos - p e p+; e um tom neutro, ou no nível o) e a variação de nível tonal. Distribuídos em unidades tonais (TU), a cada um
desses tons são atribuídos valores comunicativos de natureza informativa ou
interacional. Os tons descendentes recaem sobre elementos considerados pelo
falante como informação nova, ficando os tons ascendentes para as alusões a
conteúdos partilhados pelos interactantes, servindo de ancoragem textual para
os conhecimentos novos. A esses tons podem ser atribuídas funções
específicas, que podem ser: (a) informativa da natureza do dito; (b) indicativa
de entrega de turno; (c) informativa da natureza da contribuição a ser dada pelo
ouvinte; e (d) avaliativa da contribuição do ouvinte. Resumidamente, são as
funções organizacional, social e informativa (propriamente dita).
Acredita-se, assim, com Bennett e Dressler (1981), na existência de uma
forma prosódica em harmonia com o nível léxico-gramatical do discurso, capaz
de determinar a intenção comunicativa do falante/leitor. Esses pesquisadores
propõem uma teoria da compreensão com base na identificação das funções
comunicativas exercidas pelos aspectos prosódicos, sugerindo duas dimensões
gerais de análise, as quais acreditam serem válidas também para a LVA: a
dimensão horizontal e a dimensão vertical. Na dimensão horizontal da
prosódia, observam-se os efeitos causados pela segmentação em níveis tonais e
pela diferença de um grupo para outro em volume (crescendo/decrescendo). A
dimensão vertical, por sua vez, refere-se à segmentação em unidades tonais, às
proeminências e à tonicidade dos grupos tonais.
Assim, foram assumidas duas ordens de observação da prosódia: (i) as
determinações sintáticas e semânticas, caracterizando a coesão prosódica, e (ii)
na perspectiva funcional, a caracterização do contorno entoacional.
3. Metodologia
Compôs o banco de dados para análise prosódica, gravações de duas
edições dos noticiários televisivos exibidos em Recife e 14 edições dos
telejornais exibidos em rede nacional, distribuídas equitativamente entre as
quatro emissoras de maior audiência brasileira. Esse material permitiu a
identificação tipológica da composição textual das notícias e do
comportamento prosódico peculiar a cada tipo, o qual foi submetido a teste
preliminar de compreensão, consistindo na exibição uma a uma das notícias
109
Caderno de Resumos
prototípicas a cada um dos informantes, após o que se indagou acerca do
conteúdo da notícia. Em seguida à síntese de cada participante, foram feitas
perguntas pontuais fundadas em palavras-chave ou expressão primordial para a
compreensão de cada notícia.
Para a composição do corpus, os resultados preliminares obtidos
serviram à produção de uma pequena edição de telejornal (no laboratório de
Comunicação do Centro de Artes e Comunicação, da UFPE), dessa vez com a
manipulação da LVA, feita por locutores convidados para participar da
construção do material de teste de compreensão final. Essa edição manipulada
compôs-se de cinco notícias, com dois locutores, após observação e exercício
da LVA, conforme os padrões prosódicos encontrados na análise. Com essa
edição de telejornal, os informantes foram submetidos a novo teste de
compreensão.
4. Resultados
A análise prosódica permitiu verificar a existência de dois tipos básicos
de expressividade na locução, que foram denominadas leitura natural (LN) e
leitura padrão (LP), observados com base na noção de contextos interativos
entoacionais, de Brazil (1985) e na análise das proeminências no eixo
horizontal e das estratégias de oralidade no eixo vertical, conforme Bennett e
Dressler (1982). Esses tipos foram submetidos a teste de compreensão com 72
informantes, distribuídos em dois grupos em função do grau de escolaridade,
verificando a menor suscetibilidade ao comportamento prosódico para a
compreensão das notícias por parte dos informantes com maior grau de
escolaridade. Desse modo, a prosódia na LN colaborou para a compreensão do
grupo de informantes com baixo grau de escolaridade.
Destaque-se, no entanto, que os resultados obtidos com essa pesquisa
não se fecham neste trabalho, nem se esgotam as possibilidades analíticas, mas
pretende abrir o leque a novas pesquisas que possam explicar o que ocorre
quando a prosódia encontra a pragmática e o discurso, estabelecendo recortes
de sentido.
110
4º Colóquio Brasileiro de Prosódia da Fala
Referências
Barth-Weingarten, D; Dehé, N. & Wichmann, A. 2009. Where prosody meets
pragmatics. NL: Brill. Series Studies in Pragmatics, 8.
Beaugrande, R. & Dressler, W. 1981. Introduction to text linguistics. Londres:
Longman.
Bennett, R. & Dressler, W. 1982. “Melodies bristling with change: prosody and
understanding conversation.” Journal Sociological Methodos & Research 11 (2):
195-212. Disponível em: http://smr.sagepub.com/content/11/2/195
Brazil, D. 1985. “The communicative value of intonation in English”. Discourse
Analyses Monograph, 8, Birmingham, English Language Research.
Chafe, W. 1982. “Integration and involvement in speaking, writing, and oral literature”.
In Tannen, D. (ed.) Spoken and written language: exploring orality and literacy.
Norwood, N.J.: Ablex.
Gumperz, J. 1982. Discourse strategies. Cambridge, Cambridge University Press.
Koch, I. 1997. O texto e a construção e sentido. São Paulo: Contexto.
Marcuschi, L. A. 1989. O processo inferencial na compreensão de textos. Relatório
final do projeto de pesquisa - CNPq., UFPE.
Searle, J. 1969. Speech acts: an essay in the philosophy of language. Cambridge:
Cambridge University Press.
Van Dijk, T. 1992. Cognição, discurso e interação. São Paulo: Contexto.
111
Caderno de Resumos
Pistas prosódicas de fronteiras discursivas em narrativas
espontâneas: um estudo de percepção
1
2
1
Ebson Wilkerson , Júlia Lopes Pereira , Miguel Oliveira, Jr. ,
2
2
Regina Fernandes Cruz , Francisca Carvalho
1
Faculdade de Letras, Universidade Federal de Alagoas, Brasil
2
Faculdade de Letras, Universidade Federal do Pará, Brasil
[email protected], [email protected], [email protected],
[email protected], [email protected]
1. Introdução
O presente artigo trata de um estudo experimental e perceptual baseado
em fenômenos prosódicos observados na fala produzida espontaneamente.
Estudos dessa natureza, em prosódia do português falado no Brasil, têm
encontrado maior espaço, nos últimos anos, pela sua relevância no que diz
respeito ao aprimoramento de estudos sobre os aspectos prosódicos da fala.
Entretanto a maior parte deles é feita com dados de fala não
espontâneos/induzidos.
Nesta perspectiva, Oliveira Jr. (2000) demonstrou que a prosódia
constitui um fator relevante segmental em estudo de produção que analisa o
papel delimitador de algumas variáveis prosódicas na estruturação discursiva
de narrativas orais espontâneas. Mais tarde, Silva e Oliveira (2011) constataram
a mesma hipótese e reforçaram-na com a ideia de que as variáveis prosódicas
também facilitam a percepção da estrutura do texto narrativo. Sendo assim, este
estudo tem como principal objetivo analisar as pistas prosódicas pausa e tom,
no que diz respeito à percepção da delimitação da estrutura de narrativas orais
espontâneas.
Especificamente, o estudo busca, entre outros objetivos, examinar, por
meio de uma análise acústica, se os elementos prosódicos pausa e tom estão,
recorrentemente, associados a fronteiras discursivas estabelecidas
perceptualmente e avaliar a importância que esses elementos prosódicos têm,
isoladamente e em conjunto, na compreensão do texto narrativo.
112
4º Colóquio Brasileiro de Prosódia da Fala
Desse modo, conforme a proposta de Oliveira Jr. (2000), consideram-se
as variáveis (i) pausa e (ii) tom como corolário, pelas seguintes razões: a) as
pausas encontradas em fronteiras discursivas designadas perceptualmente são
maiores que aquelas localizadas em outras posições e; b) o tom baixo ocorre
com maior frequência diante de fronteiras discursivas, enquanto os tons médio
e alto ocorrem com mais frequência em outras posições.
2. Material
Este experimento é composto de quatro narrativas que foram extraídas
de um corpus de gravações feitas de fala espontânea (Oliveira Jr. 2000). Para a
análise, primeiramente o material foi transcrito ortograficamente, de modo
linear, sem marca de pontuação e sem indicação de paragrafeamento.
Em seguida, as narrativas foram apresentadas a 112 participantes
convocados voluntariamente, estudantes da graduação ou pessoas já
graduadas, de faixa etária variando entre 18 e 53 anos, sendo 70 informantes do
sexo feminino e 42, do sexo masculino.
3. Método
Os participantes foram submetidos à tarefa de indicar, nas narrativas, as
pistas prosódicas que eles julgavam finalizar uma unidade comunicativa. Em
seguida, foram instruídos a julgar quais seriam as fronteiras dessas unidades,
em caráter puramente subjetivo. Nenhuma definição para a noção de unidade
comunicativa foi apresentada ao participante.
Cada narrativa foi apresentada em quatro diferentes condições. Na
Condição um (C1), os participantes tiveram acesso apenas à transcrição da
narrativa, sendo solicitada a segmentação em unidades comunicativas por meio
de uma barra transversal (/). Na Condição dois (C2), a transcrição da narrativa
acompanhada do áudio foi apresentada aos participantes. De igual modo, eles
foram solicitados a segmentar a narrativa na transcrição, por meio de uma barra
transversal. Na terceira Condição (C3), apenas o áudio da narrativa foi
apresentado aos participantes. Eles foram solicitados a segmentar a narrativa
utilizando-se, para isso,da tecla Enter do computador. Na Condição quatro
(C4), uma versão deslexicalizada da narrativa foi apresentada. Os arquivos de
113
Caderno de Resumos
áudio originais foram filtrados com filtro passa-banda, resultando em uma fala
ininteligível, mas com a informação prosódica preservada. Novamente, para
segmentar a narrativa, foi utilizada a tecla Enter do computador. Ressaltamos
que a fronteira neste trabalho é a palavra prosódica.
Desse modo, a análise acústica dos elementos prosódicos nas narrativas
foi realizada por meio do uso dos Programas PRAAT e ELAN. Este é um
aplicativo computacional desenvolvido pelo Max Planck Institute for
Psycholinguistics:http//tla.mpi.nl/tools/tla-tools/élan/. O Programa PRAAT
foi consultado para se verificar o Get Pitch (Tom Médio) e o Get Maximum
Pitch (Tom Máximo) de cada vocábulo que constitui as Narrativas 1, 2, 3 e 4.
Conferências concluídas, os resultados foram lançados em planilhas do
Programa Excel, primeiramente, para especificar o total de registros nas
palavras consideradas fronteiras pelos participantes. Em outra planilha, foram
lançados os números referentes aos tons médio e máximo (Get Pitch e Get
Maximum Pitch, respectivamente) de cada palavra das narrativas, a fim de
registrar a diferença de tom entre uma palavra da narrativa e a sua subsequente.
Definimos a diferença de tom (Pitch Reset) médio de 150 Hz a 550 Hz
para mulheres e, para homens, de 30 Hz a 200 Hz, os quais foram medidos
acusticamente, a partir da segmentação feita no teste de percepção. Na análise,
apenas consideramos pausas silenciosas maiores que 250 ms, seguindo uma
tradição dos estudos desse elemento prosódico.
O critério estabelecido para fins de comparação e análise de uma
fronteira discursiva foi a marcação de uma palavra prosódica como o final de
uma unidade comunicativa por, no mínimo, 10% dos participantes do
experimento, em qualquer uma das quatro condições analisadas.
Finalmente, comparamos as fronteiras, os valores de duração de pausa e
os valores de diferença de tom (Pitch Reset) nas segmentações realizadas sob o
prisma perceptual.
Todos os informantes leram e assinaram um Termo de Consentimento
Livre e Esclarecido (TCLE), de acordo com a exigência do Ministério da Saúde
e do Comitê de Ética em Pesquisa3. Após a assinatura, os informantes
receberam instruções gerais impressas acerca do experimento, seguidas de
exemplos: duas narrativas adicionais, extraídas do corpus supramencionado.
3
Estudo avaliado pelo Comitê de Ética em Pesquisa, aprovado para realização em 24/11/2010
(Processo n. 013526/2010-01).
114
4º Colóquio Brasileiro de Prosódia da Fala
Neste estudo, fizemos uso do modelo estrutural proposto por Passonneau e
Litman (1997), o de que os falantes segmentam as narrativas que contam com o
propósito – ou intenção – de deixar claro para o ouvinte a sua organização
estrutural. Verificamos a validade desse modelo para o português brasileiro.
4. Resultados Preliminares
A análise dos dados não está concluída, mas os resultados preliminares já
apontam que há concordância entre os informantes quanto à localização de
fronteiras discursivas, como demonstrado no estudo piloto de Oliveira Jr.
(2000), e que a pausa, embora seja uma variável prosódica bastante
significativa para a percepção dessas fronteiras, não detém o maior número de
casos da segmentação no experimento, conforme mostra a figura1, abaixo.
“Figura 1:Fronteiras” .
Neste caso, estuda-se a hipótese de que a diferença de tom (Pitch Reset) é
uma pista forte de fronteira perceptual, visto que, ao compararmos os valores
médios das diferenças de tom médio (Get Pitch) e de tom máximo (Get
Maximum Pitch), em situações com e sem registro de pausa, observamos que há
115
Caderno de Resumos
uma tendência maior em baixar o tom, todavia sugerimos que a predisposição
para esse limite de tom não represente apenas uma pista prosódica adicional,
mas seja uma variável prosódica relevante para os participantes, na marcação
de fronteira. Nestes termos, os dados confirmam o que já foi debatido na
literatura (Grozs e Hisrchberg 1992; Passonneau e Litman 1993) a respeito da
duração da pausa. Assim sendo, os resultados demonstram que esta pista
prosódica representa fator importante para a percepção da segmentação do
discurso narrativo, uma vez que há indicação de um valor médio maior para a
percepção de fronteiras, mesmo quando as informações lexical, sintática e
semântica são suprimidas. Segundo os resultados, quando a pausa é mais longa,
a ruptura discursiva tem mais chances de constar nas quatro condições
apresentadas para a análise.
5. Considerações Finais
Ao verificar que o ouvinte poderá beneficiar-se das marcas prosódicas na
segmentação da narrativa espontânea, tomando como base o modelo de
intenções proposto por Passonneau e Litman (1997), parece-nos fundamental
analisar esses elementos numa abordagem acústico-experimental.
Desse modo, esse suporte teórico nos ajudará a caminhar por um
domínio ainda pouco trilhado: o da análise perceptual da prosódia e o da
correlação entre segmentos prosódicos e segmentação do discurso narrativo.
Nesse sentido, nosso interesse é suscitar questionamentos para discussões
futuras.
Vale ressaltar, ainda, que, sob uma perspectiva de aplicação, os
resultados provenientes de um estudo como o aqui proposto têm imediata
relevância para o desenvolvimento e/ou aperfeiçoamento de produtos
relacionados à tecnologia da fala, por exemplo, reconhecedores automáticos e
sintetizadores de fala.
Referências
Grosz, B.;Hirschberg, J. S. 1992. “Some intonational characteristics of discourse
structure.” In International Conference on Spoken Language Processing, Banff.
Oliveira Jr, M., 2000. Prosodic Features in Spontaneous Narratives. 291 fl. Tese
(Doutorado em
Linguística) - Simon Fraser University, Vancouver.
116
4º Colóquio Brasileiro de Prosódia da Fala
______. 2002. “O uso do tom de limite como marca de segmentação da Narrativa
espontânea.” In Revista Gelne 4 (1).
Passonneau,R. J.; Litman, D. J.1993. “Intention-based segmentation: Human
reliability and correlation
with linguistic cues.” In Proceddings of the 3ist annual
Meeting of the Association for computacional
Linguistics (ACL-93),
Columbus, Ohio.
Passonneau, R.J.; Litman, D.J.1997. “Discourse Segmentation by Human and
Automated Means.” Computational Linguistics 23 (1): 103–139.
Silva, E. W.; Oliveira Jr. M. 2011. “A percepção dos elementos prosódicos como
marca de estruturação de narrativas espontâneas.” In: Resumo do III Colóquio
Brasileiro de Prosódia da Fala. Belo Horizonte.
117
Caderno de Resumos
Produção e percepção de sentenças interrogativas totais
em dados de falantes de espanhol como L1 e L2: um
estudo experimental
1
2
Eva Christina Orzechowski Dias , Izabel Christine Seara , Juan
Manuel Sosa3
1
Pós-Graduação em Linguística, Universidade Federal de Santa
Catarina, Brasil
2
Universidade Federal de Santa Catarina, Brasil
3
Simon Fraser University, Canadá
[email protected], [email protected], [email protected]
1. Introdução
Neste trabalho, analisaram-se as sentenças interrogativas totais em
dados de duas falantes de espanhol/L1, da variedade de Bogotá, e duas falantes
brasileiras de espanhol/L2, que aprenderam espanhol informalmente, durante
um período de residência em Bogotá de um ano e seis meses. O objetivo foi
observar uma possível transferência do padrão entoacional da língua materna
(PB), considerando o tipo de aprendizado não formal, em ambiente natural. Foi
realizado também um teste perceptual de identificação, a partir de dados
sintetizados, com o intuito de verificar se essas participantes identificariam
como perguntas as sentenças interrogativas totais realizadas em espanhol/L1,
1
em português/L1 e em espanhol/LE .
1
Para o teste de percepção, foram utilizados dados de falantes de espanhol como LE
(aprendidos formalmente), uma vez que, no momento de elaborar os testes, não se dispunha
de dados de falantes de espanhol como L2 (aprendido informalmente).
118
4º Colóquio Brasileiro de Prosódia da Fala
2. Revisão teórica
Para a modalidade interrogativa total, estudos apontam que o espanhol
colombiano e o português brasileiro apresentam diferentes padrões
entoacionais, de modo que, no primeiro caso, a curva entoacional apresenta
final ascendente e, no segundo, final circunflexo (Sosa 1999; Moraes 2006,
respectivamente). Conforme apontam Flege e Bohn (1989), a prosódia é um
elemento linguístico complexo, que pode marcar a fala estrangeira mesmo nos
aprendizes com alto nível de proficiência. Diferentes autores têm apontado que
há transferência de padrões entoacionais da primeira língua (L1) para a língua
estrangeira (LE) (Pinto 2009; Silva 2009; Oliveira e Cantero Serena 2011).
Estudos sobre entoação com dados de falantes de espanhol como segunda
língua (L2), aprendido informalmente, em situação de imersão, são escassos no
Brasil. A transferência linguística se relaciona com a presença de características
da L1na produção e percepção da L2 e pode ser entendida como uma estratégia
comunicativa, decorrente de um processo natural de aprendizagem, em que os
conhecimentos existentes facilitam o processo de aprendizagem (Odlin 2008).
No entanto, há divergências conceituais com relação a esse conceito, sobretudo
devido a dificuldades metodológicas para observar esse fenômeno (Vilela
2009).
A aprendizagem informal e a experiência de residência em região de L2
constituem fatores que podem afetar a pronúncia na L2; no entanto, os estudos
não são conclusivos (Piske et al. 2001). Características prosódicas
(suprassegmentais) podem afetar a compreensão e inteligibilidade na fala dos
falantes de L2, muitas vezes, mais do que características segmentais (Derwing e
Munro 1997; Jilka 2000).
3. Metodologia
Participaram desta pesquisa quatro mulheres com faixa etária entre 30 e
60 anos, sendo duas falantes de espanhol como L1, naturais e residentes em
Bogotá, e duas falantes de espanhol como L2, naturais de Belo Horizonte e
Florianópolis, residentes em Bogotá durante um período de um ano e seis
meses. Foram feitas sessões de gravação de frases contextualizadas, a partir de
um corpus baseado no Atlas interactivo de la entonación del español (Prieto e
Roseano 2009-2013). Nessas sessões, as participantes liam silenciosamente as
119
Caderno de Resumos
situações conversacionais e as sentenças interrogativas correspondentes,
individualmente, e, em seguida, visualizavam uma ilustração da
correspondente situação e produziam, então, as perguntas. As sessões foram
realizadas em Bogotá em uma sala silenciosa. Foram analisadas 44 sentenças,
sendo 24 referentes às falantes de espanhol/L1 e 20 referentes às falantes de
espanhol/L2. Foi feita uma análise de produção, observando os padrões
melódicos das sentenças atribuídas pelos algoritmos MOMEL/INTSINT (Hirst
2007).
O teste perceptual de identificação foi realizado com as mesmas
participantes do experimento de produção. Para montar o teste de percepção,
foram utilizados estímulos sintetizados, coletados em outro estudo (Dias e
Alves 2013). Esses estímulos correspondem a frases interrogativas totais
terminadas em palavras paroxítonas produzidas por uma falante de
espanhol/L1, da variedade colombiana, uma falante de português/L1, e duas
falantes de espanhol/LE, aprendido formalmente, em ambiente da língua
materna (PB). As sentenças em espanhol L1 apresentavam padrão final
ascendente (tons BHH e LUT); as referentes ao português L1 apresentavam
padrão final circunflexo (tons UL), e as referentes ao espanhol/LE alternavam
entre padrão final ascendente (DHH) e circunflexo (STL). A síntese dos dados
consistiu em uma filtragem, realizada através do Praat2, de modo que ficaram
audíveis apenas as frequências na faixa de F0 das locutoras. Esse teste de
identificação foi realizado pelo programa TP (Rauber et al. 2012). Obteve-se
um conjunto de 72 respostas, escolhidas entre: (1) É ou parece uma pergunta ou
(2) Não parece uma pergunta.
4. Resultados
Nos resultados referentes à análise melódica, elaborada através dos
3
algoritmos MOMEL/INTSINT , observou-se que as falantes de espanhol/L1
realizaram exclusivamente a curva melódica com final ascendente (tons T ou
H). Na produção das sentenças pelas falantes de espanhol/L2, houve 81% de
2
Praat version 5.2.53 copyright 1992-2013, Paul Boersma and David Weenink.
Tons absolutos: T (top); B (bottom); M (mid) e tons relativos: H (mais alto); S (igual); L
(mais baixo); U (subida suave); D (descida suave) (Celeste 2007).
3
120
4º Colóquio Brasileiro de Prosódia da Fala
casos com curva com final ascendente (tons H ou T) e 19% com padrão final
descendente (tons L ou D). As Figuras 1 e 2 ilustram uma sentença interrogativa
total produzida por uma falante de espanhol/L1 e outra de L2, respectivamente.
Os resultados do teste de percepção mostraram diferenças na frequência
de ocorrência entre os grupos com relação às respostas (1) é ou parece uma
pergunta e (2) não parece uma pergunta. Os estímulos em espanhol/L1 (padrão
final ascendente) foram identificados como perguntas em 92% dos casos pelas
falantes de espanhol/L1 e, em 100% dos casos, pelas falantes de espanhol/L2.
Já os estímulos em português/L1 (padrão final circunflexo) foram
identificados, pelas falantes de espanhol/L1, como perguntas em 42% dos
casos, e em 100% para as brasileiras (falantes de espanhol L2). No caso dos
estímulos em espanhol/LE, tanto as falantes de espanhol/L1 quanto as de
espanhol/L2 tiveram percentual de acerto mais alto para aqueles estímulos
terminados com curva final ascendente (67% e 100%, respectivamente) do que
os terminados com padrão final circunflexo (50% e 67%, respectivamente).
Conclui-se, dessa forma, que os dados de produção das falantes de
espanhol/L2 ainda apresentam o padrão entoacional de sua L1 (padrão final
circunflexo), o que parece evidenciar um fenômeno de transferência da L1 para
a L2. Destaca-se, no entanto, que a ocorrência de curva melódica com final
ascendente em sentenças interrogativas totais (81%) pelas falantes de
espanhol/L2 pode indicar que o padrão entoacional da L2 pode ser
aprendido/adquirido informalmente. O período de imersão também pode
constituir um dos fatores que influenciaram nesse resultado. Com relação ao
teste de percepção, foi observado que as diferenças nos padrões entoacionais
afetam a interpretação dos estímulos pelas falantes de espanhol/L1.
Figura 1: Sentença ¿Tiene mermelada?, produzida por uma falante de espanhol/L1.
121
Caderno de Resumos
Figura 2: Sentença ¿Tiene mermelada?, produzida por uma falante de espanhol/L2.
Referências
Celeste, L. 2007. MOMEL e INTSINT: uma contribuição à metodologia do estudo
prosódico do PB. Dissertação de Mestrado, Universidade Federal de Minas Gerais.
Derwing, T.M. e Munro, M.J. 1997. “Accent, intelligibility, and comprehensibility”.
Studies in Second Language Acquisition (1): 1-16.
Dias, E.C.O. e Alves, M.A. 2013. “Análise de produção de sentenças interrogativas
totais em aprendizes brasileiros de espanhol como língua estrangeira”. Journal of
Speech Sciences (2): 43-63.
Flege, J.E. e Bohn, O.S. 1989. “An instrumental study of vowel reduction and stress
placement in Spanish-accented English”. Studies in Second Language Acquisition,
11 (1): 35-62.
Jilka, M. 2000. The contribution of intonation to the perception of foreign accent.
Unpublished PhD thesis, University of Stuttgart.
Moraes, J.A. 2006. “Melodic contours of yes/no questions in Brazilian Portuguese”. In
Proc. of ISCA Tutorial and Research Workshop on Experimental Linguistics: 117120.
Odlin, T. 1989. Language transfer: cross-linguistic influence in language learning.
Cambridge: Cambridge University Press.
Oliveira, A.F.D. e Cantero Serena, F. J. 2011. “Características da entonação do espanhol
falado por brasileiros”. In Anais do VII Congresso Internacional da Abralim: 84-98.
Pinto, M.S. 2009. Transferências prosódicas do português do Brasil/LM na
aprendizagem do espanhol/LE: enunciados assertivos e interrogativos totais. Tese
de Doutorado. Universidade Federal do Rio de Janeiro.
Piske, T., Mackay, I.R.A. e Flege, J.E. 2001. “Factors affecting degree of foreign accent
in an L2: a review”. Journal of Phonetics (29): 191-215.
122
4º Colóquio Brasileiro de Prosódia da Fala
Aspectos temporais envolvidos na sobreposição de vozes
em diálogos da língua Yaathe
1
1
1
Fábia Pereira da Silva , Miguel Oliveira Jr. , Januacele da Costa
1
PPGLL/Faculdade de Letras, UFAL, Brasil
[email protected], [email protected], [email protected]
O presente estudo se propõe a analisar o papel da prosódia na negociação de
turno, a partir da observação do que ocorre em relação à sobreposição de vozes em
diálogos da língua brasileira Yaathe, observando quais os elementos ou traços
prosódicos que desencadeiam tal fenômeno. De acordo com a literatura (Reed
2011, 2012, Ogden 2012, Selting & Couper-Kuhlen 2001, entre outros), os
elementos prosódicos que, geralmente, caracterizam a sobreposição de vozes
durante o turno ou na mudança de turno são o pitch, a qualidade de voz, a
velocidade de fala, o ritmo e a intensidade.
Neste estudo, iremos observar os aspectos temporais no que diz respeito ao
desencadeamento da sobreposição de vozes e às estratégias de negociação do turno
– manutenção ou tomada de turno. Usaremos uma abordagem experimental
ancorada ao quadro teórico da análise da conversação a partir do que propõem os
trabalhos acima citados.
Os dados aqui analisados são da língua Yaathe, conforme já mencionado,
que é falada pelos índios Fulni-ô. Esses índios vivem no município de Águas Belas,
localizado nas regiões do Agreste Meridional e Sertão de Pernambuco, com uma
1
população de 4.336 indivíduos . Uma das características mais notáveis da situação
dos índios Fulni-ô é a sobrevivência da língua, uma vez que todas as outras línguas
indígenas faladas no Nordeste do Brasil já desapareceram.
Os estudos feitos sobre o Yaathe até o momento consideraram aspectos
segmentais, como os trabalhos de Boudin (1950), Meland (1968), Meland e
Meland (1967; 1968) Lapenda (1968), Costa (1999) e Silva (2011), ou ainda,
suprassegmentais, mas no nível da palavra, e não do discurso, como é o caso do
1
Dados da Funasa (2010).
123
Caderno de Resumos
trabalho de Cabral (2009) e também não existem pesquisas acerca da língua Yaathe
que levem em conta a fala espontânea ou semi-espontânea.
Pesquisas que tratam da interação verbal definem a linguagem como a
realização de ações individuais e sociais. A conversa, nesse sentido, é um tipo de
interação verbal que desenvolvemos logo cedo, assim que começamos a falar.
(Marcuschi 1986). A conversa espontânea se forma a cada intervenção e interação
que ocorre entre os interlocutores. A elaboração e a produção, desse modo,
acontecem de forma simultânea no mesmo eixo temporal, o que, de forma alguma,
quer dizer que essa formação da conversa seja aleatória e desorganizada.
As definições comumente aceitas no campo da análise da conversação a
respeito do que é uma conversação afirmam que um diálogo envolve pelo menos
duas pessoas e uma troca de turno. O turno conversacional, de acordo com a
literatura, é definido como situações em que os membros de um grupo, envolvidos
em uma conversação, se alternam ou se sucedem em uma conversa.
Para Levinson (2007: 376), "é evidente que a conversação é caracterizada
pela alternância de turnos: um participante A, fala e para; outro, B, começa, fala e
para". Em seguida, o próprio autor chama a atenção para o fato de que essa
alternância de turno não é tão evidente assim e nem tão organizada, no sentido de
que um fala enquanto o outro espera a sua vez. É constatado que em situações de
interação o fenômeno da sobreposição de vozes é bastante comum. Diante desse
fato, é possível tecermos algumas considerações a respeito da organização
prosódica, verificando quais as pistas prosódicas que favorecem ou desencadeiam a
sobreposição de vozes e a continuidade do diálogo sem quebra abrupta do tópico
discursivo ou assunto da conversação. Essas pistas prosódicas agrupam-se em
termos de certos parâmetros mais gerais, como tempo, a intensidade, etc.
O tempo, por exemplo, afeta de várias maneiras e em vários trechos a
conversação. Ele pode tornar-se relevante através do alongamento de sons
individuais ou sílabas, mudanças na velocidade de fala e ritmo de entonação de
enunciados e turnos, e em pausas relevantes do ponto de vista interacional. O
tempo e o uso do tempo desempenham um papel importante na negociação dos
participantes durante o ato conversacional. (Reed 2011)
Trabalhos na área da prosódia têm apontado aspectos temporais, tais como a
velocidade de fala, como sendo fundamental para o processo de interação tanto
para produção quanto para a interpretação por parte dos interlocutores (Oliveira Jr.
2002, Coutinho & Rocha 2010 e LIMA 2007). O que ocorre em relação à
velocidade de fala nos enunciados que antecedem a sobreposição de voz em
diálogos é o que buscaremos investigar nos dados sob estudo, averiguando de que
124
4º Colóquio Brasileiro de Prosódia da Fala
forma velocidade de fala está associada às estratégias da interação verbal, no que se
refere ao favorecimento da negociação do turno.
A velocidade de fala diz respeito à forma como os participantes são rápidos
ou lentos falando. Essa medição é geralmente feita considerando-se a produção de
sílabas por segundo.
Neste trabalho, utilizamos quatro diálogos proferidos por quatro falantes de
Yaathe. Os dados utilizados fazem parte do banco de dados do projeto
Documentação da Língua Indígena Brasileira Yaathe (Fulni-ô). Duas duplas de
colaboradores foram formadas (dois homens e duas mulheres) e gravamos dois
diálogos com cada uma dessas duplas. As duplas foram formadas dessa forma para
que tivéssemos a representação da voz masculina e da voz feminina, pois sabemos
que há uma diferença no que diz respeito a elementos que se referem à prosódia. O
assunto não foi sugerido ou dado aos falantes e a gravação foi realizada em um
ambiente informal para que se garantisse a maior naturalidade possível.
Em um primeiro momento, dividimos o texto de cada falante em Unidades
Entoacionais. De acordo com Cole et al. (2010), há uma tendência de as Unidades
Entoacionais estarem encapsuladas pelas unidades sintáticas e, por sua vez, podem
representar uma unidade de planejamento para o falante ou de apresentação para o
ouvinte.
Os ouvintes são orientados em sua percepção por sinais acústicos /
prosódicos e contexto sintático e, independentemente do contexto sintático, a
duração da vogal final é a pista acústica principal para a percepção de fronteiras de
unidades prosódicas.
Cruttenden (1986) sugere que em 40% dos casos as Unidades Entoacionais
correspondem a uma oração. Entretanto, em vários casos as IUs podem
corresponder a algo menor que uma oração (advérbios, locuções adverbiais...). Há
uma flexibilidade na delimitação de Unidades Entoacionais, mas a coesão sintática
parece ser um forte fator por trás disso.
Neste trabalho, a velocidade de fala foi calculada levando-se em conta cada
unidade entoacional e, depois, calculamos a média global de velocidade de fala de
cada falante em cada diálogo. É evidente também que entre os falantes há uma
variação em termos da velocidade de articulação, razão pela qual são necessários
valores globais da velocidade de fala dos participantes do ato interacional para que
se possa fazer algum tipo de consideração a respeito desse aspecto e, assim, poderse verificar se há uma intenção no uso mais rápido ou menos rápido da fala,
considerando-se a negociação do turno. É a partir de tais observações que iremos
tecer nossas considerações em relação ao uso do tempo para marcar a sobreposição
de vozes e a negociação do turno em diálogos da língua Yaathe.
125
Caderno de Resumos
Referências
Barbosa, E. 1991. Aspectos fonológicos da língua Yatê. Dissertação de Mestrado,
Universidade de Brasília.
Boudin, M. H. 1950. Singularidades da língua ía-té. Verbum (Rio de Janeiro), 7 (1): 66-73.
Cole, J.; Mo, Y. & Baek, S. 2010. The role of syntactic structure in guiding prosody
perceptio with ordinary listeners and everyday speech. Language and Cognitive
Processes 25: 7-9.
Costa, J. F. 1999. Ya:the, a n ltima língua nativa no Nordeste do Brasil. Aspectos morfofonológicos e morfo-sintáticos. (Tese de Doutorado). Recife: UFPE.
Cruttenden, A. 1986. Intonation. Cambridge: Cambridge University Press.
Dionísio, A. P. 2001. Análise da Conversação. In Mussalim, F. & Bentes, A. C. (orgs.)
Introdução à linguística: domínios e fronteiras 2. São Paulo: Cortez. Disponível em:
http://pib.socioambiental. org/pt/povo/fulni-o/489
Lapenda, G. 1968. Estrutura da língua Yatê, falada pelos índios Fulni-ôs em Pernambuco.
Recife: UFPE, Imprensa Universitária.
Levinson, S. C. 2007. Pragmática. Tradução Luís Carlos Borges, Aníbal Mari. São Paulo:
Martins Fontes.
Lima, M. L. 2007. Análise de Elementos Prosódicos que justificam sobreposições de vozes
ocorridas no turno
conversacional de entrevistas. Disponível em:
http://bl152w.blu152.mail.live.com.
Marcuschi, L. A. 1986. Análise da Conversação. São Paulo: Ática.
Meland, D. & Meland, D. 1967. 'Fulni-ô (Yahthe) phonology statement'. Arquivo
linguístico n. 025. Brasília, D.F: Summer Institute of Linguistics.
Meland, D. & Meland, D. 1968. Word and morpheme list of the Fulni-ô indian language.
Dallas/Texas: Summer Institute of Linguistics.
Ogden, R. 2012. “Prosodies in conversation”. Journal of Linguistics.
Oliveira Jr., M. & Cunha, D. A. C. 2002. Prosody As Marker of Direct Reported Speech
Boundary.
Reed, B. S. 2011. Analysing Conversation. An introduction to prosody. New York: Palgrave
macmillan.
Reed, B. S. 2012. Beyond the Particular: Prosody and the Coordination of Actions.
Language and Speech.
Selting, M.; Couper-Kuhlen, E. 2001. Studies in Interactional Linguistics. John Benjamins
Publishing Company. Amsterdam: Philadelphia.
Silva, F. P. 2011. A sílaba em Yaathe. Dissertação de Mestrado - Universidade Federal de
Alagoas, Maceió.
126
4º Colóquio Brasileiro de Prosódia da Fala
A prosódia como ponto de partida para a segmentação
do fluxo da fala por bebês brasileiros
Ícaro Oliveira Silva e Maria Cristina Name ¹
¹ PPG - Linguística, Universidade Federal de Juiz de Fora, Brasil
[email protected], [email protected]
O presente trabalho tem como objetivo investigar se bebês brasileiros,
com idade média de treze meses, são sensíveis a fronteiras de sintagma
fonológico (? ). Estudos anteriores evidenciaram que infantes adquirindo o
inglês fazem uso de pistas acústicas disponíveis nas fronteiras desse
constituinte prosódico para segmentar o fluxo da fala em unidades
significativas (Gout et al. 2004). Desse modo, investigamos se esse fenômeno
ocorre também no Português Brasileiro (PB).
Dada a possibilidade de relação entre os constituintes prosódicos e
aqueles de natureza morfossintática, a pesquisa em questão é norteada pela
hipótese de que as informações acústicas presentes nas fronteiras de
constituintes prosódicos facilitam a segmentação da fala por crianças em
processo de aquisição da linguagem, uma vez que há um mapeamento, embora
nem sempre obrigatório, entre unidades prosódicas e unidades morfológicas e
sintáticas. (Nespor & Vogel 2007; Christophe et al. 2008).
Em concordância com o que propõem Nespor & Vogel (2007), os
enunciados linguísticos podem ser organizados em constituintes fonológicos
dispostos hierarquicamente. Esses constituintes são definidos tomando-se
como base regras de mapeamento, que consideram as informações oferecidas
pelos demais componentes da gramática, e regras fonológicas, cuja aplicação
ou restrição no interior ou na fronteira de constituintes oferece evidências para a
postulação dos domínios prosódicos. Os sete constituintes prosódicos previstos
na hierarquia proposta pelas autoras são, em ordem crescente: Sílaba (ó), Pé
Métrico (Ó), Palavra Prosódica (ù), Grupo Clítico (C), Sintagma Fonológico
(? ), Sintagma Entoacional (I) e, por fim, o Enunciado Fonológico (U).
O sintagma fonológico, constituinte investigado na pesquisa em questão,
caracteriza-se por apresentar um ou dois itens lexicais junto com os itens
funcionais associados aos primeiros e possui de quatro a sete sílabas. Destaca127
Caderno de Resumos
se, ainda, pela existência de alongamento antes de sua fronteira e por haver um
contorno melódico por sintagma (Gout & Christophe 2006). É o constituinte
mais relevante para o mapeamento entre fonologia e sintaxe, uma vez que
fronteiras de sintagma fonológico podem coincidir com fronteiras sintáticas.
As pistas prosódicas contidas no domínio das fronteiras de sintagma
fonológico, tais como alongamento da tônica antes da fronteira e diferentes
valores para a frequência fundamental e intensidade, são utilizadas também
pelos adultos no processamento sintático (Gout & Christophe 2006; Millotte et
al. 2007; Silva 2009) e no acesso lexical (Alves 2010), o que sugere a existência
de uma continuidade entre os mecanismos utilizados tanto pelas crianças, em
processo de aquisição da linguagem, quanto por adultos, no processamento
linguístico (Gout & Christophe 2006). Isso implica dizer que, para adultos e
crianças, o fluxo da fala é percebido através de constituintes prosódicos que
facilitam a identificação, e também a segmentação, das palavras e o
processamento sintático.
Considerando que o bebê, durante os primeiros anos de vida, só tem
acesso ao material fonológico, defendemos a hipótese do Boostrapping
Fonológico, segundo a qual pistas de natureza fonológica/prosódica seriam
utilizadas pelos infantes para o desencadeamento da aquisição do léxico e da
sintaxe (Christophe et al. 1997). Segundo Christophe et al. (1997), existem
fortes evidências experimentais de que os bebês, desde o nascimento, possuem
habilidades perceptuais que os capacitam, primeiramente, a segmentar o
continuum da fala e, posteriormente, a constituir o léxico do idioma em
aquisição. Uma das pistas utilizadas pelo bebê é a prosódia da língua,
principalmente a percepção das fronteiras que existem entre os constituintes
prosódicos. Diante dessa perspectiva, os enunciados de uma determinada
língua natural seriam perceptualmente acessíveis à criança, em termos de
unidades prosódicas (Maye & Gerken 2001). Nesse sentido, cabe à criança,
como tarefa inicial do processo de aquisição de linguagem, segmentar o fluxo
da fala em unidades significativas para o processamento linguístico, mesmo
não possuindo um sistema fonológico consolidado e nem um léxico da língua
que está sendo adquirida. Isso implica assumir que os infantes, desde os
primeiros anos de vida, são predispostos biologicamente a perceber
propriedades que sinalizam padrões recorrentes do idioma em aquisição.
A fim de observar se os bebês são sensíveis às informações acústicas
contidas nas fronteiras do constituinte prosódico analisado, utilizamos a
técnica de Olhar Preferencial (Preferential Looking). Conforme apresentado
por Name (2012), o Olhar Preferencial (variação da técnica de Escuta
128
4º Colóquio Brasileiro de Prosódia da Fala
Preferencial - Headturn Preference Procedure) é um tipo de técnica utilizado
com crianças de até 18 meses e é adequado para avaliação de habilidades
perceptuais. Inicialmente, a criança ouve durante um período de tempo,
aproximadamente dois minutos, determinado estímulo linguístico
apresentando o fator que está sendo investigado. Em seguida, apresentam-se
dois tipos de estímulo linguísticos, em três ensaios para cada tipo, coerentes ou
não com o que foi anteriormente apresentado. Utiliza-se um alto-falante,
centralizado junto a uma tela maior, a qual exibe uma imagem – a mesma
durante todos os ensaios. A apresentação do estímulo é dependente do
comportamento do bebê, que o escuta enquanto estiver olhando para a
imagem/direção do som. Se ele desvia o olhar, o som para e um novo evento
começa. Mede-se, assim, o tempo de olhar da criança para a imagem na tela,
que corresponde ao tempo de escuta do estímulo e, consequentemente, a seu
interesse pelo que ouve. A despeito do nome, a medida usada é de preferência
pelo enunciado ouvido. A aferição do tempo de olhar/escuta permite verificar se
a criança percebeu a distinção entre os estímulos que lhe foram oferecidos.
Uma atividade experimental foi desenvolvida utilizando o Olhar
Preferencial, em que um grupo de bebês é familiarizado durante dois minutos à
palavra BAR (grupo A), e outro grupo familiarizado a BARCO (grupo B). Na
fase de teste, todos os bebês são expostos a sentenças com as palavras BARCO
(condição 1) e BAR (condição 2) seguida de fronteira de sintagma fonológico;
porém, a palavra seguinte a BAR começa com a sílaba CO (BAR ?
COMEÇA...), conforme o exemplo abaixo:
1. a. [O dono daquele BARCO] ? [mora perto da minha casa].
b. [O dono daquele BAR] ? [começa a trabalhar cedo].
Foram construídas doze sentenças teste. Seis das sentenças apresentam a
palavra “barco” e as outras seis apresentam a mesma palavra separada por uma
fronteira de sintagma fonológico.
Nossa hipótese é que, nessa idade, o bebê é sensível a pistas de fronteira
de sintagma fonológico, utilizando-se delas na segmentação do fluxo da fala.
Dessa forma, nossa previsão é que bebês do grupo A reconhecerão a palavra
familiarizada nas sentenças da condição 2, e bebês do grupo B reconhecerão na
condição 1. Essa previsão justifica-se pela suposição de que as pistas
disponíveis nos domínios da fronteira de sintagma fonológico são fortes o
suficiente para impedir que a criança acesse a palavra BARCO na condição em
129
Caderno de Resumos
que ela esteja presente apenas “virtualmente”, isto é, na condição em que a
fronteira está justamente entre a palavra BAR e a primeira sílaba da palavra
subsequente COMEÇA. A atividade encontra-se em andamento, e espera-se
que haja uma diferença estatisticamente significativa entre os tempos de
olhar/escuta das condições nos dois grupos de bebês.
Referências
Alves, D. P. 2010. Pistas prosódicas no acesso lexical on-line de falantes adultos do
português brasileiro. Dissertação de mestrado. Universidade Federal de Juiz de
Fora.
Christophe, A., Guasti, T., Nespor, M., Dupoux, E. & Ooyen, B.V. 1997. Reflections on
phonological bootstrapping: it's role for lexical and syntactic acqusition. Language
and Cognitive Processes, 12 (5/6): 585-612.
Christophe, A., Millotte, S., Bernal, S. & Lidz, J. 2008. Bootstrapping Lexical and
Syntactic Acquisition. Language and speech, 51 (1 & 2): 61-75.
Gout, A., Christophe, A. & Morgan, J. 2004. Phonological phrase boundaries constrain
lexical Access: II Infant data. Journal of Memory and Language, 51: 548-567.
Gout, A. & Christophe, A. 2006. O papel do bootstrapping prosódico na aquisição da
sintaxe e do léxico. 2006 In: Corrêa, L. M. S. (Org.). Aquisição da Linguagem e
problemas do desenvolvimento linguístico. Rio de Janeiro: Ed. PUC-Rio; São Paulo:
Loyola: 103-127.
Maye, J. & Gerken, L. A. 2001. Learning phonemes: How far can the input take us?
Proceedings of the 21st Boston University Conference on Language Development.
Boston, MA: Cascadilla Press.
Millotte, S., Wales, R. & Christophe, A. 2007. Phrasal prosody disambiguates syntax.
Language and Cognitive Processes, 22 (6): 898-909.
Name, M. C. 2012. O que nos dizem os resultados experimentais sobre a percepção da
fala pelo bebê. Revista Veredas, Edição Especial VIII ENAL – II EIAL: 282-295.
Nespor, M. & Vogel, I. 2007. Prosodic Phonology. Dordrecht-Holland: Foris
Publications.
Silva, C. G. C. 2009. O papel das fronteiras de sintagma fonológico na restrição do
processamento sintático e na delimitação das categorias lexicais. Dissertação de
mestrado. Universidade Federal de Juiz de Fora.
130
4º Colóquio Brasileiro de Prosódia da Fala
131
Caderno de Resumos
132
4º Colóquio Brasileiro de Prosódia da Fala
133
Caderno de Resumos
134
4º Colóquio Brasileiro de Prosódia da Fala
Towards a Focus Typology in Turkish
Jane Kühn1
1
Department of Linguistics/ University of Potsdam, Germany
[email protected]
This work in progress presents a production experiment conducted in
order to classify Turkish concerning its focus typology.
Turkish is claimed to have two distinct focus marking strategies:
syntactic movement and prosodic focus marking in-situ (Erguvanlý 1984;
Göksel & Özsoy 2000; Iºsever 2003). Studies on prosodic focus marking in
Turkish understand focus as prominence in the original sense of Jackendoff
(1972) as an equivalent to stress and pitch accent implementation.
Correspondingly, Özge & Bozºahin (2010) describe the implementation of
H*L- for focused and L*H- for given constituents, remaining unsure if H- and
L- are part of a bi-tonal pitch accent, or independently implemented as
intermediate phrase boundary tones. In an acoustic analysis, Ýpek (2011) cannot
find reliable acoustic cues of pitch accent modification for in-situ focus, but a
change in default F0 contour: a focused verb in SOV declaratives reveals
“immediately pre-focal rising” on the ultimate syllable of the object.
Furthermore post-focal compression (PFC) is observed after initial focus1.
Cross-linguistic studies showed that focus prominence is not always
expressed by pitch accent, but also by alignment. Alignment is understood as
correspondence between the edge of a syntactic and/or phonological
constituent and the focused part of a sentence (McCarthy & Prince 1993;
Selkirk 1986). In Focus Prominence Theory (FPT) (Truckenbrodt 1995; Büring
2010) focus becomes prominent by introducing/deleting boundaries. In Focus
as Alignment Theory (FAT) (Féry 2013a), focus alignment may be obtained
even in the absence of prominence.
1
Note that åpek´s (2011) results are based on Turkish- English bilingual speakers. Interferences
cannot be excluded.
135
Caderno de Resumos
Based on previous studies, which did not succeed in identifying pitch
accent implementation as a focus marker in Turkish, the research question of
the present experiment is, if Turkish Information Structure uses alignment in
the prosodic expression of focus according to FPT and FAT.
Considering cross-linguistic focus typology, I expect that focus in
Turkish is expressed by alignment and not by pitch accent implementation.
Turkish does not modify pitch accent, but phrasing when Information Structure
changes. Corresponding to FPT, I expect the introduction and/ or deletion of
prosodic boundaries. I expect “immediately pre-focal rise” and PFC (Ýpek
2011) to be results of boundary insertion/ deletion to fulfill alignment. For each
pre-focal Ö, I expect the implementation of pre-nuclear high boundary tones
(Kan 2009, Güneº 2013) including boundary introduction on the object in verb
focus, causing a change in default phrasing in favor of AlignFocus. Phrasing is
also expected to change post-focally by PFC as a consequence of AlignFocus.
For the focused constituent, I expect the implementation of H* (Özge&
Bozºahin 2010), but no boundary tone (Kan 2009; Güneº 2013).
Adopting the methodology of Xu (1999), I designed five Turkish simple
SOV target sentences, each containing the same number of comparable
segments. Since Turkish word stress is final (Kornfilt 1979), it coincides with
the syllable designated for the implementation of boundary tones for focus
alignment. To avoid tonal clash, only words with initial word stress were
considered. Each target sentence was preceded by a question eliciting
contrastive focus on different constituents: subject-, object-, verb and broad
focus. Targets and preceding questions were presented on a slide, accompanied
by a picture. Six monolingual native speakers of Turkish were asked to read out
aloud the questions and following answers. A list of the target sentences is
provided in (1):
(1) Targets
(1) Nasrettin babasýný üzüyor.
Nasrettin father-POSS-ACC sadden-3SG-PRS.
Nasrettin saddens his father.
(2) Macide kardeºini çiziyor.
Macide sibling-POSS-ACC draw-3SG-PRS.
Macide draws her sibling.
(3) Nadide ablasýný özlüyor.
Nadide sister-POSS-ACC miss-3SG-PRS.
Nadide misses her sister.
136
4º Colóquio Brasileiro de Prosódia da Fala
(4) Fahýre Nacasýný seviyor.
Fahýre Nacý-POSS-ACC love-3SG-PRS.
Fahýre loves her Nacý.
(5) Yasemin aynacýyý dinliyor.
Yasemin mirror dealer-ACC listen-3SG-PRS.
Yasemin listens to the mirror dealer.
Analysis was done time-normalized in order to enable comparison
across all target sentences, focus conditions, and speakers. In a first step
analyses are reduced to F0 and will later include further acoustic correlates of
focus. Phonological description of the F0 contour among the different focus
conditions of the whole ? -phrase was done. Special attention was paid on
boundary tone implementation under the changing foci. All targets of all
speakers were annotated manually in Praat on the syllable level. Suprasegmental labeling of all targets for all speakers among all focus conditions
follows Kan (2009) using general ToBi labeling advices. Analyses include a
total of 120 sentences: 5 target sentences x 4 focus conditions x 6 speakers.
The descriptive phonological analyses of Turkish SOV declaratives
under changing foci reveal surprising issues which so far only partly fulfill the
previous expectations concerning the deletion and/or insertion of prosodic
boundaries to align focus. Results highly benefit the establishment of a general
intonation grammar of Turkish.
The production experiment shows that (i) speakers do not necessarily
modify overall F0 under manipulated focus conditions. Phonological
descriptions reveal (ii) that phrasing does not change under the manipulated
factor focus. Each pre-nuclear constituent is associated with a high tone H-.
Surprisingly, nuclear constituents, unless verbs, are associated with the same
high tone, which conflicts with Kan`s (2009) function of H- to delimit domains
and tonal units, rather representing a phrase tone. Since general mapping in
Turkish requires straight forward phrasing of verb and object into one vP (Kan
2009), the function of H- can alternatively be interpreted as an indicator of
HeadProminence. Hence, in contrast to previous descriptions of Turkish F0
contours, the analysis shows (iii) that the prosodic heads of all Ö are aligned
with H- on the ultimate syllable, including the heads of nuclear Ö´s. H- does not
represent the supposed H* of nuclear items since it is not aligned to metrically
strong syllables. In (2) the F0 contours of target sentence (2) of a male speaker
are provided. Overall F0 does not change phonologically for subject, object,
verb and broad focus.
137
Caderno de Resumos
(2) Phrasing of target sentence (2) with modified foci
The analyses furthermore show (iv) speaker variation in the phonetic
implementation of H- by not implementing downstep on the object, or
implementation of PFC. The F0 contour of (3) provides verb focus realization
in which general phrasing is maintained, but downstep not.
(3) Downstep blocking in verb focus of target sentence (3)
138
4º Colóquio Brasileiro de Prosódia da Fala
The phonological analysis of the experiment supports a new approach on
the prosodic structure of Turkish, based primarily on properties of prosodic
phrasing and less on pitch accent. The results indicate that focus is not
expressed by pitch accent implementation, but that constant phrasing takes
place under modified foci. Variation in pitch due to Information Structure takes
place on higher prosodic domains than syllables or ù. The implementation of
H- on heads of pre-nuclear and nuclear phrases shows that Turkish is strictly left
headed. Even if the focused constituent is aligned with the right edge of Ö,
HeadProminence overrides FocusProminence in the way that within the vP the
verb is not more prominent than the object. If expressed by means of F0 at all,
focus is preferably aligned with the edges of a higher prosodic domain than Öphrase.
To further examine the statistical relevance of the impact of focus on
downstepping phrase tones in ? , maximum F0 of the crucial syllables are
currently measured. Further acoustic cues accompanying phrasing, such as
break introduction (Féry 2013b) are also checked in the acoustic analyses.
References
Büring, D. 2010. “Towards a typology of focus realization”. In M. Zimmermann and C. Féry
(eds.). Information Structure. Theoretical, Typological and Experimental Perspectives.
Oxford: Oxford University Press: 177-205.
Erguvanlý, E. 1984. The function of word order in Turkish grammar. Berkeley: University of
California Publications.
Féry, C. 2013a. “Focus as prosodic alignment”. In: Natural Language and Linguistic Theory 31.
3: 683–734.
Féry, C. 2013b. Final compression in French as a phrasal phenomenon. University of Frankfurt:
http://web.uni-frankfurt.de/fb10/fery/publications/French-PFC-final%20copy.pdf
Göksel, A. and Özsoy, S. 2000: “Is there a focus position in Turkish?” In. Studies on Turkish and
Turkic Languages; Proceedings of the 9th International Conference on Turkish Linguistics.
Wiesbaden: Harrassowitz : 219–228.
Güneº, G. 2013. “Limit on syntax- prosody mapping in Turkish prosody of finite and non-finite
clausal parentheticals”. In: E. Erguvanli Taylan. Dibilim Arastirmalari Dergisi. Istanbul:
Boðaziçi University Press.
Ipek, C. 2011. “Phonetic realization of focus with no on-focus pitch range expansion in Turkish”.
In Proceedings of ICPhS XVI. Hong Kong.
Iºsever, S. 2003. “Information Structure in Turkish: The word order-prosody interface”. In
Lingua 113: 1025–1053.
Jackendoff, R. 1972. Semantic interpretation in generative grammar. Cambridge Mass.: MIT
Press.
139
Caderno de Resumos
Kan, S. 2009. Prosodic domains and the syntax-prosody mapping in Turkish. Master's thesis.
Bogazici University Istanbul.
Kornflit, J. 1979. Turkish. New York: Routledge.
McCarthy, J. and Prince, A. 1993. “Prosodic morphology”. In: J. Goldsmith. Handbook of
phonology. Blackwell: Oxford: 318-366.
Özge, U. & Bozºahin, C. 2010. “Intonation in the grammar of Turkish”. In Lingua 120: 132-175.
Selkirk, E. O. 1986. “On derived domains in sentence phonology”. In Phonology Yearbook 3:
371–405.
Truckenbrodt, H. 1995. Phonological phrases: their relation to syntax, focus & prominence.
Doctoral Dissertation. Cambridge, Mass.: MIT Press.
Xu, Y. 1999. “Effects of Tone and Focus on the Formation and Alignment of F0 Contours”.
Journal of Phonetics 27: 55–105.
140
4º Colóquio Brasileiro de Prosódia da Fala
A(s) pronúncia(s) do R final em canções do início do
século XX (1902-1920)
1
Karilene da Silva Xavier
1
Universidade Federal do Rio de Janeiro, Brasil
[email protected]
Este trabalho focaliza a realização variável do R, em posição de coda
silábica final, trazendo uma nova abordagem desse fenômeno no qual é muito
estudado no PB, pois o corpus é constituído a partir registros musicais dos
primeiros anos do século XX, quando a atividade musical iniciou seu
procedimento de expansão, divulgação e popularização no Rio de Janeiro.
Assim, as canções foram gravadas entre 1902 e 1920, por intérpretes de três
diferentes naturalidades -- Rio de Janeiro, Bahia e Rio Grande do Sul. O
registro sonoro foi disponibilizado pelo Instituto Moreira Salles, na série A
canção do tempo1 e pelo site Cifrantiga2, com o intuito de preservar a memória
radiofônica brasileira.
Devido ao escasso recurso técnico da fase mecânica da música brasileira,
a qualidade dos dados pode estar comprometida hoje em dia. Canções com a
qualidade de áudio péssima tiveram de ser excluídas da análise, porém há
inúmeras gravações com a qualidade de áudio boa. Elas representam um valor
histórico e cultural incalculável, pois são registros no tempo, ou seja, são
verdadeiros documentos, que mostram as diferentes criações, gêneros
musicais, ritmos, temas e performances, características e estilos de diversos
intérpretes, alguns deles desconhecidos pela cultura da música popular
brasileira. Constituem, ainda, fonte de pesquisa sobre o comportamento
linguístico de indivíduos habitantes de centros urbanos importantes no país,
numa época em que o registro de voz se restringia às ondas do rádio.
A partir dessas gravações musicais, é analisada a variabilidade de
http://ims.uol.com.br/radiobatuta
http://cifrantiga3.blogspot.com.br
141
Caderno de Resumos
realização do R final, inclusive a possibilidade de apagamento. Interessa-nos a
investigação desse fenômeno, pois o R apresenta "um elevado grau de
polimorfismo, prestando-se, exemplarmente, à caracterização da variação no
português do Brasil" (Callou et al. 1996). No que se refere à realização deste
segmento, de acordo com o que se lê na literatura, havia, no início do século
XX, uma grande predominância de realização da vibrante ápico-alveolar
múltipla pelos intérpretes da música popular brasileira (Anais do primeiro
Congresso de língua nacional cantada, 1938). Além de condicionamentos
fonológicos e morfológicos, mais recentemente tem sido verificado também o
papel do tipo de fronteira prosódica para a preservação/cancelamento do
segmento (Callou & Serra 2012). Nesse sentido, este trabalho também levará
em conta uma hipótese prosódica para a variabilidade de realização do R e,
como em propostas anteriores (Bisol 2002; Callou & Serra 2012; Serra
&Callou, no prelo), combinará o aparato teórico-metodológico da
sociolinguística quantitativa laboviana (Labov 1994) ao da teoria da hierarquia
prosódica (Selkirk 1984; Nespor & Vogel 1986, 2007).
Para a análise do processo de variação do R, é necessário considerar o
contexto em que ocorre o segmento, se em ataque -- início de palavra ou
intervocálico, se em coda silábica -- medial ou final, e seu tipo de realização -[+/-vibrante] e [+/- anterior] (Callou et al. 1996; Monaretto 2010). Nesse
trabalho será levada em consideração a posição específica de coda silábica
final, na qual as múltiplas realizações do R vão desde uma vibrante (simples ou
múltipla) ápico-alveolar, uma fricativa velar, uma fricativa laríngea surda
(aspiração) até a um zero fonético [Ø], gerando a tendência de produção do
padrão silábico básico CV: R x h Ø.
Segundo Labov (1972), “também é possível obter dados sistemáticos
nas transmissões de rádio e televisão embora aqui a seleção e os
condicionamentos estilísticos sejam em geral muito fortes”. É importante
mencionar que, nas gravações já analisadas até o momento, notou-se que a
forma de interpretação dos cantores era bastante padronizada, podendo ser
realizada de forma artificial, assim, diferentemente da sua fala espontânea.
Todavia, mesmo com tanta formalidade, havia também momentos em que o
intérprete distancia-se desta forma padronizada. Recuando no tempo,
pretendemos capturar esse processo gradual de diferenciação do rótico em coda
final, a fim de verificar a atuação da regra de posteriorização aliada à passagem
de vibrante à fricativa, passando progressivamente a zero.
142
4º Colóquio Brasileiro de Prosódia da Fala
Nossa hipótese é a de que, além de fatores linguísticos, como a classe
morfológica, as vogais antecedentes, os contextos subsequentes, a tonicidade, a
dimensão do vocábulo, e também extralinguísticos, como a idade, a
naturalidade, o gênero (feminino e masculino) dos cantores e a temática
musical, a estrutura prosódica também desempenharia um papel relevante no
processo de diferenciação do R, já que a fronteira de sintagma entoacional (IP)
favoreceria a manutenção da realização vibrante [+anterior], as fronteiras mais
baixas favorecendo o processo de diferenciação do rótico em outras variantes,
tendência já apontada em trabalhos recentes (Callou & Serra 2012).
Alguns resultados preliminares desse estudo, referentes à análise de 23
canções gravadas por intérpretes naturais do Rio de Janeiro disponibilizadas
pelo IMS, já têm sido analisados. As ocorrências do R final foram ouvidas e
anotadas foneticamente com o auxílio de programas de computador como o
PRAAT e o Sound Forge. Assim, até o momento atual da pesquisa, pudemos
observar que 1) ocorreu predominantemente, em 89% da distribuição total, a
realização da vibrante ápico-alveolar (múltipla ou simples), que era
considerada a forma padrão básica para a linguagem do rádio, teatro, televisão,
em outras palavras, a variante de prestígio, ou seja, aquela que deveria ser
difundida. Todavia, a realização do R como tepe (vibrante simples) ocorreu em
maioria, 68%, mostrando que nas primeiras décadas do século passado já
estaria ocorrendo um processo de enfraquecimento da realização do segmento
em questão – de vibrante múltipla à simples. Cabe ressaltar ainda que também
já ocorriam realizações mais posteriores do R, nomeadamente a fricativa glotal,
em 7% da distribuição total, o que indiciaria o início do processo de
posteriorização/ mudança de modo de articulação -- de vibrante para fricativa.
Ainda a partir desse corpus piloto, foi também verificada a não realização do R
final, em 4% das ocorrências de contexto de coda final, tendo ocorrido o
apagamento somente em verbos dissílabos e dentro da temática sertaneja. A
supressão total do R final podia estar associada à caracterização da linguagem
popular, da vida rural, o que, em termos labovianos, poderia indicar uma
mudança de baixo para cima (registro popular -> registro culto). Em relação ao
fator prosódico, não pudemos ainda postular um mesmo condicionamento
prosódico para a fala espontânea e a fala cantada. Pretendemos, nessa etapa do
trabalho, analisar um número maior de canções gravadas entre 1902 e 1920, a
fim de termos um quadro robusto das realizações possível do R em coda
silábica final, no início do século XX.
143
Caderno de Resumos
Referências
Bisol, L. 2002. “A degeminação e a elisão no VARSUL”. In: Bisol, L. & Brescancini, C.
(org.). Fonologia e variação: recortes do português brasileiro. Porto Alegre:
EDIPUCRS: 231-250.
Callou, D. ; Leite, Y. & Moraes, J. 1996. “Variação e diferenciação dialetal: a pronúncia
do /r/ no português do Brasil”. In Gramática do Português Falado vol. VI, I. Koch,
(ed.), 465-493. Campinas: UNICAMP.
Callou, D. & Serra, C. 2012. “Variação do rótico e estrutura prosódica”. In Revista do
GELNE 14 (Especial): 41-58.
Labov, W. 1994. Principles of linguistic change. Internal factors. Cambridge,
Blackwell.
Monaretto, V. 2010. “Descrição da vibrante no português do sul do Brasil”. In: Bisol,
L.; Collischonn, G. (Orgs). Português do Sul do Brasil. Porto Alegre: EDIPUCRS:
119-127.
Nespor, M. & Vogel, I. 1986. Prosodic phonology. Dordrecht: Foris.
Selkirk, E. 1984. Phonology and syntax: the relation between sound and structure.
Cambridge: M.I.T. Press.
Serra, C & Callou, D. 2013. A interrelação de fenômenos segmentais e prosódicos:
confrontando três comunidades. (no prelo) Textos Selecionados do XXVIII
Encontro Nacional da APL -- Universidade do Faro (Algarve-Portugal).
144
4º Colóquio Brasileiro de Prosódia da Fala
Exclamativas WH em português brasileiro: metodologia
para montagem de experimentos de produção e
aceitabilidade
Karina Zendron da Cunha
1
1
Programa de Pós-Graduação em Linguística, Universidade Federal
de Santa Catarina, Brasil
[email protected]
Esta pesquisa tem por objetivo responder se há dois tipos de sentenças
exclamativas WH em português brasileiro (doravante PB). O interesse por esse
tema surgiu a partir do artigo de Zanuttini e Portner (2003), no qual os autores
afirmam que, em paduano, italiano e inglês, há dois tipos de exclamativas WH: as
com WH do tipo E-only e as com WH do tipo non-E-only. Para esses autores, o
WH do tipo E-only pode estar presente apenas nas sentenças exclamativas,
enquanto o WH non-E-only pode estar presente em exclamativas e interrogativas.
Zanuttini e Portner (2003) afirmam que há similaridades entre as
sentenças exclamativas e as interrogativas nas línguas e que, uma vez que
ambas denotam um conjunto de proposições, sua sintaxe é semelhante no que
diz respeito a esse aspecto de seus significados. As diferenças sutis entre
exclamativas e interrogativas são explicadas pela presença, nas exclamativas,
do morfema abstrato que expressa factividade.
Dessa forma, o operador factivo e o constituinte WH das exclamativas
correspondem a dois componentes semânticos que distinguem as exclamativas
de outros tipos de sentença. Mas os constituintes WH presentes nas
exclamativas nem sempre são idênticos. Os autores argumentam que há um
WH que ocorre apenas nas exclamativas, enquanto um outro tipo pode ocorrer
tanto nas exclamativas quanto nas interrogativas. Esse WH que ocorre apenas
nas exclamativas contém um morfema que não está presente nos outros WHs e
tem uma relação “especial” com o operador factivo. Além disso, esse WH
ocupa uma posição bastante alta no CP, enquanto os outros ocupam uma
posição mais baixa. Zanuttini e Portner chamam esse WH que ocorre apenas
145
Caderno de Resumos
nas exclamativas de E-only e o WH que ocorre tanto em exclamativas quanto
em interrogativas de non-E-only.
Para mostrar qual é a diferença entre as exclamativas com WH E-only e
as exclamativas com WH non-E-only, os autores fornecem dados do italiano,
do paduano e do inglês. Nos dados do italiano, por exemplo, o WH E-only
coocorre obrigatoriamente com o complementizador che e permite um
constituinte à direita do WH, enquanto, nas sentenças com WH non-E-only,
encontramos o mesmo comportamento das interrogativas, ou seja, o verbo
segue imediatamente o WH (em Cº) e nenhum elemento deslocado pode seguir
o WH. Já nos dados do inglês, não há um complementizador visível e elementos
deslocados à esquerda não podem seguir o WH. Nessa língua, os casos claros de
WH E-only acontecem nos seguintes contextos: how very many+NP, how
very+AP/AdvP e what a+NP. Os elementos a e very que não estão presentes na
contraparte interrogativa do WH representam, segundo os autores, a natureza
E-only da sentença.
Com base nessa literatura, pretende-se verificar se algo parecido
acontece com os dados do PB. Dados preliminares, apresentados em Zendron
da Cunha (2012), podem indicar que as exclamativas que contêm o elemento
WH “como”, por exemplo em: “Como é lindo aquele homem!” e “Como é lindo
o Léo e a Maria!”, são do tipo E-only, enquanto as exclamativas com os WHs
“que” e “quanto”, por exemplo em: “Que alto que ele é!” e “Quanto homem
nesse lugar”, são do tipo non-E-only. Ainda em Zendron da Cunha (2012),
verificou-se se, entre esses dois tipos possíveis de exclamativas WH, existem
diferenças de padrão entoacional. Os resultados preliminares mostraram que o
padrão entoacional das exclamativas com WH do tipo E-only se assemelha ao
padrão de outro tipo de exclamativa, as small clauses livres. Já as exclamativas
com o WH non-E-only tem um padrão entoacional mais próximo do padrão de
um dos tipos de sentença interrogativa descrita por Moraes (1998), como
“Quando você soube?”. Para o autor, nesse tipo de sentença, há um aumento de
pitch na primeira sílaba acentuada e também na última sílaba acentuada do
enunciado.
Com o objetivo de refutar ou comprovar esses resultados, proponho este
estudo que investigará, entre outras coisas, se os resultados alcançados por
Zendron da Cunha (2012) até o momento podem estar relacionados a efeitos
microprosódicos.
Para isso, dois experimentos serão realizados: um de produção de fala e
outro de aceitabilidade. No primeiro, serão gravados 4 repetições de 24
146
4º Colóquio Brasileiro de Prosódia da Fala
sentenças, 12 exclamativas e 12 interrogativas, para verificar se há semelhança
no padrão entoacional das exclamativas non-E-only com as interrogativas.
Nesse experimento, serão gravados 5 informantes do sexo feminino,
falantes nativas de PB. Os dados serão apresentados aos informantes
aleatoriamente dentro de contextos, como por exemplo em:
“Maria está em um restaurante esperando atendimento. Passa por ela um
garçom muito bonito. Maria então comenta com Joana:
- Como é lindo aquele homem!”
A análise dos dados será feita com o auxílio do programa PRAAT, versão
5.1.38 e do script MOMEL/INTSINT for PRAAT, versão 10.3. O MOMEL,
proposto por Hirst em 1983, tem como propósito reduzir a curva de frequência
fundamental a pontos-alvo. Esses dados, por sua vez, podem ser passados
através do INTSINT para representações qualitativas. O INTSINT, segundo
Celeste (2007), foi desenvolvido com o objetivo de se postular um sistema de
códigos para análise prosódica capaz de representar qualquer distinção
entonativa significativa. A transcrição prosódica seguirá o modelo
autossegmental e métrico.
Depois de feita a gravação e a análise dos dados, no experimento de
aceitabilidade, objetiva-se responder à seguinte questão (já proposta em
Zendron da Cunha 2012): a presença do complementizador é obrigatória em
pelo menos algumas construções exclamativas?
Para responder a essa questão, o complementizador “que” será inserido
nas exclamativas e interrogativas e alguns falantes nativos do PB farão uma
avaliação, considerando aceitável ou não-aceitável tal inclusão. Veja nos
exemplos (1) e (2):
(1) a. Como que é lindo aquele homem!
b. Como que tá madura a laranja!
c. Quanta barata que nessa casa!
d. Quanto doce que a Maria come!
(2) a. Como que você conheceu aquele homem?
b. Como que você faz bolo de laranja?
c. Quantas vezes que você limpou a casa?
d. Quanto doce que você come?
147
Caderno de Resumos
O último teste pretende verificar se é possível não haver movimento do
elemento WH em exclamativas e também em interrogativas, como mostram os
exemplos abaixo:
(3) a. Aquele homem como é lindo!
b. A laranja como que tá madura!
c. Nessa casa quanta barata!
(4) a. Você conheceu aquele homem como?
b. Você faz bolo de laranja como?
c. Você limpou a casa quantas vezes?
Se os dados de produção mostrarem resultados relevantes, também será
realizado um experimento de percepção, no qual as sentenças serão filtradas e
os informantes deverão responder se se trata de uma interrogativa ou de uma
exclamativa. Para esse teste, também será utilizado o programa PRAAT, versão
5.1.38.
Espera-se, portanto, que, com a metodologia aqui proposta, seja possível
coletar resultados que confirmem a hipótese já levantada em Zendron da Cunha
(2012), qual seja, a de que há dois tipos de exclamativas WH em PB.
Referências
Celeste, L. C. 2007. MOMEL e INTSINT: uma contribuição à metodologia do estudo
prosódico do Português Brasileiro. 2007. 222 f. Dissertação (Mestrado em
Linguística) – Faculdade de Letras, Universidade Federal de Minas Gerais, Belo
Horizonte.
Moraes, J. A. 1998. Intonation in Brazilian Portuguese. In: HIRST, D.; Di Cristo (Org.).
Intonation systems: a survey of twenty languages. Cambridge University Press,
Cambridge.
Zanuttini, R. & Portner, P. 2003. Exclamative clauses: at the syntax-semantics
interface. Language 79 (1): 39–81. Disponível em:
<http://www9.georgetown.edu/faculty/portnerp/nsfsite/excl-paper.pdf>. Acesso
em: 21 jul. 2013.
Zendron da Cunha, K. 2012. Sentenças exclamativas em português brasileiro: padrão
entoacional e sintaxe. 2012. 146 f. Dissertação (Mestrado em Letras) – Programa de
Pós-Graduação em Letras, Setor de Ciências Humanas Letras e Artes, Universidade
Federal do Paraná, Curitiba. Disponível em:
<http://dspace.c3sl.ufpr.br:8080//dspace/handle/1884/27360>. Acesso em: 04 jul.
2013.
148
4º Colóquio Brasileiro de Prosódia da Fala
149
Caderno de Resumos
150
4º Colóquio Brasileiro de Prosódia da Fala
Context of elicitation / Positive laughs
%
Funny videos
76%
(A: 83, E: 65, U: 87)
NAO laughs
42%
(A: 23, E:45, U: 62 )
Tongue-twisters game 18%
(A: 29, E: 18, U: 0)
Jokes
42%
(A: 29, E:40, U: 63)
Negative laughs
No laughs
4%
(A: 0, E: 9, U:0)
22%
(A: 23, E: 30, U:0 )
62%
(A: 64, E: 65, U:50 )
24%
(A: 21, E: 26, U:25)
20%
(A:17, E: 26, U:12)
36%
(A: 54,E:25,U: 38)
20%
(A: 7, E:17,U: 50)
34%
(A:50,E: 30,U: 12)
Table1: Repartition of laughs (A : Asian, E : European, A: U: American)
151
Caderno de Resumos
We can see that Positive laughs were elicited with funny videos, NAO
laughs and jokes. Negative laughs mostly occurred during the tongue-twisters
game. Sense of humor is both personal and cultural. We asked subjects to fill
three after the experiment questionnaires: one about their sense of humor, on
about their personality (OCEAN) and one about the experience. 94% of the
subjects enjoyed the experiments: most (49%) preferred the tongue-twister
games, then the videos and then the jokes.
4. Audio analysis
The ComParE Interspeech Challenge 2013 [Schuller et al., 2013] on
social signals detection in natural conversations used brute force strategy for
training model with a huge number of features (# 6373) which are not easy to
analyze. Here we use a different strategy trying to explain which kind of
features seems more adequate to distinguish between positive and negative
laughter. For this first analysis, we use acoustic parameters extracted with
PRAAT: duration of the segment, range pitch, range mean pitch, zero-crossing
rate, intensity range, intensity mean range, pourcent of voice breaks, jitter_rap,
jitter_fac, shimmer_apq11 and mean_hnr.
5. First experiment and Conclusion
First prosodic analysis was carried out on positive/negative
laughs. As a first conclusion, we can say that positive laughter has more
voiced parts in our corpus than negative laughter, regardless of the
culture of the participants. A lot of these laughs have a noisy background
and are sometimes superposed to speech. There is also a lot of variability
in acoustic expression of laughs in the different contexts of elicitation. A
perceptive test will be carried out to verify the annotations. Future experiments
will attempt to correlate acoustic cues with answers to the questionnaires.
References
Bachorowski, J., Smoski, M, Owren, M. 2001. The acoustic features of human laughter.
Journal of the Acoustical Society of America, 110: 1581–1597.
152
4º Colóquio Brasileiro de Prosódia da Fala
Carter, A. 2000. Automatic acoustic laughter detection. Master Thesis, Keele
University.
Devillers, L. Vidrascu L. 2007. Positive and negative emotional states behind the laughs in
spontaneous spoken dialogs. Workshop Laughter 2007 of ICPHs.
McKeown, G. Cowie, R., Curran, W., Ruch, W., Douglas-Cowie E. 2012. ILHAIRE
Laughter Database. Proceedings of the 4th International Workshop on EMOTION
SENTIMENT & SOCIAL SIGNALS, LREC 2012, May 2012, Istanbul, Turkey,
ELRA.
Knox T. & Mirghafori W. 2007. Automatic Laughter Detection Using Neural
Networks, Proceedings of Interspeech.
Krumhuber E. & Scherer, K. 2011. “Affect bursts: Dynamic patterns of facial
expressions”. Journal of Emotion. Aug ; 11 (4):742.
Schuller, B., Steidl S., Batliner, A., Alessandro Vinciarelli A., Scherer K., Ringeval, F.,
Chetouani, M., Weninger, F., Eyben, F., Marchi, E., Mortillaro, M., Salamin, H.,
Polychroniou, A., Valente F., Kim, S. 2013. The INTERSPEECH 2013
Computational Paralinguistics Challenge Social Signals, Conflict, Emotion,
Autism; Interspeech.
Schröder, M. 2003. Experimental study of affect bursts, Speech Communication –
Special session on speech and emotion, 40, Issue 1-2.
Soury, M., Gossart, C., Adda, M., Devillers L. 2013. “A tool to elicit and collect
multicultural and multimodal laughter”, Show & Tell, Proceedings of
Interpseech,
Szameitat, Diana P. et al. 2009. Differentiation of Emotions in Laughter at the
Behavioral Level. Emotion 9 (3): 399.
Tahon, M., Devillers, L. 2010. Acoustic measures characterizing anger across corpora
collected in artificial or natural context. In Speech Prosody. Chicago, USA.
Trouvain, J. 2003. “Segmenting phonetic units in laughter”. In Proc. Intern. Confer. on
the Phonetic Sciences: 2793-2796. Barcelona.
153
Caderno de Resumos
Descendo ou subindo? Padrões entonacionais de
interrogativas totais da língua inglesa e do português
brasileiro por falantes brasileiros
1
Leonice Passarella dos Reis
Programa de Pós-Graduação em Inglês, UFSC, Brasil.
[email protected]
Os benefícios do ensino de pronúncia no processo de aquisição de uma
língua adicional são inquestionáveis. No entanto, determinar a quantidade
adequada e os aspectos da pronúncia mais importantes a serem ensinados é não
só uma necessidade, mas também um desafio (Berns 2008; Jenkins 2003). De
acordo com Berns (2008), esses aspectos da pronúncia devem ser considerados
dentro de uma comunidade específica de falantes. No Brasil, algumas pesquisas
foram conduzidas principalmente no nível segmental, mas muita pesquisa ainda
é necessária para determinar que aspectos de pronúncia (no nível segmental ou
suprassegmental) podem comprometer a comunicação de falantes de português
brasileiro (PB) em inglês.
Com o intuito de colaborar com pesquisas na área, este estudo tem como
objetivo investigar os padrões entonacionais de interrogativas totais neutras
realizadas por falantes do PB em inglês e em português, uma vez que tais padrões
diferem nas duas línguas. Neste estudo, o termo “neutra” indica que a pergunta é
feita buscando uma informação desconhecida, ou seja, a resposta à pergunta é um
dado completamente novo ao locutor. Para Moraes (2008), o contorno melódico
do núcleo das interrogativas totais neutras do PB é traduzido pela notação
/LH*L%/. Já, para o inglês americano, a notação é /L*HH%/ (HEDBERG,
SOSA & FADDEN, 2004). A principal diferença entre os dois padrões está no
tom de fronteira que é descendente para o PB e ascendente para o inglês.
Esta pesquisa busca entender se essa diferença no padrão das
interrogativas afeta a maneira como os falantes brasileiros produzem os padrões
das interrogativas totais em inglês. Para isso, contou com 13 participantes: um
falante de inglês (americano), nove brasileiros falantes de inglês e três
154
4º Colóquio Brasileiro de Prosódia da Fala
avaliadores brasileiros. Os nove participantes brasileiros, todos cariocas do sexo
masculino, participaram de três sessões de coleta de dados. Na primeira sessão,
os participantes preencheram um Termo de Consentimento, responderam a um
questionário, gravaram a descrição de figuras e receberam duas versões
impressas de um diálogo entre Mary e John em inglês, criado pela autora para o
presente estudo, a ser gravado na sessão seguinte. Na segunda sessão,
solucionaram dúvidas de pronúncia e fizeram a gravação do diálogo em inglês.
Na terceira, realizaram a gravação de duas versões de um diálogo entre Mari e
João em português.
O participante americano (da Califórnia) preencheu o Termo de
Consentimento, respondeu a um questionário e fez a gravação das duas versões
do diálogo em inglês, em um momento de interação com sua esposa, sob o
acompanhamento de uma pesquisadora colaboradora no Canadá, onde residem
atualmente. A leitura realizada para a gravação dos diálogos pelos 10
participantes foi feita com alternância, de modo que cada participante lesse todas
as falas em que houvesse perguntas, ou seja, as falas do John e as da Mary, para o
inglês, e as falas do João e as da Mari, em português (excetuando-se o
participante americano para este último). Para isso, adequações no diálogo foram
feitas, de modo a criar as duas versões, como, por exemplo, no momento da
resposta à pergunta “What's your name?”.
A partir da produção oral realizada pelos nove participantes brasileiros
através da descrição de figuras, o Teste de Proficiência foi desenvolvido e
submetido a três avaliadoras altamente proficientes em inglês, todas com pósgraduação em inglês na área de Fonética e Fonologia. Tendo como base a
discussão trazida por Silveira (2011), nenhum treinamento sistemático foi
oferecido às avaliadoras, de modo a garantir que suas avaliações refletissem os
critérios subjetivos que elas costumam empregar em tal prática. As avaliadoras
ouviram o áudio contendo uma amostra de cada informante e avaliaram o nível
de proficiência oral com o uso de uma escala tipo likert que vai de 0 (zero) – nível
de proficiência oral muito baixo – a 10 (dez) – nível de proficiência semelhante à
do falante de inglês como língua materna. Após análise do resultado do Teste de
Proficiência, apenas os dados referentes aos participantes com o mesmo nível de
proficiência foram analisados.
As 115 amostras de áudio com interrogativas totais foram recortadas e os
padrões entonacionais foram descritos através da notação do sistema métrico
autossegmental (L e H) com o auxílio do software de análise de fala - Praat, como
155
Caderno de Resumos
explicado a seguir: (1) as interrogativas totais produzidas pelo falante americano
foram analisadas de modo a descrever os padrões entonacionais por ele
produzidos para futura referência/comparação com os padrões encontrados pelos
falantes brasileiros; (2) as interrogativas produzidas pelos falantes do PB foram
analisadas de modo a descrever os padrões entonacionais por eles produzidos nas
duas línguas.
Os padrões encontrados foram analisados comparativamente: (1) de
acordo com a língua (inglês ou PB), considerando as versões do diálogo em
português e em inglês, com vias a investigar se os padrões produzidos pelos
falantes de PB diferiam ou não nas duas línguas e (2) de acordo com o status da
língua (materna, para o falante americano, e internacional, para os falantes
brasileiros), considerando as produções em inglês do falante americano e dos
falantes do PB, com vias a investigar se os padrões dos dois falantes se
assemelhavam ou não.
A análise buscou responder às seguintes perguntas de pesquisa: (1) Há
diferenças nos padrões entonacionais das interrogativas totais em inglês com
contornos ascendentes produzidos por falantes do PB quando comparados com
aqueles produzidos por falantes de inglês? Se sim, quais são? (2) Os resultados
encontrados podem ser explicados à luz da transferência linguística? As
hipóteses foram as seguintes: (1) a produção dos padrões entonacionais das
interrogativas totais dos falantes de PB serão diferentes dos produzidos pelo
falante americano; e (2) essa diferença coincidirá com os padrões produzidos
pelos falantes de PB em suas interrogativas totais no português, próprio do
processo conhecido como transferência linguística (influência da língua materna
sobre a língua adicional).
Os resultados preliminares, obtidos a partir de dois informantes com nível
de proficiência semelhante, apontam para dois comportamentos distintos. No
primeiro, considerando os dados de um informante que não estuda inglês
atualmente, a análise fonológica das amostras em inglês indicou que a produção
dos padrões entonacionais do falante do PB é a mesma dos produzidos pelo
falante americano (L*H%) e diferente das amostras em português, que respeita
os padrões entonacionais do PB (LH*L%). Isso sugere que esse informante
parece haver adquirido os padrões entonacionais do inglês e não parece possuir
interferência da L1 nas produções desses padrões na língua adicional. No
segundo, considerando os dados de um informante que estuda inglês atualmente,
a análise fonológica confirma a primeira hipótese e parcialmente confirma a
156
4º Colóquio Brasileiro de Prosódia da Fala
segunda, ou seja, há diferenças entre a produção do falante americano e a do
falante do PB, mas a produção dos padrões entonacionais do último não é a
mesma nas duas línguas. Isso sugere que parece haver uma interferência da L1,
mas essa interferência não se faz através da transferência direta dos padrões
entonacionais da L1 para os da língua adicional.
Futuras pesquisas poderão investigar o impacto no ouvinte (falantes de
inglês como língua materna e falantes de inglês como língua adicional de outras
línguas maternas) ao perceber tais padrões entonacionais e que interferências
reais esses desvios poderiam trazer à interação mútua/comunicação.
Referências
Berns, M. 2008. “World Englishes, English as a lingua franca, and intelligibility”. World
Englishes, 27(3): 327-334.
Hedberg, N., Sosa, J. M. & Fadden, L. 2004. "Meanings and Configurations of Questions
in English". Proceedings of Speech Prosody 2004, Nara, Japan. Paper (PDF)
Jenkins, J. 2003. “Community, Currency and the Lingua Franca Core”. TESOL Spain
Newsletter. 26, Spring.
Moraes, J. A. 2008. “The pitch accents in Brazilian Portuguese : analysis by synthesis”,
S p e e c h P ro s o d y , C a m p i n a s . D i s p o n í v e l e m : < h t t p : / / w w w. i s c a speech.org/archive/sp2008/papers/sp08_389.pdf>
Silveira, R. 2011. “Avaliando a proficiência oral em língua inglesa: o papel dos
avaliadores e dos informantes”. In Mota, M. B., Bergsleithner, J. M. & Weissheimer, J.
(Org.). Produção Oral em LE: Múltiplas Perspectivas. Campinas: Pontes, 19: 73-96.
157
Caderno de Resumos
Estrutura discursiva como limitadora de padres
entoacionais, e vice-versa
Luciana Lucente
Departamento de Linguística, Universidade Federal de Minas Gerais,
Brasil
[email protected]
A relação entre prosódia e discurso é bastante discutida, porém são
poucos os trabalhos experimentais que mostram essa relação, sobre tudo no
português brasileiro (PB). Em Lucente (2012) essa relação é explorada ao
investigar o alinhamento entre fronteiras entoacionais, acentos frasais e
unidades discursivas. Neste trabalho, para dar conta da organização discursiva
foi adotado o modelo de Grosz e Sidner (1986), que se baseia nos pressupostos:
atenção, intenção e estrutura discursiva. Aplicando esse modelo à análise da
estrutura discursiva da fala espontânea (de acordo com a definição apresentada
no mesmo trabalho) pode-se observar que para cada segmento discursivo estão
alinhados fronteiras de grupos acentuais (Barbosa 2006) e contornos
entoacionais específicos, que são componentes prosódicos. Os grupos
acentuais referem-se ao intervalo entre dois acentos frasais, que são segmentos
em que ocorre maior duração das vogais. Os contornos entoacionais são
definidos de acordo com o sistema DaTo de notação entoacional (Lucente
2008; 2012) e se referem a codificação de informações comunicativas pela
frequência fundamental (f0) e tem um alvo linguístico a ser atingido. Esse
alinhamento pode ser explicado ao se adotar o modelo de produção a fala
presente em Lucente (2012) a partir de um acréscimo de um oscilador glotal ao
modelo proposto originalmente por Barbosa (2006).
A proposta do presente trabalho foi aplicar um experimento que pudesse
atestar essa ocorrência e verificar que outros elementos podem estar presentes
nessa estrutura discursivo-prosódica auxiliando nosso entendimento sobre o
fenômeno.
Para tanto, na primeira etapa do experimento foram selecionados quatro
arquivos de áudio com exemplos de fala espontânea, sendo uma em taxa de
elocução lenta, uma normal e uma rápida. O terceiro exemplo se trata de uma
158
4º Colóquio Brasileiro de Prosódia da Fala
fala nonsense, porém como estrutura sintática preservada. Foi proposto
primeiramente a um grupo de 12 estudantes de letras (todos nascidos em Belo
Horizonte com faixa etária entre 20 e 25 anos) a indicação de proeminências na
transcrição das falas em formato impresso ao mesmo tempo em que lhes eram
apresentadas as respectivas gravações dos textos. Essa marcação de locais de
ocorrência de proeminências foi comparada a marcação de grupos acentuais
feita automaticamente pelo programa SG Detector (Barbosa 2006).
Na segunda etapa do experimento foi proposto para seis estudantes (um
subgrupo do grupo anterior), em um intervalo de 10 dias após o primeiro
experimento, a segmentação dos mesmos textos em unidades discursivas,
seguindo o modelo de segmentação de Grosz e Sidner. Antes da realização no
segundo experimento os alunos foram submetidos a um treinamento de 6 horas
para aprendizagem da segmentação segundo o modelo referido.
Para a primeira parte foi feita uma contagem da porcentagem de
ocorrências por item marcado como proeminente, sendo consideradas
relevantes as marcações que continham mais de 50% de ocorrências (igual ou
mais que seis marcações). Para a segunda parte do experimento também foi
analisada a concordância entre os sujeitos quanto à segmentação em unidades
discursivas, sendo que as marcações que obtiveram valor acima de 50% de
ocorrências como fronteiras na segmentação discursiva foram consideradas
“marcações fortes”, ou ocorrendo em “palavras fortes”.
A partir das indicações de proeminência e segmentação foi feito um
cruzamento desses dados a fim de verificar o quanto a estrutura discursiva e a
prosódica estão inter-relacionadas, como nos exemplos:
a) segmentação em unidades discursivas com palavras fortes em negrito:
olha eu queria chorar
porque eu não tenho assim ahh condição de prever o meu futuro
além do ponto final se tornando uma outra língua brasileira
porque eu acho que o futuro a Deus pertence
e Aton
então o futuro pertence ao ponto Aton
porque eu acho que o nosso futuro é muito reluzente
que no futuro a gente pira
não vai ter mais a que se reportar
então as réplicas elas são constantes (...)
159
Caderno de Resumos
b) marcação de proeminências :
olha(8) eu queria chorar(6) porque eu não tenho assim(3) ahh(4)
condição(8) de prever o meu futuro(10) além do ponto(3) final se tornando
uma(1) outra língua brasileira(6) porque eu acho que o futuro(10) a deus
pertence(8) e aton(9) então o futuro pertence(1) ao ponto(4) aton(6) porque
eu acho que o nosso futuro é muito reluzente(6) que no futuro a gente pira(8)
não(2) vai(7) ter(3) mais a que(3) se reportar(4) então as réplicas(4) elas são
constantes(10) (...)
Os resultados preliminares mostraram: i) probabilidade alta de ocorrer o
alinhamento entre as marcações de proeminências feitas pelos sujeitos e pelo
programa SG Detector; ii) probabilidade alta de alinhamento entre as palavras
marcadas como mais proeminente (tanto manualmente quanto
automaticamente) e fronteiras de segmentos discursivos quando ocorrem nas
chamadas fronteiras fortes, como mostra a Figura 1. Quanto à taxa de elocução,
foi observada menor concordância no alinhamento entre as marcações de
proeminências no áudio que apresentava taxa de elocução mais rápida e as
fronteiras de seus segmentos discursivos marcados pelas palavras fortes.
Em relação à marcação dos contornos entoacionais, como previsto, estes
acompanham a marcação de proeminências, e são predominantemente
contornos de fronteira LHL e HL, o que indica a estrutura discursiva
influenciando a prosódica, e vice versa. Os outros tipos de contornos, como LH,
>LH e HLH ficam restritos à marcação de foco, e raramente ocorrem em
posição de fronteira. Tais contornos ficam marcam os itens marcados como
proeminentes que não se alinham discursivamente com fronteiras, como se
pode ver nas palavras “chorar” e “futuro” assinaladas na figura abaixo:
160
4º Colóquio Brasileiro de Prosódia da Fala
Pitch (Hz)
600
LH
>LH
olha
eu
queria
chorar
HLH
porque eu
não
tenho
assim
ahh
condição
LH
:::
de
prever o meu
futuro
::
0
0
6.441
Time (s)
Figura 1: contornos LH marcando fronteiras discursivas em palavras fortes.
A discussão a que o experimento conduz é sobre o fato de as estruturas
discursiva e prosódica estarem ligadas de forma bastante intrínseca e como
partes de um sistema dinâmico de produção da fala, podendo ter como atrator os
grupos acentuais. Outro ponto a ser discutido é em que nível se dá essa
interação, pois de acordo com o modelo de Barbosa (2006) e Lucente (2012), o
processamento do discurso está em um nível superior na produção da fala,
juntamente com a sintaxe e a semântica, como um componente cognitivo, e a
prosódia em um nível executivo, ou cognitivo-executivo.
Referências
Barbosa, P. A. 2006. Incursões em torno do ritmo da fala. Campinas: Pontes.
Grosz, B. J., & Sidner, C. L. 1986. “Attention, Intentions, and the Structure of
Discourse”, Computational Linguistics, p. 12:3.
Lucente, L. 2008. DaTo: Um sistema de notação entoacional do português brasileiro
baseado em princípios dinâmicos. Ênfase no foco e na fala espontânea. Dissertação
de Mestrado. Unicamp.
________. 2012. Aspectos Dinâmicos da Fala e da Entoação no Português Brasileiro.
Tese de Doutorado, Unicamp.
161
Caderno de Resumos
A entoação do português do Brasil: uma descrição
perceptiva
1
Luma da Silva Miranda
1
Faculdade de Letras, Universidade Federal do Rio de Janeiro, Brasil
[email protected]
1. Introdução
O inventário de padrões melódicos de uma língua pode ser estabelecido
através de várias abordagens. No presente trabalho, adota-se uma perspectiva
perceptiva para a descrição dos padrões melódicos do Português Brasileiro. A
teoria do modelo IPO (Institute for Perception Research) entende que uma
abordagem perceptiva proporciona um filtro que resulta numa redução
necessária dos dados de origem acústica ou fisiológica. Tais dados “filtrados”
contêm as informações mais relevantes da entoação para o propósito da
comunicação.
Utilizando o aporte teórico-metodológico do modelo IPO, um grupo de
contornos melódicos da entoação do Português do Brasil foi analisado no
intuito de se descrever os padrões entoacionais de acordo com a metodologia
elaborada pelo modelo. Dessa forma, foram considerados oito padrões
melódicos, a saber: asserção, questão total, questão parcial, exclamação,
pedido, ordem, sugestão e desafio.
O objetivo do presente trabalho é apresentar uma descrição desses
contornos melódicos de acordo com a metodologia proposta pelo modelo IPO.
Por isso, a pesquisa segue os seguintes passos para essa investigação: (i)
descrever as propriedades prosódicas dos contornos melódicos da entoação do
Português do Brasil; (ii) identificar as propriedades fundamentais dos
contornos através do método da Escola Holandesa e (iii) verificar a tolerância
desses contornos às modificações feitas através de testes de percepção com
ouvintes que são falantes nativos da língua.
Nessa pesquisa são levantadas as seguintes indagações quanto à relação
das propriedades fonológicas da entoação e seus correspondentes no contínuo
fonético:
162
4º Colóquio Brasileiro de Prosódia da Fala
(i) Quais são as unidades melódicas que caracterizam os contornos
melódicos?
(ii) As informações de ordem melódica recaem em quais pontos-chave
de cada contorno analisado?
(iii) As técnicas de descrição do modelo IPO são suficientes para
descrever os padrões entoacionais do Português do Brasil?
2. O modelo IPO
Segundo 't Hart, J., Collier, R., Cohen, A. (1990), a abordagem do
modelo IPO considera a curva melódica observável na superfície como o
resultado de padrões melódicos de dois diferentes níveis que se superpõem: um
nível global (a linha de declínio da F0) e um nível local (configurações
melódicas). A descrição da curva melódica, no primeiro nível de análise,
possui uma orientação mais fonética do que fonológica, pois a investigação
concentra-se no estudo dos fenômenos acústicos baseados em tolerâncias
perceptuais.
A Escola Holandesa postula que as configurações são compostas por
movimentos melódicos ascendentes e descendentes além de alguns
movimentos “planos”, que seguem a linha de declínio, que são modelados
como segmentos de retas. O contorno final gerado com essa modelagem
“artificial” deve ser idêntico, do ponto de vista perceptivo, ao contorno original,
o que se convencionou chamar na teoria de “close copy stylization”, isto é, uma
estilização da curva melódica que apresenta equivalência perceptiva com a
curva original.
3. Metodologia
A metodologia do trabalho, de maneira geral, consiste em simplificar a
curva melódica para que se obtenha a “forma fonológica” do padrão
entoacional através dos movimentos melódicos relevantes perceptivamente.
Ao utilizar a técnica de ressíntese, incluída em alguns pacotes de análise
acústica, como o Praat (Boersma & Weenink 2009), geraram-se, em pequenos
passos, padrões melódicos alternativos, minimamente modificados, e foram
163
Caderno de Resumos
verificados, junto a um grupo de ouvintes, que tipo de alteração melódica é
ainda aceita como natural, e que alteração já começa a comprometer a
percepção e o significado do padrão entoacional. Por meio desse procedimento,
conhecido na literatura como “estilização” do contorno melódico, buscou-se
chegar a uma curva bastante simplificada, “ideal”, de cada padrão entoacional
analisado.
Os movimentos melódicos locais, que constituem os componentes
básicos do modelo, são caracterizados pela atribuição binária de 4 traços: (i)
[RISE] - Ascendente/descendente: direção do movimento; (ii) [EARLY] and
[LATE] - Antecipado/retardado: o movimento acaba no início, meio ou final da
parte sonora da sílaba; (iii) [SPREAD] - Estendido: atinge mais de uma sílaba
ou apenas uma; (iv) [FULL] - Completo: abarca todo o campo tonal. Dessa
forma, esses movimentos se combinam para formar configurações prototípicas,
que, por sua vez, vão formar o contorno melódico final.
Após a fase de ressíntese já mencionada acima, as frases manipuladas
artificialmente geraram um número relativamente grande de variantes, e que
foram, posteriormente, submetidas à avaliação de um grupo de ouvintes (entre
20 e 30). Os ouvintes então se manifestaram quanto à naturalidade/
aceitabilidade das referidas variantes.
A estrutura do método inclui a manipulação da F0, estilização dos
contornos melódicos baseada nos critérios da igualdade perceptiva, verificação
experimental através de testes de percepção, sistematização dos padrões dos
movimentos melódicos perceptivamente relevantes e a busca por unidades
descritivas dos contornos melódicos que geram uma combinatória dos
movimentos melódicos. Dessa forma, uma gramática pode ser elaborada na
qual são gerados os tipos de contornos que são encontrados na língua em
questão.
O corpus é constituído de frases em diferentes modalidades que foram
ditas e gravadas em laboratório por um informante masculino e um informante
feminino. Para cada padrão melódico, uma situação controlada de produção foi
criada através de uma descrição das características pragmáticas da eliciação
(fala atuada) a fim de que oito tipos diferentes de frases fossem produzidas. A
partir dessas gravações, foram geradas diversas frases estilizadas através da
técnica de ressíntese que foram, posteriormente, incluídas no corpus.
164
4º Colóquio Brasileiro de Prosódia da Fala
4. Resultados preliminares
À título de ilustração, essas são as “close copy stylizations” dos
contornos extraídos pela técnica de ressíntese:
m
a
r
i
n
a
c
an
t
a
v
a
0
1.192
Time (s)
“Figura . Asserção “Marina cantava”
m
a
r
i
n
a
c
an
t
a
v
a
0
1.203
Time (s)
“Figura 2. Questão total “Marina cantava”
c
o m
o
v
o
c
ê
s
0
a
b
e
1.102
Time (s)
“Figura 3. Questão parcial “Como você sabe?”
165
Caderno de Resumos
c
on
v
e
rs
a
c
om
e
l
e
0
1.427
Time (s)
“Figura 4. Pedido “Como você sabe?”
A tabela abaixo resume os traços encontrados nos movimentos melódicos do
grupo de contornos analisados de acordo com a configuração local:
Configuração
RISE
EARLY
LATE
SPREAD
FULL
/1/
+
-
/2/
+
+
+
+
/3/
+
+
+
-
/4/
+
+
+
+
/5/
+
+
+
-
/A/
+
+
/B/
+
+
+
+
+
/C/
+
+
+
/D/
-
/E/
+
-
/F/
+
+
+
+
-
/G/
+
+
-
“Tabela . Traços binários dos movimentos melódicos locais”
Os movimentos melódicos de cada contorno podem ser classificados pelo
conjunto de traços reunidos em cada coluna (de 1 a G) ou pela combinação
desses traços, como por exemplo, 2A, 4C, etc.
5. Considerações finais
O presente trabalho apresenta resultados preliminares de uma
dissertação de mestrado que ainda está em curso. Neste trabalho, pretende-se
chegar ao inventário de movimentos melódicos perceptivamente relevantes no
conjunto de contornos melódicos analisados do Português do Brasil. Para isso,
é preciso levar em conta os efeitos perceptivos que vão sendo gerados ao longo
do processo de estilização em que os estímulos são criados e, em seguida,
testados com ouvintes. Os resultados dessa investigação contribuem para os
166
4º Colóquio Brasileiro de Prosódia da Fala
estudos fonológicos da língua especificamente no campo da fonologia
entonacional, e espera-se que possam proporcionar subsídios teóricos para o
desenvolvimento da pesquisa na área.
Referências
Boersma, P. and Weenink, D. 2009. Praat: doing phonetics by computer (Version
5.1.05) [Computer program].
Garrido Almiñana, J. M. 2003. “La escuela holandesa: el modelo IPO”. In: P. Prieto
(eds.). Teorías de La entonacíon. Barcelona: Ariel.
Garrido Almiñana, J. M. 1996. Modelling Spanish Intonation for Text-to-Speech
Applications. PhD Thesis, Universitat Autónoma de Barcelona.
Hermes, D. J. “Stylization of pitch contours”. 2006. In: Methods in Empirical Prosody
Research, edited by S. Sudhoff, D. Lenertová, R. Meyer, S. Pappert, P. Augurzky, I.
Mleinek, N. Richter & J. Schlieber: Berlin, New York: De Gruyter (= Language,
Context and Cognition): 29-62.
Ladd, D. R. 2008. Intonational phonology. New York: 2nd edition Cambridge
University Press.
Miranda, L. S. 2010. Em busca da naturalidade da entoação da fala sintetizada. In:
XXXII Jornada Giulio Massarini de Iniciação Científica, Artística e Cultural, 2010,
Rio de Janeiro. XXXII Jornada Giulio Massarini de Iniciação Científica, Artística e
Cultural, v. 1: 74-74.
Moraes, J. 1999. F0 declination in Brazilian Portuguese in read and spontaneous
speech, Proceedings of the 14th International Congress of Phonetic Sciences, San
Francisco, 1-7 August 1999: 2323-2326.
Moraes, J. 2008. The pitch accents in Brazilian Portuguese: analysis by synthesis. In:
Barbosa, P., Madureira, S. and Reis, C. (eds.) Proceedings of the Speech Prosody
2008: Fourth Conference on Speech Prosody, Campinas, 6 a 9 de maio de 2008: 389397.
Moraes, J. 2011. A entoação de atos de fala diretivos no português do Brasil. In: III
Colóquio Brasileiro de Prosódia da Fala, 2011, Belo Horizonte. Resumos do III
Colóquio Brasileiro de Prosódia da Fala.
't Hart, J., Collier, R. and Cohen, A. 1990. A Perceptual Study of Intonation: An
experimental-phonetic approach to speech melody. Cambridge: Cambridge
University Press.
167
Caderno de Resumos
Preenchimentos dos níveis prosódicos inferiores: dados
de aquisição do português brasileiro (PB)
Luzia Miscow da Cruz Payão
Universidade Estadual de Ciências da Saúde de Alagoas – Brasil
[email protected]
1. Introdução
Observa-se na aquisição a segmentação da sílaba proeminente, como
unidade da hierarquia prosódica representativa do enunciado, mediante análise
gramatical de direção centrípeta. Essa sílaba proeminente é segmentada para
dar início aos processos fonológicos de preenchimento segmental e
estruturação silábica da palavra. A segmentação é favorecida pela sensibilidade
gramatical da criança para as proeminências acentuais do enunciado – a
unidade prosódica que representa o fluxo contínuo da fala –, desencadeando
análises de direção centrípeta norteadoras da estruturação silábica da palavra.
Em seguida ocorre um movimento de direção oposta e coocorrente, centrífuga,
partindo da sílaba acentuada, já produzida na fala, com todas as posições
silábicas preenchidas ou não, para as análises gramaticais que visam ao
preenchimento segmental da sequência sonora de palavras, frases e enunciados
da língua-alvo (Payão 2010). Os pressupostos teóricos da fonologia prosódica
(Nespor e Vogel 1986; Scarpa 1999) e da autossegmental (Clements e Hume
1995; Mota 1996) fundamentam a descrição e a análise dos preenchimentos
segmentais nas unidades prosódicas menores, que correspondem às primeiras
produções de sequência de fala na aquisição fonológica: a sílaba, o pé métrico e
as palavras inicialmente produzidas pelas crianças. De acordo com a fonologia
prosódica de Nespor e Vogel (1986) as sete unidades prosódicas estão
organizadas numa disposição hierárquica, constituída pelo enunciado, a frase
entonacional, a frase fonológica, o grupo clítico, a palavra fonológica, o pé
métrico e, por fim, a sílaba. A prosódia, portanto, fornece as estruturas básicas
para a percepção da fala e a organização da sequência de sons em palavras
(Scarpa 1997; Santos 2001; Santos e Scarpa 2005).
168
4º Colóquio Brasileiro de Prosódia da Fala
2. Objetivo
Descrever a organização prosódica e segmental inicial da aquisição
fonológica a partir da sílaba segmentada em amostra do PB falado em Maceió e
Recife.
3. Métodos
Estudo de caso observacional e descritivo da aquisição fonológica,
seguindo os preceitos éticos, baseando-se nas produções de fala espontânea de
criança do sexo feminino entre 1;6.28~1;7 e 2;1.10 de idade em fase de
aquisição do PB falado em Maceió e Recife, durante sete meses de gravações
áudio digitais. As análises de base auditivo-perceptual se restringiram ao
preenchimento fonológico-fonético da sílaba segmentada, da delimitação do pé
métrico e da palavra registrados em cada mês e comparados nos sete meses de
acompanhamento. Os dados obtidos no preenchimento segmental das posições
silábicas pré-tônicas, tônicas e pós-tônicas foram submetidos à análise de
variância (Anova) (p<0,05) e teste post hoc de Tukey para comparações
múltiplas. A quantidade e a qualidade de consoantes e vogais manipuladas nos
preenchimentos silábicos foram as variáveis dependentes analisadas ao longo
do tempo. Os dados coletados originam-se de situações lúdicas e comunicativas
durante a manipulação de brinquedos adequados para a faixa etária da criança,
explorados em conjunto com um dos pais ou ambos. Os registros foram
gravados em áudio digital, com intervalos de aproximadamente trinta dias, por
um período máximo de quarenta e cinco minutos de gravação a cada visita.
4. Resultados
No inventário consonantal há predominância das obstruintes plosivas e
das fricativas, enquanto os segmentos da classe de sonorantes restringem-se à
líquida lateral [+anterior], às nasais e aos glides, concentrando-se nas duas
sílabas – a tônica e a pós-tônica, que, sob a ação do preenchimento segmental de
direção centrífuga, estabelecem a formação binária do pé métrico, construindo
o nível prosódico destinado a colocar em evidência o acento da palavra. Notase, inicialmente, que há um número maior de segmentos consonantais na sílaba
169
Caderno de Resumos
pós-tônica, comportando-se como uma sílaba mais favorável ao preenchimento
com consoantes. Em relação às vogais há maior diversidade na posição tônica.
5. Discussão
Esse comportamento de preenchimento segmental diferenciado entre a
sílaba tônica e a pós-tônica sugere uma fase de definição do pé métrico, na qual
a predominância de vogal ou da consoante parece desempenhar funções
específicas desses segmentos nas sílabas que compõem o pé métrico. O
preenchimento da sílaba pré-tônica comporta-se com menos diferenciação
segmental. Os segmentos consonantais mais marcados, como por exemplo, as
fricativas e as líquidas, aparecem primeiro na tônica e na pós-tônica para em
seguida surgirem na pré-tônica. Observa-se um aumento significativo no
número de palavras, tanto dissílabas como trissílabas, refletindo a possibilidade
de manipular maior número de sílabas e de segmentos mais marcados pelo
contraste. Os segmentos fricativos, mais marcados em relação aos sons já
presentes no sistema dessa criança, concentram-se na sílaba tônica e na átona
pós-tônica, constituindo sílabas no padrão CV. A especificação de valor de
traços do segmento, a qualidade de tonicidade da sílaba que o hospeda e a
localização dessa sílaba dentro da palavra parecem interagir e influenciar a
efetividade da produção da palavra-alvo. As informações fonológicas do nível
prosódico e do segmental se organizam para a produção das palavras. Quanto
ao preenchimento vocálico observa-se que o número de preenchimentos
vocálicos se destaca na tônica durante todo o período de análise, enquanto que
entre as sílabas pré-tônicas e pós-tônicas não há diferença estatística relevante
entre os preenchimentos de segmentos vocálicos nessas posições átonas. A
partir da delimitação prévia do pé binário como palavra mínima de alvos
polissílabos, as sílabas pré-tônicas começam a ser preenchidas com o núcleo,
tornando a sequência silábica da palavra produzida mais próxima do alvo. A
sílaba receptora do acento primário forma com uma átona de uma mesma
palavra um constituinte binário preparatório para o preenchimento de outras
sílabas dessa palavra. A presença do acento secundário reflete a expansão
prosódica e segmental manifestada na fala dessa criança. Observam-se três
aspectos relevantes para o preenchimento impulsionado pela ação centrífuga
originária da sílaba acentuada: 1º) a qualidade de marcação de traços na
170
4º Colóquio Brasileiro de Prosódia da Fala
constituição dos segmentos, que devem preencher as posições silábicas
específicas; 2º) a influência da qualidade acentual da própria sílaba – se é tônica
ou átona –; e 3º) a delimitação do pé métrico, formando uma base de sílabas que
sustentará a transição para a palavra-alvo (Payão 2010). A tarefa de aquisição
torna-se mais desafiante à medida que a estrutura silábica necessite ser
preenchida por segmentos mais complexos em termos dos traços constituintes.
6. Conclusão
Os dados evidenciados mostram que a sílaba acentuada é produzida
desde o início das primeiras palavras reduzidas da criança. As aquisições e
expansão do sistema segmental são influenciadas pela sílaba acentuada,
corroborando estudos em aquisição, funcionando como um sinalizador
prosódico de acordo com Scarpa (1997, 1999), Santos (2001) e FerreiraGonçalves (2009), possibilitando a transferência de segmentos e padrões
silábicos para as outras posições átonas da palavra-alvo. As sequências
silábicas incompletas observadas em algumas palavras refletem,
especificamente, a dependência da aquisição de traços no nível segmental
(Mota 1996, 2007), que parecem favorecidos perceptualmente nas posições
silábicas tônica e pós-tônica, sob a influência e predomínio de palavras com o
padrão de acento trocaico. Os dados mostram evidências de análises centrípetas
que partem de referenciais prosódicos, ainda sob efeito do enunciado
fonológico (Scarpa 1997, 1999); e de análises coocorrentes de direção
centrífuga de preenchimento que operam nos aspectos silábicos, segmentais e
métricos.
Referências
Clements G. N. e Hume E. 1995. The internal organization of speech sounds. In:
Goldsmith J. (ed.)1995. The Handbook of Phonological Theory: 245-306.
Cambridge: Blackwell.
Ferreira-Gonçalves G. 2009. Unidades prosódicas – sílaba e acento – no processo de
aquisição da linguagem. In: Ferreira-Gonçalves, G.; Keske-Soares, M.; Brum-dePaula, M. R. (orgs.) 2009. Estudos em Aquisição Fonológica 2: 203-224. Santa
Maria: Sociedade Vicente Pallotti.
171
Caderno de Resumos
Mota, H. B. 1996. Aquisição segmental do português: um modelo implicacional de
complexidade de traços. Porto Alegre, 221 p. Tese (Doutorado em Letras). Instituto
de Letras e Artes, Pontifícia Universidade Católica do Rio Grande do Sul.
______. 2007. Modelo Implicacional de Complexidade de Traços – os caminhos na
aquisição segmental do português. In: Bonilha, G. F. G. e Keske-Soares, M. (orgs.).
2007. Estudos em Aquisição Fonológica: 123-136. Santa Maria: UFSM, PPGL –
Editores.
Nespor , m.e Vogel, I. 1986. Prosodic Phonology. Dordrecht: Foris Publications.
Payão, L. M. C. 2010. Aquisição de fonologia: a influência do acento e o
preenchimento de unidades prosódicas em dados de fala de duas crianças entre
1;0.4 e 2;1.10 de idade, em contato com o português brasileiro falado em Alagoas e
Pernambuco. Maceió. 192 p. Tese (Doutorado em Linguística). Programa de PósGraduação em Letras e Linguística. Faculdade de Letras. Universidade Federal de
Alagoas, 2010.
Santos, R. S. 2001. A aquisição do acento primário no português brasileiro. Campinas
– SP, 2001. 316 p. Tese (Doutorado em Linguística). Instituto de Estudos da
Linguagem, Universidade Estadual de Campinas.
Santos, R. S. e Scarpa, E. M. 2005. The phonological bootstrapping of determiners.
Linguistics in the Netherlands 22 (1): 165-178(14). Netherlands.
Scarpa, E. 1997. Learning external sandhi: evidence for a Top-down hypothesis of
prosodic acquisition. In: Sorace, A., Heycok, C., Shillcock, R. (org.). 1997.
Proceedings of GALA 1997: 272-277. Conference on Language Acquisition:
Knowledge Representation and Processing.
______. 1999. Sons preenchedores e guardadores de lugar: relações entre fatos
sintáticos e prosódicos na aquisição de linguagem. In: Scarpa, E. (org.) 1999.
Estudos de Prosódia: 253-284. Campinas: Editora da UNICAMP.
172
4º Colóquio Brasileiro de Prosódia da Fala
A prosódia como recurso para marcar tempo em
Kangang
Márcia Nascimento, Marcus Maia, Leticia Rebollo Couto
Universidade Federal do Rio de Janeiro, Brasil
[email protected], [email protected], [email protected]
1.Introdução
O presente estudo diz respeito à descrição das categorias de Tempo,
Modo e Aspecto em Kaingang. Identificamos um processo suprassegmental
atuante em relação à categoria de Tempo nesta língua: em um grupo específico
de verbos, a prosódia opera como traço distintivo de passado e de futuro, tanto
em enunciados assertivos quanto em interrogativos. Demonstra-se que a língua
Kaingang, além de explicitar construções temporais através de unidades
lexicais, partículas e morfemas gramaticais, apresenta a ocorrência de fatores
prosódicos, que influenciam a marcação de tempo, como constatado em
estudos realizados através de procedimentos psico-experimentais e também
através de análises acústicas.
Esse fenômeno prosódico foi inicialmente observado através da
aplicação de teste perceptual formulado no âmbito da Psicolinguística
Experimental (LAPEX/UFRJ). Projetamos e implementamos um experimento
psicolinguístico de julgamento de compatibilidade, que consistiu em um teste
comportamental a fim de verificar a hipótese de que a flexão melódica atua
como traço opositivo temporal na oralidade Kaingang, opondo passado e futuro
em verbos do tipo “não-flexionais”.
Os verbos denominados não-flexionais são todos terminados em
consoantes, diferentes dos demais que terminam em vogais. Caracterizam-se
pelo fato de não admitirem nenhum tipo de flexão morfológica quanto a tempo
e sim flexão prosódica, ou mais especificamente a inflexão da frequência
fundamental F0 para expressar passado e futuro. Trata-se de uma função da
inflexão de F0 ou da altura melódica que não corresponde exatamente à
descrição do tom (nível lexical), nem da entoação (nível do enunciado), uma
vez que a oposição se dá no nível da morfologia verbal, conforme propomos em
173
Caderno de Resumos
nossa análise, o que será mais bem demonstrado através da análise acústico
experimental.
2.Experimento pisco-linguístico de julgamento e de compatibilidade
Participaram do experimento 32 falantes nativos da língua Kaingang. 22
do sexo masculino e 10 do sexo feminino. Foram elaboradas 32 sentenças
interrogativas, 16 com prosódia indicando passado (PP) e 16 com prosódia
indicando futuro (PF). Da mesma forma, elaboramos 32 frases respostas,
metade indicando noção de passado (RP) e outra metade indicando futuro (RF).
Assim, geramos as 4 condições testadas em sentenças simétricas e assimétricas:
PP + RP (sentença interrogativa com prosódia indicando passado + resposta
indicando passado); PP + RF (sentença interrogativa com prosódia indicando
passado + resposta indicando futuro); PF + RF (sentença interrogativa com
prosódia indicando futuro + resposta indicando futuro); PF + RP (sentença
interrogativa com prosódia indicando futuro + resposta indicando passado).
As sentenças foram distribuídas em um desenho do tipo quadrado latino,
dividindo-se os materiais em 4 versões, de modo que os sujeitos do
experimento sejam expostos a todas as condições, mas não às diferentes
versões das mesmas frases, que são comparadas “entre sujeitos” (design
between subjects). Cada versão foi aplicada a 8 pessoas. O experimento baseouse no paradigma de audição automonitorada de sentença interrogativa, seguida
de sentença resposta, também auditiva, consistindo a tarefa experimental em
avaliar a compatibilidade entre as duas sentenças, registrando-se, além dos
índices de julgamento, também os tempos médios de decisão.
Os resultados obtidos no experimento confirmam que o índice de
concordância de respostas das sentenças interrogativas, bem como os tempos
médios de resposta demonstram que a flexão prosódica é realmente um recurso
utilizado para expressão de Tempo na língua Kaingang, como demonstrado nos
dados abaixo.
174
4º Colóquio Brasileiro de Prosódia da Fala
Tabela 1. Tabela de resultados dos índices e tempos de decisão.
3. Resultados do experimento psico-linguístico
3.1 Futuro simétrico x Futuro assimétrico
Variável categórica: índices de aceitabilidade
A condição simétrica de futuro (PFRF) obteve 109 observações positivas,
enquanto que a condição assimétrica de futuro (PFRP) obteve apenas 52
observações positivas, diferença que produz resultados altamente
2
significativos no test Chi quadrado: X =40, 4, p=0,0001***. Ou seja, a
probabilidade dessa distribuição ter sido randômica é ínfima, o que garante que
a preferência pela decisão simétrica deveu-se, de fato, à variável prosódica
manipulada no experimento.
Variável contínua: tempos médios de decisão
A condição simétrica de futuro (PFRF) obteve 109 observações positivas
respondidas em um tempo médio de 2288ms, enquanto que a condição
assimétrica de futuro (PFRP) obteve apenas 52 observações positivas, que
foram respondidas em um tempo médio de 3347ms. Esta diferença de tempos
médios de resposta produz resultados significativos no teste-T: t(159)=2,08,
p=0,04* . Assim, observe-se que dizer sim para a condição simétrica foi
significativamente mais rápido do que dizer sim para a condição assimétrica,
conforme predito em nossas hipóteses.
175
Caderno de Resumos
3.2. Passado simétrico x Passado assimétrico
Variável categórica: índices de aceitabilidade
A condição simétrica de passado (PPRP) obteve 109 observações positivas,
enquanto que a condição assimétrica de passado (PPRF) obteve apenas 55
observações positivas, diferença que produz resultados altamente
2
significativos no test Chi quadrado: X =35, 6, p=0,0001***. Ou seja, a
probalidade dessa distribuição ter sido randômica é ínfima, o que garante que a
preferência pela decisão simétrica no passado deveu-se, de fato, à variável
prosódica manipulada no experimento.
Variável contínua: tempos médios de decisão
A condição simétrica de passado (PPRP) obteve 109 observações positivas
respondidas em um tempo médio de 3040ms, enquanto que a condição
assimétrica de passado (PPRF) obteve apenas 55 observações positivas, que
foram respondidas em um tempo médio de 5293 ms. Esta diferença de tempos
médios de resposta produz resultados significativos no teste-T: t(162)=2,235,
P=0,0268*. Assim, observe-se que dizer sim para a condição simétrica no
passado foi significativamente mais rápido do que dizer sim para a condição
assimétrica, conforme predito em nossas hipóteses.
Figura 1: Índices de decisão para as condições simétricas e assimétricas.
176
4º Colóquio Brasileiro de Prosódia da Fala
Figura 2. Tempos médios de decisão para as condições simétricas e assimétricas.
De acordo com nossas hipóteses, as condições simétricas tanto para
futuro quanto para passado obtiveram o maior índice de aceitabilidade, sendo
elas também mais rápidas de processar, quando comparadas com as condições
assimétricas. Inclusive, obtivemos resultados de índices de decisões positivas
idênticos. Houve um nível insignificante de aceitabilidade das condições
assimétricas nos índices de decisão. Igualmente, os tempos médios de decisão
(latências em milésimos de segundos) foram significativamente mais rápidos
na aceitabilidade das condições simétricas do que nas assimétricas.
Os resultados acima comprovam que a flexão prosódica, de fato, está
sendo utilizada como recurso para distinguir passado e futuro em Kaingang.
Essa influencia prosódica para o Kaingang tem, portanto, consequências
interessantes no nível morfológico (marcação de tempo), diferentemente de
outras línguas onde a prosódia atua restrita ao nível lexical, por exemplo.
Temos, portanto, um caso que parece ser muito particular e sem dúvida merece
uma investigação mais aprofundada.
4. Análise acústico experimental: resultados
Nossa hipótese é que a altura melódica seja o traço distintivo para a
oposição passado e futuro que estamos descrevendo.
Os 64 enunciados de nosso corpus foram assim distribuídos: 32
enunciados interrogativos formando 16 pares mínimos com oposição de noções
temporais de passado e futuro, os mesmos do experimento psicolinguístico no
177
Caderno de Resumos
teste comportamental exposto anteriormente. A segunda metade compõe-se de
32 enunciados assertivos, também formando pares mínimos com oposição de
passado e futuro que foram especialmente elaborados para este trabalho piloto.
O total de 64 enunciados foram gravados por um falante nativo da língua
kaingang e foram analisados com o programa Praat em quatro níveis de
segmentação, a saber: sílaba, vogal, tom e enunciado.
Aplicamos para a análise o modelo métrico autossegmental proposto por
Pierrehumbert (1980). Nesse sistema abstrato das representações temos
basicamente dois tons que são H (high) para tom alto e L (low) para tom baixo.
Os acentos tonais (pitch accents) para a silaba tônica se representam por um
tom H ou L marcado pelo diacritico (*), e os tons de fronteira (Boundary Tones)
H ou L são marcados pelo diacrítico %. Em nossas análises levamos em conta o
acento nuclear (último acento tônico do enunciado) e também o primeiro acento
pré-nuclear (primeiro acento tônico do enunciado antes do núcleo).
O contorno ascendente de F0 (que marcamos com o acento nuclear
H*H%) é 100% recorrente nos 32 enunciados em contexto de futuro, seja em
enunciados interrogativos ou assertivos. Enquanto que, o contorno descendente
de F0 (que marcamos com o acento nuclear L*L%) é 100% recorrente nos 32
enunciados em contexto de passado, seja em enunciados interrogativos ou
assertivos.
Figura 3. Enunciado assertivo e interrogativo no passado.
APP3 (Fóg ag t? nãn kãtá nugnur) X PP3 (Fóg ag m? nãn kãtá nugnur)
Figura 4. Enunciado assertivo e interrogativo no futuro.
APF3 (Fóg ag t? nãn kãtá nugnur') X PF3 (Fóg ag m? nãn kãtá nugnur')
178
4º Colóquio Brasileiro de Prosódia da Fala
5. Discussão
Estes resultados nos levam a considerar que a oposição de tons em
Kaingang é funcional em alguns pontos específicos do sistema, neste caso para
a oposição de passado (L*L%) e futuro (H*H%) no núcleo, mas também para a
oposição assertiva e interrogativa no pré-núcleo, uma vez que as partículas,
interrogativa e de sujeito, se opõem também pelo movimento melódico e pelos
acentos tonais atribuídos (H* pré-núcleo e H* ou ¡H* partícula de sujeito para
assertivo, H* pré-núcleo e L+H* partícula interrogativa). Tais oposições tonais,
numa língua que não pode ser classificada como tonal, nos leva a pensar na
possibilidade da emergência de um sistema tonal ou no resquício de um sistema
tonal, em termos de evolução da linguagem. Os resultados da análise acústica
confirmam a oposição contrastante entre o acento nuclear passado L*L% e o
acento nuclear futuro H*H%.
Referências
Nascimento, M. 2012. Tempo, modo, aspecto e evidencialidade. Dissertação de
Mestrado, Programa de Pós-Graduação em Linguística, UFRJ.
179
Caderno de Resumos
Um estudo comparativo do acento ¡H+L* entre uma
variaedade brasileira nordestina e uma italiana
meridional: uma hipótese de lexicalização
suprassegmental e uma reflexão sobre o conceito de foco
1,2]
Marco Barone
1
Departamento de Matemática, Universidade Federal de Pernambuco,
Recife, Brasil
2
Departament de Traducció i Ciències del Llenguatge, Universitat
Pompeu Fabra, Barcelona, Espanha
[email protected]
A entoação do português brasileiro falado no Nordeste apresenta um
típico acento nuclear em certos enunciados declarativos, composto por uma
subida da frequência na sílaba pré-tônica e uma queda na sílaba tônica. A
presença de tal acento se faz normalmente corresponder à presença de um foco
estreito e uma etiquetagem ToBI encontrada na literatura por este acento é
¡H+L* (Morães 2008; Dabkowski 2012), ou seja uma queda de um alvo tonal
muito alto, para marcar contraste com a queda simples H+L* presente nas
declarativas sem foco de muitas variedades italianas e românicas (D'Imperio
2002; D'Imperio et al. 2005, entre outros).
Um recente estudo sobre a variedade centro-meridional de italiano
falada em Pescara (Barone et al., em preparação) encontra este mesmo acento
(Fig. 1) na elicitação das declarativas sem foco afirmativas SVO e das
declarativas com foco não contrastivo, utilizando a metodologia do Discourse
Completion Task (Blum-Kulka et al. 1989) para elicitar vários tipos de
sentenças-alvo. O foco contrastivo apresenta outro contorno. Esta
homogeneidade entre foco amplo e foco estreito não contrastivo sugeriu que de
fato os participantes colocassem obrigatoriamente um foco não contrastivo “de
default” no objeto das sentenças, mesmo onde o Task prevê uma resposta sem
focalização (ex. resposta a perguntas genéricas de tipo “O que está
acontecendo?”, “O que o sujeito na foto está fazendo?”). Haveria basicamente
uma marcação prosódica de proeminência obrigatória, não correspondendo ao
180
4º Colóquio Brasileiro de Prosódia da Fala
valor semântico-informativo de foco ou de nova informação. As frases
negativas não permitem esta marcação e são pronunciadas com uma queda
nuclear simples H+L*.
0
0.5
1
200
175
)z
150
H
(
0 125
F
100
75
Beve una bibita.
be
ve
u
na
b:i
b:i
ta
¡H+L*
LL%
Figura 1 Italiano de Pescara: constituinte nuclear simples
Quando o constituente sintático nuclear é composto, o acento ¡H+L* se
desdobra em uma subida (L+H*) na sua primeira sílaba tônica, um plateau alto
e uma queda (H+L*) na sua última sílaba tônica (Fig. 2).
0
0.5
1
1.5
200
F0 (Hz)
164
128
92
56
20
Maria beve una tazza di latte.
ma
ria
L+H*L-
be
veu ? na
ta
L+H*
ts:a
di
la
H+L*
t:e
L-L%
Figura 2 Italiano de Pescara: constituinte nuclear composto
181
Caderno de Resumos
Isto sugere que o acento ¡H+L* seja produto de um choque entre dois
eventos entoacionais, um acento pré-nuclear L+H*, marcador de foco de
default, e um nuclear declarativo H+L* e que, em ausência de suficiente
material segmental (caso de um constituinte nuclear simples: Fig. 1) o acento
ascendente L+H* seja adiado até a sílaba pré-tônica nuclear.
Observar a ocorrência deste desdobramento pode nos ajudar a discernir,
por exemplo, compostos VN recém-formados (“porta-oggetti”) que contêm
duas unidades prosódicas, de outros morfológicos, já lexicalizados, que
constituem uma única palavra prosódica (“portafogli”).
Por outro lado, é impossível encontrar, no italiano falado em Pescara,
esta subida na sílaba pré-tônica nuclear (e por isto o acento ¡H+L*) quando o
constituinte objeto é composto, como mostra a tabela abaixo.
Tabela 1 Configurações permitidas no italiano de Pescara.
O mesmo estudo analisa a língua românica falada na cidade de Pescara
(dialeto Pescarese) antes da chegada do Italiano, onde a queda simples H+L*
não se encontra em nenhum caso, nem nas declarativas negativas: as frases
negativas SVO introduzem um pronome proclítico catafórico para colocar o
acento nuclear ¡H+L* no sintagma verbal e tornar o objeto pós-nuclear e
desacentuado.
Ex. “Ngi'a jite, a la fatije” (lit. “Ele não aí-fui, para o trabalho”);
“Nnì so lett, lu libbre” (lit. “Eu não o li, o livro”)
182
4º Colóquio Brasileiro de Prosódia da Fala
O italiano regional parece reproduzir esta tendência, e para evitar
recorrer ao H+L* simples insere o pronome catafórico, às vezes em detrimento
à norma.
Ex. “Non ci sono andato, al lavoro”
Tudo isto mostra uma tendência da língua a evitar, por um lado, situações
em que não é possível colocar uma marca de ênfase em nenhum constituinte, e
por outro lado a adaptar a sintaxe de maneira a colocar em posicão nuclear o
único constituinte que pode receber esta focalização default.
O objetivo do nosso trabalho é estudar o comportamento do acento
nuclear ¡H+L* na variedade do português brasileiro falado em Recife,
comparar seu comportamento com o mesmo acento encontrado em Pescara,
observando como a realização de tal acento muda com respeito à estrutura
sintática, em frases declarativas afirmativas SVO, com o constituinte nuclear
apresentando vários graus de complexidade morfossintática, assim como em
frases negativas, com negação simples e reduplicada (não...não). Queremos
também entender em que medida se pode falar, em termos semânticos, de foco
estreito em correspondência de um tal acento.
Foram coletadas entrevistas de 7 informantes recifenses (4 mulheres e 3
homens, com idade entre 23 e 31 anos, de classe média e com ensino superior
completo) assim como cerca de 4 horas de fala espontânea. Os participantes
foram submetidos a um questionário, visando elicitar 29 sentenças-alvo (22
declarativas afirmativas, 5 declarativas negativas e 2 imperativas negativas) em
que o constituinte nuclear varia em tamanho e grau de complexidade sintática
(palavras simples ou compostas, neo-compostos, nomes geográficos: com
número de unidades e distância entre possíveis proeminências variáveis). Os
dados foram analisados com Praat (Boersma & Weeninck 2010) e etiquetados
conforme o sistema ToBI (Silverman et al. 1992).
Os resultados mostram que o acento ¡H+L*, em correspondência do
núcleo, prevalece em todo tipo de declarativa simples, SV e SVO, mesmo
quando o constituinte nuclear é composto ou possui uma estrutura
morfossintática interna articulada (Fig. 3), o que não é permitido no italiano de
Pescara.
183
Caderno de Resumos
0
0.5
1
1.5
2
350
F0 (Hz)
285
220
155
90
25
Ele veio para comprar cadeira de rodas.
E
L*
li
ve
H-
ju
L*
pa
H-
ra
kom
L*
pra
ka
de
r?
di
x?
¡H+L*
da?
L-L%
Figura 3 Recife Brazilian Portuguese: constituinte composto
Encontramos também ocorrências de plateau alto ao longo do
constituinte, como acontece no italiano de Pescara, embora se trate de uma
minoria de casos (segunda linha da tabela 2).
Tabela 2 Configurações permitidas no português de Recife.
O upstep adiado no núcleo é mais recorrente na fala espontânea do que na
semi-espontânea, o parâmetro de sexo feminino favorece decisivamente sua
ocorrência e não parece acompanhar um valor semântico de focalização ou de
nova informação do constituinte menor que delimita. As ocorrências de plateau
ao longo do constituinte confirmam que existe a possibilidade de realizar o foco
no início do sintagma, embora não seja a escolha mais frequente.
184
4º Colóquio Brasileiro de Prosódia da Fala
Tabela 3 Os dados dos dois tipos de marcação de foco de default nos enunciados afirmativos.
Nos enunciados negativos SVO também encontramos o uso de ¡H+L*,
diferentemente do italiano: o plateau ocorre apenas em certos enunciados SV
quando o constituinte focalizado é um verbo finito simples, começando sobre o
advérbio de negação e terminando no verbo.
Uma proposta de interpretação dos resultados, que deverá ser
confirmada com estudos e considerações históricas, é que tenha havido uma
185
Caderno de Resumos
reinterpretação do choque ¡H+L*, encontrado nos constituintes simples, como
evento único e uma extensão de seu uso a todo tipo de constituinte, com perda
do significado composicional fonológico da combinação (L+H*) + (H+L*).
Podemos concluir que há em Recife, assim como em Pescara, uma
tendência a colocar, na fala espontânea, um foco não contrastivo de default, sem
valor semântico-informativo. Esta mesma tendência poderia concorrer ao uso
comum da dupla negação que permite a colocação do segundo advérbio não e
do acento ¡H+L* em posição nuclear. Enquanto em Pescara esta marcação de
foco é localizada no início do constituinte nominal de objeto, em Recife se
realiza prevalentemente na sua última silaba tônica e na precedente. Se esta se
tornar no futuro a única solução possível, a informação sintática sobre estes
enunciados não será mais resgatável pela prosódia.
Referências
Barone, M., Gili Fivela, B. & Prieto, P. (em preparação). Intonational change in
Pescara: sociolinguistic and linguistic factors. Presented in PaPI 2013.
Blum-Kulka, S., House, J., & Kasper, G. (1989). Cross-cultural pragmatics: Requests
and apologies. Norwood, NJ: Ablex.
Dabkowski, M. (2012). Transcription of the intonation of Northeastern Brazilian
Portuguese, MA Thesis.
D'Imperio, M. (1999). Tonal structure and pitch targets in Italian focus constituents. In
J. Ohala (Ed.), Proceedings of the 14th International Congress of Phonetic Sciences,
3: 1757–1760, San Francisco, USA.
D'Imperio, M. (2002). Italian intonation: An overview and some questions. Probus 14
(1): 37-69.
D'Imperio, M., G. Elordieta, S. Frota, P. Prieto & M. Vigário. 2005. Intonational
Phrasing in Romance: The role of prosodic and syntactic structure. In S. Frota, M.
Vigário & M. J. Freitas (eds) Prosodies, Phonetics & Phonology Series: 59-97,
Berlin: Mouton de Gruyter.
Lucente, L, & Barbosa, P. A. (2007). Notação entoacional do português brasileiro em
corpora de fala semi-espontânea e espontânea. Em Intercâmbio, XVI, São Paulo.
Moraes, J. A. (2008). The Pitch Accents in Brazilian Portuguese. Proceedings of Speech
Prosody 2008: 389-397. Campinas.
Silverman, K., Beckman, M., Pitrelli, J., Ostendorf, M., Wightman, C., Price, P., et al.
(1992). TOBI: A Standard for Labeling English Prosody. Proceedings of ICSLP.
186
4º Colóquio Brasileiro de Prosódia da Fala
Enunciados interrogativos totais neutros em ELE: antes
e depois da sistematização no processo de ensinoaprendizagem
Maristela da Silva Pinto1, Roberto Botelho Rondinini1, Natacha
1
Dionisio de Souza
1
Departamento de Letras, UFRRJ, Brasil
[email protected], [email protected],
[email protected]
Pretendemos com este trabalho descrever foneticamente e analisar
fonologicamente a entoação de enunciados interrogativos totais neutros em
Português do Brasil, língua materna (PB/LM), fala carioca; em Espanhol,
língua materna (E/LM), nas variedades de Castela, do México e Centroamérica
e do Caribe; e em Espanhol como língua estrangeira (ELE).
Para tanto, (i) comparamos os contornos entonacionais de enunciados
interrogativos totais neutros em PB/LM, fala carioca e em E/LM, nas três
variedades estudadas, (ii) descrevemos como os aprendizes de ELE
implementam a F0, a duração e o acento tonal nuclear desses enunciados em
dois momentos distintos de coleta. Desse modo, verificamos se esses
aprendizes, após serem expostos a uma sistematização - a partir de um trabalho
de descrição, percepção, repetição mimética e produção calcada na atenção transferem o sistema prosódico de sua LM para a LE, conforme já comprovado
por Pinto (2009), ou se deixam de transferí-lo.
Segundo Gil (2007), na própria história do ensino de línguas
estrangeiras, a importância que foi dada à pronúncia variou enormemente. No
método de gramática e tradução, a pronúncia não tinha a mínima relevância, já
no método audiolingual, ela passou a ocupar o papel principal, tendo como
objetivo final a reprodução do falante nativo. Depois desse método, a pronúncia
passou por um período de esquecimento. Foi somente a partir dos anos 90, que
essa recuperou relativamente sua importância, sendo que o sotaque nativo não
era mais o foco e sim a inteligibilidade comunicativa.
No entanto, para que haja inteligibilidade, a prosódia é indispensável.
Muitas das vezes, a comunicação na língua estrangeira não é bem sucedida
187
Caderno de Resumos
devido a problemas na entoação, pois é a partir dessa que o falante expressa sua
intenção comunicativa e também é ela que permite distinguir modalidades.
Segundo McLaughlin (1987), é comum o aprendiz de LE fazer
transferências da LM quando os conhecimentos da LE não são suficientes para
produzir enunciados. Portanto, nossa hipótese é a de que no processo de
aprendizagem da língua estrangeira, os alunos transferem para a língua alvo os
traços prosódicos da LM como uma forma de facilitar o aprendizado, o que
acreditamos possa prejudicar a inteligibilidade entre aprendizes e nativos.
Pinto (2009) já evidenciou a ocorrência da transferência prosódica nas
modalidades assertiva e interrogativa total no par linguístico portuguêsespanhol. Na presente pesquisa, pretendemos verificar se tal transferência se
mantém quando há um ensino sistematizado dos contornos entonativos,
pautado em um trabalho de descrição, percepção, repetição mimética e uma
produção oral calcada na atenção.
Optamos por uma produção calcada na atenção, baseando-nos na
proposta da demanda atencional de Fortkamp (2000), que, por sua vez, é
pautada no modelo de Levelt (1989). Em tal modelo, o autor afirma que a
produção oral requer, pelo menos, três estágios: (i) conceitualização; (ii)
formulação; e (iii) articulação.
Fortkamp (2000) sinaliza que, no caso da LM, o primeiro estágio requer
atenção, já os demais são automatizados. Por outro lado, no caso da LE, a
demanda atencional se estende aos três estágios.
Desse modo, reiteramos a importância da sistematização no processo de
ensino-aprendizagem da produção oral em LE. A fim de verificar se a
metodologia por nós proposta é capaz de minimizar a transferência prosódica
da LM para a LE, comparamos os contornos entonativos de enunciados
interrogativos totais neutros nas variedades linguísticas mencionadas
anteriormente.
Nas análises feitas ao longo da pesquisa, levamos em consideração as
propostas de Moraes (2008) para o PB/LM, fala carioca e as de Prieto e Roseano
(2010) para as três variedades do E/LM. Cabe ressaltar que obtivemos os
contornos através do programa computacional PRAAT.
Para a análise fonética do núcleo, descrevemos o comportamento dos
parâmetros acústicos: F0 e duração. Na análise fonológica, seguimos o modelo
Métrico Autossegmental (AM), proposto por Pierrehumbert (1980) e Ladd
(2008) e o modelo Sp_ToBI (Estebas & Prieto 2008).
O corpus é constituído por 12 enunciados interrogativos totais neutros,
sendo 3 em PB/LM, fala carioca, 1 em E/LM, variedade de Castela, 1 em E/LM,
188
4º Colóquio Brasileiro de Prosódia da Fala
variedade do México e Centroamérica e 1 em E/LM, variedade do Caribe, 3 em
ELE, oriundos da primeira gravação, antes da sistematização, e 3 em ELE,
oriundos da segunda gravação, depois da sistematização, referentes a cada uma
das variedades do ELM estudadas nesse trabalho.
Os enunciados em PB/LM e ELE, das duas gravações, foram produzidos
por 3 informantes do sexo feminino, cariocas, adultas, entre 18 e 24 anos, do
curso de Letras – Português/Espanhol da UFRRJ. Já os enunciados em ELM
foram extraídos do Atlas Interactivo de la Entonación del Español, de Estevas
& Roseano (2009-2010).
Neste estudo, observamos que, antes da sistematização (primeira
gravação), as informantes produziam o contorno entonativo em ELE, em todas
as variedades analisadas, como em PB/LM, fala carioca, sua língua materna, ou
seja, com uma subida da pretônica para a tônica, seguida de uma queda da
tônica para a postônica (L+ <H*L%), conforme se vê nas figuras 1 e 2.
500
400
300
Pitch (Hz)
200
100
0
Tem
mar
me
e
a
e
la
da?
a
a
L+<H*L%
0
1.213
Time (s)
Figura 1: Contorno circunflexo com alinhamento tardio (L+<H*L%),
no enunciado “Tem marmelada?”, PB/LM, fala carioca.
Figura 2: Contorno circunflexo (L+<H*L%), no enunciado “¿Tiene mermelada?”,
E/LE, todas as variedades, antes da sistematização.
189
Caderno de Resumos
Após a sistematização (segunda gravação), a informante que treinou a
variedade de Castela passou a produzir o contorno entonativo de acordo com o
padrão de E/LM, ou seja, uma subida da tônica para a postônica (L*HH%),
conforme se vê nas figuras 3 e 4. A informante treinou esse padrão 60 vezes ao
longo de um mês.
Figura 3: Contorno ascendente (L*HH%), no enunciado “¿Tiene mermelada?”,
E/LM, variedade de Castela.
500
400
300
200
z)
(H
h
cit
P
100
0
¿Tie
ie
ne
e
mer
e
me
e
la
a
da?
a
L*HH%
0
0.9149
Time (s)
Figura 4: Contorno ascendente (L*HH%), no enunciado “¿Tiene mermelada?”,
ELE, variedade de Castela.
A informante que treinou a variedade do México e Centroamérica
passou a produzir o contorno entonativo de acordo com o padrão de E/LM, ou
seja, uma subida da tônica para a postônica, apenas no final desta (L*LH%),
conforme se vê nas figuras 5 e 6. A informante treinou esse padrão 40 vezes em
um mês.
190
4º Colóquio Brasileiro de Prosódia da Fala
Figura 5: Contorno ascendente (L*LH%), no enunciado “¿Tiene mermelada?”,
E/LM, variedade de México e Centroamérica.
500
400
300
200
)
z
H
(
h
tci
P
100
0
¿Tie
ie
ne
e
e
mer
me
e
a
la
da?
a
L*LH%
0
1.306
Time (s)
Figura 6: Contorno ascendente (L*LH%), no enunciado “¿Tiene mermelada?”,
E/LE, na variedade do México e Centroamérica.
No entanto, a informante que treinou a variedade do Caribe não realizou
o padrão esperado, ou seja, uma queda da pretônica para tônica seguida de outra
queda da tônica para a postônica (H+L*L%) e sim manteve o padrão de sua
língua materna, conforme se vê nas figuras 7 e 8. Acreditamos que isso tenha se
dado em função desta informante ter treinado apenas 12 vezes.
191
Caderno de Resumos
Figura 7: Contorno descendente (H+L*L%), no enunciado “¿Hay reunión mañana?”,
E/LM, variedade do Caribe.
500
400
300
Pitch (Hz)
200
100
0
¿Tie
ie
ne
e
mer
e
me
la
e
da?
a
a
L+<H*L%
0
1.077
Time (s)
Figura 8: Contorno circunflexo (L+<H*L%), no enunciado “¿Tiene mermelada?”,
ELE, na variedade do Caribe.
Acreditamos, desse modo, que quando o aprendiz dedica mais tempo a
essa repetição mimética, a transferência prosódica é minimizada e, quando
dedica menos tempo, essa se mantém.
A partir do que foi exposto, concluímos que com um estudo
sistematizado do aprendizado do contorno entonativo, a transferência prosódica
pode ser minimizada ou até mesmo deixar de existir. Em outras palavras, o
aprendiz, quando exposto a uma formalização das questões da entoação, a um
treinamento exaustivo e a uma produção atenta e consciente, deixa de produzir o
contorno e de implementar parâmetros acústicos (F0 e duração) de sua LM,
passando a produzi-lo e implementá-los como o da língua alvo.
192
4º Colóquio Brasileiro de Prosódia da Fala
Esperamos, com a presente pesquisa, contribuir para o desenvolvimento
dos estudos acerca da prosódia e também para o aprimoramento do processo de
ensino/aprendizagem de E/LE, principalmente no que concerne ao ensino da
produção oral.
Referências
Vilaplana, E. E. & Prieto, Pilar. 2008. La notación prosódica del español: una revisión
del Sp_ToBI. In: Estudios de fonética experimental XVII. Barcelona: Laboratorio de
Fonética de la Universidad de Barcelona.
Flege, J. 2002. Interactions between the native and second-language phonetic systems.
IN Burmeister, P.; Pirske, T.; Rhode, A.. An integrated view of language
development: papers in honor of Henning Wode. Trier: Wissens chaftliger Verlag:
217-243.
Fortkamp, M. 2000. Working memory capacity and L2 speech production: an
exploratory study. UFSC, Tese de Doutorado, Florianópolis.
Gil, J. 2007. Fonética para profesores de español: de la teoria a la práctica. Madrid:
Ed. Arco/Libros.
Ladd, R. 2008. Intonational Phonology. Cambridge: Cambridge University Press.
Levelt, W. J. M. 1989. Speaking: from intention to articulation. The Speaker as
Information Processor. Cambridge, MA: MIT Press.
McLaughlin, B. 1987. Theories of second language learning. Edward Arnold.
Moraes, J. A. 2008. “The Pitch Accents in Brazilian Portuguese: analysis by synthesis”.
The Fourth International Conference in Speech Prosody, Campinas, IEL.
Fernández, F. M. 2000. Qué español enseñar. Madrid, Arco Libros.
Pierrehumbert, J. 1980. The phonology and Phonetics of English Intonation. Tesis
doctoral, MIT, Cambridge, Massachusetts.
Pinto, M. 2009. Transferências prosódicas do português do Brasil/LM na
aprendizagem do espanhol/LE: Enunciados Assertivos e Interrogativos Totais.
UFRJ, Tese de Doutorado, Rio de Janeiro.
Prieto, P. & Roseano, P. (coord.). 2009-2010. Atlas interactivo de la entonación del
español. Disponível em: http://prosodia.upf.edu/atlasentonacion/
193
Caderno de Resumos
Características prosódicas dos números telefônicos no
português brasileiro
Oyedeji Musiliyu 11, Miguel Oliveira Junior 1
1
Faculdade de Letras, UFAL, Brasil
[email protected], [email protected]
O desenvolvimento da tecnologia da fala tornou o uso de sistemas
automatizados de reconhecimento e de síntese de voz bastante frequente com
aplicações múltiplas. Sistemas TTS (text-to-speech), ou conversores textofala, por exemplo, produzem fala sintetizada correspondente à leitura de um
texto. Diversos serviços baseados nesses sistemas automatizados fazem uso de
dígitos numéricos concatenados para os mais variados fins, tais como: ativação
de cartões de crédito, informações bancárias, consultas a listas telefônicas e
marcações de reservas, serviços de auxílio a deficientes visuais, etc. Serviços
que fazem uso de agrupamentos numéricos como dados de entrada dependem
de um bom sistema de processamento de informações de unidades sonoras e
textuais correspondentes a dígitos alfanuméricos. Um sistema eficiente
produzirá fala sintetizada ou dados numéricos correspondentes à pronúncia
adequada do agrupamento numérico desejado.
Em muitos casos, entretanto, a performance desses sistemas é
considerada sofrível, ora por não processarem corretamente a fala espontânea
(no caso de sistemas de reconhecimento de fala), ora por não apresentarem, em
sua produção, características de ritmo e entonação próximas às da fala natural
(no caso dos sistemas de síntese de fala). Isso se deve em parte ao fato de serem
tais sistemas na maioria das vezes baseados em dados impressionísticos (ou
muito antigos), não em dados de fala natural e corrente.
Avanços nessa área foram obtidos em decorrência da descrição da
enunciação de números naturais nas mais diversas línguas, tais como o alemão
(Baumann & Trouvain 2001) e o francês (Bartkova & Jouvet 1999). Até o
momento, entretanto, não há para o português do Brasil (PB) nenhum estudo
que descreva, de forma sistemática e abrangente, as várias características
acústicas da organização de números naturais em estruturas pré-estabelecidas.
194
4º Colóquio Brasileiro de Prosódia da Fala
O objetivo deste estudo é descrever as características prosódicas de um
tipo de agrupamento numérico bastante comum: aquele associado a números
telefônicos. Para isso, a partir de um corpus coletado especificamente para este
estudo, realizamos, num primeiro momento, uma análise segmental, com o
propósito de investigar a estratégia padrão de agrupamento e de distribuição
sonora aplicada aos números telefônicos de diferentes tamanhos no PB.
Seguidamente, procedemos a uma análise prosódica para determinar as
características entonacionais típicas de números telefônicos comuns, tais como
enunciados por falantes nativos do PB.
O corpus consiste em um total de 30 números telefônicos. Todos os
números são reais e foram extraídos de uma lista telefônica local. Os números,
sem código regional, foram escolhidos aleatoriamente, de forma a abranger (a)
os números convencionais e de telefone celular com oito dígitos, (b) os
números de serviços especiais com trés dígitos e (c) os números de ligação
gratuita com onze dígitos. No intuito de testar uma possível relação entre a
apresentação gráfica dos números e a maneira como eles são enunciados, os
números convencionais de 8 dígitos foram apresentados de três maneiras
diferentes, (i) divididos em dois grupos de quatro dígitos (NNNN NNNN), (ii)
divididos em um grupo de quatro e dois grupos de dois dígitos (NNNN NN NN)
e (iii) sem qualquer tipo de divisão (NNNNNNNN). Os catálogos telefônicos
trazem números com esses três tipos de disposição, embora a do tipo (i) seja a
mais frequente.
Oitenta e cinco pessoas (quarenta e oito mulheres e trinta e sete homens)
participaram do experimento. Os participantes leram uma breve instrução,
seguindo-se a isso um rápido ensaio, contendo um total de seis números
telefônicos representativos. Depois do ensaio, a gravação era imediatamente
feita. Os participantes foram instruídos a ler os números da maneira como
habitualmente o fazia e foram alertados de que não existe uma maneira correta
para se dizer um número telefônico, de forma que não estavam sendo testados
por isso. Os números foram apresentados um após outro, aleatoriamente, em
slideshow, com intervalos regulares de sete segundos. A gravação foi feita em
um equipamento de minidisc Sony, modelo MZ-R700, com um microfone
digital Sony, modelo ECM-MS907, localizado a 15 centímetros da boca dos
informantes.
Os enunciados produzidos pelos participantes foram segmentados e
transcritos no software PRAAT (Boersma & Weenink 2013), em agrupamentos
representados pelo dígito 1 (unário), 2 (binário), 3 (ternário) ou 4 (quaternário),
e em distribuições sonoras representadas pela letra U (unidade), D (dezena), C
195
Caderno de Resumos
(centena) ou M (milhar). A descrição do contorno entonacional na enunciação
dos números telefônicos foi obtida através de uma análise semiautomática das
variações melódicas nas distribuições sonoras por meio do script
MOMEL/INTSINT for PRAAT, versão 10.3 (Hirst 2007).
Figura 1: Janela do PRAAT ilustrando a segmentação e a transcrição de um enunciado.
O MOMEL (MOdélisation de MELodie) é um algoritmo proposto por
Hirst e automatizado por Hirst e Espesser (1993), que tem por objetivo reduzir a
curva de frequência fundamental a pontos-alvo. Esses pontos-alvo são
seguidamente representados no niìvel fonoloìgico de superfiìcie utilizando o
sistema de transcrição INTSINT (INternacional Transcription System for
INTonation). O INTSINT, desenvolvido a partir de um estudo entonacional de
20 liìnguas, foi idealizado como um sistema de códigos para análise prosoìdica
capaz de representar qualquer distinca?Þo entonativa significativa (Hirst & Di
Cristo 1998). O INTSINT utiliza oito símbolos ortográficos abstratos para
representar os pontos alvos obtidos através da estilização feita pelo MOMEL: T
(topo), M (médio), B (base), H (mais alto), S (igual), L (mais baixo), U (subida
suave) e D (descida suave).
Os resultados desse trabalho permitiram identificar um padrão no
agrupamento, na distribuição sonora e no contorno entonacional na enunciação
dos números telefônicos no português brasileiro. As análises mostraram uma
tendência a enunciar os números telefônicos de três dígitos em um agrupamento
ternário 3 (NNN) com uma distribuição sonora em centena (C). Assim, por
196
4º Colóquio Brasileiro de Prosódia da Fala
exemplo, a preferência na enunciação do número telefônico “190” é “cento e
noventa”. O contorno entonacional observado nesse caso é de uma acentuação
melódica M (médio), seguida de U (subida suave) e de D (descida suave):
MUD. A tendência dos números de 8 dígitos, por sua vez, é ser organizado em
um conjunto de quatro agrupamentos binários 2-2-2-2-2 (NN-NN-NN-NN),
com uma distribuição sonora em unidades (UU(1)-UU(2)-UU(3)-UU(4)).
Assim, por exemplo, o número telefônico “3445 2348” é enunciado
preferencialmente “três quatro quatro cinco dois três quatro oito”. O contorno
entonacional observado mostrou as seguintes características: na distribuição
sonora UU(1), a acentuação melódica apresentou o tom M (médio), seguido de
U (subida suave) e de D (descida suave); na distribuição UU(2), a acentuação
melódica apresentou o tom D (descida suave) seguido de U (subida suave); na
distribuição UU(3), a acentuação melódica apresentou o tom U (subida suave)
seguido de D (descida suave); e na distribuição UU(4), a acentuação melódica
apresentou o tom U (subida suave) seguido de um tom final B (baixo): MUDDU-UD-UB.
Figura 2: Curva típica de um número de oito dígitos.
A preferência de enunciação de números de 11 dígitos é um conjunto de
um agrupamento quaternário, um agrupamento ternário e dois agrupamentos
binários 4-3-2-2 (NNNN-NNN-NN-NN), com distribuição sonora em
unidades e em centenas (UC-UUU-UU(5)-UU(6)). Assim, por exemplo, o
número telefônico “0800 2812112” é enunciado preferencialmente da seguinte
forma: “zero oitocentos - dois oito um - dois um - um dois. O contorno
entonacional mostrou as seguintes características: na distribuição UC, a
acentuação melódica apresentou o tom M (médio), seguido de U (subida
suave), D (descida suave) e mais um U (subida suave); na distribuição UUU, a
acentuação melódica apresentou o tom M (médio) e seguido de D (descida
197
Caderno de Resumos
suave); na distribuição UU(5), a acentuação melódica apresentou o tom U
(subida suave) e o D (descida suave); na distribuição UU(6), a acentuação
melódica apresentou o tom U (subida suave), seguido de um tom final B
(baixo): MUDU-MD-UD-UB.
O propósito deste trabalho foi descrever a prosódia na enunciação dos
números telefônicos no PB. Os objetivos centrais foram: realizar uma análise
segmental para investigar a estratégia padrão de agrupamento e de distribuição
sonora aplicada a números telefônicos de diferentes tamanhos e proceder a uma
análise prosódica para estabelecer o padrão entonacional desses números, tais
como enunciados por falantes nativos do PB. Embora alguns parâmetros
prosódicos, tais como a duração e intensidade, não tenham sido considerados na
presente análise, foi possível, ainda assim, encontrar um padrão entonacional
na enunciação desses números telefônicos suficiente para caracterizá-los
prosodicamente.
Referências
Bartkova, K. & Jouvet, D. 1999. “Selective prosodic post-processing for improving
recognition of French telephone numbers”. In Proceedings of THE 6TH
EUROSPEECH. Budapest, Hungary.
Baumann, S. & Trouvain, J. 2001. “On the prosody of German telephone numbers.” In
Proceedings of THE 7TH CONFERENCE ON SPEECH COMMUNICATION AND
TECHNOLOGY. Aalborg, Denmark: 557-560.
Boersma, P. & Weenink, D. Praat: doing phonetics by computer. Versão 5.3.53.
Disponível em: http://www.praat.org/
Hirst, D.J & Di Cristo, A. 1986. Modelling French micromelody: analyses and
synthesis. Phonetica, 43: 11-30.
Hirst, D.J & Espesser, R. 1993. Automatic Modeling of Fundamental Frequency Using
a Quandratic Spline Function. Aix-Provence: Travaux de l'Institut de Phoneìtique.
Hirst, D.J. 2007. “A Praat plugin for Momel and INTSINT with improved algorithms for
modelling and coding intonation.” In Proceedings International Conference on
Phonetic Sciences, Saarbruc̈ken.
198
4º Colóquio Brasileiro de Prosódia da Fala
Percepção de correlatos prosódicos da distinção dadonovo em português brasileiro
1
2
2
Pablo Arantes , Cíntia Antão , Luciana Lucente
1
Departamento de Letras, UFSCar
2
Faculdade de Letras, UFMG
[email protected], [email protected], [email protected]
1. Introdução
Estudos descritivos mostram que o português brasileiro usa contornos de
frequência fundamental e a duração das palavras como correlatos acústicos da
distinção entre referentes novos e dados (Arantes et al. 2012; Delfino et al.
2012; Antão et al. 2013): referentes novos tendem a apresentar contornos
entoacionais com média e desvio-padrão maiores e com movimentos
ascendentes nas sílabas pré-tônicas, que não estão presentes em referentes
dados. Além disso, referentes novos tendem a ter maior duração acústica do que
referentes dados. O objetivo do presente trabalho é tentar obter evidências para
a hipótese segundo a qual as pistas prosódicas da distinção entre referentes
novos e dados presentes na produção são usadas pelos ouvintes na percepção da
fala. Relataremos os resultados de um experimento que usou os estímulos do
estudo de percepção descrito em (Arantes et al. 2012) em um teste de
percepção.
2. Materiais e métodos
No experimento, testou-se a hipótese que prevê que os ouvintes
exploram pistas entoacionais e duracionais para a distinção entre referentes
novos e dados, descritas em [1], quando processam a fala. Na produção,
encontra-se um padrão prosódico típico em cadeias de correferência como as
descritas em [1], nas quais um referente novo é seguido por sua repetição, como
mostrado no exemplo (1) abaixo.
199
Caderno de Resumos
(1) [Uma peregrinação] reuniu muitas pessoas em volta da igreja.
[A peregrinação] durou o dia todo.
NOVO
DADO
O contorno entoacional da repetição mais típica desta frase é mostrado
na Figura 1c e os trechos correspondentes ao referente novo (new) e dado
(given) estão marcados por linhas verticais pontilhadas. Note-se que há uma
proeminência no início do referente novo, em contraste com a curva
correspondente ao referente dado. Para o experimento de percepção, as frases
originais foram experimentalmente manipuladas de forma a obter todas as
combinações possíveis de referentes 'novos' e 'dados', além da sequência nãomanipulada, Novo-Dado (1c): Dado-Dado (1a), Dado-Novo (1b) e Novo-Novo
(1d). Para obter estas sequências, as duas ocorrências do substantivo
peregrinação no exemplo (1) foram cortadas e coladas conforme a necessidade,
preservando os contornos de duração, F0 e intensidade da primeira e da
segunda ocorrências do referente.
Todas as frases-veículo contendo cada uma das 18 palavras-chave do
corpus do experimento descrito em Arantes (2012), que tinham 2, 3 ou 4 sílabas
pré-tônicas, foram submetidas a este procedimento, que gera 4 estímulos
experimentais para cada frase – Dado-Dado (DD), Dado-Novo (DN), NovoDado (ND) e Novo-Novo (NN) –, obtendo-se, assim, 72 estímulos
experimentais. As 18 palavras-chave tinham.
O procedimento experimental consistiu em apresentar aos sujeitos cada
uma das frases-veículo na forma escrita e, a seguir, apresentar duas versões
lidas, em áudio, da mesma frase. Uma das versões é sempre a original, isto é, a
condição Novo-Dado (ND), e a outra é uma das versão manipuladas, isto é, DD,
DN ou NN. A tarefa dos sujeitos era ler silenciosamente a frase apresentada na
forma escrita, imaginar como ele pronunciaria aquela frase e, em seguida,
escutar as duas versões apresentadas em áudio. Os sujeitos não foram
informados de que um dos estímulos sonoros era uma versão manipulada do
outro, apenas que os dois estímulos não eram iguais. Depois de escutar as duas
opções, o sujeito indicava qual das duas versões ele julgava mais apropriada
como uma leitura da frase. Um script do programa Praat desenvolvido para essa
finalidade apresentou os estímulos aos sujeitos em ordem aleatória e registrou
suas respostas.
200
4º Colóquio Brasileiro de Prosódia da Fala
(a)
200
)
z
H
(
0
F
80
Given
Given
(b)
200
)z
H
(
0
F
80
Given
New
(c)
200
)
z
H
(
0
F
80
New
Given
(d)
200
)
z
H
(
0
F
80
New
New
Figura 1
201
Caderno de Resumos
A hipótese testada é que as frases originais, isto é, aquelas na condição
ND, seriam julgadas como leituras mais apropriadas das frases escritas. Se este
resultado se verificasse, ele poderia ser interpretado como evidência de que
quando um referente é introduzido no discurso e logo depois retomado, os
ouvintes esperam que a primeira ocorrência tenha um grau de proeminência,
expresso pela duração e por F0, maior do que a segunda ocorrência. A
estranheza a respeito do status referencial das duas ocorrências da palavrachave evocada pelos estímulos manipulado seria causada, assim, pelo conflito
entre as pistas prosódicas de um lado e, do outro, as pistas morfossintáticas
(definitude do artigo e repetição do referente).
Os dados de preferência pela leitura original ou manipulada, foram
analisados por meio da aplicação de testes binomiais. Duas análises foram
feitas. Na primeira, os dados de todas as palavras-chave foram agrupados e na
segunda os dados foram segregados em função do tamanho da palavra-chave.
Esta segunda análise se justifica pelo fato das pistas prosódicas que sinalizam a
diferença de proeminência entre os referentes novos e dados serem mais fortes
nas palavras de tamanho maior, conforme mostrado em (Arantes 2012). Testouse a hipótese nula segundo a qual a proporção de preferência pela versão nãomanipulada das frases (estímulos Novo-Dado) seria resultado de uma escolha
aleatória, isto é, 50%. Fixou-se em 5% o nível de significância para todas as
análises.
Participaram do experimento 27 sujeitos, alunos de graduação da
UFMG, com idade média de 23 anos e ingênuos em relação aos objetivos do
experimento. A aplicação consistiu de duas etapas, treinamento e sessão
experimental.
3. Resultados
A Tabela 1 resume os resultados da análise em que os dados de todas as
palavras-chave foram agrupados. A segunda coluna mostra a porcentagem de
escolhas da condição não-manipulada (Novo-Dado) quando esta era
comparada com as demais condições, mostradas na primeira coluna. A terceira
coluna mostra o valor de p do teste binomial exato. Em todos os casos, testou-se
se a proporção de escolhas da condição Novo-Dado poderia ser considerada
maior do que 50%, aquela que se obteria caso os sujeitos escolhessem
aleatoriamente.
202
4º Colóquio Brasileiro de Prosódia da Fala
Condição
Dado-Dado
Dado-Novo
Novo-Novo
Todas
% NovoDado
56
58
54
56
p
n.s.
< 0.05
n.s.
< 0.05
Tabela 1
Os resultados mostram que, quando as condições são consideradas
separadamente, apenas quando os sujeitos comparam a condição Dado-Novo
com a condição não-manipulada é que a escolha por esta versão (Novo-Dado)
tem uma porcentagem acima do nível aleatório, resultado que também se repete
quando todas as condições são comparadas em conjunto com a versão nãomanipulada. Uma das explicações para este resultado é que esta análise, ao
juntar todos os grupos de palavras-chave, pode mascarar o fato de que, nas
palavras de menor tamanho (duas sílabas pré-tônicas), o efeito de estranheza
causado pela manipulação prosódica pode ser menos forte em função da pouca
diferença de proeminência entre os dois tipos de referentes observada na
produção.
A Tabela 2 exibe os resultados de forma semelhante à tabela anterior, mas
separa os dados por tamanho da palavra-chave (medido em número de sílabas
pré-tônicas). O exame da tabela mostra que, a situação em cada um dos três
grupos é diferente. No grupo de palavras com duas pré-tônicas não se verifica
nenhuma significância, o que sugere que os sujeitos consideram as versões
manipuladas indistinguíveis das versões não-manipuladas. Esse resultado
poderia ser interpretado como resultado da menor diferenciação prosódica dos
referentes novos e dados, verificado nas palavras-chave com este tamanho.
Essa interpretação é reforçada pelo fato de haver uma preferência pela versão
natural no grupo das palavras-chave com 3 pré-tônicas em duas das quatro
condições testadas (Dado-Dado e todas as condições agrupadas) e uma
preferência marginalmente significativa na condição Dado-Novo. Contra esta
interpretação, entretanto, pesa o fato de no grupo de palavras-chave com 4 prétônicas, haver uma preferência apenas marginalmente significativa (no caso em
que as condições são reunidas), sendo as demais porcentagens comparáveis
com respostas aleatórias.
203
Caderno de Resumos
Nº de sílabas
pré-tônicas
2
3
4
Condição
% Novo-Dado
p
Dado-Dado
Dado-Novo
Novo-Novo
Todas
Dado-Dado
Dado-Novo
Novo-Novo
Todas
Dado-Dado
Dado-Novo
Novo-Novo
Todas
47
53
51
50
64
60
56
60
56
59
56
57
n.s.
n.s.
n.s.
n.s.
< 0.05
< 0.1
n.s.
< 0.05
n.s.
n.s.
n.s.
< 0.1
Tabela 2
4. Discussão
Os resultados mostrados na Tabela 1 mostram a presença de uma
preferência geral de baixa magnitude (56%), mas significativa do ponto de vista
estatístico, pelo padrão prosódico não-manipulado, dando suporte para a
hipótese de que as diferenças prosódicas verificadas entre referentes novos e
dados na produção da fala são relevantes para a percepção da boa-formação dos
enunciados. Os resultados modestos podem ser explicados em parte pelo fato
de que as diferenças prosódicas encontradas na produção, por mais que sejam
sistemáticas em sua ocorrência, podem não ser muito robustamente
perceptíveis. Além disso, o possível estranhamento que a manipulação
prosódica supostamente criaria pode ter sido encoberto pela presença de
redundâncias na marcação dos status referenciais nos estímulos, como as pistas
morfossintáticas.
Referências
Antão, C.; Arantes, P.; Cunha Lima, M. L. 2013. “Interrelation between subjecthood,
referential status and prosody”. Abstract Book of the 35th Annual Conference of the
German Linguistic Society (DGfS), March 12-15, Potsdam, Alemanha.
Arantes, P.; Lima, M. L. C.; Barbosa, P. A. 2012. “Some prosodic correlates of
referential status in Brazilian Portuguese”. Revista Diadorim, 12: 1-25.
Delfino, A.; Cunha Lima, M. L.; Arantes, P. 2012. “Prosodic marking of referential
status in Brazilian Portuguese: a preliminary study”. Proceedings of the VIIth GSCP
International Conference: Speech and Corpora: 186-190.
204
4º Colóquio Brasileiro de Prosódia da Fala
A combinação de pistas acústicas melódicas, de duração
silábica e de intensidade relativa prevê melhor a
percepção da proeminência em português brasileiro
Plínio A. Barbosa
Dep. de Linguística, Inst. de Estudos da Linguagem, Univ. de
Campinas, Brasil
[email protected]
Na pesquisa prosódica de base fonética, a proeminência percebida é vista
como uma função comunicativa associada ao destaque de uma unidade
linguística na cadeia de fala (Terken 1994; Xu e Xu 2005). As unidades mais
comumente descritas no estudo da proeminência são palavras e sílabas. Para
esses casos, as tarefas mais usadas para avaliar a proeminência são testes de
percepção com ouvintes aos quais se solicita que palavras ou sílabas se
destacam de sua vizinhança ao ouvirem frases isoladas e passagens de fala
encadeada. Este trabalho toma a proeminência como uma função comunicativa
avaliada por ouvintes leigos. A proeminência da palavra foi avaliada em
português brasileiro (PB) em parágrafos lidos em duas taxas de elocução bem
como em uma narrativa lida por uma atriz profissional (Camila Pitanga).
A proeminência pode ser avaliada tanto de uma forma binária quanto de
forma gradiente. Um exemplo de tarefa do ultimo tipo foi utilizada por Eriksson
et al. (2001). Os autores solicitaram a um grupo de 18 ouvintes adultos suecos
que avaliassem um conjunto de 20 enunciados pronunciados por 10 locutores
suecos sob três esforços vocais distintos. Esses enunciados foram obtidos ao
pronunciar as mesmas frases de 13 sílabas com diferentes esforços vocais
resultado de comunicações a distâncias distintas entre locutor e
experimentador. A proeminência silábica foi avaliada pelo deslocamento de 13
barras deslizantes, uma para cada sílaba, num mostrador gráfico que permitia
atribuir de 0 a 100% a proeminência de cada sílaba de forma contínua entre os
dois extremos. Parâmetros acústicos relativos ao esforço vocal, altura (pitch) e
duração predisseram, quando usados individualmente, o grau médio de
proeminência com uma correlação de 50%. Quando combinados linearmente,
205
Caderno de Resumos
os três fatores predisseram a proeminência avaliada pelos ouvintes com uma
correlação de 70 %. A contribuição de cada um desses fatores para predizer a
proeminência foi praticamente de mesma extensão.
Também para o sueco, Moubayed e Beskow (2010) usaram um método
similar para predizer o grau de proeminência média a partir de pistas acústicas.
No trabalho deles a proeminência da palavra foi avaliada por 4 especialistas
que avaliaram um subcorpus formado por 200 sentenças lidas por um ator
profissional. As sentenças foram obtidas de um corpus maior sobre notícias e
literatura. Alguns parâmetros acústicos foram calculados para cada sílaba. O
máximo valor de cada parâmetro acústico entre as sílabas de uma palavra foi
usado como parâmetro acústico relativo à palavra com exceção da duração, que
foi relativa à palavra como um todo. Com relação às palavras, o parâmetro que
melhor predisse o grau de proeminência média foi a duração, enquanto com
relação à sílaba foram gama de F0 seguida de duração silábica.
Recentemente, Barbosa et al. (2013) apontaram o papel mais importante
da duração da vogal para assinalar acento lexical em palavras proeminentes
tanto em PB quanto em sueco, confirmando alguns resultados anteriores do PB
e revendo outros (Massini 1991, Moraes 1987; Fernandes 1976). Nos trabalhos
de Cole et al. (2008) e Barbosa (2010), tanto a proeminência de palavra quanto a
marcação de fronteiras foram considerados de forma binária. No trabalho que
reportamos aqui somente a função de proeminência foi avaliada. Essa foi obtida
a partir da percentagem de ouvintes que avaliaram de forma binária a
proeminência das palavras ao ouvir quatro leituras de um excerto de 110
palavras. As leituras foram feitas por um locutor masculino e outro feminino em
taxas de elocução normal e rápida. Os ouvintes foram 10 estudantes de
Graduação em Linguística sem treinamento em Fonética. Cada ouvinte foi
instruído para ouvir os excertos tantas vezes quantas foram necessárias a fim de
marcar todas as palavras no texto escrito que considerassem destacadas pelo
locutor. Outro grupo de 10 estudantes de Graduação avaliou as palavras
proeminentes de uma narração de um mito amazônico sobre a origem do
Uirapuru feita por Camila Pitanga no CD Lendas Brasileiras. Segundo um teste
z de proporções, nenhum clítico pode ser considerado proeminente pela
população subjacente de ouvintes, o que nos habilitou a considerar a palavra
fonológica (clítico e palavra lexical correspondente) como lugar de
manifestação da proeminência. Dessa forma, decidiu-se calcular um conjunto
de 7 parâmetros acústicos em cada palavra fonológica.
O software Praat (Boersma e Weenink 2013) foi usado para anotação e
como plataforma para o cálculo dos parâmetros acústicos. Duas camadas de
206
4º Colóquio Brasileiro de Prosódia da Fala
anotação foram empregadas para segmentar e etiquetar os 4 excertos e a
narração. Na primeira camada delimitaram-se os intervalos correspondentes a
todas as sílabas fonéticas definidas por dois inícios de vogal consecutivos
(unidade VV). Cada rótulo contém a sequência dos fones da unidade VV. A
segunda camada, por sua vez, contém os intervalos correspondentes às palavras
fonológicas, etiquetadas pela forma ortográfica da cabeça do domínio. Um
script para o Praat foi elaborado para gerar 7 parâmetros acústicos para cada
palavra fonológica: duas medidas relativas à duração que são o inverso da taxa
de elocução em sílabas por segundo, isto é, a duração média das sílabas
fonéticas no intervalo correspondente à palavra fonológica, além do máximo
da duração normalizada da unidade VV no mesmo intervalo, obtida pela técnica
de normalização por z-score; quatro medidas relativas à curva de F0 de cada
palavra fonológica: mediana, amplitude de variação (máximo menos mínimo),
máximo e mínimo; e uma última medida, de ênfase espectral, tal como definida
por Traunmüller e Eriksson (1995). A última medida é um parâmetro que
assinala a intensidade relativa que se correlaciona com o esforço vocal.
Um conjunto de modelos de regressão logística foi preparado para prever
a percentagem de resposta dos ouvintes segundo cada palavra lexical a partir
dos sete parâmetros acústicos para o corpus em estudo aqui. Os modelos de
regressão logística foram montados no pacote R (R-project 2008) segundo uma
distribuição quase-binomial.
Para a leitura em taxa normal, o melhor modelo de regressão para
explicar o grau de proeminência foi aquele com a duração média da unidade VV
em conjunto com a ênfase espectral, em ordem de importância. Os dois
parâmetros predizem, juntos, a proeminência percebida com uma correlação de
50 %. Para a leitura rápida os melhores preditores foram o máximo da duração
normalizada de unidade VV na palavra fonológica juntamente com a ênfase
espectral com correlação de 44 %. Para a narrativa, por sua vez, o melhor
modelo conjugou a duração média da unidade VV, a ênfase espectral e o
máximo de F0 na palavra fonológica com correlação de 42 %. Nenhuma
diferença de gênero foi encontrada quando considerados modelos separando
excertos de homens e de mulheres. Ao menos quando analisada considerando
apenas a informação local da palavra fonológica, independentemente de seu
contexto, a contribuição dos parâmetros prosódico-acústicos para a
proeminência é parcialmente realizada pela duração do tamanho da sílaba
(média ou pico de duração normalizada), ênfase espectral (um correlato de
esforço vocal) e, num menor grau, o máximo de F0 na narração.
Esses resultados confirmam a relevância dos dois primeiros parâmetros
207
Caderno de Resumos
para assinalar o acento lexical em palavras proeminentes em PB (Barbosa et al.
2013), estabelecendo um vínculo entre saliência acústica e proeminência
percebida.
Referências
Barbosa, P. A. 2010. “Automatic duration-related salience detection in Brazilian
Portuguese read and spontaneous speech”, Proc. Speech Prosody 2010, Chicago
( 1 0 0 0 6 7 : 1 - 4 ) .
A v a i l a b l e
o n l i n e
a t :
http://www.speechprosody2010.illinois.edu/papers/100067.pdf
Barbosa, P.A., Eriksson, A. e Akesson, J. 2013. “Cross-linguistic similarities and
differences of lexical stress realisation in Swedish and Brazilian Portuguese”, In
E.L. Asu e P. Lippus (eds.) Nordic prosody. Proceedings from the XIth conference,
Tartu 2012 (pp. 97-106). Frankfurt am Main: Peter Lang,
Boersma, P. e Weenink, D. 2013. “Praat: doing phonetics by computer” [Computer
program], Available online at: http://www.praat.org
Cole, J., Goldstein, L., Katsika, A., Mo, Y., Nava, E. e Tiede, M. 2008. “Perceived
prosody: Phonetic bases of prominence and boundaries”, J. Acoust. Soc. Am. 24(4):
2496-2496.
Eriksson, A., G. C. Thunberg e H. Traunmller. 2001. “Syllable prominence: A matter of
vocal effort, phonetic distinctness and top-down processing”, Proceedings of
EuroSpeech-2001, Aalborg, Dinamarca, 399-402.
Fernandes, N. H. 1976. Contribuição para uma análise instrumental da acentuação e
intonação do português. Mestrado (Dissertação). Universidade de São Paulo.
Massini, G. 1991. A duração no estudo do acento e do ritmo em português. Mestrado
(Dissertação). Universidade de Campinas.
Moraes, J. A. 1987. “Corrélats acoustiques de l'accent de mot en portugais brésilien”,
Proc. XIth International Congress of Phonetic Sciences, 3, Tallinn: Estonia, 313-316.
Moubayed, S. Al e J. Beskow. 2010. “Prominence Detection in Swedish Using Syllable
Correlates”. Proc. Interspeech 2010, Makuhara, Japan, 1784-1787.
R-Project. 2008. The R foundation for statistical computing. “The R project for
statistical computing”, Available online at: http://www.r-project.org
Terken, J. 1994. “Fundamental frequency and perceived prominence of accented
Syllables”, J. Acoust. Soc. Am., 95(6): 3662-3665.
Traunmüller, H. e Eriksson, A. 1995. “The frequency range of the voice fundamental in
the speech of male and female adults”. Unpublished manuscript. Available online at:
http://www.ling.su.se/sta_/hartmut/aktupub.htm
Xu, Y. e C. X.. Xu. 2005. “Phonetic realization of focus in English declarative
intonation”, J. Phon., 33:159-195.
208
4º Colóquio Brasileiro de Prosódia da Fala
Entoação das interrogativas totais e parciais do espanhol
produzidas por um professor de espanhol, falante de
português brasileiro de Curitiba
Pollianna Milan¹
¹Universidade Federal do Paraná (UFPR), Brasil
[email protected]
O aprendizado de uma língua estrangeira (LE) exige uma série de requisitos
para que o aluno consiga aprender essa nova língua a ponto de ser um falante
proficiente. Um deles, e até mesmo um dos maiores desafios nessa aquisição, é
o aprendiz ser capaz de produzir a LE sem sotaque estrangeiro. Para isso, ele
precisa perceber que há diferenças tanto no nível segmental quanto
suprassegmental entre a LE e a sua língua materna (LM), pois, a prosódia da LE
(seu nível suprassegmental), foco da presente pesquisa, normalmente não é a
mesma da LM.
Dessa forma, o objetivo dessa pesquisa é analisar a produção de
interrogativas espanholas feitas por um brasileiro (curitibano), professor de
espanhol, que se considera um falante da variedade madrilenha, para verificar
se ele é capaz de reproduzir adequadamente a entoação dessas interrogativas na
LE.
Sobre o português brasileiro (PB), é importante lembrar que o padrão da
interrogativa total tem a seguinte configuração: L+H*L% (chamada também de
circunflexo, porque apresenta ascensão seguida de queda), de acordo com
estudos de Moraes (2007). Já as interrogativas parciais, como em wh-questions,
segundo Moraes (2008), apresentam também queda no final da pergunta, mas
com a seguinte configuração H+L*L%. Sosa (1999) indica que as
interrogativas totais madrilenhas apresentam no final o seguinte movimento:
L*H%. Já as interrogativas parciais madrilenhas costumam ter no núcleo a
forma H*L%. Sosa (2003) mostra ainda que as interrogativas com wh, em fala
espontânea, tem o movimento rising-falling. As configurações dos núcleos das
interrogativas, assim, parecem distintas nas duas línguas – PB e espanhol de
Madri -, por isso poderá haver interferências da LM na LE.
209
Caderno de Resumos
No caso de falantes do PB que aprendem a língua espanhola (ou castelhana)
como LE, diversos estudos (por exemplo, Pinto 2009; Font-Rotchés 2011; Dias
2012) têm demonstrado as dificuldades desses aprendizes em conseguir
reproduzir a entoação da língua espanhola adequadamente. Essa dificuldade
está relacionada, principalmente, às interrogativas totais e parciais, que exibem
uma maior distinção quando comparadas às interrogativas do PB. Pinto (2009)
mostra que contornos entoacionais característicos do PB às vezes são
reproduzidos indevidamente em interrogativas do espanhol. Font-Rotchés
(2011) aponta que os brasileiros que vivem em Goiás não produzem
adequadamente a entoação de interrogativas espanholas, pois, na curva
melódica, a ascensão final fica abaixo do esperado. Dias (2012) analisou as
interrogativas totais produzidas por aprendizes do sexo feminino,
florianopolitanas do curso de Letras-Espanhol. Seus resultados mostraram que,
para algumas perguntas (dependendo se o núcleo finalizava por palavra
oxítona, paroxítona ou proparoxítona), houve a produção do padrão
circunflexo (que não existe na variedade colombiana de Bogotá, a variedade
produzida pelas aprendizes). Isso pode ser reflexo, segundo Dias, da influência
da língua materna ou da interferência de outras variedades do espanhol.
Não se tem conhecimento, pelo menos por enquanto, de pesquisas nessa área
de entoação com falantes curitibanos, por isso, a intenção do trabalho é analisar
esse público para contribuir com o mapeamento prosódico do espanhol como
língua estrangeira no Brasil e, assim, apontar as dificuldades no processo de
aquisição dessa LE. Além disso, parte-se do princípio de que os curitibanos,
como os aprendizes de alguns outros estados brasileiros, repetirão as
dificuldades prosódicas no momento de produzir interrogativas totais e
parciais. Estudos têm mostrado que os brasileiros normalmente apresentam
uma curva entoacional com um range mais baixo; o pré-núcleo e o núcleo com
valores de pitch também abaixo do esperado (Pinto 2009; Font-Rotchés 2011;
Dias 2012).
O piloto dessa pesquisa contou com um informante curitibano, ou seja, que
nasceu e vive até hoje em Curitiba (PR), do sexo masculino e com 24 anos, que
aprendeu espanhol como LE no curso de Letras-Espanhol da Universidade
Federal do Paraná (UFPR). Atualmente esse informante é professor de
espanhol no Centro de Línguas da mesma instituição (Celin). Para esta
pesquisa, primeiramente foram gravadas cerca de doze horas de aulas
ministradas pelo informante e, dessas aulas, foram retiradas as falas que contêm
interrogativas totais e parciais (ao menos 35 de cada). Posteriormente foram
gravadas, com esse informante, 70 interrogativas (35 totais e 35 parciais) em
210
4º Colóquio Brasileiro de Prosódia da Fala
uma sala silenciosa, ou seja, sem a presença dos alunos. Nessa segunda coleta,
foram entregues ao informante pequenos fragmentos de textos escritos e, a
partir de cada um dos contextos descritos, ele deveria fazer a interrogativa
necessária, imaginando-se na situação narrada. Por exemplo, a partir da
citação: “Quieres hacer una sorpresa a Juan antes que él viaje. Pero estás en
duda si Juan viajará hoy. Pregúntale eso a la madre de Juan”. A escolha pelos
dois tipos de coleta de dados foi feita para conseguir ter gravações mais
próximas da fala espontânea, que é a ideal para estudos prosódicos. Os dados
foram registrados em um gravador digital da marca Olympus e foram baixados
em programa específico do próprio gravador para, depois, serem tratados no
Programa Audacity. Em seguida, para a análise dos dados, será utilizado o
programa Praat. Serão analisados: os movimentos ascendentes e descendentes
dos tons a partir do modelo AM para se observar, principalmente, o movimento
do acento nuclear, que corresponde à parte final das sentenças em que se
encontra a sílaba de maior proeminência frasal (núcleo). Além desse
movimento, serão observados ainda os valores de pitch e o alinhamento da
curva entoacional no núcleo e, também, no pré-núcleo dos enunciados.
Além da análise de produção das interrogativas totais e parciais desse
informante, também será rodado um teste de percepção com as 140
interrogativas (totais e parciais) intercaladas com declarativas (desse mesmo
informante que foram coletadas durante as aulas). Esse teste será aplicado em
um falante nativo de espanhol que está em intercâmbio em Curitiba: ele é
madrilenho, uma vez que é a variedade que o informante da pesquisa diz
reproduzir. Nesse teste de percepção, a intenção é saber se o professor brasileiro
é capaz de reproduzir adequadamente as interrogativas totais e parciais a ponto
de serem percebidas como tais por falantes nativos madrilenhos. Esse teste de
percepção será rodado no Praat e aplicado ao madrilenho com a presença da
pesquisadora. Os resultados serão tabulados e confrontados com os resultados
obtidos nas análises de produção.
Observações preliminares mostram que o informante produz, no núcleo,
interrogativas totais na configuração L+H*L% e parciais com movimento
L+H*H%, ou seja, parece produzir o contrário do que deveria fazer para cada
um dos tipos de interrogativas. Além disso, o pré-núcleo das interrogativas
apresentam pouca ou nenhuma diferença de altura de pitch, o que quer dizer que
parecem não ter a mesma diferença de pitch/range da fala dos madrilenhos.
211
Caderno de Resumos
Referências
Dias, Eva.C.O.; Alves, M.A. 2012. “Análise de produção de sentenças interrogativas
totais em aprendizes brasileiros de espanhol como língua estrangeira”. In Journal
of Speech Sciences: 43-63.
Font-Rotchés, D. 2011. “Melodic Analysis of speech (MAS): aplicaciones en la
comparación de lenguas”. Revista da Abralin eletrônico (especial): 333-366, 1ª
parte.
Moraes, J. 2008. “The Pitch Accents in Brazilian Portuguese: analysis by synthesis”. In
Speech Prosody, Campinas.
Moraes, J.; Colamarco, M. 2007. “Você está pedindo ou está perguntando? Uma
análise entonacional de pedidos e perguntas no português do Brasil”. Revista de
Estudos Linguísticos.
Pinto, M.S. 2009. Transferências prosódicas do português do Brasil/LM na
aprendizagem do espanhol/LE: enunciados assertivos e interrogativos totais. 355 f.
Tese (doutorado em Estudos Linguísticos Neolatinos), Universidade Federal do Rio
de Janeiro, Rio de Janeiro.
Pietro, P.; Estebas, E. 2008. La notación prosódica en español. Una revisión del
Sp_ToBI. Estudios de Fonética Experimental XVII: 263-283.
Sosa, J. 1999. La entonación del español: su estructura fónica, variabilidad y
dialectología. Madrid: Cátedra.
Sosa, J. 2003. Wh-questions in Spanish: meanings and configuration variability.
Simon Fraser University, Canada. In Catalan Journal of Linguistics: 2: 229-247.
212
4º Colóquio Brasileiro de Prosódia da Fala
Prosódia acústica e prosódia visual de enunciados
interrogativos no espanhol de Montevidéu
Priscila Cristina Ferreira de Sá1, Leticia Rebollo Couto1
1
Universidade Federal do Rio de Janeiro, Brasil
[email protected], [email protected]
1. Introdução
O presente estudo propõe uma descrição acústica e visual de enunciados
interrogativos totais com diferentes atitudes proposicionais no espanhol de
Montevidéu/Uruguai. Nossa hipótese é que 4 atitudes proposicionais sejam
contrastivas do ponto de vista prosódico na enunciação de perguntas. Foram
gravados dados de fala atuada, ou seja, interpretação de fala a partir de
contextos pragmaticamente controlados, com quatro informantes, dois homens
e duas mulheres.
Todos os informantes, nascidos e criados na cidade, têm entre 20 e 45
anos e representaram em quatro diferentes contextos pragmáticos o enunciado
“Marcela cenaba” em sua modalidade interrogativa.
No que se refere à prosódia acústica, foi medida a variação dos valores de
frequência fundamental e de duração nas sílabas e foi realizada a atribuição de
acentos tonais nuclear e pré-nuclear a partir do modelo de notação Sp_ToBI
(Spanish Tones and Break Indices).
No que se refere às atitudes proposicionais controlamos quatro tipos de
enunciados interrogativos, com relação ao grau de certeza do conteúdo
proposicional do enunciado.
Na pergunta confirmativa, pede-se uma informação com o objetivo de
certificar-se que essa informação está correta, maior grau de certeza, certeza
que a resposta é sim, com relação às quatro atitudes. O contexto: o entrevistador
diz ao informante que viu Marcela numa churrascaria à noite, e o informante
enuncia a pergunta confirmativa, “Marcela cenaba”, sem a partícula ¿no?
Na pergunta neutra, pede-se uma informação esperando receber como
resposta tanto um sim como um não, o grau de certeza proposicional é
213
Caderno de Resumos
considerado neutro, porque a enunciação não é nem mais nem menos certa. O
contexto: o entrevistador afirma que viu Marcela numa churrascaria e o
informante pergunta “Marcela cenaba”, esperando tanto um sim como um não
como resposta.
Na pergunta incrédula, pede-se uma informação esperando receber
como resposta apenas um não, o grau de certeza é maior no sentido de que se
espera que a resposta seja negativa, é provável que o conteúdo proposicional
seja negativo. O contexto: o entrevistador afirma que viu Marcela numa
churrascaria à noite e o informante pergunta “Marcela cenaba”, esperando um
não como resposta, já que ambos sabem que Marcela estava fazendo dieta e não
jantava.
Na pergunta retórica, pede-se uma informação esperando receber como
resposta apenas um não, o grau de certeza é maior no sentido de que se tem
certeza de que a resposta seja negativa, é certo que o conteúdo proposicional
seja negativo. O contexto: o entrevistador afirma que viu Marcela num
restaurante japonês à noite e o informante pergunta “Marcela cenaba”,
esperando um não como resposta, já que ambos sabem que Marcela detesta
comida japonesa. Neste contexto usamos como frase equivalente e de controle
“Lavaste los platos”, numa cena doméstica um dos membros do casal chega em
casa e pergunta ao outro se lavou a louça tendo certeza de que o outro não tinha
lavado. Trata-se de um contexto para o qual a frase pivô do experimento parece
menos adequada, o contexto deve evocar um certo conflito entre a informação
dada e a pergunta ou entre os dois interlocutores, uma ligeira recriminação.
2. Prosódia auditiva: análise acústica da produção
Nos enunciados interrogativos totais propomos dois acentos tonais no
núcleo para quatro diferentes atitudes. Sendo assim propomos o mesmo acento
tonal para interrogativos neutros (sem atitude proposicional) e para
interrogativos retóricos: L+>H*________L+H*HL%. E o mesmo acento tonal
para interrogativos confirmativos e incrédulos: L+>H*________L+H*L%.
As diferenças entre os enunciados interrogativos com o mesmo tipo de
acento tonal estão na implementação da duração. No núcleo das perguntas
neutras, a sílaba tônica é a mais longa: “ceNAba” e no núcleo das retóricas é a
pretônica a mais longa: “CEnaba”, o que permite distinguir uma da outra.
Igualmente, no núcleo das perguntas confirmativas, a sílaba tônica é a mais
214
4º Colóquio Brasileiro de Prosódia da Fala
longa: “ceNAba” e no núcleo das incrédulas é a pretônica a mais longa:
“CEnaba”, o que permite distinguir uma da outra.
3. Prosódia auditiva: teste de reconhecimento
O teste de reconhecimento das quatro atitudes interrogativas analisadas
serviu-se de oito enunciados, ou seja, de duas realizações de cada atitude, uma
com voz de homem e uma com voz de mulher. O teste de reconhecimento foi
aplicado a um grupo de 20 ouvintes, 10 homens e 10 mulheres de Montevidéu,
todos com ensino médio completo.
Dos 40 enunciados interrogativos neutros, 33 foram reconhecidos como
tal, o que nos dá um percentual alto de reconhecimento de 82,5%.
Dos 40 enunciados interrogativos incrédulos, 33 foram reconhecidos
como tal, o que nos dá um percentual alto de reconhecimento de 82,5%.
Dos 40 enunciados interrogativos confirmativos, 32 foram reconhecidos
como tal, o que nos dá um percentual alto de reconhecimento de 80%.
Dos 40 enunciados interrogativos neutros, apenas 16 foram
reconhecidos como tal, o que nos dá um percentual mais baixo de
reconhecimento de 40%.
4. Prosódia visual: análise dos componentes gestuais
Analisamos os movimentos de face, ombros e mãos dos quatro
informantes ao enunciar as quatro atitudes proposicionais descritas. Usamos o
software ELAN (Eudico Linguistic Annotator) para identificar e anotar os
gestos realizados pelos informantes. Foram considerados 13 movimentos
descritos no sistema FACS (7 movimentos de face, 5 movimentos de cabeça e 1
movimento de ombros) mais 1 movimento das mãos.
Nos enunciados interrogativos neutros: levantamento da parte externa da
sobrancelha e levantamento da pálpebra superior, homens e mulheres.
Nos enunciados interrogativos confirmativos: levantamento da parte
externa da sobrancelha e levantamento da pálpebra superior, mais movimento
da cabeça para baixo, homens e mulheres.
Nos enunciados interrogativos incrédulos: levantamento da parte
externa da sobrancelha e levantamento da pálpebra superior, mais movimento
215
Caderno de Resumos
projeção da cabeça para a frente, homens e mulheres e caimento da mandíbula,
somente mulheres.
Nos enunciados interrogativos retóricos: levantamento da parte externa
da sobrancelha e levantamento da pálpebra superior, mais inclinação da cabeça
e levantamento das mãos, homens e mulheres.
5. Discussão
Os quatro tipos de atitudes proposicionais analisadas mostraram-se
contrastivas em enunciados interrogativos, seja pela configuração tonal, pela
implementação da duração ou pelos movimentos gestuais que lhe dão suporte
visual. A próxima etapa desta pesquisa deverá controlar com testes de
reconhecimento o embricamento da prosódia acústica e visual, procurando
verificar se os padrões menos reconhecidos acusticamente são mais
reconhecidos visualmente, no caso da pergunta retórica. No caso das perguntas
neutra, confirmativa e incrédula, os padrões prosódicos são suficientemente
contrastivos, com relação à pergunta neutra e apresentam um alto percentual de
reconhecimento sem o apoio da prosódia visual, nossa hipótese é que com a
pontuação da prosódia visual esse percentual de reconhecimento aumentaria.
Referências
Cestero Mancera, A. M. 1999. Repertorio básico de signos no verbales del español.
Madrid: Arco Libros.
Ekmam, P., Friesen, W. & Hager, J. 2002. Facial Action Coding System. Salt lake City,
UT: The Manual on CD ROM., Research Nexus Division of Network Information
Research Corporation.
Moraes, J. A. 2008. “A entoação dita expressiva: fenômeno discreto ou contínuo”.
Congresso Nacional de Fonética e de Fonologia. Niterói: UFF.
Wichmann, A. 2002. “Attitudinal intonation and the inferential process”. In:
Proceedings of I Speech Prosody. Aix-en-Provence.
216
4º Colóquio Brasileiro de Prosódia da Fala
Pistas prosódicas para a segmentação da entrevista
sociolinguística
Raquel Meister Ko. Freitag1
1
Departamento de Letras Vernáculas/Universidade Federal de Sergipe,
Brasil
[email protected]
1.Introdução
Gênero do discurso acadêmico, especificamente da Sociolinguística
Variacionista (Bell 2007; Freitag et al. 2009), a entrevista sociolinguística se
configura como um protocolo que visa fazer emergir o vernáculo de um
indivíduo representativo de uma dada comunidade de fala (Labov 2008
[1972]). A realização de uma coleta de dados com entrevistas sociolinguísticas
é um modo relativamente rápido e altamente eficaz para se constituir uma
amostra de uma comunidade de fala, garantindo a confiabilidade e a
intersubjetividade da análise.
Apesar das críticas que vêm sendo feitas a este modelo de coleta de dados
– Schilling-Estes (2007) aponta que a entrevista sociolinguística é menos
natural ainda que outros tipos de entrevista, já que o entrevistado espera uma
situação formal e que segue um questionário; além da intransponível relação
assimétrica estabelecida entre o pesquisador de campo (da universidade) e o
falante, os tipos de texto/sequência discursiva que emergem em uma entrevista
sociolinguística são muito diferentes daqueles de uma conversação natural –, a
entrevista sociolinguística pode ser considerada uma fonte produtiva para se
obter diferentes estilos de fala, na medida em que seu roteiro permite que haja
uma transição entre distintos tópicos discursivos e sequências discursivas,
desde que sejam controladas as pistas sobre o que poderia delinear esses
diferentes estilos.
Dando continuidade à discussão acerca de estratégias metodológicas
para captar nuanças de mudança de estilo dentro da entrevista sociolinguística
(Freitag, a sair; Freitag et al. 2009), especificamente quanto ao controle de
217
Caderno de Resumos
sequências/tipos de texto e ao controle do tópico e complexidade do assunto,
neste trabalho enfocamos as pistas prosódicas significativas produzidas pelos
falantes que podem auxiliar na definição de uma trilha de segmentação da
entrevista sociolinguística, articuladas às segmentações baseadas em critérios
textuais-discursivos. Assumimos os pressupostos de Gumperz (2002 [1982]),
para quem o controle de pistas de contextualização – que podem ser
linguísticas, como a alternância de código, de dialeto ou de estilo,
paralinguísticas, como pausas, tempo da fala, hesitações, e prosódicas, como
entonação, acento, tom, ritmo, entre outros – auxilia na observação de
pressuposições contextuais.
A correlação entre a regularidade de padrões prosódicos e segmentação
de sequências discursivas/tipos de texto é sugerida por Guy et al. (1986) que, ao
buscarem motivações para a mudança entonacional em curso no inglês
australiano (elevação crescente final, conhecida como Australian Question
Intonation), analisaram, dentre os fatores linguísticos, o controle do tipo de
sequência discursiva (text type no original). A motivação para a escolha,
segundo os autores, foi o fato de que em investigações preliminares a
ocorrência de elevação crescente final em frases declarativas foi predominante
em narrativas, sugerindo que o tipo de sequência discursiva exercia influência
no fenômeno.
Em termos prosódicos, os tipo textuais/sequências discursivas
correspondem a fonoestilos; a distribuição de pausas e disfluências, articulada
ao controle do tipo de tópico temático, pode dar pistas para a sua segmentação
em entrevistas sociolinguísticas, colaborando também para a caracterização
das suas dimensões de formalidade/informalidade.
2. Metodologia
Com base em estudos que avaliaram aspectos prosódicos de narrativas
(Matte 2006), buscamos averiguar se pistas prosódicas podem auxiliar no
balizamento para a segmentação de entrevistas sociolinguísticas no português.
Para tanto, procedemos ao cálculo da frequência de pausas e disfluências
(hesitações, repetições de palavras ou repetições de segmentos) por segmento
de tipo textual/sequência discursiva (narrativa episódica, narrativa habitual,
relato de procedimento, explanação e opinião), conforme explicitado em
Freitag et al. (2009), além do tópico temático discorrido e o seu grau de
subjetividade.
218
4º Colóquio Brasileiro de Prosódia da Fala
Como corpus, foram tomadas 2 entrevistas sociolinguísticas extraídas da
amostra Fala Culta, estratificadas quanto ao sexo do falante, gravadas em
campo (Marantz PMD661), com duração entre 50-60 minutos. Inicialmente,
foram identificadas as sequências discursivas prototípicas e consensuais (casos
1
ambíguos ou de interação foram descartados neste momento) .
3. Resultados e discussão
Os dados foram coletados, tabulados em números absolutos e
submetidos à análise estatística do teste ANOVA (p <0,05). Foram analisados
70 segmentos de entrevistas sociolinguísticas, divididos quanto ao tipo de
sequência (29 explanação, 18 opinião, 10 habitual, 7 narrativa e 6
procedimento), grau de subjetividade (34 subjetivo, 21 intersubjetivo e 15
extrasubjetivo) e tópico temático discorrido (29 trabalho, 28 estudo, 4 lazer, 3
cidade, 2 viagem, 2 família e 2 rotina), aos quais foram cotejadas as ocorrências
de disfluências e pausas, conforme resultados dos gráficos 1-3.
Gráfico 1: Grau de subjetividade
1
Os dados sob análise foram coletados segundo a metodologia da Sociolinguística Variacionista,
em campo, e não em estúdio, o que traz sensíveis prejuízos à qualidade acústica, inviabilizando
uma análise prosódica mais aprofundada. Tais limitações impuseram a restrição da análise aos
fatores prosódicos mais salientes, como as pausas e as disfluências.
219
Caderno de Resumos
Gráfico 2: Tipo de texto/sequência discursiva
Gráfico 3: Tópico discursivo discorrido
Os resultados apontam que, na amostra analisada, há correlação na
ocorrência de pausas e disfluências com o tópico discursivo discorrido
(p<0,01): tópicos mais formais, relacionados ao trabalho e ao estudo, tendem a
favorecer mais a ocorrência de disfluências. Tipos de textos mais formais
também estão correlacionados à maior ocorrência de disfluências. Já as pausas
tendem a ser associadas a contextos de maior subjetividade e informalidade, na
medida em que sua recorrência é mais significativa em tópicos mais informais,
como lazer, e em sequências narrativas e relatos de procedimento,
possivelmente decorrentes do relaxamento promovido pelas estratégias de
minimizar os efeitos do paradoxo do observador que são adotadas na realização
da entrevista sociolinguística.
220
4º Colóquio Brasileiro de Prosódia da Fala
4. Conclusão
Os resultados obtidos respaldam a hipótese assumida, de que pistas
prosódicas podem também auxiliar na segmentação de tipos de
texto/sequências discursivas dentro da entrevista sociolinguística. A
sistematização do controle da distribuição de frequências destes traços pode
colaborar para automatização do processo de segmentação, ainda realizada de
modo manual e impressionístico pelos pesquisadores, ou, ao menos, auxiliando
no refinamento do controle.
Referências
Bell, A. 2007. “Style in dialogue: Bakhtin and sociolinguistic theory”. In: R. Bailey, R.
and C. Lucas (eds.). Sociolinguistic variation: theories, methods, and applications.
Cambridge: Cambridge University Press.
Freitag, R. M. K (in coming). Dissecando a entrevista sociolinguística: estilo,
sequência discursiva e tópico.
Freitag, R. M. K. et al. 2009. “O controle do gênero textual/sequências discursivas na
motivação da variação linguística: apontamentos metodológicos”. Odisseia, 3 (1):
1 - 1 5 .
A v a i l a b l e
o n l i n e
a t :
http://www.periodicos.ufrn.br/index.php/odisseia/article/view/2051/1485
Gumperz, J. J. 2002 (1982). “Convenções de contextualização”. In: B. T. Ribeiro and P.
M. Garcez. (eds.). Sociolinguística Interacional. São Paulo: Loyola.
Guy, G. et al. 1986. “An intonational change in progress in Australian English”.
Language in Society 15(1): 23-51.
Labov, W. 2008 (1972). Padrões sociolinguísticos. São Paulo: Parábola Editorial.
Matte, A. C. F. 2006. “Taxa de elocução, grupo acentual, pausas e fonoestilística:
temporalidade na prosa e na poesia com interpretação livre”. Estudos Linguísticos
3 5 ( 1 ) :
2 7 6 - 2 8 5 . A v a i l a b l e
o n l i n e
a t :
http://www.gel.org.br/estudoslinguisticos/edicoesanteriores/4publica-estudos2006/sistema06/28.pdf
Schilling-Estes, N. 2007. “Variation and the Sociolinguistic Interview: a
reconsideration”. 25th International AESLA Conference (Spanish Society for
Applied Linguistics), University of Murcia, . Available online at
http://www.um.es/lacell/aesla/contenido/pdf/9/schilling.pdf
221
Caderno de Resumos
Desviando da própria fala: implicações para a
verificação de locutor por falantes e não-falantes do
português brasileiro
Renata Regina Passetti¹, Plínio Almeida Barbosa¹ e Anders Eriksson²
¹Departamento de Linguística, Universidade Estadual de Campinas,
Brasil
²Departamento de Linguística, Universidade de Gotemburgo, Suécia
[email protected], [email protected],
[email protected]
O principal objetivo deste trabalho é avaliar a taxa de reconhecimento de
locutor entre grupos de ouvintes brasileiros e suecos e analisar qual o tipo de
informação (acústica e/ou lexical) empregada durante a tarefa de verificação de
locutor, além de tecer considerações sobre as possíveis pistas acústicas que
estariam interferindo na decisão de falantes e não-falantes do português
brasileiro.
O desempenho de reconhecimento de locutor em estudos envolvendo
língua e sotaques estrangeiros na verificação de locutor parece estar mais
propenso a ser afetado pela familiaridade do ouvinte com a língua, como
atestado por Schiller e Köster (1996) e Köster e Schiller (1997), cujos
resultados de seus estudos indicaram que a não familiaridade com a língua-alvo
afetava a habilidade de reconhecimento de locutor.
O corpus utilizado neste estudo foi composto por 7 gravações de
locutores brasileiros, três homens e quatro mulheres, com idade média de 21
anos. As gravações consistiam em diferentes sessões de leitura de um discurso
do apresentador de televisão Sílvio Santos, evocando dois tipos diferentes de
elocução: primeiramente, com o estilo natural de fala dos sujeitos e depois
utilizando o disfarce vocal “lápis na boca” (utilização de um lápis posicionado
firmemente entre os dentes frontais). As gravações foram utilizadas na
elaboração de 6 filas de reconhecimento, três com amostras de fala masculinas
e três com amostras de fala femininas. Cada fila de reconhecimento era
composta por uma amostra de referência (voz disfarçada), com duração de 40
segundos, separada por um beep de outras 6 amostras de fala não-disfarçadas,
222
4º Colóquio Brasileiro de Prosódia da Fala
cujas durações variavam entre 6,5 a 8 segundos que, por sua vez, estavam
separadas entre si por um período de silêncio de 4 segundos. Das amostras de
fala não-disfarçadas, uma consistia na voz do locutor-alvo, ou seja, aquela
ouvida anteriormente com o disfarce vocal e as outras 5 consistiam em vozes
distratoras. Estas amostras de fala distratoras eram formadas por diferentes
sessões do mesmo texto enunciado por diferentes locutores e/ou por diferentes
amostras de fala de um mesmo locutor (chamadas de “versões”).
Os participantes do teste de percepção pertenciam a dois grupos: (1)
ouvintes nativos de sueco, sem nenhum conhecimento em português brasileiro
(10 homens e 10 mulheres) e (2) ouvintes nativos de português brasileiro, que
moravam na Suécia há, pelo menos, 1 ano (7 homens e 3 mulheres). O teste de
percepção foi apresentado por meio de uma apresentação de slides, iniciada
pela simulação de um crime, no qual esses ouvintes haviam sido supostamente
vítimas, seguida de instruções sobre a condução da tarefa de verificação de
locutor. A tarefa dos ouvintes era, inicialmente, ouvir a amostra de fala
disfarçada com a voz do locutor-alvo e, em seguida, tentar descobrir qual dentre
as seis amostras de fala sem disfarce vocal pertencia ao locutor-alvo. A duração
total do teste foi de, aproximadamente, 15 minutos.
A análise do desempenho dos ouvintes no teste de percepção considerou
três etapas. Primeiramente, as respostas foram avaliadas de acordo com 4
diferentes tipos de análises: (1) análise da taxa de reconhecimento do locutoralvo pela porcentagem de identificações falsas e corretas em cada fila de
reconhecimento; (2) análise das falsas identificações por distrator; (3) análise
das falsas identificações pela posição da amostra de fala na fila de
reconhecimento e (4) análise das falsas identificações pelas amostras de fala de
um mesmo distrator (versão). A segunda etapa da análise consistiu em um
estudo acerca da duração relativa (z-score suavizado) de saliência duracional
de unidade VV e da taxa de elocução em unidades Vogal-Vogal (unidades VV)
por segundo entre as amostras de fala do locutor-alvo e do distrator
erroneamente escolhido com maior frequência para cada uma das filas de
reconhecimento. Esta análise tinha como objetivo investigar se estes
parâmetros poderiam ser considerados como pistas acústicas, nas quais os
ouvintes estariam apoiando suas (falsas) escolhas. Por fim, foi conduzida uma
análise da mediana da frequência fundamental (f0) entre os pares de locutores
(alvo e distrator erroneamente escolhido) para cada fila de reconhecimento,
cujo objetivo era aprimorar os resultados estabelecidos para a duração das
unidades VV e para a duração relativa de saliência duracional de unidade VV, e
também auxiliar na compreensão das falsas identificações de ambos os grupos
de ouvintes.
223
Caderno de Resumos
Quanto ao desempenho entre os dois grupos de ouvintes (suecos e
brasileiros), os resultados mostraram que não houve diferenças significativas
em relação à média percentual de identificações corretas (msuecos= 36,6%,
mbrasileiros= 45%). Apesar de os ouvintes brasileiros terem obtido um desempenho
melhor, os resultados revelaram que o teste mostrou-se difícil para ambos os
grupos de ouvintes, atestando nível baixo de concordância entre os ouvintes de
um mesmo grupo (kappasuecos= 0,12; kappabrasileiros= 0,02). A fila de
reconhecimento identificada corretamente com maior frequência, para ambos
os grupos, foi a número 2, com porcentagem de acertos de 70% para os ouvintes
suecos e 80% para os ouvintes brasileiros. O melhor desempenho dos ouvintes
para esta fila de reconhecimento pode ser explicado pela posição do locutoralvo na fila de reconhecimento. Este se encontrava na primeira posição, logo
após a amostra de referência (voz disfarçada), o que pode ter auxiliado na
decisão dos ouvintes, devido a maior retenção de características perceptuais da
voz do locutor-alvo na memória acústica desses ouvintes. O distrator que
obteve maior número de falsas identificações para os ouvintes suecos foi o
locutor 1, tendo a versão 1.3 escolhida mais vezes dentre suas outras versões.
Para os ouvintes brasileiros, o distrator falsamente escolhido mais vezes foi o
número 4, em sua versão 4.3. A posição erroneamente escolhida na maioria das
vezes foi a número 3 para ambos os grupos, representando para os ouvintes
suecos, aproximadamente 26% sobre a quantidade total de posições
erroneamente escolhidas e para os ouvintes brasileiros, aproximadamente 34%.
A análise comparativa da duração relativa da saliência duracional e da
taxa de elocução em unidades VV/s teve como objetivo aprimorar a análise da
taxa de reconhecimento de locutor pela avaliação das falsas identificações, já
que permitiam avaliar se a não-diferença estatística entre os valores médios
entre os distratores escolhidos e o locutor-alvo era suficiente para justificar uma
falsa escolha.
A análise comparativa da duração de unidades VV e da duração do grupo
acentual, delimitados pelos picos de duração relativa, foi calculada pelo script
SGdetector (Barbosa 2006) entre cada amostra de fala do locutor-alvo e do
distrator falsamente escolhido com maior frequência, em cada fila de
reconhecimento, para ambos os grupos de ouvintes (suecos e brasileiros). Um
teste T de variáveis independentes, com um nível de significância de 0,05, foi
conduzido com a finalidade de testar a hipótese nula de que as duas amostras
comparadas possuíam a mesma média para a duração das unidades VV e para o
grupo acentual. Os resultados mostraram que, na maioria das filas de
224
4º Colóquio Brasileiro de Prosódia da Fala
reconhecimento, o locutor-alvo e o distrator comumente escolhido (falsa
identificação) produziram a mesma quantidade de unidades VV/s, isto é, têm a
mesma taxa de elocução. Todos os locutores comparados (alvo e distratores
comumente escolhidos) produziram as mesmas taxas de duração relativa para o
grupo acentual. A conservação da hipótese nula (p > 0,05), para ambos os
parâmetros de análise, indica uma possível explicação para a escolha incorreta
dos locutores, que podiam estar apoiando suas escolhas nestas pistas rítmicas.
Os resultados obtidos para a mediana de f0 (Hz) para os pares de
locutores (alvo e distrator falsamente escolhido) em todas as filas de
reconhecimento permitiram uma melhor compreensão das falsas escolhas dos
ouvintes. O resultado mais importante deste parâmetro estava relacionado aos
valores obtidos para os pares de locutores das filas de reconhecimento 5 (para
os ouvintes suecos) e 1 (para os ouvintes brasileiros) que, apesar de não terem
atestado resultados significativos no teste T para a duração das unidades VV/s,
apresentou valores muito próximos para a mediana de f0 destes locutores, o que
também pode ser uma possível explicação para as escolhas incorretas dos
ouvintes.
Apesar de os resultados não terem apresentado diferenças significativas
na média percentual de escolhas corretas entre os dois grupos de ouvintes, o fato
de os ouvintes brasileiros apresentarem uma tendência em alcançar melhor
desempenho no teste de percepção, concorda com discussões anteriores de
Schiller e Köster's (1996) que afirmam que a prática de reconhecimento de
locutor parece não envolver apenas características puramente fonéticas, mas
também a incorporação de informação linguística, desde que esse grupo de
ouvintes possua um conhecimento prévio da língua do locutor-alvo. A análise
da taxa em unidades VV/s, da saliência duracional e, posteriormente, da
mediana de f0 entre os pares de locutores (alvo e distrator) permitiu melhor
compreender as escolhas incorretas dos ouvintes, visto que eles poderiam estar
apoiando suas (falsas) escolhas nestas pistas rítmicas e entoacionais.
Referências
Barbosa, P. A. 2006. Incursões em torno do ritmo da fala. Campinas, Brasil:
Pontes/FAPESP: 170.
Köster, O. & Schiller, N.O. 1997. “Different influences of the native language of a
listener on speaker recognition”. In Forensic Linguistic, 4 (1): 176-185.
Schiller, N.O. & Köster, O. 1996. “Evaluation of a foreign speaker in forensic
phonetics: a report”. In Forensic Linguistics, 3 (1): 176-185.
225
Caderno de Resumos
A velocidade de fala na expressão da raiva: um estudo
com dados de elocução espontânea
René Almeida1, Ayane Almeida1, Miguel Oliveira, Jr.1, Ebson Silva2
1
Faculdade de Letras - PPGLL, Universidade Federal de Alagoas, Brasil
2
Faculdade de Letras, Universidade Federal de Alagoas, Brasil
[email protected], [email protected], [email protected],
[email protected]
O estudo da expressão acústica das emoções consiste, em geral, na
análise de como variáveis prosódicas, tais como a entoação (F0), a velocidade
de fala, pausas, ritmo, intensidade e duração, podem fornecer pistas do estado
emocional da pessoa que está falando. A classificação e o conceito de emoção
são, no entanto, bastante controversos na literatura (Cowie & Cornelius 2003).
Apesar disso, há pontos comuns em vários trabalhos sobre o tema, tais como o
fato de quase sempre serem as emoções dirigidas ao objeto, serem ativadas por
estímulos internos ou externos e serem estados atuais de pessoas, tendo curta
duração (Paescke 2003). Concensual também parece ser a estipulação de três
emoções básicas: tristeza, alegria e raiva (Paescke 2003; Sawamura et al. 2007).
Cada uma das emoções, tal como classificadas pela literatura, está
associada a características prosódicas específicas, que a individualiza.
Bezooyen (1984), Leon (1993) e Paescke (2003) em estudos sobre o holandês,
o francês e o alemão respectivamente, procuraram associar padrões emotivos
nessas línguas a parâmetros acústicos, tais como, nível melódico médio global,
extensão vocal, intensidade média global e duração total do enunciado. Nas três
pesquisas, os autores observaram que a tristeza é geralmente caracterizada por
uma F0 menor, uma voz mais baixa e uma velocidade mais lenta, enquanto que
a raiva e a alegria apresentam uma F0 maior, uma voz mais alta e uma
velocidade mais rápida.
Pereira (2009), por outro lado, observa que nem sempre os falantes de
uma língua expressam as emoções da mesma maneira, com o mesmo grau de
ativação. A partir desta afirmação, podemos hipotetizar que também haverá
variação em diferentes variedades de uma língua.
226
4º Colóquio Brasileiro de Prosódia da Fala
No Português do Brasil, Pereira (2009) investigou de que forma a
manifestação de três emoções primárias afeta os contornos melódicos
característicos de quatro atos de fala, cruzando quatro atos de fala (asserção,
pergunta, pedido e ordem) e quatro emoções (três emoções primárias, tristeza,
alegria e raiva, acrescidas da forma “neutra”), com a finalidade de responder se
essas duas categorias são dimensões prosódicas realmente independentes ou se
a interação entre elas causa alterações substanciais nos padrões entoacionais
descritos para os atos de fala. A autora constatou que atos de fala e padrões
emotivos afiguram-se como categorias independentes do ponto de vista da
produção. No que diz respeito à percepção, porém, há algumas interferências
entre as duas categorias. Conclui que entoação e qualidade vocal devem ser
vistas como categorias complementares, ambas conjuntamente necessárias
para o reconhecimento dos estados emotivos do falante.
Entretanto, Pereira utiliza dois atores da região sudeste que, de forma
monitorada, gravaram os enunciados. A maior parte dos trabalhos que aborda a
prosódia das emoções no português falado no Brasil baseia-se na fala das
regiões sul e sudeste, e utiliza enunciações monitoradas, produzidas por atores.
No entanto, não se sabe até que ponto a fala monitorada reflete verdadeiramente
uma emoção que se caracteriza por ser involuntária e imprevisível. Essa é, na
verdade, uma das mais importantes limitações em estudos de fala emotiva
(Swerts & Hirschberg 2010).
O presente estudo enfoca a velocidade de fala, uma vez que a literatura
prévia a associa frequentemente aos estudos sobre prosódia e emoção (Pereira
2009; Paescke 2003; Leon 1993; Bezooyen 1984) e objetiva verificar a relação
entre esta variável prosódica e a expressão de raiva em falas espontâneas de
indivíduos da região nordeste do Brasil, variação ainda muito pouco estudada.
A relevância desta pesquisa, portanto, concentra-se no fato de apresentar
análise a partir de gravações espontâneas de falantes da região nordeste, no
intuito de obter máxima aproximação de uma realização fidedigna da emoção
em estudo. Sabe-se que a utilização de um corpus de fala espontânea requer
cuidados, pois, conforme Paescke (2003), é tarefa difícil garantir a qualidade
acústica e o controle dos enunciados nesse tipo de material.
Os dados utilizados no presente estudo consistem em pequenos trechos de
gravações de fala espontânea, extraídas do programa radialístico “A Hora do
Mução”. Trata-se de um programa humorístico bastante popular, em que o
radialista natalense Rodrigo Vieira Emerenciano encarna a personagem Mução. O
radialista liga para populares no nordeste, a partir de sugestões feitas por amigos e
parentes dos mesmos, com o propósito de irritá-los mediante a menção de uma
227
Caderno de Resumos
característica física, de um apelido previamente conhecido pelo radialista, por
descrição do solicitante, ou de um fato esdrúxulo. Nas gravações, há uma clara
diferença entre a fala dos telefonados na primeira metade das ligações telefônicas e
na segunda metade, quando o motivo das ligações já é conhecido. Na segunda
metade, a fala dos telefonados está claramente associada à expressão de raiva.
Trata-se, portanto, de um rico material para a análise de características prosódicas
associadas à expressão da raiva, uma vez que é possível cotejar a fala de um
mesmo indivíduo em situações associadas àquilo que se considera “fala neutra”
com àquela associada à expressão de raiva. Ademais, o uso desse material justificase pelo fato de ser ecologicamente válido, ao contrário do que acontece com a
maioria dos dados usados em pesquisas sobre a relação entre prosódia e emoção.
Os trechos das gravações serão selecionados a partir de um teste de
percepção realizado com vinte estudantes da graduação em Letras da
Universidade Federal de Alagoas, nascidos em Maceió. Os dados utilizados
neste teste de percepção consistirão em fragmentos de gravações disponíveis
no CD “Pegadinhas do Mução” [2010?], que serão selecionados a partir dos
seguintes critérios: (i) qualidade acústica (sinal inteligível e sem ruídos), (ii)
sexo do falante (todos os trechos deverão ser proferidos por homens), e (iii)
conteúdo das informações lexicais (não devem fornecer pistas muito evidentes
de nenhuma emoção).
Neste teste, serão disponibilizadas, em um formulário, as três opções de
emoções básicas: “raiva”, “alegria” e “tristeza”, além do “neutro”, para que os
sujeitos identifiquem a qual dessas categorias o estímulo auditivo apresentado
corresponde. Será fornecida a transcrição de cada trecho. Os participantes
poderão ouvir cada estímulo quantas vezes desejarem, antes de responder o
formulário. Somente os trechos identificados em mais de 75% dos casos como
associados à categoria “raiva” e à categoria “neutro” serão selecionados para
análise. A velocidade de fala nesses trechos será analisada a partir do critério de
número de sílabas por segundo, seguindo a tendência da literatura.
Análises preliminares baseadas em um experimento piloto realizado no
grupo de pesquisa do qual os autores do presente trabalho fazem parte
indicaram que, em dados de fala espontânea representando a variedade do
português falado no nordeste brasileiro, não se verifica uma associação entre a
emoção básica “raiva” e um aumento na velocidade de fala, conforme aponta a
literatura. Pelo contrário, muitos trechos identificados como sendo
representativos da emoção “raiva” pelos participantes do experimento piloto
foram enunciados com uma velocidade de fala mais lenta do que a apresentada
nos trechos considerados “neutros”, conforme explicita a Tabela 1 abaixo, que
228
4º Colóquio Brasileiro de Prosódia da Fala
evidencia as médias aproximadas de velocidade de fala de trechos
considerados, por meio do experimento piloto, “neutros” e representativos da
emoção “raiva”.
Velocidade de fala
Neutro
Raiva
Nº de sílabas/seg.
6
4
Tabela 1: Velocidade de fala associada à fala “neutra”
e à fala representativa da emoção “raiva”
Os dados analisados serão tratados estatisticamente para verificarmos
possíveis dissonâncias entre o que a literatura estabelece enquanto padrão
prosódico da emoção “raiva” e o que foi identificado a partir da análise
realizada com base em gravações espontâneas. Dessa forma, pretendemos
contribuir para a caracterização acústica de padrões emotivos no Português do
Brasil.
Referências
Bezooyen, R. 1984. Characteristics and recognizability of vocal expression of emotion.
Dordrecht: Foris.
Cowie, R. e Cornelius, R. R. 2003. “Describing the emotional states that are expressed
in speech”. Speech Communication 40 (1): 5-32.
Emerenciano, R. V. 2010?. Pegadinhas do Mução. Rio de Janeiro: Polysom. 1 disco
compacto: digital, estéreo.
Leon, P. 1993. Précis de phonostylistique parole et expressivité. Paris: Natan.
Paescke, A. 2003. Prosodische Analyse emotionaler Sprechweise. Berlin: Logos
Verlag.
Pereira, M. C. C. 2009. A expressão das emoções em atos de fala no português do
Brasil: produção e percepção. Dissertação de Mestrado em Letras Vernáculas,
Universidade Federal do Rio de Janeiro. Disponível em
http://www.letras.ufrj.br/posverna/mestrado/PereiraMCC.pdf.
Sawamura, K., Deng, J., Akagi, M., Erickson, D., Li, A., Sakuraba, K., Minematsu, N. E
Hirose, K. 2007. “Common factors in emotion perception among different cultures”.
Proceedings of 16th ICPhS, Saarbrücken: 2113-2116.
Swerts, M. E Hirschberg, J. 2010. “Prosodic predictors of upcoming positive or
negative content in spoken messages”. J. Acoust. Soc. Am. 128 (3): 1337.
229
Caderno de Resumos
Contribuições para o Atlas do Projeto Amper-Norte:
variedade linguística de Baião (PA)
Rosinele Lemos e Lemos 1
2
Regina Célia Fernandes Cruz
1
CML/UFPA, Brasil
/
ILC UFPA, Brasil
2
[email protected], [email protected]
1.Introdução
O objetivo deste trabalho, vinculado ao projeto internacional Atlas
1
Multimédia Prosodique de l'Espace Romain , é caracterizar prosodicamente a
variedade linguística de Baião (PA) apresentando aqui os resultados
preliminares da pesquisa da Dissertação de Mestrado de mestrado de Lemos
(em andamento) sobre um informante do sexo feminino, de baixa escolaridade
2
(BF91) .
A Universidade Federal do Pará participa do projeto desde 2007, com a
responsabilidade de confeccionar o Atlas Prosódico do Português do Norte do
Brasil. Atualmente, estão formados corpora das seguintes localidades
paraenses: a) Cametá (Santo 2011); b) Belém (Santos Jr. 2008; Silva 2011;
Brito 2012); c) Bragança (Castilho 2009); d) Abaetetuba (Remédios 2013); e)
Mosqueiro (Guimarães 2013); f) Curralinho (Freitas 2013); g) Mocajuba
(Costa em andamento); e h) Baião (Lemos em andamento) cujos dados
compõem este trabalho.
As análises dos dados foram realizadas considerando os parâmetros
físicos: frequência fundamental (F0), intensidade e duração, com o objetivo de
verificar qual(is) parâmetro(s) contribui(em) na distinção entre as modalidades
frasais declarativas e interrogativas na variedade investigada e se considerou
1
2
<http://w3.u-grenoble3.fr/dialecto/AMPER/AMPERfr_fichiers/frame.htm>.
B- Português Brasileiro; F- Pará; 9- Baião; 1- sexo feminino Ensino Fundamental.
230
4º Colóquio Brasileiro de Prosódia da Fala
apenas as médias dos parâmetros físicos investigados, obtidos com a análise
acústica das frases com sintagmas nominais finais simples contendo 10 vogais:
O pássaro gosta do pássaro (pwp), O Renato gosta do Renato (twk) e O bisavô
gosta do bisavô (kwk), porque representam as três pautas acentuais do
português (proparoxítona, paroxítona e oxítona).
2. Metodologia
Foram adotados todos os procedimentos metodológicos determinados
pelo projeto AMPER quanto à formação, organização e tratamento dos dados.
Como um dos objetivos do projeto compreende uma análise contrastiva dos
dialetos estudados; o corpus-base para a língua portuguesa é formado por 66
3
frases gravadas .
Sintaticamente, as frases foram montadas de forma a apresentar SujeitoVerbo-Complemento. Com relação à entoação, elas contemplam as
modalidades declarativas e interrogativas globais e suas expansões com a
inclusão de Sintagmas Preposicionais. Quanto à estrutura sintática, todas as
frases possuem: 1) três personagens: Renato, pássaro e bisavô; 2) três
sintagmas adjetivais: nadador, bêbado e pateta; três sintagmas preposicionais
indicadores de lugar: de Mônaco, de Veneza e de Salvador; 4) um único verbo:
gostar.
Para a seleção dos informantes, levaram-se em consideração os
seguintes critérios: 1) faixa etária (acima de 30 anos); 2) escolaridade
(Fundamental, Médio e Superior); 3) tempo de residência na localidade
(nativos do local).
A gravação dos dados ocorreu na casa dos informantes para garantir a
espontaneidade do discurso, utilizou-se gravador digital dinâmico e de cabeça
para a captura do áudio e notebook para a projeção das imagens e controle da
qualidade das gravações no software Soundforge.
As figuras formadoras das 66 frases foram exibidas pelo computador no
programa PowerPoint aos informantes, que repetiram seis vezes a série de
3
Para a variedade de Baião, utilizou-se ainda o corpus antigo de 66 frases. O corpus ampliado de
102 frases está sendo utilizado por REMÉDIOS (em andamento), FREITAS (em andamento) e
COSTA (em andamento).
231
Caderno de Resumos
frases (em ordem aleatória), no momento da gravação sem interrupção até a
última frase. Ao todo, foram obtidos seis sinais sonoros de 6h33min15s de
gravação. A taxa de amostragem de cada sinal é de 44.100 Hz, 16 bits, sinal
mono. Cada informante recebeu um código com informações sobre seu perfil.
O material gravado de BF91 sofreu seis etapas de tratamento: a)
codificação das repetições; b) isolamento das repetições em arquivos de áudio
individuais; c) segmentação fonética dos sinais selecionados no programa
PRAAT 5.0; d) aplicação do script praat; e) seleção das três melhores repetições
e f) aplicação da interface Matlab para obtenção das médias dos parâmetros das
três melhores repetições.
Na codificação das repetições do informante analisado, acrescentou-se o
código de cada frase com as indicações sintáticas, fonéticas e prosódicas, e um
número de ordem cronológica da repetição para, em seguida, isolar as 396
frases do sinal original em um arquivo sonoro específico.
Na segmentação fonética utilizou-se o programa PRAAT, apenas um
nível de segmentação fonética é criado: Vogais, assinalando no sinal as
realizações vocálicas, transcritas como letra v (vogais plenas) e f (vogais fracas
ou elididas). Durante a segmentação fonética, estabeleceu-se a escala de pitch
que ficou entre 120 a 350 Hz por se tratar de dados de um informante do sexo
feminino.
Concluída a segmentação, um script praat foi aplicado a cada uma das
396 repetições que gerou um arquivo.TXT contendo as medidas dos
parâmetros acústicos das vogais de cada repetição.
Antes de se proceder a análise acústica na interface Matlab, foram
selecionadas as três melhores repetições de cada frase em termos de qualidade
sonora e de similaridade de distribuição de vogais plenas (v) e elididas (f).
A aplicação da Matlab forneceu a média dos parâmetros físicos em um
arquivo fono.txt das três melhores repetições de cada frase e das duas
modalidades. A interface gerou mais outros arquivos em formato de imagem
contendo gráficos das médias de F0, duração e intensidade de cada modalidade
individualmente.
Utilizou-se os dados dos arquivos fono, organizados no Excel para
comparar as realizações das pautas acentuais consideradas e das duas
modalidades, uma vez que o Matlab fornece as informações de cada frase
individualmente. A interface gerou igualmente arquivos ton contendo uma
síntese de cada modalidade sem a parte segmental, entretanto, esses arquivos
não são utilizados aqui.
232
4º Colóquio Brasileiro de Prosódia da Fala
3.Resultados e Discussão
A análise preliminar dos dados incidiu sobre as variações dos parâmetros
físicos controlados sobre as sílabas tônicas do núcleo dos sintagmas nominais
para verificar a hipótese, base do projeto Norte Vogais, de que as variações mais
importantes de F0 ocorrem justamente na sílaba tônica do núcleo do sintagma
final do enunciado analisado.
Assim, a hipótese apresentada é reforçada (Santo e Cruz 2011), uma vez
que, é na última sílaba tônica da frase que se evidencia o movimento mais
importante de F0.
“Figura 1. Médias de variação de F0 nas sentenças pwp (azul), twt (laranja) e kwk (verde)
em ambas as modalidades – declarativa (linha plena) e interrogativa (linha tracejada).”
As médias de variação de F0 nas sentenças pwp O pássaro gosta do pássaro
(azul), twt O Renato gosta do Renato (laranja) e kwk O bisavô gosta do bisavô
(verde) representam as três pautas acentuais do português: proparoxítona,
paroxítona e oxítona. Observaram-se nos dados, os contornos de F0 de cada
uma dessas frases e nas modalidades-alvo Declarativa e Interrogativa com o
mesmo vocábulo nas duas posições sintática – sujeito e objeto indireto no início
e final, que os movimentos mais importantes de F0 concentram-se justamente
no final das vogais 7, 8 e 9 dos vocábulos analisados.
233
Caderno de Resumos
4. Conclusão
Os resultados preliminares de Lemos (em andamento), do informante
BF91, quanto aos parâmetros físicos, relacionados à pauta acentual do
português para a variedade investigada, permitem concluir que apenas o
parâmetro físico de frequência fundamental F0 é relevante para a distinção
entre as modalidades declarativas e interrogativas do português falado no
município. Os parâmetros de duração de ms e de intensidade dB não se
configuram relevantes para a distinção das duas modalidades frasais na
variedade linguística de Baião.
Referências
Carvalho, F.C. 2009. Formação de Corpora para o Atlas Dialetal Prosódico
Multimédia do Norte do Brasil: Variedade Linguística de Bragança (PA). Trabalho
de Conclusão de Curso não publicado, UFPA.
Contini, M. et al. 2002. “Un Projet d'Atlas Multimédia Prosodique de l'Espace Roman”.
In: Bel, B. e Marlien, I. (eds.) Proceedings of the 1st International Conference on
Speech Prosody: 227-230. Aix-en-Provence: Laboratoire Parole et Langage.
Costa, M.S.S. 2013. Contribuições para o Atlas do Projeto Amper – Norte: variedade
linguística de Mocajuba (PA). Dissertação de mestrado no prelo, UFPA.
Cruz, R. e Brito, C. 2011. “Atlas Prosódico Multimédia da Cidade de Belém (PA): uma
visão geral”. In V Congresso de Fonética Experimental. Universidad de
Extremadura; Cáceres (Espanha).
Freitas, J. 2013. Atlas Prosódico Multimédia do Município da Ilha do Marajó (PA).
Dissertação de mestrado não publicada, UFPA.
Guimarães, E. 2013. Contribuições para o Atlas do Projeto Amper-Norte: variedade
linguística de Mosqueiro (PA). Dissertação de mestrado não publicada, UFPA.
Lemos, R. 2013. Contribuições para o Atlas do Projeto Amper-Norte: variedade
linguística de Baião (PA). Dissertação de mestrado no prelo, UFPA.
Moutinho, L.C. et al. 2001. “Contribuição para o estudo da variação prosódica do
Português Europeu”. In Sánchez, F.M. (ed.). Actas do XXIII CILFR 1: 245-252.
Remédios, I. 2013. Atlas Prosódico Multimédia do Município de Abaetetuba (PA).
Dissertação de mestrado não publicada, UFPA.
Santo, I. e Cruz, R. 2011. “Atlas Prosódico Multimédia do Município de Cametá (PA):
uma visão geral”. In III Colóquio de Prosódia da Fala.
Santo, I. 2011. Atlas Prosódico Multimédia do Município de Cametá (PA). Dissertação
de mestrado não publicada, UFPA.
Santos Jr. e Manoel F. 2008. Formação de corpora para o Atlas Dialetal Prosódico
Multimédia do Norte do Brasil: variedade lingüística de Belém. Trabalho de
Conclusão de Curso não publicado, UFPA.
Silva, A. 2011. Atlas prosódico multimédia do Português do Norte do Brasil: variedade
lingüística da zona rural de Belém (PA). Plano PIBIC/CNPq/UFPA. Orientadora:
Regina Célia Fernandes Cruz.
234
4º Colóquio Brasileiro de Prosódia da Fala
Desenvolvimento de algoritmo de análise automática da
curva de frequência por meio de convoluções gaussianas
do histograma de alturas
1
2
Waldemar Ferreira Netto , André Ricardo de Souza , Maressa de
Freitas Vieira3, Daniel Oliveira Peres4, Marcus Vinícius Moreira
5
Martins
1,4,5
DLCV/FFLCH/Universidade de São Paulo, Brasil
2
Universidade Estadual do Paraná, Brasil
3
Faculdade Sudoeste Paulista, Brasil
[email protected],[email protected], [email protected],
[email protected], [email protected]
1. Introdução
A convolução de um histograma por meio da função normal de Gauss é
um dos inúmeros métodos de prospecção de dados que visam a encontrar
possíveis pontos de concentração dos dados em uma amostra (clusters) e,
portanto, possíveis alvos recorrentes do sistema que produziu aquela amostra.
A convolução suaviza o “ruído” presente no histograma da amostra, permitindo
identificar picos de probabilidade correspondentes a certos valores da variável
aleatória por meio da estimativa da função densidade de probabilidade
(probability density function, doravante PDF). No caso particular da análise
automática da curva de frequência em amostras de fala, a PDF nos permite
identificar alturas preferenciais empregadas pelo falante, o que pode contribuir
para um aperfeiçoamento dos modelos teóricos da entoação.
Este trabalho apresenta o desenvolvimento e a implementação de um
método de análise de amostras de fala baseado no conceito de convolução
gaussiana, acoplado ao algoritmo ExProsodia (Ferreira Netto 2006).
O método de convolução empregado neste trabalho é conhecido como
“janela de Parzen” (Parzen 1962). Segundo o método de Parzen, a PDF é
235
Caderno de Resumos
estimada por meio de uma função nuclear — comumente a função normal de
Gauss — estabelecida em cada ponto da escala a que pertencem os dados da
amostra. Cada um destes pontos é um candidato a centroide desta amostra.
Empregando-se a função normal de Gauss, o cálculo da probabilidade de cada
resultado da amostra pertencer ao centroide c é feito pela fórmula:
Nessa fórmula, x é o valor da variável aleatória correspondente àquele
resultado, c é o valor do centroide na escala e s é o parâmetro de suavização, que
corresponde aproximadamente à largura da janela do histograma. Depois de
calculadas as probabilidades de cada resultado da amostra pertencer a cada
candidato a centroide, calcula-se a média dessas probabilidades para cada um
desses possíveis centroides, que será o valor da PDF para cada ponto da escala.
O resultado desta função depende, portanto, do estabelecimento de uma escala
à qual pertencem os valores da amostra e do parâmetro suavizador s,
correspondente ao desvio padrão do kernel gaussiano aplicado.
O programa ExProsodia parte da hipótese de que alguns fatos prosódicos
têm restrições mecânico-fisiológicas e outros decorrem das necessidades
expressivas dos falantes (Xu e Wang 1997). Segundo Ferreira Netto (2006;
2008) e Peres e seus colegas (2009; 2011), a produção da fala exige esforço para
sustentar a voz com uma frequência relativamente estável, definida aqui como
tom médio ideal (TM) de F0, que se repete nos momentos Z(t) mensurados de
F0. A supressão desse esforço desencadeia uma declinação pontual que exige a
retomada da tensão inicial. A sustentação (S) é consequência do esforço que se
acrescenta a cada um dos momentos da fala, incluindo-se o inicial, para
compensar a declinação pontual de finalização (F). A componente F associa-se
ao fato de que se trata do tom alvo da declinação pontual, estabelecida por um
intervalo ideal decrescente de 7 st do TM obtido até o momento Z(t). TM é a
tendência central dos valores válidos de F0 calculada como a média aritmética
acumulada no tempo. Os valores válidos mensurados são os momentos de F0
que cumprem as restrições de altura, intensidade e duração. A série temporal se
configura aditivamente como Z(t)=S(t)+F(t)+E(t). A seleção das unidades Z(t)
— ora chamadas de UBI (Unit of Base of Intonation) — para análise é feita pelo
236
4º Colóquio Brasileiro de Prosódia da Fala
aplicativo ExProsodia® (Ferreira Netto 2010). O aplicativo faz a análise
automática de porções da curva de frequência estabelecida por autocorrelação
pelo software Speech Filing System® (Huckvale et al. 1985). Três parâmetros
são considerados para essa definição: frequência maior do que 50 Hz e menor
do que 700 Hz; intensidade suficiente para ser percebida e, garantidos os
critérios anteriores, duração maior do que 20 ms. Esses valores podem ser
modificados pelo usuário.
2. Metodologia
Para a realização do experimento consideraram-se as variáveis: (a)
gênero — masculino e feminino — e (b) tipo de fala — leitura, colérica, neutra e
triste — combinadas entre si. Os dados foram coletados na internet em sites que
disponibilizam podcasts (Webcombrasil 2013; A Voz... 2013; Podcast 2013).
Também foram coletadas gravações de vídeos no site (Youtube 2013). Para a
análise das variáveis gênero e manifestação emocional, foram selecionados 80
arquivos sonoros, distribuídos em grupos de 10. Os grupos compreendiam:
leitura masculina (HL), leitura feminina (ML), fala masculina colérica (HC),
fala feminina colérica (MC), fala masculina neutra (HN), fala feminina neutra
(MN), fala masculina triste (HT) e fala feminina triste (MT). A avaliação das
falas como colérica, neutra e triste decorreu de interpretação semântica feita
pelos membros da equipe de pesquisa. Não houve restrições quanto à qualidade
da gravação.
3. Resultados
Na Tabela 1 abaixo, são apresentados os resultados relativos obtidos com
a análise das convoluções gaussianas. A análise feita mostrou que a maioria
significativa dos intervalos utilizados pelos locutores permaneceu entre 1% e
2% no que diz respeito à variação média das frequências utilizadas nas UBIs,
sendo que variações de frequência entre UBIs de até 2%, representam mais das
metade das variações verificadas (ver Figura 1).
237
Caderno de Resumos
]-.01
[.01-.02[
[.02-.03[
[.03-.04[
[.04-.05[
[.05-
HL
ML
HC
MC
HT
MT
HN
MN
0,01
0,28
0,33
0,16
0,11
0,11
0,09
0,42
0,25
0,09
0,07
0,08
0,20
0,43
0,17
0,09
0,04
0,07
0,33
0,40
0,14
0,06
0,02
0,05
0,05
0,30
0,29
0,14
0,09
0,14
0,18
0,37
0,22
0,10
0,04
0,08
0,12
0,40
0,23
0,12
0,06
0,06
0,20
0,39
0,21
0,10
0,04
0,06
Tabela1: Dados intervalares (linhas) referentes às frequências
das variáveis de sexo e emoção dispostas nas colunas
Figura 1: Curva da média acumulada das frequências da Tabela 1
referente aos intervalos obtidos com o cálculo das convoluções gaussianas.
Em relação às categorias de ocorrência, foi possível verificar que,
comparando os coeficientes de variação (cv) de cada categoria, os intervalos de
frequências com variação entre 1% e 2%, têm uma dispersão muito reduzida
(cv=,015, z<0,01) e que os intervalos de frequência com variação abaixo de 1%
são os que têm a maior dispersão (cv=0,68, z<0,01).
Em relação às emoções, foi possível verificar que, a partir de um teste z
aplicado às frequências em relação às das demais emoções, todas as categorias
frequência de HL e de HT apresentaram diferenças significativas em relação ao
valores das demais categorias (z<0,01 em todos os casos). Também foi possível
verificar que MC teve um aumento significativo da categoria de intervalos
menores do que 1% (z<0,01), e um redução, também siginificativa dos
intervalos maiores do que 2% (z<0,01 em todos os casos). Essa diferença pode
ser observada na Fig. 2 abaixo.
238
4º Colóquio Brasileiro de Prosódia da Fala
Fig 2.: Histograma ocorrência (eixo vertical) das categorias dos intervalos de frequências,
agrupados por tipo d das e manifestação emocional (eixo horizontal). A descrição das
categorias vai apresentada por código de cores na legenda à esquerda.
5. Discussão
A análise das variações das emoções por meio da aplicação do teste de
convoluções gaussianas do histograma de alturas apontou diferenças
significativas entre os intervalos dos picos de probabilidades. De maneira geral,
a tendência desses intervalos acentuou-se de forma significativa nos intervalos
entre 1% e 2%. Esse fato se deu em praticamente todas as manifestações
emocionais. Nas leituras masculinas e das manifestação de tristeza masculina,
houve um aumento significativo na ocorrência dos intervalos entre 2% e 3%. A
manifestação feminina da cólera, entretanto, mostrou um comportamento
invertido, estabelecendo intervalos menores do que 2%. Esse fato é
compreensível pois, na manifestação de cólera há o aumento significativo do
TM, e, portanto, uma tensão extrema das pregas vocais, impossibilitando
variações maiores.
Referências
Ferreira Netto, W. Decomposição da entoação frasal em componentes estruturadoras e
em componentes semântico-funcionais. In: Congresso Nacional de Fonética e
Fonologia / Congresso Internacional de Fonética e Fonologia, 10/4, 2008, Niterói.
Ferreira Netto, W. 2010. ExProsodia. Revista da Propriedade Industrial – RPI , 2038,
pág. 167, item 120.
Ferreira Netto, W. , 2006. Variação de frequência e constituição da prosódia da língua
portuguesa. Tese (Livre-Docência em Fonética da Língua Portuguesa)–USP, São
Paulo.
239
Caderno de Resumos
Huckvale, M.A.; Brookes, D.M.; Dworkin, L.T.; Johnson, M.E.; Pearce, D.J.;
Whitaker, L.; The SPAR Speech Filing System, In: European Conference on Speech
Technology, 1987, Edinburgh.
Parzen, E. 1962. On Estimation of a Probability Density Function and Mode. Annals of
Math. Statistics, 33: 1065–1076.
Peres, D.; Consoni, F; Ferreira Netto, W. 2011. A influência da cadeia segmental na
percepção de variações tonais. LLJournal, v. 6, n. 1.
Peres, D.O.; Consoni, F.; Ferreira Netto, W. Decomposição da entoação frasal em
componentes estruturais e semântico-funcionais: um teste com análise da variação
de gênero. In: Osuchil - The Ohio State University Congress on Hispanic and
Lusophone Linguistics, 12, 2009, Ohio.
Xu, Yi; Wang, Q.E. 1997. Component of intonation: what are linguistic, what are
mechanical/physiological? International Conference on Voice Physiology and
Biomechanics, , Evanston Illinois.
240
4º Colóquio Brasileiro de Prosódia da Fala
A expressão da ironia no português brasileiro: um
estudo prosódico
1
Wisla Madaleni Alves Cabral Ferreira
1
Departamento de Letras / Universidade Federal de Ouro Preto UFOP, Brasil
[email protected]
O objetivo do estudo foi investigar acusticamente como os parâmetros
prosódicos se comportam na expressão da atitude de ironia, na interface com as
práticas discursivas. Alguns autores, tais como Couper-Kuhlen (1986),
Wichmann (2000), Aubergé (2002), Fónagy (2003), acreditam que aspectos
prosódicos relacionados, principalmente, à curva melódica - variações de
frequência fundamental (F0), influenciam na percepção do sentido de crenças,
atitudes e intenções do locutor. Nesse sentido, este trabalho trata de um estudo
piloto acerca da prosódia como uma das pistas para construção do significado
da ironia expressa no Português Brasileiro. O termo ironia tem significados
diversos, porém levamos em consideração, a princípio, as definições
estabelecidas pelo dicionário: “figura com que se diz o contrário do que as
palavras significam”. (Michaelis 2007). O conceito de ironia, já discutido
anteriormente por Paula (2012), designa, em geral, algo expressado em estado
de significado figurativo, relacionando-se com seus significados literais; mais
especificamente em sua acepção retórica, que a pontua como dizer o contrário
daquilo que se pensa, deixando entender uma distância intencional entre aquilo
que dizemos e aquilo que realmente pensamos. Focamos esse conceito,
também, em sua visão estratégica no discurso, uma vez que ela permite ao
locutor escapar às normas de coerência que toda argumentação impõe: o autor
de uma enunciação irônica produz um enunciado que, a um só tempo, possui
dois valores contraditórios, sem, no entanto, ser submetido às sanções que isso
deveria acarretar. A ironia parece então “uma armadilha que permite frustrar o
assujeitamento dos enunciadores às regras da racionalidade e da conveniência
públicas” (Berrendonner 1981).
241
Caderno de Resumos
Partindo da hipótese de que há distinção prosódica entre a expressão da
atitude ironia e a fala neutra, ou não atitudinal, objetivamos verificar o papel da
prosódia na construção da atitude de ironia, descrevendo os aspectos
prosódicos utilizados na expressão dessa atitude. Embasamo-nos,
teoricamente, na definição de prosódia como a variação de parâmetros de
duração, pausa e altura melódica ao longo da expressão da fala, incluindo,
ainda, ritmo e acento. Dessa forma, verificamos as características acústicas de
frequência fundamental, de duração, pausas e velocidade de articulação, na
tentativa de distinguir e caracterizar os enunciados que expressam essa atitude.
Buscamos, também, descrever os contextos de realização dos
enunciados, embasados pelo escopo comunicacional de Charaudeau (1984),
que discute as relações do contrato de comunicação, as funções do eu – sujeito
comunicante e do tu, assim como os modos de organização do discurso.
O estudo usou como corpus uma seleção de enunciados retirados do
Programa CQC, no intuito de compor dados de fala espontânea. Após a audição
de duas edições do programa, selecionamos 5 enunciados de dois locutores do
sexo masculino, apresentadores do programa CQC, que expressassem a atitude
estudada, totalizando 10 enunciados de fala espontânea.
Com o objetivo de comparação, instruímos dois atores, também do sexo
masculino, estudantes do Curso de Artes Cênicas da Universidade Federal de
Ouro Preto (UFOP), com idade entre 20 a 30 anos, os quais cursam o 8º período
do referido curso, a expressarem a atitude de ironia, percebida nos enunciados
selecionados para a fala espontânea; totalizando 10 enunciados de fala atuada.
O roteiro baseou-se nos próprios enunciados do programa, de acordo com a
descrição discursiva. Dessa forma, o corpus foi composto por 20 enunciados:
10 de fala espontânea e 10 de fala atuada. As gravações foram realizadas
diretamente no programa PRAAT (Boersma e Weenink), visando a
realização das análises acústicas, nesse sentido, podemos quantificar dados de
frequência fundamental, duração, pausas e velocidade de articulação. Para as
medidas de F0, buscamos os valores de F0 máxima, mínima, inicial do
enunciado e final do enunciado, os quais foram obtidos em Hz. Também
verificamos movimentos de F0 que possam ser característicos da expressão da
atitude de ironia, em contraste com a fala não atitudinal ou neutra. A medida da
taxa de articulação da fala aqui foi considerada como a divisão do número de
sílabas pronunciadas pela duração total do enunciado, dada em sílabas por
segundo. Os valores de duração foram considerados em nível segmental,
marcando, também, a tônica proeminente e em nível do enunciado, em
242
4º Colóquio Brasileiro de Prosódia da Fala
segundos; nessa mesma proposta foram medidas as pausas em segundos,
buscando contrastes entre a fala atuada e a fala espontânea. Realizamos, ainda,
análise estatística descritiva dos dados coletados - média, desvio padrão - e
estatística inferencial – teste T de diferença entre médias, sendo adotado o nível
de significância de 5%.
As análises acústicas e estatísticas nos proporcionaram resultados
significantes no que tange aos estudos prosódicos da entonação da atitude de
ironia. As medidas de F0 revelaram parâmetros que foram muito relevantes no
estudo dessa atitude. Os valores de F0 inicial, F0 final, F0 média e F0 máxima
do enunciado foram significativamente maiores na atitude de ironia na fala
espontânea do que na fala atuada. Ao passo que na F0 mínima, os valores nos
enunciados de fala atuada foram maiores do que nos enunciados de fala
espontânea. Em relação à duração do enunciado e da tônica saliente,
apresentaram-se com menor variação, dessa forma não pontuamos
considerações contrativas em comparação da fala atuada com a fala
espontânea. As audições e análises nos mostraram, ainda, que os informantes
fizeram uso de prolongamentos, risos, e interjeições durante a expressão da
ironia, o que interferiu no aumento da duração.
No que tange ao estudo discursivo dos enunciados analisados,
percebemos que a função comunicacional dos sujeitos envolvidos na
enunciação da atitude de ironia é bem definida, embora muitas das vezes a
intenção do sujeito comunicante pode não coincidir com a percepção do sujeito
interpretante. O que nos mostra que a ironia depende do contexto de
comunicação, assim como da entonação para ser construída como tal. Assim,
constatamos que este estudo piloto atingiu os objetivos pretendidos,
evidenciando as formas de expressão de ironia e seus contextos de realização,
evidenciando, ainda, as estratégias comunicacionais e as escolhas entoacionais
como agentes da construção do significado da atitude de ironia.
Referências
Aubergé, V. 2002. A Gestalt Morphology of Prosody Directed by Functions: the
Example of a Step Model Developed at ICP. In Proceedings of the 1st Conference on
Speech Prosody: 151-155.
Berrendonner, A. 1981. Eléments de pragmatique linguistique. Paris: Minuit.
Boersma, P. & Weenink, D. PRAAT: software de análise acústica. Disponível em:
http://www.fon.hum.uva.nl/praat/
243
Caderno de Resumos
Charaudeau, P. 1984. Le discours propaganiste. In Le français dans Le monde. 182.
Paris, Hachette.
Couper-Kuhlen, E. 1986. Introduction to English Prosody. Tübingen. Niemeyer.
FÓNAGY, I. 2003. Des fonctions de l'intonation: essay de synthèse. In Flambeau 29: 120, Tokyo.
Paula, K. M. 2012. O papel da prosódia na ironia como expressão de atitude. 92 f.
Dissertação (Mestrado) Universidade Federal de Minas gerais. Faculdade de Letras
– Belo Horizonte: UFMG/FALE.
Wichmann, A. 2000. The attitudinal effects of prosody, and how they relate to emotion.
In Proceedings of ISCA Workshop on Speech and Emotion: A Conceptual
Framework for Research, Belfast.
244
APOIO
Download

Caderno de Resumos - Faculdade de Letras