A Teoria do “Garden Path” Antes do modelo TGP… A Psicolingüística moderna começou como um empreendimento de cooperação entre linguistas e psicólogos durante os primeiros anos da década de cinqüenta. Em seus primórdios, a Psicolingüística foi influenciada pela tradição do Behaviorismo. Na década seguinte o modelo Chomskyano foi dominante; nos 70’s a Psicolingüística afastase da lingüística e aproxima-se das Ciências Cognitivas. Nos 80’s há uma reaproximação c/a Lingüística que continuou se estreitando nos 90’s e vem florescendo na presente década. 50: Início dos estudos em Psicolingüística sob a égide do Behaviorismo. 60: A Psicolingüística torna-se Chomskyana 70: A Psicolingüística é absorvida pela Psicologia Cognitiva 80- atual: Reaproximação crescente c/ a Lingüística S →r →s →R Década de 50: o Behaviorismo Nas primeiras décadas do século XX há uma crescente oposição às concepções mentalistas em Psicologia e em Lingüística. Em 1920, o behaviorismo já é o paradigma dominante. Os behavioristas favoreciam o estudo do comportamento objetivo, freqüentemente c/ animais de laboratório, abandonando por completo o estudo de processos mentais. A ênfase recaía sobre o papel de contingências ambientais (reforço e punição) sobre o comportamento. Só por volta de 1950 é que os behavioristas passam a interessar-se por temas lingüísticos, abandonando seus ratos de laboratório para tentar estudar o que chamavam de “comportamento verbal”. Diversas pesquisas nesta época fundamentavam as teses de Verbal Behaviour de Skinner, de que o comportamento verbal era passível de condicionamento por reforço: Jack & Jill (Bloomfield) 1. Verplanck (1955): “mmm study” Afirmações de estudantes universitários apresentavam índice de qualidade crescente quando estimuladas por reforçadores verbais como mmm ou bom; 2. Greenspoon (1955): produção de plural Aumentava-se o índice de palavras no plural quando se dirigia o reforço para este tipo de palavra. Podia-se influenciar a escolha de palavras na conversa com reforço gestual (meneio de cabeça). A psicolingüística de base Chomskyana Segundo Tannenhaus, há três modos distintos pelos quais as idéias de Chomsky influenciaram a Psicolingüística. 1. Contribuição metodológica: afirmando o inatismo e o fato de que a mente é rica em estrutura ; 2. O problema lógico da aquisição da linguagem fornece o quadro para a pesquisa em Psicolingüística desenvolvimental; 3. A teoria lingüística Chomskyana guiou a maior parte da pesquisa em Psicolingüística Experimental durante os 60’s. Estudos psicológicos da gramática Desde a década de 50, quando surge a Psicolingüística, nos EUA, num contexto ainda behaviorista, mas já decisivamente influenciado pelo gerativismo e pela Inteligência Artificial, os primeiros experimentos investigaram o papel da estrutura na compreensão. Os experimentos de Miller e seus colegas, por exemplo: 1. Sílabas sem sentido são + facilmente aprendidas em estruturas frasais Yig wur vum rix hum jig miv era mais dificilmente memorizado do que The Yir wurs vum rixing hum in jig miv. Resultado: Epstein (1961) sugeriu que este fato revela a importância da estrutura frasal nos processos de armazenagem e recuperação de memória. 2. Retenção de Constituintes Sentenciais na Memória de Trabalho Unless the temperature drops below freezing, rain will fall freezing Unless the storm moves farther north, freezing rain will fall freezing Caplan (1972): A informação sentencial é acumulada na memória de trabalho em conjuntos correspondentes aos constituintes oracionais 3. Locação de Clicks Garrett, Bever & Fodor, 1966 That he was happy ↓ was evident from the way he smiled As unidades de processamento são resistentes à interrupção. Mesmo quando o click estava no meio de um constituinte, ele era percebido como estando na fronteira. A realidade psicológica da sintaxe 4. Percepção de fonemas, palavras e frases em um background de ruído Resultado: Frases eram percebidas mais prontamente do que palavras e palavras mais prontamente do que fonemas, indicando que QUANTO MAIS ESTRUTURA, MAIS FÁCIL A COMPREENSÃO. 5. Percepção de frases em background de ruído (a) frases bem formadas: Os ursos roubam mel das colméias (b) frases anômalas semanticamente, mas sintaticamente bem formadas: Colorless green ideas sleep furiously (c) frases sintaticamente mal formadas: On trains hive elephants the simplify Resultados: Sujeitos recuperaram mais palavras das frases em a, do que das frases em b e mais palavras das frase em b do que das frases em c, demonstrando que a estrutura sintática tem um papel na compreensão, até mesmo quando as palavras não tem sentido. A Teoria da Complexidade Derivacional DTC A primeira grande teoria em Psicolingüística foi a “Derivational Theory of Complexity” de Miller e associados. A presunção fundamental desta teoria era a de que as frases com uma história derivacional mais complexa deveriam ser mais difíceis de processar. Animado por seus estudos anteriores de que a sintaxe influencia a compreensão, Miller e associados montaram experimentos para testar uma versão mais forte, a de que a compreensão usa a gramática de forma direta. A teoria DTC funcionava assim: quando uma frase é ouvida ou lida, seu marcador superficial é computado. Deste marcador recuperava-se o marcador do “kernel” subjacente revertendo as transformações que se aplicavam na derivação da frase. A idéia era a de que as transformações requeriam tempo de processamento. A cada transformação revertida aplicava-se um tag, assim a representação final era um kernel + um conjunto de tags. Por exemplo, quando se ouvia uma frase como: A DTC PATRICIA QUER VESTIR-SE CV=> PATRICIA QUER VESTIR-SE SSI=> PATRICIA QUERER VESTIR-SE REFL=> PATRICIA QUERER PATRICIA VESTIR-SE PATRICIA QUERER PATRICIA VESTIR PATRICIA A DTC Assim, uma frase com maior número de transformações seria mais custosa processualmente do que uma frase com menor número de transformações. Vários experimentos foram desenvolvidos não só por Miller, mas por outros estudiosos para testar a teoria: Os primeiros estudos pareciam confirmar a teoria: McMahon(1963) Afirmativa ativa 5 precedes 13 Afirmativa passiva 13 is preceded by 5 Negativa ativa 13 does not precede 5 Negativa passiva 13 is not preceded by 6 Transformação de Negação: The sun is not shining era mais difícil de compreender do que sua contraparte afirmativa. A falência da DTC Mas diversos estudos posteriores demonstram que outras transformações não eram mais custosas, passando-se a interpretar o resultado da negativa não como efeito da DTC, mas como efeito puramente semântico. Bever, Fodor, Garrett & Mehler Movimento de partícula: John phoned the girl up John phoned up the girl As duas frases eram processadas ± no mesmo tempo. Outros estudos chegaram mesmo a verificar que frases com mais transformações eram processadas mais rapidamente do que contrapartes com menos transformações. Outros estudos retestaram ativa/passiva e também não ofereceram suporte à teoria. Assim, os resultados indicaram que as pessoas não parecem produzir frases complexas aplicando transformações mentais a sentenças simples. Ou seja, transformações não eram psicologicamente reais. Esse foi um revés que levou ao afastamento da Psicolingüística da Lingüística. A realidade psicológica das EPs Outros estudos, no entanto, pareciam seguir na linha de que as estruturas sintáticas são psicologicamente reais. Aqueles estudos, por exemplo, sobre: -Percepção de tons/cliques de Fodor, Bever e Garrett: os cliques eram percebidos em pontos identificados como as fronteiras relevantes para a EP. É desta época a introdução de diferentes paradigmas experimentais, tais como monitoramento de fonemas, decisão lexical, reconhecimento de sonda. - Sachs (1967): Os ouvintes lembram do conteúdo de uma frase, mas não de sua forma - evidência de que as pessoas se lembram das EP’s e estas são reais. Wanner (1974) : RECONHECIMENTO DE SONDA de palavra na EP era mais efetiva quanto mais vezes a palavra aparecia na EP. Assim, em Patricia quer vestir-se, Patricia estaria mais ativo do que em Patricia quer sair. Discutia-se a interpretação em termos de processamento de co-referência. Além da estrutura Entretanto, na década de 70 mesmo esta versão mais fraca da teoria não vai sobreviver. Uma série de experimentos realizados por Bransford & Franks demonstraram que a representação mnemônica de uma frase inclui elementos que não estão na EP, mas que são derivados de inferências baseados no conhecimento do mundo. Assim, frases como: Três tartarugas descansavam sobre um tronco e um peixe nadou por baixo delas Podiam ser interpretadas tanto como: - O peixe nadou por baixo das tartarugas - O peixe nadou por baixo do tronco Sendo a segunda interpretação uma inferência que não estaria de modo algum representada na EP. Como analisa Tannenhaus, a 2a interpretação é inferida da frase mediante o uso de conhecimento das relações espaciais do mundo real. Este estudo, junto a outros chamou a atenção para a importância de fatores não gramaticais na compreensão, tal como o contexto. Anos 70 Com gemas furtadas financiando-o, nosso herói desafiou bravamente todo o desdém e a zombaria com que tentavam impedir seu intento. – “seus olhos vos enganam”, retrucou. Um ovo, não uma mesa, tipifica este planeta inexplorado. Agora três irmãs obstinadas buscam as provas, forjando seu caminho ora na calma vastidão, ora sobre picos e vales turbulentos. Assim, os dias se tornaram semanas enquanto os incrédulos espalhavam boatos e temores por toda parte. Finalmente, como que chegadas do nada, criaturas aladas surgiram trazendo a certeza do sucesso. (Anderson, E., 1976) Anos 70… Vimos então que durante os 70’s a pesquisa se direciona para o discurso, pragmática, inferência. Mas e os estudos de Processamento Sintático? Houve também posições intermediárias, que procuraram conciliar os resultados contraditórios. Assim, propôs-se que as estruturas sintáticas de superfície são psicologicamente reais, mas não as transformações. No modelo da época havia o componente gerativo, que gerava as EP’s e o componente transformacional que convertia EP em ES. Os estudos com base na gramática, ainda que marginais, continuaram, tomando um novo impulso no fim da década de 70. Principalmente os estudos relatados em Fodor Bever e Garrett, que haviam sido os responsáveis por experimentos que desconfirmaram a DTC e que procuravam uma alternativa para aquela teoria. É dessa época o levantamento preliminar de diferentes tipos de frases como as frases de encaixe central e, principalmente, as frases com ambiguidades estruturais locais e temporárias conhecidas como garden paths, que serão objeto de estudos, constituindo-se na teoria do garden path, principalmente pelo trabalho de Frazier e associados em Amherst, já no final dos 70’s e começo dos 80, sob a égide do modelo GB. Bever, 1970 A frase clássica de Bever que abre o campo do garden path(1970): The horse raced past the barn fell Frases de encaixe central também foram reconsideradas, mas a o foco das pesquisas centrou-se sobre o garden path . A questão: por que e sob que condições o Mecanismo Humano de Processamento de Frases (HSPM) ou parser adota uma análise de uma estrutura ambígua ao invés de outra. Lança-se aí um problema central na compreensão lingüística: como se resolve a ambigüidade. O trabalho de Bever (1970) “The Cognitive Basis for Linguistic Structure”, distingüe regras de estrutura gramatical de heurísticas ou estratégias perceptuais. Bever (1970) Bever propôs uma série de estratégias nãotransformacionais para explicar não só porque algumas frases são mais demoradas para processar do que outras, mas também para tentar explicar os erros que as pessoas cometem ao ouvir frases. Essas estratégias já foram alvo de muitas críticas, por não serem completas, meramente descritivas, serem redundantes e até mesmo por estarem simplesmente erradas. É o caso da estratégia NVN -> Ator Ação Objeto Seus princípios tem hoje mais um valor histórico. As estratégias de Kimball (1973) Princípio I – Top Down O parsing nas línguas naturais procede de acordo com um algoritmo “top-down”. Princípio II – Right Association Os constituintes são preferencialmente apostos ao nó mais baixo em construção. Princípio III – New Node Um item funcional assinala o início de um novo nó. Princípio IV – Two Sentences Os constituintes de não mais do que dois S podem ser parseados ao mesmo tempo. Princípio V – Closure Um nó deve ser fechado logo que possível Princípio VI – Fixed Structure O custo da reanálise dos constituintes de um sintagma (phrase) fechado é computacionalmente alto. Princípio VII – Processing Uma vez parseado, um sintagma (phrase) deve ser removido da área de trabalho da memória de curto prazo. Kimball Someone shot the servant of the actress who was on the balcony. ( Right Association ) Alguém baleou o empregado da atriz que estava na varanda. ( Right Association ) O rato que o gato que o cachorro perseguiu mordeu morreu. ( Two Sentences ) O cachorro perseguiu o gato que mordeu o rato que morreu. ( Closure ) That is a nice flower/That boy is her brother/That the boy left is surprising. ( Top down ) The girl pushed through the window cried ( Closure ) Mãe suspeita de assassinato de filho morre ( Closure ) They knew the girl was in the closet/ They knew that the girl was in the closet. ( New Node ) Eles viram a menina no armário/ Eles viram a menina entrar no armário ( Closure ) The girl persuaded her enemies were in the closet. ( Closure ) The Sausage Machine Frazier e Fodor (1978) e, principalmente, Frazier (1979) unificam em um sistema mais econômico e elegante as estratégias propostas durante a década de setenta por Bever e por Kimball. Dois princípios são inicialmente propostos: Late Closure – LC (Aposição Local) e Minimal Attachment – MA (Aposição Mínima). Basicamente, o modelo de Frazier e Fodor, que ficou conhecido na literatura como Sausage Machine – a máquina de salsichas – é composto de dois estágios: um PPP – Preliminary Phrase Packager –, que procede à estruturação inicial dos itens lexicais em sintagmas e um SSS – Sentence Structure Supervisor –, responsável pela estruturação subseqüente dos sintagmas em um marcador frasal completo. As decisões iniciais do PPP quanto às relações estruturais entre os nós sintáticos são determinadas pelo LC e pelo MA. Frazier & Fodor (1978) demonstram, por exemplo, que em uma frase como (i), o item down tende a ser aposto mais baixo, no âmbito do SN glove, resultando em um efeito garden-path. Já em uma frase como (ii) em que o constituinte é mais pesado, a frase é processada (parsed) corretamente, podendo-se apor com mais facilidade o constituinte ao verbo e não ao SN mais baixo: She threw [the bat, the ball and [the glove down]] She threw [the bat, the ball and the glove] down into the mud] A Teoria do Garden Path (Labirinto) TGP Pressupostos 1. Modularidade da Mente 2. Processador serial 3. Processador sintático inicial 4. Imediaticidade da Análise sintática Princípios 1. Aposição Mínima (Minimal Attachment) 2.Aposição Local (Late Closure) 3. Antecedente Ativo (Active Filler) 4. Estratégia do Antecedente mais Recente (Most Recent Filler Strategy) 5. Princípio da Cadeia Mínima (Minimal Chain Principle) Veríssimo, L.F. O Zelador do Labirinto. (2003). Revista Ícaro, 230, RMC Editora, p. 34. O zelador do labirinto Tem também a história do zelador do labirinto. Todos os dias ele saía de casa cedo, com sua marmita, e entrava no labirinto. Seu trabalho era percorrer todo o labirinto, inspecionando as paredes e o chão, vendo onde precisava um retoque, talvez uma mão de tinta, etc. Era um homem metódico. Pela manhã, fazia a ronda do labirinto, anotando tudo que havia para ser consertado, depois saía do labirinto, almoçava, descansava um pouquinho, e entrava de novo no labirinto, agora com o material que necessitaria para seu trabalho. Quando não havia nada para ser consertado, ele apenas varria todo o labirinto e, ao anoitecer, ia para casa. Um dia, enquanto fazia a sua ronda, o zelador encontrou um grupo de pessoas apavoradas. Queriam saber como sair dali. O zelador não entendeu bem. – Como, sair? – A saída! Onde fica a saída? – É por ali – apontou o zelador, achando estranha a agitação do grupo. Mais tarde, no mesmo dia, enquanto varria um dos corredores, o zelador encontrou o mesmo grupo. Não tinham encontrado a saída. Estavam ainda mais apavorados. Alguns choravam. Alguém precisava lhes mostrar a saída! Veríssimo, L.F. O Zelador do Labirinto. (2003). Revista Ícaro, 230, RMC Editora, p. 34. Com uma certa impaciência, o zelador começou a dar a direção. Era fácil. – Saiam por ali e virem à esquerda. Depois à direita, depois à esquerda, esquerda outra vez, direita, direita, esquerda... – Espere! – gritou alguém. – Ponha isso num papel. Sacudindo a cabeça com divertida resignação, o zelador pegou seu caderno de notas e toco de lápis e começou a escrever. – Deixa eu ver. Esquerda, direita, esquerda, esquerda. Hesitou. – Não, direita. É isso. Direita, direita, esquerda... Ou direita outra vez? O zelador atirou o papel e o lápis no chão como se estivessem pegando fogo. Saiu correndo, com todo o grupo atrás. Também estava apavorado. Aquilo era terrível. Ele nunca tinha se dado conta de como aquilo era terrível. Corredores davam para corredores que davam para corredores que davam numa parede. Era preciso voltar pelos mesmos corredores, mas como saber se eram os mesmos corredores? A saída! Onde fica a saída? A administração do labirinto teve que procurar um novo zelador, depois que o desaparecimento do outro completou um mês. Podia adivinhar o que tinha acontecido. O novo zelador não devia ter muita imaginação. Era preferível que nem soubesse ler e escrever. E em hipótese alguma devia falar com estranhos. Garden-paths João comprou a flor para Susana/John bought the flower for Susan João viu o turista com o binóculo João disse que o professor voltará ontem João viu o cúmplice do ladrão que fugiu HSPM A velocidade do processamento O mecanismo humano de processamento de frases ou parser aplica a gramática mental muito rapidamente Audição: Aproximadamente 300ms por palavra = 3 – 4 sílabas por segundo (1 segundo = “um chimpanzé" ), mas duas vezes mais rápido é compreensível. Leitura Silenciosa: de 200 a 350 palavras por minuto = aproximadamente 170 - 300ms por palavra A leitura dinâmica alcança de 2,000 – 10,000 palavras por minuto! Como o parser procede? O parser atribui estrutura à cadeia de palavras incrementacionalmente (palavra a palavra, sem esperar pela informação completa). A construção da estrutura é serial, algoritmica, & determinística exeto quando encontra AMBIGÜIDADE, incluindo a AMBIGÜIDADE TEMPORÁRIA. Nesses casos, a gramática não determina a análise da cadeia de palvras. O parser deve, então, adivinhar que análise o falante pretendeu. (Há poucas evidências para ação retardada ou paralela) No caso de ambigüidade plena, um “chute” incorreto incompreensão. No caso de ambigüidade temporária um “garden path” (=crash!) Se o “chute”estiver correto, não há problema. Se estiver errado, o parser precisará reanalisar a frase. Ambigüidade: plena e temporária Ivo detesta Pedro e Maria e Luís não. [ ]e[ ] [ ]e[ ] Ivo detesta Pedro e Maria não. Ambigüidades Temporárias Ian knows Thomas Ivo viu Pedro onset área ambígua is a train sair resolução Analisemos a frase “Ian knows Thomas is a train” . (em português, uma estrutura equivalente seria João viu Pedro sair). Nesta frase o “onset”, início da ambigüidade qual é? É o verbo know, que permite tanto um complemento nominal quanto um complemento sentencial. a ambigüidade é resolvida pela presença do verbo “be”, que assinala um complemento sentencial. Aqui dá-se o garden path. A área entre o onset da ambigüidade e a sua resolução é a área ambigua da frase. Na frase é o SN Thomas. É importante notar que estas áreas da frase são independentes das propriedades particulares do modelo de parsing que se assume. Estes são fatos que não decorrem do modelo. Independentemente de o parser fazer uso de informação sobre a grade de subcategorização do verbo, a frase é ambígua. Imediaticidade da Análise O Princípio da Imediaticidade (Just e Carpenter (1980/87) : É um princípio de parsing global, descreve características gerais do processo e não estratégias específicas de construção. Basicamente, as mensagens lingüísticas consistem de cadeias de palavras, encontradas uma a uma. Uma vez pronunciadas estas palavras desaparecem. Vimos que sua retenção perceptual na memória sensorial é de quanto tempo? Cerca de 4 segundos. Como então conseguimos processar frases complexas, que requerem operações mentais diversas tão prontamente? A questão é tratada pelo Princípio da Imediaticidade da Análise, segundo o qual as palavras são estruturadas logo que encontradas. Observe-se que há três alternativas lógicas a esse respeito: 1. O parser atrasa a computação até que o ponto de ambiguidade seja identificado e só então constrói a árvore correta; 2. O parser computa todas as análises distintas em paralelo 3. O parser computa uma única análise sintática imediatamente e a mantém até que seja contradita, quando então deve retornar para reanalisar a frase. A imediaticidade é justificada pelo garden-path e porque tem a vantagem de evitar a explosão computacional, ou seja, a memória de curto prazo teria dificuldades em manter diferentes alternativas sintáticas e semânticas ativas até que uma delas fosse a escolhida. Singer (p.70) exemplifica com a ambigüidade semântica de flower/flour , que deixaria 4 alternativas a serem mantidas até que o processo interpretativo pudesse resolver a ambigüidade. Seria uma carga pesada demais para a memória de curto prazo. Na verdade a própria existência de garden path indica qual a opção mais viável Explosão computacional John bought [the flower] [for Susan.] 2. John bought [the flower for Susan] 3. John bought [the flour] [for Susan.] 4. John bought [the flour for Susan] 1. Frazier & Rayner, 1982 ESTUDO COM “EYE-TRACKER” (Frazier & Rayner) NM MÃE SUSPEITA DE ASSASSINATO DO FILHO FOGE. Região ambígua Região DESAMBIGUIZADORA M MÃE SUSPEITA DE ASSASSINATO DO FILHO E FOGE. Região ambígua Delay Tempo relativo MAIS ELEVADO Região desambigüizadora Tempo GLOBAL M = NM Serial Região desambigüizadora M < NM Paralelo Região ambígua M = NM A teoria do Labirinto (Teoria do Garden Path) Em resumo, as afirmações fundamentais da Teoria do Garden Path são: o parser usa uma porção do seu conhecimento gramatical isolado do conhecimento do mundo e de outras informações para a identificação inicial rápida e reflexa das relações sintagmáticas (encapsulamento informacional); o parser confronta-se com sintagmas de aposição ambígua e compromete-se com uma estrutura única (comprometimento mínimo); pressionado pela arquitetura do sistema de memória de curto prazo, que tem um limite estreito de processamento e armazenamento, o parser segue um princípio psicológico na escolha dessa estrutura: use o menor número possível de nós (Aposição Mínima) e, se duas aposições mínimas existem, aponha cada nova palavra ao sintagma corrente (Aposição Local); TGP Para estabelecer relações de longa distância, o parser usa o conhecimento da estrutura para: identificar um elemento ativo na periferia esquerda e associá-lo à primeira lacuna disponível (Antecedente Ativo); associar uma lacuna ao antecedente mais recente (Antecedente Mais Recente); postular rapidamente análises com menos cadeias e cadeias com menos elos (Princípio da Cadeia Mínima); o parser distingüe entre relações sintáticas primárias e secundárias, aplicando os princípios acima apenas para o processamento das relações primárias (Construal). Aposição Mínima O parser aplica uma série de princípios de decisão ou estratégias que favorecem árvores simples e compactas. Tais estratégias dizem respeito, fundamentalmente, à geometria da árvore sintática, embora a freqüência possa também contribuir. Minimal Attachment “Attach an incoming item into the sentence structure using as few nodes as possible.” (Frazier 1978) Aposição Mínima VP / \ SN V’ Mãe / \ suspeita SP / \ de SN \ N’ / \ assassinato SP /__\ do filho foge? Aposição não-mínima VP / SN /____\ \ V foge Mãe suspeita de assassinato do filho Aposição Mínima (Frazier & Rayner, 1982) 1. We figured that Tom probably forgot the flashlight. (Aposição mínima) “Nós imaginamos que Tom provavelmente esqueceu a lanterna” 2. Tom probably forgot the flashlight had been stolen. (Aposição Não-Mínima) “Tom provavelmente esqueceu que a lanterna tinha sido roubada” Aposição Mínima Nas frases (1) e (2), o princípio de parsing relevante, segundo Frazier & Rayner (1982), é a Aposicão Mínima (Minimal Attachment, MA). Em (1) e (2), o SN the flashlight “a lanterna” apresenta ambigüidade estrutural temporária entre uma análise como objeto direto do verbo forgot “esqueceu” ou como sujeito de oração subordinada substantiva objetiva direta, pois esse verbo admite como complemento tanto um SN quanto uma oração. A predição do princípio da Aposição Mínima é a de que o parser deve “apor o material que vai encontrando ao marcador frasal em construção, usando o menor número de nós sintáticos, de acordo com as regras de boa formação da língua” (p. 180). Assim, tanto em (1) quanto em (2), a preferência mínima será por incorporar o SN the flashlight como objeto direto de forgot e não como sujeito de complemento oracional, pois a primeira análise requer a postulação de menos nós sintáticos. Essa decisão revela-se acertada em (1), mas não em (2), estrutura não-mínima, que leva o parser ao garden-path. Ao encontrar a forma verbal had been “tinha sido”, o parser notará que a decisão mínima não funcionou nesse caso e precisará reanalisar o SN the flashlight como sujeito da oração objetiva direta. O Processamento de concatenações sintáticas em três tipos de estruturas frasais ambíguas em Português Marcus Maia,Shelen Alcântara, Simone Buarque,Fernanda Faria (UFRJ) Reportam-se neste artigo estudos de questionário e experimentos de leitura auto-monitorada sobre três tipos de concatenações sintáticas ambíguas em português: orações iniciadas por QUE, ambíguas entre aposição como complemento ou como adjunto; formas verbais ambíguas entre a flexão de presente do indicativo ou o particípio passado; sintagmas preposicionais ambíguos entre aposição ao sintagma verbal ou ao sintagma nominal. Analisam-se essas duplas possibilidades de concatenações nos termos de Frazier & Clifton (1996), respectivamente, como relações sintáticas primárias e secundárias, mapeando-as em termos da caracterização apresentada em Chomsky (2001). Os resultados permitem corroborar a atuação no processamento de frases em português do Princípio da Aposição Mínima (Fodor e Frazier, 1978; Frazier, 1979) e apontam no sentido do encapsulamento do parsing sintático. O Processamento de concatenações sintáticas em três tipos de estruturas frasais ambíguas em Português Marcus Maia,Shelen Alcântara, Simone Buarque,Fernanda Faria Os três estudos reportados a seguir investigam o comportamento do parser quando defrontado com dupla possibilidade de concatenação sintática. Embora testando três tipos de ambiguidades sintáticas distintas, os estudos têm como referência a Teoria do Garden Path e adotam os mesmos procedimentos experimentais. São conduzidos, em um primeiro momento, estudos offline, com base em questionários a serem completados por voluntários, sem medida de tempos em milésimos de segundos. Em um segundo momento, os três estudos reportam experimentos de leitura automonitorada, utilizando o programa Psyscope, a fim de medir tempos de leitura em milésimos de segundos. O primeiro estudo analisa as preferências de aposição sintática no caso de orações subordinadas iniciadas por QUE, que têm como matriz uma oração nucleada por um verbo “dicendi”. A ambigüidade decorre da possibilidade de integrar a subordinada como substantiva objetiva direta ou como adjetiva, formando um SN complexo. Observe-se que, no caso da preferência pela aposição como substantiva, o processador será conduzido a um efeito labirinto (garden-path), pois não terá como integrar a oração subseqüente, precisando voltar e reanalisar a segunda oração como adjetiva: (1) A babá explicou para a criança / QUE estava sem sono / que a mamãe iria chegar à noite. O segundo estudo investiga estruturas em que uma forma verbal ambígua entre presente do indicativo e particípio se segue a um SN, admitindo ser aposta a ele como um verbo principal ou como uma oração adjetiva reduzida, formando um SN complexo. Como se observa no exemplo em (2), a preferência pela aposição como verbo no presente do indicativo poderá levar o leitor ao efeito garden-path, pois ao encontrar a oração subseqüente não terá como integrá-la no primeiro passe, já que se comprometeu com a estrutura mínima. Deverá, então, reanalisar sintaticamente a estrutura, de forma não mínima, isto é, interpretando a forma verbal como particípio, formando um SN complexo: (2) A empresária /PAGA com antecedência de um mês/ exige exclusividade. Finalmente, o terceiro estudo explora a compreensão de estruturas em que um sintagma preposicional pode apresentar ambigüidade de aposição sintática como um adjunto adverbial ou como um adjunto adnominal, formando um SN complexo: (3) O policial /viu o turista/com o binóculo. Observe-se que o SP “com o binóculo”, no exemplo acima, pode ser tomado como o instrumento com o qual o policial viu o turista (estratégia de aposição do SP ao SV) ou como um modificador do SN “o turista” (estratégia do SN complexo, não mínima). Os três estudos têm em comum ainda o fato de haverem manipulado efeitos semânticos e/ou pragmáticos, tanto nos estudos de questionário, quanto nos experimentos de leitura auto-monitorada, com a finalidade de investigar a interferência de fatores não estritamente estruturais no processamento sintático. O Processamento de concatenações sintáticas em três tipos de estruturas frasais ambíguas em Português Marcus Maia,Shelen Alcântara, Simone Buarque,Fernanda Faria (UFRJ) 1. Oração Substantiva x Oração Adjetiva. “O patrão disse ao funcionário que nunca chegava atrasado que lhe daria aumento”. 1.1. Estudo de questionário Um questionário com frases para serem completadas foi aplicado em 40 alunos de graduação da UFRJ. O questionário continha 60 frases (20 experimentais + 40 distratoras), em duas versões +P (+ plausibilidade de aposição ao SN) and –P (- plausibilidade de aposição ao SN). Exemplos: +P Havia várias crianças na creche. A babá explicou para a criança que....... -P Havia só uma criança na creche. A babá explicou para a criança que..... Resultados Oração substantiva Oração adjetiva TOTAL Tabela 1 – Resultados 275 dados 125 dados 400 dados do questionário +P 68,75 % 31,25 % 100 % Oração substantiva 353 dados Oração adjetiva 23 dados Ambíguas 20 dados Bão preenchido 4 dados TOTAL 400 dados Tabela 2 – Resultados do questionário –P 88,25 % 5,75 % 5,00 % 1,00 % 100 % O Processamento de concatenações sintáticas em três tipos de estruturas frasais ambíguas em Português Marcus Maia,Shelen Alcântara, Simone Buarque,Fernanda Faria Mesmo no contexto mais plausível, não há preferência maior do que 50% pelo pronome relativo (N = -8.0904, p 0). De toda forma, o contexto teve forte influência sobre as respostas: no contexto mais plausível houve um aumento significativo da proporção de preferências pelo pronome relativo (t(397) = 9.56; p 0). Os resultados demonstram, claramente, a preferência dos sujeitos pela produção com conjunção integrante, o que corresponde a 88,25 % do total de dados analisados. Observe-se que em ambos os casos, o princípio da aposição mínima parece estar funcionando, levando à produção preferencial de estruturas com menor complexidade estrutural. Entretanto, o contexto + plausível fez com que a preferência pela aposição mínima diminuísse sensivelmente, ainda que se mantendo como a opção preferencial. Conjunção Integrante (+) Plausível 68,75 % (-) Plausível 88,25 % Tabela 2 – Percentuais comparativos Pronome relativo 31,25 % 5,75 % 1.2. Estudo on-line 24 alunos de graduação da UFRJ foram voluntários de um experimento de leitura auto-monitorada não cumulativa com 16 conjuntos experimentais + 32 distratores em um desenho “between-subjects” , incluindo 4 condições: +PL(+Plausível longa): Havia duas crianças na sala. / A babá explicou para a criança / que estava sem sono / que a mamãe só iria chegar à noite. -PL (-Plausível longa): Havia uma criança na sala. / A babá explicou para a criança / que estava sem sono / que a mamãe só iria chegar à noite. +PC (+Plausível curta): Havia duas crianças na sala. / A babá explicou para a criança / que a mamãe só iria chegar à noite. -PC (-Plausível curta): Havia uma criança na sala. / A babá explicou para a criança / que a mamãe só iria chegar à noite. Tempos médios de leitura do segmento crítico Tempos Médios 2500 2000 1500 +PC 1775 -PC 1759 +PL 2329 -PL 2364 PC 1767 PL 2346.5 1000 500 0 +PC -PC +PL -PL PC PL 2. Concatenação de SN sujeito a verbo principal ou a oração adjetiva reduzida O tipo de estrutura examinado nesse estudo é equivalente ao famoso exemplo de Tom Bever “The horse raced past the barn fell”. Usando técnica de monitoramento da fixação ocular (eye-tracking), Ferreira & Clifton encontraram evidência contra o uso imediato da informação temática. Observem-se, a título de exemplo, um dos conjuntos de frases estudadas por eles: (1) The defendant examined by the lawyer was unreliable. “O réu examinou/examinado pelo advogado não era confiável” (2) The evidence examined by the lawyer was unreliable “A prova examinou/examinada pelo advogado não era confiável” Os autores encontraram o mesmo padrão de leitura para os dois tipos de frase, concluindo que os leitores sempre perseguem a análise em termos de oração principal, em conformidade com o Princípio da Aposição Mínima, sem levar em conta no processamento inicial a informação de natureza semântica. 2.1. Estudo de questionário Em Português, um tipo equivalente de ambiguidade ocorre com formas tais como “oculta”, “suspeita”, “paga”, etc., nas quais a forma verbal é ambígua entre a 3a pessoa do singular no presente e o particípio. Foram preparados dois questionários, contendo cada um 16 frases experimentais e 32 frases distratoras, que foram completados por 17 voluntários, alunos de graduação da UFRJ. Um dos questionários utilizava SN’s do tipo [+humano] e o outro SN’s do tipo [-humano], como exemplificado em (1) e (2), a seguir: (1) A repórter oculta... (2) A rocha oculta... Resultados Mínima +H 190 -H 170 Geral 360 Não-mínima 70 71 141 % Mínima 0.73 0.70 0.71 Tabela 7 – Dados do Questionário Observe-se que das 272 observações obtidas para cada questionário (16 frases experimentais completadas por 17 voluntários), registram-se preferências significativas pela estrutura mínima, tanto no questionário em que os SN’s tinham o traço [+humano], quanto no questionário em que os SN’s tinham o traço [-humano]. Note-se, entretanto, que algumas formas verbais apresentaram maior sensibilidade ao caráter [+humano]/[-humano] do SN, como as formas “isenta”, “limpa” e “fixa”. Resultados específicos +HM suspeita expulsa paga isenta oculta aceita limpa suja salva pega alerta desperta descalça inquieta confessa fixa TOTAL % 14 13 16 4 14 17 17 3 17 17 11 15 1 17 14 190 69,9 +HN 3 4 10 3 14 17 16 3 70 272 25,7 100 +H ambíguos -HM 1 3 6 2 12 2 17 16 13 11 17 2 3 17 17 5 17 1 7 16 9 170 4,4 62,5 -HN 1 6 15 14 16 10 1 8 71 272 26,1 100 -H ambíguos 15 1 3 12 31 11,4 2.2. Estudo “on line” 16 conjuntos de frases experimentais foram lidos por 24 sujeitos em uma tarefa de leitura auto-monitorada. 4 condições de controle e 32 distratores foram incluídos no desenho. Control Verb (V) Participle(P) Human (H) HV HP Inanimate (I) IV IP Table 4 – Experimental and Control conditions HV HP HM HN IV IP IM IN Experimental Minimal (M) HM IM Paga A empresária recompensa com prêmio em reais mas exige confiança. A empresária recompensada com prêmio em reais exige confiança. A empresária paga com antecedência de um mês mas exige confiança. A empresária paga com antecedência de um mês exige confiança. A empresa recompensa com prêmio em reais mas exige confiança. A empresa recompensada com prêmio em reais exige confiança. A empresa paga com antecedência de um mês mas exige confiança. A empresa paga com antecedência de um mês exige confiança. Non-mínimal (N) HN IN On-line As frases foram apresentadas em quatro segmentos, cujo tempo de permanência na tela era monitorado pelo leitor, que era instruído para ler de modo mais natural e rápido possível. As frases eram monitoradas, apertando-se a tecla amarela na caixa de botões. O quadro (8) abaixo exemplifica a segmentação das frases experimentais. Segmento Segmento 1 2 SN V sujeito A moça isenta Segmento 3 Segmento 4. complemento (conjunção) V complemento. de pagamento de mensalidades Tabela – Estrutura das frases experimentais (e) divulga o curso. + Pergunta A moça divulga o curso? Cruzamentos HM x HN IM x IN HV x HM IV x IM HP x HN IP x IN HM x IM HN x IN P-Valores 0,0000 0,0000 0,0050 0,0131 0,0009 0,0018 0,8983 0,6680 Tempos Médios 2500 2000 1500 Condições HV HP HM HN IV IP IM IN Tempos médios 1653 1614 1228 2242 1636 1508 1242 2355 1000 500 0 HV HP HM HN IV IP IM IN Há uma preferência significativa pela estrutura mínima (verbo principal), conforme predito pela Aposição Mínima. A manipulação do traço [HUMANO] NÃO afetou os tempos de leitura médios do segmento crítico. O segmento 4 foi lido mais rápidamente em HM do que em HN e também em IM do que em IN, refletindo o efeito surpresa e a reanálise dos garden-paths. Por outro lado, notese que não há diferenças significativas quando se comparam os tempos de leitura médios das condições HM e IM ou os tempos de HN e IN, demonstrando a ausência de acesso semântico rápido pelo parser. 3. Concatenação de SP a SV ou a SN A ambigüidade de aposição de SPs é uma das mais estudadas em inglês. Vários estudos aferiram tempos de leitura dessas estruturas, demonstrando que, em geral, levase mais tempo para ler SPs que demandam aposição ao SN do que SPs apostos ao SV. A conclusão tem sido a de que os leitores, guiados pelo princípio da aposição mínima, fazem uma aposição inicial do SP ao SV, sendo forçados, posteriormente a revisar esta análise, quando ela se revela inadequada. (cf. Altmann, 1986; Ferreira & Clifton, 1986; Frazier, 1978; Rayner, Carlson and Frazier, 1983, Sedivy & Spivey-Knowlton, 1994): The gang leader hit the lawyer with a whip. The gang leader hit the lawyer with a wart. Estudo de questionário Foram preparados dois questionários contendo cada um 20 frases experimentais e 40 frases distratoras, a serem respondidas por 40 voluntários, alunos de graduação da UFRJ. Em ambos os questionários havia uma frase inicial que pretendia funcionar como um contexto para a frase seguinte, onde ocorria a ambigüidade de aposição do SP. No primeiro grupo, havia um contexto que afirmava a existência de um único referente, enquanto que, no segundo grupo, o contexto introduzia mais de um referente possíveis, com vistas a favorecer a aposição baixa do SP, como exemplificado em (1) e (2), a seguir: (1) Contexto – Plausível: Havia um turista no parque. O policial viu o turista com o binóculo. (2) Contexto + Plausível: Havia dois turistas no parque. O policial viu o turista com o binóculo. Resultados Plausib./Ligação - Plausível + Plausível SP de SV 259 /64,9% 219 / 54,9% SP de SN 141 / 35,1% 181 / 45,1% TOTAL 400 / 100% 400 / 100% Tabela 13 – Resultados e percentuais por condição experimental Um teste sobre a proporção geral (40%) mostrou que esta é significativamente menor do que 50% (N = -5.62, p 0). Mesmo no contexto mais plausível, não há preferência maior do que 50% pelo SN (N = -1.91, p < 0,05). De toda forma, o contexto teve forte influência sobre as respostas: no contexto mais plausível houve um aumento significativo da proporção de SN (t(399) = 2.90; p < 0,01). Observe-se, portanto, que, em ambas as condições de plausibilidade, registra-se uma preferência significativa pela aposição alta, isto é, a interpretação que analisa o SP como ligado ao SV, indicando que o princípio da Aposição Mínima é operativo também neste tipo de estrutura em português. On-line Projetou-se um experimento de leitura auto-monitorada, em que 24 sujeitos foram solicitados a ler, da forma mais natural e rapida possível, duas orações segmentadas, conforme indicado pelas barras oblíquas, nos exemplos abaixo. Cada sujeito foi exposto a 16 frases experimentais, apresentadas randomicamente com 32 distratoras, totalizando 48 frases. As frases experimentais distribuíam-se em quatro condições, a saber, +PB (+ plausível baixa), +PA (+plausível alta), -PB (-plausível baixa) e –PA (-plausível alta). As frases experimentais foram comparadas “entre-sujeitos”, evitando-se que um mesmo sujeito fosse exposto a mais de uma versão da mesma frase. Um conjunto experimental completo é exemplificado a seguir: .+PB Havia dois turistas no parque./ O policial / viu o turista /com a ferida aberta. +PA Havia dois turistas no parque./ O policial / viu o turista /com o binóculo preto. -PB Havia um turista no parque./ O policial / viu o turista /com a ferida aberta. -PA Havia um turista no parque./ O policial / viu o turista/com o binóculo preto. Como indicado abaixo, a Aposição Mínima é operativa também nesse tipo de estrutura em PB. O experimento demonstrou ainda não haver interação entre a pressuposição pragmática e a preferência de aposição do SP. Os tempos de leitura computados foram os tempos médios dos segmentos com os SPs. A aposição baixa forçada apresentou tempos de leitura mais longos, como previsto. Cruzamentos def +PA x + PB e de PA (+PA e – PA) e PB (+PB e – PB) foram estatisticamente significativos, indicando garden path e reanálise. Por outro lado, cruzamentos de –P x + P não foram significativos. –PA x +PA (p-value = 0,8505); –PB x +PB (p-value= 0,1244Esses resultados sugerem que o efeito da pressuposição pragmática capturada no questionário offline não ocorre durante o parsing, mas durante uma interpretação pós-sintática. Tempos Médios Condições PA PB +PA -PA +PB -PB Médias 1161 1540 1153 1167 1458 1613 2000 1500 1000 500 0 PA PB +PA -PA +PB -PB Gráfico 3 – Tempos Médios de Leitura dos SP’s Cruzamentos P-valores PA X PB 0,0000 -PA X +PA 0,8505 -PB X +PB 0,1244 +PA X +PB 0,0002 -PA X -PB 0,0000 Tabela 11– Resultado das ANOVAS Conclusões Os três estudos permitiram demonstrar a existência de efeitos garden-path em português, provocados pela atuação do Princípio da Aposição Mínima (Frazier e Fodor, 1978; Frazier, 1979), que orienta o parser a decidir pela computação menos complexa sintaticamente. Os três estudos apresentaram também uma simetria interessante no que diz respeito aos resultados dos questionários offline, comparativamente aos estudos de leitura automonitorada online. De modo geral, os estudos offline apresentaram maior sensibilidade a efeitos semânticos e pragmáticos, enquanto que os resultados dos estudos online parecem sugerir que estes fatores estariam menos disponíveis ao parser do que as informações estritamente estruturais. Os dados experimentais sobre o português permitiram estabelecer que as relações do tipo primário são mais prontamente estabelecidas no parsing do que as relações secundárias que, inclusive, na análise de Chomsky (2001), requerem uma operação a mais do que as primeiras, a simplificação. Nesse sentido, o artigo pretendeu argumentar em favor da realidade psicológica dos princípios gramaticais, sugerindo que o desempenho do parser não é apenas determinado por fatores extra-lingüísticos, como os limites de memória de trabalho, mas que seu funcionamento é, fundamentalmente, decorrente dos princípios que norteiam a gramática. Aposição Local Aposicão Local (Late Closure, LC) – “Quando possível, aponha os itens lexicais que vão sendo encontrados à oração ou sintagma correntemente sendo processado, ou seja, o nó não terminal mais baixo possível dominando o último item analisado” Late Closure: When possible, attach incoming lexical items into the clause or phrase currently being processed (i.e., the lowest possible nonterminal node dominating the last item analyzed). Late Closure Aposição não-local = custo de processamento Maria o presente o menino Maryviu saw a gift for apara boy… na caixa. NP PP NP o presente P NP PP para o menino na caixa Aposição Local Frazier & Rayner (1982) apresentam um experimento em que registraram os movimentos oculares de sujeitos na leitura de frases contendo ambigüidades estruturais temporárias, tais como: Since Jay always jogs a mile this seems like a short distance to him. (Late Closure ou Aposição Local) “Como Jay sempre corre uma milha isso parece perto para ele” Since Jay always jogs a mile really seems like a very short distance to him. (Early Closure ou Aposição Não-Local) “Como Jay sempre corre uma milha realmente parece muito perto para ele” No exemplo em (2), a estratégia LC é aplicada, atrasando-se o fechamento do sintagma verbal, cujo núcleo é um verbo que pode ser transitivo ou intransitivo, para incluir-se o sintagma nominal a mile “uma milha” como objeto direto. A operação do parser é bem sucedida e não há garden path (efeito labirinto). Já em (3), a aplicação da estratégia é mal sucedida e diz-se que o parser é garden-pathed, ou seja, perde-se no labirinto. Guiado pelo LC, optou por atrasar o fechamento do SV para incluir o SN como objeto do verbo, mas, ao tentar continuar o processamento da frase, dá-se conta de que se perdeu no labirinto. Precisa, então, rever a análise, pois a estrutura, nesse caso, requeria o EC, o fechamento imediato do SV, sem incluir aí o SN a mile, que deverá ser, agora, reanalisado como sujeito da próxima oração. Late Closure em PB (Ribeiro, 2002) Frazier (1978) obteve evidências preliminares para a estratégia Late Closure usando uma tarefa de apresentação visual em que as palavras de uma frase eram apresentadas não-cumulativamente a uma velocidade de 300-350ms por palavra. Os sujeitos indicavam ao final da apresentação se a frase era gramatical. Os tempos de decisão mais rápidos ocorriam quando as frases obedeciam a interpretação prevista pelo princípio de localidade (late closure) do que quando as frases eram resolvidas pela aposição não local (early closure). Ilustram-se abaixo dois dos tipos de frases testadas por Frazier:: (1) a. Mary kissed John and his brother when she left. ( 1065ms) b. Mary kissed John and his brother started to laugh. (1667ms) (2) a. Anne was watching you she laughed and nobody knew why (1037 ms) b. Anne was watching you were laughing and nobody knew why (1598 ms) Ribeiro (2002) aplicou um experimento de leitura auto-monitorada em que 48 alunos de graduação da UFRJ foram expostos a estruturas equivalentes em PB: Segmento crítico Tipo 1 EC SC LC Maria beijou João Maria beijou João Maria beijou João e o irmão dele e o carro dele e o irmão dele arregalou os olhos derrubou as árvores estalando os lábios de espanto. do quintal. com vontade. EC SC LC Use a farinha Use a farinha Use a farinha e o fermento e você e o fermento engrossará a massa engrossará a massa preparando a massa do pão. do pão. do pão. EC SC LC Ladrões atacaram Maria Ladrões atacaram Maria Ladrões atacaram Maria e seu filho e seus gritos e seu filho soltou um grito assustaram os vizinhos roubando os pertences de medo. da rua. dos dois. EC SC LC A imprensa criticava A imprensa criticava A imprensa criticava o técnico o penta a seleção manteve o time parecia um sonho o técnico teimou e trouxe o penta. mas veio. e trouxe o penta. EC SC LC A oposição ataca A oposição ataca A oposição ataca o governo o debate o governo nega os problemas desce de nível o debate esquenta e pouco muda. e pouco muda. mas pouco muda. EC SC LC O mais fortes vencem O mais fortes vencem O mais fortes vencem os fracos os genes os fracos perdem a luta mantêm a espécie perdem a luta e a vida segue. e a vida segue. e a vida segue. Tipo 2 Resultados Os tempos de leitura do terceiro segmento (segmento crítico) foram registrados e os resultados indicaram que as estruturas de aposição local (LC) foram lidas mais rapidamente do que as estruturas não locais (EC). Os tempos de leitura dos controles semânticos não foram significativamente diferentes do que os tempos de leitura dos segmentos críticos nas estruturas locais. Tipo 1 EC = 1953 ms; LC = 1141 ms (p = 0, 0003) SC = 1370 ms; LC = 1141 ms (p = 0,2) Tipo 2 EC = 2227 ms; LC = 1444 ms (p = 0, 003) SC = 1511 ms; LC = 1444 ms (p = 0,7) Teoria do Garden Path: Dependências de longa distância 3 princípios foram postulados no âmbito da TGP para dar conta de dependências anafóricas: 1. Antecedente Ativo (Active Filler) 2. Antecedente Mais Recente (Most Recent Filler) 3. Cadeia Mínima (Minimal Chain Principle) Questões Como o parser lida com frases em que constituintes a serem relacionados não ocorrem em suas posições canônicas, ou seja, frases com dependências de longa distância com vazios (gaps) e antecedentes (fillers)? Dois problemas para o parser: (1) Uma cv não se manifesta no sinal acústico, devendo sua presença ser inferida indiretamente; (2) O antecedente distante questiona a localidade da construção da representação estrutural. Assim, as CVs têm sido um tópico central na pesquisa em processamento há 3 décadas. São reveladoras sobre a própria arquitetura do sistema de processamento Vestígios de QU Which booki is John reading __i? Que livroi o João está lendo __i ? Como computar a coindexação? O vestígio nem sempre está logo após o verbo ou no fim da frase: Which booki is John reading * __i about__i ? Active Filler Que problemas estas construções de longa distância do tipo antecedente/categoria vazia levantam para o processador gramatical? 1. Identificação do antecedente preenchedor da lacuna Detecção do antecedente em COMP 2. Identificação da Lacuna Postulação da lacuna é imediata? Postergada? Info lexical é acessada? 3. Coindexação do antecedente à lacuna Ambigüidades podem ocorrer quando mais de um antecedente possível estão presentes. Efeito da lacuna preenchida (Filled gap effect) O processador aproveita a informação sobre o antecedente? Crain & Fodor (1985) mostraram que sim: (1) Whoi did the child ask __i to sing the song? Whoi did the child ask us to sing the song for __i? (2) é mais difícil de processar do que (1), indicando um efeito surpresa. O parser identificou o antecedente em posição sem função gramatical e papel temático e procura uma lacuna para coindexá-lo, satisfazendo, assim, tão logo quanto possível os requisitos gramaticais. Entretanto, a primeira posição de postulação da lacuna está preenchida. (2) Active Filler O processador usa regras de estrutura de frase para criar estruturas sintagmáticas ? ou O processador usa núcleos de Sintagmas para criar a estrutura? As lacunas, por exemplo, poderiam ser postuladas à base de regras de estrutura de frase ou à base de informação lexical particular. Por exemplo, a possibilidade de uma lacuna é entretida à base do SV ou precisa ser atrasada até o verbo nuclear ser identificado e seu status como transitivo ser determinado? A lacuna é postulada como “first resort”. Clifton & Frazier. (1989). Comprehending Sentences with Long Distance Dependencies. In: G. Carlson & M. Tanenhaus (eds). Linguistic Structure in Language Processing. Hipótese do Antecedente Ativo : Active Filler Hypothesis: Quando um antecedente é identificado em posição nãoargumental (COMP), a possibilidade de postular uma lacuna para este antecedente é maior do que a de identificar um SN. Na p. 292, F&C apresentam evidências para a HAA: Who did Fred tell Mary left the country A interpretação favorita desta frase é: Who-i did Fred tell ___-i Mary left the country E não: Who-i did Fred tell Mary ____-i left the country. Most Recent Filler Frazier, Clifton & Randall (1983) Antecedente Recente This is the girl the teacher wanted __ to talk to __. Antecedente Distante This is the girl the teacher wanted __ to talk As frases com antecedente distante foram mais difíceis de serem compreendidas do que as frases com antecedente recente Minimal Chain Principle De Vicenzi, M. (1996). Syntactic Analysis in Sentence Comprehension:Effects of Dependency Types and Grammatical Constraints Neste trabalho, Vicenzi apresenta 3 experimentos sobre o parsing de questões-QU em Italiano, onde são manipuladas as seguintes variáveis: 1. tipo de Qu (Quem/Qual) 2. Sítio de extração do Qu (oração principal, oração dependente com e sem complementizador) O objetivo destas manipulações é o de verificar se o parser é sensível ao tipo de dependências processadas e se os efeitos de processamento podem ser explicados por um princípio único de processamento : o Princípio da Cadeia Mínima (MCP - Minimal Chain Principle). Os resultados demonstram que o parser, seguindo o MCP, prefere estruturas com menos cadeias e com cadeias menos complexas. Princípio da Cadeia Mínima A autora incia discutindo algumas das questões que podem ser levantadas no estudo de dependências do tipo QU: 1. Como o parser funciona? Há um uso imediato e automático da gramática? 2. Caso afirmativo, que tipo de gramática melhor caracteriza a gramática mental? 3. Que estratégias de parsing são usadas p/ levar do input perceptual à interpretação? Uma abordagem experimental para estas questões consiste em investigar frases com ambiguidades estruturais, tais como sub/obj com Qu em Italiano: Chi ha chiamato Gianni? Quem chamou o João? Quem-i[e-i chamou o João] Quem-i [e-j chamou e-i o João-j] A razão para estudar frases contendo ambiguidades estruturais . Qual é? Não é tanto para saber como o parser resolve estas ambiguidades em si, embora a língua natural esteja cheia de ambiguidades, mas a lógica é: Se o parser demonstra uma preferência sistemática por uma maneira de resolver as ambiguidades, então temos um insight sobre o sistema de compreensão. Princípio da Cadeia Mínima Evite postular membros da cadeia desnecessários, mas não atrase a postulação de membros necessários. PCM Por que o parser tem esta urgência de completar uma cadeia? A razão final para estruturar material em uma representação sintática é atingir a interpretação semântica de cada frase. Uma tarefa essencial para se chegar à interpretação semântica é emparelhar cada SN com uma posição argumental de um predicado. Assim, para interpretar uma frase temos de saber quem fez o que para quem. Uma cadeia liga todas as posições em uma oração pela qual e para a qual um SN se moveu, contendo informação sobre as posições que atribuem caso e papel temático que licenciam uma oração. Nos caso em que os SN se moveram, isto é, estão fora de sua posição argumental canônica, há uma pressão sobre o parser para que este construa a cadeia mais curta para os elementos QU a fim de ligá-lo logo a uma posição que possa receber caso, papel temático, logo que possível, a fim de que a interpretação semântica seja viabilizada. PCM A autora considera que na teoria GB, trabalhos de Cinque, 92 e Rizzi 90, entre outros, propuseram a existência de uma diferença sintática entre elementos QU, no que se refere a elementos QU não referenciais, como quem, o que e elementos QU referenciais como qual-N, sendo os primeiros regidos por cadeias de regência pelo antecedente e os segundos por relações de vinculação. A autora faz a hipótese de que apenas os QU não referenciais são regulados pelo MCP, sendo os referenciais D-linked, ligados discursivamente (Pesetsky,87). A idéia intuitiva de ligação discursiva (D-linked) é a de que um elemento se refere a um grupo de objetos existentes na representação discursiva, podendo receber uma interpretação diretamente através de suas propriedades de ligação discursiva, enquanto os tipos não referenciais (quem, o que) só podem ser enviados para o componente interpretativo se ligados a estrutura argumentativa de um verbo, na sintaxe. PCM Experimento 1: Testa o processamento de dependências QU em interrogativas simples com ambiguidade estrutural suj/obj em Italiano. Os participantes foram 40 alunos da U. de Roma. O experimento usou 24 questões QU que eram ambiguas entre a interpretação do QU como sujeito ou como objeto. O SN pós-verbal portava informação desambiguizadora à base de plausibilidade. A tarefa era a leitura automonitorada. Os sujeitos apertavam um botão que controlava o aparecimento de segmentos das frases na tela de um micro. Cada questão QU era seguida por uma pergunta sobre a compreensão, a que os sujeitos deviam responder apertando um botão sim ou um botão não. Havia portanto 3 medidas dependentes: 1. Tempo de leitura de cada segmento 2. Tempo de resposta às perguntas de compreensão 3. Índice de acertos nas perguntas de compreensão. PCM 1. QU n-ref (QUEM) com interpretação sujeito: Quem-i [___-i demitiu o metalúrgico sem dar aviso prévio?] 2. QU n-ref (QUEM) com interpretação objeto: Quem-i [___-j demitiu ___-i o proprietário-j sem dar aviso prévio?] 3. QU ref (QUAL) com interpretação sujeito: Qual engenheiro-i [___-i demitiu o metalúrgico sem dar aviso prévio?] 4. QU ref (QUAL) com interpretação objeto: Qual engenheiro-i [___-j demitiu___-i o proprietário-j sem dar aviso prévio?] PCM Estas 24 frases (seis por condição) foram espalhadas entre 74 distratores com diferentes estruturas. Cada sujeito viu apenas uma versão de cada quádruplo, sendo exposto a todas as condições. Quais eram as predições? 1. QU em posição SUJEITO devem ser preferenciais aos QU em posição Objeto, pois nestas estruturas o SN pós-verbal (objeto) está gerado na base aí mesmo, sem precisar mover-se. Assim, o QU em posição objeto deveria ser desfavorecido pois é mais custoso em termos de cadeias, já que tem uma cadeia para o elemento QU e para o SN-pós verbal. 2. Deve haver vantagem de processamento adicional para a extração do QU nref SUJ (QUEM), pois na extração do QU nref (QUEM) em posição objeto, o parser que seguira o MCP completando a cadeia imediatamente tem que reanalisá-la quando por razões de plausibilidade o SN pós-verbal é o Sujeito. 3. No caso das interrogativas com QU ref. (QUAL), o parser não segue o MCP e sim a ligação discursiva. Assim, não postula uma cadeia imediatamente, esperando todos os argumentos do verbo serem recebidos para então coindexar o sintagma QU com a posição vazia adequada. Portanto quando por razões de plausibilidade o SN pós verbal é interpretado preferencialmente como agente, a única posição disponível para coindexar o QU é a de objeto. Se, por outro lado, a plausibilidade indicar que o SN pós-verbal é um objeto, então o QU é coindexado com o sujeito, não havendo qualquer reanálise para este tipo de QU ref. PCM RESULTADOS A preferência geral pela extração do QU-suj em rel ao QU-obj nas orações com QU nref (QUEM) tanto em termos dos tempos de leitura, quanto em termos de COMPREENSÃO é patente nos resultados estatisticamente robustos: QU n-ref (QUEM) SUJ 2,171ms 89% corretos QU n-ref (QUEM) OBJ 2,569ms 81% corretos QU ref (QUAL) SUJ 2, 577ms 90% corretos QU ref (QUAL) OBJ2,648ms 87% corretos Constatou-se, igualmente, que nas frases com QU- ref(QUAL), tal assimetria não ocorre, como previsto. Apenas os tempos gerais de processamento são mais elevados em decorrência do SN extra que deveria ser processado aí.