SENTENCE PARSING Don Mitchell INTRODUÇÃO Para interpretar uma sentença é preciso: - identificar cada palavra, estocando informações para os próximos processos; - considerar informações contextuais, pontuação e entonação; - determinar, a partir das informações geradas nas etapas anteriores, quais ações são descritas ou quais assertivas são expressas (instruções, informações), quais características identificam pessoas e objetos e como essas pessoas e objetos se relacionam (determinar conexões e tarefas). Para os psicolinguistas que trabalham na área, o principal problema no processamento de sentenças é determinar como as pessoas convertem uma série de palavras em uma estrutura como o tree diagram (diagrama de árvore), ou seja, em uma estrutura capaz de produzir sentido a partir das corretas relações entre as palavras. O tree diagram é utilizado para: - representar a estrutura das frases - destacar as relações estabelecidas entre os seus objetos - definir as funções de cada um desses objetos - distinguir as ações principais das ações secundárias Como as operações de parsing são extremamente rápidas, os pesquisadores optaram por utilizar métodos indiretos para a obtenção de dados. O principal deles é a análise das inferências produzidas pelos leitores para solucionar ambiguidades, que podem facilitar, em um trabalho empírico e indireto, a análise das operações realizadas durante a leitura. ESTRATÉGIAS PARA CONTROLAR AMBIGUIDADES O policial informou ao motorista... Em contato com a primeira parte da frase, todos os leitores construiriam o mesmo diagrama de árvore, definindo “o policial” como sujeito e “o motorista” como objeto. O policial informou ao motorista... que ele tinha percebido... Acrescentando o segundo trecho à frase, existiriam, então, duas leituras possíveis – a que identifica “ele” como um pronome relativo ao policial e a que define o pronome como relativo ao motorista. Como é feita a leitura de trechos ambíguos? Há três caminhos possíveis para solucionar ambiguidades: 1. O leitor reconhece apenas um sentido, ignorando o outro. 2. O leitor constrói e armazena todos os sentidos possíveis. 3. O leitor realiza uma análise parcial, atrasando a tomada de decisão até que ela se torne viável. 1. Processamento serial (Frazier e outros) Garden path model (modelo da trilha do jardim) O leitor opta por um caminho e, quando este se torna incompatível com o trecho seguinte, retorna e opta pelo outro. Serial analysis without annotation (análise serial sem anotações) O leitor ignora a ambiguidade e, portanto, não realiza nenhuma escolha. Annotated serial analysis (análise serial “anotada”) O leitor percebe a ambiguidade, opta por um caminho e registra a outra opção para uma eventual reanálise eficiente. Propabilistic choice (escolha probabilística) O leitor analisa aspectos da frase e, diante da ambiguidade, opta pelo caminho mais provável. 2. Processamento paralelo (Gazdar, Mellish e outros.) Quando o leitor chega a um ponto de escolha, todas as interpretações possíveis são reconhecidas simultaneamente. Resource-Free Parallel Models (modelos paralelos de recurso livre) Não há perdas associadas à construção simultânea. Resource-Limited Parallel Models (mod. paralelos de recurso limitado) Há uma dificuldade associada. Unbiased Parallel Models (modelos paralelos imparciais) As análises são tratadas igualmente. Weighted Parallel Models (modelos paralelos ponderados) Uma análise é favorecida. 3. Minimal Commitment Models (modelos do compromisso mínimo) Frazier, Rayner e Weinberg ou Wait-and-See Model (modelo espere-e-veja) Just e Carpenter ou Delay Model (modelo de atraso) Smith, Meier e Foss Nesses modelos, quando a sentença se abre para diferentes interpretações, certos aspectos do processamento são temporariamente suspensos até que surja a informação capaz de solucionar a ambiguidade. Não há acordo entre os autores sobre quais aspectos da análise sintática são suspensos. 4. Hybrid Models (modelos híbridos) Just e Carpenter Os leitores aplicam diferentes estratégias em diferentes circunstâncias. Por exemplo: utilizam o processamento paralelo se têm recursos para isso e o processamento seriado quando se encontram sobrecarregados. Sobre os modelos: Semelhança: todos fazem proposições sobre processos extremamente curtos, ou seja, todos se referem a decisões e táticas cuja influência está restrita a poucas palavras ou frases. Diferenças: proposições sobre o processamento de partes ambíguas das sentenças e sobre o processamento nos pontos em que as ambiguidades são resolvidas. 1. Processamento em região ambígua Resource-Limited Parallel Models O processamento é mais lento pela necessidade de desenvolver e manter múltiplas representações. Resource-Free Parallel Models Não existe diferença entre o processamento de material ambíguo e não ambíguo. O leitor seleciona sua leitura preferida e apenas a abandona se o resultado dessa escolha for inconsistente. Minimal Commitment Models O processamento fica mais fácil em regiões de ambiguidade pois a análise completa é suspensa e isso reduz a complexidade das operações. 2. Carga de processamento em regiões ambíguas: a evidência A maioria dos estudos revela que o processamento de materiais ambíguos não é mais difícil (ou menos difícil) do que o de material não ambíguo. Essa equivalência no tempo de processamento é demonstrada em estudos de rastreamento de olhos (eye-tracking studies) e em tarefas de leitura autocontrolada (self-paced reading tasks). No entanto, um número pequeno de experimentos tem alcançado resultados nos quais aparecem efeitos da ambiguidade. Em cada caso, entretanto, existem ou efeitos questionáveis ou fenômenos não relacionados a ambiguidade. 3. Processamento no início da região para resolver as ambiguidades Os modelos também fazem predições sobre a carga de processamento associada com o material existente imediatamente depois da região com ambigüidade. Numa frase coerente, o material tem que resolver a ambiguidade por uma das três possibilidades de análises permitidas. Os modelos ou podem favorecer um opção, ou outra, ou podem optar por ter ou não ter as duas alternativas que deve impor mais de uma carga de processamento para comparar o material apresentado em um contexto ambíguo. . O policial informou ao motorista que ele o tinha multado para evitar ultrapassar o ônibus escolar Nas versões marcadas (tagged) e não marcadas (untagged) do modelo seriado, apenas uma análise estrutural é realizada no primeiro passe através da região com ambiguidade. Se a parte seguinte é compatível com a leitura , todos as aspectos da análise devem ser realizados facilmente na região seguinte Se o pressuposto é que é ignorada qualquer possibilidade de realização de análises alternativas, assim, os cálculos devem ser idênticos daqueles realizados nos contextos em que não existem ambigüidades. De forma contrária a esse processamento sem problemas em determinados tipos de estruturas, o modelo prediz que deve haver dificuldades no processamento quando a continuação da frase não é compatível com a análise preferida. Nesse caso, a interpretação estrutural realizada deve ser abandonada e substituída por uma nova configuração que se estende tanto para a região ambígua quanto para a seguinte. Reanálises deste tipo devem levar tempo e esforço, aumentando a carga de processamento no início da região para resolver a ambiguidade. . . Na versão não probabilística do modelo seriado, os leitores e ouvintes selecionam de forma uniforme a mesma interpretação quando encontram o mesmo tipo de ambiguidade. A carga de processamento será maior na alternativa de continuação não preferida que na preferida enquanto que a continuação preferida será processada exatamente da mesma forma. Na versão probabilística do modelo seriado, a situação é um pouco mais complexa. As leituras são eleitas com igual probabilidade, mas o efeito das reanálises será dependente da dificuldade relativa de substituir uma estrutura por outra. Se a carga de processamento para substituir ambas estruturas é similar, não haverá diferenças no processamento, mas... ...como é uma soma de tentativas, deve haver uma carga de processamento maior do que em uma situação controlada não ambígua. Em caso de existir uma probabilidade elevada de realizar uma leitura, nos casos de se voltar a fazer as mesmas análises, a carga de processamento será menor que nos casos com probabilidade de ocorrência menor. . . No caso dos modelos paralelos, é difícil ver como versões completas (Unbiased Parallel Models) podem predizer qualquer efeito diferencial na região para resolver a ambiguidade: Nas versões do modelo livre de recursos (Resource free) estruturas potenciais são montadas sem interferência mútua. Qualquer das alternativas pode servir de marco para uma possível continuação. As análises que não são compatíveis serão eliminadas e pode-se pensar que esse processo supõe alguma sobrecarga. Contudo, como não existe uma razão óbvia de porque a carga deve variar em função do tipo de estrutura que está sendo apagada, esta versão do modelo pode não predizer os efeitos de qualquer situação diferencial. Da mesma forma, nas versões do modelo com recursos limitados , também aumenta a carga de processamento na região para resolver a ambiguidade. Mas, como antes, estas influências não devem ser associadas seletivamente com uma continuação em lugar de outra. Em outros casos, os efeitos diferenciais podem acontecer nas variantes de modelos paralelos livres ou limitadas de recursos. Por exemplo, se há uma leitura com um comprometimento maior que outra (representado pelo maior nível de ativação da rede neuronal), isso pode representar um maior esforço para o processamento, para ir de uma interpretação favorecida a uma competidora oposta. Isso pode refletir no maior tempo de latência na região para resolver a ambiguidade. No caso dos modelos de compromisso mínimo (Minimal Commitment Models), no primeiro passe por uma parte da frase as decisões são deixadas para depois e qualquer predição sobre variações são processadas DEPOIS desta região. Em alguns destes modelos (PERFETII, 1990; KENNEDY et al., 1989, SMITH et al., 1991), o que acontece é que parte das operações de processamento sintático são suspensas temporariamente. Em outros casos, as operações NÃO são suspensas. O que acontece é que os produtos das operações não constituem o que em outros modelos pode ser considerado uma análise sintática completa. a) Para modelos em que a análise sintática é suspensa parcialmente sobre a região de ambiguidade, todas as predições sobre carga de processamento no final da região dependem das formas de análise que permanecem trabalhando e são capazes de detectar que a região ambígua terminou. Se não fosse assim, nada seria capaz de reativar as operações que foram suspensas temporariamente. Se a informação para resolver a ambiguidade pode ser identificada, ela pode ser utilizada para resolvê-la e ativar a reinstalação para atualizar o processamento. Podemos supor que este processo de retomada aumente o tempo de processamento nessa região. Podemos supor que, quanto mais complexa a operação de atualização, o tempo gasto será maior. b) Nos modelos de compromisso mínimo que não estã baseados na suspensão das operações, porém com outros marcos em relação às estruturas incompletas, as predições dependem de se as estruturas conseguem ser compatíveis com o material na zona para resolver a ambiguidade. Se é assim e a análise sintática da frase pode ser realizada acrescentando umas poucas estruturas, o modelo pode predizer que não deve haver uma carga de processamento nesse ponto. Esse é o tipo de predição feita na frase: Mary aguardou Fred para sair Por outro lado, se a informação para resolver a ambiguidade é incompatível com uma análise inicial, e o analisador sintático é forçado a withdraw algumas das estruturas. O modelo pode predizer que haverá um efeito Boogle na região para resolver a ambiguidade. De fato, para muitas frases ambiguas, as predições são feitas da mesma forma que nos modelos seriados vistos anteriormente. Em resumo. Na análise, os modelos de compromisso mínimo predizem um aumento de processamento na região para resolver a ambiguidade. 4- A evidencia de carga de processamento na região para resolver a ambiguidade. Muitos estudos mostram que imediatamente depois da região ambigua o processamento é maior que no mesmo material sem a ambiguidade. Isto tem sido comprovado com muitos tipos de ambiguidades. After the young Londoner had visited (,) his parents prepared to celebrate their anniversary. -The defendant examined by the lawyer turned out to be unreliable. -The defendant that was examined by the lawyer turned out to be unreliable. Também no caso da relativa (turned out) -The defendant examined by the lawyer turned out to be unreliable. -The defendant that was examined by the lawyer turned out to be unreliable. Fortes efeitos de solução da ambiguidade ocorrem quando essa frase relativa está junto com um cabeçalho errado (ou nodo não marcado de frase e também no caso dessas frases com “that” Há evidencias de que uma penalização existe quando o complemento “that” fica excluido de frases como: O historiador leu (que) o manuscrito de seu livro tinha sido perdido. Essas descobertas, em conjunto, proporcionaram fortes evidencias de que muitos modelos predizem um aumento de processamento na região para resolver a ambiguidade. -No caso dos modelos seriados não probabilísticos não deve haver custo associado com a continuação preferida, de forma contrária à não preferida. São necessários mais estudos nesse sentido. Todos esse dados trazem argumentos contrários às versões completas (unbiased) de modelos paralelos, mas são geralmente compatíveis com os modelos parciais (biased). Todos esses dados trazem argumentos contrários às versões completas (unbiased) de modelos paralelos, mas são geralmente compatíveis com os modelos parciais (biased). O grosso das evidencias é compatível com as versões não condicionais e não probabilísticas do modelo de trilha do jardim; a única exceção é a sugestão de que pode haver custos associados para manipular a continuação, tanto como interpretação preferida, quanto a não preferida do material ambiguo. Resultados desse tipo são difíceis de explicar se a eleição preferida é feita de forma incondicional e o material que segue seja tratado como se fosse ambíguo. Outros estudos são necessários. Como visto acima, a fase probabilistica do modelo de trilha do jardim pode trabalhar com diversos padrões de carga de processamento realizando diversas predições sobre a probabilidade com que o analisador sintático seleciona cada uma das interpretações possíveis. Isto é mais flexível que a forma tradicional do modelo em que os valores de probabilidade são de 1 para a forma preferida e de 0 para a forma não preferida. -No caso do modelo de compromisso mínimo, nas versões em que o processo do analisador sintático é suspenso, o padrão de dados mais obvio é aquele em que há custos de processamento associados com qualquer das continuações potenciais, devido ao fato de que um processamento total é retomado depois da suspensão temporária. Há problemas para especificar quais tipos de atividades são suspensas em um tipo de ambiguidade ou outro. ´\e mais lógico pensar que o analisador sintático continua com toda a estrutura que é compatível com todas as possibilidades de leitura da ambiguidade porém esta proposta falha para quantificar os dados. -Com frequencia são feitas checagens de baixo nível que proporcionam a base para resolver a ambiguidade da frase. Se essas operações não são realizadas quando a informação importante aparece, então não haverá forma possível para reconhecer a informação para resolver a ambiguidade e fazer uma atualização. Podemos resumir que as medidas de carga de processamento reunem evidencias em contra dos modelos seriados marcados (tagged) e todo tipo de modelos limitados de recursos, enquanto que os padrões de dados na região para resolver a ambiguidade são incompatíveis com os modelos paralelos completos (unbiased). Os poucos dados disponíveis não são consistentes com as formulações existentes sobre o modelo de compromisso mínimo. Todos os resultados experimentais, até agora, parecem ser compatíveis com o modelo paralelo em suas versões parcial (biased) e livre de recursos e com muitas versões marcadas do modelo seriado. 5. Exposure-Based Strategies Estratégias baseadas em exposição A escolha dos leitores nos casos de ambiguidades podem ser determinadas por experiências com essas formas. Porém, após análise de corpus, nota-se que escolhas de interpretação baseadas em estatísticas de frequência não influenciam o parsing inicial. Na análise preliminar de um corpus on-line, notou-se que, em inglês, os complementos, em sua maioria, apresentam núcleos nominais (attachment NP). Em espanhol, parece se observar o contrário. Tal hipótese foi testada em um grupo de crianças de sete anos, que tiveram contato com várias histórias por duas semanas e, após haveriam de escrever sobre tais histórias. O grupo de crianças foi dividido em dois a fim de oferecer estímulos diferentes ( altos ou baixos níveis de possibilidades, de acordo com a frequência de utilização na língua) Resultado do experimento Muitas divergências de acordo com as palavras utilizadas: Send the soldiers into (complemento com núcleo verbal – NP) Give the soldiers with (complemento com núcleo nominal – NP – ou preposicionado – PP) Conclui: However, the increasing availability of corpus analyses could well rectify this deficity over the next few years. (MITCHEL, p. 399) Contudo, o incremento do corpus analisado pode retificar o déficit encontrado nos próximos anos. IV. Assembly and Checking Processes •O texto trata do estudo de mecanismo usados para se selecionar estruturas (parsing); •Sugere estudos adicionais que verifiquem saídas ou performances de processamentos; •O texto trata de um pequeno consenso sobre como processamentos operam. •Poucos conhecimentos sobre estruturas finais de sentenças restringem as pesquisas; •Escolha de sentenças podem induzir o leitor; Ex.: Christina asked Julie to tidy herself up. Herself refere-se a Julie ou outra mulher qualquer. Questões relevantes: •Como checar processos/operações de leitura em atraso (caso das ambiguidades)? •Existe uma ordem compatível com a checagem de processamento que deve ser seguida? Avaliação final: •Estimular a ambiguidade pode mascarar as variáveis relevantes na pesquisa; •A ênfase no inglês pode ser o maior problema tendo em vista que as pesquisas buscam respostas sobre processamento da linguagem e não da língua inglesa, apenas; •O cruzamento de pesquisas podem servir com um novo experimento; •Questões relacionadas a tempo de processamento e medição, bem como a divisão dos textos em partes, podem tornar difíceis as análises das ambiguidades e dos tempos necessários para desfazêlas.