SENTENCE PARSING
Don Mitchell
INTRODUÇÃO
Para interpretar uma sentença é preciso:
- identificar cada palavra, estocando informações para os
próximos processos;
- considerar informações contextuais, pontuação e entonação;
- determinar, a partir das informações geradas nas etapas
anteriores, quais ações são descritas ou quais assertivas são
expressas (instruções, informações), quais características
identificam pessoas e objetos e como essas pessoas e objetos se
relacionam (determinar conexões e tarefas).
Para os psicolinguistas que trabalham na área, o principal
problema no processamento de sentenças é determinar como as
pessoas convertem uma série de palavras em uma estrutura como
o tree diagram (diagrama de árvore), ou seja, em uma estrutura
capaz de produzir sentido a partir das corretas relações entre as
palavras.
O tree diagram é utilizado para:
- representar a estrutura das frases
- destacar as relações estabelecidas entre os seus objetos
- definir as funções de cada um desses objetos
- distinguir as ações principais das ações secundárias
Como as operações de parsing são extremamente rápidas, os
pesquisadores optaram por utilizar métodos indiretos para a
obtenção de dados. O principal deles é a análise das inferências
produzidas pelos leitores para solucionar ambiguidades, que
podem facilitar, em um trabalho empírico e indireto, a análise das
operações realizadas durante a leitura.
ESTRATÉGIAS PARA CONTROLAR
AMBIGUIDADES
O policial informou ao motorista...
Em contato com a primeira parte da frase, todos os leitores
construiriam o mesmo diagrama de árvore, definindo “o policial”
como sujeito e “o motorista” como objeto.
O policial informou ao motorista... que ele tinha percebido...
Acrescentando o segundo trecho à frase, existiriam, então, duas leituras
possíveis – a que identifica “ele” como um pronome relativo ao policial
e a que define o pronome como relativo ao motorista.
Como é feita a leitura de trechos ambíguos?
Há três caminhos possíveis para solucionar ambiguidades:
1. O leitor reconhece apenas um sentido, ignorando o outro.
2. O leitor constrói e armazena todos os sentidos possíveis.
3. O leitor realiza uma análise parcial, atrasando a tomada de
decisão até que ela se torne viável.
1. Processamento serial (Frazier e outros)
Garden path model (modelo da trilha do jardim)
O leitor opta por um caminho e, quando este se torna incompatível
com o trecho seguinte, retorna e opta pelo outro.
Serial analysis without annotation (análise serial sem anotações)
O leitor ignora a ambiguidade e, portanto, não realiza nenhuma
escolha.
Annotated serial analysis (análise serial “anotada”)
O leitor percebe a ambiguidade, opta por um caminho e registra a outra
opção para uma eventual reanálise eficiente.
Propabilistic choice (escolha probabilística)
O leitor analisa aspectos da frase e, diante da ambiguidade, opta pelo
caminho mais provável.
2. Processamento paralelo (Gazdar, Mellish e outros.)
Quando o leitor chega a um ponto de escolha, todas as interpretações
possíveis são reconhecidas simultaneamente.
Resource-Free Parallel Models (modelos paralelos de recurso livre)
Não há perdas associadas à construção simultânea.
Resource-Limited Parallel Models (mod. paralelos de recurso limitado)
Há uma dificuldade associada.
Unbiased Parallel Models (modelos paralelos imparciais)
As análises são tratadas igualmente.
Weighted Parallel Models (modelos paralelos ponderados)
Uma análise é favorecida.
3. Minimal Commitment Models
(modelos do compromisso mínimo)
Frazier, Rayner e Weinberg
ou Wait-and-See Model (modelo espere-e-veja)
Just e Carpenter
ou Delay Model (modelo de atraso)
Smith, Meier e Foss
Nesses modelos, quando a sentença se abre para diferentes
interpretações, certos aspectos do processamento são
temporariamente suspensos até que surja a informação capaz de
solucionar a ambiguidade. Não há acordo entre os autores sobre
quais aspectos da análise sintática são suspensos.
4. Hybrid Models (modelos híbridos)
Just e Carpenter
Os leitores aplicam diferentes estratégias em diferentes
circunstâncias. Por exemplo: utilizam o processamento paralelo se
têm recursos para isso e o processamento seriado quando se
encontram sobrecarregados.
Sobre os modelos:
Semelhança: todos fazem proposições sobre processos
extremamente curtos, ou seja, todos se referem a decisões e
táticas cuja influência está restrita a poucas palavras ou frases.
Diferenças: proposições sobre o processamento de partes
ambíguas das sentenças e sobre o processamento nos pontos em
que as ambiguidades são resolvidas.
1. Processamento em região ambígua
Resource-Limited Parallel Models
O processamento é mais lento pela necessidade de desenvolver e
manter múltiplas representações.
Resource-Free Parallel Models
Não existe diferença entre o processamento de material ambíguo
e não ambíguo. O leitor seleciona sua leitura preferida e apenas a
abandona se o resultado dessa escolha for inconsistente.
Minimal Commitment Models
O processamento fica mais fácil em regiões de ambiguidade pois
a análise completa é suspensa e isso reduz a complexidade das
operações.
2. Carga de processamento em regiões ambíguas: a
evidência
A maioria dos estudos revela que o processamento de materiais
ambíguos não é mais difícil (ou menos difícil) do que o de
material não ambíguo. Essa equivalência no tempo de
processamento é demonstrada em estudos de rastreamento de
olhos (eye-tracking studies) e em tarefas de leitura autocontrolada (self-paced reading tasks).
No entanto, um número pequeno de experimentos tem alcançado
resultados nos quais aparecem efeitos da ambiguidade. Em cada
caso, entretanto, existem ou efeitos questionáveis ou fenômenos
não relacionados a ambiguidade.
3. Processamento no início da região para resolver as
ambiguidades
Os modelos também fazem predições sobre a carga de
processamento associada com o material existente
imediatamente depois da região com ambigüidade. Numa
frase coerente, o material tem que resolver a ambiguidade por
uma das três possibilidades de análises permitidas. Os
modelos ou podem favorecer um opção, ou outra, ou podem
optar por ter ou não ter as duas alternativas que deve impor
mais de uma carga de processamento para comparar o
material apresentado em um contexto ambíguo.
.
O policial informou ao motorista que ele o tinha
multado para evitar ultrapassar o ônibus escolar
Nas versões marcadas (tagged) e não marcadas (untagged) do
modelo seriado, apenas uma análise estrutural é realizada no
primeiro passe através da região com ambiguidade. Se a parte
seguinte é compatível com a leitura , todos as aspectos da
análise devem ser realizados facilmente na região seguinte Se
o pressuposto é que é ignorada qualquer possibilidade de
realização de análises alternativas, assim, os cálculos devem
ser idênticos daqueles realizados nos contextos em que não
existem ambigüidades.
De forma contrária a esse processamento sem problemas em
determinados tipos de estruturas, o modelo prediz que deve
haver dificuldades no processamento quando a continuação
da frase não é compatível com a análise preferida. Nesse
caso, a interpretação estrutural realizada deve ser abandonada
e substituída por uma nova configuração que se estende
tanto para a região ambígua quanto para a seguinte.
Reanálises deste tipo devem levar tempo e esforço,
aumentando a carga de processamento no início da região
para resolver a ambiguidade.
.
.
Na versão não probabilística do modelo seriado, os
leitores e ouvintes selecionam de forma uniforme a mesma
interpretação quando encontram o mesmo tipo de
ambiguidade. A carga de processamento será maior na
alternativa de continuação não preferida que na preferida
enquanto que a continuação preferida será processada
exatamente da mesma forma.
Na versão probabilística do modelo seriado, a situação é
um pouco mais complexa. As leituras são eleitas com igual
probabilidade, mas o efeito das reanálises será dependente da
dificuldade relativa de substituir uma estrutura por outra. Se a
carga de processamento para substituir ambas estruturas é
similar, não haverá diferenças no processamento, mas...
...como é uma soma de tentativas, deve haver uma carga de
processamento maior do que em uma situação controlada
não ambígua.
Em caso de existir uma probabilidade elevada de realizar uma
leitura, nos casos de se voltar a fazer as mesmas análises, a
carga de processamento será menor que nos casos com
probabilidade de ocorrência menor.
.
.
No caso dos modelos paralelos, é difícil ver como versões
completas (Unbiased Parallel Models) podem predizer
qualquer efeito diferencial na região para resolver a
ambiguidade:
Nas versões do modelo livre de recursos (Resource free)
estruturas potenciais são montadas sem interferência mútua.
Qualquer das alternativas pode servir de marco para uma
possível continuação. As análises que não são compatíveis
serão eliminadas e pode-se pensar que esse processo supõe
alguma sobrecarga. Contudo, como não existe uma razão
óbvia de porque a carga deve variar em função do tipo de
estrutura que está sendo apagada, esta versão do modelo
pode não predizer os efeitos de qualquer situação diferencial.
Da mesma forma, nas versões do modelo com recursos
limitados , também aumenta a carga de processamento na
região para resolver a ambiguidade. Mas, como antes, estas
influências não devem ser associadas seletivamente com uma
continuação em lugar de outra. Em outros casos, os efeitos
diferenciais podem acontecer nas variantes de modelos
paralelos livres ou limitadas de recursos.
Por exemplo, se há uma leitura com um comprometimento
maior que outra (representado pelo maior nível de ativação da
rede neuronal), isso pode representar um maior esforço para o
processamento, para ir de uma interpretação favorecida a uma
competidora oposta. Isso pode refletir no maior tempo de
latência na região para resolver a ambiguidade.
No caso dos modelos de compromisso mínimo (Minimal
Commitment Models), no primeiro passe por uma parte da
frase as decisões são deixadas para depois e qualquer
predição sobre variações são processadas DEPOIS desta
região.
Em alguns destes modelos (PERFETII, 1990; KENNEDY
et al., 1989, SMITH et al., 1991), o que acontece é que parte
das operações de processamento sintático são suspensas
temporariamente. Em outros casos, as operações NÃO são
suspensas. O que acontece é que os produtos das operações
não constituem o que em outros modelos pode ser
considerado uma análise sintática completa.
a) Para modelos em que a análise sintática é suspensa
parcialmente sobre a região de ambiguidade, todas as
predições sobre carga de processamento no final da região
dependem das formas de análise que permanecem
trabalhando e são capazes de detectar que a região ambígua
terminou. Se não fosse assim, nada seria capaz de reativar as
operações que foram suspensas temporariamente.
Se a informação para resolver a ambiguidade pode ser
identificada, ela pode ser utilizada para resolvê-la e ativar a
reinstalação para atualizar o processamento. Podemos supor
que este processo de retomada aumente o tempo de
processamento nessa região.
Podemos supor que, quanto mais complexa a operação de
atualização, o tempo gasto será maior.
b) Nos modelos de compromisso mínimo que não estã
baseados na suspensão das operações, porém com outros
marcos em relação às estruturas incompletas, as predições
dependem de se as estruturas conseguem ser compatíveis
com o material na zona para resolver a ambiguidade. Se é
assim e a análise sintática da frase pode ser realizada
acrescentando umas poucas estruturas, o modelo pode
predizer que não deve haver uma carga de processamento
nesse ponto. Esse é o tipo de predição feita na frase:
Mary aguardou Fred para sair
Por outro lado, se a informação para resolver a ambiguidade
é incompatível com uma análise inicial, e o analisador
sintático é forçado a withdraw algumas das estruturas.
O modelo pode predizer que haverá um efeito Boogle na
região para resolver a ambiguidade. De fato, para muitas
frases ambiguas, as predições são feitas da mesma forma que
nos modelos seriados vistos anteriormente.
Em resumo. Na análise, os modelos de compromisso
mínimo predizem um aumento de processamento na região
para resolver a ambiguidade.
4- A evidencia de carga de processamento na região
para resolver a ambiguidade.
Muitos estudos mostram que imediatamente depois da região
ambigua o processamento é maior que no mesmo material
sem a ambiguidade. Isto tem sido comprovado com muitos
tipos de ambiguidades.
After the young Londoner had visited (,) his parents prepared to
celebrate their anniversary.
-The defendant examined by the lawyer turned out to be
unreliable.
-The defendant that was examined by the lawyer turned out
to be unreliable.
Também no caso da relativa (turned out)
-The defendant examined by the lawyer turned out to be unreliable.
-The defendant that was examined by the lawyer turned out to be
unreliable.
Fortes efeitos de solução da ambiguidade ocorrem quando
essa frase relativa está junto com um cabeçalho errado (ou
nodo não marcado de frase e também no caso dessas frases
com “that”
Há evidencias de que uma penalização existe quando o
complemento “that” fica excluido de frases como:
O historiador leu (que) o manuscrito de seu livro tinha sido perdido.
Essas descobertas, em conjunto, proporcionaram fortes
evidencias de que muitos modelos predizem um aumento de
processamento na região para resolver a ambiguidade.
-No caso dos modelos seriados não probabilísticos não deve
haver custo associado com a continuação preferida, de forma
contrária à não preferida. São necessários mais estudos nesse
sentido.
Todos esse dados trazem argumentos contrários às versões
completas (unbiased) de modelos paralelos, mas são
geralmente compatíveis com os modelos parciais (biased).
Todos esses dados trazem argumentos contrários às versões
completas (unbiased) de modelos paralelos, mas são
geralmente compatíveis com os modelos parciais (biased).
O grosso das evidencias é compatível com as versões não
condicionais e não probabilísticas do modelo de trilha do
jardim; a única exceção é a sugestão de que pode haver
custos associados para manipular a continuação, tanto como
interpretação preferida, quanto a não preferida do material
ambiguo.
Resultados desse tipo são difíceis de explicar se a eleição
preferida é feita de forma incondicional e o material que
segue seja tratado como se fosse ambíguo. Outros estudos
são necessários.
Como visto acima, a fase probabilistica do modelo de trilha
do jardim pode trabalhar com diversos padrões de carga de
processamento realizando diversas predições sobre a
probabilidade com que o analisador sintático seleciona cada
uma das interpretações possíveis.
Isto é mais flexível que a forma tradicional do modelo em
que os valores de probabilidade são de 1 para a forma
preferida e de 0 para a forma não preferida.
-No caso do modelo de compromisso mínimo, nas versões
em que o processo do analisador sintático é suspenso, o
padrão de dados mais obvio é aquele em que há custos de
processamento associados com qualquer das continuações
potenciais, devido ao fato de que um processamento total é
retomado depois da suspensão temporária.
Há problemas para especificar quais tipos de atividades são
suspensas em um tipo de ambiguidade ou outro. ´\e mais
lógico pensar que o analisador sintático continua com toda a
estrutura que é compatível com todas as possibilidades de
leitura da ambiguidade porém esta proposta falha para
quantificar os dados.
-Com frequencia são feitas checagens de baixo nível que
proporcionam a base para resolver a ambiguidade da frase. Se
essas operações não são realizadas quando a informação
importante aparece, então não haverá forma possível para
reconhecer a informação para resolver a ambiguidade e fazer
uma atualização.
Podemos resumir que as medidas de carga de processamento
reunem evidencias em contra dos modelos seriados
marcados (tagged) e todo tipo de modelos limitados de
recursos, enquanto que os padrões de dados na região para
resolver a ambiguidade são incompatíveis com os modelos
paralelos completos (unbiased).
Os poucos dados disponíveis não são consistentes com as
formulações existentes sobre o modelo de compromisso
mínimo.
Todos os resultados experimentais, até agora, parecem ser
compatíveis com o modelo paralelo em suas versões parcial
(biased) e livre de recursos e com muitas versões marcadas
do modelo seriado.
5. Exposure-Based Strategies
Estratégias baseadas em exposição
A escolha dos leitores nos casos de ambiguidades podem ser
determinadas por experiências com essas formas.
Porém, após análise de corpus, nota-se que escolhas de
interpretação baseadas em estatísticas de frequência não
influenciam o parsing inicial.
Na análise preliminar de um corpus on-line, notou-se que,
em inglês, os complementos, em sua maioria, apresentam
núcleos nominais (attachment NP). Em espanhol, parece se
observar o contrário.
Tal hipótese foi testada em um grupo de crianças de sete
anos, que tiveram contato com várias histórias por duas
semanas e, após haveriam de escrever sobre tais histórias. O
grupo de crianças foi dividido em dois a fim de oferecer
estímulos diferentes ( altos ou baixos níveis de possibilidades,
de acordo com a frequência de utilização na língua)
Resultado do experimento
Muitas divergências de acordo com as palavras utilizadas:
Send the soldiers into (complemento com núcleo verbal – NP)
Give the soldiers with (complemento com núcleo nominal – NP
– ou preposicionado – PP)
Conclui:
However, the increasing availability of corpus analyses could
well rectify this deficity over the next few years. (MITCHEL,
p. 399)
Contudo, o incremento do corpus analisado pode retificar o
déficit encontrado nos próximos anos.
IV. Assembly and Checking Processes
•O texto trata do estudo de mecanismo usados para
se selecionar estruturas (parsing);
•Sugere estudos adicionais que verifiquem saídas ou
performances de processamentos;
•O texto trata de um pequeno consenso sobre como
processamentos operam.
•Poucos conhecimentos sobre estruturas finais de
sentenças restringem as pesquisas;
•Escolha de sentenças podem induzir o leitor;
Ex.: Christina asked Julie to tidy herself up.
Herself refere-se a Julie ou outra mulher qualquer.
Questões relevantes:
•Como checar processos/operações de leitura em
atraso (caso das ambiguidades)?
•Existe uma ordem compatível com a checagem de
processamento que deve ser seguida?
Avaliação final:
•Estimular a ambiguidade pode mascarar as variáveis relevantes na
pesquisa;
•A ênfase no inglês pode ser o maior problema tendo em vista que
as pesquisas buscam respostas sobre processamento da linguagem e
não da língua inglesa, apenas;
•O cruzamento de pesquisas podem servir com um novo
experimento;
•Questões relacionadas a tempo de processamento e medição, bem
como a divisão dos textos em partes, podem tornar difíceis as
análises das ambiguidades e dos tempos necessários para desfazêlas.
Download

SENTENCE PARSING - cursocarla-2011-1