Teorias e Métodos em
Processamento de Frases
Abralin
Marcus Maia & Eva
Fernández
Fevereiro de 2005
Ementa
Introdução à subárea da Psicolingüística conhecida
como Processamento de Frases. A natureza da
relação entre a sintaxe e a percepção; gramática e
parser; o papel da sintaxe nos diferentes modelos
de processamento de frases: a teoria da
Complexidade Derivacional, os princípios de
Kimball, a teoria do “garden-path”, o modelo de
construal. A crise do princípio "Late Closure". O
Processamento de Orações Relativas. A Hipótese da
Prosódia Implícita. A representação da linguagem
nos bilíngües.
A arquitetura dos sistemas de
percepção e produção. Métodos experimentais.
As Ciências Cognitivas
Ciências Cognitivas
Psicolingüística
Processamento lingüístico
Processamento de frases
As Ciências Cognitivas
Diagnóstico de Gardner (Gardner, Howard
(1984).The Mind’s New Science)
1.
2.
3.
4.
Nível de análise de Representações Mentais
A metáfora do computador eletrônico
Processos mentais estritamente cognitivos
A agenda de tópicos relevantes remonta à
tradicão filosófica da Antiguidade
5. A interdisciplinariedade
A interdisciplinaridade nas Ciências Cognitivas
(Gardner, 1987)
O Problema de Platão
As questões fundamentais da Lingüística Moderna
“Como podemos saber tanto se temos
tão poucas evidências?”
(Chomsky, 1986)
- O que é o conhecimento lingüístico?
- Como o conhecimento lingüístico é
utilizado?
- Como o conhecimento lingüístico é
adquirido?
(Chomsky, 1995)
A Faculdade da Linguagem
(…) there is a component of the human
mind/brain, dedicated to language – the
language faculty – interacting with other
systems. (…) the language faculty has at
least two components: a cognitive system
that stores information, and performance
systems that access that information and
use it in various ways.
(Chomsky, 1995, p.2)
Chomsky (1995) x Chomsky (1998)
“Performance systems are presumably
at least in part language-specific,
hence components of the language
faculty. But they are generally
assumed not to be specific to
particular languages: they do not
vary in the manner of the cognitive
system, as linguistic environments
vary”. (Chomsky, 1995, p. 2)
Chomsky (1998)
“Processing
systems
vary
with
languages and languages types,
even for very young infants,
enabling them to sort out distinct
languages in the data to which they
are exposed. (…)”
(Chomsky, 1998, p. 3)
Competência & Desempenho
Competência e Desempenho
/
\
Gramática
Parser
Saber
Fazer
Gramaticalidade x Aceitabilidade
* a processar atriz a produtor decidiu contratou que novo o a
emissora
demitiu que o
? A atriz que o novo diretor que o produtor contratou demitiu decidiu processar a
emissora.
Slips of the tongue
a. Antecipações: bake my bike por take my byke
b. Perseveração: painted the poor por painted the door/ tentou a torte por tentou
a sorte
c. Reversão: Katz e Fodor por Fatz e Kodor /
bortou o colo por cortou o bolo
d. Blending: grave erro por grerro
Representação & Acesso









Teoria x Prática
A teoria ficaria incompleta sem a caracterização do nível de processamento
O uso permite explicitar questões, problematizar e desenvolver e reformular
a teoria
Uma teoria do uso embasa qualquer aplicação da teoria do conhecimento
lingüístico a problemas práticos, como eficiência de leitura, ensino de
línguas, lingüística computacional, parsers, tradução automática, etc.
Níveis diferenciados de representação
Realidade epistemológica: Afirmação mais modesta, inclui o o quê da
competência lingüística, mas não o como dos processos mentais.
Realidade Psicológica: Afirmação mais forte, inclui o o quê da
competência e o como dos processos mentais.
Realidade neurológica: Afirmação ainda mais forte, pois deve incluir o o
quê da competência, o como dos processos mentais, além do mapeamento
cerebral desses processos.
Realidade computacional: Afirmacão mais fraca, diz respeito
exclusivamente aos processos inerentes às ferramentas de sistemas
computacionais em Inteligência Artificial.
Isonomia
BIO:
Tempo:
Ling:
Anatomia
ø
Fisiologia
Organogênese
ms
meses/anos
Gramática Processamento
Aquisição
Dillinger, M., 1992
?
séculos
Evolução
Milênios
Mud. hist. Evolução
Autonomia
Diga as cores, rapidamente:
Verde
Azul
Amarelo
Preto
Violeta
Grená
A Modularidade da Mente
Processos Modulares
Processos cognitivos gerais
automático
não-automático
rápido/reflexo
lento/reflexão
específico
geral
obrigatório
opcional
impenetrável (encapsulado) acessível à reflexão consciente
regulares/sistemáticos
idiossincráticos
Fodor, J.(1983). The Modularity of Mind)
Processamento da Informação
Um navio japonês entrava na baía um navio brasileiro.
Mãe suspeita de assassinato do filho morre.
Alguém atirou no pai da atriz que estava na varanda com seu marido.
O policial viu o turista com a ferida.
A memória…
Há mais no processamento
do que a gramática.
Processamento = gramática + memória
Relativamente pouca atenção tem sido prestada a uma das
questões fundamentais da Lingüística Moderna, no dizer de
Chomsky: Como o conhecimento lingüístico é utilizado?
Note-se que muitas noções lingüísticas não são
propriedades da língua como tal, mas do uso lingüístico.
Assim é com a noção de produtividade que implica que
os meios para gerar um número ilimitado de frases está
presente, de alguma forma, na mente humana. A estrutura
lingüística não determina o processamento lingüístico. Dada
uma estrutura frasal particular, ainda há um sem número
de maneiras através das quais se pode compreender ou
produzir uma frase com aquela estrutura. Alguns desses
modos podem ser preferíveis em relação a outros por
razões puramente psicológicas: por sobrecarregarem menos
a memória, por exemplo. O que se quer dizer é que o
Processamento Lingüístico é uma tarefa conjunta entre
princípios lingüísticos e mecanismos psicológicos.
O processamento da informação

Os sistemas de processamento de informação, um dos diagnósticos
de Gardner para as Ciências Cognitivas, advêm do desenvolvimento
da Ciência da Computação na década de 50. tendo tido papel
importante na revolução cognitivista, anti-behaviorista dos 50. Da
visão da mente como caixa-preta avançou-se para a visão da mente
como processadora de informações que como o computador é capaz
de decodificar, armazenar, manipular e recuperar informação. Assim,
impulsionados pela metáfora do computador, os pesquisadores
passaram a investigar a capacidade humana de processamento,
levantando questões como:
 - Quanta informação podemos armazenar?
 - Qual a duração da armazenagem?
 - Qual a sua recuperabilidade?

Dos esforços para responder tais questões resultaram numerosas
descobertas a respeito das capacidades de processamento e de memória
humanas.
O sistema de processamento
informacional
Os atos de compreender e produzir a linguagem
são desempenhados dentro dos parâmetros do
nosso sistema de processamento da informação.
Este sistema consiste de 3 componentes estruturais –
memória sensorial
memória de trabalho
memória de longo prazo,
além de um conjunto de processos de controle que
governam o fluxo de informação dentro do sistema.
O armazenamento sensorial
Sperling, G. (1960). The information available in brief
visual presentations.
A
M
1
J
7
Z
3
V
L
K
C
B
Armazenagem sensorial
Experimento 1
Materiais: Quadros de 12 letras e/ou números arranjados em quatro colunas e três
fileiras apresentados por
50 ms (1/20 segundos)
Tarefa: reportagem total
Resultado: nem ½ dos 12 itens era lembrado em média, embora os informatnes
reportassem lembrar-se de mais itens, perdendo-os durante a reportagem
(artefato do experimento).
Experimento 2
Mesmos materiais com tarefa de reportagem parcial, através de tons diferenciados
correspondentes às fileiras.
Resultado: ¾ das fileiras era reportado, indicando que ¾ do conjunto era retido.
Experimento 3
Tons atrasados em 1 segundo provocava declínio no desempenho da reportagem
de 75% para 36% , inferindo-se ser de 1 segundo o tempo de retenção da
informação no sistema de armazenagem visual.
Estudos semelhantes foram desenvolvidos para o sistema de armazenagem
auditiva por Darvwin, Turvin & Crowder (1972), observando-se que, neste
caso a diferença entre a reportagem total e a parcial era de 4 segundos,
indicando que o tempo de persistência auditivo é de 4 segundos.
Memória de Trabalho
Memória de Longo prazo
Característica
Unidade
Capacidade
Recuperação
Duração
M.Trabalho
Bloco
7 ± 2 blocos
Fácil/rápida
30 segundos
M.Longo Prazo
Sem restrições
Sem limite definido
Difícil/vagarosa
Indefinidamente longa
Processamento serial e paralelo
Processamento Serial: algoritmo incrementacional e determinístico
Ondas sonoras  fones  fonemas
morfemas / palavras  sintagmas 
frases  integração discursiva/pragmática
Aplicação de operações mentais sobre cadeias de símbolos, em que
o output de uma operação serve de input para a próxima.
Processamento Paralelo
Um modelo serial divide o processo de
compreensão em estágios: acesso lexical,
parsing, forma fonética, etc. Tais processos
ocorrem
um
de
cada
vez,
sem
debordamento.
Em um modelo de processamento em
paralelo todos esses processos podem
ocorrer simultaneamente. Assim, pode-se
especificar foneticamente um vocábulo ao
mesmo tempo que se acessa outro e se
constrói estrutura sintática.
Modelos conexionistas
Os modelos conexionistas ≠ modelos
computacionais. Inspiram-se nos estudos
sobre os neurônios. Na verdade, cada
neurônio é extremamente vagaroso, só
processando cerca 5 instruções por
segundo.
Como há 1012 neurônios no cérebro e 1015
conexões entre eles, o cérebro é capaz de
processar tarefas complexas, tais como a
compreensão da linguagem
Conexões
O comportamento inteligente resulta dos pesos das conexões
entre os neurônios, em uma função de mapeamento:
Pandemonium
Processamento bottom-up
e top down
O
processamento
bottom-up é
aquele que procede do nível mais
baixo para o nível mais elevado.
Um modelo top-down, por outro
lado, permite que a informação
do nível mais alto influencie o
processamento de níveis mais
baixos.
Efeitos top-down
Métodos
Público
Manipulado
Natural
Privado
Métodos
Público
Manipulado
Natural
Privado
Julgamento
gramaticalidade
Métodos
Público
Manipulado
Natural
Privado
Julgamento
gramaticalidade
Etnográfico
Métodos
Público
Privado
Manipulado
Experimental
Elicitação
Julgamento
gramaticalidade
Natural
Etnográfico
Métodos
Público
Privado
Manipulado
Experimental
Elicitação
Julgamento
gramaticalidade
Natural
Etnográfico
Insight
Métodos experimentais
Leitura auto-monitorada
Decisão lexical
Priming
Julgamento imediato de
aceitabilidade/gramaticalidade
Monitoramento de fonemas
Locação de clicks
Eye-tracking
A Psicolingüística
A Psicolingüística divide-se em:
1. Psicolingüística Experimental - o estudo da compreensão e da produção
lingüística
2. Psicolingüística Desenvolvimental - o estudo da aquisição da linguagem.
A Psicologia e a Lingüística nunca se integraram com total sucesso na
Psicolingüística, a não ser por curtos períodos. Há uma discordância
fundamental a respeito da relação entre a linguagem e a cognição que mais
ou menos divide os psicolingüistas:
1. A posição da autonomia lingüística ou da Modularidade
Os lingüistas assumem que o âmago da linguagem é um sistema lingüístico
especializado ou GRAMÁTICA, que tem interface com outros sistemas
cognitivos ao nível do input e do output. Entretanto, as regras e
representações desse sistema são distintas das de outros sistemas
cognitivos. Assim, de acordo com esta posição, uma teoria da
compreensão e da produção lingüística deve incluir entre seus princípios
explanatórioss um componente ou módulo gramatical. Note-se, por outro
lado, que a estrutura gramatical pode ser estudada independentemente do
seu uso na comunicação.
2. A posição Cognitivista
A gramática é um epifenômeno de processos cognitivos mais gerais.
A compreensão de frases
Parsing
Compreensão
Interpretação
Integração de diferentes tipos de conhecimento
Grafema
Som/Fonema
Prosódia? Prosódia?
Informação lexical
- categoria gramatical
- grade de subcategorização
- grade temática
- propriedades de controle
- traços formais
- traços semânticos
Análise sintática
Integração discursiva
Integração pragmática
Contexto
Experiência de mundo
Modelos
(3) Modelos de Processamento de Frases
Incrementacional- Satisfação
DTC Garden Path Construal
Interativo
de condições Conexionismos
|-------- | ------------------ | --------|------- | ---------------------------| -------------------------------------|
Minimalista
Teorias Paramétricas
+ Sintático
+ Semântico
Questões
Algumas questões fundamentais da área de Processamento Sintático
1. Que tipos de informação são utilizados no parsing?
Sintaxe, Semântica , Pragmática
- sintaxe - análise de constituintes, dependências de longa distância, constituintes
descontínuos, subcategorização
- semântica lexical - significado, papel temático.
- pragmática - identificar referentes , integraçao contextual e discursiva,
plausibilidade
2. Qual o ordenamento dos processos de parsing on line?
Sistema modular? Interativo? Que informação está disponível quando?
3. Há Princípios universais de parsing? Estes princípios podem ser ultrapassados
pelo conhecimento lexical/pragmático? Esses princípios são independentes de uma
língua específica?
Download

PowerPoint