Estrutura de Constituintes
João Arthur Pugsley Grahl
1
2
Como as línguas se organizam? Há uma estrutura relacionada às línguas
humanas que ordenam suas sentenças? Essa estrutura pode ser descrita?
Essas perguntas estiveram presentes, de certa maneira, nos estudos da linguagem humana durante muito tempo, mas é no século XX que elas serão
esmiuçadas, acompanhando o desenvolvimento da lingüística como ciência
autônoma.
Esse trabalho procura mostrar, sob a luz de estudos lingüísticos efetuados no século passado, como os lingüistas trataram e procuraram provar a
existência dos constituintes lingüísticos - construtos abstratos que estariam
presentes em qualquer linguagem humana, organizando sobretudo sua estrutura sintática -,que tornar-se-iam base do principal paradigma lingüístico do
século XX.
1
Estrutura das Sentenças
Uma frase como essa:
(1)
A criança comeu aquele doce vermelho
Poderia ser enunciada por qualquer pessoa, falante do português. Percebemos também, através de (1), uma realidade que é perfeitamente consciente
a todos seus falantes: todas as frases são formadas por elementos básicos, as
palavras. Analisando essa frase com um pouco mais de cuidado, percebemos
que o significado global dessa frase resulta não somente do significado de cada
palavra, pois,
(2)
Aquele doce vermelho comeu a criança,
utiliza exatamente as mesmas palavras de (1), mas com a “ordem invertida”,
mudando totalmente seu significado original (mas guardando a gramaticalidade). Já uma sentença como:
(3)
Comeu a aquele criança vermelho doce,
não pertence à língua portuguesa. É totalmente agramatical, embora utilize
estritamente as mesmas palavras de (1). Essa agramaticalidade não se deve
a uma diferença de significado global, como em (2), mas a sua ordenação
sintática, que é uma imposição da língua portuguesa.
3
Assim, uma frase como (1) parece constituir-se de uma seqüência de seis
palavras concatenadas, mas não de qualquer maneira. Há, portanto, uma
ordem determinada para que as sentenças possam ser gramaticais. Dessa
forma, as palavras formariam cadeias que poderiam ser abstratamente descritas:
(4)
a+b+c+d+e
Sendo “+” um indicador de concatenação dos elementos.
Esse tipo de concepção indica que a estrutura das frases se limita a uma
combinação linear de palavras. Essa hipótese linear é, de acordo com Raposo
[6, pp. 18]:
Ela corresponde a uma realidade evidente, perfeitamente consciente para os falantes: todas as frases são formadas de elementos básicos, que são as palavras. não é necessário ser-se lingüista
ou gramático para se apanhar o conteúdo fundamental dessa realidade, basta ter-se um mínimo de conhecimento sobre o que é
uma língua.
Se perdermos, porém, mais algum tempo analisando essa frase, intuitivamente podemos peceber que uma sentença como (1) não é apenas uma
seqüência ordenada de palavras. Parece que algumas palavras se ligam mais
facilmente a umas do que a outras. Dessa maneira,
(5)
a
⇐⇒ criança
doce ⇐⇒ vermelho
parecem formar uma nova unidade composta, um grupo natural. Diferentemente de associações como:
(6)
comeu ⇐⇒ aquele
criança ⇐⇒ comeu
Ou ainda de associações descontínuas como:
(7)
criança ⇐⇒ aquele
a
⇐⇒ vermelho
Ou seja, essa análise, embora intuitiva, nos permite formular uma hipótese
de que não há apenas uma estrutura linear como (4), inerente às sentenças,
4
mas assinalamos a possibilidade de que certas palavras ligam-se com mais
facilidade dentro da frase, sugerindo a existência de uma estruturação interna
intermediária entre as palavras e a frase. Portanto, podemos ir um pouco
mais longe e sugerir que “aquele doce vermelho”, também forma um grupo,
funcionando como uma unidade. Da mesma maneira “comeu aquele doce
vermelho” formaria um outro grupo, que se ligaria a “o menino”. Verificamos
portanto que existem certos níveis de associação que vão de um nível inferior,
lexical, até chegar a própria frase como pode ser indicado abaixo (“doce” ligase a “vermelho”, “doce vermelho” liga-se a “aquele”, “aquele doce vermelho”
liga-se a “comeu”, e finalmente “comeu aquele doce vermelho” liga-se a “a
criança”, que, como é mostrado em (5), também é uma ligação entre “a” e
“criança”):
a crinaça
comeu
aquele
doce vermelho
(8)
Podemos concluir, portanto, que as frases resultam da propensão que
determinadas unidades têm para se ligarem - seja com palavras ou grupos de
palavras -, associando-se em níveis hierárquicos que se encaixam (como em
(8)), fazendo com que aqueles que estão em níveis superiores contenham os
que estão em níveis inferiores.
Esses grupos naturais vieram a ser teorizados como constituintes das
frases recebendo um cuidado especial dos lingüistas e também um nome
grego que os generaliza, sintagma, que significa “disposição”.
2
Pequeno esboço histórico da estrutura de constituintes
Tradicionalmente, já se havia percebido pela gramática tradicional que as
frases podiam ser divididas em grupos. Daí classificar suas partes em sujeito, predicado, locuções, etc. Mas foi na primeira metade do século XX que
introduziu-se a noção de análise em constituintes imediatos por Bloomfield
[2, pp. 161], que enunciou:
Qualquer falante de inglês que se interesse pelo assunto está seguro de dizer que os constituintes imediatos de Poor John ran
5
away são as duas formas poor John e ran away; e que cada uma
dessas partes é, portanto, uma forma complexa; que os constituintes imediatos de ran away são ran, um morfema, e away, uma
forma complexa, cujos constituintes são os morfemas a- e way; e
que os constituintes de poor John são os morfemas poor e John.
A despeito de sua preocupação morfológica - dividindo away -, Bloomfild
dá um paço adiante para a descrição dos constituintes, uma vez que esses
fazem parte integrante da língua. Isso já difere da gramática tradicional, cuja
preocupação era puramente normativa e taxonômica. Esse estudo dos constituintes viria a ser aprofundado por Wells e Harris, que utilizariam critérios
distribucionais para analisar os constituintes. Mas segundo Lyons,“a teoria
da estrutura constituinte foi formalizada e submetida à análise matemática
por Chomsky e outros estudiosos que dispensaram considerável atenção à
natureza das regras necessárias para a geração de frases com uma estrutura
constituinte apropriada.”[4, pp. 242]
Foi com Chomski que a gramática de estrutura constituinte foi formalizada na forma de gramática de estrutura sintagmática, que por ser insuficiente na descrição gramatical, foi agregada à gramática transformacionál, segundo ele indispensável para tratar de relações como por exemplo
o ativo/passivo na linguagem.
3
Teste dos Constituintes
Como os constituintes não são imediatamente observáveis, faz-se necessário
a elaboração de critérios a fim de determiná-los. Esses critérios são processos
gramaticais que nos permitem verificar a existência e as diferentes categorias
de constituintes.
Um desses critérios é o da mobilidade. Ele enuncia que se uma sucessão de
palavras forma um constituinte, esse pode ser colocado em diversas posições
no interior da frase.
(9)
a.
b.
c.
d.
A criança comeu aqueles doces em sua casa na semana passada
Na semana passada, a criança comeu aqueles doces em sua casa
A criança, na semana passada, comeu aqueles doces em sua casa
A criança comeu, na semana passada, aqueles doces em sua casa
Note-se que não é possível uma estrutura como essa:
6
(10)
∗ A criança comeu aqueles doces em sua na semana passada casa
Com essa frase agramatical, vê-se um outro critério de determinação
dos constituintes, o da ininseribilidade, que enuncia: se uma seqüência de
palavras forma um constituinte, esse não pode ser interrompido inserindo-se
nele um outro constituinte, pois na semana passada está inserido entre em
sua e casa, portanto tanto na semana passada como em sua casa seriam
constituintes.
Outro critério é o da enunciabilidade em isolamento, em que um constituinte pode ser determinado, dado um contexto específico, sem a necessidade
de estar inserido numa frase completa.
(11)
a.
b.
c.
Onde a criança comeu aqueles doces?
A criança comeu aqueles doces em sua casa
em sua casa
É desnecessário responder a pergunta de (11a) com (11b), pois pode-se
responder simplesmente com (11c), que seria um constituinte. Já (12b) não
pode ser considerado um constituinte ou uma resposta gramatical para a
pergunta de (12a):
(12)
a.
b.
Onde a criança comeu aqueles doces?
∗ casa
Os critérios acima determinam se uma seqüência de palavras forma um constituinte. Mas pode-se questionar a respeito da natureza dos constituintes,
se pertencem ou não à mesma categoria, ou seja, pode-se questionar se todos têm a mesma natureza, se comportam as mesmas características. Outro
grupo de critérios é necessário para verificar as diferenças de categoria dos
constituintes.
O primeiro desses outros critérios é o da coordenabilidade: duas seqüências de palavras podem ser coordenadas somente se são constituintes da
mesma categoria.
(13)
a.
b.
A criança comeu aqueles doces na semana passada e na semana
retrasada
A criança comeu aqueles doces na sua casa e na casa do vizinho
Esses exemplos mostram que as frases constituintes coordenadas são da
7
mesma categoria. diferentemente de (14).
(14)
∗ A criança comeu aqueles doces e na semana passada
Mas novamente faz-se a pergunta: em que consiste essa diferença de categoria. Nos casos de “na semana passada” e “em sua casa”, nota-se a preposição
“em”, que introduz um grupo de palavras chamado grupo preposicional. Assim há também o grupo nominal como em “A criança” e “aqueles doces”,
cujo núcleo “criança” e “doces” são nomes. Portanto os grupos nominais
relacionam-se com os nomes e os preposicionais com as preposições. obervase também que um grupo pode conter outro como por exemplo “na semana
passada” que é preposicional, contém o grupo nominal “a semana passada”.
Outro critério que permite averiguar a sistematicidade da correlação entre categorias lexicais (notadamente os pronomes) e os constituintes é o da
substituição pronominal. Com esse critério podemos testar grupos formados
de sintagma nominal, como em:
(15)
a.
b.
c.
O menino comeu aqueles doces
Ele comeu aqueles doces
Ele comeu-os
Os exemplos (15a) e (15b) mostram portanto a possibilidade de substituir
grupos nominais por pronomes, ao contrário de (16a) e de (16b):
(16)
a.
b.
∗ Ele aqueles doces
∗ Ele os
Outras duas categorias, à parte dos grupos nominais e dos grupos preposicionais - mas não menos importantes - são os grupos adjetivais e os grupos verbais. Para definir o grupo adjetival constituinte, podemos utilizar os
critérios já vistos, como o da mobilidade. Tomemos então uma seqüência de
palavras como “muito feliz”:
(17)
a.
b.
O menino está muito feliz
Muito feliz, o menino está
8
Continuando os testes com o critério da ininseribilidade, corroboramos
com o da mobilidade, pois o enunciado “eu acho” trafega bem entre os constituintes, excetuando-se em (10d), o que provaria justamente que “muito feliz”
seria um grupo adjetival:
(18)
a.
b.
c.
d.
O menino está muito feliz, eu acho
O menino, eu acho, está muito feliz
O menino está, eu acho, muito feliz
∗ O menino está muito, eu acho, feliz
O enunciado em isolamento nos dá:
(19)
a.
b.
Como está o menino?
Muito feliz
E a coordenabilidade:
(20)
a.
b.
c.
O menino esta muito feliz
O menino esta bastante cansado
O menino esta muito feliz e bastante cansado
Depois de haver confirmado a existência do grupo adjetival, resta ainda o
grupo verbal. Portanto, novamente tentar-se-á encontrar um processo gramatical no qual o pretenso segundo grande constituinte imediato da frase
funcione como um sintagma, um grupo natural:
(21)
a.
b.
c.
O menino comeu aqueles doces vermelhos, e sua irmã também
o fez
A mãe do menino encomendou mais doces vermelhos; e a avó
do menino também
O pai e a mãe do menino trabalharam muito na festa, e seus
filhos também o fizeram
Todas essas frases são formadas por duas sentenças simples e coordenadas,
sendo a segunda oração incompleta quanto à forma, mas não quanto ao
significado. Os elementos da segunda sentença (“também o fez”, “também”,
“também o fizeram”) se referem exatamente ao SV da primeira sentença,
mas dessa fez valendo-se de um processo sintático-semântico para testar o
sintagma verbal, pois não é possível entender o “também o fez” de (21a)
como “roubou aqueles doces vermelhos”, mas somente como “comeu aqueles
9
doces vermelhos”. Da mesma maneira ocorre em todas as sentenças de (21):
(22)
a.
b.
c.
O menino comeu aqueles doces vermelhos, e sua irmã
.
.
também o fez
A mãe do menino encomendou mais doces vermelhos;
.
.
e a avó do menino também
O pai e a mãe do menino trabalharam muito na festa,
.
.
e seus filhos também o fizeram
O significado dos excertos em negrito é completado pelo constituinte dentro
do retângulo, mostrando, portanto, uma correspodência sintática (e semântica), evidenciando também o sintagma verbal que está dentro dos retângulos.
Esses não são os únicos testes possíveis de serem feitos para verificar os
constituintes, muitos outros podem ser formulados, dependendo também da
língua com a qual se está tratando.
4
A análise de Constituintes para a determinação de ambigüidades
Além dos métodos acima mencionados - que nos permitem separar e mesmo
classificar os constituintes, mostrando que as frases têm uma estrutura não
linear -, também com relação a certos tipos de ambigüidades será possível
mostrar que algumas delas existem em decorrência da estrutura de constituintes da frase. Tais ambigüidades nos mostram as diversas possibilidades de
se analisar uma mesma sentença, subdividindo-a em sintagmas. Assim numa
expressão como:
(23)
O menino recebeu a menina com um sorriso
percebe-se uma ambigüidade decorrente de uma diferença da estrutura constituinte, pois tanto pode ser interpretada o menino sorria quando recebeu a
menina, como o menino recebeu a menina que sorria. Mas convém lembrar
também a observação de Lyons [4, pp. 240]:
10
Muitos desses sintagmas não ficam sujeitos a erros de interpretação quando usados efetivamente em frases porque ou o resto
da frase ou o contexto geral em que a língua opera torna certo,
ou pelo menos provável, que uma interpretação, e não outra, é a
correta.
No capítulo seguir, veremos como é representada essa abigüidade estrutural.
5
A representação da Estrutura de Constituintes
Vimos, portanto, que as frases não têm uma estrutura linear somente, mas
organizam-se hierarquicamente em sintagmas que podem conter outros sintagmas até chegar às palavras simples. Para representar essa estrutura graficamente, podemos utilizar algumas formas de representação, chamados de
marcadores sintagmáticos. Os sistemas de representação mais utilizados são
o que utiliza parênteses e o arbóreo, que é preferido por facilitar a visualização
da estrutura. Dessa forma, uma frase como: “O menino come muito” pode ser
representada com parênteses: [(O menino)(come muito)]. Ou representá-la
como árvore:
(24)
Árvore I
x
PPP
P
y
z
Z
Z
"b
"
b
o
menino
come
muito
Dessa maneira ficariam representados os constituintes imediatos de Bloomfield. para interpretá-lo, faremos dessa maneira: os elementos com os quais as
frases foram construídas são, “o”,“menino”, “corre”, “muito”. As palavras “o”
e “menino” são os constituintes imediatos de uma construção “o menino”. Os
galhos que levam a eles derivam diretamente de um nódulo “y”; as palavras
“corre” e “muito” são constituintes imediatos ligados pelo nódulo imediatamente superior “z”; e as duas construções, “o menino” e “corre muito” são os
constituintes imediatos de uma construção de nível superior: a própria frase,
11
e ambas derivam desse nódulo “x”. Utilizando esse tipo de modo de representação unindo-o ao vocabulário técnico da sintaxe contemporâne (SN para
sintagma nominal, SV para sintagma verbal, SV e SA para o verbal e o adjetival, respectivamente), é possível representar as árvores que demonstram
as duas construções possíveis para a sentença ambígua em (21):
(25)
Árvore II
S`
```
``
SV
SN
XX
"b
"
b
Det
N
XXX
V
SN
PP
o
menino
recebeu
SN
HH
H
a menina
PP
SP
PPP
P
com um sorriso
Ou numa representação em parênteses:
(26)
[ S [ SN [ Det o ] + [ N menino ]] + [ SV [ V recebeu ] + [ SN [ SN a menina
] + [ SP com um sorriso ]]]]
A expressão acima portanto mostra a interpretação em que a menina sorri e
a próxima é o menino que sorri:
(27)
Árvore III
S
(((hhhhhh
((((
h
SV
`
SN
"b
"
Det
o
(28)
b
N
menino
V
%
%
SN
```
``
`
HH
H
recebeu a menina
SP
PPP
P
com um sorriso
[ S [ SN [ Det o ] + [ N menino ]] + [ SV [ V recebeu ] + [ SN a menina ] +
[ SP com um sorriso ]]]]
12
Os marcadores sintagmáticos acima, portanto, explicitam as duas estruturas possíveis para a ambigüidade de (21). Eles fornecem dois tipos de
informação. A primeira é que cada constituinte pertence a uma determinada classe, relacionando-se com as outras hierarquicamente, essa relação é
chamada de dominância. Em (25), o SN, por exemplo, domina tanto “o”
e “menino”, como “a menina”, ou seja, esses são constituintes da classe SN.
Quanto às relações lineares de esquerda para a direita, chamamo-las, relações
de precedência.
6
Gramática de Estrutura Sintagmática
Partindo, portanto, do princípio que as sentenças são formadas por constituintes, e constituintes de categorias diferentes (SP, SN, SV, SA), Chomski
construiu um sistema de regras gerativas que fixam explicitamente a correta
estrutura constituinte das frases. Através dessas regras, de um léxico e desses
constituintes, poder-se-ia gerar uma gramátcia. E seria esse precisamente o
problema do lingüista: “descobrir a gramática que define todas as orações
gramaticais de determinadas línguas, como o português, e apenas elas.” [1,
pp. 44].
Como parte do esforço de formalizar sua teoria gramatical, Chomsi colocou sua gramática como fazendo parte das gramáticas de reescritura irrestrita, ou seja, consiste de um vocabulário auxiliar, um vocabulário terminal e um conjunto de regras de reescritura que se aplicam a cadeias de
elementos (constituintes). Bach afirma que: “se uma língua (isto é, um conjunto de cadeias) pode ser definida por qualquer sistema formal explícito, ela
pode ser definida por um sistema de reescritura irrestrito.”
Então a Gramática de Estrutura Sintagmática se propõe, como subconjunto das gramáticas de reescritura irrestrita, a moldar o conhecimento que
o falante tem de sua língua a respeito da gramaticalidade das sentenças, e a
partir dessa gramática dizer qual é a língua definida. Note-se que há uma
diferença brutal entre “moldar o conhecimento” e dizer que a estrutura sintagmática ocorre na mente do falante. as gramáticas de estrutura sintagmática
não se prestam a definir realidades psicológicas, ou neurológicas, mas sim
representar a estrutura das línguas naturais. Tendo em mente a tarefa do
lingüista de descrever uma gramática em particular, Radford [5, pp. 122]
enuncia:
Adquirir uma linguagem involve adquirir um sistema finito de
13
regras que geram o conjunto infinito de sentenças bem-formadas
na linguagem. dessa maneira, a tarefa do lingüista de descrever
um gramática em particular se coloca em articular um sistema
de regras de formação, interpretação e pronunciação de sentenças
que gerarão o conjunto infinito de sentenças bem-formadas na
linguagem.
Trataremos apenas das regras que dizem respeito à sintaxe, deixando de
lado as regras fonológicas, semânticas, etc. Assumindo que as sentenças podem ser bem representadas por marcadores sintagmáticos (como as árvores),
faz-se necessário então regras que os produzam. tomando como exemplo uma
sentença como
(29)
A criança comeu o doce vermelho em casa
As regras, como formalizadas por Chomsky, assumem a forma X → Y Z
que significa: X pode ter como constituinte imediato um Y imediatamente
seguido por um Z. Como uma regra como essa, seria possível formar S →
SN SV, significando “uma sentença [S], forma-se tomando um Sintagma Nominal [SN] e um Sintagma Verbal [SV], gerando um marcador sintagmático
parcial:
(30)
Árvore IV
S
,l
,
l
SN
SV
Podemos colocar após essa regra, uma outra, como SV → V SN, indicando que um Sintagma Verbal é formado por um verbo seguido de um
Sintagma Nominal, ficando:
(31)
Árvore V
S
Q
Q
SN
SV
V
@
@
SN
Logo após, se formularmos uma regra como SN → D N (SP), deixamos
14
como opcional a derivação do SN que pode vir a ser tanto um D N, quanto
um D N SP, portanto:
(32)
Árvore VI
S
HH
H
SN
%e
%
e
D
SV
"b
"
"
b
b
N V
SN
H
H
H
D
N
SP
Por sua vez, uma regra como SP → P N:
(33)
Árvore VII
S
!aa
!!
a
SN
SV
%e
%
e
HH
H
D
N V
SN
H
HH
D
N
SP
%e
%
e
P
N
Além dessas regras categoriais, nossa gramática também deve conter um
léxico, portanto:
(34)
N : criança, menino, festa
V : comeu
D : a, aquele
P : na
Qualquer um desses itens lexicais pode ser inserido na categoria terminal
correspondente, no fim das árvores, formando um marcador sintagmático
como o que se segue, que utiliza as regras vistas acima, o léxico, e as categorias
sintagmáticas:
15
(35)
Árvore VIII
S
XXX
X
X
X
SN
Q
Q
D
o
N
menino
SV
XXX
X
X
SN
V
comeu
PPP
P
P
D
aquele
N
doce
SP
##cc
P
N
na festa
Se expandirmos o léxico ou as regras de nossa gramática, ela ficará conseqüentemente mais poderosa. Na categoria lexical dos Nomes poderíamos
colocar: avô, mãe, criança; nos verbos: pegou, pediu, perdeu; na dos determinantes: a, um, uma; na das prepocições: no, para com. Com essas
modificações, seria possível formar sentenças como:
(36)
a.
b.
c.
O menino levou a avó para festa
Um avô perdeu a avó na festa
A mãe pegou uma criança
Note-se que como o SP é opcional (38c) é permitido. É claro que essa grmática é extremamente pequena. para cirar um conjunto de regras para gerar
as sentenças em português, precisaríamos de algumas sentenças de regras,
juntamente com um aumento do léxico, com seus milhares de palavras. mas
mesmo assim, a estrutura sintagmática não daria conta de todas as relações
lingüísticas. Por conta disso desenvolveu-se uma teoria transformacional,
acoplada à gramática de estrutura sintagmática, mas que sugerem uma série
de outras implicações que extrapolam o tema “estrutura de constituintes”
aqui abordado. A gramática acima é só um pequeno exemplo de como se
pode tratar as línguas naturais, tendo por base a estrutura de constituintes
de uma sentença.
16
Referências
[1] Bach, E. 1974. Teoria Sintática. Rio de Janeiro: Zahar Editores.
[2] Bloofield, L. 1961. Language. Nova York: Holt, Rinegart and Winston.
[3] Graffi, G. 1994. Sintassi. Bolonha: Il Mulino.
[4] Lyons, J. 1979.Introdução à Lingüística teórica. São Paulo: Companhia
Editora.
[5] Radford, A. 1992. Transformational Grammar. Cabridge: Cambridge
University Press.
[6] Raposo, E. P. 1979. Introdução à Gramática Generativa. Lisboa: Moraes
Editores.
Download

Estrutura de Constituintes