Estrutura de Constituintes João Arthur Pugsley Grahl 1 2 Como as línguas se organizam? Há uma estrutura relacionada às línguas humanas que ordenam suas sentenças? Essa estrutura pode ser descrita? Essas perguntas estiveram presentes, de certa maneira, nos estudos da linguagem humana durante muito tempo, mas é no século XX que elas serão esmiuçadas, acompanhando o desenvolvimento da lingüística como ciência autônoma. Esse trabalho procura mostrar, sob a luz de estudos lingüísticos efetuados no século passado, como os lingüistas trataram e procuraram provar a existência dos constituintes lingüísticos - construtos abstratos que estariam presentes em qualquer linguagem humana, organizando sobretudo sua estrutura sintática -,que tornar-se-iam base do principal paradigma lingüístico do século XX. 1 Estrutura das Sentenças Uma frase como essa: (1) A criança comeu aquele doce vermelho Poderia ser enunciada por qualquer pessoa, falante do português. Percebemos também, através de (1), uma realidade que é perfeitamente consciente a todos seus falantes: todas as frases são formadas por elementos básicos, as palavras. Analisando essa frase com um pouco mais de cuidado, percebemos que o significado global dessa frase resulta não somente do significado de cada palavra, pois, (2) Aquele doce vermelho comeu a criança, utiliza exatamente as mesmas palavras de (1), mas com a “ordem invertida”, mudando totalmente seu significado original (mas guardando a gramaticalidade). Já uma sentença como: (3) Comeu a aquele criança vermelho doce, não pertence à língua portuguesa. É totalmente agramatical, embora utilize estritamente as mesmas palavras de (1). Essa agramaticalidade não se deve a uma diferença de significado global, como em (2), mas a sua ordenação sintática, que é uma imposição da língua portuguesa. 3 Assim, uma frase como (1) parece constituir-se de uma seqüência de seis palavras concatenadas, mas não de qualquer maneira. Há, portanto, uma ordem determinada para que as sentenças possam ser gramaticais. Dessa forma, as palavras formariam cadeias que poderiam ser abstratamente descritas: (4) a+b+c+d+e Sendo “+” um indicador de concatenação dos elementos. Esse tipo de concepção indica que a estrutura das frases se limita a uma combinação linear de palavras. Essa hipótese linear é, de acordo com Raposo [6, pp. 18]: Ela corresponde a uma realidade evidente, perfeitamente consciente para os falantes: todas as frases são formadas de elementos básicos, que são as palavras. não é necessário ser-se lingüista ou gramático para se apanhar o conteúdo fundamental dessa realidade, basta ter-se um mínimo de conhecimento sobre o que é uma língua. Se perdermos, porém, mais algum tempo analisando essa frase, intuitivamente podemos peceber que uma sentença como (1) não é apenas uma seqüência ordenada de palavras. Parece que algumas palavras se ligam mais facilmente a umas do que a outras. Dessa maneira, (5) a ⇐⇒ criança doce ⇐⇒ vermelho parecem formar uma nova unidade composta, um grupo natural. Diferentemente de associações como: (6) comeu ⇐⇒ aquele criança ⇐⇒ comeu Ou ainda de associações descontínuas como: (7) criança ⇐⇒ aquele a ⇐⇒ vermelho Ou seja, essa análise, embora intuitiva, nos permite formular uma hipótese de que não há apenas uma estrutura linear como (4), inerente às sentenças, 4 mas assinalamos a possibilidade de que certas palavras ligam-se com mais facilidade dentro da frase, sugerindo a existência de uma estruturação interna intermediária entre as palavras e a frase. Portanto, podemos ir um pouco mais longe e sugerir que “aquele doce vermelho”, também forma um grupo, funcionando como uma unidade. Da mesma maneira “comeu aquele doce vermelho” formaria um outro grupo, que se ligaria a “o menino”. Verificamos portanto que existem certos níveis de associação que vão de um nível inferior, lexical, até chegar a própria frase como pode ser indicado abaixo (“doce” ligase a “vermelho”, “doce vermelho” liga-se a “aquele”, “aquele doce vermelho” liga-se a “comeu”, e finalmente “comeu aquele doce vermelho” liga-se a “a criança”, que, como é mostrado em (5), também é uma ligação entre “a” e “criança”): a crinaça comeu aquele doce vermelho (8) Podemos concluir, portanto, que as frases resultam da propensão que determinadas unidades têm para se ligarem - seja com palavras ou grupos de palavras -, associando-se em níveis hierárquicos que se encaixam (como em (8)), fazendo com que aqueles que estão em níveis superiores contenham os que estão em níveis inferiores. Esses grupos naturais vieram a ser teorizados como constituintes das frases recebendo um cuidado especial dos lingüistas e também um nome grego que os generaliza, sintagma, que significa “disposição”. 2 Pequeno esboço histórico da estrutura de constituintes Tradicionalmente, já se havia percebido pela gramática tradicional que as frases podiam ser divididas em grupos. Daí classificar suas partes em sujeito, predicado, locuções, etc. Mas foi na primeira metade do século XX que introduziu-se a noção de análise em constituintes imediatos por Bloomfield [2, pp. 161], que enunciou: Qualquer falante de inglês que se interesse pelo assunto está seguro de dizer que os constituintes imediatos de Poor John ran 5 away são as duas formas poor John e ran away; e que cada uma dessas partes é, portanto, uma forma complexa; que os constituintes imediatos de ran away são ran, um morfema, e away, uma forma complexa, cujos constituintes são os morfemas a- e way; e que os constituintes de poor John são os morfemas poor e John. A despeito de sua preocupação morfológica - dividindo away -, Bloomfild dá um paço adiante para a descrição dos constituintes, uma vez que esses fazem parte integrante da língua. Isso já difere da gramática tradicional, cuja preocupação era puramente normativa e taxonômica. Esse estudo dos constituintes viria a ser aprofundado por Wells e Harris, que utilizariam critérios distribucionais para analisar os constituintes. Mas segundo Lyons,“a teoria da estrutura constituinte foi formalizada e submetida à análise matemática por Chomsky e outros estudiosos que dispensaram considerável atenção à natureza das regras necessárias para a geração de frases com uma estrutura constituinte apropriada.”[4, pp. 242] Foi com Chomski que a gramática de estrutura constituinte foi formalizada na forma de gramática de estrutura sintagmática, que por ser insuficiente na descrição gramatical, foi agregada à gramática transformacionál, segundo ele indispensável para tratar de relações como por exemplo o ativo/passivo na linguagem. 3 Teste dos Constituintes Como os constituintes não são imediatamente observáveis, faz-se necessário a elaboração de critérios a fim de determiná-los. Esses critérios são processos gramaticais que nos permitem verificar a existência e as diferentes categorias de constituintes. Um desses critérios é o da mobilidade. Ele enuncia que se uma sucessão de palavras forma um constituinte, esse pode ser colocado em diversas posições no interior da frase. (9) a. b. c. d. A criança comeu aqueles doces em sua casa na semana passada Na semana passada, a criança comeu aqueles doces em sua casa A criança, na semana passada, comeu aqueles doces em sua casa A criança comeu, na semana passada, aqueles doces em sua casa Note-se que não é possível uma estrutura como essa: 6 (10) ∗ A criança comeu aqueles doces em sua na semana passada casa Com essa frase agramatical, vê-se um outro critério de determinação dos constituintes, o da ininseribilidade, que enuncia: se uma seqüência de palavras forma um constituinte, esse não pode ser interrompido inserindo-se nele um outro constituinte, pois na semana passada está inserido entre em sua e casa, portanto tanto na semana passada como em sua casa seriam constituintes. Outro critério é o da enunciabilidade em isolamento, em que um constituinte pode ser determinado, dado um contexto específico, sem a necessidade de estar inserido numa frase completa. (11) a. b. c. Onde a criança comeu aqueles doces? A criança comeu aqueles doces em sua casa em sua casa É desnecessário responder a pergunta de (11a) com (11b), pois pode-se responder simplesmente com (11c), que seria um constituinte. Já (12b) não pode ser considerado um constituinte ou uma resposta gramatical para a pergunta de (12a): (12) a. b. Onde a criança comeu aqueles doces? ∗ casa Os critérios acima determinam se uma seqüência de palavras forma um constituinte. Mas pode-se questionar a respeito da natureza dos constituintes, se pertencem ou não à mesma categoria, ou seja, pode-se questionar se todos têm a mesma natureza, se comportam as mesmas características. Outro grupo de critérios é necessário para verificar as diferenças de categoria dos constituintes. O primeiro desses outros critérios é o da coordenabilidade: duas seqüências de palavras podem ser coordenadas somente se são constituintes da mesma categoria. (13) a. b. A criança comeu aqueles doces na semana passada e na semana retrasada A criança comeu aqueles doces na sua casa e na casa do vizinho Esses exemplos mostram que as frases constituintes coordenadas são da 7 mesma categoria. diferentemente de (14). (14) ∗ A criança comeu aqueles doces e na semana passada Mas novamente faz-se a pergunta: em que consiste essa diferença de categoria. Nos casos de “na semana passada” e “em sua casa”, nota-se a preposição “em”, que introduz um grupo de palavras chamado grupo preposicional. Assim há também o grupo nominal como em “A criança” e “aqueles doces”, cujo núcleo “criança” e “doces” são nomes. Portanto os grupos nominais relacionam-se com os nomes e os preposicionais com as preposições. obervase também que um grupo pode conter outro como por exemplo “na semana passada” que é preposicional, contém o grupo nominal “a semana passada”. Outro critério que permite averiguar a sistematicidade da correlação entre categorias lexicais (notadamente os pronomes) e os constituintes é o da substituição pronominal. Com esse critério podemos testar grupos formados de sintagma nominal, como em: (15) a. b. c. O menino comeu aqueles doces Ele comeu aqueles doces Ele comeu-os Os exemplos (15a) e (15b) mostram portanto a possibilidade de substituir grupos nominais por pronomes, ao contrário de (16a) e de (16b): (16) a. b. ∗ Ele aqueles doces ∗ Ele os Outras duas categorias, à parte dos grupos nominais e dos grupos preposicionais - mas não menos importantes - são os grupos adjetivais e os grupos verbais. Para definir o grupo adjetival constituinte, podemos utilizar os critérios já vistos, como o da mobilidade. Tomemos então uma seqüência de palavras como “muito feliz”: (17) a. b. O menino está muito feliz Muito feliz, o menino está 8 Continuando os testes com o critério da ininseribilidade, corroboramos com o da mobilidade, pois o enunciado “eu acho” trafega bem entre os constituintes, excetuando-se em (10d), o que provaria justamente que “muito feliz” seria um grupo adjetival: (18) a. b. c. d. O menino está muito feliz, eu acho O menino, eu acho, está muito feliz O menino está, eu acho, muito feliz ∗ O menino está muito, eu acho, feliz O enunciado em isolamento nos dá: (19) a. b. Como está o menino? Muito feliz E a coordenabilidade: (20) a. b. c. O menino esta muito feliz O menino esta bastante cansado O menino esta muito feliz e bastante cansado Depois de haver confirmado a existência do grupo adjetival, resta ainda o grupo verbal. Portanto, novamente tentar-se-á encontrar um processo gramatical no qual o pretenso segundo grande constituinte imediato da frase funcione como um sintagma, um grupo natural: (21) a. b. c. O menino comeu aqueles doces vermelhos, e sua irmã também o fez A mãe do menino encomendou mais doces vermelhos; e a avó do menino também O pai e a mãe do menino trabalharam muito na festa, e seus filhos também o fizeram Todas essas frases são formadas por duas sentenças simples e coordenadas, sendo a segunda oração incompleta quanto à forma, mas não quanto ao significado. Os elementos da segunda sentença (“também o fez”, “também”, “também o fizeram”) se referem exatamente ao SV da primeira sentença, mas dessa fez valendo-se de um processo sintático-semântico para testar o sintagma verbal, pois não é possível entender o “também o fez” de (21a) como “roubou aqueles doces vermelhos”, mas somente como “comeu aqueles 9 doces vermelhos”. Da mesma maneira ocorre em todas as sentenças de (21): (22) a. b. c. O menino comeu aqueles doces vermelhos, e sua irmã . . também o fez A mãe do menino encomendou mais doces vermelhos; . . e a avó do menino também O pai e a mãe do menino trabalharam muito na festa, . . e seus filhos também o fizeram O significado dos excertos em negrito é completado pelo constituinte dentro do retângulo, mostrando, portanto, uma correspodência sintática (e semântica), evidenciando também o sintagma verbal que está dentro dos retângulos. Esses não são os únicos testes possíveis de serem feitos para verificar os constituintes, muitos outros podem ser formulados, dependendo também da língua com a qual se está tratando. 4 A análise de Constituintes para a determinação de ambigüidades Além dos métodos acima mencionados - que nos permitem separar e mesmo classificar os constituintes, mostrando que as frases têm uma estrutura não linear -, também com relação a certos tipos de ambigüidades será possível mostrar que algumas delas existem em decorrência da estrutura de constituintes da frase. Tais ambigüidades nos mostram as diversas possibilidades de se analisar uma mesma sentença, subdividindo-a em sintagmas. Assim numa expressão como: (23) O menino recebeu a menina com um sorriso percebe-se uma ambigüidade decorrente de uma diferença da estrutura constituinte, pois tanto pode ser interpretada o menino sorria quando recebeu a menina, como o menino recebeu a menina que sorria. Mas convém lembrar também a observação de Lyons [4, pp. 240]: 10 Muitos desses sintagmas não ficam sujeitos a erros de interpretação quando usados efetivamente em frases porque ou o resto da frase ou o contexto geral em que a língua opera torna certo, ou pelo menos provável, que uma interpretação, e não outra, é a correta. No capítulo seguir, veremos como é representada essa abigüidade estrutural. 5 A representação da Estrutura de Constituintes Vimos, portanto, que as frases não têm uma estrutura linear somente, mas organizam-se hierarquicamente em sintagmas que podem conter outros sintagmas até chegar às palavras simples. Para representar essa estrutura graficamente, podemos utilizar algumas formas de representação, chamados de marcadores sintagmáticos. Os sistemas de representação mais utilizados são o que utiliza parênteses e o arbóreo, que é preferido por facilitar a visualização da estrutura. Dessa forma, uma frase como: “O menino come muito” pode ser representada com parênteses: [(O menino)(come muito)]. Ou representá-la como árvore: (24) Árvore I x PPP P y z Z Z "b " b o menino come muito Dessa maneira ficariam representados os constituintes imediatos de Bloomfield. para interpretá-lo, faremos dessa maneira: os elementos com os quais as frases foram construídas são, “o”,“menino”, “corre”, “muito”. As palavras “o” e “menino” são os constituintes imediatos de uma construção “o menino”. Os galhos que levam a eles derivam diretamente de um nódulo “y”; as palavras “corre” e “muito” são constituintes imediatos ligados pelo nódulo imediatamente superior “z”; e as duas construções, “o menino” e “corre muito” são os constituintes imediatos de uma construção de nível superior: a própria frase, 11 e ambas derivam desse nódulo “x”. Utilizando esse tipo de modo de representação unindo-o ao vocabulário técnico da sintaxe contemporâne (SN para sintagma nominal, SV para sintagma verbal, SV e SA para o verbal e o adjetival, respectivamente), é possível representar as árvores que demonstram as duas construções possíveis para a sentença ambígua em (21): (25) Árvore II S` ``` `` SV SN XX "b " b Det N XXX V SN PP o menino recebeu SN HH H a menina PP SP PPP P com um sorriso Ou numa representação em parênteses: (26) [ S [ SN [ Det o ] + [ N menino ]] + [ SV [ V recebeu ] + [ SN [ SN a menina ] + [ SP com um sorriso ]]]] A expressão acima portanto mostra a interpretação em que a menina sorri e a próxima é o menino que sorri: (27) Árvore III S (((hhhhhh (((( h SV ` SN "b " Det o (28) b N menino V % % SN ``` `` ` HH H recebeu a menina SP PPP P com um sorriso [ S [ SN [ Det o ] + [ N menino ]] + [ SV [ V recebeu ] + [ SN a menina ] + [ SP com um sorriso ]]]] 12 Os marcadores sintagmáticos acima, portanto, explicitam as duas estruturas possíveis para a ambigüidade de (21). Eles fornecem dois tipos de informação. A primeira é que cada constituinte pertence a uma determinada classe, relacionando-se com as outras hierarquicamente, essa relação é chamada de dominância. Em (25), o SN, por exemplo, domina tanto “o” e “menino”, como “a menina”, ou seja, esses são constituintes da classe SN. Quanto às relações lineares de esquerda para a direita, chamamo-las, relações de precedência. 6 Gramática de Estrutura Sintagmática Partindo, portanto, do princípio que as sentenças são formadas por constituintes, e constituintes de categorias diferentes (SP, SN, SV, SA), Chomski construiu um sistema de regras gerativas que fixam explicitamente a correta estrutura constituinte das frases. Através dessas regras, de um léxico e desses constituintes, poder-se-ia gerar uma gramátcia. E seria esse precisamente o problema do lingüista: “descobrir a gramática que define todas as orações gramaticais de determinadas línguas, como o português, e apenas elas.” [1, pp. 44]. Como parte do esforço de formalizar sua teoria gramatical, Chomsi colocou sua gramática como fazendo parte das gramáticas de reescritura irrestrita, ou seja, consiste de um vocabulário auxiliar, um vocabulário terminal e um conjunto de regras de reescritura que se aplicam a cadeias de elementos (constituintes). Bach afirma que: “se uma língua (isto é, um conjunto de cadeias) pode ser definida por qualquer sistema formal explícito, ela pode ser definida por um sistema de reescritura irrestrito.” Então a Gramática de Estrutura Sintagmática se propõe, como subconjunto das gramáticas de reescritura irrestrita, a moldar o conhecimento que o falante tem de sua língua a respeito da gramaticalidade das sentenças, e a partir dessa gramática dizer qual é a língua definida. Note-se que há uma diferença brutal entre “moldar o conhecimento” e dizer que a estrutura sintagmática ocorre na mente do falante. as gramáticas de estrutura sintagmática não se prestam a definir realidades psicológicas, ou neurológicas, mas sim representar a estrutura das línguas naturais. Tendo em mente a tarefa do lingüista de descrever uma gramática em particular, Radford [5, pp. 122] enuncia: Adquirir uma linguagem involve adquirir um sistema finito de 13 regras que geram o conjunto infinito de sentenças bem-formadas na linguagem. dessa maneira, a tarefa do lingüista de descrever um gramática em particular se coloca em articular um sistema de regras de formação, interpretação e pronunciação de sentenças que gerarão o conjunto infinito de sentenças bem-formadas na linguagem. Trataremos apenas das regras que dizem respeito à sintaxe, deixando de lado as regras fonológicas, semânticas, etc. Assumindo que as sentenças podem ser bem representadas por marcadores sintagmáticos (como as árvores), faz-se necessário então regras que os produzam. tomando como exemplo uma sentença como (29) A criança comeu o doce vermelho em casa As regras, como formalizadas por Chomsky, assumem a forma X → Y Z que significa: X pode ter como constituinte imediato um Y imediatamente seguido por um Z. Como uma regra como essa, seria possível formar S → SN SV, significando “uma sentença [S], forma-se tomando um Sintagma Nominal [SN] e um Sintagma Verbal [SV], gerando um marcador sintagmático parcial: (30) Árvore IV S ,l , l SN SV Podemos colocar após essa regra, uma outra, como SV → V SN, indicando que um Sintagma Verbal é formado por um verbo seguido de um Sintagma Nominal, ficando: (31) Árvore V S Q Q SN SV V @ @ SN Logo após, se formularmos uma regra como SN → D N (SP), deixamos 14 como opcional a derivação do SN que pode vir a ser tanto um D N, quanto um D N SP, portanto: (32) Árvore VI S HH H SN %e % e D SV "b " " b b N V SN H H H D N SP Por sua vez, uma regra como SP → P N: (33) Árvore VII S !aa !! a SN SV %e % e HH H D N V SN H HH D N SP %e % e P N Além dessas regras categoriais, nossa gramática também deve conter um léxico, portanto: (34) N : criança, menino, festa V : comeu D : a, aquele P : na Qualquer um desses itens lexicais pode ser inserido na categoria terminal correspondente, no fim das árvores, formando um marcador sintagmático como o que se segue, que utiliza as regras vistas acima, o léxico, e as categorias sintagmáticas: 15 (35) Árvore VIII S XXX X X X SN Q Q D o N menino SV XXX X X SN V comeu PPP P P D aquele N doce SP ##cc P N na festa Se expandirmos o léxico ou as regras de nossa gramática, ela ficará conseqüentemente mais poderosa. Na categoria lexical dos Nomes poderíamos colocar: avô, mãe, criança; nos verbos: pegou, pediu, perdeu; na dos determinantes: a, um, uma; na das prepocições: no, para com. Com essas modificações, seria possível formar sentenças como: (36) a. b. c. O menino levou a avó para festa Um avô perdeu a avó na festa A mãe pegou uma criança Note-se que como o SP é opcional (38c) é permitido. É claro que essa grmática é extremamente pequena. para cirar um conjunto de regras para gerar as sentenças em português, precisaríamos de algumas sentenças de regras, juntamente com um aumento do léxico, com seus milhares de palavras. mas mesmo assim, a estrutura sintagmática não daria conta de todas as relações lingüísticas. Por conta disso desenvolveu-se uma teoria transformacional, acoplada à gramática de estrutura sintagmática, mas que sugerem uma série de outras implicações que extrapolam o tema “estrutura de constituintes” aqui abordado. A gramática acima é só um pequeno exemplo de como se pode tratar as línguas naturais, tendo por base a estrutura de constituintes de uma sentença. 16 Referências [1] Bach, E. 1974. Teoria Sintática. Rio de Janeiro: Zahar Editores. [2] Bloofield, L. 1961. Language. Nova York: Holt, Rinegart and Winston. [3] Graffi, G. 1994. Sintassi. Bolonha: Il Mulino. [4] Lyons, J. 1979.Introdução à Lingüística teórica. São Paulo: Companhia Editora. [5] Radford, A. 1992. Transformational Grammar. Cabridge: Cambridge University Press. [6] Raposo, E. P. 1979. Introdução à Gramática Generativa. Lisboa: Moraes Editores.