O Conceito de Unidade Lexical Jorge Baptista Universidade do Algarve Faculdade de Ciências Humanas e Sociais Laboratório de Engenharia da Linguagem Instituto Superior Técnico Centro de Automática da Universidade Técnica de Lisboa [email protected] http://w3.ualg.pt/~jbaptis 1 1. Unidade x Léxico x Sistema ‘first things first’ a definição de unidade lexical depende de e ao mesmo tempo determina o objecto de estudo da linguística diferentes perspectivas de abordagem ao fenómeno da linguagem acarretam diferentes visões da forma como ela está organizada e o papel que o léxico nela desempenha 2 definir as unidades de um sistema é sempre o resultado de uma posição teórica de partida sobre a natureza do sistema, a metodologia para o analisar, os resultados que se espera obter, etc. 3 a visão do léxico como lista de formas e de propriedades, independente dos outros componentes da linguagem é, em si mesma, decorrente da ideia de que a linguagem se pode organizar em vários níveis/módulos/componentes relativamente independentes uns dos outros 4 a minha proposta: reflexão em conjunto sobre o objecto de estudo da linguística observação sobre a complexidade de noção de unidade lexical reflexão sobre consequências para o ensino da língua (com especial referência ao ensino da língua materna) à luz dos pontos anteriores 5 2. Acesso à Língua via Linguagem (prévio) distinção entre língua (conhecimento interiorizado e partilhado pelos membros de uma comunidade linguística) e linguagem (realização/manifestação exteriorizada dessa competência) ninguém nasce ensinado, e muito menos a saber falar uma língua: a aprendizagem da língua materna faz-se pela exposição a uma língua 6 a descrição linguística só pode ser feita a partir das realizações concretas (discursos), já que não se pode aceder directamente à língua (conhecimento interiorizado e partilhado pela comunidade) 7 é a partir da caracterização dos discursos que é possível construir a ‘abstracção’ teórica que constitui a noção de língua isto não significa que não existe língua, apenas que ela não é directamente observável, pelo que tem de ser concebida como um objecto teórico 8 não é possível falar da linguagem sem utilizar a própria linguagem (as línguas naturais não têm uma metalinguagem externa) por essa razão, só é possível caracterizar os discursos em termos de semelhanças e diferenças, ou seja, em termos combinatórios 9 1. a descrição dos discursos procede em dois níveis básicos: a determinação dos sons da linguagem e das respectivas restrições combinatórias, de um modo que não interfere no significado das expressões 2. a determinação de sequências de sons e das respectivas restrições combinatórias de um modo que afecta/está ligado ao significado das expressões 10 Exemplo: a cadeia sonora pode ser decomposta em unidades discretas (fones) meramente na base da percepção de que duas sequências de sons são entendidas como iguais ou diferentes [vi pátu] [vi gátu] 11 para tal, o significado da expressão – ou mesmo a sua existência na língua – é (praticamente) irrelevante: [pÉt] [gÉt] 12 os fones enquanto propriedades físicas da cadeia sonora não formam unidades discretas (p. ex. vogais) o seu valor linguístico é função destas oposições distintivas: são elas e a estrutura das relações entre si que definem os fonemas da língua – as suas unidades discretas a partir das combinações em que entram é que é possível determinar elementos portadores de significado 13 Exemplo: [vi pátu] [vi u pátu] leva a considerar a existência de dois elementos : [ ] [u ] ou, em alternativa: [ ~ ] (nasalidade) [ _ ] (ausência de nasalidade) 14 na medida em que estes se opõem regularmente a outros elementos: [vi pátu] [vi u pátu] [vi um pát] [vi uS pátuS] [ve pátu] [ve u pátu] [ve um pát] [vê pát] ... é possível constituir conjunto de oposições: 15 pátu pátuS S pát um umS pátS S u uS 16 as regularidades combinatórias observáveis levam, por seu turno, a agrupar sequências de sons em classes: (X-o, -a, -os, -as)N (W-o, -as, -a, -amos, ... -r)V (o, um)Det X Todas as categorias gramaticais tradicionais podem ser obtidas desta forma 17 3. Unidades lexicais vs. palavras gramaticais distinção entre elementos lexicais “plenos” e elementos lexicais de natureza gramatical candidatos ao estatuto de elementos gramaticais: ‘morfemas-presos’ (de tempo-modo-aspecto e pessoa-número), preposições, pronomes, determinantes, etc. 18 Que estatuto atribuir aos elementos gramaticais ? [dificuldades:] ausência de uma metalinguagem externa; (não-) pertinência do critério referencial intuitivamente, há uma distinção clara entre: carro, ler, aberto, depressa e : de, um, -mos, ele 19 os elementos gramaticais constituem um conjunto finito, de dimensão (relativamente) reduzida, enumerável em extensão e evoluem lentamente, os elementos ‘lexicais’ são a priori em número muito maior, que evolui em função da realidade extralingística, podem sempre ser acrescentados por neologia ou cair em desuso 20 = por outro lado, é evidente que os elementos gramaticais veiculam um determinado tipo de informação: O Zé leu o livro O Zé [LER + passado + perfeito] o livro o facto de em Português esta informação ser veiculada por ‘morfemas presos’ é acidental; noutras línguas estas informações são expressas por palavras independentes (com acentuação própria) 21 da mesma forma, nas combinações com verbo auxiliar + verbo, a informação gramatical é veiculada por um ‘morfema livre’: O Zé (está + anda + continua) a ler o livro O Zé (acabou + parou) de ler o livro O Zé (começou + desatou) a ler o livro 22 1. em contrapartida, há claramente elementos que, consoante a combinação em que entram: não veiculam nenhuma informação : O Zé leu o livro O Zé gosta de + o livro em que de é claramente aqui uma preposição (‘que vem antes de’) 2. veiculam de facto uma informação precisa: O Zé veio de Faro 23 1. 2. A distinção entre ‘morfema preso’ e ‘morfema livre’ também não é suficiente contracções: dos (= de + os) palavras compostas: O Zé leu o livro antes de adormecer 3. contracção de palavras compostas com palavras simples: O Zé leu o livro antes da Ana antes da (= antes de + a) 24 = certos sufixos estão sistematicamente relacionadas com frases em que o elemento seu homólogo é uma palavra independente: N0 ter a qualidade de ser Adj N0 ter a Adj-n-idade 25 a distinção entre as palavras compostas (que ortograficamente se representam por duas ou mais palavras gráficas / com acento tónico independente) e as palavras simples também não é linear: O Zé vai (amanhã + de manhã) a Lagos a razão pela qual amanhã se escreve sem espaço em branco é acidental, convencional, histórica e meramente ortográfica (poderia, p.ex., escrever-se *à manhã como em à noite) 26 as palavras compostas, por seu turno, têm o MESMO estatuto, como unidades lexicais, que as palavras simples a composição afecta TODAS as categorias gramaticais: O Zé leu um (livro + romance policial )N O Zé é muito (charmoso + bem-parecido)Adj Isso só depende de (nós + a gente)Pron O Zé caminhou (por + ao longo de)Prep o caminho O Zé comeu (dois + vinte e dois)Num bolinhos O Zé leu o livro (por + em virtude de)Conj querer saber mais sobre o assunto ... 27 o número de palavras compostas é claramente muito superior ao número de palavras simples os dicionários usuais, em grande medida, subestimam o número de palavras compostas e registam apenas as que são semanticamente opacas 28 a determinação de uma unidade lexical composta faz-se com base no facto de apresentar restrições combinatórias relativamente às propriedades que seria à partida possível observar em sequências livres formadas pelas mesmas categorias gramaticais 29 finalmente, certas combinações verbonome devem ser consideradas como um ‘bloco’: O Zé (foi para os anjinhos + está a fazer tijolo + bateu a bota + esticou o pernil + já não está entre nós + está na paz do Senhor + ...) O Zé e a Ana (juntaram os trapinhos + deram o nó + ... ) 30 o seu significado não é composicional, i.e. não pode ser calculado com base na soma do significado que, noutros contextos, cada uma das palavras poderia apresentar apresentam fixidez combinatória, i.e. não permitem as variações formais que se esperaria encontrar, dada a estrutura e a natureza sintáctica dos elementos desta combinatórias 31 No caso destas ‘frases fixas’ o problema principal é que a unidade lexical não é apenas uma mera combinação de palavras, mas sim uma frase, com um verbo, com flexão relativamente livre e um sujeito também ele distribucionalmente livre (humano). 32 parece, pois, que o léxico deverá conter não só as palavras simples, mas também as palavras compostas e todos os elementos gramaticais que contribuem para a informação veiculada pelo discurso haverá uma forma de estruturar o léxico num sistema descreva a linguagem, tendo em conta essa sua composição? 33 4. Linguagem e Informação a ideia principal de Harris é a que a linguagem veicula informação o conceito matemático de informação, tal como este autor o adopta para a descrição da linguagem, está ligado à observação de os elementos da língua não se combinam indiferentemente uns com os outros, apresentando importantes desvios a partir da equiprobabilidade combinatória 34 estes desvios criam aquilo a que se chama a redundância da informação do sistema ela baseia-se nas restrições combinatórias observáveis entre os elementos do sistema as combinações de elementos baseiam-se numa assimetria fundamental: a noção de operador e de argumentos, decorrente da ordem parcial de entrada das palavras numa frase 35 operadores são palavras que requerem a presença de uma ou mais palavras (os seus argumentos) para entrarem na frase as unidades lexicais são, pois, de dois tipos fundamentais: as palavras que funcionam como operadores e as palavras que não podem funcionar como operadores (argumentos elementares) 36 operadores de 1ª ordem de 2ª ordem ler livro em cadeira alto mesa ___________ árvore gosta de sol ante de Zé argumentos elementares os discursos são o resultado de operações (funções) dos operadores sobre os seus respectivos domínios de argumentos. 37 daqui decorre que a estrutura do léxico incluirá, além dos argumentos elementares (tipicamente nomes concretos), todas as restantes entradas lexicais (operadores) uma vez que estes operadores determinam uma construção, essas entradas lexicais não são propriamente PALAVRAS, mas sim FRASES, mais concretamente: FRASES ELEMENTARES 38 • • • • • cada operador determina a construção sintáctica da respectiva frase elementar: número de argumentos, tipo de argumentos, preposições que introduzem os complementos natureza distribucional dos argumentos propriedades transformacionais da construção 39 palavras derivadas entram muitas vezes em relações parafrásticas, de natureza transformacional: O Zé leu rapidamente o documento = O Zé fez uma leitura rápida do documento 40 tal faz pensar que a unidade lexical nem sequer será a palavra associada a uma categoria gramatical a categoria seria uma das formas de actualização sintáctica da mesma unidade lexical, transformacionalmente relacionadas: LE.R (-r V; -itura N; -itor N; -gível RAPID.O (-o Adj; -amente Adv) Adj) 41 desta perspectiva resulta que não há uma fronteira clara entre léxico, sintaxe e semântica cada unidade lexical (predicativa) tem de conter informação sobre a sua construção, as suas propriedades distribucionais e as suas propriedades transformacionais 42 Cada frase elementar é a expressão de um único predicado semântico a análise de um discurso é, pois, a sua decomposição nas frases elementares que lhe deram origem e a respectiva ordem parcial de entrada dos vários operadores 43 O Pedro prefere ler BD a ouvir música Quantos PREDICADOS tem esta frase? preferir (Pedro1, ler , ouvir) ler (Pedro2, BD) ouvir (Pedro3, música) Pedro1 = Pedro2 Pedro1 = Pedro3 44 preferir Onoo ler Onn Pedro1 Pedro2 BD ouvir Onn Pedro3 música O Pedro prefere ler BD a ouvir música NB: representação muito simplificada 45 Bibliografia Baptista, J. 1994. Estabelecimento e Formalização de Classes de Nomes Compostos. Dissertação de Mestrado em Linguística Portuguesa Descritiva apresentada à Faculdade de Letras da Universidade de Lisboa. Lisboa : FLUL (não publicada). Gross, G. 1988. Degré de figement des noms composés. Langages 90: 57-72. Paris: Larousse. Gross, G. 1990. Définition des noms composés dans un léxique-grammaire. Langue Française 87: 84-90. Paris: Larousse. Gross, G. 1996. Les expressions figées en français. Paris: Ophrys. Gross, M. 1975. Méthodes en syntaxe. Paris: Hermann. Gross, M. 1981. Les bases empiriques de la notion de prédicat sémantique. Langages 63: 7-52. Paris: Larousse. Gross, M. 1982. Simple sentences.Text Processing. Proceedings of Nobel Symposium 51, S. Allén (Ed.): 297-315. Stockholm: Almqvist & Wiksell International. Gross, M. 1988. La phrase élementaire et ses composants. Discussion de quelques exemples. La prédication séconde.Travaux de Linguistique 17:13-32. Paris/Gembloux: Duculot. Gross, M. 1991. Lexique et Syntaxe. Travaux de Linguistique 23: 106-132. Bruxelles: Duculot. Gross, M. 1996. Lexicon Grammar. In Brown, K e J. Miller (Eds.) Concise Encyclopedia of Syntactic Theories. Cambridge: Pergamon: 244-259. Harris, Z. S. 1976. Notes du Cours de Syntaxe. Maurice Gross (Trad.).Paris: Édition du Seuil. Harris, Z. S. 1981. Papers on Syntax. Henry Hiz (Ed.). Dordrecht: D.Reidel Publishing Company. Harris, Z. S. 1991. A theory of Language and Information. A Mathematical Approach. Oxford: Clarendon Press. Leeman, D. 1999. L’Unité lexicale dans la perspective harrissienne, in G. Petit (ed.) 1999. LINX 40: 117136. Paris: Univ. Paris 10. Marques Ranchhod, Elisabete, Uma imagem da Gramática. Rev. Fac. Letras 15: 109-120. Lisboa: FLUL. 46