Fundamentos de Linguística comparada / Faculdade de Letras da UFMG ALÉXIA T. DUCHOWNY JACYNTHO L. BRANDÃO JÚLIO C. VITORINO SUELI M. COELHO FUNDAMENTOS DE LINGUÍSTICA COMPARADA UNIVERSIDADE FEDERAL DE MINAS GERAIS FACULDADE DE LETRAS BELO HORIZONTE/2012 1 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG SUMÁRIO p. Introdução 3 Texto 1A: Definindo Linguística comparada 8 Texto 1B: Arqueologias 18 Texto 2: Variação e mudança linguística 30 Texto 3: O método histórico‐comparativo 41 Texto 4: Tipologia linguística 52 Texto 5A: Famílias linguísticas do mundo 62 Texto 5B: As línguas indo‐europeias 75 Texto 6: A reconstrução do indo‐europeu 94 Texto 7A: Sociedade e cultura indo‐europeias 109 Texto 7B: Fonologia e morfologia indo‐europeias 120 Texto 8A: O sistema de casos 134 Texto 8B: A categoria de caso no indo‐europeu 141 Texto 9A: Contato linguístico 152 Texto 9B: Pidgins e crioulos 164 Texto 10: Sistemas de escrita 174 2 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG INTRODUÇÃO Jacyntho Lins Brandão (Fale/UFMG) Houve uma vez em que os estudantes de Letras da UFMG mandaram confeccionar camisas com os dizeres: THE BOOK IS ON THE TABLE LE LIVRE EST SUR LA TABLE EL LIBRO ESTÁ SOBRE LA MESA DAS BUCH IST AUF DEM TISCH TO BIBΛION EΣTIN EΠI THI TΡAΠEZHI IL LIBRO È SUL TAVOLO LIBER SUPER MENSAM EST O LIVRO ESTÁ SOBRE A MESA Como você vê, uma brincadeira divertida com uma das frases que mais costumava aparecer em livros tradicionais para ensino de línguas estrangeiras, sobretudo inglês. As oito línguas faziam parte do rol das habilitações ofertadas na Faculdade de Letras, envolvendo, além das modernas, duas antigas (o latim e o grego clássico) e dois alfabetos diferentes (o grego e o latino). No caso do grego, a transliteração para o alfabeto latino é: TÒ BIBLÍON ESTÌN EPÌ TÊI TRAPÉZĒI.1 Mas, mesmo com essa diversidade, não era difícil entender que as frases correspondiam umas às outras praticamente palavra por palavra. Antes de tudo, porque todas são línguas de uma mesma família, a indo‐europeia, representada na relação por três de suas dez ramificações: o itálico (com o latim e as quatro línguas dele procedentes: francês, espanhol, 1 A duração das vogais, quando for importante marcá‐la, será indicada assim: a) vogais longas: ā/ē/ī/ō/ū (o traço horizontal sobre elas se chama macro); b) vogais breves: ă/ĕ/ĭ/ŏ/ŭ (o símbolo sobre elas se chama braquia). 3 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG italiano e português, chamadas de línguas românicas); o germânico (com o inglês e o alemão); e o grego. Na simples comparação, considerando a ordem das palavras e sua semelhança, não será difícil que você descubra a correspondência entre as mesmas. Experimente: QUADRO 1 Correspondências de “O livro está sobre a mesa” com o português Português Inglês Francês Espanhol Alemão Grego Italiano Latim O the le el das to il ‐ LIVRO book livre libro Buch biblíon libro liber ESTÁ is est está ist estìn è est SOBRE on sur sobre auf epì su super A the la la dem têi il ‐ MESA table table mesa Tisch trapézēi tavolo mensam Você deve ter encontrado dois problemas: 1. Com relação ao italiano, sul constitui uma contração da preposição su e do artigo il (do mesmo modo que, em português, temos do < de o e no < em o).2 2. Você deve ter notado que o latim não possui artigos e adota uma ordem diferente dos termos da oração: em vez de O livro Sujeito está verbo sobre a mesa locativo a ordem normal em latim é Liber Sujeito super mensam locativo est. verbo Tendo constatado essas duas diferenças, apenas para que a correspondência no quadro se faça palavra a palavra, anotou‐se a preposição su separada do artigo il, no caso do italiano, e escreveram‐se os termos latinos na ordem dos demais, deixando em branco os espaços em que as outras línguas apresentam artigos. 2 Aos poucos você se acostumará com os símbolos que utilizaremos: B < A indica que a palavra B procede de A, o que pode ser representado também assim, A > B. A ordem da procedência segue sempre a direção indicada pela seta. 4 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG Agora observe na terceira coluna do QUADRO 1 as palavras que designam ‘livro’. Não será difícil constatar que elas se distribuem em três conjuntos, considerando‐se sua semelhança: o primeiro, com cinco termos; o segundo, com dois; e o terceiro, com apenas um. Vamos organizá‐los: 1 livro livre libro libro liber QUADRO 2 Palavras para ‘livro’ 2 book Buch 3 biblion Repare que essa distribuição corresponde exatamente às famílias linguísticas referidas antes: 1. latim e as línguas românicas; 2. línguas germânicas; 3. grego. As semelhanças, portanto, não são fortuitas, mas decorrem do fato de que: a) o francês, o italiano, o espanhol e o português originaram‐se do latim; b) o inglês e o alemão têm uma origem comum; c) o grego constitui um grupo isolado dentre as demais línguas indo‐europeias Mesmo que nos três grupos as palavras para designar ‘livro’ sejam diferentes, têm elas em comum o fato de que, na origem, nomeavam o material sobre o qual se escrevia: a) O termo grego biblíon deriva de byblos, ‘papiro’, a planta natural do Egito com a qual se produzia a folha (em grego khárta) em que se escrevia e com as quais se produziam os livros. O plural biblía passou para as línguas modernas como nome do conjunto de livros sagrados de judeus e cristãos, a Bíblia. b) Para book e Buch3 reconstitui‐se, no germânico, a palavra *bōks4, relacionada com *bōka, ‘faia’, porque os povos germânicos usavam cascas dessa árvore para escrever. De *bōks Em alemão, todos os substantivos se escrevem com inicial maiúscula: Buch, Tisch etc. Um asterisco antecedendo uma palavra indica que ela não é documentada, mas reconstituída, pelo método comparativo, a partir das palavras existentes nas línguas filhas. Isso se faz sistematicamente nos estudos de 3 4 5 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG provêm os termos do inglês antigo bōc (donde, por sua vez, procede book), alemão Buch, holandês bock, sueco bok etc., todos significando ‘livro’. c) A palavra latina liber significa originalmente ‘casca’, a ‘entrecasca’ em que se escrevia antes da adoção do papiro, passando a nomear, em seguida, o próprio livro. Os termos das línguas românicas procedem de librum, o qual dá origem a libro, em italiano e espanhol, livro, em português, e livre, em francês. Examine agora a última coluna do QUADRO 1, agrupando os termos de acordo com sua semelhança. Você encontrará quatro tipos, numa distribuição diferente da anterior: mensam QUADRO 3 Palavras para ‘mesa’ table Tisch trapézēi mesa table mesa tavolo Fica claro que as palavras do espanhol e do português, mesa, provêm do latim mensa. Entretanto, também as palavras da segunda coluna têm uma origem latina: tabŭla significa ‘tábua’, ‘tabuleiro’, estando na origem do italiano tavolo e do francês table (o português tem, da mesma origem, o termo tábua, assim como o espanhol, tabla; recorde‐se ainda que távola, com o significado de ‘mesa’, existe também em português, embora seja um arcaísmo, fossilizado, por exemplo, na referência ao Rei Artur e “os cavaleiros da távola redonda”). O inglês table procede do francês, por empréstimo, como acontece com grande parte do vocabulário daquela língua, em consequência do domínio normando sobre as Ilhas Britânicas (1066‐1154). O caso do alemão também se deve a um longo processo de empréstimos: (a) o termo original é o grego dískos, ‘disco, objeto circular’, ‘disco de arremesso’ (como continua a ser linguística histórico‐comparativa. No Texto 6, entenderemos melhor os procedimentos de reconstituição de palavras. 6 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG usado nos jogos olímpicos); (b) o latim discus, ‘prato’, ‘travessa redonda’, constitui um empréstimo da palavra grega citada; (c) o germânico tomou emprestado o termo latino, *disku/diskuz, significando ‘prato’, ‘travessa’, ‘tábua de comida’, ‘bandeja’, ‘mesa’, donde provém a palavra do antigo‐alto‐alemão tisk/tisc, ‘mesa’, ‘prato’, ‘travessa’, ‘trípode’, ‘bandeja’, origem do termo do médio‐alto‐alemão tisch, ‘mesa’, ‘mesa onde se come’ e do alemão Tisch, ‘mesa’. É curioso que em alemão existe também uma outra palavra para ‘mesa’, ‘tábua’: Tafel, que procede do médio‐alto‐alemão tavele/tabele, por sua vez proveniente do antigo‐alto‐alemão tavala/tabala, empréstimo do latim tabŭla. Veja como esses fatos linguísticos sugerem que os germanos não possuíam uma palavra para ‘mesa’ e parecem ter tomado dos romanos tanto o objeto, quanto sua denominação. Enfim, o grego trápeza é uma abreviação de tetrapéza, isto é, ‘de quatro pés’, o que remete para a forma da mesa. Não continuaremos a explorar a origem dos demais termos de nossas oito frases. Mas, como você pôde observar, tudo que fizemos até aqui teve uma perspectiva comparativista. Esse será o vetor no nosso curso, com ênfase nas línguas indo‐europeias. Última observação: a atividade de comparação exige treinar a capacidade de observar, para perceber as semelhanças e diferenças. Como nosso tema é a comparação linguística, então nosso principal objetivo é desenvolver em você essa capacidade de observar o que acontece nas línguas. Trata‐se de uma atitude muito importante para que se torne capaz de observar também o que acontece na nossa própria língua, o português. Nas unidades seguintes, você tomará contato com muitas informações novas e conhecerá muitos fenômenos linguísticos. É evidente que não se espera que você aprenda as tantas línguas a que se fará referência, mas sim – o que é o mais importante – que tome as línguas e a linguística como objeto de conhecimento e de reflexão. Afinal, o homem é um animal que fala, logo, as línguas são um dos traços mais preciosos da condição humana. Ponto para você que escolheu estudar Letras! 7 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG DEFININDO LINGUÍSTICA COMPARADA Aléxia Teles Duchowny (Fale/UFMG) INTRODUÇÃO Ao tentar entender o que é Linguística comparada, é bem provável que você encontre uma definição diferente em cada autor que consultar. Até mesmo o nome que se dá a esta área do saber pode variar: Linguística comparativa, Linguística genética, Linguística contrastiva, Filologia comparativa... Para Robert Trask (2004), linguista americano, a Linguística comparada interessa‐se por identificar a origem comum de um grupo de línguas. O trabalho de reconstrução, que você verá no Texto 6 com mais detalhes, permite estabelecer as características de línguas que já não existem mais. É possível entender, então, as mudanças que levam as línguas a se diferenciarem e a originarem suas línguas‐filhas. Aqui vamos entender a Linguística comparada de uma maneira bem mais abrangente do que Trask (2004). Para nós, trata‐se de uma subárea da Linguística geral, podendo ser descritiva (sincrônica), histórica (diacrônica), e também especializada. Ela identifica diferenças, semelhanças e inter‐relações entre duas ou mais línguas, além de verificar se as línguas em questão possuem um ancestral comum. Além do mais, qualquer nível gramatical — lexical, morfológico, semântico, sintático, fônico — pode ser comparado. Vejamos cada uma dessas subpartes da Linguística comparada. 1 A Linguística descritiva comparada A Linguística descritiva comparada analisa línguas específicas, sem levar em conta as mudanças e variações que toda língua sofre ao longo do tempo. Ela também se preocupa com a classificação das línguas conforme suas características estruturais, sendo chamada de Tipologia linguística, que você verá no Texto 4. No caso da Tipologia linguística, a 8 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG comparação não leva em conta a origem das línguas, mas sim suas características em comum. Vejamos alguns exemplos de estudo de Linguística descritiva comparada. John Catford, em 1980, comparou os sistemas de duas línguas diferentes, o inglês e o francês, assim como a ocorrência das preposições nas estruturas de cada uma das línguas. Este linguista escocês afirma que, em 12 mil palavras do francês, em tradução/correspondência com o inglês, das 134 ocorrências da preposição dans (“dentro”, em francês), 73% correspondem a in (“dentro”, em inglês), 19% a into (“para dentro de”, em inglês) e 8% a outras preposições. Quando dans é precedida por um verbo de movimento, e seguida por um substantivo de lugar, a correspondência com into é de 100%. Para entendermos o próximo exemplo, precisamos relembrar do conceito de sujeito nulo: LEMBRETE ! O conceito de sujeito nulo (cf. Cunha e Cintra, 2001) O que é mesmo sujeito nulo (também chamado de oculto, por alguns autores)? Em português, dizemos: (1) Nós fomos à praia. Mas também é possível dizer, sem alteração de sentido (2) Fomos à praia. Em (1), a posição de sujeito está preenchida pelo pronome nós. Já em (2), houve o apagamento do sujeito, o que nos leva a afirmar que esta é uma frase de sujeito nulo. Em outras palavras, o sujeito nulo é aquele que não está materialmente expresso na oração, mas pode ser identificado No caso em questão, a identificação é feita pela desinência verbal ‐mos. 9 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG O aluno da UFRJ Pablo Teixeira, em sua dissertação de mestrado, investigou o fenômeno do apagamento do sujeito da frase na fala espontânea do português do Brasil e do hebraico moderno. A capacidade de apagamento do elemento que está na posição de sujeito na estrutura sintática, conhecida como fenômeno do sujeito nulo, é uma característica compartilhada por muitas línguas. Dois foram os fatores que motivaram o autor a realizar a sua pesquisa comparativa: (i) o distanciamento aparente entre as duas gramáticas e (ii) a produtividade do fenômeno de apagamento, comprovada por vários outros trabalhos sobre as duas línguas. Mas, até então, nenhuma das pesquisas tinha tido cunho comparativo. Assim, ele selecionou e transcreveu doze entrevistas retiradas da internet; sete falantes nativos do português falado no Brasil e cinco do hebraico falado em Israel. A partir de seu corpus, o pesquisador verificou que duas línguas tão diferentes uma da outra apresentam vários comportamentos em comum em relação ao apagamento do sujeito. O hebraico e o português se mostraram favoráveis ao preenchimento da posição de sujeito em detrimento do apagamento. Veja como é em hebraico: Ani lomed ivrit eu estudar‐pres. ‐ m. s. hebraico “Eu estudo hebraico” Já a estrutura abaixo é inaceitável, diferentemente do português, em que é possível a estrutura “Estudo hebraico”, sem a presença explícita do sujeito “eu”: *Lomed ivrit. Nas duas línguas, os fatores tempo e pessoa também exerceram papel fundamental na realização do fenômeno do apagamento do sujeito. O tempo presente em ambas as línguas revelou taxas de ocorrência de sujeitos nulos menores do que as taxas de preenchimento. Mas não só semelhanças foram verificadas pelo pesquisador. Em relação ao tempo passado, há no hebraico maior número de apagamento do sujeito do que no português. De 10 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG fato, em hebraico, o passado é o tempo mais favorável ao apagamento do elemento na posição de sujeito. O autor também afirma que quer continuar a pesquisa e verificar, futuramente, o funcionamento do preenchimento do sujeito em frases no futuro. Através da ótica comparativa, P. Teixeira colaborou para a construção de um panorama geral sobre o fenômeno de apagamento de sujeito das duas línguas. Você deve ter observado que a Linguística descritiva comparada é muito importante, tanto para a Linguística comparada como um todo, quanto para a Linguística comparada histórica. Se, por exemplo, queremos reconstruir a origem de dadas línguas, é preciso comparar, primeiro, as descrições dessas línguas, não é mesmo? Agora, vejamos como se realiza a comparação linguística diacrônica. 2 A Linguística histórica comparada Vamos tentar entender a vertente histórica da Linguística comparada a partir da sua trajetória. Conforme D´Avino (2003), apesar de as línguas e as linguagens humanas terem suscitado interesse entre filósofos, gramáticos e estudiosos em geral, foi só no final do século XVIII, com o Romantismo, que a história das línguas passa a receber mais atenção dos pesquisadores. Os alemães Friedrich Schlegel e Franz Bopp colaboraram bastante para a nossa disciplina, com a publicação de obras que tratavam das relações de parentesco entre as línguas e suas origens. Rasmus Rask e Jacob Grimm foram autores das primeiras gramáticas históricas conhecidas. Nelas, a ênfase era sempre o nível fonético. A Linguística histórica comparada, em geral, busca identificar e entender as relações genéticas, de parentesco, entre duas ou mais línguas. Línguas parentes são aquelas que derivam de uma mesma língua anterior. Essa língua anterior pode ser chamada de língua‐ mãe ou de protolíngua. 11 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG Veja o esquema abaixo: A e B são períodos posteriores no tempo em relação à língua‐mãe. A e B podem, então, ser entendidas como continuações divergentes da língua inicial e podem, por sua vez, também se tornarem línguas‐mães se derem origem a outras línguas. Veja: Aqui, C, D, E, F e G são subgrupos distintos de línguas irmãs, cujas línguas‐mães são A e B, por sua vez línguas irmãs da língua‐mãe. O modelo de árvore linguística, como visto acima, tem uma influência muito forte nos estudos comparativistas e pode variar muito. Ao longo do nosso curso, você terá a oportunidade de conhecer vários exemplos de árvores. O estudioso alemão August Schleicher, no século XIX, foi um dos primeiros a montar uma árvore linguística do Indo‐ europeu, o grupo linguístico que receberá a maior ênfase na nossa disciplina. 12 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG Veja abaixo: FIGURA 1: Árvore linguística do Indo‐europeu de A. Schleicher Fonte: Clackson (2007, p. 10) Para este professor da Universidade de Praga, que também era botânico e naturalista, haveria uma língua‐mãe para cada grupo ou subgrupo de línguas. As línguas seriam como os seres vivos: crescem, envelhecem e, finalmente, morrem. Hoje estas ideias não são mais aceitas, mas seu papel foi fundamental para o desenvolvimento da linguística comparada, e sua Gramática comparativa das línguas indo‐europeias (1862) é um marco para a Linguística histórica comparada. Importante também para a evolução dos estudos de Linguística histórica comparada é a tese neogramática. No final do século XIX, na Universidade de Leipzig, na Alemanha, um grupo de estudiosos vai rejeitar as orientações comparativistas de A. Schleicher e de seus seguidores. As primeiras hipóteses dos neogramáticos eram de que as leis fonéticas não apresentavam exceção. Como explica Robbins (1981, p. 321), para os neogramáticos, “dentro de certos limites geográficos e entre certas datas, uma mudança de um som para o outro em uma língua atingiria do mesmo modo todas as palavras contendo o som no mesmo ambiente fonético de outros sons.” Posteriormente, a hipótese da regularidade da mudança sonora será criticada e reformulada, tendo Hugo Schuchardt e Jules Gilliéron como alguns destes críticos. Afinal, as exceções eram inegáveis e a teoria tão genérica dos neogramáticos se mostrou 13 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG insuficiente para dar conta da complexidade e da multiplicidade das causas dos fenômenos linguísticos. Os estruturalistas vão se dirigir em direção oposta aos neogramáticos. O nome mais importante desta linha é Ferdinand de Saussure, que vai ter um impacto enorme na Linguística do século XX. O Estruturalismo, entre tantas outras importantes contribuições para as Ciências Humanas, considerou não só as unidades relativas da língua, mas também suas inter‐relações. E finalmente chegamos aos séculos XX e XXI. Os estudos recentes da Linguística comparada histórica devem muito aos estudos anteriores, principalmente do século XIX. E eles não deverão parar. Apesar de termos respostas para muitas questões, ainda há muito o que descobrir! Você já pode ter inferido que a Linguística histórica comparada não pode existir sem o pressuposto do Princípio uniformitário, desenvolvido por Osthoff e Brugmann, em 1878. Para estes dois estudiosos, as propriedades gerais da linguagem e dos processos de mudança linguísticos têm sido os mesmos durante toda a história da humanidade. Imagine se as línguas pudessem mudar e variar sem restrições? Não seria possível estudar as línguas e estágios de línguas do passado e muito menos reconstruí‐las! Mas como sabemos que duas ou mais línguas têm parentesco e fazem parte de uma mesma árvore linguística? Com muita sorte, encontraremos textos preservados de estágios anteriores às línguas analisadas. Esse é o caso das línguas neolatinas ou românicas: a sua protolíngua, o latim, foi preservada pela escrita, a qual chegou até nós por meio de muitos textos. Se essas línguas ainda existem, sendo usadas para comunicação por uma comunidade de fala, podemos compará‐las e verificar se as semelhanças são, realmente, devido a uma mesma origem. O mais comum, porém, é não termos documentos escritos em muitas das línguas do mundo, sendo muita delas ágrafas, isto é, sem sistema de escrita. Nesse caso, será preciso 14 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG utilizar uma técnica para reconstruir certas características de períodos passados das línguas em análise, chamada de reconstrução interna. Vale lembrar que é quase impossível reconstruir uma protolíngua na sua totalidade. No Texto 6, explicaremos esta técnica com mais detalhes. Aqui, apenas uma amostra do que te espera a partir de dois exemplos. EXEMPLO 1 A língua S de Langacker Exemplo: A língua S (Adaptado de R. Langacker (1975)) Imaginemos que, na língua S, [tx] ocorre apenas antes de [i] e [t] nunca ocorre antes de [i]. As palavras [txik] e [tak], então, são gramaticais, enquanto que *[tik] e *[txak] não seriam produzidas por um falante nativo. Entretanto, foram encontrados os termos [matx] e [katx], que contrariam a regra geral, vista acima, “[tx] ocorre apenas antes de [i]”. Como você explicaria tais ocorrências? A explicação mais plausível seria a de que, em um estado anterior da língua, as formas [matx] e [katx] terminavam em [i], isto é, [matxi] > [matx] e [katxi] > [katx]. Assim, a partir de propriedades dos estados mais recentes de uma língua, foi possível reconstruir um estado anterior dessa mesma língua. Muitas vezes não temos atestação da língua‐mãe, isto é, não se conhece nenhum texto escrito nela. Nesse caso, será preciso reconstruí‐la através do método comparativo, que veremos com detalhe no Texto 3. Será preciso, primeiramente, identificar as línguas‐filhas recentes para depois compará‐las. A Linguística histórica comparada também se preocupa com a comparação de estágios de diferentes línguas e com a comparação das diferentes evoluções de seus elementos. Identificar, compreender e classificar as mudanças e as variações linguísticas também é sua função, não sendo necessário que as línguas comparadas tenham parentesco. Por exemplo: Podemos comparar o desenvolvimento do verbo be (“ser”) e do verbo have (“ter”) mais particípio passado, do antigo inglês, com os mesmos termos do inglês moderno. Em seguida, comparamos os resultados dessa primeira comparação com o 15 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG desenvolvimento desse mesmo tipo de construção no francês, isto é, avoir (“ter”) ou être (“ser/estar”) + particípio passado (adaptado de Ellis, 1966). 3 A Linguística comparada especializada É possível, também, comparar línguas diferentes entre si com objetivos específicos. Assim, a comparação entre textos escritos em pontos diferentes do percurso de uma língua com os textos de outra língua é feita porque pode trazer esclarecimentos para o melhor entendimento das línguas atuais e de sua origem. A Linguística comparada da tradução trata da assimetria entre línguas quando em situação de tradução. O contato entre línguas é outra área que gera questões muito interessantes para o linguista comparativista. Entender melhor o bilinguismo, em que se analisa o contato de línguas entre indivíduos, grupos ou comunidades, os empréstimos em geral e a distribuição geográfica de línguas e dialetos são também grandes e estimulantes desafios. Mas por que as línguas mudam continuamente? Como afirma Robbins (1981), ninguém contestará que as mudanças linguísticas ocorrem em todos os níveis gramaticais de todas as línguas. Mas as causas para este processo contínuo e complexo ainda não foram compreendidas pelos linguistas. Há muitas pesquisas sobre o assunto e pode‐se afirmar que dois fatores básicos geram mudança e variação: influência externas, como contato entre falantes, e processos internos, relacionados à transmissão das línguas de uma geração para outra. Você irá entender melhor estes fenômenos no Texto 2. Aqui termina a nossa aula. Vimos que a Linguística comparada pode ser dividida em três: a descritiva, a histórica e a especializada. Agora você já sabe o que esperar da nossa disciplina? Você imaginava que a Linguística comparada pudesse ser tão fascinante e abranger estudos tão diversos? 16 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG LEITURA COMPLEMENTAR A revista Veja, em novembro de 1994, publicou uma reportagem muito interessante sobre Linguística comparada aplicada às línguas indígenas brasileiras. Acesse o link abaixo e leia o texto com bastante atenção. http://veja.abril.com.br/acervodigital/home.aspx > ano de 1994 > mês de novembro > edição 1368 de 30/11/1994 > ir para esta edição (seta verde à esquerda da tela) > página 72. Referências CATFORD, John. A linguistic theory of translation: an essay in applied linguistics. London: Oxford University, 1965. Localização na biblioteca: 418.02 C359l.Pc (FALE) CLACKSON, James. Indo‐European Linguistics. Cambridge: CUP, 2007. CUNHA, Celso; CINTRA, Lindley. Nova gramática do português contemporâneo. Rio de Janeiro: Nova Fronteira, 2001. Localização na biblioteca: 469.5 C972n 2001 (FALE) D´AVINO, Rita. Introduzione a un corso di storia comparata delle lingue classique. Roma: Kappa, 2003. ELLIS, Jeffrey. Towards a general comparative linguistics. The Hague: Mouton, 1966. Localização na biblioteca: 410 E47t 1966 (FALE) LANGACKER, Ronald W. A linguagem e sua estrutura. Petrópolis: Vozes, 1975. Localização na biblioteca: 401 L271l.Pa 1975 (FALE) ROBBINS, Robert H. Linguística geral. Rio de Janeiro: Globo, 1981. Localização na biblioteca: 410 R657g.Pc 1977 (FALE) TEIXEIRA, Pablo P. Estudo comparativo sobre o fenômeno do sujeito nulo em português do Brasil e hebraico moderno. Dissertação de Mestrado (Linguística). UFRJ, 2008. Disponível em: www.dominiopublico.gov.br/pesquisa/DetalheObraForm.do?select_action=&co_obra=118471. Acesso em: 5 out. 2011. TRASK, Robert L. Dicionário de linguagem e linguística. São Paulo: Contexto, 2004. Localização na biblioteca: 410.3 T775k.Pi 2004 R (FALE) 17 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG ARQUEOLOGIAS Jacyntho Lins Brandão (Fale/UFMG) Tanto a diferença quanto a semelhança entre as línguas intrigaram desde eras muito antigas a humanidade. É bastante conhecido o episódio da Torre de Babel, através do qual o narrador da Torá, que escreve por volta do século VI a.E.C., busca dar uma explicação para a diversidade linguística, nestes termos:5 Todo mundo se servia de uma mesma língua e das mesmas palavras. Como os homens emigrassem para o oriente, encontraram um vale na terra de Senaar e aí se estabeleceram. Disseram um ao outro: Vamos! Façamos tijolos e cozamo‐los ao fogo! O tijolo lhes serviu de pedra e o betume de argamassa. Disseram: Vamos! Construamos uma cidade e uma torre cujo ápice penetre nos céus. Façamo‐nos um nome e não sejamos dispersos sobre a terra! Ora, Iahweh desceu para ver a cidade e a torre que os homens tinham construído. E Iahweh disse: Eis que todos constituem um só povo e falam uma só língua. Isso é o começo de suas iniciativas! Agora, nenhum desígnio será irrealizável para eles. Vamos! Desçamos e confundamos (nablah) a sua linguagem para que não mais se entendam uns aos outros. Iahweh os dispersou dali por toda a face da terra, e eles cessaram de construir a cidade. Deu‐se‐lhe por isso o nome de Babel, pois foi lá que Iahweh confundiu (balal) a linguagem de todos os habitantes da terra e foi lá que ele os dispersou sobre toda a face da terra. (Gênesis, 11, 1‐9. Tradução da Bíblia de Jerusalém, com modificações) Além da maneira curiosa como a origem da diversidade é apresentada, nada mais que punição pela insolência dos homens, e ainda que a existência de línguas diferentes seja explicada por esse modo, supõe‐se que a diversificação aconteceu de repente, transformando uma situação primitiva quando toda a humanidade falava uma única e mesma língua, ou, nas palavras do Rabi Shlomó Yitzkhaki (também chamado de Rashi, 1040‐1105), quando possuía “o bem de ser um só povo com uma só língua”. Não se esclarece, contudo, qual seria essa língua original nem há qualquer traço de que pudesse ser a origem das demais. O que se deseja enfatizar é como a providência tomada por Yahweh, confundindo a linguagem humana, teve o efeito esperado de imediato, ou seja, cessar a construção da torre. Conforme comenta Rashi, na confusão que se instala de Torá é o nome original que se dá aos cinco primeiros livros da Bíblia judaica, chamados, em grego, Pentateuco. O livro da Torá que, também a partir do grego, conhecemos como Gênesis, se chama, em hebraico, Bereshit, ou seja, No princípio. No Oriente Médio, a partir da prática corrente na Mesopotâmia desde o segundo milênio a.C., era costume que as obras recebessem como título as palavras com que começavam. No caso do Gênesis: “No princípio criou Deus o céu e a terra...” 5 18 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG imediato, “um pede um tijolo e o outro lhe traz argila; o primeiro então se enfurece e quebra a cabeça do outro” (YITZJAK, s/d, p. 43‐44). Quase um século após o relato da Torá, encontramos em Heródoto (séc. V a.E.C.) a descrição da pesquisa levada a cabo por Psamético, faraó do Egito entre 664 e 610 a.E.C., o qual desejava descobrir que língua e, em consequência, qual povo seria o mai antigo do mundo: Os egípcios, antes que Psamético os governasse, julgavam que eram anteriores (prótoi) a todos os povos. Uma vez que Psamético, quando começou a reinar, quis saber quem seriam os primeiros, disseram‐lhe que se pensava que os frígios eram anteriores a eles, egípcios, e eles próprios aos demais povos. Psamético, como não conhecia nenhum meio de descobrir quais seriam os primeiros homens, elaborou este: deu duas crianças recém‐nascidas de pessoas de baixa condição a um pastor, para que as alimentasse entre os rebanhos, com o alimento ali usado, ordenando que ninguém, diante delas, emitisse qualquer som (phonén); ele devia deixá‐ las numa cabana solitária e, nos momentos apropriados, levar cabras até elas, dando‐lhes leite – e observar o que aconteceria. Psamético fez e levou ao cabo isso por querer ouvir das crianças, quando abandonassem os inarticulados gritos sem significado (asémon), qual a primeira palavra (phonèn próten) que se poriam a falar. Completados dois anos, ao pastor que cumpria sua tarefa, quando abria a porta e entrava, ambas as crianças, arrastando‐se em sua direção, diziam (ephóneon) “bekós”, estendendo as mãos. De início, ouvindo isso, ele ficou quieto, mas, como muitas vezes, quando entrava e prestava atenção, essa era a palavra (épos), contou‐o ao rei. Por ordem deste, conduziu as crianças à sua presença. Tendo‐o ouvido o próprio Psamético, informou‐se sobre quais dentre homens chamavam algo de “bekós”. Pesquisando, descobriu (heúriske) que os frígios assim chamavam o pão. Desse modo, os egípcios aquiesceram, concluindo dessa experiência que os frígios eram mais velhos (presbytérous) que eles (Heródoto, Histórias 2, 2. Tradução de Brito Broca, com modificações). Ressalte‐se que esse interesse em saber qual seria a língua primitiva da humanidade não é inocente. Nesse tipo de pensamento, que podemos chamar de arqueológico, há três perspectivas culturais entrelaçadas. Num sentido amplo e etimológico, arqueologia, palavra composta com os termos gregos arkhé e lógos, constitui um discurso (lógos) sobre o princípio (arkhé). Ora, arkhé cobre três esferas de significado: (a) a origem no tempo, um começo (como em arqueolítico); (b) o ponto de partida de onde outras coisas procedem (como em arquétipo); (c) o poder (como em arconte, monarquia, oligarquia etc.). Perguntar, portanto, sobre a origem das línguas envolve os três campos: (a) qual a língua mais antiga? (b) qual a língua donde as demais procedem? (c) qual a língua, que por ser o princípio das demais, exerce sobre elas seu poder e confere poder a quem a conhece? 19 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG Assim, escolher uma língua qualquer como a original implica atribuir‐lhe primazia, em termos de precedência, procedência e poder, supondo‐se que aqueles que a falam sejam o povo mais antigo ou descendam diretamente dele, bem como são os detentores da linguagem natural, portanto mais perfeita, de que todas as demais não são mais que devedoras. Que o assunto manteve seu interesse comprova o fato de que, mais de dois milênios depois, Frederico II, rei da Prússia (1712‐1786), repetiu, mais de uma vez, a experiência de Psamético, com desfechos fatais: [Frederico II] quis experimentar qual língua e idioma teriam as crianças, chegando à adolescência, sem terem jamais podido falar com ninguém. E por isso ordenou às amas de leite e às nutrizes que dessem leite aos infantes (...), com a proibição de falar‐lhes. Com efeito, queria saber se falariam o hebraico, que foi a primeira língua, ou talvez o grego, ou o latim, ou o árabe; ou se não falariam sempre a língua dos próprios genitores de quem tinham nascido. Mas cansou‐se sem resultado, porque as crianças ou infantes morriam todos (Salimbene da Parma, Cronaca, n. 1664, apud ECO, 2002, p. 5). Nesse contexto, há mais um pressuposto importante: o de “língua natural”. As crianças falariam a língua primordial da humanidade (supostamente o hebraico) ou de parcela dela (o grego, o latim ou o árabe, idiomas igualmente antigos) – ou se expressariam na língua materna, ainda que tivessem sido separados das respectivas mães, estando portanto impedidos de aprender a falar como todas as crianças? Noutros termos: a língua é inata ou aprendida? Dizendo com mais precisão: é natural ou cultural? Essa última questão já tinha sido discutida por Platão no Crátilo (séc. IV a.E.C.) e foi enfrentada marginalmente pelo desconhecido autor dos Discursos duplos (Dissoì lógoi), obra provavelmente escrita no século V a.E.C. Pela simplicidade como se resolve nesta última obra, mostra‐se como é possível encontrar uma resposta sem a necessidade de apelar para experimentos cruéis como os de Psamético e Frederico II. O problema que se coloca é se é possível alguém ensinar e aprender. Para solucioná‐lo, apela‐se para o que se chama de “experiência mental”: dada uma determinada situação, o rigor de análise levará à alternativa correta. Assim, declara o autor: “Se alguém, quando ainda criancinha, fosse 20 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG mandado para a Pérsia e lá fosse criado, não ouvindo jamais a língua da Grécia, falaria persa; se alguém de lá fosse trazido para cá, falaria grego.” (Dissoì lógoi, 6, 12) Portanto, a língua é um dado não da natureza, mas da cultura e as palavras podem ser ensinadas e aprendidas, uma vez que a criança esteja exposta a determinados contextos, independentemente de sua origem familiar ou étnica. Observe‐se como, nos exemplos citados, há reis dentre aqueles que se preocupam em desvendar qual seria a língua originária da humanidade, o que nos garante a relação entre conhecimento da origem e poder. Não pense que se trata de uma perspectiva que se perde nas brumas do passado, bastando recordar como o nazismo se apropriou de descobertas no campo da linguística indo‐europeia para justificar desmandos e atrocidades, criando o mito da superioridade da raça ariana e de sua pureza (cf. BLIKSTEIN, 1992). Conclusão: trabalhar com a linguagem e as línguas não é algo inócuo ou mera curiosidade, como se poderia pensar. 1 A precedência do hebraico e outras candidaturas Em geral, a exegese rabínica concordará que aquela “só e mesma língua” utilizada pelos homens no princípio era o hebraico (segundo Rashi, a “língua santa”), ponto de vista adotado também pela quase totalidade dos hermeneutas cristãos antigos e medievais. Ainda no início da era moderna insistem na mesma tecla, dentre outros, Guillaume Postel (1510‐1581) e Claude Duret (1570‐1611) – atitude ridicularizada pelo filósofo judeu‐ holandês Gottfried Leibniz (1646‐1716), o qual afirmava que “na suposição de que o hebraico foi a língua original da humanidade há tanta verdade quanto na afirmação do holandês Goropius (...) de que a língua que se falava no Paraíso era justamente o holandês” (NIKOLSKI; JAKOWLEW, 1947, p. 21‐22). A referência de Leibniz é a Goropius Becanus (Jan van Gorp, 1519‐1572), modelo de um conjunto mais amplo de autores que defendiam outras candidatas ao posto de língua 21 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG originária (cada qual puxando a brasa para a própria sardinha): assim, o poeta sueco George Stiernhielm (1598‐1672) pretendia que o gótico (ou antigo nórdico) fosse a origem de todas as línguas, assim como os países nórdicos seriam a vagina gentium, lugar onde se originou a humanidade; já o médico irlandês James Parsons (1705‐1770) opinava que o gaélico era a língua mais próxima da primitiva; e mesmo o filósofo Johann Gottlieb Fichte (1762‐1814) defendia que o melhor candidato a língua originária (Ursprache) seria o alemão, em vista de sua “pureza”. Outros optaram por soluções mais diversificadas: para um, “Adão falava basco; para outro, ao contrário, Adão e Eva utilizavam o persa, a serpente, que os seduziu, o árabe, e o Arcanjo Gabriel, o turco” (NIKOLSKI; JAKOWLWW, 1947, p. 21‐22). Umberto Eco resume bem os meandros de toda essa pendenga, em que se encontra envolvida a ideia de que a língua original seria também a língua perfeita, o que só comprova como nada se faz por simples curiosidade: Na sua versão mais antiga a busca da língua perfeita assume a forma da hipótese monogenética, ou seja, da derivação de todas as línguas de uma única língua‐mãe. (...) Os Padres da Igreja, de Orígenes a Agostinho, haviam assumido como um dado incontestável que o hebraico tinha sido, antes da confusão, a língua primordial da humanidade. A exceção mais importante fora a de Gregório de Nissa (Contra Eunomium), que sustentara que Deus não falava hebraico e ironizava a imagem de um Deus‐professor ensinando o alfabeto a nossos pais. (...) Mas a idéia do hebraico como língua divina sobrevive ao longo de toda Idade Média. Entre os séculos XVI e XVII, não basta mais sustentar que o hebraico era a protolíngua (...): então interessa promover seu estudo e, se possível, sua difusão. Um lugar particular na história do renascimento do hebraico cabe à figura de erudito utopista que foi Guillaume Postel (1510‐1581). (...) No De originibus seu de Hebraicae linguae et gentis antiquitate (1538), afirma ele que a língua hebraica provém da descendência de Noé e que dela derivaram o árabe, o caldeu, o índico e, só medianamente, o grego. (...) Claude Duret, em 1613, publica um monumental Trésor de l’histoire des langues de cet univers (...). Já que Duret mantém a idéia de que o hebraico foi a língua universal do gênero humano, é óbvio que o nome hebraico dos animais contém em si toda sua “história natural”. Assim, “a águia chama‐se nesher, nome que concorda com shor e isachar, que significam olhar e estar ereto, porque este pássaro tem, mais que todos, a vista firme e sempre levantada para o sol”. (...) Mas se Duret fazia etimologia regressiva, para mostrar como a língua‐mãe estava em harmonia com as coisas, outros farão etimologia progressiva, para mostrar como do hebraico derivaram todas as outras línguas. Em 1606, Estienne Guichard escreve L’harmonie étymologique des langues, onde demonstra como todas as línguas existentes podem ser reconduzidas a raízes hebraicas. Partindo da afirmação de que o hebraico é a língua mais simples porque nele “todas as palavras são simples e sua substância consiste de apenas três radicais”, elabora um critério que lhe permite jogar com esses radicais por inversões, anagramas, permutações, segundo a melhor 22 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG tradição cabalística. Batar em hebraico significa “dividir”. Como se justifica que de batar tenha provindo, em latim, dividere? Por inversão se produz tarab, de tarab se chega ao latim tribus, e então a distribuo – e a dividere (...). Zaqen significa “velho”; transpondo‐se os radicais, tem‐se zaneq, donde senex em latim; e com uma sucessiva permutação de letras tem‐se cazen, donde em osco casnar, de que derivaria o latino canus, que significa justamente “ancião” (...). O século XVII oferece‐nos exemplos saborosos de nacionalismos linguísticos (...). Goropius Becanus (Jan van Gorp), em Origines Antwerpianae (1569), sustenta todas as teses correntes sobre a inspiração divina da língua primitiva, sobre a relação entre palavras e coisas, e encontra essa relação exemplarmente presente no holandês, ou melhor, no dialeto de Antuérpia. Os antepassados dos habitantes de Antuérpia, os címbrios, descendem diretamente dos filhos de Jafé, que não se achavam presentes junto da Torre de Babel, escapando assim da confusio linguarum. Conservaram, portanto, a língua adâmica, o que se prova através de claras etimologias (...) e pelo fato de que o holandês tem o maior número de palavras monossilábicas, supera todas as outras línguas em riqueza de sons e oferece excepcionais possibilidades para a geração de palavras compostas. (...) Ao lado da tese holandesa‐flamenga não falta a tese “sueca”, com George Stiernhielm (De linguarum origine praefatio, 1671). (...) Quanto ao alemão, várias e repetidas suspeitas sobre seu direito de primogenitura agitam‐se no mundo germânico desde o século XIV, em seguida ao pensamento de Lutero (para o qual o alemão é a língua que mais que todas aproxima de Deus), enquanto, em 1533, Konrad Pelicanus (Commentaria bibliorum) mostra as evidentes analogias entre alemão e hebraico. (ECO, 2002, p. 83‐109) Enfim, toda essa discussão chegou a tal paroxismo que acabou inteligentemente parodiada pelo filósofo e filólogo sueco Andreas Kempe (1622‐1689): em seu panfleto satírico As línguas do Paraíso (Die Sprachen des Paradises, de 1688), seu protagonista, Simon Simplex (um Simão simplório qualquer), estabelece que Deus se dirigia a Adão em sueco e este lhe respondia em dinamarquês – enquanto a serpente falava com Eva em francês, já que esta, “a língua tradicional da sedução, ‘mexe com o corpo todo de tal modo que até a pessoa mais sábia pode ser por ela iludida’.” (apud OSTLER, 2003, p. 1). 2 O que se pode saber sobre a origem da linguagem Foi apenas no final do século XVIII e princípios do XIX que o tipo de especulação acima apresentado foi paulatinamente substituído pela ideia de que as línguas do mundo se dividem em diferentes famílias, cujo estabelecimento depende de um paciente trabalho de comparação. Esse trabalho iniciou‐se no âmbito das línguas indo‐europeias, num processo paulatino, mas contínuo, que abordaremos no capítulo seguinte – processo que marca a fundação da linguística moderna. 23 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG Isso não implica, todavia, que a pergunta sobre a origem – não tanto das línguas, mas da linguagem humana – se tenha tornado improcedente. Com efeito, se toda humanidade tem como característica utilizar‐se de línguas como forma de comunicação, isso implica que há, na linguagem humana, um conjunto de categorias universais relacionadas com determinados processos cognitivos, os quais têm recebido cada vez mais a atenção dos linguistas, com enfoques variados. A diferença com relação às interpretações anteriormente expostas está: a) no estabelecimento de que a língua é um dado de cultura, não da natureza, não havendo portanto línguas ou palavras “naturais”; b) no abandono da ideia de que as línguas do mundo possam provir de alguma das línguas conhecidas, uma vez que qualquer língua se encontra em processo de constante mutação; c) na admissão de que é possível, através da comparação, retroceder a estágios anteriores das línguas conhecidas, reconstituindo em parte as protolínguas donde uma determinada família procede; d) finalmente, na constatação de que, a partir da diversidade de línguas e da compreensão de como elas funcionam e se modificam, se podem deduzir certos parâmetros relativos à linguagem humana. Embora tenha sido abandonada por muito tempo e continue recebendo críticas, a hipótese de que as línguas do mundo tenham uma origem comum voltou a ser considerada seriamente por linguistas como Greenberg e Ruhlen, tendo em vista sobretudo o avanço do conhecimento relativo às macrofamílias linguísticas, aliado às conquistas da arqueologia, que estuda os dados da cultura material, e, mais recentemente, também da biologia, que vem trabalhando, com bons resultados, no mapeamento do genoma humano. Se o homo sapiens sapiens tem uma origem comum – que tudo leva a crer se encontra no continente africano –, é razoável supor que também as várias línguas possam 24 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG ter uma única origem. Evidentemente, não se poderá jamais saber como seria esse sistema linguístico primeiro, a não ser em termos muito gerais, ou seja, naquilo em que todas as línguas coincidem: a) a arbitrariedade do signo linguístico; b) o uso de categorias linguísticas compatíveis com os processos cognitivos através dos quais o homem apreende o mundo e com ele se relaciona; c) o caráter social da linguagem como meio de comunicação; d) o fato de que a língua se encontra em constante processo de variação e mudança. Uma especulação em forma de narrativa (como as míticas), que parece a única possível quando se trata de vislumbrar algo sobre origens que se perdem em tempos imemoriais. É o que você lerá na “Leitura complementar” a seguir. Referências BLIKSTEIN, Izidoro. Indo‐europeu, linguística e... racismo. Revista USP, n. 14, p. 104‐110, jun.‐ago. 1992. Disponível em: http://www.usp.br/revistausp/14/20‐izidoro.pdf. Acesso em: 5 out. 2011. ECO, Umberto. La ricerca della lingua perfetta nella cultura europea. Roma‐Bari: Laterza, 2002. Localização na Biblioteca: 410 E19r.Pa 2002 (FALE) NIKOLSKI, W.; JAKOWLEW, N. Warum die Menschen in verschiedenen Sprachen sprechen. Berlin: Verlag der Sowjetischen Militärverwaltung, 1947. OSTLER, Rosemarie. Searching for the first words. Verbatim: The Language Quaterly, v. 28, n. 4, p. 1‐4, Winter 2003. Disponível em: www.verbatimmag.com/28_4.pdf. Acesso em: 5 out. 2011. YITZJAKI, Shlomó. תורה חומשי חמשה ספר: El Pentateuco con el comentario de Rabí Shlomó Yitzjaki (Rashi). Traducción directa al castellano del original hebreo por Enrique Jaime Zadoff (El Pentateuco) y Jaime Barilko (Rashi). Buenos Aires: Editorial Yehuda, [s/d]. 25 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG LEITURA COMPLEMENTAR A história de Chico Rudi Keller Era uma vez um grupo de homens‐macaco. Os homens‐macaco eram seres que haviam acabado de ultrapassar o estágio de símios, mas não tinham ainda atingido um ponto em que se poderia dizer que eram simplesmente humanos, porque não tinham eles uma linguagem. Todavia, esses homens‐macaco tinham a sua disposição, exatamente como seus parentes mais próximos, gorilas e chimpanzés, um rico repertório de expressões sonoras. Os mais coléricos batiam a boca e rosnavam quando estavam irados; os vaidosos batiam no peito e rugiam quando queriam exibir‐se. Eles batiam os dentes quando se divertiam, ronronavam quando se sentiam confortáveis e emitiam gritos que rompiam os ouvidos quando ansiosos. Todas essas manifestações estavam longe de ser signos linguísticos. Não serviam para a comunicação, como hoje a entendemos, mas eram, ao invés disso, a expressão natural de eventos internos: sintomas da vida emocional, comparáveis ao suor frio, o riso, as lágrimas ou o rubor. Alguém não comunica suas emoções por meio desses fenômenos, mas, em certas condições, pode revelar algo sobre as mesmas. É que os sintomas podem causar efeitos similares aos dos signos linguísticos. Um dos integrantes do grupo era um homem‐macaco que a natureza pusera em desvantagem: pequeno, mais fraco que os outros e ansioso ao máximo. Podemos chamá‐lo de Chico. Sendo fraco, Chico era muitas vezes forçado, desde a infância, a ser um tanto mais esperto que os outros. Ele tinha de compensar sua falta de força corpórea e seu baixo status social, sob o risco de ficar completamente dominado pelos demais. Em especial, os membros mais fortes do grupo afastavam‐no regularmente da comida, não deixando que ficasse perto dos bocados mais suculentos. Mas, sendo ágil e esperto, Chico conseguia ultrapassar alguns desses obstáculos. 26 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG Um dia aconteceu algo que teria uma imensa importância para o futuro de toda raça dos homens‐macaco. O grupo estava pacificamente amontoado em volta da comida, consumindo a presa capturada naquele dia. Como sempre, havia algumas pequenas brigas e empurrões ocasionais. Chico foi de novo empurrado para a borda exterior, onde descobriu um par de olhos no meio da vegetação rasteira – os olhos de um tigre! Seus olhos encontram‐se com os do animal... Morrendo de medo, ele grita aterrorizado. O grupo dispersa instantaneamente. Cada qual trata de encontrar abrigo na árvore mais próxima, porque tal grito era sinal de enorme perigo. Estavam todos condicionados, desde a infância, a reagir assim. Chico ficou parado lá, como se congelado. Estar tão perto de morrer o havia tornado incapaz de fugir. Todavia, para seu grande espanto, os olhos piscavam para ele, de um modo nada parecido com o que faz um tigre, e seu proprietário foi‐se embora irritado. O que ele havia visto como olhos de tigre pertencia a nada mais que um pacato porco. Chico tinha sido vítima de sua vívida imaginação, alimentada por sua natural ansiedade. Mas “vítima” é a palavra correta neste caso? Quando Chico olhou em volta, desconcertado, desamparado e um pouco envergonhado, viu que estava completamente sozinho, junto com a comida deixada para trás pelos outros. A expressão de medo em seu rosto deu lugar a um firme e travesso sorriso. Ele quase não podia acreditar. Na medida em que passavam os dias e as semanas – e que, a cada vez, a disputa pelas melhores partes de alimento tinha lugar – ele era tentado a fazer intencionalmente o que lhe havia acontecido por acidente. O que Chico não podia imaginar é que essa tentação marcava o fim do paraíso da comunicação natural. O que tinha de acontecer finalmente aconteceu. Como sempre, ele tinha de ficar observando como aqueles grandalhões cabeludos repartiam as melhores partes entre si, enquanto ele, faminto, se sentava perto, tomado por uma raiva impotente. Foi então que 27 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG sucumbiu à tentação. Deu o grito de angústia e, de novo, o grupo dispersou‐se em matéria de segundos, incluindo os repugnantes grandalhões. A melhor parte da comida ficara ali, montes de comida. Na sua agitação, Chico, na verdade, nem pôde saboreá‐la (talvez sua má consciência o impedisse). Mas o primeiro degrau tinha sido galgado e Chico achou muito mais fácil da próxima vez. Com o tempo, tornou‐se quase impiedoso. Achava prazer em executar seu truque e começou mesmo a abusar. Como era inevitável, logo alguém suspeitou dele. Quando Chico foi bobo o suficiente para gritar pela segunda vez durante uma mesma tarde, um outro macaco parou, depois de poucos saltos, olhou para trás e começou a devorar a comida. Chico ficou um pouco irritado, mas não se incomodou, pois havia comida suficiente para ambos. Mas logo o cúmplice começou também a usar do expediente que aprendera e, como Chico, a exagerar. O número daqueles que não se deixavam enganar pela mentira – e, finalmente, o número de imitadores – tomou dimensões inflacionárias. A comunidade entrou num período extremamente crítico. Cada qual suspeitava dos demais. Os grandalhões tentaram restaurar a antiga ordem, penalizando todo abuso do grito de prevenção. Mas um conhecimento, uma vez adquirido, não pode ser jamais erradicado. Pelo contrário, era reforçado por todo novo abuso e toda tentativa de penalizar quem dele utilizava. O abuso permanente do grito de prevenção representava um perigo para a existência física de todo o grupo, uma vez que a crença cega nele era necessária para a sobrevivência. Mas essa época havia definitivamente acabado. Os que quisessem sobreviver nesses tempos de corrupção tinham de ter bons ouvidos. Tinham de aprender a diferenciar o grito genuíno do fingido, algo que não se mostrou difícil para muitos deles. (...) A história de Chico não pretende ser realista, mas diz algo sobre a realidade. Ela mostra como a transição da comunicação natural para a humana poderia ter acontecido. Não se 28 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG trata de uma reconstrução histórica, mas filosófica. Não são os fatos, mas apenas os dados lógicos da história que devem estar corretos, a saber: 1. As etapas que conduzem do grito natural de angústia ao ato intencional parecem plausíveis. A passagem de um ao outro não deve ter apresentado nem furos, nem saltos. 2. As pressuposições relativas às habilidades dos homens‐macaco parecem ser realistas. A história seria sem valor caso se atribuísse a Chico uma alta (e irrealista) capacidade intelectual. Traduzido de: KELLER, Rudi. On Language Change: the invisible hand in language. London/New York: Routledge, 1994. p. 19‐22. 29 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG VARIAÇÃO E MUDANÇA LINGUÍSTICA Sueli Maria Coelho (Fale/UFMG) INTRODUÇÃO A comparação entre duas ou mais línguas, conforme proposto na primeira aula de nosso curso, demonstra haver entre elas aspectos que as diferenciam, quer em maior quer em menor escala, dependendo do grupo linguístico a que pertençam os idiomas comparados. Assim, se compararmos entre si línguas originárias do ramo indo‐europeu6, nós identificaremos muito mais semelhanças que se compararmos línguas originárias desse ramo com aquelas provenientes do ramo afro‐asiático, família linguística com 353 línguas vivas presentes na Ásia e na África. Compreender que as línguas variam quando se comparam dois ou mais idiomas é relativamente fácil, principalmente porque, na maioria das vezes, as diferenças saltam aos olhos já no plano do código. A compreensão da diversidade torna‐se, contudo, menos visível quando o objeto de análise se restringe a uma mesma língua. Será que as línguas são homogêneas, isto é, será que todos os falantes de uma língua dizem as mesmas coisas da mesma forma? Além disso, será que as línguas conservam as mesmas características ao longo dos séculos? É exatamente sobre essas questões aparentemente simples, porém não tão óbvias, que você é convidado a refletir cientificamente nesta unidade, tomando como objeto de análise dados da língua portuguesa falada no Brasil. 1 Variação linguística Ao buscar resposta para a primeira pergunta acima — as línguas são homogêneas? —, é provável que você logo se lembre de que, no português do Brasil, a pronúncia de determinadas palavras, muitas vezes, varia de uma região para outra do país, o que já constitui um indício de que as línguas não são homogêneas. Pense, por exemplo, na forma 6 Família linguística composta de dez ramificações e 426 línguas vivas, entre elas o português, e distribuídas em várias regiões do mundo. 30 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG como os paulistas pronunciam a palavra tio, comparando‐a com a forma como nós, mineiros, a pronunciamos. Certamente, você identificou alguma diferença no modo de se articular o som /t/. O mesmo se dá quando se compara, por exemplo, a fala de um carioca com a fala de um gaúcho ou com a de um nordestino. Se você ainda não tinha se atentado para esse fato, ao fazê‐lo, verá que cada um desses grupos de falantes do português tem formas peculiares de articular determinados sons e também de cadenciá‐los ao pronunciar as palavras de uma frase, o que faz com que, ao ouvi‐los, logo identifiquemos as diferenças entre um falar e outro. Essas diferenças, que se dão na forma de se pronunciarem as palavras, mas que não atrapalham a compreensão, permitindo que falantes de qualquer região do país conversem e se entendam, são denominadas de variação fonética. Se você refinar um pouco mais a sua observação, prestando atenção no o modo como as pessoas falam, perceberá que as diferenças não se limitam apenas à pronúncia das palavras, embora estas sejam mais facilmente perceptíveis. A diversidade se estende também a outros níveis ou estratos da língua, como, por exemplo, ao nível do léxico, ou seja, do conjunto de palavras que compõem a língua. Compare as sentenças apresentadas no quadro abaixo e veja que, apesar de elas preservarem o mesmo sentido, há diferenças entre as palavras utilizadas para se referir a um determinado ingrediente da culinária regional: a. Fui ao mercado e comprei macaxeira para acompanhar o churrasco. b. Fui ao mercado e comprei aipim para acompanhar o churrasco. c. Fui ao mercado e comprei mandioca para acompanhar o churrasco. Certamente, você percebeu que tanto macaxeira, quanto aipim e mandioca são termos utilizados para se referir à mesma raiz de massa branca ou amarela, originária da América do Sul e que é muito utilizada na alimentação humana. Apesar de as palavras utilizadas para se referir a esse alimento serem diferentes, elas, quando empregadas pelos falantes de 31 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG regiões diferentes do Brasil, evocam o mesmo referente, isto é, remetem o falante/ouvinte para o mesmo elemento do mundo real. Quando isso acontece, dizemos que há uma variação lexical, ou seja, os mesmos elementos da realidade recebem denominações diferentes, dependendo da região em que são empregados. É muito pouco provável que, ao comunicar a alguém o fato de ter ido à feira comprar mandioca para um churrasco, um morador de Belo Horizonte ou de qualquer outra cidade de Minas Gerais profira o primeiro dos três enunciados apresentados no quadro, mas tal enunciado é bastante previsível quando a pessoa que o emite provém de cidades do nordeste do país, onde o termo mandioca não é tão empregado como aqui. Antes de continuar a pensar sobre a diversidade linguística, é muito importante que você esteja consciente de que nenhuma dessas formas é melhor que a outra, já que todas elas dizem a mesma coisa, cumprindo, de modo eficaz, a sua função comunicativa. Como adverte Faraco (1998), “do ponto de vista exclusivamente lingüístico [...], as variedades se equivalem e não há como diferenciá‐las em termos de melhor ou pior, de certo ou errado: todas têm organização (todas têm gramática) e todas servem para articular a experiência do grupo que as usa.” (p. 19) As distinções de valoração entre as diversas variedades são atribuídas socialmente; assim, algumas delas, normalmente aquelas faladas por grupos privilegiados socialmente, adquirem uma marca de prestígio, enquanto outras, geralmente porque são faladas por grupos de pouco ou nenhum prestígio social, não são reconhecidas e aceitas pela sociedade em geral. As variedades que são socialmente reconhecidas e valorizadas denominam‐se variante padrão e aquelas que são estigmatizadas pela sociedade são denominadas de variante não‐padrão. Mudando o foco de nossa observação do léxico para o conjunto de regras de uma língua, ou seja, para a sua gramática, você perceberá que também é possível identificar algumas variações. Pense no modo como os falantes do português combinam as palavras para produzir sentenças. Logo perceberá que também nesse plano não se pode falar em homogeneidade, já que existem muitas possibilidades de combinação que traduzem a mesma ideia. Esse tipo de diversidade é chamado de variação sintática, porque se dá no 32 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG plano da sintaxe da língua. Para entender melhor esse conceito, pense, a título de ilustração, na regência do verbo assistir e analise‐a nos enunciados dispostos neste quadro: a. Eu não sei se meu time ganhou, porque não assisti o jogo. b. Eu não sei se meu time ganhou, porque não assisti ao jogo. c. A final do campeonato foi assistida por milhares de torcedores. As duas primeiras sentenças do quadro são variantes linguísticas, isto é, são formas distintas de se dizer a mesma coisa, mantendo, no contexto em que são empregadas, o mesmo sentido. Embora saibamos que, segundo prescreve a norma culta, o verbo assistir, no sentido de ver, é transitivo indireto e exige a preposição a, sabemos também que essa não é a variante preferida pelo falante. No uso coloquial da língua, a preferência pela forma transitiva direta do verbo assistir – talvez por analogia com a regência do verbo ver – é muito maior. A regência não‐padrão já é tão natural na língua, que é possível encontrar, em jornais impressos, registros do verbo assistir empregado em voz passiva, conforme ilustra (c) acima, o que não é admitido para os demais verbos transitivos indiretos, tal como gostar, por exemplo, cuja regência exige sempre a preposição. Eis aqui mais uma demonstração de que a língua não é tão homogênea como o falante, ingenuamente, acredita ser. Você já foi apresentado à variação fonética, à variação lexical e à variação sintática. Falta ainda exercitar sua atitude de linguista no plano da morfologia, buscando verificar se as palavras da língua também podem sofrer variação quanto à sua flexão ou quanto ao seu processo de formação. Caso isso se constate, você estará diante de uma variação morfológica. Certamente, em alguma situação de uso da língua, você já teve dúvidas quanto ao plural de alguma palavra terminada em –ão e, quando não teve a oportunidade de consultar um dicionário ou uma gramática, teve que arriscar, optando por uma das formas possíveis na língua. Ao fazê‐lo, você incorre no risco de empregar uma flexão que não é aquela considerada padrão. Quem nunca ouviu alguém dizer cidadões em vez de cidadãos? Trata‐ 33 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG se de um caso de variação morfológica, pois a flexão de número plural de uma palavra foi feita de duas formas distintas. O mesmo se dá quando o falante pluraliza o substantivo degrau apoiando‐se no princípio utilizado para pluralizar canal, por exemplo, e produz a palavra degrais, quando a forma padrão é degraus. Também no processo de formação de palavras por meio da derivação é comum ocorrerem variações no emprego dos afixos. Tais variações geralmente ocorrem quando os sufixos ou os prefixos empregados, “embora distintos sob o ponto de vista fonético, apresentam o mesmo sentido e/ou função.” (ROCHA, 1999, p. 112). Nesse caso, o falante, normalmente por desconhecer a forma que deseja empregar no contexto, recorre a outra, que é criada com base em recursos que a língua lhe oferece, promovendo uma variação, conforme ilustram estes exemplos: a. Aqueles dois lá estão numa bajulação que ninguém aguenta. b. Aqueles dois lá estão num bajulamento que ninguém aguenta. É possível que você esteja se perguntando se a forma bajulamento não é errada. Como já mencionado, não nos cabe, na análise da variação linguística, qualquer julgamento normativo, já que não se tem por objetivo considerar uma variante como melhor que a outra, mas reconhecer a diversidade dos usos. Há, sem dúvida, níveis de aceitabilidade das variantes, mas o fato de uma delas gozar de maior prestígio que outra na escala social não anula a sua existência na língua. Até agora, deve ter ficado claro para você que uma língua não exibe diferenças apenas quando comparada à outra. Isso se dá porque nenhuma língua é homogênea, o que significa dizer que toda língua apresenta variação. Essa variação, que consiste na coexistência de formas distintas para se falar a mesma coisa, se manifesta tanto no nível do léxico, quando no da gramática e, dependendo do estrato atingido, ela se classifica como variação fonética, variação lexical, variação sintática ou variação morfológica. Resta, agora, tentar entender que fatores determinam a variação, aspecto que será tratado na próxima subseção. 34 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG 1.1 Fatores determinantes de variação Como você deve ter percebido ao longo da discussão promovida na seção anterior, são vários os fatores que determinam as variações de uma língua no plano sincrônico, isto é, num determinado momento de sua história. Tais fatores, entretanto, podem ser reagrupados em dois tipos principais, o que nos permite descrever a motivação da variedade segundo dois parâmetros básicos: o dos fatores geográficos e o dos fatores sociais. Conforme demonstrado quando da apresentação da variação fonética e da variação lexical, falantes de diferentes regiões do país podem pronunciar e cadenciar os sons de forma diferenciada, além de também poderem empregar termos diferentes para se referir aos mesmos elementos da realidade. A esse tipo de variação relacionada a “diferenças lingüísticas distribuídas no espaço físico, observáveis entre falantes de origens geográficas distintas” (ALKMIN, 2001, p.34), dá‐se o nome de variação geográfica ou diatópica. Cumpre aqui um alerta no tocante aos domínios da variação diatópica. Às vezes, é comum se associar esse tipo de variação apenas a espaços geográficos mais amplos, como as regiões de um país ou estado, mas é preciso ficar claro que ela abrange todas as variedades originárias de espaço físico. Dessa forma, as variações que se identificam entre falares de pessoas que residem na zona urbana e aquelas que residem na zona rural, ou mesmo de falantes que residem em regiões centrais ou em regiões periféricas de uma determinada comunidade linguística também são interpretadas como variações geográficas. Além do fator geográfico, as línguas ainda variam, conforme mencionado, em decorrência de fatores sociais, tais como (i) classe social a que pertence o falante, (ii) seu nível de escolaridade, (iii) sua idade, (iv) seu sexo ou ainda (v) sua profissão. Mesmo nos precavendo contra qualquer tipo de julgamento preconceituoso, não nos passa despercebido que, por uma série de fatores, dentre os quais se citam nível cultural e maior ou menor grau de letramento, a língua falada pelos membros de classes sociais distintas exibe traços característicos próprios, o que nos permite não só reconhecer diferenças linguísticas entre as classes, como também identificar a classe a que pertence o falante a partir do modo como ele fala. Além da classe social, o nível de escolaridade do falante 35 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG também interfere no modo como ele utiliza os recursos linguísticos. Falantes escolarizados recorrem a formas de dizer que diferem sensivelmente daquelas utilizadas pelos que sequer são alfabetizados, já que determinadas construções linguísticas só são adquiridas por meio de instrução formal. Não se espera, por exemplo, que um falante não alfabetizado empregue o pronome relativo cujo em sentenças como O funcionário de cuja competência eu desconfio não compareceu à reunião. Para expor essa mesma ideia, esse falante provavelmente recorrerá a uma construção menos complexa, como, por exemplo, O funcionário que eu desconfio da competência dele não foi na reunião. Não é apenas no domínio da sintaxe que se percebem variações decorrentes do nível de escolaridade do falante. Os exemplos de variação morfológica ilustrados na seção anterior também podem ser determinados pelo grau de instrução do falante, que, desconhecendo a flexão ou o afixo padrão, recorre a uma forma alternativa para se expressar. Se compararmos ainda a linguagem empregada por uma criança com aquela empregada por um adolescente, também identificaremos variações, agora motivadas não pela escolaridade, mas pela faixa etária do falante. O mesmo se verifica quando comparamos entre si a fala de um jovem, a de um adulto e a de um idoso. Outro fator social que também provoca variação linguística é o sexo do falante. O emprego de diminutivos e a entonação mais pausada para intensificar os adjetivos (“Você está des‐lum‐bran‐te!”) são traços mais característicos da fala feminina que da masculina. A profissão do falante é outra variável que pode promover variação, especialmente no plano da linguagem técnica. Um professor de linguística poderá recorrer aos termos técnicos da área quando discute determinado fenômeno da língua com um colega de profissão ou quando apresenta uma comunicação em um congresso ou profere uma conferência, mas não poderá fazê‐lo ao conversar sobre o mesmo fenômeno com um cidadão leigo, pois, caso o faça, correrá o risco de não ser compreendido ou de o ser apenas parcialmente. A esse conjunto de fatores que se relacionam não apenas com a identidade do falante, mas também com a organização sociocultural da sua comunidade de fala e que acarreta formas distintas de se dizer a mesma coisa, dá‐se o nome de variação social ou diastrática. 36 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG Além dos cinco fatores sociais apresentados, existe outro que também determina a variação linguística e que será tratado à parte e de modo um pouco mais aprofundado que os demais, dada a sua importância para a competência pragmática do falante, isto é, para que o usuário do sistema linguístico selecione adequadamente os recursos de que dispõe de modo a alcançar a eficácia na comunicação. Trata‐se do contexto de produção do discurso. Você certamente já observou que, dependendo não apenas da pessoa a quem o falante se dirige no ato comunicativo, mas também do grau de formalidade da situação, ele recorre a uma linguagem mais ou menos formal. Assim como situações sociais de maior formalidade, como casamento e formatura, por exemplo, exigem um figurino mais a rigor e situações mais descontraídas, como um churrasco entre amigos, pedem um traje mais à vontade, o uso da variante linguística também deve estar de acordo com a situação. Ninguém utiliza uma linguagem padrão formal para falar com os membros da família, com os amigos ou mesmo com os colegas de trabalho. Da mesma forma, ninguém faz uso (ou pelo menos não deveria fazê‐lo) de uma linguagem extremamente informal quando se dirige a uma autoridade ou quando é solicitado a se pronunciar em público. O fato é que determinadas situações exigem um estilo de linguagem mais formal, mais elaborado, enquanto outras requerem um estilo mais informal e mais despojado. A esse tipo de variação em que o estilo de linguagem é determinado pela situação de uso, dá‐se o nome de variação contextual, estilística ou diafásica. 2 Mudança linguística Para responder à segunda questão proposta na introdução desta unidade – será que as línguas conservam as mesmas características ao longo dos séculos? –, compare os dois textos a seguir. O primeiro é um fragmento da Cantiga 18, extraído do livro Cantigas de Santa Maria, obra datada do séc. XIII, cuja autoria é atribuída a D. Afonso X, o Sábio. O segundo é uma versão modernizada do texto medieval, numa tentativa de se preservar o mesmo sentido do original. 37 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG promessa fez, Depois que fez a promessa, senpre creceron cresceram os bichos‐da‐seda os babous ben dessa vez e dessa vez e non morreron; não morreram; mas a dona con vagar mas a dona muito grande que y prendia, se demorava e nisso d’a touca da seda dar sempre se esquecia senpre ll’escaecia. de dar a touca de seda. Por nos de dulta tirar... Para tirar‐nos a dúvida... Onde ll’ avℜo assi E nisso, aconteceu que ena gran festa na grande festa d’Agosto, que vℜo y de Agosto, quando veio con mui gran sesta diante da imagem rezar, ant’a omagen orar; durante a hora de mais calor, e ali u jazia e ali onde fazia suas preces, a prezes, foi‐lle nenbrar foi‐lhe lembrar a touca que devia. a touca que devia. É provável que uma das primeiras diferenças que você tenha percebido ao comparar os dois textos é de natureza gráfica. Isso se dá porque a grafia portuguesa medieval era baseada em princípios fonéticos, ou seja, aproximava‐se bastante do modo como as 38 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG palavras eram pronunciadas, o que não é mais o padrão atual. Além das diferenças de grafia, você deve ter identificado no texto palavras que não são mais empregadas atualmente (escaecia, dulta, nenbrar) ou que sofreram alguma alteração de sentido (sesta). Notam‐se também diferenças na forma de se combinarem as palavras para compor as sentenças, isto é, alterações de estruturas sintáticas. Como você deve ter percebido, apesar de preservar muitas das características do século XIII, o português, ao longo destes sete séculos, sofreu algumas alterações em sua estrutura. Logo, há de se reconhecer que as línguas não são estáticas, mas mudam com o tempo. Essas alterações que as línguas sofrem por ação do tempo, quer em seu léxico, quer em sua gramática, denominam‐se mudanças linguísticas. Tais mudanças têm origem na heterogeneidade linguística. Conforme demonstrado na seção anterior, as línguas variam e, por causa disso, podem ser descritas metaforicamente como um leque de variantes. Ocorre normalmente que duas ou mais variantes, por apresentarem o mesmo valor de verdade, em algum momento da história da língua, entram em processo de concorrência, até que uma das formas saia vitoriosa e se efetive a mudança. É importante você saber, contudo, que nem todo processo de variação resulta numa mudança. “A mudança linguística está envolvida por um complexo jogo de valores sociais que podem bloquear, retardar ou acelerar sua expansão de uma para outra variedade da língua.” (FARACO, 1998, p. 17) Dessa forma, muitas variantes, mesmo concorrendo entre si por um longo período de tempo, permanecem socialmente estigmatizadas, não se consumando a mudança linguística. É por isso que se diz que toda mudança pressupõe variação, mas que nem todo processo de variação acarreta uma mudança. Resta‐nos, por fim, tentar entender por que o falante não se dá conta de que a língua muda. Isso ocorre porque as mudanças linguísticas, apesar de contínuas, são lentas e graduais. Como você percebeu, ao comparar textos separados entre si por sete séculos, as mudanças são processos relativamente regulares que atingem a língua como um todo de 39 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG forma paulatina. Elas resultam de uma ação cumulativa do tempo e de uma anuência de ordem social sobre o embate entre as variantes. Para verificar se você assimilou o conteúdo do texto, faça os Exercícios referentes a este texto, que se encontram na plataforma Moodle. Referências AFONSO X, o Sábio. Cantigas de Santa Maria, Edição crítica de Walter Metteman. Coimbra: Acta Universitatis Conimbrigensis, 1959‐72. Localização na biblioteca: 861 A258c 1964‐72 (FALE) ALKMIN, Tânia Maria. Sociolinguística: parte I. In: MUSSALIM, Fernanda; BENTES, Anna Christina (orgs.). Introdução à linguística: domínios e fronteiras. v. 1. São Paulo: Cortez, 2001, p. 21‐47. Localização na biblioteca: 410 I61 2005 (FALE) BORTONI‐RICARDO, Stella Maris. Nós cheguemu na escola, e agora?: sociolingüística & educação. São Paulo: Parábola Editorial, 2005. FARACO, Carlos Alberto. Linguística histórica: uma introdução à história das línguas. 2. ed. São Paulo: Ática, 1998. Localização na biblioteca: 808.8 F981 1991 v.78 (FALE) ROCHA, Luiz Carlos de Assis. Estruturas morfológicas do português. Belo Horizonte: UFMG, 1998. Localização na biblioteca: 469.5 R672e 2008 (FALE) 40 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG O MÉTODO HISTÓRICO‐COMPARATIVO Jacyntho Lins Brandão e Júlio César Vitorino (Fale/UFMG) O método comparativo aplicado ao estudo das línguas constitui uma área de conhecimento que conta mais de duzentos anos. Com efeito, o comparatismo situa‐se na base da formação da linguística moderna, a qual tem início, no século XIX, com o estudo das línguas indo‐europeias, a então chamada “gramática comparada”, que visava à reconstituição da “língua‐mãe”. Nesse domínio, em que se lidava com um conjunto de fatos relativamente limitado, envolvendo, de início, a comparação entre o grego, o latim e o sânscrito, a que logo se ajuntam o gótico e o celta, teorias e métodos puderam ser testados, na esfera da fonética, da fonologia, da morfologia e, em escala menor, também da sintaxe. Apenas para citar um exemplo, Ferdinand de Saussure (1857‐1913) – cujo Curso de Linguística geral, publicado postumamente, em 1916, a partir das anotações de aula feitas por seus alunos, é considerado a primeira obra da linguística moderna – formou‐se no campo da linguística comparada, tendo‐se tornado conhecido pela Memória sobre o sistema primitivo das vogais nas línguas indo‐europeias, livro aparecido em 1879. 1 A descoberta do indo‐europeu Pode‐se afirmar que o fato mais determinante para a fundação da linguística comparada foi a “descoberta” do sânscrito pelos estudiosos europeus, o que se dá a partir do século XVI, num processo que se desdobra lentamente. De fato, apenas no século XVIII surgiram a primeira gramática sânscrita escrita por um europeu e o primeiro dicionário malaio‐ sânscrito‐português (o português era, então, a língua europeia predominante na Índia), ambos da autoria do jesuíta alemão Johann Ernst Hanxleden (1681‐1732). Contudo, a obra que foi fundamental para difundir o sânscrito na Europa só aparece em 1808, da autoria de Friedrich Schlegel (1772 – 1829), Über die Sprache und die Weisheit der Inder (Sobre a língua e a 41 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG sabedoria dos hindus), a partir da qual ganhou força a tese da existência de um grupo linguístico indo‐europeu. O conhecimento do sânscrito foi importante para os estudos comparativos tendo em vista, principalmente, três fatores: (a) não se tratava mais de descobrir qual teria sido a língua primitiva da humanidade; (b) os claros paralelismos entre, de um lado, o sânscrito e, de outro, o grego e o latim não poderiam ser explicados pelo contato entre esses povos em qualquer período conhecido da história; (c) pouco a pouco, a constatação das semelhanças sobretudo entre essas três línguas conduziu à formulação da hipótese de que deveriam elas pertencer a uma mesma “família”. Comparação e “parentesco” linguístico passam a ser, portanto, as palavras de ordem. É bem verdade que, ainda na Antiguidade, a semelhança entre o grego e o latim intrigara os romanos, o que não seria para menos, bastando observar algumas das palavras para cuja correspondência chamou atenção o gramático Varrão (116 a.E.C. – 27 E.C.) em seus estudos de “etimologia” (cf. Da língua latina, fr. 5, 34 e 96): QUADRO 1 Comparação de termos gregos e latinos Significado Grego Latim campo agrós ager porco hûs sus boi boûs bos touro taûros taurus ovelha óis ouis Como gregos e romanos eram povos geograficamente vizinhos, a explicação mais corrente para tais correspondências foi considerar que o latim derivava do grego, mais especificamente de um de seus dialetos, o eólico. Essa opinião, que tinha antecedentes em autores romanos como Catão o Velho (234 – 149 a.E.C.), foi assim expressa pelo historiador grego Dionísio de Halicarnasso (60 – 7 a.E.C.): “Os romanos falam uma língua que não é 42 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG nem totalmente bárbara, nem completamente a grega, mas uma certa mistura de ambas, de que a maior parte é eólica” (Antiguidades romanas 1, 90, 1). De novo é preciso lembrar que nada se diz sem intenção: o que se pretendia, neste caso, era não tanto tratar das línguas, mas enobrecer o povo romano, atribuindo‐lhe ancestrais gregos (cf. GABBA, 2000). Gregos e latinos, nem na Antiguidade, nem na Idade Média, avançaram além desse nível superficial de comparação. Somente no século XVI, com as grandes navegações, quando os primeiros europeus entraram em contato com as línguas de outros continentes, a história começaria a tomar outros rumos. Também neste caso, é preciso assinalar, o interesse da catequização e da exploração das colônias fundadas na África, na América e no extremo Oriente foram os propulsores do interesse pelas línguas. Recorde‐se que é dessa época, por exemplo, a Gramática da língua geral da costa do Brasil, do padre José de Anchieta. Neste caso e em tantos outros tratava‐se de produzir obras com finalidades bastante pragmáticas. Mas foi a uma parte das línguas da Índia, aquelas pertencentes ao grupo indo‐europeu, em especial ao sânscrito, que caberia um papel decisivo, por permitir comparações cada vez mais detalhadas com uma parte das línguas da Europa. Já em 1583, numa carta que permaneceu inédita até o século XX, o jesuíta inglês Thomas Stephens (1549 – 1619) dava notícia da existência de paralelos entre o concâni, o grego e o latim. Dois anos mais tarde, em 1585, o mercador florentino Filippo Sassetti (1540 – 1588), que viveu algum tempo em Goa e estudou sânscrito, chamou a atenção para a correspondência entre esta língua e o italiano, como, por exemplo, nas palavras abaixo: QUADRO 2 Comparação de termos italianos e sânscritos Significado Italiano Sânscrito sete sette sapta nove nove nava deus dio devah serpente serpe sarpah 43 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG Em 1768, o jesuíta francês Gaston Coeurdoux (1691 – 1779) apresenta à Académie des Inscriptions et les Belles Lettres, em Paris, estudos comparativos sobre o sânscrito, o grego e o latim, que incluíam minucioso confronto das conjugações verbais nas três línguas, propondo que as semelhanças só se podiam dever a uma origem comum. Entretanto, como seus trabalhos só foram publicados em 1808, sua tese não encontrou imediata ressonância. A “descoberta” oficial e o início dos estudos de linguística indo‐europeia têm sua data emblemática: a comunicação do diplomata inglês William Jones (1746 – 1794) à Real Sociedade Asiática de Calcutá, em 1786, quando ele avança a hipótese de que sânscrito, grego, latim e – ele apenas supõe então – também o gótico, o celta e o persa provêm de uma mesma origem. Seu objeto não é abordar a questão da proximidade entre essas línguas, mas tão somente tratar da antiguidade dos povos indianos, examinando, “em primeiro lugar, as suas línguas e escritas; em segundo lugar, a sua filosofia e religião; em terceiro lugar, os restos atuais de sua antiga escultura e arquitetura, os memoriais escritos de suas ciências e artes”, estendendo a comparação a todos esses domínios. Assim, por exemplo, ele aproxima Apolo de K shna, afirmando ainda que “não é possível ler o Védánta ou as várias refinadas composições que o ilustram, sem crer que Pitágoras e Platão derivaram suas sublimes teorias da mesma fonte que os sábios da Índia” (JONES, 2009, p. 19‐34). O trecho que se tornou famoso para os estudos linguísticos, portanto, não constitui mais que uma observação de passagem, em que o objetivo principal é ressaltar as característica excepcionais que ele, Jones, percebia no sânscrito: A língua sânscrita, seja qual for a sua antiguidade, tem uma estrutura admirável; mais perfeita que o grego, mais copiosa que o latim e mais elegantemente refinada que cada um deles, ainda que mantenha com ambos, seja nas raízes dos verbos, seja nas formas gramaticais, uma afinidade mais forte do que seria possível produzir‐se por acidente – deveras tão forte que nenhum filólogo poderia examinar todas as três sem crer que tenham advindo de alguma fonte comum, a qual talvez não exista mais há muito tempo; há uma razão similar, embora não absolutamente tão impositiva, para supor que também o gótico e o celta, embora mesclados com um idioma bastante diferente, tenham a mesma origem que o sânscrito; e o antigo persa 44 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG deveria ser adicionado à mesma família, se houvesse ocasião para discutir alguma questão relativa às antiguidades da Pérsia. (JONES, 2009, p. 19‐34) Ainda que com toda essa concisão, na verdade a declaração de Jones teve como mérito: (a) ressaltar a proximidade entre sânscrito, grego, latim, germânico, celta e persa (ou seja, representantes de cinco dos dez grupos de línguas indo‐europeias hoje admitidos); (b) não imaginar que uma das línguas conhecidas fosse a origem das demais, mas postular que deveriam elas provir de uma fonte comum (some common source) talvez não mais existente (which, perhaps, no longer exists); (c) isso posto, atribuir as afinidades ou parentesco (affinity) ao fato de que todas essas línguas deveriam pertencer a uma mesma família (the same family). Mais que tudo, observe‐se, no uso dos condicionais e dos advérbios, que não se trata de formular postulados, mas de levantar hipóteses cuja comprovação dependeria de outros estudos. Como observa Blikstein, tendo em vista os antecedentes acima expostos, na verdade, as semelhanças entre o sânscrito e as línguas européias já tinham sido percebidas bem antes do séc. XIX. Ocorre, no entanto, que a história das idéias e do pensamento não é linear; ao contrário, ela é descontínua e, no dizer do eminente lingüista romeno Eugenio Coseriu (...), a história da ciência lingüística é “cheia de ocos, a tal ponto que, reiteradamente, as mesmas coisas voltam a ser ‘redescobertas’”. (BLIKSTEIN, 1992, p. 105) O passo seguinte da “redescoberta” será dado pelo livro de Schlegel já referido, mas o mais importante foi a publicação, em 1816, do estudo do alemão Franz Bopp (1791 – 1867) Über das Conjugationssystem der Sanskritsprache in Vergleichung mit jener der griechischen, lateinischen, persischen, und germanischen Sprache (Sobre o sistema de conjugação da língua sânscrita em comparação com o das línguas grega, latina, persa e germânica). O estudo de um sistema, neste caso o verbal, revelou‐se um argumento mais poderoso para fundamentar a hipótese de uma origem comum que a simples comparação lexical. Estava, portanto, criado o método comparativo, cujo pressuposto de partida é que entre elementos de línguas aparentadas existem correspondências sistemáticas (e não apenas aleatórias) em termos de estrutura gramatical, correspondências estas passíveis de serem estabelecidas por meio duma cuidadosa comparação. Com isso, podemos não só explicitar o parentesco entre línguas (isto é, dizer se uma língua pertence ou não a uma determinada família), como também determinar, por inferência, características da língua ascendente comum de um certo conjunto de línguas. (FARACO, 2005, p. 134). 45 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG Na sequência, entre 1833 e 1852, o próprio Bopp estendeu a comparação ao lituano, eslavo, armênio, celta e albanês, abrangendo, assim, todos os grupos indo‐europeus então conhecidos (ainda não tinham sido decifrados nem o hitita nem o tocário). Paralelamente, já em 1818 havia aparecido o trabalho do dinamarquês Ramus Rask (1878 – 1832), em que eram comparadas as línguas nórdicas com as demais línguas germânicas, o grego, o latim, o lituano, o eslavo e o armênio, o que só confirmava a validade de se considerar que todos eles integravam uma mesma família. Você mesmo poderá observar, nos exemplos abaixo, o quanto essa hipótese é plausível. Vamos examinar os nomes de parentesco, um grupo de palavras que tende a ser bastante conservador. O Quadro 3 apresenta quatro línguas antigas e não mais faladas (avéstico, sânscrito, grego clássico e latim) e quatro línguas modernas e faladas hoje em dia (irlandês, alemão, inglês e russo). QUADRO 3 Nomes de parentesco nas línguas indo‐europeias Sentido Avéstico Sânscrito Grego Latim Irlandês Alemão Inglês Russo mãe matár‐ matar méter mater máthair Mutter mother mati pai pitár‐ pitar patér pater athair Vater father otiets irmão bhrátar‐ bratar‐ adelphós frater bráthair Bruder brother brat filha duhitár‐ dugədar‐ thugáter filia iníon Tochter irmã svásar‐ xvaŋhar‐ adelphé soror siúr Schwester sister siestra filho sunuh hunuš huiós filius mac Sohn son syn daughter dotsiernii A primeira constatação é que nem todas as palavras no quadro têm a mesma origem, algumas línguas tendo procedido a substituição do termo que seria comum. Contudo, a grande maioria conserva denominações muito próximas. Para descobrir quais vêm de um étimo comum, faça assim: a) Antes de tudo, tenha em vista os fonemas que têm alguma proximidade e procure observar se há alguma regularidade nas correspondências entre eles: as oclusivas dentais ‘t/th/d/dh’; as oclusivas velares ‘k/kh/g/gh’ e a fricativa ‘h’, que pode derivar das suas formas aspiradas; as oclusivas labiais ‘p/ph/b/bh’ e as 46 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG fricativas que podem derivar de suas formas aspiradas, ou seja, ‘f/v’; finalmente, as fricativas ‘s/x’ e a aspirada que pode derivar da primeira, ‘h’. b) Agora comece por ‘mãe’, que apresenta semelhanças bastante regulares em todas as línguas: você constatará que todos os termos são compostos de duas sílabas (a primeira –ma/me/mo/mu‐, seguida de –tar/thair/ter/ther/ti), o que sugere que todas devem proceder do mesmo étimo, reconstituído inicialmente como *māter; c) Passe em seguida para ‘pai’, em que a mesma terminação se repete, ocorrendo na primeira sílaba as variações pa/pi/fa/va‐ (que podem ser explicadas considerando o referido no item ‘a’ acima), a forma do irlandês apresentando a seguinte evolução: *pa‐ > pha‐ > ha‐ > a‐; em conclusão, a fonte de todos os termos (com exceção da palavra russa, que tem origem diferente) foi reconstituída tradicionalmente como *pater. d) Em ‘irmão’ você perceberá que o grego apresenta uma palavra de origem diferente, podendo todas as demais ser explicadas a partir do que você já conhece, o étimo tendo sido primeiramente reconstituído como *bhrater. e) Os termos correspondentes a ‘filha’ apresentam a mesma formação que os demais (com o sufixo *‐ter), podendo as diferenças ser explicadas a partir do que você já conhece; o étimo comum foi em princípio reconstituído como *dhughter, as exceções ficando por conta do latim, do irlandês e, parcialmente, do russo (o antigo eslavo eclesiástico apresenta a forma dušti). f) Com relação a ‘irmã’, a exceção se deve de novo ao grego, as demais palavras podendo ser aproximadas e sua origem tendo sido reconstituída de início como *swesor (no latim, a mudança ‘s’ > ‘r’ é normal em certos contextos). g) Finalmente, para ‘filho’ as exceções se constatam no latim e no irlandês, para os demais termos tendo sido proposto inicialmente o étimo *sunu‐. Todas essas reconstituições representam tentativas iniciais que mais tarde conhecerão outras propostas de restabelecimento, na medida em que se diferenciem as formas como 47 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG se desenha o sistema fonológico do indo‐europeu. Em especial, o vocalismo apresentava problemas que só aos poucos foram esclarecidos. Mas alguns elementos se impõem de imediato, como o uso de *‐ter para marcar uma parte desses nomes de parentesco, o que leva a supor que se trate de um sufixo (cuja produtividade parece ter sido estendida, no germânico e no russo, além dos quatro primeiros nomes do quadro, abrangendo também o relativo a ‘filha’). De qualquer modo, é evidente que a semelhança entre tantos termos com os mesmos significados não se poderia dever a mero acaso – ou seja, o único modo de buscar uma explicação razoável é apelar para a hipótese de uma origem comum de todas essas línguas. 2 A constituição do método histórico‐comparativo Uma etapa importante para a constituição do arcabouço da chamada gramática ou linguística histórico‐comparativa foi a publicação, em 1819, da Deutsche Grammatik (Gramática alemã), por Jacob Grimm (1785 – 1863) – um dos dois irmãos que ficaram famosos por terem recolhido e publicado os contos de fadas (Märchen) da tradição alemã. A diferença entre o trabalho de Grimm e o de seus antecessores, Bopp e Rask, está no fato de que ele não estava interessado apenas em comparação visando à demonstração do parentesco entre línguas, mas desenvolveu um estudo propriamente histórico, abordando o desenvolvimento do grupo linguístico germânico durante quatorze séculos e atento a mudanças cronologicamente datáveis. Uma das “descobertas” mais importantes de Grimm foi a lei que passou a ser chamada por seu nome (“lei de Grimm”), segundo a qual se mostrava, com relação às consoantes oclusivas, o caráter regular de mudanças que separavam o ramo germânico dos demais grupos indo‐europeus (fenômeno também chamado de “primeira rotação consonantal germânica”): (a) onde, no indo‐europeu, se encontrava uma oclusiva surda ou desvozeada (p, t, k), no germânico se tinha uma aspirada ou uma fricativa dela derivada (f, th, h); (b) onde, no indo‐europeu, havia uma aspirada (ph, th, h), o resultado era uma sonora ou 48 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG vozeada (b, d, g); (c) finalmente, onde, no indo‐europeu, existia uma vozeada (b, d, g), em germânico se encontraria uma desvozeada (p, t, k). Assim, por exemplo: desvozeada > aspirada QUADRO 4 Lei de Grimm aspirada > vozeada vozeada > desvozeada i.e. *trei‐ i.e. *bhrater i.e. *dwo‐ latim tres gótico: threis sânsc.: gótico: brothar latim: duo gótico: twa grego treis inglês: three bhratar‐ inglês: brother grego: duo inglês: two latim: frater Outra contribuição importante para os estudos histórico‐comparativos deu‐se na esfera de um grupo bastante conhecido das línguas indo‐europeias: o românico. Entre 1836 e 1844, Friedrich Diez (1794‐1876) publicou trabalhos histórico‐comparativos das línguas procedentes do latim, incluindo um dicionário etimológico das mesmas (1854), o que marca a criação da Filologia Românica, uma disciplina que conheceu, a partir de então, um desenvolvimento extenso e notável. Neste caso, havia uma grande vantagem: podia‐se contar com registros escritos da língua de origem – o latim – e das dela derivadas: português, galego, espanhol, catalão, provençal, francês, retorromano, italiano, sardo e romeno. Se, com relação a outros grupos, a reconstituição da protolíngua ficava no campo das hipóteses, com a Filologia românica a validade dos métodos de comparação pôde se testada. Vale lembrar um dos casos. Pelo método comparativo, aos poucos foram estabelecidos os processos de mudança fonética do latim para as diferentes línguas românicas. Um dos exemplos seria o grupo inicial latino pl‐, que, em certas condições, gera os seguintes resultados: ch‐ em português; ll‐ em espanhol; pl‐ em francês; pi‐ em italiano. Uma série de termos confirma essa regra: português QUADRO 5 O grupo inicial pl‐ em latim e em línguas românicas espanhol francês italiano latim chão llano plain piano planu‐ cheio lleno plein pieno plēnu‐ 49 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG Acontece que, com relação a um dos casos, o do verbo ‘chover’, a previsão se aplicava perfeitamente com relação ao grupo consonantal inicial, mas observava‐se um problema no final da palavra: português espanhol QUADRO 6 Chover francês chover llover pleuvoir italiano latim piovere *plouēre Ora, se a comparação, considerados os processos de mudança fonética, levava a plouēre, a documentação garantia que, no latim clássico, o verbo ‘chover’ era pluĕre, motivo por que a palavra foi marcada com um asterisco, para indicar que se tratava apenas de um termo reconstituído, mas não atestado. Com efeito, a semivogal latina ‐u‐ deveria gerar ‐v‐ nas línguas relacionadas, bem como os verbos latinos da terceira conjugação (terminados em – ēre) resultam regularmente nas terminações ‐er/‐oir/‐ere nessas mesmas línguas (cf. lt. mouēre > pt. e esp. mover, fr. mouvoir, it. muovere). Todavia, mais tarde se “descobriu”, num episódio famoso de um romance escrito no séc. I ou II E.C., o Satiricon de Petrônio, o termo então apenas reconstituído: durante a ceia de Trimalquião, um novo rico, várias personagens contam histórias e o autor, por tratar‐se de um texto satírico, reproduz muitos elementos da linguagem comum; numa dessas histórias, devida ao personagem Ganimedes, num determinado momento se declara que urceatim plouebat (chovia a cântaros, Satiricon 44). Ora, o imperfeito de pluĕre é pluebat, sendo a forma plouebat própria do que se passou a chamar de latim vulgar, ou seja, o latim falado, de onde procedem efetivamente as línguas românicas. O curioso é que, embora plouebat fosse atestado nos manuscritos do Satiricon, os editores corrigiam o termo, julgando que se devesse a confusão de algum copista medieval – e, com efeito, anteriormente à reconstituição da passagem pelos romanistas do século XIX, o que se conhecia era apenas a forma corrigida, urceatim pluebat, como, por exemplo, ela é citada por Voltaire no seu Dictionnaire philosophique (Dicionário filosófico) de 1764 (verbete Idole, idolâtre, idolâtrie, seção I). Portanto, observe como, a par do fato de que esse episódio 50 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG confirma a validade do método comparativo, mostra também como os estudos histórico‐ comparativos induziram a um cuidado maior na busca e leitura de fontes capazes de fornecer informações sobre as mudanças linguísticas. Com o correr dos anos, outros grupos de línguas indo‐europeias foram também objeto de estudos específicos – como as eslavas, as celtas, as indo‐iranianas etc. –, o que terminou por fornecer aos estudos histórico‐comparativos uma boa base de dados empíricos, indispensável para testar sua metodologia. 51 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG TIPOLOGIA LINGUÍSTICA Sueli Maria Coelho (Fale/UFMG) INTRODUÇÃO Uma das características do ser humano é a tendência natural de reunir ou de agrupar objetos ou seres que apresentam alguma relação. Assim, desde a mais tenra idade, o ser humano já dá mostras de sua capacidade de separar objetos segundo tamanhos, segundo cores, segundo formas... A essa atividade de distribuir elementos por grupos, obedecendo a um critério determinado de semelhanças e de diferenças é o que se chama de classificação ou de estabelecimento de tipologias. Essa propensão natural para a classificação se manifesta também nas atividades humanas, como nas ciências, por exemplo. Toda ciência adota critérios para classificar e para descrever seus objetos de estudo. A Biologia, por exemplo, pode descrever os seres vivos segundo o critério da locomoção, classificando‐os em voadores e em não‐voadores; segundo o critério do número de células, os seres podem ser unicelulares ou pluricelulares; segundo o tipo de alimento que consomem, os seres classificam‐se em carnívoros, herbívoros ou onívoros. A partir do que foi ilustrado com a Biologia, você deve ter percebido que não existe uma única forma de classificação e que, dependendo do critério adotado, os grupos podem variar não só quanto ao número de elementos, mas também quanto aos elementos propriamente ditos. A ciência da linguagem não foge à regra da classificação. Uma das atribuições da linguística geral é classificar, segundo um critério científico determinado, as múltiplas e variadas línguas humanas, o que, certamente, não constitui uma tarefa fácil, mas muito provocativa. Nesta unidade, você irá conhecer alguns critérios adotados, ao longo da história da linguagem, para classificar as diversas línguas faladas no mundo. 52 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG 1 Critérios de classificação das línguas As diversas línguas faladas no mundo têm sido tradicionalmente classificadas segundo três critérios principais: (i) critério genealógico ou genético, (ii) critério geográfico ou areal e (iii) critério estrutural ou tipológico. O primeiro dos critérios apresentados se pauta principalmente por fatores diacrônicos, interessando mais diretamente, portanto, à linguística histórica, como visto nas aulas iniciais de nosso curso. O segundo critério se apoia em um elemento extralinguístico, isto é, exterior à língua, que é o território onde as diversas línguas são faladas. Trataremos desse tema de forma mais aprofundada na aula destinada ao estudo das áreas linguísticas, uma instigante área da linguística comparada. O terceiro critério baseia‐se em características estruturais das línguas, partindo do princípio teórico de que tais estruturas são passíveis de classificação segundo tipos gerais. A seguir, você encontrará uma descrição mais detalhada de cada um desses três critérios, com exemplos que o auxiliarão a compreendê‐los melhor. O critério também chamado estrutural, objeto de estudo desta aula, receberá um tratamento um pouco mais exaustivo que os demais por ser o único puramente tipológico. 1.1 Critério genealógico ou genético Esse critério embasa‐se no parentesco entre as línguas e se desenvolveu graças ao método histórico comparativo, muito explorado e desenvolvido, conforme visto nas aulas anteriores, pelos linguistas do séc. XIX. A base desses estudos é a crença na existência de uma língua‐mãe, denominada de protolíngua, da qual tenham se originado todas as outras. Já havia especulações anteriores sobre a filiação das línguas, mas foi com a descoberta do sânscrito, no começo do séc. XIX, que a crença no parentesco linguístico ganhou força. A comparação do sânscrito com as línguas clássicas – grego e latim – demonstrou haver entre essas três línguas traços comuns, entusiasmando bastante os estudiosos da época, que chegaram a acreditar que o sânscrito fosse a língua‐mãe das demais línguas europeias. Entretanto, tal crença não se sustentou por muito tempo. Logo as explicações de William 53 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG Jones, primeiro grande estudioso do sânscrito na Europa, esclareceram que “o grego, o latim, o sânscrito etc. eram formas divergentes de uma língua pré‐histórica.” (BORBA, 1967, p. 26). A relação genética entre as línguas é comprovada historicamente, quando, a partir da comparação de idiomas entre os quais se suspeita haver alguma relação de parentesco, identificam‐se correspondências fonéticas, morfológicas ou de vocabulário. Há de se assinalar, entretanto, que a ausência de semelhança gramatical (correspondências no plano fonético ou morfológico) não significa ausência de parentesco, pois, com a fragmentação, as línguas podem seguir caminhos similares ou distintos, o que contribui para manter ou para diluir as características comuns. O francês, por exemplo, rejeitou grande parte do sistema de flexões do latim, sua língua‐mãe. O mesmo zelo recomendado para tratar as aparentes semelhanças no plano da gramática deve ser adotado no plano do léxico. Semelhanças vocabulares nem sempre denotam obrigatoriedade de parentesco, já que o léxico é a parte da língua mais aberta a incorporações e, portanto, o que mais recebe influências de outras línguas. No inglês, língua não originária do latim, é possível encontrar palavras muito próximas do português, como interpretation, por exemplo, cuja base é o latim, língua‐mãe do português, mas não do inglês. Para se atestar o parentesco entre um grupo linguístico, é necessário, então, que as relações de semelhança entre essas línguas, quer no plano da gramática, quer no do léxico, sejam mais significativas, estendendo‐se a um grupo mais representativo de palavras e não se limitando apenas a um conjunto reduzido de elementos. Apesar de bastante explorado, o critério de classificação pautado no parentesco não conseguiu incluir todas as línguas em um bloco genético bem definido. Segundo Câmara Júnior (1989), “nas condições atuais, [...] a classificação genética só se aplica com segurança a uma minoria de línguas, e não pode servir de base classificatória única.” (p. 293). 54 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG 1.2 Critério geográfico ou areal Esse critério é geralmente adotado quando não se tem um conhecimento suficiente das línguas para reuni‐las e denominá‐las e, na tentativa de se fazê‐lo, recorre‐se à área ou ao espaço geográfico “sobre o qual se estende a língua ou as línguas, tomando‐se os limites geográficos como limites linguísticos.” (CÂMARA JÚNIOR, 1967, p. 93) Sob esse critério, abarcam‐se classificações como línguas americanas, línguas africanas, línguas europeias etc. É necessário ter consciência de que esse critério é de cientificidade mais limitada que os demais, dado que “não há relação direta entre idioma e território, pois a língua é um meio de intercâmbio oral vigente numa sociedade e pode deslocar‐se com ela. Desse modo, muitas línguas teriam várias classificações ao mesmo tempo.” (BORBA, 1967, p. 94) Segundo o critério geográfico, o português, por exemplo, admite, ao menos, duas classificações: português europeu, para se referir à língua falada em Portugal, e americano, referindo‐se àquela falada no Brasil. Ainda segundo Borba (op. cit.), “a classificação geográfica só é válida quando a continuidade regional coincide com a unidade linguística ou com uma afinidade tipológica, elementos que, na verdade, fundamentam a classificação.” (p. 94) O critério geográfico é, portanto, de valor reconhecido tão somente quando há a coexistência de blocos geográficos num mesmo território, o que normalmente leva à interpenetração de traços característicos. Nesse caso, o que interessa é o contato entre as línguas, que pode dar à área linguística uma configuração estrutural comum. 1.3 Critério estrutural ou tipológico Essa é, segundo os estudiosos do tema, a tentativa mais antiga e mais apreciável de se classificar tipologicamente as línguas. Desenvolvida pelo linguista alemão August 55 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG Schleicher7, ainda na primeira fase dos estudos linguísticos do séc. XIX, essa proposta busca determinar a estrutura interna das línguas para classificá‐las com base em parâmetros gramaticais, ou seja, com base na estrutura das palavras, aspecto que levou Coutinho (1969) a denominar tal critério de morfológico. Segundo Maia (2006, p. 180), que endossa a nomenclatura de Coutinho (1969), “a tipologia morfológica do século XIX, de natureza basicamente classificacional, partia da estrutura do vocábulo” e defendia que cada língua podia ser incluída em um dos seguintes tipos: isolante, aglutinante ou flexiva. a) Línguas isolantes ou monossilábicas: são línguas “cujas unidades vocabulares são formadas por monossílabos, denominados raízes,” (COUTINHO, 1969, p. 24) e que não possuem flexão, isto é, são línguas cujas palavras não apresentam marcas gramaticais para expressar gênero, número, tempo, pessoa e modo. As palavras que as compõem não podem, dessa forma, ser decompostas em unidades significativas ou morfemas. O chinês é um exemplo clássico de língua isolante. Nele, as classes de palavras são identificadas não pela flexão, como acontece com algumas classes do português, mas pelo tom com que são pronunciadas – há monossílabos no chinês que são pronunciados com seis entoações diferentes, correspondendo cada uma a um sentido – ou pela posição que ocupam na frase. “Assim, ta kuok em chinês significa ‘o grande Estado’, mas kuok ta é uma sentença, ‘ o Estado (é) grande’”. (COUTINHO, 1969, p. 24) b) Línguas aglutinantes ou aglutinativas: são aquelas em que se juntam, numa mesma palavra, vários elementos que, mesmo reunidos, preservam sua individualidade. Cada um desses elementos é tão distinto foneticamente que pode, a qualquer momento, juntar‐se ou separar‐se do complexo usado como palavra. “Nestas línguas, a unidade vocabular não exerce muita polaridade estrutural, pois os elementos componentes, apesar de serem requeridos para pertencer à palavra, são 7 A proposta de Schleicher não é inédita. Para elaborá‐la, ele retomou ideias anteriores dos irmãos August e Friedrich Schlegel (1818), que, por sua vez, apoiavam‐se na classificação morfológica das línguas, proposta por Adam Smith (1761). Coube, contudo, a Schleicher o refinamento da proposta e a sua definição enquanto critério classificatório, aspecto que lhe creditou o reconhecimento. 56 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG bastante independentes.” (BORBA, 1967, p. 96) O turco e o japonês são exemplos de línguas aglutinantes. No turco, “os vários morfemas se seguem uns aos outros, comumente em seqüências de seis ou mais, com retenção clara, porém, da forma de cada um, o que facilita a segmentação. Assim, temos a raiz sev cujo sentido fundamental é amor. A ela se aglutinam vários morfemas: sev‐mek – amar; sev‐er – amante, ele ama; sev‐er‐im – eu amo; sev‐me‐mek – amar um ao outro; sev‐ish‐dir‐mek – causar amor um ao outro [...]” (BORBA, 1967, p. 96) Como se percebe pelos exemplos do turco, nas línguas aglutinantes, os elementos componentes da palavra não se fundem, mas ficam justapostos, mantendo demarcada sua fronteira pelo emprego do hífen. c) Línguas flexivas, orgânicas ou amalgamantes: são línguas em que o vocábulo, ao contrário das línguas isolantes, pode ser decomposto em unidades significativas menores, os morfemas. Em tais línguas, como no português, por exemplo, o vocábulo é constituído, normalmente, de um semantema, isto é, de um elemento que carrega o sentido lexical da palavra, e de morfemas gramaticais, como as desinências (morfemas flexionais) e os afixos (morfemas derivacionais), que servem para assinalar, respectivamente, as flexões e as derivações. Segundo Câmara Júnior (1989), “os próprios lingüistas da geração de Schleicher [...] reconheceram a dificuldade prática de traçar uma linha divisória nítida entre o flexionismo e a aglutinação.” (p.300) Tal dificuldade pode ser minimizada a partir da decomposição dos elementos constituintes do vocábulo. Enquanto, nas línguas aglutinantes, conforme explicado, os elementos constituintes do vocábulo, em virtude de sua individualidade, podem se separar mecanicamente do complexo formador da palavra, nas línguas flexionais, tais elementos mostram‐se tão aglutinados que não podem se separar do vocábulo, existindo individualmente. Em uma palavra, como amávamos, por exemplo, embora seja possível identificar cada um de seus quatro elementos constituintes – am + a + va + mos – tais elementos não existem desvinculados do vocábulo. Trata‐se, portanto, de uma língua flexiva. 57 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG Dado que, conforme mencionado, a distinção entre línguas aglutinantes e línguas flexivas era, para os próprios estudiosos do tema, confusa e, portanto, de baixo rigor descritivo, buscou‐se, “mais modernamente, um novo tipo de classificação estrutural, tomando‐se o vocábulo sob outro ponto de vista – o da noção que expressa.” (BORBA, 1967, p. 97) Considerando‐se, assim, a possibilidade de o vocábulo ser, sob a perspectiva nocional, simples, complexo ou muito complexo, propôs‐se um novo quadro de classificação para as línguas, separando‐as em analíticas, sintéticas ou polissintéticas. a) Línguas analíticas: agrupam‐se sob a classificação de analíticas as línguas cujos vocábulos tendem a exprimir uma só noção. As línguas que não usam declinações8, como o português, o inglês, o francês, o espanhol, o italiano, são classificadas como analíticas. b) Línguas sintéticas: são línguas em que o vocábulo concentra em si várias noções; além disso, fazem uso da declinação, sendo, por isso, chamadas de línguas de caso. O latim é uma língua sintética; a palavra lupus (“lobo”) traz as marcas de caso nominativo (função sintática de sujeito), de gênero masculino e de número singular. Caso se queira utilizar essa palavra na função de objeto direto (caso acusativo), mantendo‐se o mesmo gênero e número, será necessário substituir‐se a terminação ‐us por ‐um (lupum). Também o grego, o sânscrito e o alemão, por fazerem uso da declinação, são considerados línguas sintéticas. c) Línguas polissintéticas: recebem essa classificação línguas em que o vocábulo tende a abarcar em si todas as noções por exprimir na frase. Nesse tipo de língua, “o vocábulo tem a mesma extensão da sentença, cujos elementos (sujeito, verbo, objeto etc.) se combinam numa unidade única sem possibilidade de existência autônoma.”(BORBA, 1967, p. 98) O esquimó e algumas línguas indígenas são classificados como polissintéticas9. 8 Alterações que as palavras sofrem, por meio do acréscimo de morfemas, para exprimir as diversas funções sintáticas e gramaticais. 9 Em uma das línguas esquimós, o Inuit, Janniupiqaluknirijanga significa “Johnny está comendo/comeu (o) peixe.” 58 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG Considerações finais Como mencionado no início desta aula e demonstrado ao longo da exposição, não existe uma única forma de classificação para as línguas. Dependendo do critério adotado, uma língua pode receber até mais de uma classificação. Um critério é considerado tanto melhor, quanto mais abrangente e descritivo ele for, isto é, quanto maior o número de línguas ele puder abarcar. Além das classificações aqui apresentadas, há também as clássicas propostas de Sapir e de Greenberg, que não foram exploradas, em função do recorte imposto. Tal recorte decorre do objetivo desta aula, que é o de levá‐lo a perceber que as diversas línguas do mundo apresentam, no plano estrutural, algumas semelhanças, que lhes permitem ser agrupadas. Caso você tenha interesse em aprofundar‐se nesse assunto, poderá recorrer às referências aqui indicadas. Agora responda aos Exercícios relativos a este texto, que estão presentes na plataforma Moodle. Referências BORBA, Francisco da Silva. Introdução aos estudos linguísticos. São Paulo: Companhia Editora Nacional, 1967. Localização na biblioteca: 410 B726i 1967 (FALE) CÂMARA JÚNIOR, J. Mattoso. Princípios de linguística geral: como introdução aos estudos superiores da língua portuguesa. Rio de Janeiro: Padrão, 1989. Localização na biblioteca: 469.5 C172p 2002 (FALE) COUTINHO, Ismael de Lima. Gramática histórica. Rio de Janeiro: Livraria Acadêmica, 1969. Localização na biblioteca: 469.5 C871g 1976 (FALE) Inuit. Disponível em: <http://www.lmp.ucla.edu/Profile.aspx?LangID=196&menu=004>. Acesso em: 6 out. 2011. MAIA, Marcus. Manual de linguística: subsídios para a formação de professores indígenas na área de linguagem. Brasília: Ministério da Educação, Secretaria de Educação Continuada, Alfabetização e Diversidade; LACED/Museu Nacional, 2006. Disponível em: <http://www.trilhasdeconhecimentos.etc.br/livros/index.htm>. Acesso em: 5 out. 2011. 59 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG LEITURA COMPLEMENTAR CÂMARA JÚNIOR, J. Mattoso. Princípios de linguística geral: como introdução aos estudos superiores da língua portuguesa. Rio de Janeiro: Padrão, 1989, p. 311‐312. Uma das tarefas da lingüística geral é classificar, dentro de um dado critério científico, as múltiplas línguas do mundo, com que lidam os especialistas. Da gramática comparativa desenvolveu‐se uma classificação genética, em famílias ou blocos de línguas, pelo critério de todas provirem de uma língua matriz ou protolíngua. Desses blocos, o mais elaborado e aprofundado é o indo‐europeu, cuja reconstituição serviu de modelo para a depreensão de outros blocos, como o ugro‐fínico, o altaico, o sino‐ tibetano. Ainda não foi possível aplicar essa classificação genética a toda e qualquer língua, e nos blocos já estabelecidos existem muitos problemas de detalhe classificatório. A classificação genética é, antes de tudo, diacrônica, embora possa ser utilizada na lingüística descritiva até certo ponto; a sua diretriz é o oposto de uma classificação descritiva, no sentido de que procura reunir línguas estruturalmente muito diversas, partindo de leis rigorosamente depreendidas de evolução. Daí, para fins descritivos, recorrer‐se a classificações extralingüísticas. Dessas classificações extralingüísticas apenas é, até certo ponto, pertinente a classificação geográfica, que reúne as línguas pelas áreas geográficas por que se distribuem. A sua base lingüística é o fenômeno da difusão, que estende certos traços estruturais a línguas essencialmente distintas, quando geograficamente contíguas, podendo‐se ter até “conjuntos lingüísticos”, em áreas determinadas. A classificação areal é, portanto, em última análise, de natureza tipológica. A classificação puramente tipológica parte, por sua vez, do postulado de que os múltiplos sistemas lingüísticos são susceptíveis de se enquadrarem em tipos gerais de estrutura em número reduzido. A primeira dessas classificações foi a de Schleicher, que, entretanto, queria ser, 60 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG antes de tudo, diacrônica e servir de explicação para as diretrizes da evolução lingüística na marcha do simples para o complexo na constituição do vocábulo. Apresentava, não obstante, certas possibilidades descritivas, embora de maneira inadequada e imprecisa. Modernamente Sapir e Greenberg procuram elaborar classificações tipológicas de caráter puramente descritivo. De um modo geral, há variadas possibilidades de classificações tipológicas, partindo‐se de traços fônicos, mórficos e sintáticos ou semânticos, por exemplo; o imperativo é que se trate de traços essenciais para a apresentação mais nítida e econômica dos sistemas lingüísticos considerados. 61 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG FAMÍLIAS LINGUÍSTICAS DO MUNDO Aléxia Teles Duchowny (Fale/UFMG) INTRODUÇÃO Quantas línguas existem no mundo? Esta é uma pergunta de difícil resposta! Como já vimos na aula de variação e mudança linguística, a linguagem humana é extremamente dinâmica, variável e sofre mudanças constantes, ficando difícil saber, com precisão, o número de línguas do presente ou do passado. Lewis (2009) cataloga 6.909 línguas vivas, isto é, com falantes vivos que aprenderam a língua de seus pais e a utilizam no dia a dia. Além do mais, a própria definição de língua é muito controversa: Definir uma língua depende dos objetivos que se tem ao identificar aquela língua diferente da outra. Alguns desses objetivos se baseiam em critérios meramente linguísticos; outros reconhecem que fatores sociais, culturais ou políticos também podem ser levados em conta. Além do mais, os próprios falantes costumam ter suas próprias perspectivas sobre o que faz uma língua específica ser unicamente deles. Estes critérios são mais frequentemente relacionados a questões de legado sociocultural do que a aspectos linguísticos da(s) língua(s) em questão (LEWIS, 2009, p. 8). Na realidade, devemos evitar pensar em línguas como uma unidade contável, específica e identificável. Para Lewis (2009, p. 8), “uma língua significa um conjunto de aspectos contínuos que se estendem ao longo do tempo, da geografia e do espaço social.” Como o que chamamos de língua apresenta sempre variação, é preciso, então, tomarmos consciência das variedades dentro de uma só língua. Surge, assim, o conceito de dialeto. Mais uma vez, não há consenso entre os linguistas e cada autor terá uma definição própria. Para Crystal (1988, p. 81), trata‐se de “uma variante de uma língua, distinta em termos sociais ou regionais e identificada por um conjunto particular de palavras e estruturas gramaticais.” O que chamamos de sotaque é, na verdade, o conjunto de características da pronúncia de um dado dialeto (carioca, mineiro, paulista; inglês britânico e americano; francês canadense e da França, etc). Já Matthews (1997, p. 96) afirma que dialeto é “qualquer variedade distinta de uma língua, especialmente a falada em uma 62 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG parte específica de um país ou de outra área geográfica.” De fato, como já visto, uma comunidade de fala composta de um número relativamente alto de falantes tende a ter dialetos. Elementos que separam as pessoas dentro dessa comunidade (barreiras geográficas, classes sociais, acesso ao ensino) podem favorecer, ainda mais, o surgimento de dialetos. As línguas, por sua vez, são usualmente agrupadas em famílias ou grupos pelos linguistas. Aqui, veremos uma das possibilidades de organização das línguas do mundo em grandes conjuntos. Apesar de a família indo‐europeia ser vasta, ela é apenas uma pequena parte do complexo quebra‐cabeça de línguas do mundo. De acordo com o site Ethnologue (http://www.ethnologue.com), atualmente, há 116 famílias linguísticas diferentes. Seis delas se destacam por seu tamanho e abarcam, juntas, quase dois terços de todas as línguas e cinco sextos do total de falantes. Daremos ênfase, então, a essas seis famílias. Observe os dados abaixo e clique sobre o nome da família para visualizar um mapa com as suas línguas e a sua localização: Família Afro‐asiática http://wals.inf o/languoid/fa mily/afroasiati c Austronésia http://wals.inf o/languoid/fa mily/austrone sian Indo‐europeia http://wals.inf o/languoid/fa mily/indoeuro pean TABELA 1 As mais importantes famílias linguísticas do mundo Línguas vivas Falantes Alguns países de localização Qtde. % Qtde. % 353 5,11 359.495.289 6,03 Algéria, Etiópia, Irã, Iraque, Israel, Síria, Tanzânia, Tunísia, Turkia, Yemen... 1.231 17,82 353.585.905 5,93 Chile, China, Indonésia, Nova Zelândia, Papua Nova Guiné, Filipinas, Tailândia... 426 6,17 2.721.969.619 45,67 Áustria, Bangladesh, Finlândia, Nepal, Eslovênia, Sri Lanka, Suriname... 63 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG Níger‐congo http://wals.inf o/languoid/fa mily/nigercon go Sino‐tibetana http://wals.inf o/languoid/fa mily/sinotibet an Trans‐Nova Guiné http://wals.inf o/languoid/fa mily/transnew guinea Total 1.510 21,86 382.257.169 6,41 Burkina Faso, Gana, Mali, Moçambique, Namíbia, Uganda, Zâmbia... 445 6,44 1.259.227.250 21,13 Bangladesh, China, India, Laos, Nepal, Pakistão, Tailândia, Vietnã... 475 6,88 3.334.267 0,06 Timor Leste, Indonésia, Papua Nova Guiné 4.440 64,26 5.079.869.499 85,24 Fonte: Tabela 4 de Lewis (2009, p. 27) Saiba, entretanto, que agrupar e classificar as línguas, mesmo que conheçamos sua origem ‐ o que nem sempre acontece ‐, ainda é uma fonte de grandes discussões entre os linguistas contemporâneos (veja Ruhlen (1994) e Greenberg (1966), por exemplo). O mapa em http://www.proel.org/index.php?pagina=mundo permite que você visualize a tabela acima de outra forma, confira‐o. Você deve ter verificado que o mapa acima leva em conta tanto as línguas originais, que existiam em uma dada região, antes de colonizações modernas, quanto as atuais. É por isso, por exemplo, que as Américas estão com duas cores: rosa e lilás, para as línguas que existiram antes da chegada dos ingleses, portugueses e espanhóis, e vermelho, indicando o inglês, o espanhol e o português. Assim, na América Latina, por exemplo, podemos verificar tanto a presença de línguas da família indo‐europeia, o espanhol e o português trazidos pelos colonizadores europeus, quanto da família ameríndia, que comporta as línguas nativas. 64 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG DICA! Acesse a Tabela 5 (Outras famílias linguísticas do mundo) em http://www.ethnologue.com/ethno_docs/distribution.asp?by=family e aprecie todas as outras também fascinantes famílias linguísticas. Você ficará surpreso com a localização e a quantidade de línguas! Conheçamos um pouco sobre as famílias apontadas na Tabela 1. A família indo‐europeia receberá atenção especial e será o tema único da próxima aula, não sendo apresentada agora. 1 Família afro‐asiática Também chamada de camito‐semítica, esta família de línguas deve ter surgido na África e pode ser dividida em seis subfamílias (Egípcia, Cuxita, Chádica, Línguas berberes, Omótica, Semítica). Na verdade, o proto‐afro‐asiático tem origem controversa e os linguistas ainda discutem muito sobre o assunto. A única subfamília afro‐asiática com línguas fora da África é a semítica, composta pelo árabe, pelo aramaico e pelo hebraico, por exemplo. As línguas semíticas apresentam várias características em comum, tais como (STÖRIG, 2005): (a) consoantes “enfáticas”, que devem ser pronunciadas com energia especial; (b) sons guturais, que fazem com que elas soem “ásperas”, muitas vezes, para os ouvidos de falantes de línguas indo‐europeias. (c) escritas compostas apenas de consoantes. As vogais são marcadas apenas por sinais auxiliares ou são simplesmente omitidas. O leitor nativo complementa os sons vocálicos a partir do contexto. Em hebraico, por exemplo, a palavra menino é normalmente escrita ילד (transcrita ild) e pronunciada /´jeled/. Há, entretanto, maneiras de expressar as vogais na escrita ‐ para o uso de estrangeiros, para escrever poesia, em textos sagrados e para crianças em fase de alfabetização ‐, através de diacríticos. Assim, a mesma palavra seria יֶלֶד (transcrita ieled). 65 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG (d) raízes triconsonantais. Elas definem um conceito geral e a elas são acrescidas as vogais para a formação de palavras do mesmo campo semântico. Exemplo: a raiz ktb, relacioanda ao campo semântico escrever, pode originar em hebraico e árabe várias palavras. Veja abaixo uma pequena amostra: Árabe Hebraico kataba َ َآ َﺘﺐ (´ele escreveu´) katab בתכ (´ele escreveu´) katabat َآ َﺘﺒَﺖ (´ela escreveu´) miktabaהבתכמ (´escrivaninha´) kutub ُآﺘُﺐ (´livros´) ktobet תבותכ (´endereço´) maktab‐ﻣَﻜﺘَﺐ (´escritório’) niktab בתכנ (´estava escrito´) makatibآﺎﺗِﺐ (´escritórios´) taktib ביתכת (´prescrito´) 2 Família austronésica Antes de começarmos... Lembrete de Geografia: Você sabe onde fica a Austronésia? A Austronésia (> grego ilhas do sul) é o conjunto de ilhas e arquipélagos encontrados na Oceania e no Sudeste Asiático, localizando‐se entre os oceanos Pacífico e Índico. Os chamados austronésios, vindos provavelmente do Sudeste Asiático, colonizaram a região ainda em tempos pré‐históricos. As línguas austronésias são divididas em dez subgrupos primários. Nove deles se encontram em Taiwan10 e, apesar da proximidade geográfica com o chinês, não têm relação genética próxima com ele. O subgrupo restante é um ancestral de todas as línguas malaio‐polinésias. 10 Mais informações em: http://wals.info/languoid/by_geography?country=TW 66 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG É difícil fazer generalizações para um conjunto de línguas tão diversas e com muita dialetalização. Mas, em geral, as línguas apresentam poucos fonemas, sílabas predominantemente do tipo CV ou CVC e uma tendência à reduplicação, processo morfológico de repetição de uma palavra ou de parte dela. Exemplos (cf. http://language.psy.auckland.ac.nz/austronesian/): Malaio: langit (´céu´); langit‐langit (‘teto´, ´palato´) Maori: wera (´quente´) / werawera (´morno´) A ordem SVO é muito comum, exceto nas Filipinas, em Taiwan e na Polinésia, onde VSO é mais comum. Devido ao comércio intenso na região, as línguas dessa família tomaram emprestados vários termos de outras línguas com as quais teve contato. O malagasy tomou emprestadas várias palavras das línguas banto. As línguas da Malásia e da Indonésia receberam vários empréstimos do árabe, devido à influência do Islamismo. Entretanto, há ainda muito vocabulário derivado do proto‐austronesiano (COMRIE, 1996). 3 Família Níger‐Congo Também denominada de nigero‐cordofaniana (GREENBERG, 1966) ou nigero‐congolesa, esta é a família linguística composta do maior número de línguas, como você observou na tabela acima. Ela está muito presente na África e abarca todas as línguas da África subsaariana (que corresponde à região ao sul do deserto do Saara ou a área do continente africano que faz parte do Norte da África). Na verdade, as fronteiras políticas africanas são resultado da história colonial, e não costumam ser semelhantes aos limites linguísticos. Por isso, muitas línguas não obedecem às fronteiras oficiais dos países. As línguas deste grupo têm várias propriedades em comum11. Uma delas é o sistema de classes para os substantivos. Nesse sistema, todos os substantivos são marcados por um 11 Saiba mais em http://www.britannica.com/EBchecked/topic/414793/Niger‐Congo‐languages 67 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG afixo12. Em geral, um afixo assinala a forma do substantivo no singular e outro a forma no plural. Estes afixos não podem ser previstos levando‐se em conta fatores semânticos ou fonológicos. Assim, todos os substantivos devem pertencer a uma classe, dependendo de suas formas plurais e singulares e nunca aparecem sozinhos. Exemplo: em Ndebele, uma língua falada em Botswana, país do sul da África, há 16 prefixos qualificadores; o fulani, falado em vários países, apresenta 18. Outra característica comum é que a maioria das línguas são tonais. (Leia o texto “Línguas tonais”) Em geral, há dois ou três níveis de contraste do pitch, mas podem ser encontrados até quatro ou cinco níveis. 4 Família sino‐tibetana As línguas sino‐tibetanas são divididas em dois grandes grupos: o da língua chinesa e seus dialetos e o das línguas tibeto‐birmanesas que, como o nome indica, inclui o tibetano e o birmanês, entre outras línguas. Algumas características gerais: (1) tonalidade. Em mandarim, por exemplo, língua de quatro tons, a palavra monossilábica men, dependendo do tom com que é pronunciada, pode significar portão ou nós. Já em tailandês (atenção: nem todos os linguistas concordam com a inserção do tailandês neste grupo) a palavra mai significa, dependendo da escolha do tom, ‘não’, ‘queimar’ ou ‘madeira’. (3) morfologia monossilábica. Há mais de 1600 palavras compostas de uma única sílaba em mandarim. Alguns exemplos: guo (‘país’); wo (‘eu’); ren (‘pessoa’); an (‘paz’). (cf. http://www.krysstal.com/langfams_sinotibe.html) (4) uso de classificadores de substantivos. O substantivo típico é um termo coletivo que designa todos os membros da classe. É como se a palavra homem, em português, Atenção ao uso do termo afixo aqui, bem diferente do que fazemos em português. Em português, o afixo é um tipo de morfema preso e pode ser de três tipos: prefixo, como em infeliz, e sufixo, como em felicidade (CRYSTAL, 1988). 12 68 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG significasse ‘todos os seres humanos’. Em algumas línguas, pode‐se empregar um pronome demonstrativo para modificar ou para contar o substantivo, chamado de “classificador”. Os classificadores não existiam no proto‐sino‐tibetano. (5) ordem das palavras. Podemos encontrar os padrões SOV e SVO nas línguas do grupo13. 5 Família Trans‐Nova Guiné Estas são as línguas da Nova Guiné e de suas ilhas adjacentes. A maioria delas encontra‐ se, atualmente, em situação fragilizada: são faladas por apenas alguns milhares de pessoas e apenas quatro delas (melpa, enga, dani ocidental e ekari) têm mais de 100 mil falantes. Apesar de, mais uma vez, ser difícil fazer generalizações para uma gama tão variada de línguas, Foley (2003) aponta algumas delas: (1) Fonologia: as línguas do grupo tendem a ser simples, tanto em realação às vogais quanto às consoantes. É muito comum o sistema padrão de cinco vogais (/i/, /e/, /a/, /o/, /u/). Nenhuma língua do grupo tem mais de 10 vogais. Há, em geral, ausência de distinção entre /l/ e /r/, havendo uma articulação variando entre esses dois sons. (2) As sílabas costumam ser do tipo CV com a possibilidade de CVC em final de sílaba. (3) Muitas das línguas são tonais. Assim, em obokuitai, /ti/ quer dizer ´sacola’ ou ‘um tipo de borboleta’; /di/ significa ‘vermelho’ ou ‘você’; /ku/ é ‘madeira’ ou ‘um tipo de solo’. (4) O grupo é comumente caracterizado por sequência de verbos em justaposição, como no exemplo da língua karam: mon pk d ap ay (‘madeira bater segurar vir colocar’), que descreve ‘ajuntar lenha’. Como algumas das línguas têm um inventário bastante restrito de raízes verbais, estas sequências são necessárias para melhor explicitar a ação descrita. *** 13 Veja em: http://www.britannica.com/EBchecked/topic/546233/Sino‐Tibetan‐languages 69 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG Como você pode facilmente concluir, o número de línguas é enorme. Definir, então, qual é mais ou menos importante vai depender dos critérios e também dos objetivos selecionados. Uma língua com algumas dezenas de falantes pobres e analfabetos, com baixo prestígio social, pode ter um valor inestimável para, por exemplo, definir melhor uma família linguística. É por isso e por tantas outras razões que uma língua em situação de vulnerabilidade costuma ser uma grande preocupação para a Linguística comparada. Entendamos melhor deste assunto. 6 Línguas em risco O linguista de qualquer parte do mundo preocupa‐se com as línguas cuja sobrevivência está em risco. Mas, para que se preocupar com uma língua falada por algumas dezenas de pessoas? Grimes (2000) cita algumas razões para justificar essa preocupação: (i) evitar a perda da uma cultura; (ii) evitar a perda de conhecimento sobre a fauna e a flora da região original da comunidade de fala e (iii) preservar a identidade das pessoas. Assim, perder uma língua é deixar de ter acesso a informações da História, da Biologia, da Antropologia, da Culinária, da Medicina... Como afirmam Katsiavriades e Qureshi (2001), o estudo das línguas e das relações entre elas fornece informações sobre como ocorreu a migração de povos e pessoas ao longo da história da humanidade. Ajuda também a datar progressos da humanidade, tais como domesticação de plantas e uso de ferramentas. Cada língua dá uma perspectiva a um único modo de pensar. Pessoas que vivem em partes isoladas do mundo e que não são tecnologicamente avançadas não têm, necessariamente, uma língua mais primitiva do que a de pessoas que vivem nas grandes cidades. Toda língua apresenta partes simples e complexas, não havendo correlação entre a vida do falante e a complexidade/simplicidade da sua língua. Há muitas razões para uma língua deixar de existir, isto é, para os falantes deixarem de usá‐la para a comunicação cotidiana. Para Grimes (2000), as causas para uma população deixar de usar uma língua e passar a usar outra (a autora não usa o termo morte nem extinção, e sim shift, que quer dizer mudança ou movimento) seriam: (1) Os pais estimulam as crianças a aprenderem a língua de prestígio, e não a língua materna. Isso porque pensam que uma criança só pode aprender bem uma única língua e 70 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG que ela terá vantagens econômicas e educacionais se aprender a língua que eles próprios, em geral, não dominam. (2) Desastres naturais ou humanos. Guerras, genocídios, tsunamis, erupção de vulcões, fome etc podem dizimar toda uma população de falantes. O judeu‐espanhol e o ídiche são um exemplo: com a 2ª Guerra Mundial, uma grande parte de seus falantes, todos judeus, foi exterminada nos campos de concentração pelos alemães, fazendo com que essas duas línguas, hoje, tenham um número muito restrito de falantes. Já a língua maluku foi vítima de um terremoto na Indonésia, que matou metade de seus falantes. (3) Migração forçada ou voluntária para fora do território tradicional dos falantes. Assim aconteceu com os habitantes nativos da América do Norte e da Sibéria. Pode acontecer, também, de o território original de um grupo de falantes receber falantes de língua de maior prestígio, fazendo com que a língua nativa perca território, isto é, número de falantes. Este é o caso dos nativos do Havaí: atualmente, são apenas 20% do total de habitantes da ilha. (4) Uso de uma segunda língua na escola. Na Indonésia, por exemplo, falantes educados antes de 1972 têm como segunda língua o inglês, que era ensinado nas escolas. A partir de 1972, a segunda língua escolar era o tagalog (língua Austronésia com aproximadamente 57 milhões de falantes nas Filipinas), o que fez com que as pessoas escolarizadas desde então se tornassem fluentes (além de em sua própria língua) nessa língua, e não no inglês. (5) Políticas linguísticas oficiais uniformitárias. A Tanzânia é um exemplo do desejo do governo gerar mudanças no uso da língua. Quando o país se tornou independente, o swahili (língua do grupo Banto falada por 35 milhões de pessoas em vários países africanos. É a língua oficial da Tanzânia, da Uganda e do Quênia.) tornou‐se a língua nacional e muitas pessoas deixaram de usar sua língua tradicional ou se tornaram bilíngues. Israel é outro caso: devido à decisão do governo israelense de tornar o hebraico língua nacional, após a independência do país em 1948, há, atualmente, mais de cinco milhões de falantes nativos dessa língua. 71 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG Identificar se uma língua está em perigo de extinção e qual seria esse nível também não é fácil. O Ethnologue considera uma língua em risco de extinção quando ela tem apenas falantes idosos. Veja, abaixo, a situação atual das línguas que correm o risco de desaparecer, levando‐se em conta a sua localização geográfica: TABELA 2 Línguas em risco de extinção Área África Américas Ásia Europa Pacífico Total Número 46 182 84 9 152 473 % 9,73 38,48 17,76 1,90 32,13 100 Fonte: http://www.ethnologue.com/nearly_extinct.asp Como pode ser visto, as Américas é a região onde o maior número de línguas pode vir a desaparecer nos próximos anos. No nosso próprio país, especialmente na região amazônica, apesar de muitos esforços para a manutenção das culturas e línguas nativas, a situação é preocupante.14 Por outro lado, há algumas línguas em situação bastante segura, porque o número de falantes é considerável: TABELA 3 As dez línguas mais faladas no mundo Língua Família País de origem Número de países 1 Chinês Sino‐tibetana China 31 2 Espanhol Indo‐europeia Espanha 44 3 Inglês Indo‐europeia Reino Unido 112 4 Árabe Afro‐asiática Arábia Saudita 57 5 Hindi Indo‐europeia Índia 20 6 Bengali Indo‐europeia Bangladesh 10 (país localizado no sul da Ásia) 7 Português Indo‐europeia Portugal 37 8 Russo Indo‐europeia União Soviética 33 14 Número de falantes (milhões) 1.213 329 328 221 182 181 178 144 Observe o mapa em http://www.proel.org/index.php?pagina=extinto/samerica 72 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG 9 10 Japonês Alemão Japonesa Indo‐europeia Japão Alemanha 25 43 122 90,3 Fonte: Tabela 3 de Lewis (2009, p. 20) A família indo‐europeia, como se pode verificar facilmente na tabela acima, encontra‐se em uma situação bastante favorecida. Das dez línguas mais faladas do mundo, sete pertencem a essa família. Você está convidado, então, a conhecer um pouco mais sobre essa família na próxima aula. Curiosidade! Veja, conforme Lewis (2009, p. 39), os dez países de maior e de menor diversidade da atualidade. + ‐ TABELA 4 Países de maior e menor diversidade linguística País Línguas Número de vivas falantes Papua Nova Guiné 830 3.833.255 http://wals.info/languoid/by_geography?country=PG 114* 188.549 Vanuatu http://wals.info/languoid/by_geography?country=VU Ilhas Salomão 71 368.786 http://wals.info/languoid/by_geography?country=SB 82** 3.478.795 República Central Africana http://wals.info/languoid/by_geography?country=CF República Dem. do Congo 217 40.099.030 http://wals.info/languoid/by_geography?country=CD [...] [...] [...] Vaticano (situado dentro da cidade de Roma, na 1 5.400 Itália) Santa Helena 1 1.000 (ilha do atlântico sul, situada próxima à costa africana) 1 20.000.000 Coreia do Norte http://wals.info/languoid/by_geography?country=KP Ilhas Malvinas 1 1.990 (duas ilhas situadas próximas ao extremo sul da América do Sul) Território Britânico do Oceano Índico 1 3.500 (2300 ilhas situadas entre a Indonésia e a África) * 108 delas nativa ** 71 delas nativas 73 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG Agora, você está convidado a fazer o Exercício relativo a este texto, que se encontra no Moodle. Em caso de dúvida, não hesite em entrar em contato com a sua professora. Referências www.britannica.com. Acesso em: 21 maio 2011. COMRIE, Bernard; MATTHEWS, Stephen; POLINSKY, Maria (ed.). The Atlas of Languages: The Origin and Development of Languages Throughout the World. London: Quarto, 1996. CRYSTAL, David. Dicionário de linguística e fonética. Rio de Janeiro: Jorge Zahar, 1988. http://www.ethnologue.com. Acesso em: 20 maio 2011. FOLEY, Bill. More on Papuan languages. Disponível em: <http://sydney.edu.au/arts/research_projects/delp/papuan.php>. Acesso em: 6 out 2011. GREENBERG, Joseph. Languages of Africa. Bloomington: Indiana University Press, 1966. GRIMES, Barbara F. Global language viability. In: SAKIYAMA, Osamu (ed.). Endangered languages of the Pacific rim: lectures on endangered languages 2; from Kyoto conference 2000. Osaka, Japan: ELPR, 2001. p. 45‐68. KATSIAVRIADES; Kryss; QURESHI, Talaat. Language families. Disponível em: <http://www.krysstal.com/langfams.html>. Acesso em: 6 out 2011. LEWIS, M. Paul. Ethnologue; languages of the world. Dallas: SIL, 2009. http://www.omniglot.com/writing/tagalog.htm. Acesso em: 6 out 2011. MATTHEWS, Peter H. Concise dictionary of Linguistics. Oxford: OUP, 1997. http://www.proel.org/index.php?pagina=mundo. Acesso em: 6 out 2011. RUHLEN, Merrit. The origin of language. Hoboken: Jonh Wiley & Sons, 1994. STÖRIG, Hans Joachim. A aventura das línguas; uma história dos idiomas do mundo. São Paulo: Melhoramentos, 2005. http://wals.info/languoid. Acesso em: 6 out 2011. LEITURA COMPLEMENTAR Leia um interessante artigo sobre a última falante de uma língua em http://noticias.terra.com.br/mundo/noticias/0,,OI4254230‐EI8143,00‐ Morre+na+India+ultima+nativa+que+falava+lingua+de+mil+anos.html 74 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG AS LÍNGUAS INDO‐EUROPEIAS Júlio César Vitorino (Fale/UFMG) Observe o quadro abaixo, que mostra o nome dos dez primeiros numerais em algumas línguas românicas: QUADRO 1 Os dez primeiros numerais em algumas línguas românicas Português Espanhol Francês Italiano um un un uno dois dos deux due três tres trois tre quatro cuatro quatre quattro cinco cinco cinq cinque seis seis six sei sete siete sept sette oito ocho huit otto nove nueve neuf nove dez diez dix dieci Comparando‐se esses numerais – e mesmo considerando que a pronúncia dessas palavras não corresponde exatamente à escrita –, é fácil constatar que existe uma relativa correspondência entre o termo de cada língua e o das demais. Isso é decorrência do fato de todas essas línguas terem como ancestral comum o latim, do qual derivaram através de processos contínuos de mudança linguística (no caso específico desses numerais, as mudanças foram principalmente de ordem fonética). No caso das línguas românicas, temos documentação histórica que nos possibilita confirmar a expansão do latim pelos territórios ocupados hoje por essas línguas e corroborar a tese da existência de relações de parentesco entre elas. Contudo, recuando no tempo, esse mesmo tipo de relação pode ser estabelecido também entre o latim e outras línguas faladas por povos com os quais os romanos não tiveram contato, a ponto de gerar influências de uma língua sobre outra. 75 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG O quadro abaixo registra o nome dos numerais, de dois a dez, em algumas línguas, antigas e modernas, da Europa e da Ásia: Latim Grego QUADRO 2 Numerais de dois a dez em algumas línguas Sânscrito Galês Gótico Tocário Antigo A eslavo Lituano duo duo dvá(u) dau twai wu duva dù tres treis tráyas tri threis tre trije trys quattuor téttares catváras pedwar fidwor stwar cetyre keturì quinque pénte páñca pump fimf päñ peti penkì sex héks sát chwech saíhs säk sesti sesì septem heptá saptá saith sibun spät sedmi septynì octo októ astá(u) wyth ahtau okät osmi astuonì nouem enné(w)a náva naw niun ñu deveti devynì decem déka dása deg taíhun säk deseti desimt Ainda que as semelhanças entre as palavras correspondentes a cada número não sejam tão evidentes quanto as observadas no quadro anterior, em um exame mais atento pode ser constatado que geralmente existem elementos comuns nas diversas séries. Por exemplo, nas palavras para ‘dois’, a maioria tem um d‐ e um ‐u‐ (ou ‐w‐, ou ‐v‐); para ‘três’, todas apresentam uma sequência de dental seguida de ‐r‐. Além disso, observam‐se correspondências sistemáticas, ou seja, assim como as formas para ‘dois’ e ‘dez’ começam com d‐ em praticamente todas as línguas apresentadas, em gótico encontramos twai e taíhun, iniciadas com t‐ (o caso do tocário sendo diferente por outras razões); do mesmo modo, a sex e septem, correspondem palavras iniciadas por s‐ na maioria das línguas, com exceção do grego, cujos correspondentes apresentam h‐ inicial (o galês chwech tem uma explicação à parte). Como você já sabe, o exame minucioso de muitíssimas séries como essas, em diversos campos semânticos, unido à comparação de fatos gramaticais e culturais, levou os estudiosos a postularem a existência de uma língua ancestral comum, da qual teriam se desenvolvido as diversas línguas atestadas. À língua comum dá‐se o nome de indo‐ 76 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG europeu, enquanto as línguas dela descendentes recebem o nome de línguas indo‐ europeias. As línguas indo‐europeias dividem‐se nos seguintes grupos: 1 Línguas célticas No primeiro milênio a.E.C., os celtas ocupavam uma área muito vasta, que ia do oriente da Europa ao extremo ocidente. Os celtas britânicos habitavam o sul da Grã‐Bretanha; os celtiberos, grande parte da Península Ibérica; os gauleses, uma extensa faixa do Oceano Atlântico ao Mar Negro; enfim os gálatas, o centro da atual Turquia (Anatólia). Os do primeiro grupo, cujas línguas formam o céltico insular, se espalharam pelas ilhas britânicas e deram origem a todas as línguas célticas ainda em uso, enquanto as línguas dos demais, que formam o céltico continental, desapareceram, deixando poucos vestígios na onomástica, na toponímia e em algumas inscrições não muito consistentes. As línguas continentais, todas extintas, são o gaulês, o lepôntico (no norte da Itália) e o celtibérico. As inscrições são em alfabeto grego ou nos diversos alfabetos itálicos: as mais antigas, em lepôntico, remontam ao século VI a.E.C.; o celtibérico usa a escrita dos iberos, um povo não indo‐europeu, cujo alfabeto, parcialmente um silabário, parece ser uma mistura dos sistemas grego e fenício, com modificações. O celta insular divide‐se em dois subgrupos: goidélico e britônico. O goidélico, também chamado «céltico Q», inclui o antigo irlandês e seus descendentes: irlandês (gaélico da Irlanda), gaélico da Escócia, e manxês. As inscrições mais antigas do irlandês primitivo, em alfabeto ogâmico, cuja origem é incerta, vão do século IV ao VII, enquanto a mais antiga literatura, em antigo irlandês, começa por volta do início do século VII. A partir da cristianização, no século V, passa‐se a usar o alfabeto latino. O irlandês moderno é configurado pelos bardos no século XIII. No século XVI, com a decadência dos bardos, a língua se diversifica em diversos dialetos regionais. Com o predomínio do inglês, hoje o 77 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG irlandês é falado por menos de 70 mil pessoas, muitas das quais como segunda língua, de modo que o seu futuro é incerto. O gaélico da Escócia provém de uma colônia fundada por imigrantes irlandeses no século IV, sendo falado por menos de 80 mil pessoas, poucas das quais monolíngues. O manxês, da ilha da Manx, tem origens semelhantes: a sua literatura começa no século XVI ou XVII, mas seu uso declina a partir do fim do século XVIII, sendo que o último falante nativo morreu em 1974, seu uso estando hoje limitado ao de segunda língua. O britônico era a língua falada pelos celtas que habitavam a Grã‐Bretanha antes da conquista romana. Hoje, o grupo britônico, ou «céltico P», engloba o galês, o bretão e o córnico. Nos séculos IV e V, as invasões e a expansão dos anglo‐saxões levaram os celtas a se concentrarem, por volta do século VII, a oeste, na região do atual País de Gales, e a sul, na região da Cornualha, de onde saíram imigrantes que se transferiram para o noroeste da França, dando origem, em cada uma dessas regiões, ao galês, ao córnico e ao bretão, respectivamente. As primeiras e breves inscrições conservadas em galês primitivo datam do século VI ao fim do VIII, conservando alguns textos, geralmente em versões modernizadas nos séculos XII e XIII, época considerada do galês médio, com uma rica literatura. O galês moderno tem início em 1588, com a primeira tradução da Bíblia. O uso da língua declina lentamente, sendo ela hoje falada por meio milhão de pessoas. Do bretão há poucas atestações até o século XI, a partir de quando se passa a contar com muitas obras literárias, geralmente textos religiosos ou traduções do francês ou do latim. Com a publicação do primeiro dicionário e gramática, em XVI59, tem início o bretão moderno. Contudo, não tendo sido nunca a língua de um centro político ou cultural, o bretão jamais passou por algum processo de estandardização, sendo composto por um número de dialetos maior que o de qualquer outra língua céltica moderna. O vocabulário é em grande parte tomado do francês e atualmente a língua é falada por cerca de meio milhão de pessoas, a maior parte residente em área rural. 78 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG O córnico, bastante próximo do bretão, era falado pelos celtas habitantes da sudoeste da Inglaterra. Os primeiros documentos em antigo córnico são glosas dos séculos IX e X e um glossário compilado por volta do ano 1100. Do córnico médio há cerca de 10 mil linhas de tradução de peças religiosas do inglês, dos séculos XV e XVI. O período do córnico tardio vai até 1777, considerado o ano da morte do último falante nativo. 2 Línguas germânicas Os povos germânicos, na primeira metade do primeiro milênio a.E.C., viviam no sul da Escandinávia e nas costas dos mares do Norte e Báltico, na região entre as atuais Holanda e Polônia. Contudo, já nos primeiros documentos históricos seu território aparece bem mais estendido para o sul, até as fronteiras do Império Romano, com o qual frequentemente eles entraram em conflito. O grupo de línguas germânicas é tradicionalmente dividido em três sub‐grupos: a) o germânico oriental, hoje extinto, que incluía a língua dos godos, dos vândalos, burgúndios e outras tribos; b) o germânico setentrional, que inclui o antigo nórdico e seus descendentes escandinavos modernos; c) o germânico ocidental, com o inglês, o alemão, o holandês, etc. O rúnico, a língua das primeiras inscrições rúnicas, que utilizam o alfabeto chamado futhark (a partir do nome das seis primeiras letras: f, u, th, a, r e k), provavelmente é uma língua setentrional, mas apresenta pontos em comum também com o germânico oriental, levando alguns estudiosos a postularem um grupo nordoriental, que englobaria ambos. O germânico oriental, representado principalmente pelo gótico, é atestado quase que inteiramente pelo que resta da tradução do Novo Testamento em gótico ocidental, feita pelo bispo Wulfila, a que se acrescentam uns poucos fragmentos de um comentário ao evangelho de João, algumas inscrições isoladas e palavras preservadas em outros textos. O 79 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG alfabeto utilizado foi inventado por Wulfila, com base no grego. Em uma língua chamada gótico da Crimeia, provavelmente falada até o século XVIII, temos uma lista de palavras e frases, recolhidas por volta de 1560, que demonstram tratar‐se de um dialeto diferente do gótico bíblico. Outras línguas extintas são o vândalo, a língua do povo que deu origem ao nome Andalusia, o burgúndio, o gepídico e o rúgio, as quais desapareceram sem deixar vestígios além de alguns topônimos e antropônimos. O ramo ocidental possui três línguas com atestação suficiente anterior ao ano 1000: o antigo inglês, o antigo saxão e o antigo alto alemão. As duas primeiras são bastante próximas e deviam ser mutuamente inteligíveis, mas diferem significativamente da última. Os anglos, saxões e jutas habitavam áreas costeiras de onde se encontram a Dinamarca e o norte da Alemanha e, no século V E.C., começaram a migrar para a Grã‐Bretanha. As pequenas diferenças entre esses povos, coletivamente chamados anglo‐saxões, logo desapareceram, e a língua da nova população é conhecida como antigo inglês ou anglo‐ saxão. As primeiras atestações são inscrições rúnicas fragmentárias, de pouco valor linguístico, do século IV ou V. Dentre os textos literários, a poesia, na maior parte anônima e de difícil datação, aparece a partir do século VIII, enquanto a prosa começa no início do século VII, prosperando muito na segunda metade do século IX, durante o reinado de Alfredo, o Grande, quando a língua, uma variedade de saxão ocidental, é usada como um instrumento literário equiparável ao latim, em uma intensa atividade que se estende até a conquista normanda, em 1066. A partir de então, até cerca de 1500, é o período do inglês médio, cuja literatura supérstite consiste em textos anônimos, religiosos e didáticos em versos. O mais fino poeta inglês antes de Shakespeare, Geoffrey Chaucer, é dessa época. A partir de 1500, o período do inglês moderno é caracterizado, linguisticamente, pela mudança na pronúncia das vogais, ou Great Vowel Shift, que transparece pouco na escrita, a qual reflete ainda a pronúncia do inglês médio. 80 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG O antigo alto alemão aparece inicialmente em inscrições rúnicas do século VI. Do século VIII provém um grande número de glosas e a primeira literatura, em forma de poemas curtos e textos religiosos. A maior parte do material existente é datada, entretanto, dos séculos IX e X. A língua é preservada em seis dialetos, diferentes na ortografia e em certos aspectos gramaticais. O médio alto alemão tem início por volta de 1100, a partir de quando se desenvolve um alemão standard, baseado no bavarês e no alemânico, mas, depois de um certo tempo do florescimento da poesia do médio alto alemão, não havia mais uma língua literária comum e, por isso, a influência mais importante no desenvolvimento do alto alemão moderno foi a tradução da Bíblia feita por Lutero (o Antigo Testamento tendo sido traduzido em 1522 e o Novo Testamento, em 1534) , escrita em um estilo fácil, incorporando elementos do maior número de regiões possível, baseado principalmente no dialeto da Turíngia, região nativa de Lutero. Também é uma língua germânica, com parte de elementos lexicais hebreus, o iídiche, falado por judeus alemães e, posteriormente, devido a migrações, influenciado também pelas línguas eslavas, principalmente o polonês. O velho saxão era falado até o século XII em uma região entre o Reno e o Elba. Os principais documentos são uma vida de Cristo em versos, do início do século IX e uma tradução do Gênesis, de datação mais difícil. A língua é próxima do antigo inglês, do antigo frísio e do antigo baixo francônio. Suas descendentes modernas são as variedades de baixo alemão faladas no norte da Alemanha. O ápice do baixo alemão como língua literária e administrativa foi durante o tempo da Liga Hanseática (século XIII – XIV), com centro em Lübeck, cuja variedade de baixo alemão foi, na época, mais importante que o médio alto alemão. A oeste do antigo saxão era falado o antigo baixo francônio, língua de um grupo de francos ocidentais. É atestado escassamente do século IX ao XII no sudeste da atual Holanda. A variedade falada falada em Flandres é antecessora do médio holandês, que começa no século XII, e do holandês, do qual deriva, por sua vez, o afrikaans, falado na África do Sul. Também provém do dialeto falado em torno de Flandres o flamengo, que é o dialeto holandês falado na Bélgica. Nas costas do norte da Holanda e da Alemanha e nas 81 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG ilhas da costa do Mar do Norte fala‐se o frísio, cujas primeiras atestações seguras são do século XIII. O germânico setentrional é representado por uma antiga língua, o antigo nórdico, do qual são descendentes as línguas escandinavas modernas. As primeiras inscrições aparecem no século VII. A literatura, que conserva mais que qualquer outra aspectos da mitologia e do folclore pré‐cristãos, é escrita, a partir de meados do século XII, mas que remonta a uma tradição oral muito mais antiga, em um dialeto falado na Islândia, chamado antigo islandês, que muitas vezes é usado em concorrência com o antigo nórdico. No século IX, exploradores da Noruega se instalam na Islândia e desenvolvem a língua conhecida como islandês, que é muito conservadora, a ponto dos falantes do islandês moderno poderem ler sem muitas dificuldades as sagas em antigo nórdico sem muitas dificuldades, ainda que, no plano fonético, as mudanças terem sido mais extensas. Semelhante ao islandês é o faroês, falado nas ilhas Faroe, cujas inscrições rúnicas conhecidas vão do ano 1000 ao 1500, além de alguns documentos do século XIII. O norueguês, na sua forma antiga, é reconhecido a partir do século XII. O dinamarquês, provavelmente a menos conservadora das línguas escandinavas, é atestado em inscrições a partir do século XI e em manuscritos a partir do século XIII, mais ou menos da mesma época, temos os primeiros documentos em antigo sueco. 3 Línguas itálicas As línguas itálicas compreendem muitas das línguas indo‐europeias da antiga Itália, bem como as descendentes modernas da principal dessas línguas, o latim, que, já em época histórica, através do poderio do império romano, fez declinar o uso das outras línguas faladas na península itálica. O grupo geralmente é dividido em dois sub‐grupos: o latino‐falisco e o sabélico, também conhecido como osco‐umbro. As línguas sabélicas são faladas por povos samnitas, sabinos e outros povos, localizados na parte central da península e, após migrações, também mais 82 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG ao sul, na Campânica. As principais são o osco, o umbro e o piceno. Em osco restam cerca de 400 inscrições geralmente muito breves, a partir do século IV a.E.C., em umbro, restam principalmente as famosas sete tábulas de Gubbio, do século I a.E.C., além de poucas dezenas de inscrições dos séculos VI e V a.E.C., as poucas inscrições em piceno vão do século VI ao III a.E.C. O latino‐falisco compreende, como diz o nome, latim e falisco, línguas faladas em meados do primeiro milênio a.E.C. em uma pequena área no centro oeste da Itália. Do falisco há cerca de trezentas inscrições, do século VII ao II a.E.C., geralmente muito breves, de modo que sabemos muito pouco sobre essa língua. O latim era uma língua falada originalmente numa pequena área, próxima à foz do Tibre, ao sul da Etrúria (cuja língua não era indo‐ europeia). As atestações do latim iniciam‐se no século VII, sob forma de breves inscrições; os textos literários remanescentes são de alguns séculos posteriores, enquanto a literatura supérstite parte do século III a.E.C. O período entre as primeiras inscrições (meados do século II a.E.C.) é conhecido como latim arcaico. Segue‐se o latim clássico, que vai até o século II E.C. e, depois, o latim tardio, até o fim do Império Romano. Durante esse período, o latim falado nas diversas partes do território romano, ou latim vulgar, começou a se diferenciar nos dialetos que deram origem às línguas românicas. O alfabeto latino é uma reelaboração do alfabeto etrusco, que não é língua indo‐europeia, o qual, por sua vez, é uma reelaboração do alfabeto grego. Há outros alfabetos que eram utilizados na Itália e sua história é semelhante à do alfabeto latino. Nas inscrições mais antigas, antes da dominação romana, aparece também o alfabeto grego. Das variedades descendentes do latim vulgar, não há textos sobreviventes anteriores ao século IX. O francês é a primeira a ser atestada e até cerca de 1400 é conhecida como antigo francês. Do dialeto falado nas cercanias de Paris, que se tornou dominante a partir dos séculos XII e XIII, desenvolveu‐se o francês standard moderno. No extremo norte, o francês normando, que se espalhou pela Inglaterra após a conquista normanda em 1066, dando origem ao chamado anglo‐normando, que floresceu até o advento do médio inglês, no 83 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG século XIV. No sul, desenvolveu‐se uma variedade chamada langue d’oc (em oposição à langue d’oïl), ou ocitano, do qual há ainda alguns dialetos falados no sul da França, principalmente o provençal, atestado desde o século X. A língua românica com o maior número de falantes hoje é o espanhol, atestado na forma de glosas a partir do século X. O espanhol standard se baseia no castelhano, dialeto do reino de Castela, mas há outras variedades, como o catalão, língua oficial do reino de Aragão, no nordeste da península ibérica, e, no sul, um dialeto hoje extinto, era constituído pelo moçarábico, muito influenciado pela língua dos invasores mouros. No noroeste, o galego é, historicamente, uma variedade de português, hoje a segunda língua românica em número de falantes, cujos primeiros textos importantes remontam aos séculos XII e XIII. A Itália, por sua vez, durante o último milênio foi sempre marcada por uma imensa variedade de dialetos, cujos primeiros testemunhos provêm do século X. O dialeto de base do italiano moderno é o florentino, com influências também do dialeto de Roma. Na Sardenha fala‐se o sardo, atestado a partir do século XI, mas que conta com escasso material literário; o dialeto da parte central da ilha (logudorês) é bastante conservador, particularmente no que diz respeito a conservação da pronúncia palatal das velares diante de e e i. Outra língua importante é o romeno, cujos primeiros textos remontam ao século XVI e, isolada no extremo oriental, tem forte influência do húngaro e das línguas eslavas. Outras línguas românicas menores e isoladas se encontram no norte da Itália e na Suíça, tais como o rético e o ladino. Enfim, o dálmata, falado antigamente na costa da Croácia, é hoje uma língua extinta. 4 Grego O fato mais característico do grego é que, em mais de três milênios de história escrita, os seus dialetos não se transformaram em línguas mutuamente incompreensíveis. O dialeto de mais antiga atestação é o micênico, datados entre os séculos XIV e XII a.E.C., em uma escrita silábica chamada de “linear B”, encontrada na ilha de Creta e em cidades micênicas do continente. Depois dessas inscrições, por um período de mais de 500 anos, encontra‐se apenas uma única inscrição, encontrada em Chipre, datada em torno de 1050. 84 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG O alfabeto grego em suas versões mais antigas apresenta muitas variações, mas trata‐se de uma adaptação do alfabeto fenício que, como os alfabetos de outras línguas semíticas como o árabe e do hebraico moderno, tem letras apenas para consoantes. A grande inovação dos gregos foi usar certas letras para representar os sons vocálicos, utilizando letras fenícias que representavam sons inexistentes em grego. Algumas outras, como o phi, khi, psi e omega são adições. Entre o aparecimento das primeiras inscrições alfabéticas, no século VIII a.E.C., e o início do século V, coloca‐se o chamado período arcaico. No início desse período, fixam‐se as formas dos dois poemas homéricos: a Ilíada e a Odisseia, ápice de uma longa tradição oral. A forma linguística desses poemas é também a dos chamados hinos homéricos e da poesia de Hesíodo e tem como base o dialeto chamado jônico, misturado a um substrato de eólico. Na poesia lírica desse período, destaca‐se o uso do dialeto lésbio, usado por poetas como Safo, Alceu, nos séculos VII e VI. A partir de 480 a.E.C., tem início o período clássico, marcado pela hegemonia de Atenas, que tem seu dialeto, o ático, bastante próximo ao jônico, alçado a categoria de língua literária standard. Todos esses dialetos, ou seja, o ático‐ jônico, o eólico e o micênico, constituem o subgrupo oriental do grego, que inclui também os dialetos não literários arcado‐cipriotas e o panfílio. O outro subgrupo, ocidental, é constituído pelos dialetos chamados dóricos, que também têm importantes usos literários. Após as conquistas de Alexandre Magno, a língua grega se estende por uma área vastíssima, e tem início o período helenístico, linguisticamente caracterizado por uma variedade simplificada do grego falado conhecida como koiné, baseado principalmente no ático, com elementos jônicos e de outros dialetos. Com isso, os dialetos gregos pouco a pouco desaparecem na língua falada, restando apenas uma variedade de dórico, o lacônio, que ainda hoje continua na forma do tsacônio. Com exceção do tsacônico, no leste do Peloponeso, e dos dialetos gregos da Turquia, todas as variedades do grego moderno são descendentes da koiné. Após a independência da Turquia, em 1828, foi criada uma nova língua literária standard chamada katareúsa, 85 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG enquanto que uma variedade de grego chamada demótico se tornou a língua falada standard. Em 1976, o demótico substituiu a katareúsa também na língua escrita, mas foi de uma convergência de ambos que surgiu o chamado grego standard moderno. 5 Albanês O albanês forma um grupo separado do indo‐europeu e se divide em dois dialetos principais. O geg é falado no norte da Albânia, em regiões da antiga Iugoslávia (Montenegro, Kosovo, Croácia e Macedônia) e em áreas da Turquia. O tosk, no sul da Albânia, Grécia e Itália. De todos os grupos, o albanês foi o último a aparecer em fontes escritas, a partir do século XV. A língua, até o século XVIII é conhecida como antigo albanês. A partir do século XIX, fala‐se em albanês moderno. 6 Línguas balto‐eslavas O grupo balto‐eslavo inclui dois subgrupos: eslavo e báltico. As línguas eslavas modernas resultam de diferenciações dialetais iniciadas há cerca de 1500 anos. Ainda hoje, muitas delas são mutuamente inteligíveis, principalmente na forma escrita. Os textos literários tem início em 863, com uma tradução da Bíblia, que não sobreviveu. O alfabeto dessa tradução não é o que conhecemos como alfabeto cirílico, ainda que Cirilo seja o nome monástico de um dos dois irmãos missionários responsáveis pela tradução, mas sim um mais antigo chamado glagolítico, com letras de origem incerta; o que se chama cirílico, hoje usado para escrever o russo, bielo‐russo, ucraniano, búlgaro, macedônio, sérvio e várias línguas não eslavas da antiga União Soviética (inclusive uma língua românica: o moldavo, nome dado ao romeno usado na Moldávia), é uma adaptação das maiúsculas gregas que surgiu cerca de três séculos depois na Bulgária. Os primeiros textos reservados vêm da Bulgária, em uma língua que logo se espalhou como língua litúrgica entre os eslavos, conhecida como antigo eslavo eclesiástico, ou antigo búlgaro, ou antigo macedônio. Os manuscritos mais antigos são do século X. As línguas eslavas modernas podem ser agrupadas nos subgrupos eslavo oriental, ocidental e meridional. 86 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG Até a cristianização, no fim do século X, havia apenas uma língua eslava oriental, pouco diferenciada em relação ao restante do eslavo. A língua dos primeiros textos litúrgicos é chamada de antigo russo, mas na verdade é ancestral, além do russo moderno, também do bielo‐russo e do ucraniano. O russo moderno tem início no século XVIII. Características do bielo‐russo, muito próximo ao russo, aparecem em antigos textos a partir do século XIII, mesma data em que se encontram as primeiras manifestações do ucraniano. Entre as línguas ocidentais, o polonês, com textos a partir do século XIV, tem hoje o maior número de falantes. No norte da Polônia, nas proximidades de Gdansk, fala‐se kashubiano, às vezes considerado um dialeto polonês, às vezes uma língua à parte. Duas línguas extintas eram faladas na Polônia, o eslovíncio, aparentemente um tipo antigo de kashubiano, e o pomerânio, na costa báltica. Uma terceira língua extinta é o polabiano, conhecido por uns poucos textos e que era falado nas margens do Elba, na atual Alemanha. Ainda hoje, fala‐se, na Alemanha, em uma região próxima a Dresden, o sorbiano, com um total de 50.000 falantes, poucos monolíngues; dessa língua, o documento mais antigo é uma tradução do Novo Testamento de meados do século XVI. Mais a sul, fala‐se o tcheco, atestado a partir do século XIV, e o eslovaco, que é muito semelhante ao tcheco, do qual começou a divergir a partir do século XV. As línguas eslavas meridionais começaram a se diferenciar das demais a partir do século VI. Após o antigo eslavo eclesiástico, a primeira língua a ser atestada é o esloveno, com documentos dos séculos X e XI e que só reaparecerá em textos a partir do século XV. A sul, fala‐se croata, muito próximo ao sérvio e ao bósnio, mutuamente inteligíveis, às vezes considerados uma única língua, chamada servo‐croata. No sudoeste da antiga Iugoslávia, fala‐se macedônio, que só se diferenciou do búlgaro em época bastante recente e cuja literatura começa no século XIX. Finalmente, o búlgaro, cujo estágio mais antigo é o antigo eslavo eclesiástico, as divergências começam a aparecer nos documentos a partir do século XII e XIII. 87 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG O sub‐grupo báltico continua hoje com duas línguas, o lituano e o letão, que formam o báltico oriental, enquanto o báltico ocidental, continha o atualmente extinto antigo prussiano. O antigo lituano é atestado em traduções de orações católicas a partir do século XVI, a língua literária moderna aparece a partir do fim do século XIX. Também o letão é atestado a partir do século XVI. A única língua báltica ocidental que se conhece, e só um pouco, é o antigo prussiano, a partir de um vocabulário do século XIV, outro do século XVI e três traduções de catecismos luteranos do mesmo século; a língua se extinguiu por volta do século XVIII. Sabe‐se o nome de outras línguas bálticas faladas antigamente, mas não há nenhum documento que as ateste. 7 Línguas anatólicas As línguas da Anatólia, nome antigo da parte asiática da atual Turquia, só foram reconhecidas como indo‐europeias no século XX. A mais preservada é o hitita, do qual se conhecem milhares de placas de argila com escrita cuneiforme da segunda metade do segundo milênio a.E.C. Outras línguas são o palaico e lúvio cuneiforme, também do segundo milênio a.E.C., escritos com os mesmos cuneiformes do hitita, o lúvio hieroglífico, do segundo e primeiro milênio, escrito com hieróglifos nativos, e, do primeiro milênio, o lício e o lídio, escritos em um alfabeto derivado do grego. Outras línguas como o cário, o pisídio e o sidético, seguramente indo‐europeias, são escassamente documentas. 8 Armênio Só no fim do século XIX é que ficou provado que o armeno constituía um grupo à parte no domínio indo‐europeu, uma vez que é muito grande o número de empréstimos de línguas irânicas; na verdade, do vocabulário herdado restavam no armeno pouco mais de 450 palavras na época das primeiras atestações em inscrições e textos a partir do século V E.C., idade de ouro da literatura armena. A língua dessa época, o armeno clássico, permaneceu como standard literário até o século XIX. O alfabeto, baseado no grego, foi criado especificamente para o armeno e contém 36 letras que representam cada som da língua. Segue‐se o armeno médio, língua oficial do reino da Cilícia (séculos XI – XIV). As variantes 88 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG modernas são o armeno ocidental, uma das duas línguas literárias modernas, baseada no dialeto falado próximo a Istambul, e o armeno oriental, língua oficial da Armênia, baseado no dialeto falado próximo ao monte Ararat e à capital Erevan. As duas línguas literárias são bastante parecidas, mas ao lado delas existe uma enorme variedade de dialetos, muitos deles bastante influenciados pelas línguas dos vizinhos turcos e caucasianos. 9 Línguas indo‐iranianas As línguas indo‐iranianas se dividem em dois subgrupos: índico e iraniano; talvez haja um terceiro, o nuristani. Eram e são ainda faladas não apenas na Índia e no Irã, mas também em uma vasta região da Ásia, que vai do Mar Negro à China. Depois das línguas anatólicas, são as de mais antiga atestação, com os textos mais antigos remontando ao século XIVa.E.C. Ao antigo índico, pertencem dois dialetos: o védico e o sânscrito clássico, muito semelhantes entre si. O védico é a língua literária da tradição védica, distinguindo‐se em védico antigo e védico recente. A diferença não é bem cronológica, pois o védico antigo se baseia em um dialeto ocidental, enquanto no védico recente há um número maior de características dos dialetos centrais. O texto mais antigo é o Rig Veda (Veda dos cantos), que reúne mais de mil hinos em dez livros chamados mandalas e remonta ao ano 1000 a.E.C., mas partindo de uma longa tradição oral precedente. O sânscrito é a língua da literatura clássica da Índia e sua base é um dialeto da Índia central; por isso, o sânscrito compartilha muitas características com o védico recente. O chamado sânscrito clássico é a língua codificada pelo célebre gramático Panini (século V – IV a.E.C.), instrumento utilizado na escolarização, na religião e no discurso literário, ainda hoje usada em certa medida. Os prácritos são línguas literárias da tradição médio‐indiana (300 a.E.C. – 200 E.C.), não derivados diretamente do sânscrito, mas de uma tradição paralela; o mais importante dos prácritos antigos é o pali, língua do cânone budista. As línguas modernas da Índia são descendentes dos dialetos que constituem as bases dos prácritos antigos. 89 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG As línguas indianas modernas, mais de 200, são faladas por cerca de um quinto da população mundial em uma área dialetal contínua sem divisões nítidas. Na região oriental coloca‐se o bengali, falado em Bangladesh e no nordeste da Índia, cuja literatura, das mais antigas entre as línguas indo‐irânicas modernas, remonta ao século X ou XI, além de assamês, bihari e oriya. A principal língua da região central é o hindi‐urdu, ou hindustani, que representam duas línguas literárias, expressas em alfabetos diferentes, mas que constituem basicamente uma única língua falada. Também são línguas centrais o gujarati e o punjabi, além do romani, a língua dos ciganos, falada hoje principalmente na Europa. No nordeste, a principal língua é o nepali, falada no Nepal e no noroeste da Índia. Na região noroeste, colocam‐se as línguas dárdicas, principalmente o kashimiri, no norte da Índia e do Paquistão, além do sindhi, no sudeste do Paquistão, e do singalês, falado no Sri‐ Lanka, que foi colonizado por emigrantes vindos do norte, no século V a.E.C. Ao sul, não do sub‐continente, mas da área de línguas indianas, fala‐se o marathi. Nas mais antigas inscrições da Índia, encontram‐se dois tipos de escrita: brahmi e kharosthi. O primeiro teve uso limitado e desaparece após o século V E.C. O brahmi, tem uma história de maior destaque. Em suas origens, parece ser derivado de algum alfabeto semítico, pelo menos em parte; por volta do século III, ele evolui em dois tipos, um ao norte e outro a sul. Da forma do norte surge o devanagari, escrita do sânscrito e do hindi, que, levada pelos missionários budistas, foi usada pelo tocário, kotanês e tibetano. A forma do sul se desenvolve e dá origem à escrita usada pelas línguas dravídicas no sul da Índia, tais como o telegu, o tamil, kannada e malaio, e também a do singalês. Também uma variedade do tipo sul, por volta do século VI, se espalha pelo sudeste da Ásia, dando origem às escritas modernas da Tailândia, Burma, Camboja e Laos. As línguas irânicas se dividem, cronologicamente, em antigo iraniano, médio iraniano e línguas irânicas modernas. Em relação ao antigo iraniano, avéstico e antigo persiano são as línguas nas quais existem textos supérstites, mas sabe‐se da existências de outras línguas, como o medo e o cita. 90 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG O avéstico é a língua do Avesta, uma coleção de textos sacros da religião de Zaratustra. No interior desse corpus, fala‐se em antigo avéstico, datado como do fim do segundo milênio, e novo avéstico, provavelmente do século IX ou VIII a.E.C. A língua pertence à área oriental do iraniano. A tradição desses textos foi oral, até que no século IV se inventou uma escrita alfabética com o propósito de recordar a forma de se recitar os textos avésticos. O antigo persa é a língua das inscrições reais da dinastia Aquemênida do antigo Império Persa, datadas entre os séculos VI e IV; a língua pertence à área sudoeste. Os textos do antigo persa são em uma escrita cuneiforme imitada do cuneiforme mesopotâmico, mas os signos são completamente diferentes. A escrita do cuneiforme persa foi a primeira a ser decifrada. abrindo caminho para que se decifrassem os outros cuneiformes mesopotâmicos, pois muitas das inscrições eram bilíngues ou trilíngues. No médio iraniano, distinguem‐se um subgrupo ocidental e outro oriental, ainda que não tenham correspondência geográfica exata. O período reflete a maior área de distribuição das línguas iranianas, do mar Negro à China. Nada dessas línguas era conhecido até o século XX, quando foram descobertos, principalmente no Turquestão chinês, material em parto, sogdiano, bactriano, kotanês e tumshuquês (além do tocário). De todas essas línguas, apenas o médio persa e o sogdiano parecem ter descendentes ainda em uso. Outras línguas irânicas, como o sarmatiano e o alânico, só se conhecem por testemunhos indiretos e não há nenhuma literatura preservada. A maioria das línguas médio‐irânicas são escritas em formas derivadas do alfabeto aramaico que, como todos os alfabetos semíticos, não possui signos para vogais breves e cujos sinais para as longas trazem muita ambiguidade. No irânico ocidental, o médio persa foi a língua oficial da dinastia Sassânida (224 – 652), mas é conhecida também pela literatura dos séculos IX e X E.C. Foi a língua culta do maniqueísmo na Pérsia. Os dois tipos principais são o pahlavi, a língua standard dos textos do zoroastrismo, e a língua dos textos maniqueístas, que é mais pura. Nenhum dos dois parece descender diretamente da língua das inscrições aquemênidas. 91 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG No subgrupo oriental, coloca‐se o bactriano, conhecido por moedas, uma inscrição de 25 linhas e documentos legais, em alfabeto grego; o kotanês e o tunshuquês, situados na rota da seda, cujos documentos são escritos em alfabeto brahmi, o sogdiano, no atual Uzbequistão, preservado em textos variados, que tem um continuador no moderno yaghnobi, e, finalmente o choresmiano, conhecido principalmente a partir de uma tradução interlinear de uma enciclopédia árabe medieval. As línguas irânicas modernas são faladas em uma área muito vasta, que vai do Cáucaso (ossético), ao norte de Oman (kumzari) e ao Xinjiang (sarikoli). Entre as línguas mais faladas do irânico ocidental, podem‐se citar o persa moderno ou farsi, língua nacional do Irã e uma das duas línguas oficiais do Afeganistão, cuja variedade é chamada dari. Um dialeto do persa, o tajiki, é falado no Tajiquistão e países vizinhos; o kurdo é falado no Iraque, Irã, Turquia e Rússia; o baloqui, principalmente no Baloquistão, mas também no sudeste do Irã e sudoeste do Paquistão. No irânico oriental, coloca‐se o pashto, a outra língua oficial do Afeganistão, cuja tradição literária remonta ao século XVI. Enfim, isolado das demais línguas irânicas, o ossético é falado na Turquia e Geórgia. 10 Tocário O tocário só foi descoberto no século XX, e em 1907 já foi reconhecido como língua indo‐ europeia. A maioria dos textos são traduções, muitas bilíngues, de peças budistas, o que acilitou a sua decifração. Os documentos se colocam entre os séculos VI e VIII, e provém de uma região localizada no Turquestão. São duas línguas: uma ocidental, o tocário A; e outra, que se encontra na mesma região e também na parte oriental, é conhecida como tocário B. Sobre os falantes dessas línguas, sabe‐se muito pouco, e sua identificação é problemática. Na sua grande maioria, os textos em tocário são escritos em uma versão modificada do alfabeto Brahmi indiano, também utilizado pelo kotanês (língua médio iraniana) e o tibetano. Há também alguns fragmentos do tocário B que usam a escrita maniqueia. 92 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG 11 Outras línguas Algumas línguas indo‐europeias são atestadas de forma tão fragmentária, normalmente pequenas inscrições, nomes próprios, topônimos e glosas, que a sua colocação em um ou outro sub‐grupo não pode ser feita seguramente; são elas: frígio, trácio, macedônio, ilírio, venético, messápico e lusitano. O antigo frígio é conhecido por menos de cem inscrições que vão do século VII ao V, em um alfabeto derivado de uma forma antiga do alfabeto grego; muito tempo depois, é atestado o novo frígio, nos séculos I e II E.C., documentado por outra centena de inscrições em alfabeto grego, além disso, há algumas glosas de Hesíquio que explicam, em grego, palavras frígias. O trácio, cujos falantes, na antiguidade, ocupavam a região da atual Bulgária, é atestado em moedas, a partir do século VI a.E.C., e em poucas e breves inscrições, sem interpretação segura, além de cerca de 80 glosas de Hesíquio. Do macedônio, que não deve ser confundido com o moderno macedônio, uma língua eslava, e que era falado no norte da Grécia na antiguidade, temos apenas glosas, uma vez que as inscrições da Macedônia são em grego, adotado como língua oficial no século V a.E.C. Muito pouco conhecido também é o ilírio, da região balcânica, atestado apenas em topônimos, antropônimos e poucas glosas. O venético, no nordeste da Itália, é conhecido através de cerca de 200 inscrições curtas, do século VI ao I a.E.C., as mais antigas no alfabeto etrusco, as mais recentes no latino. Enfim, no extremo oeste do domínio indo‐europeu, na península ibérica, foram encontradas três inscrições em uma língua indo‐europeia, escritas com alfabeto latino no século I a.E.C., o lusitano. 93 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG A RECONSTRUÇÃO DO INDO‐EUROPEU Jacyntho Lins Brandão (Fale/UFMG) Vamos retomar a família indo‐europeia para seguir alguns dos passos a partir dos quais se reconstitui uma protolíngua. Há três razões principais para essa escolha: (a) como você já sabe, trata‐se de uma família bastante estudada desde o século XIX, de cuja protolíngua não temos nenhum registro escrito, o que faz com que seu conhecimento dependa inteiramente da aplicação do método comparativo; (b) é nessa família que se encontra o português, o que ajuda a compreender, em termos diacrônicos, algumas de suas categorias gramaticais; (c) da comparação do proto‐indo‐europeu com as línguas indo‐europeias percebe‐se como a mudança linguística se processa sem pressupostos teleológicos. A reconstituição de uma protolíngua não‐documentada tem como primeiro requisito a possibilidade de, comparativamente, a partir de um conjunto de línguas que se pretenda dela sejam derivadas, estabelecer o que define uma língua, a saber: (a) um léxico; (b) um sistema fonológico; (c) um sistema de morfológico; (d) padrões sintáticos. Atenção: como as línguas encontram‐se em processo constante de variação e mudança, não se trata de estabelecer essas categorias para todo o conjunto, mas de deduzir do conjunto quais seriam os traços que se encontrariam na protolíngua reconstituída, capazes de explicar os resultados observáveis nas diferentes línguas dela procedentes. Um segundo requisito é que a protolíngua deve ser tipologicamente viável. Como veremos adiante, existem alguns padrões linguísticos (o que se denomina “tipos linguísticos”), deduzidos da observação e comparação das línguas existentes. Por exemplo, recordando algo a que já se fez referência: nem todas as línguas apresentam artigos, mas, se uma língua tem apenas um tipo de artigo, este será o definido. Noutros termos, de uma perspectiva diacrônica: tudo parece indicar que, quando se criam artigos, primeiro se cria o definido e apenas depois, se for o caso, o indefinido. Nesse sentido, caso 94 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG se reconstitua uma língua que possua apenas artigos indefinidos isso representará, em princípio, uma dificuldade tipológica que põe em suspeição a própria reconstituição. Na sequência, vamos abordar alguns dos passos da reconstituição do indo‐europeu, enfatizando o que diz respeito às principais categorias morfológicas nominais e verbais, pois, como você verá, seu conhecimento ajuda a entender as categorias de número, gênero, caso, aspecto, tempo e modo nas línguas indo‐europeias modernas, incluindo o português. 1 Como se reconstroi uma língua Faça no Moodle o Exercício relativo a este tópico 2 A reconstituição do indo‐europeu Faça também o Exercício relativo a este tópico. 2.1 A categoria de número Em seu conjunto, registram‐se nas línguas indo‐europeias três números: singular, plural e dual. Como você vê, a oposição singular/plural não é a única, havendo línguas que, além do dual, apresentam ainda outros números, o que exploraremos mais à frente. Tipologicamente, entre os três que agora nos interessam, há uma organização hierárquica: (a) se uma língua possui o plural, possuirá também o singular; (b) se possui o dual, possuirá também o plural e o singular. É importante ressaltar que todas as línguas têm formas de indicar o número, mas considera‐se que possuem essa categoria gramatical apenas aquelas que atendem a dois requisitos: (a) apresentam alguma forma de marcação do número através de afixos, ou seja, um procedimento de natureza morfológica; (b) têm o número como uma categoria de concordância, o que significa dizer que ela exerce uma função sintática. No grupo indo‐ europeu, ambas as exigências se cumprem, como você pode constatar dos exemplos a seguir, em que tanto o substantivo apresenta sufixos de marcação de número, quanto seus determinantes e o verbo com ele concordam: 95 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG QUADRO 4 Exemplos de singular/plural/dual enquanto categorias gramaticais Singular Plural Dual Português Esta fruta está madura. Estas frutas estão x maduras. Francês Inglês Sânscrito Grego Ce fruit est mûr. This fruit is ripe. Etat phalam pakvam. Ces fruits sont mûrs. x These fruit are ripe. x Etāni phalāni pakvāni. Ete phale pakve. Ho karpòs hoûtos hóriós Hoi karpoì hoûtoi hórioí Tō karpō toútō horiō esti. eisi. estón. Observe: a) nos três primeiros exemplos (português, francês e inglês) há dois números (singular/plural), enquanto nos dois últimos (sânscrito/grego) encontramos três (singular/plural/dual); b) em português e francês tanto o demonstrativo (esta/ce x estas/ces), quanto o verbo (está/est x estão/sont) e o predicativo (madura/mûr x maduras/mûrs) concordam em número com o sujeito (fruta/fruit x frutas/fuits); c) no inglês, o demonstrativo (this/these) e o verbo (is/are) também apresentam concordância de número com o sujeito (fuit/fruits), mas não o predicativo (ripe), já que o adjetivo nesta língua é invariável; d) o sânscrito dispensa o verbo de ligação (etat phalam pakvam = esta fruta madura), o demonstrativo (etat/etāni/ete, ‘este/estes/estes dois’) e o predicativo (pakvam/pakvāni/pakve) concordando em número com o sujeito (phalam/phalāni/phale, ‘fruto/frutos/dois frutos’). e) em grego, todos os elementos da oração realizam a concordância de número, a saber: o artigo (ho/hoi/tō, ‘o/os/os dois’), o demonstrativo (hoûtos/hoûto/toútō, ‘este, estes, estes dois’), o predicativo (hórios/hórioi/horiō) e o verbo (estí/eisí/estón, ‘ele é/eles são/eles dois são’). Naturalmente, o que se diz no dual em sânscrito e grego pode‐se dizer também em português, francês e inglês com o acréscimo do numeral ‘dois’ (estas duas frutas estão 96 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG maduras/ces deux fruits sont mûrs/these two fruits are ripe), mas então não se trata de número gramatical, a concordância fazendo‐se no plural, uma vez que não existe a oposição entre plural e dual. Acrescente‐se que em grego sempre se pode usar o plural no lugar do dual, tendo este último número um uso bastante retrito, de modo que tō karpō toútō horiō estón (dual) equivale a hoi dúo karpoì hoûtoi hórioí eisi (plural, sendo dúo o numeral ‘dois’). No grego comum (koiné), já no fim da Antiguidade, bem como no grego moderno, o dual não existe mais. Nas línguas indo‐europeias, o dual apresenta‐se em algumas das línguas de que dispomos de registros que remontam à Antiguidade – como, além do sânscrito e do grego, também no avéstico, no gótico e no antigo eslavo eclesiástico –, não se registrando, contudo, em outras igualmente antigas, como o latim e o hitita. Manteve‐se ainda nos registros mais arcaicos do islandês e conserva‐se, ainda hoje, no esloveno (lipa/lipe/lipi, ‘tília/tílias/duas tílias’). O fato de que se encontre atestado em diversos grupos (indo‐iraniano, grego, germânico e eslavo) leva a supor que tenha sido gramaticalizado em fase bastante remota do indo‐europeu, embora posterior à separação do grupo anatólio, uma vez que nas línguas desse grupo não há qualquer traço do dual. Ressalte‐se que em latim encontramos reminiscência do dual no termo ambō, ‘ambos’. Considerando os fatos referidos, podemos representar a categoria de número no proto‐ indo‐europeu da seguinte forma: QUADRO 5 A categoria de número no proto‐indo‐europeu plural (mais de um) singular (apenas um) dual plural (pares) (mais de dois) Em geral, nas línguas que o apresentam, o dual, enquanto um desdobramento do plural, é uma oposição que se aplica a um tipo determinado de seres ou coisas, as que aparecem aos pares, como irmãos gêmeos, um casal, os olhos, as orelhas etc. (em português, alguns termos que têm forma de plural, como ‘óculos’, guardam alguma ideia de dual, tanto que 97 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG a concordância é flutuante, podendo‐se dizer tanto ‘meus óculos quebraram’, considerando‐se que se trata de um objeto composto de um óculo esquerdo e um óculo direito, quanto ’meu óculos quebrou’ [em desacordo com a língua padrão], tendo em vista que se trata de um par de óculos). É esse componente semântico que dá ao dual uma identidade mais específica, deduzida de certa visão de mundo: há o que se mostra sempre como unidade (por exemplo, o céu, o mar, a terra), ou se apresenta como tal em determinadas situações (um homem, um animal, uma árvore); há o que se apresenta sempre aos pares (olhos, pernas, braços), ou, eventualmente, assim se mostra em determinadas situações (dois homens, dois animais, duas árvores); finalmente, há tudo o que ultrapassa a unidade e/ou o par. Outra forma de indicar o número presente nas línguas indo‐europeias e proavelmente no próprio indo‐europeu é o coletivo. Neste caso, trata‐se de uma palavra que expressa uma pluralidade de indivíduos da mesma espécie, considerados todavia de uma perspectiva de conjunto: ‘rebanho’, ‘cardume’, ‘cacho’, ‘enxame’, ‘tropa’, ‘multidão’. Além da existência de itens lexicais com a significação própria de coletivo (podendo, inclusive, em alguns casos, flexionar‐se no plural: ‘rebanhos’, ‘tropas’), parece ter havido um sufixo de coletivo no indo‐europeu (–aH), de onde proveio a desinência de plural do neutro (cf. latim templum/templa, ‘templo/templos’; grego biblíon/biblía, ‘livro/livros’). A memória de que se tratava não de um plural comum, mas de um coletivo, conservou‐se em grego antigo, já que o sujeito no neutro plural concorda com o verbo no singular: tò téknon trékhei, ‘o menino corre’/tà tékna trékhei, ‘os meninos correm’, com o verbo trékhein, ‘correr’, mantendo‐se sempre na terceira pessoa do singular (o sentido da construção de plural sendo algo equivalente ‘a meninada corre’). O mesmo sentido de coletivo foi preservado em biblía, ‘livros’, desde quando o empréstimo grego a um sem número de outras línguas passou a designar ‘a Bíblia’ enquanto o conjunto de livros sagrados de judeus e cristãos. 98 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG 2.2 A categoria de gênero Em termos gerais, a categoria de gênero pode ser considerada gramatical quando, além da eventual existência de afixos que o expressam (no plano morfológico), exerce ele um papel na concordância nominal ou verbal (função sintática). Seria mais correto, portanto, considerá‐la como uma “classe de concordância”, a exemplo do que você já viu com relação às línguas nigero‐congolesas, dentre as quais o quimbundo. Como nas línguas indo‐europeias o verbo concorda com o sujeito apenas em número e pessoa, o gênero gramatical tem sua função restrita à concordância nominal. Nas línguas indo‐europeias historicamente atestadas, encontramos cinco situações: 1. línguas que não conhecem nenhuma distinção de gênero, como o persa moderno, o tadjique, o assamês (todas do grupo iraniano), o bengali (grupo índico) e o armênio (língua isolada); 2. línguas que fazem duas distinções de gênero, podendo ser eles: 2.1. comum e neutro, como no hitita (grupo anatólio), no dinamarquês, no holandês, e no sueco (todas estas do grupo germânico); 2.2.animado e inanimado, que é o caso do bretão (grupo celta); 2.3.masculino e feminino, como no letão (grupo báltico), no hindi, no români (grupo índico), no pachto (grupo iraniano) e na maior parte das línguas românicas (grupo itálico), a saber, galego, português, espanhol, catalão, francês e italiano; 3. línguas que admitem três distinções de gênero – masculino, feminino e neutro –, a exemplo do avéstico (grupo iraniano), do sânscrito (grupo índico), do búlgaro (grupo eslavo), do islandês, do inglês, do alemão (grupo germânico), do latim, do romeno (grupo itálico) e do grego (língua isolada); 4. línguas que admitem quatro distinções de gênero – a saber, masculino animado, masculino inanimado, feminino e neutro –, como o russo, o tcheco, o eslovaco, o croata, o sérvio, o bósnio e o montenegrino (todas do grupo eslavo); 99 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG 5. uma língua, o polonês (grupo eslavo), com cinco distinções de gênero – masculino pessoal, masculino animado não‐pessoal, masculino inanimado, feminino e neutro. A partir dessa relação pode‐se concluir: (a) não existe uma distribuição coerente entre os diferentes critérios e os grupos linguísticos, a não ser com relação aos itens 4 e 5, já que se trata de desdobramentos próprios das línguas eslavas (mas observe‐se que o búlgaro se encontra no item 3); (b) há duas ordens de motivação semântica envolvidas nas diferentes combinações, a saber, a oposição animado/inanimado e a oposição masculino/feminino. Parece que é essa existência de duas ordens de critérios de base diversos que torna a categoria de gênero um fato complexo no grupo indo‐europeu, o que se poderia representar assim: QUADRO 6 Combinações dos critérios animado/inanimado e masculino/feminino no gênero gramatical das línguas indo‐europeias Animado (ou Comum) Inanimado (ou Neutro) Masculino Animado Pessoal Feminino Inanimado Não‐pessoal Em termos diacrônicos, parece razoável admitir que a ordem de criação de gêneros teria se processado no seguinte sentido: a) num primeiro estágio, a oposição seria entre animado e inanimado, o que corresponde à situação verificada no hitita; b) num segundo momento, no interior do animado, se teria processado à divisão entre masculino e feminino, como se encontra em sânscrito, grego, latim, gótico e proto‐eslavo, gerando um esquema tripartido (maculino x feminino x neutro); c) num terceiro estágio, próprio das línguas eslavas, procede‐se a uma nova divisão no interior do masculino, separando as palavras em animados e inanimados (masculino animado x masculino inanimado x feminino x neutro); 100 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG d) num quarto momento, uma língua eslava, o polonês, efetuou uma nova separação no interior do masculino animado, dividindo‐o em pessoal (humanos machos) e não pessoal (animais machos). Seria necessário, também diacronicamente, percorrer, no sentido inverso, a redução das oposições de gênero em algumas línguas: a) com exceção do hitita, parece razoável reconstituir para as protolínguas dos demais ramos a existência de três gêneros: masculino, feminino e neutro (o item b acima); b) algumas línguas (como o sueco e o bretão) abandonaram a distinção masculino/feminino, retornando a uma oposição binária (animado ou comum/inanimado ou neutro); c) outras línguas (como maior parte das românicas, o hindi e o pachto), conservaram apenas a distinção masculino/feminino; d) finalmente, há línguas que eliminaram completamente a distinção de gêneros (persa, bengali, armênio). A existência do modelo tripartido (masculino/feminino/neutro) no avéstico, no sânscrito, no grego, no latim, no proto‐eslavo e no protogermânico sugere que o indo‐europeu já conhecia esse modelo antes da separação desses grupos, mas após a constituição do anatólio como grupo à parte (em que prevalece a divisão gênero comum/gênero neutro). A classe dos adjetivos, os determinantes por excelência, é esclarecedora quanto a isso. Em grego e em latim, por exemplo, há dois tipos de adjetivos: os que apresentam duas formas (com o masculino/feminino opondo‐se ao neutro) e os que têm três formas (masculino x feminino x neutro): QUADRO 7 O gênero dos adjetivos em grego e latim Grego Latim Gênero masculino feminino neutro masculino feminino Triformes agathós, ‘bom’ agathē agathón bonus, ‘bom’ bona Biformes alethēs, ‘verdadeiro’ alethĕs brevis, ‘breve’ neutro bonum breve 101 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG Observe‐se que os adjetivos biformes mantêm um modelo mais arcaico, anterior à separação do animado em masculino e feminino, o neutro correspondendo ao inanimado, enquanto os triformes já criaram uma forma própria do feminino na antiga classe do animado. No que diz respeito ao latim, como as línguas românicas, à exceção do romeno, não conservaram o gênero neutro, gerou‐se um esquema em que os adjetivos podem ser biformes (masculino/feminino) ou uniformes (sem distinção de gênero), estes últimos dando continuidade à classe dos adjetivos biformes do latim: QUADRO 8 O gênero dos adjetivos em português, espanhol e italiano Português Espanhol Italiano Gênero Masc. Fem. Masc. Fem. Masc. Fem. Biformes bom boa bueno buena buono buona Uniformes breve breve breve Os adjetivos uniformes representam, como se vê, o ponto de chegada da antiga divisão entre animados e inanimados, ou seja, neles se eliminou a distinção do gênero enquanto classe de concordância, uma vez que essas línguas não mantiveram o neutro: ‘um discurso breve/uma vogal breve’. Em alguns casos, essa distinção é recuperada, como aconteceu no francês, em que, a partir do mesmo termo latino, se retomou a distinção entre masculino (bref) e feminino (breve): un discours bref/une voyelle brève. Vamos buscar entender a motivação semântica para os dois critérios básicos de distinção de gênero no indo‐europeu. O mais recente é fácil de compreender: o masculino designa os seres animados machos; o feminino, os seres animados fêmeas. Quanto à distinção mais antiga, animado – inanimado, alguns esclarecimentos são necessários. Antes de tudo, é preciso considerar que a categoria gramatical de gênero visa a organizar o léxico de uma língua tanto em termos semânticos quanto funcionais. Do ponto de vista semântico, a organização lexical reflete a organização do mundo tal qual percebida por uma determinada cultura, ou seja, tal qual representada em seu imaginário. Nesse sentido, no conjunto dos seres, podemos considerar que o reconhecimento de uma parte deles como [+ animado], em oposição a uma outra parte tida como [‐ animado], é que teria dado 102 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG origem à primeira grande divisão do léxico indo‐europeu em duas partes, compreendendo no gênero animado os seres vivos, que se movem e se reproduzem, o que se poderia representar assim: QUADRO 9 Critérios semânticos da classificação em animado/inanimado Animado Inanimado Humanos + ‐ Animais + ‐ Árvores + ‐ Astros + ‐ Filhotes ‐ + Frutos ‐ + Objetos ‐ + Observe que é a oposição produtor/produto que determina que humanos, animais e árvores sejam [+ animado], enquanto filhotes e frutos seriam [‐ animado]. Em algumas línguas atestadas encontramos alguma reminiscência remota dessa distinção primeira, em exemplos como: Termos Pai/mãe/bebê Figueira/figo Pereira/pera Macieira/maçã Poeta/poetisa/ poema QUADRO 10 Distribuição entre masculinos/femininos e neutros que remontam à distinção animado/inanimado Língua Animados Inanimados Critério predominante Masculino Feminino Neutro Grego patēr mētēr téknon Progenitores – gerado Alemão Vater Mutter Kind Grego sukē sûkon Latim pirus pirum Árvore – Latim malus malum fruto Russo iablonia iabloko Grego mēlís mēlon Grego poiētēs poiētris poíēma Produtor – produto Fonte: Meillet, 1948, p. 211‐229; Gramkrelidze e Ivanov, 1995, p. 218‐219. Ilustrativo também é observar, em línguas que apresentam a tripartição de gêneros, como se distribuem alguns nomes de elementos da natureza, o que parece guardar alguma motivação de ordem mais arcaica: 103 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG QUADRO 11 Gêneros de elementos da natureza em latim, grego e alemão Elemento da Línguas Animados Inanimados natureza Masculino Feminino Neutro Céu Latim Caelus caelum Grego ouranós Alemão Himmel Sol Latim sol Grego hélios Alemão Sonne Lua Latim luna Grego selēnē Alemão Mond Estrela Latim stella Grego astēr Alemão Stern Terra Latim terra Grego gē Alemão Erde Fogo Latim ignis Grego pûr Alemão Feuer Água Latim aqua Grego húdor Alemão Wasser Mar Latim mare Grego póntos thálassa pélagos Alemão See Rio Latim flumen Grego potamós Alemão Fluß Repare como até o elemento ‘terra’ não há, com a exceção do latim, ocorrência de palavras do gênero neutro. O caso do latim é emblemático: caelum, neutro, designa o céu como a calota sobre a terra, enquanto Caelus, masculino, o Céu personificado como um deus. Essa seria uma explicação para a concentração dos nomes relativos ao céu, aos corpos celestes e à terra no masculino ou feminino, uma vez que eles são considerados entidades vivas, logo, do gênero animado. Quando se trata dos elementos naturais terrestres – fogo, água, mar e rio – o número de ocorrências no neutro cresce, havendo mesmo a possibilidade, como no caso das palavras que em grego nomeiam o mar, de contar‐se com termos dos três gêneros. Todos esses exemplos ilustram como a sucessão dos dois critérios de 104 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG distinção de gênero fez com que essa categoria, de um ponto de vista sincrônico, nas diferentes línguas e provavelmente já na fase mais recente do indo‐europeu, passasse a ser em grande parte imotivada semanticamente, mantendo apenas a função de classe de concordância. Há contudo uma motivação de ordem gramatical que é preciso ainda considerar. Como já se disse, a categoria de gênero organiza o léxico das línguas que a possuem. Essa organização, pelo menos em princípio, parece que estabelecia, no indo‐europeu, restrições quanto às relações entre substantivos e verbos, a saber: (a) os nomes animados poderiam ocorrer como sujeitos de verbos ativos, como ‘correr’, ‘destruir’, ‘comer’, ‘beber’, ‘morrer’, ‘falar’, ‘matar’, ‘crescer’; (b) os nomes inanimados não poderiam exercer a função de sujeitos de verbos ativos, mas apenas de verbos que semanticamente denotassem ações ou estados compatíveis com sujeitos inativos (cf. GRAMKRELIDZE; IVANOV, 1995, p. 239). Tomemos como exemplo o seguinte enunciado: I II III sujeito (agente) verbo (ativo) objeto (inativo) o homem rola a pedra. Existe um rol de termos que podem ocupar a posição I (como mulher, animal, tempestade, vento etc.), mas não são todos os itens lexicais que podem fazê‐lo: ‘a pedra rola o homem’ seria, por exemplo, um enunciado sem sentido. Em princípio, as palavras que poderiam ocupar a posição I são as que pertenceriam à classe dos animados (ou ativos), não podendo fazê‐lo os nomes inanimados (ou inativos). Assim se entende por que o conceito de animado não se restringe a seres que, da nossa perspectiva, têm vida ou se movem, pois seriam perfeitamente coerentes enunciados como: I II III sujeito (agente) verbo (ativo) objeto (inativo) o ceu fecunda a terra. a terra produz a árvore. a árvore gera o fruto. 105 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG A esse propósito, refletindo um tanto da mentalidade antiga relativamente à natureza, contamos com uma composição das odes anacreônticas (atribuídas, na época helenística, ao poeta grego arcaico Anacreonte), que diz: A terra negra bebe, E a árvore bebe a terra. O mar bebe a brisa, O sol bebe o mar, E, ao sol, a lua bebe. Por que me criticais, camaradas, Eu também querendo beber? Ainda que se trate de poesia, em que se trabalha com um registro figurado, o poeta fala de uma experiência de mundo em que terra, sol, lua, mar, árvore são capazes de ocupar a posição de agentes e não só de pacientes. Um fato de ordem morfológico‐sintática que parece corroborar isso é que nos neutros, em geral, a forma do nominativo (o caso do sujeito) é a mesma que do acusativo (o caso do objeto) – noutros termos, trata‐se de palavras que originalmente não teriam uma forma de nominativo porque, na condição de inanimados, não poderiam ocupar a posição de sujeitos de verbos ativos. Tudo isso leva Gamkrelidze e Ivanov (1995, p. 239) a concluir: A divisão de nomes em ativos e inativos, reconstituída para o indo‐europeu, encontra paralelos tipológicos freqüentes em diversas línguas com uma classificação binária de nomes. A classificação binária motiva a totalidade da estrutura gramatical e os recursos sintático‐ semânticos do estágio mais remoto que se pode estabelecer para o proto‐indo‐europeu, a partir da reconstituição comparativa e interna baseada nas línguas indo‐européias. Isso conta para várias das características do indo‐europeu, envolvendo as relações gramaticais, sintáticas e semânticas. Todo esse esforço histórico‐comparativo de compreensão da motivação da repartição dos gêneros nas diferentes fases do proto‐indo‐europeu não elimina o fato de que, com exceção do inglês, nas línguas dessa família se trate de uma categoria em parte imotivada. Repare bem: dizer imotivada parcialmente não implica que o seja de todo. Um falante do português, por exemplo, sabe que o gênero masculino é próprio dos machos, enquanto o feminino designa as fêmeas, compreendendo ambos ainda, em geral, o seguinte: 106 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG a) são masculinos os nomes de funções exercidas por homens (o cardeal), de rios (o Amazonas), de mares (o Mediterrâneo), dos meses (janeiro vindouro), dos pontos cardeais; b) são femininos os nomes de funções exercidas por mulheres (a freira), de cidades e ilhas (a antiga Ouro Preto, a pacata Paquetá). Um falante do português sabe também que há razões de ordem fonética ou morfológica para a classificação de gêneros, tais como: (a) são masculinas, em geral, as palavras terminadas em ‐o átono (livro, barco, aluno, tesouro), os substantivos concretos terminados em ‐ão (limão, algodão, balcão) etc.; (b) são femininas, em geral, as palavras terminadas em ‐a átono (caneta, lancha, aluna, tesoura), as palavras abstratas terminadas em ‐ão (instrução, razão, aflição), as palavras terminadas em ‐agem (viagem, garagem, bobagem) etc. (cf. CUNHA, 1982, p. 199‐200). Em todos os casos, os critérios são de ordem bastante genérica e termos que fogem às previsões estabelecidas saltam à vista: ‘cobra’ (gênero feminino) pode ser tanto macha quanto fêmea; o topônimo ‘Rio de Janeiro’ pertence ao gênero masculino; ‘mão’, embora substantivo concreto terminado em ‐ão, é do gênero feminino; ‘cometa’, ‘telefonema’, ‘dia’, ‘fantasma’, ‘mapa’, todos terminados em ‐a átono, pertencem ao gênero masculino; ‘personagem’ admite tanto o masculino (‘o personagem’) quanto o feminino (‘a personagem’). E assim por diante. Isso leva a que se pense muitas vezes que o gênero é imotivado, o que não seria de todo correto. O mais adequado, tendo em vista a variedade de línguas do mundo, parecer ser considerar que há gradações, admitindo‐se tanto critérios semânticos, quanto morfológicos, na seguinte escala, de acordo com Corbett: (a) sistemas estritamente semânticos; (b) sistemas predominantemente semânticos; (c) sistemas morfológicos; (d) sistemas fonológicos – prevendo‐se ainda que possa haver a combinação de critérios semânticos, morfológicos e fonológicos, o que se aplicaria, em geral, às línguas indo‐ 107 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG europeias, com a eventual predominância de um ou outro, como no russo, em que prevalece a morfologia (cf. CORBETT, 1991, p. 1‐61). O inglês é a única língua indo‐europeia que se enquadraria no primeiro item acima citado, ou seja, o dos “sistemas estritamente semânticos”, com três gêneros: masculino, feminino e neutro. Como o artigo, os demonstrativos e os adjetivos não apresentam variação de gênero, não concordando, portanto, com o nome que determinam, há linguistas que consideram que essa categoria gramatical simplesmente não existe no inglês moderno. Todavia, o gênero se encontra expresso nos pronomes de terceira pessoa do singular (he/she/it) e nos possessivos a eles correspondentes (his/her/its), exigindo a concordância com o referente, de acordo com a seguinte distribuição: (a) he (masculino), humanos machos; (b) she (feminino), humanos fêmeas; (c) it (neutro), todo o restante. As exceções são raras, como ship, ‘navio’, que frequentemente admite o pronome she. Entretanto, essa divisão estritamente semântica permanece aberta, na prática, a uma maior variedade: animais domésticos, sobretudo quando têm nomes próprios, admitem o uso de he ou she, dependendo de seu sexo, o mesmo acontecendo nas histórias infantis, ou seja, fatores pragmáticos, de ordem emotiva e cultural, interferem na escolha do falante, nas diversas situações comunicativas. Referências CORBETT, Greville. Gender. Cambridge: CUP, 1991. Localização na biblioteca: 415 C789g 1991 (FALE) CUNHA, Celso. Gramática da língua portuguesa. Rio de Janeiro: Fename, 1982. Localização na biblioteca: 469.5 C972g 1982 (FALE) ELIA, Sílvio. Preparação à lingüística românica. Rio de Janeiro: Ao Livro Técnico, 1979. Localização na biblioteca: 440 E42p 1979 (FALE) GAMKRELIDZE, Thomas V.; IVANOV, Vjačeskav V. Ivanov. Indo‐European and the Indo‐Europeans. Berlin/New York: Mouton de Gruyter, 1995. Localização na biblioteca: 491 G747i.In 1995 (FALE) MEILLET, Auguste. Linguistique historique et linguistique générale. Leiden: E. J. Brill, 1948. Localização na biblioteca: 410 M513l 1982 (FALE) 108 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG SOCIEDADE E CULTURA INDO‐EUROPEIAS Aléxia Teles Duchowny(Fale/UFMG) INTRODUÇÃO De onde vieram os indo‐europeus? Há muitas teorias que tentam identificar o local de origem desses povos. A primeira região apontada como sua pátria foi a Índia. Em seguida, são sugeridas diversas outras áreas do globo: a Ásia, o Norte da Europa, os Bálcãs, a Hungria, o sul da Rússia..., mas a maioria delas são difíceis ou até mesmo impossíveis de serem” comprovadas. Atualmente, a “Teoria dos três estágios” divide o proto‐indo‐europeu em três camadas históricas, de acordo com Quiles e López‐Menchero (2011): (i) O pré‐proto‐indo‐europeu, ou pré‐PIE, o estágio mais antigo que a linguística comparada pode reconstruir usando da reconstrução interna. Não há unanimidade, entretanto, sobre quando e onde teria sido falado; (ii) O PIE médio ou simplesmente proto‐indo‐europeu, identificado com culturas kurgans menos recentes, na Teoria Kurgan, explicada a seguir; (iii) O PIE tardio, datado de aproximadamente 3500 – 2500 a.E.C., usando modelos arqueológicos e/ou linguísticos. 1 A Teoria Kurgan Apesar de as informações fornecidas pela reconstituição linguística serem limitadas, somos levados a crer que a origem dos indo‐europeus estaria localizada em algum ponto da Europa do leste. Segundo Beekes (1995), o fato de não haver, em indo‐europeu, palavras para “cipreste” e “jumento”, e haver a palavra “neve”, sugere um local de origem não muito ao sul. A palavra “cavalo” dá pistas muito úteis: áreas de estepe do sul da Rússia são o local de origem do cavalo selvagem e da sua primeira domesticação. Muitos 109 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG autores acreditam que o cavalo deve ter sido muito importante para os indo‐europeus, fornecendo comida, funcionando como moeda de troca e meio de transporte. Os estudos arqueológicos no sul da Rússia estão florescendo e esperamos conhecer mais e mais sobre a região e seu passado. Para Mallory (1989), a cultura dos Sredny Stog, datada de 4500‐3500 a.E.C. e situada na bacia do rio Dniepr, que nasce na Rússia chegando até o Mar Negro, representaria com verossimilhança a cultura indo‐europeia. Esse povo sustentava‐se com a criação de gado, a agricultura, a caça e a pesca. Tinha também cavalos, carneiros, bodes, porcos e cães. O uso de cobre ainda é raro. Em uma fase posterior, a cultura dos Yamnaya, datada de 3600 a.E.C. a 2200 a.E.C., extende‐se do rio Bug − que nasce na Polônia e se une ao Dniepr − até o rio Ural, que nasce na Rússia e vai até o mar Cáspio. O uso do cobre é mais comum; já foram encontradas carroças de duas e de quatro rodas, há armas e as sepulturas de seus mortos é coberta por um monte de terra. Daí a arqueóloga Marija Gimbutas chamá‐los de “Kurgan”, “monte” em russo. Apesar de ser bem provável que já houvesse dialetalização, os Yamnaya seriam os representantes indo‐europeus da fase final de união linguística. Entendamos melhor a Teoria Kurgan de Guimbutas. Essa autora combinou a arqueologia com a linguística, com o intuito de localizar as origens dos proto‐indo‐europeus. Para ela, os falantes do PIE eram uma tribo nômade das estepes próximas ao Mar Cáspio, que vão da Ucrânia até o Cazaquistão, passando pela Rússia. Eles teriam expandido estágios de sua cultura em ondas sucessivas ao longo do terceiro milênio da Era Comum. Quiles e López‐Menchero (2011, p. 68) expõem a teoria de Gimbutas da seguinte forma: QUADRO 1: A hipótese Kurgan e a Teoria dos três estágios Datação Hipótese Kurgan Teoria dos três estágios ca. 4000‐4500 a.E.C. Cultura Sredny Stog, entre Proto‐indo‐hitita? outras, domesticação do cavalo. ca. 4000‐3500 a.E.C. A cultura Yamnaya e os Dialetos pré‐indo‐europeu construtores kurgans tardio e pré‐anatólicos surgem nas estepes; a evoluem em comunidades 110 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG ca. 3500‐3000 a.E.C. ca. 3000‐2500 a.E.C. ca. 2500‐2000 a.E.C. ca. 2000‐1500 a.E.C. ca. 1500‐1000 a.E.C. cultura Maykop surge no norte do Cáucaso. Cultura Yamnaya em seu ápice: ídolos de pedra, protótipo de carroças de duas rodas, criação de animais, sedentarismo, agricultura e pesca, introdução de artefatos e armas em bronze. A cultura Yamnaya estende‐se por toda a estepe Pôntica. A cultura correspondente aos mais tardios estágios da unidade indo‐europeia estende‐se do Rio Reno até o Volga. Culturas diferentes se desintegram, ainda com algum contato, permitindo a expansão da tecnologia. A Era do Bronze alcança a Europa central com a cultura dos indo‐ europeus. Os indo‐ iranianos, e depois a cultura Andronova, assentam‐se ao norte do Mar Cáspio. A carroça é inventada, levando à expansão dos iranianos e de outras culturas à Ásia Central, norte da Índia, Irã e Anatólia ocidental. O império hitita floresce. diferentes, mas há ainda contato no mesmo território. O proto‐anatólico torna‐se isolado (no sul do Cáucaso ou nos Bálcãs) e não tem mais contato com as inovações linguísticas do indo‐europeu tardio. O indo‐europeu tardio transforma‐se em dialetos. Comunidades dialetais começam a migrar, mantendo‐ se com algum tipo de contato, permitindo a expansão das inovações fonéticas e morfológicas em comum. Proto‐anatólico, falado na Ásia Menor, evolui para anatólico Comum. Completa‐se a separação dos dialetos do sul do IE. O proto‐ grego é falado nos Bálcãs, o proto‐indo‐iraniano é falado na Ásia central, o IE do nordeste é falado no norte da Europa, os dialetos anatólicos são falados na Anatólia. O indo‐iraniano divide‐se em dois principais dialetos, indo‐ iraniano e iraniano. proto‐ dialetos europeus como o pré‐ germânico, o pré‐céltico, o pré‐ itálico e o pré‐balto‐eslavo diferenciam‐se uns dos outros. As línguas anatólicas como o hitita e o luviano passam a ter escrita; o indo‐iraniano tem atestação; fala‐se o dialeto grego micênico. A Idade do Bronze nórdica O céltico, o itálico, o presencia o surgimento, na germânico, o báltico e o eslavo já são proto‐línguas diferentes, Europa Central, do início da Idade do Ferro. Povos desenvolvendo‐se, por sua vez, itálicos movem‐se para a em dialetos diferentes. O 111 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG Península Itálica. Declínio dos reinos hititas e da civilização micênica. ca. 1000‐500 a.E.C. A Europa do norte entra na Idade do Ferro pré‐ romana. Reinos e impérios indo‐europeus na Eurásia. Na Europa, a Antiguidade Clássica começa com o florescimento dos povos gregos. Fundação de Roma. iraniano e outros dialetos do sul se expandem através de conquistas militares, e o indo‐ iraniano se espalha sob a forma de uma língua sagrada, o sânscrito. Dialetos celtas espalham‐se sobre a Europa ocidental, os germânicos sobre o sul da Jutlândia. Línguas itálicas na Península Itálica. Surgimento dos alfabetos grego e itálico antigo. Dialetos anatólicos antigos. Línguas palaeo‐ balcânicas nos Bálcãs. Fonte: Quiles e López‐Menchero (2011, p. 69) 2 A Paleontologia linguística A “Paleontologia linguística” pode dar evidência para elementos e para situações representadas pelas palavras reconstruídas. Originalmente, Paleontologia é a ciência que estuda animais e vegetais fósseis. Assim, um fóssil, para a nossa área do saber, seria qualquer vestígio ou “resto” preservado de uma palavra. Como afirma Beekes (1995, p.47): “se o proto‐indo‐europeu tem uma palavra para ´cavalo´, podemos acreditar com segurança que os indo‐europeus conheciam o cavalo.” O contrário nem sempre é verdadeiro: a ausência de uma palavra no indo‐europeu, isto é, a impossibilidade de reconstruí‐la, não implica necessariamente que não ela existiria na cultura indo‐europeia. Nem sempre, tampouco, as palavras reconstruídas são aceitas com unanimidade por todos os linguistas: como as palavras podem mudar de significado ao longo do tempo, não se tem certeza de que, na época dos indo‐europeus, o sentido era o mesmo de hoje. Além do mais, conhecemos muito pouco das línguas europeias antigas − com exceção do basco que não é língua indo‐europeia −, ficando difícil afirmar com certeza que o indo‐europeu teria surgido nesse continente. Villar (1971) exemplifica o problema: a palavra latina fagus (“faia”, um tipo de árvore que cresce no centro‐sul da Europa) encontra‐se também em antigo alemão (buohha), no gótico 112 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG (boha), no curdo (buz) etc. A partir dessas formas, chega‐se a *bhāgo‐, que se supõe ter o sentido de faia. Entretanto, não temos garantia de que a palavra existiu em toda a área indo‐europeia, já que há muitas línguas que não a apresentam. Tampouco temos certeza de que a palavra já existia na época do indo‐europeu e que seu sentido foi sempre o mesmo. O termo poderia representar, por exemplo, outro tipo de árvore ou ser um nome genérico para árvore. Consequentemente, não sabemos se os indo‐europeus viveriam em regiões com faias. Existem, no vocabulário mais ou menos comum, palavras para desginar lobo, urso, castor, cervo e lebre, entre outros animais. Palavras para animais como leão, tigre, camelo são geralmente empréstimos de línguas não indo‐europeias, já que esses animais não são nativos da Europa. Assim, para Villar (1971, p. 42), “daí pode‐se deduzir que no mundo indo‐europeu existia uma fauna mais setentrional [do norte] do que meridional [do sul].” 3 Cultura indo‐europeia Em geral, a Sociologia divide a cultura em dois tipos: a material e a não‐material. A primeira refere‐se a objetos concretos, recursos e a espaços usados para definir a cultura de um povo. Assim, casas, cidades, monumentos, ferramentas, máquinas colaboram para o entendimento do comportamento e das percepções humanas. Já a cultura não‐material refere‐se a ideias como símbolos, valores, crenças, regras, linguagens, religião, instituições. Vejamos, então, o que podemos saber sobre os indo‐europeus a partir da reconstrução linguística, que você viu no Texto 6. 3.1 Cultura material indo‐europeia Beekes (1995), ao se referir à cultura material, apresenta dados muito úteis para o nosso melhor entendimento dessa cultura tão longínqua no tempo. Para ele, os indo‐europeus não viviam em cidades, pois não havia palavra que represente esse local. A palavra *p(o)lH‐ (que deu origem a púr em sânscrito, pilìs em lituano e pólis em 113 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG grego) aproxima‐se do conceito de cidade. Entretanto, ela significaria, no início, apenas um espaço fechado onde as pessoas ficavam em tempos de perigo, equivalente a um abrigo. Deveriam viver em casas de madeira, com portas duplas: a palavra para casa era *dōm (tun em armênio e dõ em grego) da raiz *demH‐ “construir” (grego démō). Dessa mesma raiz, temos o verbo “trabalhar com madeira” timrjan, em gótico. A palavra para porta *dhuer‐ está geralmente no plural (tocariano B twere, grego thúrā, latim forēs), o que indicaria portas duplas. Quanto a utensílios domésticos, poucas palavras sobreviveram até as línguas conhecidas por nós e muitas delas são empréstimos de outras línguas. Temos o mesmo problema para ferramentas e armas, difíceis de ser reconstruídas. Os indo‐europeistas conseguiram reconstituir os verbos comer (*hled‐ > latim edō), beber (*peh3(i)‐ > latim pō‐culum, “copo”), cozinhar (*pekw‐ > grego péssō, latim coquō) e talvez assar (*bh(o)Hģ > grego phógó, antigo inglês bacan), indicando que essas ações faziam parte do cotidiano dos indo‐europeus. Provavelmente consumiam mel (*méli > grego méli), glande de carvalho (*gwlh2‐(e)n‐ > grego bálanos), carne (vermelha) (*mēms‐ > sânscrito māmsá‐), peixe (*dģhuH‐ > grego ikhthũs), sal (*seh2l‐ > latim sāl) e alguns tipos de cereais (como *ģrHno‐ > antigo irlandês grán, gótico kaurn “grão”). A única fruta conhecida é maçã (*h2ebōl > antigo eslavônico jábloko, antigo alto alemão apful). Se havia consumo de bebida alcoolica, esta deveria ser à base de mel (*medhu > sânscrito mádhu, lituano medùs). Há muita polêmica em torno da palavra vinho: seria ela ou não de origem indo‐europeia? Mas não se chegou, até então, a conclusão alguma. Algumas palavras reconstituídas nos levam a crer que os indo‐europeus tinham conhecimentos agropecuários: semear (*sehl‐ > eslavônico antigo sejǫ, gótico saian), arar (*h2erh3‐ > latim arō, armênio arawr), campo (grego ároura, latim arvum), acre (que significaria “pasto”: *h2eģros > latim ager, gótico akrs), cevada (*gh(e)rsdh‐ > antigo alto alemão gersta, latim hordeum). 114 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG O animal doméstico mais importante era a vaca (*gweh3us > tocariano A ko, antigo inglês cú), mas o carneiro (*h3euis > latim ovis) e o cordeiro (h2egwnos > latim agnus) também devem ser levados em consideração. Sabemos também que o gado (*péku) serviria como dinheiro, já que em latim a palavra pecūnia, que significa “dinheiro”, vem da raiz *péku. Há também palavras para cachorro (*kuon > inglês hound, grego kúōn), cavalo (*hlekuos > sânscrito ásva, latim equus), rato (*muHs > sânscrito mús‐, inglês mouse) e porco (*suHs > avéstico hūš, antigo inlgês swīn). Coelhos, galinhas e jumentos não deveriam ser conhecidos. Os indo‐europeus não andavam nus, necessariamente, porque foi possível reconstituir os termos vestir‐se (*ues‐ > latim vestire, gótico wasjan), tecer (*hluebh‐ > grego huphaínō, antigo inglês wefan) e costurar (*siuH‐ > hitita suēl, gótico siujan). Vestiriam algum tipo de indumentária, cinta ou tapa‐sexo feito de lã (*HulHn‐ > latim lāna) e praticariam um tipo qualquer de tecelagem, confirmado pela raiz *snei‐. Haveria apenas uma palavra para metal (*h2éios > sânscrito áyas, inglês ore), que poderia representar, não sabemos com certeza, bronze ou cobre. Ouro (*ģh(o)(H)‐ > avéstico zaranya‐, antigo eslavônico zlato) e prata (*h2(e)rģ‐nt‐ > latim argentum, antigo irlandês argat) também deveriam ser conhecidos, ao contrário do ferro, que aparecerá muito mais tarde. Mas é bem possível que os indo‐europeus não conhecessem a técnica de tratamento dos metais. Quanto aos transportes, usariam carroças, apesar de não ter sido possível reconstituir essa palavra, o que demonstra o verbo carregar/dirigir (*ueģh‐ < sânscrito váhati, latim vehō) e o substantivo roda (*Hrot‐h2 > lituano rãtas, latim rota). Tais carroças teriam sido puxadas por bois e depois por cavalos. Também utilizariam algum tipo de embarcação (*neh2us > antigo irlandês nau, antigo islandês nōr) a remo (“remar” seria *hlrehl‐ (> latim rēmus, antigo islandês róa). Não sabemos com certeza se navegavam no mar ou em rios. 115 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG Há palavras para comprar e similares, tanto objetos quanto animais e humanos escravos − não tendo sido possível reconstituir o termo escravo −, sendo uma delas *kwrih2‐ (> antigo irlandês crenim, grego príasthai). 3.2 Cultura imaterial indo‐europeia Em relação à família, e ainda conforme Beekes (1995), conhecemos os termos pai, mãe, irmão, irmã, filho e filha, entre vários outros. Mas todos se referem à família do marido, o que indica que a mulher, ao se casar, passaria a viver com essa família. O pai pode ser chamado também de “senhor” ou de “dono da casa”. Assim, podemos inferir que a instituição familiar tem grande importância para os indo‐europeus, integrantes de uma sociedade patriarcal. Pouco podemos inferir em relação à organização social acima da família. Existe a palavra para povo (*teutā > osco touto, lituano tautà) e também rei (*h3rēģ‐s > antigo irlandês rí, latim rex), que poderia ser o equivalente a um chefe tribal (Villar (1971) não acredita nessa possibilidade). Um homem livre era *uiHró‐ (sânscrito vīrá‐, gótico wair) ou *h2nér (> armênio ayr, umbro ner). Quanto à lei, roubar e ladrão puderam ser reconstruídos: *(s)teh2‐ > hitita tayezzi, antigo irlandês táid. A guerra pode ter tido notável importância na sociedade indo‐europeia. Segundo Villar (1971), a partir da verificação de que na onomástica15 sejam frequentes as palavras que indicam qualidades guerreiras. Benveniste (1995, p. 268) afirma que, em relação aos indo‐europeus, “tudo está imbuído de religião, tudo indica um signo, um jogo ou um reflexo das forças divinas.” Assim, “não se tem necessidade de um termo específico aplicado ao conjunto de cultos e crenças, e é por isso que, para denominar “religião”, encontramos apenas termos que resultam de uma criação independente.” Conhecemos apenas um deus indo‐europeu, Zeus, e é difícil saber Estudo dos nomes próprios de pessoas e lugares (etimologia, variação e mudança, morfologia, etc). 15 116 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG se haveria outros e quais seriam. A palavra Diéus *ph2tér (> grego Zeùs patér, latim Iuppiter) está relacionada a dia, a céu claro. Os deuses eram, evidentemente, imortais (*nmrtós > sânscrito ámrta‐, grego ámbrotos). Há também várias palavras que remetem a rezar (*gwhedh‐, *prek‐, *meld‐). Para Meillet (1948), os povos indo‐europeus conheceram a escrita muito tarde. Apenas o sânscrito, o iraniano, o grego e os dialetos itálicos são atestados antes da Era Comum. As outras línguas apresentam escrita apenas a partir do século 4 E.C. “É impossível, então, fazer história antiga das religiões para os povos das línguas indo‐europeias” (p. 323), porque esta demanda textos escritos. Mesmo assim, chega‐se a algumas conclusões a partir do vocabulário reconstituído do indo‐europeu. O autor estabelece a existência de um termo para a ideia de “divindade”, *deiwos (> sânscrito devah, lituano dëvas, antigo prussiano deiws, latim deus, etc). O termo é de uso generalizado em todo o grupo indo‐ europeu e podemos precisar o caráter do deus indo‐europeu: é um fato natural ou social ao qual se dá uma importância específica; o deus não tem um nome distinto do fato. O deus não é uma pessoa com nome próprio; é o próprio fato, é a sua essência, sua força íntima. [...] O culto indo‐europeu não se direciona a seres autônomos, mas às próprias forças naturais e sociais (MEILLET, 1948, p. 334). Há muitas teorias sobre a sociedade indo‐europeia, sendo difícil chegar a conclusões precisas. A teoria de Dumésil (1985), aceita por Benveniste (1995), por exemplo, de que essa sociedade seria dividida em três classes − sacerdotes, guerreiros e agricultores − é muito pouco provável, na opinião de Beekes (1995). As poucas certezas que temos em relação à origem, cultura e sociedade indo‐europeias devem servir para nos estimular a continuar a busca por respostas. Como afirma Mallory (1973, p. 21), “a localização da terra de origem e a descrição de como as línguas indo‐ europeias se expandiram é central para qualquer explicação de como a Europa se tornou europeia. Em uma visão mais abrangente, é a busca das origens da civilização ocidental.” Agora, faça o exercício proposto e leia a seção seguinte. 117 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG Referências BEEKES, Robert S. P. Comparative Indo‐European Linguistics. Amsterdam/Philadelphia: John Benjamin, 1995. BENVENISTE, Émile. O vocabulário das instituições indo‐européias. 2 v. Campinas: Editora Unicamp, 1995. DUMÉSIL, Georges. Heure et malheur du guerrier. Paris: PUF, 1985. MALLORY, James Patrick. A short story of the Indo‐European problem. Journal of Indo‐European studies, n. 1, 1973, p. 21‐65. MALLORY, James Patrick. In search of the Indo‐Europeans. Londres: Thames & Hudson, 1989. MEILLET, Antoine. Linguistique historique et linguistique générale. Paris : Champion, 1948. QUILES, Carlos; LÓPEZ‐MENCHERO, Fernando. A grammar of Modern Indo‐European. 2011. Disponível em: <http://dnghu.org/en/indo‐european‐language‐grammar/>. Acesso em: 19 jun. 2011. VILLAR LIÉBANA, Francisco. Lenguas y pueblos indoeuropeos. Madrid: Istmo, 1971. LEITURA COMPLEMENTAR Literatura em proto‐indo‐europeu? Em 1868, A. Schleicher publicou o poema “O carneiro e os cavalos”, escrito em PIE. Assim, ele queria demonstrar que, a partir das palavras reconstruídas do PIE, era possível elaborar um texto real, concreto. A sua tradução é a seguinte: A ovelha e os cavalos [Em uma colina], uma ovelha sem lã avistou cavalos, um deles puxando uma carroça pesada, um carregando uma grande carga e outro carregando, rapidamente, um homem. A ovelha disse aos cavalos: ʺMeu coração me faz sofrer, vendo um homem guiando cavalosʺ. Os cavalos disseram: ʺOuça, ovelha, nossos corações nos fazem sofrer quando nós vemos isto: um homem, o mestre, fazer da lã da ovelha um vestuário para se aquecer, enquanto a ovelha está sem lã.ʺ. Ao ouvir isso, a ovelha fugiu para as planícies. Posteriormente, outros autores, tendo como base o texto de Shleicher, compuseram novas versões da fábula. Afinal, se toda língua evolui, o PIE também o faz! Veja a versão de Schleicher e as demais em: http://tinyurl.com/43nalsm 118 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG Outro texto curioso é “Diálogo entre um rei e um deus”, também escrito em PIE por vários indo‐europeístas, já no século 20. A versão original e outras que a seguem também podem ser encontradas mesmo site acima. O rei e o deus Werunos Era uma vez um rei que não tinha filhos, mas que desejava um filho. Ele perguntou para o seu sacerdote: ʺQue um filho nasça para mim!ʺ. O sacerdote disse para o rei: ʺOre para o deus Werunosʺ. O rei aproximou‐se do deus Werunos para, então, rezar para ele. ʺEscute‐me, pai Werunos!ʺ. O deus Werunos desceu do paraíso: ʺO que você deseja?ʺ ʺEu quero um filhoʺ. ʺQue assim o seja!ʺ, disse o iluminado deus Werunos. A esposa do rei gerou um filho. 119 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG FONOLOGIA E MORFOLOGIA INDO‐EUROPEIAS Aléxia Teles Duchowny (Fale/UFMG) INTRODUÇÃO Este texto é dividido em duas partes. Primeiro, conheceremos um pouco da fonologia do indo‐europeu (IE), que estuda os sons da língua. Em seguida, veremos um pouco de morfologia, o estudo das formas das palavras. A partir deles, você terá uma visão geral de algumas das características linguísticas dessa fascinante e antiga língua. 1 Fonologia do indo‐europeu Conforme Quiles e López‐Menchero (2011), o indo‐europeu seria composto dos seguintes sons: (i) As vogais curtas *[a, e, i, o, u], transcritas, em geral, como *a, e, i, o, u, respectivamente, e suas versões longas *[a:, e:, i:, o:, u:], transcritas como *ā, ē, ī, ō, ū. Existem também ditongos, compostos por essas mesmas vogais: *[ei, oi, ai] transcritos *ei, oi, ai e *[eu, ou, au], transcritos *eu, ou, au. (ii) As consoantes surdas *[p, t, k, kw, s]16 e as sonoras *[b, d, g, gw, l, r, ɾ, m, n, z, j, w]. Há também consoantes aspiradas, surdas [th, kh] e sonoras [bh, dh, gh, gwh], transcritas, respectivamente, como dígrafos th, kh e bh, dh, gh, ch. Em relação às sílabas, o sistema do IE é bastante similar ao latim, ao grego e a muitas línguas modernas: em uma sequência de consoantes e vogais, as vogais constituem o centro da sílaba. Assim (as sílabas foram separadas por um hífen para que você as visualize melhor): O w sobrescrito a um som indica que esse som é labializado; o h sobrescrito a um som indica que esse som é aspirado. 16 120 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG *swe‐sōr, irmã *ne‐wā, novo *skrei‐bhō, escrever *ju‐góm, cabresto A prosódia do IE é semelhante à do latim, à do grego e à do sânscrito: as sílabas são longas ou breves. Línguas como o português, ao contrário, têm como parâmetro sílabas fortes e fracas, isto é, pronunciadas com ênfase ou não. No caso de sílabas longas e breves, estamos falando do tempo gasto para pronunciá‐las. Assim, uma sílaba é longa (ou pesada) se é: (a) constituída de uma vogal longa: *mā‐tēr, mãe *kē‐lā‐jō, esconder (b) constituída de um ditongo: *lai‐wós, esquerda *oi‐nos, um (c) seguida de uma consoante: *korm‐nos, descolorir Por outro lado, uma sílaba é curta (ou leve) se é composta por uma vogal curta ou pelas consoantes r, l, m, n (chamadas de ressonantes) seguidas de vogal ou de uma única consoante: *dre‐pō, cortar *qŗ‐mis, minhoca *e‐í‐mi, ir *cm‐tis, marchar As palavras podem ser acentuadas ou não‐acentuadas. Palavras enclíticas, que formam com a palavra que a precede uma única unidade acentual, por exemplo *‐qe e *‐wē, sempre não‐acentuadas, vêm logo em seguida a uma palavra acentuada. O indo‐europeu tardio (datado de 3500 – 2500 a.E.C, cf. texto 7A), tinha um sistema de acento tônico, com um único acento. Assim, uma sílaba forte tinha um pitch mais alto do que as sílabas ao seu redor. 121 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG É difícil reconstituir o acento tônico do indo‐europeu. Clackson (2007), entretanto, ao comparar línguas europeias, deduz algumas propriedades do sistema de acentuação tônica do indo‐europeu: (i) o acento pode cair em qualquer elemento que funcione como núcleo de sílaba; (ii) o acento pode cair em qualquer sílaba da palavra, no início, no meio ou no fim das palavras ; (iii) nenhuma palavra tem mais de um acento. 2 Morfologia do indo‐europeu Para Meillet (1969), a palavra indo‐europeia compreende três partes: (1) a raiz, que indica o sentido geral da palavra. A maioria das palavras reconstruídas do IE é em forma de raízes. (2) o sufixo, que dá precisão ao valor da palavra; (3) a desinência, que marca o papel da palavra na frase. A raiz de uma palavra é a forma mais simples possível de uma palavra quando se faz uma análise de suas partes. Tal forma contém a ideia principal da palavra em um sentido bem geral. Assim, por exemplo (QUILES; LÓPEZ‐MENCHERO, 2011): 122 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG verbo sí‐stā‐mi eu fico em pé substantivo raiz stā‐mņ, lugar para se ficar em pé ‐stā ficar em pé particípio passado sta‐tós ficado em pé substantivo sta‐tis levantamento O indo‐europeu é considerado uma língua flexional, assim como o português, como foi visto no Texto 4. A flexão é uma mudança na forma da palavra que mostra suas relações gramaticais com os demais elementos da frase. Em português, por exemplo, podemos flexionar o verbo comer: eu como, você come, ele come... Podemos também flexionar um substantivo: menino, meninos, menina, meninas. Veja alguns exemplos do IE: pods, um/o pé; pedós, do pé eimi, eu vou; imés, nós vamos 2.1 Gênero Os gêneros no indo‐europeu tardio eram três: feminino e masculino, relativos aos seres animados, e neutro, relativo aos elementos inanimados. Ao se referir a animados, quando o gênero não é definido, usa‐se o masculino. O gênero neutro não tem ligação com a ausência de sexo, mas sim com a falta de vivacidade (QUILES; LÓPEZ‐MENCHERO, 2011). Abaixo, você verá navio como exemplo de ser animado. Apesar de sabermos que um navio não tem vida e é movido pelo vento, era considerado um ser animado porque se move nas águas. 123 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG Os substantivos animados podem variar bastante em relação ao gênero: (a) formas diferentes: palavras, *patēr/mátēr (pai/mãe); terminações, *ekwos/ekua (cavalo/égua); palavra e terminação, *wīrós/cenā (homem/mulher); (b) gêneros autônomos: *nāus (fem. ‐ navio) *pods (masc. ‐ pé) *jewos (neutro ‐carneiro); (c) um gênero em comum, que pode ser masculino ou feminino, dependendo do contexto: *deuks (líder) *cōus (vaca ou boi) (d) epicenos, que designam os sexos masculino e feminino, mas têm apenas uma forma: *nawāgós (marinheiro) *nemots (inimigo) 2.2 Número Como você já viu no Texto 5, em indo‐europeu tem‐se o singular e o plural. Haveria apenas traços do dual, que indicava, principalmente, dois elementos, no indo‐europeu tardio. É bem provável que o indo‐europeu tardio não tivesse um sistema bem desenvolvido do dual, já que poucas línguas indo‐europeias o mantiveram (indo‐iraniano, grego, balto‐eslavo, céltico). Tudo indica que até para quantificar as partes do corpo, para as quais o dual deveria ser o número mais frequente (duas pernas, duas orelhas, dois olhos, etc), o seu uso era optativo. 2.3 Os substantivos Os substantivos apresentam seis declinações e oito casos (cf. o texto “Sistema de casos”): nominativo, vocativo, acusativo, genitivo, ablativo, dativo, locativo e instrumental. 124 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG Assim: Nom. Voc. Acus. Gen. Abl. Dat. Loc. Instr. QUADRO 1 Desinências nominais Singular Plural Animado Inanimado Animado Inanimado ‐es ‐ā, ‐Ø ‐s, ‐Ø ‐m, ‐Ø ‐e, ‐Ø ‐m ‐ns ‐es, ‐os, ‐s; ‐osjo ‐om ‐es, ‐os, ‐s; ‐ēd, ‐ōd, ‐d ‐bhos (‐mos); ‐om ‐ei ‐bhos; ‐mos ‐i ‐su (‐si) ‐ē, ‐ō; ‐bhi (‐mi) ‐eis; bhis (mis) Fonte: Quiles e López‐Menchero (2011, p. 167) 2.4 Os adjetivos No indo‐europeu, o adjetivo concorda não só em número e gênero, como no português, mas também em caso com o substantivo definido por ele. As terminações mais frequentes são *‐k, ‐t, ‐s, ‐h2, ‐n. Veja um exemplo de Beekes (1995): masculino *neu‐os NOVO feminino *neu‐om neutro *neu‐eh2 125 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG 2.5 Os numerais Além dos numerais cardinais e ordinais, o indo‐europeu também apresenta duas outras formas. As distributivas, que respondem à pergunta “Quantos de uma só vez?”, como *semli, um de cada vez, e *dwisni, dois de cada vez; e os advérbios numerais, que respondem à pergunta “O quão frequente?”, como *dwis, duas vezes, *thris, três vezes. Abaixo, os principais numerais cardinais e ordinais. Compare e veja como a como existe uma grande semelhança entre eles e muitas das línguas atuais: n. 1 2 3 4 5 6 7 8 9 10 QUADRO 2 Números cardinais e ordinais Cardinal n. Ordinal oinos, oinā, oinom prāmos 1º dwōu, dwāi, dwoi ónteros 2º trejes, trja/trī, trísores tritjos 3º qétores qetwŗtos 4º penqe penqtos 5º s(w)eks sekstos 6º septm séptmos 7º oktōu óktōwos 8º newņ neunos 9º dekm dékmtos 10º Fonte: Quiles e López‐Menchero (2011, p. 199) As formas de 11 a 19 são formadas do número mais a palavra dez, *dekm. Assim: 11 = *oinos dekm (1 + 10); 12 = *dwōw dekm (2 + 10), etc. As dezenas são formadas pela unidade mais o sufixo *‐dkmta, grupo de dez: 30 = *trídkmta (3 X 10); 40 = *quatŕdkmta (4 X 10), etc. Já as centenas são formadas pela unidade seguida do sufixo *‐dkmtos. 2.6 Os pronomes Vejamos um sucinto panorama dos principais pronomes do indo‐europeu, de acordo com Quiles e López‐Menchero (2011). (A) Pronomes pessoais 126 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG O indo‐europeu apresenta os seguintes pronomes pessoais: 1ª pessoa: *egō, eu; *wejes, nós 2ª pessoa: *tū, você; *juwes, vocês 127 Como os substantivos, obedecem ao sistema de casos, dependendo de sua função na frase. Entretanto, o IE não apresenta os pronomes de 3ª pessoa, ele/a, eles/as. Para indicar uma 3ª pessoa, pode‐se usar um demonstrativo do tipo este/a/s. A ausência da 3ª pessoa no indo‐ europeu não é um caso único: o anatólico, o lituano, o latim e o grego, em suas atestações mais antigas, também não apresentam esse pronome. Em sentenças com verbos conjugados, que informam a pessoa em sua terminação, o pronome é usualmente omitido, sendo usado apenas para ênfase. (B) Pronomes possessivos Os pronomes possessivos mais antigos teriam sido os seguintes: *mos, meu *ņsmós, nosso *twos, seu (2ª p.) *usmós, seus (2ª p.) *swos, próprio (C) Pronomes demonstrativos Eles variam em gênero (masc., fem., neutro), número (sing. e plural) e obedecem ao sistema de casos. Veja alguns exemplos: *so, este, aquele *is, este aqui, aquele lá (que acaba de ser nomeado) (D) Pronomes interrogativos e indefinidos Há duas formas de pronomes interrogativos em PIE, *qi‐ e *qo‐, que se declinam obedecendo ao sistema de casos. Assim, têm‐se os pronomes interrogativos substantivos *qis? (quem?) e *quid? (o quê?); os pronomes interrogativos adjetivos *qos? (quem deles?) e *qod? (qual deles?) e os pronomes indefinidos *qi‐/qo‐ (alguém, algo). Veja os quadros a seguir: Fundamentos de Linguística comparada / Faculdade de Letras da UFMG QUADRO 3 Pronomes interrogativos do PIE Substantivo Adjetivo qis bhéreti? (quem carrega?) qos wīrós bhéreti? (qual homem carrega?) qid widēseji? (o que você vê?) qom autom widēseji? (qual carro você...?) Fonte: Quiles e López‐Menchero (2011, p. 214) QUADRO 4 Pronomes indefinidos do PIE Substantivo qis (alguém); qid (algo) Adjetivo qos, qā, qod (algum) Fonte: Quiles e López‐Menchero (2011, p. 215) Muitos desses pronomes apresentam‐se em estruturas compostas e têm correlatos, mas não trataremos deles aqui, por ser este um texto apenas introdutório. 2.7 Os verbos Antes de falarmos dos verbos do IE, entendamos o que é uma vogal temática. A vogal temática possibilita a uma palavra receber flexões. Por exemplo, em português temos três vogais temáticas verbais: ‐a‐ como em fum‐a‐r; ‐e‐ como em faz‐e‐mos; ‐i‐ como em constru‐í‐mos (CUNHA; CINTRA, 2001). Em indo‐europeu, elas são, principalmente ‐e‐ e ‐o‐ (mas também ‐i‐, ‐u‐, ‐ā‐, ‐ē‐, entre outras). Os verbos do IE apresentam: (a) duas vozes, ativa e média‐passiva. Elas são equivalentes às vozes ativa e passiva do português, como eu arrastei (voz ativa) e eu fui arrastado (voz passiva). (b) quatro modos: indicativo, imperativo, subjuntivo, optativo. Os três primeiros funcionam como no português e o optativo expressa desejos e expectativas. Eles podem ser resumidos da seguinte forma: 129 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG Função Características QUADRO 5 Os modos dos verbos indo‐europeus Indicativo Imperativo Optativo Ação descrita Comandos Desejos, como um fato expectativas Modo básico, padrão Não é conjugado na 1ª pessoa Elemento temático ‐oi‐ Subjuntivo Ação descrita como teórica Vogal temática ‐e/o‐ Fonte: Quiles e López‐Menchero (2011, p. 254) (c) três aspectos, o presente, para uma ação não completada, o estativo, para o resultado de uma ação e o aorístico, para uma ação já completada; (d) três tempos, presente, passado e futuro, funcionando como no português. Alguns exemplos para os aspectos e os tempos dos verbos no PIE: i. Aspecto presente: presente *deikō (eu mostro, eu estou mostrando); imperfeito *deikom (eu estava mostrando, eu costumava mostrar) ii. Aspecto estativo: perfeito *doika (eu estou no estado derivado do estado de ter sido mostrado) iii. Aspecto aorista: *dikóm (eu mostrei, eu tinha mostrado) (e) primeira, segunda e terceira pessoas, como no português; (f) singular e plural, como no português. Cada forma do verbo finito é composta de duas partes: a raiz, com alguma modificação ou não, e a desinência, que indica modo, tempo e pessoa. Por exemplo: raiz *deik‐ (mostrar) + vogal temática que indica presente *‐e‐ + terminação de 3ª pessoa do singular *‐ti = *déik‐e‐ti (ele mostra) 130 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG 2.7.1 As conjugações No indo‐europeu tardio, os verbos podem ser conjugados em todas as pessoas, tempos, modos e números. Assim, apenas como exemplificação, temos o quadro abaixo de alguns verbos no presente: Número Singular Plural QUADRO 6 Verbos no presente do indicativo ed‐ comer ei‐ ir Pessoa edmi chenmi 1a etsi chensi 2a esti chenti 3a 1a 2a 3a dmes dte denti chņmés chņté chņentí es‐ ser/estar esmi esi esti smes ste senti Fonte: Quiles e López‐Menchero (2011, p. 239) Veja, também, a título de exemplificação, o verbo loutum, lavar, sendo conjugado no presente do indicativo, voz ativa (raiz low + vogal tem. ‐o‐): Número Singular Plural QUADRO 7 O verbo loutum, lavar, no presente do indicativo, voz ativa Pessoa Indicativo Subjuntivo Optativo Imperativo lowō lowō lowoim ‐ 1ª lówesi lówēsi lowois lowe 2ª lóweti lówēti lowoit lówetōd 3ª lowomos lowōmos lówoime ‐ 1ª lówete lówēte lówoite lówete 2ª lowonti lowonti lowoint lówontōd 3ª Fonte: Quiles e López‐Menchero (2011, p. 263) 2.8 Os advérbios Os advérbios são formados no IE a partir de substantivos, de pronomes e de adjetivos. Veja alguns exemplos: *dē, de cima > *imde, dali *dhē‐, colocar, lugar > *idhei, lá 131 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG 2.9 As preposições Originalmente, as preposições vinham pospostas ao nome ou ao verbo. Aqui temos alguns exemplos: *ad‐, para, perto (> latim ad, gótico at) *ektós, exceto *meta, entre, com (> grego méta) *pósteri, depois 2.10 Conjunções As conjunções, que conectam palavras, frases ou sentenças, pertencem a dois grandes grupos: (A) Coordenadas. Alguns exemplos: *‐qe, e *auti, ou *tori, assim *toqe, também (B) Subordinadas. Alguns exemplos: *jod/qod, que *ei, nesse caso *eti, mesmo que *jodqid, porque 2.11 Interjeições As interjeições são exclamações que denotam dor, medo, surpresa... Eis alguns exemplos (BEEKES, 1995): *ai, surpresa, dó (> lituano aĩ, ai) *bheu, dor (> grego phũ, latim fũ) 132 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG *eheu, reclamação (> sânscrito aho) *ha ha, riso (> russo xa xa) 3 As sentenças do IE A ordem fundamental do indo‐europeu é OV, isto é, o(s) objeto(s) do verbo (seu(s) complemento(s)) o antecedem. Como os linguistas podem fazer tal afirmação? A base está em atestações em textos antigos dos dialetos indo‐europeus também mais antigos, como o védico, o hitita e o tocariano. Entretanto, muitas outras línguas apresentam essa ordem, como, por exemplo, o turco (LEHMANN, 1974, cap. 1): köpeǧi gördü viu‐ele o‐cachorro Ele viu o cachorro. No caso de verbos intransitivos, o sujeito e expressões de tempo, lugar e modo são opcionais. Já os verbos transitivos demandam, obrigatoriamente, um objeto (LEHMANN, 1974, cap. 2). As sentenças nominais são compostas de um substantivo ligado a outro substantivo, a um adjetivo ou outra partícula, sem a presença de um verbo. Terminamos aqui esta visita panorâmica à fonologia e à morfologia do indo‐europeu. Referências BEEKES, Robert. Comparative Indo‐European Linguistics. Amsterdam/Philadelphia: Jonh Benjamins, 1995. CLACKSON, James. Indo‐European Linguistics. Cambridge: CUP, 2007. CUNHA, Celso; CINTRA, Lindley. Nova gramática do português contemporâneo. Rio de Janeiro: Nova Fronteira, 2001. LEHMANN, Winfred. Proto‐Indo‐European Syntax. 1974. Disponível em: <http://www.utexas.edu/cola/centers/lrc/books/pies00.html>. Acesso em: 20 out. 2011. MEILLET, Antoine. Les dialectes indo‐européenes. Paris: Payot, 1969. QUILES, Carlos; LÓPEZ‐MENCHERO, Fernando. A grammar of Modern Indo‐European. Versão 5.0. 2011. Disponível em: <http://dnghu.org/en/indo‐european‐language‐grammar/>. Acesso em: 20 out. 2011. 133 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG O SISTEMA DE CASOS Aléxia Teles Duchowny e Jacyntho Lins Brandão (Fale/UFMG) Observe a frase abaixo, de uma língua não indo‐europeia, o turco: KITAP MASA ÜZERINDE livro mesa sobre O livro está sobre a mesa. Nesse exemplo, não se usa uma preposição, mas uma posposição – üzerinde, ‘sobre, em cima de’. Mas nem sempre preposições ou posposições são necessárias, pois há línguas em que a palavra recebe uma terminação que já expressa diferentes categorias gramaticais, como sujeito, objeto, adjuntos e complementos adverbiais e adnominais – e assim por diante. Isso é o que se chama de Sistema de casos. No húngaro, por exemplo, uma palavra pode receber até dezoito terminações para expressar que está na função de sujeito (caso nominativo), objeto direto (acusativo), beneficiário da ação (dativo), adjunto ou complemento circunstancial indicando ‘lugar onde’ (inessivo), ‘lugar para onde’ (alativo), ‘lugar de onde’ (ablativo) etc. Na frase “o livro está sobre a mesa”, a palavra que, em húngaro, significa ‘mesa’, asztal, receberá a terminação ‐on do caso supressivo (que indica ‘lugar sobre’), assumindo então a forma asztal‐on, ‘sobre a mesa’: A KÖNYV AZ ASZTALON 17 DET livro DET mesa‐SUP18 O livro está sobre a mesa. VAN está. Como asztalon já significa ‘sobre mesa’, estando determinado pelo artigo az19 – o que faz com que az asztalon signifique ‘sobre a mesa’ – não há necessidade de acrescentar uma preposição para indicar ‘sobre’. 17 Determinante: Itens que acompanham os susbstantivos e que exprimem quantidade, número, entre outros. SUP = supressivo. Indica que algo está sobre um determinado lugar. 18 134 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG Agora preste atenção: as línguas indo‐europeias como o português, o espanhol, o francês e o italiano não conhecem flexão de caso e o inglês marca apenas o genitivo, que expressa o possuidor; já o grego, o latim, o alemão e o russo, sim, como se pode constatar abaixo: Latim Liber livro‐NOM super sobre mensam mesa‐AC est. está. Russo Kniga livro‐NOM na sobre stolie. mesa‐PREP Grego Tò biblíon epì têi trapézēi DET‐NOM livro‐NOM sobre DET‐DAT mesa‐DAT estí. está. Alemão Das Buch ist auf dem Tisch. DET‐NOM livro está sobre DET‐DAT mesa. Observe: (a) O latim e o russo declinam cada um dos substantivos: ‘livro’, por ser sujeito das orações, encontra‐se no nominativo (que indicamos com a sigla NOM); ‘mesa’, como complemento circunstancial de lugar, construído com as preposições que significam ‘sobre’, apresenta‐se, em latim, no acusativo (AC), que nesta língua inclui o sentido de locativo (‘lugar onde’), e, em russo, no prepositivo (PREP), que tem também a função de expressar o locativo. (b) O grego declina tanto os artigos quanto os substantivos, sendo que o locativo se inclui no caso dativo (DAT). (c) O alemão declina apenas os artigos, permanecendo os substantivos sem modificação – também nesta língua o dativo (DAT) expressa o locativo. 19 O artigo determinado do húngaro apresenta apenas uma forma (como acontece em inglês): a; se, contudo, ele ocorre antes de palavras começadas com vogal, aparece como az. Repare no nosso exemplo: a könyv, ‘o livro’; az asztal, ‘a mesa’. 135 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG O mais importante, contudo, é perceber como existe, nas quatro línguas, uma sobrecarga de marcas. Ainda que haja declinação dos nomes e/ou dos artigos, usam‐se também preposições. Uma razão para isso é que, nelas, os casos não são tão específicos quanto no húngaro, em que a terminação ‐on indica apenas ‘lugar sobre onde’, havendo outros casos para o ‘lugar onde’, ‘lugar para onde’ etc. De fato, em grego e alemão, o dativo serve tanto para indicar ‘lugar onde’, quanto o objeto indireto, dentre outras funções, o mesmo acúmulo de funções variadas acontecendo com o acusativo latino e com o prepositivo do russo. É por isso que as preposições se tornam indispensáveis e são elas que terminam por reger o caso dos nomes com os quais constituem sintagmas. De um certo modo, essa sobrecarga (preposição + declinação) tende a fazer com que a declinação de artigos e nomes termine por desaparecer em muitas línguas, como ocorreu com a românicas, que procedem do latim, e também com o inglês, que conservou, do germânico, apenas um caso, o genitivo, para indicar o possuidor (Rose’s book, ‘livro da Rose’). Vejamos mais quatro exemplos. (1) O basco O sintagma nominal ETXEA, “a casa”, tem toda uma série de formas casuais diferentes. 136 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG Observe: Nome Absolutivo Ergativo Dativo Genitivo Instrumental Comitativo Locativo Ablativo Alativo Forma ETXEA ETXEAK ETXEAKI ETXEAREN ETXEAZ ETXEAREKIN ETXEAN ETXEATIK ETXEARA Função/sentido Sujeito intransitivo, objeto direto Sujeito transitivo Para a casa (relação abstrata) Da casa (possuidor) Por meio da casa Com a casa Na casa (localização) De/para fora da casa Para a casa (movimento) Como se pode ver, as modificações formais que afetam o nome, em geral na sua parte final, servem para indicar sua função na frase. Assim, caso também pode ser entendido como a categoria gramatical pela qual a forma de uma palavra varia por razões gramaticais e/ou semânticas. (2) O latim > o português Em latim havia seis casos: nominativo, acusativo, dativo, genitivo, ablativo, vocativo. Na evolução do latim para o português, deu‐se uma redução gradual das formas casuais, até subsistir uma única, que normalmente corresponde à do acusativo no singular e no plural. Veja: Caso acusativo singular plural singular plural singular plural singular plural Latim rosa‐ rosas lupu‐ lupos ave‐ aves flore‐ flores Português rosa rosas lobo lobos ave aves flor flores O português tem casos apenas marginalmente, porque alguns pronomes pessoais fazem distinções casuais para fins gramaticais, como EU/ME, ELA/A: Ela me viu; Eu a vi. Na primeira frase, o pronome da terceira pessoa do singular feminino aparece sob a forma ela porque tem função de sujeito; na segunda frase, sua forma é a porque tem a função de 137 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG complemento do verbo ver. Podemos fazer paralelo semelhante com o pronome da primeira pessoa do singular: com função de sujeito, aparece sob a forma eu; com função de complemento do verbo, tem a forma me. É muito comum um mesmo caso cobrir mais de uma função sintática. Exemplos do português: 1a ‐ A mãe encontrou [as crianças] na escola. (função de objeto = caso acusativo) 1b ‐ A mãe encontrou‐as na escola. (função de objeto = caso acusativo) 2a ‐ Deixa vir a mim [as crianças]. (função de sujeito = caso acusativo) 2b ‐ Deixa [as crianças] vir a mim. (função de sujeito = caso acusativo) 2c ‐ Deixe‐as vir a mim. (função de sujeito = caso acusativo) 3a ‐ A Maria entregou o livro para [mim]. (função de objeto indireto = caso dativo) 3b ‐ A Maria fez palhaçadas para [eu] rir. (função de sujeito = caso nominativo) 3c ‐ Maria fez palhaçadas para [mim] rir. (função de sujeito = caso dativo) 4a ‐ [As flores] surgem na primavera. (função de sujeito = caso nominativo) 4b ‐ No início tudo são [flores]. (função de predicativo do sujeito = caso nominativo) A partir dos dados acima, notamos que um mesmo caso pode estar correlacionado com mais de uma função sintática. Pode‐se concluir que caso e função sintática não precisam necessariamente manter uma relação biunívoca no componente sintático da gramática. Assim sendo, o acusativo pode, por exemplo, cobrir simultaneamente as funções sintáticas de objeto e de sujeito. Já o dativo pode referir‐se simultaneamente às funções sintáticas de objeto indireto e de sujeito. O nominativo pode assinalar as funções sintáticas de sujeito e de predicativo do sujeito. 138 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG (3) Inglês O único caso marcado é o genitivo. Ex.: boy / boy´s (´menino´/´do menino´) Todas as demais formas não apresentam sufixos, sendo que as noções de caso são expressas por: ‐ preposições: with the boy / to the boy (´com o menino´/´ao menino´) ‐ ordem das palavras: cat chases mouse / mouse chases cat (´gato caça rato´/´rato caça gato´) (4) Sânscrito Os casos gramaticais foram analisados extensivamente em sânscrito. O gramático Panini, por volta do século IV a.E.C., identificou seis papéis semânticos ou karaka, relacionados a sete casos ‐ nominativo, acusativo, instrumental, dativo, ablativo, genitivo, locativo. Os seis karaka são: • agente (kartri, relacionado ao nominativo) • paciente (karman, relacionado ao acusativo) • meio (karaṇa, relacionado ao instrumental) • recipiente (sampradāna, relacionado ao dativo) • fonte (apādāna, relacioando ao ablativo) • locus (adhikaraṇa, relacionado ao locativo) Por exemplo: vrikśh[at] parṇ[am] bhūm[au] patati [da] árvore uma folha [até] o chão cai ʺuma folha cai da árvore até o chãoʺ As declinações correspondentes estão refletidas nos morfemas ‐am, ‐at, ‐au respectivamente: Folha = agente ‐ declinação: ‐am Árvore = fonte ‐ declinação: ‐at Chão = locus ‐ declinação: ‐au 139 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG *** Em outras palavras, casos são formas distintas que um nome ou um pronome pode apresentar segundo a sua função sintática20. O indo‐europeu, as antigas línguas indo‐ europeias e algumas línguas IE modernas apresentam o sistema de casos. Os termos que designam os casos21 têm um valor geral apenas indicativo. Os valores mais específicos serão encontrados nas gramáticas particulares de cada língua. Uma língua que tenha casos precisa ter pelo menos duas formas casuais, como o masai. A maioria das línguas com casos têm de três a seis deles. Mas algumas, como o basco e o finlandês, têm doze, o húngaro tem vinte! O comportamento funcional dos casos é também variável: um mesmo caso pode, em uma mesma língua, corresponder a usos diversos, da mesma forma que é às vezes impossível estabelecer uma fronteira rígida entre dois casos diferentes de uma mesma língua. Referências BRANDÃO, Jacyntho L. Texto 1; O que é linguística comparada? Apostila de Fundamentos de Linguística comparada. Belo Horizonte: Faculdade de Letras da UFMG, 2011. p. 7. (Mimeografado). CRYSTAL, David. Dicionário de Linguística e fonética. Rio de Janeiro: Jorge Zahar, 1988. DUARTE, Fábio B. Caso, função sintática e papéis temáticos. In: Revista Duc In Altum, Muriaé, Faculdade Santa Marcelina, v. 6, n. 1, p. 2006. MATTOSO CÂMARA Jr., J. Dicionário de filologia e gramática. Rio de Janeiro: J. Ozon, 1968. MOUNIN, Georges. Dictionnaire de la linguistique. Paris: PUF, 1993. TRASK, R. L. Dicionário de linguagem e linguística. São Paulo: Contexto, 1998. 20 Acontecem em línguas flexionais, nas quais os morfemas são apresentados por afixos. Veja o Texto 4, “Tipologia linguística”. 21 São muitos os casos gramaticais. Apenas a título de curiosidade: abessivo, ablativo, absolutivo, acusativo, adessivo, alativo, comitativo, delativo, dativo, elativo, ergativo, essivo, genitivo, ilativo, inessivo, instrumental, instrutivo, lativo, locativo, nominativo, oblíquo, partitivo, pegativo, prolativo, reto, superessivo, separativo, transitivo, translativo, vocativo. 140 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG A CATEGORIA DE CASO NO INDO‐EUROPEU Jacyntho Lins Brandão (Fale/UFMG) Podemos definir caso em dois sentidos: (a) como as funções que uma palavra assume numa estrutura sintática (sujeito, objeto etc.); (b) como a forma assumida por determinada palavra, que a vincula ao exercício de determinadas funções sintáticas (nominativo, acusativo, etc.). Neste último sentido, que é o que nos interessa do ponto de vista morfológico, registram‐ se duas maneiras de marcação de caso: a) sob a forma de declinação, ou seja, pelo acréscimo de afixos à palavra; b) pela existência de séries supletivas. Assim, em português os pronomes pessoais apresentam diferenciação de caso pelo uso de formas supletivas, de acordo com a seguinte distribuição: QUADRO 1 Formas supletivas dos pronomes pessoais em português nos casos reto e oblíquo Pessoas Caso reto (função de Caso oblíquo (demais funções) sujeito) Formas átonas Formas tônicas singular 1ª. pessoa eu me mim/eu 2ª. pessoa tu/você te/o/a/lhe ti/você/tu 3ª. pessoa ele/ela o/a/lhe ele/ela plural 1ª. pessoa nós/a gente nos nós/a gente 2ª. pessoa vós/vocês vos/lhes vós/vocês 3ª. pessoa eles/elas os/as/lhes eles/elas A primeira pessoa apresenta a distribuição mais conservadora, mantendo as duas raízes existentes também em outras línguas indo‐europeias, a saber: A forma “eu” é exclusiva do sujeito (‘eu corro/eu te amo’), sendo que seu uso como objeto direto parece restrito a registros peculiares (há alguns anos fez sucesso uma canção que dizia “leva eu, minha saudade”, correspondente a “me leva, minha saudade”). Uma oração como ’ela gosta de eu’ seria sentida como agramatical ou, pelo menos, não usual por falantes do português, pois se esperaria ‘ela gosta de mim’. A alternância entre a 141 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG função de sujeito (nominativo) e os demais casos se expressa bem na oposição entre ‘eu te amo’ / ’ela me ama’ / ’ela gosta de mim’. Observando‐se o quadro acima, percebe‐se que há, no português contemporâneo, possibilidades variadas, algumas compreendendo a neutralização das séries supletivas, como, por exemplo, com relação à segunda pessoa. Imagine que estamos dizendo a Maria que Pedro a ama. As possibilidades, nas diversas situações possíveis no diassistema do português brasileiro, seriam: ‘ele te ama’/’ele a ama’/’ele ama você’/’ele lhe ama’. Mais estranha e, em certa medida, percebida como agramatical, seria uma construção como ’ele ama tu’, embora, também no campo da música popular, tenha feito sucesso uma canção que dizia “passei a noite procurando tu, procurando tu, procurando tu”, em que o uso de ‘tu’ (caso reto/nominativo) como objeto direto (caso oblíquo/acusativo) produzia efeito justamente pelo que teria de inusual e pela rima que a repetição do sintagma propiciava, reforçando‐o. É preciso considerar que esse tipo de neutralização se observa mesmo em línguas que contam com um sistema de flexão de casos (declinação), o nominativo podendo, ainda que em exemplos que são um tanto raros, ocupar posições em que se esperariam outros casos. Isso indica que, em geral, se trata de um caso não‐marcado. Se, em português, ‘eu passei a noite procurando tu’ é uma construção possível, o mesmo não se diria de *’me passei a noite procurando tu’. Do mesmo modo, se ‘ele ama ela’ é uma forma corrente, alternando com ‘ele a ama’, *’o a ama’ é inadmissível e ‘o ama ela’ equivale a ‘ela ama ele’ ou ‘ama‐o ela’, em que ‘ela’ chama para si a função de sujeito, mesmo estando depois do verbo. Os últimos exemplos mostram que, ocorrendo neutralização das formas supletivas, a posição dos termos da oração torna‐se responsável pela marcação de caso, situando‐se o sujeito, em português, antes do verbo e o objeto depois, ou seja, há uma ordem estabelecida Sujeito‐Verbo‐Objeto (SVO): assim, ‘ele ama ela’ (= ‘Pedro ama Maria’) é diferente de ‘ela ama ele’ (= ‘Maria ama Pedro’), sendo marcado como sujeito o termo que se põe antes do verbo e como objeto o que aparece depois. Não ocorrendo a neutralização, 142 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG a ordenação dos termos torna‐se menos rígida. Assim, em ‘ela lhe disse palavras de amor’/’disse‐lhe ela palavras de amor’/’lhe disse ela palavras de amor’, o pronome ‘ela’ (caso reto/nominativo) mantém sempre a função de sujeito, enquanto ‘lhe’ (caso oblíquo/dativo) conserva também sempre a função de objeto indireto, com base no contraste provido pelas duas formas supletivas. Tomemos mais um exemplo. Em francês, diferentemente do que acontece em português, o pronome relativo apresenta duas formas, a saber: qui (nominativo < nominativo latino qui) e que (acusativo < acusativo latino quem). Portanto, enunciados como ‘o homem que me viu é meu amigo’ (em que o pronome ‘que’ exerce a função de sujeito, já que foi ele que me viu) e ‘o homem que eu vi é meu amigo’ (em que o pronome ‘que’ tem a função de objeto direto, já que fui eu que vi o homem) se dirão assim: QUADRO 2 Formas de nominativo e acusativo do pronome relativo em francês Função do Pronome Exemplos pronome relativo l’homme qui m’a vu est mon ami / o homem que me viu é meu Sujeito qui amigo l’homme que j’ai vu est mon ami / o homem que eu vi é meu Objeto direto que amigo 1 O indo‐europeu A categoria gramatical de caso parece ter sido morfologicamente marcada através de sufixos no indo‐europeu, pelo menos no estágio até onde é possível reconstituir essa protolíngua. Como sempre, isso se deduz pela situação das diferentes línguas que dela provêm, admitindo essas, numa distribuição bastante variada, desde a ausência de marcações de casos, quanto a flexão do substantivo e de seus determinantes em até oito casos, a saber: Nominativo: é o caso próprio do sujeito, como no seguinte exemplo do latim: Petrus amat Mariam (Pedro ama Maria), em que a terminação –us indica que Petrus exerce a função de sujeito do verbo amat (ama), independentemente da ordem dos termos, pois, sem alteração 143 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG de sentido, se poderia dizer Petrus Mariam amat/Mariam Petrus amat/Mariam amat Petrus etc.; Acusativo: o caso do objeto direto, ou seja, do complemento de um verbo transitivo, papel exercido no exemplo acima por Mariam, que recebe a terminação –am por exercer a função de objeto direto – caso fosse Maria que amasse Pedro, então os papeis se inverteriam e Petrus assumiria a forma do acusativo: Maria Petrum amat (Maria ama Pedro); Dativo: marca o objeto indireto, ou seja, o beneficiário da ação expressa pelo verbo, como, ainda em latim, Maria librum Petro dat (Maria dá um livro para Pedro), em que a terminação –a indica que Maria é o sujeito, a terminação –um, que librum é o objeto direto, e a terminação –o, que Petro constitui o objeto indireto, a ordem dos termos da oração podendo variar sem alteração do sentido; Genitivo: indica posse ou o determinante nominal de um outro nome, como nos exemplos, também do latim, domus Petri (casa de Pedro)/domus Mariae (casa de Maria), ou, no inglês, Peter’s house (casa de Pedro) – o que equivale à anteposição ao nome das preposições ‘de’ (em português, espanhol, francês etc.), di (italiano), of (inglês), von (alemão) etc.; Ablativo: indica procedência, como, de novo em latim, Roma venio (venho de Roma) – essa relação é expressa em português, espanhol e francês também pela preposição ‘de’ (venho do Rio de Janeiro/vengo de Madrid/je viens de Paris), mas, em italiano, por uma preposição diferente, ou seja, da (vengo da Roma), do mesmo modo que, em inglês, por from (I come from New York) e, em alemão, por aus (Ich komme aus Berlin) etc.; Locativo: indica o lugar onde, sem ideia de movimento, como, em russo, dieti v shkolie (as crianças [estão] na escola) – no português, essa função se expressa com a preposição em; Instrumental‐associativo: cobre a esfera expressa, em português, pela preposição com (eu escrevo com a caneta/eu passeio com meu amigo), como no exemplo do russo, ia nishu karandashom (eu escrevo com o lápis); 144 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG Vocativo: marca o chamamento, a invocação, como, em latim: Petre, amas Mariam? (ó Pedro, amas Maria?). No quadro a seguir, você encontra indicados os casos em que os nomes e seus determinantes são regularmente flexionados em algumas línguas indo‐europeias de diferentes grupos, embora nem todas apresentem flexão para todos esses casos: QUADRO 3 Casos morfologicamente marcados, através de flexão, em algumas línguas indo‐europeias Nom. Acus. Gen. Dativo Ablat. Locat. Instr. Vocat. Hitita x x x x x x Sânscrito x x x x x x x x Persa antigo x x x x x x x x Armênio x x x x x x x Lituano x x x x x x x Russo x x x x x x Albanês x x x x x Grego antigo x x x x x Grego moderno x x x Alemão x x x x Inglês x Irlandês x x x x Latim x x x x x x Romeno x x x Esse levantamento é bastante representativo na medida em que as línguas tomadas como exemplos pertencem a diferentes ramos do indo‐europeu: anatólio (com o hitita), indo‐ iraniano (com o sânscrito e o persa antigo), báltico (com o lituano), eslavo (com o russo), germânico (com o alemão e o inglês), celta (com o irlandês), itálico (com o latim e o romeno), armênio, albanês e grego. Entretanto, quanto mais se avança para a esquerda menos regular se torna a marcação morfológica de caso, como no exemplo extremo do inglês que conserva apenas o genitivo morfologicamente marcado. No quadro abaixo, que toma como referência o pronome demonstrativo masculino, você poderá observar como a marcação se processa: 145 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG QUADRO 4 Declinação do pronome demonstrativo ’esse’ (em latim) e ‘este’ (nas demais línguas) Casos Sânscrito Russo Latim Grego Alemão antigo Nominativo (este/esse) eshaḥ etot iste hoûtos dieser Acusativo (este) etam etogo istum toûton diesen Genitivo (deste) etasya etogo istīus toútou dieses Dativo (a este) etasmai etomu istī toútōi diesem Ablativo (deste) etasmāt istō Locativo (neste) etasmin etom Instrumental (com este) etena etim Você pode se perguntar como procedem as línguas que não apresentam flexão para todos os casos, a resposta sendo muito simples: apelam elas para o uso de preposições. No sânscrito não há necessidade de preposições, pois os sete casos se encontram sistematicamente marcados. Nas demais línguas a situação relativa aos casos que não têm flexão própria apresenta‐se assim: (a) utilizam‐se preposições; (b) cada preposição pede um dos casos flexionados, o que se chama regência da preposição: QUADRO 5 Preposições que suprem a flexão de casos e sua regência em grego, russo, alemão e latim Preposições que expressam o sentido dos casos não flexionados Ablativo Locativo Instrumental Regência das (lugar de onde) (lugar onde) (com quê) preposições grego russo alemão grego alemão latim grego alemão latim Genitivo ek/apó iz/ot Dativo aus en in sún mit Ablativo in cum Há duas formas de considerar essa situação: (a) na primeira, própria da reconstituição tradicional do indo‐europeu, conforme a formulação de Brugmann, considera‐se que a protolíngua apresentaria os oito casos conservados em sânscrito e o processo de mudança nas línguas dela derivadas seria constituído por uma simplificação da flexão nominal; (b) a segunda, assumida por autores como Adrados, Liébana, Gamkrelidze e Ivanov, ensaia matizar as diferentes fases do indo‐europeu desde um possível estágio não‐flexionado, para tentar entender como se processa a criação da flexão nominal de caso. É esta última hipótese que seguiremos. 146 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG 2 A criação das oposições de caso Partindo‐se da hipótese bastante razoável de que o indo‐europeu tenha conhecido uma fase não‐flexionada, as primeiras oposições morfologicamente marcadas de caso, ou seja, a primeira flexão criada para os nomes, com o acréscimo de desinências ao radical, parecem ter sido as relativas ao genitivo e ao acusativo. Isso se constata, antes de tudo, pela existência de terminações para os dois casos que se registram nos vários grupos da família indo‐europeia, o que testemunha em favor de sua antiguidade. Essas terminações seriam *‐(o)s para o genitivo e *‐(o)m para o acusativo. Importante é observar que, com relação ao primeiro, se trata de estabelecer a relação entre o determinante e o determinado no sintagma nominal (‘casa de Pedro’ ou ‘casa de pedra’), enquanto com relação ao segundo a relação entre determinante e determinado diz respeito ao sintagma verbal (‘vi Pedro’ ou ‘vi a casa’). Noutros termos: é razoável admitir que a flexão se tenha iniciado para marcar as relações sintáticas nesses dois pontos mais básicos dos enunciados. Antes da criação do sistema de flexão nominal, é natural supor que o indo‐europeu contasse com outros recursos para marcar as referidas funções, como a ordem dos termos, a entonação, a variação do acento etc. Em especial a ordem dos termos se mostra bastante eficaz para exprimir relações sintáticas, como você sabe que acontece em português com relação ao verbo e o objeto (VO). No que diz respeito ao sintagma nominal, também a ordem dos termos pode ser significativa por si, como nos exemplos, também do português, ‘palavra‐chave’, ‘cidade‐estado’, ‘homem‐bomba’, ‘operação limpeza’ (ordem Determinado‐Determinante), em que apenas o fato de um substantivo vir justaposto e após outro já cria a relação de determinação (observe‐se que nem mesmo é necessário proceder a concordância de número: ‘palavras‐chave’, ‘cidades‐estado’ etc.). No caso do indo‐europeu, ainda que seja impossível saber com certeza os recursos que permitiriam expressar as relações sintáticas antes da criação da flexão, a ordem dos termos parece ter sido significativa, com o determinante precedendo o determinado, no caso dos sintagmas nominais, como sugerem alguns nomes compostos de diversas línguas: 147 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG QUADRO 6 Nomes compostos e ordenação dos elementos envolvidos na composição Língua Composto Significado Elementos de composição Determinante Determinado Sânscrito mahādevá‐ ‘grande deus’, mahā‐, ‘grande’ devá‐, ‘deus’ ‘Shiva’ svásthāna‐ ‘terra natal’ svá‐, ‘seu, sua’ sthāna‐, ‘terra’ Grego akrópolis ‘cidadela, cidade ákro‐, ‘alto’ pólis, ‘cidade’ alta’ rhododáktulos ‘de dedos róseos’ rhodo‐, ‘rosa’ dáktulos, ‘dedo’ Gótico armahaírts ‘misericordioso’ arma‐, ‘piedade’ haírts, ‘coração’ Latim misericordĭa ‘misericórdia’ miser‐, cord‐, ‘coração’ ‘desventurado’ Russo polovod’e ‘enchente’ pol‐, ‘cheio’ vod’‐, ‘água’ 2.1 Emergência do “relacionador” do sintagma nominal (genitivo) Nesse contexto em que os itens lexicais se organizam nos sintagmas sem marcas morfológicas de classe ou de caso, sendo provável que não existisse diferença entre substantivos e adjetivos (o adjetivo sendo o determinante nominal por excelência), a terminação *–os/es/s começa a ser usada para relacionar dois nomes, constituindo pares de oposição entre um caso não marcado (o do determinado) e um caso marcado por sufixo (o do determinante), como nos seguintes exemplos de genitivos: grego pod‐ós, latim ped‐is, sânscrito pad‐ás (‐as < *‐os), ‘do pé’; hitita nepiš‐aš (‐aš < *‐os), ‘do ceu’. Parece que essa terminação aplicava‐se tanto ao singular quanto ao plural, antes que fosse criada uma flexão própria de número, tanto que, em hitita, encontramos, como genitivo singular e plural de uddar, ‘palavra’, o termo flexionado uddanaš. Ora, é curioso que haja ainda uma segunda terminação de genitivo atestada nas línguas indo‐europeias: *‐ŏm. Também esta parece servir tanto para o singular quanto para o plural, como encontramos, ainda em hitita, antuhšan (‐an < *‐ŏm), ‘de uma pessoa’, ao lado do latim pedum (< *pedŏm), ‘dos pés’, e do antigo eslavo eclesiástico imenŭ (‐ŭ < *‐ŏm), ‘dos nomes’. Parece que, inicialmente, a distribuição entre as duas terminações deveria ter relação com o gênero de cada palavra, os nomes animados recebendo a terminação *‐os e os inanimados a terminação *‐ŏm. 148 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG Posteriormente, com o acréscimo a esta última terminação (*‐ŏm) da desinência de plural *‐ s (*‐oms > *ōm), a mesma se teria especializado para expressar a ideia apenas de genitivo plural, como encontramos no grego pedōn, ‘dos solos’, sânscrito padām, ‘dos pés, dos passos’, lituano vilkų (‐ų < *‐ōm), ‘dos lobos’ (cf. Gramkrelidze; Ivanov, 1995, p. xx). Declinar uma palavra é, no fundo, mudar‐lhe a classe. Assim, os substantivos na forma do genitivo (expressando uma relação que, em português, estabelecemos com a preposição ‘de’) correspondem a adjetivos, classe de palavras que se define enquanto determinantes de nomes. Quando dizemos ‘coração de pedra’, ‘de pedra’ constitui uma locução adjetiva, tanto que poderia ser substituído por um verdadeiro adjetivo, ‘coração pétreo’. É razoável supor, como o faz Villar Liébana (1974, p. 251‐262), que os nomes flexionados no genitivo estejam na origem da classe dos adjetivos do indo‐europeu: quando o grego opõe, por exemplo, o nominativo kuon (cão) ao genitivo kunós, esta última palavra assume uma função adjetiva (‘mordida de cão’ ou ‘mordida canina’). 2.2 A emergência da marca de determinante do sintagma verbal (acusativo) Como você já sabe, o acusativo é o caso próprio do objeto. Portanto, quando um nome recebe o sufixo próprio deste caso, isso indica tratar‐se de um determinante do verbo, como quando digo ‘eu como pão’, em que ‘pão’ determina o verbo ‘comer’ (não se trata de comer ‘carne’, ‘frutas’ ou seja lá o que for, mas ‘pão’). Parece que, paralelamente à criação do morfema de genitivo, o estabelecimento de uma marca morfológica para o acusativo se deu numa fase muito arcaica do indo‐europeu, anterior a sua separação em diferentes dialetos e línguas. O indício mais importante para chegar‐se a essa conclusão é que o acusativo apresenta, nos vários ramos do indo‐europeu, uma terminação bastante regular, com uma consoante nasal (‐m/‐n), como se pode constatar no quadro seguinte: 149 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG Casos Nominativo Acusativo QUADRO 7 Exemplos da oposição nominativo/acusativo Sânscrito Grego Latim Gótico vŗkah (lobo) lúkos (lobo) lupus (lobo) hana (galo) vŗkam lúkon lupum hannan Hitita ginuš (joelho) ginun Se você não esqueceu que o gênero neutro corresponderia a palavras do tipo inativo, ou seja, que não poderiam exercer a função de sujeito de verbos ativos, é importante agora observar que esses nomes, no sânscrito, no grego, no latim e no hitita, têm como característica, na declinação temática, o fato de que o nominativo termine com uma –m ou –n, bastando observar de novo a distribuição de gênero nos adjetivos: Língua Sânscrito Grego Latim QUADRO 8 Masculino, feminino e neutro nos adjetivos Masculino Feminino Neutro kântah (amado) kântâ kântam ponerós (infeliz) ponerá ponerón bonus (bom) bona bonum Assim, podemos dizer que, na origem, acrescentar a um termo ativo o sufixo de acusativo equivaleria a mudá‐la de classe, para indicar que, naquela situação, ela passará a exercer a função sintática própria dos nomes inativos, ou seja, a de objeto. 2.3 Os outros casos No que diz respeito aos outros casos, é difícil descobrir padrões comuns que se apliquem ao conjunto do indo‐europeu, parecendo antes que os elementos morfológicos são mais recentes, tendo sido criados já numa fase de dialetação, cada grupo gramaticalizando certos morfemas para expressar outras relações sintáticas. É razoável supor ainda que alguns ramos do indo‐europeu levaram mais longe a tendência a criar marcas nominais de caso, como o indo‐iraniano e o eslavo, outros fazendo‐o menos, como o germânico e o grego. No caso desta última língua, é provável que alguns sufixos locativos estivessem em vias de gramaticalizar‐se como autênticas desinências, como os sufixos ‐then para expressar o ablativo (lugar de onde) e ‐de para o 150 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG alativo (lugar para onde) – como em oíkothen (de casa) e oíkade (para a casa) –, o que todavia não aconteceu, mantendo‐se eles apenas como formadores de alguns advérbios. Referências GAMKRELIDZE, Thomas V.; IVANOV, Vjačeskav V. Ivanov. Indo‐European and the Indo‐Europeans. Berlin/New York: Mouton de Gruyter, 1995. Localização na biblioteca: 491 G747i.In 1995 (FALE) RODRÍGUEZ ADRADOS, Francisco. Lingüística indoeuropea. Madrid: Gredos, 1975. Localização na biblioteca: 491 A242l 1975 (FALE) VILLAR LIÉBANA, Francisco. Origen de la flexión nominal indoeuropea. Madrid: Instituto Antonio de Nebrija, 1974. Localização na biblioteca: 491 V719o 1974 (FALE) 151 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG CONTATO LINGUÍSTICO Sueli Maria Coelho (Fale/UFMG) INTRODUÇÃO Você já observou como pessoas que convivem de uma forma bastante próxima, tais como amigos ou mesmo colegas de escola ou de trabalho, tendem a empregar determinadas palavras ou expressões em comum? Isso se dá porque, no processo de comunicação entre os membros de uma comunidade, existe uma interação, ou seja, ao se dirigirem uns ao outros para estabelecer qualquer ato de comunicação, os interlocutores exercem também algum tipo de ação entre si. Uma dessas formas de ação consiste em influenciar, em maior ou em menor escala, o modo como o outro fala. Essa influência pode ser mais facilmente perceptível quando um falante passa a conviver com falantes de outra comunidade linguística. Um bom exemplo disso é o ambiente universitário. Nele convivem pessoas originárias de diferentes partes do país e, não raro, constatam‐se algumas distinções no modo como cada uma delas fala, o que, conforme vimos no Texto 2 deste curso, configura a variação linguística. Identificadas num primeiro momento, tais diferenças, com o tempo, passam a não ser mais tão perceptíveis, ou porque tendem a desaparecer, ou porque são incorporadas pelos demais falantes, que começam a considerá‐las naturais. Isso demonstra que um falante não apenas influencia, como também é influenciado pelo modo como o outro fala. Se tal influência pode ser facilmente constatada em uma comunidade de falantes de uma mesma língua, imagine então o que não acontece quando entram em contato falantes de línguas diferentes? É exatamente sobre a influência que uma língua exerce sobre a outra que você irá refletir nesta unidade, buscando não só entender o que os linguistas chamam tecnicamente de contato linguístico, como também identificar quais são as suas principais consequências. 152 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG 1 Contato linguístico Não se pode quantificar, com propriedade, o número exato de línguas faladas no mundo, até porque existem países que possuem mais de uma língua oficial, além de em seu território serem falados inúmeros dialetos. Junte‐se a isso o fato de que, enquanto há línguas que são faladas por milhões de pessoas, há aquelas cujos falantes são em número bem reduzido e, por causa disso, tais línguas estão em vias de extinção. Segundo informação divulgada recentemente pelo Portal Terra Educação22, nosso planeta comporta pouco mais de 190 países e cerca de seis mil e setecentos idiomas diferentes. De acordo com um levantamento realizado pelo Instituto de Investigação e Desenvolvimento em Política Linguística (IPOL) e pela Organização das Nações Unidas para a Educação, Ciência e Cultura (UNESCO), só no Brasil são falados, aproximadamente, duzentos idiomas, cento e oitenta dos quais são línguas indígenas. Esses dados demonstram que não apenas o mundo, mas também os próprios países são plurilíngues. Dessa forma, torna‐se inevitável que essas línguas, em algum momento ou por alguma situação específica, entrem em contato, influenciando umas às outras. Conforme afirma Trask (2004, p. 66), “poucas línguas estão – ou já estiveram – suficientemente isoladas para evitar todo tipo de proximidade e, portanto, virtualmente, toda língua mostra alguma prova de um contato antigo ou moderno entre línguas.” Nem sempre, contudo, o falante tem consciência de que a língua que ele fala sofreu influência de algum tipo de contato, especialmente se tal contato é bastante antigo, ocorrido ainda no período da gênese do idioma. No caso de nossa língua materna, por exemplo, os portugueses, quando chegaram ao Brasil, já encontraram aqui “um verdadeiro mosaico de línguas e dialetos.” (ILARI; BASSO, 2007, p. 30) O mesmo se deu quando o Império Romano (séc. III a.E.C.) invadiu a Península Ibérica, região onde hoje se localizam Portugal e Espanha, e a dominou, impondo o latim aos povos23 que lá viviam e 22 http://noticias.terra.com.br/noticias/0,,OI5350595‐EI188,00‐ Analistas+identificam+aceleracao+no+desaparecimento+de+idiomas+no+mundo.html (confirmar fonte) 23 A história da Península Ibérica ou Hispânia antes da invasão romana é pouca conhecida e os poucos dados são vagos. Sabe‐se que primitivamente dois povos habitavam essa região: o mediterrâneo e o cantabro‐ 153 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG que falavam as línguas locais. O fato de os portugueses terem encontrado aqui línguas nativas não impediu que eles impusessem sua língua aos povos que aqui viviam, da mesma forma que fizeram os romanos na Península Ibérica. Certamente, você já deve ter tomado conhecimento, especialmente ao consultar as regras de ortografia da língua portuguesa, que existem algumas palavras de nosso léxico que são de origem indígena. Essas palavras são uma mostra da influência que a língua do povo colonizado exerceu sobre a língua do colonizador. Esse tipo de influência tem um nome técnico. Segundo Dubois et al. (1973), chama‐se substrato a “toda língua falada que, numa região determinada, por várias razões, foi substituída por outra língua, cumprindo tomar em consideração a influência que a língua anterior pôde ter sobre a língua que a sucedeu.” (p.573) Assim, pode se dizer que o tupi‐guarani é um substrato do português falado no Brasil, já que, mesmo sendo substituído por ele, enquanto estiveram em contato, deixou no português algumas marcas. Da mesma forma, as línguas faladas pelos povos que habitaram a Península Ibérica antes da chegada dos romanos são substratos do latim lá implantado e contribuíram bastante para a dialetação dessa língua, que acabou se transformando nas várias línguas românicas que conhecemos hoje. Ocorre, porém, que nem sempre o povo que conquista uma determinada região consegue impor aos habitantes nativos sua língua. Isso se dá, principalmente, quando os conquistadores são detentores de uma cultura inferior à dos povos conquistados. Na história do português, há também exemplo dessa situação: os romanos, hábeis colonizadores, souberam provocar a aceitação de sua civilização aos habitantes da Península Ibérica. Além da condição de povo mais civilizado, souberam usar muito bem a habilidade de colonizadores, abrindo escolas, catequizando os nativos e impondo o latim como língua oficial da administração, da religião e do ensino. Contudo, quando a Península estava totalmente romanizada, ela foi invadida e tomada por povos bárbaros pirenaico. Desses povos descenderam os iberos e os bascos. Estiveram também na Península, em busca de riquezas, os fenícios e os gregos. No séc. V a.C, os celtas invadiram a cobiçada região. Da miscigenação desse povo com os iberos surgiram os celtiberos. Antes ainda da chegada dos romanos, os cartagineses fixaram‐se na Hispânia. (cf. COUTINHO, 1969) 154 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG cuja cultura era muito inferior à dos romanos. Assim, os bárbaros não conseguiram sepultar nem a cultura, nem a língua romana, já bastante sedimentada na Península Ibérica. Em vez de impor sua língua, eles passaram a fazer uso do latim peninsular, obviamente deixando nele também suas marcas linguísticas. Tais marcas são o que se denomina tecnicamente de superestrato, ou seja, língua de um povo vencedor que é abandonada em detrimento da adoção da língua do povo vencido. Uma terceira possibilidade é a convivência das duas línguas, o que pode exemplificar tanto um contato antigo quanto moderno. Tomando ainda como referência a história externa da língua portuguesa, há registros da convivência de duas línguas na Península Ibérica quando, no século VIII, ela foi alvo de nova invasão: dessa vez foram os árabes que lá se estabeleceram. Mesmo sendo povos de elevada cultura, eles também não conseguiram fazer com que os habitantes peninsulares adotassem sua língua, pois ela possuía uma estrutura muito diversa do idioma falado por eles. Passaram a conviver então, lado a lado, na Península Ibérica, tanto o árabe quanto o romanço24. A essa influência linguística mútua existente entre línguas usadas numa mesma época e num mesmo território, chama‐se tecnicamente de adstrato. Modernamente, temos exemplos de adstratos nas várias regiões fronteiriças, onde falantes de dois países se comunicam diariamente em suas respectivas línguas, o que faz com que uma influencie a outra. Segundo Dubois et al. (1973), o adstrato pode influenciar a língua tomada como referência “de várias maneiras, sobretudo no léxico, rarissimamente na morfologia, algumas vezes na fonologia e, com certa frequência, na sintaxe.” (p. 26) A influência do castelhano da Argentina sobre o português do Rio Grande do Sul é um exemplo de adstrato moderno. Depois de entender o que é um substrato, um superstrato e um adstrato linguístico, você já está em condições de entender também o que os linguistas denominam tecnicamente de contato, objetivo central desta unidade. Pelos exemplos apresentados, você deve ter percebido que os falantes de uma língua A, ao serem expostos a uma língua B, tendem a 24 O romanço ou romance é a fase intermediária entre o latim vulgar, já bastante fragmentado pela influência de substratos e de superstratos, e as línguas românicas. 155 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG incorporar e a introduzir em sua língua traços da língua à qual foram expostos, o que pode ocorrer de forma intencional ou inconsciente. Os linguistas empregam o termo contato linguístico ou simplesmente contato “para indicar uma situação em que línguas ou dialetos estão em continuidade ou proximidade social (e assim influenciam‐se mutuamente).” (CRYSTAL, 1988, p. 64) O contato ocorre, principalmente, em virtude de razões geográficas, políticas ou sociais. No caso dos contatos que influenciaram a formação da língua portuguesa, pode‐se considerar que foram determinados por razões político‐econômicas, já que a Península Ibérica era uma região rica e localizada estrategicamente, o que a tornava cobiçada e alvo de constantes invasões. No caso das regiões limítrofes ou fronteiriças, o contato é determinado por razões geográficas, dado que, em virtude da proximidade territorial, os indivíduos são normalmente levados a circular no território vizinho e a empregar ora a língua materna, ora a língua da comunidade contígua. Há ainda contatos decorrentes de causas sociais, que podem ser curtos ou mais prolongados. É o caso, por exemplo, de contatos de línguas desencadeados quando um indivíduo, em decorrência de fatores profissionais, estudantis ou mesmo turísticos, é levado a usar, em certos momentos, uma língua diferente da sua. Não podemos deixar de considerar também que, na modernidade, a tecnologia e os meios de comunicação de massa “tornaram presente um certo número de línguas em regiões onde eram previamente desconhecidas” (TRASK, 2004, p. 65), o que, sem dúvida, faz com que tais idiomas se influenciem mutuamente. 1.1 Consequências do contato linguístico Sob uma perspectiva didática, pode‐se dizer que existe uma escala na qual se dispõem as consequências do contato linguístico, já que elas vão das mais elementares às de alcance mais amplo. Pode‐se entender, então, que o contato linguístico provoca não apenas sentimentos e atitudes nos próprios falantes – como preconceito, conflito, purismo25 e insegurança, por exemplo –, como também promove alterações nas línguas envolvidas. 25 Um exemplo de purismo em relação ao contato linguístico é o projeto apresentado pelo Deputado Aldo Rebelo contra os estrangeirismos na língua portuguesa. 156 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG Tais alterações também envolvem uma gradação, uma vez que podem ocorrer de forma mais branda, como incorporações de algumas palavras, ou podem afetar mais profundamente a gramática das línguas envolvidas, promovendo alterações em sua pronúncia ou mesmo em sua estrutura. Dependendo do estrato afetado pelas interferências oriundas do contato linguístico, estas podem ser classificadas, de acordo com Calvet (2002), que se apóia em Uriel Weinrich (1953), segundo três tipologias: interferências fônicas, interferências sintáticas e interferências lexicais. As interferências fônicas se dão, obviamente, no nível da articulação dos sons da língua, gerando não só confusão entre algumas palavras que se distinguem apenas por uma especificidade articulatória, como também produzindo sotaque. Tal interferência pode ser ilustrada pela dificuldade que os brasileiros geralmente apresentam para articular o [th] do inglês, presente em palavras como thing, por exemplo, por ser esse um som inexistente na sua língua nativa. Dadas as dificuldades articulatórias, a pronúncia quase nunca é fiel ao inglês, gerando um som adaptado entre a pronúncia portuguesa e a inglesa, que não passa despercebida a nenhum dos dois falantes nativos. As interferências sintáticas se manifestam na organização estrutural da frase, quando o falante dispõe as palavras da língua B, obedecendo a uma ordem característica de sua língua A, segundo ilustra este exemplo extraído de Calvet (2002, p. 58): “É como um italianófono produzir em francês, partindo do modelo corrente de frases como vienne la pioggia (‘vem chuva’) ou suona il telefono (‘toca o telefone’), frases como sonne le téléphone.” Como o francês não admite normalmente a inversão da ordem sujeito‐verbo, aceita tanto no português quanto no italiano, a frase “sonne le téléphone” causará estranheza a um falante nativo do francês, podendo soar natural a um falante nativo do português que, apesar de ter um bom domínio do vocabulário dessa língua, não domina tão bem suas normas de construção sintática. No tocante às interferências lexicais, elas se manifestam de duas formas. Uma delas pode colocar o falante em situações bastante embaraçosas, quando, induzido pelos falsos 157 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG cognatos, ele acaba por produzir/processar informações equivocadamente, julgando que algumas palavras, dadas as semelhanças fônicas e gráficas, apresentam o mesmo significado nas duas línguas, embora tais sentidos possam ser muito distantes. A palavra rapariga, que no português europeu é empregada para se referir a uma mulher jovem, adolescente, no português brasileiro, embora se refira também à mulher, tem um sentido pejorativo, sendo empregada com o sentido de meretriz. O desconhecimento dessa diversidade semântica entre os dois idiomas pode gerar situações polêmicas e embaraçosas para os falantes envolvidos na conversação. Além das armadilhas dos falsos cognatos, a interferência lexical pode ainda produzir o empréstimo linguístico, fenômeno que será tratado na próxima subseção. 1.1.1 Empréstimo linguístico O empréstimo consiste na incorporação de palavras de uma língua à qual o falante foi exposto à sua língua nativa. Tal incorporação acontece, via de regra, para se referir a algo que o falante desconhece na própria língua e, na dificuldade de encontrar um termo semelhante, ele utiliza diretamente a palavra da outra língua, promovendo, normalmente, uma adaptação de pronúncia. Convém, contudo, advertir o leitor de que, contrariamente ao que acredita o senso comum, tal incorporação não constitui uma característica exclusiva dos tempos modernos. Segundo informação extraída de Dubois et al. (1973, p. 210), o francês, em certas épocas, fez empréstimos tanto quanto em nossos dias, mas ao latim ou ao grego: a partir do século XIV, os eclesiásticos e os sábios, que usavam tanto o latim quanto o francês, deram a esta última, a partir das línguas antigas, grande parte de seu vocabulário. A medicina forjou para si um léxico a partir das raízes gregas. O vocabulário político desenvolveu‐se, em meados do século XVIII, a partir do inglês, nos meios anglófilos; da mesma forma, parte do léxico inglês dos esportes introduziu‐se na França no fim do século XIX pelos meios aristocráticos, que provocaram também a penetração das palavras no turfe. O empréstimo é, portanto, um dos recursos tanto de constituição quanto de ampliação do léxico de uma língua e pode ocorrer por motivações várias. A mais simples delas, segundo Trask (2004), subordina‐se ao desconhecimento do referente evocado pela palavra emprestada. 158 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG O português recebeu de outras línguas, direta ou indiretamente, as palavras: whisky do gaélico da Escócia, iogurte do turco, tomate do nahuatl, sauna do finlandês, manga do tâmul, ganzá do quimbundo e pajé do tupi. A razão desses empréstimos é que os falantes do português não conheciam os referentes dessas palavras até que os importaram de outros países, ou até que os encontraram no além mar, e a solução adotada para falar deles foi simplesmente adotar os nomes que os identificavam em seu local de origem. (op. cit. p. 219) Outra motivação importante é o prestígio de que goza uma língua ou o povo que a fala. É muito comum falantes de línguas menos prestigiadas, na ânsia de demonstrarem domínio de línguas mais prestigiadas, introduzirem algumas palavras dessas línguas em sua língua materna. Tal inserção é vista pelos linguistas como uma atitude de caráter melhorativo. Sabe‐se que, no mundo capitalista, o prestígio está diretamente associado ao poderio econômico. Dessa forma, conforme esclarece Rocha (1998, p. 71), “na balança comercial do léxico, as nações mais fortes são, via de regra, as que mais exportam palavras.” Não é sem motivo, portanto, que palavras inglesas têm incorporado prodigamente as diversas línguas, principalmente no campo da tecnologia. A integração dos empréstimos nas línguas que os tomam emprestados se faz de diversas maneiras, além de comportar graus diversos, conforme explica Dubois et al. (1973). Num grau mais elementar de integração, a palavra é reproduzida quase da mesma forma como é pronunciada e escrita na língua de origem. Tal reprodução, contudo, envolve, em geral, assimilação de sons das línguas envolvidas. Um exemplo de empréstimo desse nível é a palavra paparazzo, importada do italiano. Embora se mantenha, no português, sua escrita italiana, a pronúncia é adaptada. Num nível mais avançado de integração, “só alguns traços muito freqüentes da língua B são conservados: por exemplo, os afixos ingleses –ing (camping) ou –er (docker).” (DUBOIS et al., 1973, p. 211) Considera‐se que a integração é total quando todos os traços estranhos à língua materna são substituídos. É o caso, por exemplo, da palavra football do inglês que foi integrada ao português (futebol). A adaptação fonética e ortográfica por que passou não permite ao falante recuperar sua etimologia. 159 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG 1.1.2 Bilinguismo e diglossia Conforme defende Dubois et al. (1973), o contato linguístico é o acontecimento concreto que promove o bilinguismo, ou seja, uma situação linguística em que os falantes são levados a conviver com uma ou mais línguas diferentes e, consequentemente, a empregar alternativamente tais línguas. O bilinguismo pode ser uma característica apenas individual, mas também pode ser uma manifestação coletiva, fazendo‐se presente em toda uma comunidade linguística onde, por alguma razão, empregam‐se cotidianamente duas ou mais línguas. Segundo adverte Trask (2004), tal situação “levanta uma série de questões importantes, de natureza social, política e educacional” (p. 47), porque implica profundas discussões acerca de qual língua deve não só ser objeto de estudo nas escolas, como também ser tomada como padrão jurídico e editorial. Como normalmente ocorre em qualquer situação controversa, nem sempre as opiniões são consensuais, o que pode levar a um conflito linguístico, “na medida em que os falantes pressionam pelo direito de usar suas línguas maternas no maior número possível de situações, excluindo possivelmente outras línguas.” (op. cit., p. 47). Cumpre esclarecer que o fato de o falante pressionar pelo direito de uso de sua língua materna não significa, necessariamente, que uma língua goze de maior prestígio que a outra. Afinal é exatamente a coexistência de duas modalidades linguísticas que gozam do mesmo status é que caracteriza o bilinguismo. Quando, numa comunidade linguística, uma das línguas tem um status sócio‐político inferior, tem‐se um tipo de bilinguismo a que os linguistas denominam especificamente de diglossia. Bagno (2001) exemplifica diglossia, valendo‐se da situação de bilinguismo a que são submetidos os habitantes do Paraguai. Segundo nos informa o autor, todos os paraguaios são bilíngües: além do espanhol, que á e a língua oficial, falam também o guarani, língua do povo indígena mais importante do país. No entanto, os usos de cada uma das línguas são bem determinados: enquanto o guarani é usado em casa, para as relações familiares e comunitárias, para interações informais etc., o espanhol é a língua das instituições oficiais, dos órgãos do governo, da educação formal etc. (p. 163) 160 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG O conceito de diglossia foi igualmente estendido para se referir às situações em que o falante de uma mesma língua se vê obrigado a fazer uso da variante padrão, em oposição às situações em que a variante não‐padrão é não só aceitável, mas também recomendável. Tal extensão se apóia justamente do traço que distingue o simples bilinguismo da diglossia, isto é, o teor valorativo social atribuído às variantes envolvidas. Considerações finais Nesta unidade você refletiu sobre o contato linguístico, voltando‐se para a análise de suas principais motivações e consequências. Percebeu que tais consequências variam dos níveis mais elementares, como atitudes e sentimentos do falante em relação às línguas que se influenciam mutuamente, aos mais complexos, promovendo alterações nos sistemas linguísticos envolvidos. Analisou situações de bilinguismo, de diglossia e de empréstimo como resultados do contato entre duas ou mais línguas. Na próxima unidade deste curso, você ainda continuará a estudar sobre situações de contato, voltando sua atenção para os pidgins e os crioulos. Agora, você deverá resolver os exercícios preparados para auxiliá‐lo a fixar os conceitos apresentados nesta unidade. Releia este texto sempre que julgar necessário e bom trabalho! Referências BAGNO, Marcos. Português ou brasileiro? Um convite à pesquisa. São Paulo: Parábola, 2001. CALVET, Louis‐Jean. Sociolingüística: uma introdução. São Paulo: Parábola, 2002. COUTINHO, Ismael de Lima. Gramática histórica. 6. ed. rev. Rio de Janeiro: Livraria acadêmica, 1969. CRYSTAL, David. Dicionário de linguística e fonética. Rio de Janeiro: Jorge Zahar, 1988. DUBOIS, Jean et al. Dicionário de linguística. São Paulo: Cultrix, 1973. ILARI, Rodolfo; BASSO, Renato. O português da gente: a língua que estudamos e a língua que falamos. São Paulo: Contexto, 2007. ROCHA, Luiz Carlos de A. Estruturas morfológicas do português. Belo Horizonte: Editora da UFMG, 1998. TRASK, R. L. Dicionário de linguagem e linguística. São Paulo: Contexto, 2004. WEINRICH, Uriel. Languages in contact. New York, 1953. 161 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG Leitura complementar Você sabia que o contato entre povos de origens diversas afeta outros setores da cultura que não apenas a língua? O texto que se segue, extraído de Ilari; Basso (2007, pp. 18‐19), lhe dará mais informações sobre isso. MOÇÁRABE Os cristãos e os árabes conviveram na Península Ibérica por mais de sete séculos, antes, durante e depois das reconquistas cristãs. Desse contato prolongado resultaram duas culturas que costumam ser designadas pelos adjetivos moçárabe e mudéjar. O adjetivo moçárabe aplica‐se aos cristãos que viveram em territórios dominados pelos árabes, uma situação mais comum antes das reconquistas. De acordo com sua etimologia (ar. mustaʹarab ou musta’rib), essa palavra significa “arabizado”, “tornado árabe”, “que se parece com o árabe”. Mudéjar aplica‐se à situação inversa, a do árabe que vive em território cristão – uma situação que foi mais comum do que se poderia pensar, porque os reis cristãos, nos territórios recém‐conquistados, precisaram freqüentemente dividir o poder com senhores locais de origem árabe. Um dos efeitos dessa convivência entre árabes e cristãos foi a criação de dois tipos de arquitetura: a arquitetura moçárabe, mais antiga, mais sóbria e mais próxima do românico, e a arquitetura mudéjar, mais recente, mais rica em ornamentos e próxima do mourisco; além disso, a arte mudéjar produziu obras‐primas no campo da iluminura. Mas há fortes marcas da influência árabe também nas línguas da Ibéria, pois o português e o espanhol usam até hoje, corriqueiramente, uma enorme quantidade de palavras de origem árabe. Da convivência das culturas cristã e muçulmana nasceram também alguns gêneros literários, dentre os quais o mais conhecido é a “jarcha”, de que o poema a seguir é um exemplo. 162 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG Exemplo de “jarcha”: Tradução: Vayse meu corachón de mib: Meu coração se parte de mim: ya Rab, ¿si me tornarád? Oh Deus, acaso vai voltar? ¡Tan mal meu doler li‐I‐habib! Esta dor pelo meu amado dói tanto! Enfermo yed, ¿cuánd sanararád? Está doente, quando há de sarar? 163 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG PIDGINS E CRIOULOS Sueli Maria Coelho (Fale/UFMG) INTRODUÇÃO Neste texto, daremos prosseguimento ao nosso estudo sobre os efeitos advindos do contato linguístico, voltando nossa atenção para situações em que tais efeitos são bem mais substanciais e, por vezes, até mesmo funestos, resultando na “morte” de um dos dois sistemas linguísticos envolvidos, em virtude de uma mescla que se opera entre eles. Como visto na unidade anterior, uma das possibilidades de se tentar resolver os impasses decorrentes do contato é a manutenção das duas línguas, que passam a coexistir no mesmo espaço, influenciando‐se mutuamente. Nesse caso, surgem, conforme estudado, as situações de bilinguismo e de diglossia. Outra solução possível para driblar a dificuldade de interação que, na maioria das vezes, o contato impõe é o retorno ao “monolinguismo, caracterizado somente pelas variedades intralinguísticas do sistema sobrevivente.” (TARALLO; ALKMIN, 1987, p. 14) Nesse contexto, surgem os pidgins e os crioulos, temas de que nos ocuparemos nesta unidade. 1 Pidgins: línguas instrumentais provisórias De etimologia bastante controversa, o termo pidgin é empregado para se referir a “uma língua auxiliar que surge quando falantes de diversas línguas mutuamente ininteligíveis entram em contato estreito.”.(BICKERTON, 1984, p. 173 apud COUTO, 1996, p. 15). Trata‐ se, portanto, de uma língua emergencial, que visa a permitir a interação imediata entre os membros de grupos de culturas e de línguas distintas em contextos muito específicos. A especificidade de tais contextos geralmente decorre da necessidade do estabelecimento de relações estritamente comerciais ou do deslocamento de grupos étnicos distintos para uma mesma região em virtude de situações de escravidão. Nessas condições específicas, os interlocutores vêem‐se obrigados a criar um código comum, uma espécie de língua franca, 164 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG que lhes permita a comunicação interlinguística, já que, como mencionado, um grupo não conhece nem a cultura, nem a língua do outro. Um pidgin não é, portanto, a língua materna de nenhum falante, mas sua segunda língua e, dadas as condições de seu surgimento e os fins a que se presta, uma língua dotada de um status bastante provisório. Conforme advertem Tarallo e Alkmin (1987), assim como as demais línguas chamadas naturais, o pidgin também é uma língua com espaço e tempo característicos. Serve, pois, às necessidades de uma comunidade, provisoriamente estabelecida, em um determinado local e por um período específico de tempo. (p. 15) Além do caráter auxiliar e secundário que o pidgin assume para seus falantes, já que “cada um dos grupos mantém sua própria língua no convívio social do cotidiano e do habitual” (TARALLO; ALKMIN, 1987, p. 80), há outras características que o definem. De acordo com informações fornecidas por Couto (1996), nesse tipo de código linguístico emergencial, “não há nenhuma sintaxe, cada enunciado é proferido tendo por base, quando a tem, estruturas da língua original do falante.” (p. 26) Além da ausência de sintaxe, os pidgins são ainda caracterizados pelo caráter pragmático, que os constitui, e pela improvisação. Pautando‐se em estudos de Mühlhäusler e de Meisel, Couto (op. cit.) explica que, nas línguas pidgins, a comunicação se dá inteiramente pelo modo pragmático, ou seja, ela só se viabiliza devido ao contexto da situação. Não há estruturas subjacentes, tudo é improvisado no momento. Em geral, usam‐se itens lexicais da língua do povo mais forte socioeconomicamente. Esses itens lexicais são proferidos uns após outros, sem nenhum princípio ordenador. Quando muito se reproduz um ou outro princípio da sintaxe da língua principal do falante. (p. 26) Os enunciados transcritos abaixo, extraídos de Bickerton (1984) e citados por Couto (1996, p. 26), exemplificam um pidgin: mi kape bai, mi chaek meik (japonês) me coffee buy, me check make “Ele comprou um café para mim; ele me fez um cheque” A análise do exemplo apresentado comprova a ausência de uma sintaxe reconhecível no pidgin, além de exibir o superstrato lexical da língua do povo socioeconomicamente 165 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG privilegiado. O fato de os complementos verbais precederem os verbos (me coffee buy, me check make) atesta uma nítida influência da gramática da língua materna sobre o pidgin, já que o falante do japonês, ao tentar se comunicar com o falante do inglês numa situação mercantilista, recorre a uma estrutura sintática que é própria do japonês, mas não do inglês, promovendo, dessa forma, uma mescla entre os dois idiomas. Os itens lexicais, contudo, são majoritariamente importados do inglês, língua que se impõe socioeconômica e politicamente sobre o japonês. No tocante ainda às características das línguas pidgins, Bollée (1977), citado por Couto (1996), mostra que os critérios utilizados para reconhecer o estatuto de um pidgin são tanto de ordem sociolinguística, envolvendo fatores sociais, históricos e econômicos, quanto de ordem linguística ou estrutural. No rol dos critérios sociolinguísticos por ele apresentados, citam‐se: (i) emergência numa situação de multilinguismo, em que os povos envolvidos são falantes de línguas mutuamente ininteligíveis; (ii) superioridade socioeconômica e política de um dos povos; (iii) precariedade de intercompreensão, o que gera a criação de um código comum, a partir da mescla das línguas maternas dos falantes envolvidos; (iv) modo de comunicação pragmática, destituído de uma gramática coletivamente reconhecida; e (v) ausência de um sentimento de amor e de fidelidade linguística por parte dos falantes, que abandonam o pidgin assim que possível. Os critérios linguísticos, por sua vez, decorrem dos sociolinguísticos e podem ser assim sintetizados: o pidgin apresenta uma gramática drasticamente reduzida em relação tanto à da língua de superstrato quanto à da(s) língua(s) de substrato. Assim, temos: 1) Pequeno número de fonemas. 2) Preferência pela estrutura silábica CV, em geral em vocábulos dissílabos. 3) Ausência total de morfologia derivacional e flexional. 4) As funções sintáticas são indicadas preferencialmente pela ordem. 5) Léxico reduzido a um mínimo possível. (COUTO, 1996, p. 29) Como se depreende das informações até então apresentadas, a simplificação e a redução são as características linguísticas‐chave de um pidgin. Hall (1966), um importante estudioso desse assunto, assim condensa as características que atestam a simplificação e a redução dessa mescla linguística nos diversos estratos do novo código: 166 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG Nível fonológico: o número de contrastes empregados é reduzido. As vogais representadas são, em geral, as chamadas vogais cardinais (a, e, i, o, u), enquanto os grupos consonantais são caracteristicamente evitados. Nível morfológico: ausência de algumas categorias flexionadas, como gênero, número e tempo verbal. Nível sintático: as estruturas sentenciais são simples; as sequências tendem a ser coordenadas, evitando‐se estruturas complexas e subordinação extensiva. Nível lexical: número reduzido de vocábulos, cuja ação se norteia pela extensão de significados e por polissemias significativas. (HALL, 1966 apud TARALLO e ALKMIN, 1987, p. 87) O conhecimento dos critérios tanto linguísticos quanto sociolinguísticos de reconhecimento de um pidgin é relevante, porque a obediência a esse conjunto de critérios é condição essencial para que um meio de comunicação seja considerado, de fato, um pidgin. Caso nem todos esses traços possam ser identificados, têm‐se não um pidgin, mas uma situação pidginizante, isto é, “situações de contato e/ou de ausência de uma norma comum, resultando em expressões emergenciais altamente simplificadas relativamente à língua‐alvo.” (COUTO, 1996, p. 29) Tais situações podem ser identificadas não apenas na linguagem dos estrangeiros, mas também em algumas brincadeiras verbais cujo princípio é justamente a mescla de itens lexicais de uma língua com a gramática de outra, conforme se percebe em “Laicá nóis laica, mais môni que é gudi nóis num révi” (op. cit., p. 29). Nota‐ se no enunciado transcrito a ocorrência de palavras do inglês pronunciadas segundo os padrões fonéticos do português, além de uma obediência à ordem e à gramática do português. Acrescente‐se a isso a ausência de flexão, o que, conforme demonstrado, é uma característica do pidgin. Entretanto, as condições de enunciação não são aquelas exigidas pelo pidgin, tampouco os códigos envolvidos são desconhecidos dos falantes. Isso faz com que classifiquemos o enunciado em questão não como um pidgin, mas como uma situação pidginizante, já que nem todos os critérios linguísticos e sociolinguísticos de classificação foram preenchidos. 167 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG 2 “Crioulos: rebentos linguísticos26” Conforme apresentado na seção anterior, o primeiro contato linguístico que povos de língua e cultura distintas estabelecem entre si é normalmente um pidgin, código provisório e rudimentar, que visa a permitir a interação em situações imediatistas bastante específicas. Quando, contudo, um pidgin sobrevive por mais tempo, é normal que uma segunda geração de falantes, que teve exposição ao pidgin durante o período normal em que a criança aprende a falar, passe a desenvolver para ele uma gramática própria, distinta das gramáticas das duas línguas que entraram na formação do próprio pidgin. Ao passar por esse processo espontâneo de construção de uma gramática, o pidgin dá origem a um crioulo. (ILARI; BASSO, 2007, p. 40) Assim, diferentemente do pidgin, o crioulo é a língua materna ou vernacular de uma geração de falantes que, ao contrário de seus pais, o adquiriu como primeira língua. As línguas crioulas possuem, desse modo, uma comunidade de falantes nativos e uma identidade, além de desempenharem uma função social muito mais ampla que o pidgin, pois suprem todas as necessidades comunicativas de seus falantes nativos e usuários. Depreende‐se do exposto que se atribui tecnicamente “o nome de crioulos a [...] pidgins que, por motivos diversos de ordem histórica ou sociocultural, se tornaram línguas maternas de toda uma comunidade.” (DUBOIS, 1973, p. 161) Dessa forma, conforme defende o linguista Hall Jr. (1966), a evolução natural de um pidgin é ele se tornar uma língua crioula, portanto uma relação de pai para filho. Nesses termos, todo crioulo se origina de um pidgin, embora nem todo pidgin se transforme em crioulo (como qualquer sistema, o pidgin também pode “morrer”) (HALL JR., 1966 apud TARALLO; ALKMIN, 1987, p. 97) Apesar de haver a possibilidade de o contato resultar na “morte” de um dos sistemas linguísticos envolvidos, ele pode resultar também em criação e vida, conforme alude o título desta seção. Segundo informa Couto (1996), entre os estudiosos de língua crioula, a proposta etimológica mais aceita para o termo crioulo é a de “José Leite de Vasconcelos, segundo a qual na origem dessa palavra estaria a palavra ‘criar’”. (p. 33) Tal etimologia 26 O título dessa seção é uma metáfora empregada por Tarallo e Alkmin (1987) para defenderem que o monolinguismo advindo do contato nem sempre é funesto, podendo, em algumas situações, como no caso das línguas crioulas, traduzir nascimento e vida. 168 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG vem reforçar não apenas a relação de parentesco entre pidgins e crioulos, já que estes são criados a partir daqueles, como também o atributo de rebento linguístico dispensado por Tarallo e Alkmin (1986) para caracterizarem as línguas crioulas. Além do traço histórico de nativização que caracteriza as línguas crioulas, dado que todo crioulo provém de um pidgin, duas outras características sócio‐históricas os definem. De acordo com informações coletadas em Couto (1986), os crioulos surgem sempre da situação de contato entre povos aloglotas em que um deles, geralmente o colonizador, se impõe socioeconomicamente sobre o outro. Além disso, “surgem em ilhas ou em regiões isoladas” (COUTO, 1986, p. 34), o que se costuma denominar tecnicamente de critério da insularidade. No que toca às características linguísticas ou estruturais das línguas crioulas, não há diferenças muito substanciais em relação àquelas apresentadas para os pidgins, dado a relação de parentesco entre as duas línguas. Acrescente‐se apenas a possibilidade de uma morfologia derivacional e flexional, resultante do desenvolvimento de uma gramática própria. “Uma [...] característica dos crioulos é o uso de partículas antepostas ao radical verbal para indicar tempo, modo e aspecto.” (op. cit., p. 38), o que não se constata no pidgin. Em se tratando de características sintáticas, os crioulos caracterizam‐se por preferirem uma ordem fixa, geralmente caracterizada pelo sistema SVO (sujeito – verbo – objeto), além de apresentarem artigos e/ou pronomes demonstrativos como determinantes de referentes específicos, conforme ilustram estes exemplos do crioulo guineense, apresentados por Couto (1986, p. 38): (1) e bistidu burmeju (Este/o vestido é vermelho) (2) N ka kunsi kil omi (Eu não conheço este/o homem) 169 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG Considerações finais As situações de contato linguístico entre povos de línguas e de culturas distintas, em contextos mercantilistas ou de escravidão, obrigam os falantes de tais línguas a desenvolverem estratégias emergenciais para assegurar a interação, ainda que de forma bastante precária e limitada. Nesse contexto, opta‐se, normalmente, pelo monolinguismo, criando‐se, assim, um novo código a partir da mescla das línguas maternas dos grupos linguísticos envolvidos. Surge, então, um pidgin, uma segunda língua bastante simplificada e pragmática que visa tão somente a propiciar a interação entre povos aloglotas, que mantêm sua língua materna nos demais situações de uso linguístico. Os pidgins podem vir a desaparecer quando a situação que os impuseram for temporária, dado que não existe nenhum sentimento de fidelidade linguística por parte dos falantes, que o utilizam apenas como língua franca. Entretanto, se as situações específicas de pidginização se prolongarem, pode ocorrer que os filhos desses falantes adquiram o pidgin como primeira língua, o que lhe confere um status de nativização, transformando‐o em uma língua crioula. O crioulo tende a ter uma gramática um pouco mais complexa que o pidgin que o gerou, porque seus falantes nativos passarão a utilizá‐lo não apenas em situações específicas de comunicação, mas como primeira língua, desenvolvendo para ele um sistema gramatical próprio. Assim sendo, se por um lado o contato linguístico pode resultar na falência de uma das línguas envolvidas, por outro ele pode propiciar o surgimento de um novo sistema linguístico. Referências COUTINHO, Ismael de Lima. Gramática histórica. Rio de Janeiro: Livraria Acadêmica, 1969. COUTO, Hildo Honório do. Introdução ao estudo das línguas crioulas e pidgins. Brasília: Editora da Universidade de Brasília, 1996. DUBOIS, Jean et al. Dicionário de linguística. São Paulo: Cultrix, 1973. ILARI, Rodolfo; BASSO, Renato. O português da gente: a língua que estudamos e a língua que falamos. São Paulo: Contexto, 2007. TARALLO, Fernando; ALKMIN, Tânia. Falares crioulos: línguas em contato. São Paulo: Ática, 1987. 170 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG LEITURA COMPLEMENTAR Entradas e bandeiras 1: o português na Ásia TARALLO, Fernando; ALKMIN, Tânia. Falares crioulos: línguas em contato. São Paulo: Ática, 1987, p. 123‐126 Morão Correia27 aponta que a língua portuguesa desempenhou um papel importantíssimo no Oriente durante os séculos XVI, XVII e XVIII, servindo de elemento de comunicação não só entre os povos europeus que percorriam essas terras, como também entre os vários povos indígenas que se ocupavam no comércio. Assim, Cunha nos informa que na primeira viagem dos holandeses às Índias Ocidentais, entre 1595 e 1597, sob o comando de Cornelis de Houtman, o tratado que celebraram com o Governador do Reino de Bantan, Java, é em português. Em português são também as credenciais que Maurício de Nassau entrega ao Almirante Van Neck para serem transmitidas aos Príncipes da região28. Também Valkhoff29 relata que o rei do Ceilão (atual Sri Lanka), Taj Sinja II (1629‐89), aliado dos holandeses contra os portugueses, somente aceitava correspondências em português, recusando textos enviados em holandês30. Conforme atestam várias fontes históricas, o português difundiu‐se largamente na Ásia durante alguns séculos (XVI, XVII e XVIII). Era a língua do comércio e da religião cristã (o catolicismo). Desse uso ampliado e inadvertido da língua lusitana nasceram vários crioulos portugueses na Ásia, em diferentes localidades. A grande maioria desses crioulos desapareceu, outros estão em processo de extinção, e alguns sobrevivem restritos a pequenas comunidades de descendentes dos antigos colonizadores portugueses. [...] Os crioulos portugueses da Ásia são pouco conhecidos: há poucas informações seguras sobre sua sobrevivência e existência, e muito pouco material descritivo. Tradicionalmente, 27 CORREIA, S. M. A actual situação do português no Oriente. Boletim de Filologia, XX: 13‐8, 1961. CUNHA, C. Língua, nação, alienação. Rio de Janeiro: Nova Fronteira, 1981, p. 50. 29 VALKHOFF, M. F. Studies in Portuguese and Creole. Johannesburg: Witwatersrand University Press, 1966. 30 Sobre a situação do português no Oriente ver: LOPES, D. A expansão da língua portuguesa no Oriente nos séculos XVI, XVII e XVIII. Barcelos: Portucalense, 1936; SILVA NETO, S. da. Breves notas para o estudo da expansão da língua portuguesa em África, Ásia. Revista de Portugal, XXII: 129‐47, 1957. 28 171 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG esses crioulos têm sido classificados em três grupos, a partir de critérios estritamente geográficos31. Assim temos: 1º grupo: sino‐português: o crioulo português de Macau, também conhecido como macaísta e macauenho32. “Morto” em Macau, esse crioulo sobrevive, ao lado de outras línguas, na fala de cerca de 2 mil pessoas de origem portuguesa, em Hong Kong. 2º grupo: malaio‐português: o crioulo português de Málaca (Malásia) e o crioulo português da Indonésia. O primeiro, o de Málaca, é também conhecido como papiá Kristang, serani, malaqueiro, malaquense, malaquenho, bahasa geragau, português basu, etc. Segundo Hancock33, esse crioulo é ainda hoje a primeira língua de aproximadamente 3 mil pessoas na Malásia ocidental. Há ainda em Singapura uma comunidade crioula de origem portuguesa em que se fala a variedade do malaquenho34. O crioulo português da Indonésia35 tem suas raízes em Jacarta (antiga Batávia) e sobrevive ainda hoje, embora em processo extinção, na cidade de Tugu. Hancock36 refere‐se também a outras variedades desse crioulo nas ilhas Sumatra, Bornéu, Flores, Ceram, Molucas, Célebes (todas elas próximas à Indonésia) e também em Xangai, no litoral da China. 3º grupo: indo‐português: o crioulo português de Sri Lanka e os crioulos portugueses da Índia. Segundo Cunha37, o crioulo português de Sri Lanka é falado por uma centena de famílias nas cidades de Vaipim e Batticaloa38. Hancock39 informa ser esse crioulo falado 31 Para a classificação de crioulos portugueses na Ásia, ver: DALGADO, S. R. Dialeto indo‐português de Negatapão. Revista Lusitana, XX: 40‐53, 1917. 32 Ver: THOMPSON, R. W. O dialecto português de Hong Kong. Boletim de Filologia, XIX: 289‐93, 1960; BATALHA, G. N. Estado actual do dialeto macauense. Revista Portuguesa de Filologia, 9: 177‐213, 1959. 33 HANCOCK, I. F. Appendix: Repertory of Pidgin and Creole Languages. In: VALDMAN, A., ed. Pidgin and Creole Linguistics. London, Indiana University Press, 1977. 34 Idem. Malaccan Creole Portuguese. Te Reo, 16: 23‐44, 1973; idem. Malaccan Creole Portuguese: Asian, African or European? Anthropological Linguistics, 17: 211‐36; e REGO, A. da S. Dialecto português de Málaca. Apontamentos para seu estudo. Lisboa: Agência Geral das Colônias, 1942. 35 SCHUCHARDT, H. Über das Malaioportugiesische Von Batavia und Tugu. Sitzungsberichte der Kaiserlichen Akademie der Wissenschaften zu Wien, 122(9): 1‐256, 1890. 36 HANCOCK, I. F. Appendix..., cit. 37 CUNHA, C., op. cit. 38 Consulte‐se ainda: SMITH, I. R. Sri Lanka Creole Portuguese Phonology. International Journal of Dravidian Linguistics, VII (2): 248‐406, 1978. 172 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG ainda por cristãos de origem portuguesa nas cidades de Mannar, Negumbo, Colombo (capital de Sri Lanka), Calaturey, Galle, Trincomalse, Jaffna e Upportai40. Os crioulos portugueses da Índia são muito numerosos; um exame da literatura da área permite agrupá‐los da seguinte maneira: 1) crioulos portugueses da costa do Quiromandel: hoje extintos, foram falados nas cidades de Mediapor, Madras, Cudalor, Carical, Tranquebar, Pordicheri e Negatapão41; 2) grupo norteiro ou indo‐português do norte: relacionado às variedades faladas nas cidades de Bombaim, Mahim, Bandora, Baçaim, Koralai, Taná, Andheri, Morol, Govai, Manori, Versová e Chaul. Cunha informa que os crioulos de Koralai e de Chaul42 são falados por cerca de 700 a 400 pessoas, respectivamente. Aparentemente, as demais variedades são hoje extintas. 39 HANCOCK, I. F. Appendix..., cit. Ver ainda: DALGADO, S. R. Dialecto indo‐português do Ceylão. Lisboa: Imprensa Nacional, 1908. 41 DALGADO, S. R. 1917. [...] Dalgado, um estudioso de crioulos da Índia, já em 1917 informava que os crioulos da costa do Quiromandel estavam quase a ponto de desaparecer, apresentando uma descrição da variedade ainda falada em Negatapão. 42 DALGADO, S. R. Dialecto indo‐português do Norte. Revista Lusitana, IX: 142‐66 e 193‐228, 1907. 40 173 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG SISTEMAS DE ESCRITA Aléxia Teles Duchowny (Fale/UFMG) INTRODUÇÃO A escrita, “conjunto de símbolos escritos com um determinado conjunto de convenções para seu emprego” (SAMPSON, 1996, p. 16), foi inventada há aproximadamente dez mil anos, permitindo que os seres humanos transmitissem e acumulassem com mais eficácia, de geração a geração, descobertas e experiência de seus antecessores. Assim, ao nascermos, podemos ter acesso ao conhecimento adquirido pelas gerações anteriores. Isso permite progressos impossíveis de existir em sociedades agráfas, isto é, sem escrita, ou em grupos de outros animais. Os sistemas de escrita não só são sofisticados por si só, como derivam de antecedentes complexos. Provavelmente, todos eles têm como origem alguma escrita pictórica primitiva e são artificiais, ao contrário da linguagem oral, natural aos seres humanos. A escrita pictórica primitiva é aquela presente, usualmente, em paredes de cavernas, datada, muitas vezes, de milhares de anos atrás. Cagliari (2009, p. 10) imagina a seguinte história, para explicar a invenção da escrita: Um dia, alguém, que tinha ficado fora da comunidade por muito tempo, retorna e, ao entrar na caverna, encontra‐se diante de pinturas representando animais e pessoas. Sua curiosidade pergunta o que aquilo representa. O artista olha o que fez e começa a narrar um fato que o motivou a fazer os desenhos, por exemplo, uma caçada, uma briga, etc. O visitante fica maravilhado e o artista, de repente, percebe que os desenhos, além de representar figuras e objetos do mundo, podiam representar também as palavras da história que contara. A escrita é a interpretação de uma língua falada, seus elementos, seu ordenamento e as relações desses elementos uns com os outros. Através da escrita, a linguagem falada é representada por meio de signos gráficos. Esses sinais materiais visíveis podem variar muito de grupo para grupo humano, mas todos apresentam algumas características gerais: 174 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG (i) elementos básicos e definidos, os grafemas43; (ii) normas e convenções arbitrárias compreendidas e compartilhadas por uma comunidade de fala; (iii) meios físicos (escrita no papel, na tela do computador, etc.) para representar o sistema de escrita, permitindo que seus usuários o interpretem. Horcades (2004, p. 15) faz a seguinte afirmação: Letras são como abelhas. Uma abelha sozinha é apenas um inseto irracional. Mas, se observarmos uma colméia com seu funcionamento extremamente complexo, com operárias, soldados, babás, faxineiras, zangões e rainha, veremos que esses insetos primitivos desempenham funções bem determinadas. A abelha não tem inteligência individual, mas a colméia possui inteligência coletiva. Isso acontece também com as letras. Uma letra sozinha não vale nada. Mas letras juntas formam palavras, e palavras são pensamentos. Fica justificada, então, a importância de se dar atenção aos sistemas de escrita: eles são uma das formas para a expressão das ideias humanas. Entendê‐los amplia nossa compreensão não só da forma falada e escrita das línguas, mas também da linguagem humana em geral. Os sistemas de escrita são muitos e podem ser classificados de várias maneiras, como você verá em seguida. Para Fischer (2003), essas classificações não são uma tarefa fácil, pois os critérios de cada uma podem variar: tipológico, cronológico, genealógico, geográfico... Além do mais, muitos sistemas de escrita são mistos, como o japonês, e há uma gama de empréstimos e inovações que tornam semelhantes sistemas sem relação direta uns com os outros. Para Ferdinand de Saussure, em seu Curso de linguística geral (1916), há dois sistemas básicos de escrita, o ideográfico e o chamado fonético. Aqui vai uma proposta de desenvolvimento desses dois tipos básicos. Grafema, conforme Ferreira (s/d), é um símbolo gráfico constituído por traços gráficos distintivos que permitem o entendimento visual das palavras na língua escrita. É uma designação mais ampla do que letra, porque também abarca diacríticos, ideogramas e sinais de pontuação. 43 175 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG 1 Sistemas ideográficos Nesses sistemas de escrita, cada grafema ou ideograma44 representa um morfema, isto é, há um único símbolo para uma palavra gramatical completa. A palavra é representada por um sinal único e estranho aos sons de que ela se compõe. Os hieróglifos do Antigo Egito, a escrita chinesa, a escrita dos maias e dos astecas e a cuneiforme são exemplos de sistemas ideográficos, mas apenas o chinês sobreviveu até os dias de hoje. Conheçamos um pouco sobre eles. 1.1 Os hieróglifos egípcios Os antigos egípcios chamavam a escrita hieroglífica de “fala dos deuses”. As inscrições hieroglíficas egípcias mais antigas datam do século III a.E.C45. Trata‐se de um sistema bastante complicado, pois os sinais ora exprimem palavras, ora um som. Como nos alfabetos semíticos, apenas as consoantes são representadas. Evidentemente, na hora da leitura do texto, as vogais são devidamente pronunciadas. Havia aproximadamente 75 fonogramas46 biconsonantais e 24 signos monoconsonantais, além dos ideogramas, que são a base do sistema, que representam coisas, ações e abstrações. Por exemplo, a palavra crocodilo é a figura de um crocodilo e também representa o som “msh”. Os hieróglifos para gato, miw, combinam as figuras de m, i e w com o desenho de um gato. Os hieróglifos são usualmente gravados em pedra, estando dispostos tanto de cima para baixo, como horizontalmente, bem como tanto da esquerda para a direita como da direita para a esquerda.47 Ideograma: “um símbolo gráfico ou um desenho que representa um objeto ou uma idéia.” (HOUAISS, 2001, p. 1565). 45 Era Comum, equivalente à Era Cristã, mas sem conotação religiosa. 46 “Signo que, além de ser usado com seu valor de ideograma, é empregado também na representação de uma sequência consonantal de palavras.” (HOUAISS, 2001, p. 1368). 44 Se você sabe inglês, pode consultar o curioso dicionário inglês/hieróglifos maias em http://www.famsi.org/mayawriting/dictionary/montgomery/ 47 176 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG 1.2 O chinês Falada por um quarto da população humana, a língua chinesa tem pelo menos 4.000 anos de existência. Inicialmente, os chineses desenhavam os objetos que queriam representar. Com o passar do tempo, passaram a combinar esses desenhos para representar ideias abstratas. Assim, o símbolo que representa “mulher”, se repetido duas vezes, significa “discussão”; “escutar” é representado por “ouvir” seguido de “porta”; “sincero” ou “verdadeiro” = “homem” + “palavra”. Atualmente, todo caractere chinês é composto de dois elementos, uma chave ou radical e um elemento fonético. Se por um lado esse novo sistema de escrita, denominado hsing shen, aumentou o número de caracteres na escrita chinesa, por outro eliminou muitas ambiguidades. A palavra k´o (rio), por exemplo, é composta por um primeiro elemento que significa fruta e que também indica como deve ser a pronúncia final da palavra. Adiciona‐ se a ele o símbolo determinativo shui, que significa água. Então, fruta + água = rio. Outros exemplos48: kung (trabalho manual) + hsin (coração) = k´ung (impaciência); kung (trabalho manual) +yen (palavra) = kung (luta) Para não haver confusão entre as dezenas de milhares de caracteres diferentes, o número e a forma de cada traço são feitos com bastante rigor. A escrita tradicional é em linhas verticais, de cima para baixo e da direita para a esquerda. Entretanto, atualmente, também encontramos textos na horizontal. 1.3 As escritas americanas pré‐colombianas O sistema de escrita dos maias e dos astecas manifestou‐se a partir do século III E.C. Até hoje não foi completamente decifrado, em parte porque os missionários espanhóis queimaram a maioria dos manuscritos astecas e praticamente todos os documentos maias. 48 http://www.omniglot.com/writing/chinese.htm 177 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG As escritas maias e astecas podem ser chamadas de transicionais por se encontrarem um pouco além da fase ideográfica, apresentando alguma fonetização. Da língua dos maias, presentes na Guatemala, Yucatán (um dos estados mexicanos) e Baixo México, só foi possível isolar os sinais dos meses e dos dias do calendário. O que se chama de Antigo Império Maia pode ser situado por volta do século I E.C. Nessa época, a matemática e a astronomia estavam bastante adiantadas e seu calendário cobria um período de 500 milhões de anos. Sobreviveram apenas três manuscritos, preservados pelo bispo Diego de Landa (mas que também destruiu grande número de manuscritos maias). Entretanto, chegaram até o presente grandes colunas monolíticas com caracteres e figuras esculpidas em baixo relevo (estelas49), pedras ovais (possíveis altares), esculturas e gravuras de metal, osso e madeira. Segundo fontes espanholas, a escrita maia foi utilizada até fins do século XVII, mas mesmo assim continua por decifrar. Para os maias, a escrita foi inventada pela divindade Itzamná, sendo seu conhecimento limitado aos sacerdotes, a seus filhos e a alguns senhores50. Nos manuscritos astecas, encontrados no México, há narrativas desenhadas e lendas em caracteres figurados, com frases de sentido vago. A escrita asteca era mais pictural do que a maia e quase todos os seus símbolos eram desenhos de algum tipo. Muitos dos símbolos tinham um valor fonético, sendo utilizados principalmente na escrita de nomes próprios, de lugares e de divindades. É uma escrita, como a maia, que exige uma descrição oral complementar. Os códices51 astecas são quase todos relacionados às divindades, aos rituais e à astrologia e até o presente encontram‐se apenas parcialmente decifrados. Já foi possível identificar divindades, nomes de pessoas e lugares, e entender certas cerimônias. Lápides de pedra usada como suporte, sobretudo em escritas antigas (CAGLIARI, 2009, p. 104). Neste site você também pode encontrar os curiosos elementos do silabário maia, confira! http://www.famsi.org/mayawriting/index.html 51 Forma característica do manuscrito em pergaminho que opõe à forma do rolo. Pode designar o próprio manuscrito ou a compilação de manuscritos (QUEIROZ, 2008, p. 6). 49 50 178 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG 1.4 A escrita cuneiforme O sistema cuneiforme ( < latim cuneus, “cunha”; forma, “forma”) é a escrita mais antiga que se conhece. Foi decifrado apenas no século XIX e sua origem continua obscura. Isso porque apresenta muitas semelhanças com outras escritas, como a dos egípcios e a dos povos do vale do Indo, situado no subcontinente indiano. Por volta de IV a.E.C, os sumérios invadem e conquistam o sul da Mesopotâmia, situada no Oriente Médio, entre os rios Eufrates e Tigre. No século XX, mais de mil tabuinhas e fragmentos foram encontrados em Ur, uma cidade da Mesopotâmia, com inscrições em língua sumérica. Inicialmente uma escrita figurativa, torna‐se transitória e finalmente ideográfica e fonética. Com o passar do tempo, os escribas suméricos se deram conta de que os caracteres tornavam‐se mais nítidos se impressos na superfície de argila endurecida ao sol do que riscados. Assim, as curvas, círculos e linhas foram substituídos por traços curtos e estreitos. Esses traços eram feitos com um pedaço reto de cana, osso, madeira dura ou metal. A escrita era feita da esquerda para a direita. Para evitar as ambiguidades dos símbolos cuneiformes, os escribas criaram os determinativos, uma classe de sinais colocados antes ou depois das palavras. Não eram pronunciados, mas indicavam a classe geral a que pertencia a palavra. 2 Sistemas fonéticos Os sistemas fonéticos de escrita visam à reprodução da sucessão de sons de uma palavra. Conforme Wilson Martins (2002, p. 40), um passo de consequências incalculáveis foi dado quando o homem, na tarefa de fixar e de transmitir o pensamento, percebeu que lhe era possível substituir a imagem visual pela sonora, colocar o som onde até então tinha obstinadamente colocado a figura. Dessa forma, o sinal se libertaria completamente do objeto e a linguagem readquiriria a sua verdadeira natureza, que é oral. Decompondo o som das palavras, o homem percebeu que ele se reduzia a unidades justapostas, mais ou menos independentes uma das outras (enquanto som) e nitidamente diferenciáveis. Essa revolução dará origem a dois tipos de escrita, a silábica e a alfabética. Vejamos cada uma delas. 179 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG 2.1 A escrita silábica Um silabário é um conjunto de símbolos escritos que representam sílabas. Em geral, a um som consonantal segue‐se um vocálico e cada marca escrita fisicamente contínua representa uma sílaba. O grego micênico e algumas línguas nativas americanas, como o cherokee, são exemplos de escrita silábica. Entendamos esse sistema a partir do exemplo dado por Sampson (1996) da escrita linear B. A linear B foi usada entre os século XIII e XVI para escrever uma forma arcaica do grego. Era escrita em tabuinhas de argila com pena e tinta. Algumas delas registram medidas de movimentos de tropas e retirada de civis antes de uma evacuação. Apenas em 1952 ela foi decifrada pelo arquiteto Michael Ventris; até então, acreditava‐se que a linear B não era grego. A partir do material encontrado, foi possível reconstruir o inventário fonológico do grego micênico. Há 73 símbolos‐sílabas ‐ da, de, di, do, du; ra, re, ri ro, ru; ta, te, ti, to, tu etc ‐ e mais 16 valores ainda não estabelecidos. A maioria dos grafes são arbitrários, isto é, o motivo pictórico não se liga de maneira óbvia à palavra grega correspondente à coisa representada. 2.2 A escrita alfabética Nessa escrita, cada sinal corresponde a uma letra. Em relação à escrita silábica, a alfabética representa não só maior complexidade ideológica como também maior simplificação técnica. Não se sabe com certeza que povo ou quais povos teria(m) criado o alfabeto. O mais provável é que foi inventada de maneira independente, por coletividades diferentes, na Suméria, no Egito, na China e na América Central (CAGLIARI, 1988). Em relação ao Ocidente, a partir da Era Comum, a escrita alfabética espalhou‐se na Europa graças aos gregos e romanos. O desejo de propagação do cristianismo aos pagãos fez com que os 180 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG apóstolos constituíssem novos alfabetos tomando por modelo o alfabeto lido por eles mesmos. Assim, os alfabetos gótico e eslavo tiveram como modelo o grego. O exemplar mais antigo de um abecedário completo foi descoberto na costa da Síria, em Ugarit, em 1929. Trata‐se de uma escrita impressa em placas de barro que vai da esquerda para a direita. Ela é a atestação da existência de uma provável escrita alfabética semítica por volta dos séculos XVI ou XV a.E.C. Os atuais Israel e Síria são, provavelmente, as regiões onde se originou a invenção do alfabeto. Diringer (1968) propõe o seguinte esquema para as principais ramificações do semítico (adaptado): Canaanita primitivo Paleosinaítico Semítico do norte Canaanita Fenício Hebraico primitivo Grego púnico Hebraico e neopúnico perfeito Íbero Libanês Todos os Tamacho Hebraico alfabetos moderno do Ocidente Aramaico Semítico do sul Nabateu Vários outros Sabeu Neosinaítico Etiópico Vários outros Árabe Amárico Tigreu Tigrínio Vários outros FIGURA 5 ‐ Principais ramificações do grupo semítico Vamos nos ater, aqui, a quatro alfabetos: o hebraico, o arábe, o grego e o latino. O alfabeto hebraico originou‐se da escrita aramaica. Esta, por sua vez, proveio da fenícia. O que se chama de hebraico quadrado é a escrita empregada durante os primeiros séculos da Era Comum para a cópia de textos sagrados. Como o protótipo fenício, possui 22 consoantes, também usadas como sinais numéricos, e sua direcionalidade é da direita para a esquerda. Para se evitarem erros de leituras dos textos sagrados, notam‐se com sinais ‐ pontos ou acentos ‐ as vogais, a pronúncia das consoantes e o lugar do acento tônico. Veja a seguir o alfabeto hebraico (“leia” da direita para a esquerda): 181 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG אבגדהוזחטיכלמנסעפצקרשת O árabe, como o hebraico, é uma escrita consonântica ainda em uso e escrita da direita para a esquerda. A origem do alfabeto árabe é obscura, apesar de a tradição atribuir sua invenção a um membro da família de Maomé. A primeira inscrição atestada em caracteres árabes é uma inscrição trilíngue em grego, siríaco e árabe, datada de 512 – 513 E.C. O alfabeto é constituído de 28 letras que podem apresentar pontos diacríticos acima ou abaixo delas. O árabe foi adotado por muçulmanos falantes de línguas não‐semíticas. Assim, por exemplo, há na Espanha literatura em língua espanhola escrita em caracteres árabes, as aljamias. A escrita árabe é “um elemento de unidade, visto que é o veículo da língua clássica compreendida por todos os letrados, ao passo que a língua falada se fragmentou em múltiplos dialetos”, como esclarece Higounet (2003). Veja: ء ى و نﻩ م ل ك ق ف غ ع ظ ط ض ص ش س ز ر ذ د خ ح ج ث ت ب ا A escrita grega tem importância ímpar para o Ocidente: além de ter sido usada para notar língua e culturas riquíssimas, foi intermediária entre o alfabeto semítico e o latino e deu origem a numerosas outras escritas. As mais antigas inscrições datam do século VIII a.E.C. Abaixo, o alfabeto grego: αβγδεζηθικλμνξοπρςστυφχψω Mas por que o alfabeto grego é o ancestral dos demais alfabetos ocidentais? A inovação em relação ao uso das vogais é a resposta certa. Como em grego são as desinências que indicam função e categoria das palavras, era preciso fixar com bastante clareza a sua posição. Os gregos adaptaram o sistema de notação semítica às particularidades de sua língua: tranformaram os sinais representativos das guturais em sinais vocálicos e criaram mais três sinais para as aspiradas. Os mais antigos testemunhos da escrita latina que chegaram até nós datam do fim do século VII ou início do século VI a.E.C. Não há dúvida de que derivam de um alfabeto 182 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG grego ocidental, provavelmente advindo da Itália que, por sua vez, teria recebido sua escrita por meio dos etruscos. No século I a.E.C, o alfabeto latino se apresenta constituído de 23 letras. Nos séculos II e III, surgem duas novas grafias, a uncial e a nova escrita comum. Por volta dos séculos VI e VII, o ato de escrever se concentrará nos scriptoria52 eclesiásticos, resultado do desenvolvimento da liturgia e do esfriamento da atividade econômica em geral. No início do século IX, podemos observar o retorno a um tipo comum de escrita, a carolíngia, constituída essencialmente nos scriptoria franceses do Reno e de Loire. A reforma educacional feita por Carlos Magno, durante seu reinado (768 – 814), cria uma demanda de manuscritos que favorecerá o desenvolvimento dessa escrita mais normatizada. Esse imperador restaura antigas escolas e funda novas, na tentativa de reviver o saber clássico, unificando e fortalecendo seu império. A escrita carolíngia inicia a história da escrita medieval e moderna e dá à Europa ocidental um mesmo tipo de escrita. Apenas no século XIII começa a mudar de forma, sendo substituída pela escrita gótica. Há outras transformações: Nos séculos XII e XIII, a arte de escrever, até então essencialmente monástica, se difundiu amplamente no mundo secular e leigo. A renovação intelectual e a criação das universidades provocou uma necessidade sempre crescente de livros. A produção e a venda de manuscritos são a partir de então organizadas nas corporações, com estatutos e privilégios, sob o controle das autoridades acadêmicas. Por outro lado, o desenvolvimento da administração nos grandes Estados ocidentais, o renascimento do direito romano e a extensão do notariado fizeram crescer consideravelmente a necessidade dos escritos. Por volta de 1200 se constituem as grandes chancelarias ‐ e, logo depois, a burocracia ‐ pontifícias, francesa e inglesa; no início do século XIII também o notariado ganhou da Itália todo o sul da França. E o impulso da vida econômica, do grande comércio, dos bancos multiplicaram igualmente as razões de escrever (HIGOUNET, 2003, p. 58). Nos séculos XIV e XV, as palavras passam a ser escritas sem se levantar a pena do papel, fragmentando a escrita gótica em uma grande variedade de tipos por toda a Europa. No Renascimento, surge uma escrita para livros, a humanística. Será entre os tipos de escritas Sala dos monastérios medievais usada para a elaboração e cópia de manuscritos pelos escribas. 52 183 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG da Idade Média que os primeiros fundidores de tipos gráficos escolherão seus modelos e deles se originam nossas escritas atuais. 3 A escrita hoje e amanhã Dois elementos são de grande importância para mudanças ocorridas nos sistemas de escrita em geral: a invenção da imprensa e a informática. A imprensa e sua grafia mecânica permitiram a reprodução de uma enorme gama de grafemas sempre idênticos a si mesmos e que pouco mudaram desde então. Há muita polêmica em relação ao nascimento dessa nova técnica, mas autores como Higounet (2003) acreditam que seu responsável foi João Gutemberg, em Mainz, na Alemanha, por volta de 1450. Ao mesmo tempo em que possibilita grande flexibilidade, a informática também favorece a padronização dos sistemas de escrita. Ao redigir um texto utilizando o programa Word ou similar, o usuário tem uma gama enorme de opções para a apresentação do sistema de escrita em questão, na tela ou no papel. Entretanto, se todos utilizam o mesmo programa, têm‐se apenas as opções por ele propostas. Quanto mais amplo for o uso de computadores pelas pessoas, maior a tendência à padronização. Muitos de nós, por exemplo, já sentem algum desconforto ao escrever um texto a mão. Esta sensação de estranhamento em relação à escrita manuscrita é consequência, evidentemente, da falta de prática. Como o uso da informática para expressão da escrita é algo recente, ainda não podemos avaliar com grande clareza as sua consequências para os sistemas de escrita em geral. Conclusão Aqui termina nossa viagem pela evolução da escrita. Conforme Ong (1998), e como você deve ter comprovado após a leitura do texto, a escrita amplia praticamente de forma ilimitada a potencialidade da linguagem, além de reestruturar o próprio pensamento de seus usuários. Nossa consciência e até mesmo nosso discurso oral são profundamente 184 Fundamentos de Linguística comparada / Faculdade de Letras da UFMG afetados pela tecnologia da escrita. Se somos letrados, processamos o mundo a partir de uma capacidade estruturada pela escrita e não apenas de nossa capacidade inata e natural. Não devemos nos esquecer, entretanto, de que o fato de a escrita gozar de grande importância para a nossa cultura não deve diminuir o valor da língua oral e a necessidade de estudá‐la e de respeitá‐la em toda a sua variedade. Referências CAGLIARI, Luiz Carlos. Alfabetização e linguística. São Paulo: Scipione, 1988. CAGLIARI, Luiz Carlos. A história do alfabeto. São Paulo: Paulistana, 2009. DIRINGER, David. A escrita. Lisboa: Verbo, 1968. FERREIRA, Aurélio B. de H. Novo dicionário da língua portuguesa. Rio de Janeiro: Nova Fronteira, s/d. FISCHER, Steven R. A History of Writing. Bury St Edmunds: St Edmundsbury Press, 2003. HIGOUNET, Charles. História concisa da escrita. São Paulo: Parábola, 2003. HORCADES, Carlos M. A evolução da escrita. Rio de Janeiro: Editora Senac Rio, 2004. HOUAISS, Antônio. Dicionário Houaiss da língua portuguesa. Rio de Janeiro: Objetiva, 2001. MARTINS, Wilson. A palavra escrita. São Paulo: Ática, 2002. www.omniglot.com/writing/definition.htm. Acesso em: 20 ago. 2011. ONG, Walter. Oralidade e cultura escrita. Campinas: Papirus, 1998. QUEIROZ, Sônia (Org.). Glossário de termos de edição. Belo Horizonte: Fale/UFMG, 2008. SAMPSON, Geoffrey. Sistemas de escrita. São Paulo: Ática, 1996. SAUSSURE, Ferdinand de. Curso de linguística geral. São Paulo: Cultrix, s/d. LEITURA COMPLEMENTAR Veja os seguintes vídeos em português produzidos pelo Ministério da Educação e Cultura do governo brasileiro, com consultoria científica do linguista L. C. Cagliari: Construção da escrita ‐ Parte 1 http://www.youtube.com/watch?v=oXoGEHyGQzY Construção da escrita ‐ Parte 2 http://www.youtube.com/watch?v=BAzeoLfQerM&feature=related 185