VOCALICIDADE E CONSONANTALIDADE NAS LÍNGUAS EUROPÉIAS:
ESTUDO DAS TERMINAÇÕES DE PALAVRAS COM VISTAS
AO ESTABELECIMENTO DE UMA TIPOLOGIA
Resumo: O presente trabalho estabelece uma tipologia das palavras nas línguas européias em termos de
suas terminações, propondo o cálculo de um coeficiente que permita quantificar o grau de vocalicidade ou
consonantalidade dessas terminações. A partir dessa tipologia, analisa estatisticamente as terminações de
palavras em oito línguas européias modernas (quatro românicas e quatro germânicas) e também no latim
clássico com o objetivo de calcular o coeficiente de vocalicidade/consonantalidade de cada uma dessas
línguas.
Palavras-chave: Vocalicidade, consonantalidade, línguas européias, terminações de palavras.
Abstract: This paper establishes a word typology in European languages in terms of their endings,
proposing the calculation of a coefficient that allows to quantify the degree of vocalicity or consonantality
of these endings. Starting from this typology, one statistically analyses the word endings in eight modern
European languages (four Romance and four Germanic) as well as in classic Latin aiming at calculating
the vocalicity/consonantality coefficient of each of these languages.
Keywords: Vocalicity, consonantality, European languages, word endings.
Introdução
Observa-se intuitivamente a existência de três tipos de línguas: aquelas em que predominam as
terminações vocálicas, como, por exemplo, o italiano; aquelas em que predominam as terminações
consonantais, como o inglês e o alemão; e aquelas que apresentam ambas as terminações em quantidades
equilibradas (o português, o latim, o russo, etc.). Existe, portanto, uma impressão intuitiva de que algumas
línguas são mais “vocálicas” enquanto outras são mais “consonantais”. O conceito intuitivo de
consonantalidade está geralmente ligado à possibilidade que uma língua oferece de realizar encontros
consonantais os mais variados no interior de palavra, assim como de terminar palavras com as mais
diversas consoantes. Igualmente, o conceito intuitivo de vocalicidade se prende à noção de que, numa
determinada língua, a ocorrência de encontros consonantais é mais restrita, bem como predominam
palavras terminadas em vogais, ditongos ou consoantes líquidas. Nesse sentido, é possível estabelecer o
grau de vocalicidade/consonantalidade de uma língua com base em tais critérios e chegar-se mesmo a
uma tipologia lingüística. O fato é que parece existir por parte dos falantes ingênuos de línguas européias
a impressão de que as línguas românicas (português, espanhol, francês, italiano, etc.) são
predominantemente vocálicas enquanto as línguas germânicas (inglês, holandês, alemão, sueco, etc.) são
predominantemente consonantais. Até que ponto essa impressão corresponde à verdade é o que esta
pesquisa pretendeu verificar.
Fundamentos teóricos
Todas as línguas européias, com exceção do basco, do húngaro, do finlandês, do estoniano e do
lapão, descendem do indo-europeu, língua de existência hipotética que supostamente teria sido falada em
época pré-histórica na região da Ásia Menor, e cuja expansão e dialetação teria dado origem, dentre
outras línguas, ao sânscrito, ao grego, ao latim, ao antigo celta, ao antigo eslavo, ao antigo germânico, etc.
Desse modo, tanto as línguas românicas, descendentes do latim vulgar, quanto as germânicas,
descendentes do antigo germânico, são línguas indo-européias. Sabe-se, por reconstrução, que o indoeuropeu era uma língua flexional, na qual, portanto, as desinências e vogais temáticas desempenhavam
importante papel na determinação das funções morfossintáticas das palavras. Em virtude disso, o indoeuropeu admitia palavras terminadas em todas as vogais (a, e, i, o, u breves ou longas, além de três tipos
de vogais laringais, normalmente representadas por ´1, ´2 e ´3), e também nas consoantes t, d, k’, k, q, m,
n, r, l e s, além de suas combinações (Pisani, 1939; Krahe, 1974). Em meio de palavra, os encontros
consonantais eram bastante variados, embora fosse comum o fenômeno da assimilação. Tais
características fonético-fonológicas foram herdadas tanto pelo latim quanto pelo germânico.
No latim vulgar, houve uma tendência ao desaparecimento das consoantes finais (Lausberg, 1970;
Ilari, 1997), como nos seguintes exemplos: amat > ama, patrem > patre, corpus > corpu, etc. Em geral, o
encontro consonantal em final de palavra se transformava em consoante simples: amant > aman. Essa
tendência fez com que a maioria das palavras do latim vulgar — e, conseqüentemente, das línguas
românicas — terminasse em vogal, semivogal ou semiconsoante (isto é, consoante nasal ou líquida). Isso
explica, em princípio, a tendência à vocalicidade das línguas românicas. Posteriormente, algumas dessas
línguas perderam a vogal final sob certas condições, o que fez reaparecer algumas terminações
consonantais (por exemplo, latim vulgar cattu > francês chat).
Na passagem do antigo germânico para as línguas germânicas modernas ocorreu fenômeno inverso
ao do latim (Krahe, 1977): as vogais finais caíram ou abreviaram-se, daí resultando um grande número de
palavras terminadas em consoantes (por exemplo, germânico bero > inglês bear, germânico nēdlō >
alemão Nadel, etc.).
Em início e meio de palavra, os encontros consonantais existentes no latim e no germânico, os quais
haviam sido herdados do indo-europeu, conservaram-se melhor, uma vez que a evolução fonética atingiu
com maior intensidade o final das palavras, mantendo os sons iniciais e mediais relativamente ao abrigo
de transformações fonéticas mais drásticas.1 Desse modo, pode-se dizer que a freqüência e o tipo de
encontros consonantais encontráveis tanto nas línguas românicas quanto nas germânicas é praticamente o
mesmo em ambas as famílias lingüísticas. Entretanto, como nas línguas germânicas o principal processo
neológico é a composição, ao passo que nas românicas é a derivação (Rey, 1979), existe hoje no inglês,
no alemão, etc., um grande número de encontros consonantais em palavras compostas, resultantes da
combinação do final consonantal de uma palavra simples com o início consonantal de outra palavra
simples (por exemplo, o alemão gastfrei, resultante da composição de Gast e frei). Assim, o estudo desses
encontros consonantais se reduz ao estudo das terminações das palavras simples. Nas línguas românicas,
a composição se dá em geral entre palavras terminadas por vogal (por exemplo, português pára + peito =
parapeito); quando isso não ocorre, lança-se mão de uma vogal de ligação que suaviza o encontro
consonantal (por exemplo, odor + fero = odorífero) (cfr. Kehdi, 1992).
A hipótese de base deste trabalho é a de que nas línguas românicas em geral, notadamente no
português, espanhol e italiano, predominam palavras terminadas em vogal, semivogal ou consoante fraca
(sibilante, nasal ou líquida), sendo que nas palavras variáveis ou flexionais encontramos as vogais
temáticas a, e, i, o e u e desinências formadas igualmente por essas vogais, seguidas ou não de consoantes
fracas, com raros encontros consonantais em posição final absoluta de palavra. Já no francês e nas línguas
germânicas parecem predominar palavras terminadas em consoantes tanto fracas quanto fortes (inclusive
e principalmente oclusivas), encontros consonantais ou semivogais, ao passo que a única vogal temática
dessas línguas é o e, que é mudo em francês e inglês e soa como um chevá bastante reduzido
(representado no alfabeto fonético internacional por [´]) nas demais línguas. Nessas línguas, em geral
quando encontramos palavras terminadas em outras vogais que não o e, estas não são vogais temáticas ou
desinências, mas sim pertencem ao radical da palavra, sendo a vogal temática ou desinência “zero”.
Assim, o caráter vocálico/consonantal das palavras variáveis das línguas estudadas estaria ligado à
própria morfologia das mesmas. Nesse sentido, teríamos a oposição entre línguas com vogal temática ou
desinência “cheia” e línguas com vogal temática ou desinência “vazia” ou “zero”. Nas palavras
invariáveis ou não-flexionais, em que não há vogais temáticas ou desinências, permanece ainda assim a
dicotomia vogal/consoante, especialmente porque muitas dessas palavras são, na verdade, antigas
palavras variáveis que se cristalizaram com o uso, tornando-se invariáveis ao mudarem de classe
gramatical (por exemplo, o adjetivo português conforme, que deu origem à conjunção conforme). Da
mesma forma, o advérbio outrora resulta da composição das palavras flexionais outra e hora, assim como
as preposições durante e mediante são originalmente adjetivos. Em todos esses casos, consideramos tais
palavras como flexionais e, portanto, portadoras de vogal temática e desinências.
As palavras variáveis ou flexionais (substantivos, adjetivos, verbos, alguns pronomes pessoais e
indefinidos, alguns numerais cardinais e todos os ordinais, artigos) constituem-se em geral de pelo menos
um radical, eventualmente acompanhado de afixos, além de possuírem uma vogal temática que as
enquadra num paradigma de flexão e uma ou mais desinências, que realizam a flexão da palavra em
termos de gênero, número, caso, tempo, modo, aspecto, pessoa, etc. Já as palavras invariáveis ou nãoflexionais (advérbios, preposições, conjunções, demais pronomes, interjeições) constituem-se apenas de
um radical (raramente mais de um), sem vogais temáticas ou desinências.
Em indo-europeu, assim como também em latim e em germânico, havia vogais temáticas nominais e
verbais; as primeiras figuravam em substantivos, adjetivos, advérbios, pronomes demonstrativos e
numerais, enquanto as segundas apareciam basicamente nos verbos. Se no indo-europeu a distinção entre
vogal temática e desinência era bastante clara na maioria dos casos, em latim e germânico a evolução
fonética conduziu à assimilação e por vezes fusão das duas categorias de morfemas, especialmente nas
palavras nominais. Assim, no latim equi, por exemplo, a terminação -i indica ao mesmo tempo que essa
palavra pertence à segunda declinação (vogal temática o) e se encontra no caso nominativo plural.
Fenômeno semelhante ocorre no germânico. Desse modo, a acumulação das funções temática e
desinencial na mesma terminação conduz a que, nas línguas românicas e germânicas modernas, as noções
tradicionais de vogal temática nominal e desinência possam ser substituídas pelo conceito operacional e
simplificador de apêndice. As palavras flexionais compõem-se assim de um núcleo (isto é,
radical/radicais + afixos) e de um apêndice (vogal temática + desinências). Assim, em rosas vermelhas,
costuma-se considerar o -a- do substantivo rosas como vogal temática e o -a- do adjetivo vermelhas
como desinência de gênero, ao passo que o -s é visto como desinência de número em ambas as palavras
(Ferreira, 1988). Chamaremos simplesmente de apêndice tanto ao elemento -as de rosas quanto ao -as de
vermelhas. Isso porque no próprio latim a vogal final dos adjetivos nada mais era do que uma vogal
temática nominal. Numa flexão de gênero como no adjetivo latino bonus, bona, bonum, temos que bonus
e bonum pertencem à segunda declinação (vogal temática o), ao passo que bona pertence à primeira
(vogal temática a). Raciocínio análogo se aplica ao germânico.
Nos verbos, a distinção entre vogal temática e desinências se conservou melhor, embora as vogais
temáticas verbais do latim e do germânico procedam em alguns casos de antigos sufixos indo-europeus.
Para fim deste estudo, que é estritamente fonético-fonológico, a noção de terminação não coincidirá
necessariamente com o conceito aqui proposto de apêndice, embora a tipificação e classificação das
terminações exija o exame dos apêndices. Como são analisados os fonemas finais das palavras, no caso
de palavra terminada por vogal temática e/ou desinência zero, a terminação pode fazer parte do próprio
radical. Assim, em azul, por exemplo, o apêndice (vogal temática + desinências) é zero (representado por
∅) e a terminação a ser estudada é -ul. A classificação dessa palavra, segundo critério exposto a seguir,
leva em consideração ambos os elementos. Esse critério também facilita o estudo das palavras
invariáveis, em que não há apêndices. Por outro lado, em formas verbais como amaram, por exemplo, o
apêndice é -aram, mas a terminação a ser estudada e classificada é -am.
Critério de classificação de terminações de palavras
Chama-se aqui de terminação ao conjunto formado pela ultima vogal da palavra e a(s) consoante(s)
que porventura a siga(m). Assim, na palavra amor, a terminação é -or; na palavra carro, a terminação é -o.
Nas palavras flexionais, algumas vezes a terminação coincide com o apêndice; outras vezes, o apêndice é
zero e a terminação faz parte do núcleo da palavra. Assim, por exemplo, no sueco kronor, o núcleo é
kron- e o apêndice é -or. Já em motor, o núcleo é motor- e o apêndice é zero. Em ambos os casos, a
terminação é -or.
A partir dessa definição, analisaram-se as terminações das palavras nas línguas românicas e
germânicas, procurando quantificar essas tendências através do estabelecimento de uma tabela de 9 graus
de consonantalidade. Coletaram-se palavras de um corpus aleatório, e a freqüência de ocorrência de
cada grau foi estabelecida. A seguir, calculou-se o coeficiente de consonantalidade de cada língua
segundo a fórmula:
9
Cc =
∑ gifi
i =1
9
∑ fi
i =1
onde Cc = coeficiente de consonantalidade, gi = grau de consonantalidade i e fi = freqüência de ocorrência
do grau de consonantalidade i. Essa fórmula produz a média ponderada de todos os graus de
consonantalidade encontrados no corpus em função de sua freqüência no mesmo.
Se se quiser instituir uma tabela de graus de vocalicidade, ela será o inverso da tabela de graus de
consonantalidade, isto é, enquanto uma varia de 1 a 9, a outra variaria de 9 a 1, e, portanto, o coeficiente
de vocalicidade será dado pela fórmula:
Cv = 9 – Cc
Para realizar a presente análise, dividiram-se as palavras em dois grupos: palavras flexionais,
formadas de núcleo e apêndice (substantivos, adjetivos, verbos e alguns tipos de pronomes, numerais
ordinais e artigos); e palavras não-flexionais, formadas apenas de núcleo, sem apêndice (em geral,
advérbios, pronomes, numerais cardinais, preposições e conjunções).
Nas palavras flexionais, procedeu-se à classificação das terminações em graus de consonantalidade
examinando em primeiro lugar o apêndice (nominal ou verbal); se este era ∅ ou -s, examinou-se a
terminação do núcleo. Nas palavras não-flexionais, fez-se a classificação das terminações em graus de
consonantalidade examinando diretamente a terminação do núcleo, que é também a terminação da
palavra.
Chamam-se consoantes fracas o l, m, n, r e s (líquidas, nasais e sibilante). As consoantes fortes são
as oclusivas (p, t, c, k, q, b, d, g) e mais f, v, z, x e j (esta última quando soa como consoante). Encontros
consonantais fracos são consoantes fracas seguidas de s: ls, ms, ns, rs. Encontros consonantais fortes são
todos os demais: ln, nt, rts, ct, mps, rfs, etc.).
Com base nessas definições, temos então as seguintes tabelas de graus de consonantalidade. (Nos
exemplos a seguir, assim como no corpus, o apêndice é separado do núcleo por uma barra [/] e a
terminação é sublinhada.)
GRAU
1
2
3
4
5
6
7
8
9
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
PALAVRAS VARIÁVEIS
TERMINAÇÃO
apêndice terminado em a, i, o, u final (português cas/a)
apêndice terminado em a, o + semivogal (i, u) ou u + i ou i + u (grego hípp/oi)
apêndice terminado em a, i, o, u + consoante fraca (port. cant/am)
apêndice terminado em a, i, o, u + encontro consonantal fraco (port. for/uns)
apêndice terminado em a, o + semivogal + s (gr. hípp/ous)
apêndice terminado em e final (port. carn/e)
apêndice terminado em a, i, o, u + consoante forte (latim am/at)
apêndice ∅ ou -s com núcleo terminado em vogal (francês infini/s)
apêndice terminado em e + semivogal (romeno muzic/ei)
apêndice terminado em a, i, o, u + encontro consonantal forte (lat. am/ant)
apêndice ∅ ou -s com núcleo terminado em semivogal (inglês journey/s)
apêndice terminado em e + consoante fraca (espanhol sab/en) ou em e + semivogal +
consoante fraca (port. andáv/eis)
apêndice ∅ ou -s com núcleo terminado em consoante fraca (ing. origin/∅)
apêndice terminado em e + encontro consonantal fraco (alemão Herz/ens)
apêndice ∅ ou -s com núcleo terminado em encontro consonantal fraco (fr. univers/∅)
apêndice terminado em e + consoante forte (al. lass/et)
apêndice ∅ ou -s com núcleo terminado em consoante forte (fr. institut/∅)
apêndice terminado em e + encontro consonantal forte (fr. chant/ent)
apêndice ∅ ou -s com núcleo terminado em encontro consonantal forte (ing. pact/∅)
OBSERVAÇÃO: A vogal e recebeu um tratamento separado das demais vogais porque tem um caráter
“consonantal” mais forte. Não que essa vogal seja acusticamente mais ruidosa que as demais, mas
acontece que as línguas que se caracterizam por maior abundância de terminações consonantais, como o
francês e as línguas germânicas, tenderam a transformar todas as vogais finais átonas em ∅ ou e
(pronunciado como [´] ou mudo). Distinguem-se, assim, línguas que admitem todas as terminações
vocálicas átonas e aquelas que praticamente só admitem palavras terminadas em consoante ou e. Por isso,
na tabela acima, as terminações cuja vogal é e possuem um grau de consonantalidade superior ao das
terminações com as demais vogais.
GRAU
1
2
3
4
5
6
7
8
9
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
PALAVRAS INVARIÁVEIS
TERMINAÇÃO
palavra terminada em a, i, o, u final átono (port. quando)
palavra terminada em a, o átono + semivogal ou u + i ou i + u (gr. pálai)
palavra terminada em a, i, o, u átono + consoante fraca (lat. nunquam)
palavra terminada em a, i, o, u átono + encontro consonantal fraco (al. niemals)
palavra terminada em e final átono (port. quase)
palavra terminada em vogal tônica (port. aqui)
palavra terminada em a, i, o, u átono + consoante forte (sueco något)
palavra monossilábica terminada em vogal ou semivogal (ing. to, it. mai)
palavra terminada em a, i, o, u átono + encontro consonantal forte (al. allerdings)
palavra terminada em e átono + semivogal (al. dabei)
palavra terminada em vogal tônica + semivogal (catalão avui)
palavra monossilábica terminada em consoante fraca (esp. las) ou em ditongo decrescente
+ consoante fraca (port. seus)
palavra terminada em e átono + consoante fraca (ing. after)
palavra terminada em vogal tônica + consoante fraca (port. assim)
palavra monossilábica terminada em encontro consonantal fraco (ing. hers)
palavra terminada em e átono + encontro consonantal fraco (al. anders)
palavra terminada em vogal tônica + encontro consonantal fraco (fr. toujours)
palavra monossilábica terminada em consoante forte (ing. but)
palavra terminada em e átono + consoante forte (lat. donec)
palavra terminada em vogal tônica + consoante forte (ing. amid)
palavra monossilábica terminada em encontro consonantal forte (ing. forth)
palavra terminada em e átono + encontro consonantal forte (al. gestern)
palavra terminada em vogal tônica + encontro consonantal forte (fr. pourtant)
Material e métodos
A presente pesquisa objetivou fazer um levantamento estatístico do léxico de quatro línguas
românicas (português, espanhol, francês e italiano) e de quatro línguas germânicas (inglês, alemão, sueco
e norueguês) a partir de um corpus formado de textos contemporâneos extraídos de sites jornalísticos da
Internet, com vistas a uma classificação dos tipos de terminações de palavra e posterior estabelecimento
de uma tipologia de cada língua estudada com base nos tipos de terminação predominantes. Isso permitiu
estabelecer o grau de vocalicidade ou consonantalidade de cada língua no que tange às suas terminações,
provavelmente o principal diferencial fonológico entre elas. A escolha de um corpus formado de
hipertextos se deveu à grande disponibilidade e facilidade de obtenção desse tipo de material por meio da
rede mundial de computadores, evitando assim a necessidade de digitalização de textos impressos, sempre
trabalhosa e sujeita a erros; quanto à escolha do universo de discurso jornalístico, deveu-se ao fato de esse
universo, em função de seu próprio público-alvo, utilizar um nível de linguagem bastante fiel ao uso
contemporâneo da língua, ao contrário de textos científicos ou jurídicos, por exemplo, que possuem um
caráter mais restritivo em relação ao léxico e mais conservador em relação à gramática. Isso se mostra
particularmente evidente no que tange ao uso de certos neologismos estrangeiros, bastante comum nos
meios de comunicação de massa, mas não em textos mais acadêmicos. A presença de estrangeirismos
lexicalizados contribui, a longo prazo, para a própria mudança do sistema fonológico de uma língua,
como ocorreu com as palavras francesas no inglês. Quanto a textos ficcionais, não se recomenda seu uso
em pesquisas desta natureza, uma vez que diversos recursos fonéticos de cunho estilístico, como
assonâncias e aliterações, por exemplo, costumam ser usados nesse tipo de discurso, o que pode mascarar
o comportamento fonológico real da língua.
A título de comparação e estabelecimento de um parâmetro da análise, realizou-se também um
levantamento estatístico semelhante sobre uma amostra de texto não-ficcional em latim clássico, este
digitalizado a partir de livro, dada a inexistência de textos em latim na Internet.
Cumpre aqui fazer a ressalva de que o francês, por possuir muitas consoantes finais mudas, que
outrora foram pronunciadas, apresenta palavras com terminação consonantal na escrita e vocálica na fala
(por exemplo, secret pronunciado [s´»k{E]). Por outro lado, como o e final das palavras francesas costuma
ser mudo e, portanto, o último som pronunciado é a consoante imediatamente anterior, temos em
contrapartida palavras com terminação vocálica na escrita e consonantal na fala (por exemplo, secrète
pronunciado [s´»k{Et]). Cabe acrescentar ainda que em algumas regiões da França o e final é pronunciado
e em outras não; em certas regiões, o som [´] é acrescentado até mesmo ao final de palavras terminadas
em consoante (por exemplo, Brésil é pronunciado [b{e»zil´]), constituindo-se, pois, num traço dialetal.
No chamado francês padrão, esse e é considerado mudo. (Confira a esse respeito Bizzocchi, 1993.)
Constituíram-se nove bancos de dados lexicais, cada um correspondendo a uma das línguas
estudadas. Cada palavra coletada constituiu um registro no respectivo banco de dados e teve seu apêndice
(no caso das palavras variáveis) e sua terminação destacados e classificados segundo o critério fonéticofonológico exposto no item anterior.
Cada banco de dados corresponde a uma amostra de 200 palavras por língua. Quanto à escolha do
tamanho da amostragem, em outro trabalho (Bizzocchi, 1998), estudou-se em pormenor a questão da
representatividade de uma amostra léxica tanto em face da extensão do léxico das línguas de cultura
quanto em face da extensão da dianorma léxica, tal qual definida por Barbosa (1996).
Foram excluídos do corpus nomes próprios, xenismos (isto é, palavras estrangeiras não incorporadas
ao léxico da língua), numerais que não estivessem grafados por extenso, siglas e demais sinais gráficos
não alfabéticos, como, por exemplo, símbolos de moedas nacionais e outros.
Como foi dito anteriormente, cada palavra do corpus teve sua terminação classificada segundo a
tabela de graus de consonantalidade/vocalicidade aqui proposta, isto é, foi atribuída a cada terminação de
palavra um número inteiro entre 1 e 9. Ao final, pôde-se medir a freqüência de cada tipo de terminação
mediante um procedimento estatístico e assim quantificar as tendências vocálicas ou consonantais de cada
língua. A comparação dos comportamentos estatísticos das várias línguas permitiu testar a consistência ou
não da hipótese de base.
Fizeram-se dois tipos de quantificações: em primeiro lugar, calcularam-se os coeficientes de
consonantalidade (Cc) e de vocalicidade (Cv) de cada língua, com vistas a estabelecer, de forma absoluta,
uma espécie de perfil fonético-fonológico dessas línguas no que tange às terminações das palavras. Em
segundo lugar, quantificou-se a freqüência de apêndices vazios (isto é, zero ou consoantes) em cada
língua. Ocorre que, nas línguas chamadas a priori de “vocálicas”, parece haver uma menor freqüência de
apêndices vazios e estes em geral só ocorrem quando a terminação do núcleo (que neste caso coincide
com a terminação da palavra) é branda (isto é, vocálica, semivocálica ou consonantal fraca). Já nas
línguas ditas “consonantais”, os apêndices vazios parecem ser mais freqüentes, ocorrendo inclusive
quando o núcleo termina em consoante ou encontro consonantal fortes. Nesse caso, pode-se estabelecer
também um perfil morfológico das terminações das palavras. Essas hipóteses também foram testadas
empiricamente no corpus.
Além disso, separaram-se as palavras monossilábicas das não-monossilábicas e realizou-se novo
cálculo de Cc e Cv, visto que, nas palavras monossilábicas, a freqüência de terminações consonantais,
semiconsonantais e semivocálicas é mais alta mesmo nas línguas em que predominam as terminações
vocálicas, dada a própria estrutura silábica dessas palavras.
Resultados
O cálculo do coeficiente de consonantalidade (Cc) e de vocalicidade (Cv), com seu respectivo
desvio-padrão (F) e coeficiente de variação2 (L) para as amostras de 200 palavras produziu os resultados
exibidos na Tabela 1.
Tabela 1
Cc
Cv
F
L
Cc ± F
Port.
Esp.
Fr.
It.
Ing.
Al.
Su.
Nor.
Lat.
3,30
5,70
1,82
0,55
1,485,12
3,40
5,60
1,90
0,56
1,505,30
5,23
3,77
1,55
0,30
3,686,78
2,84
6,16
1,71
0,60
1,134,55
6,05
2,95
1,79
0,30
4,267,84
5,98
3,02
1,63
0,27
4,357,61
5,44
3,56
2,46
0,45
2,987,90
5,92
3,08
1,80
0,30
4,127,72
3,09
5,91
2,04
0,66
1,055,13
A partir dessa tabela, foi possível construir o Gráfico 1.
Gráfico 1
7
6
5
4
3
Cc
2
Lat.
Nor.
Su.
Al.
Ing.
It.
Fr.
Esp.
0
Port.
1
Como se pode observar, as línguas germânicas de fato se mostraram mais consonantais que as
românicas. No entanto, o francês apresentou um Cc quase tão alto quanto o das línguas germânicas,
pouco inferior ao do sueco. Aliás, dentre as línguas germânicas, observa-se um Cc um pouco mais baixo
no sueco, certamente devido à presença das terminações nominais -a, -ar, -or e das terminações verbais -a
e -ar, que contêm as vogais temáticas a e o.
Dentre as línguas românicas, a mais vocálica é o italiano, ao passo que o espanhol e o português
demonstraram perfis semelhantes. O Cc do latim ficou entre o das línguas ibéricas e o do italiano. Por
outro lado, se analisarmos não apenas os valores pontuais de Cc mas o intervalo médio de variação desse
coeficiente (Cc ± F), veremos que o Cc latino assume valores próximos de 1, chegando até pouco acima
de 5. As línguas ibéricas apresentam praticamente o mesmo limite superior, mas têm um limite inferior
pouco acima do latim. Já o italiano tem seu Cc mínimo próximo do latino, mas seu Cc máximo é inferior
ao do latim, o que significa que palavras com terminação vocálica absoluta (a, i, o ou u) são tão
freqüentes em italiano quanto em latim, mas este apresenta terminações consonantais em t ou em x, por
exemplo, que inexistem em italiano.
O Cc do inglês, do alemão e do norueguês variam aproximadamente entre 4 e 8; o Cc do sueco varia
aproximadamente de 3 a 8, o que revela igual freqüência de terminações consonantais fortes em todas
essas línguas, mas uma presença maior de terminações vocálicas no sueco, pela razão já exposta acima.
Ao dividir cada amostra em duas, separando as palavras monossilábicas das não-monossilábicas,
obtiveram-se as Tabelas 2 e 3, respectivamente, a partir das quais chegou-se aos Gráficos 2
(monossílabos) e 3 (não-monossílabos).
Tabela 2
Cc
Cv
F
L
Cc ± F
Port.
Esp.
Fr.
It.
Ing.
Al.
Su.
Nor.
Lat.
4,39
4,61
0,67
0,15
3,725,06
4,41
4,59
0,59
0,13
3,825,00
5,10
3,90
1,51
0,30
3,596,61
4,45
4,55
0,77
0,17
3,685,22
6,00
3,00
1,70
0,28
4,307,70
6,00
3,00
1,57
0,26
4,437,57
5,85
3,15
1,57
0,27
4,287,42
5,79
3,21
1,53
0,26
4,267,32
5,44
3,56
2,21
0,41
3,237,65
Gráfico 2
6
5
4
3
Cc monossílabos
2
1
0
Port.
Fr.
Ing.
Su.
Lat.
Dentre os monossílabos, observa-se um certo nivelamento entre todas as línguas, com valores de Cc
variando entre 4 e 6. Os valores do português, espanhol e italiano são praticamente idênticos (aprox. 4,4);
os monossílabos franceses têm terminações um pouco mais consonantais (aprox. 5). Acima deles estão os
latinos (aprox. 5,4), os escandinavos (aprox. 5,8) e os ingleses e alemães (exatamente 6).
O intervalo de variação também apresentou resultados parecidos em português, espanhol e italiano
(aprox. entre 3,7 e 5). O francês variou aproximadamente entre 3,6 e 6,6. As línguas germânicas
oscilaram aproximadamente entre 4 e 7. O latim, entre 3,23 e 7,65, ou seja, seu valor mínimo é inferior ao
das línguas românicas, ao passo que seu valor máximo é comparável ao das línguas germânicas. O latim
é, portanto, a língua que apresentou o mais amplo espectro de variação no que concerne aos
monossílabos.
Tabela 3
Cc
Cv
F
L
Cc ± F
Port.
Esp.
Fr.
It.
Ing.
Al.
Su.
Nor.
Lat.
2,86
6,14
1,96
0,69
0,904,82
2,75
6,25
2,16
0,79
0,594,91
5,34
3,66
1,61
0,30
3,736,95
2,13
6,87
1,50
0,70
0,633,63
6,07
2,93
1,86
0,31
4,217,93
5,97
3,03
1,68
0,28
4,297,65
5,12
3,88
2,94
0,57
2,188,06
6,05
2,95
2,00
0,33
4,058,05
2,63
6,37
1,66
0,63
0,974,29
Gráfico 3
7
6
5
4
3
Cc não-monossílabos
2
Lat.
Nor.
Su.
Al.
Ing.
It.
Fr.
Esp.
0
Port.
1
O comportamento do Cc das amostras de não-monossílabos assemelha-se bastante ao
comportamento do Cc das amostras completas. Temos o latim, o italiano, o espanhol e o português com
valores abaixo de 3, o francês e o sueco com valores pouco acima de 5, e o inglês, alemão e norueguês
com valores em torno de 6.
Em relação ao intervalo de variação dos graus de consonantalidade, o italiano mostrou-se mais
vocálico que o latim, apresentando um comportamento parecido com o das línguas ibéricas. O teto das
línguas germânicas ficou em torno de 8 e o do francês, em torno de 7. O piso do intervalo dessas línguas
situou-se em torno de 4, com exceção do sueco, que teve seu piso pouco acima de 2. O sueco, aliás, foi a
língua a apresentar o intervalo de variação mais amplo.
O percentual de apêndices vazios, isto é, do tipo zero ou exclusivamente consonantal, é exibido na
Tabela 4. Como se pode notar, a maior taxa de apêndices vazios coube ao inglês, e a menor, ao latim. O
índice do italiano é quase tão baixo quanto o do latim. Já os índices do francês, do alemão, do sueco e do
norueguês ficaram todas pouco acima dos 30%. As taxas do português e do espanhol se aproximam, com
pequena vantagem para o português.
Tabela 4
Port.
21,5
Esp.
16,0
Fr.
31,5
It.
5,0
Ing.
45,5
Al.
31,5
Su.
34,5
Nor.
32,5
Lat.
4,5
Conclusão
Pode-se dizer que os resultados experimentais obtidos, dentro dos limites impostos pelo tamanho das
amostras e pelo conseqüente desvio estatístico, confirmaram a hipótese de partida desta pesquisa e nos
autorizam a dizer que as línguas germânicas e o francês possuem um léxico mais consonantal no que
respeita às terminações das palavras, enquanto as demais línguas românicas apresentam léxico com
terminações mais vocálicas. O padrão desviante do francês em relação às suas línguas-irmãs, por sinal,
pode ser explicado historicamente pela maior influência que os dialetos romances do norte da França —
dentre os quais está o dialeto da Île de France, que originou o francês oficial moderno — sofreram dos
invasores germânicos, sobretudo francos.
Cumpre ainda acrescentar que o idioma norueguês apresenta duas variantes, o chamado bokmål, que
corresponde ao norueguês oficial, e o nynorsk, ou neonorueguês, cujas terminações se assemelham mais
às do sueco do que às do bokmål. O nynorsk é, portanto, mais vocálico que o bokmål. A amostra aqui
analisada corresponde ao bokmål, variante na qual são produzidos os textos jornalísticos noruegueses na
Internet.
De um modo geral, ficou claro que as línguas românicas estudadas, à exceção do francês, repelem
terminações em consoantes fortes: o português e o espanhol admitem terminações em consoantes fracas,
especialmente l, m (no português), n, r e s. No italiano, quase todas as palavras terminam em vogal ou
semivogal. Mesmo as consoantes fracas ficam restritas a uns poucos monossílabos.
Nas línguas germânicas e no francês, predominam as terminações consonantais (tanto fortes quanto
fracas) e a vogal temática, quando existe, é sempre e.
Evidentemente, há nas línguas estudadas palavras vernacularizadas que fogem a essas regras;
entretanto, são pouco numerosas. Como exemplos de palavras com terminação consonantal forte em
português podemos citar bíceps, cálix, hábitat e sob; em espanhol, temos cenit, coñac e reloj. Palavras
italianas com terminação consonantal (forte ou fraca) são album, biberon, caos, clic, cognac, diapason,
film, hotel, robot, sport, zar e zenit, dentre outras. Palavras francesas terminadas em vogal “cheia” (isto é,
outra que não o e mudo) são photo, pyjama, radio, etc. Em inglês, temos alibi, analysis, banana, idea,
potato, tomato, umbrella, volcano, etc.; em alemão, Basis, Konto, Organismus, Risiko, Thema, Valuta,
Zentrum e outras.3 Em sueco e norueguês, temos album, foto, radio, etc. Todas essas palavras, que
constituem exceções, são de procedência estrangeira4, mas em alguns casos chegam a integrar-se nos
paradigmas de flexão da língua, como se pode notar nos plurais esp. relojes, cenites ou al. Organismen,
Themen, etc.
Referências bibliográficas
BARBOSA, M. A. (1996) Língua e discurso: contribuição aos estudos semântico-sintáxicos. 4.ª ed. São
Paulo, Plêiade.
BIZZOCCHI, A. (1993) Os ditongos decrescentes em francês. Ciência e Qualidade de Vida. Anais da 45ª
Reunião Anual da SBPC. Recife, SBPC, p. 499.
_______ (1998) Léxico e ideologia na Europa ocidental. São Paulo, Annablume/FAPESP.
FERREIRA, M. A. S. de C. (1988) Estrutura e formação de palavras. São Paulo, Atual.
ILARI, R. (1997) Lingüística românica. 2.ª ed. São Paulo, Ática.
KEHDI, V. (1992) Formação de palavras em português. São Paulo, Ática.
KRAHE, H. (1974) Lingüística indoeuropea. Trad. de J. Vicuña. Madri, C.S.I.C.
_______ (1977) Lingüística germánica. Trad. de Maria Teresa Zurdo. Madri, Ediciones Cátedra.
LAUSBERG, H. (1970) Lingüística románica. Trad. de J. Pérez Riesco e E. Pascual Rodríguez. Madri,
Gredos.
PISANI, V. (1939) Introduzione alla linguistica indeuropea. Roma, Edizioni Universitarie.
REY, A. (1979) La terminologie: noms et notions. Paris, P.U.F.
Notas
1. Em português, espanhol e catalão, o s inicial seguido de consoante, encontro consonantal comum
em latim e nas demais línguas indo-européias, provocou o surgimento de um e protético (lat. statua >
port. estátua). Os demais encontros consonantais latinos em início de palavra conservaram-se melhor nas
línguas ibéricas. De modo geral, os encontros consonantais em início de palavra (e de sílaba) são de três
tipos:
a) consoante explosiva (incluindo africada) + líquida (por exemplo, pr, fl, pfl, etc.);
b) consoante sibilante + explosiva (por exemplo, sp, st, sf, etc.); e
c) consoante sibilante + explosiva + líquida (por exemplo, str, spl, etc.).
2. O coeficiente de variação é a razão entre o desvio-padrão e o valor médio da variável aleatória (no
caso, Cc), ou, em termos matemáticos, ν = σ/Cc. Esse índice mede o grau de dispersão dos valores
assumidos pela variável aleatória em relação ao seu valor médio e indica o grau de confiabilidade das
amostras.
3. É interessante observar que, em alemão, as palavras com terminação vocálica são todas
substantivos.
4. A palavra portuguesa sob é vernácula, mas a grafia atual, implantada no Renascimento, decorre
de imitação do latim sub; a forma primitiva da palavra, corrente na Idade Média, era so.