Referência: BORTONI-RICARDO. S. M. Compreensão de Leitura: da palavra ao texto. In: Palavra: forma e sentido. GUIMARÃES, E; MOLLICA, C. (org). Campinas/SP: Mercado de Letras, 2007. [no prelo]. COMPREENSÃO DE LEITURA: DA PALAVRA AO TEXTO Stella Maris Bortoni-Ricardo A professora Lúcia Maria Pinheiro Lobato, com quem convivi na Universidade de Brasília durante duas décadas, será sempre lembrada como uma das principais pesquisadoras brasileiras na área de semântica e sintaxe. Nessas áreas ela primava pelo trabalho de vanguarda e pelo empenho em trazer para a academia brasileira informações sobre o estado da arte. Mas há uma outra dimensão em seu trabalho que ficou menos conhecida: sua preocupação com o ensino da língua portuguesa. Confirmam essa sua contribuição pelo menos duas iniciativas: a coordenação do número monográfico 78/79 da revista Tempo Brasileiro, que foi denominado Sociolingüística e ensino do vernáculo e que deu seqüência ao número 53/54, denominado Lingüística e ensino do vernáculo, e seu empenho em imprimir ao biênio 2003/2005, em que foi presidente da ABRALIN, prioridade à pesquisa e à discussão sobre o ensino da língua portuguesa no Brasil. Nesse sentido coordenou a participação da Associação na série das reuniões regionais da SBPC voltadas ao diálogo com professores do ensino fundamental e médio. Optei por dedicar esse capítulo à memória de Lúcia Lobato como uma lingüista comprometida com a educação brasileira e escolhi o tema da compreensão da leitura, enfocando o papel do vocabulário nesse processo. A questão da compreensão da leitura é especialmente oportuna porque, desde 1990, o Ministério da Educação vem conduzindo testes nacionais de compreensão de leitura e habilidades matemáticas com alunos na 4ª e na 8ª séries do ensino fundamental e na 3ª série do ensino médio, identificados pela sigla SAEB: Sistema Nacional de Avaliação da Educação Básica. 1 Os resultados do SAEB 2003 são bastante conhecidos. Em todo o Brasil só 4,8 % dos alunos de quarta série do ensino fundamental tiveram um desempenho adequado no teste de compreensão de leitura. Para os alunos de oitava série esse percentual foi de 9,3 % e para os de terceira série do ensino médio, 6,2 %. Essas são médias nacionais. Nas regiões brasileiras onde o índice de desenvolvimento humano - IDH - é mais baixo que a média nacional, como as regiões Nordeste e Norte, são igualmente mais baixos os resultados dos sistemas nacionais de avaliação do ensino, tanto em Língua Portuguesa quanto em Matemática. Já sabemos também que dois grupos de alunos no ensino fundamental obtêm os piores resultados nos testes: alunos cujos pais não são alfabetizados e alunos com defasagem idade/série. Os resultados de compreensão de leitura da Prova Brasil aplicada em novembro de 2005 referentes à quarta série do ensino fundamental não indicam avanço significativo em relação aos resultados do SAEB de 2003. Num total de 350 pontos, a média obtida pelos estudantes de todo o Brasil foi de 172, 09, o que corresponde a 49,16%. Isso significa que em média os estudantes não conseguiram responder de forma adequada sequer 50% das questões que avaliavam a sua compreensão textual. A questão da compreensão de leitura tem sido objeto de muita pesquisa nos países desenvolvidos. Contudo, um entendimento mais preciso desse processo ainda é um desafio, conforme esclarece a pesquisadora Diane McGuinness (2006), que fez uma análise dos objetivos e fidedignidade das pesquisas sobre ensino da leitura em uma ampla base de dados, resultante de triagem inicial realizada pelo National Reading 1 O Sistema Nacional de Avaliação da Educação Básica (Saeb), que acontece desde 1990, teve nova estrutura definida em 2005 e passou a ser denominado Prova Brasil. Em 2005, a Prova Brasil foi realizada em escolas públicas de 5.398 municípios de todas as unidades da Federação e avaliou 3.306.378 alunos de 4ª e 8ª série do ensino fundamental, a partir de provas de língua portuguesa (com foco em leitura) e matemática. Panel (NRP)2, em um total de 1072 estudos realizados nos últimos 30 anos sobre métodos de ensino de leitura nos Estados Unidos. No Brasil são conhecidas algumas iniciativas de pesquisas que visavam a aferir o grau de complexidade de um texto, independentemente do vocabulário, considerando aspectos de estrutura gramatical e informacional,. Como não são reportados resultados relevantes para os propósitos deste capítulo, limitarei aqui a fazer uma breve resenha de dois desses estudos, dedicando a maior parte do restante do capítulo à discussão de pesquisas sobre ensino e desenvolvimento do vocabulário que apresentam resultados mais definitivos para a compreensão textual. Um desses estudos exploratórios é o de Lemle e Naro em 1977, no qual os pesquisadores procuram fornecer medidas de complexidade sintática valendo-se dos recursos metodológicos da teoria gerativa à época. Seu objetivo era estabelecer um critério para comparar a complexidade sintática da modalidade falada por adultos em processo de alfabetização no MOBRAL e textos de diferentes gêneros que pudessem constituir material de leitura para os alfabetizandos. Para tanto propõem dois indicadores baseados na análise estrutural dos enunciados. O primeiro, na dimensão horizontal, refere-se ao número de sub-constituintes que compõem cada constituinte na oração. O segundo, na dimensão vertical, indica o grau de encaixe de constituintes uns dentro dos outros. Levaram ainda em conta o cumprimento das sentenças e testaram a hipótese de que “quanto mais à esquerda e abaixo na árvore a posição de um constituinte, menor tenderá ser a sua medida de complexidade”. Ao final sugeriram que frases de grandes constituintes à esquerda deveriam ser evitadas nos textos mais elementares. Como essa análise não se provou operacional os autores não avançaram no estudo da questão da complexidade e se concentraram na análise variacionista da 2 O NRP é um comitê constituído pelo Congresso Norte-Americano no ano 2000, que envolveu parlamentares, cientistas e profissionais da educação, com a finalidade de avaliar o estado da arte sobre o ensino da leitura. concordância verbo-nominal. Independentemente dos possíveis problemas associados à metodologia que propuseram, é preciso observar que a comparação de complexidade na modalidades oral e escrita apresenta um problema de origem. A sintaxe da língua oral é muito peculiar e, em certo sentido, mais complexo que a sintaxe da língua escrita em virtude das descontinuidades, como repetições, auto-reparos, contingência entre os turnos de fala, hesitações, truncamentos e anacolutos, próprios da expressão oral (cf. Koch et alii, 1990). . Na escrita, por sua vez, as informações são mais condensadas, o que também é fator de complexidade, tomada em sentido diferente. Outro estudo, de pragmática discursiva, na linha de Talmy Givón, coordenado por Leci Borges Barbisan, propôs-se a verificar como se dá a construção do tópico em textos argumentativos, identificando os fatores que caracterizam certos elementos como tópicos e a relação entre os tópicos, que constituem cadeias temáticas. Ambos os estudos sugerem categorias textuais e gramaticais que podem ser contempladas em pesquisas de natureza aplicada sobre compreensão de textos. O fato é que o estudo da compreensão da leitura é complexo e envolve diversas variáveis, dentre as quais se destaca o conhecimento do vocabulário. Alliende e Condemarin ( 1987 ) apontam três conjuntos de fatores determinantes da compreensão textual, derivados do escritor; do texto e do leitor, respectivamente. Muitos países adotam a prática de publicar livros com número controlado de palavras. À medida que o estudante avança em sua escolaridade vai tendo acesso a livros com vocabulário mais amplo. No Brasil esta prática não é extensivamente adotada. No entanto, os documentos que traduzem as políticas públicas para o ensino da língua portuguesa no Brasil reconhecem a importância do desenvolvimento do vocabulário. O “Relatório Conclusivo da Comissão Nacional para o Aperfeiçoamento do Ensino/Aprendizagem da Língua Materna” de janeiro de 19863 dedica uma seção ao “corpus lexical” e recomenda: “O professor deverá estar vigilante quanto ao enriquecimento do vocabulário ativo (o que ocorre espontaneamente ao usuárioestudante) e passivo (que ocorre no dia-a-dia, mas de que o usuário-estudante não tem ainda conhecimento)”. Para o segundo grau recomenda que o estudante deverá habituarse “a estabelecer conexões paradigmáticas das raízes e radicais latinos e gregos, dos prefixos e sufixos, tanto no acervo popular quanto no acervo erudito” (p.21). Na “Matriz de Referência de Língua Portuguesa do SAEB 2001: Tópicos e seus Descritores”4, o Descritor 3, que consta da Matriz a partir a 4° série do ensino fundamental, consiste em “inferir o sentido de uma palavra ou expressão”. À medida que a escolaridade progride, a referência ao sentido da palavra ou expressão torna-se mais explícita. No Descritor 18 lê-se: “Reconhecer o efeito de sentido decorrente da escolha de uma determinada palavra ou expressão”, ao qual podemos associar o Descritor 16: “Identificar efeitos de ironia ou humor em textos variados”. Na história recente da metodologia do ensino de línguas, inclusive de segunda língua, o foco no vocabulário foi perdendo importância para a aquisição da competência gramatical e de habilidades comunicativas funcionais. No entanto, percebe-se hoje em dia uma tendência à retomada do interesse no ensino e aprendizagem do vocabulário, no bojo dos estudos de compreensão de leitura (Read, 1997). Uma pesquisa experimental conduzida pela professora Maria Izabel Magalhães e por mim (Magalhães e Bortoni-Ricardo, 1981), no final da década de 70, na Universidade de Brasília, deixa bem patente que o vocabulário é uma variável crucial no processo de compreensão de leitura. O experimento consistiu na aplicação de testes de 3 Diretrizes para o aperfeiçoamento do ensino/aprendizagem da língua portuguesa. Ministério da Educação. Janeiro/1986. 4 SAEB 2000: novas perspectivas/Instituto Nacional de Estudos e Pesquisas Educacionais. - Brasília O Instituto, 2001. compreensão de dois textos retirados de livros didáticos de quarta série do ensino fundamental, em duas classes dessa série: uma situada em área residencial de classe média (CM); Superquadra 204 de Brasília, e outra situada na cidade satélite de Ceilândia, à época a comunidade de mais baixa renda no Distrito Federal. Os dois textos escolhidos eram narrativas. O texto A – “O Pangaré” – de Maria Clara Machado versava sobre a decisão de um pai de vender um velho cavalo de carroça ao qual o filho se afeiçoara. O texto B – “As jóias de Cornélia” – narrava um conhecido episódio ambientado na Roma Antiga: a aristocrata Cornélia, mãe dos Gracos, declara a uma amiga que suas jóias são seus dois filhos. Não há grande diferença na estrutura textual e sintática nos dois textos. A diferença entre eles está no vocabulário. Em ambos os textos, como é de se esperar, a escolha lexical é decorrente do tema. No “Pangaré” o tema é a tristeza do menino pobre por ter de privar-se do cavalo, que era seu amigo. Seu pai levava verduras na carroça para vender na feira até que o cavalo ficou muito velho e ele resolve vendê-lo para comprar umas galinhas e começar uma criação, para grande decepção do menino. No léxico do texto encontramos palavras como capim, córrego, cobres (dinheiro), vaquinha, puxar, vender, etc. Nos dois textos selecionados para o experimento pode-se facilmente distinguir um vocabulário que alguns estudiosos denominam fundamental e um vocabulário de origem erudita e trânsito quase exclusivo na cultura de letramento. No texto A há predominância de vocabulário fundamental; já no texto sobre Cornélia há muitos itens lexicais de natureza erudita. Como a narrativa é ambientada em um jardim de um palácio romano, o léxico desse texto inclui palavras como “contemplar”, “fulgurar”, “cadeias”, “pérolas”, “rubis”, “safiras”, “servo”, “túnica”, “videiras”, “frugal”, etc. Os alunos de ambas as escolas leram os dois textos. O teste de compreensão incluía questões sobre o reconhecimento da idéia principal; das personagens; dos detalhes descritivos e da seqüência narrativa. Testavam-se também as habilidades de identificar comparações e relações de causa e efeito. Ao final pedia-se aos alunos que recontassem a história por escrito. Em todas as dimensões testadas os estudantes foram mais bem sucedidos na compreensão do ‘Pangaré’ que das ‘Jóias de Cornélia’. Os principais resultados são os seguintes, considerando-se sempre uma escala de 1 a 100. Na compreensão literal a média do texto A para a CM foi de 67,9 e para o texto B, de 43,9. Os estudantes da CB obtiveram média de 64,5 no texto A e de 28,6 no texto B. Vê-se que ambos os grupos demonstram melhor compreensão do texto A: a diferença na média desse texto entre os dois grupos não é grande. O texto B não foi bem avaliado por nenhum dos grupos, mas a CM conseguiu uma média que, ainda que baixa, é muito superior à da CB para o mesmo texto. O reconto dos dois textos foi analisado nas dimensões conteúdo e linguagem. Na primeira quase não há diferença nos resultados para os dois grupos: 67,9 para a CM e 64,5 para a CB. Na dimensão linguagem a diferença quanto à variável classe social se acentua. No texto A as médias foram 81,7 e 72,1 para a CM e CB respectivamente. No texto B observa-se o mesmo padrão já reportado em relação a conteúdo: 76,3 para CM e 50,6 para a CB. Como conclusão há de se considerar que o texto mais próximo do conhecimento de mundo dos alunos foi melhor avaliado em todas as dimensões. Quanto ao outro, cuja temática, e conseqüentemente o vocabulário, estão muito distantes da vivência dos alunos, foi medianamente compreendido pelo grupo de CM, que possivelmente já tinha uma experiência vicária com livros, filmes, desenhos e jogos eletrônicos ambientados na Roma dos Césares. O grupo de CB, privado de experiências com práticas letradas mais variadas, não logrou sequer obter um escore mediano na compreensão desse texto. Mas essa não é toda a história. No item referente à percepção do tema do texto A , os alunos de CB tiveram resultados superior aos de CM. Esses resultados foram, respectivamente, 15,4 e 13,5. Fica evidenciado que textos cujo tema (e conseqüentemente o vocabulário) é familiar aos alunos são bem compreendidos e reproduzidos. A compreensão de textos com vocabulário muito distante do léxico produtivo e receptivo dos alunos fica muito dificultada, especialmente para crianças provenientes de grupos sociais com pouca participação em práticas sociais letradas. Ora, se no Brasil cerca de 75% da população de 15 a 64 anos, de acordo com o Indicador Nacional de Alfabetismo Funcional– INAF, calculado pelo Instituto Paulo Montenegro5 – é constituído de analfabetos funcionais, vamos concluir que a maior parte das crianças que freqüentam as escolas públicas e eram testadas pelo SAEB e agora o são pela Prova Brasil provêm de famílias com nível precário de alfabetização. (Ver Bortoni-Ricardo, 2006). Grande parte dos textos veiculados na escola brasileira reflete uma visão de mundo filtrada pela cultura de letramento, e é vazada em um vocabulário estranho às crianças provenientes de grupos sociais com cultura predominantemente oral, como as crianças do grupo de CB do experimento relatado. Daí os resultados tão precários nos testes nacionais de avaliação de leitura para alunos das regiões de IDH baixo e para os estudantes com defasagem idade/série, justamente os mais vulneráveis, que engrossam as estatísticas de repetência e evasão. 5 O Quinto Indicador Nacional de Alfabetismo Funcional (INAF), divulgado em setembro de 2005, pelo Instituto Paulo Montenegro - IPM - (disponível em: < www.ipm.org.br>, acesso em 26 de junho de 2006) e em RIBEIRO, 2004), mostrou que só 26% dos brasileiros na faixa de 15 a 64 anos de idade são plenamente alfabetizados. Desses, 53% são mulheres, 47% são homens e 70% , jovens de até 34 anos. Os lingüistas, desde os estágios formativos da disciplina, sabem que “o léxico da língua é o componente que mais nitidamente reflete o ambiente físico e social dos falantes”( Sapir, 1969, p.45). O conhecimento que os falantes têm desse ambiente físico e social é processado na forma de estruturas de dados ou frames (molduras). Uma moldura, de acordo com Brown e Yule (1983), é uma dada representação do mundo fixada em nossa mente6. A compreensão do que lemos ou ouvimos implica confrontar as informações que estamos adquirindo com essas estruturas de dados. Se um item ou mais do vocabulário que compõe um texto não se encaixar em uma moldura armazenada na mente, a compreensão do enunciado ou do texto fica necessariamente prejudicada. Para Biderman (2002), é difícil precisar o tamanho do léxico de uma língua natural, que é um conjunto aberto. A lexicógrafa estima, contudo, que nas línguas com tradição letrada o léxico atinja 500 mil vocábulos ou mais. Segundo sua estimativa o dicionário Aurélio conteria 130 mil verbetes e o Houaiss 230 mil verbetes. O método contemporâneo de elaboração de dicionários consiste na extração e seleção das entradas de um banco de dados informatizado. É Biderman ainda que nos informa que o Dicionário da Língua Portuguesa Contemporânea da Academia de Ciências de Lisboa, com 60 mil entradas, baseou-se num corpus de 100 milhões de ocorrências. Pesquisas sobre aquisição e desenvolvimento do vocabulário que os indivíduos dominam, conduzidas nos Estados Unidos, mostram que, por volta de 18 meses, uma criança já produz cerca de 50 palavras e já compreende um conjunto de palavras 5 vezes superior. Essa defasagem se mantém por toda a vida: o vocabulário passivo de compreensão é sempre muito maior que o vocabulário produtivo. 6 “Os autores mostram ainda que, além das frames, o conhecimento de mundo pode ser estruturado em “cenários”, “schemata” e “ scripts”. Depois que a criança ultrapassa a marca de 200 palavras, por volta dos dois anos, os resultados das pesquisas não são consistentes, mas acredita-se que o vocabulário de reconhecimento de crianças quando iniciam a escola é de cerca de 10 mil palavras. Diferentemente da aquisição de padrões gramaticais e fonológicos, cujo ápice se dá na primeira infância, o desenvolvimento do vocabulário é um processo que acompanha toda a vida de um indivíduo (cf. Mcguinness, 2006). A aferição do tamanho do vocabulário de um falante é uma tarefa bastante complexa. Meara (1996), apud Read, propõe que o conhecimento vocabular de um indivíduo deve ser conceptualizado como uma rede de itens integrados entre si por um grande número de vínculos associativos. O autor observa ainda que o vocabulário de um falante nativo é mais rico e contém associações mais complexas que o vocabulário de um aprendiz da língua como língua estrangeira. Dada a importância da amplitude do vocabulário para a compreensão de textos, uma pergunta que se impõe é: pode-se ensinar vocabulário? Em caso afirmativo, como se deve conduzir esse processo na escola? As pesquisas resenhadas por McGuinness, já mencionadas, dão conta de que a freqüência de exposição a novas palavras só resultará em aquisição de vocabulário se os alunos tiverem uma orientação sobre o significado da palavra, levando em conta o contexto. A autora sugere que qualquer método que chame a atenção para o significado e envolva o aluno cognitivamente produz ganhos no vocabulário receptivo. Uma premissa do trabalho pedagógico com vocabulário é que ele tem de envolver não só a amplitude do vocabulário, mas sua profundidade. Para Hunt (1999) essa profundidade está relacionada à complexa rede de conotações de sentido de cada palavra, vinculadas a diferentes usos, que envolvem linguagem afetiva, metáfora e nuanças do significado. O ensino do vocabulário não deve ser considerado tarefa ultrapassada ou pouco produtiva, mas é preciso que se dê atenção às pesquisas que associam conhecimento de vocabulário à compreensão textual. Vejamos, como um pequeno exemplo, um poema do poeta mineiro Ronald Claver, selecionado pelo MEC para leitura na quarta-série7. A Serpente A luxuriante malabarista serpente Serpenteia, esguia e sinuosa, diante dos olhos. É um rio de métrica nervosa, redemoinhos, Meandros e contornos. Carretel de muitas linhas. Se enrosca. Enrodilha. Arma o lance. Lança o bote. Com o pecado original na pele, o paraíso se esvai. Resta-lhe o arrastar no rastro do sol. Ao apresentar esse poema a alunos de quarta-série, há muitas estratégias de que o professor pode lançar mão para trabalhar o vocabulário levando em conta a rede de conotações que definem a profundidade de cada item. “Luxuriante” evoca um campo semântico de florestas tropicais, habitat das serpentes. “Malabarista” leva o leitor a selecionar em seu conhecimento mental armazenado a moldura de um circo. A forma verbal “serpenteia” dá origem à discussão sobre palavras derivadas. No caso os alunos poderão encontrar outros contextos onde essa forma pode-se encaixar: “O rio serpenteia”; “A procissão de fiéis contritos serpenteava pelas ladeiras íngremes”. 7 Ferreira Gular et alii. Bichos de versos, Coleção Literatura em Minha Casa, Volume 1, Poesia. Ministério da Educação/FNDE/PNBE, 2003 Comparando esses enunciados e outros com o verso original, poderão perceber os mecanismos de extensão de significado pela via da metáfora ou da polissemia. É com metáforas também que eles se confrontarão no verso: “É um rio de métrica nervosa, redemoinhos, meandros e contornos”. O poema presta-se ainda para introduzir os alunos às estratégias da leitura intertextual: “Com o pecado original na pele, o paraíso se esvai”. Escrevi este despretensioso capítulo com dois objetivos: demonstrar que a pesquisa sobre o ensino do vocabulário é um campo fértil ainda pouco explorado no Brasil e sugerir que um trabalho escolar sistemático, voltado para o aperfeiçoamento quantitativo e qualitativo do conhecimento lexical dos alunos, pode contribuir para melhorar seus índices de compreensão de leitura. Referências ALLIENDE, G.F. e CONDEMARÍN, M. (1987) Leitura: teoria, avaliação e desenvolvimento. Porto Alegre: Artes Médicas. BARBISAN, L. B.et alii (1998) “Projeto de pesquisa: a continuidade temática em textos argumentativos.” Manuscrito. BIDERMAN, M. T. C., (2002) “Análise de dois dicionários gerais do português brasileiro contemporâneo: o Aurélio e o Houaiss”. Filol. Linguist. Port., n. 5, p. 85-116, São Paulo: Humanitas. BORTONI-RICARDO, S. M. ( 2006) Educação em língua materna: A sociolingüística na sala de aula. 4ª ed. rev. e aum. São Paulo: Parábola Editorial. 1ª ed. 2004. BROWN, G. e YULE, G., (1983) Discourse analysis. Cambridge: Cambridge University Press. HUNT, G., (1999) “Working with words: vocabulary development in the primary school”. In.: GOODWIN, P. (org.)” The literate classroom, p. 107-114, Londres: David Fulton Publishers. KOCH, I. G. U. et alii (1990) “Aspectos do processamento do fluxo de informação no discurso oral dialogado”. In: CASTILHO, A. T. (org.) Gramática do português falado, volume 1: A ordem, p.143-184, Campinas: Editora da UNICAMP/FAPESP. LEMLE, M. e NARO, A. J., (1977) Competências básicas do português. Rio de Janeiro: MOBRAL, Manuscrito. MAGALHÃES, M. I. S. e BORTONI-RICARDO, S. M., (1981) “O fator cultural na compreensão da leitura” In: COUTO, H. (org.) Ensaios de lingüística aplicada ao português, p.103-146, Brasília: Thesaurus. McGUINNESS, D. , (2006). O ensino da leitura: o que a ciência nos diz sobre como ensinar a ler. Porto Alegre: Artmed. READ, J., (1997) “Assessing vocabulary in a second language” In.: CLAPHAM, C. e CORSON, D. (orgs.). Encyclopedia of language and education, volume 7: Language testing and assessment, p.99-107, Londres: Kluwer Academic Publishers. RIBEIRO, V. M. (2004) Letramento no Brasil. São Paulo: Ação Educativa e Instituto Paulo Montenegro. SAPIR, E., (1969). Lingüística como ciência. Rio de Janeiro: Livraria Acadêmica.