FABIANA DA SILVA FRANÇA BIBLIOTECA DIGITAL PAULO FREIRE: análise da aplicabilidade do Thesaurus Brased na indexação Monografia apresentada ao Curso de Biblioteconomia do Centro de Ciência Sociais Aplicadas da Universidade Federal da Paraíba, em cumprimento às exigências para obtenção do grau de Bacharel. ORIENTADORA: Profª. Maria Elizabeth B. C. de Albuquerque JOÃO PESSOA / PB 2005 FICHA CATALOGRÁFICA F 814b França, Fabiana da Silva Biblioteca Digital Paulo Freire: análise da aplicabilidade do Thesaurus Brased na indexação / Fabiana da Silva França. – João Pessoa: 2005. Trabalho de Conclusão de Curso (Graduação em Biblioteconomia) –Universidade Federal da Paraíba / 2005. Orientadora: Profª Ms. Maria Elizabeth B. C. de Albuquerque 1. Tesauro 3. Indexação 2. Sistema de Recuperação de Informação 4. Thesaurus Brased I. Título CDU: 025.4 FABIANA DA SILVA FRANÇA BIBLIOTECA DIGITAL PAULO FREIRE: análise da aplicabilidade do Thesaurus Brased na indexação Trabalho de Conclusão de Curso apresentado ao Curso de Graduação em Biblioteconomia da Universidade Federal da Paraíba - UFPB, como requisito parcial para obtenção do grau de bacharel. Aprovada em ______ de ____________de 2005 BANCA EXAMINADORA _______________________________________________________ Profª.Ms. Maria Elizabeth Baltar C. de Albuquerque Orientadora (Universidade Federal da Paraíba) _____________________________________________________ Profª. Dra. Dulce Amélia de Brito Neves Membro (Universidade Federal da Paraíba) _____________________________________________________ Profª.Ms. Eliane Bezerra Paiva Membro (Universidade Federal da Paraíba) Á Deus, aos meus Severina e José Júnior, por me força para desistir dos pais e a darem nunca meus objetivos. Dedico AGRADECIMENTOS A Deus, razão de todo meu viver, pela sabedoria e existência, por todos os momentos que precisei esteve sempre ao meu lado e tenho fé que sempre estará, pois nele tudo quero, tudo posso e tudo consigo, mestre maior e sabedor de todas as coisas; Aos meus pais, Severina da Silva França e José Luis de França Filho, pelo amor, os sacrifícios e o exemplo de vida e luta. A meu amor, José de Sousa Araújo Júnior, por todo carinho e compreensão, por não me deixar baixar a cabeça para o pior e me socorre nas horas difíceis. A minha querida avó, Maria Inácio da Silva, “Mary”, pela força e preocupação com meu bem estar. A meus irmãos, Fernanda da Silva França, Fabio da Silva França e José Eudes da Silva França, pelas participações diretas e indiretas, tornando possível à realização desta pesquisa. A minha Orientadora, profª Ms. Maria Elizabeth B. C. de Albuquerque, pelas experiências partilhadas e, muito mais, pela força, pela paciência, pela orientação, pelo estímulo, e pela confiança e carinho. Nossa convivência tornou-se prazerosa, assim como as orientações que tornou possível à concretização deste trabalho. A profª Drª Francisca Arruda Ramalho, minha orientadora do PIBIC/CNPQ/UFPB, pela oportunidade de ser pesquisadora em seu projeto e pela valiosa orientação, paciência e ajuda acadêmica. As professoras Bernardina Maria Juvenal Freire e Edna Gomes Pinheiro, pela ajuda profissional e pela atenção e sempre dedicação em me atender todas as vezes que precisei. Aos Professores do Curso de Graduação em Biblioteconomia, Eliane Bezerra Paiva, Eliany Alvarenga de Araújo, Dulce Amélia de Brito Neves, Guilherme Ataíde Dias, Marynice de Medeiros Matos Autran, Joana Coeli Ribeiro Garcia, Carlos Xavier de Azevedo Neto, Izabel França de Lima, Rosa Zuleide Lima da Silva, pela atenção em me atender e pelos ensinamentos transmitidos. A minha amiga Mercilene da Silva Santos, por sempre estar do meu lado em todos os momentos, mesmo que à distância. A Margareth Rolim Rocha pela confiança depositada em mim, e pela grande força, dando-me oportunidade de estágio na Biblioteca de sua empresa. Aos funcionários do Departamento e Coordenação do Curso de Biblioteconomia, em caráter muito especial, a Francinete, Ailda, Antônio e Sr. Pedro, pelo respeito e a atenção a mim dedicada. A todos os meus colegas do curso de biblioteconomia; as colegas Deise e Maria José; e aos colegas da MCR Aquacultura, em especial a Maria Gorette, Thais, José Carlos e Thadeu. E não menos importante, a todos os que, direta e indiretamente, contribuíram para o alcance desta vitória. "[...] o aproveitamento integral das informações contidas numa massa documental depende não somente da capacidade dos analistas, mas também da linguagem documentária utilizada por eles na indexação. Para esse fim, a linguagem deve propiciar rapidez no processamento das informações, precisão na indexação, confiabilidade na recuperação e agilidade na disseminação”. (INEP, 2005) RESUMO A busca de informações, em meios digitais, requer dos usuários um certo conhecimento da linguagem utilizada pelos sistemas de informação. Isso faz com que algumas instituições disseminadoras de informações tenham uma atenção em especial no tratamento dessas informações. Para este estudo, cujo objetivo é a análise da utilização do Thesaurus Brased na Indexação da Biblioteca Digital Paulo Freire (BDPF), enfocou-se a indexação de documentos na padronização da linguagem, a partir do Tesauro. Para responder a este objetivo, realizouse uma explanação sobre os temas: Sistemas de Recuperação da Informação (incluindo Bibliotecas Digitais, Indexação e Linguagem Documentária), o Tesauro e sua utilização na indexação de documentos, inclusive o Thesaurus Brased. Adotou-se, para coleta e análise dos dados, a abordagem quantitativa, na qual foram analisados os cabeçalhos de assuntos existentes na base de dados dessa biblioteca. Conclui-se que existe uma certa rigidez no processo de indexação da BDPF e que a padronização da linguagem de uma área específica do saber, facilita a busca de informações pelos usuários. Palavras-chave: Sistema de Recuperação de Informação. Indexação. Tesauro. Thesaurus Brased ABSTRACT The search for information, in digital media, require, from users, a certain knowledge about the language applied to information systems. This fact leads some institutions that disseminate information to display attention specially to the treatment of this information. For this study, whose aim is the analysis about the use of the Thesaurus Brased, in the indexation of the digital library that honors the name of Paulo Freire, the focus has been on the indexation of documents in the Thesaurus. In order to respond to this objective, na explanation of the following themes has been achieved. In formation recovery systems (includine Digital Libraries, Indexation and documentary Language), the Thesaurus and its use in the indexation of documents, also the Thesaurus Brased. For data collection and their analysis, the quantitative approach has been taken. In this approach, the actual subject headings have been analyzed in this library’s data basis. What is conclusive is that there is a certain stiffness in the process of the studied library’s indexation. Furthermore, the standardization of the language from, a specific knwledge area makes user’s search for information easier. Key -words: Information Recovery Systems. Indexation. Thesaurus .Thesaurus Brased LISTA DE FIGURAS Figura 1 - .............................................................................................................................. 21 Figura 2 -.............................................................................................................................. 22 Figura 3 -.............................................................................................................................. 23 Figura 4 -.............................................................................................................................. 25 Figura 5 -.............................................................................................................................. 27 Figura 6 -.............................................................................................................................. 28 Figura 7 -.............................................................................................................................. 33 Figura 8 -.............................................................................................................................. 39 Figura 9 -.............................................................................................................................. 42 Figura 10 -............................................................................................................................. 47 Figura 11-............................................................................................................................. 48 Figura 12-............................................................................................................................. 53 LISTA DE GRÁFICOS Gráfico 1 - ............................................................................................................................ 23 Gráfico 2 -............................................................................................................................. 24 Gráfico 3 -............................................................................................................................. 25 Gráfico 4 -............................................................................................................................. 26 Gráfico 5 -............................................................................................................................. 54 Gráfico 6 -............................................................................................................................. 65 Gráfico 7 -............................................................................................................................. 66 Gráfico 8 -............................................................................................................................. 68 LISTA DE QUADROS Quadro 1 - ............................................................................................................................ 38 Quadro 2 -............................................................................................................................. 50 Quadro 3 -............................................................................................................................. 57 Quadro 4 -............................................................................................................................. 57 Quadro 5 -............................................................................................................................. 58 Quadro 6 -............................................................................................................................. 58 Quadro 7 -............................................................................................................................. 58 LISTA DE TABELA Tabela 1 - .............................................................................................................................. 67 LISTA DE SIGLAS BDPF - Biblioteca Digital Paulo Freire BRASED - Tesauro Brasileiro de Educação CIBEC - Centro de Informação e Biblioteca em Educação CNPQ - Conselho Nacional de Desenvolvimento Científico e Tecnológico INEP - Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira LD - Linguagem documentária SRI - Sistema de Recuperação da Informação TIC’s - Tecnologias de Informação e Comunicação UFPB - Universidade Federal da Paraíba UNISIST - Sistema Mundial de Informação Científica SUMÁRIO 1 INTRODUÇÃO.................................................................................... 15 2 BIBLIOTECA DIGITAL PAULO FREIRE..................................... 19 2.1 Acervo .................................................................................................... 22 2.2 Índice de cabeçalhos de assunto ................................................................. 26 2.3 Glossário ................................................................................................. 27 2.4 Política de indexação da Biblioteca digital Paulo Freire............................. 29 3 SISTEMAS DE RECUPERAÇÃO DA INFORMAÇÃO................ 31 3.1 Bibliotecas Digitais ................................................................................ 36 3.2 Indexação.............................................................................................. 40 3.3 Linguagem documentária....................................................................... 43 4 TESAURO............................................................................................ 46 4.1 Classes e Tipos ..................................................................................................... 49 4.2 Relações entre descritores................................................................................... 49 4.3 Tesauro na indexação de documentos ...................................................... 51 4.4 Thesauros Brased................................................................................... 52 4.4.1 Histórico do Thesaurus Brased ......................................................................... 52 4.4.2 Matriz Conceitual do Thesaurus Brased........................................................... 53 4.4.3 Estrutura do Thesaurus Brased.......................................................................... 56 4.4.4 A pesquisa no Thesaurus Brased....................................................................... 59 4.4.5 Gestão do Thesaurus Brased.............................................................................. 59 5 PERCURSO METODOLÓGICO...................................................... 60 5.1 Delimitação do campo de pesquisa........................................................... 61 5.2 Etapas de investigação............................................................................ 61 5.2.1 Elaboração do referencial teórico ....................................................................... 61 5.2.2 Procedimento de Coleta de dados....................................................................... 62 5.2.3 Tabulação dos Dados.......................................................................................... 62 5.2.4 Análise e interpretação dos dados....................................................................... 63 6 ANÁLISE E DISCUSSÃO DOS RESULTADOS............................. 64 6.1 Cabeçalhos de assunto indexados existentes na base de dados da Biblioteca Digital Paulo Freire (BDPF)................................................................................ 64 6.2 Cabeçalhos de assunto retirados do Thesaurus Brased utilizados na indexação da BDPF ............................................................................................. 66 6.3 Outras fontes utilizadas na indexação da BDPF em relação ao Thesaurus Brased).................................................................................................................. 67 7 CONSIDERAÇÕES FINAIS.............................................................. 69 REFERÊNCIAS.................................................................................. 72 1 INTRODUÇÃO “Nenhuma grande descoberta jamais foi feita sem um palpite ousado” ISAAC NEWTON _________________________________________________ A chamada sociedade da informação1 vem provocando um turbulento crescimento da informação e do uso das tecnologias de informação e comunicação (TIC’s), principalmente, se focarmos nosso olhar para o crescimento da busca de informações digitais. A busca de informações requer dos usuários uma relação de proximidade entre o quê efetivamente se quer e onde e como se procura. A reflexão sobre essa questão tem nos acompanhado ao longo do Curso de Graduação em Biblioteconomia, ora cursando as disciplinas Disseminação da Informação e Estudo do Usuário e ora cursando as disciplinas denominadas “tecnicistas”, a exemplo das disciplinas que envolvem o tratamento da informação. Por outro lado, pensar o acesso requer necessariamente pensar o tratamento da informação, que faz a interface usuário x informação. 1 “Sociedade da informação refere-se a um modo de desenvolvimento social e econômico, em que a aquisição, armazenamento, processamento, valorização, transmissão, distribuição e disseminação de informação desempenham um papel central na atividade econômica, na geração de novos conhecimentos, na criação de riqueza, na definição da qualidade de vida e satisfação das necessidades dos cidadãos e das suas práticas culturais” (LEGEY; ALBAGLI, 2000, p.1) Trabalhando esses fatores que envolvem o tratamento da informação, esperamos, diminuir as dificuldades de busca e recuperação da informação para aqueles usuários que não possuem o domínio das terminologias, principalmente, quando se trata de uma área específica do saber. Percebemos que, em face à crescente demanda de informações eletrônicas, novos tipos de instituições se constroem no ciberespaço2, a exemplo das bibliotecas que, deste modo, vêm diversificando seus serviços a fim de suplantar o modelo tradicional. Neste estudo, este modelo refere-se àquele cujos serviços ainda não adotaram recursos tecnológicos, para o modelo digital, disponibilizando seus acervos, catálogos e serviços de forma on-line, através do instrumento de navegação World Wide Web, conhecido como Web. Toda essa evolução que as bibliotecas vêm sofrendo, com o avanço das TIC’s, também é marcada pela transferência de informação3 para os novos suportes, no caso do formato digital pelo suporte denominado hipertexto, onde o acesso acontece de maneira aleatória, não seqüencial, fazendo com que o usuário obtenha informações em diferentes formas através do simples clicar em links4. Apesar da diversidade dessas novas formas de acesso à informação, as bibliotecas ao visarem à disseminação da informação recorrem ao uso de instrumentos como listas de cabeçalhos, tesauros e outros, com o intuito de controlar o vocabulário e facilitar a recuperação da informação, caso da Biblioteca Digital Paulo Freire (BDPF) que, em meio a muitas bibliotecas digitais já desenvolvidas, a destacamos por ser nosso campo de estudo. 2 “Espaço de comunicação aberto pela interconexão de computadores e das memórias dos computadores” ((LÉVY, 2001 apud BEZERRA; VASCONCELOS, 2003, p. 112). 3 “ Conjunto de operações envolvidas na transmissão de informação, desde a geração até a utilização” (ARAUJO, 1998, p. 185). 4 “Qualquer parte de uma página Web que se conecta a algo mais. Clicando ou selecionando um link, portanto, fará com que esse algo mais apareça. A primeira parte de uma URL mencionada em um link indica o método ou o tipo do link. Os métodos incluem: file (para arquivos locais), ftp, ghoper, http, mailto, news e wais (para algumas formas de procura)” (COMUNICAÇÃO, 2005) A Biblioteca Digital Paulo Freire (BDPF) está sendo desenvolvida por um grupo multidisciplinar de professores e alunos do Departamento de Informática, do Departamento de Biblioteconomia e Documentação e do Programa de Pós-graduação em Educação, além de parcerias com a Universidade Federal de Pernambuco e com o Centro Paulo Freire - Estudos e Pesquisa, no Estado de Pernambuco. Como estudante do Curso de Biblioteconomia ingressei neste projeto, no Grupo de Indexação, como bolsista de Iniciação Científica (2003-2004), onde tive oportunidade de trabalhar na aplicação da Política de Indexação, criada para essa biblioteca. A política de indexação da BDPF, elaborada por professores do Departamento de Biblioteconomia e Documentação, estabeleceu a utilização do Thesaurus Brased do Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira – INEP para indexação e padronização dos termos, por tratar-se de uma biblioteca cujos conteúdos abrangem mais diretamente a área de Educação. Esse trabalho cotidiano de definição de termos e de manuseio dos instrumentos de padronização e recuperação de informação estimulou o aprofundamento da questão em analisar a utilização do Thesaurus Brased na indexação da Biblioteca Digital Paulo Freire (BDPF), com os seguintes objetivos: a) Identificar os cabeçalhos de assunto retirados do Thesaurus Brased para a BDPF; b) Identificar os cabeçalhos de assunto do Thesaurus Brased utilizados para construção do glossário da BDPF; c) Confrontar os cabeçalhos de assunto retirados do Thesaurus Brased em relação às outras fontes para a BDPF. Este estudo está organizado em sete capítulos. No primeiro, é apresentada a introdução, seguida dos objetivos da pesquisa. A Biblioteca Digital Paulo Freire, nosso campo de estudo, é ressaltada no segundo capítulo, para melhor compreensão. No terceiro, o referencial teórico é exposto na seguinte ordem: Sistemas de Recuperação da Informação; Biblioteca Digital; Indexação e Linguagem documentária. O Tesauro e o Thesaurus Brased, com seu histórico, matriz conceitual e estrutura, são analisados na quarta parte do estudo. Na próxima etapa, é demonstrada a metodologia utilizada para coleta, tabulação e análise dos dados. Na seqüência, é realizada a interpretação dos dados, de acordo com os objetivos da pesquisa. As considerações finais e sugestões são apresentadas no sétimo capítulo do presente estudo. 2 BIBLIOTECA DIGITAL PAULO FREIRE “Se a educação sozinha não transforma a sociedade sem ela tampouco a sociedade muda”. PAULO FREIRE _________________________________________________ Para implementar o uso das tecnologias de informação e comunicação na área acadêmica, a Universidade Federal da Paraíba (UFPB) inseriu sistemas de informação para disponibilizar documentos digitais na Internet, com objetivo de constituir um canal direcionado a atender toda a comunidade científica. Uma das iniciativas da UFPB foi o projeto “Pólo de produção e capacitação em conteúdos digitais multimídias da Paraíba”, financiado pelo Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq). Esse projeto objetivou o processo de aquisição e consolidação de competência para conceber, implementar e avaliar serviços de recuperação de informação baseados em bibliotecas digitais multimídia. A proposta apresentou a implementação de três bibliotecas digitais temáticas: a Biblioteca Digital da Organização Não-Governamental Para’iwa – Cultura, Imagem e Ação (OnG Para’iwa) a Biblioteca Digital do Núcleo de Documentação e Informação Histórica Regional (NDHIR); e a Biblioteca Digital Paulo Freire (BDPF). No ano 2000, teve início a implantação da BDPF, coordenada pelos professores Edna Gusmão de Góes Brennand (Programa de Pós-Graduação em Educação – PPGE/CEAD/UFPB) e Ed Porto Bezerra (Departamento de Informática –DI/UFPB). Em 2003, foi consolidado como um projeto dinâmico, constituído por uma equipe de três instituições: pesquisadores docentes e discentes da UFPB; da Universidade Federal de Pernambuco (UFPE) e do Centro Paulo Freire - Estudos e Pesquisas (CPFEP). Vinculando-se às linhas de pesquisa: Estudos Culturais e Tecnologias da Informação e Comunicação do Programa de Pós-graduação em Educação e ao Grupo de Pesquisa Informação; Cidadania e Memória do Departamento de Biblioteconomia e Documentação (DBD) do Centro de Ciências Sociais Aplicadas (CCSA) na UFPB, com bolsista de Pós-graduação e graduação. “Este projeto se configura, então, como iniciativa de fortalecimento de infra-estrutura para a indução de aplicações da tecnologia digital na educação e na pesquisa, com vistas a minimizar problemas na geração e difusão de inovações” (BEZERRA; BRENNAND, 2000, p. 2). Corroborando com esse pensamento Aquino (2001, p. 4) ressalta que, A aplicação da tecnologia (das redes eletrônicas) no campo educacional, sem dúvida, trará mudanças no campo dos processos de ensino-aprendizagem, na postura dos professores, na participação dos alunos, no trato com a informação, enfim na mudança do paradigma educacional. Nessa perspectiva, a BDPF tem como principal objetivo “disponibilizar pressupostos filosóficos, sociológicos e pedagógicos do pensamento freireano, para dar suporte a ações educativas democráticas” (BRENNAND, 2000). Para disponibilização e tratamento das informações nessa biblioteca, fez - se necessário a criação de equipes específicas e especializadas, das quais destacamos: Equipe de Digitalização de Material Impresso; Equipe de Digitalização de Áudio; Equipe de Digitalização de Vídeo; Equipe de Desenvolvimento; Equipe de Organização do Acervo Físico e Digital; Equipe de Indexação e Equipe de Busca, Seleção e Recuperação de Acervos. Essas equipes são formadas por pesquisadores, professores e alunos da UFPB. Assim, a idéia de concepção e implementação da Biblioteca Digital Paulo Freire biblioteca digital de personalidade -, articula esta perspectiva aos objetivos do Programa Sociedade da Informação em âmbito nacional, decorrendo na disponibilização (on-line) de uma ferramenta para a divulgação de informações a respeito de uma das mais ilustres personalidades do cenário da educação mundial: Paulo Freire (BEZERRA, 2003, p. 36). Podemos então visualizar na Figura 1, a página de entrada da BDPF, com acesso através do seguinte endereço eletrônico http://www.paulofreire.ufpb.br, cuja operacionalização localiza-se, atualmente, nas dependências do Núcleo de Tecnologia de Informação (NTI), no Pólo Digital da UFPB, Campus I. Figura 1 –Biblioteca Digital Paulo Freire (BDPF) Fonte: (BDPF, 2005) A BDPF reúne, por meio de formato digital, o acervo com uma diversidade de documentos relacionados à vida e à obra do educador Paulo Freire. Esses documentos referem-se a todas as obras impressas e não impressas, independentes do formato por que são buscados em diversas fontes de informações nacionais e/ou internacionais. A transferência de documentos, em formato impresso para eletrônico, efetiva-se com o processo de digitalização. O processo de digitalização compreende a utilização de scanner (equipamento que permite a digitalização a partir de documentos impressos) interligado em um computador. 2.1 Acervo O acervo da BDPF é formado de produções nacionais e internacionais relacionadas à vida e à obra de Paulo Freire, e está estruturado da seguinte forma: a) A obra – Produção do próprio educador Paulo Freire (Figura 2); Figura 2 – Documentos contendo as obras de Paulo Freire Fonte: (BDPF, 2005) Da produção do educador Paulo Freire, a BDPF disponibiliza apenas livros, conforme apresentado no Gráfico 1. BDPF - A obra 15 15 10 5 0 0 0 S1 Livros Textos Didátivos Outros Gráfico 1: A obra da BDPF Fonte: Dados da Pesquisa b) A crítica – Produção de autores que escreveram e escrevem sobre a vida e a obra do educador Paulo Freire (Figura 3); Figura 3 – Documentos contendo produção de outros autores que escreveram ou escrevem sobre Paulo Freire Fonte: (BDPF, 2005) A biblioteca disponibiliza nesta categoria: artigos de jornal (9), artigos de revista (34), correspondências (1), resumo de dissertações (16), livros sobre Paulo Freire (6), palestras (1), resenhas (10), resumos (15), seminários (89), textos didáticos (1), outros (28), conforme Gráfico 2. BDPF - A Crítica 28 9 34 1 1 16 6 89 15 1 10 artigos de jornal resum o de dissertações resenhaS textos didáticos artigos de revista livros sobre Paulo Freire resum os outros correspondências palestras sem inários Gráfico 2: A Crítica da BDPF Fonte: Dados da Pesquisa c) Multimídia: áudio, vídeo e imagem de Paulo Freire, dividida em duas categorias (Figura 4): - A Obra com áudio, imagem e vídeo do educador Paulo Freire e - A Crítica com áudios e vídeos, depoimentos relacionados ao educador Paulo Freire. Figura 4 – Documentos multimídia da BDPF Fonte: (BDPF, 2005) A biblioteca disponibiliza na categoria A Obra: vídeos (6); áudios (20); imagens (38). E na categoria A Crítica: áudios (2); e vídeos (14), conforme Gráficos 3 e 4. BDPF - Multimídia - A obra 38 Imagens 20 Audios 6 Videos 0 10 Gráfico 3: Multimídia - A obra da BDPF Fonte: Dados da Pesquisa 20 30 40 BDPF - Multimídia - A crítica 2 Audios 14 Videos 0 5 10 15 Gráfico 4: Multimídia -A crítica da BDPF Fonte: Dados da Pesquisa 2.2 Índice de cabeçalhos de assunto Para fazer a busca de informações por assunto, a BDPF coloca à disposição dos usuários um índice alfabético (Figura 5), ou seja, uma relação de termos que representa o conteúdo dos documentos, facilitando assim o acesso ao documento de forma rápida e precisa. Este índice é formado de cabeçalhos de assunto e de suas respectivas remissivas, tema a ser abordado no capítulo 3, no item Linguagem Documentária, deste estudo. Figura 5 – Índice de Cabeçalhos de Assunto da BDPF Fonte: (BDPF, 2005) 2.3 Glossário O glossário (Figura 6) elaborado pelo grupo de Indexação da BDPF tem como principal finalidade a recuperação da informação, sobretudo para os usuários que se interessam pela temática e não dominam a terminologia utilizada. O Grupo de Indexação da BDPF é formado por professores do Departamento de Biblioteconomia e Documentação do Centro de Ciências Sociais Aplicadas da UFPB e por alunos do Curso de Graduação em Biblioteconomia, coordenado pela professora Maria Elizabeth Baltar Carneiro de Albuquerque. Figura 6 – Glossário da BDPF Fonte: (BDPF, 2005) O glossário faz referência a cada cabeçalho, que se encontra no índice dessa biblioteca, acompanhado de seu significado, buscando, dentro do possível, expressar as idéias de Paulo Freire. Para definição dos termos do glossário, o Grupo de Indexação recorreu ao Thesaurus Brased do Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira – INEP, também a outros autores como Moacir Gadotti em sua obra intitulada “Paulo Freire: uma biobibliografia”, aos textos de Paulo Freire e aos de especialistas que sobre ele escrevem ou escreveram. Algumas definições sobre o assunto estão descritas tal como se apresentam no documento e outras foram, sempre que necessário, adaptadas ou elaboradas pelo Grupo de Indexação com a revisão de um especialista da área de Educação. 2.4 Política de indexação da Biblioteca Digital Paulo Freire A política de indexação é uma decisão administrativa e, de acordo com Carneiro (1985, p. 221), ela deve servir de guia para tomadas de decisões, levando em conta os seguintes fatores: [...] características e objetivos da organização determinantes do tipo de serviço a ser oferecido; identificação dos usuários, para atendimento de suas necessidades de informação e recursos humanos, materiais e financeiros, que delimitam o funcionamento de um sistema de recuperação de informações. Para Lancaster (2004), todas as decisões referentes à política de indexação devem ser tomadas pelos gestores do serviço de informação, ficando, deste modo fora, do controle do indexador individual. Carneiro (1985), citado por Rubi (2004), destaca os elementos que compõem uma política de indexação: a) Cobertura de assuntos – assuntos cobertos pelo sistema; b) Seleção e aquisição dos documentos-fonte – cobertura do sistema em áreas de assunto de seu interesse e qualidade dos documentos; c) Processo de indexação – refere-se aos níveis de exaustividade e especificidade requeridos pelo sistema, escolha da linguagem, capacidade de revocação e precisão do sistema; d) Estratégia de busca – decisão entre a busca delegada ou não; e) Tempo de resposta do sistema – identificação do tempo permitido para ser consumido no momento da recuperação; f) Forma de saída – definição da forma em que os resultados de busca são apresentados; g) Avaliação do sistema – determinará até que ponto o sistema satisfaz as necessidades dos usuários. No ano 2003, foi elaborada a Política de indexação da Biblioteca Digital Paulo Freire, com os seguintes objetivos: a) Recuperar conteúdos através da identificação de termos (cabeçalhos de assunto), identificando o assunto; b) Produzir um índice com os cabeçalhos atribuídos; e c) Produzir um glossário, utilizando os termos atribuídos aos cabeçalhos, em consonância com as idéias de Paulo Freire (ALBUQUERQUE, 2004). Os objetivos de uma política são a definição das variáveis que afetam o desempenho do serviço de indexação, o estabelecimento dos princípios e critérios que servirão de decisões para otimização do serviço, a racionalização dos processo e a consistência das operações envolvidas. (STREHL, 1998, p.2) A elaboração da política considerou quatro elementos: os usuários, o acervo, os critérios e a avaliação. a) Os usuários: são estudantes, docentes, pesquisadores e outros indivíduos interessados na temática de Paulo Freire; b) O acervo: como visto anteriormente, contendo todas as informações relacionadas à vida e obra de Paulo Freire; c) Os critérios: foram definidos critérios de seleção de cabeçalhos, números de palavras por cabeçalho; uso de singular e plural; sinônimos; cabeçalhos compostos; termos homógrafos; período; indicadores geográficos; e divisão de forma; d) A avaliação: a opinião do usuário é indispensável. Nesse intuito, a BDPF disponibiliza, no seu site, um espaço para os usuários interagirem, através de sugestões ou até mesmo para tirar dúvidas. Compreendemos diante do exposto, que a falta de um controle de vocabulário, pode afetar na estrutura de um Sistema de Recuperação da Informação (SRI). 3 SISTEMAS DE RECUPERAÇÃO DA INFORMAÇÃO “É inquestionável que existe um mundo invisível o problema é saber a que distância ele se encontra do centro da cidade, e até que horas ele está aberto”. WOODY ALLEN _________________________________________________ O termo Sistema de Recuperação da Informação (SRI), costuma se referir a um sistema de computador, constituído de hardware, software e base de dados, exercendo várias atividades que podem ser classificadas, conforme suas funções de input (entrada) e output (saída) de informação, apresentadas em três estágios: indexação, armazenagem e recuperação. Os sistemas de recuperação da informação foram tradicionalmente desenhados para oferecer acesso à informação a partir de distintos documentos. [...] Mais recentemente, aplicações para recuperação da informação têm fornecido acesso à informação contida nos documentos eletrônicos, especialmente documentos baseados em textos, mas cada vez mais sistemas têm incluído alguns recursos para acesso a documentos multimídia e acesso à informação e objetos com documentos multimídia (tais como fotos e vídeo-clips). (ORTEGA, 2002, p.59) Rowley (2002, p. 9) também esclarece que os SRI foram projetados para “proporcionar acesso a informações e não a documentos”. Os SRI devem representar o conteúdo dos documentos, no qual os usuários, através de uma expressão de busca, obtêm uma rápida seleção dos itens de interesse, e para isso, é necessário que se familiarizem com os diversos recursos de busca, para uma melhor otimização na utilização do sistema. Para uma correta utilização de um SRI, existem alguns elementos que devem ser necessariamente dominados pelos usuários. Kuramoto (1995, p. 2) apresenta esses elementos: - um certo número de comandos para se colocar o sistema em modo de consulta, para se escrever uma expressão de busca dentro de uma sintaxe correta, para visualizar o resultado de uma consulta etc.; - a indispensável lógica booleana em uma consulta de múltiplos critérios a qual, para oferecer bons resultados, exige a utilização de operadores como intersecção, união, exclusão, comparação, de proximidade etc.; - a estrutura conceitual da base de dados, os nomes de campos a consultar e as convenções de escrita de cada um destes campos; - os termos de indexação, os léxicos, os tesauros etc. Os recursos oferecidos pelos sistemas devem ser aproveitados pelos usuários de forma que lhes permitam atingir uma busca bem-sucedida, pois cada usuário tem sua necessidade de informação e deve converter essa necessidade em algum tipo de estratégia de busca (LANCASTER, 1993), ou seja, um conjunto de decisões e ações adotadas durante a busca. Para planejar uma estratégia de busca com maior nível de complexidade, os SRI necessitam envolver vários conceitos na mesma estratégia como: permitir a busca de palavras por títulos dos documentos, isto é, termos da linguagem natural; buscar termos específicos de linguagens controladas, nos campos de cabeçalhos de assunto; buscar por autores; por ano de publicação; por classificação; permitir a busca de conceitos compostos ou simples e a possibilidade de truncamento de palavras e de substituição de caracteres no meio dos termos, dentre outros recursos de recuperação (LOPES, 2002). Almejando-se esses conceitos, a procura de documentos, com informações úteis, torna-se mais freqüente. A partir daí, o SRI definirá suas principais características de revocação e de precisão. Entende-se por revocação a capacidade de recuperar documentos úteis e por precisão a capacidade de evitar documentos inúteis (LANCASTER, 2004). Diante do exposto, algumas bibliotecas digitais tentam aperfeiçoar a eficiência e a eficácia de seus SRI, através de suas interfaces, deixando-as mais amigáveis. Facilitando os diferentes tipos de busca de seus usuários, sejam eles inexperientes ou experientes, como, por exemplo, a BDPF, que disponibiliza menus como: busca por assunto (ao fazer a busca por assunto, o usuário deve clicar em algum cabeçalho de assunto, desse modo serão recuperados todos os documentos associados com a palavra clicada); busca avançada (quando o usuário opta em realizar uma busca avançada, ele deve preencher pelo menos um dos campos que o sistema disponibiliza – cabeçalho de assunto, título, autor, formato, tipos de documento); busca genérica ou geral (ao fazer a busca genérica, o usuário deve digitar alguma palavra chave - seja ela o nome de um autor, um cabeçalho de assunto, ou um título de uma obra desse modo serão recuperados todos os documentos associados com a palavra digitada). Podemos observar essa interface na Figura 7. Figura 7– Tipos de busca da BDPF Fonte: (BDPF, 2005) Notamos claramente que todas essas tecnologias de informação e comunicação (TIC’s) atuais influenciam as bibliotecas na mudança de sua concepção histórica de depósito de livros para instituições voltadas para disseminação de informações mais específicas, de forma dinâmica e eficaz, disponibilizando uma combinação de materiais convencionais e eletrônicos. O que antes era disponível, hoje, deve se tornar acessível, e a Internet veio como elemento facilitador, para, através dela, buscar e tratar as informações no sentido de disponibilizá-las, como é o caso das bibliotecas digitais. A definição de biblioteca digital ainda encontra-se em fase de amadurecimento. Na literatura nacional e internacional, são vários os conceitos que envolvem as bibliotecas associadas às novas tecnologias de informação e comunicação. Não existe ainda consenso entre alguns autores5, o que leva muitas vezes as estruturas das mesmas serem confundidas e/ou abordadas como semelhantes. Desta forma, apresentamos algumas definições/conceitos que contribuirão para uma reflexão a respeito dessas bibliotecas, delimitando o nosso trabalho a partir deles. A primeira é a biblioteca polimídia que apresenta diferentes tipos de meios independentes para a armazenagem da informação, como, por exemplo, o papel, os microfilmes e os discos compactos, vídeos, fitas, CD-ROMs, CD-Is, microfilmes, software de computadores etc, sendo tecnologias fisicamente diferentes. Com isso, podemos dizer que as bibliotecas polimídias são instituições que armazenam informações, usando um amplo e variado número de “mídias”, ou seja, vários meios e/ou canais de comunicação. Mesmo assim, nesse tipo de biblioteca, os computadores estão disponíveis apenas para consulta dos usuários, sendo que todos os processos de gerenciamento e organização nestas bibliotecas serão praticamente manuais e está tecnologia não será utilizada para a realização de qualquer forma de automação nessas bibliotecas. (MARCHIORI, 1997). A segunda é a biblioteca eletrônica que está presente como uma das fases da história das bibliotecas, descrita por Landoni (1993), para generalizar todas as bibliotecas que usam o computador para armazenar, recuperar e disponibilizar informações, de forma que o usuário 5 A exemplo de :Cavalcanti (1996); Marchiori (1997); Levacov (1997); Waters (1998).;Cunha (1999); Macedo e Modesto (1999); Pereira e Rutina (1999); Zang et al (2000). tenha acesso a textos completos disponíveis on-line. Segundo Rowley (2002, p.4), a “biblioteca eletrônica incluirá vários recursos auxiliares de busca de navegação que atuarão tanto no interior dela quanto permitirão o acesso a outras coleções de informações ligadas em rede em todo o mundo”. A autora também admite que “a biblioteca eletrônica não se refere à automação de biblioteca”, ou seja, ela é formada por materiais primários apenas em forma eletrônica. Podemos perceber que, na biblioteca eletrônica, os processos básicos são de natureza eletrônica, onde ocorre o uso de recursos eletrônicos, através da utilização dos computadores. Seguindo esse mesmo entendimento, Cavalcanti (1996, p.90) define a biblioteca eletrônica como [...] aquela que dá a seus usuários acesso em linha, não somente a catálogos, mas também a uma grande variedade de recursos eletrônicos existentes na própria biblioteca e fora dela, como por exemplo, índices e resumos bibliográficos, bases e bancos de dados (de informações e texto completo), sistema de cd-rom entrega de documentos, jornais eletrônicos, bases de dados de imagens, e, ainda acesso a correio eletrônico, para comunicação com bibliotecários especialistas. Refletindo sobre esse conceito, enfocamos o acesso e o uso extensivo dos meios eletrônicos, tanto dos usuários quantos dos bibliotecários e/ou especialistas. A terceira é a biblioteca virtual que, para existir, depende da tecnologia da realidade virtual, ou seja, ter um software que produza um ambiente de segunda e de terceira dimensões num ambiente de total imersão e interação, onde é possível entrar na biblioteca, percorrer salas e estantes, pegar e folhear livros, ou seja, o único lugar em que o livro existe é no computador projetado por esse software e na cabeça do leitor (MARCHIORI, 1997). De acordo com o pensamento de Bezerra (2003), o virtual é algo que existe em potência e não na prática, pois a palavra virtual origina-se da palavra virtualis que significa força, potência. E a quarta é a biblioteca digital, onde daremos mais ênfase, por ser nosso campo de estudo. 3.1 Bibliotecas Digitais Ao refletirmos sobre a biblioteca digital, temos como precursores Vannevar Bush e Theodore Nelson, idealizadores do hipertexto. Em 1945, o cientista americano Vannevar Bush, levando em consideração o aumento da produção e do registro de informação, seu armazenamento, consulta e seleção, antecipou a noção de um repositório de informação, do qual chamou de MEMEX (Memory Extension). Ele idealizou e delineou, com detalhes, no artigo intitulado “As we may think” uma máquina capaz de armazenar informações, de uma forma fácil e veloz, com acesso através de uma tela de televisão com alto-falantes. O efeito seria de uma extensão da memória humana e isso facilitaria a disseminação da informação científica. Apenas nos anos sessenta é que Theodore Nelson consolidou essa idéia, empregando o termo hipertexto em sistema de informática, para demonstrar a idéia de escrita/leitura não seqüencial, no Projeto denominado XANADU, onde imaginou que as pessoas poderiam ter acesso a qualquer informação de qualquer lugar conectada a uma grande rede contendo todo o saber literário e científico, onde seriam armazenados os textos completos de documentos (LÉVY, 1993). Essa noção de armazenamento de textos completos em rede e de leitura não seqüencial concretiza-se com as bibliotecas digitais. As bibliotecas digitais são sistemas de informação que existem somente na forma digital, ou seja, dispõem de todos os recursos de uma biblioteca eletrônica, oferecendo pesquisa e visualização dos documentos (full text, imagem, áudio etc) por meio de redes de computadores (MARTINS, 2004). Em relação ao conceito de biblioteca digital, percebemos que, na literatura, existe um consenso entre alguns autores como Marchiori (1997), Macedo e Modesto (1999), Pereira e Rutina (1999), Zang et al (2000), no que se refere à existência da informação apenas na forma digital. Assim este fato torna-se uma característica importante para diferenciá-la das demais. Discorremos, então, sobre o conceito, apresentado por Marchiori (1997, p. 4): A biblioteca digital difere-se das demais porque a informação que ela contém existe apenas na forma digital, podendo residir em meios diferentes de armazenamento, como as memórias eletrônicas (discos magnéticos e ópticos). Desta forma, a biblioteca digital não contém livros na forma convencional e a informação pode ser acessada, em locais específicos e remotamente, por meio de redes de computadores. A grande vantagem da informação digitalizada é que ela pode ser compartilhada instantaneamente e facilmente, com um custo relativamente baixo. A definição aborda aspectos tempo-espaço, a partir do momento em que o objeto é digitalizado e compartilhado; a busca de informação acontece em qualquer que seja o local de acesso. A disponibilização e compartilhamento dos documentos contidos, na biblioteca digital, são realizados de forma processável por computador, isto é, convertidos por digitação ou por reconhecimentos de caracteres óticos, digitalizados por scanners. Suas coleções são formadas por documentos contendo textos na íntegra, multimídia, imagens digitais, áudio-visuais, entre outros, com conteúdos e arquivos transferíveis quantas vezes forem necessárias, bastando apenas estar conectado, ou autorizado através de LANs6 ou WANs7. Conforme Ortega (2002, p.53) “Uma vez acessada, materiais da coleção de uma biblioteca digital podem ser visualizados, impressos, baixando ou manipulando de outro modo para satisfazer necessidades particulares de usuários”. 6 “Sigla para Local Area Network, rede de computadores em geral, limitada a um prédio ou conjunto de prédios de uma instituição” (COMUNICAÇÃO, 2005) 7 “Sigla para Wide Area Network, uma rede que interliga computadores separados por distâncias maiores do que um quilômetro” (COMUNICAÇÃO, 2005) Na construção dessas bibliotecas, existem grupos cada vez mais específicos. Isso significa que quando essas áreas de vários domínios do saber se concentram para construir uma biblioteca digital, trazem consigo suas terminologias, suas linguagens, com o objetivo de, [...] selecionar, estruturar, oferecer o acesso intelectual, interpretar, distribuir, preservar a integridade e assegurar a persistência integral das coleções de trabalhos digitais, de modo que estejam prontamente e economicamente disponíveis para o uso por uma comunidade definida ou conjunto de comunidades. (WATERS, 1998) As bibliotecas digitais assumem algumas funções citadas por Fox (1998), sendo elas: Suporte de forma colaborativa; Preservação de documento digital; Gerenciamento de base de dados distribuída; Hipertexto; Filtros de informação; Recuperação de informação; Módulos e instrução; Gerenciamento de direitos autorais; Serviços de informação multimídia; Serviços de referência e respostas às questões enviadas; Busca de recursos; Disseminação seletiva. Corroborando esse mesmo pensamento, Cunha (1999) aponta algumas características dessas bibliotecas que podemos observar no Quadro 1. • o usuário tem acesso remoto, através do computador acoplado a uma rede; • o objeto pode ser utilizado concomitantemente por duas ou mais pessoas; • inserção de produtos e serviços de uma biblioteca ou centro de informação; • acesso à referência bibliográfica, a texto completo (sendo acrescentada à rede à medida que os novos textos forem sendo digitalizados); • fornecimento de acesso em linha a outras fontes externas de informação; • diversos suportes de registro da informação, tais como: textos, sons, imagens e números; • existência de um sistema inteligente ou especialista para ajudar na recuperação de informação mais relevante. Quadro 1: Características das bibliotecas digitais Fonte: Cunha (1999) Além de apresentar essas, características, o autor faz uma análise da evolução das bibliotecas, incorporando a essa evolução uma classificação em “Eras” a partir das novas tecnologias, estruturadas da seguinte forma: Primeira Era - Tradicional Moderna; Segunda Era - Automatizada; Terceira Era - Eletrônica; e Quarta Era - denominada Digital e Virtual, conforme se pode observar na Figura 8. Virtual Maturidade ERA IV b Digital a ERA III Eletrônica ERA II Automatizada ERA I Tradicional moderna Zona de descontinuidade Tempo 1850 2000 Figura 8 - Evolução tecnológica das bibliotecas Fonte: Cunha (2000, p. 75) Ficam evidentes, então, a superação e o rompimento de todos os paradigmas que as bibliotecas ultrapassam com as novas tecnologias. Nesse contexto, as bibliotecas ganham novos horizontes e novas terminologias. Com isso, mudam também os processos, surgindo novos desafios, nos quais podemos citar os serviços que envolvem os processamentos técnicos, principalmente, a indexação, assunto a ser abordado no item a seguir. 3.2 Indexação A indexação é um subsistema de entrada do sistema de recuperação da informação, resultado da necessidade de construção de índices. Atualmente, essa concepção está relacionada ao processo de tratamento da informação que permite a análise, a síntese e a representação dos documentos. Antes de falarmos das etapas da indexação, vamos apontar alguns conceitos relacionados à ela. O Sistema Mundial de Informação Científica (UNISIST, 1981) define a indexação como a “representação do conteúdo dos documentos, por meio de símbolos especiais quer retirados do texto original (palavras-chave extraídas do documento), quer escolhidos numa linguagem de informação ou de indexação”. Para Van Slype (1991) indexação é a “operação que consiste em enumerar os conceitos sobre os quais trata um documento e representá-los por meio de uma linguagem combinatória: lista de descritores livres, lista de autoridades e o thesaurus de descritores” Esteban Navarro (1999), citado por Silva e Fujita (2004, p. 137), conceitua indexação como [...] um processo a identificar e descrever ou caracterizar o conteúdo informativo de um documento mediante a seleção das matérias sobre as quais versa (indexação sintética) ou dos conceitos presentes (indexação analítica) para sua expressão da língua natural e sua reunião em índice, com objetivo de permitir posterior recuperação dos documentos pertencentes a uma coleção documental ou conjunto de referências documentais como resposta a uma demanda acerca do tipo de informação que este contém”. Segundo Lancaster (2004), a indexação implica na preparação de uma representação do conteúdo temático dos documentos. O autor divide o processo de indexação em duas principais etapas que ocorrem de modo simultâneo: a análise conceitual e a tradução. a) Análise conceitual – indica do que trata o documento, ou seja, a qual assunto está relacionado; b) Tradução – abrange a conversão da análise conceitual de um documento, num determinado conjunto de termos de indexação para o vocabulário do sistema. Na primeira etapa da indexação, a análise conceitual está inserida a indexação manual e a indexação automática ou automatizada. Para Vieira (1998), citado por Paiva (2002, p.52) na indexação manual “os conceitos são extraídos, através de um processo de análise intelectual”. Bentes Pinto (2001) afirma que a indexação manual é realizada intelectualmente por um ser humano, baseando-se no julgamento dos indexadores, do texto e das necessidades da comunidade de usuários. Na indexação automática, o processo de indexação é realizado com o uso de computador; Guimarães (2000, p.1) aponta três concepções, levando em consideração como é realizado esse uso: – a primeira está relacionada pelo uso de programas informáticos que dão suporte ao armazenamento dos termos de indexação obtidos pela análise conceitual; - a segunda pelo uso dos sistemas que analisam documentos de forma automática com validação dos termos por um profissional (indexação semi-automática); - e a terceira, refere-se a indexação automática propriamente dita, sendo aquela realizada pelos programas de computador sem nenhum tipo de validação por profissionais. Os termos criados pela indexação automática propriamente dita não são de muita qualidade, no entanto, são mais baratos, apresenta forma muito mais rápida (obviamente). Isso faz com que algumas instituições adotem esse processo. O argumento a favor da linguagem natural e do processamento automático na indexação dos recursos eletrônicos utilizados atualmente na Internet, tem uma visão muito generalizada, pois parece haver uma interpretação de que a geração do conhecimento científico ocorre na mesma velocidade com que uma enorme gama de informações, sem qualquer valor, são geradas e disponibilizadas na Internet. Isso revela uma enorme ignorância do processo de geração do conhecimento científico, e da falsa compreensão da Internet como um sistema de informação, ou de recuperação, quando não é uma coisa nem a outra. A Internet é um sistema de comunicação que facilita muito o acesso a sistemas de informação e de recuperação da informação, sejam aqueles já existentes há tempo, sejam outros que têm sido desenvolvidos para aproveitar essa capacidade de comunicação. (JESUS, 2002,p. 15) O modelo adotado no processo de indexação da BDPF é a indexação realizada por profissionais, nela usa-se o computador apenas para armazenar os termos indexados em programas específicos. Os profissionais recebem os documentos para análise, a serem indexados, e utilizam programas de computador para armazenar os cabeçalhos indexados, sendo disponibilizados ao usuário, através de índices de cabeçalhos de assunto e na forma de glossário com seus respectivos conceitos, processo esse representado na Figura 9. Documentos Grupo de Indexação ANÁLISE dos documentos Índice Indexação Cabeçalhos de Assunto Figura 9 - Processo de indexação realizado pelos indexadores da BDPF Fonte: Dados da pesquisa Glossário Na segunda etapa da indexação, a tradução, Lancaster (2004) faz uma distinção quanto à indexação, dividindo-a em dois tipos: indexação por extração (são retiradas expressões do próprio documento para representar o conteúdo) e indexação por atribuição (são atribuídos termos de uma outra fonte aos documentos para representar seu conteúdo, a exemplo dos vocabulários controlados). A indexação é uma operação que lida com idéias a serem transmitidas e envolve vários fatores, dentre eles, o conhecimento do indexador no assunto a ser trabalhado. Isso não quer dizer que esse deve ser um especialista na área, contudo deve conhecer a linguagem a ser utilizada. Caso contrário, podem ocorrer falhas de indexação tanto na análise conceitual (deixar de reconhecer algum tópico de interesse do usuário; interpretação errônea do conteúdo do documento) como na tradução (deixar de utilizar termos específicos da área; empregar termos que não são da área). Dessa forma, faz-se necessário conhecer as linguagens de indexação, item a ser abordado a seguir. 3.3 Linguagem Documentária Os SRI utilizam instrumentos para que ocorra comunicação com o usuário, instrumentos esses que são chamados de Linguagem Documentária (LD). Essas linguagens recebem várias denominações como: linguagens de indexação (Melton, J.); linguagens descritoras (Vickery, B); codificações documentárias (Grolier, E.); linguagens de informação (Soergel); vocabulários controlados (Lancaster, F.W); listas de assuntos autorizados (Montgomery, C.). As linguagens podem ser: natural - formada pela reunião de símbolos utilizados e reconhecida pelo homem, ou seja, é uma linguagem livre; ou artificial – elaborada, de acordo com regras previamente estabelecidas, controlada por instrumentos de indexação. As linguagens documentárias são linguagens “construídas para indexação, armazenamento e recuperação da informação e correspondem a sistemas de símbolos destinados a “traduzir” os conteúdos dos documentos”(CINTRA et al., 2002, p.33). Gardin (1981), citado por Cintra (1994, p.25), trata a linguagem documentária como “um conjunto de termos providos ou não de regras sintáticas, utilizadas para representar conteúdos de documentos técnico-científicos, com fins de classificação ou busca de informação”. Essas linguagens precisam dos seguintes elementos para comunicação necessária com o usuário: vocabulário, estrutura (elementos sintéticos) e sintaxe. Para Gomes e Campos (1998), o vocabulário e a estrutura ocorrem no interior da LD e a sintaxe no momento da indexação. Entende-se por vocabulário “termos de linguagem natural, incluindo os controles de harmonia e sinonímia”, a estrutura é a rede de relações hierárquicas entre os termos” e a sintaxe é a “ordem que estes termos precisam ter para uma representação adequada dos documentos”. As linguagens documentárias podem ser classificadas, seguindo dois critérios: a) Pela ordenação dos conceitos – como pré ou pós-coordenadas; b) Pela forma de apresentação - ordem sistemática ou alfabética. As linguagens pré-coordenadas combinam ou coordenam os termos no momento da indexação, ou seja, o indexador coordena os assuntos, quando faz o tratamento da informação, a exemplo, temos os cabeçalhos de assunto. Os cabeçalhos de assuntos representam os assuntos em forma de lista e arrolam os termos de todas as áreas do conhecimento. As listas mais conhecidas são Library of Congress of Subject Headings, a Sears List of Subject Headings e Wanda Ferraz (Relação de assuntos para cabeçalhos de fichas), que estão apresentadas de forma alfabética. O sistema de cabeçalhos de assuntos foi desenvolvido pela Biblioteca do Congresso Americano em Washington para seu catálogo de assuntos, porém em 1876, Charles A. Cutter fez a primeira tentativa para estabelecer regras direcionadas a esses cabeçalhos, com o objetivo de ampliar a capacidade de representação da informação. Nas linguagens pós-coordenadas, os usuários coordenam os assuntos no momento em que fazem a busca da informação. Nesse tipo de linguagem, o usuário tem a possibilidade de realizar todo o processo para chegar à informação desejada, combinando os termos. Um exemplo clássico é o tesauro, tema a ser abordado no próximo capítulo. 4 TESAURO “Criar é, basicamente, formar. É dar uma forma a fenômenos que foram relacionados de modo novo e compreendidos em termos novos [...]”. FAYGA OSTROWER _________________________________________________ Thesaurus é uma expressão inglesa que foi empregada a partir de 1500, para indicar um acervo ordenado de informações e conhecimentos. Uma das primeiras obras a incluir esta expressão no seu título foi o Thesaurus linguae romanae et britannicae, publicada em 1565, da autoria de Cooper (CAVALCANTI, 1978). Popularizou-se, no ano de 1852, em Londres, com a publicação do Thesaurus of English Words and Phrases, de Peter Mark Roget, em que utilizava a palavra, como uma coleção de termos organizados, de acordo com as idéias que expressava cada texto, no subtítulo da obra “palavras classificadas para facilitar idéias e para ajudar na composição literária”. O thesaurus de Peter Mark Roget foi organizado da seguinte forma: estrutura classificatória, ou seja, um sistema de classificação de idéias e um índice alfabético dos cabeçalhos, dos quais ocorrem as palavras e as frases que representam as idéias. Constituído em seis categorias: as relações abstratas (existência, ordem, número, tempo, etc); o espaço (movimento, mudança de lugar); a matéria (solidez, calor, luz); o intelecto (aquisição, comunicação de idéias); vontade (escolha, ação, intenção); afeições (sentimentos morais e religiosos). Na Figura 10, temos a primeira página do catálogo classificado de palavras, compilado por Peter Mark Roget. Figura 10 – Catálogo classificado de palavras, 1805. Fonte: Dodebei (2002, p.63) Em 1940, a palavra tesauro foi utilizada em Ciência da Informação, na recuperação de informação. Todavia, foi no ano 1951 que Mortimer Taube consolidou a idéia com o desenvolvimento do Sistema Unitermo cuja finalidade era representar o assunto por palavras únicas chamadas de unitermos, introduzindo o acesso múltiplo, com arquivos manuais de fichas. As buscas eram feitas com uma comparação entre os números que eram colocados nas fichas. O principal problema desse sistema era não possuir um controle de vocabulário, fazendo com que a busca se tornasse exaustiva, pois não se tinha uma idéia como aquele documento teria sido representado no texto, problema esse que Lancaster (1993) assevera como “o retorno aos vocabulários controlados e o desenvolvimento do tesauro na recuperação de informação” como solução. Lancaster considera o sistema unitermo responsável pelo aparecimento de uma nova linguagem – o tesauro de recuperação da informação. Na área de Ciência da Informação, são incorporados vários significados ao tesauro. Na década de 70, a UNESCO, através do programa UNISIST, define o termo sob dois aspectos: quanto à estrutura - vocabulários controlados e dinâmicos, de termos relacionados, semânticos e gerais cobrindo um domínio específico do saber; e segundo a função instrumentos de controle terminológico usado na tradução da linguagem natural para uma linguagem do sistema mais restrita (CAMPOS, 2001). A preocupação da UNESCO era apresentar conceitos ligados à construção de tesauro, à organização e à recuperação da informação. O tesauro quanto à estrutura é considerado dinâmico, por permitir o registro de novos termos e alterações de termos já existentes, se for necessário, além de remissivas. De acordo com Currás (1995, p 88), tesauro “é uma linguagem especializada, normalizada, pós-coordenada, usada com fins documentários, onde os elementos lingüísticos que compõem - termos simples ou compostos - encontra-se relacionados entre si sintática e semanticamente”. Este conceito é representado na Figura 11. TESAURO TERMOS PERMITE PASSAR RELAÇÃO LINGUAGEM NATUAL NORMALIZADA HIERÁRQUICA SIMPLES COMPOSTO ASSOCIATIVA DE EQUIVALÊNCIA ACRESCENTA E SUPRIME TERMOS Figura 11: Tesauros Fonte: Currás (1995) LINGUAGEM TERMINOLÓGICA 4.1 Classes e Tipos Os tesauros podem ser classificados da seguinte forma: quando à língua; quanto ao nível de especificidade dos termos e quanto ao assunto que cobrem (GOMES; CAMPOS, 1998). a) Quanto à língua - cabe mencionar os idiomas em que se podem escrever os termos de um tesauro. De acordo com a língua, podem ser monolíngües ou multilingües; b) Quanto ao nível de especificidade dos termos - podem ser: macrotesauros, onde o número de remissivas é mais elevado do que o número de descritores, uma vez que os conceitos específicos são representados por não-descritores que remetem ao descritor superior; ou microtesauros em que os descritores representam conceitos específicos e se referem a uma área restrita do saber; c) Em relação ao assunto que cobrem - podem ser multidisciplinares (que incluem termos de diversas disciplinas) e monodisciplinares (voltados para uma disciplina científica). 4.2 Relações entre descritores As normas do programa UNISIST da Unesco estabelecem abreviaturas utilizadas antes dos termos, ou notas para indicar a relação dos descritores, conforme Quadro 2. TERMOS TERMO GENÉRICO TERMO ESPECÍFICO TERMO RELACIONADO NOTA EXPLICATIVA TERMO GENÉRICO MAIOR TERMO USADO PARA USE Português TG TE TR NE TGM UPE USE Inglês BT NT RT SN TT UF USE Quadro 2: Abreviaturas dos termos de relações entre descritores Fonte: Austin (1993) São reconhecidas três classes básicas de relações de um tesauro: Relação de Equivalência, Hierárquica e Associativa (AUSTIN, 1993). a) A Relação de Equivalência – é a relação entre o termo preferido e não preferido, ou seja, entre o que foi adotado e o não-adotado; b) A Relação Hierárquica – distingue o tesauro sistemático de uma lista de termos, baseia-se na superordenação e na subordinação; c) A Relação Associativa – relações entre pares de termos que não são membros de um conjunto de equivalência nem podem ser organizados em uma hierarquia onde o termo se subordina a outro. Essas relações podem ser apresentadas em ordem alfabética, sistemática ou gráfica. Essas formas de apresentação devem ser decididas antes da reunião dos termos a serem incluídos nos tesauros. 4.3 Tesauro na indexação de documentos O tesauro é o instrumento utilizado no contexto da documentação para indexação e recuperação da informação e é uma linguagem artificial, porque os termos que compõem esta Linguagem Documentária devem possuir um controle rígido do significado. O emprego de tesauros nas tarefas de indexação tenta resolver o problema da alocação de documentos em classes de assuntos, não só por sua capacidade de controlar o vocabulário, mas porque é um instrumento que relaciona os descritores/termos de forma mais consistente, apresentando uma estrutura sintética simplificada e uma complexa rede de referências cruzadas (DODEBEI, 2002, p. 67). Para a autora, o uso de tesauros, nas tarefas de indexação, também permite ao usuário (pesquisador ou especialista) localizar com maior grau de facilidade o termo adequado para a busca, pois apresenta uma relação lógica e hierárquica dos descritores. Além da sua capacidade de organização, o tesauro também tem um valor didático, porque utiliza conceitos específicos de uma área de domínio que contempla e permite, por meio das relações entre os termos, a sua melhor compreensão. O thesaurus de uma área, assim concebido e estruturado, norteia todo o processo de entrada e de saída de um sistema de informações. Na entrada norteia a análise definindo a seleção e a síntese das informações a serem armazenadas nos bancos de dados. Na saída norteia a análise, definindo as necessidades informacionais dos usuários e as chaves de busca nos bancos, e orientando sobre a criação de produtos e serviços de acordo com os objetivos do centro e as expectativas dos que buscam informações para gerar conhecimentos a definir a ação (INEP, 2005). Foi com esse entendimento e por se tratar de um instrumento especializado na área de Educação, que foi utilizado o Thesaurus Brased na indexação da Biblioteca Digital Paulo Freire. 4.4 Thesaurus Brased O Thesaurus Brasileiro de Educação (BRASED) é uma ferramenta que integra e padroniza todas as bases de dados educacionais do INEP e foi desenvolvido no âmbito do CIBEC/ INEP. O Centro de Informação e Biblioteca em Educação (CIBEC) são responsáveis pela disseminação de informações educacionais e estão ligados à Diretoria de Tratamento e Disseminação de Informações Educacionais do Instituto de Estudos e Pesquisas Educacionais Anísio Teixeira (INEP). 4.4.1 Histórico do Thesaurus Brased O Thesaurus Brasileiro de Educação (BRASED) começou a ser desenvolvido em 1980, sob a coordenação do professor Gaetano Lo Mônaco. No ano 1989, os analistas do CIBEC elaboraram sua primeira versão experimental para uso interno, em 1997, a segunda versão, e apenas, em 2001, é que http://www.inep.gov.br/pesquisa/thesaurus (Figura 12). foi criado seu protótipo Figura 12 –Thesaurus Brased Fonte: Inep (2005) Em princípio o Thesaurus BRASED foi elaborado para facilitar a pesquisa em Educação, sendo o tesauro pioneiro desta área no Brasil, diferenciando-se dos outros vocabulários controlados de Educação do país, por trazer seus termos selecionados e estruturados dentro de uma matriz conceitual. 4.4.2 Matriz Conceitual do Thesaurus Brased A matriz conceitual foi elaborada a partir de uma análise crítica da realidade educacional e de seu contexto. A base conceitual, na qual o Thesaurus Brased foi desenvolvido, considera a educação em seu contexto global e interdisciplinar, o que permite ao estudioso analisá-la e compreendê-la em profundidade (INEP, 2005). Para conceber, o Thesaurus Brased partiu-se do princípio de que a Educação é o processo pelo qual o ser humano (indivíduo e coletividade) desenvolve seu intelecto, suas potencialidades, sua cultura, satisfaz suas necessidades e se torna agente de sua história, interagindo constantemente com o meio. A matriz conceitual do Thesaurus Brased, portanto, coloca o homem no centro do sistema educacional (INEP, 2005), como observamos no Gráfico 5. Gráfico 5 – Matriz conceitual do Thesaurus Brased Fonte: Inep (2005) O Thesaurus Brased insere a Educação dentro do contexto global, sem o qual não é possível compreendê-la. Na definição de seu âmbito temático, foram levadas em consideração áreas que estão relacionadas com a Educação. Um thesaurus de Educação, dessa forma concebido, atenderá às exigências teóricas e concretas do pensar, fazer e gerir educação dentro de uma sociedade em desenvolvimento (INEP, 2005). De acordo com a matriz conceitual, o Thesaurus Brased é composto por quatro campos (ou subáreas), que delimitam a abrangência da Educação: a) Campo 100 - Contexto da Educação - A educação do homem se realiza dentro da realidade global e em interação com esta; fora desta não há educação; b) Campo 200 - Escola como instituição social - A Escola é a educação institucionalizada; na sociedade politicamente organizada, de fato, encontraremos todas as condições para que a educação do Homem socialmente aconteça; c) Campo 300 - Fundamentos da Educação - A educação é o principal processo do desenvolvimento humano, que é pluri e interdisciplinar, isto é, muitas ciências fundamentam e integram o processo e à ação educativa. d) Campo 400 - Educação: princípios, conteúdo e processo - O homem evolui, interagindo constantemente com o meio: é a Educação propriamente dita com seus princípios, conteúdo e processo. Além desses quatros campos, existe um campo complementar que é o indicador e o especificador de informação: Campo 900 – Indicadores e especificadores de informações – Classificam-se os termos que complementam as informações relacionadas aos quatros primeiros campos, que não fazem parte do conteúdo da Educação, sendo necessários para especificá-los, complementá-los ou identificá-los. 4.4.3 Estrutura do Thesaurus Brased Na estrutura do Thesaurus Brased, os termos se encontram dentro da lógica da matriz conceitual que contempla quatro campos temáticos e um complementar, cada um desses campos subdivide-se em grupos, facetas e subfacetas (Quadro 3, 4, 5, 6 e 7). Esses termos são ordenados, de acordo com as relações lógico-ontológicas - de hierarquia, de equivalência e de associações - existentes entre eles. 100 CONTEXTO DA EDUCAÇÃO 110 Contexto ambiental 111 Meio Ambiente 111A 111B 111C 111D 120 CAMPO GRUPO FACETA Ecologia Ambiente Natural Ambiente Humano Infra-estrutura Humana Contexto humano 121 Pessoa Humana 121A Dados Pessoais 121B Condições Pessoais 130 Contexto social 131 Democracia 131A 131B 131C 131D 140 Informações Demográficas Migração Problemas Demográficos Política Demográfica Contexto cultural 141 Meio Cultural 141A Bens Culturais SUB-FACETA 141B Entidades Culturais 141C Vida Cultural 141D Manifestações Culturais 150 Contexto político 151 Política 151A 151B 151C 151D 151E 151F 160 Filosofia Política Cidadania Sistemas Políticos Processo Político Vida Política Problemas Políticos Contexto econômico 170 Contexto mundial Quadro 3: Contexto da Educação Fonte: Inep (2005) 200 ESCOLA 210 Pesquisa da educação 220 Estatística da educação 230 Política da educação 240 Administração da educação 250 Educandos 260 Profissionais da educação 270 Instituições de ensino 280 Administração escolar 290 Economia da educação Quadro 4: Escola como instituição social Fonte: Inep (2005) 300 FUNDAMENTOS DA EDUCAÇÃO 310 Cultura e educação 320 Filosofia e educação 330 Trabalho e educação 340 Psicologia e educação 350 Sociologia e educação 360 Comunicação e educação 370 Saúde e educação Quadro 5: Fundamentos da Educação Fonte: Inep (2005) 400 EDUCAÇÃO 410 História da educação 420 Filosofia da educação 430 Educação escolar 440 Modalidades de educação 450 Curso e Currículo 460 Processo de ensino-aprendizagem 470 Avaliação escolar 480 Meios de ensino Quadro 6: Educação: princípios, conteúdo e processo Fonte: Inep (2005) 900 IDENTIFICADORES E ESPECIFICADORES DE INFORMAÇÃO 910 Identificadores de denominação 920 Identificadores de conteúdo 930 Especificadores de forma de conteúdo 940 Especificadores de suporte de informação Quadro 7: Indicadores e especificadores de informações Fonte: Inep (2005) 4.4.4 A pesquisa no Thesaurus Brased Para realizar uma pesquisa no Thesaurus Brased, encontram-se disponíveis, atualmente, duas formas: através da estrutura clicando sobre os campos 100, 200, 300, 400 e 900, ou em seus grupos ou facetas; ou através do campo termo que está disponível na página principal do Thesaurus Brased (ver item 4.3.1), digitando o termo ou palavra desejada. 4.4.5 Gestão do Thesaurus Brased A gestão do Thesaurus Brased é formada por três grupos: o grupo interno (Comitê Gestor do Brased), o grupo técnico (especialistas que colaboram com o desenvolvimento do Brased) e o grupo de usuários (usuários da Internet). A Gestão do Thesaurus Brased tem como funções: 1) Constante atualização da terminologia e suas relações; 2) Alimentação do fichário conceitual com os termos próprios ou sugeridos por analista e especialistas; 3) Compatibilização do tesauro com outras linguagens da área de Educação; 4) Avaliação da terminologia utilizada nos produtos gerados pelas bases do CIBEC; 5) Análise dos termos propostos por usuários e especialistas, auxílio na inclusão, exclusão e modificação dos termos; 6) Treinamento dos especialistas para uso dos termos de indexação e recuperação; 7) Coordenação de reuniões virtuais. 5 PERCURSO METODOLÓGICO “Fazer ciência é fascinante porque trabalha-se com a pureza que é a verdade, e com ela, pode-se descobrir e construir coisas maravilhosas, cujo beneficiário é o próprio homem”. S. L. Oliveira _________________________________________________ De acordo com Gil (1999, p. 42), pesquisa é um “processo formal e sistemático de desenvolvimento do método científico”. Para alcançar os objetivos de um trabalho de pesquisa, precisamos delimitar o caminho a ser trilhado na busca do conhecimento, ou seja, definir a metodologia a ser utilizada. Para Seabra (2001), a metodologia se constitui o caminho percorrido, refletido na prática exercida pelo pesquisador para apreender a realidade. Nesse sentido, Deslandes (2002, p. 42-43) complementa que a descrição metodológica “é uma parte complexa e deve requerer maior cuidado do pesquisador. Mais que uma descrição formal dos métodos e técnicas a serem utilizados, indica as opções e a leitura operacional que o pesquisador fez do quadro teórico”. A metodologia não está relacionada apenas ao processo de coleta de dados, mas também à leitura dos documentos para fundamentação teórica. A metodologia pode ser caracterizada, de acordo com seus objetivos, seus procedimentos de coleta e natureza dos dados. Quanto aos objetivos propostos, esta pesquisa se caracteriza como exploratória, cuja finalidade consiste em “desenvolver, esclarecer e modificar conceitos e idéias [...] desenvolvidas com o objetivo de proporcionar visão geral, de tipo aproximado, acerca de determinado fato” (GIL, 1999, p. 43). 5.1 Delimitação do campo de pesquisa A pesquisa teve como campo de estudo a Biblioteca Digital Paulo Freire (BDPF), objeto de descrição do capítulo 2 deste estudo. Analisou-se a utilização do Thesaurus Brased na Indexação, a partir dos cabeçalhos de assunto cadastrados em sua base de dados. Na base de dados estão cadastrados 351 cabeçalhos de assuntos, que constitui o universo da pesquisa. A delimitação temporal compreende o período de 25 de abril de 2005 a 04 de maio de 2005. 5.2 Etapas de investigação Para alcançar os objetivos propostos, foram percorridas as seguintes etapas no desenvolvimento da pesquisa: 5.2.1 Elaboração do referencial teórico Efetivou-se, no primeiro momento, uma revisão da literatura. Foram reunidos e analisados os documentos relacionados aos Sistemas de Recuperação da Informação (SRI) incluindo, nesse contexto, as Bibliotecas Digitais (seus conceitos e características) e a indexação, e aos Tesauros e sua relevância na indexação de documentos. Quanto à tipologia dos documentos, foram utilizados anais de congressos, apostilas de curso, documentos eletrônicos, livros, monografias (TCCs, dissertações e teses), periódicos e relatórios científicos. 5.2.2 Procedimento de Coleta de dados A coleta de dados foi feita diretamente no índice disponível na Biblioteca Digital Paulo Freire e na base de dados cadastral na qual tivemos acesso ao glossário. 5.2.3 Tabulação dos Dados A tabulação dos dados obedeceu aos princípios quantitativos, que na concepção de Richardson (1999, p.70), “caracteriza-se pelo emprego da quantificação tanto nas modalidades de coleta de informações, quanto no tratamento delas[...]”, conforme mencionado no item 5.2.4, revelando-se em formato de tabela e gráficos e ficam estruturados da seguinte forma: a) Total de cabeçalhos de assunto indexados existente na Biblioteca Digital Paulo Freire (BDPF), que compõe seu índice de cabeçalhos de assunto e seu glossário; b) Cabeçalhos de assunto retirados do Thesaurus Brased utilizados na indexação da BDPF; c) A relação entre os cabeçalhos de assunto que foram retirados de outras fontes e retirados do Thesaurus Brased utilizada na indexação da BDPF. 5.2.4 Análise e interpretação dos dados Segundo Araújo (1998, p. 110), a análise dos dados “procura, de forma ampla, atingir três objetivos: estabelecer uma compreensão dos dados coletados, confirmar ou não as questões de pesquisa e ampliar o conhecimento sobre o assunto pesquisado”. Para análise, utilizou-se a abordagem quantitativa como uma forma de garantir a precisão dos resultados, evitando, com isso, distorções de análise e interpretações. 6 ANÁLISE E DISCUSSÃO DOS RESULTADOS “A fantasia é reveladora – é um meio de caminho. Tudo o que é imaginado é verdadeiro. Nada é verdadeiro se não for antes imaginado”. EUGENE IONESCO _________________________________________________ Conforme a estrutura apresentada na metodologia da pesquisa, os dados se configuram da seguinte forma: 6.4 Cabeçalhos de assunto indexados existentes na base de dados da Biblioteca Digital Paulo Freire (BDPF) Observa-se que 351 cabeçalhos de assunto existentes na base de dados da BDPF compõem o índice alfabético e o glossário. Esses cabeçalhos foram indexados pelo Grupo de Indexação da BDPF e cadastrados em seu banco de dados. Nota-se que, na base de dados da BDPF, existem “campos” específicos, nos quais são cadastrados os cabeçalhos de assunto (termos indexados), e suas definições com suas respectivas fontes de referências. Percebe-se, nesse sentido que, na entrada por assunto, isto é, no índice alfabético dos 351 cabeçalhos de assunto; 190 encontram-se com as respectivas definições formando, assim, o glossário, como pode ser visto, no Gráfico 6. Cabeçalhos de assunto indexados da BDPF 161 190 Índice A lfabético de C abeçalhos de assunto C abeçalhos de assunto definidos no glossário Gráfico 6: Cabeçalhos de assunto da BDPF Fonte: Dados da Pesquisa Existe um número bastante significativo (190) de cabeçalhos de assuntos com seus significados, representando 54,1% dos cabeçalhos cadastrados na base de dados da BDPF para construção do glossário. Por esses dados, nota-se que há uma preocupação dessa biblioteca no controle do vocabulário, e como mencionamos no segundo capítulo deste estudo, é objetivo também da política de indexação, a produção desse glossário, utilizando-se, assim, os mesmos cabeçalhos de assunto que foram indexados para construir o índice alfabético, e definidos pelas idéias de Paulo Freire, uma vez assimiladas. 6.5 Cabeçalhos de assunto retirados do Thesaurus Brased utilizados na indexação da BDPF Verifica-se que dos 351 cabeçalhos de assunto cadastrados, na base de dados, 61 foram extraídos e definidos do Thesaurus Brased para a BDPF, como apresentado no Gráfico 7. Cabeçalhos de assunto extraídos do Thesaurus Brased para BDPF 61 161 129 C abeçalhos de assunto sem definição na B D P F C abeçalhos de assunto definidos no glossário a partirde outras fontes C abeçalhos de assunto indexados a partirdo Thesaurus B rased Gráfico 7: Cabeçalhos de assunto retirados do Thesaurus Brased para a BDPF Fonte: Dados da Pesquisa Considerando os dados anteriormente expostos, percebemos que além do Thesaurus Brased existem outras fontes que contribuem para a construção do glossário da BDPF, fontes previstas pela política de indexação. Ao analisar os cabeçalhos de assunto que foram extraídos do Thesaurus Brased, constatou-se que, apesar de ser um instrumento de controle terminológico em uma área específica do saber, neste caso, em Educação, foi necessário recorrer a outras fontes, pois não foram encontradas as definições dos termos no Thesaurus Brased. Consideram-se outras fontes todos os documentos que trazem em seu conteúdo definições dos cabeçalhos de assuntos deles extraídos, conforme se menciona no item 6.3. 6.6 Outras fontes utilizadas na indexação da BDPF em relação ao Thesaurus Brased Além do Thesaurus Brased, foram identificadas outras fontes de referências, como os próprios documentos indexados, quando estes trazem informações com seu significado, e outras obras estabelecidas pela política de indexação dessa biblioteca, conforme se pode visualizar na Tabela 1. Tabela 1: Cabeçalhos de assunto definidos utilizados na construção do glossário FONTES N. % Outras fontes 109 57,4 Thesaurus Brased 61 32,1 Moacir Gadotti 20 10,5 Total 190 100 Fonte: Dados da pesquisa Apenas 32,1% dos cabeçalhos de assunto indexados na BDPF foram extraídos do Thesaurus Brased. Da obra intitulada “Paulo Freire: uma biobibliografia”, de Moacir Gadotti o percentual de 10,5%, traz um glossário de termos extraídos das obras de Paulo Freire. E a soma de todas as outras fontes (57,4%), aponta como maior índice, como ilustrado pelo Gráfico 8. Cabeçalhos de assunto denifidos utilizados na construção do glossário da BDPF 10,5% M o acir G ado tti 32,1% T hesaurus B rased 57,4% O utras fo ntes 0 10 20 30 40 50 60 Gráfico 8: Cabeçalhos de assunto retirados do Thesaurus Brased para a BDPF Fonte: Dados da Pesquisa Considera-se a soma das outras fontes e não cada fonte individualmente abordada, pela pequena quantidade que cada fonte representa, com um quantitativo de no máximo apenas duas definições de cabeçalhos de assunto por fonte de referência, destacando-se apenas a Obra de Moacir Gadotti com um quantitativo de vinte termos. 7 CONSIDERAÇÕES FINAIS E SUGESTÕES “O pensamento e a linguagem, que refletem a realidade de uma forma diferente daquela da percepção, são a chave para a compreensão da natureza da consciência humana”. L.S. VIGOTSKI _________________________________________________ Analisar a utilização do Thesaurus Brased na indexação da BDPF, proporcionou grande avanço no conhecimento no que diz respeito ao processo de tratamento da informação dessa biblioteca. Foram enfocadas a indexação dos documentos e a contribuição trazida por um instrumento de controle terminológico, no caso, o tesauro, para a padronização da linguagem de uma área específica do saber, facilitando o caminho a ser percorrido pelos usuários para atingir suas necessidades de busca, e se tratando de uma biblioteca digital, de busca de informações em meios digitais. Logo, é interessante destacar que o controle de vocabulário utilizado por essa biblioteca foi estabelecido por uma política de indexação, instrumento relevante e necessário, pois vai influenciar na estrutura do Sistema de Recuperação da Informação (SRI), que, de acordo com Lancaster (2004), controla sinônimos, diferencia homógrafos e relaciona termos. Com relação aos resultados da pesquisa, os dados mostram que existem 351 cabeçalhos de assunto indexados na base de dados da BDPF, e 190 desses encontram-se no glossário, trabalho este que requer pesquisa criteriosa para não fugir do objetivo principal da BDPF: divulgar as idéias, os pressupostos filosóficos, sociológicos e pedagógicos do pensamento freireano, dando assim, suporte a ações educativas. Pode-se observar, portanto, que desses dados, há uma certa rigidez no processo de indexação, escolhendo-se uma linguagem pós-coordenada - o Thesaurus Brased, pioneiro na área de Educação como principal fonte de padronização da linguagem de Paulo Freire aplicada pela BDPF. É interessante destacar que os termos encontrados no índice da BDPF, conceituados e utilizados na construção do glossário, não estão disponíveis de forma on-line em seu site, porque segundo os administradores da biblioteca, o banco de dados está sendo reformulado, para melhor disponibilizar as informações aos seus usuários. Finalizada a análise dos dados constata-se a necessidade de apresentar algumas sugestões: a) Disponibilização de todos os termos já cadastrados na base de dados da BDPF, em seu site para, assim, tornar acessível aos usuários os significados dos termos; b) Um processo de análise de todos os cabeçalhos de assunto que não foram extraídos do Thesaurus Brased, que se encontram na BDPF, para que, de acordo com a estrutura e com a matriz conceitual do Thesaurus Brased, sejam apresentados ao INEP, para inclusão no Thesaurus; c) Fazer a edição impressa do glossário em Educação. Destaca-se também a relevância de um trabalho interdisciplinar, em que professores e alunos, de várias áreas, em uma ação conjunta, conseguiram construir uma Biblioteca Digital disponibilizando livros, artigos, fotos, vídeos e monografias e outros documentos do educador Paulo Freire, que tanto contribuiu para a Educação mundial. Pelo exposto, não se pode considerar este estudo concluído, tomando como base apenas as considerações e as sugestões, aqui referidas. Depreende-se, portanto, a relevância deste estudo ser apontado como um campo aberto para novas investigações e descobertas, que venham a sistematizar os conhecimentos teóricos e/ou práticos sobre Indexação e seu papel fundamental nos Sistemas de Recuperação da Informação. REFERÊNCIAS ALBUQUERQUE, Maria Elisabeth Baltar Carneiro de. Relatório de Indexação. João Pessoa, 2004. AQUINO, Mirian de Albuquerque (Coord.). Recuperação do conteúdo Freireano para a construção da Biblioteca Digital Paulo Freire. João Pessoa : UFPB, 2001. (Projeto de iniciação científica. UFPB. Departamento de Biblioteconomia e Documentação). ARAÚJO, Eliany A. A construção social da informação: práticas informacionais no contexto das organizações não governamentais/ONGs brasileiras. Brasília: UNB, 1998.Tese (Doutorado em Ciência da Informação) Programa de pós-graduação em ciência da informação. Universidade de Brasília, Brasília – DF. AUSTIN, Derek. Diretrizes para o estabelecimento e desenvolvimento de tesauros monolíngües. Brasília: IBICT / Senai, 1993, 86p. BARKER, Phillip. Electronic libraries : visions of the future. The Electronic Library, v. 12, n. 4, p. 221, Aug. 1994. BENTES PINTO, Virgínia. Indexação documentária: uma forma de representação do conhecimento registrado. Perspectivas Ciência da Informação, Belo Horizonte, v. 6, n. 2, p. 223-234, jul./dez. 2001. BEZERRA, Ed Porto e BRENNAND, Edna G. Góes. Projeto Implementação do Pólo Produtor de Capacitação em Conteúdos Digitais Multimídia no Estado da Paraíba. João Pessoa, 2000. (Projeto de Iniciação à Pesquisa) BEZERRA, Ed Porto; VASCONCELOS, Giuliana Cavalcanti. Ciberespaço e educação à distância: um debate necessário. In: CAMINHA, Iraquitan de Oliveira; AQUINO, Mirian de Albuquerque (org). Cantoria de pardais: educação, cultura e informação. Ed. Universitária, João Pessoa, 2003. BEZERRA, Emy Porto. Digitalizando o virtual: uma análise informacional do processo de implementação da Biblioteca Digital Paulo Freire. 2003. 132f. Dissertação (Mestrado em Ciência da Informação). Universidade Federal da Paraíba, Paraíba. Biblioteca Digital Paulo Freire (BDPF). Disponível em <http://www.paulofreire.ufpb.br/paulofreire/principal.jsp>Acesso em :15 mar. 2005. : BONIFÁCIO, Ailton Sergio. Bibliotecas Digitais: conceitos, arquiteturas e projetos. Universidade Federal do Rio Grande do Sul. Porto Alegre, 2001. (Trabalho digitado). Disponível em: < http://www.uel.br/pessoal/ailton/Trabalhos/trabalhos_0.html >. Acesso em: 04 jan. 2005. BRENANND, Edna G.Góes et al. Concepção e Implementação da Biblioteca Digital Paulo Freire, João Pessoa, 2000. (Projeto de Iniciação à Pesquisa) CAMPOS, Maria Luiza de Almeida. Linguagem documentária que fundamentam sua elaboração. Niterói: EdUFF,2001, 133p. CARNEIRO, M.V. Diretrizes para uma política de indexação. Revista da Escola de Biblioteconomia da UFMG, v. 14, n. 2, p. 221-241, set. 1985. CASTELLS, Manuel. A sociedade em rede. São Paulo: Paz e Terra, 1999. v. 1 CAVALCANTI, Cordélia Robalinho. Indexação & tesauro metodologia & técnicas. Brasília, ABDF, 1978 __________. Da Alexandria do Egito à Alexandria do espaço: um exercício de revisão de literatura. Brasília: Thesaurus, 1996. 240p. CIBEC. A política de disseminação informacional do Inep. Rev. bras. Est. pedag. Brasília, v. 80, n. 195, p. 335-360. maio/agos. 1999. __________. Em busca do tesauro brasileiro de educação. Rev. bras. Est. pedag. Brasília, v. 80, n. 195, p. 352-354. maio/agos. 1999. CINTRA, Ana Maria et al. Para entender as linguagens documentárias. São Paulo: POLIS/APB, 1994, 72p. CINTRA, Ana Maria et al. Para entender as linguagens documentárias. 2 ed. São Paulo: Polis, 2002, 96p. COMUNICAÇÃO Científica. Brasília: Departamento de Ciência da Informação Universidade de Brasília, 2000, 144p. COMUNICAÇÃO e Internet. Disponível em: <http://www.torque.com.br/internet/glossario. htm#W>. Acesso em: 15 jan. 2005. CUNHA, Murilo Bastos da. As tecnologias de informação e a integração das bibliotecas brasileiras. Ciência da informação, Brasília, v. 23, n.º 2, p. 182-189, maio/ago. 1994. __________. Construindo o futuro: a biblioteca universitária brasileira em 2010. Ciência da informação, Brasilia, v. 29, n. 1, p. 257-268, set./dez. 1999. __________. Desafios na construção de uma biblioteca digital. Ciência da informação, Brasilia, v. 28, n. 3. 2000. CURRÁS, Emília. Tesauros, linguagens terminológicas. Brasília: IBICT, 1995, 286p. DE PAULA, Lícia Pupo. Novas tecnologias e bibliotecas: uma síntese. Revista Brasileira de Biblioteconomia e Documentação, São Paulo, v. 25, n. 1/2, p. 42-53, jan./jun., 1992. DESLANDES, S. F. (Org.) . Caminhos do Pensamento: Epistemologia e Método. 1. ed. Rio de Janeiro: Editora FIOCRUZ, 2002. v. 1. 380 p DODEBEI, Vera Lúcia Doyle. Tesauro: linguagem de representação da memória documentária. Rio de Janeiro: Interciência, 2002, 120p. DRABENSTOTT, Karen M.; Celeste M. Burman. Revisão analítica da biblioteca do futuro. Ciência da informação, Brasília, v.26, n. 2, maio/ago. 1997. Disponível em:<http://www.scielo.br/scielo.php?script=sci_arttext&pid=S010019651997000200012&lng =pt&nrm=isov>. Acesso em: 13 dez. 2004. ESTEBAN NAVARRO, M. A. E. Elementos, actividades y critérios para la identificación, compreensión y selección de conceptos en la indización analítica. In: GARCIA MARCO, F. J. G. M. Organización del conocimiento en sistemas de información y documentación. Zaragoza: Capítulo Español de la ISKO, Universidad Carlos III de Madrid, 1999. v. 3, p. 6993. FERNANDES, Joliza Chaves. Representação da informação na WEB: história da Paraíba nos sites Altavista e Google. 2004. 116f. Dissertação (Mestrado em Ciência da Informação). Universidade Federal da Paraíba, Paraíba. FERNEDA, Edberto. Recuperação de informação: análise sobre a contribuição da Ciência da Computação para a Ciência da Informação. 2003. 147f. Tese (Doutorado em Ciência da Comunicação). Escola de Comunicações e Artes da Universidade de São Paulo, São Paulo. FOX, E. A. Digital library courseware. Blacksburg, VA : Virginia Tech Department of Computer Science, 1998. GIL, Antonio Carlos. Métodos e Técnicas de pesquisa social. 5. ed. São Paulo : Atlas: 1999. GOMES, Hagar Espanha; CAMPOS, Maria Luiza de Almeida. Tesauro e normalização terminológica: o termo como base para intercâmbio de informações. Datagramazero – Revista de Ciência da informação, v.5, n.6, dez. 2004. Disponível em: <http://www.dgz.org.br/dez04/Art_02.htm>. Acesso em: 23 dez. 2004. __________. Atualização em indexação e controle de vocabulário à distância: instrumentos de indexação/recuperação da informação. Rio de Janeiro: SESC, 1998. (digitado) GOMES, Hagar Espanha; MARINHO, Marcílio Teixeira. Introdução ao estudo do cabeçalho de assunto. Disponível em: < http://www.conexaorio.com/biti/cabecalho/cab_ass.htm>. Acesso em: 22 dez. 2004. GUIMARÃES, J.A.C. Recuperação temática da informação. Rev. Bras.Bibliotec. Doc. v.23, n. 1/4, jan./dez.1990. __________. Recuperação em um contexto de novas tecnologias. 2000, 10p. (Texto didático) INEP. Thesaurus brasileiro de educação. Disponível <http://www.inep.gov.br/pesquisa/thesaurus> Acesso em: 15 mar. 2005. em: JESUS, Jerocir Botelho Marques de. Tesauro: um instrumento de representação do conhecimento em sistemas de recuperação da informação. In: XII SEMINÁRIO NACIONAL DE BIBLIOTECAS UNIVERSITÁRIAS, Recife, 2002. KURAMOTO, Hélio. Uma abordagem alternativa para o tratamento e a recuperação de informação textual : os sintagmas nominais. Ciência da informação, Brasília, v. 25, n. 2. 1995. Disponível em: < http://www.ibict.br/cienciadainformacao/include/getdoc.php?id=814 &article=476&mode=pdf>. Acesso em: 20 nov. 2004. LEGEY, Liz-Rejane; ALBAGLI, Sarita. Construindo a sociedade da informação no Brasil: uma nova agenda. Datagramazero –Revista de Ciência da informação, v.1, n.5, out. 2000. Disponível em: < http://www.dgz.org.br/out00/F_I_art.htm >. Acesso em: 18 dez. 2004. LANCASTER, F.W. Indexação e resumos: teoria e prática. Brasília : Briquet de Lemos / Livros, 1993, 347p. _________. Indexação e resumos: teoria e prática. 2 ed. ver. Atual. Brasília: Briquet de Lemos / Livros, 2004, 452p. LANDONI, Mônica et al. Hyper-books and visual-books in na eletronic library. The Eletronic Library, v. 11, n.3, june, 1993. LARA, Marilda Lopez Ginez de. Diferenças conceituais sobre termos e definições e implicações na organização da linguagem documentária. Ciência da informação, Brasília, v.33, n.2, p. 91-96, maio/ago. 2004. Disponível em:<http://www.ibict.br/cienciadainformacao/include/getdoc.php?id=1089&article=304&mo de=pdf >. Acesso em: 15 out. 2004. LEVACOV, Marília. Bibliotecas virtuais: (r) evolução ? Disponível em:< www.ibict.br/cienciadainformacao/include/getdoc.php?id=751&article=428&mode=pdf>. Acesso em: 25 out. 2004. __________. Bibliotecas Virtuais: problemas, paradoxos, controvérsias. Intexto, n.1, 1997. LAVILLE, Christian; DIONNE, Jean. A construção do saber : manual de metodologia da pesquisa em ciências humanas. Porto Alegre: UFMG, 1999. LÉVY, Pierre. As tecnologias da inteligência. Rio de Janeiro: Ed.34, 1993, 208p. (coleção TRANS) LIMA, Maria Esther Russo. Análise e especificação de requisitos ergonômicos para sistema de recuperação da informação (SRI) na web. 2001. 196f. Dissertação (Mestrado em Engenharia de Produção). Universidade Federal de Santa Catarina, Florianópolis. Disponível em:< http://teses.eps.ufsc.br/Resumo.asp?1724>. Acesso em: 15 out. 2004. LIMA, Vânia Mara Alves. Terminologia, comunicação e representação documentária. 1998. 114f. Dissertação (Mestrado em Ciências). Escola de comunicações e artes da Universidade de São Paulo, São Paulo. Disponível em:<http://www.teses.usp.br/teses/disponiveis/ 27/27143/tde-11052004-122839/>. Acesso em: 15 out. 2004. LOPES, Ilza Leite. Estratégia de busca na recuperação da informação: revisão da literatura. Ciência Informação, Brasília, v. 31, n. 2, p. 60-71, maio/ago. 2002 LUCAS, Clarinda Rodrigues. Leitura e interperetação em biblioteconomia. São Paulo: UNICAMP, 2000, 91p. MACEDO, Neusa Dias de; MODESTO, Fernando. Equivalências: do serviço de referência convencional a novos ambientes de redes digitais em bibliotecas. Revista Brasileira de Biblioteconomia e Documentação: Nova Série, São Paulo, v. 1, n. 1, p. 38-54, 1999. MARCHIORI, P. Z. Ciberteca ou biblioteca virtual: uma perspectiva de gerenciamento de recursos de informação. Ciência da Informação, Brasília, v. 26, n. 2, p. 115 - 124, maio/ago. 1997. MARTINS, Robson Dias. Perspectivas para uma biblioteca no futuro: utopia ou realidade ?. Disponível em:< http://biblioteca.estacio.br/artigos/005.htm>. Acesso em: 01 fev. 2005. MOREIRA, Alexandre; ALVARENGA, Lídia; OLIVEIRA, Alcione de Paiva. O nível de conhecimento e os instrumentos de representação: tesauros e ontologias. Datagramazero – Revista de Ciência da informação, v.5, n.6, dez. 2004. Disponível em: <http://www.dgz.org.br/dez04/Art_01.htm>. Acesso em: 23 dez. 2004. ORTEGA, Cristina Dotta. Informática documentária: estado da arte. 2002. 259f. Dissertação (Mestrado em Ciência da Comunicação). Escola de Comunicações e Artes da Universidade de São Paulo, São Paulo. PAIVA, Eliane Bezerra. Entre as normas e os desejos: a indexação de periódicos na Biblioteca Central da Universidade Federal da Paraíba. 2002. 156f. Dissertação (Mestrado em Ciência da Informação). Universidade Federal da Paraíba, Paraíba. PEREIRA, Maria de Nazaré Freitas; PINHEIRO, Lena Vânia Ribeiro. O Sonho de Otlet: aventura em tecnologia da informação e comunicação. Brasília: IBICT/DEP/DDI, 2000, 291p. PEREIRA, Edmeire Cristina; RUTINA, Raquel. O século XXI e o sonho da biblioteca universal: quase seis mil anos de evolução na produção, registro e socialização do conhecimento. Perspectivas Ciência da Informação, Belo Horizonte, v. 4, n. 1, p. 5-19, jan./jun. 1999. RICHARDSON, Roberto Jerry. Pesquisa Social: métodos e técnicas. São Paulo: Atlas: 1999. ROBRETO, Jaime; CUNHA, Murilo B. Cunha. Documentação de hoje e de amanhã: uma abordagem informatizada da biblioteconomia e dos sistemas de informação. São Paulo: Global, 1994. 400p. ROBRETO, Jaime. Da Ciência da Informação revisitada aos sistemas humanos de informação. Brasília: Thesaurus; SSRR Informações, 2003, 262p. ROWLEY, Jennifer. A biblioteca Eletrônica. 2 ed. Brasília: Briquete de Lemos, 2002, 399p. RUBI, Milena Polsinelli. A política de indexação na perspectiva do conhecimento organizacional. 2004. 135f. Dissertação (Mestrado em Ciência da Informação). Universidade Estadual Paulista, Marília, São Paulo. SEABRA, Giovanni de Farias. Pesquisa científica: o método em questão. Brasília: Universitária, 2001. 124p. SILVA, Maria dos Remédios; FUJITA, Mariângila Spotti Lopes. A prática de indexação: análise da evolução de tendências teóricas e metodológicas. Transinformação, Campinas, v.16, n.2, p. 133-161, maio/ago. 2004. SILVEIRA, Maria de Lourdes da. Representação de informação utilizando tesauros: um estudo de caso na área jurídica. Disponível em: <http://www.dcc.ufmg.br/pos/html/spg2002/anais/maria/ maria.html >. Acesso em: 13 dez. 2004. SOUTO, Leonardo Fernandes. Recuperação de informação em base de dados: usos de tesauro. Transinformação, Campinas, v.15, n.1, p. 73-81, jan./abr. 2003. STREHL, Letícia. Avaliação da consistência da indexação realizada em uma biblioteca universitária de artes. Ciência da informação, Brasília, v.27, n.3, set. 1998. Disponível em: < www.ibict.br/cienciadainformacao/include/ getdoc.php?id=668&article=354&mode=pdf >. Acesso em: 05 dez. 2003. TREINAMENTO em indexação. Rio de Janeiro: GB, 1974. 216p. TRISTÃO, Ana Maria Delazari; FACHIN, Gleisy Regina Bóries; ALARCON, Orestes Estevam. Sistemas de classificação facetada e tesauros: instrumentos para organização do conhecimento. Ciência da informação, Brasília, v.33, n.2, p. 161-171, maio/ago. 2004. Disponível em: <http:// www.ibict.br/cienciadainformacao/include/ getdoc.php?id=1097&article=120&mode=pdf >. Acesso em: 15 out. 2004. UNISIST. Study report on the feasibility of a world science information system. Paria: UNESCO, 1978, p.148 __________. Princípios de indexação. Escola de Biblioteconomia, Universidade Federal de Minas Gerais. Belo Horizonte, v.10, n.1, p.83-94,1981. VAN SLYPE, G. Los lenguajes de indización: concepción, construcción y utilización en los sistemas documentales. Madrid: Fundación Germán Sánchez Ruipérez; Pirámide, 1991, 200p. ZANG, Nelson et al. Biblioteca virtual: conceito, metodologia e implantação. Revista de Pesquisa e Pós-Graduação, Erechim, v. 1, n. 1, p. 217-236, 2000. Disponível em: <http://www.uri.br/publicacoes/revistappg/ano1n1/> . Acesso em: 20 jan. 2005. WATERS, Donald J. What Are Digital Libraries? Digital Library Information Resources in Berkeley Digital Library SunSite. CLIR Issues, Number 4, July/August 1998. Disponível em: <http://www.clir.org/pubs/issues/issues04.html>. Acesso em 15 out. 2004.