UFMG ESCOLA DE CIÊNCIA DA INFORMAÇÃO DEPARTAMENTO DE ORGANIZAÇÃO E TRATAMENTO DA INFORMAÇÃO – DOTI LINGUAGEM DE INDEXAÇÃO INDEXAÇÃO E LINGUAGENS DE INDEXAÇÃO Profa. MARIA APARECIDA MOURA E-mail: [email protected] Profa. MARIA APARECIDA MOURA UFMG ESCOLA DE CIÊNCIA DA INFORMAÇÃO DEPARTAMENTO DE ORGANIZAÇÃO E TRATAMENTO DA INFORMAÇÃO – DOTI LINGUAGEM DE INDEXAÇÃO A representação do conhecimento • Sempre preocupou o mundo da representação documental; • Há uma preocupação em criar equivalências na estrutura de registros e arquivos para fins de recuperação futura; • Faz- se uso da estrutura sintática e semântica e das sugestões semióticas da língua natural para fins de representação da informação. Profa. MARIA APARECIDA MOURA E-mail: [email protected] Profa. MARIA APARECIDA MOURA UFMG ESCOLA DE CIÊNCIA DA INFORMAÇÃO DEPARTAMENTO DE ORGANIZAÇÃO E TRATAMENTO DA INFORMAÇÃO – DOTI LINGUAGEM DE INDEXAÇÃO A representação do conhecimento • O que significa representar o conhecimento? • Há a possibilidade de estabelecer a comparação e a comutação entre os diversos discursos ? Profa. MARIA APARECIDA MOURA E-mail: [email protected] Profa. MARIA APARECIDA MOURA UFMG ESCOLA DE CIÊNCIA DA INFORMAÇÃO DEPARTAMENTO DE ORGANIZAÇÃO E TRATAMENTO DA INFORMAÇÃO – DOTI LINGUAGEM DE INDEXAÇÃO SOLUÇÕES NO CAMPO DA CIÊNCIA DA INFORMAÇÃO • Até a década de 30 foi visto como uma questão interdependente (plano das idéias, plano verbal, plano notacional) • Década de 80 - preocupação com aspectos cognitivos presentes nos processos de representação • Acreditou-se que as metalinguagens resolveriam o problema da representação e da dispersão da informação. Anos 2005 em diante – incorporação das questões dos usuários na estruturação das linguagens de indexação Profa. MARIA APARECIDA MOURA E-mail: [email protected] Profa. MARIA APARECIDA MOURA UFMG ESCOLA DE CIÊNCIA DA INFORMAÇÃO DEPARTAMENTO DE ORGANIZAÇÃO E TRATAMENTO DA INFORMAÇÃO – DOTI LINGUAGEM DE INDEXAÇÃO INTERVENÇÃO COMUNICATIVA • Representação da informação – supõe compreensão científica da estrutura do conhecimento, análise de assunto e construção e uso de metalinguagens. • Recuperação da Informação – Envolve esforços com o intuito de permitir aos usuários intervir na linguagem do sistema Profa. MARIA APARECIDA MOURA E-mail: [email protected] Profa. MARIA APARECIDA MOURA UFMG ESCOLA DE CIÊNCIA DA INFORMAÇÃO DEPARTAMENTO DE ORGANIZAÇÃO E TRATAMENTO DA INFORMAÇÃO – DOTI LINGUAGEM DE INDEXAÇÃO Os instrumentos de organização da informação • A intervenção Comunicativa no âmbito da Ciência dada Informação se de duas maneiras distintas: • Do ponto de vista da recuperação da informação – Abordagem cognitiva • Do ponto de vista da representação da informação – Ênfase na organização do conhecimento Profa. MARIA APARECIDA MOURA E-mail: [email protected] Profa. MARIA APARECIDA MOURA UFMG ESCOLA DE CIÊNCIA DA INFORMAÇÃO DEPARTAMENTO DE ORGANIZAÇÃO E TRATAMENTO DA INFORMAÇÃO – DOTI LINGUAGEM DE INDEXAÇÃO Os instrumentos de organização da informação • Indexação: – Substituição de uma entidade lingüística longa e complexa por uma abreviada (porém não menos importante que o documento integral) – Análise de assunto do documento com extração de termos, – Atribuição de conceitos ao documento analisado – Tradução para os termos de uma linguagem de indexação adotada no sistema. Profa. MARIA APARECIDA MOURA E-mail: [email protected] Profa. MARIA APARECIDA MOURA UFMG ESCOLA DE CIÊNCIA DA INFORMAÇÃO DEPARTAMENTO DE ORGANIZAÇÃO E TRATAMENTO DA INFORMAÇÃO – DOTI LINGUAGEM DE INDEXAÇÃO • A indexação consiste na indicação do conteúdo informativo de um documento através da determinação de um ou mais termos que representarão esse conteúdo. Profa. MARIA APARECIDA MOURA E-mail: [email protected] UFMG ESCOLA DE CIÊNCIA DA INFORMAÇÃO DEPARTAMENTO DE ORGANIZAÇÃO E TRATAMENTO DA INFORMAÇÃO – DOTI LINGUAGEM DE INDEXAÇÃO • Representação fornece a representação do conteúdo de um documento • Categorização - a indexação indica o pertencimento de documento a um (ou mais)conjuntos de documentos considerados agregáveis. • Constitui um discurso documentário (estratégia para exploração informacionais disponíveis no sistema) • As condições para a sua utilização ( estratégia de exposição dos documentos Profa. MARIA APARECIDA MOURA E-mail: [email protected] Profa. MARIA APARECIDA MOURA UFMG ESCOLA DE CIÊNCIA DA INFORMAÇÃO DEPARTAMENTO DE ORGANIZAÇÃO E TRATAMENTO DA INFORMAÇÃO – DOTI LINGUAGEM DE INDEXAÇÃO Principais críticas ao vocabulário livre Multiplicidade de termos para representar um mesmo conceito, • Descontextualização dos termos em relação ao assunto total do documento, • Profa. MARIA APARECIDA MOURA E-mail: [email protected] Profa. MARIA APARECIDA MOURA UFMG ESCOLA DE CIÊNCIA DA INFORMAÇÃO DEPARTAMENTO DE ORGANIZAÇÃO E TRATAMENTO DA INFORMAÇÃO – DOTI LINGUAGEM DE INDEXAÇÃO Principais críticas ao vocabulário livre • Multiplicidade de termos para representar um mesmo conceito, • Descontextualização dos termos em relação ao assunto total do documento, Profa. MARIA APARECIDA MOURA E-mail: [email protected] Profa. MARIA APARECIDA MOURA UFMG ESCOLA DE CIÊNCIA DA INFORMAÇÃO DEPARTAMENTO DE ORGANIZAÇÃO E TRATAMENTO DA INFORMAÇÃO – DOTI LINGUAGEM DE INDEXAÇÃO FUNÇÕES DA LINGUAGEM DE INDEXAÇÃO • Normalizar a representação informação para uma pesquisa bem sucedida; • Permitir ao usuário de navegar entre assuntos próximos; • Em alguns casos, apresentar ao usuário o conteúdo de objetos selecionados de modo a facilitar sua escolha definitiva. Profa. MARIA APARECIDA MOURA E-mail: [email protected] UFMG ESCOLA DE CIÊNCIA DA INFORMAÇÃO DEPARTAMENTO DE ORGANIZAÇÃO E TRATAMENTO DA INFORMAÇÃO – DOTI LINGUAGEM DE INDEXAÇÃO Principais críticas ao vocabulário livre • Multiplicidade de termos para representar um mesmo conceito, • Descontextualização dos termos em relação ao assunto total do documento, Profa. MARIA APARECIDA MOURA E-mail: [email protected] Profa. MARIA APARECIDA MOURA UFMG ESCOLA DE CIÊNCIA DA INFORMAÇÃO DEPARTAMENTO DE ORGANIZAÇÃO E TRATAMENTO DA INFORMAÇÃO – DOTI LINGUAGEM DE INDEXAÇÃO • Dificuldades específicas da noção assunto – O assunto como unidade de pensamento complexa - o assunto como unidade de conhecimento complexa (por vezes os indivíduos se interessam por aspectos diferentes em um determinado assunto); – Heterogeneidade das expressões da curiosidade/interesse humano ( o assunto é um construto social, é um produto de um ato de linguagem que é enunciado por um indivíduo acerca de um objeto de conhecimento que lhe provoca interesse) Profa. MARIA APARECIDA MOURA E-mail: [email protected] UFMG ESCOLA DE CIÊNCIA DA INFORMAÇÃO DEPARTAMENTO DE ORGANIZAÇÃO E TRATAMENTO DA INFORMAÇÃO – DOTI LINGUAGEM DE INDEXAÇÃO Linguagens de indexação • A linguagem de indexação é qualquer conjunto de termos e/ou símbolos usados para denominar classes de assuntos em sistemas de recuperação da informação. • Elas foram criadas para simplificar, guiar e normalizar a atividade da indexação. Profa. MARIA APARECIDA MOURA UFMG ESCOLA DE CIÊNCIA DA INFORMAÇÃO DEPARTAMENTO DE ORGANIZAÇÃO E TRATAMENTO DA INFORMAÇÃO – DOTI LINGUAGEM DE INDEXAÇÃO LINGUAGENS DE INDEXAÇÃO • As linguagens de indexação são instrumentos auxiliares no processo de organização e recuperação que visam equivaler o vocabulário do proponente do item informacional, a linguagem do sistema de informação e o vocabulário de abordagem apresentado pelo usuário. Profa. MARIA APARECIDA MOURA E-mail: [email protected] Profa. MARIA APARECIDA MOURA UFMG ESCOLA DE CIÊNCIA DA INFORMAÇÃO DEPARTAMENTO DE DE ORGANIZAÇÃO ORGANIZAÇÃO E E TRATAMENTO TRATAMENTODA DEPARTAMENTO DAINFORMAÇÃO INFORMAÇÃO––DOTI DOTI TRATAMENTO LINGUAGEMDA DEINFORMAÇÃO INDEXAÇÃO III LINGUAGEM DE INDEXAÇÃO • São linguagens artificiais elaboradas para propósitos especiais de recuperação recuperação da informação. • “são destinadas a operações precisas, em condições precisas, para responder a necessidades precisas; estas limitações funcionais são essenciais e tão ou mais importantes que as considerações linguísticas”.(GUINCHAT E MENOUT,1994: p. 134) • Visam preservar a riqueza da informação original e suas possibilidades de associação Profa. MARIA APARECIDA MOURA UFMG ESCOLA DE CIÊNCIA DA INFORMAÇÃO DEPARTAMENTO DE ORGANIZAÇÃO E TRATAMENTO DA INFORMAÇÃO – DOTI LINGUAGEM DE INDEXAÇÃO Linguagens de indexação: composição • Toda linguagem de indexação pressupõe o vocabulário e a sintaxe. Profa. MARIA APARECIDA MOURA E-mail: [email protected] Profa. MARIA APARECIDA MOURA UFMG ESCOLA DE CIÊNCIA DA INFORMAÇÃO DEPARTAMENTO DE ORGANIZAÇÃO E TRATAMENTO DA INFORMAÇÃO – DOTI LINGUAGEM DE INDEXAÇÃO Linguagens de indexação: Vocabulário • O vocabulário refere-se a um conjunto específico de descritores organizados com o propósito de representar sinteticamente a informação contida em um documento. • O vocabulário é composto de descritores e não descritores e tem origem na organização sistemática dos termos compilados nas áreas de especialidade. Essa compilação obedece as determinações da garantia literária e a validação dos usuários. Profa. MARIA APARECIDA MOURA E-mail: [email protected] Profa. MARIA APARECIDA MOURA UFMG ESCOLA DE CIÊNCIA DA INFORMAÇÃO DEPARTAMENTO DE ORGANIZAÇÃO E TRATAMENTO DA INFORMAÇÃO – DOTI LINGUAGEM DE INDEXAÇÃO • Linguagens de indexação: Sintaxe A sintaxe visa orientar os usuários na correta adoção do vocabulário. Sobretudo, porque a estrutura da linguagem nem sempre se refere a fiel organização do conhecimento no campo em que é proposta. Trata-se de um procedimento artificial que visa estabilizar o sentido permitindo, assim uma equivalência terminológica mais efetiva. A Sintaxe é de suma importância pois ela definirá a aplicação do descritor e as possibilidades de coordenação dos termos indexadores para representação de assuntos compostos neste tipo de linguagem. Profa. MARIA APARECIDA MOURA E-mail: [email protected] Profa. MARIA APARECIDA MOURA UFMG ESCOLA DE CIÊNCIA DA INFORMAÇÃO DEPARTAMENTO DE ORGANIZAÇÃO E TRATAMENTO DA INFORMAÇÃO – DOTI LINGUAGEM DE INDEXAÇÃO LINGUAGEM DE INDEXAÇÃO ATUAM NOS SISTEMAS DE INFORMAÇÃO EM DOIS NÍVEIS • Orientando o indexador sobre quais os melhores termos para representação do assunto de um documento; • Orientando o pesquisador sobre a escolha dos termos indexadores que corresponderiam à representação de assunto por ele procurado (orienta portanto a elaboração de uma estratégia de busca que o leve com menor esforço e maior eficiência aos documentos procurados) Profa. MARIA APARECIDA MOURA E-mail: [email protected] Profa. MARIA APARECIDA MOURA UFMG ESCOLA DE CIÊNCIA DA INFORMAÇÃO DEPARTAMENTO DE ORGANIZAÇÃO E TRATAMENTO DA INFORMAÇÃO – DOTI LINGUAGEM DE INDEXAÇÃO A escolha da linguagem de indexação • A escolha da linguagem deve ser feita com muito cuidado e critérios pois ela é considerada o cerne do sistema de informação. • Na escolha deve-se considerar: • Usuários (Quem são? Quantos? Quais são suas necessidades de informação? Interagem com o sistema)? • Produtos e serviços; • Missão institucional; • Volume de informações a serem disponibilizadas; • Tema coberto; • Equipamento disponível para armazenamento e recuperação da informação. Profa. MARIA APARECIDA MOURA UFMG ESCOLA DE CIÊNCIA DA INFORMAÇÃO DEPARTAMENTO DE ORGANIZAÇÃO E TRATAMENTO DA INFORMAÇÃO – DOTI LINGUAGEM DE INDEXAÇÃO Linguagens podem ser Pré-coordenadas- A coordenação entre os termos acontece no momento da indexação Ex:Listas de cabeçalho de assunto Pós-coordenadas – A coordenação entre os termos ocorre no momento da recuperação da informação Ex: Tesauros Profa. MARIA APARECIDA MOURA E-mail: [email protected] Profa. MARIA APARECIDA MOURA UFMG ESCOLA DE CIÊNCIA DA INFORMAÇÃO DEPARTAMENTO DE ORGANIZAÇÃO E TRATAMENTO DA INFORMAÇÃO – DOTI LINGUAGEM DE INDEXAÇÃO Linguagens completamente hieraquizadas ou pré-coordenadas • As combinações das noções são estabelecidas previamente e em princípio pode traduzir apenas um aspecto da informação. • Refletem o estágio do conhecimento em um momento preciso, • Limitam a recuperação da informação; • Em contextos eletrônicos os limites são atenuados; Profa. MARIA APARECIDA MOURA UFMG ESCOLA DE CIÊNCIA DA INFORMAÇÃO DEPARTAMENTO DE ORGANIZAÇÃO E TRATAMENTO DA INFORMAÇÃO – DOTI LINGUAGEM DE INDEXAÇÃO PRÉ-COORDENAÇÃO • A pré coordenação privilegia um direcionamento na entrada dos itens informacionais (escolha dos cabeçalhos e sub cabeçalhos) que deverá ser seguido na saída (recuperação) para que ocorra coincidência na organização e na elaboração da estratégia de busca. • Através de um enunciado, muitas vezes único, os vários tópicos relativos ao conteúdo conceitual do documento são reunidos numa entrada que resume todos os aspectos que compõem o assunto. • Esses sistemas chamados de pré-coordenados, estabelecem a coordenação dos vários tópicos referentes a um assunto composto no momento de indexação, e com grande subjetividade determinam uma prioridade na citação desses elementos. Profa. MARIA APARECIDA MOURA UFMG ESCOLA DE CIÊNCIA DA INFORMAÇÃO DEPARTAMENTO DE ORGANIZAÇÃO E TRATAMENTO DA INFORMAÇÃO – DOTI LINGUAGEM DE INDEXAÇÃO ORDEM DE CITAÇÃO • A ordem de citação ou ordem horizontal - diz respeito à ordem das partes constituintes dentro do assunto dos documentos individuais. • A ordem de citação teve por objetivo ordenar os assuntos por ordem de importância. Nesse caso, as características que não são citadas em primeiro lugar ficam dispersas no acervo classificado. • Este tipo de sistema demandava uma entrada múltipla ou uma rede de referências ou remissa bem elaborada. Pode se usar a rotação dos termos de modo que cada um passe a ser ponto de acesso. Profa. MARIA APARECIDA MOURA UFMG ESCOLA DE CIÊNCIA DA INFORMAÇÃO DEPARTAMENTO DE ORGANIZAÇÃO E TRATAMENTO DA INFORMAÇÃO – DOTI LINGUAGEM DE INDEXAÇÃO SOLUÇÕES PARA A ORDEM DE CITAÇÃO • RANGANATHAN (1924) adotou uma fórmula a qual chamou de PMEST, ou seja: • P- personalidade, M- matéria,E- energia, S- espaço,T- tempo. O modo mais fácil de descrever a personalidade é como coisa em si, matéria é o material de que a coisa é composta. Energia é a ação realizada na ou pela coisa, Espaço é onde a ação se verifica, Tempo é quando ela ocorre. Profa. MARIA APARECIDA MOURA UFMG UFMG ESCOLA DE CIÊNCIA DA INFORMAÇÃO ESCOLA DE CIÊNCIA DA INFORMAÇÃO DEPARTAMENTO DE ORGANIZAÇÃO E TRATAMENTO DA INFORMAÇÃO – DOTI DEPARTAMENTO DE ORGANIZAÇÃO E TRATAMENTO DA INFORMAÇÃO – DOTI LINGUAGEM DE INDEXAÇÃO Exemplo: Administração da coleção de manuscritos nas bibliotecas universitárias britânicas, na década de 1970. Administração-energia, manuscritos-matéria, Bibliotecas universitárias- personalidade, Britânicas (Inglaterra) espaço, 1970 - (década) tempo Bibliotecas Universitárias/manuscritos/administração/Inglaterra/1970. Profa. MARIA APARECIDA MOURA UFMG ESCOLA DE CIÊNCIA DA INFORMAÇÃO DEPARTAMENTO DE ORGANIZAÇÃO E TRATAMENTO DA INFORMAÇÃO – DOTI LINGUAGEM DE INDEXAÇÃO Linguagens pós-coordenadas • São aquelas cuja a coordenação entre os termos é efetuada no momento da recuperação da informação. • Nesse caso elegem -se os termos representativos do documento, efetua-se a tradução para uma linguagem de indexação adotada no sistema e efetiva-se a entrada do documento no sistema de informação. Profa. MARIA APARECIDA MOURA UFMG ESCOLA DE CIÊNCIA DA INFORMAÇÃO DEPARTAMENTO DE ORGANIZAÇÃO E TRATAMENTO DA INFORMAÇÃO – DOTI LINGUAGEM DE INDEXAÇÃO Linguagens pós-coordenadas • As noções são reduzidas aos seus constituintes mais simples; • Permite privilegiar pontos de vistas distintos em relação ao conteúdo dos documentos; O termo adultério, por exemplo, pode ser visto, de acordo com a época e o lugar, como um crime, um vício ou um comportamento social. • A coordenação entre os termos é feita no momento de recuperação da informação; Profa. MARIA APARECIDA MOURA UFMG ESCOLA DE CIÊNCIA DA INFORMAÇÃO DEPARTAMENTO DE ORGANIZAÇÃO E TRATAMENTO DA INFORMAÇÃO – DOTI LINGUAGEM DE INDEXAÇÃO Objetivos dos tesauros • Instrumento facilitador da comunicação dentro do sistema, • Padronização da linguagem de indexação e de recuperação, • Sistema classificatório embutido, • Possibilidade de expressar o conjunto completo de relações associativas entre conceitos Profa. MARIA APARECIDA MOURA E-mail: [email protected] Profa. MARIA APARECIDA MOURA UFMG ESCOLA DE CIÊNCIA DA INFORMAÇÃO DEPARTAMENTO DE ORGANIZAÇÃO E TRATAMENTO DA INFORMAÇÃO – DOTI LINGUAGEM DE INDEXAÇÃO Tesauros • Os TESAUROS exercem um controle menos rígido, mais sugestivo e flexível. Utilizam um grau de coordenação mínimo, somente aquele necessário ao não comprometimento da significação dos descritores. • Dá-se entrada por todos os TERMOS RELEVANTES, sem necessidade de análise da ordem de importância dos termos. Profa. MARIA APARECIDA MOURA E-mail: [email protected] UFMG ESCOLA DE CIÊNCIA DA INFORMAÇÃO DEPARTAMENTO DE ORGANIZAÇÃO E TRATAMENTO DA INFORMAÇÃO – DOTI LINGUAGEM DE INDEXAÇÃO Referências • AMAR, Muriel. Les fondements théoriques de l’ indexation: un approche linguistique. Paris: ADBS, 2000. • GUINCHAT, C. MENOU, M. Introdução às ciências e técnicas da informação e documentação. Trad. Miriam Vieira da Cunha. Brasília: IBICT. 540 p. • MANIEZ, Jacques. Actualité des langages documentaire: fondements théoriques de la recherche d’ information. Paris: ADBS, 2002. • SVENONIUS, Elaine. The intellectual foundation of information organization. Massachusetts: MIT Press, 2000. cap. 8 e 9. Profa. MARIA APARECIDA MOURA E-mail: [email protected]