UFMG
ESCOLA DE CIÊNCIA DA INFORMAÇÃO
DEPARTAMENTO DE ORGANIZAÇÃO E TRATAMENTO DA INFORMAÇÃO – DOTI
LINGUAGEM DE INDEXAÇÃO
INDEXAÇÃO E
LINGUAGENS DE INDEXAÇÃO
Profa. MARIA APARECIDA MOURA
E-mail: [email protected]
Profa. MARIA APARECIDA MOURA
UFMG
ESCOLA DE CIÊNCIA DA INFORMAÇÃO
DEPARTAMENTO DE ORGANIZAÇÃO E TRATAMENTO DA INFORMAÇÃO – DOTI
LINGUAGEM DE INDEXAÇÃO
A representação do
conhecimento
• Sempre preocupou o mundo da representação
documental;
• Há uma preocupação em criar equivalências na
estrutura de registros e arquivos para fins de
recuperação futura;
• Faz- se uso da estrutura sintática e semântica
e das sugestões semióticas da língua natural
para fins de representação da informação.
Profa. MARIA APARECIDA MOURA
E-mail: [email protected]
Profa. MARIA APARECIDA MOURA
UFMG
ESCOLA DE CIÊNCIA DA INFORMAÇÃO
DEPARTAMENTO DE ORGANIZAÇÃO E TRATAMENTO DA INFORMAÇÃO – DOTI
LINGUAGEM DE INDEXAÇÃO
A representação do
conhecimento
• O que significa representar o conhecimento?
• Há a possibilidade de estabelecer a comparação e a
comutação entre os diversos discursos ?
Profa. MARIA APARECIDA MOURA
E-mail: [email protected]
Profa. MARIA APARECIDA MOURA
UFMG
ESCOLA DE CIÊNCIA DA INFORMAÇÃO
DEPARTAMENTO DE ORGANIZAÇÃO E TRATAMENTO DA INFORMAÇÃO – DOTI
LINGUAGEM DE INDEXAÇÃO
SOLUÇÕES NO CAMPO DA CIÊNCIA DA
INFORMAÇÃO
• Até a década de 30 foi visto como uma questão
interdependente (plano das idéias, plano verbal, plano
notacional)
• Década de 80 - preocupação com aspectos cognitivos
presentes nos processos de representação
• Acreditou-se que as metalinguagens resolveriam o
problema da representação e da dispersão
da
informação. Anos 2005 em diante – incorporação das
questões dos usuários na estruturação das linguagens
de indexação
Profa. MARIA APARECIDA MOURA
E-mail: [email protected]
Profa. MARIA APARECIDA MOURA
UFMG
ESCOLA DE CIÊNCIA DA INFORMAÇÃO
DEPARTAMENTO DE ORGANIZAÇÃO E TRATAMENTO DA INFORMAÇÃO – DOTI
LINGUAGEM DE INDEXAÇÃO
INTERVENÇÃO COMUNICATIVA
• Representação da informação – supõe
compreensão científica da estrutura do
conhecimento, análise de assunto e
construção e uso de metalinguagens.
• Recuperação da Informação – Envolve
esforços com o intuito de permitir aos
usuários intervir na linguagem do sistema
Profa. MARIA APARECIDA MOURA
E-mail: [email protected]
Profa. MARIA APARECIDA MOURA
UFMG
ESCOLA DE CIÊNCIA DA INFORMAÇÃO
DEPARTAMENTO DE ORGANIZAÇÃO E TRATAMENTO DA INFORMAÇÃO – DOTI
LINGUAGEM DE INDEXAÇÃO
Os instrumentos de
organização da informação
• A intervenção Comunicativa no âmbito da
Ciência dada Informação se de duas
maneiras distintas:
• Do ponto de vista da recuperação da
informação – Abordagem cognitiva
• Do ponto de vista da representação
da informação – Ênfase na organização
do conhecimento
Profa. MARIA APARECIDA MOURA
E-mail: [email protected]
Profa. MARIA APARECIDA MOURA
UFMG
ESCOLA DE CIÊNCIA DA INFORMAÇÃO
DEPARTAMENTO DE ORGANIZAÇÃO E TRATAMENTO DA INFORMAÇÃO – DOTI
LINGUAGEM DE INDEXAÇÃO
Os instrumentos de
organização da informação
• Indexação:
– Substituição de uma entidade lingüística longa
e complexa por uma abreviada (porém não
menos importante que o documento integral)
– Análise de assunto do documento com
extração de termos,
– Atribuição
de
conceitos
ao
documento
analisado
– Tradução para os termos de uma linguagem de
indexação adotada no sistema.
Profa. MARIA APARECIDA MOURA
E-mail: [email protected]
Profa. MARIA APARECIDA MOURA
UFMG
ESCOLA DE CIÊNCIA DA INFORMAÇÃO
DEPARTAMENTO DE ORGANIZAÇÃO E TRATAMENTO DA INFORMAÇÃO – DOTI
LINGUAGEM DE INDEXAÇÃO
• A indexação consiste na indicação do
conteúdo informativo de um documento
através da determinação de um ou mais
termos que representarão esse conteúdo.
Profa. MARIA APARECIDA MOURA
E-mail: [email protected]
UFMG
ESCOLA DE CIÊNCIA DA INFORMAÇÃO
DEPARTAMENTO DE ORGANIZAÇÃO E TRATAMENTO DA INFORMAÇÃO – DOTI
LINGUAGEM DE INDEXAÇÃO
• Representação fornece a representação
do conteúdo de um
documento
• Categorização - a
indexação indica o
pertencimento de
documento a um (ou
mais)conjuntos de
documentos
considerados agregáveis.
• Constitui um discurso
documentário
(estratégia para
exploração
informacionais
disponíveis no sistema)
• As condições para a
sua utilização (
estratégia de exposição
dos documentos
Profa. MARIA APARECIDA MOURA
E-mail: [email protected]
Profa. MARIA APARECIDA MOURA
UFMG
ESCOLA DE CIÊNCIA DA INFORMAÇÃO
DEPARTAMENTO DE ORGANIZAÇÃO E TRATAMENTO DA INFORMAÇÃO – DOTI
LINGUAGEM DE INDEXAÇÃO
Principais críticas ao
vocabulário livre
Multiplicidade de termos para
representar um mesmo conceito,
• Descontextualização dos termos em
relação
ao
assunto
total
do
documento,
•
Profa. MARIA APARECIDA MOURA
E-mail: [email protected]
Profa. MARIA APARECIDA MOURA
UFMG
ESCOLA DE CIÊNCIA DA INFORMAÇÃO
DEPARTAMENTO DE ORGANIZAÇÃO E TRATAMENTO DA INFORMAÇÃO – DOTI
LINGUAGEM DE INDEXAÇÃO
Principais críticas ao
vocabulário livre
• Multiplicidade
de
termos
para
representar um mesmo conceito,
• Descontextualização dos termos em
relação
ao
assunto
total
do
documento,
Profa. MARIA APARECIDA MOURA
E-mail: [email protected]
Profa. MARIA APARECIDA MOURA
UFMG
ESCOLA DE CIÊNCIA DA INFORMAÇÃO
DEPARTAMENTO DE ORGANIZAÇÃO E TRATAMENTO DA INFORMAÇÃO – DOTI
LINGUAGEM DE INDEXAÇÃO
FUNÇÕES DA LINGUAGEM DE INDEXAÇÃO
• Normalizar a representação informação para
uma pesquisa bem sucedida;
• Permitir ao usuário de navegar entre assuntos
próximos;
• Em alguns casos, apresentar ao usuário o
conteúdo de objetos selecionados de modo a
facilitar sua escolha definitiva.
Profa. MARIA APARECIDA MOURA
E-mail: [email protected]
UFMG
ESCOLA DE CIÊNCIA DA INFORMAÇÃO
DEPARTAMENTO DE ORGANIZAÇÃO E TRATAMENTO DA INFORMAÇÃO – DOTI
LINGUAGEM DE INDEXAÇÃO
Principais críticas ao
vocabulário livre
• Multiplicidade de termos para representar
um mesmo conceito,
• Descontextualização dos termos em
relação ao assunto total do documento,
Profa. MARIA APARECIDA MOURA
E-mail: [email protected]
Profa. MARIA APARECIDA MOURA
UFMG
ESCOLA DE CIÊNCIA DA INFORMAÇÃO
DEPARTAMENTO DE ORGANIZAÇÃO E TRATAMENTO DA INFORMAÇÃO – DOTI
LINGUAGEM DE INDEXAÇÃO
• Dificuldades específicas da noção assunto
– O assunto como unidade de pensamento
complexa - o assunto como unidade de
conhecimento complexa (por vezes os indivíduos se
interessam por aspectos diferentes em um
determinado assunto);
– Heterogeneidade das expressões da
curiosidade/interesse humano ( o assunto é um
construto social, é um produto de um ato de
linguagem que é enunciado por um indivíduo acerca
de um objeto de conhecimento que lhe provoca
interesse)
Profa. MARIA APARECIDA MOURA
E-mail: [email protected]
UFMG
ESCOLA DE CIÊNCIA DA INFORMAÇÃO
DEPARTAMENTO DE ORGANIZAÇÃO E TRATAMENTO DA INFORMAÇÃO – DOTI
LINGUAGEM DE INDEXAÇÃO
Linguagens de indexação
• A linguagem de indexação é qualquer
conjunto de termos e/ou símbolos usados
para denominar classes de assuntos em
sistemas de recuperação da informação.
• Elas foram criadas para simplificar, guiar
e normalizar a atividade da indexação.
Profa. MARIA APARECIDA MOURA
UFMG
ESCOLA DE CIÊNCIA DA INFORMAÇÃO
DEPARTAMENTO DE ORGANIZAÇÃO E TRATAMENTO DA INFORMAÇÃO – DOTI
LINGUAGEM DE INDEXAÇÃO
LINGUAGENS DE INDEXAÇÃO
• As linguagens de indexação são
instrumentos auxiliares no processo de
organização e recuperação que visam
equivaler o vocabulário do proponente do
item informacional, a linguagem do
sistema de informação e o vocabulário de
abordagem apresentado pelo usuário.
Profa. MARIA APARECIDA MOURA
E-mail: [email protected]
Profa. MARIA APARECIDA MOURA
UFMG
ESCOLA DE CIÊNCIA DA INFORMAÇÃO
DEPARTAMENTO DE
DE ORGANIZAÇÃO
ORGANIZAÇÃO E
E TRATAMENTO
TRATAMENTODA
DEPARTAMENTO
DAINFORMAÇÃO
INFORMAÇÃO––DOTI
DOTI
TRATAMENTO
LINGUAGEMDA
DEINFORMAÇÃO
INDEXAÇÃO III
LINGUAGEM DE INDEXAÇÃO
• São linguagens artificiais elaboradas para propósitos
especiais de recuperação recuperação da informação.
• “são destinadas a operações precisas, em condições
precisas, para responder a necessidades precisas; estas
limitações funcionais são essenciais e tão ou mais
importantes
que
as
considerações
linguísticas”.(GUINCHAT E MENOUT,1994: p. 134)
• Visam preservar a riqueza da informação original e suas
possibilidades de associação
Profa. MARIA APARECIDA MOURA
UFMG
ESCOLA DE CIÊNCIA DA INFORMAÇÃO
DEPARTAMENTO DE ORGANIZAÇÃO E TRATAMENTO DA INFORMAÇÃO – DOTI
LINGUAGEM DE INDEXAÇÃO
Linguagens de indexação:
composição
• Toda linguagem de indexação pressupõe
o vocabulário e a sintaxe.
Profa. MARIA APARECIDA MOURA
E-mail: [email protected]
Profa. MARIA APARECIDA MOURA
UFMG
ESCOLA DE CIÊNCIA DA INFORMAÇÃO
DEPARTAMENTO DE ORGANIZAÇÃO E TRATAMENTO DA INFORMAÇÃO – DOTI
LINGUAGEM DE INDEXAÇÃO
Linguagens de indexação:
Vocabulário
• O vocabulário refere-se a um conjunto específico de
descritores organizados com o propósito de representar
sinteticamente a informação contida em um documento.
• O vocabulário é composto de descritores e não
descritores e tem origem na organização sistemática
dos termos compilados nas áreas de especialidade.
Essa compilação obedece
as determinações da
garantia literária e a validação dos usuários.
Profa. MARIA APARECIDA MOURA
E-mail: [email protected]
Profa. MARIA APARECIDA MOURA
UFMG
ESCOLA DE CIÊNCIA DA INFORMAÇÃO
DEPARTAMENTO DE ORGANIZAÇÃO E TRATAMENTO DA INFORMAÇÃO – DOTI
LINGUAGEM DE INDEXAÇÃO
•
Linguagens de indexação:
Sintaxe
A sintaxe visa orientar os usuários na correta adoção do
vocabulário. Sobretudo, porque a estrutura da
linguagem nem sempre se refere a fiel organização do
conhecimento no campo em que é proposta. Trata-se de
um procedimento artificial que visa estabilizar o sentido
permitindo, assim uma equivalência terminológica mais
efetiva.
A Sintaxe é de suma importância pois ela definirá a
aplicação do descritor e as possibilidades de
coordenação
dos
termos
indexadores
para
representação de assuntos compostos neste tipo de
linguagem.
Profa. MARIA APARECIDA MOURA
E-mail: [email protected]
Profa. MARIA APARECIDA MOURA
UFMG
ESCOLA DE CIÊNCIA DA INFORMAÇÃO
DEPARTAMENTO DE ORGANIZAÇÃO E TRATAMENTO DA INFORMAÇÃO – DOTI
LINGUAGEM DE INDEXAÇÃO
LINGUAGEM DE INDEXAÇÃO ATUAM
NOS SISTEMAS DE INFORMAÇÃO EM
DOIS NÍVEIS
• Orientando o indexador sobre quais os melhores termos
para representação do assunto de um documento;
• Orientando o pesquisador sobre a escolha dos termos
indexadores que corresponderiam à representação de
assunto por ele procurado (orienta portanto a
elaboração de uma estratégia de busca que o leve com
menor esforço e maior eficiência aos documentos
procurados)
Profa. MARIA APARECIDA MOURA
E-mail: [email protected]
Profa. MARIA APARECIDA MOURA
UFMG
ESCOLA DE CIÊNCIA DA INFORMAÇÃO
DEPARTAMENTO DE ORGANIZAÇÃO E TRATAMENTO DA INFORMAÇÃO – DOTI
LINGUAGEM DE INDEXAÇÃO
A escolha da linguagem de indexação
• A escolha da linguagem deve ser feita com muito
cuidado e critérios pois ela é considerada o cerne do
sistema de informação.
• Na escolha deve-se considerar:
• Usuários (Quem são? Quantos? Quais são suas
necessidades de informação? Interagem com o
sistema)?
• Produtos e serviços;
• Missão institucional;
• Volume de informações a serem disponibilizadas;
• Tema coberto;
• Equipamento disponível para armazenamento e
recuperação da informação.
Profa. MARIA APARECIDA MOURA
UFMG
ESCOLA DE CIÊNCIA DA INFORMAÇÃO
DEPARTAMENTO DE ORGANIZAÇÃO E TRATAMENTO DA INFORMAÇÃO – DOTI
LINGUAGEM DE INDEXAÇÃO
Linguagens podem ser
Pré-coordenadas- A coordenação entre os
termos acontece no momento da
indexação Ex:Listas de cabeçalho de
assunto
Pós-coordenadas – A coordenação entre
os termos ocorre no momento da
recuperação da informação Ex: Tesauros
Profa. MARIA APARECIDA MOURA
E-mail: [email protected]
Profa. MARIA APARECIDA MOURA
UFMG
ESCOLA DE CIÊNCIA DA INFORMAÇÃO
DEPARTAMENTO DE ORGANIZAÇÃO E TRATAMENTO DA INFORMAÇÃO – DOTI
LINGUAGEM DE INDEXAÇÃO
Linguagens completamente hieraquizadas
ou pré-coordenadas
• As combinações das noções são estabelecidas
previamente e em princípio pode traduzir
apenas um aspecto da informação.
• Refletem o estágio do conhecimento em um
momento preciso,
• Limitam a recuperação da informação;
• Em contextos eletrônicos os limites são
atenuados;
Profa. MARIA APARECIDA MOURA
UFMG
ESCOLA DE CIÊNCIA DA INFORMAÇÃO
DEPARTAMENTO DE ORGANIZAÇÃO E TRATAMENTO DA INFORMAÇÃO – DOTI
LINGUAGEM DE INDEXAÇÃO
PRÉ-COORDENAÇÃO
• A pré coordenação privilegia um direcionamento na
entrada dos itens informacionais (escolha dos cabeçalhos
e sub cabeçalhos) que deverá ser seguido na saída
(recuperação) para que
ocorra coincidência na
organização e na elaboração da estratégia de busca.
• Através de um enunciado, muitas vezes único, os vários
tópicos relativos ao conteúdo conceitual do documento são
reunidos numa entrada que resume todos os aspectos que
compõem o assunto.
• Esses
sistemas
chamados
de
pré-coordenados,
estabelecem a coordenação dos vários tópicos referentes
a um assunto composto no momento de indexação, e com
grande subjetividade determinam uma prioridade na
citação desses elementos.
Profa. MARIA APARECIDA MOURA
UFMG
ESCOLA DE CIÊNCIA DA INFORMAÇÃO
DEPARTAMENTO DE ORGANIZAÇÃO E TRATAMENTO DA INFORMAÇÃO – DOTI
LINGUAGEM DE INDEXAÇÃO
ORDEM DE CITAÇÃO
• A ordem de citação ou ordem horizontal - diz respeito à
ordem das partes constituintes dentro do assunto dos
documentos individuais.
• A ordem de citação teve por objetivo ordenar os
assuntos por ordem de importância. Nesse caso, as
características que não são citadas em primeiro lugar
ficam dispersas no acervo classificado.
• Este tipo de sistema demandava uma entrada múltipla
ou uma rede de referências ou remissa bem elaborada.
Pode se usar a rotação dos termos de modo que cada
um passe a ser ponto de acesso.
Profa. MARIA APARECIDA MOURA
UFMG
ESCOLA DE CIÊNCIA DA INFORMAÇÃO
DEPARTAMENTO DE ORGANIZAÇÃO E TRATAMENTO DA INFORMAÇÃO – DOTI
LINGUAGEM DE INDEXAÇÃO
SOLUÇÕES PARA A ORDEM DE
CITAÇÃO
• RANGANATHAN (1924) adotou uma fórmula a
qual chamou de PMEST, ou seja:
• P- personalidade, M- matéria,E- energia,
S- espaço,T- tempo.
O modo mais fácil de descrever a personalidade
é como coisa em si, matéria é o material de que
a coisa é composta. Energia é a ação realizada
na ou pela coisa, Espaço é onde a ação se
verifica, Tempo é quando ela ocorre.
Profa. MARIA APARECIDA MOURA
UFMG
UFMG
ESCOLA DE CIÊNCIA DA INFORMAÇÃO
ESCOLA DE CIÊNCIA DA INFORMAÇÃO
DEPARTAMENTO DE ORGANIZAÇÃO E TRATAMENTO DA INFORMAÇÃO – DOTI
DEPARTAMENTO DE ORGANIZAÇÃO E TRATAMENTO DA INFORMAÇÃO – DOTI
LINGUAGEM DE INDEXAÇÃO
Exemplo:
Administração da coleção de manuscritos nas
bibliotecas universitárias britânicas, na década
de 1970.
Administração-energia,
manuscritos-matéria,
Bibliotecas universitárias- personalidade,
Britânicas (Inglaterra) espaço,
1970 - (década) tempo
Bibliotecas Universitárias/manuscritos/administração/Inglaterra/1970.
Profa. MARIA APARECIDA MOURA
UFMG
ESCOLA DE CIÊNCIA DA INFORMAÇÃO
DEPARTAMENTO DE ORGANIZAÇÃO E TRATAMENTO DA INFORMAÇÃO – DOTI
LINGUAGEM DE INDEXAÇÃO
Linguagens pós-coordenadas
• São aquelas cuja a coordenação entre os
termos é efetuada no momento da recuperação
da informação.
• Nesse caso
elegem -se
os termos
representativos do documento, efetua-se a
tradução para uma linguagem de indexação
adotada no sistema e efetiva-se a entrada do
documento no sistema de informação.
Profa. MARIA APARECIDA MOURA
UFMG
ESCOLA DE CIÊNCIA DA INFORMAÇÃO
DEPARTAMENTO DE ORGANIZAÇÃO E TRATAMENTO DA INFORMAÇÃO – DOTI
LINGUAGEM DE INDEXAÇÃO
Linguagens pós-coordenadas
• As noções são reduzidas aos seus constituintes mais
simples;
• Permite privilegiar pontos de vistas distintos em relação
ao conteúdo dos documentos;
O termo adultério, por exemplo, pode ser visto, de
acordo com a época e o lugar, como um crime, um vício
ou um comportamento social.
• A coordenação entre os termos é feita no momento de
recuperação da informação;
Profa. MARIA APARECIDA MOURA
UFMG
ESCOLA DE CIÊNCIA DA INFORMAÇÃO
DEPARTAMENTO DE ORGANIZAÇÃO E TRATAMENTO DA INFORMAÇÃO – DOTI
LINGUAGEM DE INDEXAÇÃO
Objetivos dos tesauros
• Instrumento facilitador da comunicação dentro do
sistema,
• Padronização da linguagem de indexação e de
recuperação,
• Sistema classificatório embutido,
• Possibilidade de expressar o conjunto completo
de relações associativas entre conceitos
Profa. MARIA APARECIDA MOURA
E-mail: [email protected]
Profa. MARIA APARECIDA MOURA
UFMG
ESCOLA DE CIÊNCIA DA INFORMAÇÃO
DEPARTAMENTO DE ORGANIZAÇÃO E TRATAMENTO DA INFORMAÇÃO – DOTI
LINGUAGEM DE INDEXAÇÃO
Tesauros
• Os TESAUROS exercem um controle menos
rígido, mais sugestivo e flexível. Utilizam um
grau de coordenação mínimo, somente aquele
necessário ao não comprometimento da
significação dos descritores.
• Dá-se entrada por todos os TERMOS
RELEVANTES, sem necessidade de análise da
ordem de importância dos termos.
Profa. MARIA APARECIDA MOURA
E-mail: [email protected]
UFMG
ESCOLA DE CIÊNCIA DA INFORMAÇÃO
DEPARTAMENTO DE ORGANIZAÇÃO E TRATAMENTO DA INFORMAÇÃO – DOTI
LINGUAGEM DE INDEXAÇÃO
Referências
• AMAR, Muriel. Les fondements théoriques de l’ indexation: un
approche linguistique. Paris: ADBS, 2000.
• GUINCHAT, C. MENOU, M. Introdução às ciências e técnicas
da informação e documentação. Trad. Miriam Vieira da Cunha.
Brasília: IBICT. 540 p.
• MANIEZ, Jacques. Actualité des langages documentaire:
fondements théoriques de la recherche d’ information. Paris:
ADBS, 2002.
• SVENONIUS, Elaine. The intellectual foundation of information
organization. Massachusetts: MIT Press, 2000. cap. 8 e 9.
Profa. MARIA APARECIDA MOURA
E-mail: [email protected]
Download

LINGUAGENS DE INDEXAÇÃO