Recuperação
Profa. Lillian Alvares
Faculdade de Ciência da Informação
Universidade de Brasília
1
2
Definição
 Processo de localizar informação com a
finalidade de permitir o acesso dos usuários aos
itens de informação.
3
Contexto
 Grande quantidade de informações são produzidas
e disponibilizadas diariamente
 Com a elevada quantidade de informação
disponível, o processo de recuperação de
informação não é uma tarefa simples
 A baixa qualidade associada a boa parte da
informação disponível prejudica a recuperação de
informações relevantes.
4
Sistemas de
Recuperação de Informação
5
Interface
 Estrutura responsável para permitir a interação
do usuário com os SRI
6
Operações Textuais
 São operações realizadas sobre o texto de modo
que seja reduzido o texto a ser pesquisado, a
fim de que o processo de recuperação seja mais
eficiente.
 Consistem em retirar artigos, conjunções,
preposições, acentos e caracteres especiais e
preposições que fazem elo entre as palavras.
7
Pergunta
 São operações realizadas sob expressão ou
palavra-chave utilizada pelo usuário para que o
SRI possa fazer a busca.
8
Busca
 Estrutura que consiste em buscar na base de
dados as informações
9
Ranking
 Consiste em classificar os documentos
recuperados na Busca, geralmente por ordem
decrescente de relevância e apresentá-los ao
usuário.
10
Indexação
 Processo de criação de índices para os
documentos que serão adicionados ao
armazenamento.
11
Sistema de Recuperação da Informação
Documento
Usuário
Análise do Assunto
Necessidade
Indexação
Estratégia de busca
Representação
Consulta
Processo de recuperação
12
Documentos recuperados
Medidas de Eficácia
13
Revocação e Precisão
Todos os documentos
Documentos relevantes
Documentos retornados
Relevantes retornados
Revocação (Recall) 0 < R < 1
Está associada à exaustividade: Não importa o quanto retornou não
relevante; importa o que retornou de relevante
Documentos relevantes
Relevantes retornados
= Revocação
Precisão
0<P<1
Está associado à especificidade. Importa a massa de
documentos retornados não relevantes.
Todos os documentos
Documentos relevantes
Documentos retornados
Relevantes retornados
= Precisão
+
Usuário
17
Tipologia
 Novato:
 aquele que nunca usou determinado
sistema e prefere interfaces simples e
intuitivas
18
Tipologia
 Ocasional:
 utiliza o sistema de modo infrequente e
precisa reaprender a usá-lo cada novo
contato
19
Tipologia
 Especialista:
 possui conhecimento da coleção ou da base
de dados e é familiarizado com a interface
do sistema
20
Tipologia
 Experiente:
 usa o sistema frequentemente e pode lidar
com problemas que venham a surgir
21
Tipologia
 Com necessidades especiais:
 pode ser portador de deficiências visuais ou
auditivas, ou com necessidades físicas
especiais ou distúrbios de compreensão
22
 CARDOSO FILHO, J. C. ; SANTOS, M. M.
Processos e temas selecionados. In: ALVARES, L.
(Org.). Organização da informação e do
conhecimento: conceitos, subsídios
interdisciplinares e aplicações. São Paulo: B4
Editores, 2012. 248 p. Capítulo 4, p. 185/223.
23
Download

Recuperação