Bibliotecas Digitais
Centro de Informática
Universidade Federal de Pernambuco
Almir Moura
Glauber Araújo
Marcos Cardoso
Marcos Silva
1
Roteiro
 Introdução
 Desenvolvimento de coleções
 Descrição de conteúdos
 Consulta e acesso
 Preservação
 Aspectos econômicos
 Conclusões
 Material de Consulta
2
Introdução
 Sociedade da informação marcada pela
importância crescente de documentos digitais
– Artigos eletrônicos, hipertextos, imagens,…
 Grande volume de informação digital:
– Computadores pessoais
– Avanço da Internet
 Ferramentas para atender as necessidades de
informação dos usuários
– Bibliotecas Digitais
3
Introdução
 A biblioteca foi uma das primeiras instituições
que fizeram uso de tecnologias da informação e
comunicação
–
–
–
–
Bancos de dados e as redes de computadores
Sistemas de gerenciamento de bibliotecas
Bases de dados catalográficos
OPACs - On-line Public Access Catalogs
 Com o barateamento de recursos de memória,
versões digitais (eletrônicas) dos próprios
conteúdos de informação são disponibilizadas
4
Bibliotecas Digitais
 Biblioteca sem um ambiente físico e informação
não mais atrelada ao suporte de papel impresso
 Interesse impulsionado com o surgimento da
Internet na década de 90
 Conteúdos de informação estão contidos em
formatos digitais diversos
– Textos, vídeo, áudio, imagens, hipertextos...
 Acessadas pelos usuários a qualquer hora e local
5
Bibliotecas Digitais
 Um conjunto de serviços integrados para
capturar, catalogar, armazenar, buscar, proteger
e recuperar informação;
 Em uma biblioteca digital qualquer recurso
online pode ser gerenciado e compartilhado,
tornando-o muito mais acessível do que antes;
 A internet possibilitou o surgimento de
bibliotecas com acervos imensos.
6
Bibliotecas Digitais
Desenvolvimento
do acervo
Descrição dos
conteúdos
Consulta e
acesso
Preservação
Digital
7
Desenvolvimento do Acervo
 Documentos pode ser produzidos
originalmente em formatos digitais
– Uso de editores de texto, imagens,…
– Biblioteca Digital da ACM
– Liber com dissertações e teses da UFPE
 Documentos podem ser cópias digitalizadas
dos documentos originais
– Uso de scanner e reconhecimento ótico de
caracteres
8
Bibliotecas de Documentos
Digitalizados
 Biblioteca do Vaticano:
com 150 mil
manuscritos e 100 mil
gravuras e miniaturas
9
Bibliotecas de Documentos
Digitalizados
 Projeto Making of
America (MoA):
cerca de 8500 livros
do século 19
10
Bibliotecas de destaque na Web

Internet Archive
– Localizada no presidio de São
Francisco, foi fundada por Brewster
Kahle, em 1996
– A coleção inclui filmes, audio (em
especial de concertos ao vivo),
livros e softwares;
– Em 2004 a quantidade de dados
chegou a 1 petabyte com média de
crescimento mensal de 20 terabytes.
11
Bibliotecas de destaque na Web

Ibiblio
– Projeto da Universidade da Carolina do
Norte;
– Fundada em 1992 como SunSITE ;
– Faz parte do Centro de Domínio Publico
e hospeda o desenvolvimento de projetos
open source;
12
Bibliotecas de destaque na Web

Library of Congress (LoC)
– É uma das quatro bibliotecas nacionais oficiais
dos Estados Unidos;
– A biblioteca física contem cerca de 128 milhões
de itens;
– O processo de digitalização já criou 20
terabytes de informação;
– Realiza muitas pesquisas sobre bibliotecas
digitais e intercambio de dados.
13
Google Prints
 Usa o esquema de busca do Google para
encontrar livros, a maioria de domínio
publico;
 Projeto prevê a digitalização de 16 milhões
de livros;
 Parcerias com grandes bibliotecas digitais e
editoras pode tornar o projeto a maior
biblioteca digital do mundo;
 Ainda em fase beta.
14
Desenvolvimento do Acervo
 Integração/importação de recursos digitais
disponíveis em fontes eletrônicas externas
– Outras bibliotecas digitais ou a Internet.
 Redes de computadores que permitem
transmissão de informação de forma rápida e
confiável
 Diversos autores apontam uma tendência para
a integração de recursos
15
Descrição dos Documentos
 As bibliotecas digitais geram novos desafios para
descrição de documentos
– Formatos digitais heterogêneos
– Formatos complexos como hipertextos e arquivos
multimídia
 Existem padrões de metadados aceitos
internacionalmente
– Padrão MARC (Machine Readable Cataloging)
– Padrão Dublin-Core
16
Padrão MARC
 O registro MARC é dividido em campos
identificados por um código de três dígitos
numéricos
–
–
–
–
Código 020: ISBN
Código 100: autor
Código 245: título
Código 260: publicação
 Ao todo são cerca de 800 campos com
códigos associados
17
Padrão MARC –
Exemplo de Registro
$a 308 $c R484p $8 1 / $8 13 / $8 5
$a 301.2 $c R484p $8 9
090
100
1
250
$a Ribeiro, Darcy, 1922$a O povo brasileiro : $b a formacao e o
12
sentido do Brasil / $c Darcy Ribeiro. $a 2.ed. -
260
#
245
300
650
901
910
$a Sao Paulo : $b Companhia das
Letras, $c 1995.
$a 476p. : $b il.
$a Antropologia - Brasil.
0 3 $a Cultura - Brasil.
$a Etnologia - Brasil.
$a Livro
$a BC $a CAC $a FCH $a CE
18
Padrão MARC
 O significado dos códigos é universal e o
conteúdo dos campos segue padrões
internacionais como AACR2
 Duas bibliotecas usando o formato MARC
podem trocar registros entre si
 Programas usam códigos e conteúdo dos
registros conforme a necessidade
– Fazer pesquisa por palavra-chave
– Visualizar o registro na tela do computador
19
Padrão MARC
Número de
Chamada
Autor
Principal
T¡tulo
Principal
Publicação
308 R484p Biblioteca Central / Bib. Filosofia e
C. Humanas / Bib. Artes e Comunicacao
301.2 R484p Bib. Educação
Edição
2.ed. -
Descrição
Física
476p. : il.
Assuntos
Antropologia - Brasil.
Cultura - Brasil.
Etnologia - Brasil.
Ribeiro, Darcy, 1922O povo brasileiro : a formacao e o sentido do
Brasil
Sao Paulo : Companhia das Letras, 1995.
20
Padrão Dublin-Core (DC)
 Padrão MARC que contem mais de 800
elementos de metadados (alguns bastante
específicos)
 A proposta do padrão DC é definir um
conjunto de metadados simples e intuitivo
capaz de descrever diferentes documentos
digitais
 O DC oferece 15 elementos de metadados
definidos em cooperação internacional
21
Padrão Dublin-Core (DC)
 Descrição de conteúdo (7 elementos)
– Título, assunto, descrição, fonte, linguagem,
relacionamentos, cobertura
 Propriedade intelectual (4 elementos)
– Autor, publicador, colaborador, direitos
 Instanciação do documento (4 elementos)
– Tipo (texto, imagem, vídeo,...), data, formato,
identificador único
22
Padrão Dublin-Core (DC)
 Conjunto mínimo de elementos de metadados
compreendidos por qualquer comunidade
 Extensões do padrão DC são encorajadas para
atender a necessidades específicas
– Ex.: elemento “contato” (nome e e-mail da pessoa
ou instituição ao qual o recurso está vinculado)
 Conjunto mínimo de elementos devem ser
mantido nas extensões
23
Descrição dos Documentos
 Documentos como hipertexto e multimídia
são difíceis de serem descritos
– Páginas com inúmeros relacionamentos, com
vídeos, arquivos para download...
– Metadados para descrever contexto de
arquivos multimídia
 Soluções têm sido propostas, usando
normalmente estruturas em hipertexto
– XML (eXtensible Markup Language)
– RDF (Resource Description Framework)
24
Consulta e Acesso
 Diferentes tipos de ferramentas para recuperação de
informação
– Pesquisa por palavra-chave, booleana, pesquisa em
linguagem natural, navegação em estruturas
hierárquicas, navegação em hipertexto
 Catálogos On-Line: OPACs (On-line Public Access
Catalogs)
 Acesso aos conteúdos de informação:
– Download, leitura da tela do computador, pay-perview,...
25
Consulta e Acesso
 Definição das ferramentas devem levar em
conta as especificidades dos usuários
– Idade, contexto social, diferentes habilidades no uso
de computadores,...
 Melhorar o desempenho das ferramentas de
acesso envolve:
– Pesquisa nos aspectos cognitivos dos usuários
– Modelos individualizados de perfil do usuário
– Técnicas de inteligência artificial
26
Preservação Digital
 O que seria Preservação?
– Preservar o que não pode ser
manuseado
– Tentar garantir a integridade da
informação
– Evitar a perda de informação
27
Preservação Digital - Objetivos
 Auxiliar a preservação dos documentos originais
 Tentar garantir que a informação digital esteja
disponível para acesso pelas gerações futuras
 2225?
28
Preservação Digital
 Dificuldades:
– Vida útil dos meios físicos de armazenamento
– Obsolescência dos dispositivos computacionais usados
para armazenar e visualizar documentos
• Meios físicos
• Software
– Mudança de versão, perda de informação
29
Preservação Digital Estratégias
 Migração para formatos mais seguros
 Migração para meios físicos de
armazenamentos mais seguros
30
Preservação Digital Estratégias
 Construção de infra-estrutura para preservação
– Software para preservação, dispositivos para
armazenamento, pessoal qualificado,...
31
Aspectos Econômicos
 Gastos com infra-estrutura
– Acesso a internet, softwares
de edição, reconhecimento
óptico…
32
Aspectos Econômicos
 Gastos com pessoal qualificado
– Administradores, profissionais da informação,
programadores,…
33
Aspectos Econômicos
 Custos relacionados ao desenvolvimento das
coleções
– processo de digitalização.
 Custos relacionados ao acesso às fontes de
informação.
– Gastos com direitos de acesso
34
Aspectos Econômicos
 Custos relacionados ao acesso às fontes de
informação.
– Gastos com direitos autorais
35
Aspectos Econômicos
 Preservação dos documentos
– Custos da preservação digital são difíceis de serem
estimados a longo prazo
– Como estimar o preço de uma coisa que tem valor
• Cultural
• Histórico
36
Conclusões
 Tendências
– Buscar mais informações
• Biblioteca híbrida
– Sistema de busca
• Integração de fontes de informações
37
Conclusões
 Tendências
– Buscar adoção de padrões
• W e
b
• Padrões para descrição de documentos para a internet
38
Conclusões

Exigências para o profissional da informação
– Lidar com as novas tecnologias de informação e
comunicação
– Lidar com equipes de profissionais de formações
heterogêneas
– Constante atualização de seus próprios
conhecimentos e competências
39
Conclusões
 Interesse crescente nas bibliotecas
digitais
– Educação, entretenimento, negócios,…
40
Material de Consulta
 E. Fox e O. Sornil, “Digital Libraries”, Modern
Information Retrieval, Baeza-Yates e Ribeiro-Neto
(Eds), 1999
 Revista Ciência da Informação
– M. B. da Cunha, “Desafios para a construção de uma
biblioteca digital”, Vol. 28(3), 1999
– P. Z. Marchiori, “Ciberteca ou biblioteca virtual”, Vol.
26(2), 1997
– M. Levacov, “Bibliotecas virtuais: (r)evolução”,
Vol.26(2), 1997
41
Material de Consulta
 E. Fox, R. Akscyn, M., R. Furuta e J.
Leggett, “Digital Libraries”, Communications
of the ACM, Vol. 38(4), 1995
 Universidade de Michigan, Making of
America, Humanities Text Initiative,
www.hti.umich.edu
 ACM Digital Library, www.acm.org
42
Bibliotecas Digitais
Centro de Informática
Universidade Federal de Pernambuco
Almir Moura
Glauber Araújo
Marcos Cardoso
Marcos Silva
43
Download

bibliotecas_digitais_metadados