Bibliotecas Digitais
Ou Sistemas de Informação?
Março, 2009
Brasília, DF
Sumário
Terminologia variada
Conceitos
Arquitetura das Bibliotecas Digitais
Alimentação das BD
Metadados
Protocolos e padrões
Open Archives
Software
Impactos das BD
Questões para reflexão
Terminologia variada
Biblioteca
Virtual
Biblioteca
digital
Repositório
Institucional
Biblioteca
Eletrônica
Biblioteca
sem
paredes
Biblioteca
do Futuro
Conceitos I
Todos os termos apresentados referem-se a um
mesmo sistema. Um sistema de informação.



Biblioteca Eletrônica
Faz associação da aplicação à tecnologia utilizada.
Biblioteca Digital
Faz associação à codificação utilizada no
armazenamento dos seus conteúdos.
Biblioteca Virtual
•
•
Aplicações que utilizam a tecnologia de realidades virtuais
Uma biblioteca eletrônica ou digital podem ser uma biblioteca
virtual se elas existirem apenas virtualmente, ou seja, a
biblioteca não existe na vida real (Roy Tennant)
Conceito II
definição estabelecida
pela NSF
“...the concept of a ‘digital library’ is not merely
equivalent to a digitised collection with information
management tools. It is rather an environment to
bring together collections, services, and people in
support of the full live cycle of creation,
dissemination, use, and preservation of data,
information, and knowledge.”
Digital Library Initiative Phase 2
Definição de BD (ARL)
Os termos apresentados referem-se a um mesmo
tipo de aplicação.
Elementos comuns das definições apresentadas aos
vários termos:





A BD não é uma entidade simples;
A BD requer tecnologias para interconectar os recursos de outras
BD;
A interconexão entre as diversas BD / SI são transparentes ao
usuário final;
A meta principal das BD é promover o seu acesso universal;
As coleções das BD não se limitam a informações referenciais dos
documentos, mas estendem-se a artefatos digitais que não podem
ser representados ou distribuídos em formato impresso.
Conteúdo de uma BD
Uma BD contém muito mais que uma
simples coleção de bits;
Este conteúdo é denominado de
Artefato Digital ou Objeto Digital;
Nem sempre o que se obtém de uma
BD é o mesmo que está armazenado.
Ex.: músicas, filmes, softwares etc.
Repositórios: definição
são um conjunto de serviços oferecidos por uma instituição aos
membros de sua comunidade para a gestão e disseminação da
sua produção técnico-científica em meio digital.
Clifford A. Lynch e Joan K. Lippincott (2005)
Um repositório é um lugar central onde dados são armazenados
e mantidos. Um repositório pode ser um lugar onde múltiplas
bases de dados ou arquivos são hospedados para distribuição
por intermédio de uma rede, ou um repositório pode ser um
endereço que pode ser acessível diretamente para o usuário
sem ter que navegar pela rede de computadores.
http://en.wikipedia.org/wiki/Repository
É um sistema de computador usado para armazenar coleções
de uma biblioteca digital e disseminá-los aos usuários.
www.cs.cornell.edu/wya/DigLib/MS1999/glossary.html
Denominação
A denominação da BD depende de seu
conteúdo, de sua coleção ou dos seus
propósitos. Exemplos:




Ciência da Informação (revista CI)
Repositórios Institucionais de Acesso Livre
(coleção contendo a produção científica de uma
instituição)
BDTD (Biblioteca Digital de Teses e Dissertações)
Oasis.Br (provedor de serviço)
Artefato digital (AD)
Também chamado
Objeto digital (OD)
Identificação
Ident. única,
Handle
System
Transações
Propriedades
Descrição do
AD, exemplo:
Título, autor,
descritor, data
de publicação,
etc.
Metadados
Conteúdos
Assinatura*
Assinatura digital (opcional)
Lista de transações
realizadas (Log)
•Direitos de acesso;
•Métodos de acesso
•Músicas;
•Partituras;
•Software;
•Filmes;
•Mapas;
•Textos; ou
•Multimídia
Arquitetura de BD
Porque uma arquitetura de BD?
 por tratar-se de um tipo de Sistema de
Informação
 permitir maior exaustividade no processo
de obtenção da informação;
 interconexão com outras BD
Modelos existentes I
Federação (Federation)




trata-se de uma abordagem convencional, onde
um grupo de organizações concordam, através de
algum instrumento formal, em construir os seus
sistemas observando-se certas especificações
técnicas;
o objetivo desse grupo é facilitar a
interoperabilidade entre os seus sistemas.
problema: esforço requerido para manter e
implantar o conjunto de especificações técnicas
estabelecidas.
exemplos: WorldCat (OCLC), Bibliodata
Modelos existentes II
Harvesting
Trata-se de uma arquitetura mais aberta,
onde as organizações participantes não
precisam seguir um conjunto completo de
especificações técnicas. São sistemas
mais abertos. O esforço é menor que
aquele da Federação;
 Exemplo: BDTD, Oasis.Br, NDLTD, etc.

Modelos existentes III
Gathering




modelo análogo ao dos mecanismos de busca
(Ex.: altavista, infoseek, etc);
baixa qualidade das informações;
não há custo;
exemplos: AltaVista, Infoseek e outros...
Alimentação de BD – Opção I
Documentos
Seleção
Digitalização
Docs
Digitalizados
Sistema de
Edição de
Metadados
BD
Alimentação de BD – Opção II
Repositório
Institucional
Internet
Exemplo: Open Archives (E-prints,
ArXiv, Cogprints, etc)
Metadados
Dados que descrevem os objetos digitais.
Imprescindível para a descoberta e
recuperação da informação


Exemplos: Autor, Título, Descritor, Data, etc.
Padrões internacionais: Dublin Core, GILS,
OAMS, Formato MARC, etc.
Linguagens de marcação (SGML, HTML,
XML)
Protocolos, normas e padrões internacionais
Porque utilizá-los?


Para dotar a BD de maior interoperacionalidade
(interoperability). Ou seja, o uso de padrões adotados
internacionalmente permite maior acessibilidade às informações
contidas em uma BD pela sua integração com outras BD;
para permitir o intercâmbio de informações e maior visibilidade
do acervo digital. Por exemplo, a adoção de um formato como o
MARC para materiais bibliográficos, ou mesmo o Dublin Core
são fundamentais para que a utilização o protocolo Z39.50. A
inobservância desses padrões marginaliza de forma decisiva
uma aplicação de BD.
Protocolos, normas e padrões internacionais
Z39.50 – Permite a busca distribuída
OAI-PMH – permite a busca distribuída aberta
Dublin Core – Conjunto básico de metadados contendo 15
metadados;
Formato MARC – formato de campos bibliográficos
OAMS – Conjunto de metadados estabelecidos para os OA
GILS – Government Information Locator Service - Conjunto de
metadados estabelecidos pelo governo americano para facilitar
a busca a documentos de governo.
SGML – Linguagem de marcação
XML – linguagem de marcação baseada no SGML
PDF, HTML, DOC, RTF, MPEG, JPEG, MP3, etc.
Open Archives
A primeira experiência data de meados de 1991,
quando o Laboratório de Física de Los Alamos criou
o ArXiv


1991 => média de 500 artigos mensais
2000 => média de 3.500 artigos mensais c/ 30.000
usuários/autores
Open Archives Initiatives
 fevereiro/2000 - Convenção de Santa Fé Definição de alguns padrões/protocolos como
OAI-PMH
OAI - Modelo
Mecanismo de auto-publicação (auto-arquivamento)

o próprio autor submete diretamente o seu artigo ou documento ao
pçrovedor de dados;
Armazenamento de longo prazo
Interface aberta

mecanismo de harvesting
Provedor de dados + Provedor de Serviços
Literatura cinza
OAI - Motivação
Complexidade nos procedimentos de publicação de
artigos





dificuldades enfrentados por autores junto aos editores,
principalmente os comerciais;
autor abdica, em favor do editor, os seus direitos; apenas o
editor fatura, o autor nada recebe
demora na publicação dos papers;
rigidez nos critérios adotados pelos comitês editoriais,
privilegiando determinados temas e marginalizando outros;
alto custo das publicações frente aos baixos orçamentos
das bibliotecas;
Facilidades oferecidas pelas tecnologias da
informação e da comunicação;
Falta de interoperabilidade entre bibliotecas digitais
ou repositórios digitais.
OAI - Impactos
maior rapidez na difusão dos resultados de pesquisa;
criação de uma comunidade capacitada na criação e
uso de publicações eletrônicas;
Maior incremento no volume de informação na rede
mundial de computadores;
Maior disponibilidade de informação na rede mundial
de computadores;
marco na história das bibliotecas digitais;
possibilitou a integração de bibliotecas digitais, assim
como de repositórios digitais;
Esquema Funcional do OA
Provedores de Dados (Data Providers)
Coleta
via
OAI-PMH
Agregador
Provedores de Serviços (Service Provider)
Características específicas: esquema de funcionamento
Protocolo OAI-PMH
Metadados: MTD-BR
NDLTD
Protocolo OAI-PMH
Metadados: ETD-MS
IBICT
Instituições
Impactos das BD
permite, aos usuários, o acesso direto ao documento
primário, suprimindo aparentemente a figura do
intermediário;
permite ao autor, em algumas aplicações, publicar os
seus documentos (artigos, resultados de pesquisa
científica, etc.);
permite ao usuário atualizar-se em seu próprio local de
trabalho ou estudos;
integra os processos de preservação e disseminação da
informação;
re-discussão das questões relativas ao direito de autor.
Fases no desenvolvimento de BD
ou repositórios digitais
Definição de objetivos/propósitos
Estabelecimento de políticas de criação e
manutenção da coleção de documentos;
Estudo e definição de metadados;
Estabelecimento de normas de catalogação e
entradas de dados;
Escolha do software de gestão da BD;
Aquisição/seleção de documentos
Alimentação da BD
Geração / fornecimento de produtos e serviços de
informação
Pacotes de Software
Phronesis (software desenvolvido pela Universidade Monterrey –
México) - domínio público - http:embauba.ibict.br/teses/
Open Journal System;
Open Conference System;
DSpace;
Greenstone (software desenvolvido pelo projeto de BD da
Neozelândia);
E-prints (software para a criação de Open Archives, desenvolvido
pela Southampton University);
Fedora;
CDSware;
Nou-Rau
Questões principais
Multilingüismo (NDLTD possui interface
multilingüe)
Direitos de autor
Identificação persistente dos objetos
digitais
Padrões de codificação e
representação de objetos digitais
Preservação dos objetos digitais
Sites de BD, projetos de BD e afins
http://www.ndltd.org/ (Networked DL of Theses e Dissertation)
http://www.library.unsw.edu.au/thesis/thesis.html
Projeto Australiano de Teses
http://www.cybertheses.org/cybertheses/cybertheses.
html
Biblioteca Digital de Teses da Université Lumière e Presses
Universitaires de Montréal
http://www.dlib.org/ (D-Lib Magazine)
http://www.openarchives.org/ (Open Archives Initiatives)
http://cs-tr.cs.cornell.edu/ (NCSTRL - Networked Computer
Science Technical Reference Library)
Obrigado!!!!
Hélio Kuramoto
Coordenador Geral de Pesquisa e Manutenção
de Produtos Consolidados
SAS Quadra 05 Lote 06 Bloco H
70070-912 – Brasília, DF
61 3217-6350
[email protected]
http://kuramoto.blog.br
Download

Bibliotecas Digitais