Bibliotecas Digitais Ou Sistemas de Informação? Março, 2009 Brasília, DF Sumário Terminologia variada Conceitos Arquitetura das Bibliotecas Digitais Alimentação das BD Metadados Protocolos e padrões Open Archives Software Impactos das BD Questões para reflexão Terminologia variada Biblioteca Virtual Biblioteca digital Repositório Institucional Biblioteca Eletrônica Biblioteca sem paredes Biblioteca do Futuro Conceitos I Todos os termos apresentados referem-se a um mesmo sistema. Um sistema de informação. Biblioteca Eletrônica Faz associação da aplicação à tecnologia utilizada. Biblioteca Digital Faz associação à codificação utilizada no armazenamento dos seus conteúdos. Biblioteca Virtual • • Aplicações que utilizam a tecnologia de realidades virtuais Uma biblioteca eletrônica ou digital podem ser uma biblioteca virtual se elas existirem apenas virtualmente, ou seja, a biblioteca não existe na vida real (Roy Tennant) Conceito II definição estabelecida pela NSF “...the concept of a ‘digital library’ is not merely equivalent to a digitised collection with information management tools. It is rather an environment to bring together collections, services, and people in support of the full live cycle of creation, dissemination, use, and preservation of data, information, and knowledge.” Digital Library Initiative Phase 2 Definição de BD (ARL) Os termos apresentados referem-se a um mesmo tipo de aplicação. Elementos comuns das definições apresentadas aos vários termos: A BD não é uma entidade simples; A BD requer tecnologias para interconectar os recursos de outras BD; A interconexão entre as diversas BD / SI são transparentes ao usuário final; A meta principal das BD é promover o seu acesso universal; As coleções das BD não se limitam a informações referenciais dos documentos, mas estendem-se a artefatos digitais que não podem ser representados ou distribuídos em formato impresso. Conteúdo de uma BD Uma BD contém muito mais que uma simples coleção de bits; Este conteúdo é denominado de Artefato Digital ou Objeto Digital; Nem sempre o que se obtém de uma BD é o mesmo que está armazenado. Ex.: músicas, filmes, softwares etc. Repositórios: definição são um conjunto de serviços oferecidos por uma instituição aos membros de sua comunidade para a gestão e disseminação da sua produção técnico-científica em meio digital. Clifford A. Lynch e Joan K. Lippincott (2005) Um repositório é um lugar central onde dados são armazenados e mantidos. Um repositório pode ser um lugar onde múltiplas bases de dados ou arquivos são hospedados para distribuição por intermédio de uma rede, ou um repositório pode ser um endereço que pode ser acessível diretamente para o usuário sem ter que navegar pela rede de computadores. http://en.wikipedia.org/wiki/Repository É um sistema de computador usado para armazenar coleções de uma biblioteca digital e disseminá-los aos usuários. www.cs.cornell.edu/wya/DigLib/MS1999/glossary.html Denominação A denominação da BD depende de seu conteúdo, de sua coleção ou dos seus propósitos. Exemplos: Ciência da Informação (revista CI) Repositórios Institucionais de Acesso Livre (coleção contendo a produção científica de uma instituição) BDTD (Biblioteca Digital de Teses e Dissertações) Oasis.Br (provedor de serviço) Artefato digital (AD) Também chamado Objeto digital (OD) Identificação Ident. única, Handle System Transações Propriedades Descrição do AD, exemplo: Título, autor, descritor, data de publicação, etc. Metadados Conteúdos Assinatura* Assinatura digital (opcional) Lista de transações realizadas (Log) •Direitos de acesso; •Métodos de acesso •Músicas; •Partituras; •Software; •Filmes; •Mapas; •Textos; ou •Multimídia Arquitetura de BD Porque uma arquitetura de BD? por tratar-se de um tipo de Sistema de Informação permitir maior exaustividade no processo de obtenção da informação; interconexão com outras BD Modelos existentes I Federação (Federation) trata-se de uma abordagem convencional, onde um grupo de organizações concordam, através de algum instrumento formal, em construir os seus sistemas observando-se certas especificações técnicas; o objetivo desse grupo é facilitar a interoperabilidade entre os seus sistemas. problema: esforço requerido para manter e implantar o conjunto de especificações técnicas estabelecidas. exemplos: WorldCat (OCLC), Bibliodata Modelos existentes II Harvesting Trata-se de uma arquitetura mais aberta, onde as organizações participantes não precisam seguir um conjunto completo de especificações técnicas. São sistemas mais abertos. O esforço é menor que aquele da Federação; Exemplo: BDTD, Oasis.Br, NDLTD, etc. Modelos existentes III Gathering modelo análogo ao dos mecanismos de busca (Ex.: altavista, infoseek, etc); baixa qualidade das informações; não há custo; exemplos: AltaVista, Infoseek e outros... Alimentação de BD – Opção I Documentos Seleção Digitalização Docs Digitalizados Sistema de Edição de Metadados BD Alimentação de BD – Opção II Repositório Institucional Internet Exemplo: Open Archives (E-prints, ArXiv, Cogprints, etc) Metadados Dados que descrevem os objetos digitais. Imprescindível para a descoberta e recuperação da informação Exemplos: Autor, Título, Descritor, Data, etc. Padrões internacionais: Dublin Core, GILS, OAMS, Formato MARC, etc. Linguagens de marcação (SGML, HTML, XML) Protocolos, normas e padrões internacionais Porque utilizá-los? Para dotar a BD de maior interoperacionalidade (interoperability). Ou seja, o uso de padrões adotados internacionalmente permite maior acessibilidade às informações contidas em uma BD pela sua integração com outras BD; para permitir o intercâmbio de informações e maior visibilidade do acervo digital. Por exemplo, a adoção de um formato como o MARC para materiais bibliográficos, ou mesmo o Dublin Core são fundamentais para que a utilização o protocolo Z39.50. A inobservância desses padrões marginaliza de forma decisiva uma aplicação de BD. Protocolos, normas e padrões internacionais Z39.50 – Permite a busca distribuída OAI-PMH – permite a busca distribuída aberta Dublin Core – Conjunto básico de metadados contendo 15 metadados; Formato MARC – formato de campos bibliográficos OAMS – Conjunto de metadados estabelecidos para os OA GILS – Government Information Locator Service - Conjunto de metadados estabelecidos pelo governo americano para facilitar a busca a documentos de governo. SGML – Linguagem de marcação XML – linguagem de marcação baseada no SGML PDF, HTML, DOC, RTF, MPEG, JPEG, MP3, etc. Open Archives A primeira experiência data de meados de 1991, quando o Laboratório de Física de Los Alamos criou o ArXiv 1991 => média de 500 artigos mensais 2000 => média de 3.500 artigos mensais c/ 30.000 usuários/autores Open Archives Initiatives fevereiro/2000 - Convenção de Santa Fé Definição de alguns padrões/protocolos como OAI-PMH OAI - Modelo Mecanismo de auto-publicação (auto-arquivamento) o próprio autor submete diretamente o seu artigo ou documento ao pçrovedor de dados; Armazenamento de longo prazo Interface aberta mecanismo de harvesting Provedor de dados + Provedor de Serviços Literatura cinza OAI - Motivação Complexidade nos procedimentos de publicação de artigos dificuldades enfrentados por autores junto aos editores, principalmente os comerciais; autor abdica, em favor do editor, os seus direitos; apenas o editor fatura, o autor nada recebe demora na publicação dos papers; rigidez nos critérios adotados pelos comitês editoriais, privilegiando determinados temas e marginalizando outros; alto custo das publicações frente aos baixos orçamentos das bibliotecas; Facilidades oferecidas pelas tecnologias da informação e da comunicação; Falta de interoperabilidade entre bibliotecas digitais ou repositórios digitais. OAI - Impactos maior rapidez na difusão dos resultados de pesquisa; criação de uma comunidade capacitada na criação e uso de publicações eletrônicas; Maior incremento no volume de informação na rede mundial de computadores; Maior disponibilidade de informação na rede mundial de computadores; marco na história das bibliotecas digitais; possibilitou a integração de bibliotecas digitais, assim como de repositórios digitais; Esquema Funcional do OA Provedores de Dados (Data Providers) Coleta via OAI-PMH Agregador Provedores de Serviços (Service Provider) Características específicas: esquema de funcionamento Protocolo OAI-PMH Metadados: MTD-BR NDLTD Protocolo OAI-PMH Metadados: ETD-MS IBICT Instituições Impactos das BD permite, aos usuários, o acesso direto ao documento primário, suprimindo aparentemente a figura do intermediário; permite ao autor, em algumas aplicações, publicar os seus documentos (artigos, resultados de pesquisa científica, etc.); permite ao usuário atualizar-se em seu próprio local de trabalho ou estudos; integra os processos de preservação e disseminação da informação; re-discussão das questões relativas ao direito de autor. Fases no desenvolvimento de BD ou repositórios digitais Definição de objetivos/propósitos Estabelecimento de políticas de criação e manutenção da coleção de documentos; Estudo e definição de metadados; Estabelecimento de normas de catalogação e entradas de dados; Escolha do software de gestão da BD; Aquisição/seleção de documentos Alimentação da BD Geração / fornecimento de produtos e serviços de informação Pacotes de Software Phronesis (software desenvolvido pela Universidade Monterrey – México) - domínio público - http:embauba.ibict.br/teses/ Open Journal System; Open Conference System; DSpace; Greenstone (software desenvolvido pelo projeto de BD da Neozelândia); E-prints (software para a criação de Open Archives, desenvolvido pela Southampton University); Fedora; CDSware; Nou-Rau Questões principais Multilingüismo (NDLTD possui interface multilingüe) Direitos de autor Identificação persistente dos objetos digitais Padrões de codificação e representação de objetos digitais Preservação dos objetos digitais Sites de BD, projetos de BD e afins http://www.ndltd.org/ (Networked DL of Theses e Dissertation) http://www.library.unsw.edu.au/thesis/thesis.html Projeto Australiano de Teses http://www.cybertheses.org/cybertheses/cybertheses. html Biblioteca Digital de Teses da Université Lumière e Presses Universitaires de Montréal http://www.dlib.org/ (D-Lib Magazine) http://www.openarchives.org/ (Open Archives Initiatives) http://cs-tr.cs.cornell.edu/ (NCSTRL - Networked Computer Science Technical Reference Library) Obrigado!!!! Hélio Kuramoto Coordenador Geral de Pesquisa e Manutenção de Produtos Consolidados SAS Quadra 05 Lote 06 Bloco H 70070-912 – Brasília, DF 61 3217-6350 [email protected] http://kuramoto.blog.br