Bibliotecas Digitais Centro de Informática Universidade Federal de Pernambuco Almir Moura Glauber Araújo Marcos Cardoso Marcos Silva 1 Roteiro Introdução Desenvolvimento de coleções Descrição de conteúdos Consulta e acesso Preservação Aspectos econômicos Conclusões Material de Consulta 2 Introdução Sociedade da informação marcada pela importância crescente de documentos digitais – Artigos eletrônicos, hipertextos, imagens,… Grande volume de informação digital: – Computadores pessoais – Avanço da Internet Ferramentas para atender as necessidades de informação dos usuários – Bibliotecas Digitais 3 Introdução A biblioteca foi uma das primeiras instituições que fizeram uso de tecnologias da informação e comunicação – – – – Bancos de dados e as redes de computadores Sistemas de gerenciamento de bibliotecas Bases de dados catalográficos OPACs - On-line Public Access Catalogs Com o barateamento de recursos de memória, versões digitais (eletrônicas) dos próprios conteúdos de informação são disponibilizadas 4 Bibliotecas Digitais Biblioteca sem um ambiente físico e informação não mais atrelada ao suporte de papel impresso Interesse impulsionado com o surgimento da Internet na década de 90 Conteúdos de informação estão contidos em formatos digitais diversos – Textos, vídeo, áudio, imagens, hipertextos... Acessadas pelos usuários a qualquer hora e local 5 Bibliotecas Digitais Um conjunto de serviços integrados para capturar, catalogar, armazenar, buscar, proteger e recuperar informação; Em uma biblioteca digital qualquer recurso online pode ser gerenciado e compartilhado, tornando-o muito mais acessível do que antes; A internet possibilitou o surgimento de bibliotecas com acervos imensos. 6 Bibliotecas Digitais Desenvolvimento do acervo Descrição dos conteúdos Consulta e acesso Preservação Digital 7 Desenvolvimento do Acervo Documentos pode ser produzidos originalmente em formatos digitais – Uso de editores de texto, imagens,… – Biblioteca Digital da ACM – Liber com dissertações e teses da UFPE Documentos podem ser cópias digitalizadas dos documentos originais – Uso de scanner e reconhecimento ótico de caracteres 8 Bibliotecas de Documentos Digitalizados Biblioteca do Vaticano: com 150 mil manuscritos e 100 mil gravuras e miniaturas 9 Bibliotecas de Documentos Digitalizados Projeto Making of America (MoA): cerca de 8500 livros do século 19 10 Bibliotecas de destaque na Web Internet Archive – Localizada no presidio de São Francisco, foi fundada por Brewster Kahle, em 1996 – A coleção inclui filmes, audio (em especial de concertos ao vivo), livros e softwares; – Em 2004 a quantidade de dados chegou a 1 petabyte com média de crescimento mensal de 20 terabytes. 11 Bibliotecas de destaque na Web Ibiblio – Projeto da Universidade da Carolina do Norte; – Fundada em 1992 como SunSITE ; – Faz parte do Centro de Domínio Publico e hospeda o desenvolvimento de projetos open source; 12 Bibliotecas de destaque na Web Library of Congress (LoC) – É uma das quatro bibliotecas nacionais oficiais dos Estados Unidos; – A biblioteca física contem cerca de 128 milhões de itens; – O processo de digitalização já criou 20 terabytes de informação; – Realiza muitas pesquisas sobre bibliotecas digitais e intercambio de dados. 13 Google Prints Usa o esquema de busca do Google para encontrar livros, a maioria de domínio publico; Projeto prevê a digitalização de 16 milhões de livros; Parcerias com grandes bibliotecas digitais e editoras pode tornar o projeto a maior biblioteca digital do mundo; Ainda em fase beta. 14 Desenvolvimento do Acervo Integração/importação de recursos digitais disponíveis em fontes eletrônicas externas – Outras bibliotecas digitais ou a Internet. Redes de computadores que permitem transmissão de informação de forma rápida e confiável Diversos autores apontam uma tendência para a integração de recursos 15 Descrição dos Documentos As bibliotecas digitais geram novos desafios para descrição de documentos – Formatos digitais heterogêneos – Formatos complexos como hipertextos e arquivos multimídia Existem padrões de metadados aceitos internacionalmente – Padrão MARC (Machine Readable Cataloging) – Padrão Dublin-Core 16 Padrão MARC O registro MARC é dividido em campos identificados por um código de três dígitos numéricos – – – – Código 020: ISBN Código 100: autor Código 245: título Código 260: publicação Ao todo são cerca de 800 campos com códigos associados 17 Padrão MARC – Exemplo de Registro $a 308 $c R484p $8 1 / $8 13 / $8 5 $a 301.2 $c R484p $8 9 090 100 1 250 $a Ribeiro, Darcy, 1922$a O povo brasileiro : $b a formacao e o 12 sentido do Brasil / $c Darcy Ribeiro. $a 2.ed. - 260 # 245 300 650 901 910 $a Sao Paulo : $b Companhia das Letras, $c 1995. $a 476p. : $b il. $a Antropologia - Brasil. 0 3 $a Cultura - Brasil. $a Etnologia - Brasil. $a Livro $a BC $a CAC $a FCH $a CE 18 Padrão MARC O significado dos códigos é universal e o conteúdo dos campos segue padrões internacionais como AACR2 Duas bibliotecas usando o formato MARC podem trocar registros entre si Programas usam códigos e conteúdo dos registros conforme a necessidade – Fazer pesquisa por palavra-chave – Visualizar o registro na tela do computador 19 Padrão MARC Número de Chamada Autor Principal T¡tulo Principal Publicação 308 R484p Biblioteca Central / Bib. Filosofia e C. Humanas / Bib. Artes e Comunicacao 301.2 R484p Bib. Educação Edição 2.ed. - Descrição Física 476p. : il. Assuntos Antropologia - Brasil. Cultura - Brasil. Etnologia - Brasil. Ribeiro, Darcy, 1922O povo brasileiro : a formacao e o sentido do Brasil Sao Paulo : Companhia das Letras, 1995. 20 Padrão Dublin-Core (DC) Padrão MARC que contem mais de 800 elementos de metadados (alguns bastante específicos) A proposta do padrão DC é definir um conjunto de metadados simples e intuitivo capaz de descrever diferentes documentos digitais O DC oferece 15 elementos de metadados definidos em cooperação internacional 21 Padrão Dublin-Core (DC) Descrição de conteúdo (7 elementos) – Título, assunto, descrição, fonte, linguagem, relacionamentos, cobertura Propriedade intelectual (4 elementos) – Autor, publicador, colaborador, direitos Instanciação do documento (4 elementos) – Tipo (texto, imagem, vídeo,...), data, formato, identificador único 22 Padrão Dublin-Core (DC) Conjunto mínimo de elementos de metadados compreendidos por qualquer comunidade Extensões do padrão DC são encorajadas para atender a necessidades específicas – Ex.: elemento “contato” (nome e e-mail da pessoa ou instituição ao qual o recurso está vinculado) Conjunto mínimo de elementos devem ser mantido nas extensões 23 Descrição dos Documentos Documentos como hipertexto e multimídia são difíceis de serem descritos – Páginas com inúmeros relacionamentos, com vídeos, arquivos para download... – Metadados para descrever contexto de arquivos multimídia Soluções têm sido propostas, usando normalmente estruturas em hipertexto – XML (eXtensible Markup Language) – RDF (Resource Description Framework) 24 Consulta e Acesso Diferentes tipos de ferramentas para recuperação de informação – Pesquisa por palavra-chave, booleana, pesquisa em linguagem natural, navegação em estruturas hierárquicas, navegação em hipertexto Catálogos On-Line: OPACs (On-line Public Access Catalogs) Acesso aos conteúdos de informação: – Download, leitura da tela do computador, pay-perview,... 25 Consulta e Acesso Definição das ferramentas devem levar em conta as especificidades dos usuários – Idade, contexto social, diferentes habilidades no uso de computadores,... Melhorar o desempenho das ferramentas de acesso envolve: – Pesquisa nos aspectos cognitivos dos usuários – Modelos individualizados de perfil do usuário – Técnicas de inteligência artificial 26 Preservação Digital O que seria Preservação? – Preservar o que não pode ser manuseado – Tentar garantir a integridade da informação – Evitar a perda de informação 27 Preservação Digital - Objetivos Auxiliar a preservação dos documentos originais Tentar garantir que a informação digital esteja disponível para acesso pelas gerações futuras 2225? 28 Preservação Digital Dificuldades: – Vida útil dos meios físicos de armazenamento – Obsolescência dos dispositivos computacionais usados para armazenar e visualizar documentos • Meios físicos • Software – Mudança de versão, perda de informação 29 Preservação Digital Estratégias Migração para formatos mais seguros Migração para meios físicos de armazenamentos mais seguros 30 Preservação Digital Estratégias Construção de infra-estrutura para preservação – Software para preservação, dispositivos para armazenamento, pessoal qualificado,... 31 Aspectos Econômicos Gastos com infra-estrutura – Acesso a internet, softwares de edição, reconhecimento óptico… 32 Aspectos Econômicos Gastos com pessoal qualificado – Administradores, profissionais da informação, programadores,… 33 Aspectos Econômicos Custos relacionados ao desenvolvimento das coleções – processo de digitalização. Custos relacionados ao acesso às fontes de informação. – Gastos com direitos de acesso 34 Aspectos Econômicos Custos relacionados ao acesso às fontes de informação. – Gastos com direitos autorais 35 Aspectos Econômicos Preservação dos documentos – Custos da preservação digital são difíceis de serem estimados a longo prazo – Como estimar o preço de uma coisa que tem valor • Cultural • Histórico 36 Conclusões Tendências – Buscar mais informações • Biblioteca híbrida – Sistema de busca • Integração de fontes de informações 37 Conclusões Tendências – Buscar adoção de padrões • W e b • Padrões para descrição de documentos para a internet 38 Conclusões Exigências para o profissional da informação – Lidar com as novas tecnologias de informação e comunicação – Lidar com equipes de profissionais de formações heterogêneas – Constante atualização de seus próprios conhecimentos e competências 39 Conclusões Interesse crescente nas bibliotecas digitais – Educação, entretenimento, negócios,… 40 Material de Consulta E. Fox e O. Sornil, “Digital Libraries”, Modern Information Retrieval, Baeza-Yates e Ribeiro-Neto (Eds), 1999 Revista Ciência da Informação – M. B. da Cunha, “Desafios para a construção de uma biblioteca digital”, Vol. 28(3), 1999 – P. Z. Marchiori, “Ciberteca ou biblioteca virtual”, Vol. 26(2), 1997 – M. Levacov, “Bibliotecas virtuais: (r)evolução”, Vol.26(2), 1997 41 Material de Consulta E. Fox, R. Akscyn, M., R. Furuta e J. Leggett, “Digital Libraries”, Communications of the ACM, Vol. 38(4), 1995 Universidade de Michigan, Making of America, Humanities Text Initiative, www.hti.umich.edu ACM Digital Library, www.acm.org 42 Bibliotecas Digitais Centro de Informática Universidade Federal de Pernambuco Almir Moura Glauber Araújo Marcos Cardoso Marcos Silva 43