Bibliotecas Digitais Justificativas • Explosão da informação • Tempo para encontrar a informação • Sobrecarga de informação (EUA 150Kg papel/estudante/ano + inf. eletrônica Definição Uma BIBLIOTECA DIGITAL é um espaço virtual para dar suporte à pesquisa em alguma área de conhecimento Por Que Bibliotecas Digitais •A biblioteca digital traz a biblioteca para o usuário •A capacidade do computador é usado para pesquisar e mostrar •A informação pode ser compartilhada e copiada •A informação é facilmente atualizada •A informação está sempre disponível •Novas formas de informação tornam-se possível •Menor custo de manutenção Características Uma BIBLIOTECA DIGITAL é um Sistema de informação com: • suporte a colaboração • preservação e recuperação de documentos digitais (SGBDDig) • suporte a Hipertexto, Hiperdocumentos, Multimídia • filtragem e indexação da informação • Módulos instrucionais • Direitos de propriedade intelectual • Inteface e processamento de consultas • descoberta de recursos • disseminação da informação Características apresentado armazenado • livros, monografias • artigos, periódicos • Imagens, etc. • e-mails, programas,.. OBJETO DIGITAL disseminado Representada por tipo OBRA meio • papel • papel digitalizado • híbrido • eletrônico puro Características Pesquisador editora USUÁRIO Bibliotecário livraria Modelo 5S 1. Sociedades (pessoas, componentes de HW e de SW) ajudam a satisfazer as necessidades dos usuários (administradores, usuários, relacionamentos entre atores) 2. Cenários (provêm serviços de informação) serviços, atividades, tarefas, operações (diagramas de sequência UML) 3. Espaços localizam e apresentam informação de forma adequada = {objetos, operações} (visões lógicas e de apresentação de diversos componentes) 4. Estruturas organizam informação de forma adequada (grafos dirigidos com labels descrevendo metadados, hipertextos, taxonomias, esquemas XML, RDF) 5. Streams comunicam informação com usuários e máquinas (estáticos: sequências de bits, caracteres, imagens,.. dinâmicos: fluxo de informação, animação, sicronização) Modelo 5S Estrutura formal de 5 S Estrutura formal de 5 S Estrutura formal de 5 S Objetos digitais Objetos digitais FORMATOS de Intercâmbio (Metadados): FORMATOS dos Documentos Indexação catalogação Identificação • Z39.50 •MARC/IBICT • DC – Dublin Core • PDF, PS • DOC, TXT • HTML, XML, etc. • MP3, MPEG, etc. • CDU, CDD, CR • MeSH • LCSH. • semântica X surrogate • ISBN, URL, URN • SICI – Serial Item and Contributor Id. Sistema de Biblioteca (Digital) resposta consultas cadastro REFERÊNCIAS Cópias ASSUNTOS indexação DOCUMENTOS USUÁRIOS sugestões de aquisição Bi Di Global Uma Federação de Bibliotecas Digitais INTEROPERABILIDADE • Técnica (hardware, redes, protocolos) • De Informação (escopo, linguagem, metadados, convenções, semânticas) • Social (direitos e responsabilidades pessoais e de organizações) TECNOLOGIAS • Interfaces • Recuperação Multilíngue • Indexação Multimídia (textos, análise de discursos, músicas, vídeos, imagens, gráficos) • Recuperação da Informação Multimídia • Novas Publicaçoes Eletrônicas • Digitalização Biblioteca Digital Federada BD-1 cadastro indexação • • • BD-n I N T E R F A C E resposta consultas Projetos Digital Libraries Initiative DLI1 (1994-1998) DLI2 (1999-) Coordenação de projetos de: • University of California at Berkeley - informação digital no trabalho [3.5 TB de dados, Consultas baseadas em imagens, ling. Natural, OCR, OR Postgres • University of California at Santa Barbara - informação espacial em mapas – [Bib. Alexandria, mapas, fotos aéreas, múltiplas resoluções, OR Postgres • Carnegie Mellon University - análise de videos por conteúdo – [200HS de gravações da TV pública, reconh. voz, reconh. rostos humanos, ling. Natural] Digital Libraries Initiative • University of Illinois - coleções federadas de publicações científicas [200.000 documentos digitais; Internet, rec. semântica, groupware] • Stanford University (Garcia-Molina) - interoperabilidade – [Pub. Cienc. Computação; protocolos, agentes, interfaces) InterLib • University of Michigan - agentes inteligentes para localização da informação – [Agentes, interfaces, busca distribuida, aprendizagem colaborativa] EU 6th Framework (2002-2006) €12 billion 1. 2. 3. 4. 5. 6. 7. genomics and biotechnology for health; information society technologies; nanotechnologies and nanosciences; aeronautics and space; food safety; sustainable development; and economic and social sciences. EU 6th Framework (2002-2006) advance the techniques for evaluation of networked systems COMBINA: • bibliotecas digitais • sistemas baseados em agentes, • grid computing, e • Web semântica EU 6th Framework DL ABS Common Metrics Grid SW EU 6th Framework • Issues of scale and scalability; • Interoperability among heterogeneous sources and systems challenge; • usability of these systems by a broad range of individuals; • information content, computational tools, and user needs. • evaluation standards and measures. PROJETOS • DIPPO: Federação de dados estatísticos governamentais; • Maeda et.al. Documentos Multiliguais (MHTML viewer) • Klavans&Schäuble NSF_EU Multilingual Information access • Endres&Fuhr MeDoc – Multimedia Electronic Documents. • Gonçalves&Medeiros Disseminação Científica (BD Tropicais+EMBRAPA+GEOLIB. • NCSTRL-Networked Computer Science Technical Reports Library Biblioteca Digital Distrribuída na Europa Central • NEW ZEALAND DIGITAL LIBRARY PROJETOS • NEW ZEALAND DIGITAL LIBRARY • Múltiplas línguas (Inglês, Francês, Alemão, Arábico, Maori, Português, Swahili) • Múltiplas midias (Local Oral History Collection Interiews and photographs), Musik Library (10 000 folk tunes) • Sistema MG para textos • Sistema MR para músicas Bibliotecas Digitais Federadas } Bibliotecas setoriais Bibliotecas integradas USP + Unicamp + UNESP } USPDEDALUS UNIBIBLI EVENTOS NSF Post Digital Library Futures Workshop 15-17 Junho 2003 – Massachusetts (http://www.sis.pitt.edu/%7Edlwkshop/papers.html) DELOS (Projeto ESPRIT, part of ERCIM DL Initiative) Workshops: - "Information Seeking, Searching and Querying in Digital Libraries", 11-12 December 2000, Zurich, Switzerland. - "Personalisation and Recommender Systems in Digital Libraries", 18-20 June 2001, Dublin, Ireland. -"Interoperability and Mediation in Heterogeneous Digital Libraries", 8-9 September 2001, Darmstadt, Germany - Evaluation of Digital Libraries: Testbeds, Measurements, and Metrics 6-7 June 2002 Budapest, Hungary Topicos de pesquisa • • • • • • • • • Modelos de objetos interfaces e interação descoberta da informação (browsing+IR) Metadados: catalocação e indexação Processamento linguagem (multi-)lingual material não textual (metadados e pesquisa) armazenamento e gerência de coleções conversão: físico -> digital interoperabilidade (interfaces, identificação (URN), formatos, metadados, pesquisa distrib., comunicação e transmissão ) • Autenticação e segurança (direitos autorais) REFERÊNCIAS • E. Fox & G. Marchionini (eds.) Towards a Worldwide Digital Library + diversos Artigos sobre Interoperability, Special types of Digital Libraries; Multilingual Support; National Efforts, Special Issue on DL, CACM 41(4) 1998 • E. Fox Overview of Digital Library Components and Developments • M. Gonçalves, E. Fox et.al. Streams, Strtuctures, Spaces, Scenarios, Societies (5S): A Formal Model for Digital Libraries • W. Arms Digital Libraries, MIT Press, 2000 • N. Adami et. al, ToCAI: a Framework for Indexing and Retrieval of Multimedia Documents • E. Bertino, A. Elmagarmid & Hacid Quality of Services in Multimidia Digital Libraries, ACM SIGMOD Record 30(1), 2001 • L. Feng, M. Jeusfeld & J. Hoppenbrowers Towards Knowledge Based Digital Libraries, ACM SIGMOD Record 30(1):41-46, 2001 • IEEE Computer – Special Issue on Digital Libraries, February 1999 • Franciska de Jong & Thijs Westerveld MUMIS: multimedia indexing and searching EU Founded project • Alfredo Sánchez Bibliotecas Digitales: Introducción, ENC, 1997 SISTEMAS • DIALOG Corporation •Cobre mais de 500 bancos de dados. Recupera informações bibliográficas e textos integrais • LEXIS-NEXIS • banco de dados de textos integrais sobre assuntos jurídicos e de negócios • OCLC (Online Computer Library Center) • 70 bancos de dados com 1,5 milhões de textos integrais • H.W.Wilson • 40 bancos de dados com informação colegial (versões eletrônicas, CD-ROM e Web dos dados) SISTEMAS • DIALOG Corporation •Alguns bancos de dados: • Chemical abstracts (20 milhões, + 11.000/semana); • MEDLINE (12 milhões + 7.700/semana); • NYT full text desde 1981; • Psych. Abstracts (2 milhões + 5000/mês);.. SISTEMAS • Cada sistema tem sua linguagem • Tentativas de standard: • CCL (Common Command Language) • NISO Z39.58 •ISO 8777 • Tipos de pesquisas comuns: • Termo simples • Frases • Combinações Booleanas • Proximidades (‘A’ adjacente/perto-de ‘B’) • Colocações (‘A’ no título ou no resumo, etc.) • Caminhar por relações entre termos (no thesaurus) • funções de BDs específicos (p.ex. químico) • Consultas são iterativas • Pesquisas cross-databases Acesso a bibliotecas – Ficha catalográfica Autoria Título da tese inicia-se abaixo da 4º letra do sobrenome Notas Assunto(s) Imprenta Subtítulo Sobrenome do autor, Nome Título da tese: subtítulo / Nome completo do autor. - - Rio de Janeiro: UFRJ / Nome ou sigla da Unidade, ano. Descrição Física x, 90 f. : il. ; 31 cm. Orientador: Nome Tese (doutorado) – Universidade Federal do Rio de Janeiro, Nome ou sigla da Unidade, Nome do Programa de Pós-graduação, ano. 1. Assunto. 2. Área de concentração – Tese. I. Sobrenome do orientador, Nome. II. Universidade Federal do Rio de Janeiro, Nome da Unidade, Nome do Programa de Pós-graduação. III.Título. Tamanho: 12,5 cm x 7,5 cm Pista Acesso a bibliotecas – Ficha catalográfica Pastura, Patrícia Souza Valle Cardoso Infecção suspeita em crianças com neoplasia hematológica e neutropenia / Patrícia Souza Valle Cardoso Pastura. -- Rio de Janeiro: UFRJ / Faculdade de Medicina, 2003. xi, 110 f. : il. ; 31 cm. Orientadores: Guilherme Santoro Lopes e Marcelo Gerardin Poirot Land Dissertação (mestrado) – UFRJ / Faculdade de Medicina / DIP, 2003. Referências bibliográficas: f. 88-104 1. Neutropenia. 2. Neoplasias hematológicas. 3. Leucemia linfocítica aguda L1. 4. Infecção. 5. Febre. 6. Criança. 7. Prognóstico. 8. Estudos prospectivos. 9. Doenças Infecciosas e Parasitárias - Tese. I. Lopes, Guilherme Santoro. II. Land, Marcelo Gerardin Poirot. III.Universidade Federal do Rio de Janeiro, Faculdade de Medicina, DIP. IV. Título. Acesso a bibliotecas – Ficha BibTex @Book{abramowitz+stegun, author = "Milton Abramowitz and Irene A. Stegun", title = "Handbook of Mathematical Functions with Formulas, Graphs, and Mathematical Tables", publisher = "Dover", year = 1964, address = "New York", edition = "ninth Dover printing, tenth GPO printing" ___________________________________________________________________ _______ @proceeding{646491, editor = {Alberto H. F. Laender and Arlindo L. Oliveira}, title = {SPIRE 2002: Proceedings of the 9th International Symposium on String Processing and Information Retrieval}, year = {2002}, isbn = {3-540-44158-1}, publisher = {Springer-Verlag}, address = {London, UK}, } Acesso a bibliotecas – Ficha MARC Autoria:Setzer, Valdemar Waingort, 1940Título:Curso de Fortran IV, básico. Imprenta:São Paulo, E. Blucher, Ed. da U.S.P. [1972] Descrição física:102 p. il. Notas:Registro Pré-MARC LDR005840000000002170004500 Assuntos:Fortran (Linguagem de programação) Programação, Linguagens de. 0012003083004544984914 Autorias secundárias:Simon, Imre, 1943- Kowaltowski, Tomasz, 1942003Br Classificação Decimal de Dewey:651.8 00520030830045449.8 035__ |a 155489 082__ |a 651.8 092__ |a II-1,7,11 100__ |a Setzer, Valdemar Waingort, 1940245__ |a Curso de Fortran IV, básico. 260__ |a São Paulo, E. Blucher, Ed. da U.S.P. [1972] 300__ |a 102 p. il. 590__ |a Registro Pré-MARC 650__ |a Fortran (Linguagem de programação) 650__ |a Programação, Linguagens de. 700__ |a Simon, Imre, 1943700__ |a Kowaltowski, Tomasz, 1942856__ |a 142703 Acesso a bibliotecas – Ficha MARC 00001017cam a22002654a 450 00113216768 00520031008121527.0 008030529s2004 maua b 001 0 eng 906__ |a 7 |b cbc |c orignew |d 1 |e ocip |f 20 |g y-gencatlg 9250_ |a acquire |b 2 shelf copies |x policy default 955__ |a pc21 2003-05-29 to ASCD |c jf05 2003-06-02 to subj.; |d jf04 200306-02 to S.L. |e jf12 2003-06-02 to Dewey |a aa05 2003-06-03 |a ps07 200308-21 1 copy rec’d., to CIP ver. |a jf00 2003-08-28 |f jf05 2003-10-08 to sl |e jf12 2003-10-08 to BCCD 010__ |a 2003052442 020__ |a 0321197844 040__ |a DLC |c DLC |d DLC 042__ |a pcc 05000 |a QA76.9.D3 |b D3659 2003 08200 |a 005.74 |2 21 1001_ |a Date, C. J. 24513 |a An introduction to database systems / |c C.J. Date. 24630 |a Database systems 250__ |a 8th ed. 260__ |a Boston : |b Pearson/Addison Wesley, |c 2004. 300__ |a xxvii, 983, 22 p. : |b ill. ; |c 24 cm. 504__ |a Includes bibliographical references and index. 650_0 |a Database management. Acesso a bibliotecas – Registro MARC 01099cam 2200289 a 450000100080000000500170000800800410002503500210006690600450008795501280013201000 170026002000150027704000180029205000260031008200150033610000160035124500540036725 000120042126000550043330000360048844000460052450400510057065000250062192000410064 6991005200687991007000739-3012967-20010731111512.0-940201s1995 maua b 001 0 eng - 9(DLC) 94003187- a7bcbccorignewd1eocipf19gy-gencatlg- apc03 to ja00 02-01-94; jf06 to subj 02-02-94; jf11 to sl 02-02-94; jf12 02-02-94; recd. je00 2Sept94; CIP ver je25 09-19-94- a 94003187 - a020154329X- aDLCcDLCdDLC-00aQA76.9.D3bD3659 1995-00a005.74220-1 aDate, C. J.-13aAn introduction to database systems /cC.J. Date.- a6th ed.- aReading, Mass. :bAddisonWesley Pub. Co.,cc1995.- axxiii, 839 p. :bill. ;c24 cm.- 0aAddison-Wesley systems programming series- aIncludes bibliographical references and index.- 0aDatabase management.- a** LC HAS REQ'D # OF SHELF COPIES **- bc-GenCollhQA76.9.D3iD3659 1995tCopy 1wBOOKS- bcGenCollhQA76.9.D3iD3659 1995p00023608856tCopy 2v54329wCCF- Acesso a bibliotecas : DC – Dublin Core <rdf:Description rdf:about="http://www.ieee.org"> <dc:title>Proceedings of the 13th International Workshop on Research Issues on Data Engineering: Multi-lingual Information Management-RIDE-MLIM</dc:title> <dc:creator> CROFT W. Bruce </dc:creator> <dc:creator> SANGAL Rajeev </dc:creator> <dc:subject>Workshop</dc:subject> <dc:subject>Management</dc:subject> <dc:subject>Multilingual</dc:subject> <dc:publisher>IEEE</dc:publisher> <dc:date>2003</dc:date> <dc:type>Proceedings</dc:type> <dc:format> <dc:medium>text</dc:medium> <dc:extent pages>420</dc:extent pages> </dc:format> <dc:source>IEEE Computer Society</dc:source> <dc:identifier>ISBN 0-7803-7868-7</dc:identifier> </rdf:Description> Acesso a bibliotecas - Catálogos • Fichas de papel, • Livros catalográficos, microfilmes, microfichas • On-Line (gerações de Hildreth): 1. pesquisa por autor, título, Palavras-chave 2. Visualização simples, detalhada e diálogos personalizados 3. Assistência na pesquisa; texto livre ou com vocabulário controlado; cross-database; correção de erros sensível ao contexto Acesso a bibliotecas – Catálogos on-line OPAC-Online Public Acess Catalog • • PROBLEMAS: Interface amigável para catálogos MARC ou assuntos LCSH. • Consequências: 1. retorno vazio ou retorno excessivo. Estudo MELVYL: 82% de retornos vazios, 25% dos retornos não continham a informação procurada 2. Borgman’86: “porque catálogos on-line são difíceis de serem usados?” 3. Borgman’96: “porque catálogos on-line ainda são difíceis de serem usados?” Acesso a bibliotecas – Catálogos on-line OPAC-Online Public Acess Catalog • • • SISTEMAS: Comerciais: Voyager (EIS); INNOPAC; EOSi; OrtoDocs; Aleph Acadêmicos: 1. MARIAN (Virginia Tech).(http://www.dlib.vt.edu/products/marian.html) 2. Okapi (City University-London) 3. Biblioteca Nacional (http://www.bn.br/site/default.htm) 4. MINIBLIO (http://buchada.dsc.ufcg.edu.br/miniblio/) 5. Biblioteca Nacional da Alemanha (Deutsche Nationalbibliothek) (http://dispatch.opac.ddb.de/DB=4.1/SET=1/TTL=8/START_WELCOME) 6. Biblioteca do Congresso (Library of Congress) (http://catalog.loc.gov/) 7. USP-DEDALUS (http://dedalus.usp.br:4500/ALEPH/por/USP/USP/DEDALUS/START) 8. UNIBIBLI (USP+UNESP+UNICAMP) (http://bibliotecascruesp.usp.br/scripts/odwp502k.dll?t=dfb&pr=cruesp_profile&db=cruesp_catalogo&sm=b&sort=on) Bibliotecas Digitais • TIPOS DE DOCUMENTOS 1. Documentos Multilíngues crescimento de documentos não-inglês 2. Documentos Multimídia (streams sincronizados) 3. Documentos estruturados (streams estruturados) 4. Coleções distribuídas Bibliotecas Digitais Distribuidas Sistema BioKleisli Publications = [title: string, authors; {[name string, initial string]}, journal: <uncontrolled: string, controlled <medline-jta: string, %Medline journal title abbreviation isso-jta: string, %ISO journal title abbreviation journal-title: string, %Full journal title issn: string>> %ISSN number volume string, issue string, year int, pages string, abstract string, keywd: {string}]} Sistema BioKleisli CPL – Collection Programming Language {[title = p.title, authors = p.authors] \p <- DB, p=“Date, C.”} seleciona título e autor do banco de dados DB Sistema BioKleisli Sistema BioKleisli – BDs Fonte • SGBD: • Sybase; ASN.1-Entrez, ACeDB e OPM • comunidade de archival nucleic acid (GenBank, EMBL, DDBJ e GSDB) • Genome Database (GDB) de Sybase para OPM • BLAST Software de comparação entre sequências de proteinas com um BD de sequêncais Sistema BioKleisli – Consultas Sistema BioKleisli – Consultas SQL CPL define Loci22 = GDB([query = “select locus_symbol, genbank_ref from locus, object_genbank_eref, locus_cyto_location where locus.locus_id = locus_cyto_location_id and locus.locus_id = object_genbank_eref.object_id and object_class_key = 1 and loc_cyto_chrom_num = ’22’ “])