IMPACTOS NOS SISTEMAS DE INFORMAÇÃO E NAS BIBLIOTECAS CIENTÍFICAS Luís Fernando Sayão CNEN/CIN – PPGB/UNIRIO Luana Farias Sales CNEN/IEN À GUISA DE INTRODUÇÃO IMPULSIONADO PELA TECNOLOGIA DIGITAL E REDES DE COMPUTADORES TROCA DE SUPORTE PERIÓDICO ELETRÔNICO LIVRO ELETRÔNICO ENTREGA: PDF (mimeógrafo virtual) IMPULSIONADO PELO NOVO MODO DE FAZER CIÊNCIA INOVAÇÃO: PESQUISADORES ENTREGA: PRODUTOS DE PESQUISA VARIADOS E INTEGRADOS O desenvolvimento dos novos sistemas de informação para a pesquisa será afetado pela necessidade de acessar, analisar, modelar, minerar e visualizar dados digitais. Isto coloca o desafio – para profissionais de várias áreas ‐ de como organizar, apresentar, armazenar e preservar esses recursos informacionais. OS PARADIGMAS CIENTÍFICOS 1º PARADIGMA: Ciência experimental ou empírica estuda a relação entre fenômenos por meio de experimentos 2º PARADIGMA: Ciência teórica ou descritiva formula modelos para descrição e explicação dos fenômenos naturais 3º PARADIGMA: Ciência baseada em simulação uso de software e grande geração de dados O DILÚVIO DE DADOS Uma nova geração de instrumentos científicos, sensores, satélites, software de simulação, colaboratórios produzem em ritmo exponencial quantidades imensas e diversificadas de dados brutos de pesquisa O QUARTO PARADIGMA CIENTÍFICO eScience CIÊNCIA PRODUZIDA A PARTIR DO USO, ARMAZENAMENTO, PROCESSAMENTO, ANÁLISE E COMPARTILHAMENTO DE DADOS DE PESQUISA (GRAY, 2005). [ [ O poder dos computadores modernos permite que relações altamente complexas e até então despercebidas possam ser identificadas e se tornem o motor do quarto paradigma O QUARTO PARADIGMA CIENTÍFICO eScience O MODO DE FAZER CIÊNCIA MUDA.... A computação não é mais meramente um suporte para o padrão tradicional de se conduzir a investigação científica em determinadas disciplinas, mas pode mudar fundamentalmente o desenvolvimento dessas disciplinas. FORMULAÇÃO DE HIPÓTESES Ao invés de hipóteses serem testadas e desenvolvidas a partir de dados coletados para este propósito, hipóteses são construídas após a identificação relações nos conjuntos de dados. Neste abordagem os dados vem primeiro, incorporados numa sequencia de captura de dados, curadoria e análises O QUARTO PARADIGMA CIENTÍFICO eScience ACELERAR A PESQUISA CIENTÍFICA E GERAR CONHECIMENTO COM BASE NA EXPLORAÇÃO DESSE ACÚMULO DE DADOS Ferramentas avançadas de software e de mineração de dados ajudam a interpretar e transformar os dados brutos em configurações ilimitadas de informação e conhecimento. Perguntas instigantes e recursivas colocadas perante os vários segmentos científicos podem agora ser endereçadas, pela combinação de múltiplas fontes de dados provenientes de domínios diferentes, através da aplicação de modelos complexos e de métodos inéditos de análise. O QUARTO PARADIGMA CIENTÍFICO eScience Ciência aberta Quando há compartilhamento O compartilhamento e o intercâmbio permitem descobrir conexões no que estava antes desconectado de ideias e abertura do conhecimento a ciência avança mais rapidamente Reprodutibilidade dos experimentos científicos é um dos fundamentos da ciência. Códigos fontes para reproduzir dos dados; Uso de software livres e formatos abertos; Ferramentas de pesquisa abertas; Dados de entrada e metadados Cadernos de pesquisa abertos CIÊ NC Os dados científicos devem estar disponíveis para qualquer pessoa sem restrições de copyright, patentes ou outros mecanismos de controle. Dados abertos incentivam o reuso em outras áreas diferentes da original, o que pode levar a descobertas surpreendentes. IA A T ER B A Os pesquisadores devem divulgar suas descobertas de forma que elas estejam acessíveis para todos os usuários potenciais sem qualquer barreira. Colaboração crescente entre cientistas efetivada por meio das mídias sociais e da internet. Um número crescente de cientistas estão encontrando novas estratégias para comunicar seus trabalhos usando wikis, blogs, twitter A avaliação pelas instituições de pesquisa, bem como a aprovação de financiamento pelas agências deve levar em conta a preparação dos dados para disponibilidade na mesma escala em que considera artigos de periódicos e outras publicações, ou seja o nível de transparência. AGENDA IS A ? U Q S PE E D S ADO D É É E QU O , L AFINA MICAS Ê D A C A S E Õ AÇ PUBLICAÇ UISA Q E S P D E DADOS D E O T Ã GES CICLOS DE COMUNICA ÇÃO CIENTÍFICA CICLOS DE COMUNICAÇÃO CIENTÍFICA SISTEMAS DE INFORM AÇÃO PARA A PESQUISA INFRAE STRUT URA D E PESQ UISA P ARA O PAÍS VIRTUAL SIMULATION OF A NUCLEAR POWER PLANT'S CONTROL ROOM AS A TOOL FOR ERGONOMIC EVALUATION. EXEMPLO DE RESULTAD O DE PESQUISA NA ÁREA NUCLEAR (CNEN/IEN) Leandro Barbosa S. Gatto a, Antônio Carlos A. Mól a,b,c, Isaac J.A. Luquetti dos Santos a, Carlos Alexandre F. Jorge a,*, Ana Paula Legey c INSTITUTO DE ENGENHARIA NUCLEAR - CNEN/IEN DADOS DE PESQUISA SÃO MUITO SUSCETÍVEIS A PERDAS BIBLIOTECA CONVENCIONAL BIBLIOTECA DE TESES E DISSERTAÇÕES REPOSITÓRIOS PUBLICAÇÃO PESQUISA TESE DADOS DIGITAIS ? VISÍVEL INVISÍVEL O TEXTO ACADÊMICO APRESENTA APENAS OS DADOS DE PESQUISA DE FORMA CONDENSADA MINHA TESE UMA VISÃO DOS DADOS [revisão por pares] [validação da pesquisa] !!! REUSO SQUISA E P E D S O D A D DOS Padronizados Reformatados Preservados Valor adicionado Arquivados Intercambiáveis Acessíveis ANALISADOS EM NOVOS E DIFERENTES CONTEXTOS Os pesquisadores começaram a creditar toda a confiança nos conteúdos digitais criados por outros pesquisadores para dar prosseguimento aos seus empreendimentos A ciência como um todo avança com maior qualidade, menor custo e mais eficiência quando abre a possibilidade para que o maior número possível de pesquisadores disponha de vias de acesso aos dados acumulados por seus antecessores e contemporâneos. Isso evita, objetivamente, o custo da duplicação de esforços e permite novas interpretações em diferentes contextos científicos para esses dados e, além do mais, permite que eles sejam integrados e retrabalhados de forma mais criativa, descortinando horizontes para novas pesquisas. REUSO DE DADOS DE PESQUISA Os dados que coletamos hoje podem ser usados no futuro de forma que ainda não conseguimos imaginar. Os exploradores de antigamente que coletavam espécimes de plantas e animais não sabiam nada sobre DNA e hoje as amostras são submetidas a esse tipo de investigação. Quando você coleta os seus dados, reúne informações que, no futuro, poderão ser analisadas de formas muito diferentes. São coisas que terão um valor enorme para cientistas que nem nasceram (POLIAKOFF, 2013). INCENTIVA A PESQUISA CIENTÍFICA E O DEBATE RSOS SQUISAS SÃO RECU PE E D IR RT A P A S O DADOS CRIAD DEM SER USADOS E PO E U Q R PO Q S E S SO VALIO ÓSITOS CIENTÍFICO P O PR S RO TU FU A REUTILIZADOS PAR MENTO DE DADOS A H IL T R A P M O C O . EDUCACIONAIS NTÍFICAS, EVITA A IE C ES ÇÕ A IG ST VE FACILITA NOVAS IN O DE DADOS E ÇÃ A ER G A N S ÇO R FO IDA DUPLICAÇÃO DE ES , PROVENIENTE DA V O IC R O RS U EC R M OFERECE U . ÇÃO E TREINAMENTO CA U D E A A R A P L, A RE PROMOVE A INOVAÇÃO E POTENCIALIZA NOVOS USOS PARA OS DADOS LEVA A NOVAS FORMAS DE COLABORAÇÃO ENTRE USUÁRIOS DE DADOS E CRIADORES DE DADOS MAXIMIZA A TRANSPARÊNCIA E PRESTAÇÃO DE CONTAS PERMITE O CONTROLE DOS RESULTADOS DA PESQUISA CIENTÍFICA MELHORIA E VALIDAÇÃO DA PESQUISA E A REVISÃO POR PARES REDUZ O CUSTO DE DUPLICAÇÃO DE GERAÇÃO DE COLEÇÕES DE DADOS AUMENTA A VISIBILIDADE E O IMPACTO DA PESQUISA PROMOVE A PESQUISA QUE CRIOU OS DADOS E OS SEUS RESULTADOS CREDITA AO PESQUISADOR AUTORIA PELOS DADOS ENQUANTO PRODUTO DA SUA PESQUISA OFERECE RECURSOS IMPORTANTES PARA A EDUCAÇÃO E TREINAMENTO AGÊNCIAS FINANCIADORAS DE PESQUISA PLANOS DE COMPARTILHAMENTO DE DADOS POLÍTICAS MANDATÓRIAS Isso garante que os pesquisadores se comprometem a cuidar dos dados durante e após a pesquisa no sentido de otimizar o compartilhamento de dados. DADOS PERIÓDICO CIENTÍFICO Os periódicos exigem cada vez mais que os dados que sustentam a pesquisa publicada depositado dentro em uma base de dados ou repositório de acessível . ÓRGÃOS DE PESQUISA (CONSELHOS, GESTORES DE C&T, ETC) Financiam infraestruturas para gestão e serviços de dados para facilitar o compartilhamento dentro de domínios específicos. REPOSITÓRIOS DE DADOS PESQUISADORES Iniciativas como o DataCite ‐ que atribui identificador persistente (DOI) aos dados de pesquisa ‐ ajudam o cientista a tornar seus dados citáveis, rastreáveis e acessíveis de modo que os dados de pesquisa, bem como as publicações baseadas nesses dados, façamparte da produção científica desse pesquisador. ility.html b a il a v a / s ie c hors/poli t u a / m o .c e r .natu http://www nd build to replicate a le b a e b ld u o thers sh blication u p ation is that o f lic b o u n p f io o it le d p n ci rin , a co An inherent p Therefore s. im la c d e sh li to make d e ' pub ir rs u o q th e u a r e e h r t n a upo at authors ilable to ptly ava urnal is th m o o j r p re ls tu o a c N to o a in bility associated pr d n ns on the availa io a ct ta ri a st e d r , y n ls A tions. materia a c f submission. fi o li e a u im t q e e th u t d a ut un editors readers witho tion must be disclosed to the d manuscript, including details tributed ubmitte r informa s are to be dis closed in the s of materials o al is ri d e e at b o m f ls . I a n st ns mu formatio Any restrictio aterials and in m in ta b o an c d in the paper. te ta s e b st of how readers u m company, this by a for‐profit ? AFINAL, O QUE É DADOS DE PESQUISA FATOS, NÚMEROS, CARACTERES, SÍMBOLOS QUE DESCREVEM UM OBJETO, UMA CONDIÇÃO, UMA SITUAÇÃO OU OUTRO FATOR (NSF, 1999) ENTREVISTAS REGISTRO DE FATOS USADOS COMO FONTES PRIMÁRIAS NA INVESTIGAÇÃO CIENTÍFICA E QUE GERALMENTE SÃO ACEITOS NA COMUNIDADE CIENTÍFICA COMO NECESSÁRIOS PARA A VALIDAÇÃO ANOTAÇÕES s rvações diretas, tai se b o e d os id bt o CIONAIS são ífica, a atitude dos eleitores ou A V R E S B O S O D A D pec e lcão numa data es u v um e istros históricos qu d eg o r çã m p fi u n e em u como er it st on supernova – que c rtanto, devem ser o p e, fotografia de uma z ve a nd gu coletados uma se não podem ser empre arquivados para s DADOS EXPERIMENTAIS são provenientes de situações controladas em bancadas de laboratórios. Em tese, dados experimentais provenientes de experimentos que podem ser precisamente reproduzidos e não precisam ser armazenados indefinidamente; entretanto, nem sempre é possível reproduzir precisamente todas as condições experimentais. de modelos sultados da execução re – IS A N IO C TA U DADOS COMP idos a uma ões; devem ser submet simulaç computacionais ou de ento de um grande m va ui rq a o õe up ss re p o de abordagem distinta que or um conjunto robust p os ss re xp e s, õe aç rm número de info ftware e dados de so e, ar dw ar h de o içã m descr metadados, que inclue entrada PACOTE DE INFORMAÇÃO DE DADOS DE PESQUISA DADOS BRUTOS ou DADOS PRIMÁRIOS Dados provenientes diretamente do instrumento científico OBJETOS SUPLEMENTARES Instrução de codificação Guia de entrevistas Fluxograma de coleta de dados Questionário Informações sobre os métodos usados e técnicas de pesquisa usadas Dicionário de dados Caderno de pesquisa .PROCESSAMENTO . CALIBRAÇÃO .VALIDAÇÃO .COMBINAÇÃO COM OUTROS DADOS REALIDADE VIRTUAL Texto e números não contam toda história OS OBJETIVOS E OS MÉTODOS USADOS PARA PRODUZI‐LOS VARIAM ENORMEMENTE DE ACORDO COM OS CAMPOS CIENTÍFICOS, ASSIM COMO OS CRITÉRIOS PARA COMPARTILHÁ‐LOS, SIMULAÇÕES MODELOS EM 3D NÍVEIS DE ABSTRAÇÃO DADOS DE PESQUISA SÃO OBJETOS COMPLEXOS, DIVERSIFICADOS E HETEROGÊNEOS. GAMES dispositivos de imersão e interativas apresentações sensoriais ESTRUTURAS QUÍMICAS SOFTWARE imagem em movimento WEBSITE/MULTIMÍDIA VIDEOS imagens FOTOS GRÁFICOS sons ESPECIFICAÇÕES ENTREVISTAS documentos FORMÚLAS TABELAS letras ANOTAÇÕES símbolos DADOS NUMÉRICOS números DADOS DE PESQUISA A heterogeneidade intrínseca aos dados de pesquisa implica que é necessário formular políticas de amplo espectro, que não só identifiquem, mas efetivamente sustentem os vários tipos de dados e a sua natureza díspar. O reconhecimento dessa idiossincrasia torna-se crucial quando se estabelecem as opções tecnológicas e gerenciais para a gestão desses dados. 001100011100011010100010110001011101001011001010011111010100100010100001110001001010001000101 Tabela periódica 001100011100011010100010110001011101001011001010011111010100100010100001110001001010001000101 Tabela periódica TRANSMITIR CONHECIMENTO (DADOS INTELIGENTEMENTE ABERTOS) TRANSMITIR CONHECIMENTO ACESSÍVEL Localizado e acessado 2 3 INTELIGÍVEL Deve se apresentar de forma inteligível para aqueles que desejam entendê‐lo ou analisá‐lo. Deve ser diferente para diferentes audiências, mesmo para o cidadão comum. AVALIÁVEL Natureza, evidências, confiabilidade, fonte competente, financiador, objetivos UTILIZÁVEL Deve ser capaz de ser reusado em diferentes contextos e, minimamente, por outros cientistas. METADADOS QUE DOCUMENTAM OS ELEMENTOS SEMÂNTICOS, AS PARTES DOS OBJETOS E SUAS RELAÇÕES, AS DEPENDÊNCIAS TÉCNICAS, A PROVENIÊNCIA, A IDENTIFICAÇÃO PERSISTENTE, AS RESTRIÇÕES E DIREITOS ASSOCIADOS AOS DADOS, AS POSSÍVEIS INTERVENÇÕES SOFRIDAS E SEUS EFEITOS. OU SEJA, OS METADADOS DEVEM REGISTRAR IDEALMENTE TUDO QUE DEVE SER DE INTERESSE DO PESQUISADOR, INCLUINDO MODELOS DE DADOS, EQUIPAMENTOS ESPECIAIS, ESPECIFICAÇÃO DA INSTRUMENTAÇÃO, LINHAGEM DOS DADOS E MUITO MAIS. E Q U I PA MENTO S ES P EC I AI S LINHAGEM ÕES) Ç A A L R S RE UTU ESTR ES E SUA T (PAR INTERVENÇÕES GE CALIBRA IDENTIFI CA PERSISTE ÇÃO NTE M PRECISÃO DE SCR LOCALIZAÇÃO GEOGRÁFICA IÇÃ O DEPENDÊNCIAS TÉCNICAS MODELO DE DADOS VERSÃO PROVENIÊNCIA AUTORIA DATA DIREITOS ASSOCIADOS Os metadados têm um forte impacto na capacidade dos dados de pesquisa de transmitir conhecimentos e poder ser interpretados e reusados agora e no futuro /H O R A O AÇÃ T N E RUM T S IN DESCRITIVOS: DC, MARC21, MARCXML, MODS, ONIX, DDI, EAD, TEI... ADMINISTRATIVOS PREMIS (preservação) direitos, acesso, informação de representação, técnicos ESTRUTURAIS: OAI‐ORE, MPEG 21, METS, RDF ESPECÍFICOS 1 2 3 INTERESSE COMERCIAL VALORIZAÇÃO COMERCIAL DOS DADOS PROTEGER A INOVAÇÃO PATENTES PERÍODO DE EMBARGO PRIVACIDADE INFORMAÇÕES PESSOAIS: CRÍTICO PARA A PESQUISA NAS ÁREAS DE SAÚDE E CIÊNCIAS SOCIAIS; GOVERNANÇA X PROTEÇÃO DA CONFIDENCIALIDADE ANONIMIZAÇÃO NÃO GARANTE AMEAÇA A SEGURANÇA SEGURANÇA E SAUDE PÚBLICA PROTEÇÃO CONTRA INCIDENTES NÃO INTENCIONAIS PROTEÇÃO CONTRA ATAQUES DELIBERADOS “SÓ METADE DOS DADOS QUE DEVEM SER PROTEGIDOS ESTÁ PROTEGIDO” (IDC, 2011) [ A mesma tecnologia que muda a pesquisa científica coloca os dados gerados em risco e nos impõe o desafio estratégico, gerencial e político de criar, arquivar, preservar e tornar disponível esses dados TRADICIONALMENTE CURADORIA NÃO ESTÁ PREOCUPADA APENAS COM A PRESERVAÇÃO POR LONGO PRAZO DE LIVROS RAROS, PINTURAS E OUTROS ARTEFATOS. SEU FOCO PRINCIPAL É MANTER A INTEGRIDADE E POSSIBILITAR E PROMOVER SUA DISPONIBILIDADE PARA AUDIÊNCIAS APROPRIADAS. ISTO TAMBÉM É VERDADEIRO PARA DADOS DE PESQUISA. PARA QUE ELES PERMANEÇAM ÚTEIS PODE SER NECESSÁRIO MANUTENÇÃO E MELHORIAS. ISTO SOMADO A PROMOÇÃO DOS DADOS PARA OS CONSUMIDORES POTENCIAIS SÃO OS DOIS PAPÉIS PRINCIPAIS DA CURADORIA DE DADOS. CURADORIA DIGITAL DE DADOS DE PESQUISA Manutenção, preservação e agregação de valor a dados de pesquisa durante o seu ciclo de vida. (DCC, 2003) Todas as atividades envolvidas na gestão de dados, desde o planejamento de sua criação – quando os sistemas são projetados- passando pelas boas práticas de digitalização, na seleção dos formatos e da documentação, e na garantia de estarem sempre adequados para serem descobertos e reusados agora e no f t A ATIVIDADE DE GESTÃO E DE PROMOÇÃO DE USO DO DADO DE PESQUISA DESDE A CRIAÇÃO/SELEÇÃO, ASSEGURANDO A SUA ADEQUAÇÃO PARA PROPÓSITOS ATUAIS E FUTUROS E TORNANDO‐O DISPONÍVEL PARA GESTÃO DINÂMICA DESCOBERTA E REUSO; AVALIAÇÃO MANUTENÇÃO E ENRIQUECIMENTO INTERAÇÃO ENTRE CRIADOR E USUÁRIO REFORMATAÇÃO LINKS COM OUTROS RECURSOS ANOTAÇÃO ATIVIDADE DE CURADORIA QUE ASSEGURA QUE O DADO ESTÁ SELECIONADO, ARMAZENADO E PODE SER ACESSADO E QUE A SUA INTEGRIDADE FÍSICA E LÓGICA ESTÁ MANTIDA ATIVIDADE INCLUÍDA NA CURADORIA ATRAVÉS DA QUAL ITENS ESPECÍFICOS DE DADOS SÃO MANTIDOS AO LONGO DO TEMPO DE FORMA QUE ELES POSSAM SER ACESSADOS E COMPREENDIDOS NO FUTURO A DESPEITO DAS MUDANÇAS TECNOLÓGICAS. REUSO DE DADOS PARA NOVAS PESQUISAS, INCLUINDO PESQUISAS BASEADAS EM COLEÇÕES DE DADOS RETENÇÃO DOS DADOS OBSERVACIONAIS QUE SÃO ÚNICOS E IMPOSSÍVEIS DE SE RECRIAR RETENÇÃO DOS DADOS GERADOS A CUSTO MUITO ALTO E QUE SÃO MAIS BARATOS MANTER DO QUE REGERAR. ADICIONAR VALOR AOS DADOS DISPONÍVEIS PARA PROJETOS VALIDAR RESULTADOS DE PESQUISAS PUBLICADAS TORNAR A AVALIÇÃO POR PARES MAIS CONFIÁVEL USO NO ENSINO PARA EXIGÊNCIAS LEGAIS PUBLICAÇÕES PERIÓDICOS BIBLIOTECAS REPOSITÓRIOS INSTITUCIONAIS REPOSITRIOS TEMÁTICOS DEPOSITANDO‐OS NUM REPOSITÓRIO DE DADOS DE CENTROS DE DADOS ESPECIALIZADOS DADOS SUBMETÊ‐LOS A UM PERIÓDICO PARA APOIAR UMA PUBLICAÇÃO DEPOSITANDO‐OS EM UM REPOSITÓRIO INSTITUCIONAL TORNANDO‐OS DISPONÍVEIS ON‐LINE ATRAVÉS DE UM PROJETO OU SITE INSTITUCIONAL TORNANDO‐OS DISPONÍVEIS INFORMALMENTE ENTRE PESQUISADORES DE PESSOA PARA PESSO REPOSITÓRIOS DE DADOS DE PESQUISA BANCOS DE DADOS CIENTÍFICOS DIGITAIS QUE GARANTEM O ACESSO A RESULTADOS DE PESQUISA AGORA E NO FUTURO, TENDO COMO PERSPECTIVA PRIMORDIAL O ACESSO ABERTO AO QUE É CONSIDERADO TAMBÉM UM PATRIMÔNIO DIGITAL DA HUMANIDADE (SURF FOUNDATION, 2013) Databib PIRÂMIDE DE REPOSITÓRIOS DE DADOS HIERAQUIA DE VALOR & PERMANÊNCIA INFRAESTRUTURA PADRÕES, SUSTENTABILIDADE PROVENIÊNCIA REAPONSABILIDADE DEMANDA POR ACESSO VALOR SOCIAL CONFIABILIDADE ESTABILIDADE WORDWILDE PROTEIN DATABANK LARGE HADRON COLLIDER EUROPEN BIOINFORMATICS INSTITUTE RECURSOS INTERNACIONAIS RELEVANTES NATIONAL BIODIVERSITY NETWORK REFERÊNCIAS NACIOANAIS E INTERNACIONAIS IMPORTANTES COLEÇÕES DE DADOS INSUBISTITUÍVEIS CENTROS DE DADOS NACIONAIS CARPE DIEN REPOSITÓRIOS INSTITUCIONAIS COLEÇÕES DE COMUNIDADES ESPECÍFICAS RISCO DE PERDA USABILIDADE COMPARTILHAMENTO REUSO COLEÇÕES INDIVIDUAIS COLEÇÕES DE UM GRUPO DE PESQUISADORES Baseado em THE ROYAL SOCIETY (June 2012) GARANTIA DE QUE OS DADOS ESTÃO DE ACORDO COM PADRÕES DE QUALIDADE PRESERVAÇÃO DE LONGO PRAZO ARMAZENAMENTO SEGURO COM CAPACIDADE DE CONTROLAR O DADOS ACESSO, SEMPRE QUE NECESSÁRIO BACK‐UPS DE DADOS REGULARES DESCOBERTA DE RECURSOS ON‐LINE ATRAVÉS DE CATÁLOGOS DADOS ACESSO AOS DADOS EM FORMATOS POPULARES ACORDOS DE LICENCIAMENTO PARA RECONHECER OS DIREITOS ASSOCIADOS AOS DADOS MECANISMO DE CITAÇÃO PADRONIZADA REPOSITÓRIOS DE DADOS VISIBILIDADE DOS DADOS PARA MUITOS USUÁRIOS • MONITORAMENTO DO USO SECUNDÁRIOS DOS DADOS [ OS CENTROS DE DADOS, COMO QUALQUER ARQUIVO TRADICIONAL, GERALMENTE SE APLICAM ALGUNS CRITÉRIOS PARA AVALIAR E SELECIONAR DADOS PARA PRESERVAÇÃO. S E R O D A S I U Q S E EMBORA OS P S O M O C , E S E T M E , CONCORDEM O D S I A I C N E T O P S O I BENEFÍC S O D A D E D O T N E M A COMPARTILH A , O C I F Í T N E I C O S PARA O PROGRES S A V R E S E R M E T A MAIORIA AIND O A T N E M E L P M I E QUANDO S A C I T Á R P A N O T N E COMPARTILHAM A WEB não tem MEMÓRIA PERSISTENTE, portanto é preciso CONSTRUI-LA INTENCIONALMENTE E ACREDITE NOS REPOSITÓRIOS DIGITAIS CONFIÁVEIS DOCUMENTOS ESSENCIAIS REFERENCE MODEL FOR AN OPEN ARCHIVAL INFORMATION SYSTEM CCSDS – ISO - 2001 TRUSTED DIGITAL REPOSITORIES: ATTRIBUTES AND RESPONSABILITIES RLG-OCLC - 2002 TRUSTWORTHY REPOSITORIES AUDIT & CERTIFICATION: CRITERIA AND CHECKLIST RLG/NARA - 2007 AUDIT & CERTIFICATION OF TRUSTWORTHY DIGITAL REPOSITORIES – MAGENTA BOOK CCSDS – ISO – SEP. 2011 REQUIREMENTS FOR BODIES PROVIDING AUDIT AND CERTIFICATION OF CANDIDATE TRUSTWORTHY DIGITAL REPOSITORIES – MAGENTA BOOK CCSDS – ISO - NOV. 2011 NOVOS CONCEITOS DE PUBLICAÇÃO CIENTÍFICA PUBLICAÇÕES AMPLIADAS Interoperabilidade de publicações e dados PUBLICAÇÕES AMPLIADAS relações semânticas entre publicações e dados VALORES SEMÂNTICOS PARA AS RELAÇÕES ONTOLOGIAS VOCABULÁRIOS CIENTÍFICOS PUBLICAÇÕES AMPLIADAS: ESTRUTURA As publicações ampliadas constituem-se de: E‐prints Dados Metadados Conjuntos de dados Outras publicações NEW CELL USER INTERFACE The new Cell user interface. Outstanding features are the explicit layering and internal integration of the information displayed. In addition to the textual summary a graphical abstract is included, together with a video on which the authors introduce their findings. The tabs on top correspond with the regular division of a scientific article, while sections like 'Results' and 'Data' provide ample room for charts. Figures in the 'Data' section are linked to the body of text so that each chart can be viewed in sync with its own context. The 'Comments' tab opens a blog‐like web page for reactions ABSTRACT GRÁFICO VIDEO EM QUE OS AUTORES INTRODUZEM SEUS ACHADOS RESULTADOS DADOS – FIGURAS COM LINKS PARA O TEXTO COMENTÁRIOS ‐ BLOG http://www.cell.com/abstract/S0092‐8674%2809%2901439‐ 1 NEW CELL USER INTERFACE The new Cell user interface. Outstanding features are the explicit layering and internal integration of the information displayed. In addition to the textual summary a graphical abstract is included, together with a video on which the authors introduce their findings. The tabs on top correspond with the regular division of a scientific article, while sections like 'Results' and 'Data' provide ample room for charts. Figures in the 'Data' section are linked to the body of text so that each chart can be viewed in sync with its own context. The 'Comments' tab opens a blog‐like web page for reactions ABSTRACT GRÁFICO VIDEO EM QUE OS AUTORES INTRODUZEM SEUS ACHADOS RESULTADOS DADOS – FIGURAS COM LINKS PARA O TEXTO COMENTÁRIOS ‐ BLOG http://www.cell.com/abstract/S0092‐8674%2809%2901439‐ 1 NEW CELL USER INTERFACE The new Cell user interface. Outstanding features are the explicit layering and internal integration of the information displayed. In addition to the textual summary a graphical abstract is included, together with a video on which the authors introduce their findings. The tabs on top correspond with the regular division of a scientific article, while sections like 'Results' and 'Data' provide ample room for charts. Figures in the 'Data' section are linked to the body of text so that each chart can be viewed in sync with its own context. The 'Comments' tab opens a blog‐like web page for reactions ABSTRACT GRÁFICO VIDEO EM QUE OS AUTORES INTRODUZEM SEUS ACHADOS RESULTADOS DADOS – FIGURAS COM LINKS PARA O TEXTO COMENTÁRIOS ‐ BLOG http://www.cell.com/abstract/S0092‐8674%2809%2901439‐ 1 PUBLICAÇÕES AMPLIADAS E WEB SEMÂNTICA Publicações ampliadas consistem de dados e informações heterogêneas A Web semântica é focada nas relações entre dados distribuídos A integração de dados heterogêneos requer o uso de padrões. Os padrões do W3C devem ser considerados na construção da publicação ampliada. URI, XML, XML Schema, RDF, OWL, são exemplos de recomendações do W3C que devem ser aplicadas à publicação ampliada. PUBLICAÇÃO AMPLIADA FAZ UMA PONTE QUE ATRAVESSA O TEMPO E O ESPAÇO ENTRE OS SISTEMAS ORIENTADOS POR DOCUMENTOS, COMO OS BIBLIOGRÁFICOS, E OS SISTEMAS ORIENTADOS POR DADOS, COMO OS EXIGIDOS PELA CIÊNCIA CONTEMPORÂNEA. ÕES Ç A C I L PUB S DADO Org. Pesquisa D diretor Pessoa Agência de B Fomento coordenador Projeto C autor Artigo I gera tem autoria de faz inferência sobre financiado por Artigo A é base para Patente J discute é comentado por é parte de Org. Fomento E Conjunto de Dados F Publicação G Blog H E‐PRINT descreve PESSOA DADO PROJETO ORGANIZAÇÃO Org. Pesquisa D diretor Pessoa Agência de B Fomento coordenador Projeto C autor Artigo I gera tem autoria de faz inferência sobre financiado por Artigo A é base para Patente J discute é comentado por é parte de Org. Fomento E Conjunto de Dados F Publicação G Blog H E‐PRINT descreve PESSOA DADO PROJETO ORGANIZAÇÃO CRIS CURRENT RESEARCH INFORMATION SYSTEM A CRESCENTE COMPLEXIDADE DAS ATIVIDADES DE PESQUISA, A IMENSA GERAÇÃO DE DADOS E INFORMAÇÕES E A NECESSIDADE DE GERENCIAR PROCESSOS PROPICIOU O SURGIMENTO DE INFRAESTRUTURAS TECNOLÓGICAS COM VISTAS AO TRATAMENTO E À RECUPERAÇÃO DESSAS INFORMAÇÕES Common European Research Information Format SIGNIFICA ATUALIZAÇÃO DINAMISMO RELACIONAM ENTOS E M TRANSFORMA ÇÃO INFORMAÇÕES SOBRE PESSOAS ORGANIZAÇÕES PROJETOS FINANCIAMENTO RESULTADOS DE PESQUISA EQUIPAMENTOS ... IMPULSIONADO POR UM CONCEITO UM MODELO ... INCORPORADO COMO UMA IMPLEMENTAÇÃO (ICT) ICA SEMÂNT A D A M A C METADADOS ENTIDADES H ETEROGÊNEA S INTEGRAÇÃO VISÃO INTEGRADA NA GESTÃO DE INFORMAÇÃO PARA A PESQUISA MODELO CERIF Common European Research Information Format Programa de Financiamento Pessoa Person Projeto Project Organização Organisation Serviço Expertise Publicação Equipamento CV Patente Produto Evento Classificação Classification Semantics ) ( Semântica s do a d Fi n AÇ ÃO NA LI Z ÕE IN S TI TU S CI O DR PA an Polít Ca ciam icas pa en to c Pe itaçã o s Bo Copy quisa as prá right Pa tica rce s ria s te n s e o d ist ia s o de t r r s a a e o o p s d d rm ilid Fo tada ação /cura omia erab c Me ntifi ação axon erop Ide serv ias/t e int Pre tolog los d On toco ça Pro uran g Se TECNOLOGIAS Redes de computadores Banco de dados Ferramentas de software Sistemas Repositórios CIBERINFRAESTRUTURA PARA DADOS DE PESQUISA CONSISTE DE SISTEMAS DE COMPUTAÇÃO, SISTEMAS DE ARMAZENAMENTO, INSTRUMENTOS AVANÇADOS E REPOSITÓRIOS DE DADOS, AMBIENTES DE VISUALIZAÇÃO E PESSOAS, TUDO LINKADO POR REDES DE ALTO DESEMPENHO QUE TORNA POSSÍVEL INOVAÇÃO CIENTÍFICA E DESCOBERTAS QUE DE OUTRA MANEIRA NÃO SERIA POSSÍVEL SERVIÇOS FONTES DE DADOS VISUALIZAÇÃO ANÁLISE MODELAGEM MINERAÇÃO PORTAIS/PUBLICAÇÃO CURADORIA/PRESERVAÇÃ O SELEÇÃO/RECUPERAÇÃO FERRAMENTAS ESPECÍFICAS PESSOAS INSTRUMENTOS SENSORES LABORATÓRIOS APLICAÇÕES GESTÃO DE DADOS COMPUTADORES OUTRAS FONTES CURADORIA PRESERVAÇÃO ARMAZENAMENTO ACESSO FACILIDADES P / O USO DIREITOS REUSO INOVAÇÃO INDICADORES DIVULGAÇÃO CIENTÍFICA QUALIDADE DA PESQUISA VALIDAÇÃO DE RESULTADOS REPRODUTIBILIDADE A BIBLIOTECA DE PESQUISA PRECISA CONSIDERAR O SEU PAPEL EM FACE AOS NOVOS AMBIENTES DE PESQUISA ESTABELECIDOS PELA eSCIENCE PELA CIÊNCIA ABERTA Crise da bibliotecas científicas Desintermediação Dados são diferentes de livros e periódicos É necessário um modelo gerencial e institucional voltados para gestão de dados. A BIBLIOTECA DEVE IR ALÉM DA HOSPEDAGEM DOS DADOS. Necessita de pesquisa e desenvolvimento BIBLIOTECONOMIA VOLTADA PARA PESQUISA BIBLIOTECONOMIA TI PARA DE BIBLIOTECONOMIA DADOS SERVIÇO DE CIÊNCIA BASEADA EM DADOS Baseado em QUIN (Oct. 2013) DE DADOS INFRAESTRUTURA DE DADOS GESTÃO DA TECNOLOGIA DA INFORMAÇÃO BIBLIOTECA COMO PROVEDORA DE SERVIÇOS DE DADOS Planejamento e gestão do repositório de dados Curadoria/preservação/arquivamento/disseminação Apoio a recuperação e ao depósito de dados. Guia de preservação e compartilhamento de dados BIBLIOTECA COMO PARCEIRA Desenvolvimento de aplicações, ontologias, taxonomias Cursos de gestão de dados Pesquisa na área de gestão de dados Publicação em parceria com pesquisadores da área Projetos de pesquisa TECNOLOGIA NÃO RESOLVE TUDO ! Apesar da tecnologia ser determinante para a pesquisa contemporânea, o progresso científico não depende unicamente da tecnologia. Políticas voltadas para a pesquisa, fóruns apropriados, legislação específica, fundos para financiamento, valores culturais, ou seja, um espectro multidimensional de fatores afeta profundamente a natureza das novas descobertas, a velocidade com que elas são desenvolvidas e a sua capacidade de se tornarem acessíveis e utilizadas efetivamente (OCDE, 2007) ASPECTO SOCIAL, ÉTICO E LEGAL FINANCIA PROTEÇÃO Á PROPRIEDADE INTELECTUAL CONFIDENCIALIDADE E PRIVACIDADE MECANISMOS DE RECOMPENSA CITAÇÃO DE DADOS SUSTENTABILIDADE ECONÔMICA FLUXO CONTINUO DE RECURSOS PARCERIA E COLABORAÇÃO MODELOS DE CUSTOS DEFINE POLÍTICAS ESTABELECE LINHAS DE FINANCIAMENTO PESQUISA POLÍTICA DE FOMENTO POLÍTICA GOVERNANÇA LIVRE ACESSO TRANSPARÊNCIA FÓRUNS DE DISCUSSÃO DIRETRIZES E RECOMENDAÇÕES LINHAS DE FINANCIAMENTO POLÍTICAS MANDATÓRIAS FINANCIA FINANCIA DEFINE CONFIGURAÇÃO CONSIDERA AGENDA DE PESQUISA INTEGRAÇÃO DAS EXPERIÊNCIAS MATERIAIS DE REFERÊNCIA INSERÇÃO NA PÓS‐GRADUAÇÃO CRIA CONHECIMENTO PARA DEFINE POLÍTICAS RECURSOS HUMANOS FORMAÇÃO DE PROFISSIONAIS DE TI e CI ESPECIALISTAS EM ASSUNTO CIENTISTAS DE DADOS CURSOS DEFINE POLÍTICAS DESENVOLVIMENTO DE COLEÇÕES DE DADOS DEFINIÇÃO DE PRIORIDADES/SELEÇÃO POTENCIAL DE REUSO METADADOS QUE GARANTAM A INTERPRETAÇÃO CRIA CONHECIMENTO PARA EXECUTA/GERENCIA OPERA APOIA A O DESENVOLVIMENTO APLICA SERVIÇOS SERVIÇOS INOVADORES APLICAÇÕES COMPUTACIONAIS REUSO EM OUTROS CONTEXTOS INTEROPERABILIDAE DISPONIBILIZA APLICA COORDENA CONFIGURAÇÃO ORGANIZACIONAL DISTRIBUIÇÃO DOS REPOSITÓRIOS APOIO À PESQUISA INTERDISCIPLINAR AÇÕES COLABORATIVAS POOL DE ESPECIALISTAS CONSIDERA TECNOLOGIAS & PADRÕES DEFINIÇÃO DO ELENCO DE PADRÕES PARA: TRATAMENTO, ACESSO, ARMAZENAMENTO, INTEROPERABILIDADE E PRESERVAÇÃO DESENCOLVIMENTO DE CIBERINFRAESTRUTURA DE PESQUISA BIBLIOGRAFIA SALES, Luana Farias. Integração semântica de publicações científicas e dados de pesquisa: proposta de modelo de publicação ampliada para a área nuclear. IBICT/UFRJ, 2014 SAYAO, Luis Fernando ; SALES, Luana Farias . Dados abertos de pesquisa: ampliando o conceito de acesso livre. RECIIS. Revista Eletrônica de Comunicação, Informação & Inovação em Saúde (Edição em Português. Online), v. 8, p. 76‐92, 2014. SAYAO, L. F. ; SALES, Luana Farias . Dados de pesquisa: contribuição para o estabelecimento de um modelo de curadoria digital para o país. Tendências da Pesquisa Brasileira em Ciência da Informação, v. 6, p. 7, 2013. SALES, Luana Farias ; SAYAO, L. F. ; SOUZA, R. F. . Publicações ampliadas: um novo modelo de publicação acadêmica para o ambiente de e‐science. In: XIV ENANCIB ‐ Encontro Nacional de Pesquisa em Ciência da Informação, 2013, Florianópolis ‐ SC. SALES, Luana Farias ; SAYAO, L. F. . O impacto da curadoria digital dos dados de pesquisa na Comunicação Científica. Encontros Bibli, v. 17, p. 118‐135, 2012. SAYAO, L. F. ; SALES, Luana Farias . Curadoria digital: um novo patamar para a preservação de dados digitais de pesquisa. Informação & Sociedade, v. 22, p. 1, 2012