Coleções Biológicas e Sistemas de Informação CGEE, MCT – Julho de 2005 Coleções Biológicas - missão Documentar, compreender e educar o mundo sobre a vida no nosso planeta no passado e no presente e projetar o futuro Construção do conhecimento sobre biodiversidade Coletiva, multi e inter-disciplinar Requer um ambiente de cooperação global Depende de uma base comparativa de dados e de conhecimento Dados e Computação hoje Novos instrumentos para observar a natureza Satélites, micro eletrônica, computação de alta performance etc. Habilidade de criar cenários virtuais Ferramentas para modelagem, visualização, matemática avançada Gerando uma grande quantidade de dados de qualidade Novas descobertas científicas e dados Tamanho ou quantidade Terabytes Complexidade Taxonomia, genética, ecologia, clima, sociologia, economia, ... Análise Computador Multi-disciplinar Dados Ontem: Futuro • pessoas responsáveis por seus dados • grupos / instituições responsáveis pela gestão dos dados de provedores múltiplos • dados “lidos” por indivíduos • impossível para uma pessoa “ler” os dados • dados interpretados por indivíduos • interpretação com o auxílio de software • descobertas feitas através do pensamento, através da análise de um indivíduo ou de algumas pessoas • descobertas feitas com o uso de computadores, verificadas pelas pessoas Dados precisam ser digitais e estar disponíveis on-line Sistemas em Operação: Programa Biota/Fapesp SinBiota Alimentado por pesquisadores: provedor tem controle dos dados (pode incluir, corrigir, apagar) Centralizado Ficha padrão de coleta e lista de espécies associada (padronização dos campos) Rede speciesLink Provedores: coleções biológicas com total domínio sobre os dados Sistema Distribuído Modelo de dados: DarwinCore Protocolo de comunicação: DiGIR speciesLink site http/xml lib DiGIR Portal Conectividade rápida e estável Coleção A http/xml Provider (PHP) registro Servidor Regional Provider (PHP) SQL Sistema de Gerenciamento SQL Mirror (SOAP server) Dados Dados (PostgreSQL) soap/http/xml Conectividade lenta ou instável Coleção D SQL dados Coleção B Coleção C Sistema de Gerenciamento spLinker (Java) Repositório de dados acacia Tabebuia Perfil dos Acervos: Distribuição Geográfica MZUSP (peixes) Perfil dos Acervos: Famílias ESA Cenário envolvendo o uso de padrões e protocolos pesquisa educação nomenclatura taxonomia dados descritivos tomada de decisão dados primários modelagem qualidade de dados mapas coleção biológica Conceitos Característica internacional dos dados de coleções biológicas Compartilhamento de dados exige um esforço coordenado Interoperabilidade: facilita a cooperação e o uso efetivos dos dados Impedimento digital: impacta toda a comunidade científica Considerar evolução de hardware, software, da tecnologia de comunicação e do pensamento e da organização científica O desenvolvimento e manutenção de sistemas de informação não é tarefa para amadores Conceitos Coleções biológicas: São centros de informação Precisam ter um sistema de gestão de seus dados São “nós” de uma rede interoperável de dados (via conexões dinâmicas ou através do espelhamento dos dados – mirror) Conceitos Pesquisadores ou Grupos de Pesquisa São importantes componentes de uma rede de informação, mas não são “nós” Necessitam de um sistema onde possam “depositar” os seus dados Desafios inventariar e aumentar substancialmente a base de conhecimento sobre a diversidade biológica em país de megadiversidade, carente de recursos humanos e financeiros; disseminar a cultura de compartilhamento de dados e conhecimento de acesso público e aberto; integrar pessoas, grupos de pesquisa e instituições dos setores público e privado em redes cooperativas de pesquisa e informação voltadas para a criação de uma infra-estrutura de dados sobre espécies e espécimes comum, de acesso aberto e livre; organizar e integrar dados, informação e conhecimento em bases de dados e sistemas de informação de acesso aberto e livre; Desafios usar a informação obtida no passado e no presente para prever e planejar o futuro; garantir a preservação de dados primários por tempo indeterminado, para uso presente e futuro; criar ambiente legal favorável ao processo de inovação científica e tecnológica, que facilite e estimule o acesso e uso dos componentes da diversidade em bases sustentáveis; e possibilitar a apropriação do conhecimento sobre a diversidade biológica por tomadores de decisão e responsáveis pelo desenvolvimento e harmonização de políticas públicas. Pontos Fortes Uma rede de comunicação (RNP e parceiros como a ANSP e Rede Rio) distribuída por todo o país ligando as principais instituições de pesquisa e universidades; Coleções biológicas abrangentes já estabelecidas; Recursos humanos especializados tanto em taxonomia e ecologia como também em informática; A existência de padrões e protocolos que viabilizam a implementação de sistemas distribuídos de dados; O envolvimento das sociedades científicas na discussão da implementação de um sistema aberto de disseminação de dados; A experiência bem sucedida do programa Biota/Fapesp com sistemas distribuídos de dados de acervos de coleções biológicas. Pontos Fracos Infra-estrutura em informática nas coleções (hardware, software, rede de comunicação); A precariedade de grande parte das redes de campi de universidades e centros de pesquisa, carentes de uma rede interna adequada ao uso de aplicações avançadas Ausência de equipe capacitada ou de apoio em informática na maioria das coleções; Lacunas de conhecimento taxonômico e geográficos; Ausência ou insuficiência de recursos humanos capacitados para trabalharem com determinados grupos taxonômicos; Pontos Fracos (cont.) Dificuldades na contratação de especialistas nas instituições de pesquisa do país; Impossibilidade de contratar especialistas em projetos apoiados por agências de fomento do Brasil; Ausência de uma política de disseminação de dados e informações de acesso aberto nas principais agências de C&T do país; Ausência de uma política inter-agências para a disseminação de dados e informações de acesso aberto; Ausência de políticas governamentais para a preservação e disseminação de dados que já nascem digitais; Ausência de um sistema de arquivo permanente de dados. Oportunidades A mega biodiversidade brasileira A legislação sobre o acesso público a dados e informações ambientais no Brasil; A inovação tecnológica em informática: maior capacidade de armazenamento de dados, maior velocidade na transmissão de dados, quantidade de dados em rede disponíveis, etc. O programa de pesquisa em Internet avançada, TIDIA, que prevê a criação de uma infra-estrutura de rede exclusivamente dedicada à pesquisa no Estado de São Paulo; Oportunidades (continuação) A implantação de uma nova geração do backbone nacional, RNPng, prevista para interligar dez estados (RS, SC, PR, SP, RJ, MG, DF, BA, PE, CE) em uma rede multigigabit; o sucesso da implantação de RedCLARA pelo Projeto ALICE – America Latina Interconectada com Europa - no âmbito do Programa @LIS; Os programas da Convenção sobre Diversidade Biológica como o 2010 Biodiversity Target, o GTI (Global Taxonomy Initiative), o IPI (International Pollinators Initiative) e o GSPC (Global Strategy for Plant Conservation); As iniciativas internacionais de open access e data commons; Oportunidades (continuação) O trabalho colaborativo e cooperativo desenvolvido pelo TDWG (International Working Group on Taxonomic Databases); Os trabalhos desenvolvidos pelo GBIF (Global Biodiversity Information Facility) e os resultados obtidos tanto do ponto de vista do desenvolvimento de padrões, protocolos e ferramentas como também do número de registros já disponíveis de acesso livre e aberto; O projeto financiado pelo GEF para o desenvolvimento de áreas temáticas na IABIN; A integração com outras iniciativas nas Américas (Conabio/Remib, Siamazonia, INBio, NYBG) Oportunidades (continuação) A existência da Rede Temática de Pesquisa em Modelagem da Amazônia (GEOMA) O Plano Estratégico do MCT (2004-2007) que inclui ações como apoio a redes de inventários, a difusão de conhecimentos científicos e a a implementação de sistema integrado de gestão da informação para cooperação internacional; a implantação do Instituto Nacional do Semi-Árido e a Rede Giga–Nordeste (RNP); a existência de programas e projetos importantes, geradores de dados e informações sobre espécies e espécimes como o Probio, PROANTAR, PPG7, Revizee, entre outros Ameaças A rapidez da inovação tecnológica: obsolescência dos sistemas, dificuldade na recuperação de dados Ausência de políticas permanentes de apoio à acervos científicos; Ausência de políticas coordenadas inter-agências para a estruturação e manutenção de uma infraestrutura de dados sobre espécies e espécimes; Ausência de políticas de longo prazo para a manutenção de banco de dados e sistemas de informação; Ameaças (continuação) A legislação sobre o acesso a recursos genéticos; A descontinuidade de programas; A falta de formação em microinformática nos cursos de biologia e áreas afins; A ausência de pessoal qualificado para a gestão dos acervos biológicos; A falta de uma cultura e política de compartilhamento de dados; A ausência de um “plano B”: mecanismos para a transferência de acervos, bancos de dados, sistemas de informação e data archiving Recomendações que o ponto focal do GTI no Brasil seja o Ministério da Ciência e Tecnologia que o Brasil seja um membro participante do GBIF que o MCT estabeleça uma política clara sobre o acesso aberto a dados obtidos com financiamento público. que todo projeto apoiado pelo MCT e suas agências, que gere dados sobre espécies ou espécimes, tenha na proposta um componente de estruturação e disseminação de um banco de dados ou do depósito de dados em uma fonte de acesso público. Estratégia Arquitetura Modelo de Gestão Produtos Custo Serviços Web •Mapas •Modelagem •Datacleaning •Georeferenciamento automático •Outros serviços portal servidor regional coleções biológicas data commons space dados de observação data commons space dados taxonômicos Sistema de preservação de dados para gerações futuras (long term data archive) Instituição(s) Gestora(s): Características desejáveis Ter como missão o desenvolvimento e manutenção de uma infra-estrutura de dados sobre coleções científicas de acesso livre e aberto Ser sustentável, com apoio permanente ou de longo prazo garantido; Ter flexibilidade para poder contratar e demitir mãode-obra necessária, alterar tecnologias, incluir novas prioridades, e manter um plano estratégico dinâmico; Ter alta capacidade de articulação e de estabelecimento de parcerias Ter transparência para garantir a sua credibilidade e, Contar com equipe altamente especializada. Instituição Pública ou Privada? Instituição pública relativa estabilidade financeira com a possibilidade de manutenção de longo prazo normalmente é uma administração mais “engessada”, com possíveis problemas de contratação menor facilidade para a articulação e para o estabelecimento de parcerias. Susceptível à descontinuidade de programas com as mudanças de governos dificultando a implementação de políticas de longo prazo. Instituições privadas de interesse público OS e OSCIP precisam: ter transparência, prestar contas ao Poder Executivo; e executar as atividades estatutárias. Apresentam maior facilidade para mobilizar recursos, sinergizar iniciativas promover parcerias em prol de seus objetivos e metas. Com objetivos e metas claras é também mais simples desenvolver um planejamento de longo prazo com indicadores claros e mensuráveis. Instituições privadas de interesse econômico Não foi analisada a opção de instituição privada com fins lucrativos por entendermos que não se trata de um serviço econômico competitivo e sustentável e sim de um fim público. Aspectos importantes Estabelecer um acordo de gestão ou de um termo de parceria com o Poder Público. • apoio de longo prazo à Instituição com avaliações periódicas • apoio permanente ao sistema e dados associados. • O não cumprimento das cláusulas estabelecidas implica na transferência dos sistemas e dados para uma instituição capaz de assegurar a integridade do patrimônio digital e o seu acesso público e aberto. Estabelecimento de um comitê científico para orientar os trabalhos com relação às prioridades do conteúdo, padrões de qualidade e outras questões técnicas e científicas. OSCIP Poder Público Assembléia OS Termo de Parceria Acordo de Gestão Comitê Científico Conselho Administrativo Conselho Fiscal Comitê Científico Instituição gestora do sistema (direção, equipe técnica, equipe administrativa) Parcerias: • RNP • Coleções Biológicas • Instituições de Pesquisa • Instituições de Informática Produtos Catálogo da Vida / Brasil Rede de dados de espécimes em coleções biológicas do Brasil Banco ou rede de dados de observação em campo Redes temáticas (polinizadores, espécies invasoras, espécies ameaçadas, …) Ferramentas: visualização, georeferenciamento, data cleaning, modelagem, … Centro(s) depositário(s) de dados (data archiving) de longo termo Custos primeiros 3 anos Atividade Custo (3 anos) Estudo do modelo de gestão 100.000 Estudo do sistema de data archiving 100.000 Programa de digitalização de acervos (60 coleções, apoio de 2 anos cada) 3.780.000 Infra-estrutura de comunicação e de rede 1.350.000 Programa induzido para a ampliação da rede speciesLink para incluir 20 coleções biológicas por ano 3.000.000 Projetos especiais 1.800.000 Total (3 anos) 10.130.000 Custo para 10 anos Ano (R$ 1.000) Ação 1 2 3 4 5 6 7 8 9 10 Total Estudo do modelo de gestão 100 100 Estudo do sistema de data archiving 100 100 Programa de digitalização de acervos Infra-estrutura de comunicação e de rede Programa induzido para a ampliação da rede speciesLink para incluir 20 coleções biológicas por ano 1.260 1.260 1.260 1.000 1.000 1.000 1.000 1.000 1.000 1.000 10.780 450 450 450 450 450 450 450 450 450 450 4.500 1.000 1.000 1.000 600 600 600 3.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 8.800 Instituição Gestora da Rede 4.163 4.163 4.163 4.163 4.163 4.163 4.163 29.141 Instituição responsável pelo Data Archiving 1.000 1.000 1.000 1.000 1.000 1.000 1.000 7.000 7.613 7.613 7.613 7.613 7.613 7.613 7.613 63.421 Projetos especiais Total 3.510 3.310 3.310 Obrigada Dora Ann Lange Canhos ([email protected])