Coleções Biológicas e Sistemas de
Informação
CGEE, MCT – Julho de 2005
Coleções Biológicas - missão
Documentar, compreender e educar o
mundo sobre a vida no nosso planeta no
passado e no presente e projetar o futuro
Construção do conhecimento sobre
biodiversidade
 Coletiva, multi e inter-disciplinar
 Requer um ambiente de cooperação
global
 Depende de uma base comparativa de
dados e de conhecimento
Dados e Computação hoje
Novos instrumentos para observar a natureza
 Satélites, micro eletrônica, computação de alta
performance etc.
Habilidade de criar cenários virtuais
 Ferramentas para modelagem, visualização,
matemática avançada
Gerando uma grande quantidade de dados de
qualidade
Novas descobertas científicas e dados
Tamanho ou quantidade
 Terabytes
Complexidade
 Taxonomia, genética, ecologia, clima,
sociologia, economia, ...
Análise
 Computador
 Multi-disciplinar
Dados
Ontem:
Futuro
• pessoas responsáveis por seus
dados
• grupos / instituições
responsáveis pela gestão dos
dados de provedores múltiplos
• dados “lidos” por indivíduos
• impossível para uma pessoa
“ler” os dados
• dados interpretados por
indivíduos
• interpretação com o auxílio de
software
• descobertas feitas através do
pensamento, através da análise de
um indivíduo ou de algumas
pessoas
• descobertas feitas com o uso de
computadores, verificadas pelas
pessoas
Dados precisam ser digitais e estar disponíveis on-line
Sistemas em Operação: Programa
Biota/Fapesp
SinBiota
 Alimentado por pesquisadores: provedor tem
controle dos dados (pode incluir, corrigir,
apagar)
 Centralizado
 Ficha padrão de coleta e lista de espécies
associada (padronização dos campos)
Rede speciesLink
 Provedores: coleções biológicas com total
domínio sobre os dados
 Sistema Distribuído
 Modelo de dados: DarwinCore
 Protocolo de comunicação: DiGIR
speciesLink
site
http/xml
lib
DiGIR
Portal
Conectividade rápida e estável
Coleção A
http/xml
Provider
(PHP)
registro
Servidor
Regional
Provider
(PHP)
SQL
Sistema de
Gerenciamento
SQL
Mirror
(SOAP server)
Dados
Dados
(PostgreSQL)
soap/http/xml
Conectividade lenta ou instável
Coleção D
SQL
dados
Coleção B
Coleção C
Sistema de
Gerenciamento
spLinker
(Java)
Repositório
de dados
acacia
Tabebuia
Perfil dos Acervos: Distribuição Geográfica MZUSP (peixes)
Perfil dos Acervos: Famílias ESA
Cenário envolvendo o uso de padrões e protocolos
pesquisa
educação
nomenclatura
taxonomia
dados
descritivos
tomada de
decisão
dados
primários
modelagem
qualidade de dados
mapas
coleção
biológica
Conceitos
 Característica internacional dos dados de coleções
biológicas
 Compartilhamento de dados exige um esforço
coordenado
 Interoperabilidade: facilita a cooperação e o uso
efetivos dos dados
 Impedimento digital: impacta toda a comunidade
científica
 Considerar evolução de hardware, software, da
tecnologia de comunicação e do pensamento e da
organização científica
 O desenvolvimento e manutenção de sistemas de
informação não é tarefa para amadores
Conceitos
Coleções biológicas:
 São centros de informação
 Precisam ter um sistema de gestão de seus
dados
 São “nós” de uma rede interoperável de
dados (via conexões dinâmicas ou através do
espelhamento dos dados – mirror)
Conceitos
Pesquisadores ou Grupos de Pesquisa
 São importantes componentes de uma rede
de informação, mas não são “nós”
 Necessitam de um sistema onde possam
“depositar” os seus dados
Desafios
 inventariar e aumentar substancialmente a base de
conhecimento sobre a diversidade biológica em país
de megadiversidade, carente de recursos humanos e
financeiros;
 disseminar a cultura de compartilhamento de dados e
conhecimento de acesso público e aberto;
 integrar pessoas, grupos de pesquisa e instituições
dos setores público e privado em redes cooperativas
de pesquisa e informação voltadas para a criação de
uma infra-estrutura de dados sobre espécies e
espécimes comum, de acesso aberto e livre;
 organizar e integrar dados, informação e
conhecimento em bases de dados e sistemas de
informação de acesso aberto e livre;
Desafios
 usar a informação obtida no passado e no presente
para prever e planejar o futuro;
 garantir a preservação de dados primários por tempo
indeterminado, para uso presente e futuro;
 criar ambiente legal favorável ao processo de
inovação científica e tecnológica, que facilite e
estimule o acesso e uso dos componentes da
diversidade em bases sustentáveis; e
 possibilitar a apropriação do conhecimento sobre a
diversidade biológica por tomadores de decisão e
responsáveis pelo desenvolvimento e harmonização
de políticas públicas.
Pontos Fortes
 Uma rede de comunicação (RNP e parceiros como a ANSP e
Rede Rio) distribuída por todo o país ligando as principais
instituições de pesquisa e universidades;
 Coleções biológicas abrangentes já estabelecidas;
 Recursos humanos especializados tanto em taxonomia e
ecologia como também em informática;
 A existência de padrões e protocolos que viabilizam a
implementação de sistemas distribuídos de dados;
 O envolvimento das sociedades científicas na discussão da
implementação de um sistema aberto de disseminação de
dados;
 A experiência bem sucedida do programa Biota/Fapesp com
sistemas distribuídos de dados de acervos de coleções
biológicas.
Pontos Fracos
 Infra-estrutura em informática nas coleções
(hardware, software, rede de comunicação);
 A precariedade de grande parte das redes de campi
de universidades e centros de pesquisa, carentes de
uma rede interna adequada ao uso de aplicações
avançadas
 Ausência de equipe capacitada ou de apoio em
informática na maioria das coleções;
 Lacunas de conhecimento taxonômico e geográficos;
 Ausência ou insuficiência de recursos humanos
capacitados para trabalharem com determinados
grupos taxonômicos;
Pontos Fracos (cont.)
 Dificuldades na contratação de especialistas nas
instituições de pesquisa do país;
 Impossibilidade de contratar especialistas em projetos
apoiados por agências de fomento do Brasil;
 Ausência de uma política de disseminação de dados e
informações de acesso aberto nas principais agências de
C&T do país;
 Ausência de uma política inter-agências para a
disseminação de dados e informações de acesso aberto;
 Ausência de políticas governamentais para a preservação
e disseminação de dados que já nascem digitais;
 Ausência de um sistema de arquivo permanente de
dados.
Oportunidades
 A mega biodiversidade brasileira
 A legislação sobre o acesso público a dados e
informações ambientais no Brasil;
 A inovação tecnológica em informática: maior
capacidade de armazenamento de dados, maior
velocidade na transmissão de dados, quantidade de
dados em rede disponíveis, etc.
 O programa de pesquisa em Internet avançada,
TIDIA, que prevê a criação de uma infra-estrutura de
rede exclusivamente dedicada à pesquisa no Estado
de São Paulo;
Oportunidades (continuação)
 A implantação de uma nova geração do backbone
nacional, RNPng, prevista para interligar dez estados
(RS, SC, PR, SP, RJ, MG, DF, BA, PE, CE) em uma
rede multigigabit;
 o sucesso da implantação de RedCLARA pelo
Projeto ALICE – America Latina Interconectada com
Europa - no âmbito do Programa @LIS;
 Os programas da Convenção sobre Diversidade
Biológica como o 2010 Biodiversity Target, o GTI
(Global Taxonomy Initiative), o IPI (International
Pollinators Initiative) e o GSPC (Global Strategy for
Plant Conservation);
 As iniciativas internacionais de open access e data
commons;
Oportunidades (continuação)
 O trabalho colaborativo e cooperativo desenvolvido
pelo TDWG (International Working Group on
Taxonomic Databases);
 Os trabalhos desenvolvidos pelo GBIF (Global
Biodiversity Information Facility) e os resultados
obtidos tanto do ponto de vista do desenvolvimento
de padrões, protocolos e ferramentas como também
do número de registros já disponíveis de acesso livre
e aberto;
 O projeto financiado pelo GEF para o
desenvolvimento de áreas temáticas na IABIN;
 A integração com outras iniciativas nas Américas
(Conabio/Remib, Siamazonia, INBio, NYBG)
Oportunidades (continuação)
 A existência da Rede Temática de Pesquisa em
Modelagem da Amazônia (GEOMA)
 O Plano Estratégico do MCT (2004-2007) que inclui
ações como apoio a redes de inventários, a difusão
de conhecimentos científicos e a a implementação de
sistema integrado de gestão da informação para
cooperação internacional;
 a implantação do Instituto Nacional do Semi-Árido e a
Rede Giga–Nordeste (RNP);
 a existência de programas e projetos importantes,
geradores de dados e informações sobre espécies e
espécimes como o Probio, PROANTAR, PPG7,
Revizee, entre outros
Ameaças
 A rapidez da inovação tecnológica: obsolescência
dos sistemas, dificuldade na recuperação de dados
 Ausência de políticas permanentes de apoio à
acervos científicos;
 Ausência de políticas coordenadas inter-agências
para a estruturação e manutenção de uma infraestrutura de dados sobre espécies e espécimes;
 Ausência de políticas de longo prazo para a
manutenção de banco de dados e sistemas de
informação;
Ameaças (continuação)
 A legislação sobre o acesso a recursos genéticos;
 A descontinuidade de programas;
 A falta de formação em microinformática nos cursos
de biologia e áreas afins;
 A ausência de pessoal qualificado para a gestão dos
acervos biológicos;
 A falta de uma cultura e política de compartilhamento
de dados;
 A ausência de um “plano B”: mecanismos para a
transferência de acervos, bancos de dados, sistemas
de informação e data archiving
Recomendações
 que o ponto focal do GTI no Brasil seja o Ministério
da Ciência e Tecnologia
 que o Brasil seja um membro participante do GBIF
 que o MCT estabeleça uma política clara sobre o
acesso aberto a dados obtidos com financiamento
público.
 que todo projeto apoiado pelo MCT e suas agências,
que gere dados sobre espécies ou espécimes, tenha
na proposta um componente de estruturação e
disseminação de um banco de dados ou do depósito
de dados em uma fonte de acesso público.
Estratégia




Arquitetura
Modelo de Gestão
Produtos
Custo
Serviços Web
•Mapas
•Modelagem
•Datacleaning
•Georeferenciamento
automático
•Outros serviços
portal
servidor regional
coleções biológicas
data commons
space
dados de observação
data commons
space
dados taxonômicos
Sistema de preservação de dados para gerações futuras (long term data archive)
Instituição(s) Gestora(s): Características desejáveis
 Ter como missão o desenvolvimento e manutenção
de uma infra-estrutura de dados sobre coleções
científicas de acesso livre e aberto
 Ser sustentável, com apoio permanente ou de longo
prazo garantido;
 Ter flexibilidade para poder contratar e demitir mãode-obra necessária, alterar tecnologias, incluir novas
prioridades, e manter um plano estratégico dinâmico;
 Ter alta capacidade de articulação e de
estabelecimento de parcerias
 Ter transparência para garantir a sua credibilidade e,
 Contar com equipe altamente especializada.
Instituição Pública ou Privada?
Instituição pública
 relativa estabilidade financeira com a possibilidade de
manutenção de longo prazo
 normalmente é uma administração mais “engessada”,
com possíveis problemas de contratação
 menor facilidade para a articulação e para o
estabelecimento de parcerias.
 Susceptível à descontinuidade de programas com as
mudanças de governos dificultando a implementação
de políticas de longo prazo.
Instituições privadas de interesse público
OS e OSCIP precisam:
 ter transparência,
 prestar contas ao Poder Executivo; e
 executar as atividades estatutárias.
Apresentam maior facilidade para
 mobilizar recursos,
 sinergizar iniciativas
 promover parcerias em prol de seus objetivos e
metas.
 Com objetivos e metas claras é também mais simples
desenvolver um planejamento de longo prazo com
indicadores claros e mensuráveis.
Instituições privadas de interesse econômico
Não foi analisada a opção de instituição
privada com fins lucrativos por
entendermos que não se trata de um
serviço econômico competitivo e
sustentável e sim de um fim público.
Aspectos importantes
 Estabelecer um acordo de gestão ou de um termo de
parceria com o Poder Público.
• apoio de longo prazo à Instituição com avaliações periódicas
• apoio permanente ao sistema e dados associados.
• O não cumprimento das cláusulas estabelecidas implica na
transferência dos sistemas e dados para uma instituição
capaz de assegurar a integridade do patrimônio digital e o
seu acesso público e aberto.
 Estabelecimento de um comitê científico para orientar
os trabalhos com relação às prioridades do conteúdo,
padrões de qualidade e outras questões técnicas e
científicas.
OSCIP
Poder Público
Assembléia
OS
Termo de
Parceria
Acordo de
Gestão
Comitê
Científico
Conselho
Administrativo
Conselho
Fiscal
Comitê
Científico
Instituição gestora do sistema (direção, equipe técnica, equipe administrativa)
Parcerias:
• RNP
• Coleções Biológicas
• Instituições de Pesquisa
• Instituições de Informática
Produtos
 Catálogo da Vida / Brasil
 Rede de dados de espécimes em coleções biológicas
do Brasil
 Banco ou rede de dados de observação em campo
 Redes temáticas (polinizadores, espécies invasoras,
espécies ameaçadas, …)
 Ferramentas: visualização, georeferenciamento, data
cleaning, modelagem, …
 Centro(s) depositário(s) de dados (data archiving) de
longo termo
Custos primeiros 3 anos
Atividade
Custo
(3 anos)
Estudo do modelo de gestão
100.000
Estudo do sistema de data archiving
100.000
Programa de digitalização de acervos (60 coleções, apoio
de 2 anos cada)
3.780.000
Infra-estrutura de comunicação e de rede
1.350.000
Programa induzido para a ampliação da rede speciesLink
para incluir 20 coleções biológicas por ano
3.000.000
Projetos especiais
1.800.000
Total (3 anos)
10.130.000
Custo para 10 anos
Ano (R$ 1.000)
Ação
1
2
3
4
5
6
7
8
9
10
Total
Estudo do modelo de gestão
100
100
Estudo do sistema de data
archiving
100
100
Programa de digitalização de
acervos
Infra-estrutura de
comunicação e de rede
Programa induzido para a
ampliação da rede
speciesLink para incluir 20
coleções biológicas por ano
1.260
1.260
1.260
1.000
1.000
1.000
1.000
1.000
1.000
1.000
10.780
450
450
450
450
450
450
450
450
450
450
4.500
1.000
1.000
1.000
600
600
600
3.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
8.800
Instituição Gestora da Rede
4.163
4.163
4.163
4.163
4.163
4.163
4.163
29.141
Instituição responsável pelo
Data Archiving
1.000
1.000
1.000
1.000
1.000
1.000
1.000
7.000
7.613
7.613
7.613
7.613
7.613
7.613
7.613
63.421
Projetos especiais
Total
3.510
3.310
3.310
Obrigada
Dora Ann Lange Canhos
([email protected])
Download

Coleções Biológicas e Sistemas de Informação