GRUPO DE TRABALHO 3:
CORRELAÇÃO, INTEGRAÇÃO E ANÁLISE DE PADRÕES DE DISTRIBUIÇÃO
COORDENADORES: Paulo Inácio Prado (NEPAM/UNICAMP) e Flavio A. M. Santos
(IB/UNICAMP)
PROVOCADOR: Rui Cerqueira (IB/UFRJ)
RELATOR: Rafael Fonseca (CRIA)
Questão geral:
O que foi feito com o Biota que não teria sido feito sem ele?
Questões sugeridas ao grupo:
1. O que emerge a partir dos dados armazenados no SinBiota?
2. Há possibilidade de se pensar em padrões de distribuição espacial das espécies que vêm
sendo estudadas? O que já existe, o que é possível de se pensar e que informações são
necessárias além das já existentes?
3. Existem grupos taxonômicos bem estudados que nos permitem pensar na distribuição de
outros grupos?
4. Até que ponto uma ferramenta de modelagem, baseada nos dados armazenados no SinBiota
pode orientar novas coletas?
5. Em que áreas devemos concentrar esforços?
6. Que caminhos devemos seguir no futuro?
Dinâmica Adotada
O grupo começou com algumas atividades de diagnóstico da situação. Nelas, foram
fornecidas as informações sobre o Programa Biota-FAPESP e sobre o SinBiota necessárias para
abordar as questões propostas ao grupo, e as postas pelos próprios participantes. Também foram
levantados pontos para discussão pelo provocador, assim como as principais preocupações e
demandas dos participantes. Com isto, estabeleceu-se os tópicos para discussão, bem como uma
base comum de conhecimento para que ocorresse o debate. Em seguida, foi realizada a discussão
dos tópicos considerados mais importantes, que resultou tanto em conclusões sobre as questões
propostas ao grupo, quanto uma série de sugestões adicionais.
ATIVIDADES DE DIAGNÓSTICO
Apresentação do SinBiota
Foi feita uma breve apresentação da estrutura e funcionamento do banco de dados. Dentre
as questões indicadas na discussão inicial, uma parte refere-se ao desconhecimento da ficha de
dados e outra parte à definição de uma política clara de disponibilização dos dados existentes.
Apresentação dos integrantes do grupo.
Foi sugerido que os participantes se apresentassem e indicassem suas expectativas
referentes à questão geral sobre o que foi feito com o Biota que não teria sido feito sem ele, tentando
indicar as possibilidades de síntese e as limitações existentes. Parte das discussões acabou
envolvendo uma discussão sobre o SinBiota como instrumento de síntese ou como um banco de
dados. Abaixo segue um resumo das questões levantadas dentro do grupo.
1. Coordenadas geográficas não estão disponíveis como saída do programa, apenas para os
pesquisadores que entraram com os dados. Sem esses dados, existe uma limitação muito
grande com o que se pode fazer em termos de análise de dados. As análises, nesse caso,
não permitem uma avaliação além daquela que poderia ser feita por projetos individuais, sem
a existência do Biota. Dadas as possíveis conseqüências da disponibilização dos dados ao
público em geral, torna-se fundamental o estabelecimento de uma política de diponibilização
dos dados existentes, definindo diferentes níveis de acesso. Da forma como esta, existe
pouco estímulo à entrada de dados no SinBiota e talvez até mesmo no Biota, pois não há um
retorno aparente ao pesquisador que não tem um retorno em informação além daquela que
ele disponibilizou.
2. Dificuldades na entrada dos dados. Vários representantes de grupos que já usam o sistema
avaliam que a interface para entrada de dados é lenta, e não possui facilidades para importar
os registros das plataformas nas quais cada grupo mantem sua própria base (normalmente
planilhas eletrônicas para computadores pessoais).
3. Ausência de dados sobre determinados grupos de organismos. Existem muitas informações
sobre determinados grupos (animais por exemplo e peixes mais especificamente) e poucos
sobre plantas. Parte dessa ausência de dados reflete o andamento dos projetos, a velocidade
de incorporação dos dados dos projetos ao banco de dados do SinBiota, a existência de
outros programas que englobam alguns grupos (por exemplo, o Projeto Flora Fanerogâmica
do Estado de São Paulo) e a ausência de representatividade de estudos de alguns grupos
dentro do Biota. Isso limita a obtenção de informações cruzadas de diferentes grupos em um
mesmo local e de um determinado grupo em diferentes locais.
4. Necessidade de que as identificações taxonômicas no banco de dados passem por uma
validação por autoridade taxonômica para que o dado disponibilizado seja confiável. A
ausência, em alguns casos, de material testemunho, faz com que os dados existentes
tenham diferentes níveis de confiabilidade. Existe a necessidade de filtros de saída indicando
ao usuário quais dados estão associados a material testemunho depositado em coleções e
quais dados estão associados a observações de pesquisadores, sem material de referência.
5. Para a detecção de padrões espaciais, os dados são limitados dependendo do grupo a ser
analisado e da escala. Para alguns grupos, como por exemplo os mamíferos, a escala
espacial é inadequada para o estudo de distribuições biogeográficas. Da mesma forma, a
análise de listagens de espécies por localidade é limitada pelo pequeno número de registros
e pela limitada área geográfica coberta por cada grupo. Aparentemente existe uma
concentração de coletas nas proximidades da rede viária do estado, nas proximidades das
Universidades e em áreas de apelo turístico (ver figuras)
6. O SinBiota, na sua forma atual, é bastante limitado como ferramenta de pesquisa e como
ferramenta de ensino. Disponibilidade de dados insuficiente para pesquisa e linguagem
inadequada para ensino.
7. Necessidade de entrada de dados históricos (só tem dados dos últimos 4 anos). Entrada de
dados de coleções. Integrar dados com outros sistemas. Por outro lado, embora os dados de
coleções representam um conjunto espacial e temporal de dados muito mais extensivo, com
informação qualificada e capaz de ser verificada, representam também uma informação mais
limitada em termos de padronização do que aquela existente nas fichas de entrada de dados.
Existe a necessidade de atenção para problemas de duplicação de dados (aqueles entrados
no SinBiota, referentes a material depositado posteriormente em coleções e que poderão ser
importados no sistema quando da obtenção dos dados junto a essas coleções). Existe
também a questão de como manter o sistema em uma segunda fase, visto a necessidade de
atualizações.
8. Necessidade de disponibilizar um sistema que permita a entrada de dados “off-line”
9. Necessidade de integrar o banco de dados com dados ambientais (clima e solo) existentes e
disponíveis em outros bancos de dados.
10. Necessidade de ferramentas, como filtros para conferência de nomenclatura e nomes de
autores e filtros para informação disponível (por exemplo, quais dados referem-se a material
testemunho depositado em coleção).
Palestra do Dr. Rui Cerqueira
Como provocador, o Prof. Rui Cerqueira fez uma explanação de cerca de uma hora,
enfatizando os seguintes pontos para discussão:
•
Necessidade de padronizar conceitos, categorias e variáveis, para que se garanta um
diálogo efetivo. Isto é especialmente crítico em projetos envolvendo muitas equipes
com formações diferentes.
•
A informação hoje disponível na Internet é em geral muito superficial e pouco
confiável.
•
Sistemas de informação devem ser construídos a partir de um conhecimento
aprofundado do dado que se pretende armazenar e disseminar.
•
O dado é sempre uma construção. Não existe um dado “puro”; a informação é
produzida sempre em algum contexto. Nenhuma informação presta-se a qualquer
aplicação. A estrutura de uma base de dados reflete os objetivos e análises
vislumbradas por seus planejadores.
•
Estudos correlativos, como muitas das aplicações em SIG, estabelecem relações
empíricas entre variáveis, mas não possuem premissas de teoria ecológica.
•
Os dados necessários para estudos biogeográficos demandam um enorme esforço
de conferência e validação. Isto só pode ser feito por especialistas no táxon, e que
tenham muita experiência com este tipo de registro.
Histórico e Utilização do SinBiota
Como o conhecimento acerca do SinBiota era muito variável entre os participantes, foram
realizadas duas atividades para que todos se familiarizassem com o sistema. No início da tarde do
primeiro dia de discussões, a equipe do CRIA fez uma demonstração tutorial do SinBiota, na qual os
participantes puderam experimentar as interfaces do sistema que estão on-line. Na manhã do
segundo dia, o Dr. Carlos Joly fez uma breve explanação sobre o projeto que implantou o SinBiota,
coordenado por ele.
DEBATES
O restante do tempo do grupo foi usado para discutir os tópicos mais importantes que surgiram
durante as atividades de diagnóstico. São eles:
Heterogeneidade dos Dados
Os dados produzidos pelo Programa Biota, e que estão armazenados no SinBiota, são
extremamente heterogêneos, refletindo a grande variedade de projetos abrigados hoje pelo
Programa. É preciso lembrar, inclusive, que nem todos os projetos têm o inventário de espécies como
objetivo principal. O resultado é que há variações acentuadas na escala, precisão, e extensão dos
registros. Além disto, há forte agregação espacial, temporal, e taxonômica da informação (Figuras 1 e
2). Assim, em seu conjunto de registros produzidos não são uma amostra estatística controlada,
embora os projetos isolados que os produziram tenham desenhos amostrais adequados. Agregados,
eles formam amostra de conveniência, similar aos registros de espécies obtidos em coleções de
museus e herbários. Isto não inviabiliza todo tipo de análise, mas é uma característica essencial do
dado, que delimita suas potencialidades de uso.
Extensão dos Dados
Os dados restringem-se aos registros obtidos para o estado de São Paulo, por um conjunto
específico de projetos, nos últimos quatro anos. Para muitos táxons, esta restrição espacial e
temporal impede a análise de padrões importantes.
Padronização
É preciso validar e atualizar a nomenclatura taxonômica usada pela base. Já são detectados
casos ambíguos, de nomes nulos, e de sinonímia nos dados do SinBiota, e o risco do acúmulo de
erros e discordâncias é grande, na medida que a base recebe dados de vários projetos. A validação
da nomenclatura depende da conferência por especialistas em cada táxon, e sempre que possível, do
depósito de material testemunho em coleção. Registros sem material testemunho tendem a perder a
validade muito rapidamente, pois a identificação da espécie não pode ser reavaliada.
Da mesma forma, é preciso referenciar a classificação de unidades ambientais (biomas,
hábitats, formações vegetais) usada. Como há vários sistemas de classificação destas unidades, o
pesquisador deve indicar qual está usando, ao inserir seus dados na base.
Acesso às Informações
O SinBiota hoje restringe o acesso às coordenadas do registro. Além disto, a sua interface de
consulta recupera registros individuais, e na prática inviabiliza a extração de planilhas com muitos
registros, para a análise. Do ponto de vista técnico, é possível tanto eliminar estas restrições, como
impor outras. A questão central não e técnica, mas sim de definição de uma política de acesso. É
necessária uma discussão sobre os critérios de acesso por diferentes tipos de usuários, para definir
uma política que permita o pleno uso das informações pela comunidade científica, um uso adequado
por outros setores, sem perder de vista os direitos do pesquisador que produziu os dados.
Aperfeiçoamentos da Interface
O grupo entende que tanto a entrada de dados como a consulta podem ser facilitadas. Além
disto, são necessárias novas interfaces para o público não-acadêmico. Parte destas mudanças
dependem da definição das políticas de acesso aos dados. A demanda mais urgente, e que não
depende disto, é facilitar a entrada de dados, que é considerada lenta e trabalhosa.
CONCLUSÕES DO GRUPO
1 - É necessário um diagnóstico dos dados do SinBiota, tanto do que está disponível quanto do que
se projeta ter a diferentes prazos. Uma caracterização cuidadosa da natureza deste conjunto de
dados é o primeiro passo para se identificar seus potenciais para análises de padrões de diversidade.
Um fórum de discussão e diagnóstico da base de dados seria muito oportuno.
2 - Em seu estágio atual, os dados do SinBiota podem gerar listas de espécies para alguns grupos,
para o Estado de São Paulo e suas macro-regiões. Mesmo preliminares, estas listas representariam
um enorme avanço no conhecimento da biodiversidade do estado, e um produto coletivo de grande
impacto, do Programa Biota.
3 - Análises mais detalhadas de padrões de diversidade, tais como modelos de distribuição potencial,
não são ainda possíveis apenas com os dados hoje disponíveis no SinBiota. Por outro lado, é
possível para alguns táxons que haja registros no SinBiota que, agregados a dados de outras bases,
permitam este tipo de análise. Assim, o necessário para ampliar o uso potencial dos registros de
espécies armazenados no SinBiota é:
- Aumentar o número e extansão dos registros;
- Agregar ou intengrar informação de fora do Estado de São Paulo;
- Agregar ou integrar aos registros informações ambientais digitais, nas escalas adequadas
PRINCIPAIS SUGESTÕES
•
Fazer uma página com a saída do SinBiota para o público leigo e tomadores de decisão;
•
Incorporar ao site estatísticas da base e do programa, que podem ser úteis para formulação de
Políticas Públicas;
•
Melhorar metadados: documentar metodologia e limites dos dados;
•
Diagnósticos de conteúdo do sistema por especialistas;
•
Consultas através de um polígono marcado no Atlas;
•
Melhorar a interface (entrada e saída de dados);
•
Associar as informações de espécies com a intensidade de coleta
•
Explorar interfaces que integrem com outras bases. Exemplo:com dados de solos e clima;
•
Integração com outros sistemas de informação;
•
Elaboração de um sistema de validação nomenclatura
PARTICIPANTES
1. Fabricio Leandro Neves Jacinto
[email protected]
2. Luís Carlos Bernacci
[email protected]
3. Marlon Pelaez Rodriguez
[email protected]
4. Rafael Luís Fonseca
[email protected]
5. Ricardo Scachetti Pereira
[email protected]
6. Rômulo Fernades Batista
[email protected]
7. Simey Thury Vieira Fisch
8. Mario de Vivo
[email protected]
9. Alexandre Marino
[email protected]
10. Serafim Daniel Balcentero
11. Mauro E. S. Munoz
[email protected]
12. João L. F. Batista
[email protected]
13. Renato de Giovanni
14. Leandro Querobim Yokoyama
15. Gilberto Fish
16. Rui Cerqueira
[email protected]
17. Paulo Inácio Prado
[email protected]
18. Flávio A. M. Santos
[email protected]
19. Vanderlei Canhos
[email protected]
Esforço de coletas nas Unidades de Gerenciamento
Hídrico
Entre 11 e 60 coletas
Entre 120 e 180 coletas
Entre 60 e 120 coletas
Entre 300 e 360 coletas
1315 coletas
dados de out/2002
Grupos taxonômicos coletados / Unidades de
Gerenciamento Hídrico
Entre 2 e 9 grupos
Entre 16 e 20
Entre 10 e 15 grupos
Entre 21 e 25
dados de out/2002
Download

Relatório GT-3 - Programa BIOTA/FAPESP