GRUPO DE TRABALHO 3: CORRELAÇÃO, INTEGRAÇÃO E ANÁLISE DE PADRÕES DE DISTRIBUIÇÃO COORDENADORES: Paulo Inácio Prado (NEPAM/UNICAMP) e Flavio A. M. Santos (IB/UNICAMP) PROVOCADOR: Rui Cerqueira (IB/UFRJ) RELATOR: Rafael Fonseca (CRIA) Questão geral: O que foi feito com o Biota que não teria sido feito sem ele? Questões sugeridas ao grupo: 1. O que emerge a partir dos dados armazenados no SinBiota? 2. Há possibilidade de se pensar em padrões de distribuição espacial das espécies que vêm sendo estudadas? O que já existe, o que é possível de se pensar e que informações são necessárias além das já existentes? 3. Existem grupos taxonômicos bem estudados que nos permitem pensar na distribuição de outros grupos? 4. Até que ponto uma ferramenta de modelagem, baseada nos dados armazenados no SinBiota pode orientar novas coletas? 5. Em que áreas devemos concentrar esforços? 6. Que caminhos devemos seguir no futuro? Dinâmica Adotada O grupo começou com algumas atividades de diagnóstico da situação. Nelas, foram fornecidas as informações sobre o Programa Biota-FAPESP e sobre o SinBiota necessárias para abordar as questões propostas ao grupo, e as postas pelos próprios participantes. Também foram levantados pontos para discussão pelo provocador, assim como as principais preocupações e demandas dos participantes. Com isto, estabeleceu-se os tópicos para discussão, bem como uma base comum de conhecimento para que ocorresse o debate. Em seguida, foi realizada a discussão dos tópicos considerados mais importantes, que resultou tanto em conclusões sobre as questões propostas ao grupo, quanto uma série de sugestões adicionais. ATIVIDADES DE DIAGNÓSTICO Apresentação do SinBiota Foi feita uma breve apresentação da estrutura e funcionamento do banco de dados. Dentre as questões indicadas na discussão inicial, uma parte refere-se ao desconhecimento da ficha de dados e outra parte à definição de uma política clara de disponibilização dos dados existentes. Apresentação dos integrantes do grupo. Foi sugerido que os participantes se apresentassem e indicassem suas expectativas referentes à questão geral sobre o que foi feito com o Biota que não teria sido feito sem ele, tentando indicar as possibilidades de síntese e as limitações existentes. Parte das discussões acabou envolvendo uma discussão sobre o SinBiota como instrumento de síntese ou como um banco de dados. Abaixo segue um resumo das questões levantadas dentro do grupo. 1. Coordenadas geográficas não estão disponíveis como saída do programa, apenas para os pesquisadores que entraram com os dados. Sem esses dados, existe uma limitação muito grande com o que se pode fazer em termos de análise de dados. As análises, nesse caso, não permitem uma avaliação além daquela que poderia ser feita por projetos individuais, sem a existência do Biota. Dadas as possíveis conseqüências da disponibilização dos dados ao público em geral, torna-se fundamental o estabelecimento de uma política de diponibilização dos dados existentes, definindo diferentes níveis de acesso. Da forma como esta, existe pouco estímulo à entrada de dados no SinBiota e talvez até mesmo no Biota, pois não há um retorno aparente ao pesquisador que não tem um retorno em informação além daquela que ele disponibilizou. 2. Dificuldades na entrada dos dados. Vários representantes de grupos que já usam o sistema avaliam que a interface para entrada de dados é lenta, e não possui facilidades para importar os registros das plataformas nas quais cada grupo mantem sua própria base (normalmente planilhas eletrônicas para computadores pessoais). 3. Ausência de dados sobre determinados grupos de organismos. Existem muitas informações sobre determinados grupos (animais por exemplo e peixes mais especificamente) e poucos sobre plantas. Parte dessa ausência de dados reflete o andamento dos projetos, a velocidade de incorporação dos dados dos projetos ao banco de dados do SinBiota, a existência de outros programas que englobam alguns grupos (por exemplo, o Projeto Flora Fanerogâmica do Estado de São Paulo) e a ausência de representatividade de estudos de alguns grupos dentro do Biota. Isso limita a obtenção de informações cruzadas de diferentes grupos em um mesmo local e de um determinado grupo em diferentes locais. 4. Necessidade de que as identificações taxonômicas no banco de dados passem por uma validação por autoridade taxonômica para que o dado disponibilizado seja confiável. A ausência, em alguns casos, de material testemunho, faz com que os dados existentes tenham diferentes níveis de confiabilidade. Existe a necessidade de filtros de saída indicando ao usuário quais dados estão associados a material testemunho depositado em coleções e quais dados estão associados a observações de pesquisadores, sem material de referência. 5. Para a detecção de padrões espaciais, os dados são limitados dependendo do grupo a ser analisado e da escala. Para alguns grupos, como por exemplo os mamíferos, a escala espacial é inadequada para o estudo de distribuições biogeográficas. Da mesma forma, a análise de listagens de espécies por localidade é limitada pelo pequeno número de registros e pela limitada área geográfica coberta por cada grupo. Aparentemente existe uma concentração de coletas nas proximidades da rede viária do estado, nas proximidades das Universidades e em áreas de apelo turístico (ver figuras) 6. O SinBiota, na sua forma atual, é bastante limitado como ferramenta de pesquisa e como ferramenta de ensino. Disponibilidade de dados insuficiente para pesquisa e linguagem inadequada para ensino. 7. Necessidade de entrada de dados históricos (só tem dados dos últimos 4 anos). Entrada de dados de coleções. Integrar dados com outros sistemas. Por outro lado, embora os dados de coleções representam um conjunto espacial e temporal de dados muito mais extensivo, com informação qualificada e capaz de ser verificada, representam também uma informação mais limitada em termos de padronização do que aquela existente nas fichas de entrada de dados. Existe a necessidade de atenção para problemas de duplicação de dados (aqueles entrados no SinBiota, referentes a material depositado posteriormente em coleções e que poderão ser importados no sistema quando da obtenção dos dados junto a essas coleções). Existe também a questão de como manter o sistema em uma segunda fase, visto a necessidade de atualizações. 8. Necessidade de disponibilizar um sistema que permita a entrada de dados “off-line” 9. Necessidade de integrar o banco de dados com dados ambientais (clima e solo) existentes e disponíveis em outros bancos de dados. 10. Necessidade de ferramentas, como filtros para conferência de nomenclatura e nomes de autores e filtros para informação disponível (por exemplo, quais dados referem-se a material testemunho depositado em coleção). Palestra do Dr. Rui Cerqueira Como provocador, o Prof. Rui Cerqueira fez uma explanação de cerca de uma hora, enfatizando os seguintes pontos para discussão: • Necessidade de padronizar conceitos, categorias e variáveis, para que se garanta um diálogo efetivo. Isto é especialmente crítico em projetos envolvendo muitas equipes com formações diferentes. • A informação hoje disponível na Internet é em geral muito superficial e pouco confiável. • Sistemas de informação devem ser construídos a partir de um conhecimento aprofundado do dado que se pretende armazenar e disseminar. • O dado é sempre uma construção. Não existe um dado “puro”; a informação é produzida sempre em algum contexto. Nenhuma informação presta-se a qualquer aplicação. A estrutura de uma base de dados reflete os objetivos e análises vislumbradas por seus planejadores. • Estudos correlativos, como muitas das aplicações em SIG, estabelecem relações empíricas entre variáveis, mas não possuem premissas de teoria ecológica. • Os dados necessários para estudos biogeográficos demandam um enorme esforço de conferência e validação. Isto só pode ser feito por especialistas no táxon, e que tenham muita experiência com este tipo de registro. Histórico e Utilização do SinBiota Como o conhecimento acerca do SinBiota era muito variável entre os participantes, foram realizadas duas atividades para que todos se familiarizassem com o sistema. No início da tarde do primeiro dia de discussões, a equipe do CRIA fez uma demonstração tutorial do SinBiota, na qual os participantes puderam experimentar as interfaces do sistema que estão on-line. Na manhã do segundo dia, o Dr. Carlos Joly fez uma breve explanação sobre o projeto que implantou o SinBiota, coordenado por ele. DEBATES O restante do tempo do grupo foi usado para discutir os tópicos mais importantes que surgiram durante as atividades de diagnóstico. São eles: Heterogeneidade dos Dados Os dados produzidos pelo Programa Biota, e que estão armazenados no SinBiota, são extremamente heterogêneos, refletindo a grande variedade de projetos abrigados hoje pelo Programa. É preciso lembrar, inclusive, que nem todos os projetos têm o inventário de espécies como objetivo principal. O resultado é que há variações acentuadas na escala, precisão, e extensão dos registros. Além disto, há forte agregação espacial, temporal, e taxonômica da informação (Figuras 1 e 2). Assim, em seu conjunto de registros produzidos não são uma amostra estatística controlada, embora os projetos isolados que os produziram tenham desenhos amostrais adequados. Agregados, eles formam amostra de conveniência, similar aos registros de espécies obtidos em coleções de museus e herbários. Isto não inviabiliza todo tipo de análise, mas é uma característica essencial do dado, que delimita suas potencialidades de uso. Extensão dos Dados Os dados restringem-se aos registros obtidos para o estado de São Paulo, por um conjunto específico de projetos, nos últimos quatro anos. Para muitos táxons, esta restrição espacial e temporal impede a análise de padrões importantes. Padronização É preciso validar e atualizar a nomenclatura taxonômica usada pela base. Já são detectados casos ambíguos, de nomes nulos, e de sinonímia nos dados do SinBiota, e o risco do acúmulo de erros e discordâncias é grande, na medida que a base recebe dados de vários projetos. A validação da nomenclatura depende da conferência por especialistas em cada táxon, e sempre que possível, do depósito de material testemunho em coleção. Registros sem material testemunho tendem a perder a validade muito rapidamente, pois a identificação da espécie não pode ser reavaliada. Da mesma forma, é preciso referenciar a classificação de unidades ambientais (biomas, hábitats, formações vegetais) usada. Como há vários sistemas de classificação destas unidades, o pesquisador deve indicar qual está usando, ao inserir seus dados na base. Acesso às Informações O SinBiota hoje restringe o acesso às coordenadas do registro. Além disto, a sua interface de consulta recupera registros individuais, e na prática inviabiliza a extração de planilhas com muitos registros, para a análise. Do ponto de vista técnico, é possível tanto eliminar estas restrições, como impor outras. A questão central não e técnica, mas sim de definição de uma política de acesso. É necessária uma discussão sobre os critérios de acesso por diferentes tipos de usuários, para definir uma política que permita o pleno uso das informações pela comunidade científica, um uso adequado por outros setores, sem perder de vista os direitos do pesquisador que produziu os dados. Aperfeiçoamentos da Interface O grupo entende que tanto a entrada de dados como a consulta podem ser facilitadas. Além disto, são necessárias novas interfaces para o público não-acadêmico. Parte destas mudanças dependem da definição das políticas de acesso aos dados. A demanda mais urgente, e que não depende disto, é facilitar a entrada de dados, que é considerada lenta e trabalhosa. CONCLUSÕES DO GRUPO 1 - É necessário um diagnóstico dos dados do SinBiota, tanto do que está disponível quanto do que se projeta ter a diferentes prazos. Uma caracterização cuidadosa da natureza deste conjunto de dados é o primeiro passo para se identificar seus potenciais para análises de padrões de diversidade. Um fórum de discussão e diagnóstico da base de dados seria muito oportuno. 2 - Em seu estágio atual, os dados do SinBiota podem gerar listas de espécies para alguns grupos, para o Estado de São Paulo e suas macro-regiões. Mesmo preliminares, estas listas representariam um enorme avanço no conhecimento da biodiversidade do estado, e um produto coletivo de grande impacto, do Programa Biota. 3 - Análises mais detalhadas de padrões de diversidade, tais como modelos de distribuição potencial, não são ainda possíveis apenas com os dados hoje disponíveis no SinBiota. Por outro lado, é possível para alguns táxons que haja registros no SinBiota que, agregados a dados de outras bases, permitam este tipo de análise. Assim, o necessário para ampliar o uso potencial dos registros de espécies armazenados no SinBiota é: - Aumentar o número e extansão dos registros; - Agregar ou intengrar informação de fora do Estado de São Paulo; - Agregar ou integrar aos registros informações ambientais digitais, nas escalas adequadas PRINCIPAIS SUGESTÕES • Fazer uma página com a saída do SinBiota para o público leigo e tomadores de decisão; • Incorporar ao site estatísticas da base e do programa, que podem ser úteis para formulação de Políticas Públicas; • Melhorar metadados: documentar metodologia e limites dos dados; • Diagnósticos de conteúdo do sistema por especialistas; • Consultas através de um polígono marcado no Atlas; • Melhorar a interface (entrada e saída de dados); • Associar as informações de espécies com a intensidade de coleta • Explorar interfaces que integrem com outras bases. Exemplo:com dados de solos e clima; • Integração com outros sistemas de informação; • Elaboração de um sistema de validação nomenclatura PARTICIPANTES 1. Fabricio Leandro Neves Jacinto [email protected] 2. Luís Carlos Bernacci [email protected] 3. Marlon Pelaez Rodriguez [email protected] 4. Rafael Luís Fonseca [email protected] 5. Ricardo Scachetti Pereira [email protected] 6. Rômulo Fernades Batista [email protected] 7. Simey Thury Vieira Fisch 8. Mario de Vivo [email protected] 9. Alexandre Marino [email protected] 10. Serafim Daniel Balcentero 11. Mauro E. S. Munoz [email protected] 12. João L. F. Batista [email protected] 13. Renato de Giovanni 14. Leandro Querobim Yokoyama 15. Gilberto Fish 16. Rui Cerqueira [email protected] 17. Paulo Inácio Prado [email protected] 18. Flávio A. M. Santos [email protected] 19. Vanderlei Canhos [email protected] Esforço de coletas nas Unidades de Gerenciamento Hídrico Entre 11 e 60 coletas Entre 120 e 180 coletas Entre 60 e 120 coletas Entre 300 e 360 coletas 1315 coletas dados de out/2002 Grupos taxonômicos coletados / Unidades de Gerenciamento Hídrico Entre 2 e 9 grupos Entre 16 e 20 Entre 10 e 15 grupos Entre 21 e 25 dados de out/2002