64º Congresso Nacional de Botânica Belo Horizonte, 10-15 de Novembro de 2013 DIAGNÓSTICO DA QUALIDADE DOS DADOS DISPONIBILIZADOS POR HERBÁRIOS BRASILEIROS 1,2 1,2 1,2 1,2 Flávia F. Pezzini *, Dora Ann L. Canhos , Alexandre Marino , Thiago D. de Freitas , Ricardo Braga1 2,3 Neto , Leonor C. Maia . 1 2 Centro de Referência em Informação Ambiental - CRIA. INCT Herbário Virtual da Flora e dos Fungos – INCT–HVFF. 3 Universidade Federal de Pernambuco – UFPE. *[email protected]. Introdução Dados sobre a ocorrência de espécies armazenadas em coleções biológicas servem de base para estudos relacionados à taxonomia, biogeografia, espécies invasoras e mudanças climáticas, contribuindo para a conservação e a formulação de políticas públicas [1]. O uso dos dados aumentou nos últimos anos [2] e muitas áreas da biologia reconhecem a importância da disponibilização de dados [3,4], mas pouca atenção tem sido dada à curadoria e melhoria da qualidade dessas informações [5]. Dados com erros podem demandar muito tempo para limpeza, reduzir a quantidade de informação disponível e gerar conclusões errôneas [3,5]. O INCT Herbário Virtual da Flora e dos Fungos (HVFF) é uma iniciativa pioneira e tem como missão prover uma infraestrutura de dados à comunidade científica, ao poder público e à sociedade, favorecendo a integração de informações sobre plantas e fungos coletados no Brasil de forma aberta e livre. Este trabalho tem como objetivo diagnosticar a qualidade desses dados, disponibilizados através da rede speciesLink. Metodologia Foram utilizadas as informações do aplicativo Network Manager, (http://splink.cria.org.br/manager) e das ferramentas de dataCleaning (http://splink.cria. org.br/dc/) que indicam registros considerados suspeitos, com possíveis erros ou incompletos para cada coleção. O acesso foi feito em 30/07/2013. Resultados e Discussão Participam do HVFF 76 herbários nacionais e 5 do exterior, com um acervo estimado em 6.038.794 registros. Dos 76 herbários brasileiros, a maioria está nas regiões sudeste e nordeste e a minoria no centro-oeste. Os herbários do sudeste possuem a maior quantidade de amostras e a menor proporção de dados online, enquanto a região norte possui a maior proporção de dados online. A rede speciesLink possui 4.075.084 (67,5%) registros de plantas e fungos online. Somente 33,4% desses registros possuem coordenadas originais e 43% têm coordenadas baseadas no município de coleta. Cerca de 22,7% dos dados têm coordenadas inconsistentes ou não têm informações sobre o município da coleta. Comparando com a Lista de Espécies da Flora do Brasil (versão 2012), apenas 65,2% possuem nomes aceitos, 8,5% possuem nomes considerados sinônimos, e 10,3% possuem nomes sem equivalência; 16% dos registros estão com o nome da espécie em branco, evidenciando a importância da manutenção do programa de visitas de especialistas aos herbários para a identificação de material. 201.221 registros possuem imagens, auxiliando no processo de conferência dos dados com suspeita de erros. Conclusões A maioria dos erros encontrados pode ser facilmente corrigida, embora seja um processo lento devido ao grande número de registros e à conferência das etiquetas das exsicatas. O georreferenciamento necessita de atenção em relação aos dados de acervos nacionais online, mas o tempo para correção/conferência poderá diminuir se a imagem da exsicata estiver disponível. Em relação à taxonomia, a maioria dos registros com erros pode ser corrigida com a conferência dos nomes aceitos e sinônimos nos dicionários disponíveis na rede speciesLink. Os espécimes sem identificação orientam a definição do programa de visitas de especialistas promovida pelo INCT-HV. A disponibilização das imagens das exsicatas pode acelerar o processo de identificação, podendo ser feito até mesmo à distância. A estratégia para a melhoria da qualidade dos dados envolve ações de comunicação, visitas in loco e a divulgação dos resultados, visando orientar a correção dos dados atuais e evitar erros na entrada futura de dados. Agradecimentos Os autores agradecem ao CNPq (Proc. INCT No. 573.883/2008-4; Proc. Sisbiota No. 563.342/2010-2; Proc. Reflora No. 565.048/2010-4). Referências Bibliográficas [1] Chapman, A.D. 2005. Uses of primary speciesoccurrence data. Copenhagen. Global Biodiversity Information Facility. [2] Lavoie, C. 2013. Biological collections in an ever changing world: Herbaria as tools for biogeographical and environmental studies. Perspectives in Plant Ecology, Evolution and Systematics 15(1): 68–76. [3] Graham, C.H.; Ferrier, S.; Huettman, F.; Moritz, C. & Peterson, A.T. 2004. New developments in museum-based informatics and applications in biodiversity analysis. Trends in ecology & evolution 19(9): 497–503. [4] Pullin, A.S. & Salafsky, N. 2010. Save the Whales? Save the Rainforest? Save the Data! Conservation Biology 24(4): 915–917. [5] Giovanni, R. de; Bernacci, L.C.; Siqueira, M.F. de & Rocha, F.S. 2012. The Real Task of Selecting Records for Ecological Niche Modelling. Natureza & Conservação 10(2): 139–144.