64º Congresso Nacional de Botânica
Belo Horizonte, 10-15 de Novembro de 2013
DIAGNÓSTICO DA QUALIDADE DOS DADOS DISPONIBILIZADOS POR
HERBÁRIOS BRASILEIROS
1,2
1,2
1,2
1,2
Flávia F. Pezzini *, Dora Ann L. Canhos , Alexandre Marino , Thiago D. de Freitas , Ricardo Braga1
2,3
Neto , Leonor C. Maia .
1
2
Centro de Referência em Informação Ambiental - CRIA. INCT Herbário Virtual da Flora e dos Fungos – INCT–HVFF.
3
Universidade Federal de Pernambuco – UFPE. *[email protected].
Introdução
Dados sobre a ocorrência de espécies armazenadas em
coleções biológicas servem de base para estudos
relacionados à taxonomia, biogeografia, espécies
invasoras e mudanças climáticas, contribuindo para a
conservação e a formulação de políticas públicas [1]. O
uso dos dados aumentou nos últimos anos [2] e muitas
áreas da biologia reconhecem a importância da
disponibilização de dados [3,4], mas pouca atenção tem
sido dada à curadoria e melhoria da qualidade dessas
informações [5]. Dados com erros podem demandar
muito tempo para limpeza, reduzir a quantidade de
informação disponível e gerar conclusões errôneas [3,5].
O INCT Herbário Virtual da Flora e dos Fungos (HVFF)
é uma iniciativa pioneira e tem como missão prover uma
infraestrutura de dados à comunidade científica, ao poder
público e à sociedade, favorecendo a integração de
informações sobre plantas e fungos coletados no Brasil
de forma aberta e livre. Este trabalho tem como objetivo
diagnosticar a qualidade desses dados, disponibilizados
através da rede speciesLink.
Metodologia
Foram utilizadas as informações do aplicativo Network
Manager,
(http://splink.cria.org.br/manager)
e
das
ferramentas de dataCleaning (http://splink.cria. org.br/dc/)
que indicam registros considerados suspeitos, com
possíveis erros ou incompletos para cada coleção. O
acesso foi feito em 30/07/2013.
Resultados e Discussão
Participam do HVFF 76 herbários nacionais e 5 do
exterior, com um acervo estimado em 6.038.794
registros. Dos 76 herbários brasileiros, a maioria está nas
regiões sudeste e nordeste e a minoria no centro-oeste.
Os herbários do sudeste possuem a maior quantidade de
amostras e a menor proporção de dados online, enquanto
a região norte possui a maior proporção de dados online.
A rede speciesLink possui 4.075.084 (67,5%) registros de
plantas e fungos online. Somente 33,4% desses registros
possuem coordenadas originais e 43% têm coordenadas
baseadas no município de coleta. Cerca de 22,7% dos
dados têm coordenadas inconsistentes ou não têm
informações sobre o município da coleta.
Comparando com a Lista de Espécies da Flora do
Brasil (versão 2012), apenas 65,2% possuem nomes
aceitos, 8,5% possuem nomes considerados sinônimos, e
10,3% possuem nomes sem equivalência; 16% dos
registros estão com o nome da espécie em branco,
evidenciando a importância da manutenção do programa
de visitas de especialistas aos herbários para a
identificação de material. 201.221 registros possuem
imagens, auxiliando no processo de conferência dos
dados com suspeita de erros.
Conclusões
A maioria dos erros encontrados pode ser facilmente
corrigida, embora seja um processo lento devido ao
grande número de registros e à conferência das etiquetas
das exsicatas. O georreferenciamento necessita de
atenção em relação aos dados de acervos nacionais
online, mas o tempo para correção/conferência poderá
diminuir se a imagem da exsicata estiver disponível.
Em relação à taxonomia, a maioria dos registros com
erros pode ser corrigida com a conferência dos nomes
aceitos e sinônimos nos dicionários disponíveis na rede
speciesLink. Os espécimes sem identificação orientam a
definição do programa de visitas de especialistas
promovida pelo INCT-HV. A disponibilização das imagens
das exsicatas pode acelerar o processo de identificação,
podendo ser feito até mesmo à distância. A estratégia
para a melhoria da qualidade dos dados envolve ações
de comunicação, visitas in loco e a divulgação dos
resultados, visando orientar a correção dos dados atuais
e evitar erros na entrada futura de dados.
Agradecimentos
Os autores agradecem ao CNPq (Proc. INCT No.
573.883/2008-4; Proc. Sisbiota No. 563.342/2010-2; Proc.
Reflora No. 565.048/2010-4).
Referências Bibliográficas
[1] Chapman, A.D. 2005. Uses of primary speciesoccurrence data. Copenhagen. Global Biodiversity Information
Facility.
[2] Lavoie, C. 2013. Biological collections in an ever changing
world: Herbaria as tools for biogeographical and environmental
studies. Perspectives in Plant Ecology, Evolution and
Systematics 15(1): 68–76.
[3] Graham, C.H.; Ferrier, S.; Huettman, F.; Moritz, C. &
Peterson, A.T. 2004. New developments in museum-based
informatics and applications in biodiversity analysis. Trends in
ecology & evolution 19(9): 497–503.
[4] Pullin, A.S. & Salafsky, N. 2010. Save the Whales? Save
the Rainforest? Save the Data! Conservation Biology 24(4):
915–917.
[5] Giovanni, R. de; Bernacci, L.C.; Siqueira, M.F. de &
Rocha, F.S. 2012. The Real Task of Selecting Records for
Ecological Niche Modelling. Natureza & Conservação 10(2):
139–144.
Download

DIAGNÓSTICO DA QUALIDADE DOS DADOS DISPONIBILIZADOS