Modelagem de Distribuição
Geográfica de Espécies
Ricardo Scachetti Pereira
Marinez Ferreira de Siqueira
Centro de Referência em
Informação Ambiental - CRIA
Apresentação
Programação do Curso
Aula teórica (hoje):








Dados em biodiversidade
Sistemas na Internet
Nicho Ecológico de Espécie
Modelagem de Distribuição
Erros na Previsão: Omissão vs.
Sobreprevisão
Dados Espaciais
Escala dos Dados para Análise
Algoritmos:
–
–


BioClim
GARP
Aplicações
Exemplos
Aula prática (amanhã):






Introdução ao DesktopGarp
Preparação dos dados
Entrada dos dados
Seleção de informação espacial
e ambiental
Processamento e análise dos
resultados
Outras aplicações:
–
–
–
espécies invasoras
mudanças climáticas
projeção no tempo
Caracterização dos Dados sobre
Biodiversidade

Dados primários:
–
coletas e observações:






o quê: espécie;
onde: local da coleta;
quando: data;
quem: autor;
como: método.
Dados secundários:
–
sumários, sínteses.
Caracterização dos Dados sobre
Biodiversidade

Basear análises e planejamentos em
dados secundários é conveniente, mas...
Caracterização dos Dados sobre
Biodiversidade


Basear análises e planejamentos em
dados secundários é conveniente, mas...
Danifica a conexão vital entre o produto e
os dados. O produto começa a degradar-se
Degradação dos Dados e
Produtos
A afirmação é feita ...
“Espécie X está presente no Local Y”
Quase imediatamente, novas informações tornam-se
disponíveis, taxonomias são refeitas, paisagens e
padrões de uso de solo mudam, e os dados tornam-se
menos significativos. Assim, a qualidade e o
significado dos produtos, assim como dos dados em
que se baseiam, começam a se degradar.
Caracterização dos Dados sobre
Biodiversidade



Basear análises e planejamentos em
dados secundários é conveniente, mas...
Danifica a conexão vital entre o produto e
os dados. O produto começa a degradar-se
Não permite ao produto melhorar, crescer
e evoluir com novos dados e de melhor
qualidade
Caracterização dos Dados sobre
Biodiversidade

O uso de dados primários, especialmente os
pontos de ocorrência de espécies, resolve vários
problemas:
–
–
–
Aproveita a grande quantidade de dados para todas as
regiões e espécies
Permite a atualização e evolução dos produtos conforme
os dados tornam-se melhores - o produto melhora com o
tempo
Permite uma variedade de análises quantitativas e
sintéticas, abrindo novas possibilidades para o uso da
informação sobre biodiversidade
Caracterização dos Dados sobre
Biodiversidade

Pontos de ocorrência de espécies oferecem
várias vantagens...
–
–
–
–
Ocorrências de espécies são associadas a pontos específicos no
espaço, permitindo a caracterização de necessidades ecológicas
Ocorrências de espécies são associadas a pontos específicos no
tempo, permitindo a avaliação de mudanças temporais
Pontos de ocorrência são apropriados para uso em análises
estatísticas e outros métodos quantitativos
Torna desnecessário qualquer passo interpretativo intermediário
no processo
Caracterização dos Dados sobre
Biodiversidade

3 bilhões de espécimes e dados relacionados, de
animais e plantas, espalhados por museus de
história natural e herbários, além dos dados de
observação

Descrevem cerca de 2 milhões de espécies

Representam 300 anos de exploração científica da
biodiversidade do planeta
Biblioteca da Vida
Acesso aos Dados Primários

Dados não encontram-se disponíveis:
–
Maior parte está em etiquetas de papel
Acesso aos Dados Primários

Dados não encontram-se disponíveis:
–
–
Maior parte está em etiquetas de papel
Dados informatizados encontram-se em
sistemas operacionais heterogêneos,
plataformas distintas, e sistema de
gerenciamento de coleções diversos
Acesso aos Dados Primários

Dados não encontram-se disponíveis:
–
–

Maior parte está em etiquetas de papel
Dados informatizados encontram-se em
sistemas operacionais heterogêneos,
plataformas distintas, e sistema de
gerenciamento de coleções diversos
Amostragem em coleções são
individualmente incompletas
Coleções de Pássaros Mexicanos
Paris
Museu Britânico
Field Museum
KU - Museu de
História
Natural
“Museu Mundial” de
Pássaros Mexicanos
Exemplo dos Pássaros Mexicanos

Dados integrados de 43 instituições

4 anos para construir o banco de dados

Ligação entre o banco de dados e o
produto final é danificada

Coleção mais significante tinha apenas
16% dos dados
Exemplos de Sistemas na Internet





The Species Analyst – Iniciativa da América do Norte
ENHSIN - European Natural History Specimen Information Network
CONABIO - México
ERIN - Austrália
Rede de Coleções no Estado de São Paulo
(FAPESP)
O Problema da Amostragem
1. Amostragem existente
é incompleta
2. Brancos na
distribuição conhecida
representam ausência
real ou simplesmente
não-deteção
3. Não é possível
fazer a distinção entre
as duas possibilidades
sem dados adicionais
4. Inferência além dos
limites dos dados reais se
torna necessária
Modelagem de Espécies

Ferramenta fundamental para inferência
da distribuição de espécies selvagens

Baseada em dois princípios:
–
–
modelos do nicho ecológico (habitat)
previsão da localização geográfica da espécie
Nicho Ecológico de Espécie

É o conjunto de condições ecológicas com que
as populações da espécie conseguem se manter

É definido como um
espaço n-dimensional:
Temperatura
Modelo de nicho ecológico
Precipitação
Modelagem de Distribuição

Pontos de ocorrência georeferenciados

Coberturas geográficas resumindo dimensões
ambientais como temperatura, precipitação,
topografia, solos, geologia;

Usa de associações não-aleatórias entre pontos e
coberturas para construir o modelo do nicho
ecológico da espécie;

Projeta o modelo de volta nos mapas para prever a
distribuição da espécie.
Modelagem de Distribuição
Temperatura
Ecologia
Modelo do Nicho Ecológico
Precipitação
Geografia
Algoritmo
Pontos de Ocorrência
Previsão da
Distribuição
Nativa
Erros na Previsão de Distribuição
distribução geográfica real
Erros na Previsão de Distribuição
Distribuição geográfica prevista
Erros na Previsão de Distribuição
Distribuição geográfica prevista
distribução geográfica real
Sobreprevisão
Omissão
Erros na Previsão de Distribuição

Dois tipos possíveis de erro na previsão:
–
–
Omissão: área ocupada não faz parte da
previsão
Sobreprevisão: previsão inclui área não
ocupada
Erros na Previsão de Distribuição
Objetivo: Minimizar ambas formas de erro
Erros na Previsão de Distribuição

Características dos erros na previsão:
–
Omissão: quase sempre é um erro no
modelo (má qualidade) ou no dado de
ocorrência (identificação incorreta da espécie,
erro no georeferenciamento)
–
Sobreprevisão: pode ser tanto um problema
do modelo quanto uma deficiência da
amostragem dos dados de ocorrência.
Impossível determinar qual a natureza do erro
Dados Espaciais Usados nas Análises


Variáveis importantes para a espécie
Variáveis mais comuns:
–
–
–
–
Clima: temperatura, precipitação, radiação
solar, cobertura de nuvens, neve (!?), etc
Relevo: DEM, elevação, fluxos, etc
Hidrografia
Cobertura Vegetal
Escala dos Dados para Análise

Compatibilizar a escala dos dados de
ocorrência com os dados ambientais
Coleções Biológicas
10 a 1.000km
Dados ambientais
1 a 100km
Coletas com GPS
~100m
Base do Biota
~100m
Modelagem de Distribuição


Limitação da Modelagem Devido ao
Conceito de Nicho Ecológico de Espécies:
Previsão da distribuição não leva em conta os
fatores históricos
Em outras palavras, uma espécie pode não
habitar uma região que apresente condições
favoráveis à manutenção de populações pois
nunca teve a chance de chegar até lá, devido a
uma barreira geográfica, por exemplo
Algoritmos




BioClim (Bioclimatic Envelope)
GARP (Genetic Algorithm for Rule-set Production)
Regressão Logística
Análise Multivariada
BioClim
Pontos de ocorrência sobre a
cobertura geográfica , como
a precipitação
BioClim
Pontos de ocorrência sobre a
cobertura geográfica , como
a precipitação
Histograma da freqüência da
ocorrência dos pontos nas
classes de precipitação
BioClim
Pontos de ocorrência sobre a
cobertura geográfica , como
a precipitação
Histograma da freqüência da
ocorrência dos pontos nas
classes de precipitação
Distribuição é corrigida para
eliminar os registros
marginais de habitat
BioClim
Pontos de ocorrência sobre a
cobertura geográfica , como
a precipitação
Histograma da freqüência da
ocorrência dos pontos nas
classes de precipitação
Distribuição é corrigida para
eliminar os registros
marginais de habitat
A distribuição
é projetada no mapa
GARP - Algoritmo Genético para Previsão
baseada em Conjunto de Regras

Desenvolvido por David Stockwell, no San Diego
Supercomputer Center

Tem a vantagem de utilizar múltiplos algoritmos
(BIOCLIM, regressão logística)

Diferentes regras podem se aplicar a diferentes
setores da distribuição da espécie

Usa um algoritmo genético para escolher as
melhores regras
GARP



Divide o conjunto de pontos em training data set
(para construir modelos) e test data set (para
avaliação da eficácia do modelo)
Aplica um algoritmo ao training data set
– BIOCLIM
– regressão logística
– análise de função determinante
– etc.
Avalia a eficácia do modelo, perguntando quando a
omissão e a sobreprevisão são significantemente
menores que num modelo aleatório
GARP
Pontos de ocorrência
vegetação
temperatura
precipitação
relevo
Dimensões
ambientais
(coberturas
geográficas)
Distribuição
prevista
Regras do modelo GARP
IF
elev1km=[95, 1200] AND geol1km=[1, 10] AND hum1km=[1, 8]mm
AND rain1km=[1400, 2000]mm AND temp1km=[18, 25]mm
AND veg1km=[7, 10]mm
THEN Taxon=PRESENT
IF elev1km=[250, 1000]mm AND hum1km=[3, 13]mm
AND rain1km=[500, 2000]mm AND soil1km=[1, 16]mm
AND temp1km=[16, 26]mm
THEN Taxon=BACKGROUND
IF geol1km=[1, 10]mm AND hum1km=[1, 8]mm AND rain1km=[1150,
2365]mm
THEN Taxon=PRESENT
Possíveis Projeções
Temperatura
Ecologia
Modelo do Nicho Ecológico
Precipitação
Geografia
Algoritmo
Projeção sobre
Projeção outra região
sobre clima
alterado
Pontos de Ocorrência
Previsão da
Distribuição
Nativa
Projeção sobre
Clima Modificado
Previsão de
Invasão
Aplicações

Compreensão da distribuição de espécies
raras e ameaçadas

Projeto de programas de re-introdução de
espécies

Orientação para novos inventários
Aplicações

Projeto de planos de conservação da
biodiversidade

Estudo de espécies invasoras

Estudo dos efeitos da mudança climática
sobre a biodiversidade
Exemplos
Espécie Fantasma - Ela existe?
Exemplo - Haplospiza rustica - Slaty Finch
Distribuição Prevista do Slaty Finch
Redescoberta do
“Slaty Finch” - 1995
Quão bem podemos prever?
Brown Thrasher (Toxostoma rufum)
1. Escolhem-se 20
estados para testes
Quão bem podemos prever?
Brown Thrasher (Toxostoma rufum)
2. Plotar dados de ocorrência (fonte: US Breeding Bird Survey)
3. Omitir dados dos 20 estados de teste
Quão bem podemos prever?
Brown Thrasher (Toxostoma rufum)
4. Modelar a distribuição
potencial baseado nos dados da BBS
Quão bem podemos prever?
Brown Thrasher (Toxostoma rufum)
5. Testar a previsão:
sobrepondo os dados da
BBS para os 20 estados de teste
Quão bem podemos prever?
Brown Thrasher (Toxostoma rufum)
•
•
•
•
•
Previsão aleatória: 252 pontos
715 dos 741 pontos de teste previstos corretamente
Significância estatística P < 10-225
Todos 34 pássaros testados com significância
Nenhuma excedeu 10-3
Apoio à Decisão: US Gap Analysis vs GARP



Cinza = Gap
Verde = TSA + GARP
Preto = BBS transects
Vermelho = ocorrências documentadas
Mourning Warbler
Testado em Maine
(com mais 30 outras
espécies de pássaros)
29 das 31 espécies:
modelos do GARP
significativamente
melhores que os da
metodologia GAP
Apoio à Decisão:
Endemismo nas Florestas do Sudoeste do México
• Distribuição de 16 aves endêmicas das florestas do SO mexicano
• Previsão usando o Species Analyst + GARP a partir de dados de museus
Apoio à Decisão:
Endemismo nas Florestas do Sudoeste do México
Concentração primária de
espécies endêmicas (12 espécies)
Concentração secundária (4 espécies)
Onde investir em conservação?
Apoio à Decisão:
Endemismo nas Florestas do Sudoeste do México
Reservas ecológicas
não atingem a
concentração
secundária
Concentração primária de
espécies endêmicas (12 espécies)
Concentração secundária (4 espécies)
Conseqüências das Mudanças
Climáticas para a Biodiversidade
Mudanças climáticas globais são uma
realidade, envolvendo processos muito
complexos para serem chamados
apenas de “aquecimento global”. As
suas conseqüências para a
biodiversidade continuam sem
avaliação e muito interesse.
Metodologia de Análise

Adquirir dados de distribuição para muitas espécies
(aves, mamíferos, borboletas ...)

Construir modelos ecológicos para cada espécie
usando GARP baseados em camadas geográficas
atuais

Prever e caracteriza a distribuição geográfica de
cada espécie
Metodologia de Análise

Ajustar as camadas geográficas de acordo com
projeções de modelos de mudança global em
larga escala

Projetar as distribuições de cada espécie nas
camadas geográficas ajustadas

Comparar e contrastar as distribuições correntes
e projetadas considerando todas as espécies
utilizadas
Temperatura Atual
Mudanças Projetadas na Temperatura
Precipitação Atual
Mudanças Projetadas na Precipitação
Pontos de Ocorrência
de Atlapetes virenticeps
0 r 0.50 0.99 28.55 0.35 0.504
IF
- Elev*0.26 r + Precip*0.19 r - Temp*0.10 r
THEN Taxon=BACKGROUND
4 r 0.53 0.86 23.58 0.51 0.314
IF
+ Elev*0.32 r - Precip*0.19 r - Temp*0.10 r
THEN Taxon=PRESENT
1 r 0.49 0.91 26.32 0.39 0.122
IF
- Elev*0.02 r + Precip*0.28 r - Temp*0.30 r
THEN Taxon=BACKGROUND
3 m 0.49 0.85 23.73 0.44 0.028
IF Elev=[1482,3360]r AND Precip=[ 1, 4]r AND Temp=[ 2, 4]r
THEN Taxon=PRESENT
6 d 0.49 0.86 20.90 0.33 0.019
IF Elev=[1937,3241]r
THEN Taxon=PRESENT
2 d 0.49 0.85 23.78 0.44 0.013
IF Elev=[ 0,2727]r AND Precip=[ 4, 9]r
THEN Taxon=BACKGROUND
5 d 0.48 0.83 22.11 0.41 0.000
IF Elev=[1640,2866]r AND Precip=[ 1, 4]r AND Temp=[ 2, 5]r
THEN Taxon=PRESENT
Atlapetes virenticeps:
Modelo de nicho ecológico
Previsão de Distribuição Geográfica
de Atlapetes virenticeps
0 r 0.50 0.99 28.55 0.35 0.504
IF
- Elev*0.26 r + Precip*0.19 r - Temp*0.10 r
THEN Taxon=BACKGROUND
4 r 0.53 0.86 23.58 0.51 0.314
IF
+ Elev*0.32 r - Precip*0.19 r - Temp*0.10 r
THEN Taxon=PRESENT
1 r 0.49 0.91 26.32 0.39 0.122
IF
- Elev*0.02 r + Precip*0.28 r - Temp*0.30 r
THEN Taxon=BACKGROUND
3 m 0.49 0.85 23.73 0.44 0.028
IF Elev=[1482,3360]r AND Precip=[ 1, 4]r AND Temp=[ 2, 4]r
THEN Taxon=PRESENT
6 d 0.49 0.86 20.90 0.33 0.019
IF Elev=[1937,3241]r
THEN Taxon=PRESENT
2 d 0.49 0.85 23.78 0.44 0.013
IF Elev=[ 0,2727]r AND Precip=[ 4, 9]r
THEN Taxon=BACKGROUND
5 d 0.48 0.83 22.11 0.41 0.000
IF Elev=[1640,2866]r AND Precip=[ 1, 4]r AND Temp=[ 2, 5]r
THEN Taxon=PRESENT
Atlapetes virenticeps:
Modelo de nicho ecológico
Modelo para Atlapetes virenticeps
Projetado nas Camadas Ajustadas
Atlapetes virenticeps:
Antes vs. Depois
Ortalis poliocephala:
Antes vs. Depois
Oreophasis derbianus:
Antes vs. Depois
Detalhes das Análises
de Segunda Geração

Modelo de Circulação Geral HadCM2 – usando
dois cenários:
–
–
–



HHGSDX50 - 0.5%/ano CO2
HHGGAX50 - 1%/ano CO2
Resolução de 0.5 x 0.5 graus
Seis camadas ambientais
Três cenários de habilidade de dispersão
1600 espécies – aves, mamíferos, e 2 famílias de
borboletas
100
Universal dispersal
No dispersal
Contiguous areas
HHGGAX50
50
0
-50
-100
-100
-80
-60
-40
-20
0
HHGSDX50
20
40
60
80
100
3
HHGGAX50
Universal
Dispersão
Universal
HHGSDX50
2
1
0
-100 - -75
-75 - -50
-50 - -25
-25 - 0
0 - 25
25-50
50 - 75
75 - 100
-25 - 0
0 - 25
25-50
50 - 75
75 - 100
-25 - 0
0 - 25
25-50
50 - 75
75 - 100
5
Área Contíguas
Frequency
4
3
2
1
0
-100 - -75
-75 - -50
-50 - -25
5
Sem Dispersão
4
3
2
1
0
-100 - -75
-75 - -50
-50 - -25
Percent change in area
3
HHGGAX50
Universal
Dispersão
Universal
HHGSDX50
2
1
0
-100 - -75
-75 - -50
-50 - -25
-25 - 0
0 - 25
25-50
50 - 75
75 - 100
-25 - 0
0 - 25
25-50
50 - 75
75 - 100
-25 - 0
0 - 25
25-50
50 - 75
75 - 100
5
Contiguous areas
Frequency
4
Áreas Contíguas
3
2
1
0
-100 - -75
-75 - -50
-50 - -25
5
Sem Dispersão
4
3
2
1
0
-100 - -75
-75 - -50
-50 - -25
Percent change in area
3
HHGGAX50
Dispersão Universal
HHGSDX50
2
1
0
-100 - -75
-75 - -50
-50 - -25
-25 - 0
0 - 25
25-50
50 - 75
75 - 100
-25 - 0
0 - 25
25-50
50 - 75
75 - 100
5
Frequency
4
Áreas Contíguas
3
2
1
0
-100 - -75
-75 - -50
-50 - -25
5
Dispersão Limitada
4
3
2
1
0
-100 - -75
-75 - -50
-50 - -25
-25 - 0
0 - 25
Percent change in area
25-50
50 - 75
75 - 100
Todas as 1600 espécies analisadas
200
Universal dispersal
180
160
140
100
80
60
40
20
100
0
0
20
40
60
80
100
120
140
DX
90
160
No dispersal
180
200
80
70
?
60
AX
AX
120
50
40
30
20
10
0
0
10
20
30
40
50
DX
60
70
80
90
100
Colonização
e Extinção
Borboletas do Canadá
Riqueza de Espécies Atual
HGAX 2020
HGAX 2050
HSDX 2020
HSDX 2050
Comparação da Riqueza Máxima:
Atual com HSDX 2020
2020
Atual
A Biodiversidade e as
Mudanças Climáticas Globais


A mudança no clima nos próximos 50
anos envolverá complexas reorganizações
de condições ambientais
Espera-se que as conseqüências para
espécies animais e vegetais sejam sérias,
envolvendo reduções drásticas para
muitas espécies, e a extinção para outras
Invasive Species



Impacto sobre sistemas e
recursos naturais
Impacto sobre
agroecosistemas
Causa a extinção de
espécies nativas
Solução Atual: Reativa
Detecção da espécie invasora após a
invasão
 Abordagem de combate somente
espécie por espécie
 Abordagens não têm contexto teórico
 Abordagens de combate são

completamente reativas
Nova Solução – Metodologia




Uso de bancos de dados distribuídos para
obter dados sobre a distribuição nativa ou
introduzida
Uso do GARP ou BioClim para modelar o
nicho ecológico de invasores em potencial
Projetar os modelos ecológicos às áreas de
invasão em potencial
Avaliar o risco e localizar áreas críticas
para combate às invasões
Espécies Invasoras
Temperatura
Ecologia
Modelo do Nicho Ecológico
Precipitação
Projeção sobre
outra região
Geografia
Algoritmo
Pontos de Ocorrência
Previsão da
Distribuição
Nativa
Previsão de
Invasão
Largemouth Bass
No Japão?
Pontos de Ocorrência na América do Norte, a
partir de dados da FishNet (2437 registros)
Distribuição Potencial Prevista para a
América do Norte
Mapa-Mundi I
Mapa-Mundi II
Distribuição Prevista no Japão
Previsão do Ratão do Banhado
na América do Norte
Pontos de Distribuição Nativa
Modelo de Distribução Nativa
P < 0.03
em todos
os modelos
Projeção na
América do
Norte
Glassy-winged Sharpshooter
Homolodisca coagulata
Pontos Conhecidos –
Distribuição Nativa
Modelo GARP inferido a partir dos pontos
Distribução Nativa –
Mudanças Climáticas
Projeção na Califórnia
Testes do Model de Previsão
Distribuição na Califórnia
com Mudanças Climáticas
Distribuição Potencial na
America do Sul
Distribuição Potencial na Europa
Aula prática






Introdução ao pacote de ferramentas para
modelagem DesktopGarp
Preparação dos dados
Entrada dos dados
Seleção de informação espacial e ambiental
Processamento e análise dos resultados
Outras aplicações: espécies invasoras,
mudanças climáticas, projeção no tempo
Desktop Garp

Aplicativo Windows para criação de modelos
de distribuição de espécies:
–
–


modelos para múltiplas espécies
com suporte para estudos de espécies invasoras e
mudanças climáticas
Desenvolvido em conjunto pelo CRIA e
Biodiversity Research Center - Universidade
do Kansas
Lançamento oficial em poucas semanas
Download