Análise Espacial de Áreas:
Regressão
Análise Espacial de Dados Geográficos
SER-303
Novembro/2005 (Flávia Feitosa)
Análise de Regressão

Descreve ou estima uma variável dependente (Y) a partir de
seu relacionamento com variáveis independentes (X)


Ex: Y = aX + b
Objetivos

Determinar como (e se) duas ou mais variáveis se relacionam.
 Descrever como as variáveis se relacionam (função).
 Prever valores futuros da variável dependente (Y).
Regressão Linear Simples
Yi=0+1Xi +i
Yi é o valor da variável dependente na i-ésima observação;
0 e 1 são parâmetros;
Xi é uma constante conhecida; é o valor da variável independente na iésima observação;
i é um termo de erro aleatório com distribuição normal, média zero e
variância constante 2 (E(i )=0 e 2 (i )= 2 )
i e j são não correlacionados (independentes) para i  j
Modelo de Regressão Linear
Inclinação
Intercepto
Populacional Populacional
Variável
Independente
Yi=0+1Xi +i
Variável
Dependente
Yi
i
Y
1
Erro
Aleatório
Y = E(Y) = 0 + 1 X
Coeficiente
angular
Ŷi=b0+b1Xi Modelo estimado
i =Yi-Ŷi Resíduo
0
X
Regressão Linear Múltipla
Yi=0+1Xi1 + 2Xi2 +…+ pXip + i
Yi é o valor da variável dependente na i-ésima observação
0, …, p são parâmetros
Xi1 ,…,Xip são os valores das variáveis independentes na i-ésima
observação
i é um termo de erro aleatório com distribuição normal, média zero e
variância constante 2 (E(i )=0 e 2 (i )= 2 )
i e j são não correlacionados (independentes) para i  j
Coeficiente de Determinação

Análise de Variância
SQTo = SQReg + SQRes
2
ˆ  Y)2  (Y  Yˆ )2
(Y

Y
)

(
Y
 i
 i
 i i

Coeficiente de determinação: R2=SQReg/SQTo
Proporção da variância total de Y que é “explicada” pela equação de
regressão.
 Varia entre 0 e 1
 Quanto mais próximo de 1, melhor o ajuste do modelo.

Análise da Aptidão do Modelo
Análise dos Resíduos – Verificar:

Se função de regressão é linear
Resíduo

0
X
Não Linearidade
Análise da Aptidão do Modelo
Análise dos Resíduos – Verificar:

Se os erros possuem variância constante
(homocedasticidade)
Variância Não Constante
Resíduo

0
X
Análise da Aptidão do Modelo
Análise dos Resíduos – Verificar:

Se os erros são independentes
Resíduo

0
X
Erros Correlacionados
Análise da Aptidão do Modelo
Análise dos Resíduos – Verificar:

A presença de outliers
Gráfico dos Resíduos
1
0,8
Resíduos Padronizados

0,6
0,4
0,2
0
150
155
160
165
170
-0,2
-0,4
X
175
180
185
Análise da Aptidão do Modelo

Análise dos Resíduos – Verificar:

Se erros são normalmente distribuídos
Análise da Aptidão do Modelo
Análise dos Resíduos – Modelo Adequado:
Resíduo

0
X
Análise da Aptidão do Modelo

Análise dos Resíduos : DADOS ESPACIAIS

Hipótese de independência das observações em geral é Falsa 
Dependência Espacial

Efeitos Espaciais


Se existir forte tendência ou correlação espacial, os resultados serão
influenciados, apresentando associação estatística onde não existe (e
vice-versa).
Como verificar?

Medir a autocorrelação espacial dos resíduos da regressão (Índice de
Moran dos resíduos)
Exemplo
São José dos Campos
Crescimento Populacional 91-00 X Densidade Populacional 91

Índice de Moran sobre
mapa de resíduos
I=0,45

Testes de pseudosignificância indicam
autocorrelação espacial
Regressão Espacial

Autocorrelação espacial constatada!
E agora?

Modelos de regressão que incorporam efeitos espaciais:

Globais: utilizam um único parâmetro para capturar a estrutura de
correlação espacial
 Locais: parâmetros variam continuamente no espaço
Modelos com Efeitos Espaciais Globais

Suposição:


É possível capturar a estrutura de correlação espacial num
único parâmetro (adicionado ao modelo de regressão).
Alternativas:


Spatial Lag Models: atribuem a autocorrelação espacial à variável
dependente Y.
Spatial Error Models: atribuem a autocorrelação ao erro.
Spatial Lag Model

Suposição

a variável yi depende dos valores da variável dependente nas
áreas vizinhas a i:
Y = WY + X + 



 = medida de correlação espacial
 = 0, se autocorrelação é nula
W = matriz de proximidade espacial
Spatial Error Model

Efeitos espaciais são um ruído
Y = X + 
 = W  + ξ

W = erro com efeitos espaciais

 = medida de correlação espacial
ξ = componente do erro com variância constante e não
correlacionada.

Spatial Lag Model X Spatial Error Model

Motivações diferentes, porém próximos em termos formais.

Premissa: processo espacial analisado é estacionário e pode
ser capturado em um único parâmetro.

Porém isto nem sempre é verdade!

Verificar se padões diversos de associação espacial estão
presentes.
 Indicadores Locais de Autocorrelação Espacial
Indicadores Locais de Variabilidade Espacial

distribuição dos valores de
correlação local para o índice de
exclusão
% Exclusão
Não significantes
p = 0.05
[95% (1,96)]
p = 0.01
[99% (2,54)]
p = 0.001 [99,9% (3,2)]
Modelos com Efeitos Espaciais Locais

Modelos de Regressão com Efeitos Espaciais Discretos

variações espaciais modeladas de maneira discreta.
 Regimes espaciais

Modelos de Regressão com Efeitos Espaciais Contínuos

variações espaciais modeladas de forma contínua, com parâmetros
variando no espaço.
 “Geographically Weighted Regression” – GWR.
Regimes Espaciais

Regionalizações da área
de estudo

Diferentes tipos de
variabilidade espacial

Métricas: Diagrama de
espalhamento e índices
locais e globais

Ex: Regimes espaciais
para índice de exclusão
Regimes Espaciais x Regiões
Administrativas
Impacto de Regimes Espaciais

Análise de Regressão


Regressão Linear


Idosos = f ( Domicílios Sem Esgoto)
R2 = 0,35
Regressão Espacial
Regiões Adm (R2 = 0,72)
 Regimes Espaciais (R2 = 0,83)


Para dados socioeconômicos:

modelo de regimes espaciais tende a apresentar resultados
melhores que os de regressão simples ou de regressão espacial
com efeitos globais.
GWR – geographically weighted regression

Ajusta um modelo de regressão a cada ponto observado,
ponderando todas as demais observações como função da
distância deste ponto.
Y(s) = (s)X + 
Y(s): variável que representa o processo no ponto s.
(s): parâmetros estimados no ponto s.
GWR – geographically weighted regression


Os parâmetros podem ser apresentados visualmente para identificar
como se comportam espacialmente os relacionamentos entre as
variáveis.
Ex: Crescimento Pop. (dependente) X Densidade Pop. (independente)
GWR – geographically weighted regression

Ex: Crescimento Pop. (dependente) X Densidade Pop. (independente)

Mapa de resíduos (I = 0,04) :
Softwares

GeoDa


SPRING e Terraview


Regressão Clássica e Espacial (Spatial Lag & Spatial Error)
R, aRT + TerraView


Índice de Moran, LISA maps
SpaceStat


Índice de Moran, LISA maps, Regressão Clássica e Espacial
(Spatial Lag & Spatial Error)
Regressão Clássica, Espacial (Spatial Lag & Spatial Error) e GWR
GWR 3.0

Regressão Clássica e Espacial (GWR)
Download

Análise Espacial de Áreas: Regressão