Introduction to Spatial Econometrics
André Braz Golgher1
Abstract
This paper is part of a series that discusses introductory concepts of spatial econometrics2. The
texts were written in Portuguese and intend to present this field of study to students at upper
undergraduate to graduate levels in Economy and in Regional Sciences. This first paper of the
series has as main objective to present some of the very basic topics of spatial econometrics,
such as: spatial dependency and spatial heterogeneity, introduction to spatial models, and
weights matrix. I present different types of spatial models, including some of the motivations to
use them. In order to provide a broader perspective of the applicability of the models, I include a
brief discussion and empirical applications for each spatial model, which were applied in
different fields of interests. Moreover, the present discussion also serves as a basis for the
subsequent discussion presented in the following papers of this series.
Key words: spatial econometrics; weights matrix; spatial dependency; spatial heterogeneity
1
Associate Professor at the Economics Department of Cedeplar/FACE/UFMG, visiting scholar at the Regional
Research Institute (RRI) at the West Virginia University (WVU) and visiting scholar at the Carolina Population
Center (CPC) at the University of North Carolina (UNC) in Chapel Hill.
2
A large part of the references selected for these texts comes from the readings assigned by professor Donald
Lacombe in his course ARE 693L Spatial Econometrics (spring 2012) at the WVU
(http://community.wvu.edu/~djl041/teaching.html).
1
Introdução à Econometria Espacial
André Braz Golgher3
Resumo
Esse texto faz parte de uma série que apresenta a econometria espacial em pontos introdutórios.
O objetivo principal desse primeiro texto é apresentar esse tema de forma introdutória,
abordando tópicos como: dependência espacial e heterogeneidade espacial, uma introdução aos
modelos espaciais e matriz de vizinhança. Em seguida são apresentados diferentes tipos de
modelos espaciais, incluindo motivações para o uso desses modelos, e aplicações empíricas
utilizadas em diferentes áreas do conhecimento e com metodologias distintas. A discussão
teórica inicial, a apresentação dos diversos modelos espaciais e a incorporação de um grupo de
referências com aplicações empíricas teve como intenção dar ao leitor uma visão geral das
possibilidades de aplicação da econometria espacial. A presente discussão também serve como
base para a discussão apresentada nos demais textos da serie.
Palavras chave: econometria
heterogeneidade especial.
especial,
matriz
de
peso,
dependência
especial,
1 - Introdução
Esse texto faz parte de uma série que apresenta a econometria espacial em pontos introdutórios4.
Esse primeiro texto da série tem como objetivo discutir esse tema de forma breve e introdutória.
O texto discute alguns conceitos como heterogeneidade espacial e dependência espacial, matrizes
de vizinhança, motivações para o uso de modelos espaciais e equações básicas dos modelos
3
Professor do Cedeplar/FACE/UFMG, pesquisador visitante do Regional Research Institute (RRI) da West Virginia
University (WVU) e pesquisador visitante do Carolina Population Center (CPC) na University of North Carolina
(UNC) em Chapel Hill.
4
Grande parte do material citado aqui foi selecionado da ementa do curso ARE 693L Spatial Econometrics (spring
2012) (http://community.wvu.edu/~djl041/teaching.html) ministrado por Donald Lacombe do RRI da WVU.
2
espaciais. Procurou-se introduzir os vários conceitos de forma paulatina e didática, sem que as
explicações ficassem longas ou formais demais. Entretanto, o texto incorpora alguns conceitos
formais quando essa abordagem foi julgada necessária para se discutir a questão da motivação
teórica de se utilizar os modelos espaciais. Para facilitar a compreensão do leitor, foi incluído
um breve apêndice matemático no final do texto, que busca ajudar a compreensão de algumas
passagens matemáticas utilizadas na apresentação dos modelos espaciais. Alguns trabalhos
empíricos que aplicaram a econometria espacial em diferentes áreas do conhecimento e com
metodologias distintas foram citados ou brevemente comentados no texto. O objetivo foi dar ao
leitor uma visão geral das possibilidades de aplicação dos modelos espaciais.
O texto foi dividido em 5 seções, além dessa breve introdução. Na primeira, introduz-se o campo
de estudo da econometria espacial, discutindo algumas das suas particularidades, que
diferenciam da econometria padrão. Em seguida, introduz-se o modelo espacial com um exemplo
de dependência espacial na determinação de preços no mercado imobiliário. Ponto fundamental
nos modelos espaciais, a matriz de vizinhança é o tema abordado na terceira seção. Na seção
quatro, apresenta-se uma série de modelos espaciais, com algum detalhamento formal,
procurando abordar a questão da motivação teórica de se utilizar esses modelos. A última seção
conclui o texto.
2 - Conceitos iniciais da econometria espacial
A econometria espacial faz parte do campo de estudo da econometria, mas apresenta algumas
particularidades que a diferenciam dessa última. Segue uma discussão sobre essas
particularidades, a partir de exemplos da economia regional e urbana, área de estudo na qual os
modelos espaciais são muito usados.
Em muitos estudos aplicados desse campo de estudo, as análises estatísticas são feitas com dados
sobre áreas específicas, como dados socioeconômicos ou demográficos agregados para alguma
unidade espacial de análise. Por exemplo, taxas de crescimento econômico ou níveis de pobreza
medidos para algum país ou região. Também são utilizados dados pontuais localizados em uma
determinada área, com preços de imóveis. Dados assim, apesar de representarem ou se
3
localizarem em áreas com localização específica, podendo ser associados do ponto de vista
geográfico, são muitas vezes tratados em modelos econométricos como observações
independentes.
Para exemplificar descrevemos análises sobre os determinantes de preços no mercado
imobiliário. Vários fatores influenciam a determinação do preço de um imóvel, as mais óbvias
são as próprias características destes, como tamanho, idade, qualidade de acabamento etc. Essas
variáveis são relativamente fáceis de serem definidas, quantificadas ou incorporadas em modelos
econométricos.
Além das próprias características dos imóveis, a localização de uma casa ou de um apartamento
também influencia na determinação de preços (Dubin, 1998). Assim, a localização das
observações também pode ser incorporada à análise, enriquecendo as equações econométricas de
determinação dos preços dos imóveis. Por exemplo, podemos incluir nos modelos dummies
indicando a localização do imóvel. Ou ainda, se a localização impacta na determinação dos
preços, existe a possibilidade que imóveis localizados em uma mesma vizinhança sejam afetados
pelos mesmos fatores locais. Assim, atributos locacionais que impactam na determinação de
preços de imóveis também podem ser incorporados à análise.
Entretanto, existem certas limitações quanto a essa inclusão de variáveis locacionais. Por
exemplo, quais variáveis devem ser incluídas nos modelos para caracterizar os fatores associados
à vizinhança? Como definir vizinhança, que é algo não estritamente observável? Isso implica que
quando queremos utilizar variáveis de vizinhança, devemos necessariamente utilizar proxies para
caracterizá-la, variáveis como: características socioeconômicas dos moradores locais; existência
de serviços urbanos no local; ou as taxas locais de criminalidade. Estas variáveis, além de serem
apenas proxies e em número limitado, possivelmente retratam a vizinhança de forma imperfeita.
Existem ainda outras limitações na definição de vizinhança. Nas análises, assume-se alguma
divisão geográfica arbitraria de área: municípios, unidades de planejamento de um município,
setor censitário etc. Essa divisão também representa vizinhanças apenas de forma imperfeita
incorporando, assim, erros de medida (LeSage, 1997; Anselin, 1988). Por exemplo, ao
4
agregarmos dados de uma área específica, representamos toda uma vizinhança por um valor
médio de alguma variável, e esta pode englobar regiões não-homogéneas.
Assim, se atributos da vizinhança onde o imóvel se localiza e que impactam no preço, como
amenidades e presença de serviços urbanos, não forem incorporados à análise ou forem incluídos
com as limitações citadas, dois imóveis localizados próximos um do outro em uma região que é
mais valorizada do que foi possível medir pelas variáveis incorporadas ao modelo, ambos
possivelmente apresentarão erros estocásticos positivos nos modelos econométricos. Por outro
lado, o contrário possivelmente ocorrerá com outros imóveis localizados em outras regiões, onde
o baixo valor venal não foi captado pelas variáveis incluídas no modelo. Ou seja, dadas as
limitações discutidas acima, modelos econométricos que tratam as observações de forma
independente possivelmente apresentarão erros estocásticos espacialmente correlacionados.
Além disso, podemos ter a interação entre as observações. Por exemplo, se um imóvel é cercado
de imóveis com boas características, como possuir jardins bens cuidados e serem bem acabados,
possivelmente valerá mais do que outro similar em uma área semelhante com construções
vizinhas em pior estado.
Ou seja, devido a essas limitações discutidas acima, pode-se observar em dados
georreferenciados fatores como a dependência espacial e/ou a heterogeneidade espacial. A
dependência espacial é geralmente definida como a falta de independência entre observações.
Essa dependência pode ter como origem uma série de fatores que são associados a erros de
medida comumente observados em trabalhos empíricos, como os já citados. Outro fator
associado à dependência espacial, talvez o mais importante, seja possível existência de
externalidades e spillovers entre as observações (Anselin, 1988). Um exemplo disso, como
vimos, é quando os preços de imóveis são afetados pelas características ou mesmo pelos preços
dos imóveis vizinhos. Ou ainda: regiões com elevado nível de capital humano tendem a
apresentar spillover positivo para as demais; firmas de um mesmo setor podem se beneficiar da
presença de outras similares devido à troca mais efetiva de informações etc.
Fenômenos como interações espaciais, processos de difusão e hierarquias espaciais se
relacionam diretamente com a interdependência entre as observações, implicando que a
5
localização e a distância entre as observações são fatores que deveriam ser incorporados aos
modelos econométricos que tratam destas questões. Como forma de incorporar correções para a
dependência espacial, podemos relacionar os dados ao espaço de forma mais efetiva do que o
apresentado acima, incluindo explicitamente na análise a distância entre as diversas regiões, aos
erros espacialmente correlacionados e/ou interações entre as observações. Modelos que
incorporam explicitamente a dependência espacial entre as observações abordam problemas que
não são tratados de forma efetiva pelos métodos da econometria padrão (LeSage, 1997).
Além da dependência espacial, a similaridade entre observações próximas também é esperada
devido à heterogeneidade espacial. Esta é relacionada com a estabilidade observada no espaço
com relação a diversas variáveis que apresentam uma estrutura espacial desigual, fato observado,
por exemplo, em indicadores socioeconômicos. Regiões próximas tendem a ter características
similares umas das outras, mesmo que isso não seja causado por erros de medida ou por
externalidades e sim por equilíbrios de longo prazo obtidos, por exemplo, por fatores históricos
em comum ocorridos no desenvolvimento das localidades. Note que, ao contrário dos problemas
relacionados com a dependência espacial, os problemas causados pela heterogeneidade espacial
podem ser abordados pelas técnicas econométricas não espaciais. Entretanto, o conhecimento
teórico sobre a estrutura espacial dos dados pode tornar os procedimentos de estimação mais
eficientes. Além disso, em alguns problemas, distinguir o que é dependência espacial e o que é
heterogeneidade espacial pode ser complicado (Anselin, 1988, 1999).
Sintetizando essa discussão acima, Anselin (1988) define a econometria espacial como “uma
coleção de métodos e técnicas, baseados na representação formal da dependência espacial e
heterogeneidade espacial, que tratam de forma efetiva da peculiaridade causada pelo espaço em
análises estatísticas em modelos da ciência regional”.
Segundo esse autor, o campo de estudo da econometria espacial, que nos anos 70 e 80 podia ser
considerada como um campo marginal em estudos aplicados à economia urbana e regional,
passou recentemente a fazer parte do núcleo central de estudos em economia e de outras ciências
sociais, uma vez que o uso de métodos associados a essa área se ampliou e esta sendo usada em
uma ampla gama de aplicações e campos de estudos (Anselin, 2010).
6
Dois fatores principais foram os responsáveis por essa popularização da econometria espacial
(Anselin, 1999). O primeiro foi o crescente interesse da teoria econômica de não se ater ao
agente econômico isolado como tomador de decisões e incorporar explicitamente a interações
entre agentes em um sistema, além de discutir como que essas interações individuais promovem
padrões de comportamento coletivo devido a efeitos de grupo e de vizinhança (Akerlof, 1997;
Borjas, 1995; Durlauf, 1994; Glaeser et al, 1996) e a interação estratégica entre agentes
(Brueckner, 1998).
Um segundo fator que promoveu a popularização da econometria espacial foi o aumento da
quantidade de base de dados georreferenciados e o desenvolvimento de métodos para tratar esse
tipo de informação com características diferenciadas, que não são tratados de forma efetiva pelos
métodos da econometria padrão. Assim, o reconhecimento que novos modelos tinham que ser
desenvolvidos foi um fator que motivou o desenvolvimento da econometria espacial.
Mais especificamente no campo das ciências e economia sociais, os modelos espaciais são
utilizados em uma ampla gama de aplicações em ciências sociais (Case e Katz, 1991; Ciriaci e
Palma, 2008; Darmofal, 2006; Hays et al, 2010; Monastiriotis, 2009; Voss et al, 2006), incluindo
aplicações no Brasil (Aguiar et al, 2012; Chomitz et al, 2005; Puech, 2004). Além disso, esses
modelos são também aplicados em estudos sobre a educação (Appleton and Balihuta, 1996;
Asadullah and Rahman, 2009; Gille, 2011; Gordon e Monastiriotis, 2006, 2007; Millimet e
Rangaprasad, 2006; Tselios, 2008; Weir and Knight, 2004).
Como discutido aqui, um ponto que difere a econometria espacial dos demais campos da
econometria é que os modelos incorporam explicitamente a dependência espacial entre as
observações. Esses temas são discutidos na próxima seção de forma um pouco mais formal.
3 - Introdução aos modelos espaciais
Na seção anterior vimos que a dependência espacial e heterogeneidade espacial entre as
observações podem resultar em erros de estimação em modelos econométricos não espaciais
(LeSage, 1997), uma vez que as observações podem apresentar correlação espacial entre as
7
observações ou nos erros estocásticos dos modelos. Entretanto, existem vários modelos que
utilizam os métodos da econometria espacial e abordam explicitamente problemas relacionados a
espacialidade das observações (LeSage e Pace, 2009). Nesta seção apresenta-se o modelo
espacial de forma um pouco mais formal. Para facilitar o entendimento do leitor aqui também
será utilizado o exemplo da determinação de preços no mercado imobiliário.
Uma análise cross-section convencional com modelos MQO pode ser representada pela equação
abaixo:
yi    X i    i ,  i ~ N (0, 2 ) , onde uma amostra com n observações independentes yi , i = 1,
. . . , n , é linearmente relacionada com um intercepto  , com k variáveis explicativas presentes
em uma matriz X e com  , o vetor dos k parâmetros estimados. Assume-se que o erro é
normalmente distribuído com média zero e variância  2 .
Podemos representar todas essas n equações de forma sintética no seguinte formato:
(1) Y  X   ,  i ~ N (0, I 2 ) , onde Y é um vetor n x 1, a matriz X tem dimensão n x (k + 1),
1
 
pois incorpora o vetor in , um vetor formado de números 1, in   ...  , referente ao intercepto  ,
1
 
e o vetor  , de dimensão (k + 1) x 1, também contém o coeficiente relacionado ao intercepto.
Seguindo o exemplo de preços de imóveis, teríamos um modelo hedônico de determinação de
preços, onde o preço de um imóvel, yi , seria relacionado com os atributos do imóvel como área,
idade, tamanho etc., além de proxies relacionadas à vizinhança. Todas essas variáveis
explicativas incorporados na matriz X.
Assume-se, dentre outros aspectos, que uma observação é independente das demais, o que
simplifica a estimação do modelo. Em termos matemáticos para duas observações distintas,
i  j , temos:
E[ i  j ]  E ( i ) E ( j )  0 .
8
Entretanto, por exemplo, se atributos da vizinhança onde o imóvel se localiza e que impactam no
preço, como amenidades e presença de serviços urbanos, não forem incorporados a análise, dois
imóveis localizados próximos um do outro em uma região valorizada de uma cidade
possivelmente ambos apresentarão erros positivos. Além disso, se uma casa é valorizada por
apresentar um belo jardim, possivelmente a casa ao lado, mesmo que não possua um jardim, será
valorizada por essa presença próxima de arvores e flores, mesmos que em menor magnitude. Ou
seja, os erros das observações deixam de ser independentes como especificado acima. Como
vimos, outro fator que pode tornar as observações não independentes é que quando agregamos os
dados, por exemplo, se expressamos os valores dos imóveis como uma media local, os resultados
podem apresentar dependência espacial e/ou heterogeneidade espacial devido à forma como os
dados foram agregados (Anselin, 1988). Assim, em contextos em que pode existir omissão de
variáveis, limitações relacionadas à agregação dos dados, ou interações e externalidades entre as
observações, essa suposição de independência das observações torna-se irreal, e modelos MQO
possivelmente apresentarão uma estimação enviesada ou não serão eficientes.
O modelo a seguir incorpora a dependência espacial entre as observações nas estimativas de
preços para dois imóveis 1 e 2. Na equação (2), o preço do imóvel 1, y1 , seria determinado pelos
seus próprios atributos e pelas características de vizinhança incluídas na analise, X 1 , e também
pelo preço do imóvel vizinho 2, y 2 . A dependência dessa última variável em y1 é dado por
12 y2 , que representa uma proporção do preço de y 2 . O mesmo ocorreria com o imóvel 2 na
equação (3):
(2)
y1  12 y2  X 1  1 ,  1 ~ N (0, 2 )
(3)
y 2   21 y1  X 2    2 ,  2 ~ N (0,  2 )
Para esse mesmo exemplo com dois imóveis, assumindo, por simplicidade, que a matriz X tem
duas variáveis explicativas, podemos escrever esse modelo como:
(4)
 y1   0  12  y1  1 x11
   
   
 y 2    21 0  y 2  1 x 21
 0 
x12     1 
 1    
x 22     2 
 2 
9
Essas equações podem ser reescritas como:
(5)
 12 
 0

 y1 
  y1  1 x11
    
   
 y2 
  21
0  y 2  1 x 21



(6)
 y1 
 0
    
 y2 
 w21
w12  y1  1 x11
   
0  y 2  1 x 21
 0 
x12     1 
 1    
x 22     2 
 2 
 0 
x12     1 
 1    
x 22     2 
 2 
Note que na equação (6) temos duas observações e cinco incógnitas a definir, três referentes ao
vetor  ,  0 , 1 e  2 , e outros duas associados a matriz de vizinhança ou matriz de pesos,
w12 e w21 . Tomemos um modelo com três imóveis e essas mesmas duas variáveis explicativas:
(7)
 y1 
 0 w12
 

 y 2     w21 0
y 
w
 3
 31 w32
w13  y1  1 x11
  
w23  y 2   1 x21
0  y3  1 x32
x12   0    1 
   
x22  1     2 
x33   2    3 
Note que nesse sistema com três observações temos nove incógnitas a definir, três referentes ao
vetor  e seis associadas à matriz de pesos. Em ambos os exemplos temos mais incógnitas que
observações. Ou seja, os problemas não têm solução única.
Como resolver esse problema? No caso do vetor  , se aumentarmos o número de observações
fixando o número de incógnitas não existe qualquer problema na estimação dos parâmetros do
vetor. Entretanto, para a matriz de peso, como definida acima, temos n2 – n incógnitas para
estimar no modelo. Ou seja, o numero de incógnitas, n(n – 1), cresce mais rápido do que o
numero de observações, não garantindo a identificação do modelo. Assim, aumentar o tamanho
da amostra não resolve o problema. Devemos então incorporar alguma restrição ao modelo
(Anselin, 1988). Uma solução para esse problema é estabelecer uma estrutura não estocástica
para a matriz de peso (LeSage e Pace, 2009). Ou seja, se estabelece uma estrutura a priori para a
matriz de pesos definido os valores de wij .
10
Uma vez definida a matriz de vizinhança, neste modelo especifico o parâmetro  , que
correlação entre y e Wy, e representa a magnitude da dependência espacial entre as observações,
uma vez que o parâmetro.
Para um modelo com n equações, as equações (7) podem ser escritas de forma mais sintética em
formato de matriz:
(8)
y  Wy  X   ,  ~ N (0, 2 I ) , onde y é um vetor n x 1,  é um escalar, W é uma
matriz n x n, X é uma matriz n x k,  é um vetor k x 1 e  é o erro estocástico com distribuição
normal, média zero, variância  2 e covariância igual a zero.
Esse modelo espacial é conhecido como modelo espacial autorregressivo (SAR) (LeSage e Pace,
2009) ou como modelo de lag espacial (Elhrost, 2010). Anselin (1988) utiliza para este modelo a
denominação modelo espacial autorregressivo misto. Existem vários outros tipos de modelo
espacial, como será discutido na seção 4. Entretanto, antes destes serem abordados, apresentamse na seção 3 alguns pontos relacionados à matriz de vizinhança.
4 - Matriz de pesos
A discussão da seção anterior abordou a questão da não independência das observações,
exemplificada por preços de imóveis. Aqui, usando um raciocínio análogo, discutiremos regiões,
pois isso facilita a discussão sobre a matriz de vizinhança. Atributos regionais, assim com preços
de imóveis, como renda per capita ou indicadores sociais, tendem a apresentar dependência e/ou
heterogeneidade espacial. De forma geral, esperasse que regiões próximas sejam mais
efetivamente relacionadas umas as outras que regiões distantes. Por exemplo, fatores não
observados de regiões vizinhas devem ser mais similares na média do que para regiões distantes.
Assim, segundo a primeira lei da geografia de Tobler: “tudo está relacionado com tudo, mas
coisas mais próximas estão mais relacionadas que as distantes” (Dubin, 1998).
De forma geral, representamos essa lei com valores wij  0 para i  j , onde os pesos de regiões
próximas têm valores maiores ou iguais que os de regiões distantes. Como forma de facilitar a
estimação dos modelos, pode-se assumir que a partir de uma distancia as regiões se associam de
11
forma tão pouco efetiva que o valor de wij é muito pequeno e pode ser considerado zero
(Anselin, 1988). Além disso, por construção, todos os termos da diagonal da matriz são zero:
wii  0 .
Existem infinitas matrizes que satisfazem essas características. Seguem exemplos de matrizes de
peso ou vizinhança.
Uma possibilidade é a do vizinho mais próximo. Dada uma região especifica, selecionam-se os
vizinhos mais próximos dentre todas as demais regiões e determina-se o peso wij  1 . Para todas
as outras regiões, temos wij  0 .
Segue um exemplo com quatro regiões. A região 1 tem como vizinho mais próximo a região 2. A
região 2 tem como vizinho mais próximo a região 1. A região 3 tem como vizinho mais próximo
a região 4. A região 4 tem como vizinho mais próximo a região 2. A matriz abaixo resume essa
informação. Note que uma matriz definida assim não é necessariamente é simétrica.
0

1
W 
0

0

1 0 0

0 0 0
0 0 1

1 0 0 
Esse mesmo padrão pode ser estendido para incluir um número maior de vizinhos, como quatro,
seis etc (Dubin, 1998). Segue o mesmo exemplo acima para dois vizinhos mais próximos. A
região 1 tem como segundo vizinho mais próximo a região 3. A região 2 tem como segundo
vizinho mais próximo a região 3. A região 3 tem como segundo vizinho mais próximo a região 2.
A região 4 tem como segundo vizinho mais próximo a região 3. Obtém-se a matriz abaixo, onde
foi incluída a informação do exemplo anterior.
0

1
W 
0

0

1 1 0

0 1 0
1 0 1

1 1 0 
12
Outra matriz muito utilizada é a matriz de contiguidade de primeira ordem, onde se determina o
peso wij  1 se uma região é contígua à outra, e wij  0 caso contrário (LeSage, 1997; LeSage e
Pace, 2009). No caso dessa matriz, para que ela seja obtida necessariamente devemos ter
fronteiras entre regiões bem definidas (Anselin, 1988). Note que isso não ocorre no caso da
matriz do vizinho mais próximo. Imagine, por exemplo, que você esta estudando a Grécia e todas
aquelas ilhas. Como definir a contiguidade neste caso?
Segue um exemplo de matriz de contiguidade. A região 1 é contígua a região 2. A região 2 é
contígua as regiões 1, 3 e 4. A região 3 é contígua as regiões 2 e 4. A região 4 é contígua as
regiões 2 e 3. A matriz abaixo resume essa informação. Note que a matriz é simétrica.
0

1
W 
0

0

1 0 0

0 1 1
1 0 1

1 1 0 
Existem várias outras matrizes que podem ser utilizadas. Entretanto, note que para que o modelo
espacial seja estimável, essa matriz de vizinhança deve ter algumas propriedades. Por exemplo,
tome a equação (8) novamente:
y  Wy  X   ,  ~ N (0,  2 I n ) .
Manipulando essa equação ficamos com:
y  Wy  X  
( I  W ) y  X  
Se a matriz n x n ( I  W ) tiver inversa (ver Apêndice matemático 1), temos:
y  ( I  W ) 1 ( X   )
Essa última relação é conhecida com processo de geração de dados (DGP) do modelo de lag
espacial. A partir dessa expressão obtemos as estimativas de y do modelo. Modelos diferentes
têm, em geral, DGP distintos, como veremos em discussões posteriores. Para que este modelo
seja estimável, essa matriz inversa deve existir. Em geral, assume-se que   (1,1) . Ou seja, as
variáveis podem ser espacialmente correlacionadas de forma positiva, se   0 , ou de forma
13
negativa, com   0 . Entretanto, note que ao contrário do coeficiente de correlação padrão, esse
parâmetro não assume o valor unitário. Para que a matriz ( I  W ) tenha necessariamente
inversa, fixando  nesse intervalo, um procedimento comum é normalizar a matriz W, para que
as somas das linhas sejam iguais a um.
No caso da matriz de contiguidade citada no exemplo anterior, obtemos a seguinte matriz:
 0

 13
W 
 0
 0

1
0
1
2
1
2
0
1
3
0
1
2
0 

1 
3
1 
2
0 

Neste caso, note que o termo Wy que aparece na equação do modelo é de fácil interpretação. Ele
é a média do valor da variável dependente dos vizinhos. Entretanto, note que essa normalização
da matriz muda o modelo de certa maneira, pois antes todos os pesos wij não nulos eram iguais e
agora podem ser distintos. Matrizes com termos não negativos, cujas linhas têm como soma o
valor um, tem como denominação em inglês o termo row-stochastic (linha-aleatória).
Outra opção é dividir todas as linhas pelo maior valor dentre as somas destas. Tome novamente a
matriz de contiguidade não normalizada. Nesse exemplo temos como maior valor a soma da
linha dois, que assume o valor três. Daí, temos a matriz abaixo. Note que aqui o modelo original
não muda.
 0

1
W  3
 0

 0

1
3
0
1
3
1
3
0
1
3
0
1
3
0 
1 
3
1 
3
0 

14
Pode-se também estabelecer uma distância limite L para as interações não nulas. No caso, para
todas as regiões que se localizarem até esse limite, isto é, d ij  L , temos wij  1 , caso contrario
ficamos com wij  0 .
Note que para todos esses exemplos acima tínhamos originalmente os valores 0 ou 1, que eram
posteriormente normalizados ou não. Entretanto, temos limitações inerentes a essa escolha de
valores binários. Por exemplo, uma área pequena pode ser mais associada a uma grande que
vice-versa. Assim, teríamos duas interações de magnitude distintas, mas representadas por um
mesmo valor.
Essas limitações podem ser evitadas em outras abordagens que não trabalham somente com esses
valores binários. Pode-se, por exemplo, definir o valor de wij como uma função decrescente da
distância entre as regiões: wij  f (d ij ) para i  j , com f ' (d ij )  0 . Exemplos de funções assim
são: f (d ij ) 
1
 pd
, com p > 0 ou f (d ij )  e ij , também com p > 0. Note que em casos assim
p
d ij
não devemos fazer a normalização da matriz de forma automática, porque as funções podem ter
significado econômico.
Podemos ainda mesclar essa última abordagem com a anterior estabelecendo um limite de
distância L: para d ij  L temos wij  f (d ij ) , caso contrario ficamos com wij  0 .
Toda a discussão acima foi centrada em distâncias e contiguidades entre regiões. Entretanto,
outros tipos de matriz também podem ser utilizados no estudo de regiões. Por exemplo, o peso
pode ser definido não só pela distância entre as regiões como também: pelo tamanho relativo da
fronteira em comum entre elas; pelas áreas das regiões; ou pela acessibilidade entre as regiões
(Anselin, 1988).
Quando a interação espacial é definida também por outros fatores além da distância, como os
econômicos e sociais, pode-se usar uma função que contenha características associadas a eles.
Por exemplo, a interação entre duas regiões pode ser representada também pela similaridade das
rendas per capita e da distribuição étnica da população nas regiões. Assim, podemos definir o
peso com uma função da distância (d) e dos módulos das diferenças de renda per capita (rpc) e
15
da proporção da população por grupo étnico (r): wij  f (d ij , rpci  rpc j , ri  r j ) . Outras
variáveis, como níveis educacionais e proporção de imóveis que são alugados também podem ser
utilizadas (Kelejian, 2011). Em um estudo sobre a possibilidade de contágio entre países
emergentes em crise económica, onde um país impacta nos demais, Kelejian et al (2006)
utilizaram como matriz de pesos dados sobre as distâncias geográficas e também informação
sobre as exportações entre países.
A apresentação acima discutiu matrizes de peso para regiões. Entretanto, modelos espaciais e,
consequentemente, matrizes de vizinhança, podem ser usados em vários outros tipos de problema
da teoria econômica. Segue uma discussão sobre o tema.
Modelos econômicos que possuem agentes que interagem socialmente mudam o foco principal
da análise econômica, que parte do comportamento individual atomizado, para a interação entre
indivíduo, incluindo, assim como para regiões, externalidades e transbordamentos (spillovers)
entre os agentes (Anselin, 2010; Audretsch e Feldman, 1996; Glaeser et al, 1996; Jaffe et al,
1993; Moretti, 2003; Rigby e Essletzbichler, 2002; Saxenian, 1994; Storper e Scott, 1995). Esse
fato permite o desenvolvimento de perspectivas teóricas distintas que analisam, entre outros,
fenômenos como: efeito de pares, efeitos de vizinhança, transbordamentos espaciais, estudos
sobre comunidades, capital social e efeitos de rede sociais (Anselin, 2010; Glaeser et al, 2002;
Manski, 2000; Sampson et al, 2000). Para que seja possível analisar empiricamente modelos com
interação social, devem-se explicitamente incorporar os efeitos das interações nos modelos
(Brock e Durlauf, 2007; Brueckner, 2003), como é incorporado em modelos espaciais.
Nessa perspectiva, podem-se incorporar matrizes de vizinhança diferentes daquelas propostas
para regiões, tendo em vista que as observações são sobre indivíduos ou outros tipos não
diretamente relacionados a áreas, mas de certa forma são similares aquelas. Por exemplo, podese utilizar a distância social entre dois indivíduos como indicador das interações entre eles
(Akerlof, 1997; Borjas, 1995). A inclusão desse último tipo de distância se justifica porque o
conceito de vizinhos não necessariamente implica em proximidade física, dado que existem
várias formas de interação (Barabási, 2003) que influenciam as decisões individuais, mesmo que
os agentes que interagem não estejam próximos fisicamente. Assim, uma definição mais
abrangente de vizinhos seria: “vizinhos são unidades que interagem de forma relevante”
16
(Kelejian, 2011). Por exemplo, indivíduos com níveis sociais próximos em uma determinada
localidade possivelmente interagirão de forma mais efetiva entre si que outros com níveis muito
distintos, mesmo que a distância física entre as pessoas seja similar. Esse mesmo tipo de
raciocínio também é valido para outras variáveis como sexo (s), idade (i), escolaridade (e) etc.
Um exemplo para esse tipo de matriz de vizinhança para indivíduos seria definir o peso como
uma função do módulo da diferença desses atributos para dois indivíduos distintos:
wij  f ( si  s j , ii  i j , ei  e j ) .
Por fim, como os valores de wij são não estocásticos, os resultados dos modelos espaciais
dependem da matriz de peso escolhida (Dubin, 1998). Assim, um ponto central da determinação
da matriz de vizinhança é que ela deve apreender, de forma mais fidedigna possível, as
interações entre as observações analisadas. Segundo Anselin (1988), a determinação da matriz de
pesos é uma das mais difíceis e controversas das questões em econometria espacial e devem,
sempre que possível, ser baseada em conceitos teóricos da interação entre regiões. Esse tema
cera abordado novamente em textos posteriores. Para uma discussão sobre o assunto ver Harris
et al (2011).
Essas matrizes de vizinhança discutidas nesta seção são usadas em uma serie de modelos
espaciais diferentes. A seção anterior introduziu um desses modelos, que é conhecido por (SAR)
(LeSage e Pace, 2009), ou modelo de lag espacial (Elhrost, 2010). Retomamos essa discussão a
seguir.
5 - Modelos espaciais
Existem muitos tipos de modelos espaciais, e associados a cada um deles, existem diferentes
justificativas teóricas para que sejam utilizados. Também, dependendo do modelo, existem
diferentes implicações com relação aos coeficientes estimados e a predição dos modelos. A
seguir seguem alguns exemplos de modelos espaciais. Na discussão de alguns deles são incluídos
modelos teóricos que motivam a utilização do modelo espacial especifico. São também incluídas
algumas referências de aplicações empíricas para cada um dos modelos discutidos.
17
Elhorst (2010) apresenta muitos desses modelos e parte de um diagrama (figure 1) exposto por
esse autor é replicado aqui na figura 1. São incluídas duas denominações para a maioria dos
modelos: a primeira é a utilizada por esse autor e a segunda, em parênteses, é a denominação
utilizada em LaSage e Pace (2009). Lembrando que os vetores in associados ao intercepto estão
incorporados a matriz X.
Iniciamos a discussão com o modelo 1 – MQO e sua equação em formato de matriz. Nesse e em
todos os demais modelos, assume-se que  ~ N (0,  2 I n ) . Além disso, a medida que formos
descendo no diagrama os modelos incorporarão mais termos de interação espacial. Quando
passamos do modelo 1 – MQO, o único que não é espacial, para o 2 - modelo de lag espacial
(SAR), inclui-se o termo WY . Nesse segundo modelo a variável dependente é parcialmente
determinada pelos valores da mesma variável dos vizinhos. Quando passamos do modelo 1 MQO para o 3 - modelo de erro espacial (SEM), inclui-se o termo Wu . Ou seja, os erros da
regressão são espacialmente correlacionados. Se incluirmos o termo Wu no modelo 2 ou o
termo WY no modelo 3, obtemos o 4 - modelo de Kelejian-Prucha (ou SAC). Assim temos os
dois efeitos anteriores incluídos em um só modelo. O 5 - modelo espacial de Durbin (SDM) é
obtido com a inclusão do termo WX a partir do 2 - modelo de lag espacial. Se incluirmos esse
termo no 3- modelo de erro espacial, obtemos o 6- modelo de erro espacial de Durbin. O termo
WX representa a possibilidade que a variável dependente de uma observação possa ser
explicada em parte pelas variáveis independentes das observações vizinhas. O último modelo no
diagrama é o 7 – modelo de Manski. Esse modelo contem os todos os termos dos demais. Note
que a apresentação diagrama partiu do modelo MQO, que é o mais especifico, pois nele temos
      0 , e teve como fim o modelo de Manski, que é o mais geral, pois temos   0,   0
e   0.
18
Figura 1 – Modelos espaciais
1 - MQO
De 1 para 2: inclusão do termo
WY
De 1 para 3: inclusão do termo
3 – Modelo de erro espacial (SEM)
2 – Modelo de lag espacial (SAR)
De 3 para 5:
inclusão do termo
De 2 para 5:
inclusão do termo
Wu
WY
De 3 para 6:
inclusão do termo
WX
Wu
6 - Modelo erro espacial de Durbin (SDEM)
De 2 para 6:
inclusão do termo
WX
4 - Modelo de Kelejian-Prucha (SAC)
De 6 para 7:
inclusão do termo
5 - Modelo espacial de Durbin (SDM)
WY
De 5 para 7:
inclusão do termo
De 4 para 7: inclusão do termo
Wu
WX
7 - Modelo de Manski
19
O diagrama acima procurou apresentar alguns dos modelos espaciais utilizados na análise
empírica de dados cross-section. A seguir serão discutidos alguns pontos referentes a cada um
desses modelos tendo como foco principal a questão da motivação teórica de se utilizar alguns
deles. Serão incorporados alguns conceitos formais dos modelos quando esses forem necessários
para discutir essa questão. Além disso, são brevemente comentados alguns trabalhos empíricos
em muitas áreas do conhecimento e com metodologias distintas que aplicaram cada um dos
modelos apresentados. O objetivo é apresentar uma visão geral das possibilidades de aplicação
da econometria espacial.
5.1 - Modelo de lag espacial
O primeiro dos modelos a ser abordado é o 2 - modelo de lag espacial ou SAR. Tome novamente
a equação do modelo apresentada na figura 1.
y  Wy  X   ,  ~ N (0,  2 I n ) .
Como já mostrado na seção anterior, manipulando essa equação obtemos o processo de geração
de dados (DGP) do modelo:
y  ( I  W ) 1 ( X   )
Em seguida, obtemos o valor esperado dessa expressão:
(9) E[ y]  E[( I  W ) 1 ( X   )]  ( I  W ) 1 E[( X   )]  ( I  W ) 1 X
Os próximos passos são descritos para exemplificar melhor a motivação do uso desse tipo de
modelo. Inicialmente, escrevemos a matriz ( I  W ) 1 como uma serie infinita de matrizes. Essa
serie é utilizada em muitas outras discussões teóricas.
Partimos da definição de uma serie geométrica convergente (ver apêndice matemático 2). Para
a  1 , temos:
(1  a) 1 
1
 1  a  a 2  ...
1 a
Por definição de matriz inversa, temos: ( I  W ) ( I  W ) 1  I .
20
Verificamos que se essa matriz inversa existir, de forma similar a serie geométrica, temos:
( I  W ) 1  I  W  ( W ) 2  ... , pois:
( I  W ) ( I  W  ( W ) 2  ...)  ( I  W  ( W ) 2  ...)  ( W  ( W ) 2  ...)  I .
De posse dessa informação, ficamos com a seguinte expressão para (9):
(10) E[ y]  ( I  pW  p 2W 2  ...) X .
Note que como assumimos que   1 , temos       ... .
2
3
Assim, a influência das matrizes de maior ordem é menor do que as de menor. Aqui alguns
conceitos formais foram utilizados para que a expressão (10) fosse obtida. Essa expressão foi
derivada do modelo de lag espacial porque é similar a relação obtida na motivação teórica
descrita em LeSage e Pace (2009), justificando o uso do modelo, como veremos a seguir.
Agentes econômicos podem tomar uma decisão a partir de uma análise da condição atual de
umas serie de fatores e também levando em conta o comportamento de outros indivíduos em um
período anterior. Por exemplo, a decisão do preço a ser pedido por um item, yt , pode levar em
conta o custo atual, X t , e também o preço dos concorrentes no período anterior. Dada a
diversidade dos concorrentes, alguns possivelmente impactam de foram mais decisivas na
determinação dos preços, enquanto outros influenciam menos. Essa diferença é representada por
 . Assim, ficamos com a seguinte equação que expressa esse problema:
yt  Wyt 1  X t    t
Por simplicidade, assuma que os custos não se alterem de forma muito rápida, e assim podemos
escrever a equação acima com X t  X . Tomando essa mesma equação para um período
anterior, temos:
yt 1  Wyt 2  X   t 1
Substituindo essa ultima equação na anterior, ficamos com:
yt  W ( Wyt 2  X   t 1 )  X   t
Fazendo isso q vezes e manipulando a expressão, temos:
21
yt  [ I n  W  ( W ) 2  ...  ( W ) q1 ] X   qWyt q  u,
u   t  W t 1  ( W ) 2  t 1  ...  ( W ) q1  t q
Estimando os valores esperados, temos que, E[u]  0 , pois E[ ]  0 .
Além disso, lembrando que   1 , tomando o limite q   , temos:
lim E[ y]  lim{[I n  W  ( W ) 2  ...  ( W ) q1 ] X   qWyt q }  ( I n  W  ( W ) 2  ...) X .
q
q
Essa expressão é exatamente igual a equação (10). Ou seja, o modelo de lag espacial pode ser
obtido como o estado estacionário de um processo de decisão que leva em conta a decisão dos
demais atores de forma defasada no tempo.
Note que a matriz ( I  W ) 1 , que, como veremos, é obtida nos DGPs de vários dos modelos
espaciais, se assemelha muito com uma expressão aplicada as redes sociais. No caso temos a
seguinte expressão: b  ( I  W ) 1 in  ( I  W   2W 2  ...)in , onde W é uma matriz binaria,
assim como a de contiguidade, que identifica os amigos de um indivíduo, W2 identifica os
amigos dos amigos e assim por diante. b é o grau de centralidade do individuo e mede o numero
de conexões diretas e indiretas do individuo (LeSage e Pace, 2009; para uma discussão sobre o
tema ver Bonacich, 1987). Ou seja, esse fato indica a proximidade entre os modelos espaciais,
em especial o modelo de lag espacial, e estudos de interação social e de redes sociais.
Seguem dois exemplos de estudos empíricos que utilizaram o modelo de lag espacial. Esse
modelo foi utilizado por Sobel e Dean (2008) (que também usaram o Modelo de Kelejian-Prucha
ou SAC) em um estudo empírico que analisou o impacto do crescimento da rede Wal-Mart em
pequenas empresas nos EUA. Os autores começam o artigo com a seguinte citação:
“O Wal-Mart estabeleceu nos EUA preços baixos o suficiente para retirar do mercado as pequenas empresas que
tem atividades similares a sua. Nos últimos 20 anos, com a inauguração de estabelecimentos da rede Wal-Mart em
muitas comunidades, essas foram destruídas, mercados foram fechados, houve um decréscimo da base de
sustentação para a obtenção de impostos, os centros das cidades passaram a ser cidades fantasmas”.
22
Contradizendo em parte essa citação, segundo esses autores, quando um novo Wal-Mart é
estabelecido em uma localidade, os mercados locais no ramo de máquinas e ferramentas tendem
a fechar por não poderem concorrer com um grande estabelecimento com preços menores.
Entretanto, em um processo de destruição criativa, no local onde havia uma loja deste tipo,
possivelmente outro estabelecimento em outro ramo de atividade econômica, como uma nova
galeria de arte, será inaugurado. Assim, a influência do Wal-Mart na economia local pode ser
positiva ou negativa, dependendo de uma serie de fatores. Além disso, mesmo que a influência
local de um novo Wal-Mart seja negativa, em termos macroeconômicos, o efeito pode ser
positivo, dado que os impactos em outras regiões, também devido a diminuição dos custos de
forma geral, tendem a ser mais positivos que negativos. A análise empírica dos autores indicou
que alguns ramos de atividade se beneficiavam enquanto outros eram prejudicados pelo
estabelecimento e crescimento da rede Wal-Mart. Porém, os autores enfatizam que a influência
geral era próxima de nula.
Lacombe (2004) utilizou esse mesmo tipo de modelo em um estudo que examinou os efeitos de
políticas públicas que têm como foco famílias chefiadas por mulheres de baixa renda e impactos
na participação feminina no mercado de trabalho. O autor parte do pressuposto que regiões muito
próximas tendem a ter características socioeconômicas similares, tanto para variáveis
observáveis como para não observáveis. Então, se elas forem próximas, mas se localizarem em
municípios, condados ou estados distintos com políticas públicas diferentes, as diferenças
observadas entre as regiões pode ser creditada em grande medida a essas políticas diferenciadas.
No estudo empírico que analisou dados de condados, o autor utilizou um modelo de lag espacial
com duas matrizes de vizinhança:
y  1W1 y   2W2 y  X   ,  ~ N (0,  2 I n ) .
Uma das matrizes foi definida com wij  1 para os três condados mais próximos que se
localizavam no mesmo estado, e wij  0 caso contrario. A outra matriz também foi definida com
os três vizinhos mais próximos, mas de outros estados. O pressuposto é que existem dois tipos de
dependência espacial, uma com relação aos condados no próprio estado e outra no estado
vizinho. As magnitudes da interação, representada pelas diferentes matrizes de vizinhança,
23
podem ser diferentes, pois práticas culturais e ambientes econômicos de observações vizinhas em
estados diferentes devem apresentar maiores diferenças do que vizinhos em um mesmo estado.
Como o autor selecionou apenas os condados que se localizavam na fronteira entre estados, cada
observação tinha vizinhos em seu próprio estado e também no estado vizinho.
O autor observou que os parâmetros 1 e  2 eram ambos positivos e significativos, indicando
que havia dependência espacial positiva e que o modelo especial era superior ao MQO para
explicar a variabilidade dos dados. Além disso, o autor verificou que, depois de controlados os
efeitos da dependência especial, quanto mais generosa era a política publica maior era a
proporção de domicílios chefiados por mulher e menor era a participação das mulheres no
mercado de trabalho.
5.2 - Modelo de erro espacial
Como vimos na figura 1, o modelo de erro espacial (SEM) tem a seguinte equação:
y  X  u
2
u  Wu   ,  ~ N (0,  I n )
Note que aqui a matriz de vizinhança aparece no erro da equação, ou seja, os erros são
espacialmente correlacionados. Não temos, como no caso do lag espacial, a variável dependente
dos vizinhos como variável explicativa.
Manipulando a equação do erro ficamos com:
( I  W )u  
Se a inversa de ( I  W ) existir, temos:
u  ( I  W ) 1 
Substituindo essa ultima equação na primeira descrita para o modelo, ficamos então com a
seguinte expressão, que é o DGP do modelo:
(11) y  X  ( I  W ) 1 
Tomando o valor esperado temos:
24
E[ y]  X
Note que esse valor é exatamente igual ao valor esperado para um modelo MQO, o que não foi
observado no modelo de lag espacial. Ou seja, se o DGP for realmente essa representada pelo
modelo de erro espacial e a análise for feita com modelos MQO, ou seja, não incorporarem
correlações espaciais, a estimativa será não enviesada, mas não será eficiente. Note que temos
erros heterocedásticos no modelo de erro espacial (Lacombe e Shaughnessy, 2007).
Segue um exemplo teórico, descrito em LeSage e Pace (2009), que no qual é obtido um DGP
como descrita em (11). Partimos de um exemplo com dados em painel, por exemplo, de um
grupo de regiões, cada uma correspondendo a uma observação analisada em mais de um período.
Como temos dados diferentes de uma mesma região nos diversos períodos, pode-se obter uma
relação entre o valor da variável dependente de cada região, y, variáveis explicativas referentes a
área, X, um vetor de parâmetros  a serem estimados, e um vetor a representando o intercepto
para cada região:
y  a  X .
Assim, obtemos a relação acima a partir de dados em painel com um intercepto para cada região.
Entretanto, se tivermos apenas dados cross-section, a estimação do vetor a não é possível, pois
necessitamos de mais que um valor para cada observação para que esse vetor seja estimado.
Todavia, assumindo que regiões próximas são similares em muitos fatores observáveis e não
observáveis, é razoável representar esse vetor a com a seguinte equação, onde temos correlação
positiva,   0 :
a  Wa  
Manipulando essa duas equações, obtemos o DGP do modelo de erro espacial:
( I  W )a  
a  ( I  W ) 1 
y  X  ( I  W ) 1 
25
Ou seja, a possibilidade de existência de heterogeneidade espacial não observada é uma
motivação para o uso de modelos espaciais, em particular dos modelos SEM.
Lacombe e Shaughnessy (2007) utilizaram esse modelo para analisar as eleições presidenciais
nos EUA. Segundo esses autores, existem vários fatores que impactam na quantidade de votos
que um partido obtém em uma eleição. Eles utilizaram como variáveis explicativas variáveis
demográficas, religiosas, socioeconômicas e indicadores de conservadorismo. Entretanto, um
fator que é frequentemente omitido em análises similares é a questão geográfica, uma vez que a
localização da região também influencia o resultado da eleição. Segundo os autores, o uso de
dummies geográficas, que são normalmente utilizadas como controle para fatores de localização,
não modelam de forma apropriada as interações entre as unidades geográficas de análise.
Existem vários fatores não observáveis específicos de uma região que podem ter um impacto na
eleição e que não podem ser corretamente incluídos em modelos não espaciais. Por exemplo,
áreas que votam em partidos de esquerda ou de direita, tendem a ser próximos de áreas que
fazem o mesmo. Isso decorre do fato que regiões próximas tendem a ter um conjunto comum de
valores e também tem acesso a fontes de media específicas etc.
Os autores verificaram empiricamente que havia uma correlação espacial significativa na
distribuição de votos, mesmo controlando por uma serie de variáveis explicativas. Eles
concluíram que o modelo SEM era superior ao MQO com relação às inferências dos modelos.
Além disso, os autores verificaram, dentre outros resultados, que Bush havia recebido mais votos
em regiões com mais brancos e menos negros, que eram mais conservadoras, pois tinham maior
proporção de veteranos de guerra e de pessoas religiosas na população local, proxies de
conservadorismo, e com menor nível de renda per capita.
5.3 - Modelo de Kelejian-Prucha
O modelo de Kelejian-Prucha, também denominado SAC, tem a seguinte equação:
y  Wy  X  u
u  Wu   ,  ~ N (0,  2 I n )
26
Como vimos na figura 1, ele incorpora as características dos dois modelos anteriores. Partindo do
modelo de lag espacial, inclui-se o termo Wu , presente no modelo de erro espacial. Por sua
vez, partindo do modelo de erro espacial, inclui-se Wy , termo presente no modelo de lag
espacial. Ou seja, os modelos de lag espacial e de erro espacial são casos particulares do modelo
de Kelejian-Prucha: se neste ultimo temos   0 , obtemos o modelo de lag espacial; se temos
  0 , obtemos o modelo de erro espacial. Assim, o modelo de Kelejian-Prucha engloba esses
dois modelos.
O modelo de Kelejian-Prucha foi utilizado por Kalenkoski e Lacombe (2008) (que também
utilizaram o modelo SAR) para analisar a influência de variações no salario mínimo na
quantidade de jovens empregados nos EUA. Eles verificaram que havia um significativo
decréscimo no número de jovens empregados quando o salario mínimo aumentava. Além disso,
os autores observaram que havia uma correlação espacial positiva entre as taxas de emprego das
regiões, possivelmente por causa de economias de aglomeração, ou por causa de atributos
geográficos que concentram empregos.
5.4 - Modelo espacial de Durbin
Partindo do modelo de lag espacial, o modelo espacial de Durbin (SDM) inclui o termo WX :
y  Wy  X  WX   ,  ~ N (0,  2 I n )
Ou seja, a variável dependente é explicada pelo valor das variáveis dependentes dos vizinhos e
também pelo valor das variáveis explicativas dos vizinhos. Segue um exemplo teórico de como
uma variável omitida pode gerar um modelo de espacial de Durbin (LeSage e Pace, 2009).
Assuma que uma variável dependente pode ser totalmente relacionada com apenas duas variáveis
explicativas:
y  x  z
Entretanto, assuma que a variável z é não observável:
y  x  u, u ~ N (0,  u2 I n )
Além disso, se essa variável apresentar correlação espacial:
27
z  Wz  v , v ~ N (0,  v2 I n )
Manipulando essas equações, temos:
z  ( I  W ) 1 v
y  x  ( I  W ) 1 v
y  x  ( I  W ) 1 u
Esse DGP é igual ao anterior mostrada para o modelo SEM. Assim, a possibilidade de existir
uma variável não observada, não correlacionada com as variáveis observadas, e que apresenta
correlação espacial é uma motivação para o uso dos modelos de erro espacial.
Entretanto, se assumirmos que u é correlacionado com a variável explicativa x de forma linear,
obtemos a equação do modelo espacial de Durbin:
y  x  ( I  W ) 1 ( x   ) ,  ~ N (0,  2 I n )
y  x  ( I  W ) 1 ( x )  ( I  W ) 1 
( I  W ) y  ( I  W ) x  ( x )  
y  Wy  x  Wx( )  x  
y  Wy  x(   )  Wx( )  
y  Wy  x  Wx  
Ou seja, a existência de variáveis não observáveis que apresentam correlação espacial e são
correlacionadas com alguma variável explicativa é uma motivação para se usar o modelo
espacial de Durbin.
Como exemplo de aplicação do modelo, Kirby e LeSage (2009) utilizaram o modelo espacial de
Durbin para analisar o tempo gasto para se ir ao trabalho nos EUA, a partir de dados de setores
censitários. Eles observaram que houve um aumento nesse tempo entre os anos de 1990 e 2000,
o que não estava em concordância com a perspectiva que a suburbanização seria a válvula de
escape para os problemas associados aos engarrafamentos. Segundo os autores, a econometria
espacial permitiu distinguir impactos observados em uma região devido à spillovers causados por
28
engarrafamentos em outras regiões (efeitos indiretos) da influência direta de características da
própria região, como a qualidade das estradas (efeitos diretos). Eles verificaram que mudanças
demográficas na distribuição de indivíduos por idade e sexo, e também variáveis associadas a
participação no mercado de trabalho eram as principais razões para esse aumento no tempo de
comutação.
5.5 – Modelo de erro espacial de Durbin
Obtém-se o modelo de erro espacial de Durbin ao incluir o termo WX quando se tem como
origem o modelo de erro espacial:
y  X  WX  u
2
u  Wu   ,  ~ N (0,  I n )
Esse modelo é uma boa forma de se tratar externalidades em que fatores exógenos em áreas
vizinhas impactam na variável dependente de uma área específica. Um exemplo disso é quanto
ao preço de imóveis. Se um imóvel esta cercado de imóveis com boas características, como
jardins bens cuidados, possivelmente ele valera mais do que um similar em uma área com
construções vizinhas em pior estado. Ou seja, características dos outros imóveis impactam na
determinação de preços de um imóvel específico. Assim, em um mesmo modelo, inclui-se como
variável explicativa o valor das variáveis explicativas (ou um subconjunto dessas variáveis) das
observações vizinhas. Além disso, para que o modelo de erro espacial de Durbin seja obtido
também devemos ter o termo de erro residual com correlação espacial, ou seja, a
heterogeneidade espacial não explicada incorporada no erro. Segundo Elhorst (2010), esse
modelo foi pouco usado em análises empíricas.
Lacombe et al (2010) utilizaram esse modelo para analisar quais os fatores impactavam na
probabilidade dos eleitores de irem votar. Segundo os autores, a maioria das analises anteriores
não permitiram identificar um quadro muito claro de quais fatores estariam influenciando a
decisão de votar ou não, pois não incorporavam explicitamente a questão da interação e/ou
heterogeneidade espacial. São muitos os fatores não observáveis ou difíceis de medir que podem
influenciar na decisão do individuo se ele irá votar ou não. Um dia chuvoso pode desencorajar
29
eleitores de saírem de casa. Ou um dia ensolarado pode aumentar a probabilidade dos eleitores
em potencial de não irem votar, pois estarão em uma praia ou no campo. Esperasse que fatores
assim sejam espacialmente correlacionados, o que justificaria o uso de modelos espaciais. Outros
fatores, também espacialmente correlacionados, como valores políticos e culturais, também
podem afetar essa decisão.
Os autores analisaram a influência de variáveis demográficas, econômicas e politicas nas
proporções de pessoas que foram voltar. Eles verificaram que regiões com renda per capita e
escolaridade média mais elevadas, com maior crescimento econômico, menos urbanizadas, com
mais igrejas e veteranos de guerra per capita, sinalizando regiões mais conservadoras, e com
indivíduos mais velhos votavam em maior proporção.
5.6 – Modelo de Manski
Como vimos, o modelo de Manski tem o seguinte formato:
y  Wy  X  WX  u
2
u  Wu   ,  ~ N (0,  I n )
Em um só modelo temos todos os termos dos demais modelos: Wy , a interação endógena dos
efeitos da variável dependente (quando, por exemplo, a decisão de agentes econômicos depende
da decisão dos demais); WX , a interação exógena das variáveis independentes (por exemplo, se
a decisão de agentes econômicos depende das características observáveis dos demais), e Wu , a
correlação dos efeitos dos erros aleatórios de diferentes unidades espaciais (quando atributos de
contexto não observados implicam em comportamentos similares),  o coeficiente espacial
autorregressivo,  o coeficiente de correlação espacial no erro, e os parâmetros a serem
definidos  e  (Elhorst, 2010). Segundo esse autor, não existem problemas técnicos para se
estimar esses parâmetros. Entretanto, esses não podem ser interpretados de forma relevante, uma
vez que os efeitos endógenos e exógenos não podem ser distinguidos. Como discutido em
Manski (1993) devemos incorporar alguma restrição para que os coeficientes sejam corretamente
identificados. Assim, não prosseguimos na discussão desse modelo.
30
6 - Conclusão
Esse texto teve como objetivo apresentar a econometria espacial de forma introdutória,
abordando tópicos como dependência espacial e heterogeneidade espacial, modelos espaciais,
matrizes de vizinhança e motivações para o uso de modelos espaciais. A principal referência
utilizada na confecção deste texto foi LeSage e Pace (2009), mas outras, como Anselin (1988),
Anselin (2010), Dubin (1998) e Elhorst (2010), também foram muito utilizados. Procurou-se
introduzir os vários conceitos de forma paulatina e didática, sem que as explicações ficassem
longas ou formais demais. Alguns trabalhos empíricos em muitas áreas do conhecimento e com
metodologias distintas que aplicaram a econometria espacial foram citados ou brevemente
comentados no texto. A intenção foi dar ao leitor uma visão geral das possibilidades de aplicação
desse campo de estudo.
Referências bibliográficas
Akerlof, G. (1997) Distance and social decisions. Econometrica, 65 (5).
Aguiar, M., Simões, R. e Golgher, A (2012) Building attributes and urban amenities: a real estate
market analysis of the city of Belo Horizonte, Minas Gerais, Brazil. Presented in VI World
Conference of the Spatial Econometrics Association, SEA, Salvador, Brazil
Audretsch, D. B. and M. P. Feldman, (1996), R&D spillovers and the geography of innovation
and production, American Economic Review 86(4), 253-273.
Anselin, L. (1988). Spatial Econometrics: Methods and Models. Kluwer Academic, Dordrecht.
Anselin,
Luc.
(1999)
Spatial
Econometrics.
http://www.csiss.org/learning_resources/content/papers/baltchap.pdf
Em:
Anselin, l. (2010) Thirty years of spatial econometrics. Papers in Regional Science 89 (1).
Appleton, S. e Balihuta, A. (1996) Education and agricultural productivity: evidence from
Uganda. Journal of International Development 8 (3), 415-444.
Asadullah, M. e Rahamna, S. (2009) Farm productivity and efficiency in rural Bangladesh: the
role of education revisited. Applied Economics 41 (1), 17-33.
31
Barabási, A. (2003) Linked – How everything is connected to everything else and what it means
for business, science, and everyday life. Nova York: Penguim group.
Bonacich (1987) Power and Centrality: A Family of Measures," The American Journal of
Sociology, 92(5), 1170-1182.
Borjas, G. (1995) Ethnicity, Neighborhoods, and Human-Capital Externalities. American
Economic Review 85(3), 365-390.
Brock W. e Durlauf S. (2007) Identification of binary choice models with social interactions.
Journal of Econometrics 140, 52–75
Brueckner, Jan K. (1998). Testing for strategic interaction among local governments: the case of
growth controls. Journal of Urban Economics 44, 438–67.
Case, A. e Katz, L. (1991) The company you keep: the effects of family and neighborhood on
disadvantaged youths. NBER Working paper, n. 3705.
Chomitz, K., Mata, D., Carvalho, A. e Magalhães, J. (2005) Spatial dynamics of labor markets in
Brazil. World Bank Policy Working Paper, 3752.
Ciriaci, D. e Palma, D. (2008) The role of knowledge-based supply specialization for
competitiveness: a spatial econometric approach. Papers in Regional Science 87 (3), 453-475.
Darmofal, D. (2006). Spatial Econometrics and Political Science. Society for Political
Methodology Working Paper Archive: http://polmeth.wustl.edu/workingpapers.php.
Dubin, Robin. (1998) Spatial Autocorrelation: A Primer. Journal of Housing Economics, 7 (4),
304-327.
Durlauf, Steven N. (1994). Spillovers, stratification and inequality. European Economic Review
38, 836–845.
Elhorst, J. (2010) Applied spatial econometrics: raising the bar. Spatial Economic Analysis 5 (1).
Gille, V. (2011) Education spillovers in farm productivity: empirical evidence in rural India.
Cdedse, Working paper, n.31
Glaeser E., Sacerdote, B., Scheinkman J. (1996) Crime and social interactions. Quarterly Journal
of Economics 111, 507–548
Glaeser E., Sacerdote, B., Scheinkman J. (2002) The social multiplier. NBER Working paper
series, n. 9153.
Gordon, I. e Monastitiotis, V. (2006) Urban size, spatial segregation and inequality in education
outcomes. Urban studies 43 (1), 213-236.
32
________________________ (2007) Education, location, education: a spatial analysis of
English secondary school public examination results. Urban studies 44 (7), 1203-1228.
Harris,R., Moffat, J. e Kravtsova, V. (2011): In Search of „W‟, Spatial Economic Analysis 6 (3),
249-270.
Hays, j., Kachi, A. e Franzese jr., R. (2010) A spatial model incorporating dynamic, endogenous
network interdependence: A political science application. Statistical Methodology (7), 406-428.
Jaffe, A, Trajtenberg, M. e Henderson, R. (1993) Geographic localization of knowledge
spillovers as evidence of patent citations. Quarterly Journal of Economics 108, 577 – 598.
Kelejian, H. (2011) Spatial models in Econometrics, Draft for the Spatial Econometric Advanced
Institute.
Kelejian H., Tavlas, G. e Hondroyiannis, G. (2006) A Spatial Modeling Approach to Contagion
Among Emerging Economies. Open Economies Review 17, 423–441.
Kalenkoski, Charlene and Donald J. Lacombe. (2008) Effects of Minimum Wages on Youth
Employment: the Importance of Accounting for Spatial Correlation. Journal of Labor Research
29 (4), 303-317.
Kirby, D. e LeSage, J. (2009) Changes in commuting to work times over the 1990 to 2000
period. Regional Science and Urban Economics 39 (4), 460-471.
Lacombe, Donald J.(2004) Does Econometric Methodology Matter? An Analysis of Public
Policy Using Spatial Econometric Techniques. Geographical Analysis 36 (2), 105-118.
____________________ e Timothy M. Shaughnessy. (2007) Accounting for Spatial Error
Correlation in the 2004 Presidential Popular Vote. Public Finance Review 35 (4), 480-499.
_____________ , Holloway, G. e Shaughnessy, T. (2010) Bayesian Estimation of the Spatial
Durbin Error Model with an Application to the 2004 Presidential Election" . Apresentado na 4th
World Conference of the Spatial Econometrics Association, Chicago, Illinois.
LeSage, James P. (1997) Regression Analysis of Spatial Data. Journal of Regional Analysis and
Policy 27 (2), 83-94.
LeSage, J e Pace, R. (2009) Introduction to spatial econometrics, Taylor & Francis Group, Boca
Raton.
Manski C. (1993) Identification of endogenous social effects: the reflection problem. The Review
of Economic Studies 60 (3), 531–542
_________ (2000) Economic analysis of social interactions. Journal of Economic Perspectives
14, 115–136
Millimet, D. e Rangaprasad, V. (2007) Strategic competition amongst public schools. Regional
Science and Urban Economics 37, 199-219.
33
Monastiriotis, V. (2009) Examining the consistence of spatial association patterns across socioeconomic indicators: an application to the Greek region. Empirical Economics 37, 25-49
Moretti, E. (2003). Human capital externalities in Cities. NBER Working Papers series, n.9641
Disponível em: http://www.nber.org/papers/w9641.
Puech, F. (2004) How do criminals locate? Crime and spatial dependence in Minas Gerais.
Cerdi-CNRS, Working Paper n. 200524.
Rigdy, D. e Essletzbichler, J. (2002) Agglomeration economies and productivity differences in
US cities. Journal of Economic Geography, 2, 407 – 432.
Sampson, R., Morenoff, J. e Earls, F. (2000) Beyond social capital: neighborhood mechanism
and structural sources of collective efficacy for children. American Sociological Review 64 (5)
Saxenian, A (1994). Regional advantage: culture and competition in Silicon Valley and Route
128. Cambridge, MA: Harvard University Press.
Sobel, Russell S. e Andrea M. Dean. (2008) Has Wal-Mart Buried Mom and Pop?: The Impact
of Wal-Mart on Self Employment and Small Establishments in the United States. Economic
Inquiry. 46 (4), 676-695.
Storper, M e Scott, A. (1995) The wealth of regions: market forces and policies imperatives in
local and global context. Futures 27, 505–526.
Tselios, V. (2008) Income and educational inequalities in the regions of the European Union:
geographical spillovers under welfare state restrictions. Papers in Regional Science 87 (3), 403430
Voss, P., Long, D., Hammer, R. e Friedman, S. (2006) County child poverty rates in the US: a
spatial regression approach. Population Research and Policy Review 25, 369-391.
Weir, S. e Knight, J. (2004) Externality effects of education: dynamics of the adoption and
diffusion of an innovation in rural Ethiopia. Economic Development and Cultural Change 53 (1),
93-113.
Apêndice matemático 1
A matriz identidade é uma matriz quadrada n x n cujos elementos da diagonal principal são
iguais a 1 e os demais são zero, ou seja, é um caso particular da matriz diagonal:
34
1

0
In  
...

0

0 ... 0 

1 ... 0 
... ... 0 

0 0 1 
Essa matriz aparece constantemente em álgebra linear e tem a seguinte propriedade:
AI n  I n A  A .
Por definição, a matriz inversa é aquela que quando multiplicada pela matriz original fornece
como resultado a matriz identidade. Usa-se o símbolo A
para a inversa de A. Assim, a relação
AA 1  A1 A  I n define a matriz inversa.
 0 0
 . Não existe
Entretanto, nem toda matriz tem inversa. Por exemplo, tome a matriz A  
 0 0
uma matriz A − 1
tal que a relação que define a matriz inversa seja satisfeita.
Uma matriz quadrada só terá inversa se for não singular, ou seja, se seu determinante for
diferente de zero. Isso é o mesmo que dizer que o posto da matriz quadrada é máximo e que suas
linhas (ou colunas) são independentes. Matrizes cujo determinante é zero, como no caso do
exemplo acima, não têm inversa. Matrizes cujas linhas ou colunas não são independentes, como
 1 2
 , também não têm inversa.
B  
 2 4
Apêndice matemático 2
Uma serie geométrica é definida como: S  lim 1  a  a 2  ...  a t .
t 
Multiplique a serie por a: aS  lim a  a 2  ...  a t  a t 1 .
t 
Subtraia a ultima expressão da primeira:
aS  S  lim (a t 1  10)
t 
35
(a  1) S  lim a t 1  1
t 
Se a  1, temos:
S
1
lim a t 1  1
a  1 t 
Se a  1 , então a serie converge para: S 
1
.
1 a
36
Download

Introduction to Spatial Econometrics André Braz Golgher