Introduction to Spatial Econometrics André Braz Golgher1 Abstract This paper is part of a series that discusses introductory concepts of spatial econometrics2. The texts were written in Portuguese and intend to present this field of study to students at upper undergraduate to graduate levels in Economy and in Regional Sciences. This first paper of the series has as main objective to present some of the very basic topics of spatial econometrics, such as: spatial dependency and spatial heterogeneity, introduction to spatial models, and weights matrix. I present different types of spatial models, including some of the motivations to use them. In order to provide a broader perspective of the applicability of the models, I include a brief discussion and empirical applications for each spatial model, which were applied in different fields of interests. Moreover, the present discussion also serves as a basis for the subsequent discussion presented in the following papers of this series. Key words: spatial econometrics; weights matrix; spatial dependency; spatial heterogeneity 1 Associate Professor at the Economics Department of Cedeplar/FACE/UFMG, visiting scholar at the Regional Research Institute (RRI) at the West Virginia University (WVU) and visiting scholar at the Carolina Population Center (CPC) at the University of North Carolina (UNC) in Chapel Hill. 2 A large part of the references selected for these texts comes from the readings assigned by professor Donald Lacombe in his course ARE 693L Spatial Econometrics (spring 2012) at the WVU (http://community.wvu.edu/~djl041/teaching.html). 1 Introdução à Econometria Espacial André Braz Golgher3 Resumo Esse texto faz parte de uma série que apresenta a econometria espacial em pontos introdutórios. O objetivo principal desse primeiro texto é apresentar esse tema de forma introdutória, abordando tópicos como: dependência espacial e heterogeneidade espacial, uma introdução aos modelos espaciais e matriz de vizinhança. Em seguida são apresentados diferentes tipos de modelos espaciais, incluindo motivações para o uso desses modelos, e aplicações empíricas utilizadas em diferentes áreas do conhecimento e com metodologias distintas. A discussão teórica inicial, a apresentação dos diversos modelos espaciais e a incorporação de um grupo de referências com aplicações empíricas teve como intenção dar ao leitor uma visão geral das possibilidades de aplicação da econometria espacial. A presente discussão também serve como base para a discussão apresentada nos demais textos da serie. Palavras chave: econometria heterogeneidade especial. especial, matriz de peso, dependência especial, 1 - Introdução Esse texto faz parte de uma série que apresenta a econometria espacial em pontos introdutórios4. Esse primeiro texto da série tem como objetivo discutir esse tema de forma breve e introdutória. O texto discute alguns conceitos como heterogeneidade espacial e dependência espacial, matrizes de vizinhança, motivações para o uso de modelos espaciais e equações básicas dos modelos 3 Professor do Cedeplar/FACE/UFMG, pesquisador visitante do Regional Research Institute (RRI) da West Virginia University (WVU) e pesquisador visitante do Carolina Population Center (CPC) na University of North Carolina (UNC) em Chapel Hill. 4 Grande parte do material citado aqui foi selecionado da ementa do curso ARE 693L Spatial Econometrics (spring 2012) (http://community.wvu.edu/~djl041/teaching.html) ministrado por Donald Lacombe do RRI da WVU. 2 espaciais. Procurou-se introduzir os vários conceitos de forma paulatina e didática, sem que as explicações ficassem longas ou formais demais. Entretanto, o texto incorpora alguns conceitos formais quando essa abordagem foi julgada necessária para se discutir a questão da motivação teórica de se utilizar os modelos espaciais. Para facilitar a compreensão do leitor, foi incluído um breve apêndice matemático no final do texto, que busca ajudar a compreensão de algumas passagens matemáticas utilizadas na apresentação dos modelos espaciais. Alguns trabalhos empíricos que aplicaram a econometria espacial em diferentes áreas do conhecimento e com metodologias distintas foram citados ou brevemente comentados no texto. O objetivo foi dar ao leitor uma visão geral das possibilidades de aplicação dos modelos espaciais. O texto foi dividido em 5 seções, além dessa breve introdução. Na primeira, introduz-se o campo de estudo da econometria espacial, discutindo algumas das suas particularidades, que diferenciam da econometria padrão. Em seguida, introduz-se o modelo espacial com um exemplo de dependência espacial na determinação de preços no mercado imobiliário. Ponto fundamental nos modelos espaciais, a matriz de vizinhança é o tema abordado na terceira seção. Na seção quatro, apresenta-se uma série de modelos espaciais, com algum detalhamento formal, procurando abordar a questão da motivação teórica de se utilizar esses modelos. A última seção conclui o texto. 2 - Conceitos iniciais da econometria espacial A econometria espacial faz parte do campo de estudo da econometria, mas apresenta algumas particularidades que a diferenciam dessa última. Segue uma discussão sobre essas particularidades, a partir de exemplos da economia regional e urbana, área de estudo na qual os modelos espaciais são muito usados. Em muitos estudos aplicados desse campo de estudo, as análises estatísticas são feitas com dados sobre áreas específicas, como dados socioeconômicos ou demográficos agregados para alguma unidade espacial de análise. Por exemplo, taxas de crescimento econômico ou níveis de pobreza medidos para algum país ou região. Também são utilizados dados pontuais localizados em uma determinada área, com preços de imóveis. Dados assim, apesar de representarem ou se 3 localizarem em áreas com localização específica, podendo ser associados do ponto de vista geográfico, são muitas vezes tratados em modelos econométricos como observações independentes. Para exemplificar descrevemos análises sobre os determinantes de preços no mercado imobiliário. Vários fatores influenciam a determinação do preço de um imóvel, as mais óbvias são as próprias características destes, como tamanho, idade, qualidade de acabamento etc. Essas variáveis são relativamente fáceis de serem definidas, quantificadas ou incorporadas em modelos econométricos. Além das próprias características dos imóveis, a localização de uma casa ou de um apartamento também influencia na determinação de preços (Dubin, 1998). Assim, a localização das observações também pode ser incorporada à análise, enriquecendo as equações econométricas de determinação dos preços dos imóveis. Por exemplo, podemos incluir nos modelos dummies indicando a localização do imóvel. Ou ainda, se a localização impacta na determinação dos preços, existe a possibilidade que imóveis localizados em uma mesma vizinhança sejam afetados pelos mesmos fatores locais. Assim, atributos locacionais que impactam na determinação de preços de imóveis também podem ser incorporados à análise. Entretanto, existem certas limitações quanto a essa inclusão de variáveis locacionais. Por exemplo, quais variáveis devem ser incluídas nos modelos para caracterizar os fatores associados à vizinhança? Como definir vizinhança, que é algo não estritamente observável? Isso implica que quando queremos utilizar variáveis de vizinhança, devemos necessariamente utilizar proxies para caracterizá-la, variáveis como: características socioeconômicas dos moradores locais; existência de serviços urbanos no local; ou as taxas locais de criminalidade. Estas variáveis, além de serem apenas proxies e em número limitado, possivelmente retratam a vizinhança de forma imperfeita. Existem ainda outras limitações na definição de vizinhança. Nas análises, assume-se alguma divisão geográfica arbitraria de área: municípios, unidades de planejamento de um município, setor censitário etc. Essa divisão também representa vizinhanças apenas de forma imperfeita incorporando, assim, erros de medida (LeSage, 1997; Anselin, 1988). Por exemplo, ao 4 agregarmos dados de uma área específica, representamos toda uma vizinhança por um valor médio de alguma variável, e esta pode englobar regiões não-homogéneas. Assim, se atributos da vizinhança onde o imóvel se localiza e que impactam no preço, como amenidades e presença de serviços urbanos, não forem incorporados à análise ou forem incluídos com as limitações citadas, dois imóveis localizados próximos um do outro em uma região que é mais valorizada do que foi possível medir pelas variáveis incorporadas ao modelo, ambos possivelmente apresentarão erros estocásticos positivos nos modelos econométricos. Por outro lado, o contrário possivelmente ocorrerá com outros imóveis localizados em outras regiões, onde o baixo valor venal não foi captado pelas variáveis incluídas no modelo. Ou seja, dadas as limitações discutidas acima, modelos econométricos que tratam as observações de forma independente possivelmente apresentarão erros estocásticos espacialmente correlacionados. Além disso, podemos ter a interação entre as observações. Por exemplo, se um imóvel é cercado de imóveis com boas características, como possuir jardins bens cuidados e serem bem acabados, possivelmente valerá mais do que outro similar em uma área semelhante com construções vizinhas em pior estado. Ou seja, devido a essas limitações discutidas acima, pode-se observar em dados georreferenciados fatores como a dependência espacial e/ou a heterogeneidade espacial. A dependência espacial é geralmente definida como a falta de independência entre observações. Essa dependência pode ter como origem uma série de fatores que são associados a erros de medida comumente observados em trabalhos empíricos, como os já citados. Outro fator associado à dependência espacial, talvez o mais importante, seja possível existência de externalidades e spillovers entre as observações (Anselin, 1988). Um exemplo disso, como vimos, é quando os preços de imóveis são afetados pelas características ou mesmo pelos preços dos imóveis vizinhos. Ou ainda: regiões com elevado nível de capital humano tendem a apresentar spillover positivo para as demais; firmas de um mesmo setor podem se beneficiar da presença de outras similares devido à troca mais efetiva de informações etc. Fenômenos como interações espaciais, processos de difusão e hierarquias espaciais se relacionam diretamente com a interdependência entre as observações, implicando que a 5 localização e a distância entre as observações são fatores que deveriam ser incorporados aos modelos econométricos que tratam destas questões. Como forma de incorporar correções para a dependência espacial, podemos relacionar os dados ao espaço de forma mais efetiva do que o apresentado acima, incluindo explicitamente na análise a distância entre as diversas regiões, aos erros espacialmente correlacionados e/ou interações entre as observações. Modelos que incorporam explicitamente a dependência espacial entre as observações abordam problemas que não são tratados de forma efetiva pelos métodos da econometria padrão (LeSage, 1997). Além da dependência espacial, a similaridade entre observações próximas também é esperada devido à heterogeneidade espacial. Esta é relacionada com a estabilidade observada no espaço com relação a diversas variáveis que apresentam uma estrutura espacial desigual, fato observado, por exemplo, em indicadores socioeconômicos. Regiões próximas tendem a ter características similares umas das outras, mesmo que isso não seja causado por erros de medida ou por externalidades e sim por equilíbrios de longo prazo obtidos, por exemplo, por fatores históricos em comum ocorridos no desenvolvimento das localidades. Note que, ao contrário dos problemas relacionados com a dependência espacial, os problemas causados pela heterogeneidade espacial podem ser abordados pelas técnicas econométricas não espaciais. Entretanto, o conhecimento teórico sobre a estrutura espacial dos dados pode tornar os procedimentos de estimação mais eficientes. Além disso, em alguns problemas, distinguir o que é dependência espacial e o que é heterogeneidade espacial pode ser complicado (Anselin, 1988, 1999). Sintetizando essa discussão acima, Anselin (1988) define a econometria espacial como “uma coleção de métodos e técnicas, baseados na representação formal da dependência espacial e heterogeneidade espacial, que tratam de forma efetiva da peculiaridade causada pelo espaço em análises estatísticas em modelos da ciência regional”. Segundo esse autor, o campo de estudo da econometria espacial, que nos anos 70 e 80 podia ser considerada como um campo marginal em estudos aplicados à economia urbana e regional, passou recentemente a fazer parte do núcleo central de estudos em economia e de outras ciências sociais, uma vez que o uso de métodos associados a essa área se ampliou e esta sendo usada em uma ampla gama de aplicações e campos de estudos (Anselin, 2010). 6 Dois fatores principais foram os responsáveis por essa popularização da econometria espacial (Anselin, 1999). O primeiro foi o crescente interesse da teoria econômica de não se ater ao agente econômico isolado como tomador de decisões e incorporar explicitamente a interações entre agentes em um sistema, além de discutir como que essas interações individuais promovem padrões de comportamento coletivo devido a efeitos de grupo e de vizinhança (Akerlof, 1997; Borjas, 1995; Durlauf, 1994; Glaeser et al, 1996) e a interação estratégica entre agentes (Brueckner, 1998). Um segundo fator que promoveu a popularização da econometria espacial foi o aumento da quantidade de base de dados georreferenciados e o desenvolvimento de métodos para tratar esse tipo de informação com características diferenciadas, que não são tratados de forma efetiva pelos métodos da econometria padrão. Assim, o reconhecimento que novos modelos tinham que ser desenvolvidos foi um fator que motivou o desenvolvimento da econometria espacial. Mais especificamente no campo das ciências e economia sociais, os modelos espaciais são utilizados em uma ampla gama de aplicações em ciências sociais (Case e Katz, 1991; Ciriaci e Palma, 2008; Darmofal, 2006; Hays et al, 2010; Monastiriotis, 2009; Voss et al, 2006), incluindo aplicações no Brasil (Aguiar et al, 2012; Chomitz et al, 2005; Puech, 2004). Além disso, esses modelos são também aplicados em estudos sobre a educação (Appleton and Balihuta, 1996; Asadullah and Rahman, 2009; Gille, 2011; Gordon e Monastiriotis, 2006, 2007; Millimet e Rangaprasad, 2006; Tselios, 2008; Weir and Knight, 2004). Como discutido aqui, um ponto que difere a econometria espacial dos demais campos da econometria é que os modelos incorporam explicitamente a dependência espacial entre as observações. Esses temas são discutidos na próxima seção de forma um pouco mais formal. 3 - Introdução aos modelos espaciais Na seção anterior vimos que a dependência espacial e heterogeneidade espacial entre as observações podem resultar em erros de estimação em modelos econométricos não espaciais (LeSage, 1997), uma vez que as observações podem apresentar correlação espacial entre as 7 observações ou nos erros estocásticos dos modelos. Entretanto, existem vários modelos que utilizam os métodos da econometria espacial e abordam explicitamente problemas relacionados a espacialidade das observações (LeSage e Pace, 2009). Nesta seção apresenta-se o modelo espacial de forma um pouco mais formal. Para facilitar o entendimento do leitor aqui também será utilizado o exemplo da determinação de preços no mercado imobiliário. Uma análise cross-section convencional com modelos MQO pode ser representada pela equação abaixo: yi X i i , i ~ N (0, 2 ) , onde uma amostra com n observações independentes yi , i = 1, . . . , n , é linearmente relacionada com um intercepto , com k variáveis explicativas presentes em uma matriz X e com , o vetor dos k parâmetros estimados. Assume-se que o erro é normalmente distribuído com média zero e variância 2 . Podemos representar todas essas n equações de forma sintética no seguinte formato: (1) Y X , i ~ N (0, I 2 ) , onde Y é um vetor n x 1, a matriz X tem dimensão n x (k + 1), 1 pois incorpora o vetor in , um vetor formado de números 1, in ... , referente ao intercepto , 1 e o vetor , de dimensão (k + 1) x 1, também contém o coeficiente relacionado ao intercepto. Seguindo o exemplo de preços de imóveis, teríamos um modelo hedônico de determinação de preços, onde o preço de um imóvel, yi , seria relacionado com os atributos do imóvel como área, idade, tamanho etc., além de proxies relacionadas à vizinhança. Todas essas variáveis explicativas incorporados na matriz X. Assume-se, dentre outros aspectos, que uma observação é independente das demais, o que simplifica a estimação do modelo. Em termos matemáticos para duas observações distintas, i j , temos: E[ i j ] E ( i ) E ( j ) 0 . 8 Entretanto, por exemplo, se atributos da vizinhança onde o imóvel se localiza e que impactam no preço, como amenidades e presença de serviços urbanos, não forem incorporados a análise, dois imóveis localizados próximos um do outro em uma região valorizada de uma cidade possivelmente ambos apresentarão erros positivos. Além disso, se uma casa é valorizada por apresentar um belo jardim, possivelmente a casa ao lado, mesmo que não possua um jardim, será valorizada por essa presença próxima de arvores e flores, mesmos que em menor magnitude. Ou seja, os erros das observações deixam de ser independentes como especificado acima. Como vimos, outro fator que pode tornar as observações não independentes é que quando agregamos os dados, por exemplo, se expressamos os valores dos imóveis como uma media local, os resultados podem apresentar dependência espacial e/ou heterogeneidade espacial devido à forma como os dados foram agregados (Anselin, 1988). Assim, em contextos em que pode existir omissão de variáveis, limitações relacionadas à agregação dos dados, ou interações e externalidades entre as observações, essa suposição de independência das observações torna-se irreal, e modelos MQO possivelmente apresentarão uma estimação enviesada ou não serão eficientes. O modelo a seguir incorpora a dependência espacial entre as observações nas estimativas de preços para dois imóveis 1 e 2. Na equação (2), o preço do imóvel 1, y1 , seria determinado pelos seus próprios atributos e pelas características de vizinhança incluídas na analise, X 1 , e também pelo preço do imóvel vizinho 2, y 2 . A dependência dessa última variável em y1 é dado por 12 y2 , que representa uma proporção do preço de y 2 . O mesmo ocorreria com o imóvel 2 na equação (3): (2) y1 12 y2 X 1 1 , 1 ~ N (0, 2 ) (3) y 2 21 y1 X 2 2 , 2 ~ N (0, 2 ) Para esse mesmo exemplo com dois imóveis, assumindo, por simplicidade, que a matriz X tem duas variáveis explicativas, podemos escrever esse modelo como: (4) y1 0 12 y1 1 x11 y 2 21 0 y 2 1 x 21 0 x12 1 1 x 22 2 2 9 Essas equações podem ser reescritas como: (5) 12 0 y1 y1 1 x11 y2 21 0 y 2 1 x 21 (6) y1 0 y2 w21 w12 y1 1 x11 0 y 2 1 x 21 0 x12 1 1 x 22 2 2 0 x12 1 1 x 22 2 2 Note que na equação (6) temos duas observações e cinco incógnitas a definir, três referentes ao vetor , 0 , 1 e 2 , e outros duas associados a matriz de vizinhança ou matriz de pesos, w12 e w21 . Tomemos um modelo com três imóveis e essas mesmas duas variáveis explicativas: (7) y1 0 w12 y 2 w21 0 y w 3 31 w32 w13 y1 1 x11 w23 y 2 1 x21 0 y3 1 x32 x12 0 1 x22 1 2 x33 2 3 Note que nesse sistema com três observações temos nove incógnitas a definir, três referentes ao vetor e seis associadas à matriz de pesos. Em ambos os exemplos temos mais incógnitas que observações. Ou seja, os problemas não têm solução única. Como resolver esse problema? No caso do vetor , se aumentarmos o número de observações fixando o número de incógnitas não existe qualquer problema na estimação dos parâmetros do vetor. Entretanto, para a matriz de peso, como definida acima, temos n2 – n incógnitas para estimar no modelo. Ou seja, o numero de incógnitas, n(n – 1), cresce mais rápido do que o numero de observações, não garantindo a identificação do modelo. Assim, aumentar o tamanho da amostra não resolve o problema. Devemos então incorporar alguma restrição ao modelo (Anselin, 1988). Uma solução para esse problema é estabelecer uma estrutura não estocástica para a matriz de peso (LeSage e Pace, 2009). Ou seja, se estabelece uma estrutura a priori para a matriz de pesos definido os valores de wij . 10 Uma vez definida a matriz de vizinhança, neste modelo especifico o parâmetro , que correlação entre y e Wy, e representa a magnitude da dependência espacial entre as observações, uma vez que o parâmetro. Para um modelo com n equações, as equações (7) podem ser escritas de forma mais sintética em formato de matriz: (8) y Wy X , ~ N (0, 2 I ) , onde y é um vetor n x 1, é um escalar, W é uma matriz n x n, X é uma matriz n x k, é um vetor k x 1 e é o erro estocástico com distribuição normal, média zero, variância 2 e covariância igual a zero. Esse modelo espacial é conhecido como modelo espacial autorregressivo (SAR) (LeSage e Pace, 2009) ou como modelo de lag espacial (Elhrost, 2010). Anselin (1988) utiliza para este modelo a denominação modelo espacial autorregressivo misto. Existem vários outros tipos de modelo espacial, como será discutido na seção 4. Entretanto, antes destes serem abordados, apresentamse na seção 3 alguns pontos relacionados à matriz de vizinhança. 4 - Matriz de pesos A discussão da seção anterior abordou a questão da não independência das observações, exemplificada por preços de imóveis. Aqui, usando um raciocínio análogo, discutiremos regiões, pois isso facilita a discussão sobre a matriz de vizinhança. Atributos regionais, assim com preços de imóveis, como renda per capita ou indicadores sociais, tendem a apresentar dependência e/ou heterogeneidade espacial. De forma geral, esperasse que regiões próximas sejam mais efetivamente relacionadas umas as outras que regiões distantes. Por exemplo, fatores não observados de regiões vizinhas devem ser mais similares na média do que para regiões distantes. Assim, segundo a primeira lei da geografia de Tobler: “tudo está relacionado com tudo, mas coisas mais próximas estão mais relacionadas que as distantes” (Dubin, 1998). De forma geral, representamos essa lei com valores wij 0 para i j , onde os pesos de regiões próximas têm valores maiores ou iguais que os de regiões distantes. Como forma de facilitar a estimação dos modelos, pode-se assumir que a partir de uma distancia as regiões se associam de 11 forma tão pouco efetiva que o valor de wij é muito pequeno e pode ser considerado zero (Anselin, 1988). Além disso, por construção, todos os termos da diagonal da matriz são zero: wii 0 . Existem infinitas matrizes que satisfazem essas características. Seguem exemplos de matrizes de peso ou vizinhança. Uma possibilidade é a do vizinho mais próximo. Dada uma região especifica, selecionam-se os vizinhos mais próximos dentre todas as demais regiões e determina-se o peso wij 1 . Para todas as outras regiões, temos wij 0 . Segue um exemplo com quatro regiões. A região 1 tem como vizinho mais próximo a região 2. A região 2 tem como vizinho mais próximo a região 1. A região 3 tem como vizinho mais próximo a região 4. A região 4 tem como vizinho mais próximo a região 2. A matriz abaixo resume essa informação. Note que uma matriz definida assim não é necessariamente é simétrica. 0 1 W 0 0 1 0 0 0 0 0 0 0 1 1 0 0 Esse mesmo padrão pode ser estendido para incluir um número maior de vizinhos, como quatro, seis etc (Dubin, 1998). Segue o mesmo exemplo acima para dois vizinhos mais próximos. A região 1 tem como segundo vizinho mais próximo a região 3. A região 2 tem como segundo vizinho mais próximo a região 3. A região 3 tem como segundo vizinho mais próximo a região 2. A região 4 tem como segundo vizinho mais próximo a região 3. Obtém-se a matriz abaixo, onde foi incluída a informação do exemplo anterior. 0 1 W 0 0 1 1 0 0 1 0 1 0 1 1 1 0 12 Outra matriz muito utilizada é a matriz de contiguidade de primeira ordem, onde se determina o peso wij 1 se uma região é contígua à outra, e wij 0 caso contrário (LeSage, 1997; LeSage e Pace, 2009). No caso dessa matriz, para que ela seja obtida necessariamente devemos ter fronteiras entre regiões bem definidas (Anselin, 1988). Note que isso não ocorre no caso da matriz do vizinho mais próximo. Imagine, por exemplo, que você esta estudando a Grécia e todas aquelas ilhas. Como definir a contiguidade neste caso? Segue um exemplo de matriz de contiguidade. A região 1 é contígua a região 2. A região 2 é contígua as regiões 1, 3 e 4. A região 3 é contígua as regiões 2 e 4. A região 4 é contígua as regiões 2 e 3. A matriz abaixo resume essa informação. Note que a matriz é simétrica. 0 1 W 0 0 1 0 0 0 1 1 1 0 1 1 1 0 Existem várias outras matrizes que podem ser utilizadas. Entretanto, note que para que o modelo espacial seja estimável, essa matriz de vizinhança deve ter algumas propriedades. Por exemplo, tome a equação (8) novamente: y Wy X , ~ N (0, 2 I n ) . Manipulando essa equação ficamos com: y Wy X ( I W ) y X Se a matriz n x n ( I W ) tiver inversa (ver Apêndice matemático 1), temos: y ( I W ) 1 ( X ) Essa última relação é conhecida com processo de geração de dados (DGP) do modelo de lag espacial. A partir dessa expressão obtemos as estimativas de y do modelo. Modelos diferentes têm, em geral, DGP distintos, como veremos em discussões posteriores. Para que este modelo seja estimável, essa matriz inversa deve existir. Em geral, assume-se que (1,1) . Ou seja, as variáveis podem ser espacialmente correlacionadas de forma positiva, se 0 , ou de forma 13 negativa, com 0 . Entretanto, note que ao contrário do coeficiente de correlação padrão, esse parâmetro não assume o valor unitário. Para que a matriz ( I W ) tenha necessariamente inversa, fixando nesse intervalo, um procedimento comum é normalizar a matriz W, para que as somas das linhas sejam iguais a um. No caso da matriz de contiguidade citada no exemplo anterior, obtemos a seguinte matriz: 0 13 W 0 0 1 0 1 2 1 2 0 1 3 0 1 2 0 1 3 1 2 0 Neste caso, note que o termo Wy que aparece na equação do modelo é de fácil interpretação. Ele é a média do valor da variável dependente dos vizinhos. Entretanto, note que essa normalização da matriz muda o modelo de certa maneira, pois antes todos os pesos wij não nulos eram iguais e agora podem ser distintos. Matrizes com termos não negativos, cujas linhas têm como soma o valor um, tem como denominação em inglês o termo row-stochastic (linha-aleatória). Outra opção é dividir todas as linhas pelo maior valor dentre as somas destas. Tome novamente a matriz de contiguidade não normalizada. Nesse exemplo temos como maior valor a soma da linha dois, que assume o valor três. Daí, temos a matriz abaixo. Note que aqui o modelo original não muda. 0 1 W 3 0 0 1 3 0 1 3 1 3 0 1 3 0 1 3 0 1 3 1 3 0 14 Pode-se também estabelecer uma distância limite L para as interações não nulas. No caso, para todas as regiões que se localizarem até esse limite, isto é, d ij L , temos wij 1 , caso contrario ficamos com wij 0 . Note que para todos esses exemplos acima tínhamos originalmente os valores 0 ou 1, que eram posteriormente normalizados ou não. Entretanto, temos limitações inerentes a essa escolha de valores binários. Por exemplo, uma área pequena pode ser mais associada a uma grande que vice-versa. Assim, teríamos duas interações de magnitude distintas, mas representadas por um mesmo valor. Essas limitações podem ser evitadas em outras abordagens que não trabalham somente com esses valores binários. Pode-se, por exemplo, definir o valor de wij como uma função decrescente da distância entre as regiões: wij f (d ij ) para i j , com f ' (d ij ) 0 . Exemplos de funções assim são: f (d ij ) 1 pd , com p > 0 ou f (d ij ) e ij , também com p > 0. Note que em casos assim p d ij não devemos fazer a normalização da matriz de forma automática, porque as funções podem ter significado econômico. Podemos ainda mesclar essa última abordagem com a anterior estabelecendo um limite de distância L: para d ij L temos wij f (d ij ) , caso contrario ficamos com wij 0 . Toda a discussão acima foi centrada em distâncias e contiguidades entre regiões. Entretanto, outros tipos de matriz também podem ser utilizados no estudo de regiões. Por exemplo, o peso pode ser definido não só pela distância entre as regiões como também: pelo tamanho relativo da fronteira em comum entre elas; pelas áreas das regiões; ou pela acessibilidade entre as regiões (Anselin, 1988). Quando a interação espacial é definida também por outros fatores além da distância, como os econômicos e sociais, pode-se usar uma função que contenha características associadas a eles. Por exemplo, a interação entre duas regiões pode ser representada também pela similaridade das rendas per capita e da distribuição étnica da população nas regiões. Assim, podemos definir o peso com uma função da distância (d) e dos módulos das diferenças de renda per capita (rpc) e 15 da proporção da população por grupo étnico (r): wij f (d ij , rpci rpc j , ri r j ) . Outras variáveis, como níveis educacionais e proporção de imóveis que são alugados também podem ser utilizadas (Kelejian, 2011). Em um estudo sobre a possibilidade de contágio entre países emergentes em crise económica, onde um país impacta nos demais, Kelejian et al (2006) utilizaram como matriz de pesos dados sobre as distâncias geográficas e também informação sobre as exportações entre países. A apresentação acima discutiu matrizes de peso para regiões. Entretanto, modelos espaciais e, consequentemente, matrizes de vizinhança, podem ser usados em vários outros tipos de problema da teoria econômica. Segue uma discussão sobre o tema. Modelos econômicos que possuem agentes que interagem socialmente mudam o foco principal da análise econômica, que parte do comportamento individual atomizado, para a interação entre indivíduo, incluindo, assim como para regiões, externalidades e transbordamentos (spillovers) entre os agentes (Anselin, 2010; Audretsch e Feldman, 1996; Glaeser et al, 1996; Jaffe et al, 1993; Moretti, 2003; Rigby e Essletzbichler, 2002; Saxenian, 1994; Storper e Scott, 1995). Esse fato permite o desenvolvimento de perspectivas teóricas distintas que analisam, entre outros, fenômenos como: efeito de pares, efeitos de vizinhança, transbordamentos espaciais, estudos sobre comunidades, capital social e efeitos de rede sociais (Anselin, 2010; Glaeser et al, 2002; Manski, 2000; Sampson et al, 2000). Para que seja possível analisar empiricamente modelos com interação social, devem-se explicitamente incorporar os efeitos das interações nos modelos (Brock e Durlauf, 2007; Brueckner, 2003), como é incorporado em modelos espaciais. Nessa perspectiva, podem-se incorporar matrizes de vizinhança diferentes daquelas propostas para regiões, tendo em vista que as observações são sobre indivíduos ou outros tipos não diretamente relacionados a áreas, mas de certa forma são similares aquelas. Por exemplo, podese utilizar a distância social entre dois indivíduos como indicador das interações entre eles (Akerlof, 1997; Borjas, 1995). A inclusão desse último tipo de distância se justifica porque o conceito de vizinhos não necessariamente implica em proximidade física, dado que existem várias formas de interação (Barabási, 2003) que influenciam as decisões individuais, mesmo que os agentes que interagem não estejam próximos fisicamente. Assim, uma definição mais abrangente de vizinhos seria: “vizinhos são unidades que interagem de forma relevante” 16 (Kelejian, 2011). Por exemplo, indivíduos com níveis sociais próximos em uma determinada localidade possivelmente interagirão de forma mais efetiva entre si que outros com níveis muito distintos, mesmo que a distância física entre as pessoas seja similar. Esse mesmo tipo de raciocínio também é valido para outras variáveis como sexo (s), idade (i), escolaridade (e) etc. Um exemplo para esse tipo de matriz de vizinhança para indivíduos seria definir o peso como uma função do módulo da diferença desses atributos para dois indivíduos distintos: wij f ( si s j , ii i j , ei e j ) . Por fim, como os valores de wij são não estocásticos, os resultados dos modelos espaciais dependem da matriz de peso escolhida (Dubin, 1998). Assim, um ponto central da determinação da matriz de vizinhança é que ela deve apreender, de forma mais fidedigna possível, as interações entre as observações analisadas. Segundo Anselin (1988), a determinação da matriz de pesos é uma das mais difíceis e controversas das questões em econometria espacial e devem, sempre que possível, ser baseada em conceitos teóricos da interação entre regiões. Esse tema cera abordado novamente em textos posteriores. Para uma discussão sobre o assunto ver Harris et al (2011). Essas matrizes de vizinhança discutidas nesta seção são usadas em uma serie de modelos espaciais diferentes. A seção anterior introduziu um desses modelos, que é conhecido por (SAR) (LeSage e Pace, 2009), ou modelo de lag espacial (Elhrost, 2010). Retomamos essa discussão a seguir. 5 - Modelos espaciais Existem muitos tipos de modelos espaciais, e associados a cada um deles, existem diferentes justificativas teóricas para que sejam utilizados. Também, dependendo do modelo, existem diferentes implicações com relação aos coeficientes estimados e a predição dos modelos. A seguir seguem alguns exemplos de modelos espaciais. Na discussão de alguns deles são incluídos modelos teóricos que motivam a utilização do modelo espacial especifico. São também incluídas algumas referências de aplicações empíricas para cada um dos modelos discutidos. 17 Elhorst (2010) apresenta muitos desses modelos e parte de um diagrama (figure 1) exposto por esse autor é replicado aqui na figura 1. São incluídas duas denominações para a maioria dos modelos: a primeira é a utilizada por esse autor e a segunda, em parênteses, é a denominação utilizada em LaSage e Pace (2009). Lembrando que os vetores in associados ao intercepto estão incorporados a matriz X. Iniciamos a discussão com o modelo 1 – MQO e sua equação em formato de matriz. Nesse e em todos os demais modelos, assume-se que ~ N (0, 2 I n ) . Além disso, a medida que formos descendo no diagrama os modelos incorporarão mais termos de interação espacial. Quando passamos do modelo 1 – MQO, o único que não é espacial, para o 2 - modelo de lag espacial (SAR), inclui-se o termo WY . Nesse segundo modelo a variável dependente é parcialmente determinada pelos valores da mesma variável dos vizinhos. Quando passamos do modelo 1 MQO para o 3 - modelo de erro espacial (SEM), inclui-se o termo Wu . Ou seja, os erros da regressão são espacialmente correlacionados. Se incluirmos o termo Wu no modelo 2 ou o termo WY no modelo 3, obtemos o 4 - modelo de Kelejian-Prucha (ou SAC). Assim temos os dois efeitos anteriores incluídos em um só modelo. O 5 - modelo espacial de Durbin (SDM) é obtido com a inclusão do termo WX a partir do 2 - modelo de lag espacial. Se incluirmos esse termo no 3- modelo de erro espacial, obtemos o 6- modelo de erro espacial de Durbin. O termo WX representa a possibilidade que a variável dependente de uma observação possa ser explicada em parte pelas variáveis independentes das observações vizinhas. O último modelo no diagrama é o 7 – modelo de Manski. Esse modelo contem os todos os termos dos demais. Note que a apresentação diagrama partiu do modelo MQO, que é o mais especifico, pois nele temos 0 , e teve como fim o modelo de Manski, que é o mais geral, pois temos 0, 0 e 0. 18 Figura 1 – Modelos espaciais 1 - MQO De 1 para 2: inclusão do termo WY De 1 para 3: inclusão do termo 3 – Modelo de erro espacial (SEM) 2 – Modelo de lag espacial (SAR) De 3 para 5: inclusão do termo De 2 para 5: inclusão do termo Wu WY De 3 para 6: inclusão do termo WX Wu 6 - Modelo erro espacial de Durbin (SDEM) De 2 para 6: inclusão do termo WX 4 - Modelo de Kelejian-Prucha (SAC) De 6 para 7: inclusão do termo 5 - Modelo espacial de Durbin (SDM) WY De 5 para 7: inclusão do termo De 4 para 7: inclusão do termo Wu WX 7 - Modelo de Manski 19 O diagrama acima procurou apresentar alguns dos modelos espaciais utilizados na análise empírica de dados cross-section. A seguir serão discutidos alguns pontos referentes a cada um desses modelos tendo como foco principal a questão da motivação teórica de se utilizar alguns deles. Serão incorporados alguns conceitos formais dos modelos quando esses forem necessários para discutir essa questão. Além disso, são brevemente comentados alguns trabalhos empíricos em muitas áreas do conhecimento e com metodologias distintas que aplicaram cada um dos modelos apresentados. O objetivo é apresentar uma visão geral das possibilidades de aplicação da econometria espacial. 5.1 - Modelo de lag espacial O primeiro dos modelos a ser abordado é o 2 - modelo de lag espacial ou SAR. Tome novamente a equação do modelo apresentada na figura 1. y Wy X , ~ N (0, 2 I n ) . Como já mostrado na seção anterior, manipulando essa equação obtemos o processo de geração de dados (DGP) do modelo: y ( I W ) 1 ( X ) Em seguida, obtemos o valor esperado dessa expressão: (9) E[ y] E[( I W ) 1 ( X )] ( I W ) 1 E[( X )] ( I W ) 1 X Os próximos passos são descritos para exemplificar melhor a motivação do uso desse tipo de modelo. Inicialmente, escrevemos a matriz ( I W ) 1 como uma serie infinita de matrizes. Essa serie é utilizada em muitas outras discussões teóricas. Partimos da definição de uma serie geométrica convergente (ver apêndice matemático 2). Para a 1 , temos: (1 a) 1 1 1 a a 2 ... 1 a Por definição de matriz inversa, temos: ( I W ) ( I W ) 1 I . 20 Verificamos que se essa matriz inversa existir, de forma similar a serie geométrica, temos: ( I W ) 1 I W ( W ) 2 ... , pois: ( I W ) ( I W ( W ) 2 ...) ( I W ( W ) 2 ...) ( W ( W ) 2 ...) I . De posse dessa informação, ficamos com a seguinte expressão para (9): (10) E[ y] ( I pW p 2W 2 ...) X . Note que como assumimos que 1 , temos ... . 2 3 Assim, a influência das matrizes de maior ordem é menor do que as de menor. Aqui alguns conceitos formais foram utilizados para que a expressão (10) fosse obtida. Essa expressão foi derivada do modelo de lag espacial porque é similar a relação obtida na motivação teórica descrita em LeSage e Pace (2009), justificando o uso do modelo, como veremos a seguir. Agentes econômicos podem tomar uma decisão a partir de uma análise da condição atual de umas serie de fatores e também levando em conta o comportamento de outros indivíduos em um período anterior. Por exemplo, a decisão do preço a ser pedido por um item, yt , pode levar em conta o custo atual, X t , e também o preço dos concorrentes no período anterior. Dada a diversidade dos concorrentes, alguns possivelmente impactam de foram mais decisivas na determinação dos preços, enquanto outros influenciam menos. Essa diferença é representada por . Assim, ficamos com a seguinte equação que expressa esse problema: yt Wyt 1 X t t Por simplicidade, assuma que os custos não se alterem de forma muito rápida, e assim podemos escrever a equação acima com X t X . Tomando essa mesma equação para um período anterior, temos: yt 1 Wyt 2 X t 1 Substituindo essa ultima equação na anterior, ficamos com: yt W ( Wyt 2 X t 1 ) X t Fazendo isso q vezes e manipulando a expressão, temos: 21 yt [ I n W ( W ) 2 ... ( W ) q1 ] X qWyt q u, u t W t 1 ( W ) 2 t 1 ... ( W ) q1 t q Estimando os valores esperados, temos que, E[u] 0 , pois E[ ] 0 . Além disso, lembrando que 1 , tomando o limite q , temos: lim E[ y] lim{[I n W ( W ) 2 ... ( W ) q1 ] X qWyt q } ( I n W ( W ) 2 ...) X . q q Essa expressão é exatamente igual a equação (10). Ou seja, o modelo de lag espacial pode ser obtido como o estado estacionário de um processo de decisão que leva em conta a decisão dos demais atores de forma defasada no tempo. Note que a matriz ( I W ) 1 , que, como veremos, é obtida nos DGPs de vários dos modelos espaciais, se assemelha muito com uma expressão aplicada as redes sociais. No caso temos a seguinte expressão: b ( I W ) 1 in ( I W 2W 2 ...)in , onde W é uma matriz binaria, assim como a de contiguidade, que identifica os amigos de um indivíduo, W2 identifica os amigos dos amigos e assim por diante. b é o grau de centralidade do individuo e mede o numero de conexões diretas e indiretas do individuo (LeSage e Pace, 2009; para uma discussão sobre o tema ver Bonacich, 1987). Ou seja, esse fato indica a proximidade entre os modelos espaciais, em especial o modelo de lag espacial, e estudos de interação social e de redes sociais. Seguem dois exemplos de estudos empíricos que utilizaram o modelo de lag espacial. Esse modelo foi utilizado por Sobel e Dean (2008) (que também usaram o Modelo de Kelejian-Prucha ou SAC) em um estudo empírico que analisou o impacto do crescimento da rede Wal-Mart em pequenas empresas nos EUA. Os autores começam o artigo com a seguinte citação: “O Wal-Mart estabeleceu nos EUA preços baixos o suficiente para retirar do mercado as pequenas empresas que tem atividades similares a sua. Nos últimos 20 anos, com a inauguração de estabelecimentos da rede Wal-Mart em muitas comunidades, essas foram destruídas, mercados foram fechados, houve um decréscimo da base de sustentação para a obtenção de impostos, os centros das cidades passaram a ser cidades fantasmas”. 22 Contradizendo em parte essa citação, segundo esses autores, quando um novo Wal-Mart é estabelecido em uma localidade, os mercados locais no ramo de máquinas e ferramentas tendem a fechar por não poderem concorrer com um grande estabelecimento com preços menores. Entretanto, em um processo de destruição criativa, no local onde havia uma loja deste tipo, possivelmente outro estabelecimento em outro ramo de atividade econômica, como uma nova galeria de arte, será inaugurado. Assim, a influência do Wal-Mart na economia local pode ser positiva ou negativa, dependendo de uma serie de fatores. Além disso, mesmo que a influência local de um novo Wal-Mart seja negativa, em termos macroeconômicos, o efeito pode ser positivo, dado que os impactos em outras regiões, também devido a diminuição dos custos de forma geral, tendem a ser mais positivos que negativos. A análise empírica dos autores indicou que alguns ramos de atividade se beneficiavam enquanto outros eram prejudicados pelo estabelecimento e crescimento da rede Wal-Mart. Porém, os autores enfatizam que a influência geral era próxima de nula. Lacombe (2004) utilizou esse mesmo tipo de modelo em um estudo que examinou os efeitos de políticas públicas que têm como foco famílias chefiadas por mulheres de baixa renda e impactos na participação feminina no mercado de trabalho. O autor parte do pressuposto que regiões muito próximas tendem a ter características socioeconômicas similares, tanto para variáveis observáveis como para não observáveis. Então, se elas forem próximas, mas se localizarem em municípios, condados ou estados distintos com políticas públicas diferentes, as diferenças observadas entre as regiões pode ser creditada em grande medida a essas políticas diferenciadas. No estudo empírico que analisou dados de condados, o autor utilizou um modelo de lag espacial com duas matrizes de vizinhança: y 1W1 y 2W2 y X , ~ N (0, 2 I n ) . Uma das matrizes foi definida com wij 1 para os três condados mais próximos que se localizavam no mesmo estado, e wij 0 caso contrario. A outra matriz também foi definida com os três vizinhos mais próximos, mas de outros estados. O pressuposto é que existem dois tipos de dependência espacial, uma com relação aos condados no próprio estado e outra no estado vizinho. As magnitudes da interação, representada pelas diferentes matrizes de vizinhança, 23 podem ser diferentes, pois práticas culturais e ambientes econômicos de observações vizinhas em estados diferentes devem apresentar maiores diferenças do que vizinhos em um mesmo estado. Como o autor selecionou apenas os condados que se localizavam na fronteira entre estados, cada observação tinha vizinhos em seu próprio estado e também no estado vizinho. O autor observou que os parâmetros 1 e 2 eram ambos positivos e significativos, indicando que havia dependência espacial positiva e que o modelo especial era superior ao MQO para explicar a variabilidade dos dados. Além disso, o autor verificou que, depois de controlados os efeitos da dependência especial, quanto mais generosa era a política publica maior era a proporção de domicílios chefiados por mulher e menor era a participação das mulheres no mercado de trabalho. 5.2 - Modelo de erro espacial Como vimos na figura 1, o modelo de erro espacial (SEM) tem a seguinte equação: y X u 2 u Wu , ~ N (0, I n ) Note que aqui a matriz de vizinhança aparece no erro da equação, ou seja, os erros são espacialmente correlacionados. Não temos, como no caso do lag espacial, a variável dependente dos vizinhos como variável explicativa. Manipulando a equação do erro ficamos com: ( I W )u Se a inversa de ( I W ) existir, temos: u ( I W ) 1 Substituindo essa ultima equação na primeira descrita para o modelo, ficamos então com a seguinte expressão, que é o DGP do modelo: (11) y X ( I W ) 1 Tomando o valor esperado temos: 24 E[ y] X Note que esse valor é exatamente igual ao valor esperado para um modelo MQO, o que não foi observado no modelo de lag espacial. Ou seja, se o DGP for realmente essa representada pelo modelo de erro espacial e a análise for feita com modelos MQO, ou seja, não incorporarem correlações espaciais, a estimativa será não enviesada, mas não será eficiente. Note que temos erros heterocedásticos no modelo de erro espacial (Lacombe e Shaughnessy, 2007). Segue um exemplo teórico, descrito em LeSage e Pace (2009), que no qual é obtido um DGP como descrita em (11). Partimos de um exemplo com dados em painel, por exemplo, de um grupo de regiões, cada uma correspondendo a uma observação analisada em mais de um período. Como temos dados diferentes de uma mesma região nos diversos períodos, pode-se obter uma relação entre o valor da variável dependente de cada região, y, variáveis explicativas referentes a área, X, um vetor de parâmetros a serem estimados, e um vetor a representando o intercepto para cada região: y a X . Assim, obtemos a relação acima a partir de dados em painel com um intercepto para cada região. Entretanto, se tivermos apenas dados cross-section, a estimação do vetor a não é possível, pois necessitamos de mais que um valor para cada observação para que esse vetor seja estimado. Todavia, assumindo que regiões próximas são similares em muitos fatores observáveis e não observáveis, é razoável representar esse vetor a com a seguinte equação, onde temos correlação positiva, 0 : a Wa Manipulando essa duas equações, obtemos o DGP do modelo de erro espacial: ( I W )a a ( I W ) 1 y X ( I W ) 1 25 Ou seja, a possibilidade de existência de heterogeneidade espacial não observada é uma motivação para o uso de modelos espaciais, em particular dos modelos SEM. Lacombe e Shaughnessy (2007) utilizaram esse modelo para analisar as eleições presidenciais nos EUA. Segundo esses autores, existem vários fatores que impactam na quantidade de votos que um partido obtém em uma eleição. Eles utilizaram como variáveis explicativas variáveis demográficas, religiosas, socioeconômicas e indicadores de conservadorismo. Entretanto, um fator que é frequentemente omitido em análises similares é a questão geográfica, uma vez que a localização da região também influencia o resultado da eleição. Segundo os autores, o uso de dummies geográficas, que são normalmente utilizadas como controle para fatores de localização, não modelam de forma apropriada as interações entre as unidades geográficas de análise. Existem vários fatores não observáveis específicos de uma região que podem ter um impacto na eleição e que não podem ser corretamente incluídos em modelos não espaciais. Por exemplo, áreas que votam em partidos de esquerda ou de direita, tendem a ser próximos de áreas que fazem o mesmo. Isso decorre do fato que regiões próximas tendem a ter um conjunto comum de valores e também tem acesso a fontes de media específicas etc. Os autores verificaram empiricamente que havia uma correlação espacial significativa na distribuição de votos, mesmo controlando por uma serie de variáveis explicativas. Eles concluíram que o modelo SEM era superior ao MQO com relação às inferências dos modelos. Além disso, os autores verificaram, dentre outros resultados, que Bush havia recebido mais votos em regiões com mais brancos e menos negros, que eram mais conservadoras, pois tinham maior proporção de veteranos de guerra e de pessoas religiosas na população local, proxies de conservadorismo, e com menor nível de renda per capita. 5.3 - Modelo de Kelejian-Prucha O modelo de Kelejian-Prucha, também denominado SAC, tem a seguinte equação: y Wy X u u Wu , ~ N (0, 2 I n ) 26 Como vimos na figura 1, ele incorpora as características dos dois modelos anteriores. Partindo do modelo de lag espacial, inclui-se o termo Wu , presente no modelo de erro espacial. Por sua vez, partindo do modelo de erro espacial, inclui-se Wy , termo presente no modelo de lag espacial. Ou seja, os modelos de lag espacial e de erro espacial são casos particulares do modelo de Kelejian-Prucha: se neste ultimo temos 0 , obtemos o modelo de lag espacial; se temos 0 , obtemos o modelo de erro espacial. Assim, o modelo de Kelejian-Prucha engloba esses dois modelos. O modelo de Kelejian-Prucha foi utilizado por Kalenkoski e Lacombe (2008) (que também utilizaram o modelo SAR) para analisar a influência de variações no salario mínimo na quantidade de jovens empregados nos EUA. Eles verificaram que havia um significativo decréscimo no número de jovens empregados quando o salario mínimo aumentava. Além disso, os autores observaram que havia uma correlação espacial positiva entre as taxas de emprego das regiões, possivelmente por causa de economias de aglomeração, ou por causa de atributos geográficos que concentram empregos. 5.4 - Modelo espacial de Durbin Partindo do modelo de lag espacial, o modelo espacial de Durbin (SDM) inclui o termo WX : y Wy X WX , ~ N (0, 2 I n ) Ou seja, a variável dependente é explicada pelo valor das variáveis dependentes dos vizinhos e também pelo valor das variáveis explicativas dos vizinhos. Segue um exemplo teórico de como uma variável omitida pode gerar um modelo de espacial de Durbin (LeSage e Pace, 2009). Assuma que uma variável dependente pode ser totalmente relacionada com apenas duas variáveis explicativas: y x z Entretanto, assuma que a variável z é não observável: y x u, u ~ N (0, u2 I n ) Além disso, se essa variável apresentar correlação espacial: 27 z Wz v , v ~ N (0, v2 I n ) Manipulando essas equações, temos: z ( I W ) 1 v y x ( I W ) 1 v y x ( I W ) 1 u Esse DGP é igual ao anterior mostrada para o modelo SEM. Assim, a possibilidade de existir uma variável não observada, não correlacionada com as variáveis observadas, e que apresenta correlação espacial é uma motivação para o uso dos modelos de erro espacial. Entretanto, se assumirmos que u é correlacionado com a variável explicativa x de forma linear, obtemos a equação do modelo espacial de Durbin: y x ( I W ) 1 ( x ) , ~ N (0, 2 I n ) y x ( I W ) 1 ( x ) ( I W ) 1 ( I W ) y ( I W ) x ( x ) y Wy x Wx( ) x y Wy x( ) Wx( ) y Wy x Wx Ou seja, a existência de variáveis não observáveis que apresentam correlação espacial e são correlacionadas com alguma variável explicativa é uma motivação para se usar o modelo espacial de Durbin. Como exemplo de aplicação do modelo, Kirby e LeSage (2009) utilizaram o modelo espacial de Durbin para analisar o tempo gasto para se ir ao trabalho nos EUA, a partir de dados de setores censitários. Eles observaram que houve um aumento nesse tempo entre os anos de 1990 e 2000, o que não estava em concordância com a perspectiva que a suburbanização seria a válvula de escape para os problemas associados aos engarrafamentos. Segundo os autores, a econometria espacial permitiu distinguir impactos observados em uma região devido à spillovers causados por 28 engarrafamentos em outras regiões (efeitos indiretos) da influência direta de características da própria região, como a qualidade das estradas (efeitos diretos). Eles verificaram que mudanças demográficas na distribuição de indivíduos por idade e sexo, e também variáveis associadas a participação no mercado de trabalho eram as principais razões para esse aumento no tempo de comutação. 5.5 – Modelo de erro espacial de Durbin Obtém-se o modelo de erro espacial de Durbin ao incluir o termo WX quando se tem como origem o modelo de erro espacial: y X WX u 2 u Wu , ~ N (0, I n ) Esse modelo é uma boa forma de se tratar externalidades em que fatores exógenos em áreas vizinhas impactam na variável dependente de uma área específica. Um exemplo disso é quanto ao preço de imóveis. Se um imóvel esta cercado de imóveis com boas características, como jardins bens cuidados, possivelmente ele valera mais do que um similar em uma área com construções vizinhas em pior estado. Ou seja, características dos outros imóveis impactam na determinação de preços de um imóvel específico. Assim, em um mesmo modelo, inclui-se como variável explicativa o valor das variáveis explicativas (ou um subconjunto dessas variáveis) das observações vizinhas. Além disso, para que o modelo de erro espacial de Durbin seja obtido também devemos ter o termo de erro residual com correlação espacial, ou seja, a heterogeneidade espacial não explicada incorporada no erro. Segundo Elhorst (2010), esse modelo foi pouco usado em análises empíricas. Lacombe et al (2010) utilizaram esse modelo para analisar quais os fatores impactavam na probabilidade dos eleitores de irem votar. Segundo os autores, a maioria das analises anteriores não permitiram identificar um quadro muito claro de quais fatores estariam influenciando a decisão de votar ou não, pois não incorporavam explicitamente a questão da interação e/ou heterogeneidade espacial. São muitos os fatores não observáveis ou difíceis de medir que podem influenciar na decisão do individuo se ele irá votar ou não. Um dia chuvoso pode desencorajar 29 eleitores de saírem de casa. Ou um dia ensolarado pode aumentar a probabilidade dos eleitores em potencial de não irem votar, pois estarão em uma praia ou no campo. Esperasse que fatores assim sejam espacialmente correlacionados, o que justificaria o uso de modelos espaciais. Outros fatores, também espacialmente correlacionados, como valores políticos e culturais, também podem afetar essa decisão. Os autores analisaram a influência de variáveis demográficas, econômicas e politicas nas proporções de pessoas que foram voltar. Eles verificaram que regiões com renda per capita e escolaridade média mais elevadas, com maior crescimento econômico, menos urbanizadas, com mais igrejas e veteranos de guerra per capita, sinalizando regiões mais conservadoras, e com indivíduos mais velhos votavam em maior proporção. 5.6 – Modelo de Manski Como vimos, o modelo de Manski tem o seguinte formato: y Wy X WX u 2 u Wu , ~ N (0, I n ) Em um só modelo temos todos os termos dos demais modelos: Wy , a interação endógena dos efeitos da variável dependente (quando, por exemplo, a decisão de agentes econômicos depende da decisão dos demais); WX , a interação exógena das variáveis independentes (por exemplo, se a decisão de agentes econômicos depende das características observáveis dos demais), e Wu , a correlação dos efeitos dos erros aleatórios de diferentes unidades espaciais (quando atributos de contexto não observados implicam em comportamentos similares), o coeficiente espacial autorregressivo, o coeficiente de correlação espacial no erro, e os parâmetros a serem definidos e (Elhorst, 2010). Segundo esse autor, não existem problemas técnicos para se estimar esses parâmetros. Entretanto, esses não podem ser interpretados de forma relevante, uma vez que os efeitos endógenos e exógenos não podem ser distinguidos. Como discutido em Manski (1993) devemos incorporar alguma restrição para que os coeficientes sejam corretamente identificados. Assim, não prosseguimos na discussão desse modelo. 30 6 - Conclusão Esse texto teve como objetivo apresentar a econometria espacial de forma introdutória, abordando tópicos como dependência espacial e heterogeneidade espacial, modelos espaciais, matrizes de vizinhança e motivações para o uso de modelos espaciais. A principal referência utilizada na confecção deste texto foi LeSage e Pace (2009), mas outras, como Anselin (1988), Anselin (2010), Dubin (1998) e Elhorst (2010), também foram muito utilizados. Procurou-se introduzir os vários conceitos de forma paulatina e didática, sem que as explicações ficassem longas ou formais demais. Alguns trabalhos empíricos em muitas áreas do conhecimento e com metodologias distintas que aplicaram a econometria espacial foram citados ou brevemente comentados no texto. A intenção foi dar ao leitor uma visão geral das possibilidades de aplicação desse campo de estudo. Referências bibliográficas Akerlof, G. (1997) Distance and social decisions. Econometrica, 65 (5). Aguiar, M., Simões, R. e Golgher, A (2012) Building attributes and urban amenities: a real estate market analysis of the city of Belo Horizonte, Minas Gerais, Brazil. Presented in VI World Conference of the Spatial Econometrics Association, SEA, Salvador, Brazil Audretsch, D. B. and M. P. Feldman, (1996), R&D spillovers and the geography of innovation and production, American Economic Review 86(4), 253-273. Anselin, L. (1988). Spatial Econometrics: Methods and Models. Kluwer Academic, Dordrecht. Anselin, Luc. (1999) Spatial Econometrics. http://www.csiss.org/learning_resources/content/papers/baltchap.pdf Em: Anselin, l. (2010) Thirty years of spatial econometrics. Papers in Regional Science 89 (1). Appleton, S. e Balihuta, A. (1996) Education and agricultural productivity: evidence from Uganda. Journal of International Development 8 (3), 415-444. Asadullah, M. e Rahamna, S. (2009) Farm productivity and efficiency in rural Bangladesh: the role of education revisited. Applied Economics 41 (1), 17-33. 31 Barabási, A. (2003) Linked – How everything is connected to everything else and what it means for business, science, and everyday life. Nova York: Penguim group. Bonacich (1987) Power and Centrality: A Family of Measures," The American Journal of Sociology, 92(5), 1170-1182. Borjas, G. (1995) Ethnicity, Neighborhoods, and Human-Capital Externalities. American Economic Review 85(3), 365-390. Brock W. e Durlauf S. (2007) Identification of binary choice models with social interactions. Journal of Econometrics 140, 52–75 Brueckner, Jan K. (1998). Testing for strategic interaction among local governments: the case of growth controls. Journal of Urban Economics 44, 438–67. Case, A. e Katz, L. (1991) The company you keep: the effects of family and neighborhood on disadvantaged youths. NBER Working paper, n. 3705. Chomitz, K., Mata, D., Carvalho, A. e Magalhães, J. (2005) Spatial dynamics of labor markets in Brazil. World Bank Policy Working Paper, 3752. Ciriaci, D. e Palma, D. (2008) The role of knowledge-based supply specialization for competitiveness: a spatial econometric approach. Papers in Regional Science 87 (3), 453-475. Darmofal, D. (2006). Spatial Econometrics and Political Science. Society for Political Methodology Working Paper Archive: http://polmeth.wustl.edu/workingpapers.php. Dubin, Robin. (1998) Spatial Autocorrelation: A Primer. Journal of Housing Economics, 7 (4), 304-327. Durlauf, Steven N. (1994). Spillovers, stratification and inequality. European Economic Review 38, 836–845. Elhorst, J. (2010) Applied spatial econometrics: raising the bar. Spatial Economic Analysis 5 (1). Gille, V. (2011) Education spillovers in farm productivity: empirical evidence in rural India. Cdedse, Working paper, n.31 Glaeser E., Sacerdote, B., Scheinkman J. (1996) Crime and social interactions. Quarterly Journal of Economics 111, 507–548 Glaeser E., Sacerdote, B., Scheinkman J. (2002) The social multiplier. NBER Working paper series, n. 9153. Gordon, I. e Monastitiotis, V. (2006) Urban size, spatial segregation and inequality in education outcomes. Urban studies 43 (1), 213-236. 32 ________________________ (2007) Education, location, education: a spatial analysis of English secondary school public examination results. Urban studies 44 (7), 1203-1228. Harris,R., Moffat, J. e Kravtsova, V. (2011): In Search of „W‟, Spatial Economic Analysis 6 (3), 249-270. Hays, j., Kachi, A. e Franzese jr., R. (2010) A spatial model incorporating dynamic, endogenous network interdependence: A political science application. Statistical Methodology (7), 406-428. Jaffe, A, Trajtenberg, M. e Henderson, R. (1993) Geographic localization of knowledge spillovers as evidence of patent citations. Quarterly Journal of Economics 108, 577 – 598. Kelejian, H. (2011) Spatial models in Econometrics, Draft for the Spatial Econometric Advanced Institute. Kelejian H., Tavlas, G. e Hondroyiannis, G. (2006) A Spatial Modeling Approach to Contagion Among Emerging Economies. Open Economies Review 17, 423–441. Kalenkoski, Charlene and Donald J. Lacombe. (2008) Effects of Minimum Wages on Youth Employment: the Importance of Accounting for Spatial Correlation. Journal of Labor Research 29 (4), 303-317. Kirby, D. e LeSage, J. (2009) Changes in commuting to work times over the 1990 to 2000 period. Regional Science and Urban Economics 39 (4), 460-471. Lacombe, Donald J.(2004) Does Econometric Methodology Matter? An Analysis of Public Policy Using Spatial Econometric Techniques. Geographical Analysis 36 (2), 105-118. ____________________ e Timothy M. Shaughnessy. (2007) Accounting for Spatial Error Correlation in the 2004 Presidential Popular Vote. Public Finance Review 35 (4), 480-499. _____________ , Holloway, G. e Shaughnessy, T. (2010) Bayesian Estimation of the Spatial Durbin Error Model with an Application to the 2004 Presidential Election" . Apresentado na 4th World Conference of the Spatial Econometrics Association, Chicago, Illinois. LeSage, James P. (1997) Regression Analysis of Spatial Data. Journal of Regional Analysis and Policy 27 (2), 83-94. LeSage, J e Pace, R. (2009) Introduction to spatial econometrics, Taylor & Francis Group, Boca Raton. Manski C. (1993) Identification of endogenous social effects: the reflection problem. The Review of Economic Studies 60 (3), 531–542 _________ (2000) Economic analysis of social interactions. Journal of Economic Perspectives 14, 115–136 Millimet, D. e Rangaprasad, V. (2007) Strategic competition amongst public schools. Regional Science and Urban Economics 37, 199-219. 33 Monastiriotis, V. (2009) Examining the consistence of spatial association patterns across socioeconomic indicators: an application to the Greek region. Empirical Economics 37, 25-49 Moretti, E. (2003). Human capital externalities in Cities. NBER Working Papers series, n.9641 Disponível em: http://www.nber.org/papers/w9641. Puech, F. (2004) How do criminals locate? Crime and spatial dependence in Minas Gerais. Cerdi-CNRS, Working Paper n. 200524. Rigdy, D. e Essletzbichler, J. (2002) Agglomeration economies and productivity differences in US cities. Journal of Economic Geography, 2, 407 – 432. Sampson, R., Morenoff, J. e Earls, F. (2000) Beyond social capital: neighborhood mechanism and structural sources of collective efficacy for children. American Sociological Review 64 (5) Saxenian, A (1994). Regional advantage: culture and competition in Silicon Valley and Route 128. Cambridge, MA: Harvard University Press. Sobel, Russell S. e Andrea M. Dean. (2008) Has Wal-Mart Buried Mom and Pop?: The Impact of Wal-Mart on Self Employment and Small Establishments in the United States. Economic Inquiry. 46 (4), 676-695. Storper, M e Scott, A. (1995) The wealth of regions: market forces and policies imperatives in local and global context. Futures 27, 505–526. Tselios, V. (2008) Income and educational inequalities in the regions of the European Union: geographical spillovers under welfare state restrictions. Papers in Regional Science 87 (3), 403430 Voss, P., Long, D., Hammer, R. e Friedman, S. (2006) County child poverty rates in the US: a spatial regression approach. Population Research and Policy Review 25, 369-391. Weir, S. e Knight, J. (2004) Externality effects of education: dynamics of the adoption and diffusion of an innovation in rural Ethiopia. Economic Development and Cultural Change 53 (1), 93-113. Apêndice matemático 1 A matriz identidade é uma matriz quadrada n x n cujos elementos da diagonal principal são iguais a 1 e os demais são zero, ou seja, é um caso particular da matriz diagonal: 34 1 0 In ... 0 0 ... 0 1 ... 0 ... ... 0 0 0 1 Essa matriz aparece constantemente em álgebra linear e tem a seguinte propriedade: AI n I n A A . Por definição, a matriz inversa é aquela que quando multiplicada pela matriz original fornece como resultado a matriz identidade. Usa-se o símbolo A para a inversa de A. Assim, a relação AA 1 A1 A I n define a matriz inversa. 0 0 . Não existe Entretanto, nem toda matriz tem inversa. Por exemplo, tome a matriz A 0 0 uma matriz A − 1 tal que a relação que define a matriz inversa seja satisfeita. Uma matriz quadrada só terá inversa se for não singular, ou seja, se seu determinante for diferente de zero. Isso é o mesmo que dizer que o posto da matriz quadrada é máximo e que suas linhas (ou colunas) são independentes. Matrizes cujo determinante é zero, como no caso do exemplo acima, não têm inversa. Matrizes cujas linhas ou colunas não são independentes, como 1 2 , também não têm inversa. B 2 4 Apêndice matemático 2 Uma serie geométrica é definida como: S lim 1 a a 2 ... a t . t Multiplique a serie por a: aS lim a a 2 ... a t a t 1 . t Subtraia a ultima expressão da primeira: aS S lim (a t 1 10) t 35 (a 1) S lim a t 1 1 t Se a 1, temos: S 1 lim a t 1 1 a 1 t Se a 1 , então a serie converge para: S 1 . 1 a 36