VARIÁVEIS INSTRUMENTAIS E
ESTIMAÇÃO GMM
Henrique Dantas Neder
Universidade Federal de Uberlândia
VARIÁVEIS INSTRUMENTAIS


O que são métodos de variáveis instrumentais
(IV)? Mais conhecidos como uma solução para
regressores endógenos: variáveis explicativas
correlacionadas com o termo de erro da regressão,
os métodos de variáveis instrumentais são uma
maneira de obter estimativas de parâmetros
consistentes.
A hipótese fundamental para a consistência dos
estimadores OLS é que o termo de erro do modelo
é não correlacionado com os regressores.
VARIÁVEIS INSTRUMENTAIS



Esta hipótese, também conhecida como hipótese da
esperança condicional nula, pode ser expressa por E[u|x] =
0
Podemos entender isto de uma forma concreta: quando
quisermos regredir rendimentos com anos de estudo e
soubermos que uma variável latente (não observada)
também determina os rendimentos. Neste caso, esta
variável latente, por exemplo a habilidade do trabalhador
não deve ter sua esperança condicionada ao número de
anos de estudo igual a zero. Para cada valor de anos de
estudo (por exemplo, 3 anos de estudo e 5 anos de estudo)
temos um valor médio da variável latente diferente.
Esta condição também pode ser representada pela
independência entre u e X, ou seja, covariância(u,x)=0
Vamos primeiro considerar um diagrama de causalidade
para ilustrar o problema colocado por variáveis
instrumentais. Podemos usar mínimos quadrados
ordinários (MQO) para estimar consistentemente o
seguinte modelo:
regressão: y = xb + u
(1)
Nenhuma associação entre x e u; MQO é consistente.
X
u
y
Entretanto, a regressão falha na seguinte circunstancia:
Endogeneidade: y = xb + u
Correlação entre x e u; MQO não é consistente.
x
y
u
A correlação entre x e u (ou a falha na hipótese de
média condicional nula E[u|x] = 0) pode ser
causada por muitos fatores.
•Podemos nos referir ao problema da endogeneidade
como duas ou mais variáveis determinadas
conjuntamente em um modelo comportamental. Um
exemplo é o modelo de equações simultâneas tal como o
conhecido sistema de oferta e demanda em economia,
no qual o preço e a quantidade são conjuntamente
determinados no mercado.
• Um choque ou perturbação tanto na oferta como na
demanda afetará tanto o preço como a quantidade no
mercado de forma que ambas as variáveis estão
correlacionadas com uma perturbação no sistema.
Regressão por MQO resultará em estimativas
inconsistentes de qualquer regressão incluindo preço
e quantidade.
•Uma outra situação em que temos que utilizar
variáveis instrumentais é quando temos que levar em
conta fatores não observáveis relevantes e que são
omitidos da equação de regressão. Tanto y como x
podem ser afetados por estes fatores latentes, como por
exemplo a habilidade.
• Considere a regressão de (ln) rendimentos (y) sobre
anos de estudo (x). O termo de erro u engloba todos os
outros fatores que afetam os rendimentos tais como
habilidade inata dos indivíduos ou inteligência.
• Mas a habilidade é certamente correlacionada com o
grau de escolaridade alcançado, causando uma
correlação entre o regressor e o erro,
Matematicamente, este é o mesmo problema que
aquele causado pela endogeneidade ou erros de
medida.
A solução deste problema por variáveis instrumentais
pode ser vista como:
Regressão de variáveis instrumentais: y = xb + u
z não correlacionado com u, correlacionado com x
z
x
y
u
A variável adicional z é chamada de instrumento
para x. Em geral, temos muitas variáveis em x, e
mais de uma destas variáveis correlacionada com u.
Neste caso, necessitamos no mínimo tantas
variáveis em z, quantas forem as variáveis em x
correlacionadas com u.
• Para tratar do problema de endogeneidade em um
sistema de oferta e demanda, um candidato z deve
afetar a quantidade ofertada, mas não deve impactar
diretamente a demanda do produto. Um exemplo para
um produto agrícola pode ser a temperatura ou a
precipitação pluviométrica: estes fatores são
claramente exógenos ao mercado, mas provavelmente
importantes no processo de produção.
• Consideremos o seguinte sistema de equações de
“equilíbrio” de mercado:
q  1d   2 d p   3d r  u1
p  1o   2 o q  u2
(2)
• Se considerarmos a solução algébrica deste sistema de
equações estruturais para as variáveis p e q, teremos
as equações na forma reduzida, nas quais os fatores
exógenos aparecerão em seus lados direitos.
•No caso dos fatores latentes da equação de
rendimentos, podemos escolher o instrumento z como o
número de anos de estudo do pai ou da mãe. Pais com
maior escolaridade provavelmente têm filhos com maior
escolaridade; ao mesmo tempo, fatores não observáveis
que influenciam simultaneamente a renda e o nível
educacional dos indivíduos não podem influenciar
variáveis cujos valores são definidos no passado, como a
escolaridade dos pais.
MAS PORQUE NÃO UTILIZAR SEMPRE
VARIÁVEIS INSTRUMENTAIS?



Pode ser difícil achar variáveis que servem como
instrumentos válidos. Muitas variáveis que têm um
efeito sobre as variáveis endógenas incluídas, também
têm um efeito direto sobre a variável dependente.
Estimadores IV são viesados para pequenas amostras
e suas propriedades para amostras finitas são
freqüentemente problemáticas. Estes estimadores
podem ter resultado ruim em pequenas amostras.
A precisão de estimadores IV é menor do que a de
estimadores OLS. Na presença de instrumentos fracos
(instrumentos incluídos com baixa correlação com os
regressores endógenos) a perda de precisão é muito
grande e as estimativas IV podem não compensar a
inconsistência dos estimadores OLS. Isto sugere a
necessidade de um método para determinar se um
dado regressor pode ser tratado como endógeno.
COMO SABER SE OS INSTRUMENTOS SÃO
FORTES?



Instrumentos podem ser fracos: satisfatoriamente
exógenos mas fracamente correlacionados com os
regressores endógenos. Neste caso, “a cura pode ser
pior do que a doença”.
Alguns autores (ver citação em Baum, 2008),
formalizaram a definição de instrumentos fracos:
concluem que a estatística F da equação de primeiro
estágio deve exceder 10 para que os instrumentos
sejam considerados fortes. Mas este critério não é
suficiente para considerar que um instrumento não
seja fraco.
Outros autores (Stock e Yogo, 2005) estabelecem uma
regra de bolso para avaliar a fraqueza de
instrumentos. Os comandos STATA ivreg2 e ivregress
incorporam tabulações referentes a esta regra.
SIMULAÇÃO DE UMA VARIÁVEL ENDÓGENA
SIMULAÇÃO DE UMA VARIÁVEL ENDÓGENA
SIMULAÇÃO DE UMA VARIÁVEL ENDÓGENA –
UMA NOVA ERA NO ENSINO DA ECONOMETRIA



O viés para este exemplo com variável endógena, com
tamanho de amostra n = 150 e 1000 replicações é de
aproximadamente 20% para  2  2 (Cameron e Trivedi,
2009, pg 143), o erro padrão é cerca de 17 vezes menor e
sempre rejeitamos a hipótese nula verdadeira de que  2  2.
O erro padrão (parâmetro) de x = raiz(1+.52x1) = 1.1180.
1.1180/0.06580 = 17. Ou seja, a estimativa OLS é também
inconsistente para a variância do coeficiente (subestima o
valor do parâmetro)
Outros exemplos podem ser testados. Esta possibilidade de
simulação computacional do DGP (“data generation
process”) nos coloca em uma nova era do ensino da
econometria.
UM PRIMEIRO EXEMPLO DE USO DE IV
Utilizaremos um exemplo de Cameron e
Trivedi(2009): gastos médicos com um regressor
endógeno.
 A variável dependente ldrugexp é o logaritmo dos
gastos totais em medicamentos.
 Os regressores são: um indicador (dummy) se os
indivíduos tem seguro por empresa ou por
sindicato (hi_empunion), número de condições
crônicas (totchr), idade em anos (age), indicador
de gênero (female), se é negro ou hispânico
(blhisp) e o logaritmo natural da renda domiciliar
anual em milhares de dólares (linc).

UM PRIMEIRO EXEMPLO DE USO DE IV
Vamos considerar que a variável hi_empunion é
endógena. A justificativa é que os indivíduos
escolhem uma ou outra condição baseados na sua
expectativa de gasto.
 Os instrumentos selecionados são: a relação da
rendimentos de seguridade social – rendimentos
de todas as fontes (ssiratio), uma variável
indicadora qualitativa (dummy) do status de
renda reduzida (lowincome), o tamanho da força
de trabalho empregada na firma (firmsz) e uma
variável dummy indicando se a firma é uma
grande operadora com localizações múltiplas.

UM PRIMEIRO EXEMPLO DE USO DE IV
Os primeiros dois instrumentos são relevantes
porque espera-se que sejam negativamente
correlacionados com ter seguro suplementar.
 Para serem instrumentos válidos (sem correlação
com o termo de erro da equação de segundo
estágio) – vamos admitir que se eles podem ser
omitidos desta equação dado que o efeito dos
rendimentos já é inteiramente capturado pela
variável linc.
 Os últimos dois instrumentos podem ser
irrelevantes porque muitos indivíduos podem
estar aposentados, serem autônomos ou estarem
em sistemas de seguro de saúde privados.

UM PRIMEIRO EXEMPLO DE USO DE IV –
ESTIMAÇÃO DE UM MODELO EXATAMENTE
IDENTIFICADO
use "C:\cameron stata data files\mus06data.dta", clear
global x2list totchr age female blhisp linc
ivregress 2sls ldrugexp (hi_empunion = ssiratio) $x2list,
vce(robust) first
Em modelos com mais de um regressor endógeno, mais de
uma regressão de primeiro estágio é mostrada se a opção
first é usada.
Indivíduos com seguro suplementar tem despesas com
remédios que são 90% mais baixas do que as pessoas com
este suplemento.
UM PRIMEIRO EXEMPLO DE USO DE IV
ESTIMAÇÃO DE UM MODELO SOBRE
IDENTIFICADO
–
global ivmodel “ldrugexp (hi_empunion=ssiratio multlc)
$x2list”
quietly ivregress 2sls $ivmodel, vce(robust)
estimates store TwoSLS
quietly ivregress gmm $ivmodel, wmatrix(robust)
estimates store GMM_hat
quietly ivregress gmm $ivmodel, wmatrix(robust) igmm
estimates store GMM_igmm
quietly ivregress gmm $ivmodel, wmatrix(cluster age)
estimates store GMM_clu
quietly ivregress 2sls $ivmodel
estimates store TwoSLS_def
estimates table TwoSLS GMM_hat GMM_igmm GMM_clu
TwoSLS_def, b(%9.5f) se
FÓRMULAS DERIVADAS PARA OS
ESTIMADORES
ˆ  ( Z ´ X ) 1 Z ´ y
IV
ˆ2 SLS  ( X ´Z ( Z ´Z ) 1 Z ´ X ) X ´Z ( Z ´Z ) 1 y
ˆGMM  ( X ´ZWZ ´ X ) 1 X ´ZWZ ´ y
onde:
Wé qualquer matriz de ponderação simétrica
de posto completo
Para modelos exatamente identificados, todas
as escolhas de W conduzem aos mesmos estimadores
FÓRMULAS DERIVADAS PARA OS
ESTIMADORES
Este estimador minimiza a função objetivo:
1
1
Q( )={ (y-X )´Z}W{ Z´(y-X )}
N
N
que é uma forma quadrática de matriz ponderada
em Z´(y-X ).
Para GMM, algumas escolhas de W são melhores
do que outras. O estimador 2SLS é obtido com
W = (Z´Z) 1. O estimador ótimo GMM usa W =Sˆ 1
onde Sˆ é uma estimativa de Var(N 1/2 Z ´u ).
TESTE PARA ENDOGENEIDADE DO
REGRESSOR
Se o regressor hi_empunion for exógeno, os
estimadores IV (IV, 2SLS ou GMM) são ainda
consistentes, mas eles serão muito menos
eficientes do que o estimador OLS.
 Hausman test: se há pequena diferença entre as
estimativas IV e OLS, concluímos que o regressor
é exógeno.

( ˆIV  OLS )2
2
TH 
~  (1)
Vˆ ( ˆIV  OLS )
H0:ρ=0
COMENTÁRIOS SOBRE O TESTE HAUSMAN
O comando estat endogenous implementa o teste
Durbin-Wu-Hausman (DWH).
 É baseado em uma estatística de teste robusta.
 Considere o modelo:

y1i  y´2i 1  x´1i  2  ui ,
i  1,...., N
Podemos re-escrever esta equação estrutural
adicionando uma variável v1 que é o erro da
equação de primeiro estágio para y2:
y1i  y´2i 1  x´1i  2   v1i  ui ,
i  1,...., N
COMENTÁRIOS SOBRE O TESTE HAUSMAN

Sob a hipótese nula de que y2i é éxógena
E[v1i ui | y2i , x1i ]  0
 O teste de exogeneidade é o teste de H0:ρ=0 na
regressão de y1 sobre y2, x1 e v1. Como v1 não é
diretamente observado utiliza-se o vetor de
resíduos ajustados vˆ1 da equação de primeiro
estágio.
 Para erros homocedásticos e independentes, o
teste é assintoticamente equivalente ao primeiro
teste Hausman. No caso mais realista de erros
heterocedáticos, o teste H0:ρ=0 pode ser ainda
implementado desde que utilizemos estimativas
robustas de variâncias.
TESTES DE RESTRIÇÕES DE SOBRE
IDENTIFICAÇÃO
a validade de um instrumento não pode ser
testada em um modelo exatamente identificado.
 mas é possível testar a validade de
instrumentos em um modelo sobre identificado
desde que os parâmetros do modelo são
estimados usando o GMM ótimo.
 o mesmo teste tem diversos nomes, incluindo
teste de restrições de sobre identificação (OIR),
teste de sobre identificação (OID), Teste de
Hansen, teste de Sargent e teste HansenSargent.

TESTES DE RESTRIÇÕES DE SOBRE
IDENTIFICAÇÃO

Consideremos o valor da função de critério para o
estimador GMM ótimo:
1
1 1
ˆ
Q( )={ (y-X )´Z}S { Z´(y-X )}
N
N
 Se as condições de momento da população E[Z´(y-X )]=0
estão corretas, então Z´(y-X ) 0 e Q( ˆ ) 0 .
 Sob a hipótese nula de que todos os
instrumentos são válidos, pode ser demonstrado
que Q( ˆ ) tem uma distribuição assintoticamente
qui-quadrado com numero de graus de liberdade
igual ao número de restrições sobre identificação.
NOTAÇÃO VETORIAL (MATRICIAL)
UTILIZADA
Regressores  [ X 1 X 2 ]  [ X 1Z 2 ]  [Endógenos Exógenos]
Instrumentos Z = [Z1Z 2 ]  [Excluídos Incluídos]
Portanto: a matriz Z será formada por vetores-coluna constituídos
dos instrumentos excluídos e dos instrumentos incluídos.
O MÉTODO DAS VARIÁVEIS
INSTRUMENTAIS

1
Seja PZ  Z ( Z ' Z ) Z ' . O estimador de
variáveis instrumentais de β é:
 IV  ( X ' Z ( Z ' Z ) 1 Z ' X ) 1 X ' Z ( Z ' Z ) 1 Z ' y 
1
( X ' PZ X ) X ' PZ y

(3)
Apesar deste estimador ser chamado de
estimador de variáveis instrumentais em dois
estágios, ele pode ser calculado em duas etapas
como em apenas uma através da expressão
anterior.
O MÉTODO DAS VARIÁVEIS
INSTRUMENTAIS

Equação de primeiro estágio:
iq= 1 +  2s+3expr+ 4 tenure+5rns+ 6smsa+dummies+
 7 med+8kww+9age+10 mrt+u

Equação de segundo estágio:
lw = 1 +  2s+3expr+ 4 tenure+5rns+6smsa+dummies+
7 pred (iq)  u
O MÉTODO DAS VARIÁVEIS
INSTRUMENTAIS
O MÉTODO DAS VARIÁVEIS
INSTRUMENTAIS
O MÉTODO DAS VARIÁVEIS
INSTRUMENTAIS

O estimador IV em dois estágios:
ˆ2 SLS  ( Xˆ ' X )1 Xˆ ' y  { X ' Z ( Z ' Z ) 1 Z ' X }{ X ' Z ( Z ' Z ) 1 Z ' y}
 ( X ' Pz X ) 1 X ' Pz y
O MÉTODO DAS VARIÁVEIS
INSTRUMENTAIS
O MÉTODO DAS VARIÁVEIS INSTRUMENTAIS: A
ESTIMATIVA DA VARIÂNCIA

O estimador da variância dos parâmetros
estimados pelo método 2SLS é:
Var (ˆ2 SLS )  ˆ 2{ X ' Z (Z ' Z )1 Z ' X }1  ˆ 2 ( X ' Pz X ) 1
O MÉTODO DAS VARIÁVEIS INSTRUMENTAIS –
ESTIMATIVA DA VARIÂNCIA
O MÉTODO DAS VARIÁVEIS INSTRUMENTAIS –
ESTIMATIVA DA VARIÂNCIA
PROPRIEDADES DA IV COM UMA VARIAVEL
INSTRUMENTAL POBRE: ESTIMAÇÃO COM APENAS UMA
VARIÁVEL ENDÓGENA

O viés assintótico de um estimador IV é dado pela
seguinte equação:
corr ( z, u )  u
ˆ
p lim 1  1 
.
corr ( z, x)  x
Mesmo se corr(z,u) for pequena, a inconsistência no estimador IV pode
ser muito grande se corr(z,x) também for pequena.
PROPRIEDADES DA IV COM UMA VARIAVEL
INSTRUMENTAL POBRE: ESTIMAÇÃO COM APENAS UMA
VARIÁVEL ENDÓGENA

Outra expressão para representar o viés
assintótico é dada por:

u
ˆ
p lim 1  1  co rr ( x, u ).
x
IV é preferível a OLS em termos de viés assintótico
quando corr(z,u)/corr(z,x) < corr(x,u)
ESTIMAÇÃO IV: “SÍNTESE”

Quando temos certeza de que os regressores da
nossa equação não estão correlacionados com os
erros podemos aplicar o método convencional de
OLS. No entanto, mesmo nesse caso temos que
verificar se os resíduos da regressão são
homocedásticos. Então temos que realizar o teste
heterocedasticidade. Caso os resíduos sejam
heterocedásticos temos que realizar a regressão
robusta. Isto pode ser feito utilizando a opção
robust (após a vírgula) no comando regress.
ESTIMAÇÃO IV: “SÍNTESE”

Caso tenhamos motivos para acreditar que um ou
mais regressores sejam endógenos (tenham
correlação não nula com termo de erro da
equação) temos que aplicar o método das
variáveis instrumentais. Então nesse caso
utilizaremos o comando ivreg (ou através do
menu endogenous covariates) ao invés do
comando regress.
ESTIMAÇÃO IV: “SÍNTESE”

Mas mesmo nesse caso podemos ter uma
complicação. Pode acontecer que aplicando o
método das variáveis instrumentais os resíduos
do modelo não sejam homocedásticos. Nesse caso
temos que aplicar o método das variáveis
instrumentais articulado com o método dos
momentos generalizados (GMM).
QUAIS SÃO AS IMPLICAÇÕES DA
HETEROCEDASTICIDADE PARA O ESTIMADOR

Os regressores

são todos
exógenos?
Sim
Não
Utilizar estimação
GMM
Sim
Utilizar estimação
OLS
Não
Não
Os resíduos da
regressão IV são
homocedásticos?
Os resíduos da
regressão OLS
são
homocedásticos?
IV?
Sim
Utilizar estimação
OLS com opção
robust
Utilizar estimação
IV
O MÉTODO DOS MOMENTOS
GENERALIZADOS (GMM)
Os economistas consideram que o GMM foi uma
invenção de Lars Hansen em seu paper de 1982
na revista Econometrica.
 Mas o método tem seus antecedentes nos
trabalhos de Karl Pearson sobre o método dos
momentos datados em 1895 e mais a frente
(1928) nos trabalhos de Neyman e Egon Pearson
sobre o método MCE que supera a dificuldade do
método dos momentos quando temos mais
condições de momentos do que parâmetros a
serem estimados.
 O método tem portanto, como qualquer
descoberta cientifica, uma história bem definida.

O MÉTODO DOS MOMENTOS
GENERALIZADOS
O GMM foi introduzido por Lars Hansen em
1982.
 A equação a ser estimada, em notação matricial
é:

y  X u
com uma linha típica:
yi  X i   ui
O MÉTODO DOS MOMENTOS
GENERALIZADOS
A matriz de regressores X tem dimensão n x K,
onde n é o número de observações.
 Alguns dos regressores são endógenos, de forma
que E(Xiui) ≠0.
 Fazemos uma partição do conjunto de regressores
em [X1 X2], com K1 regressores X1que de acordo
com a hipótese nula são endógenos e K2=(K-K1)
regressores X2 que são considerados exógenos.

O MÉTODO DOS MOMENTOS
GENERALIZADOS

Temos então a seguinte equação:
' '
1 2
1 2
y  [ X X ][   ]' u
(4)
O conjunto de variáveis instrumentais é Z e tem
dimensão n x L.
 Este é o conjunto completo de variáveis que são
exógenas - E(Ziui) =0.
 Fazemos uma partição dos instrumentos em [Z1-Z2],
com L1 instrumentos Z1que são instrumentos
excluídos e L2=(L- L1)instrumentos Z2 =X2 que são
os instrumentos incluídos / regressores exógenos.

O MÉTODO DOS MOMENTOS
GENERALIZADOS
Regressores  [ X 1 X 2 ]  [ X 1Z 2 ]  [Endógenos Exógenos]
Instrumentos Z = [Z1Z 2 ]  [Excluídos Incluídos]
A condição de ordem para identificação da
equação é: L ≥ K
 Isto implica que precisamos ter no mínimo tantos
instrumentos excluídos (L1)quantos forem os
regressores endógenos (K1).
 Se L = K a equação é exatamente identificada.
 Se L > K a equação é sobre-identificada.

O ESTIMADOR IV-GMM

Os L instrumentos nos dão um conjunto de L
momentos:
gi (  )  Zi'ui  Zi' ( yi  X i  ) i = 1,n
(5)
Temos um vetor gi que é L x 1 (resultado de uma
'
multiplicação de uma matriz Z i que é
L x n por outra matriz que é n x 1.
 Dado que os L instrumentos são todos exógenos E(Ziui) =0, temos L momentos nulos:
(6)
E ( g ( ))  0

i
O ESTIMADOR IV-GMM

Cada uma das L equações de momento
corresponde a um momento amostral. Para um
dado estimador ˆ , podemos escrever estes L
momentos amostrais como:
n
1 n
1
'
ˆ
g (  )   gi (  )   Z i ( yi  X i ˆ )
n i 1
n i 1
1
 Z ' uˆ
n
(7)
O ESTIMADOR IV-GMM
 g1 (  ) 
 z11
 g ( ) 
z
1
 2
   12
 ...  n  ...
 g ( ) 
z
 l

 1l
z21 ... zl1  y1  ( 1 x11  ...   k x1k ) 
z22 ... zl 2  y2  ( 1 x21  ...   k x2 k ) 


... ... ... 
...


z2l ... zll 
y

(

x

...


x
)
 n
1 n1
k nk 
O ESTIMADOR IV-GMM
O que está por trás da estimação GMM? Temos
que escolher um estimador para o vetor de
parâmetros  que torne g (  ) tão próximo de zero
quanto possível.
 No caso de L = K (equação exatamente
identificada) temos L condições (equações) iguais
a K coeficientes (incógnitas) em ˆ . Neste caso, é
possível achar uma matriz ˆ que soluciona o
sistema g (  ) .

O ESTIMADOR IV-GMM
Quando L = K a equação é exatamente
identificada e uma solução única existe
equivalente ao estimador padrão de variáveis
instrumentais:
1
ˆ
(9)
 IV  ( Z ' X ) Z ' y
 No caso de sobre-identificação (L > K), podemos
definir um conjunto de K instrumentos:
(10)
Xˆ  Z '( Z ' Z ) 1 Z ' X  P X

z
que é o estimador de mínimos quadrados em dois
estágios (2SLS) que a despeito do seu nome é
calculado por esta simples equação matricial.
O ESTIMADOR IV-GMM
Se a equação é sobre-identificada (L ≥ K) temos
mais equações do que incógnitas e neste caso não
é possível achar uma matriz ˆ
que iguale exatamente todo o conjunto de L
momentos a zero.
 Neste caso, temos que tomar uma matriz de
ponderação W (L x L) e utilizá-la para construir
uma forma quadrática nas condições de
momento.

O ESTIMADOR IV-GMM




No método 2SLS com sobre-identificação os L
instrumentos disponíveis são reduzidos aos K
necessários para definir a matriz Pz.
De acordo com Baum(2008), na abordagem IV-GMM
esta redução não é necessária e todos os L
instrumentos são usados no estimador.
Uma matriz de ponderação é empregada de forma que
podemos determinar ˆGMM de forma que os elementos
de g ( ˆGMM ) são tão próximos de zero quanto possível.
Com L > K nem todas as L condições de momento
podem ser satisfeitas e um critério de função que
pondere estas condições apropriadamente é utilizado
para aumentar a eficiência do estimador.
O ESTIMADOR IV-GMM

O estimador GMM minimiza o critério (função
objetivo):
J ( ˆGMM )  ng ( ˆGMM )'Wg ( ˆGMM )

(11)
onde W é uma matriz de ponderação simétrica LxL.
Resolvendo através deste critério de minimização
obtemos o estimador IV-GMM de uma equação sobreidentificada:
ˆGMM  ( X ' ZWZ ' X ) X ' ZWZ ' y
(12)
que será idêntico para todas as matrizes W que diferem
por um fator de proporcionalidade.
O ESTIMADOR IV-GMM
A consistência é garantida por qualquer matriz
de ponderação W simétrica positiva e portanto há
tantos estimadores GMM como há escolhas da
matriz de ponderação W.
 Mas a eficiência não é garantida por uma W
arbitrária. Então, o último estimador será
referido como estimador GMM possivelmente
ineficiente.
 Estamos interessados em obter estimadores
GMM eficientes: estimadores com mínima
variância assintótica.

QUAL É A ESCOLHA ÓTIMA DA MATRIZ DE
PONDERAÇÃO W QUE MINIMIZA A VARIÂNCIA DO
ESTIMADOR GMM?

Seja S a matriz de covariância assintótica das
condições de momento g :
1
S  AVar ( g (  ))  lim E ( Z ' uu ' Z ) 
n n
1
lim E ( Z ' Z )
n n
1
onde S é uma matriz L x L , g (  )  Z ' u
n
e Ω é a matriz de variância-covariância dos
resíduos.
(13)
QUAL É A ESCOLHA ÓTIMA DA MATRIZ DE
PONDERAÇÃO W QUE MINIMIZA A VARIÂNCIA DO
ESTIMADOR GMM?

A fórmula geral para a distribuição do estimador
GMM é:
1
V ( GMM )  (Q ' XZ WQXZ ) 1 (Q ' XZ WSWQXZ )(Q ' XZ WQXZ ) 1 (14)
n

O estimador GMM eficiente é o estimador GMM com
uma matriz de ponderação ótima que minimiza a
variância assintótica do estimador. Isto é obtido pela
escolha de W = S-1
QUAL É A ESCOLHA ÓTIMA DA MATRIZ DE
PONDERAÇÃO W QUE MINIMIZA A VARIÂNCIA DO
ESTIMADOR GMM?

Substituindo W por S-1 na expressão anterior do
estimador GMM, temos:
ˆGMM  ( X ' ZS 1Z ' X ) X ' ZS 1Z ' y
(15)
com variância assintótica:
1
1
ˆ
V (  EGMM )  (Q ' XZ S Q ' XZ )

(16)
A matriz S é obtida em um primeiro estágio através
ˆ
da estimativa ineficiente de uma matriz diagonal 
que é posteriormente introduzida na expressão:
(17)
1 n 2 '
1
Sˆ 
uˆ Z Z

n
i 1
i
i
i
ˆZ
 Z '
n
QUAL É A ESCOLHA ÓTIMA DA MATRIZ DE
PONDERAÇÃO W QUE MINIMIZA A VARIÂNCIA DO
ESTIMADOR GMM?

ˆ é uma matriz diagonal de resíduos ao
onde 
quadrado ui2 de  , que é o estimador GMM de
primeiro estágio consistente mas não
necessariamente eficiente. No comando Stata
ivreg2, este estimador de primeiro estágio é ˆIV ,
o estimador de variáveis instrumentais.
COMO UTILIZAR O COMANDO IVREG2 PARA
ESTIMAR GMM
use MROZ, clear
ivreg2 lwage exper expersq (educ=age kidslt6 kidsge6)
ivreg2 lwage exper expersq (educ=age kidslt6 kidsge6), robust
ivreg2 lwage exper expersq (educ=age kidslt6 kidsge6), gmm2s robust
ivreg2 lwage exper expersq (educ=age kidslt6 kidsge6), gmm2s

No primeiro comando (acima) temos um estimador padrão IV/2SLS
(estamos assumindo da matriz de variância- covariância que os erros são
condicionalmente homocedásticos e independentes (i.i.d.).

No segundo comando temos um estimador IV/ 2SLS com estimador da
matriz de variância-covariância que é robusto a heterocedasticidade.
GMM E ERROS HETEROCEDÁSTICOS

ˆ é a matriz diagonal de quadrados dos

resíduos.
 uˆ12

ˆ

0

uˆi2
0


uˆn2 
onde uˆi é uma estimativa consistente de u i . Então,
um estimador consistente de S é
1
ˆ
ˆ Z)
S  (Z ' 
n
(18)
GMM E ERROS HETEROCEDÁSTICOS
1.
2.
Estimar uma equação usando IV.
Calcule os resíduos uˆ . Use estes resíduos para
calcular a matriz de ponderação ótima:
1
1
ˆ
ˆ
ˆ Z )) 1
W  S1.  ( ( Z´
n
3.
(19)
Calcule o estimador GMM eficiente ˆEGMM e sua
matriz de variância-covariância usando a
matriz de ponderação ótima estimada.
QUAIS SÃO AS IMPLICAÇÕES DA
HETEROCEDASTICIDADE PARA O ESTIMADOR




IV?
Na presença de heterocedasticidade, o estimador IV é
ineficiente mas consistente, enquanto que a matriz padrão
estimada de covariância é inconsistente.
A vantagem do GMM sobre IV é clara: se a
heterocedasticidade está presente, o estimador GMM é
mais eficiente que o estimador simples IV, enquanto que se
não existe heterocedasticidade o estimador GMM não é pior
assintoticamente que o estimador IV.
No entanto, o uso do GMM tem um preço. A matriz de
ponderação ótima Sˆ é uma função dos quartos momentos e
a obtenção de uma estimativa razoável para estes requer
amostras muito grandes.
Se o erro é homocedástico, IV é preferível ao GMM eficiente
(ver Slide 30).
TESTES DE HETEROCEDASTICIDADE





Estatísticas de Breusch-Pagan/Godfrey/Cook-Weisberg e
White/Koenker são testes de heterocedasticidade em
regressão OLS.
Testa-se a relação entre os resíduos da regressão e p
variáveis indicadores que são relacionadas a
heterocedasticidade (por hipótese).
2

A estatística é distribuída como uma com p graus de
liberdade sob a nula de não heterocedasticidade e de que o
erro da regressão é normalmente distribuído.
O poder deste teste é muito sensível a hipótese de
normalidade dos resíduos: Koenker proposum teste que
relaxa esta hipótese.
Estes testes estão no Stata após a estimação com o
comando regress, com ivhettest, hettest e whitetst.
TESTES DE HETEROCEDASTICIDADE
Pagan e Hall mostraram que estes testes são
válidos na regressão IV somente se há
heterocedasticidade naquela equação e em
nenhuma outra mais no sistema.
 As outras equações estruturais no sistema
(correspondentes aos regressores endógenos X1)
precisam ser homocedásticas mesmo que elas não
sejam explicitamente estimadas.
 Este teste está disponível no Stata através do
comando ivhettest após a estimação com ivreg,
ivreg2 ou ivgmm0

TESTANDO A RELEVÂNCIA E VALIDADE DOS
INSTRUMENTOS
Como vimos as variáveis instrumentais tem que
satisfazer duas condições: precisam ser
correlacionadas com os regressores endógenos e
devem ser ortogonais ao processo de erro.
 A primeira condição pode ser testada examinando
o grau de ajuste das regressões de primeiro
estágio, ou o que é o mesmo, verificar o poder
explicativo dos instrumentos excluídos nestas
regressões.
 A estatística comumente usada é o R2 da
regressão de primeiro estágio: a correlação
parcial ao quadrado entre os instrumentos
excluídos Z1 e o regressor endógeno (Bound).

TESTANDO A RELEVÂNCIA E VALIDADE DOS
INSTRUMENTOS




Um exemplo: o pesquisador tem um modelo com dois
regressores endógenos e dois instrumentos excluídos. Um
dos instrumentos excluídos é altamente correlacionado com
os dois regressores endógenos mas o outro instrumento
excluído tem uma correlação nula (representa um processo
de ruído).
O modelo está, portanto, sub-identificado: há um
instrumento bom mas dois regressores endógenos. Mas a
estatística F e o R2 não revelam esta fraqueza.
A solução é encontrar mais instrumentos relevantes ou
eliminar o regressor endógeno da equação.
A estatística de Bound só e válida quando temos apenas um
regressor endógeno.
TESTANDO A RELEVÂNCIA E VALIDADE DOS
INSTRUMENTOS
Para levar em conta diversos regressores
endógenos Shea(1997) propôs “uma medida de R2
parcial que leva em conta as inter-correlações
entre os instrumentos”. Para um modelo
contendo um único regressor endógeno, as duas
medidas de R2 são equivalentes.
 Se uma equação gera um grande valor do R2
parcial (Bound) e pequeno valor da medida de
Shea, podemos concluir que os instrumentos tem
pouca relevância para explicar os regressores
endógenos e o modelo pode estar sub-especificado.

CONSEQÜÊNCIAS DE INSTRUMENTOS
FRACOS






Aumento do viés dos coeficientes IV estimados.
O modelo não fica identificado com relação as variáveis
endógenas.
Neste caso, o viés do estimador IV é o mesmo do estimador
OLS – a estimação IV é inconsistente e nada se ganha com
isto.
Para equação com um único regressor endógeno uma
estatística F com valor menor do que 10 significa que os
instrumentos são fracos.
Deve-se ser parcimonioso na escolha dos instrumentos,
dado que o viés por IV é crescente com o numero de
instrumentos.
O problema de instrumentos fracos pode aparecer mesmo
quando os testes de primeiro estágio são significativos aos
níveis de 5 e 1 % e se dispõe de uma amostra grande.
TESTANDO A ENDOGENEIDADE DE UMA
VARIÁVEL EXPLICATIVA (WOOLDRIDGE PG 473)

Suponha a seguinte equação de regressão:
y1  0  1 y2  2 z1  3 z2  u1
(20)
onde y2 é a variável que suspeita-se que seja
endógena e z1 e z2 são exógenas.
 Temos a equação de y2 na forma reduzida:
(21)
y2   0  1z1   2 z2   3z3   4 z4  v2
 Como as variáveis z são não correlacionadas com
u1, y2 será não correlacionado com u1 se, e somente
se v2 for não correlacionada com u1.
TESTANDO A ENDOGENEIDADE DE UMA
VARIÁVEL EXPLICATIVA

Existem duas maneiras de testar isto:
1) Regredir u1 contra em v2 um modelo u1  1v2  e1
onde e1 é não correlacionado com v2 e tem média 0.
Então u1 e v2 serão não correlacionados se, e
somente se 1  0 .
2) Incluir v2 como um regressor adicional na
primeira equação e fazer um teste t para  1 :
y1  0  1 y2  2 z1  3 z2  1v2  u1
(22)
TESTANDO A ENDOGENEIDADE DE UMA
VARIÁVEL EXPLICATIVA
Se a estimativa  1 for significativa (através de um
teste t) concluímos que y2 é endógena na equação
(20).
 Podemos também testar a endogeneidade de
múltiplas variáveis explicativas. Para cada
variável suspeita de ser endógena obtemos os
resíduos da equação da forma reduzida e
verificamos a significância conjunta da forma
estrutural usando um teste F. Se rejeitarmos a
nula concluímos que pelo menos uma das
variáveis explicativas é endógena (Wooldridge pg.
477).

TESTANDO A ENDOGENEIDADE DE UMA
VARIÁVEL EXPLICATIVA
* TESTE DE ENDOGENEIDADE DE UMA UNICA VARIAVEL
EXPLICATIVA
use "c:\textos download\wooldridge data files\mroz.dta", clear
regress educ exper expersq motheduc fatheduc if hours > 0
test motheduc fatheduc
predict v2,residuals
regress lwage educ exper expersq v2
regress lwage educ exper expersq
ivregress 2sls lwage exper expersq (educ = motheduc fatheduc)
MODELOS DE EQUAÇÃO SIMULTÂNEA E O
PROBLEMA DA IDENTIFICAÇÃO
Vamos supor um modelo Keynesiano simples de
determinação de renda:
Função consumo:
Ct   0  1Yt  ut 0 < 1  1 (23)
Identidade da renda: Yt  Ct  I t ( St )
(24)

onde:
C = despesas de consumo
Y = renda
I = investimento (considerado exógeno)
S = poupança
t = tempo
u = termo de erro estocástico
MODELOS DE EQUAÇÃO SIMULTÂNEA E O
PROBLEMA DA IDENTIFICAÇÃO
No modelo de equações simultâneas (equações 23
e 24) nota-se que C e Y são variáveis
interdependentes. Quando o termo aleatório ut
muda, o valor de C varia (pela equação 23) e isto
faz variar Y (pela equação 24) tornando Yt e ut
correlacionados em (23).
 Isto faz com que o estimador OLS de 1 em (23)
seja viesado e inconsistente. Podemos demonstrar
isto também (ver Gujarati, pg 582) substituindo
(23) em (24) e teremos:
(25)
Yt   0  1Yt  ut  I t

O PROBLEMA DA IDENTIFICAÇÃO
Problema da identificação = possibilidade de
obter, ou não, os parâmetros de uma equação
estrutural a partir dos coeficientes estimados na
forma reduzida. Em caso afirmativo, dizemos que
a equação é identificada. Em caso negativo,
dizemos que a equação é sub-identificada.
 Uma equação é exatamente identificada quando
podemos obter valores numéricos exatos para
seus parâmetros.
 Uma equação é sobre-identificada quando mais
de um valor numérico podem ser obtidos para
alguns dos parâmetros das equações estruturais.

REGRAS PARA IDENTIFICAÇÃO: A
CONDIÇÃO DE ORDEM
No caso de um modelo com M equações
simultâneas, para que a equação possa ser
identificada, é preciso que exclua no mínimo M-1
das variáveis (tanto endógenas quanto exógenas)
que aparecem no modelo.
 Para que uma equação seja identificada, em um
modelo de M equações simultâneas, o número de
variáveis exógenas excluídas da equação não
poderá ser menor do que o número de variáveis
endógenas incluídas nesta equação menos 1.

REGRAS PARA IDENTIFICAÇÃO: A
CONDIÇÃO DE ORDEM
Exemplo 1:
Função de demanda: Qt   0  1 Pt  u1t
Qt   0  1 Pt  u2t
Função de oferta:
modelo com duas variáveis endógenas, P e Q e
nenhuma variável exógena. Para serem
identificadas, cada uma destas equações devem
excluir M-1 = 2-1 = 1 variável. Como isto não ocorre
nenhuma das equações é identificada.
REGRAS PARA IDENTIFICAÇÃO: A
CONDIÇÃO DE ORDEM
Exemplo 2:
Função de demanda: Qt   0  1 Pt   2l + u1t
Função de oferta:
Qt   0  1 Pt  u2t
modelo com duas variáveis endógenas, P e Q e l é
exógena. Para serem identificadas, cada uma
destas equações devem excluir M-1 = 2-1 = 1
variável. A função de demanda não é identificada,
mas a função de oferta é exatamente identificada.
REGRAS PARA IDENTIFICAÇÃO: A
CONDIÇÃO DE ORDEM
Exemplo 3:
Função de demanda: Qt   0  1 Pt   2l + u1t
Função de oferta:
Qt   0  1Pt   2 Pt 1  u2t
modelo com duas variáveis endógenas, Pt e Qt e l e
Pt-1 são exógenas. Para serem identificadas, cada
uma destas equações devem excluir M-1 = 2-1 = 1
variável. Tanto a função de demanda como a função
de oferta são exatamente identificadas. Portanto, o
modelo como um todo é identificado.
REGRAS PARA IDENTIFICAÇÃO: A
CONDIÇÃO DE POSTO

Ver Gujarati e Baum.
TESTES REALIZADOS ATRAVÉS DO COMANDO
IVREG2: TESTE HANSEN-SARGAN
Teste de restrições de sobre-identificação.
 A hipótese nula conjunta é que os instrumentos
são instrumentos válidos, isto é, não
correlacionados com o termo de erro e que os
instrumentos excluídos são corretamente
excluídos da equação estimada.
 Sob a nula, a estatística de teste é distribuída
como qui-quadrado no número de restrições de
sobre-identificação.
 Uma rejeição coloca em dúvida a validade dos
instrumentos.

TESTES REALIZADOS ATRAVÉS DO COMANDO
IVREG2: TESTE HANSEN-SARGAN
Para o estimador eficiente GMM, a estatística de
teste é a estatística J de Hansen, que é o valor
minimizado da função objetivo GMM.
 Para os estimador 2SLS, a estatística de teste é a
estatística de Sargan, calculada como N*R2 de
uma regressão dos resíduos de IV sobre o
conjunto completo de instrumentos.
.

TESTES REALIZADOS ATRAVÉS DO
COMANDO IVREG2: ESTATÍSTICA C





A estatística C, ou estatística “diferença-em-Sargan” é
obtida através da opção orthog do comando ivreg2.
Permite o teste de um subconjunto de condições de
ortogonalidade, ou seja, é o teste de exogeneidade de um ou
mais instrumentos.
É definida como a diferença da estatística Hansen-Sargan
da equação com o conjunto menor de instrumentos e a
equação com o conjunto completo de instrumentos
(incluindo os instrumentos suspeitos).
Sob a nula de que todos os instrumentos são válidos a
estatística C tem distribuição qui-quadrado no número de
instrumentos testados.
A falha em rejeitar a nula significa que o conjunto total de
condições de ortogonalidade é válido.
TESTES REALIZADOS ATRAVÉS DO COMANDO IVREG2:
TESTE DE RAZÃO DE VEROSSIMILHANÇA DE
CORRELAÇÃO CANÔNICA DE ANDERSON





Testa se a equação é identificada, ou seja, se os
instrumentos excluídos são válidos.
A hipótese nula é que a equação é sub-especificada.
Sob a nula de sub-identificação, a estatística é distribuída
como qui-quadrado com L-K+1 graus de liberdade (L=
número de instrumentos excluídos e incluídos).
A estatística fornece uma medida da relevância dos
instrumentos e a rejeição da nula indica que o modelo é
identificado.
Importante: uma rejeição da nula deve ser interpretada
com cautela, já que problemas de instrumentos fracos
podem ainda estar presentes.
O COMANDO IVREG2
O COMANDO IVREG2 E COMPLEMENTARES
Uma importante referencia a ser pesquisada é:
Baum, Christopher F. Instrumental variables:
Overview and advances. Boston College and DIW
BerlinUKSUG 13, London, September 2007.
REFERENCIAS
Baum, C. F., M. E. Schaffer, and S. Stillman.
2003. Instrumental variables and GMM:
Estimation and testing. Stata Journal 3: 1–31.
 Baum, C. F. 2006. An Introduction to Modern
Econometrics Using Stata. College Station, TX:
Stata Press.
 Baum, C. F. Schaffer M.E. e Stillman, S. 2006.
Enhanced routines for instrumental
variables/GMM estimation and testing, 2007.
 Wooldridge, J. M.. 2003. Introductory
Econometrics: A Modern Approach. 2nd ed. New
York: Thomson Learning.

REFERENCIAS

Cameron, A.C. e Trivedi, P.K., 2009.
Microeconometrics using Stata, StataCorp LP.,
College Station, Texas.
Download

Variáveis instrumentais e estimação GMM