Aula 10
Introdução ao Stata
7 de junho de 2013
Exemplo: Gastos médicos com um
único regressor
• Medical Expenditure Panel Survey
• Variável dependente: ldrugexp (log dos gastos
com medicamentos prescritos)
• Variável endógena: hi_empunion: variável de
seguro de vida endógena.
• Ter este seguro saúde é uma variável de
escolha. Aqueles que esperam gastar mais
com saúde, escolhem um emprego que
ofereça este tipo de seguro saúde.
Possíveis instrumentos
• firmsz: tamanho da firma.
• multlc: se a firma tem múltiplas localidades.
Estes instrumentos poderiam captar se o
indivíduo tem acesso ao seguro saúde
suplementar via o empregador. Estas duas
últimas variáveis podem não ser relevantes
para os aposentados, CP, e que compram
seguro de forma privada.
Possíveis instrumentos
• Ssiratio: razão entre a renda individual advinda
da seguridade social e a renda de todas as fontes
– indicativo de restrições de renda.
• Lowincome: dummy indicando o status de baixa
renda das pessoas.
Os instrumentos são relevantes pois tem uma
correlação negativa com o acesso a seguridade
suplementar.
O papel direto da renda está sendo controlado pela
variável linc (log da renda total familiar).
Regressão Linear: Variáveis
instrumentais
• Teste de sobreidentificação:
– A validade de um instrumento não pode ser testada
em um modelo exatamente identificado.
– É possível testar a validade em um modelo
sobreidentificado (mais instrumentos que regressores
endógenos).
– Testa se instrumentos sobreidentificadores são não
correlacionados com o erro.
– Testes: testes de sobreidentificação, teste de Hansen,
teste de Sargan e teste Hansen-Sargan.
Teste de sobreidentificação
– Imagine o seguinte modelo:
y1  y2  
– Se y2 é endógeno, tenho que ter um instrumento , tal que:
cov(z, y2 )  0
cov(z,  )  0
– Suponha que este instrumento é z1, rodo MQ2E e salvo resíduos. Testo
se: (z2 é o outro instumento)
cov(z2eˆ)  0
Teste de sobreidentificação
Qui quadrada
com assintótica
com gl = número
de restrições
sobreidentificad
oras
• Regredir os resíduos das variáveis instrumentais
sobre todos instrumentos e as variáveis exógenas
e a constante.
• A rejeição da hipótese nula indica que pelo
menos um instrumento não é válido. Entretanto
não sabemos qual instrumento.
• Não rejeitar a hipótese nula não garante que
todos instrumentos sejam válidos!
Teste de sobreidentificação
• Usando ssratio e multlc.
• A estatística de teste é distribuída qui quadrada com 1 gl. (2-1
= restrições de sobreidentificação).
• Como p > 0.05 , não podemos rejeitar a hipótese nula e
concluimos que a restrição de sobreidentificação não é válida.
Hansen J statistic (overidentification test of all instruments):
Chi-sq(1) P-val =
Instrumented:
hi_empunion
Included instruments: totchr age female blhisp linc
Excluded instruments: ssiratio multlc
1.048
0.3061
Teste de sobreidentificação
• Usando ssratio, multlc, lowincome, firmsz
• A estatística de teste é distribuída qui quadrada com 3 gl. (4-1
= restrições de sobreidentificação).
• Como p < 0.05 , rejeita a hipótese nula e concluimos que a
restrição de sobreidentificação é válida.
Hansen J statistic (overidentification test of all instruments):
Chi-sq(3) P-val =
Instrumented:
hi_empunion
Included instruments: totchr age female blhisp linc
Excluded instruments: ssiratio lowincome firmsz multlc
11.590
0.0089
Regressão quantílica
Regressão quantílica
• Técnica de regressão mais robusta que apresenta
vantagens em comparação ao método de MQO
no caso de violações das suposições do modelo
de regressão clássico.
• Método mais robusto de estimação
• Para algumas variáveis contínuas, não basta
apenas olhar o comportamento da média.
• Usada nos casos em que os erros não têm
distribuição normal ou quando a variável
dependente apresenta valores extremos.
Justificativas do uso
• A média pode ficar estável, mas o
comportamento da variável é diferenciado ao
longo da distribuição.
• Pode haver interesse em uma parte específica
da distribuição da variável.
• A regressão quantílica permite examinar como
os quantis da variável dependende mudam
em resposta a um conjunto de variáveis
independentes.
Regressão quantílica
• Método de MQO: estima o efeito médio de
uma variável X sobre a distribuição
condicional de Y em X.
Regressão quantílica
• Regressão quantílica: efeito em toda a
distribuição condicional da variável de
interesse dadas as variáveis explicativas.
• Visão mais completa da relação entre as
variáveis.
Regressão quantílica
• Estimo para partes da distribuição.
MQO
Definições
• Quantil:
• Mediana
• Primeiro e último decil:
• Primeiro e último quartil:
Método de estimação
• Minimização do desvio médio absoluto:
• b será a mediana
Método de estimação
• Minimização para qualquer quantil:
• Minimiza a soma ponderada dos valore
absolutos dos resíduos
• Regressão quantílica
Regressão quantílica
• As variáveis X afetam o comportamento de
toda a distribuição de Y.
• O impacto num quantil inferior pode ser
diferente do impacto na média.
• Para cada quantil, há uma regressão
quantílica:
• Para cada quantil, haverá um vetor de
parâmetros estimados.
Interpretação
• De que forma a distribuição condicional do
quantil muda com variações de X
• Impacto das mudanças em xj, sob a hipótese
de que os indivíduos permaneçam no mesmo
quantil da distribuição depois da mudança.
Comandos no stata
• qreg: especificar o quantil
• Bsreg: erro padrão calculado por bootstrap
• Sqreg: estima para diferentes valores dos
quantis simultaneamente.
• Iqreg: estima para a diferença interquartílica
Exemplo
2
4
6
8
10
12
• Medical Expenditure Panel Survey
• Log Gastos com medicamentos: ltotexp
• Dado: mus03data.dta
0
.25
.5
Fraction of the data
.75
1
Variable
suppins
totchr
age
female
white
_cons
OLS
0.257
0.046
0.445
0.018
0.013
0.004
-0.077
0.046
0.318
0.141
5.898
0.296
QR_25
QR_50
QR_75
0.386
0.055
0.459
0.022
0.016
0.004
-0.016
0.054
0.338
0.166
4.748
0.363
0.277
0.047
0.394
0.018
0.015
0.004
-0.088
0.047
0.499
0.143
5.649
0.300
0.149
0.060
0.374
0.022
0.018
0.005
-0.122
0.060
0.193
0.182
6.600
0.381
BSQR_50
0.277
0.059
0.394
0.020
0.015
0.004
-0.088
0.052
0.499
0.233
5.649
0.385
-0.02
Age
0.02
.2
.4 .6 .8
Quantile
1
.4 .6 .8
Quantile
0
.2
.4 .6 .8
Quantile
0.50
.2
0.00
0
-1.00 -0.50
=1 if white
1
1.00
0
0.20
.4 .6 .8
Quantile
0.00
0.40
0.04
.2
-0.40 -0.20
=1 if female
0.00
0
1
1
0
.2
.4 .6 .8
Quantile
1
0
.2
.4 .6 .8
Quantile
1
n of chronic condns
0.00 0.20 0.40 0.60
10.00
0.20 0.30 0.40 0.50 0.60 0.70
-0.20
=1 if supp ins
2.00 4.00 6.00 8.00
Intercept
Download

Teste de sobreidentificação