Aula 10 Introdução ao Stata 7 de junho de 2013 Exemplo: Gastos médicos com um único regressor • Medical Expenditure Panel Survey • Variável dependente: ldrugexp (log dos gastos com medicamentos prescritos) • Variável endógena: hi_empunion: variável de seguro de vida endógena. • Ter este seguro saúde é uma variável de escolha. Aqueles que esperam gastar mais com saúde, escolhem um emprego que ofereça este tipo de seguro saúde. Possíveis instrumentos • firmsz: tamanho da firma. • multlc: se a firma tem múltiplas localidades. Estes instrumentos poderiam captar se o indivíduo tem acesso ao seguro saúde suplementar via o empregador. Estas duas últimas variáveis podem não ser relevantes para os aposentados, CP, e que compram seguro de forma privada. Possíveis instrumentos • Ssiratio: razão entre a renda individual advinda da seguridade social e a renda de todas as fontes – indicativo de restrições de renda. • Lowincome: dummy indicando o status de baixa renda das pessoas. Os instrumentos são relevantes pois tem uma correlação negativa com o acesso a seguridade suplementar. O papel direto da renda está sendo controlado pela variável linc (log da renda total familiar). Regressão Linear: Variáveis instrumentais • Teste de sobreidentificação: – A validade de um instrumento não pode ser testada em um modelo exatamente identificado. – É possível testar a validade em um modelo sobreidentificado (mais instrumentos que regressores endógenos). – Testa se instrumentos sobreidentificadores são não correlacionados com o erro. – Testes: testes de sobreidentificação, teste de Hansen, teste de Sargan e teste Hansen-Sargan. Teste de sobreidentificação – Imagine o seguinte modelo: y1 y2 – Se y2 é endógeno, tenho que ter um instrumento , tal que: cov(z, y2 ) 0 cov(z, ) 0 – Suponha que este instrumento é z1, rodo MQ2E e salvo resíduos. Testo se: (z2 é o outro instumento) cov(z2eˆ) 0 Teste de sobreidentificação Qui quadrada com assintótica com gl = número de restrições sobreidentificad oras • Regredir os resíduos das variáveis instrumentais sobre todos instrumentos e as variáveis exógenas e a constante. • A rejeição da hipótese nula indica que pelo menos um instrumento não é válido. Entretanto não sabemos qual instrumento. • Não rejeitar a hipótese nula não garante que todos instrumentos sejam válidos! Teste de sobreidentificação • Usando ssratio e multlc. • A estatística de teste é distribuída qui quadrada com 1 gl. (2-1 = restrições de sobreidentificação). • Como p > 0.05 , não podemos rejeitar a hipótese nula e concluimos que a restrição de sobreidentificação não é válida. Hansen J statistic (overidentification test of all instruments): Chi-sq(1) P-val = Instrumented: hi_empunion Included instruments: totchr age female blhisp linc Excluded instruments: ssiratio multlc 1.048 0.3061 Teste de sobreidentificação • Usando ssratio, multlc, lowincome, firmsz • A estatística de teste é distribuída qui quadrada com 3 gl. (4-1 = restrições de sobreidentificação). • Como p < 0.05 , rejeita a hipótese nula e concluimos que a restrição de sobreidentificação é válida. Hansen J statistic (overidentification test of all instruments): Chi-sq(3) P-val = Instrumented: hi_empunion Included instruments: totchr age female blhisp linc Excluded instruments: ssiratio lowincome firmsz multlc 11.590 0.0089 Regressão quantílica Regressão quantílica • Técnica de regressão mais robusta que apresenta vantagens em comparação ao método de MQO no caso de violações das suposições do modelo de regressão clássico. • Método mais robusto de estimação • Para algumas variáveis contínuas, não basta apenas olhar o comportamento da média. • Usada nos casos em que os erros não têm distribuição normal ou quando a variável dependente apresenta valores extremos. Justificativas do uso • A média pode ficar estável, mas o comportamento da variável é diferenciado ao longo da distribuição. • Pode haver interesse em uma parte específica da distribuição da variável. • A regressão quantílica permite examinar como os quantis da variável dependende mudam em resposta a um conjunto de variáveis independentes. Regressão quantílica • Método de MQO: estima o efeito médio de uma variável X sobre a distribuição condicional de Y em X. Regressão quantílica • Regressão quantílica: efeito em toda a distribuição condicional da variável de interesse dadas as variáveis explicativas. • Visão mais completa da relação entre as variáveis. Regressão quantílica • Estimo para partes da distribuição. MQO Definições • Quantil: • Mediana • Primeiro e último decil: • Primeiro e último quartil: Método de estimação • Minimização do desvio médio absoluto: • b será a mediana Método de estimação • Minimização para qualquer quantil: • Minimiza a soma ponderada dos valore absolutos dos resíduos • Regressão quantílica Regressão quantílica • As variáveis X afetam o comportamento de toda a distribuição de Y. • O impacto num quantil inferior pode ser diferente do impacto na média. • Para cada quantil, há uma regressão quantílica: • Para cada quantil, haverá um vetor de parâmetros estimados. Interpretação • De que forma a distribuição condicional do quantil muda com variações de X • Impacto das mudanças em xj, sob a hipótese de que os indivíduos permaneçam no mesmo quantil da distribuição depois da mudança. Comandos no stata • qreg: especificar o quantil • Bsreg: erro padrão calculado por bootstrap • Sqreg: estima para diferentes valores dos quantis simultaneamente. • Iqreg: estima para a diferença interquartílica Exemplo 2 4 6 8 10 12 • Medical Expenditure Panel Survey • Log Gastos com medicamentos: ltotexp • Dado: mus03data.dta 0 .25 .5 Fraction of the data .75 1 Variable suppins totchr age female white _cons OLS 0.257 0.046 0.445 0.018 0.013 0.004 -0.077 0.046 0.318 0.141 5.898 0.296 QR_25 QR_50 QR_75 0.386 0.055 0.459 0.022 0.016 0.004 -0.016 0.054 0.338 0.166 4.748 0.363 0.277 0.047 0.394 0.018 0.015 0.004 -0.088 0.047 0.499 0.143 5.649 0.300 0.149 0.060 0.374 0.022 0.018 0.005 -0.122 0.060 0.193 0.182 6.600 0.381 BSQR_50 0.277 0.059 0.394 0.020 0.015 0.004 -0.088 0.052 0.499 0.233 5.649 0.385 -0.02 Age 0.02 .2 .4 .6 .8 Quantile 1 .4 .6 .8 Quantile 0 .2 .4 .6 .8 Quantile 0.50 .2 0.00 0 -1.00 -0.50 =1 if white 1 1.00 0 0.20 .4 .6 .8 Quantile 0.00 0.40 0.04 .2 -0.40 -0.20 =1 if female 0.00 0 1 1 0 .2 .4 .6 .8 Quantile 1 0 .2 .4 .6 .8 Quantile 1 n of chronic condns 0.00 0.20 0.40 0.60 10.00 0.20 0.30 0.40 0.50 0.60 0.70 -0.20 =1 if supp ins 2.00 4.00 6.00 8.00 Intercept