Econometria II Ajuste de regressão 13 de abril de 2015 Ajuste da Regressão “Variação:” No contexto do “modelo” , significa a variação de uma variável como resultado do movimento de outra variável. Medida de ajuste: R2 Ajuste da Regressão A quantidade R2 é conhecida como coeficiente de determinação (da amostra). A medida utilizada do grau de ajuste de uma reta de regressão. Traduzindo, R2 mede a proporção ou a porcentagem da variação total do lado esquerdo da equação explicada pelo modelo de regressão. Medida de ajuste R2 e'e Regression Variation = 1 N 2 Total Variation (y y) i1 i R2 é limitado a zero e um sss: (a) Existe um termo constante em X e (b) O método utilizado é o MQO. Adicionando variáveis R2 nunca é reduzido quando uma variável z é adicionada na regressão: Adicionando variáveis ao modelo Modelo 1: Mínimos Quadrados (OLS), usando as observações 1-3010 (n = 2220) Observações omissas ou incompletas foram ignoradas: 790 Variável dependente: wage const educ age fatheduc motheduc Coeficiente Erro Padrão -598,93 53,2452 19,3177 2,27429 28,835 1,65546 5,96486 1,84208 5,68477 2,19016 Média var. dependente Soma resíd. quadrados R-quadrado F(4, 2215) Log da verossimilhança Critério de Schwarz 589,8140 1,26e+08 0,191659 131,2951 -15301,33 30641,19 razão-t -11,2485 8,4940 17,4181 3,2381 2,5956 p-valor <0,00001 <0,00001 <0,00001 0,00122 0,00950 D.P. var. dependente E.P. da regressão R-quadrado ajustado P-valor(F) Critério de Akaike Critério Hannan-Quinn *** *** *** *** *** 265,1151 238,5742 0,190199 9,8e-101 30612,66 30623,08 Adicionando variáveis ao modelo Modelo 2: Mínimos Quadrados (OLS), usando as observações 1-3010 (n = 2220) Observações omissas ou incompletas foram ignoradas: 790 Variável dependente: wage const educ age fatheduc motheduc black Coeficiente Erro Padrão -523,135 54,2643 18,9735 2,2567 28,0532 1,64716 3,97919 1,85614 4,25957 2,18512 -89,2008 14,6514 Média var. dependente Soma resíd. quadrados R-quadrado F(5, 2214) Log da verossimilhança Critério de Schwarz 589,8140 1,24e+08 0,204969 114,1597 -15282,90 30612,04 razão-t -9,6405 8,4076 17,0312 2,1438 1,9494 -6,0882 p-valor <0,00001 <0,00001 <0,00001 0,03216 0,05138 <0,00001 D.P. var. dependente E.P. da regressão R-quadrado ajustado P-valor(F) Critério de Akaike Critério Hannan-Quinn *** *** *** ** * *** 265,1151 236,6553 0,203174 1,4e-107 30577,80 30590,31 R2 ajustado 2 R = 1 - [(n-1)/(n-K)](1 - R2) Inclui uma penalidade para variáveis que não acrescentam muito ao ajuste do modelo. Pode cair quando uma variável é incluída no modelo. Critérios de informação Refletem também a qualidade de ajustamento do modelo. Calculados com base na SQR (soma do quadrado dos resíduos). Critério de Informação de Akaike: é uma estatística frequentemente utilizada para a escolha da especificação ótima de uma equação de regressão no caso de alternativas não aninhadas. Dois modelos são ditos não aninhados quando não existem variáveis independentes comuns aos dois. Quando se quer decidir entre dois modelos não aninhados, o melhor é o que produz o menor valor do critério de Akaike Critérios de informação AIC = log (SQR/n) + 2k/n AIC = log(ee/n) + 2K/n Critérios de informação Critério de Schwarz é uma estatística semelhante ao critério de Akaike com a característica de impor uma penalidade maior pela inclusão de coeficientes adicionais a serem estimados. SC = log (SQR/n) + (k log n)/n SC = log (ee/n) + (k log n)/n Princípio da Parcimônia Que as descrições sejam mantidas tão simples até que se mostrem inadequadas. Variáveis não devem ser incluídas no modelo sem necessidade.