Laboratório de Introdução à Análise de Dados Categóricos Prof. Jeronimo Oliveira Muniz [email protected] Exercício 1_Regressões Lineares 1. Regressão linear simples Os dados utilizados são: . use http://www.stata.com/data/jwooldridge/eacsap/attend.dta, clear (a) Estime os parâmetros (coeficientes) do modelo de regressão que estabelece uma função linear entre a nota da prova final (variável resposta ou dependente, stndfnl) e a presença em sala de aula (covaviável ou variável independente ou “explicativa”, atndrte). Interprete o intercepto e a inclinação. (b) Teste a significância da inclinação usando o teste t e o teste F. Como estes dois testes estão relacionados? (c) Faça um gráfico de dispersão dos dados e plote a curva dos valores ajustados. Comente sobre o ajuste do modelo. 2. Regressão linear múltipla (a) Adicione a nota média passada (priGPA) como variável preditora e repare o que acontece com a estimativa do coeficiente de presença. (b) Neste novo modelo pode-se concluir que a presença em sala de aula está relacionada à nota da prova final? Teste esta hipótese. (c) Faça a predição das notas finais e verifique que a correlação entre valores observados e preditos são parecidos ao valor do coeficiente de determinação (R2). (d) Examine a linearidade do efeito líquido da nota média passada sobre a nota da prova final controlando pela presença em sala de aula. Para realizar esta tarefa estime os resíduos do modelo de regressão “nota final=f(presença)” e do modelo “nota passada= f(presença)”. Plote estes dois resíduos no diagrama de dispersão e ajuste a reta linear na mesma. (e) Calcule a correlação entre estes resíduos. Verifique que a correlação entre a nota da prova final e a nota média passada, controlando-se pela presença em sala de aula, também pode ser calculada examinando-se coeficientes de correlação parcial entre as três variáveis do modelo. (f) Adicione um termo quadrático da nota média passada (na equação estimada em 2(a) e interprete os coeficientes lineares e quadraticos desta variável (priGPA). Adicione esta variável (e seu termo quadrático) centrada em torno da média. Questão BONUS 3. Simulação estocástica a partir do modelo especificado (Clarify) .findit clarify (Talvez seja necessário configurar o diretorio de download de programas adicionais. Exemplo: . net set ado C:\Stata11MP\ado\updates) Simular a ditribuição de coeficientes 1000 vezes: . estsimp regress stndfnl atndrte . setx mean . setx Estimar valores preditos em função de valores escolhidos da covariável de interesse. . simqi . simqi, fd(ev) listx changex(atndrte 81.71 82.71) (a) Levando-se em conta a incerteza no cálculo dos coeficientes estimados, qual seria a nota final predita daqueles que frequentaram somente 50 porcento das aulas e cuja a nota média passada foi máxima (ex. 3,93)? Qual intervalo de 95% de confiança para esta nota? (b) E qual seria é o intervalo de confiança para aqueles que foram a todas as aulas mas mas tiveram uma nota passada média igual a 1?