Laboratório de Introdução à Análise de Dados Categóricos
Prof. Jeronimo Oliveira Muniz
[email protected]
Exercício 1_Regressões Lineares
1. Regressão linear simples
Os dados utilizados são:
. use http://www.stata.com/data/jwooldridge/eacsap/attend.dta, clear
(a) Estime os parâmetros (coeficientes) do modelo de regressão que estabelece uma
função linear entre a nota da prova final (variável resposta ou dependente,
stndfnl) e a presença em sala de aula (covaviável ou variável independente ou
“explicativa”, atndrte). Interprete o intercepto e a inclinação.
(b) Teste a significância da inclinação usando o teste t e o teste F. Como estes dois
testes estão relacionados?
(c) Faça um gráfico de dispersão dos dados e plote a curva dos valores ajustados.
Comente sobre o ajuste do modelo.
2. Regressão linear múltipla
(a) Adicione a nota média passada (priGPA) como variável preditora e repare o que
acontece com a estimativa do coeficiente de presença.
(b) Neste novo modelo pode-se concluir que a presença em sala de aula está
relacionada à nota da prova final? Teste esta hipótese.
(c) Faça a predição das notas finais e verifique que a correlação entre valores
observados e preditos são parecidos ao valor do coeficiente de determinação
(R2).
(d) Examine a linearidade do efeito líquido da nota média passada sobre a nota da
prova final controlando pela presença em sala de aula. Para realizar esta tarefa
estime os resíduos do modelo de regressão “nota final=f(presença)” e do modelo
“nota passada= f(presença)”. Plote estes dois resíduos no diagrama de dispersão
e ajuste a reta linear na mesma.
(e) Calcule a correlação entre estes resíduos. Verifique que a correlação entre a nota
da prova final e a nota média passada, controlando-se pela presença em sala de
aula, também pode ser calculada examinando-se coeficientes de correlação
parcial entre as três variáveis do modelo.
(f) Adicione um termo quadrático da nota média passada (na equação estimada em
2(a) e interprete os coeficientes lineares e quadraticos desta variável (priGPA).
Adicione esta variável (e seu termo quadrático) centrada em torno da média.
Questão BONUS
3. Simulação estocástica a partir do modelo especificado (Clarify)
.findit clarify
(Talvez seja necessário configurar o diretorio de download de programas adicionais.
Exemplo: . net set ado C:\Stata11MP\ado\updates)
Simular a ditribuição de coeficientes 1000 vezes:
. estsimp regress stndfnl atndrte
. setx mean
. setx
Estimar valores preditos em função de valores escolhidos da covariável de interesse.
. simqi
. simqi, fd(ev) listx changex(atndrte 81.71 82.71)
(a) Levando-se em conta a incerteza no cálculo dos coeficientes estimados, qual
seria a nota final predita daqueles que frequentaram somente 50 porcento das
aulas e cuja a nota média passada foi máxima (ex. 3,93)? Qual intervalo de
95% de confiança para esta nota?
(b) E qual seria é o intervalo de confiança para aqueles que foram a todas as
aulas mas mas tiveram uma nota passada média igual a 1?
Download

Exercicio 01