Analise de Regressão
Parte 2
Interpretando Valores
Y
Um valor de Y conhecendo X!
X
Interpretando Valores
Y
Y
Y
X
Interpretando Valores e os Ruídos
Y
Yi (valor real)
*
Y
^
X
Interpretando os Valores e os
Ruídos
Y
Yi (valor real)
*
^
Y
i
(valor estimado)
Y
^
Y
= b0 + b1X
Esta equação vai “procurar” passar
no meio das distribuições para os
possíveis valores de Y a partir de
um dado valor X
X
Interpretando os Ruídos!
Y
Yi (valor real)
*
Yi - Y
^
Yi - Y
i
^ (valor estimado)
Y
i
^ -Y
Y
i
Y
^
Y
= b0 + b1X
X
Interpretando os ruídos / resíduos
Resíduo Global ou Variação Total em Y
Yi - Y
Se elevar ao Quadrado e considerar o somatório de
todos os possíveis valores obtenho o que se chama de
SQDy – Variação Total em Y
Variação de Y explicada pela regressão.
Se elevar ao Quadrado e considerar o somatório de todos
os possíveis valores obtenho o que se chama de
^ -Y
Y
i
SQRegressão – Variação de Y explicada pela regressão
Variação de Y Não explicada pela regressão.
Se elevar ao Quadrado e considerar o somatório de todos
os possíveis valores obtenho o que se chama de
SQResíduo – Variação de Y não explicada pela regressão
^
Yi - Yi
Interpretando os Ruídos
Y
Yi (valor real)
*
Yi - Y
^
Yi - Y
i
^ (valor estimado)
Y
i
^ -Y
Y
i
Y
^
Y
= b0 + b1X
X
Modelo de Regressão Linear
mais simples?!!
Inclinação
Intercepto
Populacional Populacional
Variável
Independente
Yi=b0+b1Xi +i
Variável
Dependente
Yi
i
Y
b1
Erro
Aleatório
Y = E(Y) = b0 + b1 X
Coeficiente
angular
Ŷi=b0+b1Xi Modelo estimado
i =Yi-Ŷi Resíduo
b0
X
Como?
n
b0  y  bˆ1 x e b1 
 x y  nxy
i 1
n
i
i
x
i 1
De onde surgiu? MMQO
Método dos Mínimos Quadrados Ordinários
2
i
 nx
2
MMQO
Yi
Y
i
Y = E(Y) = b0 + b1 X
b1 Coeficiente
angular
b0
X
MMQO
Para se encontrar o mínimo para uma
equação, deve-se derivá-la em relação à
“variável” de interesse e igualá-la a zero. A
sua derivada segunda deverá, obviamente,
ser positiva, o que no caso sempre
ocorrerá, por se tratar de uma soma de
quadrados.
Derivando então a expressão (1) em
relação aos parâmetros e igualando-as a
zero, poderemos obter duas equações
que, juntas, vão compor o chamado
sistemas de equações normais. A solução
desse sistema fornecerá:
Note: Novas Formas ou fórmulas!
Será mesmo?
n
b0  y  bˆ1 x e b1 
 x y  nxy
i 1
n
i
i
2
2
x

nx
i
i 1
Perguntas
Podemos extrapolar: isto é tentar avaliar previsões
para fora do intervalo observado para os dados
Erro Padrão da Estimativa: É a medida de variabilidade em
torno da linha de regressão (isto é, o seu desvio padrão).
e
= 1602,0971;
Medidas de Variação na Regressão
e na Correlação
• Utilidade:
– Verificar se a variável independente prevê
bem a variável dependente no modelo
estatístico utilizado!
• Soma Total de Quadrados (STQ)
• Coeficiente de Determinação
• Coeficiente de Correlação Linear
Pressupostos da Regressão e da
Correlação
•
Normalidade
•
•
Homocedasticidade
•
•
Afeta a forma de cálculo dos coeficientes de regressão
Independência de Erros
•
•
Afeta as inferências sobre os valores dos coeficientes de
regressão.
Aplica-se, em especial, a valores coletados ao longo de
um período de tempo.
Linearidade
•
O modelo utilizado não é adequado.
Análise dos Resíduos
ei  (Yi  Yi )
0
0
X
X
Erros Correlacionados
4
2
0
1
-2
-4
2
3
4
5
6
7
8
9
10 11 12 13 14 15 16
Estimativas de Intervalo de
Confiança
Yi  tn2 SYX hi
•
•
(valor médio)
Efeito Banda de Confiança
Yi  tn2 SYX 1  hi
Inferências sobre os Parâmetros:
REGRESSÃO e CORRELAÇÃO
Testes de hipótese sobre o valor de b1.
Testes de hipótese sobre o valor de .
Testes de hipótese sobre o valor de
b1
•
Hipóteses:
–
–
•
•
Determinar o nível de significância do teste ()
Calcular a estatística do teste
–
•
Nula  H0: b1 = 0 (não existe relação)
Alternativa  H1: b1  0 (existe uma relação)
Comparar Região de Rejeição com a estatística do
teste (Tabela da distribuição t com n-2 graus de
liberdade)
Concluir
Testes de hipótese sobre o valor de

•
Hipóteses:
–
–
•
•
Determinar o nível de significância do teste ()
Calcular a estatística do teste
–
•
Nula  H0:  = 0 (não existe correlação)
Alternativa  H1:   0 (existe correlação)
Comparar Região de Rejeição com a estatística do
teste (Tabela da distribuição t com n-2 graus de
liberdade)
Concluir
Exercícios
Download

Document