Universidade Federal Rural do Rio de Janeiro
CPGA-Solos
Análise Multivariada Aplicada as Ciências Agrárias
Regressão Múltipla para Dados
Repetidos
Carlos Alberto Alves Varella
Novembro-2006
Regressão Linear Múltipla para Dados com Repetição
Introdução
• Quando temos duas ou mais respostas
para o mesmo tratamento;
• SQTratamentos é decomposto em
SQregressão e SQFalta de ajustamento;
• O ajuste do modelo é avaliado pelo
teste para falta de ajustamento.
Regressão Linear Múltipla para Dados com Repetição
Análise de variância da regressão com o teste
para falta de ajustamento
•
Exemplo para dados de um delineamento experimental inteiramente
casualizado. Tratamentos são 5 níveis de uma mesma variável.
Repetições (Y)
Tratamentos (X)
Total de
tratamentos
Média de
tratamentos
1
2
2
5
5
10
4
5
7
12
6,0
6
7
8
15
7,5
8
8
9
17
8,5
10
9
12
21
10,5
Ti
Yi
5,0
N=número de observações = 10; n=número de tratamentos = 5;
r=número de repetições; G=total de observações=75.
Regressão Linear Múltipla para Dados com Repetição
Obtenção da variância residual ou
erro puro
• A variância residual é obtida por ANOVA;
• O modelo estatístico para delineamento inteiramente
causalizado é:
Yij    t i  e ij
Y ij  resposta ;
  média de tratamento s ;
t i  efeito de tratamento ;
e ij  resíduo  erro puro .
Regressão Linear Múltipla para Dados com Repetição
ANOVA para delineamento inteiramente casualizado
F.V.
G.L.
S.Q.
Tratamentos
4
37,00
Resíduo
Total
5
9
7,50
44,50
SQTotal

i
2
,j
Y ij  c , sendo c 
SQTratamen tos 
SQR  SQTotal
1
r
n
Ti
2
i 1
 SQTrat
QMR  ˆ
2
c
 s

1
2
 N
  Y i
 i 1



10
1,50
2
2
 5    12
N
2
Q.M.
 12
2
   21
2

2

75
10
75
10
2
 44 ,50
2
 37 ,00
 44 ,50  37 ,00  7 ,50
2

7 ,5
5
 1 ,50 com
n e  5 gl .
Regressão Linear Múltipla para Dados com Repetição
Neste caso não tem sentido
aplicar o teste F
• O teste F tem como hipótese nula a igualdade
das médias de fatores da variação;
• De fato o que estamos analisando são níveis
de um mesmo fator, então só temos um fator
e não tem sentido a aplicação do teste F;
• A estatística utilizada para avaliar o efeito de
níveis de um mesmo fator quantitativo é a
análise de variância da regressão.
Regressão Linear Múltipla para Dados com Repetição
É preciso conhecer o fenômeno para
depois modelar, ou melhor, tentar imitar
o mundo real.
• Neste caso estamos usando dois modelos:
ANOVA e REGRESSÃO
•
•
•
•
•
Yij    t i  e ij
Cada valor distinto de X é considerado com um diferente tratamento.
Neste caso, usado apenas para obter o erro puro=variância residual da
estimativa.
Yi   0   1 X i  e i
Cada valor distinto de X é considerado com um diferente valor de X.
De fato é o que ocorre no mundo real.
Este é o modelo que devemos usar para avaliar o efeito da variação de X
sobre o fenômeno.
Regressão Linear Múltipla para Dados com Repetição
Podemos adotar 3 estratégias diferentes
para a análise da regressão
1. Utilizando as observações individualizadas
2. Utilizando os totais de tratamentos
3. Utilizando a média de tratamentos
•
A estratégia utilizada não altera o resultado
da análise;
A equação de regressão será a mesma, isto
é, mesmo intercepto e mesmos regressores.
Regressão Linear Múltipla para Dados com Repetição
Primeiro caso: utilizando as observações
individualizadas
X ' X ˆ  X 'Y  ˆ   X ' X  X 'Y
1
5 
1
 

5
1
 

5 
1
 

7
 
1
7 
1
Y   , X  
8 
1
8 
1
 

9 
1
 

9
1
 

12 
1
2 

2
 60   75   3 , 45 
1  440

ˆ 


  

4 
800   60
10   504   0 ,675 

4 
 ˆ0 
6 
60 
10
 75 
ˆ
 , X 'X  
 , X 'Y  
,    
6 
440 
 ˆ1 
 60
 504 
8 

8 

10

Yˆi  3 , 45  0 ,675 X i
10 
Regressão Linear Múltipla para Dados com Repetição
Segundo caso: utilizando os totais de
tratamentos
1
r  X ' X ˆ  X 'Y  ˆ 
ˆ 
10 
1
 

12
1
 

Y  15  , X  1
 

17 
1
 21 
1
 

2 

4

5

6
, X 'X  

 30
8 
10 
1
2

 220

200   30
1
r
 30 

5
X
'X
 1 X
'Y
 75   3 , 45 

  

504

  0 ,675 
 ˆ0 
30 
 75 
ˆ
 , X 'Y  
,    
220 
 ˆ1 
 504 
Yˆi  3 , 45  0 ,675 X i
Regressão Linear Múltipla para Dados com Repetição
Terceiro caso: utilizando a média
de tratamentos


X ' X ˆ  X 'Y  ˆ  X ' X
ˆ 
 5 ,0 
1



6 ,0
1



Y   7 ,5  , X  1



 8 ,5 
1
10 ,51 
1



2 

4

5

6
, X 'X  

 30
8 
10 
 220

200   30
1
 30 

5
1
X 'Y
 37 ,5   3 , 45 

  

252

  0 ,675 
 ˆ0 
30 
 37 ,5 
ˆ
 , X 'Y  
,    
220 
 ˆ1 
 252 
Yˆi  3 , 45  0 ,675 X i
Regressão Linear Múltipla para Dados com Repetição
Seleção de modelos de regressão utilizando o teste F
para falta de ajustamento
*
falta de
ajustamento
regressão
modelo
inadequado
F
ns
modelo pode
ser selecionado
MODELO
*
modelo pode
ser selecionado
erro puro
F
ns
modelo
inadequado
Regressão Linear Múltipla para Dados com Repetição
Análise de variância da regressão com o teste para falta de
ajustamento: observações individualizadas
SQtotal
 Y 'Y  c  607  562 ,50  44 ,50
SQregressã o  ˆ ' X ' y  c  3 , 45
SQresíduo
da regressão
 SQtotal
I

 75 
0 ,675  
  562 ,50  598 , 95  562 ,50  36 , 45
504


 SQregressã
SQfalta de ajustament o  r . Y i  Yˆi
2

o  Y 'Y  ˆ ' X 'Y  607  598 , 95  8 ,05
 2  0 ,2750

0 ,55
i 1
Cálculo da soma de quadrados para a falta de ajustamento
Y
 Yˆi

Y
 Yˆi

2
i
Yi
Yˆ
2
5
4,8
0,20
0,0400
4
6
6,15
-0,15
0,0225
6
7,5
7,50
0,00
0,0000
8
8,5
8,85
-0,35
0,1225
10
10,5
10,20
0,30
0,0900
0,00
0,2750
X
i
i
i
Regressão Linear Múltipla para Dados com Repetição
Resultado da análise de variância da regressão
com o teste para falta de ajustamento
FV
GL
SQ
QM
F
Regressão
1
36,45
36,45
24,30**
Resíduo da regressão
8
8,05
1,00
Falta de ajustamento
3
0,55
0,18
Resíduo
5
7,50
1,50
Total
9
44,50
**= p<0,01; n.s=p>0,05
0,12ns
Download

Regressão linear múltipla para dados repetidos