Universidade Federal Rural do Rio de Janeiro CPGA-Solos Análise Multivariada Aplicada as Ciências Agrárias Regressão Múltipla para Dados Repetidos Carlos Alberto Alves Varella Novembro-2006 Regressão Linear Múltipla para Dados com Repetição Introdução • Quando temos duas ou mais respostas para o mesmo tratamento; • SQTratamentos é decomposto em SQregressão e SQFalta de ajustamento; • O ajuste do modelo é avaliado pelo teste para falta de ajustamento. Regressão Linear Múltipla para Dados com Repetição Análise de variância da regressão com o teste para falta de ajustamento • Exemplo para dados de um delineamento experimental inteiramente casualizado. Tratamentos são 5 níveis de uma mesma variável. Repetições (Y) Tratamentos (X) Total de tratamentos Média de tratamentos 1 2 2 5 5 10 4 5 7 12 6,0 6 7 8 15 7,5 8 8 9 17 8,5 10 9 12 21 10,5 Ti Yi 5,0 N=número de observações = 10; n=número de tratamentos = 5; r=número de repetições; G=total de observações=75. Regressão Linear Múltipla para Dados com Repetição Obtenção da variância residual ou erro puro • A variância residual é obtida por ANOVA; • O modelo estatístico para delineamento inteiramente causalizado é: Yij t i e ij Y ij resposta ; média de tratamento s ; t i efeito de tratamento ; e ij resíduo erro puro . Regressão Linear Múltipla para Dados com Repetição ANOVA para delineamento inteiramente casualizado F.V. G.L. S.Q. Tratamentos 4 37,00 Resíduo Total 5 9 7,50 44,50 SQTotal i 2 ,j Y ij c , sendo c SQTratamen tos SQR SQTotal 1 r n Ti 2 i 1 SQTrat QMR ˆ 2 c s 1 2 N Y i i 1 10 1,50 2 2 5 12 N 2 Q.M. 12 2 21 2 2 75 10 75 10 2 44 ,50 2 37 ,00 44 ,50 37 ,00 7 ,50 2 7 ,5 5 1 ,50 com n e 5 gl . Regressão Linear Múltipla para Dados com Repetição Neste caso não tem sentido aplicar o teste F • O teste F tem como hipótese nula a igualdade das médias de fatores da variação; • De fato o que estamos analisando são níveis de um mesmo fator, então só temos um fator e não tem sentido a aplicação do teste F; • A estatística utilizada para avaliar o efeito de níveis de um mesmo fator quantitativo é a análise de variância da regressão. Regressão Linear Múltipla para Dados com Repetição É preciso conhecer o fenômeno para depois modelar, ou melhor, tentar imitar o mundo real. • Neste caso estamos usando dois modelos: ANOVA e REGRESSÃO • • • • • Yij t i e ij Cada valor distinto de X é considerado com um diferente tratamento. Neste caso, usado apenas para obter o erro puro=variância residual da estimativa. Yi 0 1 X i e i Cada valor distinto de X é considerado com um diferente valor de X. De fato é o que ocorre no mundo real. Este é o modelo que devemos usar para avaliar o efeito da variação de X sobre o fenômeno. Regressão Linear Múltipla para Dados com Repetição Podemos adotar 3 estratégias diferentes para a análise da regressão 1. Utilizando as observações individualizadas 2. Utilizando os totais de tratamentos 3. Utilizando a média de tratamentos • A estratégia utilizada não altera o resultado da análise; A equação de regressão será a mesma, isto é, mesmo intercepto e mesmos regressores. Regressão Linear Múltipla para Dados com Repetição Primeiro caso: utilizando as observações individualizadas X ' X ˆ X 'Y ˆ X ' X X 'Y 1 5 1 5 1 5 1 7 1 7 1 Y , X 8 1 8 1 9 1 9 1 12 1 2 2 60 75 3 , 45 1 440 ˆ 4 800 60 10 504 0 ,675 4 ˆ0 6 60 10 75 ˆ , X 'X , X 'Y , 6 440 ˆ1 60 504 8 8 10 Yˆi 3 , 45 0 ,675 X i 10 Regressão Linear Múltipla para Dados com Repetição Segundo caso: utilizando os totais de tratamentos 1 r X ' X ˆ X 'Y ˆ ˆ 10 1 12 1 Y 15 , X 1 17 1 21 1 2 4 5 6 , X 'X 30 8 10 1 2 220 200 30 1 r 30 5 X 'X 1 X 'Y 75 3 , 45 504 0 ,675 ˆ0 30 75 ˆ , X 'Y , 220 ˆ1 504 Yˆi 3 , 45 0 ,675 X i Regressão Linear Múltipla para Dados com Repetição Terceiro caso: utilizando a média de tratamentos X ' X ˆ X 'Y ˆ X ' X ˆ 5 ,0 1 6 ,0 1 Y 7 ,5 , X 1 8 ,5 1 10 ,51 1 2 4 5 6 , X 'X 30 8 10 220 200 30 1 30 5 1 X 'Y 37 ,5 3 , 45 252 0 ,675 ˆ0 30 37 ,5 ˆ , X 'Y , 220 ˆ1 252 Yˆi 3 , 45 0 ,675 X i Regressão Linear Múltipla para Dados com Repetição Seleção de modelos de regressão utilizando o teste F para falta de ajustamento * falta de ajustamento regressão modelo inadequado F ns modelo pode ser selecionado MODELO * modelo pode ser selecionado erro puro F ns modelo inadequado Regressão Linear Múltipla para Dados com Repetição Análise de variância da regressão com o teste para falta de ajustamento: observações individualizadas SQtotal Y 'Y c 607 562 ,50 44 ,50 SQregressã o ˆ ' X ' y c 3 , 45 SQresíduo da regressão SQtotal I 75 0 ,675 562 ,50 598 , 95 562 ,50 36 , 45 504 SQregressã SQfalta de ajustament o r . Y i Yˆi 2 o Y 'Y ˆ ' X 'Y 607 598 , 95 8 ,05 2 0 ,2750 0 ,55 i 1 Cálculo da soma de quadrados para a falta de ajustamento Y Yˆi Y Yˆi 2 i Yi Yˆ 2 5 4,8 0,20 0,0400 4 6 6,15 -0,15 0,0225 6 7,5 7,50 0,00 0,0000 8 8,5 8,85 -0,35 0,1225 10 10,5 10,20 0,30 0,0900 0,00 0,2750 X i i i Regressão Linear Múltipla para Dados com Repetição Resultado da análise de variância da regressão com o teste para falta de ajustamento FV GL SQ QM F Regressão 1 36,45 36,45 24,30** Resíduo da regressão 8 8,05 1,00 Falta de ajustamento 3 0,55 0,18 Resíduo 5 7,50 1,50 Total 9 44,50 **= p<0,01; n.s=p>0,05 0,12ns