7. ESTUDO DAS MÉDIAS - REGRESSÃO NA ANÁLISE DE VARIÂNCIA Quando os tratamentos são níveis de um fator quantitativo, o procedimento apropriado para o estudo das médias dos tratamentos é o emprego da análise de Regressão. A regressão é uma técnica de análise que utiliza a relação entre duas ou mais variáveis quantitativas para determinar um modelo matemático de forma que o efeito de uma possa ser previsto através da outra variável (ou outras variáveis). Na análise de experimentos, o modelo matemático mais empregado para tentar explicar o efeito dos tratamentos na variável reposta é o modelo polinomial. Os polinômios são da forma: Y = β 0 + β1 X + ... + β p X p Os mais comumente utilizados são: • Polinômio do 1º grau ou Regressão Linear: • Polinômio do 2º grau ou Regressão Quadrática: • Polinômio do 3º grau ou Regressão Cúbica: Y = β 0 + β1 X Y = β 0 + β 1 X + β 2 X2 Y = β 0 + β 1 X + β 2 X2 + β 3 X3 Em todos estes modelos estão envolvidos apenas duas variáveis: X e Y. No caso dos experimentos, a variável X, ou variável independente, é uma variável não aleatória corresponde aos tratamentos e a variável Y, ou variável dependente, que é a variável resposta ( variável aleatória ) . O método de regressão na análise de variância consiste em determinar se um destes polinômios explica satisfatoriamente a relação entre os tratamentos utilizados e as observações. Para tanto, será empregado o teste F para determinar quais são os modelos possíveis e o coeficiente de determinação (R2) para mostrar o grau de explicação de cada modelo. O teste F na análise de variância permite testar apenas o coeficiente associado à variável X no seu maior expoente, testando-se assim o efeito de grau p. Para cada polinômio, as hipóteses do teste F serão: 57 Y= β0 + β1 X H0 : β 1 = 0 (Efeito Linear) Ha : β 1 ≠ 0 Y= βo + β1 X + β2 X2 H0 : β2 = 0 (Efeito Quadrático) Ha : β 2 ≠ 0 Y= βo + β1 X + β2 X2 + β3 X3 H0 : β 3 = 0 (Efeito de 3º grau) Ha : β 3 ≠ 0 ... Y= βo + β1 X + β2 X2 + β3 X3 + ... + βp Xp H0 : βp = 0 (Efeito do grau p) Ha : β p ≠ 0 Os passos para a análise de regressão são: 1. 2. 3. 4. 5. 6. Definir os efeitos de regressão a serem testados. A cada efeito de regressão corresponde 1 grau de liberdade. Assim, é possível testar tantos efeitos de regressão quantos são os graus de liberdade para tratamentos; Determinar as Somas de Quadrados para cada um destes efeitos de regressão; No quadro da Análise de Variância, testar os efeitos de regressão utilizando o Quadrado Médio do Erro Experimental; Através do teste F, definir o grau do polinômio que melhor se ajusta às médias da característica observada; Determinar o grau de ajuste, através do Coeficiente de Determinação: SQ Re gressão R2 = ⋅ 100 SQTratamentos onde SQ Re gressão = (Somas de Quadrados dos Efeitos de Regressão). Obter as estimativas dos parâmetros do modelo de Regressão escolhido e apresentar os resultados em um gráfico. EXEMPLO 7.1 Um experimento foi realizado para testar o efeito da adubação nitrogenada (0, 100, 200 e 300 kg/ha de Adubo Nitrogenado) na produção de milho (kg/parcela). Os resultados obtidos estão apresentados na Tabela 7.1 e a Análise de Variância na Tabela 7.2. 58 Tabela 7.1 Produções de Milho (kg/parcela) para doses de adubo Nitrogenado. Tratamentos I II III IV Totais Médias 0 49 47 52 50 198 49,50 100 53 58 52 60 223 55,75 200 62 52 74 63 251 62,75 300 72 68 58 67 265 66,25 Tabela 7.2 Análise de Variância das Produções de Milho. Fontes de Variação GL SQ QM Doses de N 3 666,69 222,23 Erro Experimental 12 405,25 33,77 Total 15 1.071,94 Fc 6,58* Passo 1. Considere que, neste estudo, o pesquisador esteja interessado apenas na regressão linear. Passo 2. A fórmula para o cálculo da soma de quadrados do efeito linear é: X )( Y ) n 2 ( X) 2 X − n XY − SQEL = ( 2 ⋅J onde n é o número de médias. Assim para o exemplo, tem-se o quadro auxiliar: Tratamentos (X) 0 100 200 300 600 Médias (Y) 49,50 55,75 62,75 66,25 234,25 3.800 − (600)(234,25) SQEL = 140.000 − Passo 3. 4 (600)2 XY 0 5.575 12.550 19.875 38.000 X2 0 10.000 40.000 90.000 140.000 2 ⋅4 = (2862,5)2 ⋅ 4 = 655,51 50.000 4 O teste F para os efeitos de Regressão está apresentado na Tabela 7.3. 59 Tabela 7.3 Análise de Regressão para a Produção de Milho. Fonte de Variação GL SQ QM (3) (666,69) Doses Efeito Linear 1 655,51 655,51 Desvios de Regressão 2 11,18 5,59 12 33,37 Erro Experimental Fc 19,41* <1 Passo 4. Observa-se pela significância do teste F, que existe uma tendência linear para as produções de milho em função das doses de adubo nitrogenado. Passo 5. Coeficiente de Determinação: R 2 = 100. Passo 6. 655,51 = 98,3% 666,69 Modelo de Regressão Linear : Y = β0 + β 1 X As estimativas de β 0 e β 1 são dadas por: βˆ1 = βˆ 0 = X )( Y ) 2862,5 n = = 0,0572 2 50.000 ( X) 2 X − n XY − ( Y X 234,25 600 − β1 = − 0,0572 = 49,9825 n n 4 4 A equação de regressão linear estimada é: Yˆ = 49,9825 + 0,0572 X . O quadro auxiliar seguinte apresenta os valores estimados correspondentes aos tratamentos utilizados: Tratamentos 0 100 200 300 Médias Observadas 49,50 55,75 62,75 66,25 Médias Estimadas 49,98 55,70 61,42 67,14 60 Yˆ 70 = 49,9825 + 0,0572 X R2 = 98,3 % 60 50 0 100 200 300 FIGURA 7.1 Equação de Regressão Linear para as Produções de Milho em Função de diferentes Doses de Adubo Nitrogenado. O ajuste do modelo linear às produções médias de milho foi muito bom apresentado um coeficiente de determinação igual a 98,3%. A equação ajustada mostra que a cada 1 kg/ha de adubo nitrogenado adicionado, espera-se um aumento médio na produção de 0,0572 kg/parcela. Observe que mesmo tendo sido utilizadas apenas 4 doses de adubo neste experimento, o modelo ajustado permite estimar produções em todo o intervalo de 0 a 300 Kg/ha de adubo ou seja, pode-se estimar, por exemplo, a produção de milho para uma dose de 250 Kg/ha, mesmo não tendo sido usado este tratamento. EXEMPLO 7.2 Os dados a seguir referem-se às produções de grãos obtidas em um experimento de adubação em milho no qual os tratamentos foram as doses de 25, 50, 75 e 100 kg/ha de P2O5 além de uma testemunha que não recebeu a adubação fosfatada. Tabela 7.4 Produções de Milho (Kg/parcela) para Doses de P2O5. Repetições I II III IV 0 8,38 5,77 4,90 4,54 25 7,15 9,78 9,99 10,70 50 10,07 9,73 7,92 9,48 75 9,55 8,98 10,24 8,66 100 9,14 10,17 9,75 9,50 Neste exemplo, o pesquisador está interessado em determinar o modelo de regressão que melhor explique o efeito da adubação com P2O5 na produção de milho. A análise de variância com regressão é apresentada na Tabela 7.5. 61 Tabela 7.5 Análise de Variância e Regressão para as Produções de Milho. Fontes de Variação Doses de P2O5 Efeito Linear Efeito Quadrático Efeito Cúbico Efeito de 4º Grau Erro TOTAL GL (4) 1 1 1 1 15 19 SQ (40,0998) 22,1266 11,2950 5,8905 0,7876 20,9838 61,0836 QM 10,0249 22,1266 11,2950 5,8950 0,7876 1,3989 R2 F 7,17* 15,82* 8,07* 4,21 0,56 55,2% 83,3% Os resultados do teste F e os valores dos coeficientes de determinação indicam que a regressão quadrática é o modelo apropriado para explicar a relação entre as doses de P2O5 e a produção de milho, neste exemplo. As médias observadas e suas estimativas calculadas com a equação de regressão (Figura 7.2) foram: Doses 0 25 50 75 100 Médias Observadas 5,90 9,40 9,30 9,40 9,60 10 Médias Estimadas 6,33 8,42 9,62 9,91 9,31 . . 9 Yˆ = 6,3343 + 0,1016 X – 0,0007 X2 . R2 = 83,3 % 8 7 . 6 0 FIGURA 7.2 25 50 75 100 Equação de Regressão para o Efeito de Doses de P2O5 na Produção de Milho. 62