ANÁLISE MULTIVARIADA APLICADA AS CIÊNCIAS AGRÁRIAS PÓS-GRADUAÇÃO EM AGRONOMIA CIÊNCIA DO SOLO: CPGA-CS MANOVA Análise de variância multivariada Carlos Alberto Alves Varella Introdução • A análise de variância multivariada é utilizada para comparar vetores de médias; • Os dados normalmente são provenientes de delineamentos estatísticos; • Um ponto relevante da análise multivariada é o aproveitamento da informação conjunta das variáveis envolvidas (REGAZZI, 2000). Introdução • As pressuposições para realização da MANOVA são as seguintes: 1. Modelo aditivo para efeitos de tratamentos, blocos (se houver) e erro; 2. Independência dos erros; 3. Igualdade da matriz de covariância para todas as amostras; 4. Distribuição multinormal dos erros, com variância . Modelo Estatístico: blocos Y ijr r t ir b jr e ijr i 1, 2 , , k ; j 1, 2 , , b ; r 1, 2 , , p r = indexador de variáveis; Yijr = valor observado da r-ésima variável sob o efeito do i-ésimo tratamento no j-ésimo bloco; µr = média geral da r-ésima variável; tir=efeito do i-ésimo tratamento na r-ésima variável; bjr= efeito do j-ésimo bloco na r-ésima variável; eirj= efeito aleatório associado à observação Yijr . Modelo na Forma Matricial Y X Y= matriz de valores resposta para os efeitos de tratamentos bk x p; X= matriz de valores das p variáveis independentes bk x (1+k+b); В= matriz de parâmetros de dimensões (1+k+b) x p; ε= matriz de erros de dimensões bk x p. Sistema de Equações Normais X ' X X 'Y • A solução de mínimos quadrados do sistema de equações normais é dada pela matriz: 1 , 2 , , p X ' X 1 X 'Y • O sistema admite mais de uma solução, isto é, a matriz (X’X) não possui inversa verdadeira. Solução do Sistema de Equações Normais • Impondo-se as restrições de que os somatórios dos efeitos de tratamentos e blocos sejam igual a zero, o sistema apresenta solução única que denotaremos por: 1 ˆ X ' X AA ' X ' Y ˆ1 , ˆ 2 , , ˆ p • ̂ =melhor estimador linear ou BLUE de В ; 1 • X ' X AA ' =inversa condicional de X’X. Decomposição da Soma de Quadrados e Produtos de Totais • Da mesma forma que no modelo univariado temos que: blocos ao acaso A H BE • • • • • A= SQP de Totais; H= SQP de Tratamentos; B= SQP de Blocos; E= SQP do Resíduo. Todas são matrizes de dimensões p x p Soma de Quadrados e Produtos de Totais • A matriz de soma de quadrados e produtos de totais que denotaremos por A é: A Y 'Y Soma de Quadrados e Produtos do Resíduo • Do método dos mínimos quadrados temos que SQPResíduo é: ˆ ' ˆ Y ' Y ˆ ' X ' Y Y ' Y Soma de quadrados ˆ ' X ' Y Soma de quadrados e produtos de totais; e produtos de parâmetros ; ne= n-Posto[X] graus de liberdade Graus de Liberdade do Resíduo • Graus de liberdade do resíduo denotaremos por ne: n e n Posto X n e kb k b 1 kb k b 1 k 1 b 1 n e k 1b 1 Teste para a Hipótese Nula H0 • A hipótese H0 à ser testada, considerando k tratamentos e p variáveis, é a de que os vetores de médias de tratamentos são iguais, isto é: ~ ~ ~ H : 0 1 2 k • O mesmo que testar se os vetores de efeito de tratamentos são nulos: ~ ~ ~ H 0 : t1 t2 tk 0 Testes de Hipótese H0 da MANOVA • O teste de Wilks é o mais utilizado para testar a hipótese H0 da MANOVA; • Outros testes também são utilizados, tais como Pillai, Hotelling-Lawley e o teste de Roy, os quais podem apresentar resultados diferentes para a mesma análise. O Teste de Wilks • O teste de Wilks é representado pela letra grega (lambda maiúsculo), assim definido: det E det H E E H E • Na presença de diferenças sistemáticas entre tratamentos, espera-se sempre obter LAMBDA menor que um, e tanto mais significativo quanto menor for seu valor. Regra de Decisão para Wilks • Rejeita-se a hipótese nula ao nível de significância se: cal tab • Caso contrário não se rejeita H0 e diz-se que o teste foi significativo ao nível de siginificância . O Teste T2 de Hotelling • Esse tes