ANOVA Prof. Herondino ANOVA Análise de variância (Analysis of variance -ANOVA) é um método para testar dois ou mais tratamentos para determinar se a sua amostra média poderia ter sido obtido a partir de populações com a mesma média real. ANOVA "... A análise de variância é mais do que uma técnica de análise estatística. Assim entendida, a análise de variância fornece uma visão sobre a natureza da variação de eventos naturais, dentro da Natureza em suma, o que é, possivelmente, de um valor ainda maior do que o conhecimento do método como tal. Se podemos falar de beleza em um método estatístico, análise de variância a possui mais do que qualquer outro " (Sokal and Rohlf, 1969). A área em verde escuro está a menos de um desvio padrão(σ) da média. Em uma distribuição normal, isto representa cerca de 68% do conjunto, enquanto dois desvios padrões desde a média (verde médio e escuro) representam cerca de 95%, e três desvios padrões (verde claro, médio e escuro) cobrem cerca de 99.7%. Este fato é conhecido como regra 68-95-99.7, ou a regra empírica, ou a regra dos 3-sigmas. Variância Dentro dos Grupos (Sd) Supondo-se que todos os grupos têm a mesma variância da população, podemos reunir as variâncias k amostras para estimar a variância dentro do grupo (n1 1)s12 (n2 1)s22 ... (nk 1)sk2 S (n1 1) (n2 1) ... (nk 1) 2 d ou 2 2 2 ( n 1 ) s ( n 1 ) s ... ( n 1 ) s 1 2 2 k k S d2 1 N k onde N n1 n2 ... nk Variância Entre Grupos (Se) A variância entre grupos é calculado utilizando as médias dos grupos e da média global 2 2 2 n ( x X ) n ( x X ) ... n ( x X ) 2 2 k k Se2 1 1 k 1 onde a média global é dada por: X n1 x1 n2 x2 ... nk xk n1 n2 ... nk Exemplo1 Média do grupo Variância do Grupo Média Global A B C 12 13 18 10 17 16 13 20 21 9 14 17 11 16 18 3,33 10,00 4,67 15 (n1 1) s12 (n2 1) s22 ... (nk 1) sk2 S N k 2 d (4 1) 3,33 (4 1) 10 (4 1) 4,67 54 S 6,0 12 3 9 2 d A variância dentro dos grupos Exemplo1 2 2 2 n ( x X ) n ( x X ) ... n ( x X ) 2 2 k k Se2 1 1 k 1 2 2 2 4 ( 11 15 ) 4 ( 16 15 ) 4 ( 18 15 ) 4(16 1 9) 104 2 Se 52 3 1 2 2 A variância entre grupos Se reduzirmos a duas variâncias podemos aplicar o teste F. S E2 F 2 SD 52 F 8,67 6 Graus de liberdade S E2 k 1 SD2 N k S E2 F 2 SD O numerador é a raiz quadrada da média da variância “entre grupos", que tem ν1 graus de liberdade O denominador é sempre a estimativa da variância de erro randômico puro , neste caso, a variação "dentro dos grupo", que tem ν2 graus de liberdade Um valor F com estes graus de liberdade é designado por Fv1,v2,α onde α é o ponto percentual superior a que o teste está a ser feito. O teste será feito ao nível de 5% com o grau de liberdade ν1 = k - 1 = 3 - 1 = 2 e ν2 = N-K = 12 - 3 = 9. O valor relevante é F 2,9,0.05 = 4,26. O índice calculado para o nosso experimento, F = 52/6 = 8,67 é maior que F2,9,0.05 = 4,26, então podemos concluir que este fornece elementos suficientes para concluir o intervalo de confiança de 95% de que as médias dos três grupos não são iguais. Usualmente α = 0.05 (5%) ou α = 0.01 (1%). Estudo de Caso – 5 laboratórios Os dados mostrados na Tabela abaixo foram obtidos através da divisão de uma grande quantidade de material preparado em 50 alíquotas iguais e possuindo analise de cinco laboratórios diferentes em cada 10 amostras selecionadas aleatoriamente. Pelo projeto do experimento, não há diferença real na concentração de amostras, mas os laboratórios têm produzido diferentes médias e variâncias diferentes. Aqui vamos usar uma ANOVA one-way, que se concentra em comparar a variação dentro de laboratórios com a variação entre laboratórios. A análise é de sentido único, porque há um fator (laboratórios) para ser avaliado. Dez medidas de concentração de chumbo(μg/L) de amostras idênticas em cinco laboratórios Referência Bibliográfica