Estatística e Probabilidade • ANOVA • Exercícios. •1. ANOVA – Análise da variância. • ANOVA é o procedimento padrão para análise de variáveis contínuas em duas ou mais séries comparadas. • A variância é o quadrado do s (desvio padrão). • A ANOVA inicia-se pelo cálculo da variância total em todo o conjunto sob análise. • Considera-se k grupos ou tratamentos). • A variância total é a média dos quadrados dos desvios da média. Considera-se que é a soma do total dos quadrados dos desvios dividida pelo número de observações ou N-1. Esta soma dos quadrados dos desvios é indicada como a soma dos quadrados, SQ ou SS dependendo da fonte bibliográfica. • N-1 representa os graus de liberdade (GL). •1. ANOVA – Análise da variância. • A ANOVA tenta resolver quanto de SQ total que é a variabilidade geral pode ser explicada pela variável principal (também chamado de fator) que incide sobre as séries, ou amostras e quanto pode ser considerado residual (também chamado de erro) que é relacionada à variabilidade intrínseca, de dentro dos grupos. • SQ total = SQ entre + SQ dentro • Usa as médias dos grupos ou tratamentos para calcular a soma dos quadrados de um grupo e depois do outro grupo. • A soma destes totais de grupos pode ou não ser menor do que a soma total de quadrados. Caso seja menor e a diferença seja significante, conclui-se que a variável principal explica significativamente a variação total e há diferença entre os grupos. •1. ANOVA – Análise da variância. • Porque não usar o teste t de dois em dois? • Quando o pesquisador deseja comparar mais do que dois grupos experimentais, a possibilidade de erro em comparações duas a duas é alta. O teste t foi delineado para comparar uma média A com outra B. A comparação simultânea da média A com outras tem uma probabilidade de erro maior do que alfa. • A forma correta então é o uso da ANOVA. Este método compara todas as médias num único teste. Visa a identificação de ao menos uma diferença entre grupos, se existir. • Em resultados significativos, geralmente utiliza-se testes complementares para definir o grau das diferenças entre as médias, como o de Tukey. • •1. ANOVA – Análise da variância. • A ANOVA decompõe a variação total dos valores do experimento em componentes identificáveis e elabora uma tabela. • Cada componente atribui a variação a uma causa ou fonte de variação diferentes. O número de causas da variação ou fatores depende do delineamento. • Há vários modelos ou desenhos de uso da ANOVA. • O mais simples propõe um variável para classificação dos grupos, formados de forma aleatória. É a ANOVA de um critério de classificação, ou “one way”. • •1. ANOVA – Análise da variância. • A variação total = variação ente tratamentos + variação dentro dos tratamentos. • A variação entre tratamentos é estimada pela Variância Entre tratamentos ou Variância Entre. A variação dentro dos grupos é estimada pela média das variâncias de cada grupo, é a Variância Dentro. É também a variância residual ou variância do erro experimental. • •1. ANOVA – Análise da variância. • O teste de comparação entre os efeitos dos tratamentos, baseia-se na pressuposição de que k tratamentos, A, B, ... podem originar médias diferentes, mas a variação entre os indivíduos é igual em todas as populações que estão sendo comparadadas. Deseja-se testar a hipótese de igualdade entre as médias: • H0: médias semelhantes estatisticamente, ua = ub = ...etc. • H1: médias diferem. • Os requisitos para a ANOVA, são a equivalência das variâncias dos grupos e a distribuição normal das amostras. • Mesmo sem os requisitos a ANOVA pode ser usada isoladamente ou comparada com testes não paramétricos. • •1. ANOVA – Análise da variância. • Caso haja efeito diferencial ente tratamentos, a variação entre eles deve ser maior do que a variação dentro dos tratamentos. • A Variância Entre deve ser maior do que a Variância Dentro. Isto quer dizer que se houver diferença entre os grupos, o resultado da divisão da Variância Entre pela Variância Dentro deve ser maior do que 1. • Esta é a razão F de variâncias e o resultado é comparado com um valor tabelado para se concluir pela significância das diferenças (o resultado é significativo), o valor do teste é significante). •2. ANOVA – Exemplo. • Tabela 1: Apresentação do experimento Variável ni Σx = Ti Σx2 x¯ s A1 1 3 2 4 10 2 1,41 A2 5 7 8 3 20 138 6,7 1,52 A3 2 0 3 3 5 13 1,7 1,53 Total 8 29 161 •1. ANOVA – Exemplo. • Tabela 2: Dados para ANOVA • Causas da variação Entre tratamentos Dentro (resíduo) Total SQ GL QM F calc F 5%;2,5 44,55 2 22,28 9,82 5,79 11,33 5 2,27 - - 55,88 7 - - - Fórmulas: SQ = Soma dos quadrados; QM = Quadrado médio; GL = graus de liberdade; • C = constante = (Σx)2 / Σ n i = (29)2 / 8 = 105,12 SQ Total = Σx2 – C = 161 – 105,12 = 55,88 SQ Entre = Σ(Ti 2) – C = 4 = 44,55 n i 2 2 + 20 2 + ... – 105, 12 = 149,67 – 105,12 3 SQ Dentro = SQ total – SQ Entre = 55,88 – 44,55 = 11,33 GL Total = (Σ n i )- 1 = 8-1 = 7 GL Entre = k – 1 = 3 – 1 = 2 GL Dentro ou residual = GL total – GL Entre = 7 – 2 = 5 ou (Σ k n i ) - QM Entre = SQ Entre / GL Entre = 44,55 / 2 = 22,28 QM Dentro ou residual = SQ Dentro / GL Dentro = 11,33 / 5 = 2, 27 H0: não há diferença entre as populações, a variância Entre é igual à Variância Dentro; a razão F é 1. O F calc pode flutuar sobre 1, sem ser significante; F calc = QM Entre / QM Dentro H1: existe diferenças entre as médias; teste sempre unilateral. F tabelado: F α; gl N; gl D gl N = GL numerador = GL Entre gl D = GL denominador = GL Dentro •3. ANOVA – Outra forma de apresentar a tabela da ANOVA: