Estatística e Probabilidade
•
ANOVA
•
Exercícios.
•1. ANOVA – Análise da variância.
• ANOVA é o procedimento padrão para análise de variáveis
contínuas em duas ou mais séries comparadas.
• A variância é o quadrado do s (desvio padrão).
• A ANOVA inicia-se pelo cálculo da variância total em todo o
conjunto sob análise.
• Considera-se k grupos ou tratamentos).
• A variância total é a média dos quadrados dos desvios da
média. Considera-se que é a soma do total dos quadrados dos
desvios dividida pelo número de observações ou N-1. Esta soma
dos quadrados dos desvios é indicada como a soma dos
quadrados, SQ ou SS dependendo da fonte bibliográfica.
• N-1 representa os graus de liberdade (GL).
•1. ANOVA – Análise da variância.
• A ANOVA tenta resolver quanto de SQ total que é a
variabilidade geral pode ser explicada pela variável principal
(também chamado de fator) que incide sobre as séries, ou
amostras e quanto pode ser considerado residual (também
chamado de erro) que é relacionada à variabilidade intrínseca, de
dentro dos grupos.
• SQ total = SQ entre + SQ dentro
• Usa as médias dos grupos ou tratamentos para calcular a soma
dos quadrados de um grupo e depois do outro grupo.
• A soma destes totais de grupos pode ou não ser menor do que
a soma total de quadrados. Caso seja menor e a diferença seja
significante, conclui-se que a variável principal explica
significativamente a variação total e há diferença entre os grupos.
•1. ANOVA – Análise da variância.
• Porque não usar o teste t de dois em dois?
• Quando o pesquisador deseja comparar mais do que dois
grupos experimentais, a possibilidade de erro em comparações
duas a duas é alta. O teste t foi delineado para comparar uma
média A com outra B. A comparação simultânea da média A com
outras tem uma probabilidade de erro maior do que alfa.
• A forma correta então é o uso da ANOVA. Este método compara
todas as médias num único teste. Visa a identificação de ao
menos uma diferença entre grupos, se existir.
• Em resultados significativos, geralmente utiliza-se testes
complementares para definir o grau das diferenças entre as
médias, como o de Tukey.
•
•1. ANOVA – Análise da variância.
• A ANOVA decompõe a variação total dos valores do
experimento em componentes identificáveis e elabora uma
tabela.
• Cada componente atribui a variação a uma causa ou fonte de
variação diferentes. O número de causas da variação ou fatores
depende do delineamento.
• Há vários modelos ou desenhos de uso da ANOVA.
• O mais simples propõe um variável para classificação dos
grupos, formados de forma aleatória. É a ANOVA de um critério
de classificação, ou “one way”.
•
•1. ANOVA – Análise da variância.
• A variação total = variação ente tratamentos + variação dentro
dos tratamentos.
• A variação entre tratamentos é estimada pela Variância Entre
tratamentos ou Variância Entre. A variação dentro dos grupos é
estimada pela média das variâncias de cada grupo, é a Variância
Dentro. É também a variância residual ou variância do erro
experimental.
•
•1. ANOVA – Análise da variância.
• O teste de comparação entre os efeitos dos tratamentos,
baseia-se na pressuposição de que k tratamentos, A, B, ... podem
originar médias diferentes, mas a variação entre os indivíduos é
igual em todas as populações que estão sendo comparadadas.
Deseja-se testar a hipótese de igualdade entre as médias:
• H0: médias semelhantes estatisticamente, ua = ub = ...etc.
• H1: médias diferem.
• Os requisitos para a ANOVA, são a equivalência das variâncias
dos grupos e a distribuição normal das amostras.
• Mesmo sem os requisitos a ANOVA pode ser usada
isoladamente ou comparada com testes não paramétricos.
•
•1. ANOVA – Análise da variância.
• Caso haja efeito diferencial ente tratamentos, a variação entre
eles deve ser maior do que a variação dentro dos tratamentos.
• A Variância Entre deve ser maior do que a Variância Dentro. Isto
quer dizer que se houver diferença entre os grupos, o resultado
da divisão da Variância Entre pela Variância Dentro deve ser
maior do que 1.
• Esta é a razão F de variâncias e o resultado é comparado com
um valor tabelado para se concluir pela significância das
diferenças (o resultado é significativo), o valor do teste é
significante).
•2. ANOVA – Exemplo.
• Tabela 1: Apresentação do experimento
Variável
ni
Σx = Ti
Σx2
x¯
s
A1
1
3
2
4
10
2
1,41
A2
5
7
8
3
20
138
6,7
1,52
A3
2
0
3
3
5
13
1,7
1,53
Total
8
29
161
•1. ANOVA – Exemplo.
• Tabela 2: Dados para ANOVA
•
Causas da
variação
Entre
tratamentos
Dentro
(resíduo)
Total
SQ
GL
QM
F calc
F 5%;2,5
44,55
2
22,28
9,82
5,79
11,33
5
2,27
-
-
55,88
7
-
-
-
Fórmulas: SQ = Soma dos quadrados; QM = Quadrado médio; GL
= graus de liberdade;
•
C = constante = (Σx)2 / Σ
n
i
= (29)2 / 8 = 105,12
SQ Total = Σx2 – C = 161 – 105,12 = 55,88
SQ Entre = Σ(Ti 2) – C = 4
= 44,55
n i
2
2
+ 20
2
+ ... – 105, 12 = 149,67 – 105,12
3
SQ Dentro = SQ total – SQ Entre = 55,88 – 44,55 = 11,33
GL Total = (Σ
n
i
)- 1 = 8-1 = 7
GL Entre = k – 1 = 3 – 1 = 2
GL Dentro ou residual = GL total – GL Entre = 7 – 2 = 5 ou (Σ
k
n
i
) -
QM Entre = SQ Entre / GL Entre = 44,55 / 2 = 22,28
QM Dentro ou residual = SQ Dentro / GL Dentro = 11,33 / 5 = 2, 27
H0: não há diferença entre as populações, a variância Entre é igual
à Variância Dentro; a razão F é 1.
O F calc pode flutuar sobre 1, sem ser significante;
F calc = QM
Entre / QM Dentro
H1: existe diferenças entre as médias; teste sempre unilateral.
F tabelado: F α; gl N; gl D
gl N = GL numerador = GL Entre
gl D = GL denominador = GL Dentro
•3. ANOVA – Outra forma de apresentar a tabela da ANOVA:
Download

1. ANOVA – Análise da variância.