Estatística
ANOVA
Análise de Variância (ANOVA)
Pontos mais importantes:
-metodologia
-cálculo de “within sample sum of square”, SSW
-cálculo de “between samples sum of square”, SSB
-comparação de SSw e SSB
-tabela de ANOVA
-ANOVA é um modelo aditivo
1
Estatística
ANOVA
Já tínhamos visto como se construi um teste para a igualdade das
médias de duas populações:
Hipótese nula:
H0 : mX=mY
Hipótese alternativa:
H1 : mX  mY
O que acontece, quando temos mais do que duas médias
(tratamentos) para comparar?
2
Estatística
ANOVA
O tempo de coagulação da sangue (segundo) em animais sujeitos à
quatro dietas diferentes
i/j
[X]=
A
62
60
63
59
B
63
67
71
64
65
66
C
68
66
71
67
68
68
D
56
62
60
61
63
64
63
59
3
Estatística
ANOVA
Questão: Os dados observados indicam qualquer evidência que existe
uma diferença entre os (valor médio) tratamentos?
Hipótese nula:
H0 : mA=mB =mC=mD
Hipótese alternativa:
H1 : mA  mB  mC  mD
Conceito: avaliar, se a dispersão do valor médio entre tratamentos
estivesse maior do que podia ser esperado (provável) baseado no
cálculo de dispersão dos dados dentro dos tratamentos.
Metodologia: -cálculo da estimativa da s2, só válida quando H0 é verdadeira
-cálculo da estimativa da s2, sempre válida
-comparação de estas duas
4
Estatística
ANOVA
Cálculo de estimativa da s2, sempre válida- “within
sample sum of squares” (soma dos quadrados
dentro da amostra), SSW
A média amostral de tratamento “i” obtenha-se:
ni
Xi =
X
j=1
ij
i=1, 2, ...,m
ni


 e.g.



4
XA =
X
1j
j=1
4


= 61


Variância amostral de tratamento i:
ni
(Xij  Xi ) 2
j=1
ni 1
Si = 
2
4 (X  X ) 2


2
i=1, 2, ...,m  e.g SA =  1 j 1 = 3.3
3
j=1


5
Estatística
ANOVA
2
S
(n i  1) i2 ~  2n i 1
s
como
aplicando independência, a distribuição conjunta da soma de estas
variâncias amostrais tem:
m
 (n
i =1
i
 1)Si
s2
2
~m
 ( n i 1)
2
i =1
 
E 2 = 
m
2
  (n i  1)Si  m
m
i =1
 =  (n i  1) =  n i  m
E
2
i =1
s

 i =1


m
2


(
n

1
)
S
i 
 i
 SS W 
2
i =1
 = E m
E m
=
s

  ni  m 
  ni  m 
 i =1

 i =1

6
Estatística
ANOVA
-Exemplo
Xi
S2i
61
3.3
A
62
60
63
59
B
63
67
71
64
65
66
66
8
C
68
66
71
67
68
68
68
2.8
D
56
62
60
61
63
64
61
6.8
63
59
SSw =112
SSW=33.3 + 58 + 52.8 + 76.8 = 112
7
Estatística
ANOVA
Cálculo de estimativa da s2, só válida quando H0 é
verdadeira - “between sample sum of squares”
(soma dos quadrados entre as amostras), SSB
Se H0 for verdadeira, cada Xij tem uma distribuição normal com m e s2.
Uma estimativa para o valor médio m pode ser calculada:
m
X=
X11  X12  ...  X1n1  X 21  ...  X mnm
n1  n 2  ...  n n
=
ni
 X
i =1 j=1
m
n
i =1
ij
i
Se H0 for verdadeira, Xi também tem uma distr. com valor médio m
mas com variância igual à s2/ni. Uma estimativa da variância do
valor médio é dada pela:
m
n i (Xi  X) 2

SS B
S2 = i =1
=
m 1
m 1
8
Estatística
ANOVA
s2/s2 ~ 2
Considerando o facto que:
m
2
n
(
X

X
)
 i i
i =1
Temos:
Por isso
(m  1)
m 1
s2
m
=
2
n
(
X

X
)
 i i
i =1
s2
~  2m1
m
2
n
(
X

X
)
 i i

 SS B 
 SS B 
2
i =1

E
=
E
=
m

1


E
=
s
 s 2 
 m  1
s2




Nota: pode-se mostrar que quando H0 é falso, SSB/(m-1) sobre
estima a variância (s2)
9
Estatística
ANOVA
-Exemplo
Xi
S2i
61
3.3
A
62
60
63
59
B
63
67
71
64
65
66
66
8
C
68
66
71
67
68
68
68
2.8
D
56
62
60
61
63
64
61
6.8
63
59
X=
64
SSB= 228
SSB=4(61-64)2 + 6(66-64)2 + 6(68-64)2 + 8(61-64)2 = 228
10
Estatística
ANOVA
Comparação de SSw e SSB
A divisão de duas v.a.s 2k e 2l resulta uma v.a. de distribuição F com
k e l graus de liberdade a forma seguinte:
2k k
~ Fk ,l
2
l l
Aplicando isto para as duas estimativas da variância temos quando H0
é verdade:
m
m
 (n
i =1
i
 1)Si
s
2
2
=
SS W
~  2m
2
s
 ( n i 1)
i =1
 n (X
i =1
i
i
s2
 X)2
=
SS B
~  2m 1
2
s
SS B
(m  1)
2
SS B (m  1)
s
=
~F
m
m
( m 1),  ( n i 1)
SS W m
i=1
(n i  1) SS W  (n i  1)

2
s
i =1
i =1
11
Estatística
ANOVA
Assim, já é relativamente fácil avaliar o teste de hipótese:
porque
Hipótese nula:
H0 : mA=mB =mC=mD
Hipótese alternativa:
H1 : mA  mB  mC  mD
-aceita H0 se
SS B
(m  1)
2
s
F
m
m
 ,( m 1),  ( n i 1)
SS W
i =1
(n i  1)

2
s
i =1
-rejeita H0 se
SS B
(m  1)
2
s
F
m
m
 ,( m 1),  ( n i 1)
SS W
i=1
(n i  1)

2
s
i =1
12
Estatística
ANOVA
Tabela de analise de variância (ANOVA)
Para simplificar o cálculo e visualização dos resultados da ANOVA, é
costumo apresentar a tabela ANOVA
Fonte de
variabilidade
Entre das
amostras
Soma quadrada
Grau de
liberdade
F
m
SS B =  n i (Xi  X) 2
m-1
i =1
F
m
m 1,  ( n i 1)
=
i=1
=
dentro da
amostra
m
ni
SS W =  (Xij  Xi ) 2
i =1 j=1
i =1
m
SS W
m
 (n
SS B (m  1)
i
 1)
 (n
i =1
i
 1)
13
Estatística
ANOVA
-Exemplo
Fonte de
variabilidade
Soma
quadrada
Grau de
liberdade
Entre das
amostras
SSB=228
3
F
F3,20= (228/3)/(112/20)=13.6
dentro da
amostra
SSW=112
20
14
ANOVA
Estatística
15
Estatística
ANOVA
-Output de programa SPSS10.0
ANOVA
VAR00001
df
Mean Square
76.000
5.600
3
20
23
F
13.571
Sig .
.000
72
70
68
66
64
95% CI VAR00001
Between Groups
Within Groups
Total
Sum of
Squares
228.000
112.000
340.000
62
60
58
56
N=
VAR00002
4
6
6
8
1
2
3
4
16
Estatística
ANOVA
Caso especial: o número de dados em cada tratamento e
igual, n1= n2=...= nm
Fonte de
variabilidade
Entre das
amostras
Soma quadrada
Grau de
liberdade
F
m
SS B = n  ( Xi  X) 2
i =1
m-1
Fm1,m( n 1) =
=
dentro da
amostra
m
SS B (m  1)
SS W m(n  1)
n
SS W =  (Xij  Xi ) 2
i =1 j=1
m(n-1)
17
Estatística
ANOVA
Analogia entre o conceito de analise de variância
(ANOVA) e um modelo aditivo
Modelo linear:
y=X+b
Dados experimentais:
y = aX  b  (0,s2 ) = yˆ  (0,s2 )
Suponha que a=1, a equação anterior pode ser escrita após de
aplicar a uma amostra:
ˆ  (0,s2 )
Xij = X  Xi  X   Xij  Xi  = X
i
valor médio
amostral
incremento de
linha (tratamento)
resíduo
18
Estatística
ANOVA
A equação anterior pode ser apresentada em forma matricial:
[X]=[A]+[T]+[R]
Exemplo:
Xj
X
Xi-X
Xji-Xi
i
valor médio
amostral
incremento de
coluna (tratamento)
resíduo
19
Estatística
ANOVA
Questão: [T] pode ser considerada 0 ou não?
Para dar a resposta, determina-se o “tamanho” da matrizes utilizando
a norma.
||v||=a2+b2+c2
e.g. {v}={a b c}
SSB
Assim:
 X
m
ni
i =1 j=1
 X  =  n i Xi  X    Xij  Xi 
2
ij
SSW
m
i =1
2
m
ni
2
i =1 j=1
O teste de ANOVA é a avaliação de SSB em relação de SSW. Se for
pequeno, aceita H0, se for grande, rejeita H0.
20
Download

ANOVA