Estatística: Aplicação ao Sensoriamento Remoto
ANO 2010
Camilo Daleles Rennó
[email protected]
http://www.dpi.inpe.br/~camilo/estatistica/
Teste de Hipótese para 
Uma amostra de 25 valores foi selecionada, chegando a uma média amostral X igual a
11,3. Poderia esta média amostral ter sido obtida de uma população com média  = 10
0,14
e variância s2 = 16?
N (0,1)
Hipóteses
H0 :  = 10 (hipótese nula)
H1:   10 (hipótese alternativa)
z
X 
s
~ N (0,1)
s
0,08

2
0,06
0
~ N (0,1)
n
Região Crítica:
•aceito H0 se –zcrít < z < zcrít
•rejeito H0 caso contrário

2
1
0,02
0
Se H0 é verdadeira, então
X  10
0,1
0,04
n
z
0,12
-
5
-zcrít
10
0
zcrít
15
+
rejeição aceitação rejeição
de H0
de H0
de H0
z <<< 0
z=0
z >>> 0
Se H0 falsa Se H0 verdadeira
Se H0 falsa
 P(–zcrít < z < zcrít) = 1 - 
 P(|z| > zcrít) = 
Conclusão (sempre associada a um nível de significância)
20
Teste de Hipótese para 
Uma amostra de 25 valores foi selecionada, chegando a uma média amostral X igual a
11,3. Poderia esta média amostral ter sido obtida de uma população com média  = 10
0,14 de significância...
e variância s2 = 16? Adotando-se 5%
N (0,1)
Hipóteses
H0 :  = 10 (hipótese nula)
H1:   10 (hipótese alternativa)
z
X 
s
0,1
0,08

2,5%
0,06
0,04
~ N (0,1)
2
0
0
Se H0 é verdadeira, então
X  10
~ N (0,1)
s4
5n
195%


2,5%
2
0,02
n
z
0,12
z
11,3  10
 1,625
4
5
-
5
-zcrít
zcrít
-1,96
0 1,96
10
15
+
rejeição aceitação rejeição
de H0
de H0
de H0
1,625
Região Crítica:
•aceito H0 se –1,96
1,96  P(–zcrít < z < zcrít) = 1 - 
–zcrít <<z z<<zcrít
•rejeito H0 caso contrário  P(|z| > zcrít) = 
Conclusão
associada
um nívelque
de asignificância)
Conclusão:(sempre
não há razões
paraaduvidar
média  seja de fato 10, adotando-se
5% de significância
20
Teste de Hipótese para 
Hipóteses
H0 :  = 10
H1:  > 10 (teste unilateral)
0,14
N (0,1)
0,12
0,1
z
X 
s
0,08
~ N (0,1)
0,06

1
0,04
n
0,02
Se H0 é verdadeira, então
z
X  100
s
0
0
-
5
~ N (0,1)
n
10
0
aceitação
de H0
Região Crítica:
•aceito H0 se z < zcrít
 P(z < zcrít) = 1 - 
•rejeito H0 caso contrário  P(z > zcrít) = 
Conclusão (sempre associada a um nível de significância)
zcrít
15
+
rejeição
de H0
20
Teste de Hipótese para 
Hipóteses
H0 :  = 10
H1:  > 10 (teste unilateral)
0,14
N (0,1)
0,12
0,1
z
X 
s
0,08
~ N (0,1)
0,06
5%
195%

0,04
n
0,02
Se H0 é verdadeira, então
z
X  10
~ N (0,1)
s4
5n
z
0
0
11,3  10
 1,625
4
5
-
5
Região Crítica:
10
0
zcrít
1,645
aceitação
de H0
15
+
rejeição
de H0
1,625
•aceito H0 se z < z1,645
 P(z < zcrít) = 1 - 
crít
•rejeito H0 caso contrário  P(z > zcrít) = 
Conclusão
Conclusão:(sempre
não há razões
associada
paraaduvidar
um nívelque
de asignificância)
média  seja de fato 10, adotando-se
5% de significância (teste unilateral)
20
Teste de Hipótese – Erros I e II
Hipóteses
H0 :  = 0
H1:  > 0
XX
   0
zcrít
  crít0
s s
Existe a possibilidade de se selecionar
uma amostra de uma população com
média 0 e obter X alto de forma que
0,14
leve a conclusão errada de que H0 é0,12
falsa?
0,1
n n
N (0,1)
0,08
0,06

1
0,04
0,02
0
0
-
5
10
0
zcrít
15
+
20
Teste de Hipótese – Erros I e II
Hipóteses
H0 :  = 0
H1:  > 0
zcrít 
Existe a possibilidade de se selecionar
uma amostra de uma população com
média 0 e obter X alto de forma que
leve a conclusão errada de que H0 é
falsa?
X crít  0
s
 X crít  0  zcrít
n
n
N ( 0 ,
0,14
0,12
Sim. Este erro é chamado de erro do
tipo I e equivale ao nível de
significância .
s
s2
n
)
0,1

0,08
0,06
1
0,04
0,02
0
0
P(rejeitar H0 / H0 é verdadeira) = 
P(aceitar H0 / H0 é verdadeira) = 1 - 
-
5
0
10
X crít
15
+
20
Teste de Hipótese – Erros I e II
Hipóteses
H0 :  = 0
H1:  > 0
Existe a possibilidade de se selecionar
uma amostra de uma população com
média 1 (> 0) e obter X de 0,14
forma
que leve a conclusão errada de
que H0
0,12
é verdadeira?
0,1
N ( 0 ,
s2
n
N ( 1 ,
)
s2
n
)
0,08
Sim. Este erro é chamado de erro
0,06 do
tipo II ou erro .
0,04
1
0,02

0
0
-
5
0 X crít
aceitação
P(aceitar H0 / H1 é verdadeira) = 
de H0
P(rejeitar H0 / H1 é verdadeira) = 1 -  (poder do teste)
10

1
15
20
+
Teste de Hipótese – Erros I e II
Hipóteses
H0 :  = 0
H1:  > 0
H0 é verd.
Aceita H0
H0 é falso
1-
N ( 0 ,
 0,14
s2
n
N ( 1 ,
)
s2
n
)
0,12
Rejeita H0

1 - 0,1
0,08
0,06
1
0,04
Alternativas para diminuir :
• distanciar 1 de 0
• aumentar 
• aumentar n
0,02

0
0
-
5
0 X crít
10

1
15
20
+
Teste de Hipótese para 
No exemplo anterior, uma amostra de 25 valores foi selecionada, chegando-se a uma média
amostral X igual a 11,3. Através de um teste z unilateral, chegou-se a conclusão que a
verdadeira média  poderia ser igual a 10, adotando-se o nível de significância de 5%
(considerando s2 = 16). Mas qual a probabilidade de chegarmos a esta mesma conclusão,
sendo a verdadeira média igual a 12, ou seja, qual o valor de  ?
H0 :  = 10
H1:  > 10
z
X 
s
N (0,1)
11,3  10
z  0,14
 1,625
4
0,12
5
0,1
~ N (0,1)
n
Se H0 é verdadeira, então
0,08
0,06se z < 1,645
aceito H
0
0,04
rejeito H0 se z > 1,645
95%
0,02
5%
0
z
X  10
s
n
0
~ N (0,1)
-
5
10
0
15
+
zcrít = ?1,645
Conclusão:
Aceito H0, ou seja, a média  é igual a 10
considerando 5% de significância
Teste de Hipótese para 
Agora, considerando a  igual a 12
H0 :  = 10
H1:  = 12
N (0,1)
0,14
0,12
H0 verdadeiro
 = P(aceitar H0 / H1 é verdadeiro)
0,1
0,08
  P(Z  1,645/   12)
0,06
95%
0,04
0,02
5%
0
0
-
5
10
0
15
+
zcrít = ?1,645
20
Teste de Hipótese para 
Agora, considerando a  igual a 12
H0 :  = 10
H1:  = 12
H0
 = P(aceitar H0 / H1 é verdadeiro)
H1
0,14
  P(Z  1,645/   12)
0,12
0,1
  P(
0,08
X  10
 1, 645 /   12) 0,06
4
0,04
5
95%

0,02
  P( X  11,316/   12)
  P(
5%
0
0
-
X  12 11,316  12

)
4
4
5
5
  P(Z  0,855)  P(Z  0,855)  0,1963
5
10
15
10
12
11,316
20
+
Teste de Hipótese – valor-P (p-value)
Toda conclusão de um teste de hipótese está associada a um nível de
significância.
Por exemplo: “Com base num teste z unilateral a 5% de significância, pôde-se
concluir que a média  é maior que 20 uma vez que a estatística z obtida foi
de 2,5 (zcrítico = 1,645)”.
N (0,1)
H0 :  = 20
H1:  > 20
0,14
0,12
0,1
Se H0 é verdadeira, então
0,08
95%
0,06
z
X 
s
n
z  2,5
0,04
~ N (0,1)0,02
5%
Aceita H0
0
0
-
5
Rejeita H0
10
15
0
1,645
+
20
2,5
A média  continuaria ser significativamente maior do que 20 se fosse adotado
um nível de significância de 1%?
Teste de Hipótese – valor-P (p-value)
Toda conclusão de um teste de hipótese está associada a um nível de
significância.
Por exemplo: “Com base num teste z unilateral a 5% de significância, pôde-se
concluir que a média  é maior que 20 uma vez que a estatística z obtida foi
de 2,5 (zcrítico = 1,645)”.
N (0,1)
H0 :  = 20
H1:  > 20
0,14
0,12
0,1
Se H0 é verdadeira, então
0,08
99%
0,06
z
X 
s
n
z  2,5
0,04
~ N (0,1)0,02
Aceita H0
0
0
-
5
1%
Rejeita H0
10
15
0
+
20
2,33
2,5
A
média
continuaria
serdesignificativamente
maior
que 100
fosse adotado
Para
que valores
de nível
significância, a média
 do
poderia
serseconsiderada
um
nível
de significância de 1%?
igual
a 20?
Teste de Hipótese – valor-P (p-value)
Toda conclusão de um teste de hipótese está associada a um nível de
significância.
Por exemplo: “Com base num teste z unilateral a 5% de significância, pôde-se
concluir que a média  é maior que 20 uma vez que a estatística z obtida foi
de 2,5 (zcrítico = 1,645)”.
N (0,1)
H0 :  = 20
H1:  > 20
0,14
0,12
0,1
Se H0 é verdadeira, então
0,08
0,06
z
X 
s
n
z  2,5
0,0062
?
0,04
~ N (0,1)0,02
Aceita H0
0
0
-
5
valor-P
Rejeita H0
10
15
0
+
20
2,5
A
média
continuaria
serdesignificativamente
maior
que 100
fosse adotado
Para
que valores
de nível
significância, a média
 do
poderia
serseconsiderada
um
nível
de significância de 1%?
igual
a 20?
Pode-se aceitar H0 para qualquer nível de significância () menor que 0,0062.
valor-P = P(Z > z), ou seja, neste caso valor-P = P(Z > 2,5) = 0,0062
Teste de Hipótese – valor-P (p-value)
Exemplo: Foram coletadas amostras (50 pontos) em mapas a fim de avaliar sua
exatidão. Procedeu-se o teste z para verificar quais deles possuíam exatidão
(p) de 0,90. A tabela abaixo apresenta a exatidão estimada, o resultado do
teste (estatística z) e o valor-P de cada mapa.
pˆ
z
valor-P
Mapa 1
0,87
-0,707
0,2397
Mapa 2
0,62
-6,600
2,07e-11
Mapa 3
0,82
-1,886
0,0297
Mapa 4
0,84
-1,414
0,0786
z
pˆ  p
pq
n
Quais mapas possuem exatidão menor que 0,90, com 5% de significância?
Mapas 2 e 3
Quais mapas possuem exatidão menor que 0,90, com 1% de significância?
Somente Mapa 2
Teste de Hipótese para s2
amostra
s2 = 27,34
S
s2 = 25
Uma população com variância
s2 = 25 conhecida poderia
produzir uma amostra com
s2 = 27,34?
Hipóteses
H0 : s2 = 25
H1: s2  25
(hipótese nula)
(hipótese alternativa)
Teste de Hipótese para s2
amostra
s2 = 27,34
Hipóteses
H0 : s2 = 25
H1: s2  25
(n  1) s 2
s
S
s2 = 25
Uma população com variância
s2 = 25 conhecida poderia
produzir uma amostra com
s2 = 27,34?
2
(hipótese nula)
(hipótese alternativa)
~  n21
Se H0 é verdadeira, então
(n  1) s 2
~  n21
25
Teste de Hipótese para s2
Hipóteses
H0 : s2 = 25
H1: s2  25
(n  1) s 2
s
2
(hipótese nula)
(hipótese alternativa)
~  n21
Se H0 é verdadeira, então
(n  1) s 2
~  n21
25
n21

2

2
1
0 xa
rejeição aceitação
de H0
de H0
Região Crítica:
•aceito H0 se xa < X < xb  P(xa < X < xb) = 1 - 
•rejeito H0 caso contrário
Conclusão (sempre associada a um nível de significância)
xb
+
rejeição
de H0
Teste de Hipótese para s2
Exemplo: uma v.a. qualquer tem uma distribuição desconhecida com média  e variância s2
desconhecidas. Retira-se uma amostra de 25 valores e calcula-se a variância amostral.
Supondo que s2 = 2,34, teste a hipótese de que a verdadeira variância s2 seja de fato
igual a 4, considerando 5% de significância.
 242
Hipóteses
H0 : s2 = 4
H1: s2  4
(n  1) s 2
s2
2,5%
~  n21
Se H0 é verdadeira, então
2
24 s
2
~  24
4
X
24.2,34
 14, 04
4
Região Crítica:
2,5%
95%
0 xa
?
12,40
xb
?
39,36
•aceito H0 se 12,40 < X < 39,36
•rejeito H0 caso contrário
Conclusão: Aceito H0, ou seja, não há razões para discordar que, a 5%, s2 = 4
+
Teste de Hipótese para  com s2 desconhecida
Exemplo: uma v.a. qualquer tem uma distribuição desconhecida com média  e variância s2
também desconhecidas. Retira-se uma amostra de 25 valores e calcula-se a média
amostral e a variância amostral. Supondo que X  12,7 e s2 = 4,5, teste a hipótese
unilateral a 1% de que  = 15.
H0 :  = 15
H1:  < 15
t
X 
~ tn 1
s
n
Se H0 é verdadeira, então
t24
12, 7  15
t  0,14  5, 43
2,12
0,12
25
0,1
0,08
0,06se t > -2,492
aceito H
0
0,04
rejeito H0 se t < -2,492
99%
0,02
1%
0
X  15
t
~ t24
s
25
0
-
5
10
0
tcrít = ?- 2,492
Conclusão:
Rejeito H0, ou seja, a média é
significativamente (a 1%) menor que 15
15
+
Inferência entre parâmetros de duas populações
n1
n2
X1
S1
E( X1 )  1
S2
X2
E ( X 2 )  2
Mesmo não se conhecendo as médias 1 e 2, seria possível verificar se elas são
iguais a partir de seus valores amostrais?
Se 1 e 2 são iguais, então 1 - 2 = 0.
Teste de Hipótese para 1 = 2
Hipóteses
H0 : 1 - 2 = 0 (1 = 2)
H1: 1 - 2  0
X1 ~ N ( 1,s12 )
X1 ~ ?N ( 1 ,
s 12
)
n1
X 2 ~ N ( 2 ,
( X 1  X 2 )  ( 1  2 )
s
2
1
n1

s
2
2
s
2
1
n1

s
2
2
n2
n2
X1  X 2 ~ ?N ( 1  2 ,
)
s 12
n1

s 22
n2
)
N (0,1)
~ ?N (0,1)0,12
0,1
0,08
Se H0 é verdadeira, então
z
s 22
0,14
n2
X1  X 2
i desconhecidas, mas s i2 conhecidas
X 2 ~ N ( 2 ,s 22 )

2
0,06
0,04

2
1
0,02
~ N (0,1)
0
0
-
5
-zcrít 10
0
zcrít
15
+
P( zcrít  z  zcrít )  1  
Teste de Hipótese para 1 = 2
X1 ~ N ( 1,s12 )
X 2 ~ N ( 2 ,s 22 )
( X 1  X 2 )  ( 1  2 )
s 12
n1

s 22
~ ?N (0,1)
i e s i2 desconhecidas
(n1  1)s12
s 12

(n2  1) s22
n2 1
n2
1
s 22
~ ? n1 n2 2
2
n2 1
2
( X 1  X 2 )  ( 1  2 )
s 12
n1
( n1  1) s12
s
2
1


s 22
n2
( n2  1) s22
s
n1  n2  2
2
2
~ ?tn1 n2 2
(fazendo s 12  s 22  s 2)
(homocedástico)
Teste de Hipótese para 1 = 2
X1 ~ N ( 1,s12 )
X 2 ~ N ( 2 ,s 22 )
( X 1  X 2 )  ( 1  2 )
s 12

n1
s 22
~ ?N (0,1)
n2
( X 1  X 2 )  ( 1  2 )
s2
n1
(n1  1) s
s2
2
1


s2
n2
(n2  1) s
s2
n1  n2  2
2
2
~ tn1 n2 2
i e s i2 desconhecidas
(n1  1)s12
s 12

(n2  1) s22
s 22
~ ? n1 n2 2
2
Teste de Hipótese para 1 = 2
X1 ~ N ( 1,s12 )
X 2 ~ N ( 2 ,s 22 )
( X 1  X 2 )  ( 1  2 )
s 12
n1

s 22
~ ?N (0,1)
n2
( X 1  X 2 )  ( 1  2 )
1 1
s

n1 n2
1
s
( n1  1) s  ( n2  1) s
n1  n2  2
2
1
2
2
~ tn1  n2 2
i e s i2 desconhecidas
(n1  1)s12
s 12

(n2  1) s22
s 22
~ ? n1 n2 2
2
Teste de Hipótese para 1 = 2
Hipóteses
H0 : 1 - 2 = 0 (1 = 2)
H1: 1 - 2  0
i e s i2 desconhecidas mas s12  s 22
(t homocedástico)
( X 1  X 2 )  ( 1  2 )
(n1  1) s  (n2  1) s
n1  n2  2
2
1
2
2
1 1

n1 n2
~ tn1 n2 2
0,14
tn1 n2 2
0,12
0,1
0,08
Se H0 é verdadeira, então
t
0,04
X1  X 2

2
1
0,02
(n1  1) s  (n2  1) s
n1  n2  2
2
1

2
0,06
2
2
1 1

n1 n2
~ tn1  n2 2
0
0
-
5
-tcrít 10
0
tcrít
15
+
P(tcrít  t  tcrít )  1  
Teste de Hipótese para 1 = 2
Hipóteses
H0 : 1 - 2 = 0 (1 = 2)
H1: 1 - 2  0
i e s i2 desconhecidas mas s12  s 22
(t heterocedástico)
2
( X 1  X 2 )  ( 1  2 )
2
1
2
2
s
s

n1 n2
~ tg
 s12 s22 
  
n n
g   12 2  2
0,14
 s12   s22 
   
0,12
 n1    n2 
0,1
n1  1 n2  1
tg
0,08
Se H0 é verdadeira, então
t
X1  X 2
s12 s22

n1 n2

2
0,06
0,04
~ tg

2
1
0,02
0
0
-
5
-tcrít 10
0
tcrít
15
+
P(tcrít  t  tcrít )  1  
Teste de Hipótese para 1 = 2
Exemplo: duas v.a. quaisquer têm distribuições desconhecidas com médias e variâncias
também desconhecidas. Retira-se uma amostra de cada população e calcula-se a
média e a variância para cada amostra. Teste a hipótese de que as variâncias e médias
populacionais não diferem significativamente a 5% entre si, considerando que:
n1  26 X 1  10,3 s12  2,34
n2  41 X 2  15, 7 s22  1,91
Usar teste t homocedástico ou heterocedástico?
primeiramente deve-se testar se s12  s 22
Distribuição
[( g1  g 2 ) 2]  g1 
f ( x) 
 
( g1 2) ( g 2 2)  g 2 
g1 / 2
g2
E( X ) 
g2  2
2 g22 ( g1  g2  2)
Var( X ) 
g1 ( g2  2)2 ( g2  4)
F (de Snedecor)

g 
x g1 / 21  1  1 x 
g2 

 ( g1  g2 ) 2
x0
+
0
X ~ Fg1 ,g2 (lê-se: X tem distribuição F com g1 e g2 graus
de liberdade)
Propriedades:
a) se U ~  g21 e V ~  g2 então
2
b) se X ~ Fg1 ,g2
Fg1 ,g2
U / g1
~ Fg1 ,g2
V / g2
1
então
~ Fg2 , g1
X
 P ( Fg1 , g2  F )  P ( Fg2 , g1
F
0
1
 )
F
+
Fg2 ,g1
0 1
F
+
Distribuição
F
g1
0
F
+
P( Fg1 ,g2  F )  0,025
g2
P( F15,20  ?)  0,025
P( F15,20  2,57)  0,025
Distribuição
F
g1
0
F
+
P( Fg1 ,g2  F )  0,025
g2
P( F25,5  ?)  0,025
P( F5,25  ?)  0,025
Distribuição
F
g1
0
F
+
P( Fg1 ,g2  F )  0,025
g2
P( F25,5  ?)  0,025
P( F5,25  ?)  0,025
P( F5,25  3,13)  0,025
1
P( F25,5 
)  0,025
3,13
P( F25,5  0,319)  0,025
Distribuição
Se X1 ~ N ( 1,s12 )
(n1  1) s12
s 12
~
?
2
n1 1
X 2 ~ N ( 2 ,s 22 )
(n2  1) s22
s 22
~ ? n22 1
(n1  1) s12
s12 s 22 s12s 22
(n1  1)s 12
 2 2  2 2 ~ Fn1 1,n2 1
2
(n2  1) s2
s2s 1
s 1 s2
(n2  1)s 22
F
Teste de Hipótese para s  s
2
1
2
2
Exemplo: duas v.a. quaisquer têm distribuições desconhecidas com médias e variâncias
também desconhecidas. Retira-se uma amostra de cada população e calcula-se a
média e a variância para cada amostra. Teste a hipótese de que as variâncias e médias
populacionais não diferem significativamente a 5% entre si, considerando que:
n1  26 X1  10,3 s12  2,34
n2  41 X 2  15,7 s22  1,91
Hipóteses
H 0 : s 12 / s 22  1 (s 12  s 22 )
F25;40
H1 : s / s  1
2
1
2
2
s12s 22
~ Fn1 1;n2 1
2 2
s2s1
Se H0 é verdadeira, então
2,34
s12
 1, 2251
F  2 ~ Fn1 1;n2 1 F 
1,91
s2
2,5%
2,5%
95%
0 fa
fb
Região Crítica:
•aceito H0 se 0,47 < F < 1,99
•rejeito H0 caso contrário
1
?
?
1,99
2,12
Conclusão: Aceito H0, ou seja, não há razões para discordar que, a 5%, s12  s 22
+
Teste de Hipótese para 1 = 2 (cont.)
Exemplo: duas v.a. quaisquer têm distribuições desconhecidas com médias e variâncias
também desconhecidas. Retira-se uma amostra de cada população e calcula-se a
média e a variância para cada amostra. Teste a hipótese de que as variâncias e médias
populacionais não diferem significativamente a 5% entre si, considerando que:
n1  26 X1  10,3 s12  2,34
Hipóteses
H0 : 1 - 2 = 0 (1 = 2)
H1: 1 - 2  0
0,14
(n1  1) s  (n2  1) s
n1  n2  2
2
2
0,1
0,08
1 1

n1 n2
~ t0,06
n1  n2 2
(t0,04
homocedástico)
0
(n1  1) s  (n2  1) s
n1  n2  2
2
2
-
0
X1  X 2
2
1
2,5%
2,5%
95%
0,02
Se H0 é verdadeira, então
t
t65
0,12
( X 1  X 2 )  ( 1  2 )
2
1
n2  41 X 2  15,7 s22  1,91
1 1

n1 n2
5
-t
10
0
t
15
~ tn1  n2 2
t = -14,9515
?
1,997
Conclusão: Rejeito H0, ou seja, as médias são diferentes significativamente a 5%
+
Teste de Hipótese para p
Hipóteses
H0 : p = p 0
H1 : p  p 0
0,14
N (0,1)
0,12
0,1
pˆ  p
~ N (0,1)
pq
n
Se H0 é verdadeira, então
z
pˆ  p0
~ N (0,1)
p0 q0
n
0,08

2
0,06
0,04
0,02
0
0
-
5
-zcrít 0
10
zcrít
15
+
rejeição aceitação rejeição
de H0
de H0
de H0
Região Crítica:
•aceito H0 se –zcrít < z < zcrít
•rejeito H0 caso contrário

2
1
 P(–zcrít < z < zcrít) = 1 - 
 P(|z| > zcrít) = 
Conclusão (sempre associada a um nível de significância)
20
Teste de Hipótese para p1 = p2
Hipóteses
H0 : p1 – p2 = 0 (p1 = p2)
H1 : p 1 – p 2  0
( pˆ1  pˆ 2 )  ( p1  p2 )
 p1q1 p2 q2 



n
n2 
 1
0,14
0,1
~ N (0,1)
( pˆ1  pˆ 2 )  ( p1  p2 )
1 1
ˆ ˆ  
pq
 n1 n2 
0,08

2
0,06
0,04

2
1
0,02
Se H0 é verdadeira, então
z
N (0,1)
0,12
0
0
pˆ 
n1 pˆ 1  n2 pˆ 2
n1  n2
-
5
-zcrít 0
zcrít
15
+
rejeição aceitação rejeição
de H0
de H0
de H0
Região Crítica:
•aceito H0 se –zcrít < z < zcrít
•rejeito H0 caso contrário
10
 P(–zcrít < z < zcrít) = 1 - 
 P(|z| > zcrít) = 
Conclusão (sempre associada a um nível de significância)
20
Teste de Hipótese (resumo)
se s2 é conhecida
N (0,1)
para 
se s2 é desconhecida
tn 1
para s2

para 1 - 2
z
 
2
n1
2
(n  1) s 2
X 
s
n
t
X 
s
n
N (0,1)
s2
se s 12 e s 22 são conhecidas
tn1 n2 2
se s 12 e s 22 são desconhecidas, mas s 12  s 22
tg
se s 12 e s 22 são desconhecidas, mas s12  s 22
thomo 
z
( X 1  X 2 )  ( 1  2 )
s 12
n1

s 22
n2
thetero 
( X 1  X 2 )  ( 1  2 )
(n1  1) s12  (n2  1) s22
n1  n2  2
( X 1  X 2 )  ( 1  2 )
s12 s22

n1 n2
1 1

n1 n2
Teste de Hipótese (resumo)
N (0,1)
se s2 é conhecida
tn 1
se s2 é desconhecida
para 
para s2
n21
para 1 - 2
N (0,1)
se s 12 e s 22 são conhecidas
tn1 n2 2
se s 12 e s 22 são desconhecidas, mas s 12  s 22
tg
se s 12 e s 22 são desconhecidas, mas s12  s 22
s 12
para 2
s2
Fn1 1,n2 1
para p
N (0,1)
para p1 – p2
s12s 22
F 2 2
s2s 1
z
N (0,1)
pˆ  p
pq ˆ ˆ
( p1  p2 )  ( p1  p2 )
z
n
1 1
ˆ ˆ  
pq
 n1 n2 
pˆ 
n1 pˆ 1  n2 pˆ 2
n1  n2
Teste de Hipótese / EXCEL
Exemplo:
Para se comparar a resposta espectral de 2 alvos, 10 pixels são escolhidos
aleatoriamente de cada alvo, cujos resultados são apresentados abaixo.
Adotando um nível de significância de 5%, podemos concluir que, em média, os
alvos apresentam a mesma resposta?
amostra Alvo 1 Alvo 2
1
128
98
2
134
105
3
110
99
4
112
109
5
125
95
6
107
101
7
111
100
8
115
92
9
130
107
10
120
110
Teste-t: duas amostras presumindo variâncias equivalentes
Comparação de duas médias: teste-t
Alvoou
1 heterocedástico?
Alvo 2
Alvo 1
Alvo 2
Mas qual? Homo
Teste-F: duas amostras para variâncias
Média
Variância
Observações
gl
F
P(F<=f) uni-caudal
F crítico uni-caudal
H0 : 1 - 2 = 0
H1: 1 - 2 > 0
119,2
101,6
90,84444 36,04444
10
10
9
9
2,520345
0,092349
3,178893
Média
Variância
Observações
Variância agrupada
Hipótese da diferença de média
gl
Stat t
P(T<=t) uni-caudal
t crítico uni-caudal
P(T<=t) bi-caudal
t crítico bi-caudal
119,2
101,6
90,84444 36,04444
10
10
63,44444
0
18
4,940841
5,28E-05
1,734064
0,000106
2,100922
Conclusão: através do teste-t homocedástico unilateral, pôde-se
concluir que a média do alvo 1 deve ser maior que a do alvo 2,
adotando-se um nível de significância de 5%, uma vez que valor-P
foi menor que 0,05 (0,0000528).
Teste t pareado
10 pontos são escolhidos em cada imagem
Esquema 1
amostra
B
1
12
15
2
34
17
3
16
21
4
28
27
5
15
25
6
17
32
7
23
15
8
13
19
9
29
29
10
31
30
amostra
A
B
1
12
11
2
34
37
3
16
18
4
28
28
5
15
18
6
17
19
7
23
24
8
13
15
9
29
32
10
31
33
Imagem B
Esquema 2
Imagem A
A
Esquema 2
Esquema 1
Teste t pareado
amostra
A
B
1
12
15
2
34
17
3
16
21
4
28
27
5
15
25
6
17
32
7
23
15
8
13
19
9
29
29
10
31
30
amostra
A
B
1
12
11
2
34
37
3
16
18
4
28
28
5
15
18
6
17
19
7
23
24
8
13
15
9
29
32
10
31
33
Teste t
X A  21,8 sA2  66,84
X B  23,0
sB2  41,11
Se H0 verdadeiro
s A2
H0 : sA = s B
2
(valor-P = F
0,24)
Fcalc  1,63
~s
FnA2A 
calc  2 
1, ns
1 (Ac. H0 a 5%)
B B
H1: sA > s B
sB
(valor-P = 0,37)   A  B (Ac. H0 a 5%)
tcalc  0,35
XA  XB
H0 : A = B
tcalc 
~ t n A  nB  2
2
2
H1: A <  B
1
1 (nA  1) s A  (nB  1) sB

nA nB
nA  nB  2
X A  21,8 sA2  66,84
Teste t
X B  23,5 sB2  74,94
Fcalc  0,89
(valor-P = 0,57)
 s A2  s B2 (Ac. H0 a 5%)
tcalc  0, 43
(valor-P = 0,34)
  A  B (Ac. H0 a 5%)
Esquema 2
Esquema 1
Teste t pareado
amostra
A
B
1
12
15
2
34
17
3
16
21
4
28
27
5
15
25
6
17
32
7
23
15
8
13
19
9
29
29
10
31
30
amostra
A
B
A-B
1
12
11
1
2
34
37
-3
3
16
18
-2
4
28
28
0
5
15
18
-3
6
17
19
-2
7
23
24
-1
8
13
15
-2
9
29
32
-3
10
31
33
-2
Teste t
X A  21,8 sA2  66,84
X B  23,0
sB2  41,11
Fcalc  1,63
(valor-P = 0,24)
 s A2  s B2 (Ac. H0 a 5%)
tcalc  0,35
(valor-P = 0,37)
  A  B (Ac. H0 a 5%)
X AB  1,7 s
H0 : A-B = 0
H1: A-B < 0
2
A B
 1,79
Teste t pareado
Se H0 verdadeiro
X
tcalc  A B ~ tn 1
s A B
n
tcalc  4,02
(valor-P = 0,0015)
  AB  0 (Rej. H0 a 5%)
Comparando-se as médias de r populações
n1
nr
n2

X1
Xr
S1
E( X1 )  1
S2
X2
Sr
E ( X 2 )  2
E( X r )  r
Xij é o i-ésimo elemento da amostra retirada da população j (população = tratamento)
N (2 , s 2 )
2
2
j é a média da população j
N (s1 ,)s )
N (0,
i = 1, ..., nj
N (r , s 2 )
2
j = 1, ..., r
Xij = j + ij
ij ~ N(0,s )
j = * + j
Xij = * + j + ij
- -
0 1
+

2 r
+
*
média
efeito
efeito
global
da pop.
aleatório
j
Todas r populações têm a mesma variância!!!
Comparando-se as médias de r populações
A
B
C
D
12
14
19
24
18
12
17
30
13
21
Total
Total
30
39
57
54
180
Média
15
13
19
27
18
nj
2
3
3
2
10
A
B
C
D
X11
X12
X13
X14
X21
X22
X23
X24
X32
X33
Total
Total
X*1
X*2
X*3
X*4
X**
Média
X1
X2
X3
X4
XT
nj
n1
n2
n3
n4
nT
Comparando-se as médias de r populações
A
B
C
D
12
14
19
24
18
12
17
30
13
21
Total
Total
30
39
57
54
180
Média
15
13
19
27
18
nj
2
3
3
2
10
30
25
X ij  XT
20
X 32  XT  5
15
10
XT
A
B
C
D
Comparando-se as médias de r populações
A
B
C
D
12
14
19
24
18
12
17
30
13
21
Total
Total
30
39
57
54
180
Média
15
13
19
27
18
nj
2
3
3
2
10
30
25
20
X ij  X j
X3
15
10
X4
X14  X 4  3
X1
A
X2
B
C
D
Comparando-se as médias de r populações
A
B
C
D
12
14
19
24
18
12
17
30
13
21
Total
Total
30
39
57
54
180
Média
15
13
19
27
18
nj
2
3
3
2
10
30
X4
25
X 4  XT  9
20
X3
15
10
X j  XT
X1
A
XT
X2
B
C
D
Comparando-se as médias de r populações
A
B
C
D
12
14
19
24
18
12
17
30
13
21
Total
Total
30
39
57
54
180
Média
15
13
19
27
18
nj
2
3
3
2
10
X
ij
 X T    X j  X T    X ij  X j 
nj
nj
  X ij  XT    n j  X j  XT     X ij  X j 
r
2
j 1 i 1
SQTO
r
r
2
j 1
=
j 1 i 1
SQT
+
SQE
2
Análise de Variância
A
B
C
D
12
14
19
24
18
12
17
30
13
21
Total
Total
30
39
57
54
180
Média
15
13
19
27
18
nj
2
3
3
2
10
ANOVA (Análise de Variância)
Fonte de
Variação
Soma dos Quadrados
Tratamentos
SQT   n j  X j  X T 
Erro
SQE    X ij  X j 
Total
SQTO    X ij  X T 
r
j 1 n
j
r
j 1 i 1
r nj
j 1 i 1
Graus de
Liberdade
2
r-1
2
nT - r
2
nT - 1
Quadrado
Médio
SQT
r 1
SQE
QME 
nT  r
QMT 
Análise de Variância
A
B
C
D
12
14
19
24
18
12
17
30
13
21
Total
30
39
57
54
180
Média
15
13
19
27
18
nj
2
3
3
2
10
ANOVA (Análise de Variância)
Fonte de
Variação
Tratamentos
Erro
Total
Total
Soma dos
Graus de
Quadrados Liberdade
SQT
SQE
SQTO
r-1
nT - r
nT - 1
Quadrado
Médio
QMT
E QME   s 2
r
E  QMT   s 2 
 n (
j 1
j
E  QMT   s 2 
 T ) 2
r 1
r
QME
j
n 
j 1
j
r 1
2
j
Análise de Variância
A
B
C
D
12
14
19
24
18
12
17
30
13
21
Total
30
39
57
54
180
Média
15
13
19
27
18
nj
2
3
3
2
10
ANOVA (Análise de Variância)
Fonte de
Variação
Total
Soma dos
Graus de
Quadrados Liberdade
Quadrado
Médio
Tratamentos
SQT
r-1
QMT
Erro
SQE
nT - r
QME
Total
SQTO
nT - 1
H0 : 1 = 2 = ... = r
H1: nem todos j são iguais
HQMT
0 : j =~0?F
r 1,nT r
HQME
1: nem todos j = 0
Análise de Variância
A
B
C
D
12
14
19
24
18
12
17
30
13
21
Total
30
39
57
54
180
Média
15
13
19
27
18
nj
2
3
3
2
10
ANOVA (Análise de Variância)
Fonte de
Variação
Soma dos
Graus de
Quadrados Liberdade
Quadrado
Médio
Tratamentos
SQT
r-1
QMT
Erro
SQE
nT - r
QME
Total
Total
SQTO
nT - 1
H0 : 1 = 2 = ... = r
H1: nem todos j são iguais
Fr 1,nT r
Fcalc 
QMT
QME

0 1
+
Fcrít
H0 verd. H0 falso
ac. H0 rej. H0
Análise de Variância
A
B
C
D
12
14
19
24
18
12
17
30
13
21
Total
Total
30
39
57
54
180
Média
15
13
19
27
18
nj
2
3
3
2
10
ANOVA (Análise de Variância)
Fonte de
Variação
Tratamentos
Soma dos
Graus de
Quadrados Liberdade
Quadrado
Médio
258
3
86
Erro
46
6
7,67
Total
304
9
F calculado Valor - P
11,2
0,0072
Conclusão: rej. H0 a 5%, pelo menos uma
média é diferente das demais
Análise de Variância
OBSERVAÇÕES:
- Cada observação é independente das demais;
- Cada tratamento tem distribuição normal;
- Todas as distribuições têm a mesma variância; e
- ANOVA com 2 tratamentos (r = 2) é similar a um
teste t bilateral (homocedástico).
SQT   n j  X j  X T   
r
r
2
j 1
j 1
nj
X 2j
X T2

nj
nT
SQE    X ij  X j   SQTO  SQT
r
2
j 1 i 1
nj
SQTO    X ij  X T 
r
j 1 i 1
2
nj
X T2
  X 
nT
j 1 i 1
r
2
ij
Teste de Bartlett (igualdade de variâncias)
Se s12, ... , sr2 são as variâncias amostrais de r populações com
distribuição normal, então
r
QME 
 (n
j 1
j
 1) s 2j
nT  r
B ~ r21
Fazendo
r

2,302585 
2
B
(
n

r
)
log
QME

(
n

1)
log
s
 T

10
j
10 j 
C
j

1


H0 : s12  s 22   s r2
H1: nem todas s 2j são iguais
onde
1  r 1
1 
C  1



3(r  1)  j 1 n j  1 nT  r 
r21

0
X crít
H0 verd.
ac. H0
+
rej.
H0 falso
H0
Teste de Bartlett (igualdade de variâncias)
Usando-se o exemplo da ANOVA:
A
B
C
D
12
14
19
24
18
12
17
30
13
21
Total
s2
18
1
4
18
nj
2
3
3
2
10
H0 : s12  s 22  s 32  s 42
H1: nem todas s 2j são iguais
1 1 1 r 1 11 1  1 
C  1          1,3148

3(
9 r1 1)2 j 12n j 1 1 6 nT  r 
r

2,302585 
2
B
3, 7147

2,
7897
(nT  r )log
QME

(
n

1)
log
s
5,3076

0

10
j
10 j 
1,3148
C
j

1


32
0,05
X crít
+
X crít  7,8147
Conclusão: aceito H0 a 5%, ou seja, as variâncias dos grupos podem ser as mesmas
Teste de Tukey (teste para comparação múltipla)
Utilizado quando se deseja comparar todos os pares de médias de r
populações, adotando-se um único nível de significância.
H0 : i   j  0
H1: i   j  0
i  j
O teste consiste em calcular um valor (Dcrít), acima do qual, a diferença
entre duas médias amostrais (em absoluto) é significativamente
diferente de zero.
Dcrít 
qr ,nT r
2
1
1 
QME  
 ni n j 


onde qr ,nT r representa o valor tabelado (vindo de uma distribuição da
amplitude studentizada – “studentized range”) associado ao nível de
significância adotado.
Distribuição da Amplitude Studentizada
P(qr , g  qtab )  0, 05
r
g
Teste de Tukey (teste para comparação múltipla)
Usando-se o exemplo da ANOVA:
A
B
C
D
12
14
19
24
18
12
17
30
13
21
Total
30
39
57
54
180
Média
15
13
19
27
18
nj
2
3
3
2
10
Dcrít 
q4,6
2
1
1 
QME  
 ni n j 


Xi
13
15
19
27
Total
D  15  13  2
Dcrít 
q4,6  4,90 (  5%)
4, 90
2
1 1
7, 67     8, 76
3 2
Teste de Tukey (teste para comparação múltipla)
Usando-se o exemplo da ANOVA:
A
B
C
D
12
14
19
24
18
12
17
30
13
21
Total
Total
30
39
57
54
180
Média
15
13
19
27
18
nj
2
3
3
2
10
Dcrít 
q4,6
2
1
1 
QME  
 ni n j 


q4,6  4,90
Xi
a 13
a 15
19
27
D  19  13  6
Dcrít 
4, 90
2
1 1
7, 67     7,83
3 3
Teste de Tukey (teste para comparação múltipla)
Usando-se o exemplo da ANOVA:
A
B
C
D
12
14
19
24
18
12
17
30
13
21
Total
Total
30
39
57
54
180
Média
15
13
19
27
18
nj
2
3
3
2
10
Dcrít 
q4,6
2
1
1 
QME  
 ni n j 


q4,6  4,90
Xi
a 13
a 15
a 19
27
D  27  13  14 Dcrít 
4, 90
2
1 1
7, 67     8, 76
3 2
Teste de Tukey (teste para comparação múltipla)
Usando-se o exemplo da ANOVA:
B
C
D
12
14
19
24
18
12
17
30
13
21
30
39
57
54
180
Média
15
13
19
27
18
nj
2
3
3
2
10
q4,6
2
1
1 
QME  
 ni n j 


Xi
13
15
19
27
Total
Total
Dcrít 
a
a
a
b
A
D  19  15  4
q4,6  4,90
Teste de Tukey (teste para comparação múltipla)
Usando-se o exemplo da ANOVA:
B
C
D
12
14
19
24
18
12
17
30
13
21
Total
Total
30
39
57
54
180
Média
15
13
19
27
18
nj
2
3
3
2
10
Dcrít 
a
a
a
b
A
q4,6
2
1
1 
QME  
 ni n j 


q4,6  4,90
Xi
13
15
19
27
D  27  15  12 Dcrít 
4, 90
2
1 1
7, 67     9, 60
2 2
Teste de Tukey (teste para comparação múltipla)
Usando-se o exemplo da ANOVA:
B
C
D
12
14
19
24
18
12
17
30
13
21
Total
Total
30
39
57
54
180
Média
15
13
19
27
18
nj
2
3
3
2
10
Dcrít 
a
a
a
b
A
q4,6
2
1
1 
QME  
 ni n j 


q4,6  4,90
Xi
13
15
19
27
D  27  19  8 Dcrít 
4, 90
2
1 1
7, 67     8, 76
3 2
Teste de Tukey (teste para comparação múltipla)
Usando-se o exemplo da ANOVA:
a
a
ab
b
13
15
19
27
B
C
D
12
14
19
24
18
12
17
30
13
21
Total
Total
30
39
57
54
180
Média
15
13
19
27
18
nj
2
3
3
2
10
Dcrít 
Xi
A
q4,6
2
35
30
25
20
15
10
5
0
1
1 
QME  
 ni n j 


q4,6  4,90
b
a
a
ab
10
A
B
C
D
B
A
C
20
D
30
Download

Teste de Hipótese