Estatística
Teste de hipóteses
Teste de Hipóteses
Pontos mais importantes:
-objectivo
-nível de significância, região crítica, erros
-construção de testes de hipóteses
-teste para a média de uma distr. normal (s conhecida), valor de prova
-teste para a média de uma distr. normal (s desconhecida)
-teste de igualdade de duas médias de distr. normal (s conhecida)
-teste de igualdade de duas médias de distr. normal (s desconhecida)
-teste do “t” para dados emparelhados
-teste para a variância de populações normais, comparação de duas
variâncias, distribuição F
1
Teste de hipóteses
Estatística
Objectivo:
Verificar a consistência de uma hipótese estatística (sobre um
parâmetro da distribuição em estudo) com os dados disponíveis
(amostra).
e.g.:
-os filtros que a minha empresa comprou conseguem
resistir uma pressão de 5 Bar?
-o número de células numa água contaminada diminuiu,
por um factor de 10-5/ml, após o nosso tratamento?
-A pasteurização de leite com um permutador de calor
mais barato não resultou numa qualidade inferior em
relação ao processo com um permutador de calor mais
caro?...
2
Estatística
Teste de hipóteses
Hipóteses
Aceitar

verdadeira
Aceitar um hipótese não significa
que esta é verdadeira, só significa
que
os
dados
aparecem
consistentes
com
a
nossa
hipótese (provável)
rejeitar
muito improvável
3
Estatística
Teste de hipóteses
Nível de significância
Suponha que temos uma população com distribuição F. Queremos
testar um hipótese sobre P da F. Este hipótese chama-se “hipótese
nula”.
a) H0: m=5 Bar
b) H0: m<5 Bar
(N~(m,0.2))
(N~(m,0.2))
Caso a) é um hipótese simples: determina completamente F
Caso b) é um hipótese complexo: não determina F
Baseado numa mostra de tamanho n, podemos aceitar ou rejeitar H0
4
Estatística
Teste de hipóteses
H0 é rejeitada se a amostra (estatística) fizer parte da região crítica ,C,
do espaço amostral:
aceitar H0 se
(X1, X2 ,...Xn ) C
rejeitar H0 se
(X1, X2 ,...Xn ) C
Erro de tipo I: rejeitar erradamente H0 quando é verdadeira
Erro de tipo II: aceitar erradamente H0 quando é falsa
Quando H0 é verdadeira, a nossa hipótese só deve ser rejeitada se os
valores observados forem muito improváveis. A probabilidade de
cometer erro de tipo I não deve ultrapassar um valor especificado, a
(geralmente baixo).
5
Estatística
Teste de hipóteses
a chama-se nível de significância. Existem
convencionais, mas a escolha depende do objectivo:
alguns
níveis
a=0.2
a=0.1
-é suficiente ser suspeitoso que H0 seja falsa
-moderadamente convencido que H0 é falsa
a=0.05
-bastante convencido que H0 é falsa
a=0.005
-muito convencido que H0 é falsa
6
Estatística
Teste de hipóteses
Construção de um teste de hipótese
1) Escolha da estatística para o teste: geralmente um estimador
e.g. média amostral
2) Escolha de um nível de significância
3) Determinação da distribuição de probabilidade da estatística
e a correspondente região crítica
7
Estatística
Teste de hipóteses
Testar a média de uma distribuição normal de variância
conhecida
Hipótese nula:
H0 : m=m0
Hipótese alternativa:
H1 : mm0
Estatística (óbvia):

X=
n
Região crítica:
i =1
(média é igual com um dado valor)
Xi
n
C = ( X  m 0  c)
Nos queremos determinar c em concordância de uma a tal que
(
)
Pm 0 X  m 0  c = a
(e.g. a=5%, só 5 vezes em 100 amostras, a diferença entre a
média amostral e a média ultrapassa c se H0 for verdadeira)
8
Estatística
Teste de hipóteses
Se for verdade que m=m0, nos podemos dizer:
Z= n
Assim,
X  m0
~ N(0,1)
s

n
Pm0  Z 
s


c  = a


n  a
c  =
Aplicando simetria temos, Pm 0  Z 
2
s 

Também sabemos que,
O resultado,
Pm0 (Z  z a 2 ) = a
c=
2
z a 2s
n
9
Estatística
Teste de hipóteses
aceitar H0 se
rejeitar H0 se
X  m0 
X  m0 
z a 2s
n
z a 2s
n
10
Estatística
Teste de hipóteses
Exemplo: Pretende-se re-calibrar uma balança. O erro das medições da balança
tem uma s2=4 (mg2) e, desejavelmente, média 0. Fazendo 5 medições com peso
calibrados a média amostral do erro é 1.5 mg. Pode ser que o erro da balança
continue, em média, a ser 0 (a=0.05)
H0 : m=0
H1 : mm0
n
5
X  m0 =
1.5 = 1.68  z 0.025 = 1.96
s
2
H0 é aceite com 5% de nível de significância.
11
Estatística
Teste de hipóteses
Uma alternativa ao procedimento anterior é primeiro calcular:
p

n
= P z 
X  m0
2
s





p chama-se valor de prova e dá o nível de significância crítica. H0
rejeita-se para todos valores de a que verifica pa.
Exemplo: Determine p para o exemplo anterior
p

n
= P z 
X  m0
2
s


 = P(z  1.68) = 4.65%


Assim para qualquer nível de significância superior de 2*0.0465=0.093 H0: erro do
balanço=0 seria rejeitado (e.g. a=0.1)
12
Teste de hipóteses
Estatística
13
Estatística
Teste de hipóteses
Erro de tipo II: qual é a probabilidade de aceitar erradamente H0 quando
a verdadeira média mm0?
Resultados possíveis
H0 verdadeira
H0 falsa
H0 rejeitada
Erro tipo I
(probabilidade a)
Correcta
(probabilidade 1-b)
H0 aceite
Correcta
(probabilidade 1-a)
Erro tipo II
(probabilidade b)
14
Estatística
Teste de hipóteses
Esta probabilidade (aceitar H0) é uma função da média verdadeira (m),
b(m):


X  m0
b(m) = Pm   z a 2  n
 z a 2 
s


para calcular b(m):

m
m
X m
m
b(m) = Pm   z a 2  n  n
 n 0  z a 2  n  =
s
s
s
s


m m
m m
X m
 =
= Pm  n 0
 za 2  n
 za 2  n 0
s
s
s


m m
m m

= Pm  n 0
 za 2  Z  za 2  n 0

s
s 

15
Estatística
Teste de hipóteses
m= m0+s
m= m0+3s
m= m0+2s
16
Estatística
Teste de hipóteses
Exemplo: Pretende-se re-calibrar uma balança. O erro das medições da balança
tem uma s2=4 (mg2) e, desejavelmente, média 0. Fazendo 5 medições com pesos
calibrados qual é a probabilidade de aceitarmos erradamente H0, se o factor de
calibração verdadeiro era 2mg
n
m0  m
5
=
2 =  5
s
2
;
z0.025=1.96
(
) (
)
= 1  ( 5  1.96) 1  ( 5  1.96) =
= (4.196)  ( 5  1.96) = 0.392
b(2) =  1.96  5    5  1.96 =
17
Estatística
Teste de hipóteses
No exemplo anterior é óbvio que a probabilidade de cometer o erro
tipo II só depende do tamanho da mostra (para um dado a). Assim
a função b(m1) podia ser usada para determinar o tamanho da
mostra maximizando a probabilidade de aceitar H0: m=m0 à b,
quando a verdadeira média é m1.
Infelizmente não existe solução analítica mas pode ser usada a
seguinte aproximação (sem prova):
(
z
n
2
a 2  zb ) s
2
(m 0  m1 )2
18
Estatística
Teste de hipóteses
O teste de hipótese discutido agora resultou uma rejeição de H0
quando o valor média da amostra ficou longe da média “hipotética”
da população em qualquer sentido. O que acontece e.g. se a única
alternativa é que mm0 ou:
H0 : m=m0
(ou
mm0)
Neste caso o teste chama-se teste unilateral.
Região crítica:
H1 : mm0
C = (X  m0  c)
Nos queremos determinar c em concordância de uma a tal que
Pm0 (X  m0  c) = a
19
Estatística
Teste de hipóteses


n
Assim podemos escrever: Pm 0  Z 
c(= z a ) = a

s


c=
ou
H0 : m=m0(ou mm0)
H1 : mm0
zas
n
aceitar H0 se
rejeitar H0 se
zas
X  m0 
n
zas
X  m0 
n
A probabilidade do erro tipo II é dado
m0  m 
m0  m 


b(m) = Pm  Z  z a  n
 =  z a  n

s 
s 


20
Estatística
Teste de hipóteses
Exemplo: Considere o exemplo de calibração da balança(s2=4 (mg2)). Agora
sabemos que se existe um erro, não pode ser negativo. Poderá o erro da balança
em média continuar a ser 0 em média (a=0.05)?
H0 : m=0
H1 : mm0
n
(X  m0 ) = 5 1.5 = 1.68  z0.05 = 1.645
s
2
H0 é rejeitado com 5% de nível de significância.
A mesma forma podemos construir testes de hipótese unilateral para:
H0 : m=m0
(ou
mm0)
aceitar H0 se
rejeitar H0 se
H1 : m<m0
X  m0  
zas
n
zas
X  m0  
n
21
Estatística
Teste de hipóteses
Nota: Existe uma analogia directa entre os intervalos da confiança e
os testes de hipóteses
X  m0 
aceitar H0 se

z a 2s
n
 X  m0  X 
z a 2s
n
z a 2s
n
z a 2s
n
 X  m0 
ou
z a 2s
n
X
z a 2s
n
 m0  X 
z a 2s
n
o intervalo de confiança:
s
s 

P X  Za / 2
< m < X  Za / 2
 = 1 a
n
n

Se m0 fica no intervalo da confiança com nível de conf. 1-a, H0 é
aceitado
22
Estatística
Teste de hipóteses
Testar a média de uma distribuição normal de
variância desconhecida-Teste do “t” de Student
Hipótese nula:
H0 : m=m0
Hipótese alternativa:
H1 : mm0
Estatística:
T= n
Assim:
aceitar H0 se
rejeitar H0 se
(média é igual a um dado valor)
X  m0
~ t
S
X  m0 
t a 2,n 1S
X  m0 
t a 2,n 1S
n
n
23
Estatística
Teste de hipóteses
Exemplo: Suspeita-se que nos EUA o consumo diário de água num domicilio seja
de 350 (10-1) gal/dia. Realizou-se uma experiência, que envolveu 20 famílias, e
observaram-se os seguintes resultados:
340
386
340
324
344
354
355
318
362
364
362
360
H0 : m=350
T= n
p
2
375
332
322
338
356
402
372
370
H1 : m350
X  m0
= 0.7778
s
= P(t n 1  T ) = P(t19  0.7778) = 0.2231
ou p=0.4462
e.g. com a=0.05 H0 é aceitado (p>a).
24
Estatística
Teste de hipóteses
0.22
25
Estatística
Teste de hipóteses
Podemos efectuar os testes unilaterais:
A)
H0 : m=m0
mm0)
aceitar H0 se
rejeitar H0 se
B)
H1 : mm0
(ou
H0 : m=m0
(ou
mm0)
aceitar H0 se
rejeitar H0 se
X  m0 
t a ,n 1S
X  m0 
t a ,n 1S
n
n
H1 : m<m0
X  m0  
t a ,n 1S
X  m0 < 
t a ,n 1S
n
n
26
Estatística
Teste de hipóteses
Teste da igualdade das médias de duas populações
normais com as variâncias conhecidas
Hipótese nula:
H0 : mX=mY
Hipótese alternativa:
H1 : mX  mY
i=1 Xi
n
Estatística:
XY =
n


m
i =1
m
Yi

s 2X s 2Y 

~ N m X  m Y ,

n
m

Assim se Ho for verdade:
XY
s
s

n
m
2
X
2
Y
~ N(0,1)
27
Estatística
Teste de hipóteses
Assim podemos facilmente construir um teste de hipóteses porque,
XY
aceitar H0 se
rejeitar H0 se
s
s

n
m
2
X
2
Y
XY
s
s

n
m
2
X
2
Y
 za 2
 za 2
28
Estatística
Teste de hipóteses
Exemplo: Temos dois métodos, um barato (B) e um caro (A), para imobilizar
enzimas. Medimos o tempo (em horas) que as enzimas imobilizadas mantém a
sua capacidade catalítica. Determine se o método mais barato pode ser
considerado como uma boa alternativa ao método A com 5% nível de significância
com sB=4 e sB=6.
A
61.1
58.2
62.3
64
59.7
66.2
57.8
61.4
62.2
63.6
61.7
B
62.2
56.6
66.4
56.2
57.5
58.4
57.6
65.4
H0 : mA=mB
Z=
61.7  60
16 36

10 8
H1 : mA  mB
=
1.7
= 0.688  z 0.025 = 1.96
2.47
H0 está aceitado com 5% nível de significância
60
29
Teste de hipóteses
Estatística
30
Estatística
Teste de hipóteses
Teste da igualdade das médias de duas populações
normais com as variâncias desconhecidas
Hipótese nula:
H0 : mX=mY
Hipótese alternativa:
H1 : mX  mY
Suponha que:
sY
sX=
Estatística:
T=
X  Y  (m X  m Y )
2
2
 1   1  (n  1)SX  (m  1)SY
  
nm2
 n  m
aceitar H0 se |T|<ta/2,n+m-2
Assim se Ho for verdade: T~tn+m2
rejeitar H0 se |T|>ta/2,n+m-2
31
Estatística
Teste de hipóteses
Exemplo: Considere o exemplo anterior, mas agora suponha que as variâncias são
também desconhecidos
A
61.1
58.2
62.3
64
59.7
66.2
57.8
61.4
62.2
63.6
61.7
B
62.2
56.6
66.4
56.2
57.5
58.4
57.6
65.4
H0 : mA=mB
T=
H1 : mA  mB
1.7
= 1.02  t 0.025 ,16 = 2.12
3.33 * 0.47
H0 está aceitado com 5% nível de significância
60
32
Teste de hipóteses
Estatística
33
Estatística
Teste de hipóteses
Teste do “t” para dados emparelhados
Muitas vezes estamos interessados em avaliar, se uma alteração
qualquer no nosso sistema, melhorou ou não o sistema (menos
custo, mais produção, melhor qualidade etc.) Para saber isso,
compara-se o sistema antes (X) e após (Y) a alteração feita.
Com n pares da amostra (Xi, Yi) podem ser usados para obter
uma nova v.a. Wi= Xi-Yi
Assim:
Estatística:
Hipótese nula:
H0 : mW=0
Hipótese alternativa:
H1 : mW  0
T= n
W
~ t
SW
34
Estatística
Teste de hipóteses
Assim:
aceitar H0 se
rejeitar H0 se
W
t a 2,n 1SW
W
t a 2,n 1SW
n
n
Vantagem: O teste do “t” emparelhado pode ser utilizada, apresar
as amostras não serem independentes ou não tiveram variâncias
iguais, garantido que n1=n2.
Desvantagem: o grau de liberdade em vez que 2n-2 fica apenas n-1.
35
Estatística
Teste de hipóteses
Exemplo: Recentemente um novo programa de segurança do trabalho foi
introduzido na industria de produção de latas. O tempo (em horas) médio perdido
na produção de cada semana por causa de acidentes foi medido em 10 empresas.
Determine se o programa teve um efeito positivo com 5% de nível de significância.
Antes
30.5
18.5
24.5
32
16
15
23.5
25.5
28
18
W = 2.15
SW = 3
Depois
23
21
22
28.5
14.5
15.5
24.5
21
23.5
16.5

 10
W
7.5
-2.5
2.5
3.5
1.5
-0.5
-1
4.5
4.5
1.5
H0 : mW  0
H1 : mW  0
aceitar H0 se
n
W
 t n 1,a
SW
rejeitar H0 se
n
W
 t n 1,a
SW
2.15
= 2.67  t 9,0.05 = 1.833
3
Assim H0 é rejeitado, o programa
teve um efeito positivo com 5% de
nível de significância
36
Teste de hipóteses
Estatística
37
Estatística
Teste de hipóteses
Teste de hipóteses para a variância de populações
normais
Hipótese nula:
H0 : s2=s20
Hipótese alternativa:
H1 : s2s20
Estatística:
Sabemos:
(variância é igual com um dado
valor)
(n  1)S2
2
~

n 1
s02
 2

s2
2

P  1a / 2,n 1 < (n  1) 2 <  a / 2,n 1  = 1  a
s0


aceitar H0 se
rejeitar H0
2
s
21a / 2,n 1 < (n  1) 2 < 2 a / 2,n 1
s0
para outros
38
Estatística
Teste de hipóteses
Exemplo: Uma nova máquina de encher garrafas da água foi instalada numa
empresa de água. A máquina pode ser considerada eficiente se o desvio padrão
do volume da água engarrafada não ultrapassar 0.15l (garrafas de 15l). 20
amostras indicaram uma variância amostral 0.025l2. O que podemos dizer sobre a
máquina?
H0 : s2s20
H1 : s2s20
(n  1)S2 19* 0.025
=
= 21.111 19,0.1 = 27.2
2
s0
0.0225
(p = 33.07%)
H0 é aceite com 10% nível de significância (e qualquer nível de significância
a<p=33.07%).
39
Estatística
Teste de hipóteses
21.1
40
Estatística
Teste de hipóteses
Teste da igualdade de variâncias de duas populações
normais
Hipótese nula:
H0 : s2X=s2Y
Hipótese alternativa:
H 1 : s2 X  s2 Y
Estatística:
S2X
~ Fn 1,m1
2
SY
Então:

=
n
2
X
S
i =1
(X i  X) 2
n 1

=
m
2
Y
; S
i =1
(Yi  Y) 2
m 1
2


SX
P F1a 2,n 1,m 1 < 2 < Fa 2,n 1,m 1  = 1  a
SY


2
aceitar H0 se
S
F1a 2,n 1,m1 < X 2 < Fa 2,n 1,m1
SY
rejeitar H0 para outros
41
Estatística
Teste de hipóteses
Distribuição Fn1,n2: Sejam 2n1 e 2n2 duas v.a. com distribuição
chi-quadrado a v.a. F definida:
n21
Fn1,n 2 =
n2 2
n1
n2
tem uma distribuição F com n1e n2 graus de liberdade
- f(x) muito complicado
-tabelas para calcular
probabilidades
42
Teste de hipóteses
Estatística
43
Estatística
Teste de hipóteses
Exemplo: Existem dois catalisadores utilizados num processo químico. A
quantidade de produto formado usando qualquer um dos catalisadores não tem
uma diferença significativa em termos do valor da média. Mas também queremos
testar, se as variâncias podem ser considerados iguais com 5% nível de
significância. As mostras indicaram que S21=0.14 (n=10) e S22=0.28 (n=12).
Hipótese nula:
H0 : s2X=s2Y
Hipótese alternativa:
H1 : s2X  s2Y
2
SX
= 0 .5
2
SY
F10.025,9,11 =
1
F0.025,11,9
= 0.26
F0.025,9,11 = 3.59
0.26 < 0.5 < 3.59
assim o hipótese de variâncias iguais é aceite.
44
Teste de hipóteses
Estatística
4
45
Download

Teste de Hipóteses