Teste de Hipótese e Intervalo de
Confiança
Parte 2
Questões para discutirmos em sala:
O que é uma hipótese estatística?
O que é um teste de hipótese?
Quem são as hipóteses nula e alternativa?
Quando devemos rejeitar a hipótese nula?
Estamos prontos, agora, para aprendermos o
primeiro teste de hipótese.
Vamos testar a média de uma população,
supondo que conhecemos a variância.
Considere o problema de determinar a média do
tamanho da ruptura muscular no ombro...
suponha temos uma amostra com 25 pacientes e
que a variância seja dada e igual a 1.
Relembrando: Teste de Hipótese – Passo a Passo
1) Identifique o parâmetro de interesse
média
2) Estabeleça H0 e Ha
H0:  = 3,5; Ha:   3,5
3) Estabeleça o nível de significância  que determinará a
região de rejeição
 = 0,05
Relembrando: Teste de Hipótese – Passo a Passo
4) Estabeleça uma estatística apropriada de teste
É o que determina o teste!
Relembrando: Teste de Hipótese – Passo a Passo
4) Estabeleça uma estatística apropriada de teste
Média amostral
Valor de H0
__
Z0 
Raiz da variância ou Desvio Padrão
X  0

n
Tamanho da amostra
Relembrando: Teste de Hipótese – Passo a Passo
5) Calcule o valor da estatística
Vamos supor que a média amostral tenha sido 3,1.
3,1
3,5
__
Z0 
1
X  0

n
25
Relembrando: Teste de Hipótese – Passo a Passo
5) Calcule o valor da estatística
3,1  3,5  0,4  4 10
4 5
Z0 



 2
1
1
1
10 1
5
5
25
Relembrando: Teste de Hipótese – Passo a Passo
6) Decida de H0 deve ou não ser rejeitada.
Precisamos estabelecer o valor crítico.
Região de
Rejection
rejeição
Region
Região
de
Rejection
rejeição
Region
1-
1/2 
1/2 
Nonrejection
Region
Critical
Valor
Value
crítico
-z/2
Ho
Sample Statistic
Value Critical
Valor
Value
crítico
z/2
Relembrando: Teste de Hipótese – Passo a Passo
6) Decida de H0 deve ou não ser rejeitada.
Para  = 0,05, em um teste z bicaudal, os valores
críticos são -z/2 = -1,96 e z/2 = 1,96.
Valor crítico:
Rejeitar
RejectHH
0 0
.025
RejeitarHH0
Reject
0
.025
-1.96 0 1.96 Z
Relembrando: Teste de Hipótese – Passo a Passo
6) Decida de H0 deve ou não ser rejeitada.
A hipótese nula será rejeitada se:
Z0 > z/2
ou
Z0 < -z/2
E falharemos em rejeitar se:
-z/2 < Z0 < z/2
Relembrando: Teste de Hipótese – Passo a Passo
6) Decida de H0 deve ou não ser rejeitada.
Temos que Z0 = -2 e -z/2 = -1.96
Como -2 < -1,96
H0 é rejeitada.
Relembrando: Teste de Hipótese – Passo a Passo
Isto significa que:
Com uma amostra de 25 pacientes e com variância
igual a 1...
e uma média amostral de 3,1...
A hipótese nula de que a média dos dados é 3,5
é rejeitada.
Teste Z – Inferência sobre a Média da População com
Variância Conhecida
Este teste que acabamos de estudar é conhecido
como teste Z...
porque usa a estatística de teste baseada em uma
normal padrão (média zero e variância 1).
Chamamos uma normal padrão de Z.
Vamos verificar formalmente como é definido o
teste Z...
Teste Z – Inferência sobre a Média da População com
Variância Conhecida
Suponha que desejamos testar a hipótese:
H0:  = 0
Sendo 0 uma constante especificada.
Considere uma amostra aleatória X1, X2, ..., Xn da
população e a variância 2 da população dada.
Teste Z – Inferência sobre a Média da População com
Variância Conhecida
Calcule a estatística de teste:
__
Z0 
X  0

n
H0:
H0:  = 0
Ha:
Ha:   0
Critérios de rejeição:
H0:   0
Ha:  > 0
Z0 > z
H0:   0
Ha:  < 0
Z0 < -z
Z0 > z/2 ou Z0 < -z/2
p-valor
O p-valor é o valor de significância observado
Se p-valor  , NÃO rejeita H0
Se p-valor < , REJEITA H0
Levamos ao laboratório uma
amostra aleatória de 25 caixas e
constatamos uma média do
princípio ativo de 372.5 mg. O
fabricante especifica que a média
de principio ativo é 368 mg e que
o desvio  é de 15 mg. Queremos
achar o p valor.
Genérico
368 mg
X   372.5  368
Z

 1.50

15
n
25
-1.50 0
1.50
Z
Valor amostral da estatística
Z (observado)
O p-valor é P(Z  -1.50 ou Z  1.50)
-1.50 0
1.50
Z
Valor amostral da estatística
Z (observado)
O p-valor é P(Z  -1.50 ou Z  1.50)
1/2
p-Value
½ p-valor
-1.50 0
1/2½p-Value
p-valor
1.50
Z
Valor amostral da estatística
Z (observado)
O p-valor é P(Z  -1.50 ou Z  1.50)
1/2
p-Value
½ p-valor
1/2½p-Value
p-valor
0.433
-1.50 0
Calculado através de tabela
ou no computador
1.50
Z
Valor amostral da estatística
Z (observado)
O p-valor é P(Z  -1.50 ou Z  1.50)
1/2
p-Value
½ p-valor
1/2½p-Value
p-valor
0.500
- 0.433
= 0.067
0.433
-1.50 0
Calculado através de tabela
ou no computador
1.50
Z
Valor amostral da estatística
Z (observado)
O p-valor é P(Z  -1.50 ou Z  1.50) = 0.134
1/2
p-Value
½ p-valor
1/2½p-Value
p-valor
0.500
- 0.433
= 0.067
0.433
-1.50 0
Calculado através de tabela
ou no computador
1.50
Z
Valor amostral da estatística
Z (observado)
(p-valor = 0.134)  ( = 0.05).
Então: NÃO rejeita a hipotese H0
1/2 p-valor = 0.067
1/2 p-valor = 0.067
Reject
Rejeita
Reject
Rejeita
1/2  = 0.025
1/2  = 0.025
-1.50 0
1.50
Z
Observe que no teste z, a variância da população
é dada...
entretanto, em problemas reais, isto não é algo
comum.
e se precisarmos de um teste de hipótese para
médias e não conhecermos a variância da
população?
Teste T – Inferência sobre a Média da População com
Variância Desconhecida
E se a variância não for conhecida?
Muitas vezes não conhecemos
populacional dos nossos dados.
a
variância
Usaremos, então, o teste T.
A única diferença para o teste z é que aqui a
variância não é conhecida.
Vamos testar a média de uma população, sem
conhecemos a variância.
Considere o problema de determinar a média do
tamanho da ruptura muscular no ombro...
suponha temos uma amostra com 25 pacientes.
Relembrando: Teste de Hipótese – Passo a Passo
1) Identifique o parâmetro de interesse
média
2) Estabeleça H0 e Ha
H0:  = 3,5; Ha:   3,5
3) Estabeleça o nível de significância  que determinará a
região de rejeição
 = 0,05
Relembrando: Teste de Hipótese – Passo a Passo
4) Estabeleça uma estatística apropriada de teste
Média amostral
Valor de H0
__
X  0
T0 
S
Desvio padrão amostral
n
Tamanho da amostra
Relembrando: Teste de Hipótese – Passo a Passo
5) Calcule o valor da estatística
Vamos supor que a média amostral tenha sido 3,1
e que o desvio amostral tenha sido 0,7.
3,1
3,5
__
X  0
T0 
S
0,7
n
25
Relembrando: Teste de Hipótese – Passo a Passo
5) Calcule o valor da estatística
3,1  3,5  0,4  4 10
4 50
T0 



 2,86
0,7
0,7
7
10 7
50
5
25
Relembrando: Teste de Hipótese – Passo a Passo
6) Decida de H0 deve ou não ser rejeitada.
Para  = 0,05, em um teste t bicaudal com 24
graus de liberdade, os valores críticos são -t/2 = 2,39 e t/2 = 2,39.
Relembrando: Teste de Hipótese – Passo a Passo
6) Decida de H0 deve ou não ser rejeitada.
Temos que t0 = -2,86 e -t/2 = -2,39
Como -2,86 < -2,39
H0 é rejeitada.
Na prática:
Teremos nossos dados e vamos querer testar
hipóteses.
Precisamos saber:
Unicaudal ou bicaudal
Uma ou duas populações
identificar o parâmetro a ser testado;
formular os testes, identificando
corretamente as hipóteses nula e
alternativa;
identificar o teste e executá-lo no
computador.
Intervalos de Confiança
Suponha que temos uma população NORMAL de
média  e desvio  e que vamos adquirir algumas
amostras desta população.
Podemos para cada uma destas amostras calcular a
média amostral Xa
Qual o erro que vamos incorrer ao usar esta media
amostral para estimar a média da populacao ?
Será que podemos estabelecer um intervalo de
confiança em torno de Xa dentro do qual acreditamos
encontrar a média da populacao ?
Se adquirimos muitas amostras de tamanho ‘n’, as
médias amostrais Xa terão uma distribuição, como é esta
distribuição?
É UMA NORMAL
COM MÉDIA 
e DESVIO

 Xa 
n
Suponha que uma média amostral Xa cai dentro da área
amarela,
O número 2 é uma aproximação. Na verdade teremos
1,96: X a  1,96 X
a
Note que Xa é o desvio da distribuição das médias amostrais
Como Xa tem uma probabilidade de 0,95 de cair neste
intervalo temos que a probabilidade do intervalo
X a  1,96 X a
conter  é 0,95.
Construímos então um intervalo de confiança de 0,95
de probabilidade.
Isso quer dizer que se sortearmos um grande número de
observações, cerca 95% destas observações terão a
média verdadeira incluída dentro do intervalo de
confiança.
Um hospital decide fazer uma pesquisa para estimar o
tempo médio de internação. Portanto, o que deve ser
estimado é o tempo médio  de uma população a qual
não se pode ter acesso.
Para isso colhe-se uma amostra de tamanho 100, isso é
sorteia-se 100 pacientes entre os que já passaram pelo
hospital, e verifica-se o tempo de internação
O resultado (em dias) é:
A média amostral é Xa= 4,53 dias, com um desvio
amostral s = 3,68 dias.
Então nosso intervalo de confiança de 95% é:
X a  2 X a  4,53  1,96

100
Como não temos o desvio da população , vamos usar
o desvio amostral s, que se aproxima de  a medida
que se tem um ‘n’ grande.

s
3,68
4,53  1,96
 4,53  1,96
 4,53  1,96
100
100
100
 4,53  0,72
ou seja, nossos dados nos levam a concluir que 95% de
segurança a média de internação nesse hospital está
entre 3,81 e 5,25 dias .
Note, diretamente da formula do intervalo que a
medida que o ‘n’ cresce o intervalo diminui, ou seja
com o mesmo nível de segurança (95%) pode-se
afirmar um intervalo menor. Portanto a afirmação é
feita com mais precisão.
Este intervalo de confiança é feito para média com
variância conhecida.
Se quisermos um intervalo associado com outro valor
crítico, em um teste bicaudal:
X a  z / 2 X a
Se o teste for unicaudal:
X a  z X a
Se o desvio não for dado, teremos um teste T. Para
obter o intervalo associado, basta trocar o valor crítico
e calcular o desvio amostral:
X a  t / 2,n1s X a
Download

Teste de Hipótese e Intervalo de Confiança