Aula 5. Teste de Hipóteses II.
Capítulo 12, Bussab&Morettin β€œEstatística Básica” 7ª Edição
Procedimento teste de hipótese para
proporção. Resumo.
(1) Estabelecer as hipóteses:
H: 𝑝 = 𝑝0
contra uma das alternativas
A: 𝑝 ο‚Ή 𝑝0 , A: 𝑝 ο€Ύ 𝑝0 ou A: 𝑝 ο€Ό 𝑝0 .
(2) Escolher um nível de significância 𝜢.
(3) Determinar a região crítica RC da forma
{ 𝑋 ≀ π‘˜1 } βˆͺ { 𝑋 β‰₯ π‘˜2 }, { 𝑋 β‰₯ π‘˜ } ou { 𝑋 ≀ π‘˜ },
respectivamente às hipóteses alternativas, onde 𝑋 é
número de elementos na amostra com o atributo
desejado, 𝑋~𝐡(𝑛, 𝑝0 ).
Procedimento teste de hipótese para
proporção. Resumo.
(4) Selecionar uma amostra aleatória e determinar o
número π‘₯ de elementos na amostra com o atributo
desejado.
(5) Decidir, usando a evidência π‘₯ , ao nível de significância
𝜢, e concluir.
π‘₯ οƒŽ RC οƒž rejeitamos H.
π‘₯  RC οƒž não rejeitamos H.
Procedimento teste de hipótese para
proporção. Região crítica.
Estatística do teste é 𝑋 que é número de elementos na
amostra com o atributo desejado, a distribuição de 𝑋 é a
distribuição binomial 𝐡(𝑛, 𝑝0 ). A região crítica é determinada
em forma { 𝑋 ≀ π‘˜1 } βˆͺ { 𝑋 β‰₯ π‘˜2 }, { 𝑋 ≀ π‘˜ } ou { 𝑋 β‰₯ π‘˜ },
respectivamente às hipóteses alternativas, que depende de
nível de significância do teste 𝛼 e da estatística do teste
Procedimento teste de hipótese para
proporção. Região crítica.
Estatística do teste pode ser também a proporção
𝑋
𝑝=𝑋=
𝑛
em que 𝑋, como antes, é número de elementos na amostra
com o atributo desejado. Neste caso a região crítica é
determinada em forma
π‘˜1
π‘˜2
π‘˜
π‘˜
𝑝≀
βˆͺ 𝑝β‰₯
, 𝑝β‰₯
, 𝑝≀
𝑛
𝑛
𝑛
𝑛
respectivamente às hipóteses alternativas
Procedimento teste de hipótese para proporção.
Região crítica. Aproximação normal.
Estatística do teste pode ser também 𝑧-estatística
𝑋 βˆ’ 𝑛𝑝0
𝑍=
𝑛𝑝0 (1 βˆ’ 𝑝0 )
em que 𝑋, como antes, é número de elementos na amostra
com o atributo desejado. Neste caso a região crítica é
determinada em forma
π‘˜1 βˆ’ 𝑛𝑝0
π‘˜2 βˆ’ 𝑛𝑝0
𝑍≀
βˆͺ 𝑍β‰₯
,
𝑛𝑝0 (1 βˆ’ 𝑝0 )
𝑛𝑝0 1 βˆ’ 𝑝0
π‘˜ βˆ’ 𝑛𝑝0
π‘˜ βˆ’ 𝑛𝑝0
𝑍β‰₯
,
𝑍≀
𝑛𝑝0 (1 βˆ’ 𝑝0 )
𝑛𝑝0 (1 βˆ’ 𝑝0 )
Procedimento teste de hipótese para proporção.
Região crítica. Aproximação normal.
(1) H: 𝑝 = 𝑝0
A: 𝑝 ο€Ύ 𝑝0
(2) Escolher um nível de significância 𝜢.
𝛼 = 0.05
(3) Determinar a região crítica RC da forma
𝑋 ο‚³ π‘˜ ou 𝑍 =
π‘‹βˆ’π‘›π‘0
𝑛𝑝0 (1βˆ’π‘0 )
β‰₯
onde estatística do teste
𝑋 βˆ’ 𝑛𝑝0
𝑍=
𝑛𝑝0 (1 βˆ’ 𝑝0 )
π‘˜βˆ’π‘›π‘0
𝑛𝑝0 1βˆ’π‘0
β‰ˆ 𝑁(0,1)
= 𝑧𝑐
Procedimento teste de hipótese para proporção.
Região crítica. Aproximação normal.
(3) Determinar a região crítica RC da forma
𝑍 β‰₯ 𝑧𝑐
onde estatística do teste
𝑍~𝑁(0,1)
Achamos 𝑧𝑐 pela tabela da distribuição normal
𝑃 𝑍 β‰₯ 𝑧𝑐 = 𝛼
(4) Selecionar uma amostra aleatória e determinar o
número π‘₯ de elementos na amostra com o atributo
desejado.
Procedimento teste de hipótese para proporção.
Região crítica. Aproximação normal.
(4) Calcular o valor observado da estatística do teste
π‘₯ βˆ’ 𝑛𝑝0
π‘§π‘œπ‘π‘  =
𝑛𝑝0 (1 βˆ’ 𝑝0 )
(5) Decidir, usando a evidência π‘§π‘œπ‘π‘  :
π‘§π‘œπ‘π‘  > 𝑧𝑐 οƒž rejeitamos H.
π‘§π‘œπ‘π‘  < 𝑧𝑐 οƒž não rejeitamos H.
Procedimento teste de hipótese para
proporção. Aproximação normal.
Exemplo: A proporção de analfabetos em um município
era de 15% na gestão anterior.
No início da sua gestão, o prefeito atual implantou um
programa de alfabetização e após 2 anos afirma que
reduziu a proporção de analfabetos.
Para verificar a afirmação do prefeito, n = 200 cidadãos
foram entrevistados.
Procedimento teste de hipótese para
proporção. Aproximação normal.
Seja 𝑋 o número de analfabetos entre os 200 cidadãos
entrevistados e 𝑋~𝐡 200; 𝑝 , sendo 𝑝 a proporção atual de
analfabetos no município (após o programa de alfabetização).
(1) Estabelecer as hipóteses:
H: 𝑝 = 0.15
contra alternativa
A: 𝑝 ο€Ό 0.15.
H: A proporção de analfabetos no município não se alterou
(a afirmação do prefeito está incorreta).
A: A proporção de analfabetos no município diminuiu
(a afirmação do prefeito está correta).
Procedimento teste de hipótese para
proporção. Aproximação normal.
(2) Escolher um nível de significância 𝛼.
𝛼 = 0.05
(3) Determinar a região crítica RC da forma
𝑍 < 𝑧𝑐
onde achamos 𝑧𝑐 pela tabela da distribuição normal
𝑃 𝑍 < 𝑧𝑐 = 𝛼
1 βˆ’ 𝐴 βˆ’π‘§π‘ = 𝛼 β‡’ 𝐴 βˆ’π‘§π‘ = 1 βˆ’ 𝛼 = 0.95
𝑧𝑐 = βˆ’1.64
Então, a região crítica RC é
𝑍 < βˆ’1.64
Procedimento teste de hipótese para
proporção. Aproximação normal.
(4) Buscar a evidência na amostra para concluir.
Se observamos 20 analfabetos entre os 200
entrevistados, qual a conclusão?
Calculemos a estatística do teste
π‘§π‘œπ‘π‘  =
20 βˆ’ 200 βˆ™ 0.15
200 βˆ™ 0.15 βˆ™ 0.85
β‰… βˆ’1.98
Procedimento teste de hipótese para
proporção. Aproximação normal.
(5) Decisão e conclusão:
π‘§π‘œπ‘π‘  = βˆ’1.98 < βˆ’1.64 = 𝑧𝑐 β‡’ π‘§π‘œπ‘π‘  ∈ 𝑅𝐢
decidimos por rejeitar a hipótese nula ao nível de
significância de 5%.
Concluímos que temos evidência suficiente para afirmar
que a proporção de analfabetos (após o programa de
alfabetização) é inferior a 15%, isto é, há evidência
suficiente de que a afirmação do prefeito seja correta.
Procedimento teste de hipótese para média
populacional.
amostra
população
normal
𝑋𝑖 ~𝑁(πœ‡, 𝜎 2 )
𝑋1 , 𝑋2 , … , 𝑋𝑛 : são
independentes e
𝑋𝑖 ~𝑁(πœ‡, 𝜎 2 )
𝑋1 , 𝑋2 , … , 𝑋𝑛
( x )2
f ( x) ο€½
e
2 2
2 2
Procedimento teste de hipótese para média
populacional.
Nosso objetivo agora é apresentar procedimentos
estatísticos simples para verificar se um conjunto de dados
amostrais dá ou não suporte à uma conjectura sobre o
valor médio πœ‡ (desconhecido) de uma característica de
interesse, observável em β€œindivíduos” de uma população
(normal).
Mais precisamente, procedimentos para testar hipóteses
sobre πœ‡, tomando como base o valor médio 𝑋 dessa
característica, observado em uma amostra casual simples
de tamanho 𝑛 desses β€œindivíduos”.
Procedimento teste de hipótese para média
populacional.
Exemplo:
Em períodos de pico, os clientes de um banco são obrigados a
enfrentar longas filas para sacar dinheiro nos caixas
eletrônicos. Dados históricos de vários anos de operação
indicam que o tempo de transação nesses caixas tem
distribuição normal com média igual a 270 segundos.
Para aliviar essa situação o banco resolve instalar, em caráter
experimental, alguns caixas eletrônicos de concepção mais
avançada. Após o período de experiência, o banco pretende
examinar o tempo médio obtido em uma amostra casual
simples das transações realizadas nesses caixas.
Procedimento teste de hipótese para média
populacional.
As etapas a serem cumpridas para este teste de hipóteses
são as mesmas que vimos anteriormente.
(1) Formular as hipóteses nula H e a alternativa A
Hipótese Nula : afirmação ou conjectura sobre πœ‡ contra a qual
estaremos buscando evidência nos dados amostrais.
Hipótese Alternativa : afirmação ou conjectura sobre πœ‡ que
suspeitamos (ou esperamos) ser verdadeira.
H: πœ‡ = πœ‡0 contra uma das alternativas
H: πœ‡ = 270 seg.
A: πœ‡ β‰  πœ‡0 , A: πœ‡ < πœ‡0 ou A: πœ‡ > πœ‡0
A: πœ‡ < 270 seg.
Procedimento teste de hipótese para média
populacional.
(2) Fixar o nível de significância 𝛼 do teste. Seja 𝛼 = 5%.
(3) Determinar a região crítica RC da forma
𝑍 < βˆ’π‘§π‘ βˆͺ 𝑍 > 𝑧𝑐 , 𝑍 > 𝑧𝑐 ou 𝑍 < βˆ’π‘§π‘
ou
𝑇 < βˆ’π‘‘π‘ βˆͺ 𝑇 > 𝑑𝑐 , 𝑇 > 𝑑𝑐 ou 𝑇 < βˆ’π‘‘π‘
respectivamente às hipóteses alternativas
Procedimento teste de hipótese para média
populacional.
A estatística do teste 𝑍 ou 𝑇 vai ser definida dependendo do
conhecimento de variância populacional 𝜎 2 como
𝑍=
π‘‹βˆ’πœ‡0
𝜎
𝑛 ~ 𝑁 0,1
caso 𝜎 2 é conhecida, e
𝑇=
π‘‹βˆ’πœ‡0
𝑠
𝑛 ~ π‘‘π‘›βˆ’1
caso 𝜎 2 é desconhecida
Valores 𝑧𝑐 e 𝑑𝑐 são definidos pelas hipóteses e 𝛼:
𝑃 𝑍 < βˆ’π‘§π‘ βˆͺ 𝑍 > 𝑧𝑐 = 𝑃 𝑍 > 𝑧𝑐 = 𝛼,
𝑃 𝑍 > 𝑧𝑐 = 𝛼 ou 𝑃 𝑍 < βˆ’π‘§π‘ = 𝛼 usando tabela normal
𝑃 𝑇 < βˆ’π‘‘π‘ βˆͺ 𝑇 > 𝑑𝑐
ou
= 𝑃 𝑇 > 𝑑𝑐 = 𝛼,
𝑃 𝑇 > 𝑑𝑐 = 𝛼 ou 𝑃 𝑇 < βˆ’π‘‘π‘ = 𝛼 usando tabela T-Student
Procedimento teste de hipótese para média
populacional.
No exemplo supomos não que sabemos variância populacional
𝜎 2 então usaremos a estatística do teste
𝑋 βˆ’ πœ‡0
𝑇=
𝑛 ~ π‘‘π‘›βˆ’1
𝑆
Para aliviar essa situação o banco resolve instalar, em caráter
experimental, alguns caixas eletrônicos de concepção mais
avançada. Após o período de experiência, o banco pretende
examinar o tempo médio obtido em uma amostra casual
simples das 24 transações realizadas nesses caixas.
Achamos 𝑑𝑐 de condição 𝑃 𝑇 < βˆ’π‘‘π‘ = 0.05
𝑃 𝑇 < βˆ’1.714 = 0.05
RC= 𝑇 < βˆ’1.714
Procedimento teste de hipótese para média
populacional.
(4) Buscar a evidência na amostra para concluir:
Para aliviar essa situação o banco resolve instalar, em caráter
experimental, alguns caixas eletrônicos de concepção mais
avançada. Após o período de experiência, o banco pretende
examinar o tempo médio obtido em uma amostra casual
simples das 24 transações realizadas nesses caixas.
Amostra de 24 trasações oferece seguintes dados:
π‘₯ = 262.3,
𝑠 = 21.4
Valor observado da estatística do teste é
π‘₯ βˆ’ πœ‡0
262.3 βˆ’ 270
π‘‘π‘œπ‘π‘  =
𝑛=
24 β‰… βˆ’1.76
𝑠
21.4
Procedimento teste de hipótese para média
populacional.
(5) Decisão e conclusão:
π‘‘π‘œπ‘π‘  = βˆ’1.76 < βˆ’1.71 = 𝑑𝑐 β‡’ π‘§π‘œπ‘π‘  ∈ 𝑅𝐢
decidimos por rejeitar a hipótese nula ao nível de
significância de 5%.
Concluímos que temos evidência suficiente para afirmar que a
média de transição diminuiu nas novos caixas eletrônicos
Exemplo: Um industrial afirma que seu processo de fabricação
produz 90% de peças dentro das especificações. O IPEM deseja
investigar se esse processo de fabricação está sob controle.
Seja 𝑝 a proporção de peças produzidas dentro das
especificações.
As hipóteses de interesse são:
H: 𝑝 = 0.9
A: 𝑝 < 0.9
Ou seja, queremos testar
H: O processo está sob controle.
A: O processo não está sob controle.
Nível descritivo. Introdução.
Selecionamos uma amostra aleatória de 15 itens
e observamos o número 𝑋 de itens satisfatórios.
Então: 𝑋~𝐡(15, 𝑝)
Região crítica: RC= { X ο‚£ k }
Para 𝛼 = 6% temos π‘˜ = 11 e RC= 𝑋 ≀ 11
Para 𝛼 = 1% temos π‘˜ = 9 e RC= 𝑋 ≀ 9
Nível descritivo. Introdução.
Se observamos x = 10 peças satisfatórias, então:
a) 𝛼 = 6% οƒž 10 οƒŽ RC
Rejeitamos H ao nível de significância de 6%.
b) 𝛼 = 1% οƒž 10  RC
Não rejeitamos H ao nível de significância de 1%.
Crítica: Arbitrariedade na escolha da RC
(ou do nível de significância).
Sugestão: Determinar o nível de significância
associado à evidência experimental, que é
denominado nível descritivo ou p-valor.
Nível descritivo. P-valor.
No exemplo, a região crítica é da forma RC = 𝑋 ≀ π‘˜ .
Para π‘₯π‘œπ‘π‘  = 10,o nível descritivo ou valor 𝑃 é calculado por:
𝑝 = 𝑃 𝑋 ≀ 10 | 𝑝 = 0.9 = 0.0127
O valor 𝑃 é igual à probabilidade de ocorrerem valores de 𝑋
tão ou mais desfavoráveis para a hipótese nula 𝐻 do que o
valor observado π‘₯π‘œπ‘π‘  = 10.
Assim, se o processo estivesse sob controle, a probabilidade de
encontrarmos uma amostra de 15 peças com 10 ou menos
peças satisfatórias é de apenas 1%.
Isso sugere que a hipótese nula 𝐻 deve ser rejeitada.
Nível descritivo. P-valor.
Se o valor 𝑃
é β€œpequeno”, então é pouco provável
observarmos valores iguais ou mais extremos que o da
amostra, supondo a hipótese nula 𝐻 verdadeira.
Assim, há indícios de que a hipótese nula não seja verdadeira e
tendemos a rejeitá-la.
Por outro lado, para valores β€œnão tão pequenos” de 𝑃, não fica
evidente que a hipótese nula 𝐻 seja falsa, portanto tendemos a
não rejeitá-la.
Assim,
P β€œpequeno” οƒž rejeitamos H
P β€œnão pequeno” οƒž não rejeitamos H
Quão β€œpequeno” deve ser o valor de P para
rejeitarmos H ?
Nível descritivo. P-valor.
Lembrando que a ideia inicial de 𝑃 era considerar um nível de
significância associado à evidência amostral, podemos
compará-lo a um nível de significância 𝛼 fixado, de modo
que:
𝑃 ≀ 𝛼 οƒž rejeitamos 𝐻
𝑃 > 𝛼 οƒž não rejeitamos 𝐻
P
P

rejeitamos H
não rejeitamos H
Se 𝑃 ≀ 𝛼 , dizemos que a amostra forneceu evidência
suficiente para rejeitar a hipótese nula 𝐻.
No exemplo: P = 0,0127.
Adotando  = 0,05, temos que P < , portanto
rejeitamos H ao nível de significância 5%.
Assim, o processo não está sob controle.
Observações:
β€’ Quanto menor o valor P, maior é a evidência
contra a hipótese nula H contida nos dados.
β€’ Quando a hipótese nula é rejeitada para um nível
de significância  fixado, dizemos também que
a amostra é significante ao nível de significância .
31
Download

Aula 5 Teste de Hipoteses II versao preliminar