ANÁLISE ESTATÍSTICA II
1
TESTES DE HIPÓTESES
Case Oxford Cereals
A Oxford Cereals abastece milhares de caixas de cereais
durante um turno de oito horas. Como gerente de operações da
unidade de produção, você é responsável por monitorar a
quantidade de cereal colocada em cada caixa.
Para ser coerente com o conteúdo especificado na
embalagem, as caixas devem conter, em média, 368 gramas de
cereal. Se o processo de abastecimento não estiver funcionando de
maneira apropriada, o peso médio das caixas pode se desviar
demasiadamente do peso especificado no rótulo e toda a produção
se torna inaceitável.
Uma vez que a pesagem de cada caixa individual consome
uma quantidade demasiadamente grande de tempo, é dispendiosa e
ineficiente, você decidiu extrair uma amostra de caixas.
ANÁLISE ESTATÍSTICA II
2
TESTES DE HIPÓTESES
O teste de hipótese se inicia com algum tipo de teoria sobre
um determinado parâmetro de uma população.
Por exemplo, a hipótese inicial no exemplo anterior é de que o
processo está operando adequadamente, de modo tal que a
média aritmética do peso abastecido corresponde a 368 g, e
não é necessária nenhuma ação corretiva.
ANÁLISE ESTATÍSTICA II
3
TESTES DE HIPÓTESES
A hipótese de que o parâmetro da população é igual à
especificação da empresa é chamada de hipótese nula, Ho.
No exemplo, a hipótese nula é de que o processo de
abastecimento
está
operando
adequadamente,
e,
consequentemente, a média aritmética da quantidade
abastecida é igual à especificação apresentada pela Oxford
Cereals. Isso é declarado como:
Ho: μ = 368
ANÁLISE ESTATÍSTICA II
4
TESTES DE HIPÓTESES
Sempre que uma hipótese nula é enunciada, uma hipótese
alternativa (H1) é também especificada e ela é verdadeira
sempre que a hipótese nula é falsa.
A hipótese alternativa é o oposto da hipótese nula.
No exemplo anterior:
H1: μ ≠ 368
ANÁLISE ESTATÍSTICA II
5
TESTES DE HIPÓTESES
A hipótese nula é rejeitada sempre que houver evidências, a
partir dos dados extraídos da amostra, que a hipótese nula é
falsa.
No exemplo, a hipótese alternativa é verdadeira caso os pesos
das caixas selecionadas para fins de amostra estejam acima
ou abaixo da média aritmética esperada.
ANÁLISE ESTATÍSTICA II
6
TESTES DE HIPÓTESES
Caso a hipótese nula seja rejeitada, deve-se interromper a
produção e adotar a ação necessária para corrigir o problema.
Caso a hipótese nula seja aceita, deve-se continuar a
produção, e nenhuma ação corretiva é necessária. Neste caso,
não se prova que o processo esteja operando corretamente, e
sim não se conseguiu provar que ele esteja operando
incorretamente.
ANÁLISE ESTATÍSTICA II
7
TESTES DE HIPÓTESES
Resumo
1. Ho é aquilo que se acredita no momento, em relação a uma
situação.
2. H1 é o oposto da hipótese nula. Deve ser investigada.
ANÁLISE ESTATÍSTICA II
8
TESTES DE HIPÓTESES
A metodologia do teste de hipóteses diz respeito a determinar
qual é a possibilidade de que a hipótese nula seja verdadeira,
ao se considerar as informações coletadas em uma amostra.
Se no cenário da Oxford Cereal Company, você seleciona uma
amostra e a média dela é próxima do valor da média da
população, não há evidências para se rejeitar a hipótese nula.
ANÁLISE ESTATÍSTICA II
9
TESTES DE HIPÓTESES
Não obstante, se há uma grande diferença entre as médias da
amostra e da população, podemos concluir que a hipótese nula
é falsa.
O processo de decisão não é tão simples.
ANÁLISE ESTATÍSTICA II
10
TESTES DE HIPÓTESES
A distribuição de amostragens da estatística do teste está
dividida em duas regiões, uma região de rejeição, também
conhecida como região crítica, e uma região de não rejeição.
ANÁLISE ESTATÍSTICA II
11
TESTES DE HIPÓTESES
Caso a estatística do teste se posicione dentro da região de
não rejeição, não rejeitamos a hipótese nula.
No caso da Oxford Cereals, não existem evidências suficientes
de que a média aritmética da população correspondente à
quantidade abastecida seja diferente de 368.
Caso a estatística do teste se posicione na região de rejeição,
rejeitamos a hipótese nula.
ANÁLISE ESTATÍSTICA II
12
TESTES DE HIPÓTESES
Para tomarmos uma decisão com relação à hipótese nula,
primeiramente devemos determinar o valor crítico para a
estatística do teste.
A determinação do valor crítico depende do tamanho da região
de rejeição.
O tamanho da região de rejeição está diretamente relacionado
aos riscos envolvidos na utilização somente de evidências
decorrentes de amostras para tomar decisões sobre um
parâmetro da população.
ANÁLISE ESTATÍSTICA II
13
TESTES DE HIPÓTESES
Existem 2 tipos de erros que podem ser cometidos ao se
aplicar a metodologia para testes de hipóteses: erro do Tipo I e
o erro do Tipo II.
Erro do Tipo I ocorre se rejeitamos a hipótese nula, quando ela
é verdadeira. A probabilidade de ocorrência deste erro é
representada por α.
Erro do Tipo II ocorre se não rejeitamos a hipótese nula,
quando ela é falsa. A probabilidade de ocorrência deste erro é
representada por β.
ANÁLISE ESTATÍSTICA II
14
TESTES DE HIPÓTESES
Um erro do Tipo I é um “falso alarme”.
Um erro do Tipo II representa uma “oportunidade perdida”.
A probabilidade de vir a cometer um erro do Tipo I é
identificada como o nível de significância do teste estatístico.
ANÁLISE ESTATÍSTICA II
15
TESTES DE HIPÓTESES
Controlamos o erro do Tipo I, quando decidimos sobre o nível
de risco, α, que estamos dispostos a correr ao rejeitar a
hipótese nula quando ela é verdadeira.
Especificamos o nível de significância antes do teste de
hipótese ser realizado.
Os níveis mais utilizados são 0,01, 0,05 e 0,10.
ANÁLISE ESTATÍSTICA II
16
TESTES DE HIPÓTESES
A opção por um nível está diretamente ligado ao custo inerente
a cometer um erro do Tipo I.
Depois que especificamos o valor para α, podemos então
determinar os valores críticos.
Dessa forma conheceremos o tamanho da região de rejeição
tendo em vista que α representa a probabilidade de rejeição
quando a hipótese nula é verdadeira.
ANÁLISE ESTATÍSTICA II
17
TESTES DE HIPÓTESES
O complemento da probabilidade de um erro do Tipo I (1 – α),
é conhecido como coeficiente de confiança.
O coeficiente de confiança corresponde à probabilidade de que
se venha a não rejeitar a hipótese nula, quando ela é
efetivamente verdadeira e não deve ser rejeitada.
O nível de confiança de um teste de hipótese é representado
por (1 – α) x 100%
ANÁLISE ESTATÍSTICA II
18
TESTES DE HIPÓTESES
No cenário da Oxford Cereals, o coeficiente de confiança mede
a probabilidade de que se conclua que a média aritmética da
população da quantidade abastecida é igual a 368 g, quando
de fato ela é de 368 g.
A probabilidade de cometer um erro do Tipo II depende da
diferença entre o valor identificado na hipótese e o verdadeiro
valor do parâmetro da população.
ANÁLISE ESTATÍSTICA II
19
TESTES DE HIPÓTESES
Haja vista que grandes diferenças são mais fáceis de ser
encontradas do que pequenas diferenças, caso a diferença
entre o valor identificado na hipótese e o verdadeiro valor para
o parâmetro da população seja grande, β será pequeno.
Por exemplo, se a média aritmética da população é igual a 330
g, existe uma pequena chance (β) de que venhamos a concluir
que a média aritmética não se modificou em relação a 368.
ANÁLISE ESTATÍSTICA II
20
TESTES DE HIPÓTESES
Caso a diferença entre o valor identificado na hipótese e o
verdadeiro valor para o parâmetro seja pequena, β será
grande.
Por exemplo, no caso de a média aritmética da população ser
verdadeiramente igual a 367 g, existe uma chance
considerável β de que venhamos a concluir que a média
aritmética permanece ainda igual a 368 g.
ANÁLISE ESTATÍSTICA II
21
TESTES DE HIPÓTESES
A eficácia de um teste estatístico é conhecida quando
determinamos o complemento da probabilidade de um erro do
Tipo II, isto é, 1 – β, isto é, quando se rejeita a hipótese nula,
sendo ela falsa e devendo, efetivamente, ser rejeitada.
No exemplo, a eficácia do teste corresponde à probabilidade
de que se conclua que a média aritmética da quantidade
abastecida não é igual a 368 g, quando ela efetivamente não é
igual a 368 g.
ANÁLISE ESTATÍSTICA II
22
TESTES DE HIPÓTESES
Riscos na tomada de decisão
SITUAÇÃO REAL
DECISÃO ESTATÍSTICA
Ho Verdadeira
Ho Falsa
Não rejeitar Ho
Decisão correta
Confiança = 1 - α
Erro do Tipo II
P (erro do Tipo II) = β
Rejeitar Ho
Erro do Tipo I
P(erro do Tipo I) = α
Decisão correta
Eficácia = 1 - β
ANÁLISE ESTATÍSTICA II
23
TESTES DE HIPÓTESES
Como forma de reduzir a probabilidade de erro do Tipo II,
consiste no aumento do tamanho da amostra, tendo em vista
que amostras com tamanhos maiores, permitem que se
detecte diferenças, mesmo que pequenas, entre os valores
apresentados na hipótese e os parâmetros da população.
Para um α determinado, o aumento do tamanho da amostra faz
com que β diminua, e consequentemente, cresça a eficácia do
teste para detectar que a hipótese nula é falsa.
ANÁLISE ESTATÍSTICA II
24
TESTES DE HIPÓTESES
O erro do Tipo I, é um erro que pode ser diretamente
controlado, para a redução desse risco, seleciona-se um valor
menor para α.
Por exemplo pode-se reduzir α = 0,05 para α = 0,01, porém
quando se diminui α, β cresce, ou seja, a redução do risco do
Tipo I resulta em um maior risco de um erro do Tipo II.
De outra forma, quando se quer diminuir β, basta selecionar
um valor mais alto para α.
ANÁLISE ESTATÍSTICA II
25
TESTES DE HIPÓTESES
No exemplo da Oxford Cereals, o risco de ocorrência de um
erro do Tipo I, significa que a média se modificou em relação
aos 368 g identificados na hipótese, quando na verdade ela
não se modificou.
O risco de ocorrência de um erro do Tipo II, significa que a
média se não se modificou em relação aos 368 g identificados
na hipótese, quando na verdade ela se modificou.
ANÁLISE ESTATÍSTICA II
26
TESTES DE HIPÓTESES
A escolha de α e β, depende dos custos que cada escolha irá
trazer.
No exemplo, se for muito caro alterar o processo de
abastecimento de cereais, deve-se estar muito certo de se
fazer uma alteração antes de executá-la, ou seja, o risco de se
cometer um erro do Tipo I é mais importante, e deve-se optar
por um α pequeno.
ANÁLISE ESTATÍSTICA II
27
TESTES DE HIPÓTESES
Caso contrário, se houver uma confiança alta de se detectar
variações em relação à média de 368 g, o risco de se cometer
um erro do Tipo II é mais importante, e deve-se optar por um α
maior.
Quando o desvio padrão da população σ, é conhecido, utilizase o teste Z para a média aritmética se a população for
distribuída nos moldes da distribuição normal.
ANÁLISE ESTATÍSTICA II
28
TESTES DE HIPÓTESES
Teste Z para a média aritmética com σ conhecido.
ZESTAT
X−μ
= σ
n
A equação representa a diferença da média aritmética da
amostra e a média aritmética da hipótese em termos de
unidades de erro padrão.
ANÁLISE ESTATÍSTICA II
29
TESTES DE HIPÓTESES
Por exemplo, se α = 0,05, os valores críticos são – 1,96 e
1,96.
+
Para o exemplo da Oxford Cereals, valores de ZESTAST maiores que +
1,96 ou menores que – 1,96, indicam que X é suficientemente
diferente de 368 g, declarado na hipótese.
Rejeitar Ho se ZESTAST > +1,96 ou ZESTAST < – 1,96
Caso contrário, não rejeitar Ho
ANÁLISE ESTATÍSTICA II
30
TESTES DE HIPÓTESES
Se, por exemplo, a amostra de 25 caixas apresentar uma
média aritmética igual a 372,5 g e o desvio-padrão da
população for igual a 15 g, então:
ZESTAT
X−μ
372,5 − 368
= σ =
= + 1,50
15
n
25
ANÁLISE ESTATÍSTICA II
31
TESTES DE HIPÓTESES
Já que ZESTAT = + 1,50 e portanto está entre – 1,96 e + 1,96
não rejeitamos a hipótese nula, Ho.
Continuamos a acreditar que a média aritmética da quantidade
abastecida é de 368 g.
Devemos anunciar que “existem evidências insuficientes de
que a média aritmética da quantidade abastecida seja diferente
de 368 g”, para levarmos em consideração a possibilidade de
um erro do Tipo II.
ANÁLISE ESTATÍSTICA II
32
TESTES DE HIPÓTESES
Resumo:
1) Declare a hipótese nula Ho e a hipótese alternativa H1;
2) Escolha o risco α e o tamanho da amostra n;
3) Determine a estatística apropriada do teste e a distribuição
de amostragens;
4) Determine os valores críticos;
5) Calcule o valor da estatística do teste;
6) Tome a decisão estatística e expresse a conclusão
gerencial.
ANÁLISE ESTATÍSTICA II
33
TESTES DE HIPÓTESES
1) Você é o gerente de uma lanchonete, e quer determinar se a
média aritmética da população correspondente ao tempo de espera
para que um pedido seja atendido se modificou, no mês anterior, em
relação a seu valor anterior de 4,5 minutos. Com base em
experiências passadas, você consegue pressupor que a população é
distribuída nos moldes da distribuição normal, com um desviopadrão de 1,2 minutos para a população. Você seleciona uma
amostra de 25 pedidos durante o período de 1 hora. A média
aritmética da amostra é 5,1 minutos. Utilize a abordagem das seis
etapas, para determinar se existem evidências, no nível de
significância de 0,05, de que a média aritmética da população do
tempo de espera para o atendimento de um pedido se modificou, no
mês passado, em relação a seu valor anterior para a média
aritmética da população, que era de 4,5 minutos.
ANÁLISE ESTATÍSTICA II
34
TESTES DE HIPÓTESES
Ho: μ = 4,5
H1: μ ≠ 4,5
Etapa 2:
n = 25 e α = 0,05
Etapa 3:
Como σ conhecido, distribuição normal e a
estatística do teste ZESTAT
Etapa 4:
Valores críticos ± 1,96
Etapa 1:
Etapa 5:
ZESTAT =
5,1 −4,5
1,2
25
= +2,50
Etapa 6:
Como ZESTAT = + 2,50 > + 1,96, rejeita-se a hipótese
nula, isto é, existem evidências de que a média aritmética da
população para o tempo de espera de atendimento de um pedido se
modificou em relação a seu valor anterior de 4,5 minutos.
ANÁLISE ESTATÍSTICA II
35
TESTES DE HIPÓTESES
2) Se você utilizar um nível de significância de 0,05 em um
teste de hipótese, o que você decide, caso o valor calculado da
estatísticas do teste for:
a) ZESTAT = – 0,75
b) ZESTAT = + 2,22
ANÁLISE ESTATÍSTICA II
36
TESTES DE HIPÓTESES
3) Se você utilizar um nível de significância de 0,10 em um
teste de hipótese, qual seria a sua regra de decisão para
rejeitar uma hipótese nula de que a média aritmética da
população é igual a 500 se você estivesse utilizando o teste Z?
Download

Teste de hipósteses - Professor Ubiratan