ANÁLISE ESTATÍSTICA II 1 TESTES DE HIPÓTESES Case Oxford Cereals A Oxford Cereals abastece milhares de caixas de cereais durante um turno de oito horas. Como gerente de operações da unidade de produção, você é responsável por monitorar a quantidade de cereal colocada em cada caixa. Para ser coerente com o conteúdo especificado na embalagem, as caixas devem conter, em média, 368 gramas de cereal. Se o processo de abastecimento não estiver funcionando de maneira apropriada, o peso médio das caixas pode se desviar demasiadamente do peso especificado no rótulo e toda a produção se torna inaceitável. Uma vez que a pesagem de cada caixa individual consome uma quantidade demasiadamente grande de tempo, é dispendiosa e ineficiente, você decidiu extrair uma amostra de caixas. ANÁLISE ESTATÍSTICA II 2 TESTES DE HIPÓTESES O teste de hipótese se inicia com algum tipo de teoria sobre um determinado parâmetro de uma população. Por exemplo, a hipótese inicial no exemplo anterior é de que o processo está operando adequadamente, de modo tal que a média aritmética do peso abastecido corresponde a 368 g, e não é necessária nenhuma ação corretiva. ANÁLISE ESTATÍSTICA II 3 TESTES DE HIPÓTESES A hipótese de que o parâmetro da população é igual à especificação da empresa é chamada de hipótese nula, Ho. No exemplo, a hipótese nula é de que o processo de abastecimento está operando adequadamente, e, consequentemente, a média aritmética da quantidade abastecida é igual à especificação apresentada pela Oxford Cereals. Isso é declarado como: Ho: μ = 368 ANÁLISE ESTATÍSTICA II 4 TESTES DE HIPÓTESES Sempre que uma hipótese nula é enunciada, uma hipótese alternativa (H1) é também especificada e ela é verdadeira sempre que a hipótese nula é falsa. A hipótese alternativa é o oposto da hipótese nula. No exemplo anterior: H1: μ ≠ 368 ANÁLISE ESTATÍSTICA II 5 TESTES DE HIPÓTESES A hipótese nula é rejeitada sempre que houver evidências, a partir dos dados extraídos da amostra, que a hipótese nula é falsa. No exemplo, a hipótese alternativa é verdadeira caso os pesos das caixas selecionadas para fins de amostra estejam acima ou abaixo da média aritmética esperada. ANÁLISE ESTATÍSTICA II 6 TESTES DE HIPÓTESES Caso a hipótese nula seja rejeitada, deve-se interromper a produção e adotar a ação necessária para corrigir o problema. Caso a hipótese nula seja aceita, deve-se continuar a produção, e nenhuma ação corretiva é necessária. Neste caso, não se prova que o processo esteja operando corretamente, e sim não se conseguiu provar que ele esteja operando incorretamente. ANÁLISE ESTATÍSTICA II 7 TESTES DE HIPÓTESES Resumo 1. Ho é aquilo que se acredita no momento, em relação a uma situação. 2. H1 é o oposto da hipótese nula. Deve ser investigada. ANÁLISE ESTATÍSTICA II 8 TESTES DE HIPÓTESES A metodologia do teste de hipóteses diz respeito a determinar qual é a possibilidade de que a hipótese nula seja verdadeira, ao se considerar as informações coletadas em uma amostra. Se no cenário da Oxford Cereal Company, você seleciona uma amostra e a média dela é próxima do valor da média da população, não há evidências para se rejeitar a hipótese nula. ANÁLISE ESTATÍSTICA II 9 TESTES DE HIPÓTESES Não obstante, se há uma grande diferença entre as médias da amostra e da população, podemos concluir que a hipótese nula é falsa. O processo de decisão não é tão simples. ANÁLISE ESTATÍSTICA II 10 TESTES DE HIPÓTESES A distribuição de amostragens da estatística do teste está dividida em duas regiões, uma região de rejeição, também conhecida como região crítica, e uma região de não rejeição. ANÁLISE ESTATÍSTICA II 11 TESTES DE HIPÓTESES Caso a estatística do teste se posicione dentro da região de não rejeição, não rejeitamos a hipótese nula. No caso da Oxford Cereals, não existem evidências suficientes de que a média aritmética da população correspondente à quantidade abastecida seja diferente de 368. Caso a estatística do teste se posicione na região de rejeição, rejeitamos a hipótese nula. ANÁLISE ESTATÍSTICA II 12 TESTES DE HIPÓTESES Para tomarmos uma decisão com relação à hipótese nula, primeiramente devemos determinar o valor crítico para a estatística do teste. A determinação do valor crítico depende do tamanho da região de rejeição. O tamanho da região de rejeição está diretamente relacionado aos riscos envolvidos na utilização somente de evidências decorrentes de amostras para tomar decisões sobre um parâmetro da população. ANÁLISE ESTATÍSTICA II 13 TESTES DE HIPÓTESES Existem 2 tipos de erros que podem ser cometidos ao se aplicar a metodologia para testes de hipóteses: erro do Tipo I e o erro do Tipo II. Erro do Tipo I ocorre se rejeitamos a hipótese nula, quando ela é verdadeira. A probabilidade de ocorrência deste erro é representada por α. Erro do Tipo II ocorre se não rejeitamos a hipótese nula, quando ela é falsa. A probabilidade de ocorrência deste erro é representada por β. ANÁLISE ESTATÍSTICA II 14 TESTES DE HIPÓTESES Um erro do Tipo I é um “falso alarme”. Um erro do Tipo II representa uma “oportunidade perdida”. A probabilidade de vir a cometer um erro do Tipo I é identificada como o nível de significância do teste estatístico. ANÁLISE ESTATÍSTICA II 15 TESTES DE HIPÓTESES Controlamos o erro do Tipo I, quando decidimos sobre o nível de risco, α, que estamos dispostos a correr ao rejeitar a hipótese nula quando ela é verdadeira. Especificamos o nível de significância antes do teste de hipótese ser realizado. Os níveis mais utilizados são 0,01, 0,05 e 0,10. ANÁLISE ESTATÍSTICA II 16 TESTES DE HIPÓTESES A opção por um nível está diretamente ligado ao custo inerente a cometer um erro do Tipo I. Depois que especificamos o valor para α, podemos então determinar os valores críticos. Dessa forma conheceremos o tamanho da região de rejeição tendo em vista que α representa a probabilidade de rejeição quando a hipótese nula é verdadeira. ANÁLISE ESTATÍSTICA II 17 TESTES DE HIPÓTESES O complemento da probabilidade de um erro do Tipo I (1 – α), é conhecido como coeficiente de confiança. O coeficiente de confiança corresponde à probabilidade de que se venha a não rejeitar a hipótese nula, quando ela é efetivamente verdadeira e não deve ser rejeitada. O nível de confiança de um teste de hipótese é representado por (1 – α) x 100% ANÁLISE ESTATÍSTICA II 18 TESTES DE HIPÓTESES No cenário da Oxford Cereals, o coeficiente de confiança mede a probabilidade de que se conclua que a média aritmética da população da quantidade abastecida é igual a 368 g, quando de fato ela é de 368 g. A probabilidade de cometer um erro do Tipo II depende da diferença entre o valor identificado na hipótese e o verdadeiro valor do parâmetro da população. ANÁLISE ESTATÍSTICA II 19 TESTES DE HIPÓTESES Haja vista que grandes diferenças são mais fáceis de ser encontradas do que pequenas diferenças, caso a diferença entre o valor identificado na hipótese e o verdadeiro valor para o parâmetro da população seja grande, β será pequeno. Por exemplo, se a média aritmética da população é igual a 330 g, existe uma pequena chance (β) de que venhamos a concluir que a média aritmética não se modificou em relação a 368. ANÁLISE ESTATÍSTICA II 20 TESTES DE HIPÓTESES Caso a diferença entre o valor identificado na hipótese e o verdadeiro valor para o parâmetro seja pequena, β será grande. Por exemplo, no caso de a média aritmética da população ser verdadeiramente igual a 367 g, existe uma chance considerável β de que venhamos a concluir que a média aritmética permanece ainda igual a 368 g. ANÁLISE ESTATÍSTICA II 21 TESTES DE HIPÓTESES A eficácia de um teste estatístico é conhecida quando determinamos o complemento da probabilidade de um erro do Tipo II, isto é, 1 – β, isto é, quando se rejeita a hipótese nula, sendo ela falsa e devendo, efetivamente, ser rejeitada. No exemplo, a eficácia do teste corresponde à probabilidade de que se conclua que a média aritmética da quantidade abastecida não é igual a 368 g, quando ela efetivamente não é igual a 368 g. ANÁLISE ESTATÍSTICA II 22 TESTES DE HIPÓTESES Riscos na tomada de decisão SITUAÇÃO REAL DECISÃO ESTATÍSTICA Ho Verdadeira Ho Falsa Não rejeitar Ho Decisão correta Confiança = 1 - α Erro do Tipo II P (erro do Tipo II) = β Rejeitar Ho Erro do Tipo I P(erro do Tipo I) = α Decisão correta Eficácia = 1 - β ANÁLISE ESTATÍSTICA II 23 TESTES DE HIPÓTESES Como forma de reduzir a probabilidade de erro do Tipo II, consiste no aumento do tamanho da amostra, tendo em vista que amostras com tamanhos maiores, permitem que se detecte diferenças, mesmo que pequenas, entre os valores apresentados na hipótese e os parâmetros da população. Para um α determinado, o aumento do tamanho da amostra faz com que β diminua, e consequentemente, cresça a eficácia do teste para detectar que a hipótese nula é falsa. ANÁLISE ESTATÍSTICA II 24 TESTES DE HIPÓTESES O erro do Tipo I, é um erro que pode ser diretamente controlado, para a redução desse risco, seleciona-se um valor menor para α. Por exemplo pode-se reduzir α = 0,05 para α = 0,01, porém quando se diminui α, β cresce, ou seja, a redução do risco do Tipo I resulta em um maior risco de um erro do Tipo II. De outra forma, quando se quer diminuir β, basta selecionar um valor mais alto para α. ANÁLISE ESTATÍSTICA II 25 TESTES DE HIPÓTESES No exemplo da Oxford Cereals, o risco de ocorrência de um erro do Tipo I, significa que a média se modificou em relação aos 368 g identificados na hipótese, quando na verdade ela não se modificou. O risco de ocorrência de um erro do Tipo II, significa que a média se não se modificou em relação aos 368 g identificados na hipótese, quando na verdade ela se modificou. ANÁLISE ESTATÍSTICA II 26 TESTES DE HIPÓTESES A escolha de α e β, depende dos custos que cada escolha irá trazer. No exemplo, se for muito caro alterar o processo de abastecimento de cereais, deve-se estar muito certo de se fazer uma alteração antes de executá-la, ou seja, o risco de se cometer um erro do Tipo I é mais importante, e deve-se optar por um α pequeno. ANÁLISE ESTATÍSTICA II 27 TESTES DE HIPÓTESES Caso contrário, se houver uma confiança alta de se detectar variações em relação à média de 368 g, o risco de se cometer um erro do Tipo II é mais importante, e deve-se optar por um α maior. Quando o desvio padrão da população σ, é conhecido, utilizase o teste Z para a média aritmética se a população for distribuída nos moldes da distribuição normal. ANÁLISE ESTATÍSTICA II 28 TESTES DE HIPÓTESES Teste Z para a média aritmética com σ conhecido. ZESTAT X−μ = σ n A equação representa a diferença da média aritmética da amostra e a média aritmética da hipótese em termos de unidades de erro padrão. ANÁLISE ESTATÍSTICA II 29 TESTES DE HIPÓTESES Por exemplo, se α = 0,05, os valores críticos são – 1,96 e 1,96. + Para o exemplo da Oxford Cereals, valores de ZESTAST maiores que + 1,96 ou menores que – 1,96, indicam que X é suficientemente diferente de 368 g, declarado na hipótese. Rejeitar Ho se ZESTAST > +1,96 ou ZESTAST < – 1,96 Caso contrário, não rejeitar Ho ANÁLISE ESTATÍSTICA II 30 TESTES DE HIPÓTESES Se, por exemplo, a amostra de 25 caixas apresentar uma média aritmética igual a 372,5 g e o desvio-padrão da população for igual a 15 g, então: ZESTAT X−μ 372,5 − 368 = σ = = + 1,50 15 n 25 ANÁLISE ESTATÍSTICA II 31 TESTES DE HIPÓTESES Já que ZESTAT = + 1,50 e portanto está entre – 1,96 e + 1,96 não rejeitamos a hipótese nula, Ho. Continuamos a acreditar que a média aritmética da quantidade abastecida é de 368 g. Devemos anunciar que “existem evidências insuficientes de que a média aritmética da quantidade abastecida seja diferente de 368 g”, para levarmos em consideração a possibilidade de um erro do Tipo II. ANÁLISE ESTATÍSTICA II 32 TESTES DE HIPÓTESES Resumo: 1) Declare a hipótese nula Ho e a hipótese alternativa H1; 2) Escolha o risco α e o tamanho da amostra n; 3) Determine a estatística apropriada do teste e a distribuição de amostragens; 4) Determine os valores críticos; 5) Calcule o valor da estatística do teste; 6) Tome a decisão estatística e expresse a conclusão gerencial. ANÁLISE ESTATÍSTICA II 33 TESTES DE HIPÓTESES 1) Você é o gerente de uma lanchonete, e quer determinar se a média aritmética da população correspondente ao tempo de espera para que um pedido seja atendido se modificou, no mês anterior, em relação a seu valor anterior de 4,5 minutos. Com base em experiências passadas, você consegue pressupor que a população é distribuída nos moldes da distribuição normal, com um desviopadrão de 1,2 minutos para a população. Você seleciona uma amostra de 25 pedidos durante o período de 1 hora. A média aritmética da amostra é 5,1 minutos. Utilize a abordagem das seis etapas, para determinar se existem evidências, no nível de significância de 0,05, de que a média aritmética da população do tempo de espera para o atendimento de um pedido se modificou, no mês passado, em relação a seu valor anterior para a média aritmética da população, que era de 4,5 minutos. ANÁLISE ESTATÍSTICA II 34 TESTES DE HIPÓTESES Ho: μ = 4,5 H1: μ ≠ 4,5 Etapa 2: n = 25 e α = 0,05 Etapa 3: Como σ conhecido, distribuição normal e a estatística do teste ZESTAT Etapa 4: Valores críticos ± 1,96 Etapa 1: Etapa 5: ZESTAT = 5,1 −4,5 1,2 25 = +2,50 Etapa 6: Como ZESTAT = + 2,50 > + 1,96, rejeita-se a hipótese nula, isto é, existem evidências de que a média aritmética da população para o tempo de espera de atendimento de um pedido se modificou em relação a seu valor anterior de 4,5 minutos. ANÁLISE ESTATÍSTICA II 35 TESTES DE HIPÓTESES 2) Se você utilizar um nível de significância de 0,05 em um teste de hipótese, o que você decide, caso o valor calculado da estatísticas do teste for: a) ZESTAT = – 0,75 b) ZESTAT = + 2,22 ANÁLISE ESTATÍSTICA II 36 TESTES DE HIPÓTESES 3) Se você utilizar um nível de significância de 0,10 em um teste de hipótese, qual seria a sua regra de decisão para rejeitar uma hipótese nula de que a média aritmética da população é igual a 500 se você estivesse utilizando o teste Z?