Testes de Hipóteses para Mèdia de Populações NormaisVariância conhecida e desconhecida Ivan Bezerra Allaman Considerando variância conhecida Introdução • Nestes casos utiliza-se a seguinte estatística de teste: Z= X̄ − µ0 √ σ/ n • Uma vez calculada a estatística de teste, chegou-se a hora de tomarmos uma decisão. • Há duas regras para tomadas de decisão: – a regra de rejeição baseada no critério do valor crítico; – a regra de rejeição baseada no critério do p-valor. ∗ Você pode optar por uma delas. Regra baseada no critério do valor crítico • Obviamente que a tomada de decisão irá depender do tipo de hipótese estabelecida (bilateral, unilateral à direita ou a esquerda). • Logo, teremos as seguintes regras de acordo com as hipóteses estabelecidas: Hipótese bilateral Rejeitar H0 se Z ≤ −Zα/2 ou se Z ≥ Zα/2 Exemplo: Hipótese bilateral 1. Considere o seguinte teste de hipóteses: H0 : µ = 15 Ha : µ 6= 15 Uma amostra de tamanho 50 produziu a média amostral 14, 15. O desvio padrão da população é 3. • Calcule o valor da estatística de teste. mu0 = 15 sigma = 3 n = 50 xbarra = 14.15 Z = (xbarra - mu0)/(sigma/sqrt(n)) Z 1 ## [1] -2.003469 • Qual o valor crítico considerando α = 0, 05? alpha = 0.05 alpha_2 = alpha/2 # pois o teste é bilateral Zalpha_2 = abs(qnorm(alpha_2)) # valor sem sinal! Zalpha_2 ## [1] 1.959964 • Qual sua conclusão? Hipótese bilateral RNR RC RC −2 −1.96 1.96 Resp: Como a estatística Z (-2) está dentro da região crítica (Z < Zalpha/2 = −1, 96), então rejeita-se H0 com 95% de confiança, ou seja, podemos inferir com 95% de confiança que a média da população é diferente de 15. Hipótese unilateral à direita Rejeitar H0 se Z ≥ Zα Exemplo: Hipótese unilateral à direita 1. Considere o seguinte teste de hipóteses: H0 : µ = 25 Ha : µ > 25 Uma amostra de tamanho 40 produziu a média amostral 26, 4. O desvio padrão da população é 6. • Calcule o valor da estatística de teste. mu0 = 25 sigma = 6 n = 40 xbarra = 26.4 Z = (xbarra - mu0)/(sigma/sqrt(n)) Z 2 ## [1] 1.47573 • Qual o valor crítico considerando α = 0, 01? alpha = 0.01 Zalpha = abs(qnorm(alpha)) # valor sem sinal! Zalpha ## [1] 2.326348 • Qual sua conclusão? Hipótese unilateral à direita RNR RC 1.48 2.33 Resp: Como a estatística Z (1,48) está dentro da região de não-rejeição (Z < Zalpha = 2, 33), então não rejeita-se H0 com 99% de confiança, ou seja, podemos inferir com 99% de confiança que a média da população é menor ou igual a 25. Hipótese unilateral à esquerda Rejeitar H0 se Z ≤ −Zα Exemplo: Hipótese unilateral à esquerda 1. Considere o seguinte teste de hipóteses: H0 : µ = 20 Ha : µ < 20 Uma amostra de tamanho 50 produziu a média amostral 19, 4. O desvio padrão da população é 2. • Calcule o valor da estatística de teste. mu0 = 20 sigma = 2 n = 50 xbarra = 19.4 Z = (xbarra - mu0)/(sigma/sqrt(n)) Z 3 ## [1] -2.12132 • Qual o valor crítico considerando α = 0.06? alpha = 0.06 Zalpha = abs(qnorm(alpha)) # valor sem sinal! Zalpha ## [1] 1.554774 • Qual sua conclusão? Hipótese unilateral à esquerda RC −2.12 RNR −1.55 Resp: Como a estatística Z (-2,12) está dentro da região de crítica (Z < Zalpha = −1, 55), então rejeita-se H0 com 94% de confiança, ou seja, podemos inferir com 94% de confiança que a média da população é menor do que 20. Regra baseada no p-valor • O p-valor é a probabilidade de cometermos o erro do tipo I se a estatística de teste for utilizada como limite da região de rejeição. Podemos interpretar-lo como um indicador do peso da evidência contra a hipótese nula. • Logo, tem-se a seguinte regra de decisão: Hipótese bilateral Rejeitar H0 se o p-valor ≤ α/2 Exemplo: Hipótese bilateral 4. Considere o mesmo exemplo 1 e α = 0, 05. • Calcule o valor da estatística de teste e o p-valor. 4 mu0 = 15 sigma = 3 n = 50 xbarra = 14.15 Z = (xbarra - mu0)/(sigma/sqrt(n)) # estatística de teste Z ## [1] -2.003469 pvalor = pnorm(Z)*2 # p-valor pvalor ## [1] 0.04512695 • Qual sua conclusão? Hipótese bilateral 0.023 RNR 0.023 −1.96 1.96 Resp: Como o p-valor (0,046) foi menor do que α (0,05), então rejeita-se H0 com 95% de confiança, ou seja, podemos inferir com 95% de confiança que a média da população é diferente de 15. Hipótese unilateral à direita Rejeitar H0 se o p-valor ≤ α Exemplo: Hipótese unilateral à direita 5. Considerando o mesmo exemplo 2 e α = 0, 01. • Calcule o valor da estatística de teste e o p-valor. mu0 = 25 sigma = 6 n = 40 xbarra = 26.4 Z = (xbarra - mu0)/(sigma/sqrt(n)) Z 5 ## [1] 1.47573 pvalor_auxiliar = pnorm(Z) pvalor = 1-pvalor_auxiliar pvalor ## [1] 0.07000825 • Qual sua conclusão? Resp: Como o p-valor (0,07) é maior do que α (0,01), então não rejeita-se H0 com 99% de confiança, ou seja, podemos inferir com 99% de confiança que a média da população é menor ou igual a 25. Hipótese unilateral à esquerda Rejeitar H0 se o p-valor ≤ α Exemplo: Hipótese unilateral à esquerda 6. Considere o mesmo exemplo 3 e α = 0, 06. • Calcule o valor da estatística de teste e o p-valor. mu0 = 20 sigma = 2 n = 50 xbarra = 19.4 Z = (xbarra - mu0)/(sigma/sqrt(n)) Z ## [1] -2.12132 pvalor = pnorm(Z) pvalor ## [1] 0.01694743 • Qual sua conclusão? Resp: Como o p-valor (0,017) é menor do que α (0,06), então rejeita-se H0 com 94% de confiança, ou seja, podemos inferir com 94% de confiança que a média da população é menor do que 20. Aplicações 1. As declarações do imposto de renda individuais entregues antes do dia 31 de março obtiveram uma média de restituição de R$ 1056,00. Considere a população de declarantes “de última hora” que entregam suas declarações durante os cinco últimos dias do período de entrega das declarações do imposto de renda. • Um pesquisador sugere que uma razão para que as pessoas esperem até os cinco últimos dias é que em média essas pessoas têm menores restituições a receber do que aquelas que entregam as declarações primeiro. Desenvolva as hipóteses apropriadas de tal forma que a rejeição de H0 sustente a argumentação do pesquisador. 6 • Para uma média de 400 indivíduos que entregaram suas declarações nos últimos cinco dias, a média amostral de restituição foi de R$ 910,00. Baseando-se na experiência anterior, pode-se supor um desvio padrão populacional σ = R$1600, 00. Qual é o p-valor? • Com α = 0, 05, qual é a sua conclusão? 2. A Reis, Inc., uma firma de pesquisa imobiliária de Nova York, acompanha o custo do aluguel de apartamentos nos Estados Unidos. Em meados de 2002, o índice médio de aluguel por apartamento em todo o território nacional era de US$ 895 por mês. Suponha que, baseando-se em pesquisas trimestrais históricas, seja razoável considerar-se um desvio padrão populacional σ = U S$225. Em um estudo recente dos índices de aluguel de apartamentos, uma amostra de 180 apartamentos de todo o país produziu uma média amostral de US$ 915 por mês. Os dados amostrais possibilitam à Reis concluir que o índice médio populacional de aluguel de apartamentos agora ultrapasse o nível relatado em 2002? 3. A CNN e a ActMedia criaram um canal de televisão destinado a pessoas que esperam nas filas do caixa de supermercados. O canal apresentava notícias, entrevistas breves e anúncios. A duração do programa baseava-se na suposição de que o tempo médio que a população de compradores permanece em uma fila de supermercado é igual a 8 minutos. Uma amostra de 120 compradores apresentou uma média amostral de tempo de espera de 8, 5 minutos. Suponha um desvio padrão populacional σ = 3, 2 minutos. Os dados sustentam a evidência de que o tempo real de espera difere do padrão de 8 minutos? Considerando variância desconhecida Introdução • Neste caso só irá mudar a função densidade de probabilidade que será a t-Student, pois todo o raciocínio anterior é válido. • Lembrem-se que além da média você deverá também estimar a variância da amostra. • Logo, tem-se a seguinte estatística de teste: t= X̄ − µ0 √ S/ n Exemplo 1. De uma população normal cuja variância é desconhecida, extraiu-se uma amostra casual obtendo-se os seguintes valores: amostra = c(86,105,112,108,138,85,97,83,101,118,116,89,92,118,88,114,116,118,81,127,106,90, 93,102,92,85,94,115,99,117,105,90,99,90,91,94) * Ao nível de 5% , testar: H0 : µ = 105 Ha : µ < 105 7 # Retirando informações da amostra media = mean(amostra) # estimando a média desvpad = sd(amostra) # estimando o desvio padrão n = length(amostra) # tamanho da amostra erropad = desvpad/sqrt(n) # Resolvendo o problema alfa = 0.05 glib = n - 1 # graus de liberdade tcalc = (media - 105)/erropad pvalor = pt(tcalc, glib) pvalor ## [1] 0.07025871 Resp: Como o pvalor é maior que alfa, não rejeita-se H_0 com 95% de confiança. Aplicações 1. Uma máquina de misturar fertilizantes é adaptada para fornecer 10g de nitrato para cada 100g de fertilizante. Dez porções de 100g são examinadas, com as seguintes porcentagens de nitrato: [1] 9 12 11 10 11 9 11 12 9 10 • Há razões para crer que a porcentagem de nitrato não é 10g ao nível de 10%? 8