Exercícios Resolvidos R10.1) Velocidade média na estrada Sergio afirma que Raquel dirige seu carro na estrada a uma velocidade média superior a 100 km/h, enquanto Raquel discorda, afirmando dirigir na estrada a uma velocidade média menor ou igual a 100 km/h. Para dirimir essa controvérsia, Sergio resolve cronometrar o tempo (em minutos) que ela gasta ao volante em 10 viagens, sempre pelo mesmo percurso que liga duas cidades distanciadas de 120 km: 73, 68, 73, 61, 70, 78, 63, 64, 74, 62. (a) Quem parece ter razão, ao nível de significância de 5%? (b) Qual o nível crítico? Solução: (a) As hipóteses a serem consideradas são H0: µ 100 (Raquel) e H1: µ > 100 (Sergio), onde µ é a média populacional da velocidade (em km/h) com que Raquel dirige na estrada. Como o desvio padrão populacional σ é desconhecido, teremos que utilizar a distribuição t de Student com ν = 10 – 1 = 9 graus de liberdade. O critério de decisão a ser utilizado é então: Rejeitar H0, se Tobs = > t0,95 = 1,83. Caso contrário, aceitar H0. Os dados com os quais devemos trabalhar neste caso são as velocidades médias (em km/h) correspondentes a cada uma das 10 viagens. Eles podem ser obtidos através da expressão: velocidade (km/h) = Os resultados obtidos em km/h são: 98,63 105,88 98,63 118,03 102,86 92,31 114,29 112,50 97,30 116,13 Com base nesses dados, temos: Daí, Tobs = = 105,66 ; s = 9,06. = 1,97 > 1,83, o que implica que H0 deve ser rejeitada. Isso significa que, ao nível de significância α = 0,05, Sergio parece estar com a razão. (b) O p-valor no caso é R10.2) Teste de hipótese simples contra alternativa simples com modelo Normal de variância conhecida Queremos testar a hipótese H0: = 50 contra a alternativa H1: = 52, onde é a média 2 populacional de uma distribuição Normal com variância conhecida = 25. Temos então variáveis aleatórias iid X1, X2,...,Xn, que seguem todas essa lei de probabilidade, e a média amostral X será usada como estatística de teste. Se as probabilidades dos erros de tipo I e II são pré-fixadas em = 0,01 e = 0,05 respectivamente: (a) Determine qual deve ser o tamanho n da amostra. (b) Qual o critério de decisão para se aceitar ou rejeitar H0? Solução: Como as hipóteses H0 e H1 se referem à média populacional, a estatística de teste será a média amostral . Como 50 < 52, a regra de decisão será : Rejeitar H0 se X > C, onde C é uma constante a determinar. Sabemos que 0,01 = = P(Erro I) = P(Rejeitar H0), se H0 é verdadeira. 0,01 P Então 0,01 = P[ > C], se =50 Logo, C 50 5 n Logo, C 52 5 n C 50 5 n 2,33 (valor obtido da tabela da Normal Padrão) Por outro lado, 0,05 Então 0,05 = P[ X 50 5 n β P(ErroII) (I) P(Aceitar H 0 ) , se H0 é falsa. 0,05 C], se =52 P X 52 5 n C 52 5 n 1,64 (valor obtido da tabela da Normal Padrão) (II) Resolvendo o sistema de 2 equações a duas incógnitas formado pelas equações (I) e (II), obtemos n = 99 e C = 51,18. R10.3) Testando hipóteses em uma eleição para governador Em uma pesquisa eleitoral referente ao primeiro turno de uma eleição para governador foram ouvidos n = 1000 eleitores selecionados aleatoriamente e entre eles m = 510 declararam-se favoráveis ao candidato A. Deseja-se testar a hipótese H0 de que a proporção p de eleitores do candidato A é menor ou igual a 0,5 contra a alternativa de que A venceria direto, sem a necessidade do segundo turno. (a) Qual seria a sua decisão ao nível de significância de 5%? Por que? (b) Qual é o p-valor? (c) Se na realidade p = 0,55, qual seria a probabilidade de ser cometido o Erro de tipo II ao ser usada essa mesma regra de decisão? Qual o poder do teste neste caso? Solução: (a) Queremos testar H0: p 0,5 contra H1: p > 0,5 ao nível de significância α = 0,05. Então neste caso temos p0 = 0,5 e σ0 = 0,0158 Por outro lado, 1 – α = 0,95 e z0,95 = 1,645. O critério de decisão é então: Rejeitar H0 se > 0,5 + 1,645 = 0,526. Como 0,526, a hipótese nula H0 deve ser aceita. Isso significa que, ao nível de significância α = 0,05, não há evidências suficientes de que o candidato A já tenha ganho a eleição no 1º turno. (b) O p-valor é o menor valor de α para o qual ainda rejeitaríamos H0, com os dados disponíveis. Então , se p = 0,5. Ou seja, padronizando, temos P(Z > 0,632) = 0,264. Como esse p-valor é excessivamente grande, isso reforça a nossa decisão de não rejeitar a hipótese nula H0 de que há necessidade de um 2º turno. (c) Se p1 = 0,55, temos σ1 = . Então, β = P(Aceitar H0) = P(Z -1,525) = 0,064. O poder do teste neste caso seria então 1 – 0,064 = 0,936 ou 93,6%. Exercícios Propostos P10.1) Verificação de conceitos básicos Quando estamos testando hipóteses relativas a um parâmetro de uma distribuição de probabilidade: (a) A região de rejeição corresponde aos valores do parâmetro que tornam falsa a hipótese nula. Sim ou não? Por que? (b) A soma das probabilidades dos erros de tipo I e de tipo II é igual a 1. Sim ou não? Por que? (c) O p-valor (também chamado nível crítico) depende do conjunto de dados coletados. Sim ou não? Por que? (d) Apenas com base em uma amostra não podemos afirmar com certeza que H0 seja verdadeira ou que H0 seja falsa. Sim ou não? Por que? P10.2) Propaganda enganosa? A propaganda da Companhia de Cigarros Tabacox afirma que o teor médio de nicotina dos cigarros da marca Delicious, que ela fabrica é no máximo, de 0,7 mg. Um organismo fiscalizador analisa 16 cigarros dessa marca, obtendo um valor médio para a amostra analisada de 0,708 mg de nicotina. O organismo decide denunciar o fabricante à Justiça, que o autua por propaganda enganosa e o condena a pagar uma elevada multa. A Companhia decide recorrer. Formulando o problema no contexto de um teste de hipótese, temos: População: todos os cigarros da marca Delicious produzidos pela Companhia de Cigarros Tabacox Propriedade da população a ser analisada: teor de nicotina, representado pela v.a. X. Função de densidade de X: podemos supor distribuição Normal (a) (b) (c) Hipótese Nula: O teor médio de nicotina da marca Delicious é no máximo igual a 0,7 mg. Simbolicamente, H0: 0,7 Hipótese Alternativa: O teor médio de nicotina da marca Delicious é maior que 0,7 mg. Simbolicamente, H1: > 0,7 Amostra aleatória X1, X2, ..., X16: teor de nicotina em cada cigarro dessa marca selecionado para análise Para um nível de significância de 5%, construa o teste de hipóteses adequado para dirimir essa controvérsia, especificando a estatística de teste e as regiões de aceitação e de rejeição. Se os valores de teor de nicotina dos 16 cigarros da amostra coletada são: 0,718 0,703 0,692 0,792 0,657 0,679 0,706 0,719 0,673 0,682 0,665 0,684 0,770 0,761 0,699 0,728 qual a decisão a ser tomada? Qual é o p-valor neste caso? P10.3) Arqueologia – Os crânios encontrados são de que raça? Suponha que a longitude máxima de crânios humanos de uma certa raça A da antiguidade pode ser encarada como uma variável aleatória com distribuição Normal de média 145 mm e desvio padrão 12 mm. Por outro lado, para uma segunda raça B, a longitude máxima dos crânios segue uma distribuição Normal com média 149 mm e o mesmo desvio padrão de 12 mm. Admita agora que, em uma escavação, foram encontrados 36 crânios e há dúvidas quanto à raça da população da qual eles são provenientes. Evidências adicionais encontradas nessa escavação mostram que os crânios só podem ser de uma das duas raças: A ou B. Os antropólogos consultados acreditam que a longitude máxima do crânio fornece uma boa medida para se especificar a raça. Como decidir de que raça são os crânios encontrados? (a) Formule o problema em um contexto de teste de hipótese, especificando claramente o que seriam H0 e H1. (b) Qual o critério de decisão a ser utilizado, se decidirmos trabalhar a um nível de significância α = 5%? (c) Neste caso qual seria a probabilidade β de se cometer o erro tipo II? P10.4) Viscosidade em um processo químico Um artigo em Quality Engineering (Vol. 4, 1992, PP. 487 – 495) apresenta dados sobre viscosidade em um lote de um processo químico. Uma amostra desses dados é apresentada a seguir (ler de cima para baixo, da esquerda para a direita). 13,3 14,5 15,3 15,3 14,3 14,8 15,2 14,5 14,6 14,1 14,9 13,7 15,2 14,5 15,3 15,6 15,8 13,3 14,1 15,4 15,8 13,7 15,1 13,4 14,1 14,8 14,3 14,3 16,4 16,9 16 14,9 13,6 15,3 14,3 15,6 16,1 13,9 15,2 14,4 14,3 16,1 13,1 15,5 12,6 14,6 14,3 15,4 15,2 16,8 15,2 15,2 15,9 16,5 14,8 15,1 14,9 14,8 14 14,2 16,9 14,9 15,2 14,4 15,2 14,6 16,4 14,2 15,7 14 14,4 13,7 13,8 15,6 14,5 12,8 16,1 16,6 15,6 17 (a) Teste a hipótese de que neste processo a média populacional da viscosidade é igual a 15 contra a alternativa de que ela é diferente de 15, ao nível de significância de 5%. (b)Qual o nível crítico? P10.5) Valor médio de Nitrogênio Total em uma amostra de combustíveis Se µ é a média do conteúdo de Nitrogênio Total em um determinado combustível, deseja-se testar a hipótese nula H0: µ = 130 contra a hipótese alternativa H1: µ ≠ 130, admitindo que essa variável segue uma distribuição Normal. Para isso foi coletada uma amostra com n = 33 observações, com base na qual obtivemos Σx = 4484 e Σx 2 = 779744. (a) Qual a sua conclusão ao nível de significância de 5%? (b) Qual o nível crítico? P10.6) Mais uma vez os implantes mamários Usando de novo os dados dos Exercícios P7.4 e P9.2: 72,2 80,1 70,4 67,8 70,9 72,1 75,1 73,0 59,4 77,2 65,1 66,5 64,1 79,0 70,6 70,3 63,1 64,4 74,9 75,3 relativos à tensão de ruptura para uma amostra de n = 20 implantes mamários produzidos por um determinado fabricante, teste a hipótese de que a média populacional dessa variável é igual a 70 contra a alternativa de que ela é maior que 70, ao nível de significância α = 5%. Suponha que os dados são provenientes de uma distribuição Normal. P10.7) Desempenho de automóvel O fabricante de um determinado modelo de automóvel alega que, sob condições de tráfego tipicamente urbanas, esse carro faz, em média, pelo menos 10 quilômetros por litro de gasolina. A proprietária de um automóvel desse modelo registrou o desempenho do seu carro em nove ocasiões diferentes em que ela encheu o tanque com gasolina e conduziu no perímetro urbano. Os resultados, em quilômetros por litro, foram os seguintes: 7,80 9,30 9,15 10,05 10,75 9,20 9,55 10,20 9,50 Verifique se a alegação do fabricante se sustenta, realizando um teste ao nível de significância de 5%. Liste cuidadosamente as suposições que você deve fazer para o uso desse teste. P10.8) Teste sobre a proporção de eleitores que apóiam Seu Fernando Foi realizada uma pesquisa eleitoral na cidade em que Seu Fernando é candidato a prefeito. Sabe-se que: n = 1625 eleitores foram ouvidos quanto às suas preferências nessa eleição entre eles, m = 475 revelaram sua intenção de votar em Seu Fernando Se p é a proporção de eleitores na cidade que pretendem votar nele: (a) Teste a hipótese nula H0: p ≥ 0,30 contra a alternativa H1: p < 0,30, ao nível α = 1%. (b) Determine o nível crítico. P10.9) Teste bilateral de proporção Queremos testar a hipótese nula H0: p = 0,20 contra a alternativa H1: p 0,20, onde p é a proporção de elementos de uma população que possuem determinada característica. Para isso será usada uma amostra com n = 500 elementos dessa população. Seja X o número de elementos da amostra com a característica aqui considerada. O critério de decisão a ser utilizado é: Aceitar H0 se 82 X 118 e rejeitar H0 em caso contrário. (a) Determine o nível de significância relativo a esse teste. (b) Determine a probabilidade do erro de tipo II, caso o valor real de p seja 0,25. Qual o poder do teste neste caso? P10.10) Testando hipóteses sobre a proporção de pessoas com nível superior Estima-se em 30% a proporção dos habitantes adultos de certa localidade que têm curso superior completo. Para testar tal hipótese escolhe-se uma amostra aleatória de 15 habitantes adultos. Se, dentre eles, houver de 2 a 7 indivíduos com curso superior completo, aceitaremos a hipótese H0: p = 0,30. Caso contrário, ela será rejeitada em favor de H1: p 0,30. (a) Determinar o nível de significância do teste. (b) Determinar = P[Erro tipo II], para a alternativa p = 0,2. (c) Determinar = P[Erro tipo II], para a alternativa p = 0,4. Obs.: 1. Note que para n = 15 não é adequado aproximar a binomial por uma Normal. 2. A tabela abaixo contem os valores de P(X k), onde X Binomial(15;p), para (p = 0,2), (p = 0,3) e (p = 0,4) e para k variando desde 0 até 15: p↓ k→ 0,2 0,3 0,4 p↓ k→ 0,2 0,3 0,4 0 1 2 3 4 5 6 7 0,035 0,167 0,398 0,648 0,836 0,939 0,982 0,996 0,005 0,035 0,127 0,297 0,515 0,722 0,869 0,950 0,000 0,005 0,027 0,091 0,217 0,403 0,610 0,787 8 9 10 11 12 13 14 15 0,999 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,985 0,996 0,999 1,000 1,000 1,000 1,000 1,000 0,905 0,966 0,991 0,998 1,000 1,000 1,000 1,000