TESTES DE HIPÓTESES Spencer Barbosa da Silva Departamento de Estatística Teste Bilateral • A concentração de determinada substância no sangue é uma va (continua) que segue a distribuição Normal com variância 36. • Considere uma doença que altera a concentração desta substancia. • Para pacientes sadios (sem a doença) a concentração média desta substancia é 18 mg por litro de sangue. • O tratamento proposto para esta doença é eficaz? X = concentração da substância no sangue dos pacientes dos pacientes doentes após o tratamento X ~ Normal com média µ e variância σ2 =36 µ = 18 µ ≠ 18 tratamento é eficaz tratamento não é eficaz Inferência Estatística • Uma amostra de n pacientes doentes foi submetida ao tratamento. • Após o tratamento verificamos a concentração média desta substancia no sangue destes n pacientes ( x). • Nossa decisão sobre µ será tomada com base em x , pois melhor estimador para µ. x éo • Se a média amostral for muito diferente de 18, então optaremos por µ ≠ 18. Ho: µ = 18 Ha: µ ≠ 18 RC x xc1 ou x xc 2 Região de Rejeição de Ho ou Região Crítica Região de Rejeição de Ho ou Região Crítica xc1 18 xc 2 Erros associados ao teste de hipóteses Situação Ho verdadeira Ho falsa Rejeitar Ho Erro Tipo I Sem erro Não rejeitar Ho Sem erro Erro Tipo II Decisão α = P(erro Tipo I) = P(rejeitar Ho| Ho verdadeira) = nível de significância β = P(erro Tipo II) = P(não rejeitar Ho| Ho falsa) 1 - β = 1- P(não rejeitar Ho| Ho falsa) = P(rejeitar Ho| Ho falsa) = poder do teste Ha: µ ≠ µ0 Ho: µ = µ0 xc1 0 z 2 n xc 2 0 z 2 n onde z>0 é um valor da tabela normal padrão associado ao nível de significância do teste (α). P(Z < -z) = P(Z > z) = α/2 • No nosso exemplo: • Considerando 5% de significância (α = 0,05): xc1 18 1,96 36 Ho: µ = 18 30 15,85 Ha: µ ≠ 18 n=30 xc 2 18 1,96 36 30 20,15 RC x 15,85 ou x 20,15 • A concentração média da substancia no sangue dos 30 pacientes doentes submetidos ao tratamento após o tratamento foi de 22,00 mg por litro. • Conclusão: Rejeitamos a hipótese nula ao nível de 5% de significância, ou seja, a amostra fornece evidência de que o tratamento não é eficaz. • A nossa conclusão foi rejeitar Ho, ou seja, concluímos que a tratamento não é eficaz. • É possível que esta conclusão esteja errada, ou seja, é possível que na verdade o tratamento seja eficaz? • Sim, é possível. Podemos estar rejeitando Ho quando na verdade Ho é verdadeira. A probabilidade de estarmos cometendo este erro (erro do tipo I) é igual ao nível de significância adotado (neste caso 5%). Exemplo: Um pesquisador deseja estudar o efeito de certa substância no tempo de reação de seres vivos a um certo estimulo. Cobaias que fizeram uso desta substancia forneceram os seguintes tempos de reação (em segundos): 9,1 9,3 7,2 7,5 13,3 10,9 7,2 9,9 8,0 8,6 Sabe-se que o tempo de reação a este estimulo tem distribuição Normal com desvio padrão de 2 segundos. Sem o uso desta substancia, o tempo médio de reação é de 8 segundos. O pesquisador desconfia que o tempo médio é reação é alterado pela substancia. Teste esta desconfiança ao nível de 10% de significância. Teste Unilateral • A concentração de determinada substância no sangue é uma va (continua) que segue a distribuição Normal com variância 36. • Considere uma doença que aumenta a concentração desta substancia. • Para pacientes sadios (sem a doença) a concentração média desta substancia é 18 mg por litro de sangue. • O tratamento proposto para esta doença é eficaz? X = concentração da substância no sangue dos pacientes dos pacientes doentes após o tratamento X ~ Normal com média µ e variância σ2 =36 µ = 18 µ > 18 tratamento é eficaz tratamento não é eficaz Inferência Estatística • Uma amostra de n pacientes doentes foi submetida ao tratamento. • Após o tratamento verificamos a concentração média desta substancia no sangue destes n pacientes ( x). • Nossa decisão sobre µ será tomada com base em x , pois melhor estimador para µ. x éo • Se a média amostral for muito maior que 18, então optaremos por µ > 18. Ho: µ = 18 Ha: µ > 18 RC x xc RC 18 xc Ho: µ = µ0 xc 0 z Ha: µ > µ0 2 n onde z > 0 é um valor da tabela normal padrão associado ao nível de significância do teste (α). P(Z > z) = α • No nosso exemplo: • Considerando 5% de significância (α = 0,05): xc 18 1,64 36 Ho: µ = 18 30 Ha: µ > 18 n=30 19,79 RC x 19,79 • A concentração média da substancia no sangue dos 30 pacientes doentes submetidos ao tratamento após o tratamento foi de 22,00 mg por litro. • Conclusão: Rejeitamos a hipótese nula ao nível de 5% de significância, ou seja, a amostra fornece evidência de que o tratamento não é eficaz. • A nossa conclusão foi rejeitar Ho, ou seja, concluímos que a tratamento não é eficaz. • É possível que esta conclusão esteja errada, ou seja, é possível que na verdade o tratamento seja eficaz? • Sim, é possível. Podemos estar rejeitando Ho quando na verdade Ho é verdadeira. A probabilidade de estarmos cometendo este erro (erro do tipo I) é igual ao nível de significância adotado (neste caso 5%). Exemplo: Um pesquisador deseja estudar o efeito do álcool no tempo de reação de seres vivos a um certo estimulo. Cobaias que fizeram uso de bebida alcoólica substancia forneceram os seguintes tempos de reação (em segundos): 9,1 9,3 7,2 7,5 13,3 10,9 7,2 9,9 8,0 8,6 Sabe-se que o tempo de reação a este estimulo tem distribuição Normal com variância 6. O tempo médio de reação sem efeito de álcool é de 9 segundos. O pesquisador desconfia que o álcool aumenta o tempo médio de reação. Teste esta desconfiança ao nível de 1% de significância. Teste Unilateral • A concentração de determinada substância no sangue é uma va (continua) que segue a distribuição Normal com variância 36. • Considere uma doença que diminui a concentração desta substancia. • Para pacientes sadios (sem a doença) a concentração média desta substancia é 18 mg por litro de sangue. • O tratamento proposto para esta doença é eficaz? X = concentração da substância no sangue dos pacientes dos pacientes doentes após o tratamento X ~ Normal com média µ e variância σ2 =36 µ = 18 µ < 18 tratamento é eficaz tratamento não é eficaz Inferência Estatística • Uma amostra de n pacientes doentes foi submetida ao tratamento. • Após o tratamento verificamos a concentração média desta substancia no sangue destes n pacientes ( x). • Nossa decisão sobre µ será tomada com base em x , pois melhor estimador para µ. x éo • Se a média amostral for muito menor que 18, então optaremos por µ < 18. Ho: µ = 18 Ha: µ < 18 RC x xc RC RC xc 18 Ho: µ = µ0 xc 0 z Ha: µ < µ0 2 n onde z > 0 é um valor da tabela normal padrão associado ao nível de significância do teste (α). P(Z > z) = α • No nosso exemplo: • Considerando 5% de significância (α = 0,05): xc 18 1,64 36 Ho: µ = 18 30 Ha: µ < 18 n=30 16,21 RC x 16,21 • A concentração média da substancia no sangue dos 30 pacientes doentes submetidos ao tratamento após o tratamento foi de 22,00 mg por litro. • Conclusão: Não rejeitamos a hipótese nula ao nível de 5% de significância, ou seja, a amostra fornece evidência de que o tratamento é eficaz. • A nossa conclusão foi não rejeitar Ho, ou seja, concluímos que a tratamento é eficaz. • É possível que esta conclusão esteja errada, ou seja, é possível que na verdade o tratamento não seja eficaz? • Sim, é possível. Podemos não estar rejeitando Ho quando na verdade Ho é falsa. A probabilidade de estarmos cometendo este erro (erro do tipo II) é igual a β. • O calculo de β depende do valor de µ. Exemplo: Um pesquisador deseja estudar o efeito de uma bebida energética no tempo de reação de seres vivos a um certo estimulo. Cobaias que fizeram uso de bebida alcoólica forneceram os seguintes tempos de reação (em segundos): 9,1 9,3 7,2 7,5 13,3 10,9 7,2 9,9 8,0 8,6 Sabe-se que o tempo de reação a este estímulo tem distribuição Normal com variância 6. Sem efeito de energético, o tempo médio de reação é de 10 segundos. O pesquisador desconfia que energético diminui o tempo médio de reação. Teste esta desconfiança ao nível de 10% de significância. Etapas de um teste de hipóteses 1. Estabelecer as hipóteses nula e alternativa. 2. Definir a forma da região crítica, com base na hipótese alternativa. 3. Fixar α e obter a região crítica. 4. Concluir o teste com base na média amostral. Exemplo: Deseja-se investigar se uma certa doença que ataca o rim aumenta o consumo de oxigênio deste órgão. O consumo de oxigênio segue a distribuição Normal com desvio padrão de 9 cm3/min. Para indivíduos sadios o consumo médio é de 13 cm3/min. Uma amostra de 5 pacientes doentes forneceu os seguintes valores para o consumo (em cm3/min): 14,4 12,9 15,0 13,7 13,5 a) Com base nesta amostra, forneça uma estimativa pontual para o consumo médio em pacientes doentes. b) A amostra fornece evidencia de que a doença aumenta o consumo? Faça um teste com 2% de significância? Exemplo: Uma associação de defesa do consumidor desconfia que embalagens de 450 gramas de um biscoito estão abaixo do peso. O peso destas embalagens segue a distribuição Normal com desvio padrão de 10 gramas. Para verificar esta suspeita foram coletados 81 pacotes do biscoito, de vários supermercados, obtendo-se peso médio de 447 gramas. Existe evidencia amostral de que as embalagens estão abaixo do peso? Use α=7%. Exemplo: O tempo de duração de lâmpadas segue a distribuição Normal com desvio padrão de 002 anos. Um fabricante de lâmpadas afirma que o tempo médio de duração de suas lâmpadas é 2,3 anos. Para verificar esta afirmação 49 lâmpadas foram testadas. O tempo médio de duração destas lâmpadas foi de 2,5 anos. Existe evidencia amostral de a informação do fabricante esteja errada? Use 12% de significância. - Podemos também realizar testes de hipóteses para a proporção populacional. - Hipóteses: H0: p = p0 Ha: p ≠ p0 ou p > p0 ou p > p0 - A decisão neste caso é baseada na proporção amostral. - Ha: p ≠ p0 ^ ^ RC p xc1 ou p xc 2 p0 (1 p0 ) xc1 p z n ^ p0 (1 p0 ) xc 2 p z n ^ - Ha: p > p0 ^ RC p xc p0 (1 p0 ) xc p z n ^ - Ha: p < p0 ^ RC p xc p0 (1 p0 ) xc p z n ^ Exemplo: Uma companhia afirma que 40% da água obtida em poços artesianos no nordeste é salobra. Para testar esta hipótese, 400 poços foram sorteados e em 120 deles observou-se água salobra. Teste a afirmação da companhia ao nível de 10% de significância. Exemplo: A LG afirma que apenas 5% de suas televisões LCD dão algum tipo de problema antes de 1 ano de uso. Para testar esta hipótese, 500 televisões LCD novas da marca LG foram usadas durante 1 ano. 40 delas apresentaram algum tipo de problema. Suspeita-se que a porcentagem de televisões LCD da marca LG que apresenta problema antes de 1 ano de uso seja maior do que o informado pelo fabricante. Teste esta suspeita ao nível de 1% de significância. Exemplo: Um pré-vestibular afirma que 90% de seus alunos são aprovados no Vestibular, mas desconfia-se que esta proporção seja menor. Para testar esta desconfianca100 alunos deste pré vestibular foram selecionados. Destes 100, 76 disseram ter sido aprovado. Verifique se a desconfiança procede ao nível de 5% de significância.