ESTATÍSTICA APLICADA Capítulo 7 Teste de Hipóteses Prof. Paulo Renato de Morais Conceitos de Teste de Hipóteses Teste de Hipóteses População Eu acredito que a idade média da população é 50 (hipótese). Testes de Hipóteses População Eu acredito que a idade média da população é 50 (hipótese). Amostra aleatória Média X = 20 Rejeito a hipótese! Ficou longe. O que é uma Hipótese? 1. Uma afirmação sobre um parâmetro populacional Parâmetro é média, proporção, variância populacional Deve ser feita antes da análise Eu acredito que a idade média desta classe é 25 anos! © 1984-1994 T/Maker Co. Hipótese Nula 1. O que se quer testar 2. Tem uma séria conseqüência se a decisão errada é tomada 3. Sempre tem um sinal de igualdade: , ou 4. Designada por H0 5. Especificada como H0: Algum valor numérico Escrita com sinal = mesmo se ou Exemplo, H0: 50 Hipótese Alternativa 1. Contrário da hipótese nula 2. Sempre tem sinal de desigualdade: , ou 3. Designada por H1 4. Especificada como H1: < Algum valor numérico Exemplo, H1: < 50 Passos para se Estabelecer Hipóteses Passos 1. Formule a questão estatisticamente Exemplo: A média populacional é diferente de 50? 1. 50 Passos para se Estabelecer Hipóteses Passos 1. Formule a questão estatisticamente 2. Formule o contrário estatisticamente Exemplo: A média populacional é diferente de 50? 1. 50 Devem ser mutuamente exclusivas 2. = 50 e exaustivas Passos para se Estabelecer Hipóteses Passos 1. Formule a questão estatisticamente 2. Formule o contrário estatisticamente Exemplo: A média populacional é diferente de 50? 1. 50 Devem ser mutuamente exclusivas 2. = 50 e exaustivas 3. H1: 50 3. Selecione a hipótese alternativa Tem o sinal , < ou > Passos para se Estabelecer Hipóteses Passos 1. Formule a questão estatisticamente 2. Formule o contrário estatisticamente Exemplo: A média populacional é diferente de 50? 1. 50 Devem ser mutuamente exclusivas 2. = 50 e exaustivas 3. H1: 50 3. Selecione a hipótese 4. H0: = 50 alternativa 4. Tem o sinal , < ou > Selecione a hipótese nula Idéia Básica Distribuição Amostral == 50 50 H0 Sample Sample Mean Mean Idéia Básica Distribuição Amostral É improvável obter uma média amostral com este valor ... ... se de fato esta é a média populacional 20 == 50 50 H0 Sample Sample Mean Mean Idéia Básica Distribuição Amostral É improvável obter uma média amostral com este valor ... ... portanto, rejeita-se a hipótese que = 50. ... se de fato esta é a média populacional 20 == 50 50 H0 Sample Sample Mean Mean Nível de Significância 1. Define valores pouco prováveis da estatística amostral se a hipótese nula for verdadeira Chamada região de rejeição da distribuição amostral 2. É uma probabilidade 3. Denotada (alfa) 4. Selecionada no início Valores típicos são: 0,01; 0,05; 0,10 Região de Rejeição (Teste Unilateral) Distribuição Amostral Valor de Ho Estatística Amostral Região de Rejeição (Teste Unilateral) Distribuição Amostral Região de Rejeição Região de Não-rejeição Valor Crítico Valor de Ho Estatística Amostral Região de Rejeição (Teste Unilateral) Distribuição Amostral Nível de Confiança Rejection Rejection Region Region 1- Nonrejection Nonrejection Region Region Critical Critical Value Value Ho Ho Value Value Sample Sample Statistic Statistic Região de Rejeição (Teste Unilateral) Distribuição Amostral Nível de Confiança Rejection Rejection Region Region 1- Nonrejection Nonrejection Region Region Critical Critical Value Value Ho Ho Value Value Sample Sample Statistic Statistic Valor observado da estatística amostral Região de Rejeição (Teste Unilateral) Distribuição Amostral Nível de Confiança Rejection Rejection Region Region 1- Nonrejection Nonrejection Region Region Critical Critical Value Value Ho Ho Value Value Sample Sample Statistic Statistic Regiões de Rejeição (Teste Bilateral) Distribuição Amostral Valor de Ho Estatística Amostral Regiões de Rejeição (Teste Bilateral) Distribuição Amostral Região de Rejeição Região de Rejeição Região de Não-rejeição Valor Estatística Amostral Valor de Ho Valor Crítico Crítico Regiões de Rejeição (Teste Bilateral) Distribuição Amostral Nível de Confiança Rejection Rejection Region Region 1/2 1/2 Rejection Rejection Region Region 1- Nonrejection Nonrejection Region Region Critical Critical Value Value 1/2 1/2 Ho Ho Sample Sample Statistic Statistic Value Critical Value Critical Value Value Regiões de Rejeição (Teste Bilateral) Distribuição Amostral Nível de Confiança Rejection Rejection Region Region 1/2 1/2 Rejection Rejection Region Region 1- Nonrejection Nonrejection Region Region Critical Critical Value Value 1/2 1/2 Ho Ho Sample Sample Statistic Statistic Value Critical Value Critical Value Value Regiões de Rejeição (Teste Bilateral) Distribuição Amostral Nível de Confiança Rejection Rejection Region Region 1/2 1/2 Rejection Rejection Region Region 1- Nonrejection Nonrejection Region Region Critical Critical Value Value 1/2 1/2 Ho Ho Sample Sample Statistic Statistic Value Critical Value Critical Value Value Regiões de Rejeição (Teste Bilateral) Distribuição Amostral Nível de Confiança Rejection Rejection Region Region 1/2 1/2 Rejection Rejection Region Region 1- Nonrejection Nonrejection Region Region Critical Critical Value Value 1/2 1/2 Ho Ho Sample Sample Statistic Statistic Value Critical Value Critical Value Value Riscos na Tomada de Decisões Erros na Tomada de Decisões 1. Erro Tipo I Rejeitar uma hipótese nula verdadeira Tem sérias conseqüências Probabilidade de erro Tipo I é (alfa) Chamado nível de significância 2. Erro Tipo II Não rejeitar uma hipótese nula falsa Probabilidade de erro Tipo II é (beta) Resultados de Decisões H0: Inocente Juri Teste de H0 Verdade Veredito Inocente Inocente Correta Culpado Erro Culp. Verdade Decision H0 Verd. Erro Não Rejeita H0 Correta Rejeita H0 1- H0 Falsa Erro Tipo II () Erro ipo Potênc I () (1 - ) Resultados de Decisões H0: Inocente Juri Teste de H0 Verdade Veredito Inocente Inocente Correta Culpado Erro Verdade Culp. Decisão H0 Verd. H0 Falsa Erro Não Rejeita H0 Tipo II Erro () Rejeita Correta H0 1- Tipo I Potênc Erro () (1 - ) e Têm uma Relação Inversa e Têm uma Relação Inversa e Têm uma Relação Inversa Não é possível reduzir ambos os erros! Passos do Teste de Hipóteses Passos para Testar H0 Formule H0 Estabeleça valores críticos Formule H1 Colete dados Escolha Calcule estatística de teste Escolha n Tome decisão estatística Escolha teste Expresse a decisão Teste Z Bilateral para a Média (Amostra Grande) Teste Z Bilateral para a Média (Amostra Grande) 1. Hipóteses: Tamanho da amostra no mínimo 30 (n 30) Se o desvio padrão populacional for desconhecido, use o desvio padrão amostral 2. Hipótese alternativa tem o sinal Teste Z Bilateral para a Média (Amostra Grande) 1. Hipóteses: Tamanho da amostra no mínimo (n 30) Se o desvio padrão populacional for desconhecido, use o desvio padrão amostral 2. Hipótese alternativa tem o sinal 3. Estatística de teste Z X xx X Z xx n Exemplo de Teste Z Bilateral Uma caixa de cereal contém 368 gramas de cereal em média? Numa amostra aleatória de 36 caixas obteve-seX = 372,5. A companhia especificou que é 15 gramas. Teste ao nível de 0,05. 368 g Solução do Teste Z Bilateral H0: = 368 Estatística de Teste: H1: 368 X 372.5 368 Z 1.80 0,05 15 n 36 n 36 Valores Críticos: Decisão: Reject H00 Reject H00 Não rejeitar com = 0,05 .025 .025 Conclusão: Não há evidência que a média não é 368 -1.96 0 1.96 Z Questão Você quer saber se uma empresa está fabricando cabos elétricos de acordo com a especificação do cliente: resistência média à quebra de 70 lb com = 3,5 lb. Você seleciona uma amostra de 36 cabos e calcula uma média amostral de 69,7 lb. Ao nível de 0,05, há evidência que a máquina não esteja obedecendo a especificação? Solução do Teste Z Bilateral H0: = 70 H1: 70 = 0,05 n = 36 Valores Críticos: Reject H00 Reject H00 .025 .025 -1.96 0 1.96 Z Estatística de Teste: X 69.7 70 Z .51 3.5 n 36 Decisão: Não rejeitar com = 0,05 Conclusão: Não há evidência que a média não seja 70 Teste Z Unilateral para a Média (Amostra Grande) Teste Z Unilateral para a Média (Amostra Grande) 1. Hipóteses: Tamanho da amostra no mínimo 30 (n 30) Se o desvio padrão populacional for desconhecido, use o desvio padrão amostral 2. Hipótese alternativa tem o sinal < ou > Teste Z Unilateral para a Média (Amostra Grande) 1. Hipóteses: Tamanho da amostra no mínimo (n 30) Se o desvio padrão populacional for desconhecido, use o desvio padrão amostral 2. Hipótese alternativa tem o sinal ou > 3. Estatística de teste Z X xx X Z xx n Teste Z Unilateral para a Média H0:= 0 H1: < 0 H0:= 0 H1: > 0 Reject Reject H H00 Reject Reject H H00 00 Deve ser significativamente abaixo de Z Z 00 Valores pequenos satisfazem H0 . Não rejeitar! Z Z Teste Z Unilateral: Achando Z Crítico Quanto é Z dado = 0,025? =1 = 0,025 0 Z Teste Z Unilateral: Achando Z Crítico Quanto é Z dado = 0,025? 0,500 - 0,025 0,475 =1 = 0,025 0 Z Teste Z Unilateral: Achando Z Crítico Quanto é Z dado = 0,025? 0,500 - 0,025 0,475 =1 Z .05 .06 .07 1.6 .4505 .4515 .4525 = 0,025 0 Tabela da Normal Padrão: Z 1.7 .4599 .4608 .4616 1.8 .4678 .4686 .4693 1.9 .4744 .4750 .4756 Teste Z Unilateral: Achando Z Crítico Quanto é Z dado = 0,025? 0,500 - 0,025 0,475 =1 Tabela da Normal Padrão: Z .05 .06 .07 1.6 .4505 .4515 .4525 = 0,025 0 1.96 Z 1.7 .4599 .4608 .4616 1.8 .4678 .4686 .4693 1.9 .4744 .4750 .4756 Exemplo de Teste Z Unilateral Uma caixa de cereal contém mais de 368 gramas de cereal em média? Numa amostra aleatória de 36 caixas obteve-seX = 372,5. A companhia especificou que é 15 gramas. Teste ao nível de 0,05. 368 g Solução do Teste Z Unilateral H0: = 368 H1: > 368 = 0,05 n = 36 Valor Crítico: Estatística de Teste: Z Reject .05 0 1.645 Z X 372.5 368 1.80 15 n 36 Decisão: Rejeitar com = 0,05 Conclusão: Há evidência que a média é maior que 368 Nível de Significância Observado: Valor p Valor p 1. Probabilidade de obter uma estatística de teste no mínimo tão extrema (ou do que o valor amostral obtido dado que H0 é verdadeira 2. Chamado nível de significância observado Menor valor de que faz H0 ser rejeitada 3. Usado para tomar decisões de rejeição Se valor p , não rejeitar H0 Se valor p < , rejeitar H0 Exemplo do Valor p para o Teste Z Bilateral Uma caixa de cereal contém 368 gramas de cereal em média? Numa amostra aleatória de 36 caixas obteve-seX = 372,5. A companhia especificou que é 25 gramas. Ache o valor p. 368 g Solução do Valor p para o Teste Z Bilateral Z X 372.5 368 1.80 15 n 36 -1.80 0 1.80 Z Valor Z da estatística amostral (observado) Solução do Valor p para o Teste Z Bilateral Valor p = P(Z -1,80 ou Z 1,80) -1.80 0 1.80 Z Valor Z da estatística amostral (observado) Solução do Valor p para o Teste Z Bilateral Valor p = P(Z -1,80 ou Z 1,80) 1/2 p-value 1/2 p-value -1.80 0 1.80 Z Valor Z da estatística amostral (observado) Solução do Valor p para o Teste Z Bilateral Valor p = P(Z -1,80 ou Z 1,80) 1/2 p-value 1/2 p-value .4641 -1.80 0 1.80 Da tabela Z: olhar 1,80 Z Valor Z da estatística amostral (observado) Solução do Valor p para o Teste Z Bilateral Valor p = P(Z -1,80 ou Z 1,80) 1/2 p-value 1/2 p-value .4641 -1.80 0 1.80 Da tabela Z: olhar 1,80 0,5000 - 0,4641 0,0359 Z Valor Z da estatística amostral (observado) Solução do Valor p para o Teste Z Bilateral Valor p = P(Z -1.80 ou Z 1.80) = 0,0718 1/2 p-value .0359 1/2 p-value .0359 .4641 -1.80 0 1.80 Da tabela Z: olhar 1,80 0,5000 - 0,4641 0,0359 Z Valor Z da estatística amostral (observado) Solução do Valor p para o Teste Z Bilateral 1/2 valor p = 0,0359 Reject 1/2 valor p = 0,0359 Reject 1/2 = 0,025 1/2 = 0,025 -1.80 0 1.80 Z Solução do Valor p para o Teste Z Bilateral 1/2 valor p = 0,0359 Reject 1/2 valor p = 0,0359 Reject 1/2 = 0,025 1/2 = 0,025 -1.80 0 1.80 Z (valor p = 0,0718) ( = 0,05). Não rejeitar. Calculando a Probabilidade de Erro Tipo II Potência do Teste 1. Probabilidade de rejeitar falsa H0 Decisão correta 2. Designada por 1 - 3. Usada para determinar adequação do teste 4. Afetada por: Valor verdadeiro do parâmetro populacional Nível de significância Desvio padrão e tamanho da amostra n Achando a Potência: Passo 1 Hipótese: H0: 0 368 H1: 0 < 368 n = 15/25 Rejeitar = 0,05 Não Desenhar Rejeitar 0 = 368 X Achando a Potência: Passo 2 Hipótese: H0: 0 368 H1: 0 < 368 Situação ‘Verdadeira’: 1 = 360 Especificar n = 15/25 Rejeitar = 0,05 Não Desenhar Rejeitar 0 = 368 X Achando a Potência: Passo 3 Hipótese : H0: 0 368 H1: 0 < 368 Situação ‘Verdadeira’: 1 = 360 n = 15/25 Rejeitar Não Desenhar Rejeitar = 0,05 0 = 368 Desenhar Especificar 1 = 360 X X Achando a Potência: Passo 3 Hipótese : H0: 0 368 H1: 0 < 368 Situação ‘Verdadeira’: 1 = 360 n = 15/25 Rejeitar Não Desenhar Rejeitar = 0,05 0 = 368 Desenhar Especificar 1 = 360 X X Achando a Potência: Passo 3 Hipótese : H0: 0 368 H1: 0 < 368 Situação ‘Verdadeira’: 1 = 360 n = 15/25 Rejeitar Não Desenhar Rejeitar = 0,05 0 = 368 Desenhar Especificar 1 = 360 X X Achando a Potência: Passo 3 Hipótese: H0: 0 368 H1: 0 < 368 Situação ‘Verdadeira’: 1 = 360 Especificar n = 15/25 Rejeitar Não Desenhar Rejeitar = 0,05 0 = 368 Desenhar 1- 1 = 360 X X Achando a Potência: Passo 4 Hipótese : H0: 0 368 H1: 0 < 368 n = 15/25 Rejeitar Não Desenhar Rejeitar = 0,05 0 = 368 Situação ‘Verdadeira’: 1 = 360 Especificar Desenhar X XL 0 Z n 368 (1,645) 363,065 1 = 360 363,065 X 15 25 Achando a Potência: Passo 5 Hipótese: H0: 0 368 H1: 0 < 368 Situação ‘Verdadeira’: 1 = 360 Especificar n = 15/25 Rejeitar Não Desenhar Rejeitar = 0,05 0 = 368 Desenhar Tabela Z X XL 0 Z = .154 1- =.846 n 368 (1,645) 363,065 1 = 360 363,065 X 15 25 Curvas de Potência Potência H0: 0 Possíveis valores verdadeiros de 1 = 368 ilustrada Curvas de Potência Potência H0: 0 Possíveis valores verdadeiros de 1 Potência H0: 0 Possíveis valores verdadeiros de 1 = 368 ilustrada Curvas de Potência Potência H0: 0 Potência H0: 0 Possíveis valores verdadeiros de 1 Potência H0: =0 Possíveis valores verdadeiros de 1 Possíveis valores verdadeiros de 1 = 368 ilustrada Teste t Bilateral para a Média (Amostra Pequena) Teste t para a Média (Amostra Pequena) 1. Hipóteses: Tamanho da amostra é menor que 30 (n < 30) População tem distribuição normal Desvio padrão populacional é desconhecido Teste t para a Média (Amostra Pequena) 1. Hipóteses: Tamanho da amostra é menor que 30 (n < 30) População tem distribuição normal Desvio padrão populacional é desconhecido 3. Estatística de teste T X t S n Teste t Bilateral: Achando os Valores Críticos de t Dado: n = 3; = 0,10 gl = n - 1 = 2 Tabela de valores críticos de t /2 = 0,05 v t.10 .10 t.05 .05 t.025 .025 1 3.078 6.314 12.706 2 1.886 2.920 4.303 0 /2 = 0,05 t 3 1.638 2.353 3.182 Teste t Bilateral: Achando os Valores Críticos de t Dado: n = 3; = 0,10 gl = n - 1 = 2 Tabela de valores críticos de t /2 = 0,05 v t.10 .10 t.05 .05 t.025 .025 1 3.078 6.314 12.706 2 1.886 2.920 4.303 -2.920 0 2.920 t /2 = 0,05 3 1.638 2.353 3.182 Exemplo de Teste t Bilateral Uma caixa de cereal contém 368 gramas de cereal em média? Numa amostra aleatória de 25 caixas obteve-se uma média de 372,5 e um desvio padrão de 12 gramas. Suponha uma distribuição normal. Teste ao nível de 0,05. 368 g Solução do Teste t Bilateral H0: = 368 Estatística de Teste: H1: 368 X 372.5 368 t 1.875 = 0,05 S 12 gl = 25 - 1 = 24 n 25 Valores Críticos: Decisão: Reject H00 Reject H00 Não rejeitar com = 0,05 .025 .025 Conclusão: -2.064 0 2.064 t Não há evidência que média populacional não é 368 Teste t Unilateral para a Média (Amostra Pequena) Exemplo de Teste t Unilateral A capacidade média de baterias é no mínimo 140 ampéres-horas? Numa amostra aleatória de 20 baterias obteve-se uma média de 138,47 e um desvio padrão de 2,66. Suponha uma distribuição normal. Teste ao nível de 0,05. Solução do Teste t Unilateral H0: = 140 Estatística de Teste: H1: < 140 X 138.47 140 t 2.57 = 0,05 S 2.66 gl = 20 - 1 = 19 n 20 Valor Crítico: Decisão: Reject Rejeitar com = 0,05 .05 -1.729 0 t Conclusão: Há evidência que a média é menor que 140 Teste Z para a Proporção Teste Z para a Proporção 1. Hipóteses: Dois resultados categóricos População segue distribuição binomial Aproximação pela Normal pode ser usada np ˆ 3 npˆ (1 pˆ ) não contém 0 ou n Teste Z para a Proporção 1. Hipóteses: Dois resultados categóricos População segue distribuição binomial Aproximação pela Normal pode ser usada np ˆ 3 npˆ (1 pˆ ) não contém 0 ou n 2. Estatística de teste Z para a proporção p p00 Z p00 (1 p00) n Proporção populacional suposta Exemplo de Teste Z para Proporção O sistema atual de empacotamento produz 10% de caixas de cereal defeituosas. Usando um novo sistema, uma amostra aleatória de 200 caixas teve 11 defeitos. O novo sistema produz menos defeitos? Teste ao nível de 0,05. Solução do Teste Z para a Proporção H0: p = 0,10 Estatística de Teste: 11 H1: p < 0,10 .10 p p00 200 Z 2.12 = 0,05 p00 (1 p00) .10 (1 .10) n = 200 n 200 Valor Crítico: Decisão: Reject Rejeitar com = 0,05 .05 Conclusão: Há evidência que novo -1.645 0 Z sistema < 10% defeituosas Teste para a Variância Teste para a Variância 1. Hipóteses: Amostragem aleatória População tem distribuição normal Teste para a Variância 1. Hipóteses: Amostragem aleatória População tem distribuição normal 2. Estatística de teste 2 2 (n 1) s 2 2 Exemplo de Teste Bilateral para a Variância A variância da capacidade das baterias produzidas é 4,20 ampéres-horas2? Numa amostra aleatória de 20 baterias obteve-se uma média de 138,47 e uma variância de 7,08. Suponha uma distribuição normal. Teste ao nível de 0,10. Solução do Teste 2 Bilateral H0: 2 = 4,20 H1: 2 4,20 = 0,10 gl = 20 - 1 = 19 Valores Críticos: 2 0,05;19 = 30,144 20,95;19 = 10,117 Estatística de Teste: 2 (n 1) s 2 2 (20 1) 7,08 32,03 4,20 Decisão: Rejeitar com = 0,10 Conclusão: Há evidência que a variância é diferente de 4,20