HEP-5800 – BIOESTATÌSTICA UNIDADE IV INFERÊNCIA ESTATÍSTICA: TESTES DE HIPÓTESES Nilza Nunes da Silva Regina I. T. Bernal I. QUADRO CONCEITUAL São procedimentos estatísticos que consistem em usar dados de amostras (ESTIMATIVAS) para tomar decisões sobre rejeição de hipóteses construídas a respeito de valores populacionais. PROCEDIMENTO 1. Problema científico A SAÚDE ORAL DE CRIANÇAS COM 12 ANOS DE IDADE É PRECÁRIA. Ou Seja, o número de dentes estragados é alto. Ou ainda, a população apresenta CPOD médio superior a 7. 2. Hipóteses estatísticas Nula H0 : Alternativa H1 : 7 > igualdade 7 maior.............teste unilateral 3. Fixa critério de decisão........para decidir rejeição de Ho. NÍVEL DE SIGNIFICÂNCIA (α) = probabilidade REJEITAR H0 , sendo H0 verdadeira. (α ) =0,05 0,05 0,05 z 0 - + x z 0 4. Identifica valor de (z) para (α) = 0,05 ........z0,05 = 1,64 5. Sorteia a amostra aleatória simples (n>30) 6. Calcula estimativas da média e respectivo erro padrão (x dp(x ) 8 ; sx = 3) 3 30 3 5,5 0,55 7. Calcula valor de z .....admitindo H0 verdadeira z 8 7 0,55 1 1,82 0,55 8. Compara z calculado com z0,05 ( 1,82 > 1,64 )......está localizado na região de rejeição do teste, portanto, 9. Decisão........Rejeita H0, com risco de errar igual a 5%. Portanto, há evidências de que a média do cpod na população é maior que 7. Bioestatística II 1 II. TIPOS DE TESTE Os testes podem ser bicaudais ou unicaudais. Observe que no exemplo anterior, a hipótese científica indicou a direção da hipótese alternativa. Se o pesquisador desejasse apenas mostrar que a média da população é igual a 7, a hipótese nula continuaria a mesma, mas a hipótese alternativa referiria apenas que o cpod médio é diferente de 7 (maior ou menor). Nula H0 : Alternativa H1 : 7 igualdade diferente..........teste bicaudal 7 TESTE BICAUDAL (α ) =0,05 0,025 0,025 0 - -1,96 0 + x z 1,96 Z0,05 = 1,96 ZCALCULADO na amostra anterior = 1,82 1,82 < 1,96...................fora da região de rejeição decisão: não rejeita H0, sob com risco de errar igual a 5%. Portanto, há evidências para admitir que o cpod médio da população é igual 7. OBSERVAÇÃO verdadeira Rejeita H0 pode ser falsa Rejeita ERRO TIPO I (α ) =0,05 ( (α ) Não há erro A direção do teste bicaudal é definida pela hipótese científica, antes de sortear a amostra. Perceba que o intervalo de confiança (95%) para a média populacional 6,9|-------|9,1 conteria o valor 7. x 1,96 dp ( x ) 8 1,96.0,55 8 1,078 Bioestatística II 2 III. TESTE PARA UMA MÉDIA COM DESVIO PADRÃO DESCONHECIDO Quando é usado o desvio padrão de X estimado na amostra e se n < 100 usa-se a distribuição t de Student com (n-1) graus de liberdade para identificar a região de rejeição e o t crítico. No exemplo anterior suponha que o sX = 3,5 α = 0,05 n-1 graus de liberdade então t(calculado) = 1,355 t(critico) = 1,83 1,355 < 1,83 , não há evidências para rejeitar H0. Ao nível de significância de 5% o CPOD MÉDIO da população é igual a 7. 7 H0 : H1 : > 7 ???E se o teste fosse bicaudal????Qual a decisão a respeito de H0 .??? IV - TESTE PARA UMA PROPORÇÃO RESTRIÇÕES............... np e nq maiores que 5 H0 : P = 0,5 H1 : P 0,5 Sob H0 ; a proporção amostral tem distribuição normal com média igual a 0,5 e erro padrão calculado por 0,5 x0,5 . n (α ) =0,05 0,025 - -1,96 Bioestatística II 0,025 0 0 + x z 1,96 3 Em uma amostra de 200 crianças, 80 eram desnutridas. Qual a decisão que podemos tomar sobre REJEITAR H0 com nível de significância igual a 5%? Z(calculado) = 0,4 0,5 0,03464 2,88 z(critico)0,05 = -1,96 Há evidências para rejeitar H0. Ao nível de significância de 5% admitimos que a proporção de crianças desnutridas na população é diferente de 50%. OBSERVAÇÃO: Note que se o teste fosse monocaudal à esquerda, continuaríamos rejeitando a hipótese de igualdade H0. Mas aceitaríamos que a proporção de crianças desnutridas na população é menor que 50%. H0 : P = 0,5 H1 : P < 0,5 0,05 0,05 - -1,64 0 + z x Zcalculado = -2,88 ????rejeita H0 V. SÍNTESE DO PROCEDIMENTO PROBLEMA CIENTÍFICO------------DEFINE HO E H1 SELECIONA A DISTRIBUIÇÃO NORMAL Z ( 0, 1 ) FIXA O NÍVEL DE SIGNIFICANCIA (α ) -----------DEFINE O Z CRÍTICO ( Z0,05 ) SORTEIA A AMOSTRA ALEATÓRIA SIMPLES OU SISTEMÁTICA (De preferência n>30) CALCULA AS ESTIMATIVAS ( x ou p, e respectivos erros padrão) x μ0 dp( x) DECIDE SE REJEITA OU NÃO H0......NÍVEL DE SIGNIFICÂNCIA ( α ) PADRONIZA ESTIMATIVAS usando a expressão z(calculado) = Bioestatística II 4 INTERPRETA RESULTADO À LUZ DO PROBLEMA CIENTÍFICO II - Critérios de decisão Hipóteses Alternativas H1 MENOR Zcrítico Rejeita H0 , se (α ) = 0,05 Zcalc < - 1,64 Z0,05 = - 1,64 (α ) = 0,05 H1 MAIOR Zcalc > 1,64 Z0,05=1,64 H1 DIFERENTE (α ) / 2= 0,05/2 Z 0,05= 1,96 ou –1,96 Valor absoluto de zcalc > 1,96 ou < -1,96. VI. PODER DO TESTE Vimos nos procedimentos anteriores, que a regra de decisão se baseou apenas no nível de significância ( ). A decisão de rejeitar ou não H0, determina dois possíveis erros em relação à realidade do problema alvo da pesquisa. REALIDADE H0 DECISÃO ERRO PROBABILIDADE VERDADEIRA REJEITAR I (ALFA) FALSA ACEITAR II (BETA) PARA ALFA FIXADO, PODE-SE CONTROLAR A PROBABILIDADE DO ERRO TIPO II, (ACEITAR H0 FALSA). Suponha que estamos testando as hipóteses abaixo. H0 : 20 H1 : 20 AAS, (.n=25 ; σX 5 ; σx Nível de significância = Bioestatística II 1) = 0,05 5 A hipótese nula será rejeitada se a média estimada, na amostra sorteada, for maior que 21,6. 20 a distribuição amostral corresponde à distribuição normal representada Pois, sob H0 : na figura 1. Zcritico = 1,64......= x μ0 x 20 ........=... ............> x dp( x) 1 20 Suponha agora que H0 é falsa. Ou seja, na realidade = 21,64 é a verdade. Se não rejeitássemos a hipótese nula, estaríamos cometendo o erro tipo II. Ou seja, (aceitando H0 falsa), pois a média populacional é 23. 23 ) Então a probabilidade de obter valores menores que 21,64 sob H1 ( ( ) = 0,087. é dado por H0 0,05 + - 20 20 - x H1 21,64 + 23 23 x (1 ) é então a probabilidade de rejeitar H0 quando na realidade ela é falsa. Chama-se o poder do teste. SÍNTESE: REALIDADE DECISÃO H0 VERDADE H0 FALSA CORRETA REJEITAR H0 ACEITA H0 Bioestatística II ERRO TIPO I ( ) (1 CORRETO (1 - Poder Teste ) ) ERRO TIPO II ( ) 6 VII. TESTE DE HIPÓTESES PARA AS MÉDIAS DE DUAS POPULAÇÕES CORRELATAS Para estudar o efeito de certa dieta sobre o aumento de peso em adultos normais, estudaram-se os resultados da tabela abaixo. Note que o mesmo indivíduo tem duas medidas e que esses resultados não podem ser considerados independentes. Peso antes e depois do uso da dieta. N.INDIVÍDUO 1 4 3 4 5 6 7 8 9 10 11 12 13 14 15 PESO ANTES (pa) 54 61 50 74 80 62 58 55 49 63 67 70 71 75 66 PESO DEPOIS (pd) 56 65 52 73 82 60 58 56 53 63 68 72 72 79 72 .d= (pd – pa) 2 4 2 -1 2 -2 0 1 4 0 1 2 1 4 6 _ H0 : D= 0 _ H1 : D >0 _ (n = 15 ) ; d = 26/15 = 1,73 kg. t (calculado ) = d 0 2,12 / 15 sd = 2,12 kg . 3,16 e t(14gl ; 0,05 ) = 1,76 . Decisão ( 3,16 > 1,76 ) Rejeita-se H0 ao nível de significância de 0,05. Pode-se esperar que a dieta aumente em média o peso dos indivíduos. Bioestatística II 7 Exercícios 1) Desejando-se conhecer a média de consumo de carne em uma determinada população, selecionou-se uma amostra aleatória de 100 pessoas. Os resultados mostraram que, em média, os indivíduos consumiam 1.000 g/mês (desvio padrão de 625g). Teste a hipótese de que o consumo médio dessa população está de acordo com o esperado, que é 1.200g/mês, ( =10%). 2) Admite-se que a quantidade de carne ingerida por pessoa por semana (com renda familiar menor do que 3 salários mínimos e tamanho da família de 5 membros), na região sudeste, possui distribuição normal com média 600g e desvio padrão 100g. Deseja-se saber se no subdistrito de Pirituba o consumo médio é menor do que esta quantidade. Para isto foi conduzida uma pesquisa, com nível de significância de 5%, cujos valores amostrais de consumo são apresentados a seguir. Elabore de forma completa o teste de hipótese. Consumo médio semanal (em gramas): 300; 400; 350; 450; 100; 220; 150; 500; 900; 800; 600; 150; 50; 170; 370; 200; 3) Em uma amostra aleatória de 50 alunos encontrou-se que a altura média foi de 165 cm (desvio padrão de 15 cm). Testar a hipótese de que essa média é igual ao esperado, sabendo-se que a média padrão é 170 cm (desvio padrão conhecido igual a 20 cm) ( =5%). 4) A fim de acelerar o tempo que um analgésico leva para penetrar na corrente sanguínea, um químico analista acrescentou certo componente à fórmula original, que acusava um tempo de médio de 43 minutos. Em 36 observações com a nova fórmula, obteve-se um tempo médio de 42 minutos, com desvio padrão de 6 minutos. a) O que podemos concluir, ao nível de 5% de significância, sobre a eficiência do novo componente? b) Qual seria a resposta ao nível de 1%? c) Que tipo de erro pode ser cometido? 5) No problema de teste de hipóteses, descreva os conceitos : a) de hipótese nula e alternativa, b) erro tipo I , nível de significância e região crítica. c) erro tipo II, poder do teste . 6) Tente comparar a inferência estatística mediante INTERVALO DE CONFIANÇA (95%) e TESTES DE HIPÓTESES, nível significância 5% . Bioestatística II 8