Teste de Hipótese e Intervalo de Confiança Parte 2 Questões para discutirmos em sala: O que é uma hipótese estatística? O que é um teste de hipótese? Quem são as hipóteses nula e alternativa? Quando devemos rejeitar a hipótese nula? Estamos prontos, agora, para aprendermos o primeiro teste de hipótese. Vamos testar a média de uma população, supondo que conhecemos a variância. Considere o problema de determinar a média do tamanho da ruptura muscular no ombro... suponha temos uma amostra com 25 pacientes e que a variância seja dada e igual a 1. Relembrando: Teste de Hipótese – Passo a Passo 1) Identifique o parâmetro de interesse média 2) Estabeleça H0 e Ha H0: = 3,5; Ha: 3,5 3) Estabeleça o nível de significância que determinará a região de rejeição = 0,05 Relembrando: Teste de Hipótese – Passo a Passo 4) Estabeleça uma estatística apropriada de teste É o que determina o teste! Relembrando: Teste de Hipótese – Passo a Passo 4) Estabeleça uma estatística apropriada de teste Média amostral Valor de H0 __ Z0 Raiz da variância ou Desvio Padrão X 0 n Tamanho da amostra Relembrando: Teste de Hipótese – Passo a Passo 5) Calcule o valor da estatística Vamos supor que a média amostral tenha sido 3,1. 3,1 3,5 __ Z0 1 X 0 n 25 Relembrando: Teste de Hipótese – Passo a Passo 5) Calcule o valor da estatística 3,1 3,5 0,4 4 10 4 5 Z0 2 1 1 1 10 1 5 5 25 Relembrando: Teste de Hipótese – Passo a Passo 6) Decida de H0 deve ou não ser rejeitada. Precisamos estabelecer o valor crítico. Região de Rejection rejeição Region Região de Rejection rejeição Region 1- 1/2 1/2 Nonrejection Region Critical Valor Value crítico -z/2 Ho Sample Statistic Value Critical Valor Value crítico z/2 Relembrando: Teste de Hipótese – Passo a Passo 6) Decida de H0 deve ou não ser rejeitada. Para = 0,05, em um teste z bicaudal, os valores críticos são -z/2 = -1,96 e z/2 = 1,96. Valor crítico: Rejeitar RejectHH 0 0 .025 RejeitarHH0 Reject 0 .025 -1.96 0 1.96 Z Relembrando: Teste de Hipótese – Passo a Passo 6) Decida de H0 deve ou não ser rejeitada. A hipótese nula será rejeitada se: Z0 > z/2 ou Z0 < -z/2 E falharemos em rejeitar se: -z/2 < Z0 < z/2 Relembrando: Teste de Hipótese – Passo a Passo 6) Decida de H0 deve ou não ser rejeitada. Temos que Z0 = -2 e -z/2 = -1.96 Como -2 < -1,96 H0 é rejeitada. Relembrando: Teste de Hipótese – Passo a Passo Isto significa que: Com uma amostra de 25 pacientes e com variância igual a 1... e uma média amostral de 3,1... A hipótese nula de que a média dos dados é 3,5 é rejeitada. Teste Z – Inferência sobre a Média da População com Variância Conhecida Este teste que acabamos de estudar é conhecido como teste Z... porque usa a estatística de teste baseada em uma normal padrão (média zero e variância 1). Chamamos uma normal padrão de Z. Vamos verificar formalmente como é definido o teste Z... Teste Z – Inferência sobre a Média da População com Variância Conhecida Suponha que desejamos testar a hipótese: H0: = 0 Sendo 0 uma constante especificada. Considere uma amostra aleatória X1, X2, ..., Xn da população e a variância 2 da população dada. Teste Z – Inferência sobre a Média da População com Variância Conhecida Calcule a estatística de teste: __ Z0 X 0 n H0: H0: = 0 Ha: Ha: 0 Critérios de rejeição: H0: 0 Ha: > 0 Z0 > z H0: 0 Ha: < 0 Z0 < -z Z0 > z/2 ou Z0 < -z/2 p-valor O p-valor é o valor de significância observado Se p-valor , NÃO rejeita H0 Se p-valor < , REJEITA H0 Levamos ao laboratório uma amostra aleatória de 25 caixas e constatamos uma média do princípio ativo de 372.5 mg. O fabricante especifica que a média de principio ativo é 368 mg e que o desvio é de 15 mg. Queremos achar o p valor. Genérico 368 mg X 372.5 368 Z 1.50 15 n 25 -1.50 0 1.50 Z Valor amostral da estatística Z (observado) O p-valor é P(Z -1.50 ou Z 1.50) -1.50 0 1.50 Z Valor amostral da estatística Z (observado) O p-valor é P(Z -1.50 ou Z 1.50) 1/2 p-Value ½ p-valor -1.50 0 1/2½p-Value p-valor 1.50 Z Valor amostral da estatística Z (observado) O p-valor é P(Z -1.50 ou Z 1.50) 1/2 p-Value ½ p-valor 1/2½p-Value p-valor 0.433 -1.50 0 Calculado através de tabela ou no computador 1.50 Z Valor amostral da estatística Z (observado) O p-valor é P(Z -1.50 ou Z 1.50) 1/2 p-Value ½ p-valor 1/2½p-Value p-valor 0.500 - 0.433 = 0.067 0.433 -1.50 0 Calculado através de tabela ou no computador 1.50 Z Valor amostral da estatística Z (observado) O p-valor é P(Z -1.50 ou Z 1.50) = 0.134 1/2 p-Value ½ p-valor 1/2½p-Value p-valor 0.500 - 0.433 = 0.067 0.433 -1.50 0 Calculado através de tabela ou no computador 1.50 Z Valor amostral da estatística Z (observado) (p-valor = 0.134) ( = 0.05). Então: NÃO rejeita a hipotese H0 1/2 p-valor = 0.067 1/2 p-valor = 0.067 Reject Rejeita Reject Rejeita 1/2 = 0.025 1/2 = 0.025 -1.50 0 1.50 Z Observe que no teste z, a variância da população é dada... entretanto, em problemas reais, isto não é algo comum. e se precisarmos de um teste de hipótese para médias e não conhecermos a variância da população? Teste T – Inferência sobre a Média da População com Variância Desconhecida E se a variância não for conhecida? Muitas vezes não conhecemos populacional dos nossos dados. a variância Usaremos, então, o teste T. A única diferença para o teste z é que aqui a variância não é conhecida. Vamos testar a média de uma população, sem conhecemos a variância. Considere o problema de determinar a média do tamanho da ruptura muscular no ombro... suponha temos uma amostra com 25 pacientes. Relembrando: Teste de Hipótese – Passo a Passo 1) Identifique o parâmetro de interesse média 2) Estabeleça H0 e Ha H0: = 3,5; Ha: 3,5 3) Estabeleça o nível de significância que determinará a região de rejeição = 0,05 Relembrando: Teste de Hipótese – Passo a Passo 4) Estabeleça uma estatística apropriada de teste Média amostral Valor de H0 __ X 0 T0 S Desvio padrão amostral n Tamanho da amostra Relembrando: Teste de Hipótese – Passo a Passo 5) Calcule o valor da estatística Vamos supor que a média amostral tenha sido 3,1 e que o desvio amostral tenha sido 0,7. 3,1 3,5 __ X 0 T0 S 0,7 n 25 Relembrando: Teste de Hipótese – Passo a Passo 5) Calcule o valor da estatística 3,1 3,5 0,4 4 10 4 50 T0 2,86 0,7 0,7 7 10 7 50 5 25 Relembrando: Teste de Hipótese – Passo a Passo 6) Decida de H0 deve ou não ser rejeitada. Para = 0,05, em um teste t bicaudal com 24 graus de liberdade, os valores críticos são -t/2 = 2,39 e t/2 = 2,39. Relembrando: Teste de Hipótese – Passo a Passo 6) Decida de H0 deve ou não ser rejeitada. Temos que t0 = -2,86 e -t/2 = -2,39 Como -2,86 < -2,39 H0 é rejeitada. Na prática: Teremos nossos dados e vamos querer testar hipóteses. Precisamos saber: Unicaudal ou bicaudal Uma ou duas populações identificar o parâmetro a ser testado; formular os testes, identificando corretamente as hipóteses nula e alternativa; identificar o teste e executá-lo no computador. Intervalos de Confiança Suponha que temos uma população NORMAL de média e desvio e que vamos adquirir algumas amostras desta população. Podemos para cada uma destas amostras calcular a média amostral Xa Qual o erro que vamos incorrer ao usar esta media amostral para estimar a média da populacao ? Será que podemos estabelecer um intervalo de confiança em torno de Xa dentro do qual acreditamos encontrar a média da populacao ? Se adquirimos muitas amostras de tamanho ‘n’, as médias amostrais Xa terão uma distribuição, como é esta distribuição? É UMA NORMAL COM MÉDIA e DESVIO Xa n Suponha que uma média amostral Xa cai dentro da área amarela, O número 2 é uma aproximação. Na verdade teremos 1,96: X a 1,96 X a Note que Xa é o desvio da distribuição das médias amostrais Como Xa tem uma probabilidade de 0,95 de cair neste intervalo temos que a probabilidade do intervalo X a 1,96 X a conter é 0,95. Construímos então um intervalo de confiança de 0,95 de probabilidade. Isso quer dizer que se sortearmos um grande número de observações, cerca 95% destas observações terão a média verdadeira incluída dentro do intervalo de confiança. Um hospital decide fazer uma pesquisa para estimar o tempo médio de internação. Portanto, o que deve ser estimado é o tempo médio de uma população a qual não se pode ter acesso. Para isso colhe-se uma amostra de tamanho 100, isso é sorteia-se 100 pacientes entre os que já passaram pelo hospital, e verifica-se o tempo de internação O resultado (em dias) é: A média amostral é Xa= 4,53 dias, com um desvio amostral s = 3,68 dias. Então nosso intervalo de confiança de 95% é: X a 2 X a 4,53 1,96 100 Como não temos o desvio da população , vamos usar o desvio amostral s, que se aproxima de a medida que se tem um ‘n’ grande. s 3,68 4,53 1,96 4,53 1,96 4,53 1,96 100 100 100 4,53 0,72 ou seja, nossos dados nos levam a concluir que 95% de segurança a média de internação nesse hospital está entre 3,81 e 5,25 dias . Note, diretamente da formula do intervalo que a medida que o ‘n’ cresce o intervalo diminui, ou seja com o mesmo nível de segurança (95%) pode-se afirmar um intervalo menor. Portanto a afirmação é feita com mais precisão. Este intervalo de confiança é feito para média com variância conhecida. Se quisermos um intervalo associado com outro valor crítico, em um teste bicaudal: X a z / 2 X a Se o teste for unicaudal: X a z X a Se o desvio não for dado, teremos um teste T. Para obter o intervalo associado, basta trocar o valor crítico e calcular o desvio amostral: X a t / 2,n1s X a