Estatística II – Antonio Roque – Aula 12 Testes de Hipóteses sobre uma Proporção Populacional Seja o seguinte problema: Estamos interessados em saber que proporção de motoristas da população usa cinto de segurança regularmente. Em uma pesquisa com 300 motoristas, 123 deles disseram que usam regularmente o cinto de segurança. Podemos concluir desses dados que a proporção de motoristas que usa cinto de segurança é inferior a 50% ? Para a amostra obtida, p̂ = 123/300 = 0,41. A hipótese nula a ser testada neste caso é: H0: p ≥ 0,5 H1: p < 0,5 onde p é a proporção populacional de motoristas que usam o cinto de segurança regularmente. Portanto, o teste é unilateral. Nas aulas sobre distribuições amostrais, vimos que a distribuição amostral de p̂ pode ser aproximada por uma distribuição normal se tanto np como n(1 − p) forem maiores ou iguais a 5. No nosso caso, com p = 0,5, np = n(1 − p) = 300x0,5 = 150, o que garante que podemos usar a variável z para fazer o cálculo de P. A distribuição amostral de p̂ é aproximadamente normal com média µ pˆ = p = 0,5 e desvio padrão σ pˆ = p (1 − p ) = n 0,5 × 0,5 = 0,0289. 300 Portanto, o valor P é calculado a partir de 1 Estatística II – Antonio Roque – Aula 12 z= pˆ − p σ pˆ = 0,41 − 0,50 0,09 =− = −3,11. 0,0289 0,0289 Consultando a tabela da distribuição normal reduzida, vemos que P = 0,5 – 0,49906 = 0,00094. Portanto, P < α . Logo, rejeitamos a hipótese nula e concluímos que os dados sugerem que a proporção de motoristas que usa o cinto de segurança regularmente é menor do que 50%. Testes de Hipóteses sobre a Diferença entre as Proporções de Duas Populações Vamos considerar o seguinte exemplo: Uma empresa que presta serviços de assessoria econômica a empresas está interessada em comparar a taxa de reclamações sobre os seus serviços em dois dos seus escritórios em duas cidades diferentes. Suponha que a empresa tenha selecionado aleatoriamente 100 serviços realizados pelo seu escritório na cidade A e 120 serviços realizados pelo seu escritório na cidade B. Dos 100 serviços da cidade A, em 12 deles houve algum tipo de reclamação feita pelas empresas que receberam os serviços e dos 120 serviços da cidade B, 18 receberam algum tipo de reclamação. Portanto, as proporções amostrais de reclamações sobre os serviços dos escritórios das cidades A e B são, respectivamente, pˆ 1 = 12 = 0,12 e 100 pˆ 2 = 18 = 0,15. 120 2 Estatística II – Antonio Roque – Aula 12 A empresa deseja saber se estes resultados são suficientes para se concluir que os dois escritórios apresentam diferenças significativas nas suas taxas de reclamações. A hipótese nula a ser testada neste caso é: H0: p1 – p2 = 0 H1: p1 – p2 ≠ 0. Portanto, o teste a ser feito é bilateral. A primeira coisa a fazer é verificar se a distribuição amostral de pˆ 1 − pˆ 2 pode ser aproximada por uma distribuição normal. Para testar isso, deve-se tomar os produtos n1 pˆ 1 , n1 (1 − pˆ 1 ), n2 pˆ 2 , n2 (1 − pˆ 2 ) e verificar se são todos maiores ou iguais a 5. No nosso caso, eles são. Portanto, a distribuição amostral de pˆ 1 − pˆ 2 é aproximadamente normal com média, µ pˆ − pˆ = p1 − p 2 = 0 1 2 (pela hipótese nula) e desvio padrão, σ pˆ − pˆ = 1 2 p1 (1 − p1 ) p2 (1 − p2 ) + = n1 n2 p(1 − p) p(1 − p) . + n1 n2 Como não conhecemos o valor de p, o que se faz neste caso é estimá-lo como uma média ponderada de pˆ 1 e pˆ 2 : 3 Estatística II – Antonio Roque – Aula 12 p= n1 pˆ 1 + n2 pˆ 2 100 × 0,12 + 120 × 0,15 30 = = = 0,136. n1 + n2 220 220 Este é o valor de p que será usado para o cálculo de σ pˆ1 − pˆ 2 , dando: σ pˆ − pˆ = 1 2 p (1 − p ) p (1 − p ) 0,1175 0,1175 + = + = 0,0464. n1 n2 100 120 O valor de z para este caso é: z= ( pˆ1 − pˆ 2 ) − 0 = (0,12 − 0,15) − 0 = σ pˆ − pˆ 1 2 0,0464 − 0,03 = −0,65 . 0,0464 Consultando a tabela para a distribuição normal padrão, isto nos dá o seguinte valor P: P = 2 x 0,2578 = 0,51 > 0,05. Portanto, não se pode rejeitar a hipótese nula com base nos dados amostrais obtidos. As taxas de reclamações sobre os serviços prestados pelos escritórios da empresa nas cidades A e B podem ser iguais. Testes de Hipóteses sobre a Variância de uma População Quando os dados disponíveis para estudo consistem de uma amostra aleatória retirada de uma população normalmente distribuída, a estatística a ser usada para se testar uma hipótese sobre a variância populacional é a distribuição do qui-quadrado com n – 1 graus de liberdade, 4 Estatística II – Antonio Roque – Aula 12 s2 2 χ = (n − 1) σ2 . Como a distribuição do qui-quadrado é assimétrica, o cálculo do valor P para um teste bilateral é complicado neste caso. Prefere-se, então, calcular o intervalo que contém 95% de todos os valores de χ2 para n – 1 graus de liberdade e verificar se o valor de χ 2 = (n − 1)(s 2 σ 2 ) calculado com os dados do problema (incluindo a hipótese nula H0) está dentro desse intervalo. Se χ2 estiver dentro do intervalo, a probabilidade de obtê-lo é maior do que 5% e aceita-se H0. Exemplo: Tomou-se uma amostra de 15 estudantes de odontologia, os quais foram submetidos a um teste de habilidade manual. A variância das notas do teste foi igual a s2 = 1,2. Pode-se concluir, com base nesse estudo, que a variância da distribuição populacional das notas dos estudantes de odontologia é diferente de 2,5? A hipótese nula e a hipótese alternativa são: H0: σ2 = 2,5 H1: σ2 ≠ 2,5. Portanto, o teste a ser feito é bilateral. O valor de χ2 para os dados e a hipótese nula é: 2 χ = (n − 1) s2 σ 2 = 14 × 1,2 = 6,72. 2,5 5 Estatística II – Antonio Roque – Aula 12 Para n – 1 = 14 graus de liberdade, o intervalo de valores de χ2 dentro do qual estão 95% de todas os valores da distribuição está limitado entre χ 02, 025 = 5,629 e χ 02,975 = 26,119 (veja abaixo). Como 6,72 está dentro do intervalo, não se pode rejeitar a hipótese nula H0. A variância das notas da população de estudantes de odontologia pode ser igual a 2,5. Testes de Hipóteses sobre a Razão entre Duas Variâncias Vamos ilustrar este tipo de teste de hipótese aproveitando o exemplo anterior. Suponha que uma amostra aleatória de 22 estudantes de engenharia foi submetida ao mesmo teste de destreza manual ao qual os estudantes de odontologia do exemplo anterior foram submetidos. A variância das notas no teste dos estudantes de engenharia foi igual a 1,6. Pode-se concluir que a variância das notas da população de estudantes de odontologia é diferente da variância das notas da população de estudantes de engenharia? 6 Estatística II – Antonio Roque – Aula 12 Os dados do problema são (vamos designar a população dos estudantes de engenharia de população 1 e a população dos estudantes de odontologia de população 2): n1 = 22; s12 = 1,6 n2 = 15; s22 = 1,2. Vamos assumir que as distribuições das notas das duas populações são normais. Desta forma, as hipóteses nula e alternativa são: H0: σ 12 = σ 22 ; H1: σ 12 ≠ σ 22 . Portanto, o teste a ser feito é bilateral. Na aula sobre intervalos de confiança para a razão entre duas variâncias, vimos que a variável (s (s 2 1 2 2 σ 12 ) σ 22 ) é distribuída como a função F com n1 – 1 graus de liberdade do numerador e n2 – 1 graus de liberdade do denominador. No caso do exemplo, como a hipótese nula implica que σ 12 = σ 22 , esta variável vale s12 1,6 = = 1,3 . s 22 1,2 7 Estatística II – Antonio Roque – Aula 12 Portanto, o teste de hipótese a ser feito neste caso consiste em obter o intervalo de confiança de 95% para F e verificar se o valor 1,3 está dentro dele. Este intervalo está entre os valores F0, 025,n1 −1,n2 −1 = 1 F0,975,n2 −1,n1 −1 e F0 ,975,n1 −1,n2 −1 . Olhando na tabela da função F para F0,975 temos que: F0,975, 21,14 ≅ F0,975, 20,14 = 2,84 e F0,975,14, 21 ≅ F0,975,15, 21 = 2,53 ⇒ F0, 025, 21,14 ≅ 1 = 0,39. 2,53 Portanto, 95% dos valores de F estão entre 0,39 e 2,84 (veja abaixo). Como s12 s 22 = 1,3 está dentro desse intervalo, não se pode rejeitar a hipótese nula. As duas variâncias populacionais podem ser iguais. 8