Estatística II – Antonio Roque – Aula 12
Testes de Hipóteses sobre uma Proporção Populacional
Seja o seguinte problema: Estamos interessados em saber que proporção de
motoristas da população usa cinto de segurança regularmente. Em uma
pesquisa com 300 motoristas, 123 deles disseram que usam regularmente o
cinto de segurança. Podemos concluir desses dados que a proporção de
motoristas que usa cinto de segurança é inferior a 50% ?
Para a amostra obtida, p̂ = 123/300 = 0,41.
A hipótese nula a ser testada neste caso é:
H0: p ≥ 0,5
H1: p < 0,5
onde p é a proporção populacional de motoristas que usam o cinto de
segurança regularmente. Portanto, o teste é unilateral.
Nas aulas sobre distribuições amostrais, vimos que a distribuição amostral de
p̂ pode ser aproximada por uma distribuição normal se tanto np como n(1 −
p) forem maiores ou iguais a 5. No nosso caso, com p = 0,5, np = n(1 − p) =
300x0,5 = 150, o que garante que podemos usar a variável z para fazer o
cálculo de P.
A distribuição amostral de p̂ é aproximadamente normal com média
µ pˆ = p = 0,5 e desvio padrão
σ pˆ =
p (1 − p )
=
n
0,5 × 0,5
= 0,0289.
300
Portanto, o valor P é calculado a partir de
1
Estatística II – Antonio Roque – Aula 12
z=
pˆ − p
σ pˆ
=
0,41 − 0,50
0,09
=−
= −3,11.
0,0289
0,0289
Consultando a tabela da distribuição normal reduzida, vemos que P = 0,5 –
0,49906 = 0,00094. Portanto, P < α . Logo, rejeitamos a hipótese nula e
concluímos que os dados sugerem que a proporção de motoristas que usa o
cinto de segurança regularmente é menor do que 50%.
Testes de Hipóteses sobre a Diferença entre as Proporções de Duas
Populações
Vamos considerar o seguinte exemplo: Uma empresa que presta serviços de
assessoria econômica a empresas está interessada em comparar a taxa de
reclamações sobre os seus serviços em dois dos seus escritórios em duas
cidades diferentes.
Suponha que a empresa tenha selecionado aleatoriamente 100 serviços
realizados pelo seu escritório na cidade A e 120 serviços realizados pelo seu
escritório na cidade B. Dos 100 serviços da cidade A, em 12 deles houve
algum tipo de reclamação feita pelas empresas que receberam os serviços e
dos 120 serviços da cidade B, 18 receberam algum tipo de reclamação.
Portanto, as proporções amostrais de reclamações sobre os serviços dos
escritórios das cidades A e B são, respectivamente,
pˆ 1 =
12
= 0,12 e
100
pˆ 2 =
18
= 0,15.
120
2
Estatística II – Antonio Roque – Aula 12
A empresa deseja saber se estes resultados são suficientes para se concluir que
os dois escritórios apresentam diferenças significativas nas suas taxas de
reclamações.
A hipótese nula a ser testada neste caso é:
H0: p1 – p2 = 0
H1: p1 – p2 ≠ 0.
Portanto, o teste a ser feito é bilateral.
A primeira coisa a fazer é verificar se a distribuição amostral de pˆ 1 − pˆ 2 pode
ser aproximada por uma distribuição normal. Para testar isso, deve-se tomar os
produtos n1 pˆ 1 , n1 (1 − pˆ 1 ), n2 pˆ 2 , n2 (1 − pˆ 2 ) e verificar se são todos maiores ou
iguais a 5. No nosso caso, eles são.
Portanto, a distribuição amostral de pˆ 1 − pˆ 2 é aproximadamente normal com
média,
µ pˆ − pˆ = p1 − p 2 = 0
1
2
(pela hipótese nula)
e desvio padrão,
σ pˆ − pˆ =
1
2
p1 (1 − p1 ) p2 (1 − p2 )
+
=
n1
n2
p(1 − p) p(1 − p)
.
+
n1
n2
Como não conhecemos o valor de p, o que se faz neste caso é estimá-lo como
uma média ponderada de pˆ 1 e pˆ 2 :
3
Estatística II – Antonio Roque – Aula 12
p=
n1 pˆ 1 + n2 pˆ 2 100 × 0,12 + 120 × 0,15 30
=
=
= 0,136.
n1 + n2
220
220
Este é o valor de p que será usado para o cálculo de σ pˆ1 − pˆ 2 , dando:
σ pˆ − pˆ =
1
2
p (1 − p ) p (1 − p )
0,1175 0,1175
+
=
+
= 0,0464.
n1
n2
100
120
O valor de z para este caso é:
z=
( pˆ1 − pˆ 2 ) − 0 = (0,12 − 0,15) − 0 =
σ pˆ − pˆ
1
2
0,0464
− 0,03
= −0,65 .
0,0464
Consultando a tabela para a distribuição normal padrão, isto nos dá o seguinte
valor P: P = 2 x 0,2578 = 0,51 > 0,05.
Portanto, não se pode rejeitar a hipótese nula com base nos dados amostrais
obtidos. As taxas de reclamações sobre os serviços prestados pelos escritórios
da empresa nas cidades A e B podem ser iguais.
Testes de Hipóteses sobre a Variância de uma População
Quando os dados disponíveis para estudo consistem de uma amostra aleatória
retirada de uma população normalmente distribuída, a estatística a ser usada
para se testar uma hipótese sobre a variância populacional é a distribuição do
qui-quadrado com n – 1 graus de liberdade,
4
Estatística II – Antonio Roque – Aula 12
s2
2
χ = (n − 1)
σ2
.
Como a distribuição do qui-quadrado é assimétrica, o cálculo do valor P para
um teste bilateral é complicado neste caso. Prefere-se, então, calcular o
intervalo que contém 95% de todos os valores de χ2 para n – 1 graus de
liberdade e verificar se o valor de χ 2 = (n − 1)(s 2 σ 2 ) calculado com os dados
do problema (incluindo a hipótese nula H0) está dentro desse intervalo. Se χ2
estiver dentro do intervalo, a probabilidade de obtê-lo é maior do que 5% e
aceita-se H0.
Exemplo: Tomou-se uma amostra de 15 estudantes de odontologia, os quais
foram submetidos a um teste de habilidade manual. A variância das notas do
teste foi igual a s2 = 1,2. Pode-se concluir, com base nesse estudo, que a
variância da distribuição populacional das notas dos estudantes de odontologia
é diferente de 2,5?
A hipótese nula e a hipótese alternativa são:
H0: σ2 = 2,5
H1: σ2 ≠ 2,5.
Portanto, o teste a ser feito é bilateral.
O valor de χ2 para os dados e a hipótese nula é:
2
χ = (n − 1)
s2
σ
2
= 14 ×
1,2
= 6,72.
2,5
5
Estatística II – Antonio Roque – Aula 12
Para n – 1 = 14 graus de liberdade, o intervalo de valores de χ2 dentro do qual
estão 95% de todas os valores da distribuição está limitado entre
χ 02, 025 = 5,629
e
χ 02,975 = 26,119 (veja abaixo).
Como 6,72 está dentro do intervalo, não se pode rejeitar a hipótese nula H0. A
variância das notas da população de estudantes de odontologia pode ser igual a
2,5.
Testes de Hipóteses sobre a Razão entre Duas Variâncias
Vamos ilustrar este tipo de teste de hipótese aproveitando o exemplo anterior.
Suponha que uma amostra aleatória de 22 estudantes de engenharia foi
submetida ao mesmo teste de destreza manual ao qual os estudantes de
odontologia do exemplo anterior foram submetidos. A variância das notas no
teste dos estudantes de engenharia foi igual a 1,6. Pode-se concluir que a
variância das notas da população de estudantes de odontologia é diferente da
variância das notas da população de estudantes de engenharia?
6
Estatística II – Antonio Roque – Aula 12
Os dados do problema são (vamos designar a população dos estudantes de
engenharia de população 1 e a população dos estudantes de odontologia de
população 2):
n1 = 22; s12 = 1,6
n2 = 15; s22 = 1,2.
Vamos assumir que as distribuições das notas das duas populações são
normais. Desta forma, as hipóteses nula e alternativa são:
H0: σ 12 = σ 22 ;
H1: σ 12 ≠ σ 22 .
Portanto, o teste a ser feito é bilateral.
Na aula sobre intervalos de confiança para a razão entre duas variâncias,
vimos que a variável
(s
(s
2
1
2
2
σ 12 )
σ 22 )
é distribuída como a função F com n1 – 1 graus de liberdade do numerador e
n2 – 1 graus de liberdade do denominador.
No caso do exemplo, como a hipótese nula implica que σ 12 = σ 22 , esta variável
vale
s12 1,6
=
= 1,3 .
s 22 1,2
7
Estatística II – Antonio Roque – Aula 12
Portanto, o teste de hipótese a ser feito neste caso consiste em obter o
intervalo de confiança de 95% para F e verificar se o valor 1,3 está dentro
dele. Este intervalo está entre os valores
F0, 025,n1 −1,n2 −1 =
1
F0,975,n2 −1,n1 −1
e
F0 ,975,n1 −1,n2 −1 .
Olhando na tabela da função F para F0,975 temos que:
F0,975, 21,14 ≅ F0,975, 20,14 = 2,84
e
F0,975,14, 21 ≅ F0,975,15, 21 = 2,53 ⇒ F0, 025, 21,14 ≅
1
= 0,39.
2,53
Portanto, 95% dos valores de F estão entre 0,39 e 2,84 (veja abaixo).
Como s12 s 22 = 1,3 está dentro desse intervalo, não se pode rejeitar a hipótese
nula. As duas variâncias populacionais podem ser iguais.
8
Download

Testes de Hipóteses sobre uma Proporção Populacional