Estatística II – Antonio Roque – Aula 11
Testes de Hipóteses para a Diferença Entre Duas Médias Populacionais
Vamos considerar o seguinte problema: Um pesquisador está estudando o
efeito da deficiência de vitamina E sobre o armazenamento de vitamina A em
ratos. Ele quer saber se uma dieta deficiente em vitamina E altera a quantidade
de vitamina A armazenada. A pergunta que ele faz é:
O valor médio de vitamina A armazenada em ratos com dieta deficiente em
vitamina E é igual ao valor médio de vitamina A armazenada em ratos com
dieta normal?
Para responder a sua pergunta, o pesquisador toma um grupo de 20 ratos e os
divide aleatoriamente em dois grupos de 10. Durante um certo tempo, um dos
grupos é alimentado com a dieta normal e o outro grupo é alimentado com
uma dieta deficiente em vitamina E. Depois disso, o pesquisador sacrifica os
ratos dos dois grupos e mede a quantidade de vitamina A no fígado deles.
O valor médio de vitamina A no fígado dos ratos alimentados com a dieta
normal foi de x1 = 3.371 ui (unidades internacionais) e o valor médio de
vitamina A armazenada no fígado dos ratos alimentados com a dieta deficiente
em vitamina E foi de x 2 = 2.570 ui, de maneira que a diferença entre as médias
das duas amostras é de: x1 − x 2 = 805 ui.
O problema agora é decidir se essa diferença é grande o suficiente para que o
pesquisador possa concluir que existe realmente uma diferença na quantidade
de vitamina A armazenada entre as duas populações, ou se a diferença obtida é
apenas uma variação amostral.
1
Estatística II – Antonio Roque – Aula 11
Vamos supor que o pesquisador tem bons motivos para crer que as
distribuições populacionais da vitamina A armazenada no fígado de ratos com
dietas normal e deficiente em vitamina E são normais.
Vamos supor também que o pesquisador conhece as variâncias populacionais
σ 12 e σ 22 . Este é um caso muito difícil de acontecer na prática, mas vamos
considerá-lo aqui apenas para ilustrar o método. Vamos supor que σ1 = σ2 =
600 ui.
Para este caso, sabemos que a distribuição amostral da diferença entre as
médias x1 − x 2 tem média igual a µ x − x = µ1 − µ 2 e desvio padrão igual a
1
σ x1 − x2
σ 12 σ 22
σ2 σ2
=
+
=
+
=
n1
n2
n1
n2
2
2 × (600)
= 268,2 ui.
10
2
A hipótese nula a ser testada neste caso é:
H0: µ1 = µ 2 ⇒ µ1 − µ 2 = 0;
H1: µ1 ≠ µ 2 ⇒ µ1 − µ 2 ≠ 0.
Portanto, o teste é bilateral.
Para encontrar o valor P, calculamos o valor z correspondente a x1 − x 2 = 805 :
z=
805 − 0
= 3,0.
268,2
Isto implica que o valor P é 0,0026 (veja a figura a seguir).
2
Estatística II – Antonio Roque – Aula 11
Para um nível de significância de α = 0,05, temos que P < α e deve-se rejeitar
a hipótese nula. O pesquisador conclui então que, com um nível de
significância de 0,05 existe uma diferença entre as quantidades de vitamina A
armazenadas no fígado de ratos alimentados com dieta normal e deficiente em
vitamina E.
O exemplo dado foi para um teste bilateral. Entretanto, o pesquisador poderia
ter feito um teste unilateral. Suponha que ele tenha certeza que a dieta
deficiente em vitamina E não pode ocasionar um aumento na quantidade de
vitamina A armazenada. Neste caso, a sua pergunta seria: µ1 é maior do que
µ2 ?
Agora a hipótese nula é H0: µ1 ≤ µ 2 e o valor P deve ser calculado apenas
como a probabilidade de que x1 − x 2 seja maior que 805 ui se µ1 = µ 2 . Neste
caso, o valor P é 0,0013 e continua menor que 0,05. Novamente a hipótese
nula é rejeitada e a conclusão do experimento favorece a hipótese alternativa
com um nível de significância de 0,05: H1: µ1 > µ 2 .
Vamos agora considerar o caso mais realista em que as variâncias
populacionais σ 12 e σ 22 são desconhecidas.
3
Estatística II – Antonio Roque – Aula 11
Neste caso, sabemos que há duas possibilidades: σ 12 = σ 22 e σ 12 ≠ σ 22 . Já vimos,
nas aulas sobre distribuições amostrais, como tratar os dois casos. Aqui,
vamos considerar apenas o caso em que σ 12 = σ 22 .
Vamos supor que no caso do exemplo anterior σ
2
é desconhecida, mas o
desvio padrão foi calculado para cada amostra, dando:
s1 = 626 ui e s2 = 538 ui.
Conhecendo-se s1 e s2, pode-se estimar o valor desconhecido de σ como:
σ =
2
(n1 − 1)s12 + (n2 − 1)s22
n1 + n2 − 2
9(626) 2 + 9(538) 2
=
= 340958 ⇒
18
⇒ σ = 584 ui .
Desta forma, o valor estimado para o desvio padrão da distribuição amostral
da diferença entre as médias é,
σ x1 − x2
584 2 584 2
=
+
= 261 ui.
10
10
Como no exemplo anterior, a hipótese nula é:
H0: µ1 = µ 2 ⇒ µ1 − µ 2 = 0;
H1: µ1 ≠ µ 2 ⇒ µ1 − µ 2 ≠ 0.
Agora porém, como as amostras são pequenas e as variâncias populacionais
são desconhecidas, devemos usar a distribuição t de Student. Para encontrar o
valor P, calculamos o valor t correspondente a x1 − x 2 = 805 :
4
Estatística II – Antonio Roque – Aula 11
t=
805 − 0
= 3,1.
261
Consultando a tabela para a distribuição t de Student para gl = 18, vemos que
todos os valores são menores do que 3,1 (desde a coluna para t.90 até a coluna
para t.995). Portanto, sabemos que a área à esquerda de t = 3,1 é maior que
0,995. Isto implica que a área à direita de t = 3,1 é menor do que 0,005.
Para um teste bilateral, o valor P será então: P < 2x0,005 = 0,001 ⇒ P < α =
0,05. Portanto, deve-se rejeitar a hipótese nula: há evidência suficiente para
rejeitar a afirmação de que o valor médio de vitamina A armazenada em ratos
com dieta deficiente em vitamina E é igual ao valor médio de vitamina A
armazenada em ratos com dieta normal.
Para um teste unilateral, P < 0,005 < α. Logo, também rejeita-se a hipótese
nula.
Dados emparelhados
Nos exemplos anteriores, o pesquisador tratou as duas amostras de 10 ratos
como se elas fossem independentes, ou seja, com se não houvesse qualquer
relação entre a amostra de ratos alimentados com dieta normal e a amostra de
ratos alimentados com a dieta deficiente em vitamina E.
Porém, em muitos casos em que se faz um teste de hipóteses sobre a diferença
entre duas médias costuma-se trabalhar com amostras que possuem algum
grau de relação entre si.
5
Estatística II – Antonio Roque – Aula 11
Em tais casos, em que as amostras não são independentes, costuma-se chamálas de amostras emparelhadas. Um exemplo disso ocorre quando se compara
uma amostra de pesos de pessoas antes de se submeterem a uma dada dieta
com a amostra de pesos das mesmas pessoas após se submeterem à dieta.
Neste caso, o que se faz é comparar a diferença entre os pesos de uma mesma
pessoa antes e depois da dieta.
Um outro exemplo, aproveitando o caso dos 20 ratos apresentado acima, é
dado a seguir. Vamos supor que ao invés de escolher 20 ratos de forma
aleatória e separá-los em duas amostras de 10 ratos cada, uma alimentada com
a dieta normal e a outra alimentada com dieta deficiente em vitamina E, o
pesquisador prefira trabalhar com 10 pares de ratos, sendo que cada par é
composto por ratos retirados da mesma ninhada e com o mesmo peso. Desta
forma, pode-se considerar que os ratos de um dado par possuem as mesmas
condições antes do experimento, ou seja, eles não são independentes.
Desta forma, o pesquisador vai trabalhar com 10 pares de ratos nas mesmas
condições iniciais. A partir daí, as condições passam a ser diferentes. Um rato
de cada par é escolhido para ser alimentado com a dieta normal e o outro rato
é alimentado com a dieta deficiente em vitamina E. Após um certo tempo, o
pesquisador mede as quantidades de vitamina A armazenadas nos fígados dos
10 pares de ratos.
Como os dados estão emparelhados (existem 10 pares de ratos), é conveniente
trabalhar com a variável x definida como sendo a diferença entre as
quantidades de vitamina A armazenadas para cada par de ratos: x = x1 – x2. A
tabela abaixo ilustra isso.
6
Estatística II – Antonio Roque – Aula 11
Par
x1 (ui)
(dieta normal)
x2 (ui)
x (ui)
x2
(dieta deficiente) (diferença: x1 – x2)
1
3950
2650
1300
1690000
2
3800
3350
450
202500
3
3450
2450
1000
1000000
4
3400
2650
750
562500
5
3700
2650
1050
1102500
6
3900
3150
750
562500
7
3800
2900
900
810000
8
3050
1700
1350
1822500
9
2700
1700
1000
1000000
10
2000
2500
− 500
250000
8050
9002500
Soma
Note que a tabela acima diz respeito a 20 ratos, só que eles estão
emparelhados em 10 pares. Um rato de cada par foi alimentado com a dieta
normal e o outro foi alimentado com a dieta deficiente. A variável de interesse
agora não é a diferença entre as médias das amostras de ratos alimentados com
cada tipo de dieta ( x1 − x 2 ), como nos casos anteriores. A variável de interesse
para o caso dos dados emparelhados é a diferença entre os valores de vitamina
A armazenados para cada par de ratos (x).
Podemos considerar que a tabela acima nos dá uma amostra de 10 pares de
ratos, com os valores de 10 diferenças de quantidades de vitamina A
armazenadas em ratos alimentados com dietas normais e deficientes em
vitamina E.
7
Estatística II – Antonio Roque – Aula 11
O valor médio e o desvio padrão dessas 10 diferenças são:
8050
x=
= 805 ui;
10
s
2
∑x
=
2
− x 2 10
9
= 280250 ⇒ s = 529 ui.
Podemos considerar que todas as diferenças possíveis x formam uma
população e que as 10 diferenças obtidas constituem uma amostra de tamanho
10 desta população. Vamos assumir que a distribuição da população de x é
normal. Como não se conhece o desvio padrão da população de x, vamos
aproximar o valor de σ por s. Desta forma, o desvio padrão da distribuição
amostral das diferenças é
σx =
s
n
=
529
10
= 167,4 ui.
A hipótese nula é a de que a média das diferenças x seja igual a zero:
H0: µ x = 0;
H1: µ x ≠ 0.
Se o número de pares de ratos escolhido fosse maior ou igual a 30, faríamos o
cálculo do valor P correspondente usando o valor z da distribuição normal.
Porém, como o número de pares de ratos é menor do que 30, teremos que
fazer o cálculo de P usando a distribuição t de Student.
O valor de t para este caso é:
t=
805 − 0
= 4,8.
167,4
8
Estatística II – Antonio Roque – Aula 11
Para gl = n – 1 = 10 – 1 = 9, todos os valores da tabela para a distribuição t de
Student são menores do que 4,8. Logo:
P < 2x0,005 = 0,001 ⇒ P < α = 0,05.
Portanto, deve-se rejeitar a hipótese nula: as evidências levam o pesquisador a
rejeitar a hipótese de que o valor médio de vitamina A armazenada em ratos
com dieta deficiente em vitamina E é igual ao valor médio de vitamina A
armazenada em ratos com dieta normal.
Exemplos
1. Um epidemiologista quer estudar os efeitos de duas vacinas anti-rábicas
para verificar qual é a mais efetiva. Ele dividiu um grupo de indivíduos que já
foram vacinados anteriormente contra a raiva em duas amostras. Os
indivíduos da amostra 1 receberam uma dose extra da vacina do tipo 1 e os
indivíduos da amostra 2 receberam uma dose extra da vacina do tipo 2. As
respostas dos anti-corpos foram medidas duas semanas depois, resultando nos
seguintes dados (unidades arbitrárias):
Amostra
n
x
s
1
10
4,5
2,5
2
9
2,5
2,0
O epidemiologista pode concluir que a vacina 1 é mais eficaz que a vacina 2?
Considere α = 0,05. Assuma que as variâncias populacionais são iguais.
9
Estatística II – Antonio Roque – Aula 11
Neste caso, como a pergunta do epidemiologista é se a vacina 1 é mais eficaz
do que a vacina 2 (se a resposta média dos indivíduos vacinados com a vacina
1, µ1, é maior do que a resposta média dos indivíduos vacinados com a vacina
2, µ2), a hipótese nula e a hipótese alternativa devem ser:
H0: µ1 − µ 2 ≤ 0;
H1: µ1 − µ 2 > 0.
Estimando σ2:
σ
2
(
n1 − 1)s12 + (n 2 − 1)s 22
=
n1 + n 2 − 2
=
9 × 6,25 + 8 × 4
= 5,2 ⇒
17
⇒ σ = 5,2 = 2,3.
O valor t para este caso é:
t=
(x1 − x2 ) − (µ1 − µ 2 ) = (4,5 − 2,5) − 0 =
σ2 σ2
+
n1 n2
5,2 3,2
+
10
9
2,0
= −1,9.
1,05
Olhando para a tabela da distribuição t de Student para gl = n1 + n2 – 2 = 17,
vemos que 1,9 está entre 1,7396 e 2,1098 (veja abaixo).
10
Estatística II – Antonio Roque – Aula 11
Logo, 0,025 < P < 0,05. Como P < α, o epidemiologista deve rejeitar a
hipótese nula e concluir que as evidências experimentais favorecem a hipótese
de que a vacina 1 é mais eficaz do que a vacina 2.
2. Um personal trainer garante que uma pessoa que faça ginástica sob a sua
supervisão por um mês perderá peso sem necessitar fazer qualquer tipo de
dieta especial. Para testar a afirmação do personal trainer, seleciona-se uma
amostra de 7 pessoas e toma-se os seus pesos antes do início do programa de
ginásticas. As 7 pessoas são então submetidas ao treinamento oferecido pelo
personal trainer durante 1 mês, com a recomendação de não alterar seus
hábitos alimentares nem seu modo de vida. Após o mês de treinamento, os
pesos das 7 pessoas são novamente medidos, resultando na tabela abaixo.
Indivíduo
Peso
antes
1
2
3
4
5
6
7
94
81
65
70
83
72
69
80
65
70
80
74
65
(kg)
Peso
depois 93,5
(kg)
Pode-se concluir, baseado nestes dados e com um índice de significância α =
0,05, que a afirmação do personal trainer é correta?
Este é um caso para trabalharmos com dados emparelhados, pois podemos
considerar que temos 7 pares de valores não independentes: eles são as
diferenças x dos pesos das mesmas pessoas, antes e depois do treinamento.
Como a afirmação do personal trainer é a de que os pesos das pessoas
diminuem, as hipóteses nula e alternativa devem ser:
11
Estatística II – Antonio Roque – Aula 11
H0: µ x ≥ 0;
H1: µ x < 0.
Da tabela, temos: x = 0,9; s = 2,0.
O desvio padrão da distribuição amostral de x é então:
σx =
s
n
=
2,0
7
= 0,75.
O valor de t é então:
t=
0,9 − 0
= 1,2.
0,75
Pela tabela da distribuição t de Student para gl = 7 – 1 = 6, vemos que este
valor de t é menor do que todos os valores listados. Isto implica que
P > 0,10.
Como o valor P para este caso é maior do que α, não se pode rejeitar a
hipótese nula. Ou seja, as evidências não apóiam fortemente a afirmação do
personal trainer de que as pessoas perdem peso após se submeter ao seu
programa de exercícios por um mês.
12
Download

Testes de Hipóteses para a Diferença Entre Duas Médias