COMPARAÇÃO DE
DUAS POPULAÇÕES
Spencer Barbosa da Silva
DEEST
- Suponha que estamos interessados em comparar duas populações
com relação às suas médias.
- Queremos realizar um teste de hipóteses onde a hipótese nula é
Ho: µ1 = µ2
e a hipótese a aternativa é
Ha: µ1 ≠ µ2
ou
Ha: µ1 > µ2
ou
Ha: µ1 < µ2
Erros associados ao
teste de hipóteses
Situação
Ho verdadeira
Ho falsa
Rejeitar Ho
Erro Tipo I
Sem erro
Não rejeitar Ho
Sem erro
Erro Tipo II
Decisão
α = P(erro Tipo I) = P(rejeitar Ho| Ho verdadeira) = nível de significância
β = P(erro Tipo II) = P(não rejeitar Ho| Ho falsa)
1 - β = 1- P(não rejeitar Ho| Ho falsa) = P(rejeitar Ho| Ho falsa) = poder do teste
- A região de rejeição de Ho (Ho: µ1 = µ2) depende da hipótese
alternativa.
Ha: µ1 ≠ µ2
Rejeitamos Ho se o modulo da estatistica de teste for maior que um valor
critico. O valor critico é positivo e a area acima dele é igual a α/2.
Ha: µ1 > µ2
Rejeitamos Ho se a estatistica de teste for maior que um valor critico. O valor
critico é positivo e a area acima dele é igual a α.
Ha: µ1 < µ2
Rejeitamos Ho se a estatistica de teste for menor que um valor critico. O valor
critico é negativo e a area abaixo dele é igual a α.
- Como vimos, se o nível de significância muda, a região critica também
muda.
- No entanto podemos concluir um teste de hipóteses com base no
valor-p, que não muda com o nível de significância.
- O valor-p é uma probabilidade que depende de Ha.
- Se valor-p <= α rejeitamos Ho. Se valor-p > α não rejeitamos Ho.
- Se valor-p <= α rejeitamos Ho. Se valor-p > α não rejeitamos Ho.
Ha: µ1 > µ2
Rejeitamos Ho se a estatistica de teste for maior que um valor critico. O valor
critico é positivo e a area acima dele é igual a α.
valor-p = P (estatistica de teste > estatistica de teste observada)
Ha: µ1 < µ2
Rejeitamos Ho se a estatistica de teste for menor que um valor critico. O valor
critico é negativo e a area abaixo dele é igual a α.
valor-p = P (estatistica de teste < estatistica de teste observada)
- Se valor-p <= α rejeitamos Ho. Se valor-p > α não rejeitamos Ho.
Ha: µ1 ≠ µ2
Rejeitamos Ho se o modulo da estatistica de teste for maior que um valor
critico. O valor critico é positivo e a area acima dele é igual a α/2.
i) se a estatistica de teste observada é negativa:
valor-p = 2x P(estatistica de teste < estatistica de teste observada)
ii) se a estatistica de teste observada é positiva:
valor-p = 2x P(estatistica de teste > estatistica de teste observada)
- Considere que tomamos uma amostra de tamanho n1 da população 1
e uma amostra de tamanho n2 da população 2.
- Vamos estudar testes paramétricos para as hipóteses estabelecidas,
ou seja, testes que só podem ser realizados quando as duas amostras
vierem de populações Normais.
- Caso as duas amostras não venham de população Normal mas
tenham tamanhos grandes (maior ou igual a 30), os testes
paramétricos ainda são válidos.
- Caso alguma das amostras seja pequena e não venha de população
precisamos realizar um teste de hipótese não paramétrico.
- Aqui vamos considerar que as duas amostras vem de distribuição
Normal e vamos trabalhar com amostras pequenas.
Amostras pareadas x Amostras independentes
Duas amostras são ditas pareadas quando a medida de interesse é
feita para cada unidade amostral em dois momentos diferentes.
A vantagem de trabalhar com amostras pareadas é eliminar possíveis
fontes de confundimento.
CASO 1: Amostras dependentes (teste t pareado)
Exemplo: Queremos comparar a gasolina tradicional com um novo
tipo de combustível. 12 carros são primeiramente abastecidos com a
gasolina tradicional e mede-se o rendimento em km por litro. Em
seguida, os 12 carros são abastecidos com o novo combustível e medese o rendimento em km por litro.
Automovel
Novo combustivel
Gasolina tradicional
D=novo-tradicional
1
2
3
4
5
6
7
8
9
10
11
12
11,6 8,8 9,9 9,5 11,6 9,1 10,6 10,8 13,4 10,6 10,5 11,4
8,1 7,9 6,8 7,8 7,6 7,9 5,7 8,4 8,0 9,5 8,0 6,8
3,5 0,9 3,1 1,7 4,0 1,2 4,9 2,4 5,4 1,1 2,5 4,6
Vamos testar as hipóteses
Ho: µn = µt
Ho: µn - µt = µD = 0 (o novo combustivel não altera o rendimento)
Ha: µn > µt
Ha: µn - µt = µD > 0 (o novo combustivel aumenta o rendimento)
Como a variância populacional é desconhecida nosso teste será
baseado na distribuição t com n-1 graus de liberdade.
Nossa estatística de teste é
D   D 2,9  0
t

 6,48
sD / n
2,4
12
Para α = 0,05 o valor crítico da tabela t com 11 graus de liberdade é
1,80.
Como t>1,80 rejeitamos a hipótese nula, ou seja, a amostra
fornece evidencia de que o novo combustível é eficaz na melhora do
rendimento.
valor-p = P(t>6,84)=1- P(t<6,84)= 1-0,9995=0,0005
Para α = 0,05 rejeitamos a hipótese nula, ou seja, a amostra
fornece evidencia de que o novo combustível é eficaz na melhora do
rendimento.
Para α = 0,01 rejeitamos a hipótese nula, ou seja, a amostra
fornece evidencia de que o novo combustível é eficaz na melhora do
rendimento.
valor-p < alfa: rejeito a hipótese nula ao nivel alfa de significancia, ou
seja, as duas populaçõess tem variancias diferentes.
valor-p > alfa: não rejeito a hipótese nula ao nivel alfa de significancia,
ou seja, as duas populaçõess tem variancias iguais.
CASO 2: Amostras independentes com variâncias populacionais
conhecidas (teste Z)
Exemplo: Queremos comparar dois medicamentos. 15 pacientes
receberam o medicamento A e mediu-se o tempo até a cura (em dias).
15 pacientes receberam o medicamento B e mediu-se o tempo até a
cura (em dias).
Sabe-se que a variância populacional do tempo de cura para, tanto para
o medicamento A quanto para o medicamento B, é de 10 dias.
Paciente
Medicamento A
Medicamento B
1
2
3
4
5
6
7
8
9 10 11 12 13 14 15
182 185 193 175 184 192 175 173 186 178 162 179 164 182 186
192 176 176 190 197 190 186 193 100 115 185 180 190 186 194
Vamos testar as hipóteses
Ho: µA = µB
Ho: µA - µB = 0 (a eficiência dos dois tratamentos é a mesma)
Ha: µA ≠ µB
Ha: µA - µB ≠ 0 (a eficiência dos dois tratamentos não é a mesma)
Como a variância populacional é conhecida nosso teste será baseado
na distribuição Normal.
Nossa estatística de teste é
Z
x A  xB
 A2
nA

 B2
nB

179,73  177,67
 2,65
10 10

15 15
Para α = 0,05 o valor crítico da tabela Normal é 1,960.
Como |Z|>1,96 rejeitamos a hipótese nula, ou seja, a amostra
fornece evidencia de que a eficiência dos dois tratamentos não é a
mesma.
valor-p = 2P(Z>2,65) = 2P(Z< -2,65) = 2.0,004 = 0,008
Para α = 0,05 rejeitamos a hipótese nula, ou seja, a amostra
fornece evidencia de que a eficiência dos dois tratamentos não é a
mesma.
Para α = 0,01 rejeitamos a hipótese nula, ou seja, a amostra
fornece evidencia de que a eficiência dos dois tratamentos não é a
mesma.
CASO 3: Amostras independentes com variâncias populacionais
desconhecidas (teste t)
a) Variâncias populacionais iguais (σ1= σ2)
Exemplo: Queremos comparar dois medicamentos. 15 pacientes
receberam o medicamento A e mediu-se o tempo até a cura (em dias).
15 pacientes receberam o medicamento B e mediu-se o tempo até a
cura (em dias).
Paciente
Medicamento A
Medicamento B
1
2
3
4
5
6
7
8
9 10 11 12 13 14 15
182 185 193 175 184 192 175 173 186 178 162 179 164 182 186
192 176 176 190 197 190 186 193 100 115 185 180 190 186 194
Vamos testar as hipóteses
Ho: µA = µB
Ho: µA - µB = 0 (a eficiência dos dois tratamentos é a mesma)
Ha: µA > µB
Ha: µA - µB > 0 (tratamento B é mais eficiente que tratamento A)
Como a variância populacional é desconhecida nosso teste será
baseado na distribuição t com n1+n2-2 graus de liberdade.
Nossa estatística de teste é
t
x A  xB
 1
1 

s   
 n A nB 
2
p
onde
2
2
(
n

1
)
s

(
n

1
)
s
A
2
B
s 2p  1
n1  n2  2
Então
(n1  1)s A2  (n2  1)sB2 14.79,78  14.834,67
s 

 457,2
n1  n2  2
15  15  2
2
p
t
x A  xB
 1
1 
s 2p   
 n A nB 

179,73  177,67
1 1
457,2  
 15 15 
 11,51
Para α = 0,05 o valor crítico da tabela t com 28 graus de liberdade é
1,701.
Como t>1,701 rejeitamos a hipótese nula, ou seja, a amostra
fornece evidencia de que o tratamento B é mais eficiente que o
tratamento A.
valor-p = P(t>11,51)=1- P(t<11,51) =1-1= 0
Para α = 0,05 rejeitamos a hipótese nula, ou seja, a amostra
fornece evidencia de que o tratamento B é mais eficiente que o
tratamento A.
Para α = 0,01 rejeitamos a hipótese nula, ou seja, a amostra
fornece evidencia de que o tratamento B é mais eficiente que o
tratamento A.
b) Variâncias populacionais diferentes (σ1 ≠ σ2)
Exemplo: Queremos comparar dois medicamentos. 13 pacientes
receberam o medicamento 1 e mediu-se o tempo até a cura (em dias).
12 pacientes receberam o medicamento 2 e mediu-se o tempo até a
cura (em dias).
Paciente
Medicamento 1
Medicamento 2
1
182
192
2
185
196
x1  179,08 s12  88,91
x2  180,75 s22  458,39
3
193
176
4
5
6
7
8
9 10 11 12 13
175 184 192 175 173 186 178 162 179 164
190 197 190 186 193 148 127 185 189
Vamos testar as hipóteses
Ho: µ1 = µ2
Ho: µ1 - µ2 = 0 (a eficiência dos dois tratamentos é a mesma)
Ha: µ1 < µ2
Ha: µ1 - µ2 < 0 (tratamento 1 é mais eficiente que tratamento 2)
Como a variância populacional é desconhecida nosso teste será
baseado na distribuição t com v graus de liberdade.
v
s
s
2
1
2
1
/ n1  s / n2
2
2
 
2
2
2

2

/ n1
s / n2

n1  1
n2  1
2
Nossa estatística de teste é
x1  x2
179,08  180,75

 0,25
2
2
88,91 458,39
s1 s2


13
12
n1 n2
t
v
s
s
2
1
2
1
/ n1  s / n2
2
2
 
2
2
2

2

/ n1
s / n2

n1  1
n2  1
2

88,91/ 13  458,39 / 12
v
2
2
88,91/ 13  458,39 / 12
2
13  1
12  1
 14,85
Para 5% de significância, o valor critico da tabela t com 15 graus de
liberdade é -1,753.
Como t=-0,25 não é menor que -1,753, não rejeitamos Ho. Ou seja, a
amostra fornece evidencia de que a eficiência dos dois tratamentos é a
mesma.
valor-p = P(t < -0,25) = P(t > 0,25) = 1- P(t < 0,25) =1-0,6=0,4
Para α = 0,05 não rejeitamos a hipótese nula, ou seja, a amostra
fornece evidencia de que a eficiência dos dois tratamentos é a mesma.
Para α = 0,01 não rejeitamos a hipótese nula, ou seja, a amostra
fornece evidencia de que a eficiência dos dois tratamentos é a mesma.
Testes Paramétricos para comparação de duas médias
Amostras
Dependentes
Amostras
Independentes
Teste t pareado
gl = n-1
Variâncias
populacionais
conhecidas
Teste Z
Teste t
Iguais
Variâncias
populacionais
desconhecidas
Diferentes
gl = n1+ n2-2
Teste t
gl = v
Testes paramétricos aplicáveis se as duas populações seguem distribuição Normal. Caso as duas
amostras sejam grandes (n>=30), testes paramétricos são validos mesmo se a distribuição não é Normal.
Teste F para comparação de duas variâncias
Ho: σ21 = σ22
Ha: σ21 ≠ σ22
A estatística de teste é
2
1
2
2
s
F
s
Regiao de rejeicao de Ho
Rejeitamos Ho se a estatistica F for menor que valor critico 1(f1) ou
maior que valor critico 2 (f2).
Os dois valores criticos (f1 e f2) sao positivos e podem ser obtidos na
tabela F (n1-1 graus de liberdade no numerador e n2-1 graus de
liberdade no denominador).
f1 < f2
A area abaixo de f1 é igual a α/2 e a área acima de f2 é igual a α/2.
Teste de Normalidade
Ho: a amostra vem de uma população com distribuição Normal
Ha: a amostra não vem de uma população com distribuição Normal
valor-p < alfa: rejeito a hipótese nula ao nivel alfa de significancia, ou
seja, a amostra não vem de uma população com distribuição Normal.
valor-p > alfa: não rejeito a hipótese nula ao nivel alfa de significancia,
ou seja, a amostra vem de uma população com distribuição Normal.
Teste Z para duas proporções
Suponha agora que estamos interessados em comparar duas
populações com às suas proporções.
Queremos realizar um teste de hipóteses onde a hipótese nula é
Ho: p1 = p2
e a hipótese a aternativa é
Ha: p1 ≠ p2 ou Ha: p1 > p2 ou Ha: p1 < p2
A estatitsica de teste é
^
Z
^
p1  p2
^
^
p(1  p)(1 / n1  1 / n2 )
^
^
n1 p1  n2 p2
p
n1  n2
^
O teste Z para proporcoes pode ser usado se n1 > 30 e n2>30.
Download

th duas amostras - ICEB-UFOP