ESTATÍSTICA APLICADA
Capítulo 8
Inferências com Base em
Duas Amostras
Prof. Paulo Renato de Morais
Amostragem Independente e
Dependente
Amostragem Independente e
Dependente
Independente
1.
Fontes de dados
diferentes


Não relacionadas
Independentes
Dependente
1.
Mesma fonte de
dados


Pares
Medidas repetidas
(antes/depois)
Amostragem Independente e
Dependente
Independente
1.
Fontes de
dados diferentes


Não relacionadas
Independentes
2.
Usa diferença
entre as 2 médias
amostrais

X1 -X2
1.
dados


Dependente
Mesma fonte de
Pares
Medidas repetidas
(antes/depois)
2.
Usa diferença
entre cada par de
observações

Dn = X1n - X2n
Exemplos de Populações
Independentes
1. Um dentista deseja determinar se há
diferença no número médio de cáries em
2 grupos de classes sociais diferentes.
2. O Ministério da Educação deseja comparar
as notas no Provão entre alunos de
universidades públicas e privadas.
Exemplos de Populações
Dependentes
1. A Nike deseja verificar se há diferença na
durabilidade de 2 materiais para sola. Um
tipo é colocado em um dos pés do tênis, o
outro tipo é colocado no outro pé do mesmo
par de tênis.
2. Uma universidade deseja comparar as
notas de alunos em um simulado do Provão
antes e depois de um curso de revisão.
Testando Duas Médias
Populacionais Dependentes
Experimentos de Pares
Teste para Diferença de Médias
para Amostras aos Pares
1. Testa médias de 2 populações relacionadas


Pares
Medidas repetidas (antes/depois)
2. Elimina variação entre elementos
3. Hipóteses:


Amostras aleatórias independentes
Ambas populações com distribuição normal
(caso de pequenas amostras somente)
Tabela de Coleta de Dados para
Teste de Amostras aos Pares
Observação Grupo 1 Grupo 2 Diferença
1
x11
x21
D1 = x11-x21
2
x12
x22
D2 = x12-x22
...
...
...
i
x1i
x2i
...
...
...
n
x1n
x2n
...
Di = x1i - x2i
...
Dn = x1n - x2n
Teste t para Amostras aos Pares
xD  D0
t 
SD
gl  nD  1
nD
n
xD 
 Di
i 1
nD
Média Amostral
n
SD 

i 1
2
Di
 nD  D
nD  1
Desvio Padrão Amostral
2
Exemplo de Teste t para Amostras
aos Pares
Você deseja saber se um programa de
treinamento foi efetivo. Você coletou as
seguintes notas de um teste padrão:
Nome
Antes (A) Depois (B)
Samuel
85
94
Tadeu
94
87
Bruno
78
79
Marcos
87
88
Ao nível de 0,10, o
treinamento foi efetivo?
Tabela de Cálculos
Observação
Antes
Depois
Diferença
Samuel
85
94
-9
Tadeu
94
87
7
Bruno
78
79
-1
Marcos
87
88
-1
Total
-4
Solução da Hipótese Nula
1. O treinamento foi efetivo?
2. Efetivo significa ‘Depois’ > ‘Antes’.
3. Estatisticamente, significa B > A.
4. Rearranjando termos, dá 0 A - B.
5. Definindo D = A - B e substituindo em
(4), dá 0 D ou D .
6. A hipótese alternativa é H1: D 0.
Solução do Teste t para Amostras
aos Pares
H0: D = 0 (D = A - B) Estatística de Teste:
H1: D < 0
xD  D 0 1  0
t

 ,306
 = 0,10
SD
6,53
gl = 4 - 1 = 3
nD
4
Valor Crítico:
Decisão:
Reject
Não rejeitar com  = 0,10
.10
-1.6377 0
t
Conclusão:
Não há evidência que
treinamento foi efetivo
Estimação por Intervalo:
Diferença de Duas Médias
Populacionais Independentes
Caso de Amostras Grandes
Intervalo de Confiança para
Amostras Grandes
1. Hipóteses:



Amostras aleatórias independentes
Tamanho de ambas as amostras no mínimo 30
(n1  30 e n2  30 )
Se 1 e 2 desconhecidos, use dados amostrais
Intervalo de Confiança para
Amostras Grandes
1. Hipóteses:



Amostras aleatórias independentes
Tamanho de ambas as amostras no mínimo 30
(n1  30 e n2  30 )
Se 1 e 2 desconhecidos, use dados amostrais
2. Intervalo de confiança para 1 - 2:
x1  x2   Zα/2 
2
σ1
n1

2
σ2
n2
Exemplo de Estimação de Duas
Médias (Amostras Grandes)
Usando os seguintes dados sobre preços
de automóveis, construa um intervalo com
95% de confiança para a diferença entre
os preços médios populacionais.
Tamanho amostra
Média amostral
D. padr. amostral
EUA
Vendas
50
$14.545
$ 1.989
Japão
Vendas
30
$15.243
$ 1.843
Solução do Exemplo de Estimação
 x1  x2   Zα/2 
2
σ1
n1

2
σ2
n2
14.545  15.243  1,96 
1.989
2

50
 698  1,96 438,57  698  860
(1.558, 162)
1.843
30
2
Testando Duas Médias
Populacionais Independentes
Teste Z para Amostras Grandes
Teste Z de Duas Médias
Independentes (Amostra Grande)
1. Hipóteses:


Amostras aleatórias independentes
Tamanho de ambas as amostras no mínimo
30 (n1  30 e n2  30 )
Teste Z para Duas Médias
Independentes (Amostra Grande)
1. Hipóteses:


Amostras aleatórias independentes
Tamanho de ambas as amostras no mínimo 30
(n1  30 e n2  30 )
2. Teste Z para duas amostras independentes:
Z
(X1 X 2 )  1 
2
2
1
2
2

n1
n2

(X1 X 2 )  1 
2
2
s1
n1

s2
2
n2
Exemplo de Teste Z para Amostras
Grandes
Você é um analista financeiro. Você deseja
saber se há diferença nos rendimentos em
dividendos entre ações listadas no NYSE e
NASDAQ. Você coletou os seguintes dados:
NYSE
NASDAQ
Número
121
125
Média
3,27
2,53
Desv. Pad. 1,30
1,16
Há diferença no rendimento
médio ( = 0,05)?
© 1984-1994 T/Maker Co.
Solução do Teste Z para Amostras
Grandes
H0: 1 - 2 = 0 (1 = 2)
H1: 1 - 2  0 (1  2)
  0,05
n1 = 121, n2 = 125
Valores Críticos:
Reject H0
Reject H0
.025
.025
-1.96 0 1.96
z
Estatística de Teste:
3,27  2,5
z
 4,69
3
1698
,
1353
,

121
125
Decisão:
Rejeitar com  = 0,05
Conclusão:
Há evidência de
diferença nas médias
Comparando 2 Variâncias
Populacionais Independentes:
Teste F
Teste F para Duas Variâncias
1. Testa a diferença entre 2 variâncias
populacionais
2. Hipóteses

Ambas populações são normalmente
distribuídas


Teste não é robusto quanto a violações
Amostras aleatórias independentes
Teste F para Variâncias:
Hipóteses e Estatística de Teste
1. Hipóteses

H0: 12 = 22
H1: 12  22
OU
H0 :  1 2   2 2
H1: 12 22 (ou >)
2. Estatística de teste


F = s12 /s22
Dois conjuntos de graus de liberdade


1 = n1 - 1; 2 = n2 - 1
Segue a distribuição F
Teste F para 2 Variâncias:
Valores Críticos
0
F
Teste F para 2 Variâncias:
Valores Críticos
Rejeita H
0
0
Rejeita H 0
F
Teste F para 2 Variâncias:
Valores Críticos
Reject H0
Reject H0
Do Not
Reject H0
0
F
Teste F para 2 Variâncias:
Valores Críticos
Reject H0
Reject H0
Do Not
Reject H0
/2
0
/2
F
Teste F para 2 Variâncias:
Valores Críticos
Reject H0
Reject H0
Do Not
Reject H0
/2
0
/2
F
FU ( / 2;  1, 2 )
Teste F para 2 Variâncias:
Valores Críticos
Reject H0
Reject H0
Do Not
Reject H0
/2
/2
F
0
FL ( / 2;  1, 2 ) 
1
FU ( / 2;  2 , 1 )
FU ( / 2;  1, 2 )
Note!
Exemplo de Teste F para
Variâncias
Você é um analista financeiro. Você deseja
comparar dividendos de ações listadas na
NYSE e na NASDAQ. Você coletou os
seguintes dados:
NYSE
NASDAQ
Número
21
25
Média
3,27
2,53
Desv. Pad. 1,30
1,16
Há diferença de variâncias
entre a NYSE e a NASDAQ
ao nível de 0,05?
© 1984-1994 T/Maker Co.
Solução do Teste F para 2
Variâncias
H0: 12 = 22
H1: 12  22

1 
2 
Valores Críticos:
Estatística de Teste:
Decisão:
Conclusão:
Solução do Teste F para 2
Variâncias
H0: 12 = 22
H1: 12  22
  0,05
1  20 2  24
Valores Críticos:
Estatística de Teste:
Decisão:
Conclusão:
Solução do Teste F para 2
Variâncias
Reject H0
/2 = 0,025
Reject H0
Do Not
Reject H0
/2 = 0,025
F
0
FU (.025; 20, 24 )  2.33
FL (.025; 20, 24 ) 
1
FU (.025; 24, 20)
1

 0.415
2.41
Solução do Teste F para 2
Variâncias
H0: 12 = 22
H1: 12  22
  0,05
1  20 2  24
Valores Críticos:
Reject
Decisão:
Reject
.025
0 0.415
Estatística de Teste:
.025
2.33
Conclusão:
F
Solução do Teste F para 2
Variâncias
H0: 12 = 22
H1: 12  22
  0,05
1  20 2  24
Valores Críticos:
Reject
F
S12
S2
2

1,30 2

1,162
Decisão:
Reject
.025
0 0.415
Estatística de Teste:
.025
2.33
Conclusão:
F
 1,25
Solução do Teste F para 2
Variâncias
H0: 12 = 22
H1: 12  22
  0,05
1  20 2  24
Valores Críticos:
Reject
F
2

1,30 2

1,162
 1,25
Decisão:
Não rejeitar com  = 0,05
.025
2.33
S12
S2
Reject
.025
0 0.415
Estatística de Teste:
Conclusão:
F
Solução do Teste F para 2
Variâncias
H0: 12 = 22
H1: 12  22
  0,05
1  20 2  24
Valores Críticos:
Reject
F
2

1,30 2

1,162
 1,25
Decisão:
Não rejeitar com  = 0,05
.025
2.33
S12
S2
Reject
.025
0 0.415
Estatística de Teste:
F
Conclusão:
Não há evidência de
diferença nas variâncias
Questão
Você é um analista para a companhia de luz.
Você deseja comparar o consumo de eletricidade
de casas em 2 cidades. Você obteve os
seguintes dados de uma amostra de casas:
Cidade 1 Cidade 2
Número
25
21
Média
$ 85
$ 68
Desv. Pad. $ 30
$ 18
Ao nível de 0,05, há evidência de diferença
nas variâncias das duas cidades?
Solução
H0:
H1:

1  24 2 
Valores Críticos:
Estatística de Teste:
Decisão:
Conclusão:
Solução
H0: 12 = 22
H1: 12  22
  0,05
1  24 2  20
Valores Críticos:
Estatística de Teste:
Decisão:
Conclusão:
Solução
Reject H0
/2 = 0,025
Reject H0
Do Not
Reject H0
/2 = 0,025
F
0
FU (.025; 24, 20)  2.41
FL (.025; 24, 20) 
1
FU (.025; 20, 24 )
1

 0.429
2.33
Solução
H0: 12 = 22
H1: 12  22
  0,05
1  24 2  20
Valores Críticos:
Reject
Decisão:
Reject
.025
0 0.429
Estatística de Teste:
.025
2.41
Conclusão:
F
Solução
H0: 12 = 22
H1: 12  22
  0,05
1  24 2  20
Valores Críticos:
Reject
F
S12
S2
2

30 2

182
Decisão:
Reject
.025
0 0.429
Estatística de Teste:
.025
2.41
Conclusão:
F
 2,778
Solução
H0: 12 = 22
H1: 12  22
  0,05
1  24 2  20
Valores Críticos:
Reject
F
2

30 2

182
 2,778
Decisão:
Rejeitar com  = 0,05
.025
2.41
S12
S2
Reject
.025
0 0.429
Estatística de Teste:
Conclusão:
F
Solução
H0: 12 = 22
H1: 12  22
  0,05
1  24 2  20
Valores Críticos:
Reject
F
2

30 2

182
 2,778
Decisão:
Rejeitar com  = 0,05
.025
2.41
S12
S2
Reject
.025
0 0.429
Estatística de Teste:
F
Conclusão:
Há evidência de
diferença nas variâncias
Testando as Médias de Duas
Populações Independentes
Teste t para Amostras Pequenas
Teste t para Duas Médias
Independentes (Amostra Pequena)
1. Testa médias de 2 populações
independentes com variâncias iguais
2. Hipóteses:




Tamanho de ao menos uma das amostras
menor que 30
Amostras aleatórias independentes
Ambas populações com distribuição normal
Variâncias populacionais são desconhecidas
mas supostas iguais
Teste t para Amostras Pequenas

X 1  X 2   μ1  μ 2 
t
SP
SP 
2
2
 1
1 
 

 n1 n 2 
Diferença
suposta
n1  1  S 12  n 2  1  S 2 2
n1  n 2  2
gl  n1  n 2  2
Exemplo de Teste t para Amostras
Pequenas
Você é um analista financeiro. Você deseja
saber se há diferença nos rendimentos em
dividendos entre ações listadas no NYSE e
NASDAQ. Você coletou os seguintes dados:
NYSE
NASDAQ
Número
21
25
Média
3,27
2,53
Desv. Pad. 1,30
1,16
Supondo populações normais,
há diferença no rendimento
médio ( = 0,05)?
© 1984-1994 T/Maker Co.
Solução do Teste t para Amostras
Pequenas

X1  X 2   μ1  μ2  3,27  2,53   0 
t

 1
1 

SP  

 n1 n2 
2
SP
1 
 1
1,510  


 21 25 
2
2




n

1

S

n

1

S
2
1
2
2
 1
n1  n2  2

21  1  1,30 2  25  1  1,16 2

21  25  2
 1,510
 2,03
Solução do Teste t para Amostras
Pequenas
H0: 1 - 2 = 0 (1 = 2)
Ha: 1 - 2  0 (1  2)
  0,05
gl  21 + 25 - 2 = 44
Valores Críticos:
Reject H00
Reject H00
.025
.025
-2.0154 0 2.0154
t
Estatística de Teste:
t
3,27  2,53
1 1
1,510    
 21 25 
 2,03
Decisão:
Rejeitar com  = 0,05
Conclusão:
Há evidência de
diferença nas médias
Teste Z para Diferenças entre
Duas Proporções
Teste Z para Diferença entre Duas
Proporções
1. Hipóteses:



Populações são independentes
Populações seguem distribuição binomial
Aproximação pela Normal pode ser usada
 np
ˆ  3 npˆ 1 pˆ  não contém 0 ou n
Teste Z para Diferença entre Duas
Proporções
1. Hipóteses:



Populações são independentes
Populações seguem distribuição binomial
Aproximação pela Normal pode ser usada
 np
ˆ  3 npˆ 1 pˆ  não contém 0 ou n
2. Teste Z para duas proporções:

pˆ 1  pˆ 2   p1  p2 
Z
1 1
pˆ  1  pˆ     
 n1 n2 
X1  X 2
onde pˆ 
n1  n2
Exemplo de Teste Z para Duas
Proporções
Você quer testar a percepção
de justiça de dois métodos de
avaliação de desempenho. 63
de 78 empregados acharam o
Método 1 justo. 49 de 82
acharam o Método 2 justo. Ao
nível de 0,01, há diferença nas
percepções?
Solução do Teste Z para Duas
Proporções
ˆp1  X1  63  0,808
n1 78
ˆp2  X 2  49  0,598
n2 82
ˆp  X1  X 2  63  49  0,70
n1  n2 78  82
Z
pˆ 1  pˆ 2   p1  p2 


ˆp  1  pˆ   1  1 
n n 
2
 1
 2,90

0,808  0,598  0
1
 1
0,70  1 0,70    
 78 82 
Solução do Teste Z para Duas
Proporções
H0: p1 - p2 = 0
H1: p1 - p2  0
 = 0,01
n1 = 78 n2 = 82
Valores Críticos:
Reject H00
Reject H00
.005
.005
-2.58 0 2.58 Z
Estatística de Teste:
Z  2.90
Decisão:
Rejeitar com  = 0,01
Conclusão:
Há evidência de diferença
nas proporções
Download

cap08