Amostragem de Conglomerados em Um
Único Estágio – Conglomerados de
Tamanhos Diferentes
• Notação:
– População:
1
2
...
i
...
M
XiT é o total do cluster i;
Ni é o tamanho do cluster i;
Ni
X iT   X ij
j 1
Xi
é a média do cluster i.
Xij valor da variável de interesse do elemento j e
cluster i.
1
Amostra: a amostra de cluster consiste de todos os
elementos de cada um dos m cluster selecionados
aleatoriamente a partir dos M cluster da população.
1
2
...
i
...
m
xiT é o total do cluster i;
ni é o tamanho do cluster i;
xi
é a média do cluster i.
Unidade primárias: são os clusters;
Unidades secundárias: são os elementos da população dentro dos clusters;
A amostra de cluster é uma amostra aleatória simples de clusters.
2
A média populacional geral () (isto é, o valor médio de X das unidades secundárias) é:
M
Ni
   X ij
i 1 j 1
M
M
N  X
i
i 1
i 1
M
iT
N
i 1
i
Interpretação: razão do total dos valores XiT para o total dos valores Ni.
Estimação: desejamos estimar  a partir de uma amostra de
conglomerados.
m
xc   xiT
i 1
m
n
i 1
i
A qual é a razão da soma dos totais de clusters para a soma dos tamanhos de
clusters, na amostra de clusters selecionada.
3
Variância de x pode ser estimada a partir da
c
amostra por:

M  mM  ni 
2
Varxc  
  xi  xc 

mm  1 i 1  N 
m
2
E se N for desconhecido, ele pode ser substituído pelo estimador Mn/m, onde n
é o tamanho efetivo da amostra, obtendo-se:

M  mm  ni 
2
Varxc  
  xi  xc 

M m  1 i 1  n 
m
2
(amostragem sem reposição)
I .C.;95% : xc  t. Varxc 
4
Estimação do total geral XT
xT  Nxc
Var xT   N Var xc 
2
5
Exemplo:
Trata-se de avaliar o rendimento dos alunos da primeira série do primeiro grau, na
rede de ensino público de certa localidade.
A partir da relação das 3500 turmas existentes, foram preparados conglomerados
(clusters), juntando turmas de diferentes escolas, com o objetivo de agrupar alunos
o mais possível diferentes no que se refere ao rendimento (necessidade dos
conglomerados serem heterogêneos).
Os conglomerados foram formados com 5 turmas de, aproximadamente, 150
alunos, supondo uma base de 30 alunos por turma. Na população temos 700
clusters.
Deseja-se observar uma amostra de 1500 alunos.
Considerando:
n  mN  1500/ 150  10 conglomerados
Prob(cluster) = 10/700 = 0,014286
6
Conglomerados da
amostra
Número de alunos
ni
Soma dos escores
XiT
1
162
1004,4
2
170
952,0
3
145
1015,0
4
151
830,5
5
160
960,0
6
162
793,8
7
145
855,5
8
148
947,2
9
171
1214,1
10
178
1032,4
Total
1592
9604,9
7
Estimativa do rendimento médio por aluno
m
xc   xiT
i 1
m
n
i 1
i
xc  9604,9 / 1592 6,033
8
Estimativa da variância da média de conglomerado

M  mm  ni 
2
Varxc  
  xi  xc 

M m  1 i 1  n 
2
m
Conglomerados
1
2
3
4
5
6
7
8
9
10
TOTAL
0,1018
0,1068
0,0911
0,0948
0,1005
0,1018
0,0911
0,0930
0,1074
0,1118
0,0104
0,0114
0,0083
0,0090
0,0101
0,0104
0,0083
0,0086
0,0115
0,0125
0,1670
-0,4330
0,9670
-0,5330
-0,0330
-1,1330
-0,1330
0,3670
1,0670
-0,2330
0,0279
0,1875
0,9351
0,2841
0,0011
1,2837
0,0177
0,1347
1,1385
0,0543
0,00029
0,002138
0,007761
0,002557
1,11E-05
0,01335
0,000147
0,001158
0,013093
0,000679
0,041184
9

700 1010
Var  xc  
0,041184 0,0451
70010  1
DP xc   0,0451 0,212368
IC  : 6,033 2,262.0,212368
5,5526; 6,5133
Distribuição t de Student com 10-1 = 9 graus de liberdade
10
Estimativa do coeficiente de variação da média de
conglomerado
Indica a precisão da média e o padrão é que ele seja inferior a 10%.
DPxc  0,212368
CV xc  

 0,0352
xc
6,033
Exercício:
Estimar o total geral XT.
11
Estimação de uma proporção
• Notação
– X é uma variável de interesse de estudo. Por
exemplo: 1) proporção de famílias com casa
própria e 2) proporção de domicílios com pelo
menos um automóvel.
– Xij = 1 se o elemento j do conglomerado i tem o
atributo em estudo;
– Xij = 0 se o elemento j do conglomerado i não tem
o atributo em estudo;
12
População:
XiT é a quantidade de elementos que possui o atributo ou a
característica em estudo no conglomerado i.
Ni
X iT   X ij
O total de elementos que possuem
o atributo ou a característica no
conglomerado i.
X iT
Xi 
 Pi
Ni
A proporção de elementos que
possuem o atributo ou a
característica no conglomerado i.
j 1
M
X 
X
i 1
M
iT
N
i 1
P
A proporção de elementos que
possuem o atributo ou a
característica na população.
i
13
Estimador:
Proporção na amostra
m
pc 
x
i 1
m
iT
n
i 1
i
xiT é a quantidade de elementos que possuem o atributo
no conglomerado i.
Ni é o tamanho (a quantidade de registros, casos) no
conglomerado i selecionado.
14
Variância da
proporção da amostra

M  mm  ni 
2
Var pc  
   pi  pc 

M m  1 i 1  n 
m
2
DP pc   Var pc 
n é a quantidade total de registros, casos ou observações na amostra
selecionada.
pi é a proporção amostral de elementos com o atributo no
conglomerado i selecionado.
I .C. ;95% : pc  1,96.DP pc 
15
Exemplo:
No exemplo anterior observou-se, também, o número de alunos
que compram lanche, cujos resultados foram:
Conglomerados da
amostra
Número de alunos
ni
Número de alunos
que compram
lanche
xiT
1
162
50
2
170
63
3
145
47
4
151
48
5
160
68
6
162
59
7
145
36
8
148
45
9
171
71
10
178
75
Total
1592
562
16
 Estimativa
da proporção dos alunos que compram
lanche
m
pc 
x
i 1
m
iT
n
i 1
562

 0,3530
1592
i
Estimativa da variância da proporção dos alunos que
compram lanche

M  mm  ni 
2


Var pc  
p

p
  i

c
M m  1 i 1  n 
m
2
17
Conglomerados
da amostra
1
2
3
4
5
6
7
8
9
10
Total
162
170
145
151
160
162
145
148
171
178
50
63
47
48
68
59
36
45
71
75
0,101759
0,106784
0,09108
0,094849
0,100503
0,101759
0,09108
0,092965
0,107412
0,111809
0,010355
0,011403
0,008296
0,008996
0,010101
0,010355
0,008296
0,008642
0,011537
0,012501
0,308642
0,370588
0,324138
0,317881
0,425000
0,364198
0,248276
0,304054
0,415205
0,421348
0,001969
0,000309
0,000834
0,001234
0,005182
0,000125
0,010970
0,002397
0,003868
0,004669
0,0000203884
0,0000035214
0,0000069177
0,0000111053
0,0000523404
0,0000012949
0,0000910057
0,0000207175
0,0000446212
0,0000583738
0,0003102866

700 1010
Var pc  
0,000310286 0,0003398
70010  1
DP pc   0,0003398 0,018433
18
I .C. ;95% : pc  1,96.DP pc 
I .C. ;95% : 0,3530 1,96.0,018433
0,3169;0,3891
19
Download

Amostragem de Conglomerados em Um Único Estágio