Laboratório em Planos Complexos
de Amostragem
Vigitel
Janeiro de 2013
1
Histórico
Inquérito por Telefone
Vantagens
Desvantagens
 Baixo custo
 Problemas de cobertura
 Rapidez no preenchimento dos
questionários
 Disponibilidade das listas
telefônicas
 Maior controle sobre erros não
amostrais
 Atualização dos cadastros
de telefones
Métodos usuais de amostragem de linhas
telefônicas residenciais
Fonte de Informação
Métodos de Seleção
Pontos Críticos
 Lista telefônica
 Sorteio aleatório
ou estratificado
 Cobertura
 Atualização do
cadastro
 Disponibilidade
 Prefixos do número
do telefone
 Random Digital Dialing (RDD)
11 - 3061 - _ _ _ _
 Complexidade
 Lista comercial
 Sorteio aleatório
ou estratificado
 Custo
 Cobertura
Vigitel
Plano de Amostragem
 Abrangência: 26 capitais e Distrito Federal
 População de estudo
Adultos (>=18 anos) residentes nas capitais
 Número mínimo de entrevista: 2.000 em cada cidade
Vigitel
População
Amostra probabilística
População de Estudo
Vigitel
Pesos de
Pós-estratificação
(idade, sexo e escolaridade)
Resultados para
população de estudo (N)
Rio de Janeiro
São Paulo
Curitiba
Belo Horizonte
Porto Alegre
Florianópolis
Vitória
Distrito Federal
Goiânica
Salvador
Recife
Cuiabá
Belém
Campo Grande
Aracaju
São Luis
Natal
Fortaleza
Manaus
Porto Velho
João Pessoa
Teresina
Maceió
Boa Vista
Rio Branco
Macapá
Palmas
%
Vigitel
Cobertura de domicílios com acesso a linha telefônica fixa.
Capitais brasileiras e Distrito Federal, 2010
80
70
60
50
40
30
20
10
0
Média
Capitais
Fonte: Censo 2010
Sorteio da Amostra
Primeiro estágio:
 Cadastro eletrônico de linhas residenciais fixas
 Amostragem sistemática ordenada por CEP
Sorteio da Amostra
Universo
CEP3
Amostra
5.000 linhas
telefônicas
N
%
660
93.002
Réplica 1
Amostra
200
linhas
CEP3
661
13.9091
telefônicas n
666 % 35.805%
660
2.134
668
661
319
Réplica 2
670
666
821
200 linhas
671
telefônicas
668
594
672
670
334
Total
671
734
672
Total
Amostra
n
42,67
2
6,38
%
16,43
42,68 43,00 43,00
25.880
11,87
6,38
6,50
6,50
14.560
6,68
16,42 16,00 16,00
31.984
14,67
11,88 12,00 12,00
2.809
1,29
6,68
7,00
7,00
217.949
100,00
14,68 14,50 14,50
Réplicas
2.134
%
42,68
3
319
%
821
46,38
%
16,42
5
43,00
594
6,50
334
16,00
734
12,00
64
6,50
5.000
15,00
43,00
11,88
6,00
6,68
16,50
14,68
12,00
1,28
6,50
100
15,00
43,00
%
6,00
16,50
12,00
6,50
15,00
64
1,28
1,00
1,00
1,00
1,00
1,00
5.000
100
100,0
0
100,0
0
100,0
0
100,0
0
100,0
0
Réplica 25
200 linhas
telefônicas
Resultados
Distribuição das linhas telefônicas por réplicas e CEP4.
Aracaju, 2010
Amostra sorteada
100%
90%
80%
4916
70%
4909
60%
4908
4907
50%
4906
40%
4905
30%
4903
20%
4902
10%
4901
0%
4900
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
Réplicas
Sorteio da Amostra
Segundo estágio:
 Sorteio de um adulto residente no domicílio
Pesos
Peso da amostra para uma capital qualquer é dado por:
peso _ amostraij  ifa i * número _ adultos ij *
1
qtde _ linhas _ telefônicasij
sendo i=1, 2, ..., 27 (capitais) e j= 1, 2, ..., n (entrevistas)
O peso final:
peso _ final ijk  peso _ amostra ij *
N popadulta
ni
i PesoPos
jkl
sendo i= 1, 2, ... 27 (cidades)
j=1,2, ..., n (entrevistas)
k= 1, 2, ..., 36 (células da pós-estratificação)
Operacional de campo
Processo em 2010
Amostra de
linhas telefônicas
(n=5.000)
Linhas telefônicas utilizadas
(média de 3.000)
57%
Elegível
Taxa de
Resposta (77%)
Status
43%
Empresa
Não existe
Fora de serviço
10 tentativas sem sucesso
Não
elegível
Percentual de linhas elegíveis
%
80
70
60
50
40
30
20
10
0
Municípios
Taxa de resposta
(%)
100
90
80
70
60
50
40
30
20
10
0
Municípios
Resultados
Distribuição das linhas telefônicas por réplicas e CEP4.
Aracaju, 2010
Amostra sorteada
Amostra realizada
100%
100%
90%
90%
80%
4916
80%
4916
70%
4909
70%
4909
60%
4908
60%
4908
4907
50%
4906
40%
4907
50%
4906
40%
4905
4905
30%
4903
20%
4902
30%
4903
20%
10%
4901
10%
0%
4900
0%
4902
4901
4900
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
Réplicas
Réplicas
Resultados – Aracaju/2010
Taxa resposta
%
Taxa de elegível
90
80
80
70
70
60
60
%
90
50
50
40
40
30
30
20
20
10
10
0
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
Réplicas
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
Réplicas
Peso de Pós-Estratificação
Regressão logística múltipla
 Variável resposta : (0) Sem telefone fixo
PNAD
(1) Com telefone fixo
 Variáveis explicativas : Faixa etária
Sexo
Anos de estudo
Cor da pele
Posse de plano de saúde
Métodos
 Seleção de variáveis para construção dos pesos de pós-estratificação
Região
Variáveis
Constante
Anos Estudo
Norte
Raça Branca
Tem Plano Saúde
Constante
Anos Estudo
Nordeste
Raça Branca
Tem Plano Saúde
Área Urbana
Constante
Anos Estudo
Raça Branca
Sudeste
Tem Plano Saúde
Região Metropolitana
Área Urbana
Constante
Anos Estudo
Raça Branca
Sul
Tem Plano Saúde
Região Metropolitana
Área Urbana
Constante
Anos Estudo
Raça Branca
Centro-Oeste
Tem Plano Saúde
Região Metropolitana
Área Urbana
Estimativa Erro-Padrão
-1.355
0.056
0.105
0.005
0.316
0.041
1.270
0.057
-4.106
0.147
0.139
0.003
0.189
0.030
1.430
0.041
2.691
0.149
-2.956
0.125
0.112
0.031
0.391
0.029
1.293
0.035
0.445
0.043
2.061
0.127
-2.581
0.137
0.133
0.005
0.383
0.051
1.061
0.046
0.179
0.061
1.824
0.127
-3.189
0.199
0.109
0.005
0.360
0.041
1.153
0.061
0.730
0.087
2.319
0.205
t
-24.250
20.190
7.640
22.090
-27.950
44.290
6.310
34.800
18.070
-23.580
36.250
13.620
36.830
10.380
16.280
-18.520
25.110
7.510
22.980
2.950
14.410
-15.960
21.560
8.870
18.810
8.350
11.290
P>|t|
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
LTR segundo cor da pele e anos de estudo
cor da pele branca
cor da pele não branca
.75
Raca Não Branca
Probabilidade
.5
Tem Telefone
.25
Probabilidade
.5
Tem Telefone
Não Tem Telefone
0
0
Não Tem Telefone
.25
(mean) p/(mean) p0
.75
Raca Branca
0
5
10
anos de estudo
(a)
Indivíduos com
cor
branca
(mean)
p da pele (mean)
p0
15
0
5
10
15
anos de estudo
Indivíduos com
nãop0branca
(b)
(mean)cor
p da pele(mean)
Fonte: BERNAL, R.T.I.; SILVA, NN da. Linhas Telefonicas Residenciais: uso em inquéritos
epidemiológicos no Brasil. São Paulo; 2006 [Dissertação de Mestrado – FSP – USP].
Métodos
 Pesos de pós-estratificação - Célula
Distribuição de frequência bivariada da população e da amostra. Método de
ponderação por célula
1
2
.
.
.
H
Total
1
FR11
FR21
.
.
.
FRH1
FR.1
População
2
...
FR12 ...
FR22 ...
.
.
.
.
.
.
FRH2 ...
FR.2
K
FR1K
FR2K
.
.
.
FRHK
FR.K
Total
FR1.
FR2.
.
.
.
FRH.
1
1
2
.
.
.
H
Total
1
fr11
fr21
.
.
.
frH1
fr.1
Amostra
2
...
fr12
...
fr22
...
.
.
.
.
.
.
frH2
...
fr.2
Figura extraída do livro do KALTON, 1983 pp.56
peso _ pósestrati cação 
K
fr1K
fr2K
.
.
.
frHK
fr.K
FRHK
f HK
Total
fr1.
fr2.
.
.
.
frH.
1
População
Idade e escolaridade
40a49 e 0a8
50a59 e 0a8
60+ e 0a8
40a49 e 9a11
50a59 e 9a11
H,60+ e 9a11
40a49 e 12+
50a59 e 12+
60+ e 12+
Total
Amostra
Sexo
M
0.10
0.09
0.11
0.05
0.04
0.01
0.05
0.03
0.01
0.47
F
0.09
0.09
0.12
0.08
0.03
0.01
0.07
0.02
0.01
0.53
Total
Idade e escolaridade
0.20
0.18
0.23
0.13
0.07
0.02
0.12
0.04
0.01
1.00
40a49 e 0a8
50a59 e 0a8
60+ e 0a8
40a49 e 9a11
50a59 e 9a11
H,60+ e 9a11
40a49 e 12+
50a59 e 12+
60+ e 12+
Total
Sexo
M
0.05
0.06
0.06
0.07
0.03
0.02
0.05
0.02
0.01
0.38
F
0.08
0.08
0.14
0.10
0.07
0.02
0.07
0.04
0.02
0.62
Pesos de pós-estratificação
Idade e escolaridade
FRHK
peso _ pósestrati cação 
frhk
40a49 e 0a8
50a59 e 0a8
60+ e 0a8
40a49 e 9a11
50a59 e 9a11
H,60+ e 9a11
40a49 e 12+
50a59 e 12+
60+ e 12+
Sexo
M
1.956
1.371
1.763
0.654
1.147
0.459
1.160
1.097
0.462
F
1.213
1.153
0.859
0.835
0.447
0.411
0.956
0.421
0.368
Total
0.13
0.14
0.20
0.17
0.10
0.04
0.12
0.07
0.03
1.00
Exemplo:
Pirâmide etária e distribuição da variável escolaridade segundo inquérito.
Município de Rio Branco-AC, 2007
[65;96]
[65;96]
[55;64]
[55;64]
[45;54]
[45;54]
[35;44]
[35;44]
[25;34]
[25;34]
[18;24]
[18;24]
-20
-15
v-10
-5
0
H
5
10
15
20
-20
-15
v-10
-5
M
0
H
(a) População (PNAD)
M
(b) Amostra Vigitel
50
45
40
35
30
25
20
15
10
5
0
%
[0;8]
[9;11]
[12; 20]
5
10
15
20
[65;96]
[65;96]
[55;64]
[55;64]
[45;54]
[45;54]
[35;44]
[35;44]
[25;34]
[25;34]
Exemplo:
[18;24]
-20
-15
[18;24]
v-10
-5
0
5
10
15
20
-20
-15
v-10
-5
0
5
10
15
20
H M
Pirâmide etária He Mdistribuição da variável escolaridade
segundo inquérito.
(a) População (PNAD)
(b) Amostra Vigitel
Município de Rio Branco-AC, 2007
50
45
40
35
30
25
20
15
10
5
0
%
[0;8]
[9;11]
Anos de estudo
(c) População
- PNAD
(d) Amostra Vigitel
[12; 20]
Medidas resumo do peso final em Rio Branco
Categorias
Homem, 18a24,0a8
Homem, 18a24, 9a11
Medidas resumo
4357.4
DP
1772.1
CV
0.4
Média
436.9
DP
174.7
CV
0.4
Média
Homem, 18a24, 12ou+ DP
CV
Homem, 25a34, 0a8
1396.7
Homem, 35a44, 9a11
529.8
DP
253.6
CV
0.5
DP
547.5
CV
0.5
Média
365.1
DP
159.7
Homem, 35a44,12ou+ DP
CV
Homem, 45a54,9a11
Mulher, 25a34,9a11
850.4
435.4
CV
0.5
Média
294.6
DP
126.4
0.6
Média
543.2
DP
211.5
CV
0.4
Mulher, 35a44, 9a11
874.2
0.5
Média
427.4
DP
204.6
CV
0.5
190.9
89.3
0.5
Média
828.7
DP
417.5
CV
0.5
Média
311.5
DP
162.4
Média
Mulher, 35a44,12ou+ DP
CV
0.5
209.9
95.8
0.5
Média
560.3
DP
253.2
CV
0.5
Média
Mulher, 45a54,9a11
0.4
DP
CV
Mulher,45a54,0a8
72.0
1819.6
CV
Mulher,35a44,0a8
177.5
Média
Média
0.4
DP
CV
Mulher, 25a34. 12ou+ DP
0.4
Média
1774.1
CV
294.2
129.1
DP
CV
Mulher, 25a34, 0a8
Peso final
3092.3
Mulher, 18a24, 12ou+ DP
0.5
1163.3
Média
Homem,45a54,0a8
97.6
Medidas resumo
Média
Média
214.5
Média
CV
Mulher, 18a24, 9a11
0.5
Média
CV
Mulher, 18a24,0a8
0.4
DP
Média
Homem,35a44,0a8
63.0
2800.4
Homem, 25a34. 12ou+ DP
Categorias
179.3
Média
CV
Homem, 25a34,9a11
Peso final
Média
DP
195.5
87.6
Avaliação dos pesos
2006 a 2011
Média do efeito de delineamento (deff) e do tamanho efetivo da amostra (ndeff) por indicador
segundo região – peso da amostra
Indicador
Norte
DEFF
Nordeste
ndeff
DEFF
Sudeste
ndeff
DEFF
Sul
ndeff
DEFF
Centro-Oeste
ndeff
DEFF
ndeff
FLV recomendado
1.18
1700
1.18
1702
1.18
1694
1.18
1695
1.18
1690
FLV regular
1.18
1690
1.20
1672
1.20
1661
1.21
1656
1.20
1667
Obesidade
1.19
1689
1.19
1683
1.19
1679
1.21
1655
1.18
1690
Hipertensão arterial
1.20
1672
1.18
1694
1.19
1674
1.19
1684
1.18
1696
Ex-fumante
1.20
1661
1.18
1696
1.20
1664
1.20
1666
1.19
1680
Diabetes
1.21
1654
1.17
1714
1.17
1712
1.17
1712
1.17
1719
Excesso de peso
1.21
1647
1.20
1662
1.22
1645
1.21
1647
1.21
1653
Fuma 20 ou mais
1.23
1641
1.19
1687
1.23
1628
1.27
1586
1.20
1674
Leite com gordura
1.22
1641
1.21
1652
1.22
1639
1.22
1639
1.22
1646
Gordura
1.25
1606
1.24
1619
1.25
1604
1.24
1612
1.22
1636
Fumante
1.26
1593
1.22
1644
1.23
1628
1.25
1600
1.21
1649
Refrigerante 5 ou mais
1.27
1582
1.27
1581
1.26
1587
1.26
1587
1.25
1602
Mamografia
1.26
217
1.23
297
1.23
319
1.27
330
1.25
280
Mamografia 2 anos
1.23
221
1.22
298
1.25
311
1.26
325
1.21
288
Papanicolau
1.31
645
1.29
630
1.31
595
1.28
613
1.30
639
Papanicolau 3 anos
1.29
655
1.26
643
1.28
609
1.25
626
1.26
657
Não há diferença entre regiões
Efeito do sorteio de um adulto no domicílio produz deff entre 1.17 e 1.31
Métodos
 Pesos de pós-estratificação - Rake
Tabela de contingência da população e da amostra
1
1
2
.
.
.
H
Marginal
FR.1
População
2
...
FR.2
K
FR.K
Marginal
FR1.
FR2.
.
.
.
FRH.
1
1
2
.
.
.
H
Marginal
1
w11
w21
.
.
.
wH1
fr.1
Amostra
2
...
w12
...
w22
...
.
.
.
.
.
.
wH2
...
fr.2
K
w1K
w2K
.
.
.
wHK
fr.K
Marginal
fr1.
fr2.
.
.
.
frH.
1
Saída da macro Raking
Saída da macro Raking
Saída da macro Raking
Download

VIGITEL