Laboratório em Planos Complexos de Amostragem Vigitel Janeiro de 2013 1 Histórico Inquérito por Telefone Vantagens Desvantagens Baixo custo Problemas de cobertura Rapidez no preenchimento dos questionários Disponibilidade das listas telefônicas Maior controle sobre erros não amostrais Atualização dos cadastros de telefones Métodos usuais de amostragem de linhas telefônicas residenciais Fonte de Informação Métodos de Seleção Pontos Críticos Lista telefônica Sorteio aleatório ou estratificado Cobertura Atualização do cadastro Disponibilidade Prefixos do número do telefone Random Digital Dialing (RDD) 11 - 3061 - _ _ _ _ Complexidade Lista comercial Sorteio aleatório ou estratificado Custo Cobertura Vigitel Plano de Amostragem Abrangência: 26 capitais e Distrito Federal População de estudo Adultos (>=18 anos) residentes nas capitais Número mínimo de entrevista: 2.000 em cada cidade Vigitel População Amostra probabilística População de Estudo Vigitel Pesos de Pós-estratificação (idade, sexo e escolaridade) Resultados para população de estudo (N) Rio de Janeiro São Paulo Curitiba Belo Horizonte Porto Alegre Florianópolis Vitória Distrito Federal Goiânica Salvador Recife Cuiabá Belém Campo Grande Aracaju São Luis Natal Fortaleza Manaus Porto Velho João Pessoa Teresina Maceió Boa Vista Rio Branco Macapá Palmas % Vigitel Cobertura de domicílios com acesso a linha telefônica fixa. Capitais brasileiras e Distrito Federal, 2010 80 70 60 50 40 30 20 10 0 Média Capitais Fonte: Censo 2010 Sorteio da Amostra Primeiro estágio: Cadastro eletrônico de linhas residenciais fixas Amostragem sistemática ordenada por CEP Sorteio da Amostra Universo CEP3 Amostra 5.000 linhas telefônicas N % 660 93.002 Réplica 1 Amostra 200 linhas CEP3 661 13.9091 telefônicas n 666 % 35.805% 660 2.134 668 661 319 Réplica 2 670 666 821 200 linhas 671 telefônicas 668 594 672 670 334 Total 671 734 672 Total Amostra n 42,67 2 6,38 % 16,43 42,68 43,00 43,00 25.880 11,87 6,38 6,50 6,50 14.560 6,68 16,42 16,00 16,00 31.984 14,67 11,88 12,00 12,00 2.809 1,29 6,68 7,00 7,00 217.949 100,00 14,68 14,50 14,50 Réplicas 2.134 % 42,68 3 319 % 821 46,38 % 16,42 5 43,00 594 6,50 334 16,00 734 12,00 64 6,50 5.000 15,00 43,00 11,88 6,00 6,68 16,50 14,68 12,00 1,28 6,50 100 15,00 43,00 % 6,00 16,50 12,00 6,50 15,00 64 1,28 1,00 1,00 1,00 1,00 1,00 5.000 100 100,0 0 100,0 0 100,0 0 100,0 0 100,0 0 Réplica 25 200 linhas telefônicas Resultados Distribuição das linhas telefônicas por réplicas e CEP4. Aracaju, 2010 Amostra sorteada 100% 90% 80% 4916 70% 4909 60% 4908 4907 50% 4906 40% 4905 30% 4903 20% 4902 10% 4901 0% 4900 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 Réplicas Sorteio da Amostra Segundo estágio: Sorteio de um adulto residente no domicílio Pesos Peso da amostra para uma capital qualquer é dado por: peso _ amostraij ifa i * número _ adultos ij * 1 qtde _ linhas _ telefônicasij sendo i=1, 2, ..., 27 (capitais) e j= 1, 2, ..., n (entrevistas) O peso final: peso _ final ijk peso _ amostra ij * N popadulta ni i PesoPos jkl sendo i= 1, 2, ... 27 (cidades) j=1,2, ..., n (entrevistas) k= 1, 2, ..., 36 (células da pós-estratificação) Operacional de campo Processo em 2010 Amostra de linhas telefônicas (n=5.000) Linhas telefônicas utilizadas (média de 3.000) 57% Elegível Taxa de Resposta (77%) Status 43% Empresa Não existe Fora de serviço 10 tentativas sem sucesso Não elegível Percentual de linhas elegíveis % 80 70 60 50 40 30 20 10 0 Municípios Taxa de resposta (%) 100 90 80 70 60 50 40 30 20 10 0 Municípios Resultados Distribuição das linhas telefônicas por réplicas e CEP4. Aracaju, 2010 Amostra sorteada Amostra realizada 100% 100% 90% 90% 80% 4916 80% 4916 70% 4909 70% 4909 60% 4908 60% 4908 4907 50% 4906 40% 4907 50% 4906 40% 4905 4905 30% 4903 20% 4902 30% 4903 20% 10% 4901 10% 0% 4900 0% 4902 4901 4900 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 Réplicas Réplicas Resultados – Aracaju/2010 Taxa resposta % Taxa de elegível 90 80 80 70 70 60 60 % 90 50 50 40 40 30 30 20 20 10 10 0 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 Réplicas 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 Réplicas Peso de Pós-Estratificação Regressão logística múltipla Variável resposta : (0) Sem telefone fixo PNAD (1) Com telefone fixo Variáveis explicativas : Faixa etária Sexo Anos de estudo Cor da pele Posse de plano de saúde Métodos Seleção de variáveis para construção dos pesos de pós-estratificação Região Variáveis Constante Anos Estudo Norte Raça Branca Tem Plano Saúde Constante Anos Estudo Nordeste Raça Branca Tem Plano Saúde Área Urbana Constante Anos Estudo Raça Branca Sudeste Tem Plano Saúde Região Metropolitana Área Urbana Constante Anos Estudo Raça Branca Sul Tem Plano Saúde Região Metropolitana Área Urbana Constante Anos Estudo Raça Branca Centro-Oeste Tem Plano Saúde Região Metropolitana Área Urbana Estimativa Erro-Padrão -1.355 0.056 0.105 0.005 0.316 0.041 1.270 0.057 -4.106 0.147 0.139 0.003 0.189 0.030 1.430 0.041 2.691 0.149 -2.956 0.125 0.112 0.031 0.391 0.029 1.293 0.035 0.445 0.043 2.061 0.127 -2.581 0.137 0.133 0.005 0.383 0.051 1.061 0.046 0.179 0.061 1.824 0.127 -3.189 0.199 0.109 0.005 0.360 0.041 1.153 0.061 0.730 0.087 2.319 0.205 t -24.250 20.190 7.640 22.090 -27.950 44.290 6.310 34.800 18.070 -23.580 36.250 13.620 36.830 10.380 16.280 -18.520 25.110 7.510 22.980 2.950 14.410 -15.960 21.560 8.870 18.810 8.350 11.290 P>|t| 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 LTR segundo cor da pele e anos de estudo cor da pele branca cor da pele não branca .75 Raca Não Branca Probabilidade .5 Tem Telefone .25 Probabilidade .5 Tem Telefone Não Tem Telefone 0 0 Não Tem Telefone .25 (mean) p/(mean) p0 .75 Raca Branca 0 5 10 anos de estudo (a) Indivíduos com cor branca (mean) p da pele (mean) p0 15 0 5 10 15 anos de estudo Indivíduos com nãop0branca (b) (mean)cor p da pele(mean) Fonte: BERNAL, R.T.I.; SILVA, NN da. Linhas Telefonicas Residenciais: uso em inquéritos epidemiológicos no Brasil. São Paulo; 2006 [Dissertação de Mestrado – FSP – USP]. Métodos Pesos de pós-estratificação - Célula Distribuição de frequência bivariada da população e da amostra. Método de ponderação por célula 1 2 . . . H Total 1 FR11 FR21 . . . FRH1 FR.1 População 2 ... FR12 ... FR22 ... . . . . . . FRH2 ... FR.2 K FR1K FR2K . . . FRHK FR.K Total FR1. FR2. . . . FRH. 1 1 2 . . . H Total 1 fr11 fr21 . . . frH1 fr.1 Amostra 2 ... fr12 ... fr22 ... . . . . . . frH2 ... fr.2 Figura extraída do livro do KALTON, 1983 pp.56 peso _ pósestrati cação K fr1K fr2K . . . frHK fr.K FRHK f HK Total fr1. fr2. . . . frH. 1 População Idade e escolaridade 40a49 e 0a8 50a59 e 0a8 60+ e 0a8 40a49 e 9a11 50a59 e 9a11 H,60+ e 9a11 40a49 e 12+ 50a59 e 12+ 60+ e 12+ Total Amostra Sexo M 0.10 0.09 0.11 0.05 0.04 0.01 0.05 0.03 0.01 0.47 F 0.09 0.09 0.12 0.08 0.03 0.01 0.07 0.02 0.01 0.53 Total Idade e escolaridade 0.20 0.18 0.23 0.13 0.07 0.02 0.12 0.04 0.01 1.00 40a49 e 0a8 50a59 e 0a8 60+ e 0a8 40a49 e 9a11 50a59 e 9a11 H,60+ e 9a11 40a49 e 12+ 50a59 e 12+ 60+ e 12+ Total Sexo M 0.05 0.06 0.06 0.07 0.03 0.02 0.05 0.02 0.01 0.38 F 0.08 0.08 0.14 0.10 0.07 0.02 0.07 0.04 0.02 0.62 Pesos de pós-estratificação Idade e escolaridade FRHK peso _ pósestrati cação frhk 40a49 e 0a8 50a59 e 0a8 60+ e 0a8 40a49 e 9a11 50a59 e 9a11 H,60+ e 9a11 40a49 e 12+ 50a59 e 12+ 60+ e 12+ Sexo M 1.956 1.371 1.763 0.654 1.147 0.459 1.160 1.097 0.462 F 1.213 1.153 0.859 0.835 0.447 0.411 0.956 0.421 0.368 Total 0.13 0.14 0.20 0.17 0.10 0.04 0.12 0.07 0.03 1.00 Exemplo: Pirâmide etária e distribuição da variável escolaridade segundo inquérito. Município de Rio Branco-AC, 2007 [65;96] [65;96] [55;64] [55;64] [45;54] [45;54] [35;44] [35;44] [25;34] [25;34] [18;24] [18;24] -20 -15 v-10 -5 0 H 5 10 15 20 -20 -15 v-10 -5 M 0 H (a) População (PNAD) M (b) Amostra Vigitel 50 45 40 35 30 25 20 15 10 5 0 % [0;8] [9;11] [12; 20] 5 10 15 20 [65;96] [65;96] [55;64] [55;64] [45;54] [45;54] [35;44] [35;44] [25;34] [25;34] Exemplo: [18;24] -20 -15 [18;24] v-10 -5 0 5 10 15 20 -20 -15 v-10 -5 0 5 10 15 20 H M Pirâmide etária He Mdistribuição da variável escolaridade segundo inquérito. (a) População (PNAD) (b) Amostra Vigitel Município de Rio Branco-AC, 2007 50 45 40 35 30 25 20 15 10 5 0 % [0;8] [9;11] Anos de estudo (c) População - PNAD (d) Amostra Vigitel [12; 20] Medidas resumo do peso final em Rio Branco Categorias Homem, 18a24,0a8 Homem, 18a24, 9a11 Medidas resumo 4357.4 DP 1772.1 CV 0.4 Média 436.9 DP 174.7 CV 0.4 Média Homem, 18a24, 12ou+ DP CV Homem, 25a34, 0a8 1396.7 Homem, 35a44, 9a11 529.8 DP 253.6 CV 0.5 DP 547.5 CV 0.5 Média 365.1 DP 159.7 Homem, 35a44,12ou+ DP CV Homem, 45a54,9a11 Mulher, 25a34,9a11 850.4 435.4 CV 0.5 Média 294.6 DP 126.4 0.6 Média 543.2 DP 211.5 CV 0.4 Mulher, 35a44, 9a11 874.2 0.5 Média 427.4 DP 204.6 CV 0.5 190.9 89.3 0.5 Média 828.7 DP 417.5 CV 0.5 Média 311.5 DP 162.4 Média Mulher, 35a44,12ou+ DP CV 0.5 209.9 95.8 0.5 Média 560.3 DP 253.2 CV 0.5 Média Mulher, 45a54,9a11 0.4 DP CV Mulher,45a54,0a8 72.0 1819.6 CV Mulher,35a44,0a8 177.5 Média Média 0.4 DP CV Mulher, 25a34. 12ou+ DP 0.4 Média 1774.1 CV 294.2 129.1 DP CV Mulher, 25a34, 0a8 Peso final 3092.3 Mulher, 18a24, 12ou+ DP 0.5 1163.3 Média Homem,45a54,0a8 97.6 Medidas resumo Média Média 214.5 Média CV Mulher, 18a24, 9a11 0.5 Média CV Mulher, 18a24,0a8 0.4 DP Média Homem,35a44,0a8 63.0 2800.4 Homem, 25a34. 12ou+ DP Categorias 179.3 Média CV Homem, 25a34,9a11 Peso final Média DP 195.5 87.6 Avaliação dos pesos 2006 a 2011 Média do efeito de delineamento (deff) e do tamanho efetivo da amostra (ndeff) por indicador segundo região – peso da amostra Indicador Norte DEFF Nordeste ndeff DEFF Sudeste ndeff DEFF Sul ndeff DEFF Centro-Oeste ndeff DEFF ndeff FLV recomendado 1.18 1700 1.18 1702 1.18 1694 1.18 1695 1.18 1690 FLV regular 1.18 1690 1.20 1672 1.20 1661 1.21 1656 1.20 1667 Obesidade 1.19 1689 1.19 1683 1.19 1679 1.21 1655 1.18 1690 Hipertensão arterial 1.20 1672 1.18 1694 1.19 1674 1.19 1684 1.18 1696 Ex-fumante 1.20 1661 1.18 1696 1.20 1664 1.20 1666 1.19 1680 Diabetes 1.21 1654 1.17 1714 1.17 1712 1.17 1712 1.17 1719 Excesso de peso 1.21 1647 1.20 1662 1.22 1645 1.21 1647 1.21 1653 Fuma 20 ou mais 1.23 1641 1.19 1687 1.23 1628 1.27 1586 1.20 1674 Leite com gordura 1.22 1641 1.21 1652 1.22 1639 1.22 1639 1.22 1646 Gordura 1.25 1606 1.24 1619 1.25 1604 1.24 1612 1.22 1636 Fumante 1.26 1593 1.22 1644 1.23 1628 1.25 1600 1.21 1649 Refrigerante 5 ou mais 1.27 1582 1.27 1581 1.26 1587 1.26 1587 1.25 1602 Mamografia 1.26 217 1.23 297 1.23 319 1.27 330 1.25 280 Mamografia 2 anos 1.23 221 1.22 298 1.25 311 1.26 325 1.21 288 Papanicolau 1.31 645 1.29 630 1.31 595 1.28 613 1.30 639 Papanicolau 3 anos 1.29 655 1.26 643 1.28 609 1.25 626 1.26 657 Não há diferença entre regiões Efeito do sorteio de um adulto no domicílio produz deff entre 1.17 e 1.31 Métodos Pesos de pós-estratificação - Rake Tabela de contingência da população e da amostra 1 1 2 . . . H Marginal FR.1 População 2 ... FR.2 K FR.K Marginal FR1. FR2. . . . FRH. 1 1 2 . . . H Marginal 1 w11 w21 . . . wH1 fr.1 Amostra 2 ... w12 ... w22 ... . . . . . . wH2 ... fr.2 K w1K w2K . . . wHK fr.K Marginal fr1. fr2. . . . frH. 1 Saída da macro Raking Saída da macro Raking Saída da macro Raking