Sistema Integrado de Pesquisas Domiciliares Amostra Mestra Marcos Paulo Soares de Freitas Gerência de Desenvolvimento e Pesquisa Coordenação de Métodos e Qualidade 25/08/06 Roteiro - Introdução - Amostra Mestra em pesquisas domiciliares - Amostra Mestra no SIPD - Desenho amostral - Tamanho da amostra - Utilização - Últimas definições - Comparação dos tamanhos de amostra - Considerações Introdução - Novo sistema de pesquisas domiciliares por amostragem Integração - Integração: • conceitos e definições de variáveis comuns • procedimentos e equipe de coleta • procedimentos de apuração, crítica e imputação dos dados • uso de um mesmo cadastro de seleção • uso de uma amostra comum: Amostra Mestra Amostra Mestra em pesquisas domiciliares Uma amostra mestra corresponde a um conjunto de unidades de área selecionadas de um cadastro, segundo um método probabilístico de seleção, de forma que seja possível selecionar subamostras para as diversas pesquisas. Amostra Mestra em pesquisas domiciliares Seleção das subamostras - Subamostras de unidades de área - Subamostra de domicílios em todas as unidades de área selecionadas para a Amostra Mestra. Em ambas as situações a seleção pode ser feita: de forma independente • com um certo controle para obter ou não sobreposição • Amostra Mestra no SIPD Abrangência Geográfica - Considerar a cobertura de todas as pesquisas - Não deixar de fora qualquer parte do território coberto pelas pesquisas - Verificar a necessidade de exclusão por questões operacionais Definida para a Amostra Mestra: todo território nacional Amostra Mestra no SIPD Cadastro de seleção: Cadastro Mestre O cadastro mestre para seleção da Amostra Mestra corresponde ao conjunto de unidades de área (setores censitários) que têm seus limites bem definidos e que cobrem todo o país. Para cada um dessas áreas são associadas informações sobre divisões administrativas, contagens populacionais e outras características sociodemográficas. Amostra Mestra no SIPD Desenho amostral - As unidades amostrais selecionadas para a Amostra Mestra serão as unidades primárias de amostragem (UPAs) no planejamento das diversas pesquisas - Desenho amostral: estratificado com seleção das unidades com probabilidade proporcional a uma medida de tamanho aspecto comum dos desenhos amostrais das diversas pesquisas Amostra Mestra no SIPD Desenho amostral Definição das unidades amostrais - As unidades amostrais são definidas em geral como uma área com um determinado tamanho mínimo populacional em termos de domicílios ou pessoas. Podem ser: • unidades básicas do cadastro de seleção setores censitários • unidades mais agregadas áreas de ponderação divisões administrativas Definidas para a Amostra Mestra: setores censitários Amostra Mestra no SIPD Desenho amostral Estratificação • Divisão Administrativa: estratos de municípios formados por divisão administrativa em cada Unidade da Federação: capital, pertencente à Região Metropolitana e demais municípios • Espacial: estratos de municípios ou de áreas de ponderação do Censo 2000 formados considerando: posição geográfica, densidade demográfica; proporção de ocupados em atividades agrícolas; renda média dos responsáveis pelos domicílios e taxa de desocupação Amostra Mestra no SIPD Desenho amostral Estratificação •Estatística: estratos de setores censitários formados com objetivo de minimizar a variância do estimador do total da renda dos responsáveis pelos domicílios • Situação do setor: setores separados em estratos por sua situação: urbano e rural Estratificação espacial - Rio de Janeiro Amostra Mestra no SIPD Desenho amostral Estratificação • Tamanho mínimo dos estratos - evitar formação de estratos pequenos - evitar frações de amostragem muito grandes (>10%) - definido em número de setores Amostra Mestra no SIPD Desenho amostral Estratificação • Tamanho mínimo dos estratos definido considerando características da pesquisa básica - Pesquisa integrada PNAD/PME: - ciclo de acumulação da amostra: trimestre - painel rotativo esquemas de rotação 1-2(4) 1-2(5) Definido para a Amostra Mestra: 150 setores Tabela 1 - Número de estratos espaciais e de renda segundo a UF UF Brasil RO(11) AC(12) AM (13) RR(14) PA(15) AP(16) TO(17) M A(21) PI(22) CE(23) RN(24) PB(25) PE(26) Número de estratos espaciais 196 3 2 5 2 4 2 4 10 5 11 6 4 10 Número de estratos de renda 719 10 3 18 2 17 2 7 35 20 40 14 12 36 UF AL(27) SE(28) BA(29) M G(31) ES(32) RJ(33) SP(35) PR(41) SC(42) RS(43) M S(50) M T(51) GO(52) DF(53) Número de estratos espaciais 5 4 11 19 5 13 25 9 6 9 5 6 6 5 Número de estratos de renda 14 14 47 81 15 58 108 35 22 39 15 19 23 13 Amostra Mestra no SIPD Tamanho da amostra - Para o cálculo do tamanho da amostra foi preciso considerar os estágios de seleção, as unidades de amostragem e os esquemas de seleção da pesquisa básica, que necessita de um tamanho de amostra maior • Amostragem conglomerada em 2 estágios de seleção, com estratificação das unidades primárias de amostragem (UPAs) 1º estágio: seleção de setores censitários com probabilidade proporcional ao número de domicílios 2º estágio: seleção de um número fixo de domicílios com probabilidade igual Amostra Mestra no SIPD Tamanho da amostra - Para o cálculo do tamanho da amostra foi preciso considerar também: • Parâmetro de interesse: total de pessoas desocupadas no trimestre em cada Unidade da Federação • Precisão desejada: coeficiente de variação entre 3,5% e 10% • Número de domicílios selecionados por setor: 14 domicílios • Número de grupos de setores: 12 ou 15 grupos • Período para distribuição igualitária da coleta: 3 meses, 12 semanas ou 13 semanas Tabela 2 – Tamanho da amostra de setores por proposta de grupamento e o nível de precisão desejado, segundo a UF (continua) Total UF BRASIL RO(11) AC(12) AM(13) RR(14) PA(15) AP(16) TO(17) MA(21) PI(22) CE(23) RN(24) PB(25) PE(26) CV 12_3 12_12 12_13 15_3 15_12 15_13 0,9 10 770 11 400 11 713 12 294 13 008 13 221 8 10 6 10 6 10 8 4 8 4 6 6 4 165 90 234 63 282 48 144 711 249 594 219 246 510 180 96 252 72 300 60 156 756 264 672 252 264 540 182 104 247 78 299 65 169 754 260 650 260 260 546 177 90 279 63 309 48 150 735 300 660 240 264 594 192 96 300 72 324 60 168 792 300 684 252 276 624 195 104 299 78 338 65 169 767 325 715 273 273 650 Tabela 2 – Tamanho da amostra de setores por proposta de grupamento e o nível de precisão desejado, segundo a UF (conclusão) Total UF AL(27) SE(28) BA(29) MG(31) ES(32) RJ(33) SP(35) PR(41) SC(42) RS(43) MS(50) MT(51) GO(52) DF(53) CV 4 6 4 3,5 4 3,5 3,5 4 4 4 6 6 6 6 12_3 483 210 639 993 375 717 1 296 516 501 570 204 267 288 156 12_12 12_13 516 240 696 1 020 408 744 1 296 528 528 588 228 288 300 156 507 234 676 1 066 403 767 1 404 572 546 637 221 312 325 169 15_3 483 225 741 1 224 381 876 1 620 588 522 648 234 297 351 195 15_12 15_13 516 240 780 1 272 408 936 1 692 636 540 696 252 312 372 216 507 247 793 1 300 403 923 1 729 624 559 689 260 325 377 234 Amostra Mestra no SIPD Avaliações do tamanho da amostra - Avaliação da precisão da estimativa de outros parâmetros de interesse (total do rendimento dos responsáveis, total de pessoas freqüentando escola por 2 faixas etárias,…) - Avaliação da precisão da estimativa do total de desocupados em outros níveis geográficos Proposta de utilização da Amostra Mestra no SIPD • Pesquisa integrada PNAD/PME: amostra de domicílios em todos os setores • Pesquisa de Orçamentos Familiares (POF): subamostra de setores amostra de domicílios não coincidente com PNAD/PME • Pesquisa de Orçamentos Familiares Simplificada (POFs) subamostra de setores amostra de domicílios coincidente com PNAD/PME (após última visita) • Economia Informal Urbana (ECINF) subamostra de setores amostra de domicílios pode ser coincidente ou não com PNAD/PME • Pesquisas suplementares e especiais Amostra Mestra no SIPD Amostra de setores sem sobreposição (hoje) Amostra de setores coincidente - Possível usar a mesma amostra? - Não há esgotamento de setores? Amostra Mestra no SIPD Considerando: • Tamanho dos setores censitários - 250 domicílios • Número de domicílios selecionados por setor - 14 domicílios Tabela 3 – Número de amostras não sobrepostas de domicílios por esquema de rotação Esquema de Rotação Amostras não sobrepostas de domicílios por setor Tot al Necessárias em 10 anos "Sobra" 1-2(5) 1-2-1-8-1-2-1 (ou 2-2-2) 1-2(4) 18 8 ou 9 10 ou 9 18 11 7 18 11 7 Respondendo as perguntas • É possível utilizar a mesma amostra de setores • Não haverá esgotamento de setores, apenas em algumas situações isoladas 4-8-4 18 17 ou 18 1 ou 0 Amostra Mestra no SIPD Escolha do esquema de rotação Tabela 4 – Tamanho da amostra de domicílios e sobreposição da amostra por esquema de rotação Tamanho da amostra de domicílios e sobreposição da amostra Esquema de Rotação 1-2(5) 1-2(4) 1-2-1-8-1-2-1 (ou 2-2-2) 53 159 638 255 127 53 159 638 279 159 53 159 638 359 159 Tamanho da amostra de domicílios Mês Trimest re A no - t ot al A no - dif erent es Ano - por visita Sobreposição da amostra Trimest re t / Trimest re (t -1) Trimest re t / Trimest re (t -4) 200 600 400 360 680 80 20 200 600 400 300 600 75 0 200 600 400 100 600 50 50 Amostra Mestra no SIPD - Rotação da amostra de setores da pesquisa integrada PNAD/PME minimizar o esgotamento de setores - redução do tempo de participação do setor na amostra de 10 anos para 5 anos em média permitir acumulação de amostras em períodos maiores que um ano para estimação em áreas geográficas menores - Método de seleção seqüencial dos setores coordenar a rotação dos setores incorporar mudanças no cadastro - atualização contínua e consolidação para seleção uma vez por ano - “novas construções” tratadas como um novo setor Comparação dos tamanhos de amostra Tabela 5 – Cobertura geográfica e tamanho da amostra de setores e de domicílios segundo a pesquisa Pesquisa PNAD PM E Cobertura Brasil 6 RM s PNAD + PM E Integrada Brasil (urbana) Setores Tamanho da amostra Domicílios M ês Trimestre Ano 7 400 2 020 11 667 40 000 35 000 120 000 140 000 480 000 9 420 51 667 155 000 620 000 11 400 53 200 159 600 638 400 Obs.: O tamanho da amostra de domicílios por mês e por trimestre na PNAD foi obtido dividindo-se o tamanho da amostra anual por 12 e por 4, respectivamente Considerações - Número de domicílios visitados em um ano na pesquisa integrada muito próximo ao número total visitado atualmente na PNAD e PME - Pesquisa integrada: aproximadamente o mesmo número de visitas em todos os meses - Atualmente: último trimestre do ano com maior número de visitas Considerações - Número de setores na amostra aproximadamente 20% maior que o atual nas duas pesquisas maior espalhamento da amostra maior custo - Compartilhamento dos setores em todas as pesquisas menor custo Equipe Coordenação de Métodos e Qualidade Marcos Paulo Soares de Freitas Mauricio Franca Lila Rosemary Vallejo de Azevedo Giuseppe Antonaci Flávio Montenegro José André de Moura Brito [email protected] [email protected] [email protected] [email protected] [email protected] [email protected] Coordenação de Trabalho e Rendimento Elizabeth Belo Hypolito Eloane Goncalves Ramos [email protected] [email protected]