Amostragem de Conglomerados em Um Único Estágio – Conglomerados de Tamanhos Diferentes • Notação: – População: 1 2 ... i ... M XiT é o total do cluster i; Ni é o tamanho do cluster i; Ni X iT X ij j 1 Xi é a média do cluster i. Xij valor da variável de interesse do elemento j e cluster i. 1 Amostra: a amostra de cluster consiste de todos os elementos de cada um dos m cluster selecionados aleatoriamente a partir dos M cluster da população. 1 2 ... i ... m xiT é o total do cluster i; ni é o tamanho do cluster i; xi é a média do cluster i. Unidade primárias: são os clusters; Unidades secundárias: são os elementos da população dentro dos clusters; A amostra de cluster é uma amostra aleatória simples de clusters. 2 A média populacional geral () (isto é, o valor médio de X das unidades secundárias) é: M Ni X ij i 1 j 1 M M N X i i 1 i 1 M iT N i 1 i Interpretação: razão do total dos valores XiT para o total dos valores Ni. Estimação: desejamos estimar a partir de uma amostra de conglomerados. m xc xiT i 1 m n i 1 i A qual é a razão da soma dos totais de clusters para a soma dos tamanhos de clusters, na amostra de clusters selecionada. 3 Variância de x pode ser estimada a partir da c amostra por: M mM ni 2 Varxc xi xc mm 1 i 1 N m 2 E se N for desconhecido, ele pode ser substituído pelo estimador Mn/m, onde n é o tamanho efetivo da amostra, obtendo-se: M mm ni 2 Varxc xi xc M m 1 i 1 n m 2 (amostragem sem reposição) I .C.;95% : xc t. Varxc 4 Estimação do total geral XT xT Nxc Var xT N Var xc 2 5 Exemplo: Trata-se de avaliar o rendimento dos alunos da primeira série do primeiro grau, na rede de ensino público de certa localidade. A partir da relação das 3500 turmas existentes, foram preparados conglomerados (clusters), juntando turmas de diferentes escolas, com o objetivo de agrupar alunos o mais possível diferentes no que se refere ao rendimento (necessidade dos conglomerados serem heterogêneos). Os conglomerados foram formados com 5 turmas de, aproximadamente, 150 alunos, supondo uma base de 30 alunos por turma. Na população temos 700 clusters. Deseja-se observar uma amostra de 1500 alunos. Considerando: n mN 1500/ 150 10 conglomerados Prob(cluster) = 10/700 = 0,014286 6 Conglomerados da amostra Número de alunos ni Soma dos escores XiT 1 162 1004,4 2 170 952,0 3 145 1015,0 4 151 830,5 5 160 960,0 6 162 793,8 7 145 855,5 8 148 947,2 9 171 1214,1 10 178 1032,4 Total 1592 9604,9 7 Estimativa do rendimento médio por aluno m xc xiT i 1 m n i 1 i xc 9604,9 / 1592 6,033 8 Estimativa da variância da média de conglomerado M mm ni 2 Varxc xi xc M m 1 i 1 n 2 m Conglomerados 1 2 3 4 5 6 7 8 9 10 TOTAL 0,1018 0,1068 0,0911 0,0948 0,1005 0,1018 0,0911 0,0930 0,1074 0,1118 0,0104 0,0114 0,0083 0,0090 0,0101 0,0104 0,0083 0,0086 0,0115 0,0125 0,1670 -0,4330 0,9670 -0,5330 -0,0330 -1,1330 -0,1330 0,3670 1,0670 -0,2330 0,0279 0,1875 0,9351 0,2841 0,0011 1,2837 0,0177 0,1347 1,1385 0,0543 0,00029 0,002138 0,007761 0,002557 1,11E-05 0,01335 0,000147 0,001158 0,013093 0,000679 0,041184 9 700 1010 Var xc 0,041184 0,0451 70010 1 DP xc 0,0451 0,212368 IC : 6,033 2,262.0,212368 5,5526; 6,5133 Distribuição t de Student com 10-1 = 9 graus de liberdade 10 Estimativa do coeficiente de variação da média de conglomerado Indica a precisão da média e o padrão é que ele seja inferior a 10%. DPxc 0,212368 CV xc 0,0352 xc 6,033 Exercício: Estimar o total geral XT. 11 Estimação de uma proporção • Notação – X é uma variável de interesse de estudo. Por exemplo: 1) proporção de famílias com casa própria e 2) proporção de domicílios com pelo menos um automóvel. – Xij = 1 se o elemento j do conglomerado i tem o atributo em estudo; – Xij = 0 se o elemento j do conglomerado i não tem o atributo em estudo; 12 População: XiT é a quantidade de elementos que possui o atributo ou a característica em estudo no conglomerado i. Ni X iT X ij O total de elementos que possuem o atributo ou a característica no conglomerado i. X iT Xi Pi Ni A proporção de elementos que possuem o atributo ou a característica no conglomerado i. j 1 M X X i 1 M iT N i 1 P A proporção de elementos que possuem o atributo ou a característica na população. i 13 Estimador: Proporção na amostra m pc x i 1 m iT n i 1 i xiT é a quantidade de elementos que possuem o atributo no conglomerado i. Ni é o tamanho (a quantidade de registros, casos) no conglomerado i selecionado. 14 Variância da proporção da amostra M mm ni 2 Var pc pi pc M m 1 i 1 n m 2 DP pc Var pc n é a quantidade total de registros, casos ou observações na amostra selecionada. pi é a proporção amostral de elementos com o atributo no conglomerado i selecionado. I .C. ;95% : pc 1,96.DP pc 15 Exemplo: No exemplo anterior observou-se, também, o número de alunos que compram lanche, cujos resultados foram: Conglomerados da amostra Número de alunos ni Número de alunos que compram lanche xiT 1 162 50 2 170 63 3 145 47 4 151 48 5 160 68 6 162 59 7 145 36 8 148 45 9 171 71 10 178 75 Total 1592 562 16 Estimativa da proporção dos alunos que compram lanche m pc x i 1 m iT n i 1 562 0,3530 1592 i Estimativa da variância da proporção dos alunos que compram lanche M mm ni 2 Var pc p p i c M m 1 i 1 n m 2 17 Conglomerados da amostra 1 2 3 4 5 6 7 8 9 10 Total 162 170 145 151 160 162 145 148 171 178 50 63 47 48 68 59 36 45 71 75 0,101759 0,106784 0,09108 0,094849 0,100503 0,101759 0,09108 0,092965 0,107412 0,111809 0,010355 0,011403 0,008296 0,008996 0,010101 0,010355 0,008296 0,008642 0,011537 0,012501 0,308642 0,370588 0,324138 0,317881 0,425000 0,364198 0,248276 0,304054 0,415205 0,421348 0,001969 0,000309 0,000834 0,001234 0,005182 0,000125 0,010970 0,002397 0,003868 0,004669 0,0000203884 0,0000035214 0,0000069177 0,0000111053 0,0000523404 0,0000012949 0,0000910057 0,0000207175 0,0000446212 0,0000583738 0,0003102866 700 1010 Var pc 0,000310286 0,0003398 70010 1 DP pc 0,0003398 0,018433 18 I .C. ;95% : pc 1,96.DP pc I .C. ;95% : 0,3530 1,96.0,018433 0,3169;0,3891 19