Técnicas de Amostragem Thais Rotsen Correa Departamento de Estatística/UFOP Thais Rotsen Correa Departamento de Matemática/UFOP Amostragem Amostragem ou Censo? Por que fazer amostragem? população grande diminuir custo resultados mais rápidos minimizar perdas por medidas destrutivas Por que fazer censo? população pequena precisão completa (não se permite erros) a observação já é completa Thais Rotsen Correa Departamento de Matemática/UFOP Amostragem Quanto amostrar? depende: da variabilidade original dos dados (maior variância maior amostra) da precisão requerida no trabalho (maior precisão maior amostra) do tempo disponível (menor o tempo menor amostra) do custo da amostragem (maior o custo menor amostra) Como amostrar? amostragem probabilística X não probabilística Notação: N: tamanho da população n: tamanho da amostra X1,..., XN : elementos da população x1,..., xn: elementos da amostra Thais Rotsen Correa Departamento de Matemática/UFOP Amostragem Probabilística e Não Probabilística Amostragem probabilística: cada elemento da população tem uma probabilidade (não nula) de ser escolhido Amostragem não probabilística: amostragem restrita aos elementos que se tem acesso escolha a esmo amostragem intencional, sem sorteio voluntários Thais Rotsen Correa Departamento de Matemática/UFOP Definições População: conjunto formado por indivíduos ou objetos que tem pelo menos uma característica em comum. Amostra: qualquer subconjunto da população. Amostragem: processo de formação da amostra. Parâmetro: medida numérica populacional de interesse. Estimador: função da amostra. Estimativa: valor numérico do estimador. Erro amostral: erro que ocorre pelo uso da amostra, diferença entre o valor do parâmetro populacional e sua estimativa. Thais Rotsen Correa Departamento de Matemática/UFOP Amostragem Aleatória Simples Escolhe-se n elementos de uma população de tamanho N. Todos os elementos da população tem a mesma probabilidade de ser selecionado. Com reposição X Sem reposição Exemplo: escolher 10 pixels de uma imagem 13x17 etapas: rotular cada pixel com um código único sortear aleatoriamente 10 códigos identificar os pixels selecionados OBS: Thais Rotsen Correa Departamento de Matemática/UFOP método mais simples pressupõe população homogênea Amostragem Aleatória Estratificada Este tipo de amostragem deve ser utilizado quando a população for heterogênea com relação a variável de interesse. O objetivo da amostragem aleatória estratificada é formar estratos homogêneos e então realizar amostragem aleatória simples dentro de cada estrato. Entre os extratos deve haver heterogeneidade. Exemplo: Considere a população dos funcionários de uma industria (N=50.000). Desejamos estimar o salário médio de um funcionário desta industria usando uma amostra de tamanho n=2500 funcionários. Thais Rotsen Correa Departamento de Matemática/UFOP Amostragem Aleatória Estratificada A população é heterogênea com relação a variável de interesse, pois o salário varia muito dependendo do cargo. (n=2500) Cargo N Salário Chefe de seção 5000 Alto Operário especializado 15000 Médio Operário não especializado 30000 Baixo Total 50000 Thais Rotsen Correa Departamento de Matemática/UFOP Amostragem Aleatória Estratificada Primeiramente a população (N) é dividida em L sub-populações (estratos) com N1, N2, ..., NL elementos. Para cada estrato, escolhe-se ni elementos aleatoriamente, totalizando n elementos. Estratos de mesmo tamanho: ni n L Estratos de tamanhos proporcionais a Ni: ni n Ni N Exemplo: escolher 10 pixels de uma imagem 13x17 etapas: selecionar um estrato rotular cada pixel com um código único sortear aleatoriamente ni códigos identificar os pixels selecionados repetir o processo para todos os estratos OBS: Thais Rotsen Correa Departamento de Matemática/UFOP usado para população heterogênea (estratos homogêneos) Amostragem Aleatória Estratificada Podemos formar estratos de acordo com o cargo. Assim teremos estratos homogêneos com relação ao salário e teremos heterogeneidade entre os estratos. Estratos de tamanhos proporcionais: ni n Cargo Ni N N Salário n Chefe de seção 5000 Alto 250 Operário especializado 15000 Médio 750 Operário não especializado 30000 Baixo 1500 Total 50000 Thais Rotsen Correa Departamento de Matemática/UFOP 2500 Amostragem Aleatória Estratificada Etapas Dividir a população em x estratos homogêneos com relação a variável de interesse. No estrato 1 selecionar n1 elementos, usando amostragem aleatória simples No estrato 2 selecionar n2 elementos, usando amostragem aleatória simples. ... No estrato x selecionar nx elementos, usando amostragem aleatória simples. Observação: n1+n2+... + nx = n Thais Rotsen Correa Departamento de Matemática/UFOP Amostragem Sistemática Se os elementos da população já se encontram ordenados segundo algum critério pode-se selecionar um elemento qualquer e escolher um “fator” que definirá qual será o próximo elemento escolhido. Etapas Calcular o fator de sistematização s = N/n. Sortear um numero m entre 1 e s. O primeiro elemento da amostra será o de numero m. O segundo elemento da amostra será o de numero m+s. O terceiro elemento da amostra será o de numero m+2s. ............................................................. O n-ésimo elemento da amostra será o de numero m+s(n-1). Thais Rotsen Correa Departamento de Matemática/UFOP Amostragem Sistemática Exemplo: N = 20, n = 4, s = 20/4=5, m=3 1 10 Fator de sistematização = 5 Vantagem: amostra-se uniformemente todo o espaço Thais Rotsen Correa Departamento de Matemática/UFOP 20 Amostragem por Conglomerados Consideramos conglomerados os grupos de elementos com as seguintes características: - Dentro de cada conglomerado há uma grande heterogeneidade, ou grande variabilidade; - Entre os conglomerados há uma grande homogeneidade, ou pequena variabilidade. Exemplo: Se estamos interessados no salário médio dos operários da indústria automobilística, podemos selecionar uma montadora e, dentro dela, estudar os salários. Thais Rotsen Correa Departamento de Matemática/UFOP Amostragem por Conglomerados - A população é dividida em subpopulações (conglomerados) heterogêneos. - Alguns dos conglomerados são selecionados usando amostragem aleatória simples. - A amostra é composta por todos os elemntos dos conglomerados selecionados. Thais Rotsen Correa Departamento de Matemática/UFOP Amostragem por Conglomerados Exemplo: Estamos interessados no salário médio dos operários da indústria automobilística. Solução: - Amostragem aleatória simples é inviável, pois pressupõe uma listagem de todas os operários de todas as montadoras, o que é difícil de se obter. - Amostragem estratificada é também inviável, já que aqui também é necessária uma listagem dos elementos por estrato. - A melhor escolha é amostragem por conglomerado. Cada montadora é um conglomerado. Assim temos heterogeneidade dentro dos conglomerados com relação ao salário e entre os conglomerados existe homogeneidade. Extrai-se uma amostra aleatória simples de montadoras e nelas pesquisa-se o salário de todos os funcionários. Thais Rotsen Correa Departamento de Matemática/UFOP Conglomerados X Estratos - Tanto no caso da amostragem estratificada como no da amostragem por conglomerado, a população deve estar dividida em grupos. - Na amostragem estratificada seleciona-se uma amostra aleatória simples dentro de cada grupo (estrato). - Na amostragem por conglomerado selecionam-se amostras aleatórias simples de grupos, e todos os itens dentro dos grupos (conglomerados) selecionados farão parte da amostra. Thais Rotsen Correa Departamento de Matemática/UFOP