Técnicas de Amostragem
Thais Rotsen Correa
Departamento de Estatística/UFOP
Thais Rotsen Correa
Departamento de Matemática/UFOP
Amostragem
Amostragem ou Censo?
Por que fazer amostragem?
população grande
diminuir custo
resultados mais rápidos
minimizar perdas por medidas destrutivas
Por que fazer censo?
população pequena
precisão completa (não se permite erros)
a observação já é completa
Thais Rotsen Correa
Departamento de Matemática/UFOP
Amostragem
Quanto amostrar?
depende:
da variabilidade original dos dados (maior variância  maior amostra)
da precisão requerida no trabalho (maior precisão  maior amostra)
do tempo disponível (menor o tempo  menor amostra)
do custo da amostragem (maior o custo  menor amostra)
Como amostrar?
amostragem probabilística X não probabilística
Notação:
N: tamanho da população
n: tamanho da amostra
X1,..., XN : elementos da população
x1,..., xn: elementos da amostra
Thais Rotsen Correa
Departamento de Matemática/UFOP
Amostragem Probabilística e Não Probabilística
Amostragem probabilística:
cada elemento da população tem uma probabilidade (não nula) de ser
escolhido
Amostragem não probabilística:
amostragem restrita aos elementos que se tem acesso
escolha a esmo
amostragem intencional, sem sorteio
voluntários
Thais Rotsen Correa
Departamento de Matemática/UFOP
Definições
População: conjunto formado por indivíduos ou objetos que tem pelo
menos uma característica em comum.
Amostra: qualquer subconjunto da população.
Amostragem: processo de formação da amostra.
Parâmetro: medida numérica populacional de interesse.
Estimador: função da amostra.
Estimativa: valor numérico do estimador.
Erro amostral: erro que ocorre pelo uso da amostra, diferença entre o
valor do parâmetro populacional e sua estimativa.
Thais Rotsen Correa
Departamento de Matemática/UFOP
Amostragem Aleatória Simples
Escolhe-se n elementos de uma população de tamanho N. Todos os
elementos da população tem a mesma probabilidade de ser selecionado.
Com reposição X Sem reposição
Exemplo: escolher 10 pixels de uma imagem 13x17
etapas: rotular cada pixel com um código único
sortear aleatoriamente 10 códigos
identificar os pixels selecionados
OBS:
Thais Rotsen Correa
Departamento de Matemática/UFOP
método mais simples
pressupõe população homogênea
Amostragem Aleatória Estratificada
Este tipo de amostragem deve ser utilizado quando a população for
heterogênea com relação a variável de interesse.
O objetivo da amostragem aleatória estratificada é formar estratos
homogêneos e então realizar amostragem aleatória simples dentro de
cada estrato. Entre os extratos deve haver heterogeneidade.
Exemplo:
Considere a população dos funcionários de uma industria (N=50.000).
Desejamos estimar o salário médio de um funcionário desta industria
usando uma amostra de tamanho n=2500 funcionários.
Thais Rotsen Correa
Departamento de Matemática/UFOP
Amostragem Aleatória Estratificada
A população é heterogênea com relação a variável de interesse, pois
o salário varia muito dependendo do cargo. (n=2500)
Cargo
N
Salário
Chefe de seção
5000
Alto
Operário especializado
15000
Médio
Operário não especializado
30000
Baixo
Total
50000
Thais Rotsen Correa
Departamento de Matemática/UFOP
Amostragem Aleatória Estratificada
Primeiramente a população (N) é dividida em L sub-populações
(estratos) com N1, N2, ..., NL elementos. Para cada estrato, escolhe-se
ni elementos aleatoriamente, totalizando n elementos.
Estratos de mesmo tamanho:
ni 
n
L
Estratos de tamanhos proporcionais a Ni:
ni  n
Ni
N
Exemplo: escolher 10 pixels de uma imagem 13x17
etapas: selecionar um estrato
rotular cada pixel com um código único
sortear aleatoriamente ni códigos
identificar os pixels selecionados
repetir o processo para todos os estratos
OBS:
Thais Rotsen Correa
Departamento de Matemática/UFOP
usado para população heterogênea
(estratos homogêneos)
Amostragem Aleatória Estratificada
Podemos formar estratos de acordo com o cargo. Assim teremos
estratos homogêneos com relação ao salário e teremos
heterogeneidade entre os estratos.
Estratos de tamanhos proporcionais: ni  n
Cargo
Ni
N
N
Salário
n
Chefe de seção
5000
Alto
250
Operário especializado
15000
Médio
750
Operário não especializado
30000
Baixo
1500
Total
50000
Thais Rotsen Correa
Departamento de Matemática/UFOP
2500
Amostragem Aleatória Estratificada
Etapas
 Dividir a população em x estratos homogêneos com relação a
variável de interesse.
 No estrato 1 selecionar n1 elementos, usando amostragem
aleatória simples
 No estrato 2 selecionar n2 elementos, usando amostragem
aleatória simples.
...
 No estrato x selecionar nx elementos, usando amostragem
aleatória simples.
Observação: n1+n2+... + nx = n
Thais Rotsen Correa
Departamento de Matemática/UFOP
Amostragem Sistemática
Se os elementos da população já se encontram ordenados segundo algum
critério pode-se selecionar um elemento qualquer e escolher um “fator” que
definirá qual será o próximo elemento escolhido.
Etapas
Calcular o fator de sistematização s = N/n.
Sortear um numero m entre 1 e s.
O primeiro elemento da amostra será o de numero m.
O segundo elemento da amostra será o de numero m+s.
O terceiro elemento da amostra será o de numero m+2s.
.............................................................
O n-ésimo elemento da amostra será o de numero m+s(n-1).
Thais Rotsen Correa
Departamento de Matemática/UFOP
Amostragem Sistemática
Exemplo: N = 20, n = 4, s = 20/4=5, m=3
1
10
Fator de sistematização = 5
Vantagem:
amostra-se uniformemente todo o espaço
Thais Rotsen Correa
Departamento de Matemática/UFOP
20
Amostragem por Conglomerados
Consideramos conglomerados os grupos de elementos com as seguintes
características:
- Dentro de cada conglomerado há uma grande heterogeneidade, ou
grande variabilidade;
- Entre os conglomerados há uma grande homogeneidade, ou pequena
variabilidade.
Exemplo: Se estamos interessados no salário médio dos operários da
indústria automobilística, podemos selecionar uma montadora e, dentro
dela, estudar os salários.
Thais Rotsen Correa
Departamento de Matemática/UFOP
Amostragem por Conglomerados
- A população é dividida em subpopulações (conglomerados)
heterogêneos.
- Alguns dos conglomerados são selecionados usando amostragem
aleatória simples.
- A amostra é composta por todos os elemntos dos conglomerados
selecionados.
Thais Rotsen Correa
Departamento de Matemática/UFOP
Amostragem por Conglomerados
Exemplo: Estamos interessados no salário médio dos operários da
indústria automobilística.
Solução:
- Amostragem aleatória simples é inviável, pois pressupõe uma
listagem de todas os operários de todas as montadoras, o que é
difícil de se obter.
- Amostragem estratificada é também inviável, já que aqui também é
necessária uma listagem dos elementos por estrato.
- A melhor escolha é amostragem por conglomerado. Cada montadora
é um conglomerado. Assim temos heterogeneidade dentro dos
conglomerados com relação ao salário e entre os conglomerados
existe homogeneidade. Extrai-se uma amostra aleatória simples de
montadoras e nelas pesquisa-se o salário de todos os funcionários.
Thais Rotsen Correa
Departamento de Matemática/UFOP
Conglomerados X Estratos
- Tanto no caso da amostragem estratificada como no da
amostragem por conglomerado, a população deve estar
dividida em grupos.
- Na amostragem estratificada seleciona-se uma amostra
aleatória simples dentro de cada grupo (estrato).
- Na amostragem por conglomerado selecionam-se amostras
aleatórias simples de grupos, e todos os itens dentro dos
grupos (conglomerados) selecionados farão parte da amostra.
Thais Rotsen Correa
Departamento de Matemática/UFOP
Download

Tecnicas de Amostragem - ICEB-UFOP