Prof. Adriano Mendonça Souza, Dr.
Departamento de Estatística
PPGEMQ / PPGEP - UFSM
1
Na prática da pesquisa em geral, o tamanho da
amostra parece sintetizar todas as questões
relacionadas ao processo de amostragem. E, às
vezes, esse aspecto ainda é traduzido pela clássicas
questões:
Que percentagem da população deverá ser
observada?
5 ou 10% será significante?
2
Determinação do Tamanho da
Amostra
Em pesquisas, uma etapa de grande
importância é a determinação do tamanho da
amostra que será utilizado para o
levantamento dos dados.
3
Sabemos que conhecido o nível de confiança, o qual
deve ser fixado em função do acerto que se deseja
ter na estimação por intervalo, a medida que
aumentamos neste nível, os intervalos passam a ter
amplitudes maiores, o que implica em perda de
precisão.
4
O ideal seria termos alto nível de confiança e
pequena
amplitude
(logo
teríamos
grande
precisão), mas necessitaríamos de uma amostra
muito grande, pois, fixado n, confiança e precisão
variam em sentidos opostos.
5
Depende de três fatores:
1º)Nível de confiança
: determinado pelo
pesquisador;
2º)Precisão (e0): o erro amostral corresponde à diferença
entre
as
estimativas
amostrais
e
os
parâmetros
populacionais, ocorrendo em qualquer tipo de pesquisa ou
experimento;
3º)Tipo de Investigação: depende das características
populacionais a serem investigadas.
6
Cálculo para
mínimo da
o tamanho
amostra
Um primeiro cálculo do tamanho da amostra pode
ser feito, mesmo sem conhecer o tamanho da
população, da seguinte forma:
n0
Onde:
n0
e0
1

2
e0
primeira aproximação para o tamanho da amostra.
erro amostral tolerável
7
Quando se conhece o tamanho
da população
o cálculo anterior pode ser corrigido:
N .n 0
n 
N  n0
N
tamanho da população
n
tamanho da amostra
8
Exemplo
Planeja-se um levantamento por amostragem para avaliar
diversas características da população das N=200 famílias
moradoras de um certo bairro. Estas características
(parâmetros) são especialmente do tipo percentagens, tais
como, a percentagem de famílias que usam programas de
alimentação popular, a de famílias que moram em casas
próprias,... Qual deve ser o tamanho mínimo da amostra
aleatória simples, tal que possamos admitir, com alta
confiança, que os erros amostrais não ultrapassem 4%
(e0= 0,04)?
9
Para estimar a média populacional 
e0 = Semi-amplitude do intervalo de
confiança, neste caso da média.
 
e0  Z .
2 n
 S
ou e0  t .
2
n
10
Tamanho da amostra para
estimar a média
populacional
com variância populacional conhecida:
População Infinita
  z
 
 
2  
n  

e0




População Finita
2
2
 z   2 N
 2


n
2
z  2
2


e0  N 1  

 2
11
Exemplo
Suponha que a variável escolhida num estudo seja
o peso de certa peça e que a população é composta
de 600 elementos. Pelas especificações do
produto, o desvio-padrão é de 10 kg. Admitindose um nível de confiança de 95,5% e um erro
amostral de 1,5 kg, calcule o tamanho da amostra.
12
com variância populacional desconhecida:
Substituí-se pela variância que é obtida através de uma
amostra piloto, de tamanho n1.
População Infinita
 
  t  ,
n  
e


Onde

2
0
 S 






População Finita
2
 t
 s 2 N
 , 2 

n 2
e 0 ( N  1)  ( t  , ) 2 s 2
2
= n1 - 1 graus de liberdade
13
Considerações após o cálculo
do tamanho da amostra:
 Se n < n1: a pré-amostra selecionada, de tamanho n1,
foi suficiente para garantir a precisão desejada.
 Se
n
>n1:
deve-se
completar
a
pré-amostra,
acrescentando elementos até atingir o valor “n” que
garanta a precisão desejada.
14
Observações:
Se  for desconhecido, o valor de S deve ser
calculado numa amostra piloto de n’ elementos e

com (n’-1) gl.
t
2
Se
n < n’
estimação;
a amostra piloto já é suficiente para
Se
n > n’
retira-se da população os elementos
amostrais necessários para estimar  .
Como a variância aparece no numerador das
expressões, concluímos que quanto mais heterogênea
for a população em estudo, maior deverá ser “n”. 15
Exemplos
1) Qual o tamanho da amostra necessária para se estimar a
média de uma população infinita cujo desvio padrão é
4mm, com 98% de confiança e precisão de 0,5mm?
16
2) Foram feitas 20 medidas do tempo gasto em minutos
para se fabricar um componente industrial,obtendo-se:
13,15,12,14,17,15,16,15,14,16,17,14,16,15,15,13,14,15,
16,15.
Esses dados são suficientes para estimar o tempo médio
gasto nessa fabricação, com precisão de 30 segundos e
95% de certeza? Caso negativo, qual o tamanho da
amostra adicional necessária?
17
Tamanho da amostra se a
variável for nominal ou ordinal
de população finita
População Infinita
2
 z  p * p *

2 

n
2
e0
População Finita
2
 z  p*q* N

2

n 2
2
e0 (N 1)  (z ) p*q*
2
Onde: p* é a proporção amostral que pode ser
obtida através de um pré-amostra de n1 elementos
e q* =(1-p)
18
Exemplo
Suponha que a variável escolhida num estudo seja a
proporção de eleitores favoráveis ao candidato X e
que o investigador tenha elementos para suspeitar que
essa porcentagem seja de 30%. Admita a população
infinita e que se deseja um nível de 99% e um erro
amostral de 2%. Calcule o tamanho da amostra.
19
Observações:
1) Quando não se tem informação a respeito de p*, usa-se
p* = q* = 50% o que levará a um tamanho de amostra
superavaliado mas garantindo a precisão desejada, embora
podendo ter como conseqüência, aumentos no custo e no
tempo de amostragem e consequentemente na pesquisa.
2) Se p for próximo de 0 ou 1 corre-se o risco de se
dimensionar uma amostra maior do que o necessário.
20
Observações:
3) Se soubermos com segurança que p  p 0  0 ,5
ou 0 ,5  p0  p , pode-se usar p0 obtendo-se
uma amostra suficiente, pois
p( 1  p )  p0 ( 1  p0 ).
21
Exemplos
1) Qual o número de jogadas de uma moeda é
suficiente para se estimar a proporção de “caras”
obtidas, com precisão de 3% e confiança de 90%?
22
2) Em uma pesquisa de mercado bem conduzida, 57 das
150 pessoas entrevistadas afirmaram que seriam
compradoras de certo produto a ser lançado. Essa
amostra é suficiente para estimar a proporção real de
futuros compradores, com uma precisão de 0,08 e
confiança de 95%?
23
Cálculo do tamanho da amostra
quando se deseja fazer um teste
de diferença de médias para
amostras dependentes

2
( t  ; n  1  t ; n  1 )
2
n
x1  x 2
2
S .D
EPD 
n
EPD - erro padrão da diferença

- erro tipo II (sua probabilidade)
24
Quando o desvio padrão é
desconhecido
( t  ; n  1  t  ; n  1 )2
n
2
( x1  x 2 )
2
S 21  S 2 2
EPD 
n1  n2  2
Onde:
2
S1  var iância da amostra piloto 1
2
S 2  var iância da amostra piloto 2
x1  média da amostra piloto 1
x2  média da amostra piloto 2
EPD  erro padrão da diferença
25
Cálculo do tamanho da amostra
quando se deseja fazer um teste de
duas médias para amostras
independentes com desvios-padrões
desconhecidos mas iguais
( t  ; n1  1  t 2 ; n2  1 ) .( EPD )
2
n
( x1  x2 )
2
( n1  1 ).S 1  ( n2  1 ).S
EPD 
n1  n2  2
2
2
2
2
1
1

.
n1 n2
26
Cálculo do tamanho da amostra
quando se deseja fazer um teste de
duas médias para amostras
independentes com desvios-padrões
desconhecidos e desiguais
( t  ; n1  1  t 2 ; n2  1 ) .( EPD )
2
n
( x1  x2 )
EPD 
2
2
2
2
S1
S2

n1
n2
27
Download

2 - UFSM