Prof. Adriano Mendonça Souza, Dr. Departamento de Estatística PPGEMQ / PPGEP - UFSM 1 Na prática da pesquisa em geral, o tamanho da amostra parece sintetizar todas as questões relacionadas ao processo de amostragem. E, às vezes, esse aspecto ainda é traduzido pela clássicas questões: Que percentagem da população deverá ser observada? 5 ou 10% será significante? 2 Determinação do Tamanho da Amostra Em pesquisas, uma etapa de grande importância é a determinação do tamanho da amostra que será utilizado para o levantamento dos dados. 3 Sabemos que conhecido o nível de confiança, o qual deve ser fixado em função do acerto que se deseja ter na estimação por intervalo, a medida que aumentamos neste nível, os intervalos passam a ter amplitudes maiores, o que implica em perda de precisão. 4 O ideal seria termos alto nível de confiança e pequena amplitude (logo teríamos grande precisão), mas necessitaríamos de uma amostra muito grande, pois, fixado n, confiança e precisão variam em sentidos opostos. 5 Depende de três fatores: 1º)Nível de confiança : determinado pelo pesquisador; 2º)Precisão (e0): o erro amostral corresponde à diferença entre as estimativas amostrais e os parâmetros populacionais, ocorrendo em qualquer tipo de pesquisa ou experimento; 3º)Tipo de Investigação: depende das características populacionais a serem investigadas. 6 Cálculo para mínimo da o tamanho amostra Um primeiro cálculo do tamanho da amostra pode ser feito, mesmo sem conhecer o tamanho da população, da seguinte forma: n0 Onde: n0 e0 1 2 e0 primeira aproximação para o tamanho da amostra. erro amostral tolerável 7 Quando se conhece o tamanho da população o cálculo anterior pode ser corrigido: N .n 0 n N n0 N tamanho da população n tamanho da amostra 8 Exemplo Planeja-se um levantamento por amostragem para avaliar diversas características da população das N=200 famílias moradoras de um certo bairro. Estas características (parâmetros) são especialmente do tipo percentagens, tais como, a percentagem de famílias que usam programas de alimentação popular, a de famílias que moram em casas próprias,... Qual deve ser o tamanho mínimo da amostra aleatória simples, tal que possamos admitir, com alta confiança, que os erros amostrais não ultrapassem 4% (e0= 0,04)? 9 Para estimar a média populacional e0 = Semi-amplitude do intervalo de confiança, neste caso da média. e0 Z . 2 n S ou e0 t . 2 n 10 Tamanho da amostra para estimar a média populacional com variância populacional conhecida: População Infinita z 2 n e0 População Finita 2 2 z 2 N 2 n 2 z 2 2 e0 N 1 2 11 Exemplo Suponha que a variável escolhida num estudo seja o peso de certa peça e que a população é composta de 600 elementos. Pelas especificações do produto, o desvio-padrão é de 10 kg. Admitindose um nível de confiança de 95,5% e um erro amostral de 1,5 kg, calcule o tamanho da amostra. 12 com variância populacional desconhecida: Substituí-se pela variância que é obtida através de uma amostra piloto, de tamanho n1. População Infinita t , n e Onde 2 0 S População Finita 2 t s 2 N , 2 n 2 e 0 ( N 1) ( t , ) 2 s 2 2 = n1 - 1 graus de liberdade 13 Considerações após o cálculo do tamanho da amostra: Se n < n1: a pré-amostra selecionada, de tamanho n1, foi suficiente para garantir a precisão desejada. Se n >n1: deve-se completar a pré-amostra, acrescentando elementos até atingir o valor “n” que garanta a precisão desejada. 14 Observações: Se for desconhecido, o valor de S deve ser calculado numa amostra piloto de n’ elementos e com (n’-1) gl. t 2 Se n < n’ estimação; a amostra piloto já é suficiente para Se n > n’ retira-se da população os elementos amostrais necessários para estimar . Como a variância aparece no numerador das expressões, concluímos que quanto mais heterogênea for a população em estudo, maior deverá ser “n”. 15 Exemplos 1) Qual o tamanho da amostra necessária para se estimar a média de uma população infinita cujo desvio padrão é 4mm, com 98% de confiança e precisão de 0,5mm? 16 2) Foram feitas 20 medidas do tempo gasto em minutos para se fabricar um componente industrial,obtendo-se: 13,15,12,14,17,15,16,15,14,16,17,14,16,15,15,13,14,15, 16,15. Esses dados são suficientes para estimar o tempo médio gasto nessa fabricação, com precisão de 30 segundos e 95% de certeza? Caso negativo, qual o tamanho da amostra adicional necessária? 17 Tamanho da amostra se a variável for nominal ou ordinal de população finita População Infinita 2 z p * p * 2 n 2 e0 População Finita 2 z p*q* N 2 n 2 2 e0 (N 1) (z ) p*q* 2 Onde: p* é a proporção amostral que pode ser obtida através de um pré-amostra de n1 elementos e q* =(1-p) 18 Exemplo Suponha que a variável escolhida num estudo seja a proporção de eleitores favoráveis ao candidato X e que o investigador tenha elementos para suspeitar que essa porcentagem seja de 30%. Admita a população infinita e que se deseja um nível de 99% e um erro amostral de 2%. Calcule o tamanho da amostra. 19 Observações: 1) Quando não se tem informação a respeito de p*, usa-se p* = q* = 50% o que levará a um tamanho de amostra superavaliado mas garantindo a precisão desejada, embora podendo ter como conseqüência, aumentos no custo e no tempo de amostragem e consequentemente na pesquisa. 2) Se p for próximo de 0 ou 1 corre-se o risco de se dimensionar uma amostra maior do que o necessário. 20 Observações: 3) Se soubermos com segurança que p p 0 0 ,5 ou 0 ,5 p0 p , pode-se usar p0 obtendo-se uma amostra suficiente, pois p( 1 p ) p0 ( 1 p0 ). 21 Exemplos 1) Qual o número de jogadas de uma moeda é suficiente para se estimar a proporção de “caras” obtidas, com precisão de 3% e confiança de 90%? 22 2) Em uma pesquisa de mercado bem conduzida, 57 das 150 pessoas entrevistadas afirmaram que seriam compradoras de certo produto a ser lançado. Essa amostra é suficiente para estimar a proporção real de futuros compradores, com uma precisão de 0,08 e confiança de 95%? 23 Cálculo do tamanho da amostra quando se deseja fazer um teste de diferença de médias para amostras dependentes 2 ( t ; n 1 t ; n 1 ) 2 n x1 x 2 2 S .D EPD n EPD - erro padrão da diferença - erro tipo II (sua probabilidade) 24 Quando o desvio padrão é desconhecido ( t ; n 1 t ; n 1 )2 n 2 ( x1 x 2 ) 2 S 21 S 2 2 EPD n1 n2 2 Onde: 2 S1 var iância da amostra piloto 1 2 S 2 var iância da amostra piloto 2 x1 média da amostra piloto 1 x2 média da amostra piloto 2 EPD erro padrão da diferença 25 Cálculo do tamanho da amostra quando se deseja fazer um teste de duas médias para amostras independentes com desvios-padrões desconhecidos mas iguais ( t ; n1 1 t 2 ; n2 1 ) .( EPD ) 2 n ( x1 x2 ) 2 ( n1 1 ).S 1 ( n2 1 ).S EPD n1 n2 2 2 2 2 2 1 1 . n1 n2 26 Cálculo do tamanho da amostra quando se deseja fazer um teste de duas médias para amostras independentes com desvios-padrões desconhecidos e desiguais ( t ; n1 1 t 2 ; n2 1 ) .( EPD ) 2 n ( x1 x2 ) EPD 2 2 2 2 S1 S2 n1 n2 27