Amostragem Amostragem: o procedimento pelo qual um grupo de indivíduos ou um subconjunto de uma população é escolhido com a intenção de se obter informação em relação a um fenómeno e de tal modo que a população inteira que nos interessa esteja representada. Base de amostragem: lista dos membros da população em estudo e que é utilizada para extrair a amostra Plano de amostragem: descrição da estratégia a utilizar para selecionar a amostra. Fornece detalhes sobre a forma de proceder quanto à utilização de um método de amostragem para certo estudo. Métodos Formais de Amostragem Servem para assegurar uma certa precisão na estimação dos parâmetros da população, reduzindo o erro amostral. 1. Métodos de Probabilísticos 2. Métodos de Amostragem Não Casual ou Métodos Não Probabilísticos ou Intencionais Amostragem Casual ou Métodos Métodos Formais de Amostragem Amostras probabilísticas são preferíveis se o objetivo for: (a) descrição: estimativa das caraterísticas da população; (b) explicação: comprovação de hipóteses empíricas. Amostras não-probabilísticas ou intencionais são preferíveis se o objetivo for: (a) exploração e desenvolvimento de teoria; (b) desenvolvimento e comprovação de instrumentos de pesquisa; (c) seleção de um pequeno número de unidades de primeira fase. Ex.º: seleção de quatro escolas para realizar um inquérito sobre as aspirações dos alunos; (d) compreensão de processos e ações sociais. Métodos de Amostragem Casual Cada elemento da população tem uma probabilidade conhecida e diferente de zero de ser escolhido, aquando da tiragem ao acaso para compor a amostra; É possível estimar estatisticamente o grau de confiança com o qual as conclusões extraídas da amostra se aplicam ao universo. Objetivo: obter a melhor representatividade possível. TIPOS Amostragem aleatória simples; Amostragem sistemática; Amostragem estratificada; Amostragem por clusters; Amostragem multi-etápica ou por etapas. Amostragem Aleatória Simples Apresenta 2 caraterísticas principais: 1. Quando se retira uma amostra de n casos diferentes a partir de um universo com N casos, todas as amostras possíveis de tamanho n devem ter a mesma probabilidade de serem retiradas do universo; 2. Cada um dos N casos do universo tem a mesma probabilidade de ser incluído na amostra retirada. Ou seja: Dá a cada elemento da população uma oportunidade igual de ser incluído na amostra. Toma igualmente provável a escolha de todas as combinações possíveis do número desejado de casos. Amostragem Aleatória Simples Ponto de partida: possuir uma base de amostragem. Exigência: identificar cada membro da população Fração de amostragem (FA): Representa a oportunidade de seleção de cada elemento da população. Calculada a partir da dimensão da amostra (n) dividida pela dimensão da população/universo (N). O.s.: FA= n/N. Amostragem Aleatória Simples Método de lotaria Exemplo: Inquérito a pequenas empresas cujo universo é 400: Os nomes de 400 empresas são colocados num recipiente qualquer, misturados, extraindo-se uma amostra de 50, ou seja: 1/8. É exequível perante uma pequena população. Amostragem Aleatória Simples Método dos números aleatórios Mais utilizado que o método de lotaria. É atribuído um número de identificação exclusivo a cada membro da população. No caso das pequenas empresas, de 001 a 400. Podem-se também usar tabelas de números aleatórios. Procedimentos do investigador: começar por uma coluna escolhida aleatoriamente e verificar os números de 3 dígitos nessa coluna. Quando esse número de 3 dígitos recai entre 001 e 400, essa pequena empresa passa a figurar na amostra. O processo continua até obtenção de uma amostra de 50 unidades. Usual a amostragem sem substituição. Amostragem Sistemática Método da seleção sistemática Exige menor tempo; Em que consiste? Todos os elementos da população são enumerados e é utilizado um intervalo de amostragem fixo para extrair os membros da amostra. Este intervalo de amostragem é o recíproco da fração de amostragem. Caso da amostra de 50 pequenas empresas, num universo de 400, a FA é de 1/8 e o intervalo de amostragem seria 8. Portanto: seria selecionada cada oitava pequena empresa da lista após um começo aleatório entre 1 e 8 (o intervalo de amostragem). Ex.º: em caso de a primeira empresa selecionada for a 5, seguidamente é a número 13 a escolhida e depois a 21 e assim por diante. Feita sem substituição. A seleção de um elemento condiciona todos os seguintes, que são selecionados pela ordem da lista. Assim: é impossível que números vizinhos na lista entrem na amostra, assegurando-se uma vantagem: a distribuição mais regular na população do que na amostra casual simples. Amostragem Estratificada A estratificação implica dividir uma população em vários segmentos ou estratos, com base numa ou mais caraterísticas que se presume estarem estritamente associadas com as variáveis de estudo, selecionando-se em cada estrato uma amostra probabilística. VANTAGEM: aumenta a precisão com custos adicionais mínimos, assegurando que a amostra é representativa da(s) caraterística(s) empregue(s) para formar os estratos. Amostragem por clusters Especialmente útil quando o universo estatístico é formado por populações de grande dimensão e dispersas por vastas áreas geográficas. Usa agrupamentos naturais de elementos da população, nos quais cada elemento da população pertence a um só grupo. Para tal, é necessário que se disponha de uma listagem completa das amostras primárias (por exemplo, as turmas de uma escola). Os clusters são escolhidos aleatoriamente e, dentro de cada cluster, todos os elementos são selecionados. Ou seja, só existe uma etapa de amostragem. Está orientada para a seleção de grupos de elementos e não de elementos individuais. Segundo HILL et al. (2002), este método tem a vantagem de ser muito útil quando for difícil, ou impossível, conhecer todos os casos do universo, mas todos estes casos existem, naturalmente, por clusters. Desvantagem: os clusters devem ser relativamente semelhantes de modo a que uma amostra aleatória de clusters possa ser uma amostra representativa dos casos do universo. Amostragem Multi-Etápica ou Por Etapas Seleciona-se em primeiro lugar, aleatoriamente, uma amostra por clusters – repare-se que é muito mais fácil obter uma lista por clusters (por exemplo, de escolas) do que uma lista exaustiva dos elementos que compõem a população (por exemplo, todos os alunos). Seguidamente pode-se realizar, ou não, uma segunda etapa, na qual são escolhidos aleatoriamente alguns elementos dos clusters selecionados na fase anterior ou, então, continuando com a seleção de clusters até se chegar às unidades elementares. Amostragens Não Probabilísticas TIPOS Amostragem acidental ou de conveniência; Amostragem por quotas; Amostragem por redes ou bola de neve. Amostragem acidental ou de conveniência Formada por sujeitos facilmente acessíveis, que estão presentes num determinado local e momento preciso. Exemplo: sujeitos hospitalizados. Vantagens: simples em organizar e pouco onerosa. Desvantagens: Pode provocar enviesamentos, pois nada garante que os selecionados são representativos da população-alvo. Amostragem por quotas Idêntica à amostragem aleatória estratificada. Difere desta pela não escolha aleatória dos sujeitos no interior de cada estrato ou grupo. Contudo, e segundo HILL et al. (2002), há duas grandes desvantagens com este método de amostragem: (1) Embora o número de casos em cada um dos estratos seja proporcional ao número de casos no mesmo estrato do universo, a amostra de casos dentro do estrato, por não ser escolhida ao acaso, não é necessariamente representativa dos casos do estrato correspondente ao universo. (2) Os autores defendem que há quase sempre um enviesamento na seleção dos casos dentro dos estratos porque a amostra de casos é normalmente escolhida por meio de um método de amostragem por conveniência. Tal característica remete-nos para uma segunda desvantagem pois, nestes casos, não é possível extrapolar com confiança para o universo os resultados e conclusões tiradas a partir da amostra. Amostragem por redes ou bola de neve Forma-se tomando por base redes sociais, amizades e conhecimentos que, de outro modo, seriam difíceis de encontrar. Caso de matérias sigilosas ou sensíveis. Determinação do Tamanho da Amostra Tamanho “ótimo” de uma amostra depende: (1) Margem de erro: uma amostra representa aproximadamente (e nunca exatamente) uma população. A medida deste “aproximadamente” é a margem de erro. É lida assim: se uma pesquisa tem uma margem de erro de 2% e a doença cardíaca teve 25% de prevalência na amostra recolhida, podemos dizer que, naquele instante, na população, haverá uma prevalência entre 23% e 27% (25% menos 2% e 25% mais 2%); (2) Nível de confiança: as pesquisas são feitas com um parâmetro chamado nível de confiança, geralmente de 95%: se realizarmos uma outra pesquisa, com uma amostra do mesmo tamanho, nas mesmas datas e locais e com o mesmo instrumento de recolha de dados, há uma probabilidade de 95% de que os resultados sejam os mesmos (e uma probabilidade de 5% - é claro – de que tudo difira). Determinação do Tamanho da Amostra - Nível de confiança estabelecido O nível de confiança de uma amostra refere-se à área da curva normal definida a partir dos desvios-padrão em relação à sua média. Fatores que determinam o tamanho da amostra: - Erro máximo permitido Os resultados obtidos numa pesquisa elaborada a partir de amostras não são rigorosamente exatos em relação ao universo. Esses resultados apresentam sempre um erro de medição. Nas pesquisas sociais, trabalha-se usualmente com uma estimativa de erro entre 3 e 5%. Erro amostral Erro amostral ou de amostragem: diferença entre os resultados obtidos numa amostra e os que teriam sido obtidos na população-alvo. Duas soluções para reduzir o erro amostral: 1. Retirar de forma aleatória e um número suficiente de sujeitos que constituirão a amostra; 2. Procurar reproduzir, o mais fielmente possível, a população tomando em consideração as suas caraterísticas. Erro amostral Distribuição normal Se desejarmos um nível de confiança muito alto (superior a 99%) aplica-se a fórmula dos três desvios. Distribuição normal 1 desvio padrão representatividade = 68% de 2 desvios = 95,5% de seu total 3 desvios= 99,7% da amostra ou população Determinação do Tamanho da Amostra Para Populações infinitas (+ de 100 000 elementos) Para populações finitas (menos de 100 000 elementos) Bibliografia Coutinho, Clara, “Métodos ou Técnicas de Amostragem”, Universidade do Minho, http://claracoutinho.wikispaces.com/M%C3%A9todos+e+ T%C3%A9cnicas+de+Amostragem Hill, Margarida; Hill, Andrew (2009), Investigação por Questionário, Lisboa, Edições Sílabo. Moreira, Carlos Diogo (1994), Planeamento e Estratégias da Investigação Social, Lisboa, ISCSP. Pocinho, Margarida (2009), Estatística – Volume I. Teoria e exercícios passo-a-passo. http://docentes.ismt.pt/~m_pocinho/Sebenta_estatistica% 20I.pdf Links para plano de amostragem http://www.dgai.mai.gov.pt/cms/files/conteudos/file/administracao_eleitoral/Result ados%20RE/Publicacao_DR_Ref31Dez2011(1).pdf http://www.google.com/url?sa=t&rct=j&q=&esrc=s&source=web&cd=1&ved=0CCMQ FjAA&url=http%3A%2F%2Fwww.ine.pt%2Fngt_server%2Fattachfileu.jsp%3Flook_pare ntBoui%3D131011296%26att_display%3Dn%26att_download%3Dy&ei=uNmLT76VAeH F0QXMvsC3CQ&usg=AFQjCNHbhfDNxILJQHbMo9fjD-wCZQhSOw http://www.pordata.pt/Subtema/Portugal/Recenseamento+Eleitoral-190 http://www.pordata.pt/Portugal/Recenseados+total+e+por+grupo+etario-2252 http://www.pordata.pt/Portugal/Recenseados+total+e+por+sexo-2251 Fontes/Entidades: DGAI/MAI - Base de Dados do Recenseamento Eleitoral, PORDATA Última actualização: 2012-01-24