Corpus UFRGS Organização de Projetos Marcia Benetti – 2008/2 Depois de definir o tema, a questão de pesquisa e os objetivos (que incluem a definição do objeto empírico), chega o momento de estabelecer o corpus. O corpus é o recorte arbitrário de elementos que o pesquisador define para que, ao aplicar sobre eles uma metodologia, possa atingir o objetivo. Logo, a construção do corpus é uma escolha do pesquisador, que deve ser justificada no trabalho. Algumas perguntas norteiam esta escolha: de quantas unidades preciso para que meus resultados tenham validade? quantas unidades posso coletar e analisar, no período de tempo de que disponho? quanto tempo deve abranger a minha amostra (no caso do corte temporal ser pertinente)? Termos População ou universo: conjunto de elementos que possuem uma ou mais características em comum (pode ser finita ou infinita) Censo: estudo de toda a população Amostra: subconjunto da população Unidade: cada um dos elementos da população Variável: característica da população que o pesquisador considera relevante Variável qualitativa: sexo, raça, classe social, grau de instrução etc. Variável quantitativa: número de filhos, estatura, peso etc. Dados primários: coletados especificamente para uma determinada pesquisa Dados secundários: informações existentes em órgãos governamentais, entidades de classe, pesquisas etc. e que podem ser utilizadas como argumentos no estudo ou para elaborar uma amostra A escolha “Após ter circunscrito o seu campo de análise, deparam- se três possibilidades ao investigador: ou recolhe dados e faz incidir as suas análises sobre a totalidade da população coberta por esse campo; ou a limita a uma amostra representativa desta população; ou estuda apenas algumas componentes muito típicas, ainda que não estritamente representativas, dessa população. A escolha é, na realidade, bastante teórica, visto que, na maior parte das vezes, uma das soluções se impõe naturalmente, em função dos objetivos da investigação.” (QUIVY; CAMPENHOUDT, 1992, p. 162). A totalidade da população (ou censo): População é o conjunto de elementos constituintes de um todo (todos os alunos de uma escola, todos os livros de uma biblioteca, todos os artigos de um jornal etc.) A amostra representativa: “Esta fórmula impõe-se quando estão reunidas duas condições: Quando a população é muito volumosa e é preciso recolher muitos dados para cada indivíduo ou unidade; Quando, sobre os aspectos que interessam ao investigador, é importante recolher uma imagem globalmente conforme a que seria obtida interrogando o conjunto da população; resumindo, quando se põe um problema de representatividade.” (QUIVY; CAMPENHOUDT, 1992, p. 163) Amostras Há dois tipos básicos de amostra: Probabilística: todas as unidades da população têm igual probabilidade de ser selecionadas. Não probabilística: as unidades amostrais são selecionadas de acordo com a conveniência do pesquisador. Amostra probabilística Todos os elementos da população ou universo têm a mesma chance de ser escolhidos. Por isso, é considerada uma amostra representativa da população. Alguns tipos são mais comuns: Amostra aleatória simples ou casual simples Amostra casual estratificada Amostra sistemática Amostra por estágios múltiplos Amostra aleatória simples ou casual simples Escolhida ao acaso ou probabilisticamente: por exemplo, a partir do sorteio em uma tabela de números. Amostra casual estratificada A população de interesse é dividida em subgrupos ou estratos mutuamente exclusivos. Pode ser proporcional ou desproporcional, em relação à presença do estrato no universo. Cada estrato constitui uma amostra aleatória simples. Amostra sistemática Pressupõe a listagem do universo de interesse. Sorteia-se um número inicial, a partir do qual haverá um intervalo entre uma unidade selecionada e a próxima. Este intervalo é obtido dividindo-se o número de unidades do universo pelo tamanho da amostra pretendida (por exemplo, quero estudar 30 de 100 jornais, o intervalo é 3). Amostra por estágios múltiplos O sorteio se dá em diversas etapas, a primeira delas considerando a população, e as etapas seguintes considerando segmentos definidos desse universo, preservando-se sua representatividade. Dessa maneira, chega-se à unidade amostral (por exemplo: 1º estágio: sorteio dos municípios; 2º estágio: sorteio dos bairros; 3º estágio: sorteio dos quarteirões; 4º estágio: sorteio dos domicílios; 5º estágio: sorteio dos entrevistados). Amostra não probabilística Nem todos os elementos têm a mesma chance de ser selecionados, já que a amostra é definida a partir de critérios do pesquisador. Os resultados não podem ser generalizados para a população. Alguns tipos são mais comuns: Amostra por conveniência Amostra intencional Amostra por cota Amostra por conveniência A amostra é regida pela disponibilidade dos elementos (ex: os que responderem a um anúncio publicado no jornal). Amostra intencional A amostra é definida por critérios do pesquisador (ex: os líderes de um partido, os leitores negros de um jornal). Amostra por cotas As unidades são sorteadas a partir de características conhecidas previamente e consideradas relevantes para o estudo; pode haver sorteio. Tamanho da amostra Para definir o tamanho da amostra, a questão de pesquisa e os objetivos devem estar claros. A amostra deve ser suficiente para: representar a população; contemplar as variáveis importantes; esgotar as perguntas a serem respondidas. Corpus Bauer e Aarts (2002) fazem uma distinção entre corpus e amostragem, considerados como procedimentos de seleção diversos. A construção do corpus significa “escolha sistemática de algum racional alternativo”. Amostragem representativa “Como pode o estudo de uma parte fornecer um referencial seguro do todo? A chave para decifrar este enigma é a representatividade. A amostra representa a população se a distribuição de algum critério é idêntica tanto na população quanto na amostra. Os parâmetros de uma população são calculados através das estimativas observadas na amostra.” (BAUER e AARTS, 2002, p. 41) Quanto maior a amostra, menor a margem de erro sobre os resultados obtidos. Porém, o próprio processo de definição da amostragem pode induzir a erro. Os autores dão como exemplo utilizar a lista de eleitores como população de um país, quando prisioneiros, por exemplo, não estão incluídos nesta lista. “Uma amostragem representativa conseguirá a melhor descrição possível de uma população, apesar de se pesquisar apenas parte dela. Contudo, ela depende da possibilidade de um referencial de amostragem, de uma lista ou combinação de listas dos membros de uma população, ou do conhecimento de distribuição de características essenciais na população. Sem listas ou distribuições conhecidas, o trabalho não pode ser executado.” (BAUER e AARTS, 2002, p. 42) Corpus A palavra corpus significa simplesmente corpo (nas ciências históricas, por exemplo, referese a um conjunto de textos). Barthes define corpus como “uma coleção finita de materiais, determinada de antemão pelo analista, com (inevitável) arbitrariedade, e com a qual ele irá trabalhar” (apud BAUER e AARTS, 2002, p. 44). Os materiais devem ser homogêneos, por isso em princípio não se deve misturar texto e imagem (a menos que tenhamos um método para cada tipo de material). “Uma boa análise permanece dentro do corpus e procura dar conta de toda a diferença que está contida nele” (BAUER e AARTS, 2002, p. 45). Critérios de construção do corpus: relevância; sincronicidade; homogeneidade. Relevância Os assuntos devem ser teoricamente relevantes. Os materiais devem ser coletados sob um único ponto de vista, considerando uma temática ou problematização. Sincronicidade Os materiais devem ser coletados dentro de um ciclo de tempo determinado. Homogeneidade Os materiais de um corpus devem ser tão homogêneos quanto possível. Materiais textuais não devem ser misturados com imagens. Meios ou suportes distintos não devem ser confundidos. Transcrições de entrevistas individuais não devem ser misturadas a entrevistas de grupos focais (devem constituir corpora distintos). Tamanho do corpus “Pouco pode ser dito sobre o tamanho dos corpora para pesquisa qualitativa. Devemos considerar o esforço envolvido na coleta de dados e na análise, o número de representações que se quer caracterizar, e alguns requisitos mínimos e máximos [...] como critérios para o tamanho de um corpus. A maioria das limitações provém do esforço que é exigido para se fazer um grande número de grupos focais, ou entrevistas em profundidade, ou para coletar documentos. ... ... O tempo disponível para se fazer estas entrevistas, e para analisá-las, será a primeira restrição sobre o tamanho do corpus. Pesquisa qualitativa que envolve uma grande quantidade de material foi corretamente identificada como um ‘incômodo atrativo’ [...]. Os pesquisadores coletam facilmente muito mais material interessante do que aquele com que poderiam efetivamente lidar, dentro do tempo de um projeto. Isso leva à queixa comum de que o projeto termina sem que o material tenha sido analisado com alguma ... ... profundidade. Isto também resulta na criação de ‘porões de dados’: materiais coletados, mas nunca de fato analisados. Uma avaliação séria dos procedimentos referentes ao tempo exigido para seleção e análise irá aumentar o realismo de muitos pesquisadores” (BAUER e AARTS, 2002, p. 59-60). A regra básica na construção de um corpus é selecionar preliminarmente; analisar essa variedade; ampliar o corpus de dados até que não se descubra mais variedade (este é o ponto de saturação do tamanho, e onde o corpus termina). Referências BAUER, Martin W.; AARTS, Bas. A construção do corpus: um princípio para a coleta de dados qualitativos. In: BAUER, martin; GASKELL, George (org.). Pesquisa qualitativa com texto, imagem e som. Petrópolis: Vozes, 2002. QUIVY, Raymond; CAMPENHOUDT, Luc Van. Manual de investigação em Ciências Sociais. Lisboa: Gradiva, 1992.