Corpus
UFRGS
Organização de Projetos
Marcia Benetti – 2008/2
 Depois de definir o tema, a questão de
pesquisa e os objetivos (que incluem a
definição do objeto empírico), chega o
momento de estabelecer o corpus.
 O corpus é o recorte arbitrário de elementos
que o pesquisador define para que, ao
aplicar sobre eles uma metodologia, possa
atingir o objetivo.
 Logo, a construção do corpus é uma escolha
do pesquisador, que deve ser justificada no
trabalho.
 Algumas perguntas norteiam esta escolha:



de quantas unidades preciso para que meus
resultados tenham validade?
quantas unidades posso coletar e analisar, no
período de tempo de que disponho?
quanto tempo deve abranger a minha amostra
(no caso do corte temporal ser pertinente)?
Termos
 População ou universo: conjunto de
elementos que possuem uma ou mais
características em comum (pode ser finita
ou infinita)
Censo: estudo de toda a população
 Amostra: subconjunto da população

 Unidade: cada um dos elementos da
população
 Variável: característica da população que o
pesquisador considera relevante


Variável qualitativa: sexo, raça, classe social,
grau de instrução etc.
Variável quantitativa: número de filhos,
estatura, peso etc.
 Dados primários: coletados especificamente
para uma determinada pesquisa
 Dados secundários: informações existentes
em órgãos governamentais, entidades de
classe, pesquisas etc. e que podem ser
utilizadas como argumentos no estudo ou
para elaborar uma amostra
A escolha
 “Após ter circunscrito o seu campo de análise, deparam-
se três possibilidades ao investigador: ou recolhe dados e
faz incidir as suas análises sobre a totalidade da
população coberta por esse campo; ou a limita a uma
amostra representativa desta população; ou estuda
apenas algumas componentes muito típicas, ainda que
não estritamente representativas, dessa população. A
escolha é, na realidade, bastante teórica, visto que, na
maior parte das vezes, uma das soluções se impõe
naturalmente, em função dos objetivos da investigação.”
(QUIVY; CAMPENHOUDT, 1992, p. 162).
 A totalidade da população (ou censo):

População é o conjunto de elementos
constituintes de um todo (todos os alunos de
uma escola, todos os livros de uma biblioteca,
todos os artigos de um jornal etc.)
 A amostra representativa:



“Esta fórmula impõe-se quando estão reunidas duas
condições:
Quando a população é muito volumosa e é preciso
recolher muitos dados para cada indivíduo ou unidade;
Quando, sobre os aspectos que interessam ao
investigador, é importante recolher uma imagem
globalmente conforme a que seria obtida interrogando
o conjunto da população; resumindo, quando se põe
um problema de representatividade.” (QUIVY;
CAMPENHOUDT, 1992, p. 163)
Amostras
 Há dois tipos básicos de amostra:


Probabilística: todas as unidades da
população têm igual probabilidade de ser
selecionadas.
Não probabilística: as unidades amostrais
são selecionadas de acordo com a
conveniência do pesquisador.
Amostra probabilística
 Todos os elementos da população ou
universo têm a mesma chance de ser
escolhidos. Por isso, é considerada uma
amostra representativa da população.
 Alguns tipos são mais comuns:




Amostra aleatória simples ou casual simples
Amostra casual estratificada
Amostra sistemática
Amostra por estágios múltiplos
 Amostra aleatória simples ou casual simples
 Escolhida ao acaso ou probabilisticamente: por
exemplo, a partir do sorteio em uma tabela de
números.
 Amostra casual estratificada
 A população de interesse é dividida em subgrupos ou estratos mutuamente exclusivos. Pode
ser proporcional ou desproporcional, em relação à
presença do estrato no universo. Cada estrato
constitui uma amostra aleatória simples.
 Amostra sistemática

Pressupõe a listagem do universo de
interesse. Sorteia-se um número inicial, a
partir do qual haverá um intervalo entre uma
unidade selecionada e a próxima. Este
intervalo é obtido dividindo-se o número de
unidades do universo pelo tamanho da
amostra pretendida (por exemplo, quero
estudar 30 de 100 jornais, o intervalo é 3).
 Amostra por estágios múltiplos
 O sorteio se dá em diversas etapas, a primeira
delas considerando a população, e as etapas
seguintes considerando segmentos definidos
desse universo, preservando-se sua
representatividade. Dessa maneira, chega-se à
unidade amostral (por exemplo: 1º estágio: sorteio
dos municípios; 2º estágio: sorteio dos bairros; 3º
estágio: sorteio dos quarteirões; 4º estágio:
sorteio dos domicílios; 5º estágio: sorteio dos
entrevistados).
Amostra não probabilística
 Nem todos os elementos têm a mesma
chance de ser selecionados, já que a
amostra é definida a partir de critérios do
pesquisador. Os resultados não podem ser
generalizados para a população.
 Alguns tipos são mais comuns:



Amostra por conveniência
Amostra intencional
Amostra por cota
 Amostra por conveniência

A amostra é regida pela disponibilidade dos
elementos (ex: os que responderem a um
anúncio publicado no jornal).
 Amostra intencional

A amostra é definida por critérios do
pesquisador (ex: os líderes de um partido, os
leitores negros de um jornal).
 Amostra por cotas

As unidades são sorteadas a partir de
características conhecidas previamente e
consideradas relevantes para o estudo; pode
haver sorteio.
Tamanho da amostra
 Para definir o tamanho da amostra, a
questão de pesquisa e os objetivos devem
estar claros.
 A amostra deve ser suficiente para:



representar a população;
contemplar as variáveis importantes;
esgotar as perguntas a serem respondidas.
Corpus
 Bauer e Aarts (2002) fazem uma distinção
entre corpus e amostragem, considerados
como procedimentos de seleção diversos.
 A construção do corpus significa “escolha
sistemática de algum racional alternativo”.
 Amostragem representativa
 “Como pode o estudo de uma parte fornecer um
referencial seguro do todo? A chave para decifrar
este enigma é a representatividade. A amostra
representa a população se a distribuição de algum
critério é idêntica tanto na população quanto na
amostra. Os parâmetros de uma população são
calculados através das estimativas observadas na
amostra.” (BAUER e AARTS, 2002, p. 41)


Quanto maior a amostra, menor a margem de
erro sobre os resultados obtidos.
Porém, o próprio processo de definição da
amostragem pode induzir a erro. Os autores
dão como exemplo utilizar a lista de eleitores
como população de um país, quando
prisioneiros, por exemplo, não estão incluídos
nesta lista.
 “Uma amostragem representativa conseguirá a
melhor descrição possível de uma população, apesar
de se pesquisar apenas parte dela. Contudo, ela
depende da possibilidade de um referencial de
amostragem, de uma lista ou combinação de listas
dos membros de uma população, ou do
conhecimento de distribuição de características
essenciais na população. Sem listas ou distribuições
conhecidas, o trabalho não pode ser executado.”
(BAUER e AARTS, 2002, p. 42)
 Corpus


A palavra corpus significa simplesmente corpo
(nas ciências históricas, por exemplo, referese a um conjunto de textos).
Barthes define corpus como “uma coleção
finita de materiais, determinada de antemão
pelo analista, com (inevitável) arbitrariedade,
e com a qual ele irá trabalhar” (apud BAUER e
AARTS, 2002, p. 44).
 Os materiais devem ser homogêneos, por
isso em princípio não se deve misturar texto
e imagem (a menos que tenhamos um
método para cada tipo de material).
 “Uma boa análise permanece dentro do
corpus e procura dar conta de toda a
diferença que está contida nele” (BAUER e
AARTS, 2002, p. 45).
 Critérios de construção do corpus:



relevância;
sincronicidade;
homogeneidade.
 Relevância


Os assuntos devem ser teoricamente
relevantes.
Os materiais devem ser coletados sob um
único ponto de vista, considerando uma
temática ou problematização.
 Sincronicidade

Os materiais devem ser coletados dentro de
um ciclo de tempo determinado.
 Homogeneidade




Os materiais de um corpus devem ser tão
homogêneos quanto possível.
Materiais textuais não devem ser misturados
com imagens.
Meios ou suportes distintos não devem ser
confundidos.
Transcrições de entrevistas individuais não
devem ser misturadas a entrevistas de grupos
focais (devem constituir corpora distintos).
 Tamanho do corpus
 “Pouco pode ser dito sobre o tamanho dos
corpora para pesquisa qualitativa. Devemos
considerar o esforço envolvido na coleta de dados
e na análise, o número de representações que se
quer caracterizar, e alguns requisitos mínimos e
máximos [...] como critérios para o tamanho de
um corpus. A maioria das limitações provém do
esforço que é exigido para se fazer um grande
número de grupos focais, ou entrevistas em
profundidade, ou para coletar documentos. ...

... O tempo disponível para se fazer estas
entrevistas, e para analisá-las, será a primeira
restrição sobre o tamanho do corpus. Pesquisa
qualitativa que envolve uma grande quantidade de
material foi corretamente identificada como um
‘incômodo atrativo’ [...]. Os pesquisadores coletam
facilmente muito mais material interessante do
que aquele com que poderiam efetivamente lidar,
dentro do tempo de um projeto. Isso leva à queixa
comum de que o projeto termina sem que o
material tenha sido analisado com alguma ...

... profundidade. Isto também resulta na criação
de ‘porões de dados’: materiais coletados, mas
nunca de fato analisados. Uma avaliação séria
dos procedimentos referentes ao tempo exigido
para seleção e análise irá aumentar o realismo de
muitos pesquisadores” (BAUER e AARTS, 2002,
p. 59-60).
 A regra básica na construção de um corpus é



selecionar preliminarmente;
analisar essa variedade;
ampliar o corpus de dados até que não se
descubra mais variedade (este é o ponto de
saturação do tamanho, e onde o corpus
termina).
Referências
 BAUER, Martin W.; AARTS, Bas. A construção do corpus: um
princípio para a coleta de dados qualitativos. In: BAUER, martin;
GASKELL, George (org.). Pesquisa qualitativa com texto,
imagem e som. Petrópolis: Vozes, 2002.
 QUIVY, Raymond; CAMPENHOUDT, Luc Van. Manual de
investigação em Ciências Sociais. Lisboa: Gradiva, 1992.
Download

Corpus de Pesquisa