Mas o que é mesmo Corpus? – Alguns Apontamentos sobre a Construção de Corpo de
Pesquisa nos Estudos em Administração
Autoria: Thaysa Danyella Lira da Silva, Edcleide Maria da Silva
Resumo: Nos últimos anos tem havido uma moção direcionada aos estudos qualitativos com
o objetivo de compreender os processos de significação e as interações simbólicas entre os
indivíduos, tornando premente ao pesquisador selecionar dados representativos desses
processos. Assim, este artigo apresenta os principais conceitos e critérios para a construção de
um corpus de pesquisa. Visando explorar o uso dessa técnica nas pesquisas em administração,
realizou-se uma desk research nas edições do Encontro de Ensino e Pesquisa em
Administração - EnEPQ. Evidencia-se que o conceito de corpus ainda é pouco utilizado,
sobretudo, no que se refere ao seu uso criterioso e estruturado.
Palavras-chave: Corpus, pesquisa qualitativa, critérios.
1
1. Introdução
As pesquisas sociais, por muito tempo, permaneceram alinhavadas aos métodos
quantitativos. Essa dimensão se alarga ainda mais se direcionarmos esse prisma para as
pesquisas em administração, visto que o paradigma funcionalista regeu grande parte dos
estudos engendrados nessa área. Entretanto, a complexidade imanente à modernidade tardia
tem posto em ‘xeque’ muitos dos argumentos sobre a primazia de quantificar e generalizar os
fenômenos sociais.
Notadamente, é crescente a tendência de se interpretar a realidade como uma rede de
significações, o que tem conduzido a abordagem qualitativa a trilhar novos caminhos
epistemológicos e metodológicos. De um ponto de vista operacional, a pesquisa qualitativa
vai do campo ao texto e do texto ao leitor (DENZIN, 1994), sendo o texto compreendido
dentro das abordagens linguísticas como manifestação material verbal e/ou semiológica
expressa de forma oral, gráfica, gestual, icônica.
Nesse intricado entre seleção de materiais e processo de significação, a forma como o
investigador constrói seu corpus de pesquisa adquire extrema importância, uma vez que
tangencia aspectos de confiabilidade e validação do estudo.
Assim, este artigo discute algumas compreensões acerca do conceito de corpus,
discorrendo sobre os principais critérios utilizados no seu delineamento. O ponto de partida é
uma reflexão sobre a paulatina substituição do paradigma racionalista, dominante na
concepção moderna, por enfoques de cunho mais subjetivos e simbólicos, o que conduz a
apresentar os principais conceitos de corpus e como ele se consubstancia na pesquisa
qualitativa. A seção seguinte trata dos principais critérios utilizados na construção do corpus,
a exemplo de tamanho, representatividade e relevância, destacando-se as esquematizações
apresentadas por Sinclair (1991), Barthes (2004), Berber Sardinha (2004), Biber, Conrad e
Reppen (1998), Bauer e Aarts (2008). Da mesma forma, nas seções subsequentes, apresentase a ideia de corpus como processo cíclico e os principais entendimentos sobre os critérios de
saturação e exaustão. Por fim, são apresentados os achados decorrentes de uma pesquisa
exploratória abrangendo todas as edições do EnEPQ – Encontro de Ensino e Pesquisa em
Administração da ANPAD (2007-2011).
2. Já fomos mais modernos: crescimento de uma abordagem qualitativa nos estudos
sociais
A ciência foi um princípio definidor da sociedade moderna (MAFFESOLI, 1994) e
sua demarcação atuou para além de uma definição de corpo de conhecimento, trazendo a
reboque a distinção entre quais saberes eram mais significativos para a sociedade. Nesse
contexto, a ciência se constituía como um corpo de conhecimento racional, livre de
impressões e subjetividades, baseado na observação e análise dos fatos (JAPIASSÚ, 1994).
A razão, tendo como processo basilar a observação, emancipava o conhecimento de
qualquer interferência de cunho axiológico. Tinha-se a certeza de que a observação criteriosa
era capaz de desvelar os fatos tal como eles são, concedendo aos humanos uma dominação da
natureza. Desse modo, qualquer conhecimento que se pretendesse configurar como científico,
que tencionasse elaborar previsões, explicar fenômenos do mundo ou ser aplicado para fins
práticos deveria ser capaz de usar a lógica e a matemática para eliminar quaisquer
contradições e, assim, procurar leis gerais e precisas obtidas, principalmente, a partir de testes
e refutações de hipóteses advindas de experimentos controlados (GEWANDSZNAJDER,
1989).
Sob essa mesma amálgama, foram desenvolvidos os preceitos de cientificidade nas
ciências sociais. “A ciência moderna consagrou o homem enquanto sujeito epistemológico,
mas expulsou-o enquanto sujeito empírico.” (SANTOS, 2000). Nesses termos, tinha-se a
2
proposta de uma física social, os fatos sociais eram coisas e deviam ser tratados como tais.
Assim, para adquirir status científico, as pesquisas sociais deveriam dispor dos mesmos
critérios de neutralidade e objetividade utilizados na física, química e matemática. Não é de se
estranhar, como destaca Santos (2000), a premência por instrumentos metodológicos que
garantissem o distanciamento entre pesquisador e objeto (social), portanto, se fazendo
necessária a adoção de métodos quantitativos, o inquérito sociológico e a análise documental.
Com efeito, os métodos quantitativos caracterizaram a produção científica na área de
administração (CHASE, 1980; BUFFA, 1980). A despeito da estruturação realizada por
Burrel e Morgan (1979), pode-se apontar que esses métodos convergiam com o estruturalismo
predominante como direcionamento paradigmático das pesquisas em administração.
O paradigma funcionalista emerge das contribuições teóricas de Comte, Durkheim e
Pareto. Trata de uma percepção determinista e positivista relacionada a teorias que expliquem
a ordem social entendendo a sociedade como estruturas relativamente estáveis. Há o
entendimento de uma ciência social composta por artefatos empíricos e relativamente
concretos. Portanto, era plausível a ideia de aprender a “realidade” a partir de métodos
quantitativos de investigação, o que permitiria resultados reproduzíveis e generalizações
(HAYATI; KARAMI; SLEE, 2006). Um estudo realizado por Betero, Caldas e Wood Jr em
1999 acerca da produção científica administrativa brasileira revela que mais de 80% dos
trabalhos se orientam por esse paradigma.
Contudo, um movimento divergente a esse paradigma já tomava corpo desde as décadas
de 1920 e 1930, com os trabalhos engendrados pela escola de Chicago. Nesse período,
desenvolveu-se uma significativa quantidade de pesquisas utilizando a observação
participante, entrevistas detalhadas, análise dos documentos pessoais e histórias de vida.
Apontava-se para um redirecionamento das investigações científicas enfatizando-se a natureza
social e a interação simbólica entre os indivíduos (DENZIN; LINCOLN, 2006). Como
destaca Godoy (1995), o que atualmente se denominam estudos qualitativos começou a se
desenhar, no cenário da investigação social, a partir da segunda metade do século XX,
notadamente nas pesquisas antropológicas, sendo posteriormente absorvidos pela sociologia,
com a adoção do método etnográfico e da entrevista como estratégia de pesquisa.
Cabe destacar que esse percurso transcorrido pela pesquisa qualitativa, da década de 1930
até a atualidade, foi labiríntico, sendo marcado por questionamentos e crises. Denzin e
Lincoln (2006) classificam essas tensões como (1) crise da representação, na qual os modos
estabelecidos de representar a realidade são inadequados para a tarefa de pesquisa, impelindose ao pesquisador um posicionamento mais subjetivo e engajado, o que acarreta na (2) crise
da legitimidade, sob a qual o direcionamento mais subjetivo impõe questionamentos acerca
dos critérios convencionais de validade, confiabilidade e objetividade para acessar o resultado
das pesquisas e, por sua vez, essas duas crises culminam na (3) crise da práxis na qual é
questionada o comprometimento das pesquisas acadêmicas em compreender, dar respostas e
resolver os problemas sociais.
Tangenciando-se a pesquisa qualitativa à administração, percebe-se que esse enfoque tem
sido adotado, progressivamente, desde a década de 1990 (VIEIRA; ZOUAIN, 2006). A
administração tem apontado para um rompimento com a perspectiva que se inicia com os
estudos de Taylor e a percepção de uma dimensão organizacional voltada apenas para o
aumento da produção e controle do trabalho, despertando para compreender os fenômenos
administrativos a partir da complexidade na interação de pessoas que estabelecem relações
internas próprias e mutáveis, nas quais, dadas essas características, não são passíveis de
controle, reprodução e generalizações (GAY; DIEHL, 1992).
Assim, o significado que as pessoas atribuem às coisas passa a ser a preocupação essencial
do pesquisador, de modo que compreender o processo de significação entre indivíduos e
3
indivíduos e coisas (instituições, ideias, objetos, situações vivenciadas) torna-se imanente ao
estudo qualitativo (GODOY, 1995) .
Nesses termos, a pesquisa qualitativa aproxima o pesquisador de uma variedade de
materiais: história de vida, entrevista, textos e produções culturais, textos observacionais,
históricos, interativos e visuais – que descrevem momentos e significados rotineiros e
problemáticos na vida dos indivíduos (DENZIN; LINCOLN, 2006). Esses artefatos
entremeiam-se à necessidade de se estabelecer uma análise linguística visando a compreender
os processos de significação, pelo que a concepção de corpus tem sido cada vez mais
recorrente nos estudos qualitativos.
2. Corpus
O conceito de corpus tem sido definido por polifônicos posicionamentos, destacandose semelhanças e diferenças nas indicações dos autores. Como elemento comum, o corpus é
apontado como uma coleção de materiais (SINCLAIR, 1991, AARTS, 1991, BARTHES,
2006, BERBER SARDINHA, 2004). Concernente a esse conceito, McEnery e Wilson (1996)
buscam a origem etimológica do termo que é simplesmente a equivalência em latim da
palavra corpo, o que reforça a ideia de conjunto de elementos. Contudo, os autores destacam
que quando utilizado no contexto da linguística moderna o termo corpus adquire conotações
mais específicas.
Assim, para Tognini-Bonelli (2001), corpus é uma coleção de textos presumidamente
representativa de uma dada língua que é compilada para que possa ser utilizada na análise
linguística. Sinclair (1991) converge com esse conceito ao descrever corpus como uma
coleção de textos naturais, selecionados para caracterizar um estado ou variedade de uma
língua. A expressão textos naturais refere-se a textos autênticos, ou seja, textos que já existam
na língua e que não foram criados com o propósito de figurar o corpus (BERBER
SARDINHA, 2004).
Entretanto, é mister esclarecer que o corpus em si é artificial, visto que se trata de
textos organizados e selecionados, criando um objeto para fins de pesquisa (BERBER
SARDINHA, 2004). Nessa perspectiva, Aarts (1991) traz uma definição mais abrangente ao
entender corpus como uma coleção de amostras de texto corrido, que podem se apresentar nas
modalidades escrita, falada ou intermediária, podendo ser, essas amostras, de qualquer
tamanho. Não obstante, a definição de Aarts (1991) elucida a possibilidade de se configurar
em um corpus diversas modalidades da linguagem.
Esse esclarecimento é necessário, visto a compreensão do conceito de texto dentro das
abordagens linguísticas. Nessa esfera, o texto é concebido como uma manifestação material
verbal e/ou semiológica expresso de forma oral, gráfica, gestual, icônica etc.
(CHAREAUDEAU, 1992). Assim, o texto é uma unidade linguística com propriedades
estruturais específicas (KOCH, 1989), podendo-se considerar por texto desde um artigo
científico, um documento oficial, um trecho de conversação, a uma fotografia, uma música ou
um filme.
Operacionalmente, Bauer e Aarts (2008) abordam o corpus como um princípio
alternativo de coleta. Trata-se de uma escolha racional sistematizada análoga funcionalmente
à amostragem representativa e distinta no que se refere aos aspectos estruturais. Em síntese, o
processo de amostragem é típico dos métodos quantitativos e apenas apresenta ao pesquisador
a distribuição de atributos já conhecidos do espaço social. Já o corpus, de referência
eminentemente qualitativa, tem a finalidade de expor atributos desconhecidos direcionados a
perceber os signos, sentidos e representações presentes em uma determinada prática social.
4
Sob um caráter lato, o corpus pode ser entendido como um conjunto de materiais
representativos de uma língua ou variante. Contudo, em virtude dessa ampla acepção, faz-se
necessário abordar critérios que auxiliam no seu delineamento.
3. Tamanho, Representatividade e Relevância do corpus
Sinclair (1991) e Berber Sardinha (2004) destacam que quanto maior for um corpus
maior será sua representatividade. Contudo, não há consenso sobre o tamanho mínimo para
que um corpus seja indicado como representativo. Nesse sentido, Bowker e Pearson (2003)
afirmam que a definição de corpus como grande coleção de textos não é precisa o suficiente
para se criar um critério que se ajuste adequadamente a essa expressão “grande”. Na mesma
proporção, Pearson (1998) destaca que o fato de o corpus ser vasto não significa,
eminentemente, que contenha textos representativos do fenômeno estudado.
Notadamente, esses diversos posicionamentos contribuem para uma reflexão acerca
desse tema. Entretanto, para efeito didático, alguns apontamentos são necessários a fim de
conduzir os pesquisadores no desenvolvimento da pesquisa. Desse modo, Berber Sardinha
(2004), a partir de uma abordagem histórica, fundamentada no mapeamento dos corpora
empregados pela comunidade de linguistas em quatro anos de eventos, 1995-1998, sobre
Linguística de Corpus, esquematizou a seguinte classificação:
Quantidade de palavras
Menos de 80 mil
80 a 250 mil
250 mil a 1 milhão
1 milhão a 10 milhões
10 milhões ou mais
Classificação do Corpus
Pequeno
Pequeno-médio
Médio
Médio-grande
Grande
Figura 1: Classificação do tamanho do Corpus
Fonte: BERBER SARDINHA, T. Linguística de Corpus. Barueri (SP): Manole, 2004.
Essa classificação considera o efeito probabilístico da língua, sob o qual elementos
gramaticais, lexicais e semânticos só poderiam ser observados se constituídos dentro de
corpus vasto. Essa corrente teórica adquire sonoridade a partir dos estudos realizados por
Halliday (1991, 1992, 1993), observando-se que a maior parte das palavras que constituem a
língua ocorre em baixa frequência, de tal modo que, para adquirir representatividade, um
corpus deve ser o quanto mais extenso possível. Ao mesmo tempo em que se destaca a
polissemia das palavras, ou seja, o mesmo significante representando múltiplos significados,
assim para se distinguir a representatividade de cada um desses sentidos, um corpus deve
conter o maior número possível de sentidos de cada forma (BERBER SARDINHA, 2004).
Sinclair (1991) corrobora essa abordagem e, apesar de não apontar para uma classificação,
indica a necessidade de se compor um corpus robusto para identificar maior variação dos
fenômenos linguísticos.
A partir de estudos realizados, Biber, Conrad e Reppen (1998) indicam certos padrões
mínimos a serem seguidos por pesquisas que trabalham com corpus. Para os autores, é
necessário pelo menos 10 (dez) amostras de um mesmo padrão de texto (oral/escrito) e que
cada um desses textos contenham minimamente 1.000 (mil) palavras para que se obtenham
resultados significativos.
Por sua vez, Bauer e Gaskell (2008) sugerem outros caminhos a serem utilizados pelos
pesquisadores na construção de corpus para as ciências sociais. O primeiro aspecto abordado
é que o tamanho do corpus na pesquisa qualitativa deve considerar o esforço envolvido na
coleta de dados, na análise e o número de representações que se pretende caracterizar. O
5
elemento tempo é primordial, uma vez que há uma tendência de se coletar mais materiais do
que se possa lidar, o que resulta na criação de “porões de dados”, ou seja, materiais que foram
coletados, mas nunca de fato utilizados. Com obviedade, os autores não renunciam a
necessidade de um corpus ser representativo da população estudada, contudo, indicam que
essa total representação é utópica, vista não propriamente a dificuldade de se desenhar esse
corpus, mas de tornar esses materiais comparáveis e acessíveis à análise. Em face dessas considerações, Bauer e Aarts (2008) preferem fazer uso da tipologia
desenvolvida por Barthes (2006) que se refere à relevância, homogeneidade e sincronicidade
dos materiais que configuram o corpus.
Critérios de Construção do Corpus segundo Barthes (2006) e Bauer e Aarts (2008)
Relevância
Grau de importância e convergência do material aos propósitos da
pesquisa
Homogeneidade
Padrão de um mesmo tipo de material
Sincronicidade
Intersecção histórica dos materiais
Figura 2: Classificação do Corpus
Fonte: BAUER, M. W.; AARTS, B. A construção do corpus: um princípio para a coleta de dados qualitativos.
In: BAUER, Martin W.; GASKELL, George (Orgs). Pesquisa qualitativa com texto, imagem e som: um manual
prático. 7. ed. Petrópolis: Vozes, 2008. p. 39-63.
O primeiro aspecto a se considerar é que o corpus é selecionado a partir de certa
arbitrariedade inevitável do pesquisador (BARTHES, 2006). Dessa forma, o critérios de
relevância referem-se à composição de materiais que, dado o conhecimento prévio do
pesquisador, são considerados pertinentes aos propósitos da pesquisa. O importante, contudo,
é que esses materiais sejam homogêneos do ponto de vista da substância material dos dados,
ou seja, materiais textuais não devem ser misturados com imagens, por exemplo. Ao mesmo
tempo, os materiais estudados devem ser sincrônicos, visto que o corpus é uma interseção da
história. Assim, os materiais devem ser selecionados dentro de um ciclo natural, como
exemplo de padrões familiares, que têm probabilidade de permanecer estáveis por uma
geração. Padrões de moda e vestimentas, por sua vez, mudam a cada ano, pois opiniões têm
ciclos curtos de dias e semanas. Desse modo, caso haja a necessidade de se estudar materiais
de substâncias diferentes ou padrões temporais distintos, o interessante é separá-los em
subcategorias, corpora (BAUER; AARTS, 2008).
4. Corpus como um processo cíclico
Dada às diversas pluri-definições quanto ao posicionamento de tamanho ou
representatividade do corpus, é interessante trazer à baila o posicionalmente de Fairclough
(2001), ao destacar a necessidade de se considerar que o corpus pode não ser totalmente
constituído antes ou mesmo durante o período de análise, mas deve estar aberto e com
possibilidades de crescimento em resposta a questões que surgem no transcorrer desse
processo. Notadamente, a natureza do corpus é moldada conforme o projeto e as questões da
pesquisa, porém, existem certos princípios gerais para se ter em mente. Numa primeira
instância, é necessário saber o que é útil e como chegar até lá, bem como é preciso ter o
domínio do que se está pesquisando e dos processos de mudança que estão em andamento,
como uma preliminar para decidir onde recolher amostras para um corpus. Contudo, precisase ter consciência que trabalhar com corpus é, naturalmente, alterar o mapa preliminar da
pesquisa.
6
Destarte, “os pesquisadores devem estar bem atentos em não confiar apenas em suas
intenções quando segmentam o espaço social. Precisam manter a mente aberta para estratos e
distribuições posteriores, que podem não ser óbvias num primeiro momento” (BAUER;
AARTS, 2008, p. 59). Portanto, a seleção de corpus para a pesquisa qualitativa aparece como
um processo cíclico, tendo como sugestão de procedimento selecionar preliminarmente o
corpus, analisar essa variedade de materiais e, caso se compreenda necessário, ampliar o
desenho desse corpus. Essa seria um das primeiras regras em pesquisa qualitativas. O corpus
é um sistema em ampliação ao qual, em vias gerais, deve-se proceder pelas seguintes etapas:
(1) selecionar, (2) analisar essa seleção, (3) selecionar de novo (BAUER; AARTS, 2008).
O delineamento do corpus deve ser um processo cíclico, não realizado
aprioristicamente, visto que sua construção está dependente da investigação empírica. Isso,
porém, não indica a abdicação de categorias externas e internas para a compilação desse
corpus. Os critérios externos precedem a percepção da variação interna, sendo os critérios
externos eminentemente critérios contextuais e não linguísticos como tipo de gênero, a
modalidade, a origem e, sobretudo, a finalidade pelos quais os textos devem ser incluídos. Os
critérios internos, por sua vez, referem-se a uma série de categorias linguísticas; entre elas
pode-se citar a distribuição de pronomes, preposições, tempos verbais ou proposições. Dada a
primazia dos aspectos conceituais que, por sua vez, são detectados no campo empírico,
precede-se o desenho do corpus nessa esquematização cíclica (BIBER, 1993):
Investigação empírica,
piloto e análise teórica
Delineamento do
Corpus
Compilação de
porção do corpus
Investigação
empírica
Figura3: Corpus como processo cíclico
Fonte: BIBER, D. Using register-diversified corpora for general language studies. 1993. Disponível em
<http://acl.ldc.upenn.edu/J/J93/J93-2001.pdf> Acesso em: 28 de Out de 2012.
A plasticidade do corpus reflete a dinamicidade das práticas sociais estudadas.
Operacionalmente, contudo, há restrições quanto ao tempo e a capacidade do pesquisador em
manejar esses materiais, o que impele a necessidade de se estabelecer critérios que apontem
para o desenho final do corpus, nomeadamente, ponto de saturação.
5. Critérios de Saturação
Talvez, um dos grandes questionamentos do pesquisador que adota abordagens
qualitativas relaciona-se a quando parar. Ou seja, como detectar o momento em que o corpus
já definiu seu contorno a tal sorte que os dados já possuam as contribuições para o estudo.
Essa questão é imperativa para o pesquisador, a fim de se evitar a seleção de um grande
volume de material que resulte na criação de “porões de dados” (BAUER; AARTS, 2008), ou
a necessidade de uma ampliação assistemática do corpus que venha afetar, sobremaneira, o
cronograma de pesquisa.
A fim de dar luzes a esses questionamentos, tem-se discutido o uso do critério de
saturação nas pesquisas de caráter qualitativo. Cabe esclarecer que, de modo geral, no estudo
qualitativo, o investigador desdobra o espaço social em duas dimensões: funções ou
categorias/representações. As categorias são variáveis segundo as quais geralmente se
segmenta a população, como idade, renda, atividade ocupacional etc. Já as representações
7
tratam da relação vivencial entre sujeito-objeto, sendo observada através de conceitos tais
como crenças, estereótipos, hábitos, práticas etc. Amiúde, os pesquisadores selecionam dados
a partir das categorias para desvelar um fenômeno desconhecido (BAUER; AARTS, 2008).
Essa definição é importante, pois grande parte dos apontamentos acerca do ponto de saturação
cinge aspectos pertinentes a categorias/representações.
O termo saturação, mais especificamente saturação teórica (theoretical saturation),
começa a ser explorado por Glaser e Strauss (1967) para representar o momento da pesquisa
em que os dados não emergem mais nenhum elemento novo ou relevante, sendo a ocasião de
se interromper a captação de informações.
Assim, a saturação envolve o lapso temporal onde o investigador consegue
compreender a lógica interna do grupo ou da coletividade em estudo (MINAYO, 2006), de
modo que a inclusão de novos estratos sociais não acrescenta novos elementos à pesquisa
(BAUER; AARTS, 2008).
Strauss e Corbin (1998) descrevem a saturação como o momento em que os dados
coletados completam as lacunas de cada categoria abordada, de tal forma que: (1) nenhum
dado relevante emerja; (2) a categoria esteja bem desenvolvida em termos de suas
propriedades e dimensões, demonstrando variação; (3) seja possível se configurar o
relacionamento entre as categorias. Mayan (2001) corrobora e completa a descrição anterior
ao delimitar que os pesquisadores não devem mais coletar os dados quando todos os dados
das categorias estiverem saturados e isso ocorre quando: 1) nenhum dado novo ou relevante
emerge; 2) todos os caminhos tenham sido seguidos; 3) quando a história ou a teoria está
completa. Assim, a saturação ocorre mediante a robustez de todas as categorias de pesquisa,
seja no campo empírico ou teórico.
Nos estudos em que o corpus é composto por entrevistas em profundidade, a saturação
ocorre quando os relatos dos entrevistados começam a apresentar aspectos que já são do
conhecimento do investigador, provocando uma rarefação de informações novas (SEIDMAN,
1998). Para fins didáticos, Fontanella, Ricas e Turato (2008) propuseram uma representação
esquemática a fim de demonstrar o processo de saturação de corpus em entrevistas. A
categoria refere-se a “atribuições de significados quanto ao tema X”. Notadamente, nenhum
discurso é idêntico ao outro, mas possuem alguns elementos em comum. Observa-se no
Quadro 3 que os dados são representados por {a,b,c,d,e,f,g,h,i,j,k,l,}. Percebe-se, portanto,
que entre os primeiros entrevistados há um acréscimo de dados como c, h, g, f, contudo, a
partir do entrevistado 12, repetem-se os mesmos elementos das repostas.
Mantendo-se esse padrão, são realizadas mais duas entrevistas, a primeira a fim de
verificar essa permanência e uma segunda para ratificar esse primeiro processo de verificação.
No caso dos padrões se repetirem, fica configurado que das respostas não emergem novos
esclarecimentos, ou seja, os dados tornaram-se rarefeitos, saturados.
Categoria: Atribuições de significados quanto ao tema X
Entrevistado Padrões de elementos contidos na fala
1
a,b,l,d
2
c,e,f,i
3
a,d,g,k
4
f,g,d,l
5
k,b,d,k
6
f,b,c,h
7
c,i,g
8
b,c,d,j,f,k
9
k,d,b,c,h,l
10
d,h
11
a,d,f,c,h,b,l,h
12
a,b,j,l,h,k
8
13
14
15
l,f,a
f,d,l,a,c,k
c,f,b,h
Figura 4: Saturação do Corpus
Fonte: FONTANELLA B. J. B.; RICAS J.; TURATO E. R. Amostragem por saturação em pesquisas qualitativas
em saúde: contribuições teóricas. Cad. Saúde Pública, v. 24, n. 1, p. 17-27, 2008.
Porém, há situações em que o pesquisador vai a campo sem pré-categorias
explicitadas, a exemplo de estudos nitidamente exploratórios. Nesses casos, faz-se necessário
que o pesquisador estabeleça um recorte, mesmo não intencional, que será objeto de suas
reflexões, constituindo objetivos declarados a posteriori. Diante disso, o investigador
estabelece não propriamente categorias, mas campos categoriais, nos quais o processo de
construção do corpus deverá ser interrompido quando houver saturação dos significados,
representações e simbolizações dos fenômenos estudados (FONTANELLA, RICAS,
TURATO, 2008).
Outro ponto que merece destaque é a distinção entre o fechamento do corpus por
processo de saturação e fechamento do corpus por exaustão. Em muitas pesquisas
qualitativas, o pesquisador realiza uma etapa exploratória a fim de eleger o espaço, o grupo,
ou os sujeitos que serão estudados (MINAYO, 2006). A partir desse conhecimento, são
elencados critérios para incluir materiais e/ou sujeitos no estudo. Desse modo, quando todos
os elementos que configuram esses critérios estiverem inclusos no corpus de pesquisa, tem-se
o fechamento desse corpus por exaustão (FONTANELLA, RICAS, TURATO, 2008).
Pelo exposto, evidencia-se que o processo de saturação é um intricado entre propósitos
do estudo e redundância ou repetição de um mesmo padrão de significados. Em outros
termos, o momento de se interromper a construção do corpus deriva da rarefação de novas
contribuições ao escopo da pesquisa. Frisar esse aspecto torna-se importante, pois os
processos de significação são dinâmicos e complexos, envolvem muitos elementos e uma
grande variedade de representação. De tal modo que, em virtude dessa complexidade, o
pesquisador deve estar sempre em processo reflexivo sobre quais significados/representações
consubstanciam o estudo, a fim de evitar que a inclusão e/ou exclusão de elementos no corpus
seja realizada de forma acrítica.
6. Procedimentos metodológicos
Considerando-se que a finalidade do artigo é abordar o uso do corpus em pesquisas em
administração, utilizou-se como procedimento metodológico o desk research abrangendo
todas as edições do EnEPQ – Encontro de Ensino e Pesquisa em Administração da ANPAD
(2007-2011). O desk research é utilizado para o processo de seleção de materiais
secundários, provenientes de fontes já existentes, a exemplo de relatórios, informações de
empresas, estatísticas do governo etc. (WESTWOOD, 2005; BERI, 2008). Trata-se, portanto,
de uma pesquisa de dados secundários, de caráter exploratório-descritivo (PIETRANGELO,
2006).
A pesquisa exploratória elegeu como conceito de referência os termos corpus e
corpora, uma vez que trata da prerrogativa temática desse estudo. Foram analisados todos os
artigos apresentados no EnEpq perfazendo um total de 317, dos quais 138 são da edição do
evento ocorrida em 2007, 83 do evento de 2009 e 96 da edição de 2011.
O corpus da pesquisa foi submetido a um processo de qualificação. A primeira etapa
constou em selecionar os artigos que fossem relevantes aos propósitos do estudo (BARTHES,
2006). Para tal, buscaram-se no corpo de todos os textos, a partir do software FileSeek, os
9
conceitos de referência – corpus e corpora. Mediante o critério estabelecido, passaram a
configurar o corpus 6 artigos do EnEPQ 2007, 2 artigos do EnEPQ 2009, e 4 artigos do
EnEPQ 2011. Em seguida, procedeu-se a segunda etapa que consta da pré-análise dos textos a
partir de leituras tipo:
a) Scanning: que se caracterizou pela procura de algum tópico ou assunto, lendo-se o índice,
algumas linhas ou alguns parágrafos do texto, em busca de frases ou palavras-chave;
b) Skimming: que objetivou captar a tendência geral dos textos, sem entrar em minúcias,
usando-se, sobretudo, os títulos e subtítulos nos quais o texto se divide, mas também alguns
parágrafos, a fim de auxiliar a compreensão dos aspectos gerais dos textos (LAKATOS,
MARCONI, 2001).
Essa etapa de pré-análise possibilitou identificar três categorias: (1) artigos utilizando
corpus como etapa da pesquisa (coleta de dados), (2) artigos metateóricos, (3) artigos
utilizando corpus como via de significação do fenômeno estudado, frisando que apenas esta
última categoria se coaduna ao escopo desta pesquisa. Contudo, todas as categorias foram
contempladas na análise.
7. Achados da pesquisa
Aprioristicamente, torna-se necessário esclarecer que este artigo parte de uma moção
que reconhece a crescente demanda pela abordagem qualitativa, visto que a mudança social
acelerada e a diversificação das esferas de vida conduzem os pesquisadores a buscar novas
formas de abordagens, para além de uma visão de pesquisa como verificação e testes de
teorias (FLICK, 2009).
Assim, explorar o conceito e os aspectos relacionados ao uso do corpus nas pesquisas
em administração significa não apenas discutir uma dimensão técnica, uma vez que ele é
imanente à pesquisa qualitativa, significando, portanto, conhecer o como se dá na pesquisa
qualitativa a compreensão dos processos de significação dos indivíduos.
O primeiro achado da pesquisa revela que, dentre os 317 artigos apresentados nas
edições do EnEPQ, apenas 12 utilizam o conceito de corpus, apesar da grande maioria dos
trabalhos se posicionarem deliberadamente qualitativistas.
Destaca-se que muitos dos artigos apresentam na abordagem metodológica a reunião
de materiais linguísticos objetivando a compreensão do processo de significação de uma dada
prática social. Contudo, por não utilizarem o conceito de corpus, fogem do escopo desta
pesquisa.
Assim, após uma leitura aprofundada, observou-se que o corpus é utilizado nos artigos
para configurar três categorias, das quais apenas a última se aproxima à discussão pretendida.
Na primeira, o corpus é mencionado, estritamente, para se referir a uma etapa da pesquisa
(coleta de dados). A segunda apresenta uma abordagem metateórica do corpus, discutindo a
importância de sua construção como critério de validação da pesquisa qualitativa. E, por fim,
a terceira categoria faz o uso do corpus para entender os significados atribuídos à ....
Apesar de apontar para uma abordagem qualitativa, essa primeira acepção de corpus
retoma a ideia do desenvolvimento da pesquisa associada, tradicionalmente, à coleta e
interpretação de informações. A pesquisa emerge a partir de uma formalidade e o corpus
configura uma sequência de momentos ordenados que fornecerá as bases para uma
interpretação despersonalizada da realidade objeto de estudo. O elemento qualitativo aparece
pelo não uso de uma abordagem estatística, contudo, há uma clara tendência em ver o dado
como elemento que contém uma significação per si. Com efeito, nesse modo de compreender
os diversos processos de pesquisa, permanecem resquícios dos pressupostos funcionalistas
que nortearam e, por vezes, ainda norteiam os estudos em administração.
10
Nesse sentido, o corpus foi utilizado, em cinco dos artigos, para apresentar a
compilação de materiais como documentos, relatórios, matérias de revistas. Entretanto, há que
se esclarecerem dois aspectos sob essa primeira abordagem. No primeiro, como aponta
González Rey (2005), a pesquisa qualitativa parte de princípios epistemológicos que
constituem sua diferença essencial quanto à pesquisa quantitativa. Por isso, não há nenhum
sentido em continuar entendendo o dado como um fim em si mesmo, ou uma variável
operacionalmente definida, visto que na pesquisa qualitativa o valor de qualquer elemento não
provê de sua objetividade em abstrato, mas do significado atribuído dentro de uma dada
convenção social. O segundo aspecto trata de não confundir a postura epistemológica da
pesquisa qualitativa com falta de rigor científico, trazendo à baila o pensamento de Bourdieu
(1989, p. 26): “pesquisa é uma coisa demasiado séria e demasiado difícil para se poder tomar
a liberdade de confundir a rigidez, que é o contrário da inteligência e da invenção, com o
rigor”.
Dando continuidade, adentra-se na segunda categoria encontrada que apresenta uma
abordagem metateórica do corpus. Esses artigos discursam acerca das teorias e métodos que
fazem o uso do corpus, apontando-se alguns critérios para atender ao rigor científico nas
pesquisas qualitativas.
Em um desses artigos, o corpus foi abordado dentro de uma discussão acerca dos
aspectos epistemológicos, técnicos e axiológicos. O estudo problematiza a reflexividade do
pesquisador qualitativo e a necessidade deste se assumir enquanto sujeito ético, político e
social. O corpus surge no texto como conjunto de elementos teóricos e empíricos de
significações sob os quais o olhar do pesquisador é essencial para compreender
reflexivamente diversas visões de mundo.
Outro texto utiliza Guba e Lincoln (2005), destacando que a metodologia de pesquisa
não pode ser tratada como um conjunto de regras universalmente aplicáveis. Portanto, não se
pode conceber qualquer aspecto metodológico desvinculado de suas origens e das disciplinas
que emergiram. A discussão gravita em torno da adoção de técnicas complementares de
coleta, dada à complexidade da realidade organizacional. O corpus é abordado a partir da
possibilidade de compor, para posterior análise com triangulação, entrevistas, pesquisa
documental, observação, história oral etc. Contudo, o enfoque do texto estava nos processos
de triangulação, não enfatizando aspectos diretamente relacionados à construção do corpus.
Um terceiro artigo propõe discutir os critérios de validade e confiabilidade nas
pesquisas qualitativas. Descreve seu crescimento no campo da administração, abordando os
aspectos epistemológicos e éticos que circundam essa abordagem. A construção do corpus de
pesquisa é apontada como critério de validade e confiabilidade. Nesse estudo, destaca-se o
corpus como equivalente funcional à amostra representativa e tamanho da amostra em
pesquisas quantitativas. Contudo, essas técnicas são distintas no que se refere ao objetivo de
descobrir variedades de representações, até então desconhecidas pelo pesquisador. Para os
autores do artigo, o tamanho do corpus não é o elemento mais importante para configurar sua
validade, desde que se atinja o ponto de saturação, a partir do momento em que não surjam
mais relatos inusitados e novos discursos ofereçam contribuições significativas para as
análises e conclusões da pesquisa.
Outro artigo tece considerações sobre a necessidade de se ampliar as formas de
investigação nas ciências administrativas, apontando a etnografia da comunicação como uma
opção de se investigar as interações organizacionais. Sobre o corpus, destaca-se que sua
formação, no caso específico da seleção de comunidades de fala, é um critério indissociável
da validade e confiabilidade da pesquisa. Para esse método, é interessante observar que muito
dos diálogos não devem compor o corpus, cabendo ao pesquisador identificar passagens que
realmente contribuam para compreensão do fenômeno a ser interpretado. Na mesma
proporção, nessas pesquisas, a fim de uma construção adequada do corpus, faz-se necessário
11
que os relatos das interações e experiências sejam registrados de forma rica e detalhada, o que
também configura um critério de validade e confiabilidade.
Os três artigos pertencentes à última categoria identificada se referiram ao corpus
como via de significação do fenômeno estudado. Nessa categoria, o corpus, em aspectos
gerais, foi entendido não como um dado a priori, mas como um elemento em construção e
significação durante o processo de pesquisa. Frente a esse sentido, o corpus aparece como
uma seleção de materiais representativos de uma língua que adquire significações no fluxo da
pesquisa. Esses artigos apresentam um recorte epistemológico convergente a Orlandi (2002),
quando apontam que a significação dos fenômenos não se dá por sua chave de interpretação,
não há uma verdade oculta a se descobrir. Há, de fato, um método, a construção de um
dispositivo teórico que conduz o pesquisador na construção interpretativa de um dado
fenômeno.
Com efeito, os artigos priorizam a construção do corpus para a análise do discurso,
entremeando-se a pragmática e as teorias da enunciação. O desenho do corpus é apresentado,
em linhas gerais, a partir da eleição de critérios pertinentes aos objetivos da pesquisa, sendo a
relevância o critério proeminente no delineamento do corpus. Não sendo incomum que os
autores mais citados, por essa categoria, sejam Bauer e Aarts (2008).
Entretanto, cabe destacar que esses autores são citados, sem que se esmiúcem suas
referências quanto à homogeneidade, sincronicidade e relevância. De modo geral, as
constatações acerca do corpus aparecem da seguinte forma: a construção do corpus foi
definida conforme os critérios de Bauer e Aarts (2008). Apenas um artigo cita Barthes (2006),
também para especificar a seleção de materiais por relevância, sem demais esclarecimentos
sobre esse critério.
O emprego de saturação é utilizado em apenas um desses artigos, que promoveu
entrevistas em profundidade, destacando que a saturação ocorreu na sétima entrevista, uma
vez que não foram apresentadas novas versões do tema, entretanto, não são destacados autores
que corroboram essa interpretação.
Os demais artigos, ao elencar pré-critérios para inclusão de sujeitos e materiais na
pesquisa, trabalharam com a concepção de exaustão, visto que todos os elementos que
consubstanciam o corpus foram analisados. Embora caiba frisar que em nenhum momento os
artigos se referem a esse termo.
Percebe-se que, apesar de uma tendência de crescimento nas pesquisas qualitativas, o
conceito de corpus não é amplamente utilizado. Dentre 317 artigos apresentados no EnEPQ,
apenas 12 utilizam essa terminologia. De forma mais crítica, poucos dos artigos que
utilizaram o conceito de corpus fizeram uso de algum critério de construção, saturação ou
exaustão.
Esse resultado, apenas doze artigos utilizando o termo corpus, reduziu, sobremaneira, o
nosso espectro de análise. Contudo, esse resultado reforça a importância deste estudo em
explorar o assunto. Não obstante, o desenho acerca dos critérios de construção se revela
díspar, visto que dois dos artigos não apenas utilizam o conceito de corpus como
discursivisam o corpus como elemento de validade e confiabilidade para pesquisa. Enquanto
que os demais utilizam o termo sem explorá-lo ou embasá-lo teoricamente.
8. Considerações Finais
A dinamicidade e fragmentação das relações sociais pós-modernas impeliram os
pesquisadores a um olhar para além da quantificação e mensuração de dados. O corolário de
uma teoria lógica capaz de desvelar a verdade a partir de procedimentos precisos distancia-se
cada vez mais da concepção atual de ciência.
12
Há, de fato, uma moção em perceber a verdade como uma rede construída de
significações. Portanto, a ideia de uma verdade suturada nos dados cai por terra, uma vez que
essas verdades deslizam nos significados atribuídos nas práticas sociais dos indivíduos.
Contudo, transpor a tradição positivista nos estudos sociais ainda não é tarefa das mais
fáceis, principalmente, se considerarmos que do lado de lá da fronteira positivista habitam
diversas concepções paradigmáticas que ainda estão se consolidando, sobretudo, no que se
refere aos métodos e procedimentos.
Portanto, é necessário reconhecer que a visão qualitativista de pesquisa ainda tem um
longo caminho a percorrer, principalmente, nas discussões acerca do seu delineamento,
implantação e critérios de validação e confiabilidade.
Nesse intento, o presente artigo tencionou levantar uma centelha no debate sobre
conceitos e critérios na construção de corpus, tendo em vista a importância de se
compreenderem as manifestações materiais, verbais e/ou semiológicas, foco dessas pesquisas.
Entretanto, explorar esse tema é, por demais, complexo, na medida em que, durante a
construção do próprio corpus deste artigo, encontramos dificuldades na composição de
autores e estudos que exploram a temática, apesar de sua eminente importância para as
abordagens qualitativas.
Igualmente, essa tendência se apresentou nas pesquisas em administração, tendo em
vista o ínfimo número de artigos publicados no EnEPQ que utilizam o conceito de corpus.
Contudo, tem-se como ponto mais crítico o fato de grande parte dessas pesquisas utilizarem
procedimentos estruturados, como os exemplificados neste estudo.
Pelo exposto, identifica-se a utilização de corpus nas pesquisas em administração,
ainda, como um terreno a se edificar pelo que se indica a importância desse estudo.
Evidentemente, deixamos claro que, em face de suas limitações, este artigo não explora nem
esgota todas as facetas no uso do corpus, deixando-se o convite para novas abordagens e
interpretações.
9. Referências
AARTS, J. Intuition-based and observation-based grammars. In: AIJMER, K.;
ALTENBERG, B. (org.). English Corpus Linguistics: Studies in honour of Jan Svartvik.
Longman, Harlow, 1991.
BARTHES, R. Elementos de Simiologia. 16. ed. São Paulo: Cultrix, 2006.
BAUER, M. W.; AARTS, B. A construção do corpus: um princípio para a coleta de dados
qualitativos. In: BAUER, Martin W.; GASKELL, George (Orgs). Pesquisa qualitativa com
texto, imagem e som: um manual prático. 7. ed. Petrópolis: Vozes, 2008. p. 39-63.
BERBER SARDINHA, T. Linguística de Corpus. Barueri (SP): Manole, 2004.
BERI, G.G. Marketing research. 5. ed. New York: Mcgraw-Hill, 2008.
BERTERO, C. O., CALDAS, M. P., WOOD JR. T. Produção científica em administração
de empresas: provocações, insinuações e contribuições para um debate local. In Revista de
Administração de Empresas, v.3, n.1, jan./abril 1999.
BIBER, D. Using register-diversified corpora for general language studies. 1993.
Disponível em <http://acl.ldc.upenn.edu/J/J93/J93-2001.pdf> Acesso em: 28 de Out de 2012.
______.; CONRAD, S., REPPEN, R. Corpus Linguistics: investigating language structure
and use. Cambridge: Cambridge University Press,1998.
BOGDAN, R.C.; BIKLEN, S.K. Qualitative research for education: an introduction to
theory and methods. Boston: Allyn and Bacon, 1982
BOURDIEU, P. O poder simbólico. Rio de Janeiro: Bertrand Brasil, 1989.
BOWKER, L.; PEARSON, J. Working with specialized language – a practical guide to
using corpora. London/New York: Routledge, 2003.
13
BUFFA, E.S. Research in operations management. Journal of Operations Management, 1
(1), p. 1-7, 1980.
BURREL; G.; MORGAN, G. Sociological paradigms and organizational analysis.
Heineman, London, l979.
CHARAUDEAU, P. Grammaire du sens et de l’expression. Paris: Hachette, 1992.
CHASE, R.B. A classification and evaluation of research in operations management. Journal
of Operations Management, 1 (1), p. 9-14, 1980.
DENZIN, N.: “The art and politics of interpretation”. In DENZIN, N.; LINCOLN, Y, (Eds.),
Handbook of qualitative research. Califórnia: Sage,1994.
DENZIN, N. K.; LINCOLN, Y. S. (org). O planejamento da pesquisa qualitativa: teorias e
abordagens. Porto Alegre: Artmed, 2006.
FAIRCLOUGH, N. Discurso e mudança social. Brasília: Universidade de Brasília, 2001.
FLICK, U. Uma introdução à pesquisa qualitativa. 3. ed. Porto Alegre: Bookman, 2009.
FONTANELLA B. J. B.; RICAS J.; TURATO E. R. Amostragem por saturação em pesquisas
qualitativas em saúde: contribuições teóricas. Cad. Saúde Pública, v. 24, n. 1, p. 17-27,
2008.
GAY, L; DIEHL, P. Research methods for business and management. New York:
Maxwell Macmilan, 1992.
GEWANDSZNAJDER, F. O que é o método científico? São Paulo: Pioneira, 1989.
GLASER, B, STRAUSS, A. The discovery of grounded theory: strategies for qualitative
research. New York: Aldine de Gruyter, 1967.
GODOY, A. Introdução à pesquisa qualitativa e suas possibilidades. Revista de
Administração de Empresas - RAE, v.35, n.2, mar./abr., 1995, p.57-63.
GONZÁLEZ REY, F. Pesquisa qualitativa e subjetividade: os processos de construção da
informação. São Paulo: Pioneira Thomson Learning, 2005.
GUBA, E. G.; LINCOLN, Y. S. Paradigmatic controversies, contradictions, and emerging
confluences. In: DENZIN, Norman K.; LINCOLN, Yvonna S. (Eds.) The Sage Handbook
of Qualitative Research: Third Edition. London: Sage, 2005
HALLIDAY, M. A. K. Corpus Studies and probabilistic grammar. In: AIJMER, K;
ALTERNBERG, B. (eds). English corpus linguistic. London: Longman, 1991.
______. Quantitative studies and probabilities in grammar. In: HOEY, M (ed.), Data,
description, discourse. New York: Harper Collins, 1993.
______. Some lexicogrammatical features of the Zero Population Growth Text. In: MANN,
W. C.; THOMPSON, S. A. (eds.). Discourse Description: Diverse linguistic analyses of a
fund-raising tex. Amsterdan: John Benjamim, 1992.
JAPIASSÚ, H. Introdução às Ciências Humanas: análises de epistemologia histórica. São
Paulo: Letras & Letras, 1994.
KOCH, I. G. Villaça. A Coesão Textual. São Paulo: Contexto, 1989.
KUHN, T. S. A estrutura das revoluções científicas. São Paulo: Perspectiva, 2009.
MAFFESOLI, M. A Ruína do Presente e a Invenção do Futuro. Revista do GEEMPA. Porto
Alegre: GEEMPA, n. 3, p. 09-21,mar. 1994.
MAYAN M. An introduction to qualitative methods: a training module for students and
professionals. Alberta, Canadá: International Institute for Qualitative Methodology, 2001.
MCENERY, T.; WILSON, A. Corpus Linguistics. Edinburgh: Edinburgh University Press,
1996.
MINAYO, M. C. S. O desafio do conhecimento: pesquisa qualitativa em saúde. São Paulo:
Hucitec, 2006.
ORLANDI, E. Análise de discurso: princípios e procedimentos. Campinas: Pontes, 2002.
PEARSON, J.Terms in Context. Amsterdam & Philadelphia: John Benjamins Pub. Co,1998.
14
PIETRANGELO, M. Tipos de pesquisa. In: MALHOTRA, N. K. Pesquisa de marketing:
uma orientação aplicada. 4. ed. Porto Alegre: Bookman, 2006.
SANTOS, B. S. S. A crítica da razão indolente: contra o desperdício da experiência. São
Paulo: Cortez, 2000.
SEIDMAN, I. Interviewing as qualitative research: a guide for researchers in education and
the social sciences. 2. ed. New York: Teachers College Press, 1998.
SINCLAIR, J. Corpus, concordance, collocation. Oxford: Oxford University Press, 1991.
STRAUSS, A., CORBIN, J. Basics of qualitative research: techniques and procedures for
developing grounded theory. London: SAGE Publications; 1998.
TOGNINI-BONELLI, E. Corpus linguistics at work. Amsterdam/Philadelphia: John
Benjamins, 2001.
VIEIRA, M. M. F.; ZOUAIN, D. M. (orgs.). Pesquisa Qualitativa em Administração. 2. ed.
Rio de Janeiro: FGV, 2006.
WESTWOOD, J. The marketing plan workbook (the sunday times business enterprise
guide series). New York: Kogan Page, May 31, 2005.
15
Download

Mas o que é mesmo Corpus? – Alguns Apontamentos