PROPOSTA DE ELABORAÇÃO DE METODOLOGIA PARA
CONSTRUÇÃO DE INSTRUMENTO DE RECUPERAÇÃO DA
INFORMAÇÃO, A PARTIR DA LINGUAGEM COTIDIANA, EM
PLATAFORMAS INTERATIVAS. (*)
Jaqueline Birulio Peres1, Luciana Gracioso2
1
Graduanda, bolsista CNPq, UFSCar, São Carlos, SP
2
Doutora, UFSCar, São Carlos, SP
Resumo
Os estudos sobre as linguagens de representação da informação sempre foram o
foco da biblioteconomia e da ciência da informação. No ambiente interativo da rede
muitos desafios sobre esse cenário tem surgido. E para dar conta desse novo
contexto a área tem procurado compreender uma demanda urgente de construção e
organização social dos conteúdos virtuais. O presente trabalho se propõe a delimitar
alguns procedimentos metodológicos para construção de linguagens híbridas para
intermediação da informação. Selecionamos a Coordenadoria de Comunicação
Social e o sistema desenvolvido por ela, o SACI – Sistema de Apoio de
Comunicação Integrada - para análise do contexto de aplicação da metodologia a
ser proposta, por ter características de um sistema interativo. Neste sistema
selecionamos os clippings como produto informacional para análise das condições
sobre a proposta de uma linguagem de indexação aberta. A proposta metodológica
em questão foi sugerida utilizando como parâmetro de aproximação e contradição as
regras de metodologia para construção de vocabulário controlado e a norma ANSI/
NISO Z39.19-2005, depois de árduo exercício de estruturação.
Palavras-Chave: Linguagem cotidiana; Folksonomia; Plataformas interativas; Recuperação
de informação; Linguagem de indexação aberta.
Abstract
Studies on the languages of representation of information has always been the focus
of library and information science. In the interactive environment of the network many
challenges on this situation has arisen. And to realize this new context, the area has
sought to understand an urgent demand for construction and social organization of
virtual content. The present study is to delineate some methodological procedures for
the construction of hybrid languages for intermediation information. We selected the
Coordination of Social Communication and the system developed by it, the SACI Support System for Integrated Communications - to analyze the context of
application of the methodology to be proposed, because it features an interactive
system. In this system we selected clippings and information product for analysis of
the conditions on the proposal for an indexing language open. The methodology in
question was suggested using as parameter approach and contradicts the rules of
methodology for construction of controlled vocabulary and ANSI / NISO Z39.19-2005,
after strenuous exercise in structure.
Keywords: Daily language; Folksonomy; Interactive platforms; Information retrieval;
Language of indexation open.
1 Introdução
A discussão sobre as questões de organização e recuperação da informação
sempre foram preocupação da Ciência da informação. Ainda mais hoje, quando
encontramos a grande maioria das informações em espaços virtuais que podem ser
editadas e formuladas pelos seus próprios usuários. Por isso é que nos
preocupamos em analisar como deveriam ser os instrumentos de representação da
informação nesse ambiente virtual e interativo e acreditamos que incluir a linguagem
natural (ou cotidiana) nesse instrumento seria de fundamental importância para
ampliar sua eficácia na recuperação da informação neste espaço. Assim temos
como objetivo geral, relacionar alguns parâmetros metodológicos para elaboração de
vocabulário controlado, que contemple a linguagem natural (cotidiana), para fins de
recuperação precisa de informação em plataformas interativas da web. Procuramos
identificar na literatura, metodologias vigentes sobre a representação da linguagem
cotidiana em instrumentos de organização e recuperação da informação; delimitando
etapas metodológicas para elaboração de instrumentos de recuperação da
informação; escolhendo a plataforma e apresentando resultados parciais de
recuperação da informação.
2 Revisão de Literatura
Diante do objetivo desta pesquisa, vimos a necessidade inicial de um
delineamento básico em relação às discussões sobre a linguagem na ciência da
informação, diferenciando especialmente a linguagem documentária da linguagem
natural até chegarmos às atuais folksonomias. Isto para pensarmos em uma
proposta de aproximação das condições de estrutura da linguagem para
representação e recuperação em ambientes interativos de comunicação e uso da
informação. O uso da linguagem natural, enquanto linguagem de busca do usuário,
e que chamaremos de linguagem cotidiana, como ponto de partida de todo o
processo de produção, organização e recuperação da informação nos parece claro,
principalmente se pensarmos em espaços virtuais da informação, onde as ações do
sujeito (usuário), e não o documento e até mesmo o seu conteúdo, torna-se o foco
principal da ciência da informação. “Hoje, percebem-se sintomas de uma incipiente
mudança nos critérios de relevância: da ênfase nos sistemas e nas leituras
estruturais à ênfase nos atores sociais e suas ações de comunicação/informação,
colocando-se em um novo escopo a questão da significação” (GOMES, 1993,
p.221).
Outros autores e estudos da ciência da informação também indicam essa
mudança no ponto de partida para os estudos de representação e recuperação da
informação e os analisaremos ao longo do trabalho.
E isto, irá demandar várias aberturas teóricas e metodológicas para a área,
assim como Gonzalez de Gomez que diz que “na busca de novos pontos de partida,
a área dos estudos da organização e da representação do conhecimento –
acreditamos
–
deverá
passar
pela
reconstrução
de
algumas
premissas
epistemológicas – subjacentes às mudanças de locus do conhecimento/informação
nas modernas formações sociais.” e nós seguiremos nessa pesquisa, com esse
exercício.
A principal abordagem teórica, conceitual e metodológica a qual nos
apoiaremos para discutir o contexto informacional na sua configuração de uso, é a
pragmática. Outras abordagens sobre o entendimento da linguagem e da
representação
são
utilizadas
em
diferentes
domínios
de
organização
do
conhecimento.
Especificamente, dentro desta abordagem, situamos e nos norteamos a partir
das concepções do filosofo L. Wittgenstein, especialmente pela perspectiva de seu
livro Investigações Filosóficas (1953). A escolha desta abordagem se deve a
diferentes implicações, mas a principal delas é a defesa, explicação e a
exemplificação apresentada em sua obra, de que a linguagem é o seu uso. Isto é o
que percebemos cada vez mais nas plataformas interativas virtuais – o uso dinâmico
e interativo da linguagem para construir informação e conhecimento que tem sido
representada a partir das folksonomias.
A ciência da informação tem diferentes focos de pesquisa e atuação
relacionada à informação. Um de seus núcleos de pesquisa e ação são as
metodologias de representação e organização do conhecimento aplicadas nos
sistemas de informação para sua recuperação e uso. Os vocabulários controlados
desenvolvidos por esta área são subsidiados por um conjunto de normas e diretrizes
que os tornam precisos quando aplicados em domínios ou comunidades discursivas
especificas do conhecimento. Contudo, o nosso trabalho esta voltado a observar os
espaços abertos e interativos da informação onde esta especificação da informação
não é dominante. Diante disto, pensamos em flexibilizar alguns dos critérios
seguidos na construção dos vocabulários controlados abrindo-os para algumas
concepções teóricas e práticas sugeridos na abordagem pragmática da linguagem e
da informação.
A nova web interativa, reconhecida como web 2.0, mostra uma nova forma de
representar, organizar e recuperar informação, quebrando um paradigma antigo da
biblioteconomia na medida em que o bibliotecário não é mais essencialmente o filtro
da informação. Agora não são somente os bibliotecários que descrevem, indexam e
categorizam os documentos, e sim todos os usuários. E a folksonomia, enquanto
“indexação social” (GUEDES, 2010) é a conexão entre a tecnologia e o clássico, a
partir da possibilidade dos usuários taggearem (etiquetar) o conteúdo dos
documentos com livre poder de organização e uso.
Ao invés de utilizar uma forma hierárquica e centralizada de
categorização de alguma coisa, o usuário escolhe palavras-chaves
(conhecidas como tags) para classificar a informação ou partes de
informação. Tag em inglês significa ―etiqueta, ―identificação.
―Taggear é identificar, etiquetar alguma coisa. (NASCIMENTO,
2008, p. 33).
A web 2.0, é conceitualmente uma plataforma interativa que pode ser editada
por seus usuários, envolvendo wikis, baseadas em tecnologias da informação,
folksonomia e redes sociais. A idéia principal e inicial é de que os usuários possam
interagir, editando e criando melhores formas de uso e personalização da web,
aproveitando a inteligência coletiva. Podemos dizer que o mais marcante na web 2.0
é o poder de personificação das ferramentas usadas e a 'customização' que é sua
principal marca.
Com estas novas tecnologias, a informação se torna “bottom-up” (de baixo
para cima), onde os usuários se tornam escritores, onde os consumidores produzem
a informação que será registrada e recuperada na rede.
3 Materiais e Métodos
Como espaço, ou laboratório de observação e atuação, estudamos o
ambiente CCS (Coordenação de Comunicação Social) da UFSCar, principalmente
pela sua natureza interativa na construção de seus conteúdo, pela mistura entre
conhecimentos científicos e sociais que lida, organiza e disponibiliza em um mesmo
espaço. Especificamente analisamos o contexto de produção, organização e
disponibilização dos clippings e a linguagem utilizada para sua indexação e busca.
A coordenadoria de Comunicação Social da UFSCar, mais conhecida como
CCS, tem como princípio de atuação o compromisso com a comunidade, práticas de
ensino, pesquisa e extensão, focando sempre ao acesso indiscriminado ao
conhecimento, o acesso a democracia e a cidadania. A CCS também tem princípios
e orientações para a construção de uma política de informação e comunicação que
visa o apoio à inserção de todos, através da era digital abrangendo todos os níveis
da universidade.
Focamos mais ainda nossa pesquisa no SACI (Sistema de Apoio a
Comunicação Integrada), um software “open source” (livre) que foi desenvolvido
especialmente a Coordenadoria de Comunicação Social da UFSCar para a
organização e controle do fluxo de informações para facilitação de disponibilização
de materiais de diferentes suportes em meio digital. Um software que suporte o fluxo
de informação e comunicação que a UFSCar desenvolve, em seus três campus
integradamente. Sistema eficiente para a gestão eficiente de informação.
SACI é o Sistema de Apoio ao Controle de Informação, um software livre
especialmente editado para o uso de centros de comunicação social de
universidades federais. Entre suas funções, destaca-se o gerenciamento de
informações e disponibilização de notícias e produtos artísticos, científicos e
culturais. Para controle desde a armazenagem, recepção, produção e até a
disseminação otimizada em plataformas digitais. O principal interesse do projeto
SACI é o desenvolvimento de software para a viabilização de dados e notícias de
qualquer lugar, para a UFSCar e a CCS isso é necessário, já que assim podem-se
disponibilizar os acervos para usuários de fora do campus da universidade. Este
software permite que os usuários tenham sua ferramenta de trabalho a disposição
em qualquer lugar, em qualquer momento. O programa também permite uma
interação maior entre o leitor e os usuários que queiram divulgar informações,
oferecendo um acesso dinâmico ao sistema online para solicitações e pesquisas.
No contexto da CCS, analisaremos especificamente os clippings enquanto
produto informacional, passível de representação e organização social.
O clipping está direcionado unicamente a notícias que são retiradas de meios
de comunicação e que expressem qualquer tipo de relação com a universidade e
seus membros da comunidade acadêmica. Os clippings são um tipo de produto
informacional produzido no contexto do jornalismo que podemos associar
diretamente as nossas clássicas práticas de seleção e recortes temáticos de jornais
e revistas, arquivados em Hemerotecas. Hoje os recursos para produzir essas
sistematizações organizadas de notícias é muito influenciada pelo uso das
tecnologias, mas os propósitos da atividade ainda são os mesmos.
A escolha desta plataforma como nosso campo de observação se deve a
alguns motivos em especial: Espaço com configuração sistematizada e colaborativa
que permite aplicar e desenvolver a proposta metodológica apresentada com
possibilidade de configuração de software; a possibilidade de ensaio metodológico
para posterior avanço e desenvolvimento de metodologias para serem testadas em
espaços da internet aberta; espaço em que discurso acadêmico e social são
utilizado com propósitos comuns, sem diferenças hierárquicas; ser desenvolvido
dentro da Coordenadoria de Comunicação Social da UFSCar, em software livre e
gerenciado pelo sistema SACI (Sistema de Apoio a Comunicação Integrada); pelo
feito de que a Coordenadoria de Comunicação Social, seus produtos e serviços, se
estabelecerem e desenvolverem a partir de princípios abertos, deliberativos e
colaborativos na sua configuração de software – software livre - configurando-se
como um espaço hibrido no que se refere a sistematização e a abertura das
plataformas de gerenciamento de informação; considerar a linguagem de busca por
informações, tanto acadêmica como social.
Cabe ressaltar que, embora já tenham sido feitas muitas iniciativas de
tratamento, ou sistematização, ou ainda, compreensão das folksonomias e do
comportamento das tags como recursos de recuperação da informação em
ambientes abertos e virtuais da informação, não se diagnosticou nenhuma
construção metodológica aplicada a este ambiente Web. Pelo menos não de modo
relacionado às metodologias vigentes de construção de vocabulário controlado
desenvolvidos pela Biblioteconomia e Ciência da informação. Acreditando que esta
aproximação possa ser um caminho a ser percorrido, analisado, aplicado e avaliado,
seguimos apresentando e aproximando às metodologias de construção de
vocabulário controlado, as possibilidades de representação permitidas pelas
folksonomias.
As linhas gerais de construção e formatação de vocabulários controlados são
apresentadas pela organização norteamericana National Information Standards
Organization (ANSI, 2005). Mais especificamente sobre as regras de produção
desses vocabulários (onde se incluem os tesauros, as taxonomias, as listas de
sinônimos) a norma estabelece padrões para estabelecimento de associação,
equivalência e hierarquia no vocabulário. Recentemente, esta mesma norma ANSI/NISO Z39.19-2005 incluiu em seu escopo metodológico a as especificidades
propostas pelo Classification Research Group – CRG e a análise facetada proposta
por Ranganathan (1967) mais voltadas para os tesauros. Elementos de
interoperabilidade entre linguagens também começam a se delimitar.
Mas o que nos interessa nesta pesquisa é o conjunto de tratamentos
sugeridos ao termo no processo de construção do vocabulário controlado. No
entanto, são nos trabalhos desenvolvidos e apresentados no site de Biblioteconomia,
Informação e Tecnologia da informação - BITI (CAMPOS, GOMES, MOTTA, 2004)
que encontramos mais claramente os elementos que analisaremos. A análise desses
padrões e normas tem sido feita em diferentes contextos de estudo.
Em síntese, um vocabulário controlado, tem os seguintes elementos:
Delimitação de campo de assunto, levantamento de descritores sobre o assunto,
categorização dos descritores, estabelecimento de relações entre descritores em
cada categoria – relação de equivalência, hierárquica e associativa e notas de
escopo (descrição dobre os descritores).
Considerando a existência de espaços híbridos de controle e abertura de
produção e uso da informação, como é o caso das plataformas interativas (Web
pragmática), a proposta de uma linguagem hibrida (controlada e não controlada)
parece necessária. Considerando o caso da Coordenadoria de Comunicação Social
da UFSCar, de seus produtos informacionais e de seu público alvo esse hibridismo
precisa estar presente em qualquer linguagem que se proponha a representar e
recuperar as informações que produzem.
4 Resultados Parciais/Finais
Como resultados iniciais da pesquisa que apresentamos podemos
apresentar uma sistematização comparativa entre as características do vocabulário
controlado e as folksonomias para discutirmos oportunamente o desenvolvimento de
uma linguagem híbrida para representação da informação.
No planejamento para a linguagem controlada, primeiramente delimitamos a
área do assunto que deve ser representado, seguido da definição do público alvo e
os procedimentos de manutenção. Na folksonomia, o planejamento segue um maior
número de passos; primeiro há a delimitação da área de assunto a priori, não tendo
um público alvo explícito para se ater e sua manutenção é feita de forma
concomitante ao seu uso.
Para o levantamento de vocabulário temos a seleção dos termos
representativos e definidos pela natureza do assunto na linguagem controlada. Na
linguagem cotidiana selecionamos os termos representativos, os vinculando
exclusivamente ao conteúdo do documento, pois a representatividade dos termos
está atrelada ao usuário e criador da folksonomia, sendo que a definição não é feita
de modo unívoco, e um mesmo conceito pode ter várias descrições e significados
relacionados.
Para a organização dos conceitos, a folksonomia unifica seus termos de
acordo com o uso na marcação do conteúdo, enquanto no vocabulário controlado o
agrupamento é feito em categorias ou facetas por termos de uma mesma natureza.
A sua apresentação final nos vocabulários controlados são feitas por
listagens alfabéticas e visualizações gráficas, podendo ser avaliados pelos seus
índices de precisão e revocação. Na folksonomia, a apresentação final é por meio de
nuvens de tags destacadas graficamente a partir da quantidade de uso, sendo
avaliadas pelo índice de uso.
Outra análise é a comparação das metodologias de construção de
vocabulários controlados definidos pela Norma Americana ANSI/NISO Z39.19-2005
e das folksonomia.
Na metodologia para construção de vocabulário controlado, o descritor é
incluído em um vocabulário controlado que representa um conceito único (ou
unidade de ideia). Um conceito pode ser expresso por termos de uma única palavra
ou por um termo com múltiplas palavras. O escopo dos descritores é restringido para
selecionados significados em um domínio do vocabulário controlado. Cada descritor
pode ser formulado em tal modo que convir o escopo intencionado para cada
usuário do vocabulário controlado. Já na folksonomia, o descritor não representa um
conceito único. Sua descrição e associação com os conteúdos que irá representar
são estabelecidas na ação de seu uso como descritor. A indicação da relação entre
descritores (tags) e conteúdo será estabelecida a partir do significado dado ao
descritor, pelo usuário-indexador.
Na folksonomia, não há nota de escopo. O significado do conceito (tag)
indicado para a indexação não é fixo, seu significado do conceito utilizado no
taggeamento é variável ao entendimento de cada taggeador.
Já a nota de escopo do vocabulário controlado são usados para restringir ou
expandir a aplicação de um descritor, para distinguir entre descritores que têm
significados sobrepostos na linguagem natural, ou para prover conselho no uso de
outro termo para o indexador e o pesquisador. Uma nota de escopo deve situar o
significado escolhido de um descritor; ele pode também indicar outros significados
que são reconhecidos em linguagem natural, mas que foram deliberadamente
excluídos do vocabulário controlado. Uma nota de escopo não é uma parte de um
descritor. Uma nota de escopo pode ser fornecida para cada descritor.
Os tipos de relacionamentos encontrados na linguagem controlada são as
equivalências, a hierarquia e os termos associativos. Entretanto, na folksonomia não
é previsto uma sistematização entre conceitos. A indicação de termos preferidos são
estabelecidas a partir da predominância do uso na indexação (taggeamento).
5 Considerações Parciais/Finais
Diante do que até então foi analisado, sintetizamos um conjunto inicial de
procedimentos para sistematizar uma linguagem híbrida de representação da
informação.
Ao final vislumbra-se aplicar os procedimentos propostos, avaliando-os e na
medida do possível, propondo sua aplicabilidade em outros espaços híbridos de
informação na rede.
6 Referências
AMARAL, A.; AQUINO, M. C. Práticas de Folksonomia e Social Tagging no Last.Fm.
Florence, Italy. Apr. 2008.
DEODATO, M.; BOTELHO, R. Coordenadoria de comunicação social. São Carlos, 2004.
Disponível em: < http://www.comunicacao.ufscar.br/>. Acesso em: fev. 2010.
GONZÁLEZ DE GOMEZ, M. N. Da representação do conhecimento ao conhecimento da
representação. Ciência da Informação, Brasília: IBICT, v. 22, n. 3, p. 217-222, 1993.
GONZÁLEZ DE GOMEZ, M. N. Novas fronteiras tecnológicas das ações de informação:
questões e abordagens. Ciência da Informação, Brasília: IBICT, v. 33, n. 1, p. 55-67, 2004.
GUEDES, R. de M.; DIAS, E. J. W. Indexação social: abordagem conceitual. ACB,
Florianópolis, v. 15, n. 1, p. 39-53, 2010.
HJORLAND, B. Concept Theory. Wiley InterScience, América, p. 1-18, 2009.
LOPES, I. L. Uso das linguagens controlada e natural em bases de dados: revisão da
literatura. Ci. Inf, Brasília, vol.31, n.1, p. 41-52, 2002.
MAIA, C.; BASSOLINI, M.; BETOLNI, N. Análise da coordenadoria de comunicação
social da UFSCar, campus São Carlos: proposta de melhoria no processo de
comunicação com base nas teorias de gestão do conhecimento e melhoria de
processos. São Carlos, 2008.
NASCIMENTO, G. F. C. de L. Folksonomia como estratégia de indexação dos
bibliotecários no Del.icio.us. João Pessoa: PPGCI, 2008.
NOVELINO, M. S. F. Instrumentos e metodologias de representação da informação.
Informação & Informação, Londrina, v. 1, n. 2, p. 37-45, 1996.
VALE, E. A do. Linguagens de indexação. In: (Coord) SMIT, J. W. Análise documentária:
analise da síntese. 2 ed. Brasília: IBICT, p.13-28, 1989.
WITTGENSTEIN, L. Investigações filosóficas. São Paulo: Nova Cultural, 1989. (Os
Pensadores).
(*) – Este estudo é parte integrante do projeto de pesquisa “Proposta para identificação e
aplicação de parâmetros teóricos e metodológicos na elaboração de instrumentos
pragmáticos de representação e organização do conhecimento”, financiado pelo CNPq,
desenvolvido pela Dra. Luciana de S. Gracioso e do projeto de pesquisa de iniciação
científica: “Proposta de elaboração de metodologia para construção de instrumento de
recuperação da informação, a partir da linguagem cotidiana, em plataformas interativas
(Web 2.0)”, desenvolvida pela bolsista Jaqueline Birulio Peres, CNPq. Também está atrelado
a esta pesquisa do projeto de extensão coordenado pela Dra. Vera R. C Boccato intitulado:
“Organização e gestão da inovação em processos e produtos informacionais para a
comunicação na UFSCar”, vinculado ao Programa de Extensão coordenado pela Dra.
Cristina C. Ferraz.
Download

proposta de elaboração de metodologia para construção de