PROPOSTA DE ELABORAÇÃO DE METODOLOGIA PARA CONSTRUÇÃO DE INSTRUMENTO DE RECUPERAÇÃO DA INFORMAÇÃO, A PARTIR DA LINGUAGEM COTIDIANA, EM PLATAFORMAS INTERATIVAS. (*) Jaqueline Birulio Peres1, Luciana Gracioso2 1 Graduanda, bolsista CNPq, UFSCar, São Carlos, SP 2 Doutora, UFSCar, São Carlos, SP Resumo Os estudos sobre as linguagens de representação da informação sempre foram o foco da biblioteconomia e da ciência da informação. No ambiente interativo da rede muitos desafios sobre esse cenário tem surgido. E para dar conta desse novo contexto a área tem procurado compreender uma demanda urgente de construção e organização social dos conteúdos virtuais. O presente trabalho se propõe a delimitar alguns procedimentos metodológicos para construção de linguagens híbridas para intermediação da informação. Selecionamos a Coordenadoria de Comunicação Social e o sistema desenvolvido por ela, o SACI – Sistema de Apoio de Comunicação Integrada - para análise do contexto de aplicação da metodologia a ser proposta, por ter características de um sistema interativo. Neste sistema selecionamos os clippings como produto informacional para análise das condições sobre a proposta de uma linguagem de indexação aberta. A proposta metodológica em questão foi sugerida utilizando como parâmetro de aproximação e contradição as regras de metodologia para construção de vocabulário controlado e a norma ANSI/ NISO Z39.19-2005, depois de árduo exercício de estruturação. Palavras-Chave: Linguagem cotidiana; Folksonomia; Plataformas interativas; Recuperação de informação; Linguagem de indexação aberta. Abstract Studies on the languages of representation of information has always been the focus of library and information science. In the interactive environment of the network many challenges on this situation has arisen. And to realize this new context, the area has sought to understand an urgent demand for construction and social organization of virtual content. The present study is to delineate some methodological procedures for the construction of hybrid languages for intermediation information. We selected the Coordination of Social Communication and the system developed by it, the SACI Support System for Integrated Communications - to analyze the context of application of the methodology to be proposed, because it features an interactive system. In this system we selected clippings and information product for analysis of the conditions on the proposal for an indexing language open. The methodology in question was suggested using as parameter approach and contradicts the rules of methodology for construction of controlled vocabulary and ANSI / NISO Z39.19-2005, after strenuous exercise in structure. Keywords: Daily language; Folksonomy; Interactive platforms; Information retrieval; Language of indexation open. 1 Introdução A discussão sobre as questões de organização e recuperação da informação sempre foram preocupação da Ciência da informação. Ainda mais hoje, quando encontramos a grande maioria das informações em espaços virtuais que podem ser editadas e formuladas pelos seus próprios usuários. Por isso é que nos preocupamos em analisar como deveriam ser os instrumentos de representação da informação nesse ambiente virtual e interativo e acreditamos que incluir a linguagem natural (ou cotidiana) nesse instrumento seria de fundamental importância para ampliar sua eficácia na recuperação da informação neste espaço. Assim temos como objetivo geral, relacionar alguns parâmetros metodológicos para elaboração de vocabulário controlado, que contemple a linguagem natural (cotidiana), para fins de recuperação precisa de informação em plataformas interativas da web. Procuramos identificar na literatura, metodologias vigentes sobre a representação da linguagem cotidiana em instrumentos de organização e recuperação da informação; delimitando etapas metodológicas para elaboração de instrumentos de recuperação da informação; escolhendo a plataforma e apresentando resultados parciais de recuperação da informação. 2 Revisão de Literatura Diante do objetivo desta pesquisa, vimos a necessidade inicial de um delineamento básico em relação às discussões sobre a linguagem na ciência da informação, diferenciando especialmente a linguagem documentária da linguagem natural até chegarmos às atuais folksonomias. Isto para pensarmos em uma proposta de aproximação das condições de estrutura da linguagem para representação e recuperação em ambientes interativos de comunicação e uso da informação. O uso da linguagem natural, enquanto linguagem de busca do usuário, e que chamaremos de linguagem cotidiana, como ponto de partida de todo o processo de produção, organização e recuperação da informação nos parece claro, principalmente se pensarmos em espaços virtuais da informação, onde as ações do sujeito (usuário), e não o documento e até mesmo o seu conteúdo, torna-se o foco principal da ciência da informação. “Hoje, percebem-se sintomas de uma incipiente mudança nos critérios de relevância: da ênfase nos sistemas e nas leituras estruturais à ênfase nos atores sociais e suas ações de comunicação/informação, colocando-se em um novo escopo a questão da significação” (GOMES, 1993, p.221). Outros autores e estudos da ciência da informação também indicam essa mudança no ponto de partida para os estudos de representação e recuperação da informação e os analisaremos ao longo do trabalho. E isto, irá demandar várias aberturas teóricas e metodológicas para a área, assim como Gonzalez de Gomez que diz que “na busca de novos pontos de partida, a área dos estudos da organização e da representação do conhecimento – acreditamos – deverá passar pela reconstrução de algumas premissas epistemológicas – subjacentes às mudanças de locus do conhecimento/informação nas modernas formações sociais.” e nós seguiremos nessa pesquisa, com esse exercício. A principal abordagem teórica, conceitual e metodológica a qual nos apoiaremos para discutir o contexto informacional na sua configuração de uso, é a pragmática. Outras abordagens sobre o entendimento da linguagem e da representação são utilizadas em diferentes domínios de organização do conhecimento. Especificamente, dentro desta abordagem, situamos e nos norteamos a partir das concepções do filosofo L. Wittgenstein, especialmente pela perspectiva de seu livro Investigações Filosóficas (1953). A escolha desta abordagem se deve a diferentes implicações, mas a principal delas é a defesa, explicação e a exemplificação apresentada em sua obra, de que a linguagem é o seu uso. Isto é o que percebemos cada vez mais nas plataformas interativas virtuais – o uso dinâmico e interativo da linguagem para construir informação e conhecimento que tem sido representada a partir das folksonomias. A ciência da informação tem diferentes focos de pesquisa e atuação relacionada à informação. Um de seus núcleos de pesquisa e ação são as metodologias de representação e organização do conhecimento aplicadas nos sistemas de informação para sua recuperação e uso. Os vocabulários controlados desenvolvidos por esta área são subsidiados por um conjunto de normas e diretrizes que os tornam precisos quando aplicados em domínios ou comunidades discursivas especificas do conhecimento. Contudo, o nosso trabalho esta voltado a observar os espaços abertos e interativos da informação onde esta especificação da informação não é dominante. Diante disto, pensamos em flexibilizar alguns dos critérios seguidos na construção dos vocabulários controlados abrindo-os para algumas concepções teóricas e práticas sugeridos na abordagem pragmática da linguagem e da informação. A nova web interativa, reconhecida como web 2.0, mostra uma nova forma de representar, organizar e recuperar informação, quebrando um paradigma antigo da biblioteconomia na medida em que o bibliotecário não é mais essencialmente o filtro da informação. Agora não são somente os bibliotecários que descrevem, indexam e categorizam os documentos, e sim todos os usuários. E a folksonomia, enquanto “indexação social” (GUEDES, 2010) é a conexão entre a tecnologia e o clássico, a partir da possibilidade dos usuários taggearem (etiquetar) o conteúdo dos documentos com livre poder de organização e uso. Ao invés de utilizar uma forma hierárquica e centralizada de categorização de alguma coisa, o usuário escolhe palavras-chaves (conhecidas como tags) para classificar a informação ou partes de informação. Tag em inglês significa ―etiqueta, ―identificação. ―Taggear é identificar, etiquetar alguma coisa. (NASCIMENTO, 2008, p. 33). A web 2.0, é conceitualmente uma plataforma interativa que pode ser editada por seus usuários, envolvendo wikis, baseadas em tecnologias da informação, folksonomia e redes sociais. A idéia principal e inicial é de que os usuários possam interagir, editando e criando melhores formas de uso e personalização da web, aproveitando a inteligência coletiva. Podemos dizer que o mais marcante na web 2.0 é o poder de personificação das ferramentas usadas e a 'customização' que é sua principal marca. Com estas novas tecnologias, a informação se torna “bottom-up” (de baixo para cima), onde os usuários se tornam escritores, onde os consumidores produzem a informação que será registrada e recuperada na rede. 3 Materiais e Métodos Como espaço, ou laboratório de observação e atuação, estudamos o ambiente CCS (Coordenação de Comunicação Social) da UFSCar, principalmente pela sua natureza interativa na construção de seus conteúdo, pela mistura entre conhecimentos científicos e sociais que lida, organiza e disponibiliza em um mesmo espaço. Especificamente analisamos o contexto de produção, organização e disponibilização dos clippings e a linguagem utilizada para sua indexação e busca. A coordenadoria de Comunicação Social da UFSCar, mais conhecida como CCS, tem como princípio de atuação o compromisso com a comunidade, práticas de ensino, pesquisa e extensão, focando sempre ao acesso indiscriminado ao conhecimento, o acesso a democracia e a cidadania. A CCS também tem princípios e orientações para a construção de uma política de informação e comunicação que visa o apoio à inserção de todos, através da era digital abrangendo todos os níveis da universidade. Focamos mais ainda nossa pesquisa no SACI (Sistema de Apoio a Comunicação Integrada), um software “open source” (livre) que foi desenvolvido especialmente a Coordenadoria de Comunicação Social da UFSCar para a organização e controle do fluxo de informações para facilitação de disponibilização de materiais de diferentes suportes em meio digital. Um software que suporte o fluxo de informação e comunicação que a UFSCar desenvolve, em seus três campus integradamente. Sistema eficiente para a gestão eficiente de informação. SACI é o Sistema de Apoio ao Controle de Informação, um software livre especialmente editado para o uso de centros de comunicação social de universidades federais. Entre suas funções, destaca-se o gerenciamento de informações e disponibilização de notícias e produtos artísticos, científicos e culturais. Para controle desde a armazenagem, recepção, produção e até a disseminação otimizada em plataformas digitais. O principal interesse do projeto SACI é o desenvolvimento de software para a viabilização de dados e notícias de qualquer lugar, para a UFSCar e a CCS isso é necessário, já que assim podem-se disponibilizar os acervos para usuários de fora do campus da universidade. Este software permite que os usuários tenham sua ferramenta de trabalho a disposição em qualquer lugar, em qualquer momento. O programa também permite uma interação maior entre o leitor e os usuários que queiram divulgar informações, oferecendo um acesso dinâmico ao sistema online para solicitações e pesquisas. No contexto da CCS, analisaremos especificamente os clippings enquanto produto informacional, passível de representação e organização social. O clipping está direcionado unicamente a notícias que são retiradas de meios de comunicação e que expressem qualquer tipo de relação com a universidade e seus membros da comunidade acadêmica. Os clippings são um tipo de produto informacional produzido no contexto do jornalismo que podemos associar diretamente as nossas clássicas práticas de seleção e recortes temáticos de jornais e revistas, arquivados em Hemerotecas. Hoje os recursos para produzir essas sistematizações organizadas de notícias é muito influenciada pelo uso das tecnologias, mas os propósitos da atividade ainda são os mesmos. A escolha desta plataforma como nosso campo de observação se deve a alguns motivos em especial: Espaço com configuração sistematizada e colaborativa que permite aplicar e desenvolver a proposta metodológica apresentada com possibilidade de configuração de software; a possibilidade de ensaio metodológico para posterior avanço e desenvolvimento de metodologias para serem testadas em espaços da internet aberta; espaço em que discurso acadêmico e social são utilizado com propósitos comuns, sem diferenças hierárquicas; ser desenvolvido dentro da Coordenadoria de Comunicação Social da UFSCar, em software livre e gerenciado pelo sistema SACI (Sistema de Apoio a Comunicação Integrada); pelo feito de que a Coordenadoria de Comunicação Social, seus produtos e serviços, se estabelecerem e desenvolverem a partir de princípios abertos, deliberativos e colaborativos na sua configuração de software – software livre - configurando-se como um espaço hibrido no que se refere a sistematização e a abertura das plataformas de gerenciamento de informação; considerar a linguagem de busca por informações, tanto acadêmica como social. Cabe ressaltar que, embora já tenham sido feitas muitas iniciativas de tratamento, ou sistematização, ou ainda, compreensão das folksonomias e do comportamento das tags como recursos de recuperação da informação em ambientes abertos e virtuais da informação, não se diagnosticou nenhuma construção metodológica aplicada a este ambiente Web. Pelo menos não de modo relacionado às metodologias vigentes de construção de vocabulário controlado desenvolvidos pela Biblioteconomia e Ciência da informação. Acreditando que esta aproximação possa ser um caminho a ser percorrido, analisado, aplicado e avaliado, seguimos apresentando e aproximando às metodologias de construção de vocabulário controlado, as possibilidades de representação permitidas pelas folksonomias. As linhas gerais de construção e formatação de vocabulários controlados são apresentadas pela organização norteamericana National Information Standards Organization (ANSI, 2005). Mais especificamente sobre as regras de produção desses vocabulários (onde se incluem os tesauros, as taxonomias, as listas de sinônimos) a norma estabelece padrões para estabelecimento de associação, equivalência e hierarquia no vocabulário. Recentemente, esta mesma norma ANSI/NISO Z39.19-2005 incluiu em seu escopo metodológico a as especificidades propostas pelo Classification Research Group – CRG e a análise facetada proposta por Ranganathan (1967) mais voltadas para os tesauros. Elementos de interoperabilidade entre linguagens também começam a se delimitar. Mas o que nos interessa nesta pesquisa é o conjunto de tratamentos sugeridos ao termo no processo de construção do vocabulário controlado. No entanto, são nos trabalhos desenvolvidos e apresentados no site de Biblioteconomia, Informação e Tecnologia da informação - BITI (CAMPOS, GOMES, MOTTA, 2004) que encontramos mais claramente os elementos que analisaremos. A análise desses padrões e normas tem sido feita em diferentes contextos de estudo. Em síntese, um vocabulário controlado, tem os seguintes elementos: Delimitação de campo de assunto, levantamento de descritores sobre o assunto, categorização dos descritores, estabelecimento de relações entre descritores em cada categoria – relação de equivalência, hierárquica e associativa e notas de escopo (descrição dobre os descritores). Considerando a existência de espaços híbridos de controle e abertura de produção e uso da informação, como é o caso das plataformas interativas (Web pragmática), a proposta de uma linguagem hibrida (controlada e não controlada) parece necessária. Considerando o caso da Coordenadoria de Comunicação Social da UFSCar, de seus produtos informacionais e de seu público alvo esse hibridismo precisa estar presente em qualquer linguagem que se proponha a representar e recuperar as informações que produzem. 4 Resultados Parciais/Finais Como resultados iniciais da pesquisa que apresentamos podemos apresentar uma sistematização comparativa entre as características do vocabulário controlado e as folksonomias para discutirmos oportunamente o desenvolvimento de uma linguagem híbrida para representação da informação. No planejamento para a linguagem controlada, primeiramente delimitamos a área do assunto que deve ser representado, seguido da definição do público alvo e os procedimentos de manutenção. Na folksonomia, o planejamento segue um maior número de passos; primeiro há a delimitação da área de assunto a priori, não tendo um público alvo explícito para se ater e sua manutenção é feita de forma concomitante ao seu uso. Para o levantamento de vocabulário temos a seleção dos termos representativos e definidos pela natureza do assunto na linguagem controlada. Na linguagem cotidiana selecionamos os termos representativos, os vinculando exclusivamente ao conteúdo do documento, pois a representatividade dos termos está atrelada ao usuário e criador da folksonomia, sendo que a definição não é feita de modo unívoco, e um mesmo conceito pode ter várias descrições e significados relacionados. Para a organização dos conceitos, a folksonomia unifica seus termos de acordo com o uso na marcação do conteúdo, enquanto no vocabulário controlado o agrupamento é feito em categorias ou facetas por termos de uma mesma natureza. A sua apresentação final nos vocabulários controlados são feitas por listagens alfabéticas e visualizações gráficas, podendo ser avaliados pelos seus índices de precisão e revocação. Na folksonomia, a apresentação final é por meio de nuvens de tags destacadas graficamente a partir da quantidade de uso, sendo avaliadas pelo índice de uso. Outra análise é a comparação das metodologias de construção de vocabulários controlados definidos pela Norma Americana ANSI/NISO Z39.19-2005 e das folksonomia. Na metodologia para construção de vocabulário controlado, o descritor é incluído em um vocabulário controlado que representa um conceito único (ou unidade de ideia). Um conceito pode ser expresso por termos de uma única palavra ou por um termo com múltiplas palavras. O escopo dos descritores é restringido para selecionados significados em um domínio do vocabulário controlado. Cada descritor pode ser formulado em tal modo que convir o escopo intencionado para cada usuário do vocabulário controlado. Já na folksonomia, o descritor não representa um conceito único. Sua descrição e associação com os conteúdos que irá representar são estabelecidas na ação de seu uso como descritor. A indicação da relação entre descritores (tags) e conteúdo será estabelecida a partir do significado dado ao descritor, pelo usuário-indexador. Na folksonomia, não há nota de escopo. O significado do conceito (tag) indicado para a indexação não é fixo, seu significado do conceito utilizado no taggeamento é variável ao entendimento de cada taggeador. Já a nota de escopo do vocabulário controlado são usados para restringir ou expandir a aplicação de um descritor, para distinguir entre descritores que têm significados sobrepostos na linguagem natural, ou para prover conselho no uso de outro termo para o indexador e o pesquisador. Uma nota de escopo deve situar o significado escolhido de um descritor; ele pode também indicar outros significados que são reconhecidos em linguagem natural, mas que foram deliberadamente excluídos do vocabulário controlado. Uma nota de escopo não é uma parte de um descritor. Uma nota de escopo pode ser fornecida para cada descritor. Os tipos de relacionamentos encontrados na linguagem controlada são as equivalências, a hierarquia e os termos associativos. Entretanto, na folksonomia não é previsto uma sistematização entre conceitos. A indicação de termos preferidos são estabelecidas a partir da predominância do uso na indexação (taggeamento). 5 Considerações Parciais/Finais Diante do que até então foi analisado, sintetizamos um conjunto inicial de procedimentos para sistematizar uma linguagem híbrida de representação da informação. Ao final vislumbra-se aplicar os procedimentos propostos, avaliando-os e na medida do possível, propondo sua aplicabilidade em outros espaços híbridos de informação na rede. 6 Referências AMARAL, A.; AQUINO, M. C. Práticas de Folksonomia e Social Tagging no Last.Fm. Florence, Italy. Apr. 2008. DEODATO, M.; BOTELHO, R. Coordenadoria de comunicação social. São Carlos, 2004. Disponível em: < http://www.comunicacao.ufscar.br/>. Acesso em: fev. 2010. GONZÁLEZ DE GOMEZ, M. N. Da representação do conhecimento ao conhecimento da representação. Ciência da Informação, Brasília: IBICT, v. 22, n. 3, p. 217-222, 1993. GONZÁLEZ DE GOMEZ, M. N. Novas fronteiras tecnológicas das ações de informação: questões e abordagens. Ciência da Informação, Brasília: IBICT, v. 33, n. 1, p. 55-67, 2004. GUEDES, R. de M.; DIAS, E. J. W. Indexação social: abordagem conceitual. ACB, Florianópolis, v. 15, n. 1, p. 39-53, 2010. HJORLAND, B. Concept Theory. Wiley InterScience, América, p. 1-18, 2009. LOPES, I. L. Uso das linguagens controlada e natural em bases de dados: revisão da literatura. Ci. Inf, Brasília, vol.31, n.1, p. 41-52, 2002. MAIA, C.; BASSOLINI, M.; BETOLNI, N. Análise da coordenadoria de comunicação social da UFSCar, campus São Carlos: proposta de melhoria no processo de comunicação com base nas teorias de gestão do conhecimento e melhoria de processos. São Carlos, 2008. NASCIMENTO, G. F. C. de L. Folksonomia como estratégia de indexação dos bibliotecários no Del.icio.us. João Pessoa: PPGCI, 2008. NOVELINO, M. S. F. Instrumentos e metodologias de representação da informação. Informação & Informação, Londrina, v. 1, n. 2, p. 37-45, 1996. VALE, E. A do. Linguagens de indexação. In: (Coord) SMIT, J. W. Análise documentária: analise da síntese. 2 ed. Brasília: IBICT, p.13-28, 1989. WITTGENSTEIN, L. Investigações filosóficas. São Paulo: Nova Cultural, 1989. (Os Pensadores). (*) – Este estudo é parte integrante do projeto de pesquisa “Proposta para identificação e aplicação de parâmetros teóricos e metodológicos na elaboração de instrumentos pragmáticos de representação e organização do conhecimento”, financiado pelo CNPq, desenvolvido pela Dra. Luciana de S. Gracioso e do projeto de pesquisa de iniciação científica: “Proposta de elaboração de metodologia para construção de instrumento de recuperação da informação, a partir da linguagem cotidiana, em plataformas interativas (Web 2.0)”, desenvolvida pela bolsista Jaqueline Birulio Peres, CNPq. Também está atrelado a esta pesquisa do projeto de extensão coordenado pela Dra. Vera R. C Boccato intitulado: “Organização e gestão da inovação em processos e produtos informacionais para a comunicação na UFSCar”, vinculado ao Programa de Extensão coordenado pela Dra. Cristina C. Ferraz.