USO DE FERRAMENTAS DE SISTEMAS DE GESTÃO DE CONTEÚDO PARA O COMPARTILHAMENTO DA INFORMAÇÃO E CONHECIMENTO: O CASO DO REPOSITÓRIO ACADÊMICO DE BIBLIOTECONOMIA E CIÊNCIA DA INFORMAÇÃO - RABCI Tiago R. M. Murakami * [email protected] Sibele S. Fausto ** [email protected] Área Temática: Redes de Conhecimento Sub-área: Arquitetura de Informação e Tecnologias * Prefeitura Municipal de São Paulo Centro Educacional Unificado - CEU Butantã Av. Eng. Heitor Antônio Eiras Garcia, 1870 05588-001 - São Paulo, SP - Brasil Tel. (11) 3735-0287 **Universidade de São Paulo Faculdade de Arquitetura e Urbanismo Rua do Lago, 876 05508-080 - São Paulo, SP - Brasil Tel. (11) 3091-4797 2 RESUMO Este trabalho Biblioteconomia apresenta e Ciência a trajetória da do Informação Repositório Acadêmico - as RABCI, de tecnologias experimentadas inicialmente e sua evolução até a adoção atual de uma ferramenta de Sistema de Gestão de Conteúdo em software livre – o Drupal, abordando sua concepção, organização, os recursos tecnológicos e as funcionalidades envolvidos em sua implementação, focando a experiência prática do projeto como um recurso de compartilhamento dinâmico da informação e do conhecimento gerada nos cursos de graduação em Biblioteconomia e Ciência da Informação, contribuindo para o livre acesso e disseminação da produção científica acadêmica da área. Palavras-chave: Repositórios Digitais Temáticos. Sistemas de Gestão de Conteúdo. Software Livre. Biblioteconomia. Ciência da Informação. 1 INTRODUÇÃO A evolução da internet e de suas tecnologias derivadas alterou a interface virtual da interação reativa com os conteúdos digitais basicamente estáticos para um ambiente de interação ativa, participativo e compartilhado, com maior autonomia e liberdade de seus atores. Os conteúdos web passaram a ser colaborativos, gerados pelos usuários (User Generated Content - UGT), com alta velocidade de disponibilização, e o arcabouço tecnológico necessário para suportar essa dinâmica intensamente dialógica são os Sistemas de Gestão de Conteúdo - SGC (Content Management Systems – CMS), que combinam soluções flexíveis e ágeis para estruturar e facilitar a criação, administração, distribuição, publicação e acesso do conteúdo web. A produção científica acadêmica pode se beneficiar das muitas vantagens reunidas nos CMS, a exemplo de sua adoção para um repositório digital temático específico para a área da informação, o Repositório Acadêmico de Biblioteconomia e Ciência da Informação – RABCI. Este trabalho apresenta o RABCI, compartilhando a experiência de sua trajetória, discutindo os princípios envolvidos nos CMS e nos repositórios digitais de acesso livre. 3 2 SISTEMAS DE GESTÃO DE CONTEÚDO O atual panorama interativo da web tornou a publicação uma tarefa complexa no ambiente digital, exigindo soluções para a gestão de seu conteúdo com elementos de valor agregado, e as tecnologias de suporte que respondem a esta demanda são os Sistemas de Gestão de Conteúdo, que integram ferramentas necessárias para várias funções na criação e gerenciamento (edição, inserção e workflow) de conteúdo de forma dinâmica, dispensando a necessidade de programação de código. Os CMS, por serem frameworks, são compostos pela interação entre vários módulos que gerenciam funções específicas na construção de uma página web. Estes recursos provêem um framework para criação, gerenciamento e publicação de conteúdos web; um ambiente seguro através do gerenciamento de papéis de usuários e podem ser complementados com extensões para ampliar suas funcionalidades, através de customização (AUSTIN; HARRIS, 2008, p.5). Tais características1 tornam os CMS o suporte tecnológico em praticamente toda a World Wide Web atual. 3 REPOSITÓRIOS DIGITAIS DE ACESSO ABERTO Da evolução da comunicação científica no ambiente digital derivaram formas de armazenamento e disseminação da produção científica em modelos eficientes que promovem sua visibilidade e acesso, a exemplo dos chamados repositórios digitais, podendo ser institucionais ou temáticos. Os esforços para a livre disseminação do conhecimento científico2 promoveram várias alternativas para esse fim, entre elas os repositórios de acesso livre baseados em arquivos abertos, “[...] onde os conteúdos podem ser acessados sem custos e barreiras de quaisquer naturezas” (MORENO; LEITE; MÁRDERO ARELLANO, 2006, p. 84), reunindo padrões e normas de interoperabilidade para facilitar a eficiente disseminação de conteúdos científicos na internet. 1 Módulos essenciais de um CMS são os de coleção, gerenciamento e publicação; administração do BackOffice; o módulo de contribuição, o workflow editorial e o módulo de publicação (TRAMULLAS, 2005; LALAUDE, 2009). 2 Estes esforços foram capitaneados pelo Movimento do Acesso Aberto (Open Access Movement – OAM) e pela Iniciativa dos Arquivos Abertos (Open Archives Initiative – OAI). 4 4 REPOSITÓRIO ACADÊMICO DE BIBLIOTECONOMIA E CIÊNCIA DA INFORMAÇÃO – RABCI3 A convergência dos princípios envolvidos nos CMS e nos repositórios temáticos de acesso livre direcionaram a criação de um repositório digital temático específico para a produção científica da graduação em Biblioteconomia e Ciências da Informação (CI). 4.1 Por que um Repositório Acadêmico de Biblioteconomia e Ciência da Informação? Segundo Petinari (2008), quase não há iniciativas para a disponibilidade online da produção científica da graduação no Brasil, pois a obrigatoriedade legal4 em divulgar de forma digital a produção das Instituições de Ensino Superior - IES restringe-se às teses e dissertações dos programas reconhecidos de doutorado e mestrado dessas instituições. Neste contexto, é pertinente a existência de um repositório digital temático livre e gratuito voltado à graduação. O RABCI objetiva ser um espaço alternativo de compartilhamento do conhecimento produzido por alunos e também profissionais da área de Biblioteconomia e CI, preenchendo o gap existente, além de ser um espaço de experimentação de novas tecnologias web facilitadoras da disseminação da informação, em um panorama em que as inovações e soluções surgem e disseminam-se rapidamente, exigindo agilidade para acompanhar e adotar as novidades tecnológicas. 4.2 RABCI: histórico e configuração atual A idéia de criar um repositório surgiu em 20045. O intuito inicial era utilizar as tecnologias disponíveis em soluções livres (Free/Live Open Source Software FLOSS) e sob licença de uso público geral (General Public License – GNU GPL) para divulgar o conhecimento produzido por alunos de graduação dos cursos de Biblioteconomia e Ciência da Informação. 3 RABCI: http://www.rabci.org Portaria nº 13, de 15 de fevereiro de 2006, da Coordenação de Aperfeiçoamento de Pessoal de Nível Superior – Capes (BRASIL, 2006). 5 Durante o mini curso sobre Bibliotecas Digitais durante o Encontro Nacional de Estudantes de Biblioteconomia e Documentação - ENEBD 2004, na Universidade Federal de Pernambuco - UFPE. 4 5 O RABCI foi então desenvolvido no final de 2004, inicialmente considerando-se softwares distribuídos nos modelos OAM/OAI. A princípio, adotou-se experimentalmente o Open Journal System (OJS)6, porém como este aplicativo é específico para a editoração de revistas, surgiu a necessidade de outras alternativas apropriadas para a criação de um repositório que aceitasse diversos formatos de publicações. Além disso, este e os demais modelos OAM/OAI7 se mostraram inviáveis por exigirem um alto controle do servidor, adequados para instituições com capacidade de infra-estrutura para tanto. Continuando o trabalho de prospecção de uma alternativa mais adequada às nossas necessidades8, percebemos que os CMS seriam uma boa solução, por dependerem somente da estrutura LAMP (Linux – Apache – MySQL - PHP), dispensando infra-estruturas especialistas e/ou proprietárias. Surgiu então a opção pelo CMS livre Drupal9, inclusive por contar com um módulo customizável para gerenciamento bibliográfico, o Bibliography. Verificamos que este CMS é altamente flexível, com variadas possibilidades de customização10, além de contar com uma ampla comunidade de suporte, também no Brasil11, e até mesmo de bibliotecários usuários do recurso12. 4.2.1 Organização e funcionalidades A grande flexibilidade do Drupal permitiu a implementação de algumas funcionalidades facilitadoras para a organização e recuperação da informação no RABCI, de forma inédita, descritas a seguir. O RABCI é organizado no framework do Drupal, através do módulo Bibliography, 6 uma extensão customizável para gerenciar conteúdos O OJS é um software de editoração de periódicos científicos desenvolvido pelo Public Knowledge Project (PKP), da University of British Columbia (Canadá), em GNU-GPL, traduzido para o português e distribuído pelo Instituto Brasileiro de Informação em Ciência e Tecnologia – IBICT em 2003. 7 Como o E-prints (da Southampton University, Inglaterra), o Greenstone (desenvolvido na Waikato University, Nova Zelândia, e distribuído em cooperação com a UNESCO) ou o DSpace (do Massachusetts Institute of Technology – MIT). 8 Inclusive experimentando gerenciadores de bibliografia em FLOSS/GNU-GPL como o WikiNDX e o Aigaion, que se mostraram robustos, mas limitados em termos de customização e com pouca atualização. 9 CMS Drupal: http://drupal.org/ 10 O RABCI usa a versão 6 do Drupal, que soma 100 módulos customizáveis diferentes. 11 Drupal Brasil: http://drupal-br.org/ 12 Drupal Group Libraries: http://groups.drupal.org/og/manage/1845. 6 estruturados, prevendo em sua estrutura: a Administração do sistema13; o Workflow editorial14; e o Produto informacional15. Esta estrutura suporta a gestão dos conteúdos fornecidos pelos usuários, através do auto-depósito (self-archiving) de seus trabalhos, mediante cadastro prévio16, possibilitando o acesso e preenchimento do formulário estruturado com informações de metadados dos trabalhos a ser depositados, inclusive atribuindo palavraschave de sua escolha (Folksonomia) - que alimentam a nuvem de assuntos (tags) disponível na página principal ou escolhidas do vocabulário controlado17 disponível no sistema. O preenchimento do formulário de metadados possibilita ao sistema a busca em todos os campos. A pesquisa de documentos no catálogo do RABCI pode ser processada de diferentes maneiras, através dos links específicos para pesquisar ou navegar18. É possível imprimir, salvar ou fazer o download dos trabalhos, além de exportar os dados recuperados de uma dada pesquisa em EndNote, XML ou BibTex, pois o Módulo Bibliography do Drupal provê um filtro para esse procedimento19. Ao preencher o formulário de auto-depósito, os usuários concordam em disponibilizar seus trabalhos sob uma licença de copyleft Creative Commons20, permitindo aos visitantes do RABCI livre acesso ao conteúdo, mas impede sua comercialização ou modificação por terceiros. Assim, são assegurados os direitos autorais morais sobre a obra, e compartilhados os direitos materiais. Em dezembro de 2008, foi adicionado ao RABCI um novo recurso adotado pelo suporte do Drupal no Módulo Bibligraphy, provendo uma interface para a 13 Função essencial do CMS, administra dados importantes para todo o sistema como os dados dos usuários, permissões de cada tipo de usuário, modelagem da estruturação de dados, etc. 14 Permite o gerenciamento do processo editorial e suas funções. 15 Permite acesso ao produto informacional final. 16 Atualmente há 360 usuários cadastrados no RABCI. 17 Este vocabulário controlado é o JITA, um sistema de classificação de documentos da área de Biblioteconomia e Ciência da Informação, criado para ser usado no E-Lis, repositório temático internacional, de acesso aberto, da área de CI, integrante da iniciativa E-Prints (http://eprints.rclis.org). JITA é um acrônimo formado pelo nome dos autores: Jose Manuel Barrueco Cruz, Imma Subirats Coll, Thomas Krichel e Antonella De Robbio. 18 A pesquisa é possível por autor, por ano, por palavra-chave, na nuvem de assuntos ou no vocabulário controlado. 19 No entanto, para isso o usuário precisa ter instalado em seu desktop um software gerenciador de bibliografias, como o EndNote, mas existem alguns livres como o WikiNDX ou o Aigaion que aceitam o formato utilizado no RABCI. 20 Creative Commons: licença e direitos autorais em copyleft: http://www.creativecommons.org.br/. 7 interoperabilidade com outras fontes de informação, através do padrão Open Archives Initiative – Protocol for Metadata Harvesting – OAI-PMH, que consiste em uma ferramenta de colheita de metadados. O uso deste protocolo permite que os metadados do RABCI sejam passíveis de harvesting – promovendo a visibilidade e a disseminação online dos trabalhos ali depositados, porém o próprio RABCI ainda não atua como harvester de conteúdos externos. O RABCI é organizado em Seções, onde são distribuídos os conteúdos, acessíveis através de links. Mas a navegação no RABCI é muito flexível devido às ferramentas de web 2.0 incorporadas ao framework, tornando a página dinâmica e sempre atualizada, através da automatização de recepção de informação em tempo real, proporcionadas pelo emprego de agregador de Feeds RSS (Really Simple Syndication)21, mantendo seus usuários constantemente informados sobre temas, novidades e oportunidades da área22. Outra funcionalidade é o calendário23, útil para indicar eventos da área. Além de tudo, o RABCI conta também com um Blog próprio, criado para ser um espaço de interatividade entre os usuários, através da réplica pública em comentários, propiciando o estreitamento do contato e a criação de uma comunidade social, fomentando discussões, críticas e sugestões sobre a produção científica ali disponível. 4.3 Resultados do recurso informacional Com quase 5 anos de existência, o RABCI acumulou resultados relevantes. A seguir mostramos gráficos da avaliação quantitativa de seu desempenho quanto ao número de trabalhos depositados por ano24 e por instituição: 21 O RABCI subscreve Feeds de vários blogs e páginas web com temáticas relacionadas à Biblioteconomia e CI, bem como envia alertas aos usuários sobre suas atualizações, como novos trabalhos depositados, por exemplo. 22 Esses Feeds são distribuídos em quatro categorias: - Últimos posts em blogs de Biblio e CI; - Últimos posts sobre concursos e empregos; - Últimas contribuições em repositórios de acesso livre. - Últimas contribuições ao repositório22; Além de apontar os 10 documentos mais acessados e baixados – o chamado Zeitgeist do RABCI. 23 Para o Calendário, adotou-se o widget do Google Calendar. 24 É necessário esclarecer que a data refere-se ao ano de conclusão do trabalho, e não ao ano de depósito no RABCI, já que esses dados são fornecidos através dos metadados dos documentos, onde consta sua data de conclusão. 8 Gráfico 1: Distribuição dos trabalhos depositados no RABCI por ano Fonte: RABCI, 2009 Gráfico 2: Distribuição dos trabalhos depositados no RABCI por instituição Fonte: RABCI, 2009 O RABCI teve início em 2004, mas o Gráfico 1 mostra que a data dos trabalhos é anterior, chegando a 2000. Isso aponta o repositório como alternativa para o arquivamento retrospectivo, tornando-o uma fonte de memória científica acadêmica, além de disseminador de novos trabalhos. O fato de haver mais trabalhos do ano de 2005 em diante demonstra sua maior divulgação entre os usuários, que adotam o recurso como alternativa de publicação online de sua produção. Já o Gráfico 2, em relação às instituições de origem dos documentos, verifica-se que a maior presença é da Universidade de São Paulo – USP, com 16 trabalhos auto-arquivados25. Porém, nota-se que há instituições de praticamente todo o Brasil, apontando o alcance do recurso. 25 Isso se deve ao fato de a USP ser a instituição da graduação do desenvolvedor do RABCI (Tiago R.M. Murakami), onde naturalmente houve maior divulgação entre os alunos e colegas. 9 Quanto aos acessos e downloads26, os quantitativos em um recorte temporal de três anos (2007-2009)27 são mostrados no Gráfico 3 e na Tabela 1, respectivamente Gráfico 3: Número de acessos, por ano Acessos ao servidor ja n/ 07 ab r/0 7 ju l/0 7 ou t/0 7 ja n/ 08 ab r/0 8 ju l/0 8 ou t/0 8 ja n/ 09 20000 15000 10000 5000 0 Visitantes únicos Numero de visitas Tabela 1: Número de downloads, por ano e formato Ano PDF DOC PPS Totais parciais/ano 2007 3.039 114 122 3.275 2008 13.648 661 445 14.754 2009 1.148 7 4 1.159 782 571 Totais parciais/formato 17.835 Total Geral --------- 19.188 O Gráfico 3 mostra que o RABCI tem um bom fluxo de acessos, chegando a 15.000 em janeiro de 2009. Em relação aos downloads efetivados por ano, o maior número verificou-se em 2008, com o total parcial de 14.754 documentos baixados. Em relação ao formato de publicação, o PDF foi majoritário em todos os anos, atingindo o número de 17.835 no período analisado (2007-2009). Lembramos que o RABCI aceita arquivos em formatos variados (pdf, doc, pps, jpg, avi, mp3, html, etc.), porém o fato de ser um repositório acadêmico mostra 26 Utilizamos a ferramenta de análise web Debian AWStats: http://www.debianhelp.co.uk/awstats.htm. O RABCI migrou de servidor, sendo que só foi possível analisar os dados de acesso e download disponíveis no servidor atual, no período indicado. 27 10 que os documentos da produção científica (basicamente Trabalhos de Conclusão de Curso) são geralmente em formatos de publicação PDF. Verificamos a performance do RABCI na internet, nas ferramentas do Google Indexed Pages (nota obtida: 3,360) e Google PageRank28 (nota obtida: 2). O PageRank indica a relevância de um site, e a nota 2 obtida coloca o RABCI como mais importante que 20% do conteúdo da internet, um bom resultado já que o RABCI nunca adotou ações sistemáticas de marketing virtual, ficando sua divulgação por conta do “efeito viral” da web. Utilizamos também a avaliação de posicionamento web do Hubspot (Hubspot’s Website Grader), que analisa sites em termos de efetividade de marketing na web e atribui uma nota (website grade RABCI: 81/100). Nesta avaliação, o Hubspot mostrou também que o tempo médio de acesso e permanência no site é de 8 minutos, além de indicar a origem dos robôs/spiders utilizados nas buscas que levam ao site, importante para apontar em quais deles o RABCI está indexado29. As freqüências de acesso e download confirmam que o compartilhamento em um repositório digital de acesso livre para disseminação da informação mostrase eficiente, devendo ser considerada por alunos de graduação e profissionais da área de CI, aproveitando um recurso já disponível e aberto. 4.4 Desafios para o futuro A adoção de um CMS livre e flexível como o Drupal, que possui uma ampla e participativa comunidade de desenvolvedores confere ao RABCI uma característica mutante – está sempre em “beta”, sempre se desenvolvendo e adotando novos módulos de tecnologia disponibilizados pela comunidade. Isso aponta para sua melhoria constante no alcance de algumas metas traçadas para o futuro, entre as quais: 28 • Ampliar a possibilidade de colaboração dos usuários; • Integração de ferramentas da Web Semântica; O Google PageRank utiliza em sua análise de um site um algoritmo combinando acessos e links recebidos para determinar sua relevância. . 29 O Hubspot mostra muitos outros indicadores, e disponibiliza os resultados em relatórios e gráficos, em sua página web. O relatório de avaliação do RABCI está no URL: http://grader.com/site/rabci.org/rabci para livre acesso e consulta. 11 • Ampliar a funcionalidade do OAI-PMH para atuar como harvester; • Trabalhar junto à comunidade de desenvolvedores para encontrar soluções eficientes de preservação digital do conteúdo, um ponto importante ainda não devidamente atendido pelo Drupal; • Melhoria da acessibilidade: o RABCI já foi submetido ao escrutínio de diretrizes de acessibilidade para a Web30 e precisa desenvolver mais as funcionalidades assistivas demandadas pelas Pessoas com Necessidades Especiais (PNE); • Implantar avaliações sistemáticas e programadas do RABCI, através de metodologias avaliativas fundamentadas (CAMARGO; VIDOTTI, 2008). 5 CONSIDERAÇÕES FINAIS Atualmente, o frenético surgimento de tecnologias propiciado pelo contexto interativo e colaborativo da web aponta para os CMS como ferramentas ideais para a gestão, publicação, disseminação e acesso da informação e do conhecimento, por sua alta flexibilidade e necessária agilidade na adoção de novidades úteis para esses fins. Os recursos de CMS livres, como o Drupal, que conta com uma grande participação de comunidades de desenvolvedores que compartilham erros e acertos e possibilitam ao sistema o desenvolvimento contínuo numa interconexão dinâmica confirmam-se como alternativas viáveis aos tradicionais sistemas de bibliotecas ou recursos de informação online dependentes das instituições que as mantém, conferindo-lhes morosidade em seu desenvolvimento e rápida obsolescência. O RABCI, ao adotar o CMS Drupal, transmudou-se em um verdadeiro laboratório de aplicações web, incorporando as soluções úteis para seus objetivos e conferindo-lhe características dinâmicas e proativas, a nosso ver extremamente necessárias aos serviços de informação vivendo sob o paradigma tecnológico atual. Trabalhar com um CMS livre permitiu ao RABCI atingir a vanguarda em muitas aspectos relacionados à disseminação, ao 30 Guias de acessibilidade para a Web30 do World Wide Web Consortium (Web Content Accessibility Guidelines - W3CWCAG): http://www.w3.org/TR/WAI-WEBCONTENT/ . 12 acesso e ao uso da informação, que constituem a missão básica dos serviços de informação. REFERÊNCIAS AUSTIN, A.; HARRIS, C. Drupal in Libraries. Library Technology Reports, v. 4, n. 4, Maio/Jun. 2008. BRASIL. Ministério da Educação. Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (Capes). Portaria nº 13, de 15 de fevereiro de 2006. Institui a divulgação das teses e dissertações. Diário Oficial [da] União, Brasília, DF, n. 35, 17 fev. 2006. Seção 1, p ---. CAMARGO, Liriane S.A., VIDOTTI, Silvana A. B.G. Uma estratégia de avaliação em repositórios digitais. In: Seminário Nacional de Bibliotecas Universitárias, São Paulo, 2008. Anais... São Paulo: CRUESP, 2008. Disponível em: <http://www.sbu.unicamp.br/snbu2008/anais/site/pdfs/3560.pdf>. Acesso em 05 mar.2009. HUBSPOT’S WEBSITE GRADER. Report for rabci.org/rabci. Disponível em: <http://grader.com/site/rabci.org/rabci>. Acesso em 24.03.2009. LALAUDE, Myriam. Découvrir la gestion de contenu. Documentaliste: Sciences de L´information, v. 45, n.3, 2008. MORENO, Fernanda P.; LEITE, Fernando C.L.; MÁRDERO-ARELLANO, Miguel A. Acesso livre a publicações e repositórios digitais em ciência da informação no Brasil. Perspect. ciênc. inf. Belo Horizonte, v.11, n. 1, p. 82-94, 2006. Disponível em: <http://www.scielo.br>. Acesso em 20 mar.2009. PETINARI, Valdinéa S. Repositórios digitais e sua colaboração para Disseminação da produção científica da graduação. In: Seminário Nacional de Bibliotecas Universitárias, São Paulo, 2008. Anais... São Paulo: CRUESP, 2008. Disponível em: <http://www.sbu.unicamp.br/snbu2008/anais/site/pdfs/2878.pdf>. Acesso em 05 mar.2009. TRAMULLAS, Jesús. Open source tools for content management. Hipertext. net, n. 3, 2005. Disponível em: <http://www.hipertext.net>. Acesso em: 1 jun. 2006.