UM SOFTWARE PARA AVALIAÇÃO DE QUALIDADE DE FONTES DE INFORMAÇÃO EM SAÚDE NA WEB Edemar Oliveira da Silva1 <[email protected]> Dr. Stanley Loh2 <[email protected]> – Orientador Universidade Luterana do Brasil (ULBRA) – Curso de Sistemas de Informação – Campus Canoas Av. Farroupilha, 8.001 – Bairro Luís – CEP 92420-280 – Canoas – RS 30 de outubro de 2011 RESUMO Este trabalho apresenta a proposta de uma ferramenta que visa auxiliar na tomada de decisão de fontes de informação em saúde na web, fornecendo ao publico leigo uma forma mais simples de avaliar sua credibilidade. Para isso foram definidos alguns critérios para serem implementados em um software computacional, critérios esses que são originados por instituições que realizam estudos e pesquisas na tentativa de estabelecer métodos para definir a qualidade para esse tipo de informação na Internet. Palavras-chave: Qualidade da Informação; Internet; Avaliação; Informação em saúde; Software; ABSTRACT Title: “A software for evaluation of quality of health information source on the WEB” This article presents proposal for a tool to assist in decision making in health information sources on the web, providing the lay public a simpler way to evaluate their credibility. For some criteria that were set to be implemented in a computer software, these criteria that are originated by institutions that conduct research and studies in an attempt to establish methods to define quality for this kind of information on the Internet. Key-words: Quality of Information; Internet; Evaluation; Health information Software; 1 INTRODUÇÃO Em qualquer meio de comunicação as informações não confiáveis, incorretas, podem causar danos, tanto as pessoas, quanto para as organizações que confiam nelas como verídicas e confiáveis. Na internet não é diferente e como essas informações crescem rapidamente de forma desordenada, temos muita informação não verídicas e de baixa qualidade. Esse crescimento criou dificuldades para se localizar informações especificas e precisas na área de saúde, tanto para profissionais da área quanto para usuários leigos no assunto. Informações desatualizadas, inválidas, falsas ou tendenciosas, e a grande quantidade de conteúdo no mínimo duvidoso em toda a World Wide Web (WEB), é o grande problema atualmente, ao confiar em informações oriundas da Internet. Em portais de busca, o resultado das pesquisas relacionadas a saúde, comumente apresentam informações divergentes com as de um profissional de saúde, quando o uso dessa ferramenta é feito por um usuário leigo, a falta de conhecimento adequado para avaliar a qualidade dessas informações recuperadas, torna-se essa questão mais crítica, sendo que com a popularização do uso Internet esse número vêm a crescer. Um exemplo dessa prática foi presenciado pelo ex-presidente dos Estados Unidos da América, Bill Clinton, em uma visita a Índia, onde ele viu uma mulher entrar em um centro de saúde da aldeia, e realizar uma pesquisa sobre como cuidar de seu bebê, utilizando informações de um site da WEB. (WILLIAM, 2010). Não se sabe qual foi resultado da ação dessa mulher em confiar em informações de saúde disponíveis na internet, mas mostra como essa pratica é comum e realizada sem orientação ou qualquer tipo de ajuda de profissionais que possam auxiliar na seleção de informações confiáveis. De acordo com Marin (1995, p. 2) na área da saúde a informação é um dos principais, se não o principal recurso necessário para os profissionais exercerem a profissão com qualidade e eficiência e que ter ou não essas informações pode implicar em ter ou não sucesso na aplicação de algum cuidado ou tratamento prestado ao paciente. Informações não confiáveis podem acarretar grandes riscos na área da saúde, para 1 2 Aluno do curso de Sistemas de Informação da Universidade Luterana do Brasil (ULBRA). Professor orientador da Universidade Luterana do Brasil (ULBRA). 1 usuários que desconhecem padrões de qualidade nos documentos disponíveis na WEB, que com a popularização do uso da internet, essa prática esta cada vez mais frequente. A questão da qualidade da informação na área da saúde torna-se mais preocupante pela facilidade que qualquer pessoa com acesso a internet e com mínimo de conhecimento em informática consegue criar um site e publicar seus artigos, com baixa ou nenhuma credibilidade no assunto tratado, uma vez que não se tem nenhum tipo de controle sobre as páginas publicadas na rede, assim essas informações crescem de forma desordenada e rapidamente. O problema, portanto, já não é mais em encontrar a informação, mas avaliar a credibilidade da mesma, bem como a relevância e a precisão de um documento encontrado na Internet. Tendo em vista essa realidade, esse trabalho apresenta uma ferramenta de software com implementações de métricas e critérios definidos por organismos especializados em qualidade da informação na Internet. Serão apresentadas as instituições que realizam estudos e pesquisas a fim de melhorar a qualidade da informação na Internet, sendo definindo padronizações para confiabilidade dos documentos disponíveis, ou avaliando os fornecedores dessas informações. Será apresentado como a avaliação da qualidade da informação em saúde na Internet é realizado atualmente, e como essas informações são classificadas de maneira manual. Será apresentada também uma analise de critérios, filtros, e métricas que foram implementados no programa computacional, com o objetivo de automatizar essa atividade. Será exposto como essa ferramenta foi implementada, demonstrando como o programa computacional realiza as avaliações, como é seu o funcionamento, uma analise das tecnologias usadas para o desenvolvimento, seus objetivos e resultados. A descrição de cada sessão será apresentada a seguir. A sessão 2 descreve um estudo sobre a avaliação da qualidade da informação na Internet, e um estudo com foco na avaliação na área de saúde, assim como exemplos de ferramentas disponíveis atualmente para realizar essa avaliação de forma automatizada. A sessão 3 apresenta uma análise de como a avaliação da qualidade da informação é realizada de forma humana e de forma automatizada. A sessão 4 descreve a solução proposta do software para avaliação automatizada da qualidade de fontes de informação em saúde na WEB, apresentação dos critérios que utilizados na implementação e apresentação da ferramenta desenvolvida. A sessão 5 apresenta a avaliação da ferramenta e seus resultados. Por fim são apresentadas as considerações finais do trabalho, limitações e sugestão de trabalhos futuros. 2 AVALIAÇÃO DA QUALIDADE DA INFORMAÇÃO NA INTERNET A busca de informações com qualidade na internet pode ser uma tarefa difícil devido a grande quantidade de informação disponível, sendo que filtrar essas informações é uma tarefa que toma grande tempo, principalmente para quem tem pouco conhecimento no assunto pesquisado, assim os resultados de pesquisas realizadas podem possuir muita informação irrelevante e não confiável. Na tentativa de melhorar essa realidade, algumas instituições vêm realizando estudos e pesquisas para atribuir critérios de avaliação, para assim tornar as informações oriundas da internet mais confiáveis. A idéia central dos critérios e/ou filtros para avaliação, baseia-se em listas que contenham categorias e subcategorias dos problemas relacionados com a qualidade da informação na Internet. Gil e Artz (2006) do Instituto de Ciências da Informação da Universidade do Sul da Califórnia apresentaram na 15ª conferência Internacional de World Wide Web uma seleção de dezenove critérios possíveis para avaliação da informação na internet: • Tema, um site torna-se mais confiável quando oferece informações sobre um tema especifico; • Contexto e criticidade, caso a informação seja critica, a mesma deve possuir elevada precisão; • Popularidade, quanto mais referência o conteúdo possui, mais ele tende a ser confiável; • Autoridade, o autor do documento deve ter domínio do assunto que esta apresentando; • Experiência direta, interação direta do leitor com um recurso que fornece informações; • Recomendação, o documento possui referência de outros usuários confiáveis; • Recursos relacionados, relação com outras entidades e/ou instituições que remetem confiança; • Proveniência, transmite confiança nas entidades responsáveis pela geração do conteúdo; • Experiência, conhecimento do usuário em relação ao conteúdo apresentado; • Tendência, o autor pode enfatizar algumas informações positivas e omitir as negativas; 2 • Incentivo, a informação tende a ser confiável, se existe uma motivação para se fornecer informação precisa; • Escassez de recursos, ausência de fontes alternativas podem resultar em maior confiança em informações imprecisas, que estão ao alcance do usuário; • Conformidade, mesmo que a informação não transmita muita confiança, o leitor pode acabar confiando, caso vários outros recursos enfatizem o conteúdo apresentado; • Especificidade, conteúdo preciso e especifico tende a gerar mais confiança ao leitor; • Probabilidade, probabilidade de o conteúdo estar correto de acordo com conhecimento do leitor; • Atualidade, dependendo do conteúdo, sua vida útil pode ser pequena e mudar constantemente; • Aparência, percepção do usuário em relação ao aspecto do conteúdo pode influenciar na confiança; • Engano, recursos com intenções enganosas tende a atenuar a confia do leitor no conteúdo; • Recência, a confiança no conteúdo pode mudar com o tempo, um recurso que tinha má reputação, pode agora ter reputação melhor, ou vice versa; Sales e Toutain (2005) citam como critérios gerais para avaliação categorias como: • Escopo do site: Onde se deve avaliar a proposta do site, recursos disponíveis, organização da informação se combina informação educacional; • Fonte: Pode-se verificar quem é o autor ou criador do site, se as informações são fornecidas por organizações, instituições governamentais, universidade ou por uma pessoa física, data de fundação do site, se os autores são claramente identificados e se suas qualificações sobre o assunto estão disponíveis. • Fluxo da informação: Pode-se verificar se as informações disponíveis são revisadas e atualizadas regularmente, se os artigos estão identificados com o nome do autor e a data de publicação é informada, se esta claro que a data informada é de publicação ou de revisão. Se os links HTML foram revisados e estão funcionando. • Apresentação: Pode-se verificar se a interface do site é amigável, se possui um sistema de busca interno e em fácil localização na tela, em relação aos textos se possuem correteza, seguindo as regras de gramáticas, ortografia, pontuação. • Outros critérios: Se há necessidade de enviar informações confidenciais para ter acesso ao conteúdo, se não há exibição de pop-ups ou frames. De acordo com Sales e Almeida (2007) um estudo realizado por Pinto (2004) com membros acadêmicos das áreas de Engenharia Civil, Educação Física e Administração, com foco no uso da internet, demonstrou que os critérios adequados para essa avaliação deveriam envolver os seguintes aspectos: autoridade da fonte; escopo; conteúdo; publico alvo; proposta da informação; endereço do documento, corpo editorial; atualidade da informação. 2.1 Critérios para avaliação da qualidade da informação em saúde na Internet Os resultados de diversas organizações que tem realizado estudos e pesquisas referentes ao uso da Internet para obter informações na área da saúde, têm indicado que as pessoas realizam pesquisas de maneira aleatória, utilizando ferramentas de busca de uso geral, onde grande parte das informações é irrelevante. São realizadas sem a ajuda de profissionais de saúde, e a maioria das pessoas acredita que se a informação esta na publicada na internet ela é confiável (JUZZO. p.2 ) Em relação a avaliação da informação sobre saúde na Internet, tem-se critérios semelhantes ao analisados anteriormente, porem essa analise deve ser mais critica devido ao riscos que podem ser causados por informações oriundas de pessoas sem conhecimento qualificado para fornecer esse tipo de informação. Numa tentativa de minimizar esse problema, algumas organizações vêm estudando e desenvolvendo critérios que auxiliem na avaliação da qualidade da informação na área da saúde, como os apresentados a seguir. 2.1.1 Critérios para avaliação da Health on the Net Foundation A Health on the Net Foundation (HON) é uma organização não governamental e sem fins lucrativos, fundada em 1995, com objetivo auxiliar a identificar sites confiáveis na área da saúde. Possui o HONCode, que é um código de conduta para os websites médicos e de saúde, esse código possui oito princípios que são considerados essenciais para atribuir qualidade da informação na área de saúde, modificado nos primeiros dez meses de sua existência, ampliou de seis para oito princípios, e sua versão atual tem-se mantido 3 inalterada desde abril de 1997. A certificação do HONCode não é um sistema de premiação de qualidade, e nem pretende avaliar a qualidade da informação do site, apenas define um conjunto de regras éticas na apresentação das informações e ajuda os leitores a conhecer a origem e a finalidade das informações que estão lendo, a certificação HONCode é gratuita. (HON, 2009). Os princípios considerados essenciais para a HON são: • Autoridade: Define que todas as orientações médicas e de saúde do site deve ser produzidas por profissionais qualificados. Caso contrário deve ser declarado expressamente que a orientação esta sendo fornecida por uma pessoa ou organização que não tem qualificações adequadas na área médica. • Complementaridade: As informações publicadas no site devem ter o objetivo de apoiar e não substituir a relação do médico com o paciente. • Confidencialidade: O site deve assegurar o sigilo dos dados e identidade dos pacientes e visitantes, respeitando os requisitos legais mínimos de privacidade de informação médica e de saúde vigente no país ou estado onde o site se localiza. • Atribuições: O site deve apresentar referências claras das fontes consultadas, se possível informar os links HTML para essas fontes. A data da última atualização da página WEB também deve estar disponível para o visitante de uma forma clara, como por exemplo, no topo da página. • Justificativas: As informações apresentadas sobre os benefícios e o desempenho dos tratamentos, produtos ou serviços devem estar baseadas em evidencias adequadas e equilibradas, com atribuições as comprovações. • Autoria: As informações dispostas no site devem estar de forma mais clara possível, endereços para contato devem estar de fácil acesso aos os visitantes, caso os mesmos queiram maiores informações ou ajuda adicional. Endereço de e-mail do responsável pelo site deve estar disponível em todas as páginas do site. • Patrocínio: Qualquer tipo de apoio que tenha contribuído para ajuda financeira, serviços ou recursos materiais por organizações comerciais e não-comerciais, devem estar claramente identificados aos visitantes. • Publicidade: O site deve indicar claramente se a publicidade é uma das fontes de renda usadas e fornecer uma breve descrição da política de divulgação empregada. Anúncios e materiais promocionais devem ser apresentados de uma maneira e um contexto que facilitem diferencia-los do conteúdo produzido pela instituição administradora do site. 2.1.2 Critérios para avaliação apresentados pelo Hospital John Kopkins O Hospital John Kopkins possui uma lista de critérios que foram elaborados por bibliotecários que possuem contato com a área médica, este documento esta disponível em sua página da internet. O documento é dividido por categoria, dispondo assim de filtros para a avaliação da qualidade da informação. De acordo com Kirk (1996) os critérios avaliados devem ser: Autoria: Critério mais importante ao avaliar uma informação. Quando encontramos uma informação que nos é importante, e a mesma tem um algum valor para nossa necessidade, queremos saber quem escreveu, qual é a autoridade do autor, para esse critério podemos avaliar: • Reconhecimento e prestigio do autor em seu campo de estudo; • Citações positivas por outros autores reconhecidos como autoridade no campo de estudo; • Referência externa partindo de sites que o leitor confia; • Dados biográficos do autor disponíveis que permita avaliar as suas credenciais; • Caso não possua os itens anteriores, deve se verificar a existência de telefone e/ou endereço postal. Apenas o endereço de e-mail é informação insuficiente. Corpo do texto: Critério que pode auxiliar na avaliação da qualidade em documentos impressos, significa que a revisão do texto foi feita por críticos qualificados, na internet para realizarmos essa avaliação e autoridade do editor, podemos realizar os seguintes filtros em relação a onde o documento está localizado: • Identificação de alguma organização confiável, sendo no rodapé, logotipo, ou marca d’água que identifica quem fornece o documento. Possibilidade de entrar em contato com webmaster a partir de dados disponíveis no documento. Organização é acreditada academicamente; • Possibilidade de ligá-la a uma página onde conste no nome da intuição, com a possibilidade de identificar a URL como uma organização confiável; 4 • A entidade que hospeda o documento é reconhecida no campo da atuação indicado; • A entidade que hospeda o documento é adequada para abordar o requerido tema; • O autor do texto tem vinculação com a organização responsável pelo site e o documento em questão tem indícios que foi produzido em função da vinculação com a instituição, não remetendo um vinculo passageiro dos mesmos; • É possível conferir a identidade do servidor onde o documento está hospedado, usando por exemplo nslookup e whois; • A página consultada esta hospedada em um domínio de um site oficial ou endereço pessoal? Essa informação deve ser analisada com o máximo de cuidado. Ponto de vista: A informação raramente é neutra, com a popularidade da internet, uma página WEB torna-se um local perfeito para distribuir essa informação de modo seletivo. Então torna-se importante avaliar quem esta fornecendo a informação e avaliar se essa poderia ser um ponto de vista ou preconceito sobre o assunto tratado. • Caso o documento esteja hospedado em uma organização, é provável que a informação sobre a mesma, será apresentando de maneira mais positiva possível. Caso documento esteja hospedado em uma empresa, a mesma pode estar apresentando um anuncio de um produto e/ou serviço, da mesma forma pode estar sendo apresentada uma opinião preconceituosa sobre o assunto; • Documento hospedado em um servidor de uma organização política ou filosófica com informações de modo seletivo; Referência ou Conhecimento da Literatura: Faz referência ao contexto que o autor situa seu trabalho, revelando assim se o mesmo tem conhecimentos sobre a disciplina e suas práticas, permitindo ao leitor avaliar a escolaridade e os conhecimentos da área de discussão do autor. Para esse filtro sugerem-se os seguintes critérios: • Bibliografia do documento; • Referências corretas e adequadas, mostrando conhecimento de fontes relacionadas; • O autor demonstra ter conhecimento de teorias, escolas de pensamento e técnicas que são consideradas apropriadas para o assunto tratado. • O autor menciona que esta utilizando uma teoria e/ou técnica nova como base para sua investigação e discute seus valores e limitações da nova abordagem. • Se autor usa uma abordagem controversa do problema, o mesmo demonstra conhecimento disso? Precisão ou verificabilidade: Parte importante do processo de avaliação, principalmente quando se trata de uma obra de um organização ou autor desconhecido. Critérios de avaliação de precisão: • Quando for um documento de investigação, informa como realizar as interpretações do fenômeno; • Apresenta uma metodologia adequada ao tema e permite realizar estudos para sua verificação; • Apresenta fontes que estão listadas na bibliografia, ou mesmo, inclui links para os próprios documentos; • Menciona fontes e indivíduos que forneceram dados não publicados, que foram utilizados no estudo; • Informações antecedentes utilizadas no trabalho como base estão verificadas na sua correção. Atualidade: Refere-se a atualidade da informação, em algumas área de estudo, a atualidade não é um critério muito importante, porem na área da saúde esse é um dos critérios mais importante a ser analisado. Em relação a esse critério temos os seguintes filtros: • Informa a data em que a informação apresentada foi coletada; • Refere-se a data da informação de forma clara; • Inclui informações sobre a regularidade das atualizações, quando ouve necessidade de acrescentar ou atualizar os dados; • Inclui a data de publicação e data de última atualização; • Inclui data de direitos autorais; • Caso não o documento não possua essas informações, é possível verificar a data do documento no diretório onde o mesmo encontrar-se hospedado? 5 2.1.3 Critérios de avaliação desenvolvidos pelo Health Information Technology Institute De acordo com Lopes (2006) e Marques (2003) o documento Criteria for Assessing the quality of Health Information on the Internet (Critérios para avaliação da qualidade da Informação em Saúde na Internet), desenvolvido pelo Health Information Technology Institute (HITI) e a empresa Mitretek System, com intermédio do Health Summit Working Group (HSWG), possui sete categorias de critérios para avaliar a qualidade da informação em saúde na Internet: credibilidade; conteúdo; apresentação do site; link, design; interatividade; anúncios. Quanto a credibilidade da informação são verificados elementos como: Fonte médica - considerado o primeiro elemento para estabelecer que o documento possui credibilidade e qualidade, esse critério envolve, visualização do nome da instituição e do autor. Também é usado como critérios o contexto; a atualidade da informação; sua pertinência/utilidade além do processo de revisão editorial. Em relação ao conteúdo devem-se ser verificados os critérios como, a acurácia da informação; a comprovação de evidências; a precisão das fontes apresentadas; a disponibilização de avisos institucionais, informado os objetivos, autoridade e limitações da informação; a completeza da informação. No quesito apresentação do site, os critérios avaliados são: os objetivos da instituição e o perfil do site, onde deve ser descrito seu perfil para seus usuário ou consumidores. Em relação a categoria links os critérios avaliados estão ligados com a seleção dos links; a arquitetura que os mesmos são apresentados, a relação com o conteúdo apresentado e links de retorno. Na categoria Designer deve se analisar critérios como: acessibilidade; navegabilidade, mecanismos de buscas internos. Os requisitos de interatividades e anúncios devem ser avaliados os mecanismos de retorno da informação, fórum de discussão e também a explicitação de algoritmos e as chamadas que vinculam propagandas. 2.1.4 Critérios de avaliação da American Medical Association A American Medical Association (AMA) iniciou o desenvolvimento de suas normas para qualidade para páginas Web no inicio de 1999, essas normas foram definidas para orientar tanto os responsáveis pelo desenvolvimento das páginas Web tanto para os provedores de informação de saúde. Foram definidas quatro áreas principais que necessitavam de normas de qualidade: conteúdo; publicidade e patrocínio; privacidade e confidenciabilidade; e comercio eletrônico. As normas da AMA são semelhantes as das instituições HON e HITI apresentadas anteriormente. O grupo permanente da AMA para a atualização das normas é formado por funcionários na área editorial da própria organização e também por consultores externos. LOPES (2006) apud WINKER(2004). 2.2 Ferramentas para avaliação da qualidade da informação na Internet A busca por informações na Internet, em sua grande maioria é realizada por ferramentas de pesquisas WEB comuns, como o Google <www.google.com>, por exemplo, e os critérios apresentados anteriormente, quando aplicados, são de forma manual. Durante o estudo percebeu-se que as ferramentas para avaliação da qualidade da informação de forma automatizada ou semi-automatizada ainda não são muito comuns, e estão começando a surgirem. 2.2.1 WRAPIN - Worldwide Online Reliable Advice to Patients and Individuals O protótipo WRAPIN - Worldwide Online Reliable Advice to Patients and Individuals, tem como objetivo oferecer informações médicas e de cuidados com a saúde de forma mais confiável e segura. A ferramenta fornece um mecanismo que permite uma comparação de documentos de saúde com base em informações publicadas na literatura e fornece um resumo com as conclusões obtidas. Essa ferramenta tem como objetivo auxiliar a determinar a confiabilidade dos documentos disponíveis na WEB, verificar em relação aos parâmetros estabelecidos e determinar uma relevância determinada na página de resultados da pesquisa. O WRAPIN faz uso de novos desenvolvimentos no mapeamento de termos médicos, tecnologia de buscas por indexação e processamento de linguagem natural. Os resultados de pesquisa do WRAPIN não 6 pretendem ser relevante só nas pesquisas, mas também permitir ao usuário determinar a qualidade, em relação as referências e confiabilidade dos documentos. WRAPIN (2010). 2.2.2 Busca Saúde O projeto de pesquisa foi desenvolvido para o Programa de Pós-graduação em Informática em Saúde, na Universidade Federal de São Paulo (UNIFESP), esta disponível em <http://buscasaude.unifesp.br>, tem por objetivo a recuperação de conteúdos através de recursos de ferramentas de buscas externas, e classificação de conteúdos sobre saúde que estão disponíveis na Internet. O projeto tem como intuito oferecer ao público uma maneira fácil de localizar conteúdos sobre saúde em relação aos demais buscadores populares. Para identificar os sites que tenham sido classificados com conteúdo de saúde, os mesmos são exibidos com um selo, ao lado de seu endereço. A ferramenta possui uma interface semelhante a maioria das ferramentas de buscas populares, conteúdo uma pagina de pesquisa, com um campo e um botão para realizar a pesquisa e os resultados são exibidos numa nova página em forma de listagem. 3 AVALIAÇÃO HUMANA DA QUALIDADE DA INFORMAÇÃO EM SAÚDE NA INTERNET A avaliação da qualidade da informação em saúde na Internet realizada de forma humana ocorre levando em consideração as experiências e conhecimento que o usuário que busca essas informações tem em relação ao assunto pesquisado. Na avaliação humana, ao realizar uma busca na Internet, o usuário utiliza-se de seus conhecimentos empíricos para selecionar essas informações, porem nem todos os usuários, tem conhecimento de como realizar essas pesquisas de forma correta, das praticas julgadas importantes para avaliar informações e seleção de conteúdo com credibilidade. Para realizar avaliação humana da qualidade da informação, algumas instituições possuem usuários especializados para realizar esse tipo de pesquisa na Internet, os mesmos possuem um maior conhecimento de métodos de como efetuar as buscas, como filtrar os resultados a fim de se obter resultados com maior qualidade e credibilidade. A Universidade Federal de Ciências da Saúde de Porto Alegre (UFCSPA), por exemplo, lugar onde esse trabalho recebeu auxilio para o desenvolvimento dessa ferramenta, possui algumas pessoas responsáveis por esse estudo. Esses usuários possuem um conhecimento maior de como realizar essas pesquisas, de métodos e técnicas para auxiliar a obter resultados mais confiáveis em buscas de conteúdo na Internet. Os mesmos utilizam para essas pesquisas ferramentas de busca comum na WEB e métodos como apresentados a seguir. Para a avaliação da qualidade das informações de sites avaliados de forma manual, o usuário geralmente utiliza-se de uma ferramenta de pesquisa na Internet, como o Google <www.google.com>, ou similares, essas ferramentas de busca apresentam os resultados de acordo com a popularidade do conteúdo e proximidades dos termos de busca. Com os resultados obtidos na busca, são escolhidas as Uniform Resource Locator (URL) encontradas para assim realizar uma analise das informações que elas possuem. Acessando o endereço das URL’s selecionadas, são aplicados filtros com definições de pré-requisitos importantes, como por exemplo, a origem da instituição que esta oferecendo essas informações, que pode ser realizada analisando a autoria da mesma. Aplicando esse primeiro filtro, podem-se excluir da lista as URL’s que não se encaixam nos critérios e que serão descartadas da avaliação. Também são feitas definições dos formatos de documentos que serão incluídos para a avaliação, definindo se serão apenas páginas da WEB, ou outros formatos de arquivos digitais (documentos com extensões .pdf, .doc, .pps, etc). Os resultados com links HTML repetidos, e páginas que contenham apenas fornecimento de documentos com links HTML para outros sites que possuam o conteúdo original pesquisado são descartados. Após essa primeira seleção das URL’s que serão analisadas, é desenvolvido então, uma espécie de check-list específico com base nos critérios das instituições apresentadas anteriormente, como a Health on the Net Foundation, Hospital John Kopkins, Health Information Technology Institute e American Medical Association, que são organismos que tem critérios relevantes para esse tipo de avaliação da qualidade da informação disponível na Internet. Com os critérios relevantes para a avaliação especifica definida, os mesmos são aplicados manualmente nas páginas WEB das URL’s pré-selecionadas na pesquisa. O usuário acessa cada um dos links HTML, aplica o check-list e realiza a analise, e aplica a pontuação do conteúdo fornecido por aquela 7 página de acordo com os critérios e filtros escolhidos. Com a aplicação desse check-list, é gerada uma planilha com o detalhamento da avaliação do site, essa planilha geralmente contem uma estrutura onde é apresentado o endereço do site avaliado, relacionados com os critérios analisados e a pontuação em valores numéricos sobre cada item avaliado. Como se pode observar, apesar da possibilidade de obter uma avaliação criteriosa, nota-se que a mesma pode ter um tempo demasiado, dependendo da quantidade de resultados que o usuário deseja analisar. Usuários leigos podem não ter condições satisfatórias para realizar todas as etapas da avaliação, pois os mesmo podem não ter condições de avaliar quais URL’s seriam mais confiáveis, e não ter conhecimento da existência de organismos especializados em estudos e pesquisas para fornecer listas de critérios e métricas importantes para avaliar um conteúdo disponível na Internet. 3.1 A avaliação automatizada da qualidade da informação na Internet A avaliação automatizada não propõe substituir a avaliação humana, mas sim auxilia-la nesse processo. A automatização em um sistema computacional pode ter alguns empecilhos, pois ao avaliar o conteúdo de uma página WEB, com os critérios definidos por organismos especializados em qualidade da informação, a maioria desses critérios requerer uma analise mais humana, sendo complexa para ser analisada por um programa computacional. As maiores dificuldades encontradas em uma avaliação automatizadas, são com critérios muito subjetivos que a página WEB pode apresentar, onde seriam necessários a implementação de algoritmos mais complexos para analisar de forma satisfatória, como por exemplo, ao realizar uma analise de critérios como, justificativas, ponto de vista, comprovação de evidencia, entre outros. Com base nos critérios desenvolvidos pelas instituições apresentadas anteriormente e no tópico da avaliação humana na qualidade da informação na Internet, percebeu-se que partes do processo são repetidos para todas as analises realizadas, e alguns desses critérios podem ser automatizados por um programa computacional. 4 SOFTWARE PARA AVALIAÇÃO AUTOMATIZADA DA QUALIDADE DE FONTES DE INFORMAÇÃO EM SAÚDE NA WEB Decidiu-se trabalhar com seis critérios julgados importantes e de possível avaliação automatização em uma ferramenta computacional, que são eles, autoridade, atualidade, autoria, complementaridade, popularidade, e fonte, os mesmos são identificados com a utilização de expressões regulares: Após a análise dos critérios apresentados e escolha dos que foram automatizados, definiu-se as funcionalidades, os objetivos, como é realizado o processamento, quais serão as entradas que o usuário ira inserir no sistema, e quais as saídas e/ou resultados esperados do programa computacional. O objetivo dessa ferramenta será auxiliar na tomada de decisão sobre as informações de saúde que temos disponível na Internet. O programa computacional avalia automaticamente os critérios implementados, porem o mesmo não avalia todos os critérios necessários, para a avaliação completa de uma fonte de informação, pois alguns filtros devem ser minuciosamente avaliados e analisados manualmente, então o sistema auxilia num apoio de tomada de decisão para os usuários. Após definidos os critérios utilizados no programa computacional, escolheu-se os filtros que foram aplicados e as pontuações de cada um ao ser realizado a analise automatizada. Os filtros dos critérios foram realizados através de expressões regulares, que nada mais são do que uma composição de símbolos, caracteres com funções especiais, e caracteres literais, que formam uma expressão, que é interpretada como uma regra, a mesma indicará sucesso se uma entrada de dados obedecer exatamente a essas condições. Os valores definidos para os filtros apresentados foram definidos através de vários testes até se conseguir a pontuação final Um melhor detalhamento de como esses critérios foram implementados será apresentado a seguir: 4.1.1 Critério de Autoridade O critério propõe que toda a orientação médica ou da área de saúde contida no site será dada somente por profissionais treinados e qualificados. O critério é um dos 8 (oito) códigos de conduta para os websites médicos e de saúde definidos pela Health on the Net Foundation. Nesse critério são avaliados no texto, palavras, códigos ou siglas para que se consiga localizar um indicador que o mesmo possui, um 8 profissional, uma instituição ou algum organismo com qualificações para fornecer informações relacionadas a saúde. Para realizar essa avaliação o programa computacional chama uma função que percorre o código fonte da página WEB, avaliando uma vez o texto da maneira que ele é interpretado e apresentado ao usuário, ou seja, apenas o texto, sem as marcações HTML, e outra vez diretamente o código fonte, junto com as marcações HTML. Através de expressões regulares são realizadas buscas para encontrar termos que identifiquem a possibilidade de autoridade no documento, alguns termos aplicados nesse critério foram: “Dr\.”; “Dra\.”; “CFE.[[:punct:]”; “HealthOnNet”, “Conselho Regional de.”, entre outros termos cadastrados no banco de dados da ferramenta, para esse critério. Caso seja identificado algum termo nessa etapa, a função retorna o valor TRUE para o programa principal. A pontuação recebida quando o critério é identificado é de 1 (um) ponto na pontuação total do documento avaliado. 4.1.2 Critério de Atualidade Propõe que a informação contida no site deve possuir a data em que cada página médica foi atualizada pela última vez. Nesse critério é verificado se o documento possui informação que indique quando ele foi criado, qual sua data de atualização, utilizando palavras chaves e padrões de datas. O critério é um dos códigos de conduta da HON e do Hospital John Kopkins. Para realizar essa avaliação a ferramenta chama uma função que varre o código fonte da página WEB, avaliando uma vez o texto da maneira que ele é interpretado e apresentado ao usuário, ou seja, apenas o texto, sem as marcações HTML, e outra vez diretamente o código fonte, junto com as marcações HTML. Através de expressões regulares são realizadas buscas para encontrar termos que identifiquem a possibilidade do documento possuir o critério de atualidade, como por exemplo, “Atualizado em.”; “data de publicação”; “ultima atualização”, e padrões de datas como, por exemplo, M/D/AA, M/D/AAAA, MM/DD/AAAA ou MM/DD/AA, como o apresentado na Figura 1, entre outros termos cadastrados no banco de dados da ferramenta. Caso seja identificado algum termo nessa etapa, a função retorna o valor TRUE para o programa principal. A pontuação recebida quando o critério é identificado é de 1 (um) ponto na pontuação total do documento avaliado. ‘/((0?[13578]|10|12)(-|\/)(([1-9])|(0[1-9])|([12])([0-9]?)|(3[01]?))(-|\/)((19)([29])(\d{1})|(20)([01])(\d{1})|([8901])(\d{1}))|(0?[2469]|11)(-|\/)(([1-9])|(0[1-9])|([12])([09]?)|(3[0]?))(-|\/)((19)([2-9])(\d{1})|(20)([01])(\d{1})|([8901])(\d{1})))/’ Figura 1 – Exemplo de expressão regular para padrões de datas M/D/AA, M/D/AAAA, MM/DD/AAAA ou MM/DD/AA. 4.1.3 Critério de Autoria O critério define que os endereços para contato ou telefone devem estar de fácil acesso aos visitantes, casos os mesmo queiram maiores informações ou ajuda adicional. É verificado se o documento possui endereço para contato, telefone, ou alguma forma de entrar em contato com o autor ou instituição. Esse critério é um dos 8 (oito) códigos de conduta definidos pela Health on the Net Foundation. Para realizar essa avaliação o programa computacional chama uma função que percorre o código fonte da página WEB, avaliando uma vez o texto da maneira que ele é interpretado e apresentado ao usuário, ou seja, apenas o texto, sem as marcações HTML, e outra vez diretamente o código fonte, junto com as marcações HTML. Através de expressões regulares são realizadas buscas para encontrar termos que identifiquem a possibilidade do documento possuir autoria, entre eles, “Fale conosco”; “Entre em contato.”; “Nosso contato[:punct:]”, e expressões para localizar código postal (CEP) e números de telefones com padrão utilizado no Brasil, como apresentados nos exemplos da Figura 2 e Figura 3, respectivamente, entre outros termos cadastrados no banco de dados da ferramenta, para esse critério. Caso seja identificado algum termo nessa etapa, a função retorna o valor TRUE para o programa principal. A pontuação recebida quando o critério é identificado é de 1 (um) ponto na pontuação total do documento avaliado. ‘/\d{5}\x2D\d{3}/’ Figura 2 – Exemplo de expressão regular usada para padrões de CEP 9 ‘/\(([0-9]{2}|0{1}((x|[0-9]){2}[0-9]{2}))\)\s*[0-9]{3,4}[- ]*[0-9]{4}/’ Figura 3 – Exemplo de expressão regular usada para padrões de telefones brasileiros 4.1.4 Critério de Complementaridade O critério propõe que a informação disponível no site é concebida apenas para apoiar, e não para substituir o relacionamento existente entre pacientes ou visitantes do site e seus médicos. É verificado se durante o texto, o documento deixa claro ao visitante que as informações dispostas no site devem ser usadas como consulta extra de informações. O critério é um dos códigos de conduta para os websites médicos e de saúde da HON. Para realizar essa avaliação o software chama uma função que percorre o código fonte da página WEB, avaliando uma vez o texto da maneira que ele é interpretado e apresentado ao usuário, ou seja, apenas o texto, sem as marcações HTML, e outra vez diretamente o código fonte, junto com as marcações HTML. Através de expressões regulares são realizadas buscas para encontrar termos que identifiquem a possibilidade do documento possuir complementaridade, como por exemplo, “Consulte um profissional”; “Consulta ao médico”; “Consultar sempre um médico”; “Consulte sempre um profissional”, “não substituem a consulta médica”, entre outros termos cadastrados no banco de dados da ferramenta, para o critério de complementaridade. Caso seja identificado algum termo nessa etapa, a função retorna o valor TRUE para o programa principal. A pontuação recebida quando o critério é identificado é de 1 (um) ponto na pontuação total do documento avaliado. 4.1.5 Critério de Popularidade O critério propõe que o documento tem mais credibilidade se o mesmo possui referências externa partindo de sites que o leitor confia. Essa avaliação é realizada através das referencias que o conteúdo apresenta, levando em consideração, que quanto mais referências externas uma página WEB apresenta, maior relevância ele tende a ter. Nesse critério é avaliado as referências apenas de sites governamentais, pelo motivo de os mesmos possuírem maior credibilidade, a analise é realizada pela URL do documento. O critério tem base na lista de critérios criada pelos bibliotecários do Hospital John Kopkins e os critérios apresentados na 15ª conferência Internacional de World Wide Web do Instituto de Ciências da Informação da Universidade do Sul da Califórnia. Para realizar essa avaliação o programa computacional faz a chamada de uma função especifica, enviando como parâmetro a URL de onde o documento esta hospedado, então utilizando a API do Google Web Search, a mesma realiza uma busca na Internet, para verificar os documentos que citam a URL do documento em questão. Caso seja identificada alguma referência externa para esse endereço, então é validado se o dominio da referência é de algum site governamental, essa validação é realizada atravéz da URL, com base nos cadastros dispostos no banco de dados da ferramenta. Caso seja identificada alguma referência de um site governamental para o documento, durante essa etapa, a função retorna o valor TRUE para o programa principal, que armazena essa informação para a apresentação dos resultados. A pontuação recebida quando o critério é identificado é de 2,5 (dois vírgula cinco) pontos na pontuação total do documento avaliado. 4.1.6 Critério de Fonte O critério da fonte do conteúdo, ou seja, quem esta fornecendo as informações e qual é credibilidade dessa fonte de informação, será oferecida ênfase apenas nos documentos hospedados em sites governamentais devido a sua maior credibilidade. O critério foi um dos apresentados no CINFORM – Encontro Nacional de Ciência da Informação, em Salvador no ano de 2005 e está presente em praticamente todos os organismos especializados em qualidade da informação na Internet estudados anteriormente. Para essa avaliação o programa computacional faz a chamada de uma função, enviando a URL do documento em questão, como parâmetro. Na função a URL recebida é decomposta, é verificado qual é o seu domínio, então é realizada uma comparação com base nos domínios cadastrados no banco de dados do software. A analise do domínio é realizada com base nas informações da Internet Corporation for Assigned Names and Numbers (ICANN) que é o órgão mundial responsável por estabelecer regras do uso da Internet. 10 Com essa padronização existente, pode-se analisar se um site tem domínio governamental. Essa analise pode ser feita verificando se a URL possui o domínio .gov ou .gov.br, por exemplo. Caso seja identificado que a URL é de um domínio governamental, a função retorna o valor TRUE para o programa principal, que armazena essa informação para a apresentação dos resultados. 4.2 Funcionamento do programa computacional Foi desenvolvida uma ferramenta simples e objetiva, para que, assim usuários leigos também tenham uma maior facilidade em seu uso. Contendo uma página HTML com um formulário de pesquisa, formado por um campo de texto input e um botão para solicitar a pesquisa. Para o uso do programa computacional, o usuário deve informar as palavras descritivas do assunto que deseja maiores informações no formulário da ferramenta. O método para realizar a pesquisa é a mesma forma que em qualquer outra ferramenta de busca na Internet, após realizar a entrada de dados, o usuário irá solicitar a busca e processamento das informações da pesquisa através do botão “Pesquisar” disponível na tela. A Figura 4 mostra a interface de pesquisa da ferramenta. A ferramenta captura as palavras descritivas informadas pelo usuário no formulário e as utiliza para efetuar uma pesquisa através da API do Google. Os dados coletados pela ferramenta são analisados e processados para se obter a avaliação de acordo com os critérios implementados. Durante esse processamento serão realizadas as validações das URL’s recebidas e processamento dos dados, momento que é aplicada a pontuação de acordo com a parametrização que foi definida para cada um dos critérios implementados. Figura 4 – Interface de pesquisa da ferramenta. Para cada resultado apresentado é possível consultar o detalhamento da pontuação recebida. Essa informação poderá ser visualizada na parte inferior de cada resultado, sendo que para cada critério encontrado, será exibido seu ícone correspondente. A Figura 5 apresenta os ícones usados na ferramenta, uma breve explicação dos critérios, quais são suas fontes de referência, e qual o valor atribuído ao documento, quando o mesmo for encontrado, essa informações podem ser consultadas pelo usuário, através do link “Como funciona”, que esta disponível no canto superior direito da ferramenta. O detalhamento da avaliação é um fator importante a ser apresentado para o usuário, pois assim o mesmo tem conhecimento de como a avaliação é realizada, como a nota e o posicionamento recebido foram 11 resolvidos pela ferramenta. Acredita-se que assim o programa computacional ganha maior credibilidade nas informações apresentadas, pois o usuário terá maior confiança no resultado apresentado ao entender como ele foi atribuído. Figura 5 – Ícones utilizados na ferramenta Os resultados obtidos são organizados por ordem decrescente da pontuação da avaliação, refazendo a ordenação inicial que foi recebida da API do Google. No lado esquerdo é exibida a pontuação do 12 documento, calculada de acordo com a soma dos critérios encontrados, o titulo é exibido na parte superior da direita, seguido de um breve resumo do documento, junto com a sua URL. Logo abaixo das informações básicas do documento, são exibidos os ícones dos critérios encontrados para aquela URL. No canto inferior direito um link denominado “Detalhes”, permite verificar os padrões encontrados para cada critério do documento avaliado, é um detalhamento mais técnico, não tão amigável a um usuário comum, sendo desenvolvido para usuários mais avançados que tenham pretensão de ver um detalhamento mais minucioso dos critérios encontrados, verificando partes do código HTML, padrões de palavras e códigos que definiram os critérios. As URL’s que contêm o tema saúde são exibidas em azul, dando assim um maior destaque para as mesmas, e as que não foram identificadas como página que contêm o tema saúde são exibidas em cinza. A Figura 6 apresenta um exemplo de resultado de uma página identificada como documento que contem tema da área de saúde. Figura 6 – Exemplo de um resultado obtido Devido ao número de consultas necessárias para avaliar a quantidade e origem das referências de links HTML recebidas por cada página WEB, decidiu-se trabalhar com até 8 (oito) resultados oriundos da API do Google Web Search, pois a mesma, atualmente fornece apenas 100 consultas por dia para usuarios gratuitos. O propósito da ferramenta é realizar uma analise apenas em documentos HTML, sendo que são descartados documentos digitais em outros formatos, por exemplo, *.doc, *.pdf, *.ppt, etc,. Isso porque a ferramenta trabalha diretamente com tags de HyperText Markup Language para obter os dados para analise do documento. 4.3 Tecnologia utilizada no programa computacional O programa computacional foi desenvolvido com interface WEB, e com estrutura compatível com os navegadores Internet Explorer 7 ou superior, e Mozilla Firefox 3.0 ou superior. Optou-se por usar a linguagem de programação Hypertext Preprocessor (PHP) para realizar o processamento dos dados recebido pela ferramenta de meta-busca. A escolha da linguagem de programação PHP, foi pelo motivo de a mesma atender os requisitos necessários para as necessidades do programa computacional e necessidade de poucos requisitos para executá-la em um servidor. Foi utilizado Servidor HTTP Apache para execução da linguagem. No desenvolvimento das interfaces, foi utilizado HyperText Markup Language (HTML). Para auxiliar em uma maior interação do usuário com a interface do programa computacional foi utilizado a linguagem de programação JavaScript. E utilização de Cascading Style Sheets (CSS) para a edição da apresentação dos documentos escritos com a linguagem de marcação HTML. Foi utilizado o MySQL como sistema de gerenciamento de banco de dados (SGBD), o mesmo é necessário para realizar a parametrização utilizada e para se obter uma maior flexibilidade na ferramenta. O banco de dados é composto por duas tabelas, que são utilizadas para a parametrização da ferramenta. A tabela CRITERIOS é utilizada para o cadastro dos critérios, descrições e explicações de seus princípios, fonte de referencia e valor que ele possui. A tabela TERMOS possui o cadastro das expressões e padrões que são utilizados pela ferramenta durante a avaliação dos documentos. O modelo Entidade-Relacionamento (ER) apresenta de maneira gráfica as tabelas, e seus respectivos campos, do banco de dados. O ER do sistema está representado pela Figura 7. 13 Figura 7 – Modelo ER do Sistema O dicionário de dados é uma listagem organizada de todos os elementos de dados que são utilizados no sistema, possuindo um conteúdo preciso, conciso e não redundante. O dicionário de dados da tabela CRITERIOS e TERMOS estão representados no Quadro 1, e Quadro 2, respectivamente. Quadro 1 – Dicionário de Dados da tabela CRI|TERIOS Campo Tipo Nulo Padrão Comentários id int(11) Não Chave primária nome varchar(25) Não Atributo que representa o nome do critério desc varchar(500) Não Atributo que representa descrição do critério fonte varchar(200) Sim NULL Atributo que representa a fonte do critério valor double(10,1) Sim NULL Atributo que representa o valor do critério Quadro 2 – Dicionário de Dados da tabela TERMOS Campo Tipo Nulo Padrão Comentários id int(11) Não Chave primária criterio_id varchar(25) Não Chave estrangeira exp varchar(500) Não Atributo que representa a expressão regular do termo O programa computacional utiliza as funcionalidades do Google Web Search API do Google <http://code.google.com/intl/pt-BR/apis/websearch>, que permite utilizar o serviço de Pesquisa Google na WEB. A utilização da API do Google, foi devido a mesma atender todas as necessidades de pesquisa na WEB necessárias na ferramenta desenvolvida. 5 RESULTADOS E VALIDAÇÃO DA FERRAMENTA Para apresentação dos resultados fornecidos pela ferramenta, realizou-se uma pesquisa com as palavras descritivas: “Tratamentos para Bulimia”. Os resultados encontrados serão apresentados comparando os resultados fornecidos pela ferramenta de busca Google e pelo sistema desenvolvido neste trabalho. Decidiu-se validar o documento “BULIMIA – ABC da Saúde”, disponível no endereço <http://www.abcdasaude.com.br/artigo.php?139>, pois o mesmo apresentou maior numero de critérios e maior pontuação na ferramenta desenvolvida, sendo que dessa forma é possível fazer um maior numero validações dos critérios para ela. A primeira busca tendo como foco principal a utilização da ferramenta Google apresentou o documento em questão, na nona posição. Devido a utilização de seus ranking critérios de avaliação, definidos por seu algoritmo de calculo, denominado PageRank, pelo calculo de popularidade, links de referencias, adequação do termo pesquisado ao conteúdo, entre vários outros fatores que a ferramenta utiliza como critério de posicionamento. A segunda busca, a qual foi dada ênfase nesta pesquisa, realizou-se com a ferramenta chave, disponível em <http://edemar.eti.br/tcc> que, por sua vez, traz o tema estudado em primeira posição. Abrangendo os critérios de classificação para a classificação tem-se: Autoridade; Atualidade; Autoria; Complementaridade; e Popularidade, todos expostos por ícones. Corrobora-se, juntamente com os critérios avaliativos pelos organismos especialistas no assunto de qualidade de informação, que a grande diferença 14 entre as posições referentes ao documento “BULIMIA – ABC da Saúde”, no viés da ferramenta desenvolvida, se refere a utilização da mesma ser direcionada para temas da área da saúde. Os resultados obtidos, em ambas as pesquisas, são apresentados na Figura 8, esboçado a esquerda, tem-se a ordem da classificação da ferramenta desenvolvida e a direita a classificação da busca realizada pela ferramenta de busca Google. Figura 8 – Resultados da busca em ambas as ferramentas 5.1.1 Validação dos critérios encontrados pela ferramenta Para a verificação dos resultados apresentados pela ferramenta, por meio de indicativo dos ícones, acessou-se a URL <http://www.abcdasaude.com.br/artigo.php?139> do primeiro resultado: “BULIMIA – ABC da Saúde”, para localizar a existência dos critérios encontrados para o documento. O relatório dos termos encontrados, pode ser visualizado na Figura 9, os resultados da analise serão apresentados a seguir. Para o critério de autoridade, que segundo a ferramenta esta presente no documento, foi encontrado no código-fonte palavras-chaves que podem ser classificadas como critérios para autoridade. Pressupõem-se então que esse documento foi produzido por profissionais qualificados, e são acreditados por um órgão adequado na área de saúde. Os indicativos encontrados foram: • Dra. Alice Sibile Koch • Dra. Dayane Diomário da Rosa • Dra. Ana Luiza Galvão • Selo do HONcode - “Nós aderimos aos princípios da carta HONcode.” No critério de atualidade, foram encontrados padrões de datas, e palavras-chaves que identificam que a mesma possui datas de criação, atualização e revisão do documento. • Esta página foi atualizada em 05/01/2010. 15 • Data de publicação: 01/11/2001 • Revisão: 05/01/2010 Para a avaliação de autoria do documento, um dos critérios mais importantes para medir a credibilidade da informação, foi encontrado um link para um formulário de contato, possibilitando assim que qualquer leitor tenha contato direto com os editores do site em questão. No critério de complementaridade, foi encontrada na página, uma notificação alertando que o site tem por objetivo apoiar e não substituir o relacionamento entre pacientes, visitantes do site e médicos. O alerta encontrado foi: • Tais informações não deverão, de forma alguma, ser utilizadas como substituto para o diagnóstico médico ou tratamento de qualquer doença sem antes consultar um médico. Para a verificação do critério de popularidade, verificou-se, se que o endereço digital <http://www.portal.santos.sp.gov.br/seduc/page.php?226> descrito na pagina “Mais Detalhes” possuía um link de referenciando o documento analisado. Figura 9 – Relatório dos padrões encontrados. 16 6 CONSIDERAÇÕES FINAIS Embora não muito divulgadas, existem várias iniciativas com o objetivo de estabelecer padrões de critérios ou certificações sobre as informações em saúde disponíveis na Internet, porem ainda não se tem uma padronização mundial que garanta ao usuário uma maior segurança nas informações obtidas. Sendo que esses filtros e critérios devem ser aplicados de forma manual fazendo que esse processo seja ainda mais demorado e trabalhoso, e provavelmente obscuro para usuários leigos. É importante a observação que alguns dos critérios apresentados, como os da HON, por exemplo, estão mais voltados para códigos de conduta, os mesmos definem padronizações para confiabilidade dos documentos disponíveis na Internet, porem não avaliam a qualidade da informação apresentada pelo mesmo. Observou-se que parte dos critérios, que foram criados por grandes organismos especialistas no assunto de qualidade de informação na Internet, podem ser implementados de maneira satisfatória, em uma ferramenta computacional, e assim auxiliar nesse processo que tende a ser repetitivo e demorado quando executado manualmente. Alguns dos critérios estudados apresentaram-se muito complexos para serem automatizados em um programa computacional, sendo necessária uma avaliação humana, pois envolvem analises minuciosas e exigem uma avaliação bem criteriosa, especificamente humana, como por exemplo, o critério de justificativa, onde as informações apresentadas sobre os benefícios e o desempenho dos tratamentos, produtos ou serviços devem estar baseadas em evidencias adequadas e equilibradas, com atribuições as comprovações. Uma das limitações fortes na ferramenta, é a utilização de serviços de terceiros como a API do Google, que é uma recurso limitado, oferecendo apenas 8 resultados a cada requisição, e um limite máximo de 100 buscas por dia, sendo ainda que esse recurso esta sendo depreciado pela empresa. Em relação aos trabalhos futuros, existem melhorias que poderiam ser aplicadas a essa ferramenta afim de melhor seu funcionamento, algumas delas são listadas a seguir: • Incluir outras fontes de pesquisas na Internet, além da API do Google, como Yahoo! Search Web Services, Bing Search entre outros disponíveis na WEB. Para melhorar o numero de resultados e melhor avaliação de critérios como popularidade, por exemplo. • Criar uma paginação, oferecendo assim a possibilidade de se obter mais resultados referentes ao assunto pesquisado. • Acrescentar a opção de avaliar o site completo de cada resultado, para se obter uma avaliação mais global da fonte consultada. • Adicionar a opção de avaliar um site especifico através da sua URL, assim quando o usuário quiser, ele pode avaliar um site que ele já tenha conhecimento. REFERÊNCIAS GIL, Yolanda; ARTZ, Donavan. Towards Content Trust of Web Resources. ACM - Association for Computing Machinery, New York, NY, USA, 2006. HON, Health On the Net Foundation. Disponível em: <http://www.hon.ch> . Acesso em 12 set 2010. JUZZO, Luisa Maria Larcher Caliri. Critérios para avaliação da qualidade das informações sobre saúde disponíveis online. Disponível em <http://telemedicina.unifesp.br/pub/SBIS/CBIS2004/trabalhos/arquivos/419.pdf>. Acesso em 10 set 2010 KIRK, Elizabeth E. Evaluating Information Found on the Internet. Disponível em <http://www.library.jhu.edu/researchhelp/general/evaluating>. Acesso em 2 out 2010. LOPES, Ilza Leite de Azevedo Santos. Proposta de critérios de qualidade apara avaliação da informação em saúde recuperada nos sites brasileiros da Word Wide Web. Disponível em: <http://repositorio.bce.unb.br/bitstream/10482/5040/1/2006%20Ilza%20Leite%20de%20Azevedo%20Santo s%20Lopes.pdf>. Acesso em 27 set 2010. 17 MARIN, Heimar de Fátima. Informática em Enfermagem. São Paulo: Editora Pedagógica e Universitária Ltda, 1995. MARQUES, Isaac R. Métodos para avaliação da qualidade da informação de saúde na Internet. Acta Paul Enf 2003; 16(1): 84-91. PINTO, Marli Dias. de Souza. et al. Diversidade da recuperação de informações via Internet na pesquisa e ensino. Rev. ACB: Biblioteconomia em Santa Catarina, v. 8/9, p. 143-154, 2003/2004. Disponível em <http://revista.acbsc.org.br/index.php/racb/article/view/399/498> Acesso em: 18 set 2010. SALES, Ana Lídia Campos; TOUTAIN, Lídia Brandão. Aspectos que norteiam a avaliação da qualidade da informação em saúde na era da sociedade digital. In: CINFORM - ENCONTRO NACIONAL DE CIÊNCIA DA INFORMAÇÃO, 5., 2005, Salvador. Anais... Salvador, 2005. Disponível em: <http://dici.ibict.br/archive/00000487/01/AnaLidiaSales.pdf>. Acesso em: 18 set 2010. SALES, Rodrigo de; ALMEIDA, Patrícia Pinheiro de. Avaliação de fontes de informação na internet: Avaliando o site do NUPILL/UFSC. Revista Digital de Biblioteconomia e Ciência da Informação, Campinas, v. 4, n. 2, p. 67-87, jan./jun. 2007. WILLIAMS, Martym. G8 to meet developing nations on digital divide. Disponível em: <www.cnn.com/2000/TECH/computing/07/19/g8.divide.idg/index.html>. Acesso em: 12 set. 2010. WRAPIN, Worldwide Online Reliable Advice to Patients and Individuals. Disponivel em <http://www.wrapin.org>. Acesso em 27 set 2010. 18