UM SOFTWARE PARA AVALIAÇÃO DE QUALIDADE DE
FONTES DE INFORMAÇÃO EM SAÚDE NA WEB
Edemar Oliveira da Silva1 <[email protected]>
Dr. Stanley Loh2 <[email protected]> – Orientador
Universidade Luterana do Brasil (ULBRA) – Curso de Sistemas de Informação – Campus Canoas
Av. Farroupilha, 8.001 – Bairro Luís – CEP 92420-280 – Canoas – RS
30 de outubro de 2011
RESUMO
Este trabalho apresenta a proposta de uma ferramenta que visa auxiliar na tomada de decisão de fontes de informação
em saúde na web, fornecendo ao publico leigo uma forma mais simples de avaliar sua credibilidade. Para isso foram
definidos alguns critérios para serem implementados em um software computacional, critérios esses que são
originados por instituições que realizam estudos e pesquisas na tentativa de estabelecer métodos para definir a
qualidade para esse tipo de informação na Internet.
Palavras-chave: Qualidade da Informação; Internet; Avaliação; Informação em saúde; Software;
ABSTRACT
Title: “A software for evaluation of quality of health information source on the WEB”
This article presents proposal for a tool to assist in decision making in health information sources on the web,
providing the lay public a simpler way to evaluate their credibility. For some criteria that were set to be
implemented in a computer software, these criteria that are originated by institutions that conduct research and
studies in an attempt to establish methods to define quality for this kind of information on the Internet.
Key-words: Quality of Information; Internet; Evaluation; Health information Software;
1
INTRODUÇÃO
Em qualquer meio de comunicação as informações não confiáveis, incorretas, podem causar danos,
tanto as pessoas, quanto para as organizações que confiam nelas como verídicas e confiáveis. Na internet
não é diferente e como essas informações crescem rapidamente de forma desordenada, temos muita
informação não verídicas e de baixa qualidade. Esse crescimento criou dificuldades para se localizar
informações especificas e precisas na área de saúde, tanto para profissionais da área quanto para usuários
leigos no assunto. Informações desatualizadas, inválidas, falsas ou tendenciosas, e a grande quantidade de
conteúdo no mínimo duvidoso em toda a World Wide Web (WEB), é o grande problema atualmente, ao
confiar em informações oriundas da Internet.
Em portais de busca, o resultado das pesquisas relacionadas a saúde, comumente apresentam
informações divergentes com as de um profissional de saúde, quando o uso dessa ferramenta é feito por um
usuário leigo, a falta de conhecimento adequado para avaliar a qualidade dessas informações recuperadas,
torna-se essa questão mais crítica, sendo que com a popularização do uso Internet esse número vêm a
crescer.
Um exemplo dessa prática foi presenciado pelo ex-presidente dos Estados Unidos da América, Bill
Clinton, em uma visita a Índia, onde ele viu uma mulher entrar em um centro de saúde da aldeia, e realizar
uma pesquisa sobre como cuidar de seu bebê, utilizando informações de um site da WEB. (WILLIAM,
2010). Não se sabe qual foi resultado da ação dessa mulher em confiar em informações de saúde disponíveis
na internet, mas mostra como essa pratica é comum e realizada sem orientação ou qualquer tipo de ajuda de
profissionais que possam auxiliar na seleção de informações confiáveis.
De acordo com Marin (1995, p. 2) na área da saúde a informação é um dos principais, se não o
principal recurso necessário para os profissionais exercerem a profissão com qualidade e eficiência e que ter
ou não essas informações pode implicar em ter ou não sucesso na aplicação de algum cuidado ou tratamento
prestado ao paciente. Informações não confiáveis podem acarretar grandes riscos na área da saúde, para
1
2
Aluno do curso de Sistemas de Informação da Universidade Luterana do Brasil (ULBRA).
Professor orientador da Universidade Luterana do Brasil (ULBRA).
1
usuários que desconhecem padrões de qualidade nos documentos disponíveis na WEB, que com a
popularização do uso da internet, essa prática esta cada vez mais frequente.
A questão da qualidade da informação na área da saúde torna-se mais preocupante pela facilidade
que qualquer pessoa com acesso a internet e com mínimo de conhecimento em informática consegue criar
um site e publicar seus artigos, com baixa ou nenhuma credibilidade no assunto tratado, uma vez que não se
tem nenhum tipo de controle sobre as páginas publicadas na rede, assim essas informações crescem de
forma desordenada e rapidamente.
O problema, portanto, já não é mais em encontrar a informação, mas avaliar a credibilidade da
mesma, bem como a relevância e a precisão de um documento encontrado na Internet.
Tendo em vista essa realidade, esse trabalho apresenta uma ferramenta de software com
implementações de métricas e critérios definidos por organismos especializados em qualidade da
informação na Internet. Serão apresentadas as instituições que realizam estudos e pesquisas a fim de
melhorar a qualidade da informação na Internet, sendo definindo padronizações para confiabilidade dos
documentos disponíveis, ou avaliando os fornecedores dessas informações.
Será apresentado como a avaliação da qualidade da informação em saúde na Internet é realizado
atualmente, e como essas informações são classificadas de maneira manual. Será apresentada também uma
analise de critérios, filtros, e métricas que foram implementados no programa computacional, com o
objetivo de automatizar essa atividade.
Será exposto como essa ferramenta foi implementada, demonstrando como o programa
computacional realiza as avaliações, como é seu o funcionamento, uma analise das tecnologias usadas para o
desenvolvimento, seus objetivos e resultados. A descrição de cada sessão será apresentada a seguir.
A sessão 2 descreve um estudo sobre a avaliação da qualidade da informação na Internet, e um
estudo com foco na avaliação na área de saúde, assim como exemplos de ferramentas disponíveis atualmente
para realizar essa avaliação de forma automatizada. A sessão 3 apresenta uma análise de como a avaliação
da qualidade da informação é realizada de forma humana e de forma automatizada. A sessão 4 descreve a
solução proposta do software para avaliação automatizada da qualidade de fontes de informação em saúde
na WEB, apresentação dos critérios que utilizados na implementação e apresentação da ferramenta
desenvolvida. A sessão 5 apresenta a avaliação da ferramenta e seus resultados. Por fim são apresentadas as
considerações finais do trabalho, limitações e sugestão de trabalhos futuros.
2
AVALIAÇÃO DA QUALIDADE DA INFORMAÇÃO NA INTERNET
A busca de informações com qualidade na internet pode ser uma tarefa difícil devido a grande
quantidade de informação disponível, sendo que filtrar essas informações é uma tarefa que toma grande
tempo, principalmente para quem tem pouco conhecimento no assunto pesquisado, assim os resultados de
pesquisas realizadas podem possuir muita informação irrelevante e não confiável.
Na tentativa de melhorar essa realidade, algumas instituições vêm realizando estudos e pesquisas
para atribuir critérios de avaliação, para assim tornar as informações oriundas da internet mais confiáveis. A
idéia central dos critérios e/ou filtros para avaliação, baseia-se em listas que contenham categorias e subcategorias dos problemas relacionados com a qualidade da informação na Internet.
Gil e Artz (2006) do Instituto de Ciências da Informação da Universidade do Sul da Califórnia
apresentaram na 15ª conferência Internacional de World Wide Web uma seleção de dezenove critérios
possíveis para avaliação da informação na internet:
• Tema, um site torna-se mais confiável quando oferece informações sobre um tema especifico;
• Contexto e criticidade, caso a informação seja critica, a mesma deve possuir elevada precisão;
• Popularidade, quanto mais referência o conteúdo possui, mais ele tende a ser confiável;
• Autoridade, o autor do documento deve ter domínio do assunto que esta apresentando;
• Experiência direta, interação direta do leitor com um recurso que fornece informações;
• Recomendação, o documento possui referência de outros usuários confiáveis;
• Recursos relacionados, relação com outras entidades e/ou instituições que remetem confiança;
• Proveniência, transmite confiança nas entidades responsáveis pela geração do conteúdo;
• Experiência, conhecimento do usuário em relação ao conteúdo apresentado;
• Tendência, o autor pode enfatizar algumas informações positivas e omitir as negativas;
2
• Incentivo, a informação tende a ser confiável, se existe uma motivação para se fornecer
informação precisa;
• Escassez de recursos, ausência de fontes alternativas podem resultar em maior confiança em
informações imprecisas, que estão ao alcance do usuário;
• Conformidade, mesmo que a informação não transmita muita confiança, o leitor pode acabar
confiando, caso vários outros recursos enfatizem o conteúdo apresentado;
• Especificidade, conteúdo preciso e especifico tende a gerar mais confiança ao leitor;
• Probabilidade, probabilidade de o conteúdo estar correto de acordo com conhecimento do leitor;
• Atualidade, dependendo do conteúdo, sua vida útil pode ser pequena e mudar constantemente;
• Aparência, percepção do usuário em relação ao aspecto do conteúdo pode influenciar na
confiança;
• Engano, recursos com intenções enganosas tende a atenuar a confia do leitor no conteúdo;
• Recência, a confiança no conteúdo pode mudar com o tempo, um recurso que tinha má
reputação, pode agora ter reputação melhor, ou vice versa;
Sales e Toutain (2005) citam como critérios gerais para avaliação categorias como:
• Escopo do site: Onde se deve avaliar a proposta do site, recursos disponíveis, organização da
informação se combina informação educacional;
• Fonte: Pode-se verificar quem é o autor ou criador do site, se as informações são fornecidas por
organizações, instituições governamentais, universidade ou por uma pessoa física, data de
fundação do site, se os autores são claramente identificados e se suas qualificações sobre o
assunto estão disponíveis.
• Fluxo da informação: Pode-se verificar se as informações disponíveis são revisadas e atualizadas
regularmente, se os artigos estão identificados com o nome do autor e a data de publicação é
informada, se esta claro que a data informada é de publicação ou de revisão. Se os links HTML
foram revisados e estão funcionando.
• Apresentação: Pode-se verificar se a interface do site é amigável, se possui um sistema de busca
interno e em fácil localização na tela, em relação aos textos se possuem correteza, seguindo as
regras de gramáticas, ortografia, pontuação.
• Outros critérios: Se há necessidade de enviar informações confidenciais para ter acesso ao
conteúdo, se não há exibição de pop-ups ou frames.
De acordo com Sales e Almeida (2007) um estudo realizado por Pinto (2004) com membros
acadêmicos das áreas de Engenharia Civil, Educação Física e Administração, com foco no uso da internet,
demonstrou que os critérios adequados para essa avaliação deveriam envolver os seguintes aspectos:
autoridade da fonte; escopo; conteúdo; publico alvo; proposta da informação; endereço do documento, corpo
editorial; atualidade da informação.
2.1
Critérios para avaliação da qualidade da informação em saúde na Internet
Os resultados de diversas organizações que tem realizado estudos e pesquisas referentes ao uso da
Internet para obter informações na área da saúde, têm indicado que as pessoas realizam pesquisas de
maneira aleatória, utilizando ferramentas de busca de uso geral, onde grande parte das informações é
irrelevante. São realizadas sem a ajuda de profissionais de saúde, e a maioria das pessoas acredita que se a
informação esta na publicada na internet ela é confiável (JUZZO. p.2 )
Em relação a avaliação da informação sobre saúde na Internet, tem-se critérios semelhantes ao
analisados anteriormente, porem essa analise deve ser mais critica devido ao riscos que podem ser causados
por informações oriundas de pessoas sem conhecimento qualificado para fornecer esse tipo de informação.
Numa tentativa de minimizar esse problema, algumas organizações vêm estudando e desenvolvendo critérios
que auxiliem na avaliação da qualidade da informação na área da saúde, como os apresentados a seguir.
2.1.1
Critérios para avaliação da Health on the Net Foundation
A Health on the Net Foundation (HON) é uma organização não governamental e sem fins lucrativos,
fundada em 1995, com objetivo auxiliar a identificar sites confiáveis na área da saúde. Possui o HONCode,
que é um código de conduta para os websites médicos e de saúde, esse código possui oito princípios que são
considerados essenciais para atribuir qualidade da informação na área de saúde, modificado nos primeiros
dez meses de sua existência, ampliou de seis para oito princípios, e sua versão atual tem-se mantido
3
inalterada desde abril de 1997. A certificação do HONCode não é um sistema de premiação de qualidade, e
nem pretende avaliar a qualidade da informação do site, apenas define um conjunto de regras éticas na
apresentação das informações e ajuda os leitores a conhecer a origem e a finalidade das informações que
estão lendo, a certificação HONCode é gratuita. (HON, 2009). Os princípios considerados essenciais para a
HON são:
• Autoridade: Define que todas as orientações médicas e de saúde do site deve ser produzidas por
profissionais qualificados. Caso contrário deve ser declarado expressamente que a orientação
esta sendo fornecida por uma pessoa ou organização que não tem qualificações adequadas na
área médica.
• Complementaridade: As informações publicadas no site devem ter o objetivo de apoiar e não
substituir a relação do médico com o paciente.
• Confidencialidade: O site deve assegurar o sigilo dos dados e identidade dos pacientes e
visitantes, respeitando os requisitos legais mínimos de privacidade de informação médica e de
saúde vigente no país ou estado onde o site se localiza.
• Atribuições: O site deve apresentar referências claras das fontes consultadas, se possível
informar os links HTML para essas fontes. A data da última atualização da página WEB também
deve estar disponível para o visitante de uma forma clara, como por exemplo, no topo da página.
• Justificativas: As informações apresentadas sobre os benefícios e o desempenho dos tratamentos,
produtos ou serviços devem estar baseadas em evidencias adequadas e equilibradas, com
atribuições as comprovações.
• Autoria: As informações dispostas no site devem estar de forma mais clara possível, endereços
para contato devem estar de fácil acesso aos os visitantes, caso os mesmos queiram maiores
informações ou ajuda adicional. Endereço de e-mail do responsável pelo site deve estar
disponível em todas as páginas do site.
• Patrocínio: Qualquer tipo de apoio que tenha contribuído para ajuda financeira, serviços ou
recursos materiais por organizações comerciais e não-comerciais, devem estar claramente
identificados aos visitantes.
• Publicidade: O site deve indicar claramente se a publicidade é uma das fontes de renda usadas e
fornecer uma breve descrição da política de divulgação empregada. Anúncios e materiais
promocionais devem ser apresentados de uma maneira e um contexto que facilitem diferencia-los
do conteúdo produzido pela instituição administradora do site.
2.1.2
Critérios para avaliação apresentados pelo Hospital John Kopkins
O Hospital John Kopkins possui uma lista de critérios que foram elaborados por bibliotecários que
possuem contato com a área médica, este documento esta disponível em sua página da internet. O
documento é dividido por categoria, dispondo assim de filtros para a avaliação da qualidade da informação.
De acordo com Kirk (1996) os critérios avaliados devem ser:
Autoria: Critério mais importante ao avaliar uma informação. Quando encontramos uma
informação que nos é importante, e a mesma tem um algum valor para nossa necessidade, queremos saber
quem escreveu, qual é a autoridade do autor, para esse critério podemos avaliar:
• Reconhecimento e prestigio do autor em seu campo de estudo;
• Citações positivas por outros autores reconhecidos como autoridade no campo de estudo;
• Referência externa partindo de sites que o leitor confia;
• Dados biográficos do autor disponíveis que permita avaliar as suas credenciais;
• Caso não possua os itens anteriores, deve se verificar a existência de telefone e/ou endereço
postal. Apenas o endereço de e-mail é informação insuficiente.
Corpo do texto: Critério que pode auxiliar na avaliação da qualidade em documentos impressos,
significa que a revisão do texto foi feita por críticos qualificados, na internet para realizarmos essa avaliação
e autoridade do editor, podemos realizar os seguintes filtros em relação a onde o documento está localizado:
• Identificação de alguma organização confiável, sendo no rodapé, logotipo, ou marca d’água que
identifica quem fornece o documento. Possibilidade de entrar em contato com webmaster a partir
de dados disponíveis no documento. Organização é acreditada academicamente;
• Possibilidade de ligá-la a uma página onde conste no nome da intuição, com a possibilidade de
identificar a URL como uma organização confiável;
4
• A entidade que hospeda o documento é reconhecida no campo da atuação indicado;
• A entidade que hospeda o documento é adequada para abordar o requerido tema;
• O autor do texto tem vinculação com a organização responsável pelo site e o documento em
questão tem indícios que foi produzido em função da vinculação com a instituição, não
remetendo um vinculo passageiro dos mesmos;
• É possível conferir a identidade do servidor onde o documento está hospedado, usando por
exemplo nslookup e whois;
• A página consultada esta hospedada em um domínio de um site oficial ou endereço pessoal? Essa
informação deve ser analisada com o máximo de cuidado.
Ponto de vista: A informação raramente é neutra, com a popularidade da internet, uma página WEB
torna-se um local perfeito para distribuir essa informação de modo seletivo. Então torna-se importante
avaliar quem esta fornecendo a informação e avaliar se essa poderia ser um ponto de vista ou preconceito
sobre o assunto tratado.
• Caso o documento esteja hospedado em uma organização, é provável que a informação sobre a
mesma, será apresentando de maneira mais positiva possível. Caso documento esteja hospedado
em uma empresa, a mesma pode estar apresentando um anuncio de um produto e/ou serviço, da
mesma forma pode estar sendo apresentada uma opinião preconceituosa sobre o assunto;
• Documento hospedado em um servidor de uma organização política ou filosófica com
informações de modo seletivo;
Referência ou Conhecimento da Literatura: Faz referência ao contexto que o autor situa seu
trabalho, revelando assim se o mesmo tem conhecimentos sobre a disciplina e suas práticas, permitindo ao
leitor avaliar a escolaridade e os conhecimentos da área de discussão do autor. Para esse filtro sugerem-se os
seguintes critérios:
• Bibliografia do documento;
• Referências corretas e adequadas, mostrando conhecimento de fontes relacionadas;
• O autor demonstra ter conhecimento de teorias, escolas de pensamento e técnicas que são
consideradas apropriadas para o assunto tratado.
• O autor menciona que esta utilizando uma teoria e/ou técnica nova como base para sua
investigação e discute seus valores e limitações da nova abordagem.
• Se autor usa uma abordagem controversa do problema, o mesmo demonstra conhecimento disso?
Precisão ou verificabilidade: Parte importante do processo de avaliação, principalmente quando se
trata de uma obra de um organização ou autor desconhecido. Critérios de avaliação de precisão:
• Quando for um documento de investigação, informa como realizar as interpretações do
fenômeno;
• Apresenta uma metodologia adequada ao tema e permite realizar estudos para sua verificação;
• Apresenta fontes que estão listadas na bibliografia, ou mesmo, inclui links para os próprios
documentos;
• Menciona fontes e indivíduos que forneceram dados não publicados, que foram utilizados no
estudo;
• Informações antecedentes utilizadas no trabalho como base estão verificadas na sua correção.
Atualidade: Refere-se a atualidade da informação, em algumas área de estudo, a atualidade não é
um critério muito importante, porem na área da saúde esse é um dos critérios mais importante a ser
analisado. Em relação a esse critério temos os seguintes filtros:
• Informa a data em que a informação apresentada foi coletada;
• Refere-se a data da informação de forma clara;
• Inclui informações sobre a regularidade das atualizações, quando ouve necessidade de
acrescentar ou atualizar os dados;
• Inclui a data de publicação e data de última atualização;
• Inclui data de direitos autorais;
• Caso não o documento não possua essas informações, é possível verificar a data do documento
no diretório onde o mesmo encontrar-se hospedado?
5
2.1.3
Critérios de avaliação desenvolvidos pelo Health Information Technology Institute
De acordo com Lopes (2006) e Marques (2003) o documento Criteria for Assessing the quality of
Health Information on the Internet (Critérios para avaliação da qualidade da Informação em Saúde na
Internet), desenvolvido pelo Health Information Technology Institute (HITI) e a empresa Mitretek System,
com intermédio do Health Summit Working Group (HSWG), possui sete categorias de critérios para avaliar
a qualidade da informação em saúde na Internet: credibilidade; conteúdo; apresentação do site; link, design;
interatividade; anúncios.
Quanto a credibilidade da informação são verificados elementos como: Fonte médica - considerado
o primeiro elemento para estabelecer que o documento possui credibilidade e qualidade, esse critério
envolve, visualização do nome da instituição e do autor.
Também é usado como critérios o contexto; a atualidade da informação; sua pertinência/utilidade
além do processo de revisão editorial.
Em relação ao conteúdo devem-se ser verificados os critérios como, a acurácia da informação; a
comprovação de evidências; a precisão das fontes apresentadas; a disponibilização de avisos institucionais,
informado os objetivos, autoridade e limitações da informação; a completeza da informação.
No quesito apresentação do site, os critérios avaliados são: os objetivos da instituição e o perfil do
site, onde deve ser descrito seu perfil para seus usuário ou consumidores.
Em relação a categoria links os critérios avaliados estão ligados com a seleção dos links; a
arquitetura que os mesmos são apresentados, a relação com o conteúdo apresentado e links de retorno.
Na categoria Designer deve se analisar critérios como: acessibilidade; navegabilidade, mecanismos
de buscas internos. Os requisitos de interatividades e anúncios devem ser avaliados os mecanismos de
retorno da informação, fórum de discussão e também a explicitação de algoritmos e as chamadas que
vinculam propagandas.
2.1.4
Critérios de avaliação da American Medical Association
A American Medical Association (AMA) iniciou o desenvolvimento de suas normas para qualidade
para páginas Web no inicio de 1999, essas normas foram definidas para orientar tanto os responsáveis pelo
desenvolvimento das páginas Web tanto para os provedores de informação de saúde.
Foram definidas quatro áreas principais que necessitavam de normas de qualidade: conteúdo;
publicidade e patrocínio; privacidade e confidenciabilidade; e comercio eletrônico.
As normas da AMA são semelhantes as das instituições HON e HITI apresentadas anteriormente. O
grupo permanente da AMA para a atualização das normas é formado por funcionários na área editorial da
própria organização e também por consultores externos. LOPES (2006) apud WINKER(2004).
2.2
Ferramentas para avaliação da qualidade da informação na Internet
A busca por informações na Internet, em sua grande maioria é realizada por ferramentas de
pesquisas WEB comuns, como o Google <www.google.com>, por exemplo, e os critérios apresentados
anteriormente, quando aplicados, são de forma manual.
Durante o estudo percebeu-se que as ferramentas para avaliação da qualidade da informação de
forma automatizada ou semi-automatizada ainda não são muito comuns, e estão começando a surgirem.
2.2.1
WRAPIN - Worldwide Online Reliable Advice to Patients and Individuals
O protótipo WRAPIN - Worldwide Online Reliable Advice to Patients and Individuals, tem como
objetivo oferecer informações médicas e de cuidados com a saúde de forma mais confiável e segura.
A ferramenta fornece um mecanismo que permite uma comparação de documentos de saúde com
base em informações publicadas na literatura e fornece um resumo com as conclusões obtidas. Essa
ferramenta tem como objetivo auxiliar a determinar a confiabilidade dos documentos disponíveis na WEB,
verificar em relação aos parâmetros estabelecidos e determinar uma relevância determinada na página de
resultados da pesquisa.
O WRAPIN faz uso de novos desenvolvimentos no mapeamento de termos médicos, tecnologia de
buscas por indexação e processamento de linguagem natural. Os resultados de pesquisa do WRAPIN não
6
pretendem ser relevante só nas pesquisas, mas também permitir ao usuário determinar a qualidade, em
relação as referências e confiabilidade dos documentos. WRAPIN (2010).
2.2.2
Busca Saúde
O projeto de pesquisa foi desenvolvido para o Programa de Pós-graduação em Informática em
Saúde,
na
Universidade
Federal
de
São
Paulo
(UNIFESP),
esta
disponível
em
<http://buscasaude.unifesp.br>, tem por objetivo a recuperação de conteúdos através de recursos de
ferramentas de buscas externas, e classificação de conteúdos sobre saúde que estão disponíveis na Internet.
O projeto tem como intuito oferecer ao público uma maneira fácil de localizar conteúdos sobre saúde em
relação aos demais buscadores populares. Para identificar os sites que tenham sido classificados com
conteúdo de saúde, os mesmos são exibidos com um selo, ao lado de seu endereço.
A ferramenta possui uma interface semelhante a maioria das ferramentas de buscas populares,
conteúdo uma pagina de pesquisa, com um campo e um botão para realizar a pesquisa e os resultados são
exibidos numa nova página em forma de listagem.
3
AVALIAÇÃO HUMANA DA QUALIDADE DA INFORMAÇÃO EM SAÚDE NA INTERNET
A avaliação da qualidade da informação em saúde na Internet realizada de forma humana ocorre
levando em consideração as experiências e conhecimento que o usuário que busca essas informações tem em
relação ao assunto pesquisado. Na avaliação humana, ao realizar uma busca na Internet, o usuário utiliza-se
de seus conhecimentos empíricos para selecionar essas informações, porem nem todos os usuários, tem
conhecimento de como realizar essas pesquisas de forma correta, das praticas julgadas importantes para
avaliar informações e seleção de conteúdo com credibilidade.
Para realizar avaliação humana da qualidade da informação, algumas instituições possuem usuários
especializados para realizar esse tipo de pesquisa na Internet, os mesmos possuem um maior conhecimento
de métodos de como efetuar as buscas, como filtrar os resultados a fim de se obter resultados com maior
qualidade e credibilidade. A Universidade Federal de Ciências da Saúde de Porto Alegre (UFCSPA), por
exemplo, lugar onde esse trabalho recebeu auxilio para o desenvolvimento dessa ferramenta, possui algumas
pessoas responsáveis por esse estudo.
Esses usuários possuem um conhecimento maior de como realizar essas pesquisas, de métodos e
técnicas para auxiliar a obter resultados mais confiáveis em buscas de conteúdo na Internet. Os mesmos
utilizam para essas pesquisas ferramentas de busca comum na WEB e métodos como apresentados a seguir.
Para a avaliação da qualidade das informações de sites avaliados de forma manual, o usuário
geralmente utiliza-se de uma ferramenta de pesquisa na Internet, como o Google <www.google.com>, ou
similares, essas ferramentas de busca apresentam os resultados de acordo com a popularidade do conteúdo e
proximidades dos termos de busca. Com os resultados obtidos na busca, são escolhidas as Uniform Resource
Locator (URL) encontradas para assim realizar uma analise das informações que elas possuem. Acessando o
endereço das URL’s selecionadas, são aplicados filtros com definições de pré-requisitos importantes, como
por exemplo, a origem da instituição que esta oferecendo essas informações, que pode ser realizada
analisando a autoria da mesma.
Aplicando esse primeiro filtro, podem-se excluir da lista as URL’s que não se encaixam nos critérios
e que serão descartadas da avaliação. Também são feitas definições dos formatos de documentos que serão
incluídos para a avaliação, definindo se serão apenas páginas da WEB, ou outros formatos de arquivos
digitais (documentos com extensões .pdf, .doc, .pps, etc). Os resultados com links HTML repetidos, e
páginas que contenham apenas fornecimento de documentos com links HTML para outros sites que possuam
o conteúdo original pesquisado são descartados.
Após essa primeira seleção das URL’s que serão analisadas, é desenvolvido então, uma espécie de
check-list específico com base nos critérios das instituições apresentadas anteriormente, como a Health on
the Net Foundation, Hospital John Kopkins, Health Information Technology Institute e American Medical
Association, que são organismos que tem critérios relevantes para esse tipo de avaliação da qualidade da
informação disponível na Internet.
Com os critérios relevantes para a avaliação especifica definida, os mesmos são aplicados
manualmente nas páginas WEB das URL’s pré-selecionadas na pesquisa. O usuário acessa cada um dos
links HTML, aplica o check-list e realiza a analise, e aplica a pontuação do conteúdo fornecido por aquela
7
página de acordo com os critérios e filtros escolhidos. Com a aplicação desse check-list, é gerada uma
planilha com o detalhamento da avaliação do site, essa planilha geralmente contem uma estrutura onde é
apresentado o endereço do site avaliado, relacionados com os critérios analisados e a pontuação em valores
numéricos sobre cada item avaliado.
Como se pode observar, apesar da possibilidade de obter uma avaliação criteriosa, nota-se que a
mesma pode ter um tempo demasiado, dependendo da quantidade de resultados que o usuário deseja
analisar. Usuários leigos podem não ter condições satisfatórias para realizar todas as etapas da avaliação,
pois os mesmo podem não ter condições de avaliar quais URL’s seriam mais confiáveis, e não ter
conhecimento da existência de organismos especializados em estudos e pesquisas para fornecer listas de
critérios e métricas importantes para avaliar um conteúdo disponível na Internet.
3.1
A avaliação automatizada da qualidade da informação na Internet
A avaliação automatizada não propõe substituir a avaliação humana, mas sim auxilia-la nesse
processo. A automatização em um sistema computacional pode ter alguns empecilhos, pois ao avaliar o
conteúdo de uma página WEB, com os critérios definidos por organismos especializados em qualidade da
informação, a maioria desses critérios requerer uma analise mais humana, sendo complexa para ser
analisada por um programa computacional.
As maiores dificuldades encontradas em uma avaliação automatizadas, são com critérios muito
subjetivos que a página WEB pode apresentar, onde seriam necessários a implementação de algoritmos mais
complexos para analisar de forma satisfatória, como por exemplo, ao realizar uma analise de critérios como,
justificativas, ponto de vista, comprovação de evidencia, entre outros. Com base nos critérios desenvolvidos
pelas instituições apresentadas anteriormente e no tópico da avaliação humana na qualidade da informação
na Internet, percebeu-se que partes do processo são repetidos para todas as analises realizadas, e alguns
desses critérios podem ser automatizados por um programa computacional.
4
SOFTWARE PARA AVALIAÇÃO AUTOMATIZADA DA QUALIDADE DE FONTES DE
INFORMAÇÃO EM SAÚDE NA WEB
Decidiu-se trabalhar com seis critérios julgados importantes e de possível avaliação automatização
em uma ferramenta computacional, que são eles, autoridade, atualidade, autoria, complementaridade,
popularidade, e fonte, os mesmos são identificados com a utilização de expressões regulares:
Após a análise dos critérios apresentados e escolha dos que foram automatizados, definiu-se as
funcionalidades, os objetivos, como é realizado o processamento, quais serão as entradas que o usuário ira
inserir no sistema, e quais as saídas e/ou resultados esperados do programa computacional.
O objetivo dessa ferramenta será auxiliar na tomada de decisão sobre as informações de saúde que
temos disponível na Internet. O programa computacional avalia automaticamente os critérios
implementados, porem o mesmo não avalia todos os critérios necessários, para a avaliação completa de uma
fonte de informação, pois alguns filtros devem ser minuciosamente avaliados e analisados manualmente,
então o sistema auxilia num apoio de tomada de decisão para os usuários.
Após definidos os critérios utilizados no programa computacional, escolheu-se os filtros que foram
aplicados e as pontuações de cada um ao ser realizado a analise automatizada.
Os filtros dos critérios foram realizados através de expressões regulares, que nada mais são do que
uma composição de símbolos, caracteres com funções especiais, e caracteres literais, que formam uma
expressão, que é interpretada como uma regra, a mesma indicará sucesso se uma entrada de dados obedecer
exatamente a essas condições. Os valores definidos para os filtros apresentados foram definidos através de
vários testes até se conseguir a pontuação final
Um melhor detalhamento de como esses critérios foram implementados será apresentado a seguir:
4.1.1
Critério de Autoridade
O critério propõe que toda a orientação médica ou da área de saúde contida no site será dada
somente por profissionais treinados e qualificados. O critério é um dos 8 (oito) códigos de conduta para os
websites médicos e de saúde definidos pela Health on the Net Foundation. Nesse critério são avaliados no
texto, palavras, códigos ou siglas para que se consiga localizar um indicador que o mesmo possui, um
8
profissional, uma instituição ou algum organismo com qualificações para fornecer informações relacionadas
a saúde.
Para realizar essa avaliação o programa computacional chama uma função que percorre o código
fonte da página WEB, avaliando uma vez o texto da maneira que ele é interpretado e apresentado ao usuário,
ou seja, apenas o texto, sem as marcações HTML, e outra vez diretamente o código fonte, junto com as
marcações HTML. Através de expressões regulares são realizadas buscas para encontrar termos que
identifiquem a possibilidade de autoridade no documento, alguns termos aplicados nesse critério foram:
“Dr\.”; “Dra\.”; “CFE.[[:punct:]”; “HealthOnNet”, “Conselho Regional de.”, entre outros termos cadastrados
no banco de dados da ferramenta, para esse critério. Caso seja identificado algum termo nessa etapa, a
função retorna o valor TRUE para o programa principal. A pontuação recebida quando o critério é
identificado é de 1 (um) ponto na pontuação total do documento avaliado.
4.1.2
Critério de Atualidade
Propõe que a informação contida no site deve possuir a data em que cada página médica foi
atualizada pela última vez. Nesse critério é verificado se o documento possui informação que indique
quando ele foi criado, qual sua data de atualização, utilizando palavras chaves e padrões de datas. O critério
é um dos códigos de conduta da HON e do Hospital John Kopkins.
Para realizar essa avaliação a ferramenta chama uma função que varre o código fonte da página
WEB, avaliando uma vez o texto da maneira que ele é interpretado e apresentado ao usuário, ou seja, apenas
o texto, sem as marcações HTML, e outra vez diretamente o código fonte, junto com as marcações HTML.
Através de expressões regulares são realizadas buscas para encontrar termos que identifiquem a
possibilidade do documento possuir o critério de atualidade, como por exemplo, “Atualizado em.”; “data de
publicação”; “ultima atualização”, e padrões de datas como, por exemplo, M/D/AA, M/D/AAAA,
MM/DD/AAAA ou MM/DD/AA, como o apresentado na Figura 1, entre outros termos cadastrados no
banco de dados da ferramenta. Caso seja identificado algum termo nessa etapa, a função retorna o valor
TRUE para o programa principal. A pontuação recebida quando o critério é identificado é de 1 (um) ponto
na pontuação total do documento avaliado.
‘/((0?[13578]|10|12)(-|\/)(([1-9])|(0[1-9])|([12])([0-9]?)|(3[01]?))(-|\/)((19)([29])(\d{1})|(20)([01])(\d{1})|([8901])(\d{1}))|(0?[2469]|11)(-|\/)(([1-9])|(0[1-9])|([12])([09]?)|(3[0]?))(-|\/)((19)([2-9])(\d{1})|(20)([01])(\d{1})|([8901])(\d{1})))/’
Figura 1 – Exemplo de expressão regular para padrões de datas M/D/AA, M/D/AAAA,
MM/DD/AAAA ou MM/DD/AA.
4.1.3
Critério de Autoria
O critério define que os endereços para contato ou telefone devem estar de fácil acesso aos
visitantes, casos os mesmo queiram maiores informações ou ajuda adicional. É verificado se o documento
possui endereço para contato, telefone, ou alguma forma de entrar em contato com o autor ou instituição.
Esse critério é um dos 8 (oito) códigos de conduta definidos pela Health on the Net Foundation.
Para realizar essa avaliação o programa computacional chama uma função que percorre o código
fonte da página WEB, avaliando uma vez o texto da maneira que ele é interpretado e apresentado ao usuário,
ou seja, apenas o texto, sem as marcações HTML, e outra vez diretamente o código fonte, junto com as
marcações HTML. Através de expressões regulares são realizadas buscas para encontrar termos que
identifiquem a possibilidade do documento possuir autoria, entre eles, “Fale conosco”; “Entre em contato.”;
“Nosso contato[:punct:]”, e expressões para localizar código postal (CEP) e números de telefones com
padrão utilizado no Brasil, como apresentados nos exemplos da Figura 2 e Figura 3, respectivamente, entre
outros termos cadastrados no banco de dados da ferramenta, para esse critério. Caso seja identificado algum
termo nessa etapa, a função retorna o valor TRUE para o programa principal. A pontuação recebida quando
o critério é identificado é de 1 (um) ponto na pontuação total do documento avaliado.
‘/\d{5}\x2D\d{3}/’
Figura 2 – Exemplo de expressão regular usada para padrões de CEP
9
‘/\(([0-9]{2}|0{1}((x|[0-9]){2}[0-9]{2}))\)\s*[0-9]{3,4}[- ]*[0-9]{4}/’
Figura 3 – Exemplo de expressão regular usada para padrões de telefones brasileiros
4.1.4
Critério de Complementaridade
O critério propõe que a informação disponível no site é concebida apenas para apoiar, e não para
substituir o relacionamento existente entre pacientes ou visitantes do site e seus médicos. É verificado se
durante o texto, o documento deixa claro ao visitante que as informações dispostas no site devem ser usadas
como consulta extra de informações. O critério é um dos códigos de conduta para os websites médicos e de
saúde da HON.
Para realizar essa avaliação o software chama uma função que percorre o código fonte da página
WEB, avaliando uma vez o texto da maneira que ele é interpretado e apresentado ao usuário, ou seja, apenas
o texto, sem as marcações HTML, e outra vez diretamente o código fonte, junto com as marcações HTML.
Através de expressões regulares são realizadas buscas para encontrar termos que identifiquem a
possibilidade do documento possuir complementaridade, como por exemplo, “Consulte um profissional”;
“Consulta ao médico”; “Consultar sempre um médico”; “Consulte sempre um profissional”, “não substituem
a consulta médica”, entre outros termos cadastrados no banco de dados da ferramenta, para o critério de
complementaridade. Caso seja identificado algum termo nessa etapa, a função retorna o valor TRUE para o
programa principal. A pontuação recebida quando o critério é identificado é de 1 (um) ponto na pontuação
total do documento avaliado.
4.1.5
Critério de Popularidade
O critério propõe que o documento tem mais credibilidade se o mesmo possui referências externa
partindo de sites que o leitor confia. Essa avaliação é realizada através das referencias que o conteúdo
apresenta, levando em consideração, que quanto mais referências externas uma página WEB apresenta,
maior relevância ele tende a ter. Nesse critério é avaliado as referências apenas de sites governamentais,
pelo motivo de os mesmos possuírem maior credibilidade, a analise é realizada pela URL do documento. O
critério tem base na lista de critérios criada pelos bibliotecários do Hospital John Kopkins e os critérios
apresentados na 15ª conferência Internacional de World Wide Web do Instituto de Ciências da Informação da
Universidade do Sul da Califórnia.
Para realizar essa avaliação o programa computacional faz a chamada de uma função especifica,
enviando como parâmetro a URL de onde o documento esta hospedado, então utilizando a API do Google
Web Search, a mesma realiza uma busca na Internet, para verificar os documentos que citam a URL do
documento em questão. Caso seja identificada alguma referência externa para esse endereço, então é
validado se o dominio da referência é de algum site governamental, essa validação é realizada atravéz da
URL, com base nos cadastros dispostos no banco de dados da ferramenta.
Caso seja identificada alguma referência de um site governamental para o documento, durante essa
etapa, a função retorna o valor TRUE para o programa principal, que armazena essa informação para a
apresentação dos resultados. A pontuação recebida quando o critério é identificado é de 2,5 (dois vírgula
cinco) pontos na pontuação total do documento avaliado.
4.1.6
Critério de Fonte
O critério da fonte do conteúdo, ou seja, quem esta fornecendo as informações e qual é credibilidade
dessa fonte de informação, será oferecida ênfase apenas nos documentos hospedados em sites
governamentais devido a sua maior credibilidade. O critério foi um dos apresentados no CINFORM –
Encontro Nacional de Ciência da Informação, em Salvador no ano de 2005 e está presente em praticamente
todos os organismos especializados em qualidade da informação na Internet estudados anteriormente.
Para essa avaliação o programa computacional faz a chamada de uma função, enviando a URL do
documento em questão, como parâmetro. Na função a URL recebida é decomposta, é verificado qual é o seu
domínio, então é realizada uma comparação com base nos domínios cadastrados no banco de dados do
software.
A analise do domínio é realizada com base nas informações da Internet Corporation for Assigned
Names and Numbers (ICANN) que é o órgão mundial responsável por estabelecer regras do uso da Internet.
10
Com essa padronização existente, pode-se analisar se um site tem domínio governamental. Essa analise pode
ser feita verificando se a URL possui o domínio .gov ou .gov.br, por exemplo. Caso seja identificado que a
URL é de um domínio governamental, a função retorna o valor TRUE para o programa principal, que
armazena essa informação para a apresentação dos resultados.
4.2
Funcionamento do programa computacional
Foi desenvolvida uma ferramenta simples e objetiva, para que, assim usuários leigos também
tenham uma maior facilidade em seu uso. Contendo uma página HTML com um formulário de pesquisa,
formado por um campo de texto input e um botão para solicitar a pesquisa.
Para o uso do programa computacional, o usuário deve informar as palavras descritivas do assunto
que deseja maiores informações no formulário da ferramenta. O método para realizar a pesquisa é a mesma
forma que em qualquer outra ferramenta de busca na Internet, após realizar a entrada de dados, o usuário irá
solicitar a busca e processamento das informações da pesquisa através do botão “Pesquisar” disponível na
tela. A Figura 4 mostra a interface de pesquisa da ferramenta.
A ferramenta captura as palavras descritivas informadas pelo usuário no formulário e as utiliza para
efetuar uma pesquisa através da API do Google. Os dados coletados pela ferramenta são analisados e
processados para se obter a avaliação de acordo com os critérios implementados. Durante esse
processamento serão realizadas as validações das URL’s recebidas e processamento dos dados, momento
que é aplicada a pontuação de acordo com a parametrização que foi definida para cada um dos critérios
implementados.
Figura 4 – Interface de pesquisa da ferramenta.
Para cada resultado apresentado é possível consultar o detalhamento da pontuação recebida. Essa
informação poderá ser visualizada na parte inferior de cada resultado, sendo que para cada critério
encontrado, será exibido seu ícone correspondente.
A Figura 5 apresenta os ícones usados na ferramenta, uma breve explicação dos critérios, quais são
suas fontes de referência, e qual o valor atribuído ao documento, quando o mesmo for encontrado, essa
informações podem ser consultadas pelo usuário, através do link “Como funciona”, que esta disponível no
canto superior direito da ferramenta.
O detalhamento da avaliação é um fator importante a ser apresentado para o usuário, pois assim o
mesmo tem conhecimento de como a avaliação é realizada, como a nota e o posicionamento recebido foram
11
resolvidos pela ferramenta. Acredita-se que assim o programa computacional ganha maior credibilidade nas
informações apresentadas, pois o usuário terá maior confiança no resultado apresentado ao entender como
ele foi atribuído.
Figura 5 – Ícones utilizados na ferramenta
Os resultados obtidos são organizados por ordem decrescente da pontuação da avaliação, refazendo
a ordenação inicial que foi recebida da API do Google. No lado esquerdo é exibida a pontuação do
12
documento, calculada de acordo com a soma dos critérios encontrados, o titulo é exibido na parte superior
da direita, seguido de um breve resumo do documento, junto com a sua URL. Logo abaixo das informações
básicas do documento, são exibidos os ícones dos critérios encontrados para aquela URL.
No canto inferior direito um link denominado “Detalhes”, permite verificar os padrões encontrados
para cada critério do documento avaliado, é um detalhamento mais técnico, não tão amigável a um usuário
comum, sendo desenvolvido para usuários mais avançados que tenham pretensão de ver um detalhamento
mais minucioso dos critérios encontrados, verificando partes do código HTML, padrões de palavras e
códigos que definiram os critérios.
As URL’s que contêm o tema saúde são exibidas em azul, dando assim um maior destaque para as
mesmas, e as que não foram identificadas como página que contêm o tema saúde são exibidas em cinza. A
Figura 6 apresenta um exemplo de resultado de uma página identificada como documento que contem tema
da área de saúde.
Figura 6 – Exemplo de um resultado obtido
Devido ao número de consultas necessárias para avaliar a quantidade e origem das referências de
links HTML recebidas por cada página WEB, decidiu-se trabalhar com até 8 (oito) resultados oriundos da
API do Google Web Search, pois a mesma, atualmente fornece apenas 100 consultas por dia para usuarios
gratuitos.
O propósito da ferramenta é realizar uma analise apenas em documentos HTML, sendo que são
descartados documentos digitais em outros formatos, por exemplo, *.doc, *.pdf, *.ppt, etc,. Isso porque a
ferramenta trabalha diretamente com tags de HyperText Markup Language para obter os dados para analise
do documento.
4.3
Tecnologia utilizada no programa computacional
O programa computacional foi desenvolvido com interface WEB, e com estrutura compatível com
os navegadores Internet Explorer 7 ou superior, e Mozilla Firefox 3.0 ou superior. Optou-se por usar a
linguagem de programação Hypertext Preprocessor (PHP) para realizar o processamento dos dados recebido
pela ferramenta de meta-busca. A escolha da linguagem de programação PHP, foi pelo motivo de a mesma
atender os requisitos necessários para as necessidades do programa computacional e necessidade de poucos
requisitos para executá-la em um servidor. Foi utilizado Servidor HTTP Apache para execução da
linguagem.
No desenvolvimento das interfaces, foi utilizado HyperText Markup Language (HTML). Para
auxiliar em uma maior interação do usuário com a interface do programa computacional foi utilizado a
linguagem de programação JavaScript. E utilização de Cascading Style Sheets (CSS) para a edição da
apresentação dos documentos escritos com a linguagem de marcação HTML.
Foi utilizado o MySQL como sistema de gerenciamento de banco de dados (SGBD), o mesmo é
necessário para realizar a parametrização utilizada e para se obter uma maior flexibilidade na ferramenta. O
banco de dados é composto por duas tabelas, que são utilizadas para a parametrização da ferramenta. A
tabela CRITERIOS é utilizada para o cadastro dos critérios, descrições e explicações de seus princípios,
fonte de referencia e valor que ele possui. A tabela TERMOS possui o cadastro das expressões e padrões
que são utilizados pela ferramenta durante a avaliação dos documentos.
O modelo Entidade-Relacionamento (ER) apresenta de maneira gráfica as tabelas, e seus respectivos
campos, do banco de dados. O ER do sistema está representado pela Figura 7.
13
Figura 7 – Modelo ER do Sistema
O dicionário de dados é uma listagem organizada de todos os elementos de dados que são utilizados
no sistema, possuindo um conteúdo preciso, conciso e não redundante. O dicionário de dados da tabela
CRITERIOS e TERMOS estão representados no Quadro 1, e Quadro 2, respectivamente.
Quadro 1 – Dicionário de Dados da tabela CRI|TERIOS
Campo
Tipo
Nulo
Padrão
Comentários
id
int(11)
Não
Chave primária
nome
varchar(25)
Não
Atributo que representa o nome do critério
desc
varchar(500)
Não
Atributo que representa descrição do critério
fonte
varchar(200)
Sim
NULL
Atributo que representa a fonte do critério
valor
double(10,1)
Sim
NULL
Atributo que representa o valor do critério
Quadro 2 – Dicionário de Dados da tabela TERMOS
Campo
Tipo
Nulo
Padrão
Comentários
id
int(11)
Não
Chave primária
criterio_id
varchar(25)
Não
Chave estrangeira
exp
varchar(500)
Não
Atributo que representa a expressão regular do termo
O programa computacional utiliza as funcionalidades do Google Web Search API do Google
<http://code.google.com/intl/pt-BR/apis/websearch>, que permite utilizar o serviço de Pesquisa Google na
WEB. A utilização da API do Google, foi devido a mesma atender todas as necessidades de pesquisa na
WEB necessárias na ferramenta desenvolvida.
5
RESULTADOS E VALIDAÇÃO DA FERRAMENTA
Para apresentação dos resultados fornecidos pela ferramenta, realizou-se uma pesquisa com as
palavras descritivas: “Tratamentos para Bulimia”. Os resultados encontrados serão apresentados
comparando os resultados fornecidos pela ferramenta de busca Google e pelo sistema desenvolvido neste
trabalho.
Decidiu-se validar o documento “BULIMIA – ABC da Saúde”, disponível no endereço
<http://www.abcdasaude.com.br/artigo.php?139>, pois o mesmo apresentou maior numero de critérios e
maior pontuação na ferramenta desenvolvida, sendo que dessa forma é possível fazer um maior numero
validações dos critérios para ela.
A primeira busca tendo como foco principal a utilização da ferramenta Google apresentou o
documento em questão, na nona posição. Devido a utilização de seus ranking critérios de avaliação,
definidos por seu algoritmo de calculo, denominado PageRank, pelo calculo de popularidade, links de
referencias, adequação do termo pesquisado ao conteúdo, entre vários outros fatores que a ferramenta utiliza
como critério de posicionamento.
A segunda busca, a qual foi dada ênfase nesta pesquisa, realizou-se com a ferramenta chave,
disponível em <http://edemar.eti.br/tcc> que, por sua vez, traz o tema estudado em primeira posição.
Abrangendo os critérios de classificação para a classificação tem-se: Autoridade; Atualidade; Autoria;
Complementaridade; e Popularidade, todos expostos por ícones. Corrobora-se, juntamente com os critérios
avaliativos pelos organismos especialistas no assunto de qualidade de informação, que a grande diferença
14
entre as posições referentes ao documento “BULIMIA – ABC da Saúde”, no viés da ferramenta
desenvolvida, se refere a utilização da mesma ser direcionada para temas da área da saúde.
Os resultados obtidos, em ambas as pesquisas, são apresentados na Figura 8, esboçado a esquerda,
tem-se a ordem da classificação da ferramenta desenvolvida e a direita a classificação da busca realizada
pela ferramenta de busca Google.
Figura 8 – Resultados da busca em ambas as ferramentas
5.1.1
Validação dos critérios encontrados pela ferramenta
Para a verificação dos resultados apresentados pela ferramenta, por meio de indicativo dos ícones,
acessou-se a URL <http://www.abcdasaude.com.br/artigo.php?139> do primeiro resultado: “BULIMIA –
ABC da Saúde”, para localizar a existência dos critérios encontrados para o documento. O relatório dos
termos encontrados, pode ser visualizado na Figura 9, os resultados da analise serão apresentados a seguir.
Para o critério de autoridade, que segundo a ferramenta esta presente no documento, foi encontrado
no código-fonte palavras-chaves que podem ser classificadas como critérios para autoridade. Pressupõem-se
então que esse documento foi produzido por profissionais qualificados, e são acreditados por um órgão
adequado na área de saúde. Os indicativos encontrados foram:
•
Dra. Alice Sibile Koch
•
Dra. Dayane Diomário da Rosa
•
Dra. Ana Luiza Galvão
•
Selo do HONcode - “Nós aderimos aos princípios da carta HONcode.”
No critério de atualidade, foram encontrados padrões de datas, e palavras-chaves que identificam
que a mesma possui datas de criação, atualização e revisão do documento.
• Esta página foi atualizada em 05/01/2010.
15
• Data de publicação: 01/11/2001
• Revisão: 05/01/2010
Para a avaliação de autoria do documento, um dos critérios mais importantes para medir a
credibilidade da informação, foi encontrado um link para um formulário de contato, possibilitando assim
que qualquer leitor tenha contato direto com os editores do site em questão.
No critério de complementaridade, foi encontrada na página, uma notificação alertando que o site
tem por objetivo apoiar e não substituir o relacionamento entre pacientes, visitantes do site e médicos. O
alerta encontrado foi:
• Tais informações não deverão, de forma alguma, ser utilizadas como substituto para o
diagnóstico médico ou tratamento de qualquer doença sem antes consultar um médico.
Para a verificação do critério de popularidade, verificou-se, se que o endereço digital
<http://www.portal.santos.sp.gov.br/seduc/page.php?226> descrito na pagina “Mais Detalhes” possuía um
link de referenciando o documento analisado.
Figura 9 – Relatório dos padrões encontrados.
16
6
CONSIDERAÇÕES FINAIS
Embora não muito divulgadas, existem várias iniciativas com o objetivo de estabelecer padrões de
critérios ou certificações sobre as informações em saúde disponíveis na Internet, porem ainda não se tem
uma padronização mundial que garanta ao usuário uma maior segurança nas informações obtidas. Sendo que
esses filtros e critérios devem ser aplicados de forma manual fazendo que esse processo seja ainda mais
demorado e trabalhoso, e provavelmente obscuro para usuários leigos.
É importante a observação que alguns dos critérios apresentados, como os da HON, por exemplo,
estão mais voltados para códigos de conduta, os mesmos definem padronizações para confiabilidade dos
documentos disponíveis na Internet, porem não avaliam a qualidade da informação apresentada pelo mesmo.
Observou-se que parte dos critérios, que foram criados por grandes organismos especialistas no
assunto de qualidade de informação na Internet, podem ser implementados de maneira satisfatória, em uma
ferramenta computacional, e assim auxiliar nesse processo que tende a ser repetitivo e demorado quando
executado manualmente.
Alguns dos critérios estudados apresentaram-se muito complexos para serem automatizados em um
programa computacional, sendo necessária uma avaliação humana, pois envolvem analises minuciosas e
exigem uma avaliação bem criteriosa, especificamente humana, como por exemplo, o critério de
justificativa, onde as informações apresentadas sobre os benefícios e o desempenho dos tratamentos,
produtos ou serviços devem estar baseadas em evidencias adequadas e equilibradas, com atribuições as
comprovações.
Uma das limitações fortes na ferramenta, é a utilização de serviços de terceiros como a API do
Google, que é uma recurso limitado, oferecendo apenas 8 resultados a cada requisição, e um limite máximo
de 100 buscas por dia, sendo ainda que esse recurso esta sendo depreciado pela empresa.
Em relação aos trabalhos futuros, existem melhorias que poderiam ser aplicadas a essa ferramenta
afim de melhor seu funcionamento, algumas delas são listadas a seguir:
•
Incluir outras fontes de pesquisas na Internet, além da API do Google, como Yahoo! Search
Web Services, Bing Search entre outros disponíveis na WEB. Para melhorar o numero de
resultados e melhor avaliação de critérios como popularidade, por exemplo.
•
Criar uma paginação, oferecendo assim a possibilidade de se obter mais resultados
referentes ao assunto pesquisado.
•
Acrescentar a opção de avaliar o site completo de cada resultado, para se obter uma
avaliação mais global da fonte consultada.
•
Adicionar a opção de avaliar um site especifico através da sua URL, assim quando o usuário
quiser, ele pode avaliar um site que ele já tenha conhecimento.
REFERÊNCIAS
GIL, Yolanda; ARTZ, Donavan. Towards Content Trust of Web Resources. ACM - Association for
Computing Machinery, New York, NY, USA, 2006.
HON, Health On the Net Foundation. Disponível em: <http://www.hon.ch> . Acesso em 12 set 2010.
JUZZO, Luisa Maria Larcher Caliri. Critérios para avaliação da qualidade das informações sobre saúde
disponíveis online. Disponível em
<http://telemedicina.unifesp.br/pub/SBIS/CBIS2004/trabalhos/arquivos/419.pdf>. Acesso em 10 set 2010
KIRK, Elizabeth E. Evaluating Information Found on the Internet. Disponível em
<http://www.library.jhu.edu/researchhelp/general/evaluating>. Acesso em 2 out 2010.
LOPES, Ilza Leite de Azevedo Santos. Proposta de critérios de qualidade apara avaliação da
informação em saúde recuperada nos sites brasileiros da Word Wide Web. Disponível em:
<http://repositorio.bce.unb.br/bitstream/10482/5040/1/2006%20Ilza%20Leite%20de%20Azevedo%20Santo
s%20Lopes.pdf>. Acesso em 27 set 2010.
17
MARIN, Heimar de Fátima. Informática em Enfermagem. São Paulo: Editora Pedagógica e Universitária
Ltda, 1995.
MARQUES, Isaac R. Métodos para avaliação da qualidade da informação de saúde na Internet. Acta
Paul Enf 2003; 16(1): 84-91.
PINTO, Marli Dias. de Souza. et al. Diversidade da recuperação de informações via Internet na
pesquisa e ensino. Rev. ACB: Biblioteconomia em Santa Catarina, v. 8/9, p. 143-154, 2003/2004.
Disponível em <http://revista.acbsc.org.br/index.php/racb/article/view/399/498> Acesso em: 18 set 2010.
SALES, Ana Lídia Campos; TOUTAIN, Lídia Brandão. Aspectos que norteiam a avaliação da qualidade
da informação em saúde na era da sociedade digital. In: CINFORM - ENCONTRO NACIONAL DE
CIÊNCIA DA INFORMAÇÃO, 5., 2005, Salvador. Anais... Salvador, 2005. Disponível em:
<http://dici.ibict.br/archive/00000487/01/AnaLidiaSales.pdf>. Acesso em: 18 set 2010.
SALES, Rodrigo de; ALMEIDA, Patrícia Pinheiro de. Avaliação de fontes de informação na internet:
Avaliando o site do NUPILL/UFSC. Revista Digital de Biblioteconomia e Ciência da Informação,
Campinas, v. 4, n. 2, p. 67-87, jan./jun. 2007.
WILLIAMS, Martym. G8 to meet developing nations on digital divide. Disponível em:
<www.cnn.com/2000/TECH/computing/07/19/g8.divide.idg/index.html>. Acesso em: 12 set. 2010.
WRAPIN, Worldwide Online Reliable Advice to Patients and Individuals. Disponivel em
<http://www.wrapin.org>. Acesso em 27 set 2010.
18
Download

um software para avaliação de qualidade de fontes de informação