Sistema de análise de dados na área da saúde Benjamin Grando Moreira1, Kathya Silvia Collazos Linares2 1,2 Grupo de Inteligência Aplicada (GIA), Centro de Ciências Tecnológicas da Terra e do Mar (CTTMar), Universidade do Vale do Itajaí, Santa Catarina -Brasil Resumo - Este trabalho apresenta o desenvolvimento de um sistema para análise de dados na área da saúde para o ambulatório da Universidade do Vale do Itajaí. O projeto será desenvolvido para uso na web e utiliza as linguagens de programação PHP e Javascript, utilizando para armazenamento das informações o banco de dados Oracle. O sistema possibilita a criação e alteração dos formulários de entrada de dados, possibilitando assim a personalização dos dados de entrada. Uma segunda parte do sistema é responsável por fazer a análise dos dados e utilizará mineração de dados, técnica de inteligência artificial, para a descoberta de conhecimento. Palavras-chave: Prontuário Eletrônico; Informática em Saúde; Desenvolvimento de sistemas. Abstract – This work presents the development of a data analyzing system in the health area for the UNIVALI´s ambulatory. This system is developed for Web environment and use PHP and Javascript languages, being used the Oracle Database for storing information. The system makes possible the creation and alteration of entering data form and, in this way the personalization of these data entering. A second part of the system is responsible for making the data analysis and uses data mining, artificial intelligence techniques, for knowledge discovering. Key words: Electronic Health Record, Computing in Health Systems; System development. Introdução Este trabalho tem por objetivo apresentar um sistema para análise de dados na área da saúde para o ambulatório da Universidade do Vale do Itajaí - Univali. Para o desenvolvimento deste projeto, as seguintes etapas foram estabelecidas: (i) desenvolvimento de uma interface para a criação dos formulários onde possa ser criado, da maneira mais fácil possível, os formulários de entrada de dados; (ii) criação de um módulo para obtenção de cálculos estatísticos como soma, media, mediana, desvio padrão, coeficiente de variação, coeficiente de correlação e regressão linear simples; (iii) criação de gráficos para facilitar a visualização e análise dos dados; (iii) realização do cálculo de tabulação cruzada; (iv) implantação da inteligência artificial com técnica de mineração de dados; (v) teste e validação do sistema. A seguir serão detalhadas as etapas de desenvolvimento do projeto. Metodologia Para estabelecer as funcionalidades do sistema, foram analisados outros sistemas que realizam análise de dados na área da saúde e dentre eles dois foram escolhidos: • O Epi Info é um software desenvolvido e distribuído pelo CDC americano (Centers • for Disease Control and Prevention) e a OMS (Organização Mundial da Saúde). O software é composto por uma série de programas para uso dos profissionais de saúde, utilizado para conduzir investigações epidemiológicas, administrar bancos de dados e gerar estatísticas. O Epi Info gera estatísticas epidemiológicas, gráficos, e tabelas[1]. O Tabwin foi desenvolvido pelo DATASUS e busca facilitar o trabalho de tabulação e tratamento dos dados, permitindo que seja realizadas operações aritméticas e estatísticas nos dados e elaborar gráficos Desses sistemas foram abstraídos os cálculos estatísticos e os gráficos. Esses sistemas também serão utilizados para validação dos resultados obtidos. Para esse projeto optou-se por utilizar os cálculos de soma, media, mediana, desvio padrão, coeficiente de variação, coeficiente de correlação e regressão linear simples. Os gráficos que a ferramenta irá gerar são os gráficos de barra vertical, barra horizontal, linha e ponto. Em acréscimo às funcionalidades oferecidas pelos softwares Epi Info e Tabwin foi planejada a utilização da técnica de Descoberta de Conhecimento em Base de Dados (DCBD), que é uma técnica que possibilita a “análise” de grandes conjuntos de base de dados permitindo flexibilidade no raciocínio, a qual é desejável na análise de dados clínicos, os quais quase sempre são imprecisos e incertos[2]. A descoberta de conhecimento será feita com o uso da mineração de dados que são o uso de técnicas automáticas de “exploração” de grandes quantidades de dados de forma a descobrir novos padrões e relações que, devido ao volume de dados, não seriam facilmente descobertos a olho nu pelo ser humano[3]. Para a implementação do sistema utilizouse a linguagem PHP, JavaScript e o banco de dados Oracle. PHP é uma tecnologia server-side, isso quer dizer que é realizada no lado do servidor e é uma linguagem de programação de ampla utilização, interpretada, que é especialmente interessante para desenvolvimento para a Web e pode ser mesclada dentro do código HTML. Esta linguagem permite criar páginas que serão geradas dinamicamente de forma rápida[4]. Certos controles, como o de campos obrigatórios a serem preenchidos nos formulários, serão efetuados com o uso da linguagem JavaScript, a qual prove funcionalidades de manipulação de eventos sem a necessidade de acessos ao servidor e essa característica é utilizada para otimização do sistema. Para o armazenamento dos dados foi utilizado o banco de dados Oracle por ele suportar grandes quantidades de registros e seu bom desempenho ao manipular tais registros. A modelagem do sistema foi feita baseada em UML. As Figuras 1 e 2 ilustram os use cases do sistema. Figura 2 – Use case referente ao Administrador Resultados O sistema está em fase de desenvolvimento por isso resultados ainda não são possíveis de se obter. Algumas telas da modelagem do sistema são apresentadas nas Figuras 3, 4 e 5. A Figura 3 representa a tela para criação do formulário dinâmico. Basta o usuário escolher o tipo de entrada de dado que será utilizada. As opções de tipo disponíveis são: list, checkbox, radio e textbox. Figura 3 – Tela para criação do formulário Figura 1 – Use case referente ao Profissional da Saúde Caso a opção de tipo de entrada for uma list, checkbox ou radio a tela representada na Figura 4 é apresentada. Nela o usuário indicará as opções que são disponíveis para o campo escolhido. de mastologia do ambulatório da UNIVALI é a equipe que está auxiliando o desenvolvimento desse sistema. Figura 4 – Tela para inserção de valores válidos para os campos list, checkbox ou radio A tarefa de DCBD quer será inicialmente utilizada será a de classificação. Essa tarefa é uma das mais pesquisadas e por isso documentações a respeito dela são mais facilmente encontradas. Agradecimentos Caso a opção de entrada de dados escolhida seja a de textbox, a tela representada pela Figura 5 é apresentada. Nela o usuário indica se o campo aceita somente número, ou se aceita texto. Outra opção disponível para esse tipo de entrada é a limitação de número de caracteres para o campo ou a indicação de que o campo é de texto múltiplo o que permite a digitação de uma maior quantidade de caracteres. Agradecemos a coordenação do ambulatório da UNIVALI e a equipe de mastologia do desse ambulatório, pelo apoio ao projeto Referências 1. Artigos em Revistas e Anais e Capítulos de Livros Collazos, K. S. et al, “KDD em Base de Dados na Área Médica”. In: Anais do XVII Congresso Brasileiro de Engenharia Biomédica CBEB’2000, Florianópolis, Eds.: Fernando Mendes de Azevedo et al., v.1, p. 765-768, 2000. 1.1. Livros e Teses Figura 5 – Tela para inclusão de um tipo de entrada textbox As demais telas do sistema ainda não foram modeladas. Discussão e Conclusões Os formulários iniciais serão criados baseados nos atuais prontuários de atendimento do ambulatório da UNIVALI. Para conferir e validar os algoritmos para os cálculos estatísticos serão utilizados os softwares Epi Info e Tabwin. Ao termino da validação dos cálculos estatísticos dar-se-á início ao desenvolvimento da parte inteligente do sistema, com a utilização da mineração de dados. A validação dos algoritmos de mineração de dados será efetuada com a ajuda de especialistas da área médica. Inicialmente, a área Bakken, S. S., Aulbach, A., Schmid, E., Winstead, J., Wilson, L. T., Lerdorf R., Manual do PHP. http://www.php.net/manual. DEAN, A. G. et al. Epi info 2000 manual. Carvalho, L. A. V. “Datamining: a mineração de dados no marketing, medicina, economia, engenharia e administração”. Editora Érica, 2001. Contato Benjamin Grando Moreira. Acadêmico da Universidade do Vale do Itajaí. Residente na rua Antônio Agnelo Santana, 167, centro, Piçarras – Santa Catarina. Telefone (47) 345-4700, [email protected].