PROGRAMA DE MINERAÇÃO DE DADOS PARA ANÁLISE DE DIABETES & HIPERTENSÃO Rodrigo G. Prieto Kathya S. Collazos L. Dra. Luiz Gustavo Pinto Dr. Jorge Roel Ortiz Dr. [email protected] Estrutura da Apresentação Introdução Descoberta de Conhecimento em Banco de Dados Diabetes & Hipertensão Metodologia Aplicação Discussão e Conclusões Referências Introdução A Medicina produz uma grande quantidade de informação, a qual coletada e armazenada constitui-se em uma base de dados. São necessárias ferramentas que facilitem a análise desses dados, auxiliando na tomada de decisão, favorecendo o tratamento e/ou a prevenção de doenças. Introdução A interpretação de dados geralmente é feita utilizando métodos estatísticos. A metodologia KDD pode ser utilizada para a análise de dados, utilizando a técnica de mineração de dados (MD). Apresenta-se um programa para análise de dados para diabetes e/ou hipertensão utilizando MD. Descoberta de Conhecimento em Base de Dados (*KDD) Armazenamento de dados Mineração de dados (MD) Interpretação e Avaliação *Knowledge Discovery in Database (KDD) O Processo KDD Interpretação e Avaliação Mineração de Dados Seleção e Pre-processamento Consolidação dos Dados p(x)=0.02x Padrões e Modelos Armazém de Dados Dados Consolidadados Fonte de Dados Conhecimento Dados Preparados Diabetes & Hipertensão A Diabetes Mellitus é uma anormalidade caracterizada por uma quantidade de açúcar em excesso no sangue e na urina. O controle desta anormalidade é importante para evitar consequencias graves como infecções, ceguera entre outras. Diabetes & Hipertensão A hipertensão arterial não é somente uma condição clínica de cifras tensionais elevadas, senão um quadro sindrômico, incluindo alterações hemodinâmicas, tróficas e metabólicas. A hipertensão arterial deixou de ser vista como uma doença ligada somente à tensão, passou a ser um dos graves fatores para doenças cardiovasculares. Metodologia O ambulatório da Univali (Itajaí) oferece atendimento a pacientes portadores destas duas doenças. A análise dos dados, coletados dos pacientes, é importante para a tomada de decisão visando o controle das mesmas. O ambulatório não tem um sistema informatizado para coleta de dados, dificultando a análise de tais dados. Metodologia Desenvolveu-se como uma opção a estas dificuldades um Sistema de Análise de dados que inclui: Informatização do formulário de coleta de dados, baseado no formulário em papel. Implementação da técnica de MD (árvore de decisão) para a análise dos dados. O sistema foi desenvolvido no Oracle Forms (telas) e Reports Builder (relatórios), utilizou-se a linguagem PL/SQL. Metodologia O algoritmo de mineração implementado obtém uma árvore de decisão utilizando três parâmetros. O sistema considera os dois primeiros como preditivos e o terceiro como objetivo. A partir da árvore são obtidas regras especializadas. Aplicação O banco de dados inclui 186 pacientes atendidos no primeiro trimestre de 2004. Selecionaram-se doze interesse dos pacientes: Idade do Paciente Sexo do Paciente Cor do Paciente Profissão do Paciente Índice de Massa Corporal Valor da Pressão Arterial parâmetros de Valor de LDL Valor de HDL Valor de Glicose Valor de Colesterol Valor de Triglicerídios Valor de FC Aplicação Utilizaram-se os dados: Indice de Massa Corpórea, Idade, Trigliceridios, LDL e Sexo para as consultas no sistema. Os resultados mostraram a prevalência de sobrepeso e obesidade nos pacientes consultados, tal valor é próximo dos percentuais obtidos em outras pesquisas de nível nacional. Aplicação Foi constatado que no caso de pacientes idosos, muitos prontuários não possuíam informações de peso e altura. Baseado nestes resultados estão sendo previstas duas ações a serem tomadas: Início de atividades para melhorar o parâmetro IMC. Monitoramento para o correto preenchimento dos prontuários dos pacientes. Discussão e Conclusões O algoritmo implementado permitiu observar características dos pacientes consultados no ambulatório. A base de dados (BD) criada é o datawarehouse do sistema, já que a BD é específica para a pesquisa de diabetes e/ou hipertensão. Discussão e Conclusões O sistema irá a migrar para uma estrutura web para facilitar o acceso ao sistema fora do ambulatório. O sistema incluirá um formulário para realizar o acompanhamento do paciente, atualmente o preenchimento dos formulários é feito por única vez, o qual não permite realizar o acompanhamento do paciente e monitorar sua evolução. Referências Pinto, L.G. (2004), Formulário para coleta de dados de pacientes diabéticos e/ou Hipertensos, Technical report Ambulatório da Univali, Itajaí Brasil. Mannila, H. (1996), “Data Mining: machine learning, statistics, and databases”, Eight International Conference on Scientific and Statistical Database Management, Stockholm-Sweden. p. 1-8. Mannila, H. (1997), “Methods and problems in data mining (a tutorial)”, Proceedings of International Conference on Database Theory ICDT'97, Eds.: F. Afrati, P. Kolaitis, Springer-Verlag, Delphi-Greece, p. 41-55, Janeiro. Silver, D.L. (1996), “Knowledge Discovery and Data Mining”. Technical Report MBA6522 CogNova Technologies London Health Science Center. Referências Barreto, J.M. Inteligência Artificial no Limiar do Século XXI, 3a Edição. Florianópolis- SC, Edições, 2001. Pacheco, M.A., Vellasco, M., Lopes, C.H. (1999), Descoberta de Conhecimento e Mineração de Dados, Notas de Aula em Inteligência Artificial. Rio de Janeiro, ICA – Laboratório de Inteligência Computacional Aplicada, Engenharia Elétrica PUC-RIO. URL:http://www.ica.ele.puc-rio.br. Collazos, K., Barreto, J.M. (2003), “KDD Ferramenta Para Análise de Dados Epidemiológicos”, Anais do III Congresso Brasileiro de Computação - III Workshop de Informática aplicada à Saúde - CBCOMP'2003, Itajaí, p. 2226-2236. Referências De Oliveira, J.E.P. (2003), Informações para Pacientes Diabéticos. Sistema Brasileiro de Diabetes (SBD). URL:http:// www.diabetes.org.br/Diabetes/info_pacientes/infopac_set.ht ml Acessado em 11-2003. Nobre, F., Lima, N.K.C. (2000), “Hipertensão Arterial: Conceito, Classificação e Critérios Diagnósticos”, Sociedade de Cardiologia do Estado de São Paulo (SOCESP) : Ari Timerman, Luiz Antonio Machado César. São Paulo: Editora Atheneu.