PROGRAMA DE MINERAÇÃO
DE DADOS PARA ANÁLISE
DE DIABETES &
HIPERTENSÃO
Rodrigo G. Prieto
Kathya S. Collazos L. Dra.
Luiz Gustavo Pinto Dr.
Jorge Roel Ortiz Dr.
[email protected]
Estrutura da Apresentação
 Introdução
 Descoberta de Conhecimento em Banco de
Dados
 Diabetes & Hipertensão
 Metodologia
 Aplicação
 Discussão e Conclusões
 Referências
Introdução
 A Medicina produz uma grande quantidade
de informação, a qual coletada e armazenada
constitui-se em uma base de dados.
 São necessárias ferramentas que facilitem a
análise desses dados, auxiliando na tomada
de decisão, favorecendo o tratamento e/ou
a prevenção de doenças.
Introdução
 A interpretação de dados geralmente é
feita utilizando métodos estatísticos.
 A metodologia KDD pode ser utilizada para a
análise de dados, utilizando a técnica de
mineração de dados (MD).
 Apresenta-se um programa para análise de
dados para diabetes e/ou hipertensão
utilizando MD.
Descoberta de Conhecimento
em Base de Dados (*KDD)
Armazenamento de dados
Mineração de dados (MD)
Interpretação e Avaliação
*Knowledge Discovery in Database (KDD)
O Processo KDD
Interpretação
e Avaliação
Mineração
de Dados
Seleção e
Pre-processamento
Consolidação
dos Dados
p(x)=0.02x
Padrões e
Modelos
Armazém
de Dados
Dados
Consolidadados
Fonte de Dados
Conhecimento
Dados Preparados
Diabetes & Hipertensão
 A Diabetes Mellitus é uma anormalidade
caracterizada por uma quantidade de açúcar
em excesso no sangue e na urina.
 O controle desta anormalidade é importante
para evitar consequencias graves como
infecções, ceguera entre outras.
Diabetes & Hipertensão
 A hipertensão arterial não é somente uma
condição clínica de cifras tensionais
elevadas, senão um quadro sindrômico,
incluindo alterações hemodinâmicas, tróficas
e metabólicas.
 A hipertensão arterial deixou de ser vista
como uma doença ligada somente à tensão,
passou a ser um dos graves fatores para
doenças cardiovasculares.
Metodologia
 O ambulatório da Univali (Itajaí) oferece
atendimento a pacientes portadores destas
duas doenças.
 A análise dos dados, coletados dos
pacientes, é importante para a tomada de
decisão visando o controle das mesmas.
 O ambulatório não tem um sistema
informatizado para coleta de dados,
dificultando a análise de tais dados.
Metodologia
 Desenvolveu-se como uma opção a estas
dificuldades um Sistema de Análise de
dados que inclui:
 Informatização do formulário de coleta de
dados, baseado no formulário em papel.
 Implementação da técnica de MD (árvore de
decisão) para a análise dos dados.
 O sistema foi desenvolvido no Oracle Forms
(telas) e Reports Builder (relatórios),
utilizou-se a linguagem PL/SQL.
Metodologia
 O algoritmo de mineração implementado
obtém uma árvore de decisão utilizando três
parâmetros.
 O sistema considera os dois primeiros como
preditivos e o terceiro como objetivo.
 A partir da árvore são obtidas regras
especializadas.
Aplicação
 O banco de dados inclui 186 pacientes
atendidos no primeiro trimestre de 2004.
 Selecionaram-se doze
interesse dos pacientes:
 Idade do Paciente
 Sexo do Paciente
 Cor do Paciente
 Profissão do Paciente
 Índice de Massa Corporal
 Valor da Pressão Arterial
parâmetros
de
Valor de LDL
Valor de HDL
Valor de Glicose
Valor de Colesterol
Valor de Triglicerídios
Valor de FC
Aplicação
 Utilizaram-se os dados: Indice de Massa
Corpórea, Idade, Trigliceridios, LDL e Sexo
para as consultas no sistema.
 Os resultados mostraram a prevalência de
sobrepeso e obesidade nos pacientes
consultados, tal valor é próximo dos
percentuais obtidos em outras pesquisas de
nível nacional.
Aplicação
 Foi constatado que no caso de pacientes
idosos, muitos prontuários não possuíam
informações de peso e altura.
 Baseado nestes resultados estão sendo
previstas duas ações a serem tomadas:
Início de atividades para melhorar o
parâmetro IMC.
Monitoramento para o correto preenchimento
dos prontuários dos pacientes.
Discussão e Conclusões
 O algoritmo implementado permitiu observar
características dos pacientes consultados no
ambulatório.
 A base de dados (BD) criada é o
datawarehouse do sistema, já que a BD é
específica para a pesquisa de diabetes e/ou
hipertensão.
Discussão e Conclusões
 O sistema irá a migrar para uma estrutura
web para facilitar o acceso ao sistema fora
do ambulatório.
 O sistema incluirá um formulário para
realizar o acompanhamento do paciente,
atualmente o preenchimento dos formulários
é feito por única vez, o qual não permite
realizar o acompanhamento do paciente e
monitorar sua evolução.
Referências
Pinto, L.G. (2004), Formulário para coleta de dados de pacientes
diabéticos e/ou Hipertensos, Technical report Ambulatório
da Univali, Itajaí Brasil.
Mannila, H. (1996), “Data Mining: machine learning, statistics,
and databases”, Eight International Conference on Scientific
and Statistical Database Management, Stockholm-Sweden. p.
1-8.
Mannila, H. (1997), “Methods and problems in data mining (a
tutorial)”, Proceedings of International Conference on
Database Theory ICDT'97, Eds.: F. Afrati, P. Kolaitis,
Springer-Verlag, Delphi-Greece, p. 41-55, Janeiro.
Silver, D.L. (1996), “Knowledge Discovery and Data Mining”.
Technical Report MBA6522 CogNova Technologies London
Health Science Center.
Referências
Barreto, J.M. Inteligência Artificial no Limiar do Século XXI, 3a
Edição. Florianópolis- SC,  Edições, 2001.
Pacheco, M.A., Vellasco, M., Lopes, C.H. (1999), Descoberta de
Conhecimento e Mineração de Dados, Notas de Aula em
Inteligência Artificial. Rio de Janeiro, ICA – Laboratório de
Inteligência Computacional Aplicada, Engenharia Elétrica
PUC-RIO. URL:http://www.ica.ele.puc-rio.br.
Collazos, K., Barreto, J.M. (2003), “KDD Ferramenta Para
Análise de Dados Epidemiológicos”, Anais do III Congresso
Brasileiro de Computação - III Workshop de Informática
aplicada à Saúde - CBCOMP'2003, Itajaí, p. 2226-2236.
Referências
De
Oliveira, J.E.P. (2003), Informações para Pacientes
Diabéticos. Sistema Brasileiro de Diabetes (SBD). URL:http://
www.diabetes.org.br/Diabetes/info_pacientes/infopac_set.ht
ml Acessado em 11-2003.
Nobre, F., Lima, N.K.C. (2000), “Hipertensão Arterial: Conceito,
Classificação e Critérios Diagnósticos”, Sociedade de
Cardiologia do Estado de São Paulo (SOCESP) : Ari
Timerman, Luiz Antonio Machado César. São Paulo: Editora
Atheneu.
Download

Diabetes & Hipertensão