Modelo para codificação de narrativas clínicas para uma ontologia de domínio utilizando SNOMED CT Priscilla Koppe Edson José Pacheco Percy Nohama Stefan Schulz Pontifícia Universidade Católica do Paraná Universidade de Freiburg, Alemanha INTRODUÇÃO Crescente expansão de informações não estruturada em prontuários eletrônicos Necessidade de implementação de sistemas que lidam com terminologias clínicas Importância da codificação na comunicação eletrônica Criação de regras para codificação OBJETIVO O objetivo da pesquisa é propor uma metodologia para o mapeamento de texto livre, especificamente de narrativas clínicas, para SNOMED CT, através de regras de codificação. Finalidade é a criação de um padrão-ouro para permitir a avaliação de um sistema PLN SNOMED CT SNOMED CT é um vocabulário médico padronizado que define o significado dos termos médicos, visando melhorar a interoperabilidade entre sistemas. Inclui: sinais sintomas doenças procedimentos medicamentos SNOMED CT Os elementos básicos que compõem SNOMED CT são: Conceito: unidade básica de SNOMED CT. Cada conceito é identificado por um código numérico único, tem um nome único (Fully Specified Name) e um conjunto de termos sinônimos (descriptions). Hierarquias: são 19 as principais (ex: Disorder, Procedure, Substance, Clinical findings, etc.); Relações: associações entre conceitos, usadas para formalmente definir e descrever um conceito SNOMED CT METODOLOGIA 120 sumários de alta oriundos da área de cardiologia do Hospital de Clínicas de Porto Alegre (HCPA) foram selecionados para a efetuação da codificação do conteúdo Utilização do Virginia Tech Browser Desenvolvimento de uma estrutura tabular para relacionar elementos do texto com conceitos SNOMED METODOLOGIA Chunk Context Structure HAS e HIS DM tipo 2 HIS Polarity Code Observation LIS 38341003 Hipertensão Arterial Sistêmica LIS 44054006 Diabetes Mellitus 41976001 cateterismo Paciente com história de Submetido a cat que evidenciou lesão suboclusiva 2929001 na coronária DA. 59438005 Realizado angioplastia. 41339005 Recomendação na alta: em caso de intercorrência, UNC vir à UNC emergência. UNC 185265000 Descendente Anterior METODOLOGIA O processo de codificação foi realizado por dois profissionais da área da saúde. A composição de um guideline foi necessária para dar suporte à criação de um padrão ouro de codificação objetivando a avaliação de um processo computadorizado de mapeamento usando tecnologias de processamento de linguagem natural. GUIDELINE As principais regras implantadas foram: Somente use a hierarquia “Morphologies” se não houver código correspondente nas hierarquias preferidas: “Clinical Findings” ou “Procedure”; Para codificar resultados de laboratório, utilize a categoria “Observable concepts”; Para codificar um medicamento, utilize o código SNOMED CT referente a Substance ao invés de Product. Ex: digoxin (substance) preferencialmente a digoxin (product) GUIDELINE Para conceitos anatômicos, a SNOMED CT apresenta sempre dois conceitos: “Entire X” e “ X structure ”. Nesses casos, codifique o último, termo mais geral. Ex.: “Right coronary artery structure” ao invés de “Entire right coronary artery”; Utilize conceitos SNOMED CT da categoria “Qualifier value” apenas quando esta referir-se a características importantes de outros conceitos. Ex.: “laterality, episodicity, severity”; Se um termo estiver presente na hierarquia SNOMED CT “Anatomical concepts” e o mesmo conceito estiver nas hierarquias “Clinical Findings” ou “ Procedure”, codifique o termo obtido na “ Clinical Findings”; RESULTADOS Efetividade do Guideline através da avaliação da concordância do trabalho de codificação realizado pelos profissionais 12 sumários de alta foram aleatoriamente selecionados e submetidos ao processo de codificação pelos dois especialistas envolvidos nesta atividade 89% de concordância (Cohen’s Kappa) DISCUSSÕES Avaliação das discordâncias existentes: Termo: “TABAGISTA” DISCUSSÕES Termo: “ELETROCARDIOGRAMA” DISCUSSÕES Termo: “SATURAÇÃO DE OXIGÊNIO” DISCUSSÕES Termo: “PARADA RESPIRATÓRIA” DISCUSSÕES Termo: “HEMATÚRIA” DISCUSSÕES Avaliação das concordâncias existentes: Medicamentos (Hierarquia Substance): Sinvastatina, Metoprolol, Captopril, Furosemida, etc. Doenças (Hierarquia Disorder): Hipertensão sistêmica, Diabetes mellitus, Cardiopatia isquêmica, etc. Procedimentos (Hierarquia Procedure): transluminal percutânea, Cateterismo, Rx Ecocardiograma, etc. Estruturas anatômicas (Hierarquia Body Structure): Ventrículo direito, Septo cardíaco, Artéria coronária direita, etc. Aspirina, arterial Angioplastia de tórax, CONCLUSÃO O Guideline desenvolvido abordou tópicos importantes para a obtenção de um resultado satisfatório de codificação manual. Com base no resultado alcançado com o mapeamento manual, uma rotina automatizada de mapeamento está sendo desenvolvida, com base em ferramentas de processamento de linguagem natural (PLN).