Definição de Variáveis em Redes Neurais Artificiais por Análise de Componentes Principais: Aplicação em Transplante Renal Antonio Fernando. C. Infantosi Renan Moritz. V. R. Almeida João Carlos G. D. Costa Programa de Engenharia Biomédica, COPPE, Universidade Federal do Rio de Janeiro (UFRJ) Carlos A. L. Ávila José H. Rocco Suassuna Faculdade de Medicina Universidade Estadual do Rio de Janeiro (UERJ) Estrutura da Apresentação Introdução Objetivo Redes Neurais Artificiais Análise de Componentes Principais Base de Dados de Transplantados Renais Variáveis de Entrada da RNA Variável de Saída da RNA Características das Variáveis Características da RNA Comparação Entre Estimativas dos Modelos RNA Autovetores e Autovalores mais representativos Simulações para Treinamento da RNA Resultados Discussão Conclusão Referências Introdução Redes Neurais Artificiais (RNA) têm sido cada vez mais empregadas na prática médica, porém ainda sem aceitação universal; Trabalhos têm mostrado a viabilidade das RNA no auxílio ao diagnóstico, até mesmo com vantagens sobre Regressão Logística (RL); Introdução Em transplantes renais (TXR), as RNA têm sido usadas em aplicações tais como: a) Predição de funcionamento do enxerto; b) Diagnóstico de rejeição; c) Seleção de variáveis para previsão de rejeição crônica; d) Predição de citomegalovirose; e) Dosagem de imunossupressores; Introdução A existência de colinearidade entre variáveis de entrada de uma RNA implica: • Aumento desnecessário da complexidade; • Pouco acréscimo de informação. Objetivo Utilizar a Análise de Componentes Principais na redução da dimensionalidade do vetor de entrada de uma RNA para predição de sobrevida de enxerto renal. Redes Neurais Artificiais Redes Neurais Artificiais são modelos que simulam o comportamento neuronal humano; As RNA têm sido apontadas como alternativas às técnicas de predição tradicionais: a) Detecção de relações complexas entre as variáveis; b) Robustez quanto à perda de informações; c) Adaptabilidade; d) Processamento paralelo (rapidez); e) Mapeamento caixa-preta; f) Mapeamento através de funções não lineares Análise de Componentes Principais A ACP é uma técnica de análise multivariada linear para diminuição da quantidade de variáveis (usualmente preditoras em um modelo), sem perda considerável de informação; As novas variáveis de entrada do modelo são compostas da multiplicação matricial entre as variáveis originais e os autovetores da matriz de variáveis; Base de Dados de Transplantados Renais a) 109 pacientes com dados completos (doadores vivos); b) Definição de três conjuntos de dados (Haykin, 2002) : 1. Treinamento da RNA: 60 pacientes; 2. Validação da RNA: 17 pacientes; 3. Teste da RNA: 32 pacientes; Variáveis de Entrada da RNA co: contínua c : categórica d : dicotômica 1) Idade Receptor (co); 2) Idade Doador (co) 3) Diferença Idade Doador/Receptor (co); 4) Status Diferença Idade (d); 5) Sexo Receptor (d); 6) Sexo Doador (d); 7) Raça Receptor (d); 8) Raça Doador (d); 9) Transplantes Prévios (co); 10)Tempo de Diálise (co); 11)Tipo de Diálise (d); 12)Ocorrência de Rejeição (d); 13)Mismatch HLA (c); 14)Esquema Imunossupressor (d); 15)Transfusões Sangüíneas (co); Variável de Saída da RNA 1) Sobrevida do enxerto em meses Pacientes com sobrevida maior ou igual a 60 meses foram considerados como tendo escore igual a 1; Características da Variáveis O status das variáveis dicotômicas e categórica contribuintes para o sucesso do TXR foram definidas com o maior escore, p.ex.: • Sexo Doador: masculino = 1; • Mismatch HLA: Doador Idêntico = 3; • Ocorrência de Rejeição = 0 Todas as variáveis foram escaladas para situarem-se dentro da faixa de operação dos neurônios artificiais [0,1-0,9] (Andrea e Kalayeh, 1991); Características da RNA Duas RNA com arquiteturas diferentes foram utilizadas: a) com as 15 entradas originais e b) com o número de entradas reduzido após a aplicação de ACP; Estrutura: • Feedfoward, totalmente conectada; • Apresentação de exemplos em lote; • Neurônios artificiais com função logsigmoidal; • Quantidade de neurônios na camada oculta conforme Andrea e Kalayeh (1991). Características da RNA Algoritmo de Aprendizagem: • Algoritmo de retropropagação do erro; • Técnica de otimização por gradiente descendente; • Taxa de aprendizagem e constante de momento segundo Sheppard et al. (1999); • Função custo ou objetivo: Mean Square Error (mse). Autovetores (âi) e Autovalores () mais representativos. Percentual de informação de cada autovetor. Comparação Entre Estimativas dos Modelos RNA Foram feitas 15 sessões de treinamento para cada uma das RNA com pesos iniciais aleatórios com FDP uniforme; RNA 15x8x1 (sem ACP) RNA 6x3x1 (com ACP) O treinamento é interrompido após 5000 épocas ou mse igual a 0,01; Sessões de Treinamento da RNA MSE mínimo alcançado após 5000 épocas no treinamento da RNA. Sessão Sem ACP Com ACP 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 0,11 0,12 0,12 0,11 0,13 0,14 0,10 0,09 0,13 0,11 0,13 0,14 0,11 0,11 0,12 0,10 0,09 0,09 0,10 0,10 0,10 0,10 0,10 0,10 0,10 0,11 0,10 0,10 0,10 0,09 Resultados Média e mediana do conjunto das 15 sessões de treinamento após a aplicação de ACP foram significativamente menores do que no conjunto utilizando as variáveis originais (p=0,001, Teste de Postos com Sinais de Wilcoxon ). Discussão Mesmo utilizando os oito maiores autovalores (representando mais do que 90% da informação), a aplicação de ACP ainda resultou em melhor convergência (p=0,002); As variáveis previamente selecionadas possuem redundância, evidenciada após a aplicação de ACP (diminuição em quase 2/3 das variáveis originais); Discussão Como sugerido por Haykin (2002), a descorrelação das variáveis de entrada no conjunto de estimação possibilitou melhoria na convergência, com ganho de simplicidade para o modelo; Conclusão A aplicação de ACP nas variáveis de entrada originais resultou em seis novas variáveis que, ao serem aplicadas à entrada da RNA, melhoraram a convergência e o desempenho do treinamento da RNA para o conjunto de dados em estudo. Referências [1] Sheppard, D., McPhee, D., Darkr, C., Shrethra, B., Moore, R., Jurewitz, A., Gray, A., (1999), “Predicting Citomegalovirus Disease After Renal Transplantation: An Artificial Network Approach”, Int J Med Inf, v. 54, n. 1, p. 55-76. [2] Andrea, T.A., Kalayeh, H., (1991), “Applications of Neural Networks in Quantitative Structure-Activity Relationships of Dihydrofolate Reductase Inhibitors”, J Med Chem, v. 34, n. 9, p. 2824-2836. Referências [3] Haykin, S., (2002), Redes Neurais – Princípios e Prática, 2ª Edição, Porto Alegre, Bookman.