Definição de Variáveis em Redes
Neurais Artificiais por Análise de
Componentes Principais:
Aplicação em Transplante Renal
Antonio Fernando. C. Infantosi
Renan Moritz. V. R. Almeida
João Carlos G. D. Costa
Programa de Engenharia Biomédica, COPPE,
Universidade Federal do Rio de Janeiro (UFRJ)
Carlos A. L. Ávila
José H. Rocco Suassuna
Faculdade de Medicina
Universidade Estadual do Rio de Janeiro (UERJ)
Estrutura da Apresentação
















Introdução
Objetivo
Redes Neurais Artificiais
Análise de Componentes Principais
Base de Dados de Transplantados Renais
Variáveis de Entrada da RNA
Variável de Saída da RNA
Características das Variáveis
Características da RNA
Comparação Entre Estimativas dos Modelos RNA
Autovetores e Autovalores mais representativos
Simulações para Treinamento da RNA
Resultados
Discussão
Conclusão
Referências
Introdução

Redes Neurais Artificiais (RNA) têm sido
cada vez mais empregadas na prática
médica, porém ainda sem aceitação
universal;

Trabalhos têm mostrado a viabilidade das
RNA no auxílio ao diagnóstico, até mesmo
com vantagens sobre Regressão Logística
(RL);
Introdução

Em transplantes renais (TXR), as RNA têm
sido usadas em aplicações tais como:
a) Predição de funcionamento do
enxerto;
b) Diagnóstico de rejeição;
c) Seleção de variáveis para
previsão de rejeição crônica;
d) Predição de citomegalovirose;
e) Dosagem de imunossupressores;
Introdução

A existência de colinearidade entre
variáveis de entrada de uma RNA
implica:
• Aumento desnecessário da complexidade;
• Pouco acréscimo de informação.
Objetivo
Utilizar a Análise de Componentes
Principais na redução da
dimensionalidade do vetor de
entrada de uma RNA para predição
de sobrevida de enxerto renal.
Redes Neurais Artificiais


Redes Neurais Artificiais são modelos que
simulam o comportamento neuronal
humano;
As RNA têm sido apontadas como
alternativas às técnicas de predição
tradicionais:
a) Detecção de relações complexas entre as
variáveis;
b) Robustez quanto à perda de informações;
c) Adaptabilidade;
d) Processamento paralelo (rapidez);
e) Mapeamento caixa-preta;
f) Mapeamento através de funções não lineares
Análise de Componentes Principais

A ACP é uma técnica de análise
multivariada linear para diminuição da
quantidade de variáveis (usualmente
preditoras em um modelo), sem perda
considerável de informação;

As novas variáveis de entrada do modelo
são compostas da multiplicação matricial
entre as variáveis originais e os
autovetores da matriz de variáveis;
Base de Dados de Transplantados Renais
a) 109 pacientes com dados completos
(doadores vivos);
b) Definição de três conjuntos de dados
(Haykin, 2002) :
1. Treinamento da RNA: 60 pacientes;
2. Validação da RNA: 17 pacientes;
3. Teste da RNA: 32 pacientes;
Variáveis de Entrada da RNA
co: contínua
c : categórica
d : dicotômica
1) Idade Receptor (co);
2) Idade Doador (co)
3) Diferença Idade Doador/Receptor (co);
4) Status Diferença Idade (d);
5) Sexo Receptor (d);
6) Sexo Doador (d);
7) Raça Receptor (d);
8) Raça Doador (d);
9) Transplantes Prévios (co);
10)Tempo de Diálise (co);
11)Tipo de Diálise (d);
12)Ocorrência de Rejeição (d);
13)Mismatch HLA (c);
14)Esquema Imunossupressor (d);
15)Transfusões Sangüíneas (co);
Variável de Saída da RNA
1) Sobrevida do enxerto em meses

Pacientes com sobrevida maior ou igual a
60 meses foram considerados como tendo
escore igual a 1;
Características da Variáveis

O status das variáveis dicotômicas e
categórica contribuintes para o sucesso do
TXR foram definidas com o maior escore,
p.ex.:
• Sexo Doador: masculino = 1;
• Mismatch HLA: Doador Idêntico = 3;
• Ocorrência de Rejeição = 0

Todas as variáveis foram escaladas para
situarem-se dentro da faixa de operação
dos neurônios artificiais [0,1-0,9] (Andrea e
Kalayeh, 1991);
Características da RNA

Duas RNA com arquiteturas diferentes
foram utilizadas: a) com as 15 entradas
originais e b) com o número de entradas
reduzido após a aplicação de ACP;
Estrutura:
• Feedfoward, totalmente conectada;
• Apresentação de exemplos em lote;
• Neurônios artificiais com função logsigmoidal;
• Quantidade de neurônios na
camada oculta conforme Andrea e
Kalayeh (1991).
Características da RNA
Algoritmo de Aprendizagem:
• Algoritmo de retropropagação do
erro;
• Técnica de otimização por gradiente
descendente;
• Taxa de aprendizagem e constante
de momento segundo Sheppard et
al. (1999);
• Função custo ou objetivo: Mean
Square Error (mse).
Autovetores (âi) e Autovalores ()
mais representativos.
Percentual de
informação de
cada autovetor.
Comparação Entre Estimativas dos
Modelos RNA

Foram feitas 15 sessões de treinamento
para cada uma das RNA com pesos
iniciais aleatórios com FDP uniforme;
RNA 15x8x1 (sem ACP)

RNA 6x3x1 (com ACP)
O treinamento é interrompido após 5000
épocas ou mse igual a 0,01;
Sessões de
Treinamento
da RNA
MSE mínimo alcançado
após 5000 épocas no
treinamento da RNA.
Sessão Sem ACP Com ACP
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
0,11
0,12
0,12
0,11
0,13
0,14
0,10
0,09
0,13
0,11
0,13
0,14
0,11
0,11
0,12
0,10
0,09
0,09
0,10
0,10
0,10
0,10
0,10
0,10
0,10
0,11
0,10
0,10
0,10
0,09
Resultados

Média e mediana do conjunto das 15
sessões de treinamento após a aplicação
de ACP foram significativamente menores
do que no conjunto utilizando as variáveis
originais (p=0,001, Teste de Postos com
Sinais de Wilcoxon ).
Discussão

Mesmo utilizando os oito maiores
autovalores (representando mais do que
90% da informação), a aplicação de ACP
ainda resultou em melhor convergência
(p=0,002);

As variáveis previamente selecionadas
possuem redundância, evidenciada após a
aplicação de ACP (diminuição em quase
2/3 das variáveis originais);
Discussão

Como sugerido por Haykin (2002), a
descorrelação das variáveis de entrada no
conjunto de estimação possibilitou
melhoria na convergência, com ganho de
simplicidade para o modelo;
Conclusão

A aplicação de ACP nas variáveis de
entrada originais resultou em seis novas
variáveis que, ao serem aplicadas à
entrada da RNA, melhoraram a
convergência e o desempenho do
treinamento da RNA para o conjunto de
dados em estudo.
Referências


[1] Sheppard, D., McPhee, D., Darkr, C.,
Shrethra, B., Moore, R., Jurewitz, A., Gray,
A., (1999), “Predicting Citomegalovirus
Disease After Renal Transplantation: An
Artificial Network Approach”, Int J Med Inf,
v. 54, n. 1, p. 55-76.
[2] Andrea, T.A., Kalayeh, H., (1991),
“Applications of Neural Networks in
Quantitative Structure-Activity
Relationships of Dihydrofolate Reductase
Inhibitors”, J Med Chem, v. 34, n. 9, p.
2824-2836.
Referências

[3] Haykin, S., (2002), Redes Neurais –
Princípios e Prática, 2ª Edição, Porto
Alegre, Bookman.
Download

910