Modelagem de Dados
•
Revisão
Redes neuronais artificiais: aplicações
nas ciências farmacêuticas – uma revisão
Artificial neural networks: applications in the pharmaceutical sciences – a review
João Rui Barbosa de Alencar1* & Maurício Bezerra de Souza Jr2
RESUMO – Redes neuronais são técnicas do campo da inteligência artificial, que nas últimas duas décadas
receberam um grande número de aplicações em diversas áreas do conhecimento. O objetivo deste trabalho
é apresentar uma breve revisão da sua teoria e uma retrospectiva das suas aplicações na área das ciências
farmacêuticas. As principais aplicações se referem à predição do comportamento fármaco-cinético e fármaco-dinâmico de drogas, e otimização de formulações de medicamentos. Uma aplicação à modelagem dos
dados de um estudo de bioequivalência entre comprimidos de 150mg do medicamento LAFEPE ® Lamivudina e o medicamento de referência Epivir® é apresentada como ilustração do uso. Apesar do potencial das
redes neuronais para modelagem de processos complexos, percebe-se uma fraca interação das redes neuronais com os processos produtivos de fabricação da indústria far macêutica ao contrário do que requer o PAT
– Process Analytical Technology.
PALAVRAS-CHAVE – Redes neuronais artificiais, Ciências Farmacêuticas.
SUMMARY – Neural networks are artificial intelligence techniques that in the last two decades were
employed a great number of applications in different areas of knowledge. The aim of this work is to
present a concise review its theory and a retrospective of their applications in pharmaceutical sciences
area. The main applications concern the prediction of pharmacokinetic and pharmacodynamic behavior
of drugs and optimization of medicine formularizations. An application to modeling of the data study of
bio-equivalence between 150mg LAFEPE ® tablet medicine Lamivudine and the reference medicine Epi vir® is presented to illustrate the use. Despite the potential of the neural networks for modeling of complex processes, a weak interaction of the neural nets with the productive processes of manufacture by the
phar maceutical industry is perceived in contrast with the demands of the PAT – P rocess Analytical Technology.
KEYWORDS – Neural networks, Pharmaceutical Sciences.
INTRODUÇÃO
C
om o advento do PAT – Process Analytical Technology, o recente programa instituído pelo FDA (Food
and Drug Administration) dos Estados Unidos, as indústrias farmacêuticas estão motivadas a reduzir problemas com a qualidade dos produtos, e, ao mesmo
tempo, aumentar a eficiência dos processos de produção e garantia de qualidade (FDA, 2003). Para tanto,
as indústrias estão dispostas a lançar mão de ferramentas destinadas ao projeto, análise e controle dos processos de fabricação hoje já disponíveis em outros segmentos industriais agregando conhecimento aos seus
processos, e a substituir, ao longo do tempo, a atual
forma de trabalho que é baseada em muito empirismo,
práticas convencionais, e muito pouca ciência.
Com este enfoque, a modelagem matemática dos
processos surge como uma ferramenta valiosa para
auxiliar as indústrias. Porém, devido à complexidade
dos processos farmacêuticos, dificilmente seriam obtidos modelos do processo a partir das leis de conserva-
ção de massa, energia e quantidade de movimento como
são os modelos fenomenológicos. Assim, os modelos
tipo caixa-preta como os baseados em redes neuronais
artificiais se apresentam como uma alternativa viável,
dado que estas são consideradas mapeadores universais entre dados de entrada e saída (Hornik et al, 1989).
O surgimento de uma vasta gama de aplicações tem
tornado as redes neuronais artificiais o foco de muita
atenção. Redes neuronais são uma técnica do campo
da inteligência artificial, que nas últimas duas décadas tem mostrado um grande número de aplicações em
áreas como análise e processamento de sinais, controle
de processos, robótica, classificação de dados, reconhecimento de padrões em linhas de montagem, análise
de imagens, análise de voz, análise de aroma e odor,
dentre outras (Baughman & Liu, 1995).
O objetivo deste trabalho é apresentar uma revisão da
teoria envolvendo redes neuronais e uma retrospectiva
das aplicações com estas ferramentas na área das ciências farmacêuticas dada a importância que representa para
com o advento das tecnologias analíticas de processo.
Recebido em 21/3/2007
D. Sc. em Tecnologia de Processos Químicos e Bioquímicos pela EQ/UFRJ
2
Professor Associado I EQ/UFRJ, D.Sc. Engenharia Química pelo PEQ/COPPE/UFRJ
Universidade Federal do Rio de Janeiro/UFRJ), Centro de Tecnologia, Escola de Química
Ilha do Fundão, Bloco E, Sala 207 – 21949-900, Rio de Janeiro - RJ - Brasil - Fone (0xx21)2562-7636/Fax (0xx21)2562-7616
1
Rev. Bras. Farm., 88(3): 145-152, 2007
145
2. Redes neuronais artificiais
Redes neuronais são modelos matemáticos desenvolvidos para descrever o comportamento de sistemas
físicos, a partir de um conjunto de dados de entrada e
saída correspondentes (Haykin, 1994). Matematicamente, as redes neuronais podem ser vistas como um tipo
de modelo de regressão não linear de dados, onde os
parâmetros da rede são ajustados mediante um critério
de minimização de erros.
Inspirado, originalmente, na forma como o sistema
nervoso organiza seus neurônios, os modelos de neurônios artificiais, desenvolvidos podem ser arranjados
ordenadamente para construir as chamadas redes neuronais artificiais. A rede é capaz de processar dados
numéricos, produzindo sinais de saída a partir de dados de entrada, após uma etapa chamada de treinamento. (Campos & Saito, 2004).
No treinamento (às vezes chamado de aprendizagem), os parâmetros da rede, pesos e “biases”, são
modificados. A forma de treinamento mais utilizada é a
que se baseia na experiência prévia, tal que padrões
de dados de entrada e de saída são apresentados à
rede de modo que ela modifica seus parâmetros a fim
de obter as saídas desejadas. A rede cria um modelo
interno do processo que rege os dados que a mesma
recebe, de maneira que ela possa predizer as novas
entradas (através de interpolações e extrapolações) e
reconhecer padrões mesmo para dados com ruídos (Joseph et al., 1992).
Várias arquiteturas podem ser obtidas, destacandose três tipos como sendo as mais comumente empregadas, que são: a rede de múltiplas camadas, também
chamadas de MLP (ou Multilayer Perceptron) com neurônios internos com funções de ativação sigmoidal, a
rede de funções de base radial - RBF com três camadas, uma de entrada com neurônios com funções de
ativação lineares, uma camada escondida com unidades com função de ativação de bases radiais e uma camada de saída de unidades lineares e as redes lineares , que têm apenas duas camadas, sendo a de saída
formada com neurônios lineares.
2.1. Modelo de um Neurônio Artificial
soma essas entradas ponderadas e o valor resultante é
por sua vez somado a um limite interno de ativação,
“bias”, que pode ser representado por Θ. O neurônio,
em seguida, produz uma resposta (y) para este sinal
de acordo com uma função de ativação (De Souza Jr.,
1993).
O comportamento de um neurônio pode ser expresso matematicamente, por:
(1)
(2)
tal que f é usualmente escolhida entre a função sigmoidal ou tangente hiperbólica para a camada escondida e sigmoidal ou linear para a camada de saída
nas redes de múltiplas camadas. A Tabela I resume as
principais funções de ativação empregadas com as
redes neuronais. A Figura 2 mostra uma representação de uma rede neuronal do tipo MLP, com três neurônios na camada de entrada, três na camada esconTABELA I
Funções de ativação usualmente empregadas
Nome
Fórmula - f(x)
Características
Degrau
+1 se x > 0
0 caso contrário
não diferenciável
degrau unitário
positiva
Sigmóidal
Tangente
Hiperbólica
1
1+exp-x
tanh(x)
Gaussiana
O neurônio artificial é uma entidade capaz de receber e enviar sinais, sendo seu comportamento simulado como explicado na seqüência.
Um neurônio qualquer de uma camada, Figura 1,
recebe um conjunto de informações dos neurônios da
camada anteriores, x( i), ponderadas, cada uma, pelo
peso w(i) correspondente à sua conexão. O neurônio
FIG. 1 - O neurônio: elemento processador da rede neural.
146
Figura
diferenciável
degrau suave
positiva
diferenciável
degrau suave
diferenciável
pulso suave
Fig. 2 – Rede neuronal MLP com 3 camadas
Rev. Bras. Farm., 88(3), 2007
dida e três na camada de saída. A cada conexão entre
neurônios está associado um peso e a cada neurônio,
um “ bias” ; esses parâmetros serão otimizados e fixados na etapa de treinamento. Na mesma Figura, o a i
representa as saídas dos neurônios da camada de
entrada e v ij os pesos relativos às conexões entre a
camada de entrada e a camada escondida. Já os parâmetros bi, representam as saídas dos neurônios da
camada escondida e os wij os pesos relativos às conexões entre a camada escondida e a camada de saída.
Uma rede como a da Figura 2 terá, portanto, 24 parâmetros, sendo 18 pesos e 6 “ biases”, uma vez que os
“biases” da camada de entrada são usualmente considerados nulos. As informações das variáveis de entrada, x i, são normalmente escalonadas, para que pesos muito grandes e dificuldade de convergência sejam evitados.
O desenvolvimento de redes neuronais requer a
realização de duas fases consecutivas:
l Fase de treinamento
l Fase de generalização
Para treinamento, a base de dados é dividida em
um conjunto de dados para treinamento, formado por
grande parte dos dados e um conjunto de dados para
validação (ou seleção) das redes, formado para verificação da capacidade de generalização das redes treinadas. O objetivo da fase de treinamento, também chamada fase de aprendizagem, é ajustar os pesos e “ biases” da rede pela apresentação de exemplos de padrões de entrada e saída, modificando-os, até que a
aplicação de um conjunto de entradas produza saídas
da rede que cor respondam às saídas desejadas. Tratase de um problema de otimização. Treinar uma rede
corresponde a minimizar uma função objetivo não-linear que dá o erro entre as saídas
, preditas pela
rede, e as saídas desejadas (y k ).
(3)
onde η é um parâmetro de ajuste conhecido como taxa
η<1 e E é dado por
de aprendizagem, e tal que 0<η
pela equação 3.
Segundo De Souza Jr., (1993), as redes treinadas
por este método são multicamadas, não apresentam
conexões laterais, (entre neurônios da mesma camada), e os seus sinais são feedforward, ou seja, dado
um vetor de entrada, o vetor de saída é calculado em
um passo do tipo para frente (“forward”) que calcula
os níveis de atividade de cada camada por vez, usando
os níveis de atividade já computados nas camadas anteriores.
As fórmulas para cálculo do gradiente da função
objetivo em relação aos pesos e “biases” foram detalhadamente deduzidas em De Souza Jr., (1993).
O processo se repete até que o erro seja suficientemente pequeno. Logo, enquanto houver diferença entre as saídas da rede e os valores desejados para um
dado padrão, essa diferença vai dar um sinal de erro
que é propagado de volta pela rede e usado para gerar
mudança nos pesos. A parada do procedimento se dá,
quando o valor do erro entre as medidas reais e inferidas começam a aumentar quando medidas para um
conjunto de dados não utilizados durante o treinamento, isto é conjunto de seleção. A precisão das redes
normalmente é medida por comparação entre os dados
reais e as inferências produzidas pelas redes através
de coeficientes de correlação linear e erros de predição.
η)
A técnica do gradiente descendente com passo (η
fixo adotada no método “backpropagation” é, entretanto, ineficiente. Dificuldade de convergência em função
da escolha do tamanho do passo foi observada. Passos
pequenos conduzem a convergência extremamente lenta e passos grandes a oscilações nas variáveis independentes de otimização.
Com o intuito de evitar essas oscilações nos pesos,
pode-se somar ao lado direito da equação 6 um termo
de momento (Rumelhart & Mcclelland, 1986):
(6)
(4)
tal que NP é o número de padrões e no o número de
neurônios da última camada.
O treinamento constitui-se de duas fases: a fase em
que cada padrão de dados é apresentado e propagado
para frente através da rede, iniciando-se com pesos
aleatórios compreendidos entre –1 e 1, até computar os
sinais de saída, que são comparados com as saídas
desejadas, obtendo-se um erro; e a fase em que este
erro é propagado para trás e os pesos vão sendo atualizados. (De Souza Jr., 1993).
No método chamado “backpropagation” ou “retropropagação”, o processo de mudança dos pesos é feito
de modo proporcional ao gradiente descendente do
quadrado dos erros entre a predição da rede e o valor
desejado, seguindo-se a expressão geral, para a k-ésima iteração:
(5)
Rev. Bras. Farm., 88(3), 2007
Por sua vez, o método do gradiente conjugado é um
método mais avançado de otimização em que os parâmetros da equação 6 podem ser recalculados a cada
iteração (De Souza Jr., 1993).
2.2. Redes de função de base radial
Outro tipo de rede que tem se tornando uma alternativa de modelo não linear para problemas de
regressão e classificação são as redes de função de
base radial. As funções de base radial também são
capazes de aproximar qualquer função não linear,
porém seus algoritmos de treinamento diferem das
redes MLP. Possuem em geral, reconhecida capacidade de treinamento mais rápido que as redes MLP
dada, principalmente a sua saída linear na última
camada e por produzirem melhor desempenho quando a base de dados se constitui um espaço de aglomerados de informações. As redes RBF consistem de
três camadas, sendo uma de entrada, uma escondida e outra de saída. A primeira camada apenas propaga as entradas, isto é, não há aplicação de parâmetros de ponderação, ou ainda, as saídas são iguais
às entradas. Na camada escondida ocorre a mais
importante etapa do processamento. Nesta, as uni147
dades devem satisfazer uma propriedade de serem
radialmente simétricas às quais devem possuir:
- Um vetor centro ( ck ) gerado a partir dos dados de
entrada considerando o centro de aglomerados de dados;
- Uma medida de distância (raio) ( Ik ) que representa o quão distante está um vetor de entrada (xi) do vetor centro, a exemplo da equação 7, onde N é o número
de padrões:
(7)
- Uma função de transferência de bases radiais que
transforma a distância I k na saída de cada unidade de
processamento da camada, sendo a mais comum a Gaussiana, equação 8, onde σk é uma constante denominada fator de escala ou desvio-padrão do espaço delimitado pela unidade k:
(8)
Em resumo, a camada escondida processa a informação em duas etapas: o cálculo da distância Ik e a
aplicação da função de transferência. As saídas das
unidades da camada escondida são totalmente conectadas àquela(s) da camada de saída final através de
uma ponderação das suas saídas. A última camada
possui unidades lineares, isto é, sua saída é resultado
da soma ponderada das suas entradas, sendo os pesos
ajustados a exemplo do método backpropagation. (Baughman & Liu, 1995).
O procedimento típico de treinamento de uma rede
de base radial envolve três estágios:
- o primeiro estágio é o treinamento da camada
escondida, quando se definem os parâmetros desta
camada (localização dos centros e dos desvios);
- o segundo estágio define os valores dos pesos
entre as camadas escondida e de saída, num procedimento de otimização linear a exemplo do backpropagation descrito anteriormente. Nessa segunda fase,
os parâmetros definidos na primeira fase não se modificam. Essas etapas são descritas resumidamente a
seguir:
Localização de centros: vários algoritmos podem
ser utilizados para esta etapa. No algoritmo K-means
descrito por Baughman & Liu (1995) os vetores centros (ck) são otimizados partindo-se de um conjunto
inicial de centros determinados arbitrariamente do
conjunto dos dados de entrada. Os elementos do vetor (cik) são armazenados como pesos entre a camada
de entrada e a camada escondida. À medida que o
conjunto de dados de treinamento é apresentado à
rede os novos centros são localizados interativamente
de modo a minimizar a soma dos quadrados das distâncias entre os dados de treinamento e seus centros
mais próximos ck . A cada novo padrão os centros são
recalculados baseados, por exemplo, na seguinte
equação 9 (Baughman & Liu, 1995):
148
(9)
tal que a é a taxa de aprendizagem que diminui à medida que o processo iterativo progride. Este procedimento se repete por um número fixo de interações ou
até que não seja mais necessária a modificação dos
mesmos.
Estabelecimento dos desvios: também para determinação do desvios da função, vários algoritmos estão disponíveis. No P-near est neighbors consideramse, além de um conjunto de centros ck,, um conjunto
de P centros ( ck1 , ck2,...,ckp) mais próximos deste. Assim, os comprimentos do vetor s são escolhidos levando-se em conta a distância média dos vizinhos mais
próximos de cada neurônio. O desvio ou espalhamento
da função é calculado pela equação 10 (Baughman &
Liu, 1995):
(10)
Otimização: Uma vez estabelecidos os centros de
cada neurônio e os fatores de escala, estes são mantidos fixos e a saída da camada escondida, vk, pode ser
determinada. As conexões de pesos entre a camada
escondida e a camada de saída são obtidas através de
procedimentos de regressão linear a exemplo dos Mínimos Quadrados.
- o terceiro estágio de treinamento é a utilização
da rede propriamente dita, isto é, com os parâmetros
definidos nos estágios anteriores, calculam-se as predições das redes para os conjuntos de dados de treinamento e testes, e compara-se com os valores reais de
cada saída associada à cada padrão.
2.3. Redes lineares
Em geral um modelo mais simples é sempre preferível em detrimento de um modelo complexo quando este
não produz um bom ajuste dos dados. Desta forma, o
modelo mais simples é o linear o qual está sempre sendo referenciado. A rede linear não possui camada escondida, isto é, os dados são propagados da camada de
entrada diretamente para a camada de saída sendo a
saída propriamente dita um somatório ponderado das
entradas nesta camada. conforme Equação 11.
(11)
3. Redes Neuronais Artificiais nas Ciências Farmacêuticas
A habilidade em aproximar funções altamente nãolineares e complexas, através da apresentação de um
conjunto de dados experimentais, fez das redes neuronais, ferramentas úteis na modelagem de sistemas complexos.
Nas Ciências Farmacêuticas, as redes neuronais
também já têm sido aplicadas a uma ampla gama de
processos e sistemas. Uma visão geral das principais
aplicações das redes neuronais nesta área é feita por
Achanta et al. (1995) e Agatonovic-Kustrin & Beresford (2000).
Rev. Bras. Farm., 88(3), 2007
A obtenção de formulações nas quais o princípio
ativo de um medicamento atinja os seus alvos, através da corrente sangüínea, na concentração e na velocidade preconizados pela terapêutica, é o principal
objetivo de quem desenvolve produtos farmacêuticos.
Para tanto, ensaios de dissolução ( in vitro) e de biodisponibilidade ( in vivo) são fundamentais para comprovação desses parâmetros.
É nessa linha, de desenvolvimento e otimização
de formulações de produtos farmacêuticos, que as redes neuronais têm sido bastante aplicadas. Hussain
et al. (1991); Kesavan & Peck (1996); Bourquin, et al.
(1997); Bourquin, et al. (1998a); Bourquin, et al.
(1998b); Bourquin, et al. (1998c); Edube et al. (1997);
Takahara, et al. (1997); Zhang & Southard (1998); Chen
et al. (1999); Takayama et al. (1999a); Takayama et al.
(1999b) e Wu et al. (2000), aplicaram com sucesso, as
redes neuronais para otimização de formulações de
diversos produtos, avaliando a influência de parâmetros das formulações no perfil de dissolução ou nos
parâmetros de qualidade fixados para cada um dos
produtos. Esses autores, quase sempre, utilizavam
como parâmetros de entrada das redes, concentrações
dos ingredientes inativos; e, como saída ( outputs ),
parâmetros associados ao perfil de dissolução, isto é,
concentrações do fármaco em diversos tempos após a
dissolução, além de propriedades físicas dos medicamentos associadas às especificações farmacopéicas dos
mesmos.
Veng-Pedersen & Modi (1993) e Gobbur u & Chen
(1996) avaliaram a utilidade das redes neuronais para
reconhecer o comportamento farmacodinâmico de drogas. Nesses trabalhos foi avaliada a capacidade das
redes neuronais de reproduzir o comportamento de
drogas quando simuladas por modelos clássicos de
comportamento farmacocinético e farmacodinâmico de
drogas.
Hussain et al. (1993) utilizaram sem muito sucesso os recursos da modelagem neural para predizer a
partir de dados obtidos com animais o comportamento
farmacocinético de drogas como Zalcitabina e Zidovudina utilizadas no tratamento da AIDS.
Brier et al. (1995) utilizaram, de forma bem sucedida, redes neuronais para predizer o pico de concentração plasmática de gentamicina em função da
idade, altura, peso, dose, intervalo entre doses, relação peso/dose, creatinina, clearance de creatinina,
superfície corporal e duas outras variáveis representando o intervalo entre doses que foi variável (8 ou 12
horas). A arquitetura da rede estudada possuía 11
neurônios de entrada, uma camada escondida com 5
neurônios e um neurônio na camada de saída prevendo o pico de concentração. Os autores compararam os
resultados obtidos com a modelagem neural com um
algoritmo NONMEN - Nonlinear mixed effect modeling e ambos mostraram resultados equivalentes.
Opara et al. (1999) utilizaram redes neuronais para
predição de parâmetros farmacocinéticos e análise de
diversos fatores que influenciam nos estudos de bioequivalência.
Outra linha de trabalhos utilizando redes neuronais é a obtenção de correlações entre o comportamento de drogas in vitro e o correspondente comportamento in vivo (CIVIV), podendo-se citar os trabalhos de Hussain (1997) e Dowell et al. (1999). Nestes,
redes são utilizadas para modelar o comportamento
Rev. Bras. Farm., 88(3), 2007
entre dados de dissolução de formulações obtidos em
laboratório com o comportamento farmacocinético das
mesmas drogas obtidos em estudos in vivo.
A modelagem via redes neuronais do processo de
granulação por leitos fluidizados foi estudada por
Murtoniemi et al. (1994). Parâmetros de pressão e temperatura do ar e concentração da solução de granulação foram utilizados como entradas da rede. Tamanho
médio dos grânulos e friabilidade destes foram os parâmetros controlados ou saídos da rede. A rede neuronal mostrou-se capaz de prever adequadamente o
comportamento do granulador.
Poucos trabalhos envolvem o controle do processamento dos medicamentos. Em Turkoglu et al (1995) a
otimização de parâmetros do processamento de um
comprimido de hidroclorotiazida obtido por compressão direta via redes neuronais foi obtido. Foram utilizadas, como dados de entrada, variações do tipo de
lubrificante utilizado na formulação, além da força de
compressão e do tempo de mistura e, como saída, o
teor dos comprimidos e a velocidade de dissolução do
fármaco nos tempos 30 e 60min.
A predição do teor e da dureza de comprimidos de
teofilina de várias formulações com concentrações variadas do fármaco, a partir de dados de espectroscopia próxima do infravermelho (NIR) foi o objetivo do
trabalho de Chen et al (2001).
Em vários segmentos industriais, especialmente o
da indústria química e petroquímica, encontram-se
aplicações das redes neuronais na modelagem e controle de processos industriais. Aplicações mais recentes têm sido desenvolvidas para a construção de modelos de processo visando sua utilização como sensores virtuais de variáveis de qualidade, cuja instrumentação ou não está disponível ou o tempo de análise é tão grande que inviabiliza ações de controle a
partir dos seus resultados. Araúzo-Bravo et al. (2004)
Sensores ou analisadores virtuais são modelos preditivos treinados a partir de um conjunto de dados
representativos que possibilitem prever o comportamento e interpolar dados esparsos. Normalmente, os
modelos puramente empíricos, como os baseados em
redes neuronais, são bem utilizados, porém, modelos
de regressão linear; filtros de K alman, sistemas fuzzy,
além dos modelos fenomenólgicos são também aplicados para o desenvolvimento de sensores virtuais
(Campos & Saito, 2004).
Aplicações de sensores virtuais, baseados em redes
neuronais na fabricação de medicamentos, são raras e
se constituem potenciais usos das tecnologias analíticas de processo para inferências de suas variáveis críticas dos medicamentos, uma vez que estes sempre são
avaliados por testes laboratoriais. Alencar et al (2006),
desenvolveram um estudo inicial sobre um sensor virtual baseado em redes neuronais para inferência contínua dos parâmetros teor, dissolução e unifor midade de
conteúdo de comprimidos de captopril 25mg, a partir
de dados disponíveis no controle em processo.
3.1. Aplicação de redes neuronais
à modelagem do estudo de bioequivalência
Estudos de bioequivalência são etapas fundamentais na obtenção do registro de um medicamento genérico. Tais estudos, além de serem caros, consomem tempo e são influenciados por variáveis diversas, extremamente difíceis de serem modeladas tendo em vista
tratar-se de sistemas biológicos.
149
A modelagem matemática dos dados de biodisponibilidade pode ser útil na predição do comportamento
das drogas no organismo humano, assim como na seleção das variáveis que afetam o desempenho das mesmas.
A modelagem dos dados de um estudo de bioequivalência entre o medicamento teste Lamivudina, comprimidos de 150mg, de fabricanção do LAFEPE®, lote
00080226, e Epivir®, medicamento de referência fabricado pela Glaxo Welcome, lote B018603, foi obtida. Este
medicamento faz parte do coquetel destinado a portadores do vírus HIV.
Nestes, um grupo de 24 voluntários é recrutado e
submetido à administração do medicamento teste. Após
um tempo mínimo de um semana, procedeu-se à administração do medicamento de referência, ao qual o
medicamento teste se quer assemelhar. Após a administração do medicamento são coletadas amostras plasmáticas do sangue dos voluntários e feito o doseamento da droga (lamivudina) ao longo do tempo, até sua
total excreção. De posse dos dados das análises, a concentração do fármaco em estudo é plotada ao longo do
tempo e os parâmetros farmacocinéticos são obtidos a
partir desta curva. Os principais parâmetros são a área
sob a cur va (AUC) e que dá uma idéia da extensão da
absorção do fármaco, a concentração máxima (C MAX) e
o tempo para atendimento da concentração máxima
(TMAX).
Para desenvolvimento das redes neurais nessa
aplicação, empregou-se o pacote computacional Statistica Neural Networks , versão 6.0, utilizando o
método backpropagation e gradiente conjugado além
da função sigmoidal como função de ativação dos
neurônios da camada escondida. Foram treinadas e
comparadas, tendo por base critérios estatísticos, diversas redes.
Os dados de entrada para apresentação das redes
consistiram de 16 variáveis a saber:
- idade do voluntário,
- sexo (utilizando um(1) para homem e zero(0) para
mulher),
- relação peso/altura e
- concentrações plasmáticas da droga lamivudina
nos tempo 0; 0,5h; 1,0h; 1,5h; 2h; 3h; 4h; 6h; 8h; 10h;
12h; 24h; 30h.
Isso posto, a rede terá 16 neurônios na camada de
entrada.
O número de neurônios na camada escondida foi
variável entre o mínimo de 1 e máximo de 14. A camada de saída foi projetada para ter um único neurônio
para cada rede, estimando separadamente os parâmetros far macocinéticos: área sob curva (AUC) ou a concentração máxima da droga ou o tempo máximo para a
concentração máxima.
Dos 24 dados de comportamento da droga para cada
voluntário, foram selecionados 18 para treinamento das
redes e os 6 restantes foram utilizados para teste escolhidos aleatoriamente. Os dois conjuntos de dados das
duas formulações do medicamento foram tratados separadamente com a seleção de uma rede para modelar
cada conjunto.
Nas Tabelas II, III e IV são apresentadas o desempenho de cada tipo de rede para os dois conjuntos de
formulações, respectivamente, para os parâmetros CMAX,
T MAX e AUC. Tal desempenho foi medido através do
150
TABELA II
Desempenho das Redes de predição da CMAX
Tipo da Rede
Medicamento
R
Número de Neurônios
Linear
LAFEPE
0,170
16-0-1
MLP
LAFEPE
0,978
16-7-1
RBF
LAFEPE
0,843
16-6-1
Linear
Epivir
0,002
16-0-1
MLP
Epivir
0, 992
16-14-1
RBF
Epivir
0,885
16-9-1
TABELA III
Desempenho das Redes de predição da TMAX
Tipo da Rede
Medicamento
R
Número de Neurônios
Linear
LAFEPE
0,224
16-0-1
MLP
LAFEPE
0,990
16-7-1
RBF
LAFEPE
0,615
16-2-1
Linear
Epivir
0,002
16-0-1
MLP
Epivir
0, 992
16-14-1
RBF
Epivir
0,885
16-5-1
TABELA IV
Desempenho das Redes de predição da AUC
Tipo da Rede
Medicamento
R
Número de Neurônios
Linear
LAFEPE
0,999
16-0-1
MLP
LAFEPE
1,000
16-7-1
RBF
LAFEPE
0,943
16-3-1
Linear
Epivir
0,999
16-0-1
MLP
Epivir
1,000
16-6-1
RBF
Epivir
0,962
16-9-1
coeficiente de correlação linear (R) definido de acordo
com a equação 12.
(12)
onde n é o número de padrões utilizados para treinamento ou teste, é o valor predito pelo modelo, é o
valor real observado e é a média global da variável.
Para um modelo perfeito R ser igual à unidade, isso só
ocorrerá se não houver resíduos alguns entre os valores individuais e as respectivas predições do modelo,
isto é, toda a variação em torno da média for explicada
pela regressão.
Observa-se nas referidas tabelas que, para todos
os parâmetros, as redes do tipo MLP foram as que
apresentaram melhor desempenho. Para o parâmetro AUC do medicamento Epivir®, a rede linear apresentou desempenho similar. Com relação ao tamanho das redes, as mesmas tabelas indicam os tamanhos de cada rede através do número de neurônios
Rev. Bras. Farm., 88(3), 2007
de cada camada escondida, uma vez que a camada
de entrada e a saída são idênticas para todas as redes.
As Figuras 3, 4 e 5 apresentam o comportamento da
predição das melhores redes (MLP) em relação aos
dados reais para cada voluntário que participou do estudo, respectivamente e para cada um dos parâmetros
C MAX , TMAX e AUC.
Para o parâmetro CMAX – Figura 3 – o erro médio
absoluto das predições foi de 73,94ng/mL o que representa 3,7% em relação ao valor médio das medidas
reais.
Quanto ao parâmetro TMAX – Figura 4 – o erro médio
absoluto das predições foi de 0,0355 h (~2,13 minutos) o que representa 3,6% em relação ao valor médio
das medidas reais.
Já no caso do parâmetro AUC – Figura 5 – o erro
médio absoluto das predições foi de 12,22ng.h/mL o
que representa 0,19% em relação ao valor médio das
medidas reais. Percebe-se nessas figuras, que, de maneira geral, os modelos conseguiram reproduzir com
boa precisão os parâmetros farmacocinéticos do estudo.
Nas Figuras 6, 7 e 8 são mostrados os mesmos resultados para o medicamento de referência. Também
para este caso, todas as redes de melhor desempenho
foram do tipo MLP. Para o parâmetro CMAX – Figura 6 –
o erro médio absoluto das predições foi de 73,94ng/mL
o que representa 2,0% em relação ao valor médio das
medidas reais.
Quanto ao parâmetro TMAX do medicamento Epivir
– Figura 7 – o erro médio absoluto das predições foi de
0,144h (~8,6 minutos) o que representa 15,4% em relação ao valor médio das medidas reais.
Já no caso do parâmetro AUC – Figura 8 – o erro
médio absoluto das predições foi de 6,15ng.h/mL o que
representa 0,09% em relação ao valor médio das medidas reais. Percebe-se também nestas figuras, que os
modelos conseguiram reproduzir com boa precisão os
parâmetros farmacocinéticos do estudo.
FIG. 3 – CMAX – Formulação teste (LAFEPE) – Valores reais e preditos pelo modelo
FIG. 6 –Cmax – Epivir® - valores reais e preditos pelo modelo
FIG. 4 – TMAX – Formulação teste (LAFEPE) - Valores reais e preditos pelo modelo
FIG. 7 –Tmax – Epivir® - valores reais e preditos pelo modelo
FIG. 5 – AUC – Formulação teste (LAFEPE) - Valores reais e preditos pelo modelo
FIG. 8 –AUC – Epivir® -valores reais e preditos pelo modelo
Rev. Bras. Farm., 88(3), 2007
151
5. CONCLUSÕES
Como qualquer técnica de modelagem, as redes
neuronais possuem limitações tais como longos tempos de treinamentos, requer uma elevada quantidade
de dados para treinamento, não garante resultados otimizados e não permite estabelecer relações com os
modelos fenomenológicos. Por outro lado, possui destacada capacidade de modelar processos complexos de
natureza como são os sistemas vivos ou os que interagem com eles, além da habilidade para classificação,
reconhecimento de padrões.
Através de uma breve revisão da teoria das redes
neuronais e de uma revisão bibliográfica, este trabalho
teve como objetivo apresentar as aplicações da técnica
e identificar outros potenciais usos dentro deste segmento da ciência. Dada a complexidade dos sistemas
nos quais estão inseridas as ciências farmacêuticas, as
aplicações levantadas na literatura se referem basicamente à predição do comportamento farmacocinético e
farmacodinâmico de drogas, otimização de formulações
de medicamentos. Porém, conforme relatado por Achanta et al. (1995), as redes são bastante promissoras em
outras áreas como nas determinações de correlações
estrutura-atiividade de novas entidades químicas, interpretação de dados analíticos, controle de qualidade, estudos epidemiológicos, auxílio no diagnóstico de
doenças, dentre outras.
Por outro lado, muito pouco ainda se observa quanto a aplicações das redes neuronais no monitoramento
e modelagem de processos de fabricação da indústria
farmacêutica como está sendo requerido pelo PAT –
Process Analytical Technology. Percebe-se que esta é
uma grande promessa uma vez que tais metodologias
já foram bastante testadas com sucesso em outros segmentos industriais como o da indústria química e petroquímica.
6. REFERÊNCIAS
1. Achanta, A . S., Kowalski, J. G., Rhodes, C. T., Artificial Neural Networks: Implications for Pharmaceutical Sciences, Drug Development and Industrial Pharmacy , 21 (1), pp. 119-155, 1995.
2. Agatonovic-Kustrin, S. & Beresford, R., Basic concept of artificial neural network (ANN) modeling and its application in pharmaceutical research, Journal
of Pharmaceutical and Biomedical Analysis, 22, pp. 717-727, 2000.
3. Alencar, J. R. B., Rolim Neto, P. J., De Souza Jr., M. B., Bioequivalence Evaluation
of Formulations Containing Lamivudine Using Neural Networks, Anais VII PHARMATECH – International Conference on Pharmaceutical Technology and Quality Control , João Pessoa, Brasil, 2003.
4. Alencar, J. R. B., De Souza Jr., M. B., Lopes, C. E., Sensor Virtual para Controle
de Processos de Fabricação de Formas Farmacêuticas Sólidas, Anais XVI
COBEQ – Congresso Brasileiro de Engenharia Química, Santos-SP, Brasil, 2006.
5. Araúzo-Bravo, M. J., Cano-Izquierdo, J. M., Gómez-Sánchez, E., López-Neto, M.
J., Dimitriadis, Y. A., López-Coronado, J., Automatization of a Penicilin Production Process with Soft Sensors and an Adaptive Controller Based on Neuro
Fuzzy Systems, Control Engineering Practices, Article in Press, 2004.
6. Baughman, D. R. & Liu, Y. A. - Neural Networks in Bioprocess and Chemical
Engineering, Academic Press, USA, 1995, 488p.
7. Bourquin, J ., Schmidli, H., Van Hoogevest, P., Leuenberger, H., Application of
Artificial Neural Networks (ANN) in the Development of Solid Dosage Forms,
Pharmaceutical Development and Technology, 2 (2), pp. 111-121, 1997.
8. Bourquin, J., Schmidli, H., Van Hoogevest, P., Leuenberger, H., Comparison of
Artificial Neural Networks (ANN) with Classical Modelling Techniques Using Diffent Experimental Designs and Data From a Galenical Study on a Solid Dosage
Form, European Journal of Pharmaceutical Sciences, 6, pp. 287-300, 1998a.
152
9. Bourquin, J., Schmidli, H., Van Hoogevest, P., Leuenberger, H., Advantages of
Artificial Neural Networks (ANN) as Alternative Modeling Technique for Data
Sets Showing Non-Linear Relationships Using Data From a Galenical Study on
a Solid Dosage Form, European Journal of Pharmaceutical Sciences, 7, pp. 516, 1998b.
10. Bourquin, J., Schmidli, H., Van Hoogevest, P., Leuenberger, H., Pitfalls of Artificial Neural Networks (ANN) Modeling Techniques for Data Sets Containing
Outlier Measurements Using a Study on Mixture Properties of a Direct Compressed Dosage Form, European Journal of Pharmaceutical Sciences, 7, pp. 1728, 1998c.
11. Brier, M. E., Zurada, J. M., Aronoff, G. R., Neural Network Predicted Peak and
Trough Gentamicin Concetrations, Pharmaceutical Research, 12 (3), pp. 406412, 1995.
12. Campos, M. M. & Saito, K., Sistemas Inteligentes em Controle e Automação de
Processos, Rio de Janeiro, Ed. Ciência Moderna, 2004.
13. Chen, Y., Thosar, S. S., Forbess, R. A., Kemper, M. S., Rubinovitz, R. L., Shukla, A .
J., Prediction of Drug Content and Hardness of Intact Tablets Using Artificial
Neural Network and Near-Infrared Spectroscopy, Drug. Development and Industrial Pharmacy, 27(7), p.623-631, 2001.
14. De Souza Jr., M. B., Redes Neuronais Multicamadas Aplicadas a Modelagem e
Controle de Processos Químicos, Tese de Doutorado, COPPE/PEQ/UFRJ, Rio
de Janeiro, 1993.
15. Dowell, J. A., Hussain, A ., Devane, J., Young, D., Artificial Neural Networks Applied to the In Vitro-In Vivo Correlation of Extended-Release Formulation: Initial
Trials and Experience, Journal of Phamaceutical Sciences, 88 (1), pp.154-160,
1999.
16. Edube, N. K., Mccall, T., Chen, Y., Meyer, M. C., Relating Formulation Variables to
In Vitro Dissolution Using an Artificial Neural Network, Pharmaceutical Development and Technology, 2(3), pp. 225-232, 1997.
17. FDA, Guidance for Industry PAT - A Framework for Innovative Pharmaceutical
Manufacturing and Quality Assurance, August 2003, USA, 2003
18. Gobburu, J. V. S. , Chen, E. P., Artificial Neural Networks As a Novel Approach to
Integrated Pharmacokinetic-Pharmacodynamics Analysis, Journal of Phamaceutical Sciences, 85 (5), pp.505-510, 1996.
19. Haykin, S., Neural Networks: A Comprehensive Foundation, MacMillan Publishing Company, 1994.
20. Hornik, K., Stinchcombe, M., White, H., Multilayer Feed Forward Networks are
Universal Approximations, Neural Networks, 2 (5), pp. 359-366, 1989
21. Hussain, A. S., Yu, X. & Johnson, R. D., Application of Neural Computing in Pharmaceutical Product Development, Pharmaceutical Research, 8 (10), pp. 12481252, 1991.
22. Hussain, A. S., Johnson, R. D., Vachharajani, N. N., Ritschel, W., A., Feasibility
of Developing a Neural Network for Prediction of Human Pharmacokinetic
Parameters from Animal Data, Pharmaceutical Research, 10 (3), pp. 466-469,
1993.
23. Joseph, B., Wang, F. H., Shieh D. S. S., Exploratory Data Analysis: A Comparison of Statistical Methods With Artificial Neural Networks, Computers and
Chemical Engineering, (16)4. pp. 413-423, 1992.
24. Murtoniemi, E., Yliruusi, J., Kinnunen P., Merkku, P., Leiviska, K., The Advantages by the Use of Neural Networks in Modeling the Fluidized Bed Granulation
Process, International Journal of Pharmaceutics, 108, pp. 155-164, 1994.
25. Takahara, J., Takayama, K., Nagai, T., Multi-objective Simultaneous Optimization Technique Based on an Artificial Neural Network in Sustained Release
Formulations, Journal of Controlled Release, 49, pp.11-20, 1997.
26. Takayama, K., Takahara, J., Fujiwara, M., Ichikawa, H., Nagai, T., Formula Optimization Based on Artificial Neural Networks in Transdermal Drug Delivery,
Journal of Controlled Release, 62, pp.161-170, 1999a.
27. Takayama, K., Fujiwara, M., Nagai, T., Artificial Neural Network AS A Novel
Tehod to Optimize Pharmaceutical Formulations, Pharmaceutical Research,
16 (1), 1999b.
28. Turkoglu, M., Ozarslan, R., Sakr, A., Artificial Neural Network Analysis of a Direct Compression Tablet Ting Study, Eur. J. Pharm., Biopharm, 41(5), p.315-322,
1995.
29. Veng-Pedersen, P. & Modi, N., Application of Neural Networks to Pharmacodynamics, Journal of Pharmaceutical Sciences, 82 (9), pp. 918-926, 1993.
30. Wu, T., Pan, W., Chen, J., Zhang, R., Formulation Optimization Technique Based
on Artificial Neural Network in Salbutamol Sulfate Osmotic Pump Tablets, Drug
Development and Industrial Pharmacy, 26(2), pp. 211-215, 2000.
31. Zhang, Y. & Southard, M. Z., Dissolution Study of Ionizable Drug and Buffer Cocompressed Tablet by Neural Networks, Proceedings Annual Meeting of the
American Institute of Chemical Engineers, 1998.
Endereços eletrônicos
João Rui Barbosa de Alencar
E-mail: [email protected],
Maurício Bezerra de Souza Jr.
E-mail: [email protected]
Rev. Bras. Farm., 88(3), 2007
Download

Redes neuronais artificiais: aplicações nas ciências farmacêuticas