Modelagem de Dados • Revisão Redes neuronais artificiais: aplicações nas ciências farmacêuticas – uma revisão Artificial neural networks: applications in the pharmaceutical sciences – a review João Rui Barbosa de Alencar1* & Maurício Bezerra de Souza Jr2 RESUMO – Redes neuronais são técnicas do campo da inteligência artificial, que nas últimas duas décadas receberam um grande número de aplicações em diversas áreas do conhecimento. O objetivo deste trabalho é apresentar uma breve revisão da sua teoria e uma retrospectiva das suas aplicações na área das ciências farmacêuticas. As principais aplicações se referem à predição do comportamento fármaco-cinético e fármaco-dinâmico de drogas, e otimização de formulações de medicamentos. Uma aplicação à modelagem dos dados de um estudo de bioequivalência entre comprimidos de 150mg do medicamento LAFEPE ® Lamivudina e o medicamento de referência Epivir® é apresentada como ilustração do uso. Apesar do potencial das redes neuronais para modelagem de processos complexos, percebe-se uma fraca interação das redes neuronais com os processos produtivos de fabricação da indústria far macêutica ao contrário do que requer o PAT – Process Analytical Technology. PALAVRAS-CHAVE – Redes neuronais artificiais, Ciências Farmacêuticas. SUMMARY – Neural networks are artificial intelligence techniques that in the last two decades were employed a great number of applications in different areas of knowledge. The aim of this work is to present a concise review its theory and a retrospective of their applications in pharmaceutical sciences area. The main applications concern the prediction of pharmacokinetic and pharmacodynamic behavior of drugs and optimization of medicine formularizations. An application to modeling of the data study of bio-equivalence between 150mg LAFEPE ® tablet medicine Lamivudine and the reference medicine Epi vir® is presented to illustrate the use. Despite the potential of the neural networks for modeling of complex processes, a weak interaction of the neural nets with the productive processes of manufacture by the phar maceutical industry is perceived in contrast with the demands of the PAT – P rocess Analytical Technology. KEYWORDS – Neural networks, Pharmaceutical Sciences. INTRODUÇÃO C om o advento do PAT – Process Analytical Technology, o recente programa instituído pelo FDA (Food and Drug Administration) dos Estados Unidos, as indústrias farmacêuticas estão motivadas a reduzir problemas com a qualidade dos produtos, e, ao mesmo tempo, aumentar a eficiência dos processos de produção e garantia de qualidade (FDA, 2003). Para tanto, as indústrias estão dispostas a lançar mão de ferramentas destinadas ao projeto, análise e controle dos processos de fabricação hoje já disponíveis em outros segmentos industriais agregando conhecimento aos seus processos, e a substituir, ao longo do tempo, a atual forma de trabalho que é baseada em muito empirismo, práticas convencionais, e muito pouca ciência. Com este enfoque, a modelagem matemática dos processos surge como uma ferramenta valiosa para auxiliar as indústrias. Porém, devido à complexidade dos processos farmacêuticos, dificilmente seriam obtidos modelos do processo a partir das leis de conserva- ção de massa, energia e quantidade de movimento como são os modelos fenomenológicos. Assim, os modelos tipo caixa-preta como os baseados em redes neuronais artificiais se apresentam como uma alternativa viável, dado que estas são consideradas mapeadores universais entre dados de entrada e saída (Hornik et al, 1989). O surgimento de uma vasta gama de aplicações tem tornado as redes neuronais artificiais o foco de muita atenção. Redes neuronais são uma técnica do campo da inteligência artificial, que nas últimas duas décadas tem mostrado um grande número de aplicações em áreas como análise e processamento de sinais, controle de processos, robótica, classificação de dados, reconhecimento de padrões em linhas de montagem, análise de imagens, análise de voz, análise de aroma e odor, dentre outras (Baughman & Liu, 1995). O objetivo deste trabalho é apresentar uma revisão da teoria envolvendo redes neuronais e uma retrospectiva das aplicações com estas ferramentas na área das ciências farmacêuticas dada a importância que representa para com o advento das tecnologias analíticas de processo. Recebido em 21/3/2007 D. Sc. em Tecnologia de Processos Químicos e Bioquímicos pela EQ/UFRJ 2 Professor Associado I EQ/UFRJ, D.Sc. Engenharia Química pelo PEQ/COPPE/UFRJ Universidade Federal do Rio de Janeiro/UFRJ), Centro de Tecnologia, Escola de Química Ilha do Fundão, Bloco E, Sala 207 – 21949-900, Rio de Janeiro - RJ - Brasil - Fone (0xx21)2562-7636/Fax (0xx21)2562-7616 1 Rev. Bras. Farm., 88(3): 145-152, 2007 145 2. Redes neuronais artificiais Redes neuronais são modelos matemáticos desenvolvidos para descrever o comportamento de sistemas físicos, a partir de um conjunto de dados de entrada e saída correspondentes (Haykin, 1994). Matematicamente, as redes neuronais podem ser vistas como um tipo de modelo de regressão não linear de dados, onde os parâmetros da rede são ajustados mediante um critério de minimização de erros. Inspirado, originalmente, na forma como o sistema nervoso organiza seus neurônios, os modelos de neurônios artificiais, desenvolvidos podem ser arranjados ordenadamente para construir as chamadas redes neuronais artificiais. A rede é capaz de processar dados numéricos, produzindo sinais de saída a partir de dados de entrada, após uma etapa chamada de treinamento. (Campos & Saito, 2004). No treinamento (às vezes chamado de aprendizagem), os parâmetros da rede, pesos e “biases”, são modificados. A forma de treinamento mais utilizada é a que se baseia na experiência prévia, tal que padrões de dados de entrada e de saída são apresentados à rede de modo que ela modifica seus parâmetros a fim de obter as saídas desejadas. A rede cria um modelo interno do processo que rege os dados que a mesma recebe, de maneira que ela possa predizer as novas entradas (através de interpolações e extrapolações) e reconhecer padrões mesmo para dados com ruídos (Joseph et al., 1992). Várias arquiteturas podem ser obtidas, destacandose três tipos como sendo as mais comumente empregadas, que são: a rede de múltiplas camadas, também chamadas de MLP (ou Multilayer Perceptron) com neurônios internos com funções de ativação sigmoidal, a rede de funções de base radial - RBF com três camadas, uma de entrada com neurônios com funções de ativação lineares, uma camada escondida com unidades com função de ativação de bases radiais e uma camada de saída de unidades lineares e as redes lineares , que têm apenas duas camadas, sendo a de saída formada com neurônios lineares. 2.1. Modelo de um Neurônio Artificial soma essas entradas ponderadas e o valor resultante é por sua vez somado a um limite interno de ativação, “bias”, que pode ser representado por Θ. O neurônio, em seguida, produz uma resposta (y) para este sinal de acordo com uma função de ativação (De Souza Jr., 1993). O comportamento de um neurônio pode ser expresso matematicamente, por: (1) (2) tal que f é usualmente escolhida entre a função sigmoidal ou tangente hiperbólica para a camada escondida e sigmoidal ou linear para a camada de saída nas redes de múltiplas camadas. A Tabela I resume as principais funções de ativação empregadas com as redes neuronais. A Figura 2 mostra uma representação de uma rede neuronal do tipo MLP, com três neurônios na camada de entrada, três na camada esconTABELA I Funções de ativação usualmente empregadas Nome Fórmula - f(x) Características Degrau +1 se x > 0 0 caso contrário não diferenciável degrau unitário positiva Sigmóidal Tangente Hiperbólica 1 1+exp-x tanh(x) Gaussiana O neurônio artificial é uma entidade capaz de receber e enviar sinais, sendo seu comportamento simulado como explicado na seqüência. Um neurônio qualquer de uma camada, Figura 1, recebe um conjunto de informações dos neurônios da camada anteriores, x( i), ponderadas, cada uma, pelo peso w(i) correspondente à sua conexão. O neurônio FIG. 1 - O neurônio: elemento processador da rede neural. 146 Figura diferenciável degrau suave positiva diferenciável degrau suave diferenciável pulso suave Fig. 2 – Rede neuronal MLP com 3 camadas Rev. Bras. Farm., 88(3), 2007 dida e três na camada de saída. A cada conexão entre neurônios está associado um peso e a cada neurônio, um “ bias” ; esses parâmetros serão otimizados e fixados na etapa de treinamento. Na mesma Figura, o a i representa as saídas dos neurônios da camada de entrada e v ij os pesos relativos às conexões entre a camada de entrada e a camada escondida. Já os parâmetros bi, representam as saídas dos neurônios da camada escondida e os wij os pesos relativos às conexões entre a camada escondida e a camada de saída. Uma rede como a da Figura 2 terá, portanto, 24 parâmetros, sendo 18 pesos e 6 “ biases”, uma vez que os “biases” da camada de entrada são usualmente considerados nulos. As informações das variáveis de entrada, x i, são normalmente escalonadas, para que pesos muito grandes e dificuldade de convergência sejam evitados. O desenvolvimento de redes neuronais requer a realização de duas fases consecutivas: l Fase de treinamento l Fase de generalização Para treinamento, a base de dados é dividida em um conjunto de dados para treinamento, formado por grande parte dos dados e um conjunto de dados para validação (ou seleção) das redes, formado para verificação da capacidade de generalização das redes treinadas. O objetivo da fase de treinamento, também chamada fase de aprendizagem, é ajustar os pesos e “ biases” da rede pela apresentação de exemplos de padrões de entrada e saída, modificando-os, até que a aplicação de um conjunto de entradas produza saídas da rede que cor respondam às saídas desejadas. Tratase de um problema de otimização. Treinar uma rede corresponde a minimizar uma função objetivo não-linear que dá o erro entre as saídas , preditas pela rede, e as saídas desejadas (y k ). (3) onde η é um parâmetro de ajuste conhecido como taxa η<1 e E é dado por de aprendizagem, e tal que 0<η pela equação 3. Segundo De Souza Jr., (1993), as redes treinadas por este método são multicamadas, não apresentam conexões laterais, (entre neurônios da mesma camada), e os seus sinais são feedforward, ou seja, dado um vetor de entrada, o vetor de saída é calculado em um passo do tipo para frente (“forward”) que calcula os níveis de atividade de cada camada por vez, usando os níveis de atividade já computados nas camadas anteriores. As fórmulas para cálculo do gradiente da função objetivo em relação aos pesos e “biases” foram detalhadamente deduzidas em De Souza Jr., (1993). O processo se repete até que o erro seja suficientemente pequeno. Logo, enquanto houver diferença entre as saídas da rede e os valores desejados para um dado padrão, essa diferença vai dar um sinal de erro que é propagado de volta pela rede e usado para gerar mudança nos pesos. A parada do procedimento se dá, quando o valor do erro entre as medidas reais e inferidas começam a aumentar quando medidas para um conjunto de dados não utilizados durante o treinamento, isto é conjunto de seleção. A precisão das redes normalmente é medida por comparação entre os dados reais e as inferências produzidas pelas redes através de coeficientes de correlação linear e erros de predição. η) A técnica do gradiente descendente com passo (η fixo adotada no método “backpropagation” é, entretanto, ineficiente. Dificuldade de convergência em função da escolha do tamanho do passo foi observada. Passos pequenos conduzem a convergência extremamente lenta e passos grandes a oscilações nas variáveis independentes de otimização. Com o intuito de evitar essas oscilações nos pesos, pode-se somar ao lado direito da equação 6 um termo de momento (Rumelhart & Mcclelland, 1986): (6) (4) tal que NP é o número de padrões e no o número de neurônios da última camada. O treinamento constitui-se de duas fases: a fase em que cada padrão de dados é apresentado e propagado para frente através da rede, iniciando-se com pesos aleatórios compreendidos entre –1 e 1, até computar os sinais de saída, que são comparados com as saídas desejadas, obtendo-se um erro; e a fase em que este erro é propagado para trás e os pesos vão sendo atualizados. (De Souza Jr., 1993). No método chamado “backpropagation” ou “retropropagação”, o processo de mudança dos pesos é feito de modo proporcional ao gradiente descendente do quadrado dos erros entre a predição da rede e o valor desejado, seguindo-se a expressão geral, para a k-ésima iteração: (5) Rev. Bras. Farm., 88(3), 2007 Por sua vez, o método do gradiente conjugado é um método mais avançado de otimização em que os parâmetros da equação 6 podem ser recalculados a cada iteração (De Souza Jr., 1993). 2.2. Redes de função de base radial Outro tipo de rede que tem se tornando uma alternativa de modelo não linear para problemas de regressão e classificação são as redes de função de base radial. As funções de base radial também são capazes de aproximar qualquer função não linear, porém seus algoritmos de treinamento diferem das redes MLP. Possuem em geral, reconhecida capacidade de treinamento mais rápido que as redes MLP dada, principalmente a sua saída linear na última camada e por produzirem melhor desempenho quando a base de dados se constitui um espaço de aglomerados de informações. As redes RBF consistem de três camadas, sendo uma de entrada, uma escondida e outra de saída. A primeira camada apenas propaga as entradas, isto é, não há aplicação de parâmetros de ponderação, ou ainda, as saídas são iguais às entradas. Na camada escondida ocorre a mais importante etapa do processamento. Nesta, as uni147 dades devem satisfazer uma propriedade de serem radialmente simétricas às quais devem possuir: - Um vetor centro ( ck ) gerado a partir dos dados de entrada considerando o centro de aglomerados de dados; - Uma medida de distância (raio) ( Ik ) que representa o quão distante está um vetor de entrada (xi) do vetor centro, a exemplo da equação 7, onde N é o número de padrões: (7) - Uma função de transferência de bases radiais que transforma a distância I k na saída de cada unidade de processamento da camada, sendo a mais comum a Gaussiana, equação 8, onde σk é uma constante denominada fator de escala ou desvio-padrão do espaço delimitado pela unidade k: (8) Em resumo, a camada escondida processa a informação em duas etapas: o cálculo da distância Ik e a aplicação da função de transferência. As saídas das unidades da camada escondida são totalmente conectadas àquela(s) da camada de saída final através de uma ponderação das suas saídas. A última camada possui unidades lineares, isto é, sua saída é resultado da soma ponderada das suas entradas, sendo os pesos ajustados a exemplo do método backpropagation. (Baughman & Liu, 1995). O procedimento típico de treinamento de uma rede de base radial envolve três estágios: - o primeiro estágio é o treinamento da camada escondida, quando se definem os parâmetros desta camada (localização dos centros e dos desvios); - o segundo estágio define os valores dos pesos entre as camadas escondida e de saída, num procedimento de otimização linear a exemplo do backpropagation descrito anteriormente. Nessa segunda fase, os parâmetros definidos na primeira fase não se modificam. Essas etapas são descritas resumidamente a seguir: Localização de centros: vários algoritmos podem ser utilizados para esta etapa. No algoritmo K-means descrito por Baughman & Liu (1995) os vetores centros (ck) são otimizados partindo-se de um conjunto inicial de centros determinados arbitrariamente do conjunto dos dados de entrada. Os elementos do vetor (cik) são armazenados como pesos entre a camada de entrada e a camada escondida. À medida que o conjunto de dados de treinamento é apresentado à rede os novos centros são localizados interativamente de modo a minimizar a soma dos quadrados das distâncias entre os dados de treinamento e seus centros mais próximos ck . A cada novo padrão os centros são recalculados baseados, por exemplo, na seguinte equação 9 (Baughman & Liu, 1995): 148 (9) tal que a é a taxa de aprendizagem que diminui à medida que o processo iterativo progride. Este procedimento se repete por um número fixo de interações ou até que não seja mais necessária a modificação dos mesmos. Estabelecimento dos desvios: também para determinação do desvios da função, vários algoritmos estão disponíveis. No P-near est neighbors consideramse, além de um conjunto de centros ck,, um conjunto de P centros ( ck1 , ck2,...,ckp) mais próximos deste. Assim, os comprimentos do vetor s são escolhidos levando-se em conta a distância média dos vizinhos mais próximos de cada neurônio. O desvio ou espalhamento da função é calculado pela equação 10 (Baughman & Liu, 1995): (10) Otimização: Uma vez estabelecidos os centros de cada neurônio e os fatores de escala, estes são mantidos fixos e a saída da camada escondida, vk, pode ser determinada. As conexões de pesos entre a camada escondida e a camada de saída são obtidas através de procedimentos de regressão linear a exemplo dos Mínimos Quadrados. - o terceiro estágio de treinamento é a utilização da rede propriamente dita, isto é, com os parâmetros definidos nos estágios anteriores, calculam-se as predições das redes para os conjuntos de dados de treinamento e testes, e compara-se com os valores reais de cada saída associada à cada padrão. 2.3. Redes lineares Em geral um modelo mais simples é sempre preferível em detrimento de um modelo complexo quando este não produz um bom ajuste dos dados. Desta forma, o modelo mais simples é o linear o qual está sempre sendo referenciado. A rede linear não possui camada escondida, isto é, os dados são propagados da camada de entrada diretamente para a camada de saída sendo a saída propriamente dita um somatório ponderado das entradas nesta camada. conforme Equação 11. (11) 3. Redes Neuronais Artificiais nas Ciências Farmacêuticas A habilidade em aproximar funções altamente nãolineares e complexas, através da apresentação de um conjunto de dados experimentais, fez das redes neuronais, ferramentas úteis na modelagem de sistemas complexos. Nas Ciências Farmacêuticas, as redes neuronais também já têm sido aplicadas a uma ampla gama de processos e sistemas. Uma visão geral das principais aplicações das redes neuronais nesta área é feita por Achanta et al. (1995) e Agatonovic-Kustrin & Beresford (2000). Rev. Bras. Farm., 88(3), 2007 A obtenção de formulações nas quais o princípio ativo de um medicamento atinja os seus alvos, através da corrente sangüínea, na concentração e na velocidade preconizados pela terapêutica, é o principal objetivo de quem desenvolve produtos farmacêuticos. Para tanto, ensaios de dissolução ( in vitro) e de biodisponibilidade ( in vivo) são fundamentais para comprovação desses parâmetros. É nessa linha, de desenvolvimento e otimização de formulações de produtos farmacêuticos, que as redes neuronais têm sido bastante aplicadas. Hussain et al. (1991); Kesavan & Peck (1996); Bourquin, et al. (1997); Bourquin, et al. (1998a); Bourquin, et al. (1998b); Bourquin, et al. (1998c); Edube et al. (1997); Takahara, et al. (1997); Zhang & Southard (1998); Chen et al. (1999); Takayama et al. (1999a); Takayama et al. (1999b) e Wu et al. (2000), aplicaram com sucesso, as redes neuronais para otimização de formulações de diversos produtos, avaliando a influência de parâmetros das formulações no perfil de dissolução ou nos parâmetros de qualidade fixados para cada um dos produtos. Esses autores, quase sempre, utilizavam como parâmetros de entrada das redes, concentrações dos ingredientes inativos; e, como saída ( outputs ), parâmetros associados ao perfil de dissolução, isto é, concentrações do fármaco em diversos tempos após a dissolução, além de propriedades físicas dos medicamentos associadas às especificações farmacopéicas dos mesmos. Veng-Pedersen & Modi (1993) e Gobbur u & Chen (1996) avaliaram a utilidade das redes neuronais para reconhecer o comportamento farmacodinâmico de drogas. Nesses trabalhos foi avaliada a capacidade das redes neuronais de reproduzir o comportamento de drogas quando simuladas por modelos clássicos de comportamento farmacocinético e farmacodinâmico de drogas. Hussain et al. (1993) utilizaram sem muito sucesso os recursos da modelagem neural para predizer a partir de dados obtidos com animais o comportamento farmacocinético de drogas como Zalcitabina e Zidovudina utilizadas no tratamento da AIDS. Brier et al. (1995) utilizaram, de forma bem sucedida, redes neuronais para predizer o pico de concentração plasmática de gentamicina em função da idade, altura, peso, dose, intervalo entre doses, relação peso/dose, creatinina, clearance de creatinina, superfície corporal e duas outras variáveis representando o intervalo entre doses que foi variável (8 ou 12 horas). A arquitetura da rede estudada possuía 11 neurônios de entrada, uma camada escondida com 5 neurônios e um neurônio na camada de saída prevendo o pico de concentração. Os autores compararam os resultados obtidos com a modelagem neural com um algoritmo NONMEN - Nonlinear mixed effect modeling e ambos mostraram resultados equivalentes. Opara et al. (1999) utilizaram redes neuronais para predição de parâmetros farmacocinéticos e análise de diversos fatores que influenciam nos estudos de bioequivalência. Outra linha de trabalhos utilizando redes neuronais é a obtenção de correlações entre o comportamento de drogas in vitro e o correspondente comportamento in vivo (CIVIV), podendo-se citar os trabalhos de Hussain (1997) e Dowell et al. (1999). Nestes, redes são utilizadas para modelar o comportamento Rev. Bras. Farm., 88(3), 2007 entre dados de dissolução de formulações obtidos em laboratório com o comportamento farmacocinético das mesmas drogas obtidos em estudos in vivo. A modelagem via redes neuronais do processo de granulação por leitos fluidizados foi estudada por Murtoniemi et al. (1994). Parâmetros de pressão e temperatura do ar e concentração da solução de granulação foram utilizados como entradas da rede. Tamanho médio dos grânulos e friabilidade destes foram os parâmetros controlados ou saídos da rede. A rede neuronal mostrou-se capaz de prever adequadamente o comportamento do granulador. Poucos trabalhos envolvem o controle do processamento dos medicamentos. Em Turkoglu et al (1995) a otimização de parâmetros do processamento de um comprimido de hidroclorotiazida obtido por compressão direta via redes neuronais foi obtido. Foram utilizadas, como dados de entrada, variações do tipo de lubrificante utilizado na formulação, além da força de compressão e do tempo de mistura e, como saída, o teor dos comprimidos e a velocidade de dissolução do fármaco nos tempos 30 e 60min. A predição do teor e da dureza de comprimidos de teofilina de várias formulações com concentrações variadas do fármaco, a partir de dados de espectroscopia próxima do infravermelho (NIR) foi o objetivo do trabalho de Chen et al (2001). Em vários segmentos industriais, especialmente o da indústria química e petroquímica, encontram-se aplicações das redes neuronais na modelagem e controle de processos industriais. Aplicações mais recentes têm sido desenvolvidas para a construção de modelos de processo visando sua utilização como sensores virtuais de variáveis de qualidade, cuja instrumentação ou não está disponível ou o tempo de análise é tão grande que inviabiliza ações de controle a partir dos seus resultados. Araúzo-Bravo et al. (2004) Sensores ou analisadores virtuais são modelos preditivos treinados a partir de um conjunto de dados representativos que possibilitem prever o comportamento e interpolar dados esparsos. Normalmente, os modelos puramente empíricos, como os baseados em redes neuronais, são bem utilizados, porém, modelos de regressão linear; filtros de K alman, sistemas fuzzy, além dos modelos fenomenólgicos são também aplicados para o desenvolvimento de sensores virtuais (Campos & Saito, 2004). Aplicações de sensores virtuais, baseados em redes neuronais na fabricação de medicamentos, são raras e se constituem potenciais usos das tecnologias analíticas de processo para inferências de suas variáveis críticas dos medicamentos, uma vez que estes sempre são avaliados por testes laboratoriais. Alencar et al (2006), desenvolveram um estudo inicial sobre um sensor virtual baseado em redes neuronais para inferência contínua dos parâmetros teor, dissolução e unifor midade de conteúdo de comprimidos de captopril 25mg, a partir de dados disponíveis no controle em processo. 3.1. Aplicação de redes neuronais à modelagem do estudo de bioequivalência Estudos de bioequivalência são etapas fundamentais na obtenção do registro de um medicamento genérico. Tais estudos, além de serem caros, consomem tempo e são influenciados por variáveis diversas, extremamente difíceis de serem modeladas tendo em vista tratar-se de sistemas biológicos. 149 A modelagem matemática dos dados de biodisponibilidade pode ser útil na predição do comportamento das drogas no organismo humano, assim como na seleção das variáveis que afetam o desempenho das mesmas. A modelagem dos dados de um estudo de bioequivalência entre o medicamento teste Lamivudina, comprimidos de 150mg, de fabricanção do LAFEPE®, lote 00080226, e Epivir®, medicamento de referência fabricado pela Glaxo Welcome, lote B018603, foi obtida. Este medicamento faz parte do coquetel destinado a portadores do vírus HIV. Nestes, um grupo de 24 voluntários é recrutado e submetido à administração do medicamento teste. Após um tempo mínimo de um semana, procedeu-se à administração do medicamento de referência, ao qual o medicamento teste se quer assemelhar. Após a administração do medicamento são coletadas amostras plasmáticas do sangue dos voluntários e feito o doseamento da droga (lamivudina) ao longo do tempo, até sua total excreção. De posse dos dados das análises, a concentração do fármaco em estudo é plotada ao longo do tempo e os parâmetros farmacocinéticos são obtidos a partir desta curva. Os principais parâmetros são a área sob a cur va (AUC) e que dá uma idéia da extensão da absorção do fármaco, a concentração máxima (C MAX) e o tempo para atendimento da concentração máxima (TMAX). Para desenvolvimento das redes neurais nessa aplicação, empregou-se o pacote computacional Statistica Neural Networks , versão 6.0, utilizando o método backpropagation e gradiente conjugado além da função sigmoidal como função de ativação dos neurônios da camada escondida. Foram treinadas e comparadas, tendo por base critérios estatísticos, diversas redes. Os dados de entrada para apresentação das redes consistiram de 16 variáveis a saber: - idade do voluntário, - sexo (utilizando um(1) para homem e zero(0) para mulher), - relação peso/altura e - concentrações plasmáticas da droga lamivudina nos tempo 0; 0,5h; 1,0h; 1,5h; 2h; 3h; 4h; 6h; 8h; 10h; 12h; 24h; 30h. Isso posto, a rede terá 16 neurônios na camada de entrada. O número de neurônios na camada escondida foi variável entre o mínimo de 1 e máximo de 14. A camada de saída foi projetada para ter um único neurônio para cada rede, estimando separadamente os parâmetros far macocinéticos: área sob curva (AUC) ou a concentração máxima da droga ou o tempo máximo para a concentração máxima. Dos 24 dados de comportamento da droga para cada voluntário, foram selecionados 18 para treinamento das redes e os 6 restantes foram utilizados para teste escolhidos aleatoriamente. Os dois conjuntos de dados das duas formulações do medicamento foram tratados separadamente com a seleção de uma rede para modelar cada conjunto. Nas Tabelas II, III e IV são apresentadas o desempenho de cada tipo de rede para os dois conjuntos de formulações, respectivamente, para os parâmetros CMAX, T MAX e AUC. Tal desempenho foi medido através do 150 TABELA II Desempenho das Redes de predição da CMAX Tipo da Rede Medicamento R Número de Neurônios Linear LAFEPE 0,170 16-0-1 MLP LAFEPE 0,978 16-7-1 RBF LAFEPE 0,843 16-6-1 Linear Epivir 0,002 16-0-1 MLP Epivir 0, 992 16-14-1 RBF Epivir 0,885 16-9-1 TABELA III Desempenho das Redes de predição da TMAX Tipo da Rede Medicamento R Número de Neurônios Linear LAFEPE 0,224 16-0-1 MLP LAFEPE 0,990 16-7-1 RBF LAFEPE 0,615 16-2-1 Linear Epivir 0,002 16-0-1 MLP Epivir 0, 992 16-14-1 RBF Epivir 0,885 16-5-1 TABELA IV Desempenho das Redes de predição da AUC Tipo da Rede Medicamento R Número de Neurônios Linear LAFEPE 0,999 16-0-1 MLP LAFEPE 1,000 16-7-1 RBF LAFEPE 0,943 16-3-1 Linear Epivir 0,999 16-0-1 MLP Epivir 1,000 16-6-1 RBF Epivir 0,962 16-9-1 coeficiente de correlação linear (R) definido de acordo com a equação 12. (12) onde n é o número de padrões utilizados para treinamento ou teste, é o valor predito pelo modelo, é o valor real observado e é a média global da variável. Para um modelo perfeito R ser igual à unidade, isso só ocorrerá se não houver resíduos alguns entre os valores individuais e as respectivas predições do modelo, isto é, toda a variação em torno da média for explicada pela regressão. Observa-se nas referidas tabelas que, para todos os parâmetros, as redes do tipo MLP foram as que apresentaram melhor desempenho. Para o parâmetro AUC do medicamento Epivir®, a rede linear apresentou desempenho similar. Com relação ao tamanho das redes, as mesmas tabelas indicam os tamanhos de cada rede através do número de neurônios Rev. Bras. Farm., 88(3), 2007 de cada camada escondida, uma vez que a camada de entrada e a saída são idênticas para todas as redes. As Figuras 3, 4 e 5 apresentam o comportamento da predição das melhores redes (MLP) em relação aos dados reais para cada voluntário que participou do estudo, respectivamente e para cada um dos parâmetros C MAX , TMAX e AUC. Para o parâmetro CMAX – Figura 3 – o erro médio absoluto das predições foi de 73,94ng/mL o que representa 3,7% em relação ao valor médio das medidas reais. Quanto ao parâmetro TMAX – Figura 4 – o erro médio absoluto das predições foi de 0,0355 h (~2,13 minutos) o que representa 3,6% em relação ao valor médio das medidas reais. Já no caso do parâmetro AUC – Figura 5 – o erro médio absoluto das predições foi de 12,22ng.h/mL o que representa 0,19% em relação ao valor médio das medidas reais. Percebe-se nessas figuras, que, de maneira geral, os modelos conseguiram reproduzir com boa precisão os parâmetros farmacocinéticos do estudo. Nas Figuras 6, 7 e 8 são mostrados os mesmos resultados para o medicamento de referência. Também para este caso, todas as redes de melhor desempenho foram do tipo MLP. Para o parâmetro CMAX – Figura 6 – o erro médio absoluto das predições foi de 73,94ng/mL o que representa 2,0% em relação ao valor médio das medidas reais. Quanto ao parâmetro TMAX do medicamento Epivir – Figura 7 – o erro médio absoluto das predições foi de 0,144h (~8,6 minutos) o que representa 15,4% em relação ao valor médio das medidas reais. Já no caso do parâmetro AUC – Figura 8 – o erro médio absoluto das predições foi de 6,15ng.h/mL o que representa 0,09% em relação ao valor médio das medidas reais. Percebe-se também nestas figuras, que os modelos conseguiram reproduzir com boa precisão os parâmetros farmacocinéticos do estudo. FIG. 3 – CMAX – Formulação teste (LAFEPE) – Valores reais e preditos pelo modelo FIG. 6 –Cmax – Epivir® - valores reais e preditos pelo modelo FIG. 4 – TMAX – Formulação teste (LAFEPE) - Valores reais e preditos pelo modelo FIG. 7 –Tmax – Epivir® - valores reais e preditos pelo modelo FIG. 5 – AUC – Formulação teste (LAFEPE) - Valores reais e preditos pelo modelo FIG. 8 –AUC – Epivir® -valores reais e preditos pelo modelo Rev. Bras. Farm., 88(3), 2007 151 5. CONCLUSÕES Como qualquer técnica de modelagem, as redes neuronais possuem limitações tais como longos tempos de treinamentos, requer uma elevada quantidade de dados para treinamento, não garante resultados otimizados e não permite estabelecer relações com os modelos fenomenológicos. Por outro lado, possui destacada capacidade de modelar processos complexos de natureza como são os sistemas vivos ou os que interagem com eles, além da habilidade para classificação, reconhecimento de padrões. Através de uma breve revisão da teoria das redes neuronais e de uma revisão bibliográfica, este trabalho teve como objetivo apresentar as aplicações da técnica e identificar outros potenciais usos dentro deste segmento da ciência. Dada a complexidade dos sistemas nos quais estão inseridas as ciências farmacêuticas, as aplicações levantadas na literatura se referem basicamente à predição do comportamento farmacocinético e farmacodinâmico de drogas, otimização de formulações de medicamentos. Porém, conforme relatado por Achanta et al. (1995), as redes são bastante promissoras em outras áreas como nas determinações de correlações estrutura-atiividade de novas entidades químicas, interpretação de dados analíticos, controle de qualidade, estudos epidemiológicos, auxílio no diagnóstico de doenças, dentre outras. Por outro lado, muito pouco ainda se observa quanto a aplicações das redes neuronais no monitoramento e modelagem de processos de fabricação da indústria farmacêutica como está sendo requerido pelo PAT – Process Analytical Technology. Percebe-se que esta é uma grande promessa uma vez que tais metodologias já foram bastante testadas com sucesso em outros segmentos industriais como o da indústria química e petroquímica. 6. REFERÊNCIAS 1. Achanta, A . S., Kowalski, J. G., Rhodes, C. T., Artificial Neural Networks: Implications for Pharmaceutical Sciences, Drug Development and Industrial Pharmacy , 21 (1), pp. 119-155, 1995. 2. Agatonovic-Kustrin, S. & Beresford, R., Basic concept of artificial neural network (ANN) modeling and its application in pharmaceutical research, Journal of Pharmaceutical and Biomedical Analysis, 22, pp. 717-727, 2000. 3. Alencar, J. R. B., Rolim Neto, P. J., De Souza Jr., M. B., Bioequivalence Evaluation of Formulations Containing Lamivudine Using Neural Networks, Anais VII PHARMATECH – International Conference on Pharmaceutical Technology and Quality Control , João Pessoa, Brasil, 2003. 4. Alencar, J. R. B., De Souza Jr., M. B., Lopes, C. E., Sensor Virtual para Controle de Processos de Fabricação de Formas Farmacêuticas Sólidas, Anais XVI COBEQ – Congresso Brasileiro de Engenharia Química, Santos-SP, Brasil, 2006. 5. Araúzo-Bravo, M. J., Cano-Izquierdo, J. M., Gómez-Sánchez, E., López-Neto, M. J., Dimitriadis, Y. A., López-Coronado, J., Automatization of a Penicilin Production Process with Soft Sensors and an Adaptive Controller Based on Neuro Fuzzy Systems, Control Engineering Practices, Article in Press, 2004. 6. Baughman, D. R. & Liu, Y. A. - Neural Networks in Bioprocess and Chemical Engineering, Academic Press, USA, 1995, 488p. 7. Bourquin, J ., Schmidli, H., Van Hoogevest, P., Leuenberger, H., Application of Artificial Neural Networks (ANN) in the Development of Solid Dosage Forms, Pharmaceutical Development and Technology, 2 (2), pp. 111-121, 1997. 8. Bourquin, J., Schmidli, H., Van Hoogevest, P., Leuenberger, H., Comparison of Artificial Neural Networks (ANN) with Classical Modelling Techniques Using Diffent Experimental Designs and Data From a Galenical Study on a Solid Dosage Form, European Journal of Pharmaceutical Sciences, 6, pp. 287-300, 1998a. 152 9. Bourquin, J., Schmidli, H., Van Hoogevest, P., Leuenberger, H., Advantages of Artificial Neural Networks (ANN) as Alternative Modeling Technique for Data Sets Showing Non-Linear Relationships Using Data From a Galenical Study on a Solid Dosage Form, European Journal of Pharmaceutical Sciences, 7, pp. 516, 1998b. 10. Bourquin, J., Schmidli, H., Van Hoogevest, P., Leuenberger, H., Pitfalls of Artificial Neural Networks (ANN) Modeling Techniques for Data Sets Containing Outlier Measurements Using a Study on Mixture Properties of a Direct Compressed Dosage Form, European Journal of Pharmaceutical Sciences, 7, pp. 1728, 1998c. 11. Brier, M. E., Zurada, J. M., Aronoff, G. R., Neural Network Predicted Peak and Trough Gentamicin Concetrations, Pharmaceutical Research, 12 (3), pp. 406412, 1995. 12. Campos, M. M. & Saito, K., Sistemas Inteligentes em Controle e Automação de Processos, Rio de Janeiro, Ed. Ciência Moderna, 2004. 13. Chen, Y., Thosar, S. S., Forbess, R. A., Kemper, M. S., Rubinovitz, R. L., Shukla, A . J., Prediction of Drug Content and Hardness of Intact Tablets Using Artificial Neural Network and Near-Infrared Spectroscopy, Drug. Development and Industrial Pharmacy, 27(7), p.623-631, 2001. 14. De Souza Jr., M. B., Redes Neuronais Multicamadas Aplicadas a Modelagem e Controle de Processos Químicos, Tese de Doutorado, COPPE/PEQ/UFRJ, Rio de Janeiro, 1993. 15. Dowell, J. A., Hussain, A ., Devane, J., Young, D., Artificial Neural Networks Applied to the In Vitro-In Vivo Correlation of Extended-Release Formulation: Initial Trials and Experience, Journal of Phamaceutical Sciences, 88 (1), pp.154-160, 1999. 16. Edube, N. K., Mccall, T., Chen, Y., Meyer, M. C., Relating Formulation Variables to In Vitro Dissolution Using an Artificial Neural Network, Pharmaceutical Development and Technology, 2(3), pp. 225-232, 1997. 17. FDA, Guidance for Industry PAT - A Framework for Innovative Pharmaceutical Manufacturing and Quality Assurance, August 2003, USA, 2003 18. Gobburu, J. V. S. , Chen, E. P., Artificial Neural Networks As a Novel Approach to Integrated Pharmacokinetic-Pharmacodynamics Analysis, Journal of Phamaceutical Sciences, 85 (5), pp.505-510, 1996. 19. Haykin, S., Neural Networks: A Comprehensive Foundation, MacMillan Publishing Company, 1994. 20. Hornik, K., Stinchcombe, M., White, H., Multilayer Feed Forward Networks are Universal Approximations, Neural Networks, 2 (5), pp. 359-366, 1989 21. Hussain, A. S., Yu, X. & Johnson, R. D., Application of Neural Computing in Pharmaceutical Product Development, Pharmaceutical Research, 8 (10), pp. 12481252, 1991. 22. Hussain, A. S., Johnson, R. D., Vachharajani, N. N., Ritschel, W., A., Feasibility of Developing a Neural Network for Prediction of Human Pharmacokinetic Parameters from Animal Data, Pharmaceutical Research, 10 (3), pp. 466-469, 1993. 23. Joseph, B., Wang, F. H., Shieh D. S. S., Exploratory Data Analysis: A Comparison of Statistical Methods With Artificial Neural Networks, Computers and Chemical Engineering, (16)4. pp. 413-423, 1992. 24. Murtoniemi, E., Yliruusi, J., Kinnunen P., Merkku, P., Leiviska, K., The Advantages by the Use of Neural Networks in Modeling the Fluidized Bed Granulation Process, International Journal of Pharmaceutics, 108, pp. 155-164, 1994. 25. Takahara, J., Takayama, K., Nagai, T., Multi-objective Simultaneous Optimization Technique Based on an Artificial Neural Network in Sustained Release Formulations, Journal of Controlled Release, 49, pp.11-20, 1997. 26. Takayama, K., Takahara, J., Fujiwara, M., Ichikawa, H., Nagai, T., Formula Optimization Based on Artificial Neural Networks in Transdermal Drug Delivery, Journal of Controlled Release, 62, pp.161-170, 1999a. 27. Takayama, K., Fujiwara, M., Nagai, T., Artificial Neural Network AS A Novel Tehod to Optimize Pharmaceutical Formulations, Pharmaceutical Research, 16 (1), 1999b. 28. Turkoglu, M., Ozarslan, R., Sakr, A., Artificial Neural Network Analysis of a Direct Compression Tablet Ting Study, Eur. J. Pharm., Biopharm, 41(5), p.315-322, 1995. 29. Veng-Pedersen, P. & Modi, N., Application of Neural Networks to Pharmacodynamics, Journal of Pharmaceutical Sciences, 82 (9), pp. 918-926, 1993. 30. Wu, T., Pan, W., Chen, J., Zhang, R., Formulation Optimization Technique Based on Artificial Neural Network in Salbutamol Sulfate Osmotic Pump Tablets, Drug Development and Industrial Pharmacy, 26(2), pp. 211-215, 2000. 31. Zhang, Y. & Southard, M. Z., Dissolution Study of Ionizable Drug and Buffer Cocompressed Tablet by Neural Networks, Proceedings Annual Meeting of the American Institute of Chemical Engineers, 1998. Endereços eletrônicos João Rui Barbosa de Alencar E-mail: [email protected], Maurício Bezerra de Souza Jr. E-mail: [email protected] Rev. Bras. Farm., 88(3), 2007