Controle Neural Gain Scheduling de Tanques Interativos Júlio Cézar Peixoto de Oliveira! l Peterson Resende 2 Carlos Andrey Maia 'Universidade Federal de Minas Gerais, CPDEE Cx. P. 209 , 30161-970 Belo Horizonte, MG {julio,peterson}@novell .cpdee.ufmg .br "Universidade Federal de Minas Gerais, DEE Cx . P. 209, 30161-970 Belo Horizonte, MG maia@cce .ufmg .br abstract. This paper presents an application of a neural network scheme for levei control of an interacting tank plant. The neural network control utilizes a gain scheduling technique, that is achieved by training from data obtained from several linear controllers designed for different operating points. Experimental results of the neural gain schedu ling control implemention are presented. Resumo. Este artigo apresenta aplicação de um esquema neural para controle de nível de tanques interativos. O controle neural utiliza a técnica de gain scheduling, que é obtido através de treinamento com diversos controladores lineares projetados para diversos pontos de operação da planta. São apresentados resultados experimentais da implentação do controle neural gain scheduling. Neste trabalho serão utilizadas redes neurais para a implementação de controladores gain scheduling (Ahmed & Tasadduq , 1994; Maia & Resende, 1996). Esta técnica consiste basicamente no treinamento para constituir um contro lador neural global de modo a substituir diversos controladores lineares que são projetados para diferentes pontos de operação, atingindo uma efetiva interpolação entre os pontos de operação. Introdução Redes neurais são importantes ferramentas para aplicação em controle de plantas não-lineares dadas suas características de mapeadores universais e da capacidade de aprender por treinamento (Fukuda & Shibata. (1992)) . Aplicações envolvendo controle adaptativo através da linearização do sinal de controle para sistemas SISO (Chen & Khalil, 1995) e controle por Modelo Interno (Hunt & Sbarbaro, 1991) são algumas das muitas abordagens de utilização de redes neurais em controle de processos (Narendra & Parthasarath, 1990). Sistemas dinâmicos não-lineares tem apresentado um grande interesse para a engenharia de controle, dada a sua importância na representação matemática de inúmeros sistemas físicos. Devido à complexidade de tais sistemas é difícil desenvolver técnicas abrangentes para o projeto de controladores. As técnicas mais comuns se baseiam no cancelamento das não-linearidades (Slotine & Weiping, 1990) que apresenta como principal limitação o fato de necessitar de um modelo perfeito da planta e a mesma possuir dinâmica inversa estável. Outros métodos importantes, em controle de processos são controle interno (Garcia & Morari, 1982) e a técnica gain scheduled (Shamma & Athans, 1990). 2 Tanques Interativos O trabalho experimental desenvolvido nesta trabalho foi realizado na planta de Tanques Interativos do Laboratório de Controle de Processos Industriais, CPDEE, UFMG. A planta é esquematizada na figura I. Esta planta é dita interativa devido ao acoplamento existente entre os tanques TQ-A e TQ-B (através da válvula manual FV) . A água do tanque TQ-A flui para o tanque TQ-B pelo princípio dos vasos comunicantes. A água do tanque TQ-B é bombeada pela bomba BB de modo a tornar a vazão de saída desacoplado da altura do nível deste tanque (Braga, 1994). As válvulas FCV - I e a FCV-2 são pneumáticas e automáticas. O controle da FCV -I é feita com ar para abrir e o atuador do é do tipo 224 3 pistão. O controle da FCV-2 é feita com ar para fechar com atuador do tipo diafragma. são as vazões m /s correspondentes a Wi , WAB e Wo'; A é a área da seção transversal dos tanques. Observe-se que em (2) não existe acoplamento entre a vazão de saída, qo , e a altura do nível do tanque TQ-B, hB" devido a presença da bombaBB. Pela lei de Bernoulli, tem-se a equação que descreve a queda de pressão em função da vazão sobre uma válvula (Braga, 1994): rcv-a q AS (t) = C; PA (t) - r, (t) (3) FCV-2 onde C; é o coeficiente de vazão da válvula FV, PA e PIJ são as pressões no fundo do tanque TQ-A e TQ-B, respectivamente, que são dadas por Figura I. Diagrama da planta de tanques interativos A medição de nível do tanque TQ-B (LE) é feita por um sensor de pressão tipo ponte de slrain gages com um tubo introduzido dentro do tanque cuja pressão é proporcional à altura da coluna de água . Através de manipulação da vazão de entrada no tanque TQ-A pela abertura da válvula FCV -I, problema de controle abordado neste trabalho consiste na regulação da altura do nível do tanque TQ-B fornecida pelo medidor LE. A vazão de saída do tanque TQ-B é ajustada através do fechamento da vávula FCV-2. Os tanques TQ-A e TQ-B têm mesmas 2 dimensões de área transveral de 0,433m , e altura máxima de 0,7 m. O modelo dinâmico dos tanques interativos pode ser obtido pela equação de balanço de massa dos tanques TQ-A e TQ-B. Assim, podemos escrever PA(t)=Patm +pghA(t) (4a) = PaIm + pghs(t) (4b) Ps(t) onde PaIm é a pressão atmosférica, p a densidade da água e g a aceleração da gravidade. Substituindo-se (4) em (3), tem-se: q AB (t) = (t) -hB(t) -=--.:..:..----=--- com (5) Rh (6) A válvula FCV -I apresenta característica exponencial do seguinte tipo (Braga, 1994) .(f) ql (I a) (I b) = Q.r max R I (7) (u(t)-I) onde U(I) é o sinal de controle fracionário normalizado aplicado na válvula FCV-I, R, representa o alcançe das válvulas FCV- I, Q; muar é 3/s. a vazão máxima de entrada em m Substituindo-se (5) e (7) em (2), obtém-se o modelo não linear da planta de tanques interativos: onde: m; e I11 B são respectivamente as massas de água dos tanques TQ-A e TQ-B em Kg; \Vi , \V AIJ e 11'0 são as vazões mássicas na entrada de TQ-A, transferida de TQ-A para TQ-B, na saída de TQ-B, respectivamente, em Kg/s. C0l110 as dimensões dos tanques TQ-A e TQ-B são iguais, podemos reescrever (i) como dhA(t) _ Qimax R(II(I)-I) _ di A 1 dhs(t) (2a) di (2b) A Rh (t) -hs(t) ARh (8) Assim, o problema de controle deste trabalho é regular a variável medida hB(t) no valor de referência através do sinal de controle u (t). onde 17.'1 e h li são respectivamente as alturas dos níveis de água de TQ-A e TQ-B em 111: q;, qA!J e qo 225 É fácil verificar que em regime estacionário, para um ponto de operação , obtemos u," = 1+ln(RAJIln(Q'malqaJ. Para os testes realizados neste trabalho, utilizamos a vazão de saída qo constante, igual a 17%. 3 dados representativos de suas relações entrada saída. Estes dados são então utilizados para o treinamento do controlador neural gain scheduling. Cumpre observar que o controlador neural global, que deverá prover o escalonamento de todos os controladores válidos nos pontos de operação treinados. Controle Neural Gain Scheduling A metodologia de controle por gain scheduling tem se mostrado de grande utilidade em muitas apl icações de engenharia (Shamma & Athans, 1990). Esta técnica consiste na obtenção de modelos linearizados em tomo de diversos pontos de operação da planta, para os quais são projetados controladores lineares utilizando técnicas convencionais de controle linear. A seguir um controlador não-linear global é obtido pelo escalonamento de ganhos de cada ponto de operação. Neste trabalho adotaremos a abordagem de controle neural gain scheduling proposta em Maia & Resende (1996). Esta abordagem considera uma representação discreta da planta, da forma y(t+ I) = f{y(t) . . . ., y(t-n+ I). u(t). . . ., utt-t-« 1)} y(t) y(l) do controlador _ _ v(t-l) L- 8 u(t) = u(t) - u* (IOb) Para garantir, em regime estacionário, erro nulo entre a saída da planta e o valor de referência é introduzido um integrador na entrada da planta. Assim, u(t) passa a ser obtido pela integração da variável v(t), que é gerada pelo controlador, OU seja, u(t) = u(t-l) +v(t) ( 12) Assim, para cada de operação é utilizado o esquema mostrado na figura 2, onde o bloco controle inclui a seqüência de atrasos requerida pelo controlador. Para geração dos dados de treinamento do controlador neural, é necessário um preprocessamento, no padrão de entrada da rede neural, pois v(t) deve ser zero quando 8y(t), .... õyttn), v(t-L) , .... vtt-m) são nulos (devido à condição de erro nulo em regime estacionário assegurado pela introdução de integrador na entrada da planta). Isso é conseguido definindo o vetor (Maia & Resende, 1996) : sendo que y* é o valor do ponto de operação e u* é a entrada da planta correspondente em regime estacionário. O controlador neural gain scheduling deve representar uma relação dinâmica da forma (Maia & Resende, 1996): . v(t) = g{8y(t), ....8y(t-nJ: vtt-l), ..., vtt-m), y(t)} --' Figura 2. Esquema para controle da planta em torno de y *. onde y(.), u(.) são a saída e a entrada da planta; com n e €inteiros positivos. São então determinados modelos aproximados válidos em tomo pontos de operação, sendo definidos os incrementos em torno destes pontos como: (IOa) 8 y(t) v (t) (9) 8 y(t) = y(t) - y* + Y* Seleção T Z = [ZI , z]} l' (13) T C11) onde ZI = [8y(t), ..., 8y(t-n), v(t-l). ... ,V(t-II1)} e Z] = y/t). O pré-processamento pode ser da seguinte forma: ( 14) = T(z) z sendo que m é um inteiro positivo e n é dado em (9). Assim, determinaremos um controlador neural global que representa os diversos controladores lineares, no sentido de implementar a técnica de gain scheduling. De acordo com o esquema da figura 2, para os diversos pontos de operação e os controladores lineares correspondentes, são gerados sendo T uma transformação contínua de L=n+lI1+2, satisfazendo as condições: b) T([ z/" 226 z] fj deve ser tinívoca se IlzI 117:0 e Um mapeamento que atende a essas exigências pode ser definido como: 4 com a função 0.(.) é definida como Para aplicação da técnica de controle neural gain scheduling, é utilizado como modelo da planta' a versão discretízada de (8) para período de amostragem de Is. Consideremos inicialmente a equação de um controlador PI discreto dado por (16) onde M é uma matriz (n+m+ I) x( n+m+ I) definida positiva. Uma vez conseguida a transformação T, os dados de treinamento são pré-processados, obtendo-se assim Z. Feito isso, a rede neural é então treinada para aprender o mapeamento nãolinear Z v(t). Também, é escolhida a rede neural do controlador com estrutura feedforward mult icamadas, sem termos de polarização e com função de ativação tangente hiperbólica. O esquema do treinamento do controlador neural gain scheduling é mostrado na figura 3. Neste esquema, o treinamento da rede é feito da forma usual através do algoritmo de retropropagação do erro (Rumelhart et a!., 1986). / õy(I) , .. ., svü -n), v(I- 1) ,.. .. vit-m) , y(l) Préproces- I-J Rede Neural sarnento I u(t) = Kp8y(t) + K;2::8y(t) (17) ;=0 com 8y(t) = h; - hn(t) (18) onde Kp , K;, são respectivamente o ganho proporconal e o ganho integral. Adotando a introdução de integrador ..na entrada da planta, como requerido pela abordagem descrita em (12), temos que v(t) =u(t)-u(t- 1). Assim, usando (17) em dois instantes de amostragem consecutivos obtemos v(t) = Kp[8y(t) -8y(t -1)]+ K; 8y(t) (19) v(1) - 1+ ---+0 que é a forma do controlador discreto PI incrementai, a ser usado na .etapa de projeto de controladores para diversos pontos de operação da planta de tanques interativos. Deste modo, para seis pontos de operação distribuidos na faixa de operação de altura de níveis do tanque TQ-B, foram sintonizados controladores PI por meio de regras clássicas de Ziegler-Nichols, para testes de degrau de pequena amplitude. Segundo o esquema da figura 2, cada um desses controladores, na vizinhança do respectivo ponto de sinton ia, foram utilizados para geração de dados, através de simulação usando (12), (17), (18)e a forma discretizada de (8). Foi usado o pré-processamento indicado em (13)-(16), pará M matriz identidade 2x2 com Zj = T ' [8y(t), 8y(t)-8y(t-l)] e Z2 = y(t), onde y(t)=hB(t) . Assim, a rede neural foi treinada para aprender o mapeamento não linear z v(t), segundo o diagrama da figura 3. Foi utilizado uma rede neural com três entradas, cinco neurônios na camada escondida e um na camada de saída, sem termos de polarização e com função de ativação tangente hiperbólica. O controle neural gain scheduling foi então implementado na plarita de tanques interativos segundo o diagrama da figura 4. As figuras 5 e 6 apresentam os resultados experimentais obtidos com o controle neural gain scheduling da planta de tanques interativos. A figura 5 mostra o sinal dado pelo medidor FE que é a altura do nível do tanque TQ-B, hB (t) e degraus / Figura 3. Esquema do treinamento do controlador neural gain scheduling Após o treinamento da rede', o controlador neural gain scheduling é obtido e utilizado para controlar a planta, como mostrado na estrutura dada na figura 4 (onde o bloco con trolador neural gain scheduling inclui a seqüência de atrasos, o préprocesamento e a rede neural treinada). y(t) + v(t) Implementação Experimental do Controle Neural Gain Scheduling .Controlador neural gain scheduling Figura 4. Controle Neural gain scheduling da planta 227 de referência. A figura 6 mostra o sinal de comando da v álvula r-CY-l que ajusta a vazão de entrada da planta por meio da variávelu(1) 60 20 L . - _ - - - '_ _--'-_ _ _ _ _ 1000 1500 2000 500 O _____..J 2500 Figura 5. Sinal de saída para degraus de referência. 100 80 60 u(t) 20 o'-_---'__ O 500 _ 1000 1500 2000 _____" 2500 Figura 6. Sinal da ação de controle. 5 Conclusões Este trabalho apresentou uma aplicação experimental da técnica de controle neural gaill scheduling para o controle de altura de nível de tanques interativos descrito por modelo dinâmico não linear. A abordagem de controle utilizada mostrou que o controlador neural global pode prover a substituição dos diversos controladores sintonizados para os diferentes pontos de operação da planta. Os resultados experimentais demonstraram a viabilidade de aplicação da técnica neural gain scheduling em plantas não lineares. 6 Referências Ahmed, M.S.; Tasadduq , I.A. (1994). Neural net control/er for nonlinear plants: design approach through linearisation, IEE Proc. Control Theory Appl., 141,315-322. Braga, A. 1.; (1994). Implementação de estratégias de controle niultimalha e multivariável, Dissertação de Mestrado, PPGEE, UFMG . Chen , F.C.; Khalil, H.K. (1995). Adaptive Control of a Class of Nonlinear Discrete-Time Systems Using Neural Networks, IEEE Trans. A utomat. Contr. , 40, 791-80 I. Fukuda , T.; Shibata, T. (1992). Theory and applicarions of neural networks for industrial control systerns, IEEE Trans. on Industrial Eletronics , 39,472-489. Garcia, CE. and Morari, M., (1982). Internai Model control I: a unifying review and some ncw results. lnd. Eng. Chem. Process Dés. Dev., Vol. 21.no. 9, pp. 308-323 l lunt. K.J.; Sbarbaro, D. (1991). Neural Networks for nonlinear internai model contro l, IEE Proc., Purt D. 138.431-438, . Maia. C. A; Resende , P. (1996). Projeto de controladores lineares para plantas não-lineares via linearização, Anais do XI Congresso Brasileiro de Automática, S. Paulo , 1561-1566. Narendra, K.; Parthasarathy, K. (1990) . ldcnti fication and control of dynam ical systems using neural networks, IEEE Trans. Neural Nctworks, I. 4-27 . Rumclharr. D.E.; Hinton . G.E .; Willians, R.J. (19S6) . Learning internai representations by .error propagation. in Parallel distributed proccssing, MlT Press. SharnrnaJ. S.: Athans, M. (1990) . Analysis of gain schedulcd control for nonlinear plants. IEEE Trans. Automut. Contr.. 35.898-907. Slotine. J.J.E.; Weiping . L. (1990). Applied ,\'lIlIlint'ur Contrai, Prentice Hall, Ne w Jersey.