PROJETO DE CONTROLADOR PI ESCALONADO VIA CONTROLE PREDITIVO Rafael Meireles Saback∗, Tito Luis Maia Santos∗ ∗ Departamento de Engenharia Elétrica, 40210-630 Universidade Federal da Bahia Salvador, Bahia, Brasil Emails: [email protected], [email protected] Abstract— This paper aims to study, in a preliminary way, the use of a PI controller based on gain-scheduling applied to integrator first-order systems, without time delay and with output constraints. It’s known that the existence of constraints for process variables imposes significative hardships for classical control techniques. On the other hand, the simplicity of implementation of the PI or PID control techniques is a major reason for the success of these techniques. In order to address both aspects, it is possible to obtain a control law of gainscheduled PI type tuned from a model predictive controller in order to respect the constraints of process variables. A case study based on the slug flow control problem is used to evaluate the proposed strategy. The controller was tested at a 1:20 scale prototype of a tank similar to the geometry of a two-phase separator. Keywords— gramming. Two-phase separator, severe slug, PI control, model predictive control, multi-parametric pro- Resumo— Este artigo tem como objetivo estudar, de maneira preliminar, a utilização de um controlador PI com ganho escalonado aplicado a sistemas integrativos de primeira ordem, sem atraso de transporte e com restrições na saı́da. Sabe-se que a presença de restrições operacionais nas variáveis de processo impõe dificuldades significativas à utilização de técnicas de controle clássico. Por outro lado, a simplicidade de implementação de técnicas de controle do tipo PI ou PID é um dos principais motivos para o sucesso destas técnicas. De forma a contemplar ambos os aspectos, é possı́vel obter uma lei de controle do tipo PI escalonado sintonizado a partir de um controlador preditivo baseado em modelo com o intuito de respeitar as restrições nas variáveis do processo. Um estudo de caso baseado no problema de controle de golfadas é utilizado para avaliar a estratégia proposta. O controlador foi testado em um protótipo em escala 1:20 de um tanque com geometria similar à de um separador bifásico. Palavras-chave— Separador bifásico, golfada severa, controle PI, controle preditivo baseado em modelo, programação multiparamétrica. 1 Introdução Em 1922, Nicholas Minorsky publicou a primeira análise teórica sobre controladores PID e propôs a lei de controle com a qual associamos o conceito atual de controle PID (Bennett, 1996). Desde então, inúmeros artigos foram publicados sobre este tipo de controlador. Ao longo das décadas novas técnicas de controle foram propostas, algumas abordando problemas não explicitamente solucionados pelos controladores PID (como por exemplo, restrições e sistemas com atraso dominante), outras propondo melhores resultados em termos de desempenho (como as técnicas baseadas em modelo). Embora a tecnologia atual ofereça o potencial necessário para que técnicas de controle mais avançadas possam ser utilizadas, ainda é comum a preferência de engenheiros da indústria por estruturas de controle baseada em controladores mais simples (Wang, 2009). A estrutura simples dos controladores PID facilita a sua implementação em sistemas de controle e permite que sejam embarcados em hardwares com menor capacidade de processamento. No entanto, uma das principais limitações do controlador PID é a sua incapacidade de lidar de forma direta com restrições. No contexto da indústria, as restrições podem aparecer sob a forma de limitações fı́sicas, como por exemplo a capacidade de um tanque ou a abertura de uma válvula, ou sob a forma de restrições de processo, como limites de temperatura e pressão que representam limites operacionais para garantir que reações quı́micas ocorram de forma adequada. As restrições são não-linearidades por essência (Wang, 2009) e representam um problema importante dentro da teoria e prática do controle de sistemas. Neste trabalho, as técnicas de CPBM e programação multiparamétrica são utilizadas de forma conjunta para realizar a sintonia ótima de controladores PI com escalonamento de ganho, ao mesmo tempo em que se impõe restrições de forma explı́cita ao controlador. Esta solução é algo tratado anteriormente na literatura cientı́fica, e é também conhecida como mp-MPC (Multi-parametric Model Predictive Control ) ou CPBM explı́cito (Dua et al., 2008) (Pistikopoulos, 2009). Nesta abordagem, o problema de otimização inerente ao CPBM com restrições, que usualmente seria solucionado durante a operação do controlador, passa a ser resolvido de forma offline pela programação multiparamétrica. Para tanto, o espaço de soluções do problema de otimização é particionado em função do estado do processo. Em cada partição do universo de solução, pode-se escrever o sinal de controle ótimo como uma função afim (linear com a adição de uma parcela constante) do vetor de estados. Desta forma, para cada partição, podese obter uma lei de controle afim do estado e o universo de solução é chamado de afim por partes (Bemporad et al., 2002). Um estudo de caso, utilizado como exemplo motivador, é apresentado ao final do artigo. A técnica proposta foi aplicada no controle regulatório do nı́vel de um protótipo de separador bifásico, que em sua operação normal está sujeito a perturbações devido a uma vazão de entrada inconstante, problema este conhecido como golfada severa. 2 2.1 Estratégia de Controle Proposta Controle Preditivo Baseado em Modelo i capacidade de lidar facilmente com sistemas multivariáveis (Camacho and Bordons, 1999); ii capacidade de tratar com sistemas simples ou complexos, que podem incluir sistemas com atraso, fase não mı́nima ou plantas instáveis (Camacho and Bordons, 1999); iii e, por último, o CPBM permite que as restrições sejam impostas de forma explı́cita ao controlador (Wang, 2009). Na equação (1) é apresentado um sistema causal genérico de primeira ordem e sem atraso de transporte que incorpora a ação integral para garantir a rejeição de perturbações constantes. x(k + 1) y(k) = = sendo: Ax(k) + B∆u(k) Cx(k) x(k) = ∆y(k) y(k) (1) (2) A opção de x(k) conforme apresentada na equação (2) foi realizada por simplicidade de representação, uma vez que partiu-se de um modelo em espaço de estados, como em Wang (2009). Esta escolha foi realizada sem perda de generalidade uma vez que o mesmo problema poderia ser resolvido com uma representação entrada-saı́da. A partir do modelo discreto em espaço de estados (1), é possı́vel obter o modelo de predição apresentado em (3), no qual o controle preditivo é baseado (Wang, 2009). Y = F x(k) + Φ∆U (3) sendo ∆U o vetor de controles atual e futuros, com: F = [ CA CA2 ··· CANp ]T Φ= CB CAB CA2 B . . . Np −1 CA B 0 CB CAB . . . Np −2 CA B ··· ··· ··· .. . ··· 0 0 0 . . . (5) CANp −Nc B O controle preditivo calcula a sequência de controles ótimos (∆U ) a ser aplicado na planta dada as informações disponı́veis no instante atual com base na função custo quadrática apresentada em (6). ERRO CONTROLE }| { z }| { z J = (Rs − Y )T (Rs − Y ) + (∆U T R∆U ) (6) sendo: Rs Y ∆U R Np = = = = z }| { Vetor de referências = [111 · · · 1]T r(k) Vetor de saı́das preditas Vetor de controles ótimos Matriz de pond. do esforço de controle (7) O Controle Preditivo Baseado em Modelo (CPBM) é uma técnica de controle avançado que tem despertado o interesse tanto da comunidade acadêmica como da industrial (Wang, 2009). Alguns aspectos do CPBM fazem dele uma estratégia atraente para ambas as comunidades, como por exemplo: (4) No caso irrestrito, a lei de controle ótima do CPBM é linear e pode ser calculada conforme é apresentado na equação (8) (Wang, 2009). ∆U = (ΦT Φ + R)−1 ΦT (Rs − F x(k)) (8) Nc x1 sendo que ∆U ∈ R e Nc é o horizonte de controle. Os elementos do vetor ∆U correspondem aos controles a serem aplicados nos instantes k, k+1, k+2, ..., k+Np −1 . Embora o vetor contenha os controles atual e futuros, apenas o controle no instante atual (k) é aplicado na planta devido ao princı́pio do horizonte deslizante. No caso restrito, o controle ótimo é encontrado através de um processo de otimização, levando-se em consideração o modelo da planta (1), as restrições do sistema e a função custo (6). Deve-se ressaltar que a grande vantagem de se impor restrições de forma explı́cita reside no fato de que se torna possı́vel aproximar-se de maneira mais segura das restrições independentemente da sintonia escolhida. No entanto, a complexidade computacional associada a este tipo de solução dificulta a sua utilização em processadores mais simples, a exemplo dos Controladores Lógico Programáveis. Uma alternativa para este problema está na utilização da ferramenta de programação multiparamétrica, conforme discutido brevemente na introdução. 2.2 Programação Multiparamétrica A programação multiparamétrica apresenta duas principais caracterı́sticas que a tornam uma solução interessante no contexto deste trabalho: (i) capacidade de resolver o problema de otimização em modo offline, reduzindo-se o tempo de processamento durante a operação normal do sistema; (ii) as leis de controle do controlador preditivo explı́cito, conforme será apresentado ao longo das seções 2.3, 2.4 e 2.5, possuem estruturas similares às de controladores PI. A programação multiparamétrica aplicada à resolução do problema de otimização consiste em dividir o espaço de estados em um conjunto de regiões (chamadas de politopos ou regiões politópicas), e para cada uma delas uma lei de controle ótima está associada. Um exemplo de divisão do espaço de estados é exibido na Figura 1, onde cada uma das regiões exibidas está associada a uma lei de controle própria. sendo Kpd e Kid , respectivamente, os ganhos proporcional e integral do controlador discreto. Manipulando-se a equação anterior, obtém-se a relação expressa em (10). C(z) = (Kpd + Kid ) − Kpd z −1 1 − z −1 (10) Assim, a malha do PI discreto pode ser representada conforme é apresentado na Figura 2. 2.4 Lei de Controle Preditivo - Caso Irrestrito Com base na equação (8), pode-se realizar a seguinte manipulação matemática: M =(ΦT Φ + R)−1 ΦT m11 m12 m22 m21 = .. .. . . mNc 1 mNc 2 ··· ··· .. . ··· m1Np m2Np .. . mNc Np (11) e assim: ∆U = M Rs − M F x(k) Figura 1: Exemplo de regiões politópicas. Embora a programação multiparamétrica baseie-se no processamento offline das leis de controle, o custo computacional pode tornar-se proibitivo para sistemas que possuem um número muito grande de estados ou horizontes de controle e predição elevados (Kvasnica et al., 2006). Isto ocorre pois, quanto maior a complexidade do sistema de controle envolvido, maior é o número de regiões politópicas, podendo aumentar significativamente o número de chaveamentos entre as leis de controle. A programação multiparamétrica implementada neste trabalho fez uso de uma ferramenta gratuita desenvolvida por pesquisadores do Swiss Federal Institute of Technology, chamada MultiParametric Toolbox (MPT) (Kvasnica et al., R 2006), que opera em ambiente Matlab . Os controles ótimos calculados para o controlador preditivo com restrições são funções afins por partes. Estas funções, por sua vez, são soluções para regiões do espaço de estados, e não para um determinado estado apenas. Em outras palavras, cada região politópica está associada a uma lei de controle afim. Para o problema em questão, estas leis de controle, sob o ponto de vista de função de transferência e malha de controle, apresentam uma estrutura equivalente à de um controlador PI com escalonamento de ganho e com filtro de referência adaptativo. Estas afirmações serão demonstradas ao longo desta seção. 2.3 Controlador PI Discreto O modelo de um controlador PI discreto pode ser escrito na forma apresentada em (9). U (z) z = C(z) = Kpd + Kid E(z) z−1 (9) (12) A fim de se calcular o controle ótimo apenas para o instante atual, a expressão (12) fica reduzida à primeira linha de ∆U , conforme é apresentado em (13). ∆u(k) = (m11 + m12 + · · · + m1Np )r(k)− (M F )11 ∆y(k) − (M F )12 y(k) (13) e, a fim de simplificar a equação (13): (m11 + m12 + · · · + m1Np ) (M F )11 (M F )12 = = = Cr C1 C2 (14) e então: ∆u(k) = Cr r(k) − C1 ∆y(k) − C2 y(k) (15) Por fim, manipulando-se a equação (15), encontra-se a expressão da lei de controle para o controlador preditivo irrestrito, que é apresentada em (16). ∆u(k) = Cr r(k) − (C1 + C2 )y(k) + C1 y(k − 1) (16) ou alternativamente: u(k) = u(k − 1) + Cr r(k) − (C1 + C2 )y(k) + C1 y(k − 1) (17) Assim, obtém-se a malha de controle exibida na Figura 2. Sabe-se que, em regime permanente, o filtro de referência apresenta ganho estático unitário para garantir o seguimento de referência. Neste caso, pode-se verificar que a relação a seguir é válida: Cr = (C1 + C2 ) − C1 = C2 (18) Desta forma, para sistemas de primeira ordem com o modelo de predição utilizado neste trabalho, obtém-se um PI com filtro de referência conforme apresentado na Figura 2. Este resultado já foi muito explorado na literatura de controle preditivo, mas serve de referência para o caso com programação multiparamétrica. Figura 2: Malhas de controle linear: PI discreto (acima), equivalente ao CPBM para uma solução afim (abaixo). 2.5 Solução Multiparamétrica Conforme foi apresentado na Figura 1, a programação multiparamétrica divide o espaço de estados em diversas regiões politópicas. Pode-se verificar que a solução da região central, região esta que não possui restrições ativas, é a solução do caso irrestrito. A lei de controle das regiões politópicas possui a estrutura apresentada em (19). ∆U = H(i) · x(k) + G(i) (19) sendo que ∆U ∈ RNc x1 , H ∈ RNc xn , G ∈ RNc x1 , Nc é o horizonte de controle, n é a ordem do sistema e o ı́ndice i representa o politopo ao qual a lei de controle está associada. Cada uma das linhas do vetor corresponde ao controle a ser aplicado nos instantes k, k + 1, k + 2, ..., k + Np − 1. Levandose em consideração apenas o controle aplicado no instante k, tem-se a lei de controle apresentada em (20). ∆u(k) = [H11 H12 ] ∆y(k) y(k) ser interpretada como um controlador PI com escalonamento de ganho e filtro de referência (ver Figura 2), cujos parâmetros são função da região politópica considerada. Em outras palavras, define-se um PI com escalonamento de ganhos através de um procedimento de sintonia simples, que otimiza um critério e permite que restrições sejam impostas de forma explı́cita ao projeto do controlador. É importante ressaltar que o critério a ser minimizado tem seu significado diretamente relacionado com o principal objetivo de controle, que no caso de estudo a ser considerado é: reduzir a variação da vazão de saı́da. Assim, é possı́vel definir as regiões e os controladores PI em modo offline com vistas a embarcar um PI adaptativo em um processador com capacidade moderada a exemplo de um controlador CLP local de baixo custo. + G1 (20) 3 assim: ∆u(k) = H11 (y(k) − y(k − 1)) + H12 y(k) + G1 (21) 3.1 Caso Motivador - Controle Regulatório de Nı́vel A Golfada Severa ou então: ∆u(k) = (H11 + H12 )y(k) − H11 y(k − 1)) + G1 (22) A estrutura da lei de controle (22) vale para todas as regiões politópicas, porém, cada uma estará associada às suas respectivas matrizes H(i) e G(i). Considerando-se referências não nulas é possı́vel reescrever o termo G1 como em (23). FR (k) = G1 r(k) (23) Em geral, a referência assume o valor constante num dado intervalo de tempo em uma parte significativa dos problemas de controle reais. Assim, numa dada região, FR (k) é simplesmente FR . Deve-se ressaltar que cada região do politopo terá um valor para G1 , H11 , H12 e FR associado à mesma. Assim, (22) pode ser reescrita como em (24). u(k) = u(k−1)+(H11 +H12 )y(k)−H11 y(k−1))+FR r(k) (24) Nas regiões exteriores ao politopo central, há a presença de restrições ativas. Neste caso, o ganho do filtro de referência não é necessariamente unitário. Desta forma, conforme exibido na Figura 3, pode-se observar que a estratégia proposta pode O petróleo contido no reservatório está submetido a elevadas pressões, isso faz com que haja uma grande quantidade de gás dissolvido em solução. À medida que o petróleo sobe na coluna de produção, a pressão à qual ele está submetido começa a se reduzir, e, por consequência, parte do gás dissolvido começa a se desprender. Esse gás que é desprendido forma pequenas bolhas ao longo tubulação, e estas começam a aglomerar-se em trechos horizontais da coluna. Em um dado momento, a porção gasosa é tamanha que acaba interferindo no fluxo da fase lı́quida, caracterizandose a golfada severa (de Almeida, 2011). A golfada severa é um fenômeno indesejável na exploração de petróleo, pois é um tipo de fluxo inconstante caracterizado por causar mudanças abruptas na pressão e na vazão de lı́quido e de gás na saı́da da tubulação. A Figura 4 exibe uma ilustração deste tipo de regime de fluxo deslocando-se verticalmente, enquanto que a Figura 5 exibe uma imagem da plataforma experimental utilizada. Neste trabalho, para mitigar os efeitos da golfada severa no processo, o sistema de controle projetado atua na válvula de saı́da do separador bifásico, com o intuito de utilizar a sua capacidade de armazenamento para amortecer os efeitos deste Figura 3: Malha de controle - abordagem multiparamétrica. arizante (Khalil, 2002) e é apresentada em (27). qo = − Figura 4: Ilustração do fenômeno da golfada severa. A(h) u A sendo u um sinal de controle virtual e A uma constante, que pode ser definida como a área média, obtida a partir da geometria do tanque. O modelo nominal, após a aplicação da realimentação linearizante proposta em (27), passa a ser dado por: dh 1 = u dt A Figura 5: Plataforma experimental do separador bifásico. fenômeno indesejado. Além do mais, foram consideradas duas restrições do sistema: restrição de nı́vel mı́nimo de operação (9cm), que deve ser respeitada a fim de não prejudicar os processos à jusante; e restrição de nı́vel máximo (15cm), devido aos limites fı́sicos da capacidade de armazenamento do equipamento. Há de se ressaltar que, no caso do controle de nı́vel do separador bifásico, deseja-se reduzir a variação da vazão de saı́da, respeitando-se as restrições operacionais, pois a vazão de saı́da afeta o processo a jusante. 3.2 (27) (28) Este é um modelo integrador, que pode ser facilmente controlado com qualquer estratégia de controle clássico. No entanto, com vistas a respeitar as restrições de nı́vel, faz-se necessário ter uma atenção especial com o ajuste do controlador. No caso do controlador preditivo, as restrições de nı́vel são impostas explicitamente. 3.3 Resultados Experimentais A emulação da golfada no sistema foi realizada através da bomba de entrada do separador bifásico. O padrão da perturbação aplicada à vazão de entrada é exibido na Figura 7. Modelo do Processo Conforme discutido em Astrom and Wittenmark (2008) o modelo de um tanque com área de seção transversal variável em função do nı́vel é dada por: dh dV = A(h) = qi − qo dt dt Figura 7: Emulação da perturbação. (25) sendo h o nı́vel do tanque, A(h) a área da seção transversal em função do nı́vel, qi a vazão de entrada e qo a vazão de saı́da. No caso do separador bifásico, a vazão de entrada age como uma perturbação desconhecida, a vazão de saı́da é a variável manipulada e o nı́vel é a variável de processo, que deve respeitar os limites operacionais. Assim, desconsiderando a perturbação desconhecida (vazão de entrada), a equação (25) pode ser manipulada para se encontrar a expressão apresentada em (26). qo dh =− dt A(h) (26) A vazão , que é a variável manipulada do sistema, pode ser definida com base na realimentação line- O nı́vel do tanque nos gráficos exibidos foi parametrizado entre 0 a 100%, sendo que 0% corresponde à restrição de nı́vel inferior (9cm) e 100% corresponde à restrição de nı́vel superior (15cm). O controlador preditivo possui alguns parâmetros que permitem realizar a sua sintonia, como os horizontes de predição e controle, por exemplo. Nos experimentos realizados, o parâmetro de sintonia utilizado foi a matriz ponderação do esforço de controle (R), que pondera a função de custo quadrático apresentada em (6). Neste estudo, as ponderações da matriz R foram homogêneas, ou seja, não houve distinção ao se ponderar o controle atual e os controles futuros calculados no vetor ∆U . (a) Ponderação do esforço de controle igual a 5.000. (b) Ponderação do esforço de controle igual a 20.000. Figura 6: Resultados experimentais. A Figura 6a e a Figura 6b exibem os resultados obtidos para ponderações de controle igual a 5.000 e 20.000, respectivamente. Note que, ao se considerar uma ponderação mais baixa, o controlador fica mais agressivo, conforme pode ser visto na Figura 6a em comparação com a Figura 6b. Isso ocorre pois uma menor ponderação do esforço de controle possibilita que valores mais elevados possam ser utilizados pelo controlador. Também é interessante notar que, por ser um controle menos agressivo, a variação do nı́vel foi maior para o segundo controlador. E, à medida que o nı́vel começa a se aproximar da restrição superior (100% - 15cm), o controle começa a se tornar mais agressivo, apresentando variações de controle mais abruptas. Com isso, é possı́vel concluir que a sintonia do controlador PI com escalonamento de ganho a partir do CPBM explı́cito com restrições tem a vantagem de permitir que um operador escolha o valor de ponderação de forma livre. Os resultados obtidos neste trabalho não foram comparados com um PI pois, para o tipo de problema considerado, seria difı́cil escolher um PI com sintonia adequada uma vez que as restrições na saı́da não podem ser consideradas explicitamente em um controlador linear clássico. 4 Conclusão Neste trabalho mostrou-se que para sistemas de primeira ordem com restrições, pode-se sintonizar um PI escalonado por meio de estratégias de controle preditivo baseado em modelo. O problema de primeira ordem com atraso não foi tratado, mas pode ser considerado utilizando técnicas de compensação de atraso. Por fim, foram avaliados os resultados experimentais obtidos a partir protótipo experimental que representa o problema de controle de golfadas. Referências Astrom, K. J. and Wittenmark, B. (2008). Adaptive control, Dover. Bemporad, A., Morari, M., Dua, V. and Pistikopoulos, E. N. (2002). The explicit linear quadratic regulator for constrained systems, Automatica 38(1): 3 – 20. Bennett, S. (1996). A brief history of automatic control, Vol. 16. Camacho, E. and Bordons, C. (1999). Model Predictive Control, Springer. de Almeida, B. R. (2011). Estabilização da Golfada Severa por meio de Sistemas de Controle Realimentado. Dua, P., Kouramas, K., Dua, V. and Pistikopoulos, E. N. (2008). Mpc on a chip-recent advances on the application of multi-parametric model-based control, Computers & Chemical Engineering 32(4): 754–765. Khalil, H. (2002). Nonlinear Systems, Prentice Hall. Kvasnica, M., Grieder, P., Baotic, M. and Christophersens, F. (2006). Multi-Parametric Toolbox (MPT) Manual. Pistikopoulos, E. (2009). Perspectives in multiparametric programming and explicit model predictive control, Vol. 55, Wiley Online Library. Wang, L. (2009). Model predictive control system design and implementation using R MATLAB, Springer Science & Business Media.