Anais do XX Congresso Brasileiro de Automática Belo Horizonte, MG, 20 a 24 de Setembro de 2014 EXTENSÃO DE GRAU RELATIVO ARBITRÁRIO PARA O MRAC BINÁRIO MULTIVARIÁVEL UTILIZANDO DIFERENCIADORES ROBUSTOS EXATOS GLOBAIS A NDREI BATTISTEL , E DUARDO V.L. N UNES AND L IU H SU∗ ∗ Programa de Engenharia Elétrica COPPE/Universidade Federal do Rio de Janeiro, C.P. 68504 21945-970-Rio de Janeiro, RJ, Brasil Email: [email protected], [email protected], [email protected] Abstract— This paper presents a multivariable adaptive control technique that does not require stringent symmetry assumptions on the High Frequency Gain and is applicable to plants of non-uniform arbitrary relative degree. The result is an extension to the Multivariable Binary Model Reference Adaptive Control (BMRAC), where Global Robust Differentiators (GRED) are used to circumvent the relative degree obstacle. Global exact output tracking for uncertain linear plants is obtained with good transient performance and robustness. Keywords— Multivariable Adaptive Control, High Order Sliding Modes, Robust Exact Differentiators Resumo— Este trabalho apresenta a extensão para grau relativo arbitrário e não uniforme do Controle Adaptativo Multivariável Binário por Modelo de Referência (BMRAC). Obtém-se um controlador robusto com rastreamento global e exato para plantas lineares incertas sem a necessidade de simetrização da matriz do ganho de alta frequência. Para contornar o problema do grau relativo, é utilizada a versão multivariável do Diferenciador Robusto Global e Exato (GRED), que obtém derivadas exatas através da combinação convexa de um filtro de avanço de fase com um estimador não linear baseado em modos deslizantes de ordem superior. Palavras-chave— 1 Controle Adaptativo Multivariável, Modos Deslizantes de Ordem Superior, Diferenciadores Exatos Robustos um sejam WASPR é que a matriz do HFG, Kp , tenha forma de Jordan diagonal positiva (PDJ). Este resultado motivou um novo algoritmo de MRAC direto sem a necessidade de superparametrização e que dispensa as condições de simetria em Kp (Hsu et al., 2014) Sabe-se que os controladores adaptativos baseados em lei do gradiente têm como característica os maus transitórios de adaptação e a pouca robustez. A partir daí motivou-se o desenvolvimento do BMRAC (Binary Model Reference Adaptive Control) (Hsu and Costa, 1994), que permite um aumento do ganho de adaptação de maneira que estes problemas são suavizados, permitindo bom comportamento transitório e robustez. O BMRAC consiste basicamente no MRAC convencional com uso de projeção paramétrica combinado com alto ganho de adaptação. A extensão multivariável para grau relativo um foi recentemente apresentada em (Yanque et al., 2012). Embora o BMRAC tenda para um controle em modos deslizantes conforme o ganho de adaptação aumenta, este ganho pode ser sintonizado para um valor suficientemente alto evitando o chattering. Embora esta solução requeira apenas que Kp seja PDJ, relaxando assim a condição de simetria, o algoritmo em questão é restrito a plantas de grau relativo uniforme ρ = 1 apenas. Neste trabalho é proposta uma nova extensão ao MIMO BMRAC englobando plantas de grau relativo não uniforme e que permite obter rastreamento global e exato através de um estimador híbrido recentemente generalizado para o caso multivariável (Nunes et al., 2013). Tal estimador, chamado Diferenciador Robusto Exato Global (GRED, Global Robust Exact Differentiator), chaveia entre um filtro MIMO de avanço de fase e um filtro não linear que utiliza Diferenciadores Robustos Exatos (RED) (Levant, 2003) Introdução As técnicas convencionais de Controle Adaptativo Direto1 Multivariável por Modelo de Referência (MIMO MRAC) requerem o conhecimento de um multiplicador Sp para a matriz Kp do Ganho de Alta Frequência (HFG, high frequency gain), tal que Sp Kp se torne simétrica positiva definida (SPD, symmetric positive definite) (Tao, 2003) (Ioannou and Sun, 1996). Essa hipótese é não genérica, portanto frágil, uma vez que uma perturbação paramétrica arbitrariamente pequena no Kp destrói a simetria. Algumas das técnicas que permitem o projeto de controladores MIMO-MRAC para plantas com HFG incerto e possivelmente não simétrico se baseiam em fatoração matricial (Tao, 2003), (Costa et al., 2003), (Imai et al., 2004), (Xie and Zhang, 2005), (Xie and Li, 2006), (Xie, 2008), (Boulkroune et al., 2010), (Charandab et al., 2011). Embora trate-se de uma solução bastante genérica que dispensa o conhecimento de uma matriz simetrizante Sp , a desvantagem é a resultante superparametrização do controle. Uma possibilidade recente de contornar a exigência de simetria é encontrada em (Barkana et al., 2006) and (Hsu et al., 2011a), utilizando para tal o conceito de passividade generalizada, WSPR (W strictly positive real) apresentado em (Fradkov, 2003) ao invés do paradigma usual de positividade real SPR; e a idéia de passividade WASPR (W almost SPR), no qual um sistema pode se tornar WSPR por meio de realimentação estática de saída. É demonstrado em (Hsu et al., 2011a) que a condição necessária e suficiente para que sistemas de fase mínima de grau relativo 1 No controle adaptativo direto, os parâmetros do controlador são diretamente atualizados por uma lei de adaptação 1135 Anais do XX Congresso Brasileiro de Automática Belo Horizonte, MG, 20 a 24 de Setembro de 2014 3 baseado em modos deslizantes de ordem superior. O uso do MIMO GRED torna o erro do sistema uniformemente exponencialmente globalmente praticamente estável em relação a um conjunto residual pequeno com convergência para zero. 2 Considera-se uma planta MIMO linear invariante no tempo descrita por ẋp = Ap xp + Bp u , O conceito de SPR convencional requer que o ganho de alta frequência da planta seja SPD, condição dificilmente satisfeita por sistemas reais. Uma solução para contornar esta dificuldade foi recentemente proposta em (Barkana et al., 2006), (Hsu et al., 2011a), explorando um conceito mais geral de passividade associado com a definição de WSPR e resultados correlatos. y = G(s)u, (2) G(s) = Hp (sI −Ap )−1Bp . As seguintes hipóteses são consideradas (A1) G(s) é de fase mínima e tem posto completo. Definição 1 (WSPR) (Barkana et al., 2006) (Hsu et al., 2011b) Um sistema linear invariante no tempo com a realização {AK , B, C}, onde AK ∈ Rn×n , B ∈ Rn×M , and C ∈ RM ×n é dito W –Estritamente Passivo (WSP) e a sua função de transferência C(sI −AK )−1 B é dita W –Estritamente Positiva Real (WSPR), se existem matrizes simétricas positivas definidas P , Q e W tal que P B = CT W . y = Hp xp , onde xp ∈ Rn é o estado, u ∈ RM é a entrada, y ∈ RM é a saída e Ap , Bp and Hp são matrizes constantes e incertas. Todos os parâmetros incertos pertencem a um conjunto compacto Υ, tal que são disponíveis os limites de incerteza necessários a serem definidos posteriormente. O modelo entrada-saída da planta é dado por Passividade generalizada (WSPR) ATK P + P AK = −Q , Descrição do Problema (A2) A planta é controlável e observável. (A3) O índice de observabilidade ν de G(s), ou um limitante superior de ν é conhecido. (A4) Existe uma matriz polinomial diagonal conhecida ξm (s), definida como a matriz interactor pela esquerda modificada (MLI) de G(s) da forma ξm (s) = diag {d1 (s), d2 (s), . . . , dM (s)} onde di (s) são polinômios mônicos estáveis de grau ρi > 0. (1) (A5) A matriz de ganho de alta frequência de G(s), definida como Kp = lims→∞ ξm (s)G(s) é finita e não singular, com autovalores positivos e forma de Jordan diagonal (condição PDJ). Definição 2 (WASPR) : Um sistema linear e invariante no tempo com realização {A, B, C}, é dito WASP se pode se tornar WSP a partir de uma realimentação estática de saída, i.e., se existe K ∈ RM ×M tal que C(sI − AK )−1 B é WSPR, com AK = A − BKC. Assim, pela hipótese (A4), o grau relativo vetorial [ρ1 , ρ2 , ..., ρM ]T é arbitrário e conhecido. O sinal de referência ym é gerado pelo seguinte modelo de referência O teorema WASPR é enunciado como em (Hsu et al., 2011a) e estabelece a condição para que um sistema se torne WSPR por meio de realimentação estática de saída. ym = M (s) r ; r, ym ∈ IRM (3) −1 M (s) = diag (s + a) , ..., (s + a)−1 L−1 (s) (4) Teorema 1 (Teorema WASPR (Hsu et al., 2011b)) Todo sistema estritamente próprio e de fase mínima {A, B, C} com A ∈ Rn×n , B ∈ Rn×M , C ∈ RM ×n e matriz de transferência C(sI − A)−1 B de ordem M × M pode se tornar WSPR através de realimentação de saída (suficientemente grande), se e somente se Kp tem autovalores positivos e reais e sua forma de Jordan é diagonal (condição PDJ). onde a > 0 e L(s) é dado por L(s) = diag {L1 (s), L2 (s), ..., LM (s)} , (5) e Li (s), i = 1, ..., M são polinômios Hurwitz dados por [i] [i] [i] Li (s) = s(ρi −1) + lρi −2 s(ρi −2) + ... + l1 s + l0 (6) A matriz de transferência M (s) tem o mesmo grau relativo vetorial de G(s) e o seu HFG é a matriz identidade. O objetivo de controle é encontrar uma lei de controle u(t) tal que o erro de saída Conforme (Hsu et al., 2011a)[Lemma 1], a condição necessária e suficiente para a existência de W que simetriza Kp é que Kp = CB tenha autovalores positivos e reais e que sua forma de Jordan seja diagonal positiva (condição PDJ). De acordo com (Hsu et al., 2014),(Yanque et al., 2012), se Kp não satisfaz a condição de PDJ, é possível escolher um multiplicador matricial L̄ tal que L̄Kp satisfaça a condição de PDJ de maneira robusta. e(t) = y(t) − ym (t), (7) tenda a zero assintoticamente para condições iniciais arbitrárias. Quando a planta é conhecida, uma 1136 Anais do XX Congresso Brasileiro de Automática Belo Horizonte, MG, 20 a 24 de Setembro de 2014 lei de controle que obtém o casamento entre a matriz de transferência em malha fechada e M (s) é dada T por u∗ = Θ∗ ω, onde a matriz de parâmetros pode h T iT T T ∗T ser escrita como Θ∗ = Θ∗u Θ∗y Θ∗0 KΘ , com Θ∗u , Θ∗y Kronecker. A lei de adaptação do MIMO BMRAC é dada por ϑ̇ = −ϑσ − γΩξ (14) com σ dada por uma projeção 0, se ||ϑ|| < Mϑ ou σeq < 0 σ= σeq , se ||ϑ|| ≥ Mϑ e σeq ≥ 0 ∗ , Θ∗0 , KΘ ∈ IRM ×M e o vetor [ωuT ωyT y T rT ]T , ωu , ωy ∈ IRM (ν−1) M (ν−1)×M ∈ IR regressor ω = é obtido dos filtros de entrada e saída dados por: ωu = A(s)Λ−1 (s)u , ωy = A(s)Λ−1 (s)y , σeq = (8) onde A(s) = [Isν−2 Isν−3 · · · Is I]T , Λ(s) = λ(s)I e λ(s) é um polinômio mônico e estável de grau ∗T ν − 1. A condição de casamento requer que KΘ = −1 Kp . No entanto, como a planta é desconhecida, a matriz de parâmetros desejada Θ∗ também é desconhecida. Nesse caso, a seguinte lei de controle pode ser usada u(t) = ΘT (t)ω(t) (9) 4 y = H0 X (10) com Ac = A0 + B0 θ∗T Ω1 , Bc = B0 Kθ∗T = B0 Kp−1 . O modelo de referência pode ser descrito por Ẋm = Ac Xm + Bc r. Assim, o estado do erro xe = X − Xm é dado por (16) BMRAC utilizando um filtro MIMO de avanço de fase onde hTi ∈ Rn+2M (ν−1) é a i-ésima linha da matriz Ho e a segunda igualdade é obtida a partir da hipótese (A4) e da Eq. (10). O erro de grau relativo ρ = 1 corresponde a e = ξ y − ym (19) (11) Note que (Ac , Bc , H0 ) é uma realização não mínima de M (s) e assim o a equação do erro pode ser reescrita na forma entrada-saída como e = M (s)Kp [u − u∗ ] 2 O BMRAC proposto em (Yanque et al., 2012) obtém rastreamento global e exato se a planta considerada tem grau relativo uniforme n∗ = 1. Para contornar o problema do grau relativo, utiliza-se o operador (6), tal que L(s)G(s) e L(s)M (s) tenham grau relativo uniforme n∗ = 1. Para tal, define-se a seguinte saída modificada: (ρ −1) [1] [1] y1 1 + · · · + l1 ẏ1 + l0 y1 .. = ξy =L(s)y = . (ρ −1) [M ] [M ] yM M + · · · + l1 ẏM + l0 yM Pρ1 −1 [1] T (j) j=0 lj h1 Ac X .. = H̄X , (18) . PρM −1 [M ] T (j) j=0 lj hM Ac X Ẋ = Ac X + Bc Kp [u − u∗ ] + Bc r, e = H0 xe ||ϑ|| onde Mϑ > ||ϑ∗ ||. A lei de controle pode ser rescrita como u(t) = ΘT (t)ω(t) = ΩT (t)ϑ(t) (17) onde Θ é uma estimativa de Θ∗ obtida por uma lei de adaptação. Uma equação do erro pode ser obtida estendendo-se a abordagem usual do MRAC para o caso SISO para o caso MIMO (Tao, 2003; Ioannou and T Sun, 1996). Define-se o vetor X = xTp , ωuT , ωyT com a seguinte dinâmica Ẋ = A0 X + B0 u. Assim, somando e subtraindo B0 u∗ e notando que há matrizes Ω1 e Ω2 tal que ω = Ω1 X + Ω2 r, segue-se que ẋe = Ac xe + Bc Kp [u − u∗ ] , −γϑT Ωξ (15) Deve-se notar que o sinal ξy necessário para contornar o obstáculo do grau relativo não é diretamente disponível para implementação. Uma maneira de resolver este problema é estimando ξy por meio de um filtro de avanço de fase. (12) Esta é uma abordagem existente para o caso de plantas com grau relativo arbitrário uniforme (Yanque et al., 2012). A extensão para o caso de grau relativo arbitrário pode ser obtida utilizando estimativas das derivadas de y, tal que um sistema de grau relativo uniforme n∗ = 1 é gerado. A extensão do BMRAC para sistemas MIMO é usada como na proposta apresentada em (Yanque et al., 2012), adotando a seguinte parametrização: θ1 ω θ2 .. ϑ = vec(Θ) = . , Ω = Im ⊗ω = . .. ω θn (13) com Ω ∈ IRN M ×M , ϑ ∈ IRN M , onde N é o número de elementos do vetor regressor ω, θi é a i-ésima coluna da matriz de parâmetros Θ e ⊗ é o produto de ξˆl = La (s)e, La (s) = L(s)F −1 (τ s) (20) onde F (τ s) = diag{(τ s + 1)ρ1−1 , . . . , (τ s + 1)ρm−1 }. Pode-se notar que conforme τ > 0 tende a zero, ξˆl aproxima ξy . Definindo-se o erro de estimativa do filtro de avanço de fase como l = ξˆl − ξy , a respectiva dinâmica pode ser descrita como ẋε = 1 Aε xε + Bε ξ˙y , τ εl = Hε xε , (21) onde ξ˙y = H̄Ac X + H̄Bc Kp ϑ̃T Ω (ver (11) e (18)), [1] [M ] [i] Aε = block diag {Aε , . . . , Aε }, com Aε ∈ ρi −1×ρi −1 R , 1137 Anais do XX Congresso Brasileiro de Automática Belo Horizonte, MG, 20 a 24 de Setembro de 2014 [1] [M ] [i] Bε = block diag {Bε , . . . , Bε }, com Bε [1] [M ] Rρi −1×1 , Hε = block diag {Hε , . . . , Hε }, [i] com Hε ∈ R1×ρi −1 , A[i] ε [i] [i] 5 −aρi −2 1 0 ... 0 −a[i] ρi −3 .. = . [i] −a1 0 .. . 0 1 .. . 0 ... .. . 0 [i] −bρ −3 0 i .. , B [i] = .. , . ε . [i] 1 −b1 0 0 0 0 , [i] −a0 Hε[i] = [i] aj ∈ = 1 0 −1 Cρρii−1−j , 0 ... [i] ρi −1 bj = Cj+1 −bρi −2 0 [i] −b0 Cln = n!/(k!(n − k)!) com σ dada por uma projeção 0, se ||ϑ|| < Mϑ ou σeq < 0 σ= σeq , se ||ϑ|| ≥ Mϑ e σeq ≥ 0 σeq = −γϑT Ω(ē + βα ) ||ϑ|| 2 Na seção anterior, o BMRAC utilizando um filtro de avanço de fase para estimar ξy foi analisado. Pelo Teorema 2 a convergência do estado do erro é garantida apenas a um conjunto residual. Para obter um rastreamento exato, pode-se utilizar a extensão MIMO do diferenciador baseado em modos deslizantes de ordem superior (HOSM, high order sliding modes) recentemente proposto em (Levant, 2003). A ideia é empregar um RED de ordem pj = ρj − 1 para cada saída ej ∈ R, j = 1, . . . , M como se segue: [j] [j] ζ̇i = vi , Na análise de estabilidade em malha fe do sistema chada com estado z T = xTe xTε , considera-se a presença de uma perturbação de saída uniformemente limitada βα (t) de ordem τ do filtro de avanço de fase. Por projeto, βα (T ) ≤ M com M = τ KR , e KR > 0 é uma constante. Utilizando o filtro MIMO de avanço de fase, a lei de adaptação é dada por ϑ̇ = −ϑσ − γΩ(ē + βα ) Diferenciador Robusto Exato MIMO [j] [j] vi = −λi Cρ[j]j 1 pj −i+1 pj −i [j] [j] [j] p −i+1 [j] sgn(ζi −vi−1 ) ζi −vi−1 j [j] + ζi+1 , .. . [j] [j] [j] ζ̇p[j]j = −λ[j] pj Cρj sgn(ζpj − vpj ), (25) onde i = 0, . . . , pj − 1, (22) (ρj ) constante tal que |ej [j] v−1 = ej (t), [j] Cρj é uma [j] (t)| ≤ Cρj , ∀t. Se os parâme- [j] tros λi são propriamente escolhidos de forma recursiva 2 , então as igualdades são válidas em tempo finito (Levant, 2003). (23) [j] [1] [1] [1] [1] [1] ζρ1 −1 + · · · + l1 ζ1 + l0 ζ0 .. . ξˆr = . [M ] [M ] [M ] [M ] [M ] ζρM −1 + · · · + l1 ζ1 + l0 ζ0 (26) Assim, as derivadas de y podem ser usadas conforme em ξy = L(s)y. Porém, apenas a convergência local do estado do erro para zero pode ser garantida, uma (ρ ) vez que os sinais ej j (t), j = 1, . . . , M devem ser uniformemente limitados. 6 Corolário 3 Para todo R > 0, existe τ > 0 suficientemente pequeno e γ suficientemente grande tal que para algum tempo finito T , o estado do erro z(t) é levado a um conjunto invariante compacto DR := {z : ||z|| ≤ R}. BMRAC baseado no RED Global (GRED) A fim de garantir a estabilidade global e exponencial em relação a um conjunto residual e obter a convergência global do estado do erro para zero, demonstrase que o filtro MIMO de avanço de fase apresentado na Seção 4 pode ser combinado com o RED MIMO (Seção 5). O esquema de controle proposto, chamado GRED-BMRAC, é baseado em um compensador híbrido que consiste em uma combinação convexa e variante no tempo entre a estimativa dada pelo filtro MIMO (20) e a estimativa do RED MIMO (26), da (i) Corolário 4 Os sinais ej (t), i = 0,. . ., ρj , j = ∞ j = 1, . . . , m; Assim, utilizando um RED MIMO composto de M REDs de ordem ρj − 1 para cada saída ej , a seguinte estimativa de ξy pode ser obtida Teorema 2 Dada a planta (2) e o modelo de referência (3)–(5) com sinal de controle (9) e lei de adaptação (22)–(24). Suponha que as hipóteses (A1) a (A5) são satisfeitas. Se a perturbação βα (t) é uniformemente limitada por ||βα (t)|| ≤ τ KR , onde KR > 0 é uma constante, então para τ > 0 suficientemente pequeno e γ > 0 suficientemente grande, o sistema do erro em malha fechada (11), (9), (18), (21), (22)–(24) com estado z T = xTe xTε , é uniformemente globalmente exponencialmente praticamente estável (GEpS) em relação a um conjunto residual, i.e., existem constantes cz , a > 0 tal que ||z(t)|| ≤ cz e−a(t−t0 ) ||z(t0 )||+ O(τ ) + O(γ −1 ) é satisfeita ∀z(t0 ), ∀t ≥ t0 > 0. (Prova: ver Apêndice.) [j] (i) i =1, . . . , pj onde Mϑ > ||ϑ∗ ||. Neste ponto, o seguinte Teorema pode ser enunciado. 1,. . ., M são uniformemente limitados, i.e., ∃Ki (i) [j] 0 tal que |ej (t)| ≤ Ki , ∀ t ≥ t0 ≥ 0, i 0,. . ., ρj , j = 1,. . ., M . Além disso, se ||xe (t)|| (ρ ) [j] R, ∀t > T , então, ∃Cρj > 0 tal que ej[Tj,t] [j] ζ0 =ej (t); ζi = ej (t), (24) > = ≤ ≤ 2 Particularmente, [j] Cρj , j = 1, . . . , M . (Prova: ver Apêndice) [j] 1.5, λ3 1138 [j] para pj ≤ 3: λ0 [j] = 5, λ1 [j] = 3, λ2 = = 1.1. Mais detalhes são encontrados em (Levant, 2003). Anais do XX Congresso Brasileiro de Automática Belo Horizonte, MG, 20 a 24 de Setembro de 2014 seguinte forma: ξˆg = α(ν̃rl ) ξˆl + [1 − α(ν̃rl )] ξˆr , (27) onde ν̃rl = ξˆr − ξˆl é a diferença entre ambas estimativas. A função de chaveamento α(ν̃rl ) é uma modulação contínua e dependente do estado que assume valores no intervalo [0, 1] e permite que o controlador alterne de maneira suave entre os estimadores. Deve-se notar que a estabilidade global a um conjunto invariante DR é garantida independente do chaveamento entre os estimadores, uma vez que é possível mostrar que o sistema resultante é equivalente a um BMRAC com filtro MIMO de avanço de fase como uma perturbação de saída uniformemente limitada de ordem τ . Assim, estabilidade prática global e convergência ao conjunto DR são garantidas de acordo com o Teorema 2. A função de chaveamento é escolhida de maneira a garantir que, em tempo finito apenas, a estimativa do RED MIMO seja utilizada. α(·) é projetado de maneira que Especificamente, ˆ ˆ ≤ τ K : ξ − ξ g R l Figura 1: Diagrama de blocos do GRED-BMRAC conjunto residual e a estimativa do MIMO RED e todos os sinais em malha fechada são uniformemente [j] limitados. Além disso, para λi , j = 1, . . . , M , i = 0, . . . , ρj − 1, e KR propriamente escolhidos, a estimativa das derivadas do erro ξy passam a ser exatas, utilizando apenas o RED (α(·) = 0)em tempo finito. Assim, o estado do erro em malha fechada z T = xTe xTε , e portanto o erro de saída e, convergem exponencialmente para zero. (Prova: a prova segue os passos das provas de (Nunes et al., 2013)[Teorema 3], (Nunes et al., 2009)[Teorema 3]). 0, ||ν̃rl || < εM − ∆ α(ν̃rl ) = (||ν̃rl ||−εM +∆)/∆, εM −∆ ≤ ||ν̃rl || < εM 1, ||ν̃rl || ≥ εM (28) onde 0 < ∆ < εM é uma camada de transição utilizada para suavizar a função de chaveamento, e εM := τ KR onde KR é um parâmetro de projeto, escolhido tal que εM −∆ > ε̄l . Isto implica que em tempo finito apenas a estimativa do RED MIMO é utilizada (α = 0), provendo o valor exato das derivadas de ξy conforme desejado. Uma forma de ajuste os parâmetros do GRED MIMO é dada em (Nunes et al., 2013). Usando o GRED para estimar ξy a lei de adaptação é dada por ϑ̇ = −ϑσ − γΩξˆg com σ dado por uma projeção 0, se ||ϑ|| < Mϑ ou σeq < 0 σ= σeq , se ||ϑ|| ≥ Mϑ e σeq ≥ 0 σeq = −γϑT Ωξˆg ||ϑ|| 2 7 Resultados de Simulação Considera-se um sistema MIMO linear invariante no tempo descrevendo um atuador e processo dados por 10 20 0 0 1 2 3 1 −1 −0.5 0 −0.5 0 2 1 1 , A= 0 0 1 1 ; B = 0 0 16 80 0 0 0 4 0 0 0 1 (29) H =I cuja matriz de transferência é G0 (s). A planta é composta de um atuador/processo e um sensor dado pela matriz de transferência Gs (s) = diag{1/(s + 1), 1/(s + 1), 1, 1}. A matriz de transferência resultante G(s) = Gs (s)G0 (s) de u para y tem grau relativo vetorial ρ = [2, 2, 1, 1]. O modelo é escolhido como M (s) = diag{1/(s + 1)2 , 1/(s + 1)2 , 1/(s + 1), 1/(s + 1)}. Por simplicidade, escolhe-se Kp = B PDJ. Assim, com L(s) = diag {(s + 1), (s + 1), 1, 1}, a matriz de transferência correspondente L(s)M (s)KP pode ser demonstrada como sendo WSPR. Quando isto não é possível, um multiplicador passivador pode ser utilizado a partir de um Kp nominal (Hsu et al., 2011a). De acordo com a prova do teorema WASPR em (Barkana et al., 2006), pode-se concluir que um sistema WSPR mantém-se WSPR com qualquer realimentação estática de saída de ganho −k onde k é um escalar positivo. Verificouse que é possível melhorar a velocidade da convergência do erro de rastreamento ajustando-se este ganho k. (30) (31) onde Mϑ > ||ϑ∗ ||. Os resultados de estabilidade e convergência do controlador proposto são enunciados no teorema a seguir. Um diagrama de blocos da estratégia é mostrado na Fig. 1 Teorema 5 Seja a planta (2) e o modelo de referência (3)–(5) com lei de controle dada por (9) e lei de adaptação (29)–(31). A função de chaveamento α(·) é definida em (28). Supondo que as hipóteses (A1) a (A5) são válidas, para τ > 0 suficientemente pequeno e γ > 0 suficientemente grande, o sistema do erro em malha fechada, descrito por (9), (11), (18), (21), (29)–(31) é uniformemente globalmente exponencialmente praticamente estável (GEpS) em relação a um 1139 Anais do XX Congresso Brasileiro de Automática Belo Horizonte, MG, 20 a 24 de Setembro de 2014 Figura 2: Erros de rastreamento obtidos quando apenas o filtro de avanço de fase é utilizado Figura 3: Erros de rastreamento obtidos como estimador híbrido (GRED-BMRAC) O sinal de referência r(t) ∈ IR4 é escolhido como ondas quadradas com offset f (t/T ) = sqw(2t/T ) + 1 e diferentes períodos T , rT = 0.5[f (t/6); 2f (t/2); 3f (t/4); 3f (t/0.3)]. O único conhecimento prévio da planta necessário para o controle é Mϑ = 15 (de acordo com (31)) e o índice de observabilidade ν = 2. O ganho de adaptação é γ = 10. Outros parâmetros de projeto são: filtro de avanço de fase (20): τ = 0.01; RED MIMO (25)-(26): [1] [1]1/2 [1] [1] [1] λ0 = 1.5C2 , λ1 = 1.1C2 e C2 = 10; função de chaveamento (28): εM = 0.5 e ∆ = 0.2. A condição inicial da planta é y(0) = [1 1 1 1]. O restante das condições iniciais é zero. Quando apenas o filtro de avanço é utilizado, o erro tem amplitude considerável, conforme Fig. 2. Quando o diferenciador híbrido é empregado, erro nulo de rastreamento é obtido (a menos de erros de integração numérica), conforme a Fig. 3. O desempenho do rastreamento é visto na Fig. 4e pode-se ver que o chattering é evitado no controle. Finalmente, na Fig. 5 pode-se notar que a diferenciação é feita inicialmente pelos filtros de avanço de fase para em seguida chavear permanentemente para o RED MIMO em tempo finito. Deve-se notar que nas mesmas circunstâncias o sistema é instável se apenas o RED MIMO é utilizado. 8 Figura 4: Desempenho de rastreamento obtidos como estimador híbrido (GRED-BMRAC) Conclusões Este trabalho apresenta a extensão de grau relativo não-uniforme e arbitrário para o Controle Adaptativo Binário por Modelo de Referência (BMRAC). Obtémse rastreamento global e exato para plantas lineares e incertas sem a neessidade de condições restritivas de simetria no ganho de alta frequência, além de um melhor transitório em relação a técnicas convencionais do MRAC. Para contornar a restrição do grau relativo, empregou-se uma versão multivariável do Diferenciador Robusto Global e Exato (GRED), que obtém estabilidade uniforme global e prática e rastreamento exato através do chaveamento de um filtro de avanço Figura 5: a) Função de chaveamento do estimador híbrido (GRED-BMRAC) e b) sinal de controle 1140 Anais do XX Congresso Brasileiro de Automática Belo Horizonte, MG, 20 a 24 de Setembro de 2014 de fase com um estimador não linear baseado em modos deslizantes de ordem superior. O sinal de controle é contínuo e sem chattering com λ = λmin (Q)/λmax (P ). Utilizando um lema de comparação é possível mostrar que existem constantes cz , a > 0 tal que ||z(t)|| ≤ cz e−a(t−t0 ) ||z(t0 )|| + O(τ ) + O(γ −1 ) ∀z(t0 ), ∀t ≥ t0 > 0 (i) Prova do Corolário 4: É possível mostrar que ej = Apêndice (i) hT j Ac xe , i = 1, . . . , ρi − 1, j = 1, . . . , m. Uma vez que o estado do erro xe é uniformemente limitado, existem constan(i) tes tais que: |ej | ≤ Ki , ∀t ≥ t0 ≥ 0, i = 0, . . . , ρi − No que se segue, todos ki e κi são constantes positivas. Prova do Teorema 2: Considerando a seguinte candidata a função de Lyapunov, com P1 , P2 e WN simétricas e positivas definidas, e ϑ̃ = ϑ − ϑ∗ . V = xT e P 1 xe + 1 T ϑ̃ WN ϑ̃ + xT ε P2 xε γ (ρ ) 1, j = 1, . . . , M . Além disso, tem-se que ej j , j = 1, . . . , M é uniformemente limitado, uma vez que o estado do erro xe (t), e os sinais u(t) e u∗ , são uniformemente limitados. (32) Onde utilizou-se ē = ξ̂l − ym and ξy = ξ̂l + εl . Pela Eq. (18), e tendo que WN Ω = ΩW tem-se (ρj ) (ρ ) (t), j = 1, . . . , M são dados por: ej j (t) = ρ −1 ρ j j T hT Bc Kp [u(t) − u∗ ] . Note que u − u∗ = j Ac xe (t) + hj Ac T T Ω ϑ̃ = Θ̃ ω e assim, a Eq. (34) permite estabelecer que |wr | ≤ (ρ ) κ1 |xe | + κ2 , visto que Xm , r e Θ̃ são limitados. Assim ej j (t) (ρ ) pode ser majorado por ej j (t) ≤ κ3 |xe (t)| + κ4 . Uma vez (ρ ) [j] que |xe (t)| ≤ R ∀t ≥ T , as inequações ej j ≤ Cρj , j = [T ,t] 1 T σ T V̇ = −xT e Q1 xe − xε Q2 xε −2 ϑ WN ϑ̃− ϑ̃WN Ω(εl +βα ) + τ γ 1, . . . , M são válidas uma vez que a projeção garante que ϑ̃ é limitado. Os sinais ej uma vez que o sistema (11) é WSPR V̇ 1 T σ x Q2 xε − 2 ϑT WN ϑ̃ + τ ε γ ˙ (33) − 2ϑ̃WN Ω(ξy + εl + βα − ym ) + 2xT P B ε 2 ε ξy T = −xT e Q1 xe + 2eW Ω ϑ̃ − T T +2xT ε P2 Bε HAK X +2xε P2 Bε HBc Kp Ω ϑ̃ Referências Sabendo-se que ΩT ϑ̃ = Θ̃T ω, xe = X −Xm , ωr = W0 (xe+Xm ) onde ωr = [ωu ωy y]T , Θ∗r = [Θ∗u Θ∗y Θ∗0 ]T e 0 I 0 0 I W0 = 0 (34) H0 0 0 Barkana, I., Teixeira, M. C. M. and Hsu, L. (2006). Mitigation of symmetry condition in positive realness for adaptive control, Automatica 39(9): 1611–1616. tem-se 1 T σ T T T V̇ = −xT e Q1 xe − xε Q2 xε −2 ϑ WN ϑ̃−(εl +βα ) W Ω ε̃+ τ γ T T +2xT ε P2 Bε HAK xe + 2xε P2 Bε HBc Kp Ω W0 xe + T T T +2xT ε P2 Bε HBc Kp Ω W0 Xm + 2xε P2 Bε HBc Kp KΘ r O que pode ser simplificado: V̇ =− xT e Q1 xe − σ 1 T x Q2 xε − 2 ϑT WN ϑ̃− τ ε γ T +2xT ε [Q3 xe +Q4 Xm + Q5 r] Fradkov, A. L. (2003). Passification of non-square linear systems and feedback Yakubovich-Kalman-Popov lemma, European Journal of Control 6(1): 573–582. com Q3 = P2 Bε HBc Kp Θ̃T r W0 +P2 Bε HAK ; T; Q4 = P2 Bε HBc Kp Θ̃T W0 ; Q5 = P2 Bε HBc Kp KΘ T Q6 = W Θ̃T W0 ; Q7 = W KΘ Uma vez que Θ é limitado e lembrando que βα é uniformemente limitado por εM = τ KR , and ||εl || ≤ ||xe ||, Hsu, L., Battistel, A. and Nunes, E. V. L. (2014). Multivariable mrac design without gain symmetry conditions using a stabilizing multiplier, IEEE Trans. Aut. Contr. to appear. k2 ||xε ||2 +k3 ||xε || ||xe || + k4 ||xε || + τ σ −2 ϑT WN ϑ̃ + O(τ ) γ Hsu, L. and Costa, R. R. (1994). B-MRAC: Global exponential stability with a new model reference adaptive controller based on binary control theory, C-TAT - Control-Theory and Advance Technology 10(04): 649–668. Special Issue on Sliding Mode Control. Completando os quadrados e simplificando, tem-se k2 k1 k2 V̇ ≤ ||xe ||2 − ||xε || − k1 − 3 τ ||xe ||2 + 2 2τ k2 2 σ +O(τ ) − 2 λM (WN ) ϑ̃ γ Hsu, L., Teixeira, M. C. M., Costa, R. R. and Assunçao, E. (2011a). Necessary and sufficient condition for generalized passivity, passification and application to multivariable adaptive systems, Proc. of the 18th IFAC World Congress, Milan. Hsu, L., Teixeira, M. C. M., Costa, R. R. and Assunçao, E. (2011b). Necessary and sufficient condition for generalized passivity, passification and application to multivariable adaptive systems, Proc. World Congress of the International Federation of Automatic Control (IFAC). ϑT WN ϑ̃ é não-positivo, De acordo com a Eq. (15), o termo −2 σ γ visto que ϑ̃ = ϑ − ϑ∗ e Mϑ ≥ ||ϑ∗ || e assumindo que τ ≤ tem-se k1 k2 V̇ ≤ − ||xe ||2 − ||xε ||2 + O(τ ) 2 4τ Uma vez que ||ϑ|| é uniformemente limitado, obtém-se P1 0 xe V ≤ [xe xε ]T + O(γ −1 ) 0 P2 xε Charandab, B. A., Salmasi, F. R. and Sedigh, A. K. (2011). Improved dead zone modification for robust adaptive control of uncertain linear systems described by input-output models with actuator fault, IEEE Transactions on Automatic Control 56(4): 863–867. Costa, R. R., Hsu, L., Imai, A. K. and Kokotović, P. (2003). Lyapunov-based adaptive control of MIMO systems, Automatica 39(7): 1251–1257. T (εl + βα ) Q6 [xe + Xm ] + (εl + βα ) Q7 r+ V̇ ≤ −k1 ||xe ||2 − Boulkroune, A., M’Saad, M. and Chekireb, H. (2010). Design of a fuzzy adaptive controller for MIMO nonlinear time-delay systems with unknown actuator nonlinearities and unknown control direction, Information Sciences 180(24): 5041–5059. k1 k2 2 , 2k3 Imai, A. K., Costa, R. R., Hsu, L., Tao, G. and Kokotović, P. V. (2004). Multivariable adaptive control using high-frequency gain matrix factorization, IEEE Transactions on Automatic Control 49(7): 1152–1157. (35) Ioannou, P. and Sun, K. (1996). Robust Adaptive Control, Prentice Hall PTR. Tal que se pode escrever z = [xe xε ]T V − O(γ −1 ) ≤ z T P z ≤ λmax (P )z T z e V̇ − O(τ ) ≤ −z T Qz ≤ −λmin (Q)z T z e assim V̇ ≤ −λ V − O(γ −1 ) + O(τ ) (36) Levant, A. (2003). Higher-order sliding modes, differentiation and output-feedback control, Int. J. Contr. 76(09): 924–941. 1141 Anais do XX Congresso Brasileiro de Automática Belo Horizonte, MG, 20 a 24 de Setembro de 2014 Nunes, E. V. L., Hsu, L. and Lizarralde, F. (2009). Global exact tracking for uncertain systems using output-feedback sliding mode control, Transactions on Automatic Control 54(5): 1141–1147. Nunes, E. V. L., Peixoto, A. J., Oliveira, T. R. and Hsu, L. (2013). Global exact tracking for uncertain mimo linear systems by output feedback sliding mode control, Journal of the Franklin Institute . Tao, G. (2003). Adaptive Control Design and Analysis, John Wiley & Sons Inc. Xie, X.-J. (2008). Stability and robustness analysis of MIMO MRAC using Kp = L2 D2 S2 factorization, International Journal of Systems Science 39(3): 265–278. Xie, X.-J. and Li, J.-L. (2006). A robustness analysis of discretetime direct model reference adaptive control, International Journal of Control 79(10): 1196–1204. Xie, X.-J. and Zhang, Z.-Q. (2005). Robust direct model reference adaptive control using Kp = LDU factorization for multivariable plants, International Journal of Control 78(10): 762– 772. Yanque, I., Nunes, E. V. L., Costa, R. and Hsu, L. (2012). Binary mimo mrac using a passifying multiplier, 2012 American Control Conference, Montreal, pp. 1925–1930. 1142