XVIII Congresso Brasileiro de Automática / 12 a 16 Setembro 2010, Bonito-MS. TÉCNICA DE REPRESENTAÇÃO DE MODELOS LPV BASEADA NA TRANSFORMADA HAAR Leonardo Oliveira de Araújo∗, Paulo César Pellanda∗, Juraci Ferreira Galdino∗ ∗ Instituto Militar de Engenharia (IME) Rio de Janeiro, RJ, Brasil Emails: [email protected], [email protected], [email protected] Abstract— This paper proposes the use of Haar transform to systematically obtain a set of gain-scheduled LTI models that arbitrarily approximates the dynamics of a quasi-LPV or a nonlinear model. This approach is an alternative to the traditional method of modeling an LPV system in which a set of homogeneously distributed operating points is chosen a priori, without considering any information about its parameter dependence. The Haar transform is combined with an error criterion based on an appropriated system metric to yield a set of LTI models corresponding to a grid of operation subdomains. A denser grid is obtained in the regions where the system dynamics is more affected by parameter variations. The methodology helps the controller designer in specifying a set of LTI models suitable to interpolation and hence to the synthesis of gain scheduling controllers. A numerical example illustrates the advantage of the proposed approach. Keywords— Wavelet transforms, Haar transforms, LPV, quasi-LPV, nonlinear systems, control systems, linearization, gain scheduling Resumo— Este trabalho propõe o emprego da transformada Haar para a obtenção sistemática de um conjunto de modelos LTI escalonados que aproxima arbitrariamente a dinâmica de um modelo LPV ou não-linear. Essa abordagem é uma alternativa ao método tradicional de modelagem de um sistema LPV em que um conjunto de pontos de operação distribuı́dos uniformemente é escolhido a priori, sem considerar qualquer informação sobre sua dependência paramétrica. Uma combinação da transformada Haar com um critério de erro baseado em uma métrica apropriada de sistema é usada para fornecer um conjunto de modelos LTI que corresponde a uma grade de subdomı́nios de operação. Uma grade mais densa é obtida nas regiões onde a dinâmica do sistema é mais afetada por variações paramétricas. A metodologia ajuda o projetista de controle na especificação de um conjunto de modelos LTI propı́cio para a interpolação e, consequentemente, para a sı́ntese de controladores escalonados. Um exemplo numérico ilustra a vantagem do método proposto. Palavras-chave— Transformadas wavelet, transformada Haar, LPV, quasi-LPV, sistemas não-lineares, sistemas de controle, linearização, escalonamento de ganhos 1 Introdução uma caracterı́stica favorável que é a adaptação em tempo real do seu comportamento dinâmico, segundo a evolução dos parâmetros (endógenos ou exógenos) que caracterizam as condições de funcionamento do sistema. Essas técnicas ampliam o alcance dos métodos clássicos de controle robusto LTI que consideram somente as caracterı́sticas lineares locais e condições particulares de funcionamento do sistema. Este benefı́cio da estratégia de controle por escalonamento de ganhos é uma consequência da explı́cita utilização de informações adicionais importantes oriundas da medida dos parâmetros variantes. O sucesso das técnicas de controle depende do emprego de um modelo matemático que represente adequadamente a dinâmica da planta a ser controlada. Devido à maior simplicidade de análise e de sı́ntese, os modelos lineares receberam grande atenção para aplicação na área de controle. Em razão disso, uma vasta gama de técnicas e um amplo arcabouço teórico foram desenvolvidos nesta área ao longo do tempo. No entanto, as dinâmicas reais tratadas pela engenharia de controle apresentarem, em sua grande maioria, comportamentos não-lineares, ou lineares variantes no tempo (ou Linear a Parâmetro Variante, LPV). Isso motiva o desenvolvimento de novas técnicas e estudos de estabilidade e desempenho. Tradicionalmente, o controle de sistemas nãoestacionários é realizado pelo uso de técnicas de escalonamento de ganhos (ou interpolação de controladores), cujo objetivo é controlar um sistema que evolui num amplo domı́nio de funcionamento, para o qual as técnicas de controle robusto Linear Invariante no Tempo (ou Linear a Tempo Invariante, LTI) se mostram ineficazes. Além da propriedade de robustez em relação às incertezas do sistema, os controladores interpolados possuem O desenvolvimento de novos métodos de interpolação de controladores tem despertado grande interesse na comunidade cientı́fica. Contudo, os métodos mais utilizados no meio industrial são os denominados “clássicos”, “convencionais” ou “tradicionais”. Eles se baseiam em um conjunto de modelos LTI obtidos pela linearização de um modelo não-linear em torno de uma famı́lia de pontos de operação ou a partir do “congelamento” do parâmetro variante de um modelo originalmente LPV [1 - 5]. Um conjunto de técnicas de controle linear (LQG, PRLQG, H2 , H∞ , sı́ntese µ, etc.) é, então, disponı́vel para o projeto de uma famı́lia de controladores LTI que oferecem um compromisso 3197 XVIII Congresso Brasileiro de Automática / 12 a 16 Setembro 2010, Bonito-MS. razoável entre desempenho e robustez em torno das condições de funcionamento consideradas. Apesar dos desenvolvimentos teóricos recentes, alguns problemas relevantes ainda persistem. Uma dificuldade destacável reside no fato de que, em geral, o comportamento dinâmico dos controladores interpolados depende fortemente da estrutura ou das representações de estado adotadas para a famı́lia de controladores lineares projetados sobre um conjunto de pontos de operação e também dos seus coeficientes variantes. Nesse sentido, uma questão importante é a definição dos pontos de operação sob a ótica da interpolação. Na busca de ferramentas matemáticas apropriadas para contribuir na obtenção de resposta para essa questão, a Transformada Haar mostra um potencial ainda inexplorado. O emprego da Transformada Wavelet Discreta (DWT, do inglês Discrete Wavelet Transform) neste trabalho difere daqueles encontrado na recente literatura que emprega esta transformada na área de controle. Dentre as publicações pesquisadas que empregam a DWT na área de controle, observa-se o uso na identificação não-paramétrica de modelos, em controle adaptativo e em redes neurais [6 - 9]. Este trabalho propõe uma forma alternativa de linearização de sistemas LPV, baseada em subdomı́nios de operação, em substituição ao conceito tradicional de pontos de operação. A aplicação da Transformada Haar possibilita a obtenção sistematizada de um conjunto de modelos LTI que aproxima a dinâmica do modelo original LPV tanto quanto o projetista necessitar (e os recursos computacionais permitirem). Nessa aproximação do sistema não-estacionário, é possı́vel verificar quais modelos LTI devem ser considerados por ocasião da sı́ntese do conjunto de controladores a ser usado em uma estratégia de interpolação. O restante deste trabalho é organizado da seguinte maneira: na Seção 2, o problema é contextualizado; uma revisão dos conceitos básicos de Transformada Wavelet Discreta é apresentada na Seção 3; a Seção 4 introduz uma nova sistemática de modelagem de sistemas LPV; a Seção 5 ilustra numericamente a metodologia; a Seção 6 conclui. 2 algébrica, da seguinte forma [10]: ẋ(t) = A (θ) x(t) + B (θ) u(t) y(t) = C (θ) x(t) + D (θ) u(t) (1) As funções reais que formam os elementos das matrizes A(θ), B(θ), C(θ) e D(θ) pertencem à L2 (R) . Essas matrizes são de dimensões compatı́veis com as dimensões dos sinais de entrada e saı́da e definem completamente a dinâmica do sistema. As matrizes têm caracterı́stica não-estacionária originada pela variável θ. Este vetor de parâmetros pode ser desdobrado em duas componentes θ = [θx θp ]T : θx = θx (x(t)) ∈ Rr1 é uma variável endógena, ou seja, que depende da dinâmica interna do sistema; θp = θp (t) ∈ Rr2 é um parâmetro exógeno, ou seja, que evolui no tempo de forma independente da dinâmica interna do sistema. A presença de θx caracteriza o modelo denominado de quasi-LPV. As dependências em relação ao tempo serão suprimidas no restante do texto por simplicidade. No domı́nio θ ≤ θ ≤ θ, no qual um sistema LPV ou quasi-LPV é definido, busca-se: 1. uma forma sistematizada de obter modelo LTI que aproximam o modelo LPV para uma ou mais partições do domı́nio de θ; 2. mensurar a diferença entre a aproximação calculada e o modelo original; e 3. identificar abruptas variações paramétricas e usar esta caracterı́stica para selecionar pontos de operação que tenham maior relevância na aproximação da dinâmica nãoestacionária original, disponibilizando esta informação para a sı́ntese de controladores. Do exposto, pretende-se obter um conjunto de modelos LTI que represente a dinâmica LPV, em malha aberta, de forma mais precisa. A sı́ntese da famı́lia de controladores pode, então, ser calculada com base no conjunto LTI obtido. Na sı́ntese de controladores dentro da técnica de escalonamento clássico de ganhos, a primeira etapa corresponde à obtenção de uma descrição linear aproximada do sistema descrito na Eq 1 que envolve um conjunto conveniente das variáveis de interpolação θ(t) ∈ Rr (r = r1 + r2 ). A maneira mais utilizada na prática consiste em: Contextualização do Problema Uma classe importante de sistemas dinâmicos nãoestacionários pode ser representada por um conjunto de equações diferenciais não-lineares de ordem qualquer. Por meio de escolha apropriada dos vetores das variáveis de estado x(t) ∈ Rn , de entrada u(t) ∈ Rm e de saı́da y(t) ∈ Rp , pode-se frequentemente obter um modelo não-linear em relação aos estados, mas linear em relação à entrada, que implique em uma equação matricial diferencial de primeira ordem e uma equação matricial obter, via linearização Jacobiana clássica do modelo (Eq 1) em torno de um conjunto de (k) (k) pontos de equilı́brio x0 (u0 ), k = 1, 2, ..., uma famı́lia de modelos linearizados. definir uma trajetória nominal de x0 (t) para o sistema e, supondo que θx (t) e dθx (t)/dt 3198 XVIII Congresso Brasileiro de Automática / 12 a 16 Setembro 2010, Bonito-MS. são limitadas e independentes de x0 (t) e dx0 (t)/dt, derivar um modelo do tipo LPV onde o parâmetro e sua taxa de variação evoluem em domı́nios compactos, θ(t) ∈ DΘ ⊂ Rr , θ̇(t) ∈ DΘd ⊂ Rr , ∀t; e Wi = span{ψi,j , i, j ∈ Z} ϕ(x)j e ψ(x)i,j são bases que, para qualquer inteiro positivo i, são obtidas pelas definições: ϕ(x)i,j = 2i/2 ϕ(x − j) ψi,j (x) = 2i/2 ψ(2i x − j) eventualmente, escolher uma trajetória θ(t) ←− θ0 (t) ou “congelar” o parâmetro em um ponto dado θ(t) ←− θ0 (t), para obter, respectivamente, um modelo linear variante no tempo (LTV) ou LTI. Nos dois últimos casos, certos estados, ou funções dos estados, são classificados como variáveis exógenas em certas partes do modelo, enquanto que em outras permanecem como variáveis endógenas. Esta hipótese leva a um certo conservadorismo, mais ou menos importante, na etapa de sı́ntese dos controladores 1 . Nesse caso particular, o modelo é denominado quasi-LPV. Enfim, um sistema pode ainda ser, pela sua própria natureza, LPV e nenhuma aproximação ou linearização suplementar é necessária para construir o modelo da Eq (1). O modelo LPV ou quasi-LPV tolera uma dependência paramétrica bastante geral, que engloba a maior parte das situações práticas. Esta propriedade requer a utilização e o desenvolvimento de metodologias sofisticadas e complexas de análise e sı́ntese de leis de controle por escalonamento de ganho. Transformada Wavelet Discreta A DWT representa funções (sinais) quadraticamente integráveis - f (x) ∈ L2 (R) - da seguinte forma: f (x) = i 2∑ −1 j I 2∑ −1 ∑ (5) A função ϕ é denominada de Wavelet Pai e a função ψ é denominada de Wavelet Mãe. Os espaços funcionais gerados⊕possuem as seguinte caracterı́sticas: Vi+1 = Vi Wi ; Wi ⊥Wk , se k ̸= i; e Wi ⊂ Vk , se k > i Para qualquer i ∈ Z, o espaço funcional Wi é definido como o complemento ortogonal de Vi em relação a Vi+1 . Quando I = ∞, as bases ϕ(x)j e ψ(x)i,j geram L2 (R). Os coeficientes da DWT são obtidos pelo produto interno da função projetada com a função base, ou seja: vj = ⟨ϕ(x)j , f (x)⟩ e wij = ⟨ψ(x)ij , f (x)⟩. A cada nova projeção em Wi somada à projeção em Vi , detalhes mais refinados são acrescentados à representação da função f (x) (Eq 2). Este processo seqüencial é denominado de multirresolução [11]. O truncamento do limitante superior I do primeiro somatório da segunda parcela na Eq 2 resulta em um erro de aproximação tanto maior quanto menor for esse limitante. A DWT respeita o Teorema de Parseval. Há abordagem para sistemas multidimensionais. Estes dois aspectos podem ser estudados em [11]. A concentração da energia do sinal nos coeficientes de resoluções mais baixas é outra propriedade marcante da DWT. Há um amplo conjunto de bases Wavelets disponibilizadas. Neste trabalho a base Haar é a utilizada. Esta base é constituida por constantes, ou constantes por partes: a função Pai é uma constante e a função Mãe é constante por partes (Fig 1). Assim, todas as demais bases Haar geradoras dos subespaços Wij , por guardarem as caracterı́sticas da função Mãe, são também constantes por partes. Uma conseqüência desta propriedade é que, no processo de sı́ntese de funções, a base Haar possibilita a obtenção de funções constantes por partes. escolher convenientemente a função θx (x(t)) de forma a reescrever o modelo numa forma onde os termos não-lineares possam ser redefinidos por um parâmetro variante unicamente em função do tempo θx (t). De forma análoga ao caso anterior, considera-se que as trajetórias desse parâmetro são limitadas e independentes das trajetórias de x(t), o que desconecta as funções matriciais A, B, C e D das variáveis de estado. 3 (4) i vj ϕ(x)i + i∈Z wij ψ(x)ij 4 (2) j Modelagem Proposta Considere um sistema não-linear de múltiplas entrada e múltiplas saı́das representado pela Eq 1. Se o parâmetro θ ∈ Rr origina equações do tipo f (θ) : Rr −→ R, com domı́nio D, f (θ) ∈ L2 (R), pode-se aplicar a DWT à f (θ) (Eq 2). Estendendo-se a aplicação da DWT ao sistema apresentado, tem-se um modelo MΣ(I) que pode ser representado genericamente por: em que vj e wij são os coeficientes Wavelets, ϕ(x)i são bases do espaço V0 e ψ(x)i,j são bases do espaço Wij . Os espaços Vj e Wi são gerados da seguinte forma: Vj = span{ϕj , j ∈ Z} (3) 1 O conservadorismo introduzido pela modelagem denominada quasi-LPV é tão menos desprezı́vel quanto maior o número de estados implicados no parâmetro. ẋ = (A0 + AΣ(I) )x + (B0 + BΣ(I) )u y = (C0 + CΣ(I) )x + (D0 + DΣ(I) )u 3199 (6) XVIII Congresso Brasileiro de Automática / 12 a 16 Setembro 2010, Bonito-MS. mas LTI: Base Haar Pai . nik = ∥MΣ((i+1)j)k − MΣ(ij)k ∥ 1 (8) 0.5 em que k = {0, 1, ..., (2i+1 −1)} representa um dos dois subdomı́nios em que as bases dos subespaços W(i+1)j são não nulos2 . O uso da norma induzida também se justifica por melhor representar a diferença da dinâmica da saı́da dos sistemas, entre os dois diferentes nı́veis, em relação a uma métrica que considere as simples diferenças das respectivas matrizes de estado. Para um nı́vel de resolução suficientemente elevado, pode-se agrupar subdomı́nios (usando, por exemplo, o valor médio deles) em um novo subdomı́nio que contenha seus geradores. Neste processo, subdomı́nios subseqüentes são reunidos até que o novo modelo (médio) local esteja no limite da distância máxima do modelo vizinho, segundo uma norma definida previamente. Esse e i , lineares por parprocedimento produz espaços V tes, diferentes daqueles gerados pela base Haar. 0 −0.5 0 0.5 1 1.5 1 1.5 Variável Base Haar Mãe 1 0 −1 −0.5 0 0.5 Variável Figura 1: Perfil das funções da base Haar. em que A0 , B0 , C0 , D0 e AΣ(I) , BΣ(I) , CΣ(I) , DΣ(I) são as construções dos elementos das matrizes A, B, C e D, respectivamente, pela Wavelet Pai (Eq 3) e pelas Wavelets propriamente ditas (Eq 4). Desta forma, AΣ(I) = ∑I ∑2i −1 i=0 j=0 Ai,j ψ(θ)i,j , em que a matriz Ai,j é composta pelos coeficientes resultantes da aplicação da DWT em cada um dos elementos que compõem a matriz original A. Por analogia, tem-se a descrição das demais matrizes. A representação por meio da Eq 6 - definido aqui como o sistema MΣ(I) - permite arbitrar a diferença entre as dinâmicas deste e do modelo da Eq 1 - M(θ, t). Note que: M(θ, t) = MΣ(I) + E(θ, t) 4.2 Admitindo-se que o erro da aproximação (Eq 7) reduz-se exponencialmente com o aumento do nı́vel de resolução, pode-se definir um supremo deste erro da seguinte maneira: N I+1 = (7) ∞ ∑ c1 e−c2 i ≥ ∥E(θ, t)∥ (9) i=I+1 O erro E(θ, t), pelas propriedades das Wavelets, tende a zero quanto i → ∞ (Eq 2). 4.1 Definição da resolução máxima I em que os coeficientes c1 e c2 são positivos e pertencem ao conjunto dos reais. A função exponencial é ajustada de forma que para cada nı́vel i ∞ ∑ Análise para modelos tipo Haar A modelagem propiciada pela base Haar nos elementos das matrizes A, B, C e D (Eq 1) permite a obtenção de matrizes A0 , B0 , C0 , D0 e AΣ(I) , BΣ(I) , CΣ(I) , DΣ(I) que são formadas por elementos constantes em subdomı́nios caracterı́sticos (definidos pelo ı́ndice i), obtendo, assim, a linearização do sistema em intervalos do domı́nio (ou em subdomı́nios). Este procedimento tem a vantagem de poder associar um erro entre o sistema LPV original e o conjunto de modelos LTI obtidos. Este erro pode ser reduzido com ao aumento da quantidade de nı́veis somados à aproximação. Devido as funções que caracterizam as matrizes originais do sistema não-estacionário descrito pela Eq 1 poderem ser diferentes, inclusive com componentes frequenciais diversos, obter uma métrica indicativa do quanto cada aproximação representa em relação ao comportamento geral do modelo tem aplicações. Por estar se tratando de um conjunto LTI, calcular a contribuição dessa nova aproximação (W(i+1)j ) apresenta relativa facilidade se utilizada a norma induzida para siste- i=I+1 c1 e−c2 i = max{nik } = g(i) k (10) O supremo N I+1 permite o controle do truncamento do modelo da aproximação. Este valor pode ser obtido analiticamente ou seguindo o procedimento computacional proposto. 1. IM é um nı́vel resolução que se pode considerar o erro de aproximação entre o modelo proposto e o sistema original nulo3 . Aplicar a DWT (base Haar) às matrizes A, B, C e D obtendo os coeficientes Wavelets. 2. Obter a projeção das funções que compõem A, B, C e D no subespaço V0 e, em conseqüência, a aproximação M0 . Também calcular MΣ(00) (modelagem do sistema no subespaço V1 ). 3. Selecionar o maior dentre o conjunto n0k . 2 Cada ı́ndice j (Eq 5) implicar em dois subdomı́nios em Vi+1 . No exemplo dado pela Fig 1, a soma das funções forma uma base de V1 , que apresenta dois subdomı́nios. 3M ∼ Σ(IM ) = M(θ, t). 3200 XVIII Congresso Brasileiro de Automática / 12 a 16 Setembro 2010, Bonito-MS. 4. Repetir os passos 2 e 3, obtendo {MΣ(0) , MΣ(00) , ...MΣ(IM j) } e {g(0), g(1), ...g(IM )}. Utilizar este conjunto para ajustar os coeficientes c1 e c2 (Eq 10). No cálculo, usar os elementos de ı́ndices mais elevados. em que T r(.) é o operador traço para matrizes. O limitante superior υ do sistema e é a norma H2 e a função υ(θ) = υθ estabelece um limitante do tipo H2 para cada valor do parâmetro θ. A função υθ pode ser construı́da nı́vel a nı́vel através da análise proporcionada pela transformada Haar de forma prática, usando-se somente ferramentas que trabalham com sistemas LTI e o conceito da DWT. 5. Usando a Eq 9 (uma progressão geométrica) e os requisitos do projeto, definir o ı́ndice I considerado suficiente (erro admissı́vel). 4.3 1. Calcular ∥M0 ∥2 = n̄0 . Quando usar a modelagem Haar? 2. Usa-se Eq 8 (particularizada à norma 2) para se obter os elementos nik . Em, pelo menos, dois processos de sı́ntese de controladores o projetista pode tirar proveito do estudo aqui proposto. O primeiro é quando a planta apresentar ampla variação (ou aleatoriedade) de pontos de operação: a definição de subdomı́nios de operações pode ser útil. A transformada Haar fornece, no subespaço Vi , médias da função original em tantos subdomı́nios quanto se necessite. Além disso, como já mencionado (na seção 4.1), pode-se obter e i ). subdomı́nios de tamanhos variados (V O segundo é no caso de sistemas cujos controladores posam ser sintetizados com base em pontos de operação previamente definidos pelo projetista. A análise dos elementos nik passa a ser uma ferramenta que permite selecionar os pontos de operação dominantes em um subdomı́nio. Ou seja, para um número previamente definido de pontos de operação, a análise de nik possibilita encontrar um conjunto destes pontos que reduz uma função custo. Esta função é definida como: ∑p ∫ T 2 i=1 0 [ŷ(t)i − yi ] dt (11) ∑p ∫ T 2 i=1 0 [y(t)i ] dt 3. Analisar se cada valor de nik aumenta ou diminui a norma geral do sistema: basta verificar qual dos modelos da subtração (Eq 8) possui maior norma H2 . Se nik representar um decréscimo4 , multiplica-se este elemento por −1. Para distinguir este novo conjunto, seus elementos serão tratados como n̄ik . O conjunto de n̄ik pode ser organizado na forma de um vetor composto pela norma H2 de M0 , seguido pelas contribuições (em termos de norma H2 ) de: MΣ(00) , MΣ(10) , ... MΣ(I(2I −1)) . Observe que cada modelo implica em dois subdomı́nios de contribuições5 . Assim, o conjunto formado por n̄ik tem: 1+2+4+8+...+2I+1 = 2I+2 −1 elementos. Este vetor proporciona a construção de uma função de θ que é a projeção de υθ num espaço V̄I constante por partes. Ou seja: n̄ik ϕ(θ)ik (14) i=0 k=0 A Eq 14 é descrita nos molde da Eq 2 (quando ϕ(θ)ik = 1). Como a resolução I é considerada suficientemente grande, é possı́vel tomar o valor da derivada pela aproximação de Euler (∆θ muito pequeno): em que ŷi ∈ R é a estimativa da saı́da yi ∈ R obtida pela aproximação dada pela Eq 6 para uma determinada resolução. Como a função custo escolhida é quadrática, buscam-se valores absolutos mı́nimos para qualquer ŷi − yi . Ou seja, objetiva-se minimizar: ∥Ẽ(θ, t)∥2 = ∥M(θ, t) − M̂(θ, t)∥2 I 2∑ ∑ (i+1) υθ ∼ = ∂υθ ∼ υθ+∆θ − υθ = ∂θ ∆θ (12) (15) Um sistema obtido pela interpolação normalizada do tipo: em que M̂(θ, t) é um sistema LPV, que aproxima o original, obtido via interpolação de sistemas LTI originados em pontos de operação de M(θ, t) a serem determinados. Mθ̂ = [1 − f (θ̂)]Ma + f (θ̂)Mb (16) tem sua variação em função de θ̂ dada por: 4.4 Seleção de pontos de operação ∂Mθ̂ = lim∆θ̂→0 { ∂ θ̂ [1−f (θ̂+∆θ̂)]Ma +f (θ̂+∆θ̂)Mb −[1−f (θ̂)]Ma −f (θ̂)Mb } ∆θ̂ É possı́vel minimizar a função custo usando interpolação de modelos LTI sem a necessidade de simulações. Isto é possı́vel ao se relacionar os elementos nik a pontos do domı́nio de θ pela técnica aqui apresentada. Define-se a função ganho υ(θ), com υ(θ)max = υ, tal que: P(θ) = P ∈ Rn×n , P = PT ≻ 0 Ṗ + AP + PAT + CT C ≺ 0 T r(BT PB) < υ(θ) ≤ υ (17) o que implica em ∂Mθ̂ ∂ θ̂ b −Ma ) = lim∆θ̂→0 [f (θ̂+∆θ̂)−f∆(θ̂)](M = θ̂ (Mb − Ma ) ∂f∂(θ̂θ̂) (18) (13) 4 ∥M Σ(i+1)ik ∥2 < ∥MΣ(ij)ik ∥2 5 Advindos do acréscimo proporcionado 3201 por Wi . XVIII Congresso Brasileiro de Automática / 12 a 16 Setembro 2010, Bonito-MS. Logo: ∂f (θ̂) ∂Mθ̂ ∥Mb − Ma ∥2 ∂ θ̂ = ∂ θ̂ 2 2 (19) O cálculo da norma H2 do sistema Mθ̂ (Eq 16) não leva a uma expressão tão simples. Voltando ao problema indicado pela Eq 12, tem-se que: ∂MΣ(∞) ∂M(θ, t) = ∂θ ∂θ (20) Ao se truncar MΣ(∞) , fazendo i = I, obtémse a aproximação: M(θ, t) = MΣ(∞) → ∂M(θ, t) ∼ ∂MΣ(I) = ∂θ ∂θ Figura 3: Função que majora o ganho médio quadrático do sistema LPV (Eq 13). São considerados dois vetores aleatórios de entrada (pertencentes a R2 ) independentes os quais são apresentados na Fig 2. O vetor Entrada 1 é constituı́do por um degrau unitário deslocado de 0, 5 segundo e um degrau com amplitude de −0, 5. O vetor Entrada 2 é constituı́do por um degrau com amplitude de −2 e um degrau unitário deslocado de 2 segundos. (21) Com isto, tem-se o cálculo de υθ (Eq 14) e sua derivada parcial (Eq 15) proporcionado pelo nı́vel de resolução I. A análise da curva obtida pela Eq 15 é que vai permitir a seleção dos pontos de operação que minimizam o critério (Eq 12). Nestes pontos, a aproximação M̂(θ, t) é idêntica ao sistema original. Assim, minimizar: ∂∥Ẽ(θ, t)∥2 ∂∥[M(θ, t) − M̂(θ, t)]∥2 = ∂θ ∂θ (22) é obter a minimização do erro6 descrito na Eq 12. A minimização desse erro é obtida ao se analisar quais pontos da função dada pela Eq 15 permitem a interpolação proposta na Eq 16, de forma que as curvas originadas por funções do tipo ∂f (θ)/∂θ - pelo resultado expresso na Eq 19 - interliguem estes pontos de maneira a aproximar a curva7 descrita pela Eq 15. 5 Figura 2: Entradas aplicadas ao sistema LPV. Exemplo A técnica apresentada de seleção de pontos de operação é comparada à tradicional: uso da partição do domı́nio paramétrico de forma uniforme. Os modelos interpolados linearmente foram contruı́dos com base em 5, 7, 10 e 17 pontos do sistema original. Para os modelos tradicionais, o domı́nio considerado foi de 0 ≤ t ≤ 7, 2 segundos (para definir o valor final, simulações são necessárias). Para calcular os modelos MΣ , as funções f (t)1 e f (t)2 foram amostradas em 512 pontos, uniformemente distribuı́dos, no domı́nio 0 ≤ t ≤ 2π segundos (∆t = 2π/511). A aproximação da função υt (Eq 14), segundo a técnica proposta, é apresentada na Fig 3. Da análise deste gráfico, verifica-se que a escolha de t = 7, 2 segundos como limite superior para a distribuição uniforme do modelo tradicional é observado sem necessidade de simulações (há poucas variações em υt ). A aproximação de Euler para a derivada de υt (Eq 15), multiplicada por uma constante e decimada, é fornecida naturalmente pelos coeficientes Dado o sistema LPV hipotético parametrizado em t, (θ = t): [ ] −1 − 1, 3f (t)1 0, 5 − 20f (t)1 A= −1 + 2f (t)1 −2 − 10f (t)2 [ ] 1 + 2, 2f (t)1 −4 + 0, 5f (t)2 B= −1 − 6f (t)1 −1 − 5f (t)2 [ ] [ ] 1 0 0 0 C= , D= 0 1 0 0 em que: f (t)1 = 0, 5 + e−0,5t [0, 5t + cos(0, 3t2 )]/2 2 e f (t)2 = 0, 5 + 2−(t−3) sen(0, 3t2 − 9). O sistema é LPV, conforme descrito pela Eq 1. 6 Os sistemas LTI que se somariam aos resultados das integrações em θ, que conduz à implicação reversa na Eq 20, são nulos. 7 Ao se utilizar uma função de interpolação f (θ) de segundo grau, tem-se que a curva de sua derivada será formada por rampas. Neste caso, ao se ajustar rampas que se aproximam do perfil descrito pela função obtida na Eq 15, está também se aproximando M̂(θ, t), descrita conforme a Eq 16, de M(θ, t). 3202 XVIII Congresso Brasileiro de Automática / 12 a 16 Setembro 2010, Bonito-MS. da Transformada Haar no nı́vel de resolução I − 1 (no nı́vel I, os coeficientes são nulos). Este mapeamento é suficiente para definir os pontos de interesse8 , visto que o objetivo é estabelecer rampas que acompanhem a derivada de υt . A Fig 4 traz os coeficientes do nı́vel 8 da DWT aplicada à υt . Esta é a curva base para definir os pontos de operação de interesse. A Tab 1 contém os 17 pontos de operação utilizados no modelo proposto elaborado com o número máximo de pontos selecionados (tomando como base a Fig 4). Note que os modelos que usaram mais densidades de pontos em relação aos modelos que usaram uma densidade menor aproveita integralmente todos os pontos selecionados anteriormente (o que não ocorre, necessariamente, com a aproximação interpolada tradicional). As Fig 5, 6 e 7 apresentam o primeiro elemento do vetor das saı́das (y1 = x1 ) para o vetor Entrada 1 aplicado: à planta LPV (linhas cheias), ao modelo de pontos selecionados (linhas pontilhadas) e ao modelo tradicional (linhas tracejadas). As Tab 2 e Tab 3 apresentam os valores dos erros, segundo o expresso pela Eq 11, por saı́da, para cada vetor de entradas, respectivamente, Entrada 1 e Entrada 2 (Fig 2). Nestas tabelas, QP é quantidade de pontos de operação, Sd é a saı́da (1º ou 2º elemento do vetor y), Erro SP é o erro apresentado na aproximação via seleção de pontos e Erro PU é o erro apresentado na aproximação com pontos de operação uniformemente distribuı́dos (tradicional). Razão é o quociente da divisão (Erro PU)/(Erro SP). Figura 4: Coeficientes do oitavo nı́vel da Transformada Haar aplicada à υt . Figura 5: Estado 1, com 5 pontos de operação. Tabela 1: Pontos selecionados e sua ordenação para cada modelo simulado. Pontos (s) SP 5 SP 7 SP 10 SP 17 0 t1 t1 t1 t1 0,88538 t2 t2 0,98370 t3 1,47550 t2 t3 t4 2,16400 t2 t3 t4 t5 2,26240 t6 2,55757 t3 t4 t5 t7 2,65590 t8 3,22000 t5 t6 t9 3,44280 t10 3,54120 t11 4,22978 t4 t6 t7 t12 4,62320 t13 4,72163 t14 4,96900 t8 t15 5,95500 t9 t16 7,20000 t5 t7 t10 t17 Figura 6: Estado 1, com 10 pontos de operação. Legenda: SP “n” = seleção de “n” pontos de operação. Verifica-se que os resultados obtidos com a Figura 7: Estado 1, com 17 pontos de operação. 8A multiplicação por uma constante não altera o perfil, a forma, genérica da curva. 3203 XVIII Congresso Brasileiro de Automática / 12 a 16 Setembro 2010, Bonito-MS. Tabela 2: Erros para QP Sd Erro SP 5 1 0,01404 5 2 0,07233 7 1 0,00274 7 2 0,01853 10 1 0,00164 10 2 0,01398 17 1 0,00036 17 2 0,00290 Tabela 3: Erros para QP Sd Erro SP 5 1 0,01222 5 2 0,05457 7 1 0,00264 7 2 0,01636 10 1 0,00152 10 2 0,01216 17 1 0,00033 17 2 0,00249 cesso automatizado para a seleção de pontos de operação, o qual se baseia no procedimento heurı́stico aqui apresentado. Para uma evidência numérica mais abrangente, a aplicação de entradas aleatórias sorteadas (dentro de limites de amplitudes estabelecidas previamente) para a geração de uma seqüencia maciça de custos, também está em estudo. o vetor Entrada 1. Erro PU Razão 0,06304 4,49 0,31436 4,35 0,00555 2,02 0,03709 2,00 0,00657 4,01 0,04241 3,03 0,00156 4,33 0,01045 3,60 Referências [1] R. A. Hyde, and K. Glover (1993). The Application of Scheduled H∞ Controllers to a VSTOL Aircraft, IEEE Trans. Automat. Contr. 38(7):1021-39. o vetor Entrada 2. Erro PU Razão 0,05806 4,75 0,27442 5,03 0,00535 2,03 0,03389 2,07 0,00621 4,09 0,03833 3,15 0,00141 4,27 0,00886 3,56 [2] D. A. Lawrence, W. J. Rugh (1995). Gain Scheduling Dynamic Linear Controllers for a Nonlinear Plant, Automatica, 31(3):381-390. [3] R. A. Nichols, R. T. Reichert, W. J. Rugh (1993). Gain Scheduling for H∞ Controllers: a Flight Control Example, IEEE Trans. Contr. Systems Technology, 1(2):69-79. [4] W. J. Rugh (1991). Analytical Framework for Gain Scheduling, IEEE Contr. Syst. Magazine, 11(2):79-84. técnica proposta reduziram consideravelmente a função custo em relação a metodologia tradicional. As Tab 2 e Tab 3 contém, respectivamente, os resultados em que a metodologia apresentada proporciona a maior e a menor razão entre os valores das funções custos obtidos nas simulações. A redução deste erro foi de 50% a 80% favoravelmente à modelagem objeto deste estudo. 6 [5] J. S. Shamma, M. Athans (1990). Analysis of Gain Scheduled Control for Nonlinear Plants, IEEE Trans. Automat. Contr., 35(8): 898907. [6] N. Sureshbabu e J. A. Farrell (1999). WavetBased System Identification for Nonlinear Control, IEEE Transactions on Automatic Control, vol 44, Nº 2. Conclusão Neste artigo, foi mostrado como utilizar a Transformada Haar para linearizar modelos nãoestacionários e para obter um limite superior do erro entre o sistema original e o modelo proposto. Além disto, o modelo estudado permite um critério de seleção dos pontos de operação para o emprego em aproximações que usam interpolação de modelos LTI. Embora a técnica proposta apresente uma implementação computacional de complexidade mais elevada em relação à tradicional, ela evidencia vantagens verificadas no exemplo simples discutido, como, por exemplo: para um mesmo número de pontos de interpolação, a função custo resulta em um valor menor; e caso se fixe um custo máximo, este é respeitado mesmo empregando uma quantidade menor de modelos interpolados. O procedimento para o ajuste dos pontos de operação é heurı́stico, mas não requer simulações. Uma aplicação de interesse a ser explorada é o uso desta aproximação para sı́ntese de controladores LPV politópicos. Como continuação deste trabalho, os autores estão investigando o desenvolvimento de um pro- [7] J. Xu, R. Yan e W. Wang (2007). On Learning Wavelet Control for Affine Nonlinear Systems American Control Conference. [8] Z. Hasiewicz, M. Pawlak e P. Sliwinski (2005). Nonparametric Identification of Nonlinearities in Block-Oriented Systems by Orthogonal Wavelet With Compact Support IEEE Transactions on Circuits and Systems, Vol 52, Nº 2. [9] S. A. Billings e H. Wei (2005). A New Class of Wavelet Networks for Nonlinear System Identification IEEE Transactions on Neural Networks, Vol. 16, Nº 4. [10] P. C. Pellanda (2001). Commande Systèmes Instationnaires: Séquencement Compensateurs et Commande LPV Tese Doutorado, École Nationale Supérieure l’Aéronautique et de l’Espace, França. de de de de [11] S. Mallat (2009). A Wavelet Tour of Signal Processing - Third Ed., Elsevier. 3204