XVIII Congresso Brasileiro de Automática / 12 a 16 Setembro 2010, Bonito-MS.
TÉCNICA DE REPRESENTAÇÃO DE MODELOS LPV BASEADA NA
TRANSFORMADA HAAR
Leonardo Oliveira de Araújo∗, Paulo César Pellanda∗, Juraci Ferreira Galdino∗
∗
Instituto Militar de Engenharia (IME)
Rio de Janeiro, RJ, Brasil
Emails: [email protected], [email protected], [email protected]
Abstract— This paper proposes the use of Haar transform to systematically obtain a set of gain-scheduled
LTI models that arbitrarily approximates the dynamics of a quasi-LPV or a nonlinear model. This approach is
an alternative to the traditional method of modeling an LPV system in which a set of homogeneously distributed
operating points is chosen a priori, without considering any information about its parameter dependence. The
Haar transform is combined with an error criterion based on an appropriated system metric to yield a set of
LTI models corresponding to a grid of operation subdomains. A denser grid is obtained in the regions where
the system dynamics is more affected by parameter variations. The methodology helps the controller designer in
specifying a set of LTI models suitable to interpolation and hence to the synthesis of gain scheduling controllers.
A numerical example illustrates the advantage of the proposed approach.
Keywords— Wavelet transforms, Haar transforms, LPV, quasi-LPV, nonlinear systems, control systems,
linearization, gain scheduling
Resumo— Este trabalho propõe o emprego da transformada Haar para a obtenção sistemática de um conjunto
de modelos LTI escalonados que aproxima arbitrariamente a dinâmica de um modelo LPV ou não-linear. Essa
abordagem é uma alternativa ao método tradicional de modelagem de um sistema LPV em que um conjunto de
pontos de operação distribuı́dos uniformemente é escolhido a priori, sem considerar qualquer informação sobre
sua dependência paramétrica. Uma combinação da transformada Haar com um critério de erro baseado em uma
métrica apropriada de sistema é usada para fornecer um conjunto de modelos LTI que corresponde a uma grade
de subdomı́nios de operação. Uma grade mais densa é obtida nas regiões onde a dinâmica do sistema é mais
afetada por variações paramétricas. A metodologia ajuda o projetista de controle na especificação de um conjunto
de modelos LTI propı́cio para a interpolação e, consequentemente, para a sı́ntese de controladores escalonados.
Um exemplo numérico ilustra a vantagem do método proposto.
Palavras-chave— Transformadas wavelet, transformada Haar, LPV, quasi-LPV, sistemas não-lineares, sistemas de controle, linearização, escalonamento de ganhos
1
Introdução
uma caracterı́stica favorável que é a adaptação em
tempo real do seu comportamento dinâmico, segundo a evolução dos parâmetros (endógenos ou
exógenos) que caracterizam as condições de funcionamento do sistema. Essas técnicas ampliam o
alcance dos métodos clássicos de controle robusto
LTI que consideram somente as caracterı́sticas lineares locais e condições particulares de funcionamento do sistema. Este benefı́cio da estratégia
de controle por escalonamento de ganhos é uma
consequência da explı́cita utilização de informações adicionais importantes oriundas da medida
dos parâmetros variantes.
O sucesso das técnicas de controle depende do emprego de um modelo matemático que represente
adequadamente a dinâmica da planta a ser controlada. Devido à maior simplicidade de análise e
de sı́ntese, os modelos lineares receberam grande
atenção para aplicação na área de controle. Em
razão disso, uma vasta gama de técnicas e um amplo arcabouço teórico foram desenvolvidos nesta
área ao longo do tempo.
No entanto, as dinâmicas reais tratadas pela
engenharia de controle apresentarem, em sua
grande maioria, comportamentos não-lineares, ou
lineares variantes no tempo (ou Linear a Parâmetro Variante, LPV). Isso motiva o desenvolvimento de novas técnicas e estudos de estabilidade
e desempenho.
Tradicionalmente, o controle de sistemas nãoestacionários é realizado pelo uso de técnicas de
escalonamento de ganhos (ou interpolação de controladores), cujo objetivo é controlar um sistema
que evolui num amplo domı́nio de funcionamento,
para o qual as técnicas de controle robusto Linear Invariante no Tempo (ou Linear a Tempo Invariante, LTI) se mostram ineficazes. Além da
propriedade de robustez em relação às incertezas
do sistema, os controladores interpolados possuem
O desenvolvimento de novos métodos de interpolação de controladores tem despertado grande
interesse na comunidade cientı́fica. Contudo, os
métodos mais utilizados no meio industrial são os
denominados “clássicos”, “convencionais” ou “tradicionais”. Eles se baseiam em um conjunto de
modelos LTI obtidos pela linearização de um modelo não-linear em torno de uma famı́lia de pontos de operação ou a partir do “congelamento” do
parâmetro variante de um modelo originalmente
LPV [1 - 5]. Um conjunto de técnicas de controle
linear (LQG, PRLQG, H2 , H∞ , sı́ntese µ, etc.) é,
então, disponı́vel para o projeto de uma famı́lia de
controladores LTI que oferecem um compromisso
3197
XVIII Congresso Brasileiro de Automática / 12 a 16 Setembro 2010, Bonito-MS.
razoável entre desempenho e robustez em torno
das condições de funcionamento consideradas.
Apesar dos desenvolvimentos teóricos recentes, alguns problemas relevantes ainda persistem.
Uma dificuldade destacável reside no fato de que,
em geral, o comportamento dinâmico dos controladores interpolados depende fortemente da estrutura ou das representações de estado adotadas
para a famı́lia de controladores lineares projetados
sobre um conjunto de pontos de operação e também dos seus coeficientes variantes. Nesse sentido, uma questão importante é a definição dos
pontos de operação sob a ótica da interpolação.
Na busca de ferramentas matemáticas apropriadas para contribuir na obtenção de resposta para
essa questão, a Transformada Haar mostra um potencial ainda inexplorado.
O emprego da Transformada Wavelet Discreta
(DWT, do inglês Discrete Wavelet Transform)
neste trabalho difere daqueles encontrado na recente literatura que emprega esta transformada na
área de controle. Dentre as publicações pesquisadas que empregam a DWT na área de controle,
observa-se o uso na identificação não-paramétrica
de modelos, em controle adaptativo e em redes
neurais [6 - 9].
Este trabalho propõe uma forma alternativa
de linearização de sistemas LPV, baseada em subdomı́nios de operação, em substituição ao conceito tradicional de pontos de operação. A aplicação da Transformada Haar possibilita a obtenção sistematizada de um conjunto de modelos LTI
que aproxima a dinâmica do modelo original LPV
tanto quanto o projetista necessitar (e os recursos computacionais permitirem). Nessa aproximação do sistema não-estacionário, é possı́vel verificar quais modelos LTI devem ser considerados por
ocasião da sı́ntese do conjunto de controladores a
ser usado em uma estratégia de interpolação.
O restante deste trabalho é organizado da seguinte maneira: na Seção 2, o problema é contextualizado; uma revisão dos conceitos básicos de
Transformada Wavelet Discreta é apresentada na
Seção 3; a Seção 4 introduz uma nova sistemática
de modelagem de sistemas LPV; a Seção 5 ilustra
numericamente a metodologia; a Seção 6 conclui.
2
algébrica, da seguinte forma [10]:
ẋ(t) = A (θ) x(t) + B (θ) u(t)
y(t) = C (θ) x(t) + D (θ) u(t)
(1)
As funções reais que formam os elementos das
matrizes A(θ), B(θ), C(θ) e D(θ) pertencem à
L2 (R) . Essas matrizes são de dimensões compatı́veis com as dimensões dos sinais de entrada e saı́da
e definem completamente a dinâmica do sistema.
As matrizes têm caracterı́stica não-estacionária
originada pela variável θ. Este vetor de parâmetros pode ser desdobrado em duas componentes
θ = [θx θp ]T :
ˆ θx = θx (x(t)) ∈ Rr1 é uma variável endógena,
ou seja, que depende da dinâmica interna do
sistema;
ˆ θp = θp (t) ∈ Rr2 é um parâmetro exógeno,
ou seja, que evolui no tempo de forma independente da dinâmica interna do sistema.
A presença de θx caracteriza o modelo denominado de quasi-LPV. As dependências em relação
ao tempo serão suprimidas no restante do texto
por simplicidade.
No domı́nio θ ≤ θ ≤ θ, no qual um sistema
LPV ou quasi-LPV é definido, busca-se:
1. uma forma sistematizada de obter modelo
LTI que aproximam o modelo LPV para uma
ou mais partições do domı́nio de θ;
2. mensurar a diferença entre a aproximação calculada e o modelo original; e
3. identificar abruptas variações paramétricas e
usar esta caracterı́stica para selecionar pontos de operação que tenham maior relevância na aproximação da dinâmica nãoestacionária original, disponibilizando esta
informação para a sı́ntese de controladores.
Do exposto, pretende-se obter um conjunto de
modelos LTI que represente a dinâmica LPV, em
malha aberta, de forma mais precisa. A sı́ntese da
famı́lia de controladores pode, então, ser calculada
com base no conjunto LTI obtido.
Na sı́ntese de controladores dentro da técnica
de escalonamento clássico de ganhos, a primeira
etapa corresponde à obtenção de uma descrição
linear aproximada do sistema descrito na Eq 1 que
envolve um conjunto conveniente das variáveis de
interpolação θ(t) ∈ Rr (r = r1 + r2 ). A maneira
mais utilizada na prática consiste em:
Contextualização do Problema
Uma classe importante de sistemas dinâmicos nãoestacionários pode ser representada por um conjunto de equações diferenciais não-lineares de ordem qualquer. Por meio de escolha apropriada dos
vetores das variáveis de estado x(t) ∈ Rn , de entrada u(t) ∈ Rm e de saı́da y(t) ∈ Rp , pode-se frequentemente obter um modelo não-linear em relação aos estados, mas linear em relação à entrada,
que implique em uma equação matricial diferencial de primeira ordem e uma equação matricial
ˆ obter, via linearização Jacobiana clássica do
modelo (Eq 1) em torno de um conjunto de
(k) (k)
pontos de equilı́brio x0 (u0 ), k = 1, 2, ...,
uma famı́lia de modelos linearizados.
ˆ definir uma trajetória nominal de x0 (t) para
o sistema e, supondo que θx (t) e dθx (t)/dt
3198
XVIII Congresso Brasileiro de Automática / 12 a 16 Setembro 2010, Bonito-MS.
são limitadas e independentes de x0 (t) e
dx0 (t)/dt, derivar um modelo do tipo LPV
onde o parâmetro e sua taxa de variação evoluem em domı́nios compactos, θ(t) ∈ DΘ ⊂
Rr , θ̇(t) ∈ DΘd ⊂ Rr , ∀t;
e
Wi = span{ψi,j , i, j ∈ Z}
ϕ(x)j e ψ(x)i,j são bases que, para qualquer inteiro positivo i, são obtidas pelas definições:
ϕ(x)i,j = 2i/2 ϕ(x − j)
ψi,j (x) = 2i/2 ψ(2i x − j)
ˆ eventualmente, escolher uma trajetória
θ(t) ←− θ0 (t) ou “congelar” o parâmetro em
um ponto dado θ(t) ←− θ0 (t), para obter,
respectivamente, um modelo linear variante
no tempo (LTV) ou LTI.
Nos dois últimos casos, certos estados, ou funções dos estados, são classificados como variáveis
exógenas em certas partes do modelo, enquanto
que em outras permanecem como variáveis endógenas. Esta hipótese leva a um certo conservadorismo, mais ou menos importante, na etapa de
sı́ntese dos controladores 1 . Nesse caso particular,
o modelo é denominado quasi-LPV.
Enfim, um sistema pode ainda ser, pela sua
própria natureza, LPV e nenhuma aproximação
ou linearização suplementar é necessária para
construir o modelo da Eq (1).
O modelo LPV ou quasi-LPV tolera uma dependência paramétrica bastante geral, que engloba a maior parte das situações práticas. Esta
propriedade requer a utilização e o desenvolvimento de metodologias sofisticadas e complexas
de análise e sı́ntese de leis de controle por escalonamento de ganho.
Transformada Wavelet Discreta
A DWT representa funções (sinais) quadraticamente integráveis - f (x) ∈ L2 (R) - da seguinte
forma:
f (x) =
i
2∑
−1
j
I 2∑
−1
∑
(5)
A função ϕ é denominada de Wavelet Pai e a função ψ é denominada de Wavelet Mãe.
Os espaços funcionais gerados⊕possuem as seguinte caracterı́sticas: Vi+1 = Vi Wi ; Wi ⊥Wk ,
se k ̸= i; e Wi ⊂ Vk , se k > i
Para qualquer i ∈ Z, o espaço funcional Wi é
definido como o complemento ortogonal de Vi em
relação a Vi+1 . Quando I = ∞, as bases ϕ(x)j e
ψ(x)i,j geram L2 (R).
Os coeficientes da DWT são obtidos pelo produto interno da função projetada com a função base, ou seja: vj = ⟨ϕ(x)j , f (x)⟩ e wij =
⟨ψ(x)ij , f (x)⟩.
A cada nova projeção em Wi somada à projeção em Vi , detalhes mais refinados são acrescentados à representação da função f (x) (Eq 2). Este
processo seqüencial é denominado de multirresolução [11].
O truncamento do limitante superior I do primeiro somatório da segunda parcela na Eq 2 resulta em um erro de aproximação tanto maior
quanto menor for esse limitante.
A DWT respeita o Teorema de Parseval. Há
abordagem para sistemas multidimensionais. Estes dois aspectos podem ser estudados em [11].
A concentração da energia do sinal nos coeficientes de resoluções mais baixas é outra propriedade marcante da DWT. Há um amplo conjunto
de bases Wavelets disponibilizadas.
Neste trabalho a base Haar é a utilizada. Esta
base é constituida por constantes, ou constantes
por partes: a função Pai é uma constante e a função Mãe é constante por partes (Fig 1). Assim,
todas as demais bases Haar geradoras dos subespaços Wij , por guardarem as caracterı́sticas da
função Mãe, são também constantes por partes.
Uma conseqüência desta propriedade é que, no
processo de sı́ntese de funções, a base Haar possibilita a obtenção de funções constantes por partes.
ˆ escolher convenientemente a função θx (x(t))
de forma a reescrever o modelo numa forma
onde os termos não-lineares possam ser redefinidos por um parâmetro variante unicamente em função do tempo θx (t). De forma
análoga ao caso anterior, considera-se que as
trajetórias desse parâmetro são limitadas e
independentes das trajetórias de x(t), o que
desconecta as funções matriciais A, B, C e
D das variáveis de estado.
3
(4)
i
vj ϕ(x)i +
i∈Z
wij ψ(x)ij
4
(2)
j
Modelagem Proposta
Considere um sistema não-linear de múltiplas entrada e múltiplas saı́das representado pela Eq
1. Se o parâmetro θ ∈ Rr origina equações do
tipo f (θ) : Rr −→ R, com domı́nio D, f (θ) ∈
L2 (R), pode-se aplicar a DWT à f (θ) (Eq 2).
Estendendo-se a aplicação da DWT ao sistema
apresentado, tem-se um modelo MΣ(I) que pode
ser representado genericamente por:
em que vj e wij são os coeficientes Wavelets, ϕ(x)i
são bases do espaço V0 e ψ(x)i,j são bases do espaço Wij .
Os espaços Vj e Wi são gerados da seguinte
forma:
Vj = span{ϕj , j ∈ Z}
(3)
1 O conservadorismo introduzido pela modelagem denominada quasi-LPV é tão menos desprezı́vel quanto maior
o número de estados implicados no parâmetro.
ẋ = (A0 + AΣ(I) )x + (B0 + BΣ(I) )u
y = (C0 + CΣ(I) )x + (D0 + DΣ(I) )u
3199
(6)
XVIII Congresso Brasileiro de Automática / 12 a 16 Setembro 2010, Bonito-MS.
mas LTI:
Base Haar Pai
.
nik = ∥MΣ((i+1)j)k − MΣ(ij)k ∥
1
(8)
0.5
em que k = {0, 1, ..., (2i+1 −1)} representa um dos
dois subdomı́nios em que as bases dos subespaços
W(i+1)j são não nulos2 . O uso da norma induzida
também se justifica por melhor representar a diferença da dinâmica da saı́da dos sistemas, entre
os dois diferentes nı́veis, em relação a uma métrica
que considere as simples diferenças das respectivas
matrizes de estado.
Para um nı́vel de resolução suficientemente
elevado, pode-se agrupar subdomı́nios (usando,
por exemplo, o valor médio deles) em um novo
subdomı́nio que contenha seus geradores. Neste
processo, subdomı́nios subseqüentes são reunidos
até que o novo modelo (médio) local esteja no
limite da distância máxima do modelo vizinho,
segundo uma norma definida previamente. Esse
e i , lineares por parprocedimento produz espaços V
tes, diferentes daqueles gerados pela base Haar.
0
−0.5
0
0.5
1
1.5
1
1.5
Variável
Base Haar Mãe
1
0
−1
−0.5
0
0.5
Variável
Figura 1: Perfil das funções da base Haar.
em que A0 , B0 , C0 , D0 e AΣ(I) , BΣ(I) , CΣ(I) ,
DΣ(I) são as construções dos elementos das matrizes A, B, C e D, respectivamente, pela
Wavelet Pai (Eq 3) e pelas Wavelets propriamente ditas (Eq 4). Desta forma, AΣ(I) =
∑I ∑2i −1
i=0
j=0 Ai,j ψ(θ)i,j , em que a matriz Ai,j é
composta pelos coeficientes resultantes da aplicação da DWT em cada um dos elementos que compõem a matriz original A. Por analogia, tem-se a
descrição das demais matrizes.
A representação por meio da Eq 6 - definido
aqui como o sistema MΣ(I) - permite arbitrar a
diferença entre as dinâmicas deste e do modelo da
Eq 1 - M(θ, t). Note que:
M(θ, t) = MΣ(I) + E(θ, t)
4.2
Admitindo-se que o erro da aproximação (Eq 7)
reduz-se exponencialmente com o aumento do nı́vel de resolução, pode-se definir um supremo deste
erro da seguinte maneira:
N I+1 =
(7)
∞
∑
c1 e−c2 i ≥ ∥E(θ, t)∥
(9)
i=I+1
O erro E(θ, t), pelas propriedades das Wavelets,
tende a zero quanto i → ∞ (Eq 2).
4.1
Definição da resolução máxima I
em que os coeficientes c1 e c2 são positivos e pertencem ao conjunto dos reais. A função exponencial é ajustada de forma que para cada nı́vel i
∞
∑
Análise para modelos tipo Haar
A modelagem propiciada pela base Haar nos elementos das matrizes A, B, C e D (Eq 1) permite a obtenção de matrizes A0 , B0 , C0 , D0 e
AΣ(I) , BΣ(I) , CΣ(I) , DΣ(I) que são formadas por
elementos constantes em subdomı́nios caracterı́sticos (definidos pelo ı́ndice i), obtendo, assim, a
linearização do sistema em intervalos do domı́nio
(ou em subdomı́nios). Este procedimento tem a
vantagem de poder associar um erro entre o sistema LPV original e o conjunto de modelos LTI
obtidos. Este erro pode ser reduzido com ao aumento da quantidade de nı́veis somados à aproximação.
Devido as funções que caracterizam as matrizes originais do sistema não-estacionário descrito
pela Eq 1 poderem ser diferentes, inclusive com
componentes frequenciais diversos, obter uma métrica indicativa do quanto cada aproximação representa em relação ao comportamento geral do
modelo tem aplicações. Por estar se tratando de
um conjunto LTI, calcular a contribuição dessa
nova aproximação (W(i+1)j ) apresenta relativa facilidade se utilizada a norma induzida para siste-
i=I+1
c1 e−c2 i = max{nik } = g(i)
k
(10)
O supremo N I+1 permite o controle do truncamento do modelo da aproximação. Este valor
pode ser obtido analiticamente ou seguindo o procedimento computacional proposto.
1. IM é um nı́vel resolução que se pode considerar o erro de aproximação entre o modelo
proposto e o sistema original nulo3 . Aplicar
a DWT (base Haar) às matrizes A, B, C e
D obtendo os coeficientes Wavelets.
2. Obter a projeção das funções que compõem
A, B, C e D no subespaço V0 e, em conseqüência, a aproximação M0 . Também calcular MΣ(00) (modelagem do sistema no subespaço V1 ).
3. Selecionar o maior dentre o conjunto n0k .
2 Cada ı́ndice j (Eq 5) implicar em dois subdomı́nios em
Vi+1 . No exemplo dado pela Fig 1, a soma das funções
forma uma base de V1 , que apresenta dois subdomı́nios.
3M
∼
Σ(IM ) = M(θ, t).
3200
XVIII Congresso Brasileiro de Automática / 12 a 16 Setembro 2010, Bonito-MS.
4. Repetir os passos 2 e 3, obtendo {MΣ(0) ,
MΣ(00) , ...MΣ(IM j) } e {g(0), g(1), ...g(IM )}.
Utilizar este conjunto para ajustar os coeficientes c1 e c2 (Eq 10). No cálculo, usar os
elementos de ı́ndices mais elevados.
em que T r(.) é o operador traço para matrizes. O
limitante superior υ do sistema e é a norma H2
e a função υ(θ) = υθ estabelece um limitante do
tipo H2 para cada valor do parâmetro θ.
A função υθ pode ser construı́da nı́vel a nı́vel através da análise proporcionada pela transformada Haar de forma prática, usando-se somente
ferramentas que trabalham com sistemas LTI e o
conceito da DWT.
5. Usando a Eq 9 (uma progressão geométrica)
e os requisitos do projeto, definir o ı́ndice I
considerado suficiente (erro admissı́vel).
4.3
1. Calcular ∥M0 ∥2 = n̄0 .
Quando usar a modelagem Haar?
2. Usa-se Eq 8 (particularizada à norma 2) para
se obter os elementos nik .
Em, pelo menos, dois processos de sı́ntese de controladores o projetista pode tirar proveito do estudo aqui proposto.
O primeiro é quando a planta apresentar ampla variação (ou aleatoriedade) de pontos de operação: a definição de subdomı́nios de operações
pode ser útil. A transformada Haar fornece, no
subespaço Vi , médias da função original em tantos subdomı́nios quanto se necessite. Além disso,
como já mencionado (na seção 4.1), pode-se obter
e i ).
subdomı́nios de tamanhos variados (V
O segundo é no caso de sistemas cujos controladores posam ser sintetizados com base em pontos de operação previamente definidos pelo projetista. A análise dos elementos nik passa a ser
uma ferramenta que permite selecionar os pontos de operação dominantes em um subdomı́nio.
Ou seja, para um número previamente definido de
pontos de operação, a análise de nik possibilita encontrar um conjunto destes pontos que reduz uma
função custo. Esta função é definida como:
∑p ∫ T
2
i=1 0 [ŷ(t)i − yi ] dt
(11)
∑p ∫ T
2
i=1 0 [y(t)i ] dt
3. Analisar se cada valor de nik aumenta ou diminui a norma geral do sistema: basta verificar qual dos modelos da subtração (Eq 8)
possui maior norma H2 . Se nik representar
um decréscimo4 , multiplica-se este elemento
por −1. Para distinguir este novo conjunto,
seus elementos serão tratados como n̄ik .
O conjunto de n̄ik pode ser organizado na
forma de um vetor composto pela norma H2 de
M0 , seguido pelas contribuições (em termos de
norma H2 ) de: MΣ(00) , MΣ(10) , ... MΣ(I(2I −1)) .
Observe que cada modelo implica em dois subdomı́nios de contribuições5 . Assim, o conjunto formado por n̄ik tem: 1+2+4+8+...+2I+1 = 2I+2 −1
elementos. Este vetor proporciona a construção
de uma função de θ que é a projeção de υθ num
espaço V̄I constante por partes. Ou seja:
n̄ik ϕ(θ)ik
(14)
i=0 k=0
A Eq 14 é descrita nos molde da Eq 2 (quando
ϕ(θ)ik = 1).
Como a resolução I é considerada suficientemente grande, é possı́vel tomar o valor da derivada
pela aproximação de Euler (∆θ muito pequeno):
em que ŷi ∈ R é a estimativa da saı́da yi ∈ R
obtida pela aproximação dada pela Eq 6 para uma
determinada resolução.
Como a função custo escolhida é quadrática,
buscam-se valores absolutos mı́nimos para qualquer ŷi − yi . Ou seja, objetiva-se minimizar:
∥Ẽ(θ, t)∥2 = ∥M(θ, t) − M̂(θ, t)∥2
I 2∑
∑
(i+1)
υθ ∼
=
∂υθ ∼ υθ+∆θ − υθ
=
∂θ
∆θ
(12)
(15)
Um sistema obtido pela interpolação normalizada do tipo:
em que M̂(θ, t) é um sistema LPV, que aproxima o
original, obtido via interpolação de sistemas LTI
originados em pontos de operação de M(θ, t) a
serem determinados.
Mθ̂ = [1 − f (θ̂)]Ma + f (θ̂)Mb
(16)
tem sua variação em função de θ̂ dada por:
4.4
Seleção de pontos de operação
∂Mθ̂
= lim∆θ̂→0 {
∂ θ̂
[1−f (θ̂+∆θ̂)]Ma +f (θ̂+∆θ̂)Mb −[1−f (θ̂)]Ma −f (θ̂)Mb
}
∆θ̂
É possı́vel minimizar a função custo usando interpolação de modelos LTI sem a necessidade de
simulações. Isto é possı́vel ao se relacionar os elementos nik a pontos do domı́nio de θ pela técnica
aqui apresentada.
Define-se a função ganho υ(θ), com υ(θ)max =
υ, tal que:
P(θ) = P ∈ Rn×n , P = PT ≻ 0
Ṗ + AP + PAT + CT C ≺ 0
T r(BT PB) < υ(θ) ≤ υ
(17)
o que implica em
∂Mθ̂
∂ θ̂
b −Ma )
= lim∆θ̂→0 [f (θ̂+∆θ̂)−f∆(θ̂)](M
=
θ̂
(Mb − Ma ) ∂f∂(θ̂θ̂)
(18)
(13)
4 ∥M
Σ(i+1)ik ∥2 < ∥MΣ(ij)ik ∥2
5 Advindos do acréscimo proporcionado
3201
por Wi .
XVIII Congresso Brasileiro de Automática / 12 a 16 Setembro 2010, Bonito-MS.
Logo:
∂f (θ̂) ∂Mθ̂ ∥Mb − Ma ∥2
∂ θ̂ = ∂
θ̂
2
2
(19)
O cálculo da norma H2 do sistema Mθ̂ (Eq 16)
não leva a uma expressão tão simples.
Voltando ao problema indicado pela Eq 12,
tem-se que:
∂MΣ(∞)
∂M(θ, t)
=
∂θ
∂θ
(20)
Ao se truncar MΣ(∞) , fazendo i = I, obtémse a aproximação:
M(θ, t) = MΣ(∞) →
∂M(θ, t) ∼ ∂MΣ(I)
=
∂θ
∂θ
Figura 3: Função que majora o ganho médio quadrático do sistema LPV (Eq 13).
São considerados dois vetores aleatórios de entrada (pertencentes a R2 ) independentes os quais
são apresentados na Fig 2. O vetor Entrada 1 é
constituı́do por um degrau unitário deslocado de
0, 5 segundo e um degrau com amplitude de −0, 5.
O vetor Entrada 2 é constituı́do por um degrau
com amplitude de −2 e um degrau unitário deslocado de 2 segundos.
(21)
Com isto, tem-se o cálculo de υθ (Eq 14) e
sua derivada parcial (Eq 15) proporcionado pelo
nı́vel de resolução I. A análise da curva obtida
pela Eq 15 é que vai permitir a seleção dos pontos
de operação que minimizam o critério (Eq 12).
Nestes pontos, a aproximação M̂(θ, t) é idêntica
ao sistema original. Assim, minimizar:
∂∥Ẽ(θ, t)∥2
∂∥[M(θ, t) − M̂(θ, t)]∥2
=
∂θ
∂θ
(22)
é obter a minimização do erro6 descrito na Eq 12.
A minimização desse erro é obtida ao se analisar quais pontos da função dada pela Eq 15
permitem a interpolação proposta na Eq 16, de
forma que as curvas originadas por funções do tipo
∂f (θ)/∂θ - pelo resultado expresso na Eq 19 - interliguem estes pontos de maneira a aproximar a
curva7 descrita pela Eq 15.
5
Figura 2: Entradas aplicadas ao sistema LPV.
Exemplo
A técnica apresentada de seleção de pontos de
operação é comparada à tradicional: uso da partição do domı́nio paramétrico de forma uniforme.
Os modelos interpolados linearmente foram contruı́dos com base em 5, 7, 10 e 17 pontos do sistema original.
Para os modelos tradicionais, o domı́nio considerado foi de 0 ≤ t ≤ 7, 2 segundos (para definir
o valor final, simulações são necessárias).
Para calcular os modelos MΣ , as funções
f (t)1 e f (t)2 foram amostradas em 512 pontos,
uniformemente distribuı́dos, no domı́nio 0 ≤ t ≤
2π segundos (∆t = 2π/511).
A aproximação da função υt (Eq 14), segundo
a técnica proposta, é apresentada na Fig 3.
Da análise deste gráfico, verifica-se que a escolha de t = 7, 2 segundos como limite superior
para a distribuição uniforme do modelo tradicional é observado sem necessidade de simulações
(há poucas variações em υt ).
A aproximação de Euler para a derivada de υt
(Eq 15), multiplicada por uma constante e decimada, é fornecida naturalmente pelos coeficientes
Dado o sistema LPV hipotético parametrizado em
t, (θ = t):
[
]
−1 − 1, 3f (t)1 0, 5 − 20f (t)1
A=
−1 + 2f (t)1
−2 − 10f (t)2
[
]
1 + 2, 2f (t)1 −4 + 0, 5f (t)2
B=
−1 − 6f (t)1
−1 − 5f (t)2
[
]
[
]
1 0
0 0
C=
, D=
0 1
0 0
em que: f (t)1 = 0, 5 + e−0,5t [0, 5t + cos(0, 3t2 )]/2
2
e f (t)2 = 0, 5 + 2−(t−3) sen(0, 3t2 − 9). O sistema
é LPV, conforme descrito pela Eq 1.
6 Os sistemas LTI que se somariam aos resultados das
integrações em θ, que conduz à implicação reversa na Eq
20, são nulos.
7 Ao se utilizar uma função de interpolação f (θ) de segundo grau, tem-se que a curva de sua derivada será formada por rampas. Neste caso, ao se ajustar rampas que se
aproximam do perfil descrito pela função obtida na Eq 15,
está também se aproximando M̂(θ, t), descrita conforme a
Eq 16, de M(θ, t).
3202
XVIII Congresso Brasileiro de Automática / 12 a 16 Setembro 2010, Bonito-MS.
da Transformada Haar no nı́vel de resolução I − 1
(no nı́vel I, os coeficientes são nulos). Este mapeamento é suficiente para definir os pontos de interesse8 , visto que o objetivo é estabelecer rampas
que acompanhem a derivada de υt .
A Fig 4 traz os coeficientes do nı́vel 8 da DWT
aplicada à υt . Esta é a curva base para definir os
pontos de operação de interesse.
A Tab 1 contém os 17 pontos de operação
utilizados no modelo proposto elaborado com o
número máximo de pontos selecionados (tomando
como base a Fig 4). Note que os modelos que
usaram mais densidades de pontos em relação aos
modelos que usaram uma densidade menor aproveita integralmente todos os pontos selecionados
anteriormente (o que não ocorre, necessariamente,
com a aproximação interpolada tradicional).
As Fig 5, 6 e 7 apresentam o primeiro elemento do vetor das saı́das (y1 = x1 ) para o vetor
Entrada 1 aplicado: à planta LPV (linhas cheias),
ao modelo de pontos selecionados (linhas pontilhadas) e ao modelo tradicional (linhas tracejadas).
As Tab 2 e Tab 3 apresentam os valores dos
erros, segundo o expresso pela Eq 11, por saı́da,
para cada vetor de entradas, respectivamente, Entrada 1 e Entrada 2 (Fig 2). Nestas tabelas, QP
é quantidade de pontos de operação, Sd é a saı́da
(1º ou 2º elemento do vetor y), Erro SP é o erro
apresentado na aproximação via seleção de pontos
e Erro PU é o erro apresentado na aproximação
com pontos de operação uniformemente distribuı́dos (tradicional). Razão é o quociente da divisão
(Erro PU)/(Erro SP).
Figura 4: Coeficientes do oitavo nı́vel da Transformada Haar aplicada à υt .
Figura 5: Estado 1, com 5 pontos de operação.
Tabela 1: Pontos selecionados e sua ordenação
para cada modelo simulado.
Pontos (s) SP 5 SP 7 SP 10 SP 17
0
t1
t1
t1
t1
0,88538
t2
t2
0,98370
t3
1,47550
t2
t3
t4
2,16400
t2
t3
t4
t5
2,26240
t6
2,55757
t3
t4
t5
t7
2,65590
t8
3,22000
t5
t6
t9
3,44280
t10
3,54120
t11
4,22978
t4
t6
t7
t12
4,62320
t13
4,72163
t14
4,96900
t8
t15
5,95500
t9
t16
7,20000
t5
t7
t10
t17
Figura 6: Estado 1, com 10 pontos de operação.
Legenda: SP “n” = seleção de “n” pontos de operação.
Verifica-se que os resultados obtidos com a
Figura 7: Estado 1, com 17 pontos de operação.
8A
multiplicação por uma constante não altera o perfil,
a forma, genérica da curva.
3203
XVIII Congresso Brasileiro de Automática / 12 a 16 Setembro 2010, Bonito-MS.
Tabela 2: Erros para
QP Sd Erro SP
5
1
0,01404
5
2
0,07233
7
1
0,00274
7
2
0,01853
10
1
0,00164
10
2
0,01398
17
1
0,00036
17
2
0,00290
Tabela 3: Erros para
QP Sd Erro SP
5
1
0,01222
5
2
0,05457
7
1
0,00264
7
2
0,01636
10
1
0,00152
10
2
0,01216
17
1
0,00033
17
2
0,00249
cesso automatizado para a seleção de pontos de
operação, o qual se baseia no procedimento heurı́stico aqui apresentado. Para uma evidência numérica mais abrangente, a aplicação de entradas
aleatórias sorteadas (dentro de limites de amplitudes estabelecidas previamente) para a geração
de uma seqüencia maciça de custos, também está
em estudo.
o vetor Entrada 1.
Erro PU Razão
0,06304
4,49
0,31436
4,35
0,00555
2,02
0,03709
2,00
0,00657
4,01
0,04241
3,03
0,00156
4,33
0,01045
3,60
Referências
[1] R. A. Hyde, and K. Glover (1993). The Application of Scheduled H∞ Controllers to a VSTOL Aircraft, IEEE Trans. Automat. Contr.
38(7):1021-39.
o vetor Entrada 2.
Erro PU Razão
0,05806
4,75
0,27442
5,03
0,00535
2,03
0,03389
2,07
0,00621
4,09
0,03833
3,15
0,00141
4,27
0,00886
3,56
[2] D. A. Lawrence, W. J. Rugh (1995). Gain
Scheduling Dynamic Linear Controllers for a
Nonlinear Plant, Automatica, 31(3):381-390.
[3] R. A. Nichols, R. T. Reichert, W. J. Rugh
(1993). Gain Scheduling for H∞ Controllers: a Flight Control Example, IEEE Trans.
Contr. Systems Technology, 1(2):69-79.
[4] W. J. Rugh (1991). Analytical Framework for
Gain Scheduling, IEEE Contr. Syst. Magazine, 11(2):79-84.
técnica proposta reduziram consideravelmente a
função custo em relação a metodologia tradicional. As Tab 2 e Tab 3 contém, respectivamente,
os resultados em que a metodologia apresentada
proporciona a maior e a menor razão entre os valores das funções custos obtidos nas simulações.
A redução deste erro foi de 50% a 80% favoravelmente à modelagem objeto deste estudo.
6
[5] J. S. Shamma, M. Athans (1990). Analysis of
Gain Scheduled Control for Nonlinear Plants,
IEEE Trans. Automat. Contr., 35(8): 898907.
[6] N. Sureshbabu e J. A. Farrell (1999). WavetBased System Identification for Nonlinear
Control, IEEE Transactions on Automatic
Control, vol 44, Nº 2.
Conclusão
Neste artigo, foi mostrado como utilizar a
Transformada Haar para linearizar modelos nãoestacionários e para obter um limite superior do
erro entre o sistema original e o modelo proposto.
Além disto, o modelo estudado permite um critério de seleção dos pontos de operação para o
emprego em aproximações que usam interpolação
de modelos LTI.
Embora a técnica proposta apresente uma implementação computacional de complexidade mais
elevada em relação à tradicional, ela evidencia
vantagens verificadas no exemplo simples discutido, como, por exemplo: para um mesmo número
de pontos de interpolação, a função custo resulta
em um valor menor; e caso se fixe um custo máximo, este é respeitado mesmo empregando uma
quantidade menor de modelos interpolados.
O procedimento para o ajuste dos pontos de
operação é heurı́stico, mas não requer simulações.
Uma aplicação de interesse a ser explorada é o uso
desta aproximação para sı́ntese de controladores
LPV politópicos.
Como continuação deste trabalho, os autores
estão investigando o desenvolvimento de um pro-
[7] J. Xu, R. Yan e W. Wang (2007). On Learning
Wavelet Control for Affine Nonlinear Systems
American Control Conference.
[8] Z. Hasiewicz, M. Pawlak e P. Sliwinski (2005).
Nonparametric Identification of Nonlinearities in Block-Oriented Systems by Orthogonal Wavelet With Compact Support IEEE
Transactions on Circuits and Systems, Vol
52, Nº 2.
[9] S. A. Billings e H. Wei (2005). A New Class
of Wavelet Networks for Nonlinear System
Identification IEEE Transactions on Neural
Networks, Vol. 16, Nº 4.
[10] P. C. Pellanda (2001).
Commande
Systèmes Instationnaires: Séquencement
Compensateurs et Commande LPV Tese
Doutorado, École Nationale Supérieure
l’Aéronautique et de l’Espace, França.
de
de
de
de
[11] S. Mallat (2009). A Wavelet Tour of Signal
Processing - Third Ed., Elsevier.
3204
Download

TÉCNICA DE REPRESENTA¸C˜AO DE MODELOS LPV BASEADA