5º. Capítulo: Transformações lineares em frações
5.1 O que são LFT’s. Propriedades
Este termo, transformações lineares em frações (“linear fractional transformations” =
LFT) é bem conhecido da teoria de funções de uma variável complexa, por exemplo:
a + bs
, com a, b, c e d ∈ C .
c + ds
Se c ≠ 0 , temos F ( s ) = α + β s (1 − γ s ) −1 , para α , β e γ ∈ C apropriados.
(Calculando, obtemos α = a / c, β = (bc − ad ) / c 2 , γ = − d / c ).
F ( s ) : C → C tal que F ( s ) =
A ideia acima pode ser generalizada para funções vetoriais e matriciais:
(1)
Definição:
Seja a matriz complexa
⎡M
M = ⎢ 11
⎣ M 21
M 12 ⎤
∈ C( p1 + p2 )×( q1 + q2 ) e sejam ∆ l ∈ C q2 × p2 e ∆ u ∈ C q1× p1 .
⎥
M 22 ⎦
(Os índices l e u acima significam “lower” e “upper”, respectivamente).
Definem-se então as LFT do seguinte modo:
Y l ( M , •) : C q2 × p2 → C p1×q1 , , com
Y l ( M , ∆ l ) := M 11 + M 12 ∆ l ( I − M 22 ∆ l ) −1 M 21 ,
(2)
supondo, é claro, que ( I − M 22 ∆ l ) −1 exista.
Se M e ∆ l forem matrizes de transferência, uma interpretação importante para a
expressão acima é dada pelo seguinte diagrama de blocos
⎡M
M = ⎢ 11
⎣ M 21
z
M 12 ⎤
M 22 ⎥⎦
∆l
y
r
u
Figura 24a
Com efeito, do diagrama de blocos acima, temos
z = M 11r + M 12u , y = M 21r − M 22 y, u = ∆ l y .
Substituindo a 2ª. na 3ª., temos
u = ∆ l M 21r − ∆ l M 22u ∴ u = ( I + ∆ l M 22 ) −1 ∆ l M 21r = ∆ l ( I + M 22 ∆ l ) −1 M 21r
E substituindo esta na 1ª. acima, temos
z = M 11r + M 12 ∆ l ( I + M 22 ∆ l ) −1 M 21r .
1
Portanto a matriz de transferência entre z e r é
M 11 + M 12 ∆ l ( I − M 22 ∆ l ) −1 M 21 = Y l ( M , ∆ l ) ,
conforme definido em (2).
Analogamente, define-se
Y u ( M , •) : C q1× p1 → C p2 ×q2 , com
Y u ( M , ∆ u ) := M 22 + M 21∆ u ( I − M 11∆ u ) −1 M 12 ,
(3)
supondo que ( I − M 11∆ u ) −1 exista.
Abaixo o diagrama de blocos correspondente na interpretação, que será amplamente
dominante, como é natural, neste curso.
∆u
u2
y2
z2
M
w2
Figura 24b
Utilizando procedimento semelhante ao de cima, é fácil provar que a matriz de
transferência entre z2 e w2 é dada por Tz2 w2 = Y u ( M , ∆ u ) .
Mais ainda, podemos verificar que Y u ( N , ∆ u ) = Y l ( M , ∆ l ) , com
⎡M
N = ⎢ 22
⎣ M 12
M 21 ⎤
.
M 11 ⎥⎦
(3*)
Com efeito, de (3), temos Y u ( N , ∆ u ) = N 22 + N 21∆ u ( I − N11∆ u ) −1 N12 = Y l ( M , ∆ l ) ,
dado em (2), em vista de (3*).
Nos diagramas de blocos acima, “M” é, tipicamente, a planta (junto, usualmente, com
atuadores e sensores), enquanto que os ∆ ’s podem representar seja uma perturbação seja
um controlador.
A matriz “M” nas LFTs é chamada frequentemente, em outros contextos, “matriz
coeficiente”.
(4)
Definição:
Uma LFT Y l ( M , ∆ l ) é dita bem definida (ou bem posta) se I − M 22 ∆ l tiver inversa.
Dualmente, Y u ( M , ∆ u ) será bem definida se I − M 11∆ u tiver inversa.
2
Claro que Y l ( M ,0) e Y u ( M ,0) são bem definidas, qualquer que seja M. Uma função
que não for bem definida na origem não pode ser uma LFT, como por exemplo
f (δ ) = 1/ δ .
Alguns autores definem LFT’s através das seguintes matrizes:
( A + BQ)(C + DQ) −1 e (C + QD) −1 ( A + QB) ,
onde se supõe que a matriz C tenha inversa, tal como mencionado antes para o caso
escalar:
F (s) =
a + bs
c + ds
Lema:
Suponha que C tenha inversa. Então,
( A + BQ)(C + DQ) −1 = Y l ( M , Q) ,
(5)
(C + QD) −1 ( A + QB ) = Y l ( N , Q) ,
⎡ AC −1
onde M = ⎢
−1
⎣C
⎡ C −1 A
B − AC −1D ⎤
C −1 ⎤
e
.
=
N
⎥
⎢
−1
−1 ⎥
−C −1D ⎦
⎣ B − DC A − DC ⎦
Prova:
Vamos provar a 1ª. igualdade acima, a prova da outra sendo dual. Recordamos de (2) que
Y l ( M , Q) := M 11 + M 12Q( I − M 22Q ) −1 M 21
Identificamos na expressão de M acima:
M 11 = AC −1 , M 12 = B − AC −1D, M 21 = C −1 e M 22 = −C −1D .
Portanto, Y l ( M , Q ) = AC −1 + ( B − AC −1 D )Q ( I + C −1 DQ ) −1 C −1
(
= AC −1 + ( B − AC −1 D )Q C −1 (C + DQ )
(
)
)
−1
C −1 = AC −1 + ( B − AC −1D)Q(C + DQ) −1
= AC −1 (C + DQ ) + ( B − AC −1 D )Q (C + DQ ) −1 = ( A + BQ)(C + DQ) −1 ,
onde na última passagem foram cancelados, por subtração, os termos AC −1 DQ .
•
A recíproca do Lema anterior também vale se M satisfizer às condições mencionadas no
lema que segue:
(6)
Lema:
⎡ M 11
⎣ M 21
Seja a LFT Y l ( M , Q ) com M = ⎢
M 12 ⎤
. Então,
M 22 ⎥⎦
(a) se M 12 tiver inversa,
Y l ( M , Q) = (C + QD) −1 ( A + QB ) , com
A = M 12 −1M 11 , B = M 21 − M 22 M 12 −1M 11 , C = M 12 −1 e D = − M 22 M 12 −1 .
3
⎡A
Alem disso, ⎢
⎣B
⎛⎡ 0
⎜⎢
M
= Y l ⎜ ⎢ 21
⎜⎢
⎜⎜ ⎢
⎝ ⎣ M 11
0
0
I
⎛⎡ 0
⎞
−I ⎤
0
⎜⎢
⎟
⎥
M
0
M
C⎤
21
22
−
1
⎜
⎥ , −M ⎟
=Yl ⎢
12
⎥
⎜
⎟
⎢
⎥
⋅
D⎦
⎜⎜ ⎢
⎟⎟
⎥
I ⎦
⎝ ⎣ M 11 I
⎠
⎞
−I ⎤
⎟
⎥
M 22 ⎥ −1 ⎟
,E
, para qualquer E não singular.
⎟
⎥
⋅
⎟⎟
⎥
M 12 + E ⎦
⎠
(b) se M 21 tiver inversa,
Y l ( M , Q) = ( A + BQ)(C + DQ ) −1 , com
A = M 11M 21−1 , B = M 12 − M 11M 21−1M 22 , C = M 21−1 e D = − M 21−1M 22 .
⎛ 0 M 12
M 11
⎞
⎜
⎟
0
0
I
⎡A C⎤
−1 ⎟
⎜
Alem disso, ⎢
, − M 21
⎥ =Yl ⎜
⎟
⋅
⎣B D⎦
⎜⎜
⎟⎟
I
⎝ − I M 22
⎠
⎛ 0 M 12
⎞
M 11
⎜
⎟
0
0
I
−1 ⎟
⎜
, − E , para qualquer matriz não singular E.
=Yl
⎜
⎟
⋅
⎜⎜
⎟⎟
M 21 + E
⎝ − I M 22
⎠
Prova:
Será esboçada a prova da 1ª. parte, o esboço da prova da 2ª. segue os mesmos passos.
⎡A C⎤
acima.
D ⎥⎦
(a) Vamos provar a igualdade das duas expressões de ⎢
⎣B
Da 2ª. expressão acima, temos
−1
⎡ A C ⎤ ⎡ 0 0⎤ ⎡ − I ⎤
+⎢
− E −1 ) I − ( M 12 + E ) ( − E −1 ) [ M 11
(
⎥
⎥
⎢B D⎥ = ⎢M
⎣
⎦ ⎣ 21 0 ⎦ ⎣ M 22 ⎦
−1
⎡ 0 0⎤ ⎡ − I ⎤
−1
−1
= ⎢
+
−
(
−
−
)
−
E
E
M
E
E
[ M 11 I ]
(
)
(
)
12
⎥ ⎢
⎥
⎣ M 21 0 ⎦ ⎣ M 22 ⎦
(
(
⎡ 0 0⎤ ⎡ − I ⎤
−1
+⎢
( − M 12 ) [ M 11
⎥
⎥
⎣ M 21 0 ⎦ ⎣ M 22 ⎦
⎡A C⎤
de ⎢
⎥.
B
D
⎣
⎦
= ⎢
)
I]
)
I ] , que é claramente igual à primeira expressão
4
Agora haveria que provar que, efetivamente,
⎛⎡ 0
⎜⎢
⎡A C⎤
⎜ ⎢ M 21
⎢B D⎥ = Y l ⎜ ⎢
⎣
⎦
⎜⎜ ⎢
⎝ ⎣ M 11
0
0
I
⎞
−I ⎤
⎟
⎥
M 22 ⎥
−1 ⎟
, − M 12 .
⎟
⎥
⋅
⎟⎟
⎥
I ⎦
⎠
•
O lema seguinte resume algumas das propriedades das LFT’s:
Lema:
Sejam as matrizes particionadas de forma apropriada:
⎡ A B1 B2 ⎤
⎡ M 11 M 12 ⎤
⎡ Q11 Q12 ⎤
, G = ⎢⎢ C1 D11 D12 ⎥⎥ . Então,
M =⎢
, Q=⎢
⎥
⎥
⎣ M 21 M 22 ⎦
⎣Q21 Q22 ⎦
⎣⎢C2 D21 D22 ⎦⎥
(7)
⎡0 I ⎤ ⎡ 0 I ⎤ ⎡ M 22 M 21 ⎤
(i) Y u ( M , ∆) = Y l ( N , ∆ ) com N = ⎢
⎥.
⎥M ⎢
⎥=⎢
⎣ I 0 ⎦ ⎣ I 0 ⎦ ⎣ M 12 M 11 ⎦
(ii) Suponha que Y u ( M , ∆ ) seja quadrada e bem definida e M 22 não singular. Então a
inversa de Y u ( M , ∆ ) existe e é também uma LFT com respeito a ∆ :
⎡ M 11 − M 12 M 22−1M 21
(Y u ( M , ∆)) = Y u ( N , ∆) , com N = ⎢
M 22−1M 21
⎣
(iii) Y u ( M , ∆1 ) + Y u (Q, ∆ 2 ) = Y u ( N , ∆ ) , com
−1
− M 12 M 22−1 ⎤
⎥.
M 22−1 ⎦
M 12 ⎤
⎡ M 11 0
⎢ 0 Q
Q12 ⎥⎥
⎡ ∆1 0 ⎤
11
⎢
e ∆=⎢
N=
⎥.
⎢
⎥
⋅
⎣ 0 ∆2 ⎦
⎢
⎥
M 22 + Q22 ⎦
⎣ M 21 Q21
(iv) Y u ( M , ∆1 )Y u (Q, ∆ 2 ) = Y u ( N , ∆ ) , com
⎡ M 11
⎢ 0
N =⎢
⎢
⎢
⎣ M 21
M 12Q22 ⎤
Q12 ⎥⎥
⎡ ∆1 0 ⎤
e ∆=⎢
⎥.
⎥
⋅
⎣ 0 ∆2 ⎦
⎥
M 22Q21
M 22Q22 ⎦
(v) Considere o seguinte sistema, as dimensões de ∆1 sendo compatíveis com as de A :
M 12Q21
M 11
5
z
w
Y u (G , ∆1 )
Y u (Q, ∆ 2 )
Figura 8
Então, a matriz de transferência de w a z é dada por
Y l (Y u (G, ∆1 ), Y u (Q, ∆ 2 )) = Y u (Y Ä (G, Y u (Q, ∆ 2 )), ∆1 ) = Y u ( N , ∆ ) , com
⎡ A + B2Q22 L1C2
⎢
Q12 L1C2
N =⎢
⎢
⎢
⎣C1 + D12 L2Q22C2
B2 L2Q21
Q11 + Q12 L1 D22Q21
D12 L2Q21
L1 := ( I − D22Q22 )−1 , L2 := ( I − Q22 D22 )−1
B1 + B2Q22 L1 D21 ⎤
⎥
Q12 L1 D21
⎥ , onde
⎥
⋅
⎥
D11 + D12Q22 L1 D21 ⎦
0⎤
⎡∆
e ∆=⎢ 1
⎥.
⎣ 0 ∆2 ⎦
Prova (parcial / esboçada):
⎡0 I ⎤ ⎡0 I ⎤
(i) Em primeiro lugar, note-se que N = ⎢
⎥M ⎢
⎥
⎣ I 0⎦ ⎣ I 0⎦
⎡0 I ⎤ ⎡ M 11 M 12 ⎤ ⎡ 0 I ⎤ ⎡ 0 I ⎤ ⎡ M 12 M 11 ⎤ ⎡ M 22 M 21 ⎤
=⎢
⎥⎢
⎥=⎢
⎥ , efetivamente.
⎥⎢
⎥=⎢
⎥⎢
⎣ I 0 ⎦ ⎣ M 21 M 22 ⎦ ⎣ I 0 ⎦ ⎣ I 0 ⎦ ⎣ M 22 M 21 ⎦ ⎣ M 12 M 11 ⎦
A seguir, recorda-se de (3) que Y u ( M , ∆ ) := M 22 + M 21∆ ( I − M 11∆ ) −1 M 12 e que de (2),
temos Y l ( N , ∆ ) := N11 + N12 ∆ ( I − N 22 ∆ ) −1 N 21 ; e em vista da definição de N acima,
temos a igualdade das duas LFT’s.
(ii) Temos que provar que
(M
22
+ M 21∆ ( I − M 11∆ ) −1 M 12
)
−1
(
= M 22−1 − M 22−1M 21∆ I − ( M 11 + M 12 M 22−1M 21 )
)
−1
M 12 M 22−1 , o
que não parece trivial.
(iii) Y u ( M , ∆1 ) = M 22 + M 21∆1 ( I − M 11∆1 ) −1 M 12 ,
Y u (Q, ∆ 2 ) = Q22 + Q21∆ 2 ( I − Q11∆ 2 ) −1 Q12 e
6
⎡∆
Q21 ] ⎢ 1
⎣0
Y u ( N , ∆ ) = M 22 + Q22 + [ M 21
= M 22 + Q22 + [ M 21
= M 22 + Q22 + [ M 21
−1
0 ⎤⎛
⎡ M 11 0 ⎤ ⎡ ∆1 0 ⎤ ⎞ ⎡ M 12 ⎤
⎜I −⎢
⎥
⎥⎢
⎥⎟ ⎢
⎥
∆2 ⎦ ⎝
⎣ 0 Q11 ⎦ ⎣ 0 ∆ 2 ⎦ ⎠ ⎣ Q12 ⎦
−1
0 ⎤ ⎡ I − M 11∆1
0
⎡∆
⎤ ⎡ M 12 ⎤
Q21 ] ⎢ 1
⎥
⎢
0
I − Q11∆ 2 ⎥⎦ ⎢⎣ Q12 ⎥⎦
⎣ 0 ∆2 ⎦ ⎣
⎡ ∆ ( I − M 11∆1 ) −1
⎤ ⎡ M 12 ⎤
0
Q21 ] ⎢ 1
⎥
−1 ⎥ ⎢
∆ 2 ( I − Q11∆ 2 ) ⎦ ⎣ Q12 ⎦
0
⎣
= M 22 + Q22 + M 21∆1 ( I − M 11∆1 ) −1 M 12 + Q21∆ 2 ( I − Q11∆ 2 ) −1 Q12 , conferindo.
(iv) Y u ( M , ∆1 )Y u (Q, ∆ 2 )
= ( M 22 + M 21∆1 ( I − M 11∆1 ) −1 M 12 )( Q22 + Q21∆ 2 ( I − Q11∆ 2 ) −1 Q12 )
= M 22Q22 + M 21∆1 ( I − M 11∆1 ) −1 M 12Q22 + M 22Q21∆ 2 ( I − Q11∆ 2 ) −1 Q12
+ M 21∆1 ( I − M 11∆1 ) −1 M 12Q21∆ 2 ( I − Q11∆ 2 ) −1 Q12 ,
enquanto que
Y u ( N , ∆) =
= M 22Q22 + [ M 21
0 ⎤⎛
⎡∆
⎡ M 11
M 22Q21 ] ⎢ 1
⎜I −⎢
⎥
⎣ 0 ∆2 ⎦ ⎝
⎣ 0
= M 22Q22 + [ M 21
0 ⎤ ⎡ I − M 11∆1
⎡∆
M 22Q21 ] ⎢ 1
⎥⎢
0
⎣ 0 ∆2 ⎦ ⎣
⎡ ∆1 0 ⎤
M 22Q21 ] ⎢
⎥
⎣ 0 ∆2 ⎦
= M 22Q22 + [ M 21
(8*)
M 12Q21 ⎤ ⎡ ∆1
M 11 ⎥⎦ ⎢⎣ 0
−1
0 ⎤ ⎞ ⎡ M 12Q22 ⎤
⎟
∆ 2 ⎥⎦ ⎠ ⎢⎣ Q12 ⎥⎦
−1
M 12Q21∆ 2 ⎤ ⎡ M 12Q22 ⎤
M 11∆ 2 ⎥⎦ ⎢⎣ Q12 ⎥⎦
−1
⎛ ⎡I − M ∆
0 ⎤ ⎡ I ( I − M 11∆1 )−1 M12Q21∆ 2 ⎤ ⎞ ⎡ M 12Q22 ⎤
11 1
×⎜ ⎢
⎢
⎥⎟ ⎢
⎥
⎜ ⎢⎣
0
M11∆ 2 ⎥⎥⎦ ⎢⎣0
I
⎥⎦ ⎟⎠ ⎣ Q12 ⎦
⎝
0⎤
⎡∆
= M 22Q22 + ⎡⎣ M 21 M 22Q21 ⎤⎦ ⎢ 1
⎥
⎣ 0 ∆2 ⎦
⎛ ⎡ I −( I − M 11∆1 )−1 M 12Q21∆ 2 ⎤ ⎡( I − M 11∆1 )−1
⎤ ⎞ ⎡ M 12Q22 ⎤
0
×⎜ ⎢
⎟
⎥⎢
⎥
−1 ⎥ ⎟ ⎢
⎜ ⎣0
0
(
∆
)
M
I
11 2
⎦⎣
⎦ ⎠ ⎣ Q12 ⎦
⎝
⎡ ∆1
= M 22Q22 + ⎡⎣ M 21 M 22Q21 ⎤⎦ ⎢
⎣0
0⎤
∆ 2 ⎥⎦
⎛ ⎡I
−( I − M11∆1 )−1 M 12Q21∆ 2 ⎤ ⎡( I − M 11∆1 )−1 M 12Q22 ⎤ ⎞
⎥ ⎟⎟
⎥⎢
−1
⎜ ⎣0
(
M
∆
)
Q
I
11 2
12
⎦⎣
⎦⎠
⎝
×⎜ ⎢
7
⎡ ∆1
= M 22Q22 + ⎡⎣ M 21 M 22Q21 ⎤⎦ ⎢
⎣0
0⎤
∆ 2 ⎥⎦
⎡( I − M 11∆1 ) −1 M 12Q22 − ( I − M 11∆1 ) −1 M 12Q21∆ 2 ( M 11∆ 2 ) −1 Q12 ⎤
×⎢
⎥
( M 11∆ 2 ) −1 Q12
⎣
⎦
= M 22Q22 + [ M 21∆1 M 22Q21∆ 2 ]
⎡ ( I − M 11∆1 ) −1 M 12Q22 − ( I − M 11∆1 ) −1 M 12Q21∆ 2 ( M 11∆ 2 ) −1 Q12 ⎤
⎢
⎥
( M 11∆ 2 ) −1 Q12
⎣
⎦
−1
−1
−1
= M 22Q22 + M 21∆1 ( ( I − M 11∆1 ) M 12Q22 − ( I − M 11∆1 ) M 12Q21∆ 2 ( M 11∆ 2 ) Q12 )
−1
+ M 22Q21∆ 2 ( M 11∆ 2 ) Q12
= M 22 Q22 + M 21∆1 ( I − M 11∆1 ) −1 M 12 (Q22 − Q21∆ 2 ( M 11∆ 2 ) −1 Q12 ) + M 22Q21∆ 2 ( M 11∆ 2 ) −1 Q12 (8**)
Agora “só” falta conferir que esta expressão é igual a (8*), caso não haja erro...
(v) prova omitida.
Lema:
(9)
⎡ P11
⎣ P21
Sejam P = ⎢
P12 ⎤
e K matrizes de transferência racionais e seja G = Y l ( P, K ) .
P22 ⎥⎦
Então,
(a) G é própria se P e K forem próprias com det( I − P22 K )(∞) ≠ 0 .
(b) Y l ( P, K1 ) = Y l ( P, K 2 ) implica K1 = K 2 se P12 e P21 tiverem posto normal cheio de
linha e coluna, respectivamente.
⎛
⎡G 0 ⎤ ⎞
⎥ ⎟ (∞) ≠ 0 e se
0
0
⎣
⎦⎠
(c) Se P e G forem próprias, det( P)(∞) ≠ 0 , det ⎜ P − ⎢
⎝
P12 e P21 forem quadradas e tiverem inversa para quase todo s, então K é própria e
K = Y u ( P −1 , G ) .
Prova:
(a) Lembra-se que Y l ( P, K ) := P11 + P12 K ( I − P22 K ) −1 P21 . É claro que se as condições
forem satisfeitas, G = Y l ( P, K ) será própria.
(b) Y l ( P, K1 ) − Y l ( P, K 2 ) = P11 + P12 K1 ( I − P22 K1 ) −1 P21 − P11 − P12 K 2 ( I − P22 K 2 ) −1 P21
= P12 K1 ( I − P22 K1 ) −1 P21 − P12 K 2 ( I − P22 K 2 ) −1 P21
= P12 ( K1 ( I − P22 K1 ) −1 − K 2 ( I − P22 K 2 ) −1 ) P21 .
Se esta expressão for nula e se forem satisfeitas as condições de posto, então é preciso
que
K1 ( I − P22 K1 ) −1 = K 2 ( I − P22 K 2 ) −1 ∴ ( I − K1P22 ) −1 K1 = K 2 ( I − P22 K 2 ) −1
∴ K1 ( I − P22 K 2 ) = ( I − K1P22 ) K 2 ∴ K1 − K1P22 K 2 = K 2 − K1P22 K 2 ; donde finalmente,
8
K1 = K 2 .
(c) Prova omitida (ver ZDG, p. 253).
•
Observação:
(10)
Uma interpretação simples de (c) do lema é dada, considerando os sinais no SMF da
figura 11, supondo que o sistema seja bem posto:
z
w
P
u
y
K
Figura 11
⎡z⎤
⎡ w⎤
⎢ y ⎥ = P ⎢ u ⎥ , u = Ky ⇒ z = Y Ä ( P, K ) w = Gw ; e portanto, supondo que P tenha
⎣ ⎦
⎣ ⎦
inversa,
⎡ w⎤
−1 ⎡ z ⎤
⎢ u ⎥ = P ⎢ y ⎥ , z = Gw .
⎣ ⎦
⎣ ⎦
Ou seja, podemos construir o seguinte diagrama de blocos
G
w
z
P −1
y
u
Figura 11*
e deste diagrama de blocos, temos u = Y â ( P −1 , G ) y , ou seja, K = Y â ( P −1 , G ) .
5.2 Exemplos de LFT’s
As LFT’s são um instrumento conveniente para a formulação de muitos objetos
matemáticos. Nesta seção e nas seguintes, mostraremos que várias estruturas matemáticas
conhecidas adquirem nova compreensão através do uso das LFT’s.
9
Realizações no espaço de estado
Seja o sistema no espaço de estado:
x = Ax + Bu ,
y = Cx + Du ,
cuja matriz de transferência é G ( s ) = D + C ( sI − A) −1 Bu , a qual pode ser expressa como
⎛⎡A B⎤ 1 ⎞
uma LFT: G ( s ) = Y u ⎜ ⎢
⎥ , I ⎟ , que corresponde, como sabemos, ao seguinte
⎝ ⎣C D ⎦ s ⎠
diagrama de blocos:
I /s
⎡A B⎤
⎢C D ⎥
⎣
⎦
Figura 12
−1
⎛⎡A B⎤ 1 ⎞
1⎛
1⎞
, I ⎟ = D + C ⎜ I − A ⎟ B = D + C ( sI − A) −1 B = G ( s ) .
Com efeito, Y u ⎜ ⎢
⎥
s⎝
s⎠
⎝ ⎣C D ⎦ s ⎠
(O livro tem outros exemplos, e alguns estão errados).
5.3 Um Princípio Básico
O princípio básico a que nos referimos nesta seção é comumente tratado como “tirar os
∆ ’s para fora”. Já veremos de que se trata.
Considere-se a figura 15, um diagrama de blocos qualquer:
10
Figura 15
Este diagrama de blocos pode ser re-escrito como na figura 16. Repare-se que os ∆ i ’s
são perturbações da planta, “dentro” dela, conforme a figura 15, a qual inclui também,
sem distinguir da planta, o controlador. Na figura 16 os ∆ i ’s são tirados para fora da
planta, bem como o controlador. Como veremos, esta operação tornará o tratamento
analítico do problema bem mais fácil.
Figura 16
11
Vamos ilustrar esta ideia com um exemplo:
Suponha que a relação entre a entrada e a saída de um sistema em malha fechada seja
dada por: z =
a + bδ 2 + cδ1δ 22
w =: Gw,
1 + dδ1δ 2 + eδ12
(10*)
onde a, b, c, d e e são constantes ou funções de transferência.
Queremos escrever G como uma LFT em termos de δ1 e δ 2 . Isto é feito em três passos:
1. Construir o diagrama de blocos para a relação entre a entrada w e a resposta z com
cada δ separado, conforme mostrado na figura 17.
2. Marcar as entradas e saídas dos δ ’s como y’s e u’s, respectivamente.
3. Escrever z e os y’s em termos de w e u’s, respectivamente com os δ ’s e K fora. (No
caso presente, (10*), não existe K). Este passo é equivalente a calcular a transformação
na área cinzenta da figura 16.
Vamos ao exemplo enunciado em (10*):
1. Vamos mostrar que o diagrama de blocos dado abaixo corresponde, de fato, a (10*).
z = ay1 + δ 2 (by1 + cδ 2δ1 ) y1 = (ay1 + bδ 2 + cδ1δ 22 ) y1 ,
y1 = w − eδ12 y1 − dδ 2δ1 y1 ∴ (1 + dδ1δ 2 + eδ12 ) y1 = w ∴ y1 =
1
1 + d δ1δ 2 + eδ12
w.
Substituindo esta na expressão acima, obtemos efetivamente (10*). Observo que foi fácil
provar isto, mas construir o diagrama de blocos a partir de (10*) não parece tarefa trivial.
12
a
z
y4
δ2
b
u4
c
u3
y3
u1
δ2
w
δ1
y1
-d
y2
δ1
u2
−e
Figura 17
⎡0
⎢1
⎢
⎢1
Vamos mostrar agora que z = Y u ( M , ∆ ) w com M = ⎢
⎢0
⎢
⎢
⎣0
0 ⎤
⎡δ I
∆=⎢ 1 2
⎥.
⎣ 0 δ2I2 ⎦
−e − d
0
0
0
0
−be −bd
0
0
0
0
⋅
− ae − ad
1
1⎤
0 ⎥⎥
0⎥
⎥ e
b⎥
⎥
⎥
a⎦
Construído o diagrama de blocos, passamos ao segundo passo enunciado acima, que é o
de “marcar as entradas e saídas dos δ ’s como y’s e u’s, respectivamente”. Após esta
marcação, já na figura 17, temos:
13
y1 = w − eu2 − du3 ; y2 = u1 ; y3 = u1; y4 = cu3 + b( w − eu2 − du3 ) = −beu2 + (c − bd )u3 + bw
, ou em forma vetorial,
−d
⎡ y1 ⎤ ⎡0 −e
⎢ y ⎥ ⎢1 0
0
⎢ 2⎥ = ⎢
⎢ y3 ⎥ ⎢1 0
0
⎢ ⎥ ⎢
⎣ y4 ⎦ ⎣0 −be c − bd
0 ⎤ ⎡ u1 ⎤ ⎡1 ⎤
⎡ u1 ⎤
⎢
⎥
⎢u ⎥
⎥
⎢
⎥
0 ⎥ ⎢u 2 ⎥ ⎢ 0 ⎥
+
w =: M 11 ⎢ 2 ⎥ + M 12 w .
⎢
⎥
⎢ u3 ⎥
⎥
⎢
⎥
u
0 3
0
⎢ ⎥
⎥⎢ ⎥ ⎢ ⎥
0 ⎦ ⎣u 4 ⎦ ⎣ b ⎦
⎣u 4 ⎦
Por outro lado, do diagrama de blocos, temos também
⎡ y1 ⎤ ⎡ y1 ⎤
⎡ y1 ⎤
⎡ u1 ⎤
⎡ y1 ⎤
⎢
⎥
⎢
⎥
⎢y ⎥
⎢u ⎥ δ I
⎢
⎥
y2 ⎥ ⎢ y2 ⎥
0 ⎤ ⎢ y2 ⎥
⎢
⎢ 2⎥ = ⎡ 1 2
=: ∆
∴
= M 11∆ ⎢ 2 ⎥ + M 12 w
⎢
⎥
⎢ y3 ⎥ ⎢ y3 ⎥
⎢ u3 ⎥ ⎣ 0 δ 2 I 2 ⎦ ⎢ y3 ⎥
⎢ y3 ⎥
⎢ ⎥ ⎢ ⎥
⎢ ⎥
⎢ ⎥
⎢ ⎥
⎣ y4 ⎦ ⎣ y4 ⎦
⎣u4 ⎦
⎣ y4 ⎦
⎣ y4 ⎦
⎡ y1 ⎤
⎡ y1 ⎤
⎢y ⎥
⎢y ⎥
2⎥
⎢
∴ ( I 4 − M 11∆ )
= M 12 w ∴ ⎢ 2 ⎥ = ( I 4 − M 11∆ ) −1 M 12 w
⎢ y3 ⎥
⎢ y3 ⎥
⎢ ⎥
⎢ ⎥
⎣ y4 ⎦
⎣ y4 ⎦
⎡ u1 ⎤
⎢u ⎥
∴ ⎢ 2 ⎥ = ∆ ( I 4 − M 11∆ ) −1 M 12 w .
⎢ u3 ⎥
⎢ ⎥
⎣u4 ⎦
(11)
E do diagrama de blocos temos ainda
⎡ u1 ⎤
⎡ u1 ⎤
⎢u ⎥
⎢u ⎥
2⎥
⎢
z = u4 + a ( w − eu2 − du3 ) = [ 0 − ae − ad 1]
+ aw =: M 21 ⎢ 2 ⎥ + M 22 w .
⎢u3 ⎥
⎢u3 ⎥
⎢ ⎥
⎢ ⎥
⎣u 4 ⎦
⎣u 4 ⎦
E em vista de (11), vem
z = ( M 21∆ ( I 4 − M 11∆ ) −1 M 12 + M 22 ) w ,
ou seja, z = Y u ( M , ∆ ) w ,
⎡ M 11
⎣ M 21
com M = ⎢
M 12 ⎤
.
M 22 ⎥⎦
•
5.5 Produto estrelado de Redheffer
A mais importante propriedade das LFT’s é que qualquer interconexão de LFT’s é uma
LFT. Esta propriedade é usada extensivamente no uso de LFT’s. Como veremos, a
maioria das estruturas de conexão, como em cascata e realimentação, podem ser vistas
como casos especiais do assim chamado produto estrelado.
14
Sejam as matrizes e submatrizes com dimensões compatíveis para o produto PK :
⎡P
P = ⎢ 11
⎣ P21
P12 ⎤
⎡ K11 K12 ⎤
, K =⎢
⎥
⎥.
P22 ⎦
⎣ K 21 K 22 ⎦
Suponha que P21 K11 seja quadrada e que I − P21 K11 tenha inversa.
O produto estrelado de P e K com respeito a esta partição é definido como:
⎡
Y l ( P, K11 )
S ( P, K ) := ⎢
−1
⎣ K 21 ( I − P21K11 ) P21
P12 ( I − P21K11 ) −1 K12 ⎤
⎥,
Y u ( K , P22 )
⎦
(12)
onde lembramos mais uma vez que
Y l ( P, K11 ) = P11 + P12 K11 ( I − P22 K11 ) −1 P21 ,
(13)
−1
Y u ( K , K 22 ) = K 22 + K 21K 22 ( I − K11K 22 ) K12
(14)
Observe-se que esta definição é essencialmente dependente da partição das matrizes P e
K. Efetivamente, o produto estrelado pode ser bem definido para uma partição e não para
outra.
O uso do produto estrelado leva à representação em diagrama conforme a figura 18.
z
w
P
y
u
K
ŵ
ẑ
Figura 18
Do diagrama de blocos acima, vemos que se trata de um sistema em que estamos
interessados em controlar não somente a saída da planta, mas também do controlador.
Este tipo de sistema ocorre em algumas situações em queremos monitorar a resposta do
compensador, de modo a evitar saturação, por exemplo.
Do diagram de blocos acima, temos
u = K11 y + K12 wˆ , y = P21w + P22u ∴ u = K11 ( P21w + P22u ) + K12 wˆ
∴ ( I − K11P22 )u = K11P21w + K12 wˆ ∴ u = ( I − K11P22 ) −1 ( K11P21w + K12 wˆ ) .
Mas,
z = P11w + P12u = P11w + P12 ( I − K11P22 ) −1 ( K11P21w + K12 wˆ )
∴ z = ( P11 + P12 ( I − K11P22 ) −1 K11P21 ) w + P12 ( I − K11P22 ) −1 K12 wˆ .
(15)
15
Ora, a matriz de transferência entre z e w é igual a Y l ( P, K11 ) , de acordo com (12),
coincidindo com (15), tendo em vista que
P11 + P12 ( I − K11P22 ) −1 K11P21 = P11 + P12 K11 ( I − P22 K11 ) −1 P21 . E vemos também que a
matriz de transferência entre z e ŵ de acordo com (12) também coincide com a dada
em (15).
Por outro lado, pode-se verificar que a matriz de transferência entre a resposta do
controlador e as entradas da planta e do controlador é dada pela segunda “linha” de (12).
Suponha agora que conheçamos as realizações da matrizes de transferência P e K:
⎡A
P = ⎢⎢ C1
⎢⎣C2
B1
D11
D21
B2 ⎤
D12 ⎥⎥ ,
D22 ⎥⎦
⎡ AK BK1 BK 2 ⎤
K = ⎢⎢CK1 DK11 DK12 ⎥⎥
⎢⎣CK 2 DK 21 DK 22 ⎥⎦
⎡ w⎤ ⎡ z ⎤
Então a matriz de transferência desejada S ( P, K ) : ⎢ ⎥ → ⎢ ⎥ tem a representação:
⎣ wˆ ⎦ ⎣ zˆ ⎦
⎡A
⎢
S ( P, K ) = ⎢
⎢ C1
⎢
⎣ C2
onde
⎡ A + B2 R −1 DK 11C2
A=⎢
BK 1 R −1C2
⎣
B1
D11
D21
B2 ⎤
⎥ ⎡A
⎥=⎢
D12 ⎥ ⎢
⎥ ⎢C
D22 ⎦ ⎣
B⎤
⎥
⎥
D ⎥⎦
⎤
⎥,
AK + BK 1 R D22CK 1 ⎦
⎡ B + B2 R −1DK 11D21
B=⎢ 1
BK 1R −1D21
⎣
⎡C + D12 DK 11R −1C2
C=⎢ 1
DK 21R −1C2
⎣
B2 R −1CK 1
−1
⎤
B2 R −1DK 12
⎥,
BK 2 + BK 1R −1D22 DK 12 ⎦
⎤
D12 R −1CK 1
⎥ e
CK 2 + DK 21R −1D22CK 1 ⎦
⎡ D11 + D12 DK 11R −1D21
⎤
D12 R −1DK 12
D=⎢
⎥,
DK 21 R −1 D21
DK 22 + DK 21R −1D22 DK 12 ⎦
⎣
com R = I − D22 DK 11 e R = I − DK 11 D22 .
16
Efetivamente, é fácil (?) mostrar que
⎛⎡ A
A = S⎜⎢
⎝ ⎣ C2
⎛ ⎡C
C = S⎜⎢ 1
⎝ ⎣ C2
⎛ ⎡ B1 B2 ⎤ ⎡ DK 11 DK 12 ⎤ ⎞
B2 ⎤ ⎡ DK 11 CK 1 ⎤ ⎞
,⎢
⎟, B = S ⎜ ⎢
⎥,⎢ B
⎥⎟,
⎥
⎥
D22 ⎦ ⎣ BK 1 AK ⎦ ⎠
D
D
B
21
22
1
2
K
K
⎣
⎦
⎣
⎦⎠
⎝
⎛ ⎡ D11 D12 ⎤ ⎡ DK 11 DK 12 ⎤ ⎞
D12 ⎤ ⎡ DK 11 CK 1 ⎤ ⎞
,⎢
⎟ e D = S⎜⎢
⎥ , ⎢D
⎥⎟.
⎥
⎥
D22 ⎦ ⎣ DK 21 CK 2 ⎦ ⎠
D
D
D
22 ⎦ ⎣ K 21
K 22 ⎦ ⎠
⎝ ⎣ 21
Nestas quatro expressões, está sendo usado o produto estrelado para matrizes definidas
sobre os números reais e não sobre funções racionais.
6º. Capítulo: Valor Singular Estruturado
Pode-se observar que os critérios de estabilidade robusta e de desempenho robusto
desenvolvidos no 4º. Capítulo variam com as hipóteses a respeito das descrições da
incerteza e exigências de desempenho. Será mostrado neste capítulo que eles podem ser
tratados de modo unificado usando o conceito de LFT introduzido no capítulo anterior e o
de valor singular estruturado, a ser introduzido neste capítulo.
Isto não significa, claro, que aqueles problemas especiais e suas soluções não sejam
importantes; pelo contrario, eles são muito esclarecedores para a nossa compreensão de
problemas complexos pois estes são formados a partir de problemas simples.
Mas por outro lado uma abordagem unificada pode aliviar as dificuldades matemáticas
oriundas do tratamento de diferentes problemas.
6.1 A estrutura geral para a robustez de sistemas
Como foi mostrado no último capítulo, qualquer sistema com interligações pode ser “rearrumado” de modo a se enquadrar na estrutura geral da figura 19.
17
∆
z
P
w
K
Figura 19
No diagrama acima, ∆ é tipicamente uma matriz de “perturbações” no sentido amplo,
como observado poucas linhas abaixo; é obtida a partir do método de “puxar para fora”
as perturbações, método que foi estudado no capítulo anterior. K é tipicamente o
controlador e P é a planta, nela incluídos os sensores e atuadores.
Embora a estrutura original do sistema seja bastante complicada, é sempre possível
chegar à estrutura da figura. Efetivamente, há softwares que permitem obter a estrutura
da figura acima a partir de sistemas originais, como o SIMULINK e µ -TOOLS . Ou
seja, estes softwares fazem a operação de “tirar para fora” as perturbações, algo que não é
trivial, como vimos.
Observe-se que as incertezas, caracterizadas pela matriz ∆ podem provir não somente
de perturbações dos parâmetros do modelo, mas também de entradas externas (distúrbios
determinísticos ou ruídos aleatórios). O desempenho do sistema é medido a partir da
resposta ou do erro, seja que se deseja rejeitar um distúrbio, seja que se deseja rastrear um
sinal, seja que queremos as duas coisas.
Conforme a figura 19, a planta é definida pela sua matriz de transferência
⎡ P11 ( s ) P12 ( s ) P13 ( s ) ⎤
P ( s ) = ⎢⎢ P21 ( s ) P22 ( s ) P23 ( s ) ⎥⎥ e o sistema em malha fechada é dado por
⎢⎣ P31 ( s ) P32 ( s ) P33 ( s ) ⎥⎦
z = Y u (Y l ( P, K ), ∆ ) w = Y l (Y u ( P, ∆ ), K ) w .
Se agora absorvermos o controlador dentro de uma estrutura maior, definamos
⎡ M ( s ) M 12 ( s ) ⎤
M ( s ) = Y l ( P ( s ), K ( s )) = ⎢ 11
⎥ , obtendo-se
(
)
(
)
M
s
M
s
22
⎣ 21
⎦
−1
z = Y u ( M , ∆ ) w = [ M 22 + M 21∆ ( I − M 11∆ ) M 12 ( s )]w .
18
∆
M
z
w
Figura 20
Suponha que K seja um controlador que estabiliza o SMF nominal (ou, no jargão,
“estabiliza a planta” nominal). Então, M ( s ) ∈ RH ∞ .
Supomos, sem perda de generalidade, que ∆ é bloco-diagonal, conforme a expressão
logo abaixo e, usando pesos apropriados, supomos também que ∆ ∞ < 1 .
Dizemos que não há perda de generalidade supor que ∆ seja bloco-diagonal, porque, na
pior das hipóteses, podemos considerar que ∆ tenha um único bloco.
Então estamos supondo que ∆ ( s ) tem a forma
∆ ( s ) = {diag[δ1I1 ,..., δ s I s , ∆1 ,..., ∆ F ] : δ i ∈ RH ∞ , ∆ j ∈ RH ∞ } ,
com δ i
∞
<1 e ∆j
∞
(1)
< 1.
Na expressão acima os δ 's são supostos escalares, enquanto que os ∆ 's são supostos
matrizes.
6.2 Valor singular estruturado
Do ponto de vista conceitual, o valor singular estruturado nada mais é que uma
“generalização imediata” (quem o inventou é o segundo autor de ZDG) do valor singular
para matrizes constantes.
Para ser mais específico, considere-se novamente o diagrama de blocos padrão da figura
22 abaixo, onde M e ∆ são supostos estáveis.
∆
w1
e1
M
e2
w2
Figura 22
19
Uma pergunta básica a respeito do SMF da figura 22 é quão grande pode ser ∆ (no
sentido de ∆ ∞ ) sem desestabilizar o sistema.
Os polos do SMF são dados pela equação det( I − M ( s ) ∆ ( s )) = 0 . Portanto o SMF é
instável se a eq. acima for satisfeita para algum s ∈ C + , o semiplano complexo fechado
da direita estendido, isto é, incluindo o infinito.
Supomos, como dito acima, que o sistema nominal, isto é, M, seja estável. Seja α > 0
suficientemente pequeno tal que o SMF da figura 22 seja estável para todos os
∆ ∞ < α . A seguir fazemos α aumentar até α max de modo que o sistema da figura 22
se torne instável. Então dizemos que α max é a margem de estabilidade robusta.
Ora, pelo teorema do pequeno ganho, temos
1
α max
= M
∞
:= sup σ ( M ( s )) = sup σ ( M ( jω )) .
ω
s∈C+
(2)
Em vista disso, podemos escrever
σ ( M ( s )) =
1
.
min{σ (∆ ) : det( I − M ( s )∆ ) = 0, ∆ é não-estruturado}
(3)
Ou por outras palavras, a recíproca do maior valor singular de M é uma medida do
menor ∆ desestruturado que causa instabilidade no sistema com realimentação.
Para quantificar o menor ∆ estruturado que desestabiliza o SMF, é introduzido o valor
singular estruturado:
1
.
min{σ (∆ ) : det( I − M ( s )∆ ) = 0, ∆ é estruturado}
Observe-se que a definição indica o valor singular de M ( s ) com relação a ∆ .
µ∆ ( M ( s )) =
(4)
De (2) e (4), temos:
1
α max
= sup µ ∆ ( M ( s )) = sup µ∆ ( M ( jω )) .
ω
s∈C+
(5)
A última igualdade é demonstrada de modo rigoroso em ZDG, pp.277s, em que se prova
que:
sup µ∆ ( M ( s)) = sup µ∆ ( M ( s )) = sup µ∆ ( M ( jω )) .
s∈C+
s∈C+
ω
Definições de µ
O valor singular estruturado µ (⋅) foi definido em (4) acima. O que se entende por
estrutura em ∆ já vimos em (1), sem mencionar então a palavra “estruturado”. Vamos
agora explicar e formalizar melhor esta definição.
Consideremos matrizes M ∈ C n×n . Na definição de µ ( M ) há uma estrutura subjacente
∆ , que é um conjunto de matrizes bloco-diagonais. Para cada problema esta estrutura é
diferente, dependendo das incertezas e dos objetivos de pesquisa do sistema. Definir a
estrutura de ∆ depende de três coisas: o tipo de cada bloco do diagrama de blocos, o
número total de blocos e suas respectivas dimensões.
20
Há dois tipos de blocos, como vimos em (1): escalares repetidos e blocos cheios; o
número de cada um será representado por S e F, respectivamente. E as dimensões de
cada bloco serão dadas por r1 ,..., rS e m1 ,..., mF , respecitvamente, ou seja, o i-ésimo
bloco de escalares repetidos tem dimensão ri × ri , enquanto que o j-ésimo bloco cheio
tem dimensão m j × m j .
Com estes números em mente, definimos ∆ ∈ C n×n como
{
∆ = diag[δ1I r1 ,..., δ S I rs , ∆1 ,..., ∆ F ] : δ i ∈ C,δ j ∈ C
m j ×m j
}.
(5*)
Às vezes precisaremos de subconjuntos de ∆ que sejam limitados por norma, pelo que é
introduzida a notação:
(6a)
B∆={∆ ∈ ∆ : σ (∆ ) ≤ 1} ,
B0∆={∆ ∈ ∆ : σ (∆ ) < 1} .
(6b)
Observe-se que os blocos cheios ∆ i não precisam ser quadrados, mas suporemos aqui
que o sejam para tornar a notação mais compacta.
Definição:
Para M ∈ C n×n , µ ∆ ( M ) é definido como
(7a)
1
,
(7b)
min{σ (∆ ) : ∆ ∈ ∆, det( I − M ∆ ) = 0}
a não ser que não exista ∆ ∈ ∆ que torne I − M ∆ singular, e neste caso, define-se
µ∆ ( M ) := 0.
µ∆ ( M ) :=
(8)
Observação:
- Quando não existe ∆ ∈ ∆ que torne I − M ∆ singular, define-se µ ∆ ( M ) := 0,
coerentemente com o fato que então a margem de estabilidade é infinita.
- Sem perda de generalidade, os blocos cheios em ∆ podem ser escolhidos como díades
(de posto igual a 1). Para ver isto, suponha, para simplificar, que S = 0, isto é, todos os
blocos são cheios. Suponha que I − M ∆ é singular para algum ∆ ∈ ∆ . Então existe um
x ∈ C n tal que M ∆x = x . Particionemos x:
⎡ x1 ⎤
⎢x ⎥
x = ⎢ 2 ⎥ , xi ∈ Cmi , i = 1,..., F .
⎢ ⎥
⎢ ⎥
⎣ xF ⎦
⎧ ∆ i xi xi∗
⎪ 2 , se xi ≠ 0
Definamos: ∆ i = ⎨ xi
⎪
⎩0, se xi = 0
{
para i = 1,..., F ,
(8*)
}
∆ = diag ∆1 , ∆ 2 ,..., ∆ F .
21
xi xi∗
∆ i xi xi∗
xi xi∗
Ora, ∆ i =
≤ ∆i
,
≤ ∆i
2
xi2
xi2
xi
(8**)
porque xi2 é o produto escalar de xi por ele mesmo. Para calcularmos o numerador da
última expressão, consideremos, para maior clareza de idéias, e “quase” sem perda de
generalidade, o caso em que xi tem apenas duas componentes, que denominaremos, para
simplificar a notação, por x1 e x2 . Então, supondo que x seja real (de novo para não
⎡ x1 ⎤
sobrecarregar a notação), temos x x = ⎢ ⎥ [ x1
⎣ x2 ⎦
T
i i
⎡ x12
x2 ] = ⎢
⎣ x1 x2
x1 x2 ⎤
⎥ . Ora a norma-2
x22 ⎦
induzida de uma matriz é a raiz quadrada do seu maior autovalor; temos
⎛
⎛ ⎡ λ − x12 − x1 x2 ⎤ ⎞
⎡ x 2 x1 x2 ⎤ ⎞
det ⎜ λ I 2 − ⎢ 1
det
=
⎜⎜ ⎢
2 ⎥⎟
2⎥⎟
⎜
⎟
⎟
⎣ x1 x2 x2 ⎦ ⎠
⎝
⎝ ⎣ − x1 x2 λ − x2 ⎦ ⎠
= λ 2 − x12λ − x22λ + x12 x22 − x12 x22 = λ (λ − x12 − x22 ) . E é claro que o maior auto valor é
x12 + x22 , donde que xi xi∗ = x12 + x22 . Então a última fração de (8*) é igual a 1 e
portanto temos ∆ i ≤ ∆ i .
Logo, σ (∆ ) ≤ σ (∆ ) .
Agora note-se de (8*) que, supondo ainda, para simplificar, que xi tenha apenas duas
componentes,
∆ i xi = ∆ i
1 ⎡ x1 ⎤
⎢ ⎥ [ x1
xi2 ⎣ x2 ⎦
⎡x ⎤
1
x2 ] ⎢ 1 ⎥ = ∆ i 2
x1 + x22
⎣ x2 ⎦
⎡ x1 ⎤ 2
2
⎢ x ⎥ ( x1 + x2 ) = ∆ i xi .
⎣ 2⎦
Donde, ∆x = ∆x e, portanto ( I − M ∆ ) x = ( I − M ∆ ) x = 0 , isto é, I − M ∆ também é
singular.
Portanto, nós substituímos a perturbação geral ∆ que satisfaz à condição de
singularidade por uma perturbação ∆ que não é maior (no sentido de σ (⋅) ) e que tem
posto igual a um em cada bloco, mas ainda satisfaz a condição de singularidade.
Segue-se uma expressão alternativa da definição de µ ∆ ( M ) :
(9)
=
,
µ ∆ ( M ) max ∆∈B∆ ρ ( M ∆ )
onde ρ (⋅) é o raio spectral da matriz, isto é , o valor absoluto do auto-valor de maior
valor absoluto.
Lema:
Prova: Segue de (3), lembrando que o maior valor singular é a raiz quadrada do maior
autovalor.
•
Em virtude deste lema, a continuidade da função µ : C n×n → R fica evidente.
22
Em geral, entretanto, a função µ : C n×n → R não é uma norma, pois se pode mostrar que
ela não satisfaz à desigualdade do triângulo.
Entretanto, para qualquer α ∈ C temos µ (α M ) = α µ ( M ) , portanto, em algum
sentido, µ (⋅) está relacionado a quão “grande” uma matriz é.
Podemos relacionar µ∆ ( M ) a quantidades familiares na álgebra linear quando ∆ é um
dos conjuntos:
(10)
Fato:
Se ∆ = {δ I : δ ∈ C} , (ou seja, S = 1, F = 0, r1 = n ), então, µ∆ ( M ) = ρ ( M ) .
Prova: Os únicos ∆ ' s em ∆ que satisfazem a det( I − M ∆ ) = 0 correspondem aos
autovalores não nulos de M. E o menor deles é associado com o maior autovalor, donde a
conclusão.
•
Fato:
Se ∆ = Cn×n , ou seja, S = 0, F = 1, m1 = n , então µ∆ ( M ) = σ ( M ) .
(11)
1
, então I − M ∆ é não singular, por aplicação do teorema do
σ (M )
pequeno ganho. Aplicando a definição (7b) e (3), temos µ∆ ( M ) ≤ σ ( M ) .
(12)
Prova: Se σ ( ∆ ) <
A possivel desigualdade anterior se deve ao fato que no lado esquerdo temos perturbação
estruturada. Ora, quando temos um bloco único cheio, a perturbação é de fato
desestruturada, daí a igualdade.
•
É claro que para um ∆ geral como em (5*), devemos ter:
{δ I n : δ ∈ C} ⊂ ∆ ⊂ C n×n .
Consequentemente, da definição de µ e dos dois casos especiais acima, temos
ρ ( M ) ≤ µ∆ ( M ) ≤ σ ( M ) .
(13)
(14)
Mas estes limitantes não são suficientes para nossos propósitos, porque a diferença entre
ρ ( M ) e σ ( M ) pode ser arbitrariamente grande. Assim, por exemplo, suponha que
⎡δ 0 ⎤
∆=⎢ 1
⎥ e
δ
0
2⎦
⎣
⎡0 β ⎤
1º. caso: M = ⎢
⎥ , com β > 0 , de resto qualquer. Então, ρ ( M ) = 0 e σ ( M ) = β ,
⎣0 0 ⎦
porque os valores singulares são as raizes quadradas dos autovalores de MM T . E
µ ( M ) = 0 , visto que det( I − M ∆ ) = 1 para todos os ∆ ' s admissíveis.
⎡ −1/ 2 1/ 2 ⎤
2º. Caso: M = ⎢
⎥ . Neste caso, temos ρ ( M ) = 0 e σ ( M ) = 1 . E visto que
⎣ −1/ 2 1/ 2 ⎦
23
det( I − M ∆) = 1 +
δ1 − δ 2
2
⎧
⎩
, é fácil ver que min ⎨ max i δ i :1 +
δ1 − δ 2
2
⎫
= 0⎬ = 1 ,
⎭
portanto µ (M) = 1.
Poranto, nem ρ nem σ proveem limitantes úteis mesmo em casos simples. Eles são
úteis se ρ ( M ) ≈ σ ( M ) .
Entretanto estes limitantes podem ser refinados considerando transformações em M que
não afetam µ∆ ( M ) , mas afetam ρ e σ . Com este objetivo, definamos os seguintes
dois subconjuntos de Cn×n :
U = {U ∈ ∆ : UU ∗} = I n ,
{
D = diag[ D1 ,..., DS , d1I m1 ,..., d F −1I mF −1 , I mF ] : Di ∈ C
(15)
ri ×ri
}
, Di = Di ∗ > 0, d j ∈ R, d j > 0
Note-se que para todo ∆ ∈ ∆, U ∈ U e D ∈ D, temos
U ∗ ∈ U , U ∆ ∈ ∆, ∆U ∈ ∆, σ (U ∆) = σ (∆U ) = σ (∆ ), D∆ = ∆D .
(16)
(17)
Em vista disso, temos
Teorema:
Para todo U ∈ U e D ∈ D,
(18)
µ∆ ( MU ) = µ∆ (UM ) = µ∆ ( M ) = µ∆ ( DMD −1 )
Prova:
Para todo D ∈ D e ∆ ∈ ∆,
det( I − M ∆) = det( I − MD −1∆D) = det( I − DMD −1∆ ) ,
a primeira igualdade porque D comuta com ∆ e a segunda porque, em geral,
det(I – AB) = det(I – BA). Portanto, µ∆ ( M ) = µ∆ ( DMD −1 ) .
Alem disso, para todo U ∈ U , det( I − M ∆ ) = 0 se só se det( I − MUU ∗∆) = 0 . Mas
visto que U ∗∆ ∈ ∆ (ver (17), e σ (U ∗ ∆ ) = σ (∆ ) (idem), obtemos µ∆ ( MU ) = µ∆ ( M ) . E
o argumento para UM segue a mesma linha.
•
Em vista disto, os limitantes em (14) podem ser mais “apertados”:
maxU ∈U ρ (UM ) ≤ max ∆∈B∆ ρ (∆M ) = µ∆ ( M ) ≤ inf D∈D σ ( DMD −1 ) ,
(19)
onde a igualdade acima vem do lema (9).
Então, de (19), temos
maxU∈U ρ (UM ) ≤ µ∆ ( M ) ≤ inf D∈D σ ( DMD −1 )
(19*)
A seguir temos o resultado, cuja prova é remetida para um artigo (ver ZDG, p. 281):
Teorema:
maxU ∈U ρ ( MU ) = µ∆ ( M )
(19#)
24
Boa definição e desempenho para LFT’s constantes
⎡ M 11
⎣ M 21
Seja uma matriz complexa: M = ⎢
M 12 ⎤
M 22 ⎥⎦
(20)
e sejam duas estruturas ∆1 e ∆ 2 que são compatíveis em dimensões com M 11 e M 22 .
Defina-se uma terceira estrutura:
⎧⎪ ⎡ ∆
⎫⎪
0⎤
∆ = ⎨⎢ 1
(21)
⎥ : ∆1 ∈ ∆1 , ∆ 2 ∈ ∆ 2 ⎬ .
⎩⎪ ⎣ 0 ∆ 2 ⎦
⎭⎪
Vamos computar µ com respeito a estas três estruturas. Usaremos a seguinte notação:
µ1 se refere a ∆1 , µ 2 se refere a ∆ 2 e µ∆ se refere a ∆ . Com esta notação,
µ1 ( M 11 ), µ2 ( M 22 ) e µ∆ ( M ) todas fazem sentido, mas µ1 ( M ) , por exemplo, não faz.
Estamos interessados em resolver os seguintes problemas:
- Determinar se a LFT Y l ( M , ∆ 2 ) é bem definida para todo ∆ 2 ∈ ∆ 2 com
σ ( ∆ 2 ) ≤ β (< β ) e
- se este for o caso, determinar quão “grande” Y l ( M , ∆ 2 ) pode ser.
Então, seja ∆ 2 ∈ ∆ 2 . Lembremo-nos que Y l ( M , ∆ 2 ) é bem definida se I − M 22 ∆ 2 tiver
inversa.
O próximo teorema nada mais é que uma reformulação da definição de µ :
(22)
Teorema:
A LFT Y l ( M , ∆ 2 ) é bem definida
(a) para todo ∆ 2 ∈ B∆ 2 se só se µ 2 ( M 22 ) < 1 ,
(b) para todo ∆ 2 ∈ B0 ∆ 2 se só se µ2 ( M 22 ) ≤ 1 .
•
Quando a “perturbação” ∆ 2 é diferente de zero, a matriz Y l ( M , ∆ 2 ) se torna diferente
de M 11 . Os valores que µ1 (Y l ( M , ∆ 2 )) pode ter são intimamente relacionados a
µ∆ ( M ) , conforme o teorema segunte:
Teorema da malha principal:
(23)
⎧⎪ µ 2 ( M 22 ) < 1 e
⎫⎪
µ∆ ( M ) < 1 se só se ⎨
⎬,
⎩⎪max ∆2∈B∆2 µ1 (Y l ( M , ∆ 2 )) < 1⎭⎪
⎪⎧ µ 2 ( M 22 ) ≤ 1 e
⎪⎫
µ∆ ( M ) ≤ 1 se só se ⎨
⎬.
⎪max ∆ ∈B ∆ µ1 (Y l ( M , ∆ 2 )) ≤ 1⎪
⎩
0
2
2
⎭
Prova: (apenas da 1ª. parte, a da 2ª. sendo análoga)
(Suficiência): Sejam ∆1 ∈ ∆1 e ∆ 2 ∈ ∆ 2 , com σ ( ∆1 ) ≤ 1 e σ (∆ 2 ) ≤ 1 e defina-se
∆ = diag[∆1 , ∆ 2 ] . É claro que ∆ ∈ ∆ . Ora,
25
⎡ I − M 11∆1
det( I − M ∆) = det ⎢
− M 12 ∆ 2 ⎤
.
I − M 22 ∆ 2 ⎥⎦
(24)
⎣ − M 21∆1
Por hipótese I − M 22 ∆ 2 tem inversa e, portanto,
det( I − M ∆ ) = det( I − M 22 ∆ 2 ) det ( I − M 11∆1 − M 12 ∆ 2 ( I − M 22 ∆ 2 ) −1 M 21∆1 ) , ou seja,
(25)
det( I − M ∆ ) = det( I − M 22 ∆ 2 ) det( I − Y l ( M , ∆ 2 )∆1 ) .
Mas µ1 (Y l ( M , ∆ 2 )) < 1 por hipótese (enunciado do teorema), e ∆1 ∈ B∆1 (primeira
linha da prova deste teorema), donde que I − Y l ( M , ∆ 2 )∆1 é não singular. Então
I − M ∆ é não singular e, por definição (?), µ∆ ( M ) < 1 .
(Necessidade): Basicamente, reverte-se o argumento acima. De novo, ∆1 ∈ ∆1 e ∆ 2 ∈ ∆ 2
e ∆ = diag[∆1 , ∆ 2 ] . Então ∆ ∈ B∆ e, por hipótese, det( I − M ∆ ) ≠ 0 . Pode-se verificar
da definição de µ que temos sempre µ ( M ) ≥ max{µ1 ( M 11 ), µ 2 ( M 22 )} . Mais ainda,
como por hipótese µ2 ( M 22 ) < 1 , temos I − M 22 ∆ 2 é não singular. Então, (25) é valida,
dando det( I − M 22 ∆ 2 ) det( I − Y l ( M , ∆ 2 )∆1 ) = det( I − M ∆ ) ≠ 0 .
Então é claro que I − Y l ( M , ∆ 2 )∆1 é não singular para todos ∆1 ∈ B∆1 e ∆ 2 ∈ B∆ 2 ,
provando o teorema.
•
6.3 Estabilidade robusta estruturada e desempenho
Estabilidade robusta
O uso mais conhecido de µ como ferramenta de análise de robustez é no domínio da
frequência.
Seja G ( s ) uma matriz de transferência racional, com coeficientes reais e estável. Para
maior concretude, suponha que a matriz tenha q1 entradas e p1 saídas. Seja ∆ como em
(5*) e suponha que as dimensões sejam tais que ∆ ⊂ C q1× p1 .
Seja M (∆) o conjunto de todas as matrizes racionais, estáveis e bloco-diagonais com
estrutura de blocos como em ∆ , e tais que
M (∆) := ∆ (⋅) ∈ RH ∞ : ∆ ( s0 ) ∈ ∆ para todo s0 ∈ C + .
{
}
Então, temos
Teorema:
Seja β > 0 . Então o SMF abaixo é bem posto e internamente estável para todo
∆ (⋅) ∈ M (∆) com ∆
∞
(26)
< 1/ β se só se supω∈R µ∆ (G ( jω )) ≤ β .
26
ω1
e1
∆
G( s)
ω2
e2
Figura 27
Prova:
(Suficiência): Temos sup s∈C µ∆ (G ( s )) = supω∈R µ∆ (G ( jω )) ≤ β , esta desigualdade
+
por hipótese do teorema. Portanto, det( I − G ( s )∆ ( s )) ≠ 0 para todo s ∈ C + ∪ {∞}
sempre que ∆
∞
< 1/ β , isto é, o sistema é robustamente estável.
(Necessidade): Suponha que supω∈R µ∆ (G ( jω )) > β . Então existe um ω0 , 0 < ω0 < ∞ ,
tal que µ∆ (G ( jω0 )) > β . De acordo com a observação (8), existe um complexo ∆ c ∈ ∆
tal que cada bloco cheio tenha posto 1 , σ ( ∆ c ) < 1/ β e tal que I − G ( jω ) ∆ c é singular.
A seguir, usando o mesmo tipo de prova do teorema do pequeno ganho, pode-se
encontrar uma matriz racional ∆ ( s ) tal que ∆ ( s ) ∞ = σ (∆ c ) < 1/ β , ∆ ( jω0 ) = ∆ c e
∆ ( s ) desestabiliza o sistema.
•
Desempenho robusto
Suponha que G p seja uma matriz de transferência racional, real, estavel e própria com
q1 + q2 entradas e p1 + p2 saídas.
G12 ⎤
⎡G
. Seja ∆ ⊂ C q1× p1 uma estrutura em blocos como em (5*). DefinaG p ( s ) = ⎢ 11
⎥
⎣G21 G22 ⎦
⎧⎪ ⎡ ∆ 0 ⎤
⎫⎪
se uma estrutura em bloco aumentada: ∆ p := ⎨ ⎢
: ∆ ∈ ∆ , ∆ f ∈ C q2 × p2 ⎬ .
⎥
⎩⎪ ⎣ 0 ∆ f ⎦
⎭⎪
Queremos estudar o problema do desempenho robusto conforme a figura 28.
27
∆( s)
G p (s)
z
w
Figura 28
A matriz de transferência de w a z é, como sabemos, Y u (G p , ∆ ) .
Teorema
Seja β > 0 Para todo ∆ ( s ) ∈ M (∆) com ∆
internamente estável e Y u (G p , ∆ )
∞
(29)
<1/β o SMF da figura 28 é bem posto,
∞
≤ β se só se supω∈R µ∆ p (G p ( jω )) ≤ β .
•
Observe-se que estabilidade interna implica supω∈R µ∆ (G11 ( jω )) ≤ β . Portanto a prova
deste teorema é ao longo das linhas do teorema (26).
Este é um teorema muito útil, ele é, como se pode ver, uma extensão do teorema do
pequeno ganho. Ele nos diz que o problema do desempenho robusto é equivalente ao
problema da estabilidade robusta com a incerteza ∆ .
6.4 Visão de conjunto da síntese usando µ
Nesta seção mostraremos como a teoria de análise discutida nas seções anteriores leva
naturalmente aos problemas de síntese.
Dos resultados obtidos vimos como cada caso leva a calcular
(31)
M α com α =2, ∞ ou então µ .
Obtemos, com a malha fechada sempre uma LFT, como na figura 32 que segue.
z
G
w
K
Figura 32
28
Y l (G , K ) = G11 + G12 K ( I − G22 K ) −1 G21 ,
⎡ G11 G12 ⎤
onde G = ⎢
⎥ é escolhida respectivamente como:
G
G
22 ⎦
⎣ 21
⎡ P22
- no caso de apenas desempenho nominal ( ∆ = 0 ): G = ⎢
⎣ P32
⎡ P11 P13 ⎤
- no caso de estabilidade robusta somente: G = ⎢
⎥.
⎣ P31 P33 ⎦
P23 ⎤
P33 ⎥⎦
- no caso de desempenho robusto:
⎡ P11 P12 | P13 ⎤
⎢P P | P ⎥
23 ⎥
.
G = P = ⎢ 21 22
⎢−
− ⋅ −⎥
⎢
⎥
⎣ P31 P32 | P33 ⎦
E cada situação leva ao problema de síntese
min K Y l (G , K ) α , com α =2, ∞, ou µ ,
(33)
sujeito à estabilidade interna do sistema nominal.
O problema de síntese com α =2 foi resolvido nos anos 60’s, o problema com α = ∞
foi resolvido ao final dos anos 80’s, o segundo autor de ZDG tendo tido atuação de
liderança, o terceiro autor também tendo contribuído. O problema com µ ainda é (?)
objeto de pesquisa.
Estes três problemas são o foco do resto deste texto.
7º. Capítulo: Parametrização dos controladores estabilizadores
A configuração básica dos problemas deste capítulo é uma LFT como a figura 34, onde G
é uma planta generalizada com dois conjuntos de entradas: os sinais exógenos w que
incluem distúrbios e comandos e os sinais de controle u , usulamente através de
atuadores, incorporados a G. A planta tem também dois conjuntos de saídas: as
respostas medidas, usulamente através de sensores, incorporados a G, e as respostas
reguladas z.
29
z
w
G
y
u
K
Figura 34
Neste capítulo nos ocuparemos somente do problema de síntese de estabilização do SMF,
ou seja, como diz mais ou menos o título do capítulo, achar o conjunto de todos os
controladores que estabilizam o SMF.
7.1 Existência de Controladores estabilizadores
Suponnha que G tenha uma realização estabilizável e detectável dada por:
⎡A
⎡ G11 ( s ) G12 ( s ) ⎤ ⎢
G (s) = ⎢
⎥ = ⎢ C1
⎣G21 ( s ) G22 ( s ) ⎦ ⎢C
⎣ 2
B1
D11
D21
B2 ⎤
D12 ⎥⎥
D22 ⎥⎦
(1)
Definição:
(1*)
Um controlador próprio K(s) é dito admissível se estabilizar internamente G (isto é, se
ele estabilizar internamente a malha).
(2)
Lema:
Existe um controlador K que estabiliza internamente a malha se só se ( A, B2 ) é
estabilizável e (C2 , A) é detectável. Isto posto, sejam F e L tais que
A + B2 F e A + LC2 sejam estáveis; então um controlador estabilizador é dado por
⎡ A + B2 F + LC2 + LD22 F
K (s) = ⎢
F
⎣
−L⎤
0 ⎥⎦
(O controlador do tipo acima é chamado de controlador com base em observador).
Prova:
(Suficiência): Sendo G estabilizável e detectável, existem F e L tais que
A + B2 F e A + LC2 são estáveis.
Temos as eqs. da planta
x = Ax + B2u , y = C2 x + D22u .
(2*)
30
Usemos o controlador sugerido pelo enunciado do Lema:
u ( s) = F ( sI − A − B2 F − LC2 − LD22 F )−1 (− L) y ( s) ,
isto é,
xˆ = ( A + B2 F + LC2 + LD22 F ) xˆ − Ly ,
u = Fxˆ .
(2**)
(2#)
De (2**) em vista de (2#) e da segunda eq. de (2*), temos
xˆ = ( A + B2 F + LC2 + LD22 F ) xˆ − LC2 x − LD22 Fxˆ
= ( A + B2 F + LC2 ) xˆ − LC2 x .
Da primeira de (2*) com (2#) e desta última, temos as eqs. de estado do SMF:
⎡ x⎤ ⎡ A
⎢ ⎥=⎢
⎣ xˆ ⎦ ⎣ − LC2
⎤ ⎡ x⎤
.
⎥
A + B2 F + LC2 ⎦ ⎢⎣ xˆ ⎥⎦
B2 F
(2##)
⎡I
0⎤
Premultiplicando a matriz do sistema acima por ⎢
⎥ e pós multiplicando pela sua
⎣−I I ⎦
inversa (uma transformação de similaridade) obtemos
⎡ A + B2 F
⎢ 0
⎣
B2 F ⎤
.
A + LC2 ⎥⎦
(2$)
A matriz que premultiplica a matriz do sistema, também tem que multiplicar o lado
esquerdo de (2##), obtendo-se
⎡ x ⎤
⎢
⎥ , a segunda componente desta sendo a derivada do “erro” entre os dois estados.
⎣ xˆ − x ⎦
Isto é algo familiar, pois não? Trata-se da diferença que apareceu na eq. do observador
entre o estado estimado e o estado da planta. Eis porque o controlador deste Lema é
chamado de “controlador baseado em observador”.
Ora, de (2$) vemos que seus autovalores são os de A + B2 F e os de A + LC2 . Isto prova
a suficiência da condição do Lema.
(Necessidade): Se ( A, B2 ) não for estabilizável ou se (C2 , A) não for detectável, a
matriz de sistema dada em (2$) não será estável.
•
A esabilizabilidade e detectabilidade de ( A, B2 , C2 ) serão pressupostas no resto deste
capítulo.
Lema:
Suponha que a realização “herdada”
⎡A
G22 = ⎢
⎣ C2
B2 ⎤
D22 ⎥⎦
(3)
(3*)
31
seja estabilizável e detectável. Então o SMF da figura 34 é internamente estável se só se o
da figura 35 o for:
G22
y
u
K
Figura 35
Ou por outras palavras, K estabiliza internamente G se só se estabilizar internamente
G22 .
Prova: Reportamo-nos à matriz de transferência da planta dada em (1), em que a primeira
“linha” se refere à resposta controlada da planta, enquanto que a segunda “linha” é a que
nos interessa, pois se refere à resposta realimentada da planta, que é a entrada do
controlador K. Mas na segunda linha a coluna que nos interessa do ponto de vista da
estabilidade é a segunda, uma vez que a primeira relaciona a resposta realimentada com o
sinal exógeno, o qual não afeta a estabilidade da planta.
•
(4)
Observação:
Sabemos que uma realização de uma matriz não é única. Claro que outras realizações de
G22 acima podem não ser estabilizáveis e/ ou detectáveis.
Assim por exemplo, se
G22 =
⎡ −1 1 ⎤
1
=⎢
s + 1 ⎣ 1 0 ⎥⎦
é claro que esta é uma realização mínima, isto é, controlável e observável. E a fortiori é
estabilizável e detectável.
Mas a realização seguinte
⎡ −1 0 1 ⎤
1
G22 = ⎢⎢ 0 1 0 ⎥⎥ =
s +1
⎢⎣ 1 0 0 ⎥⎦
nem é estabilizável nem detectável.
32
7.2 Dualidade e problemas especiais
Nesta seção discutiremos quatro problemas, dos quais são obtidas as soluções para o
sistema com realimentação da resposta.
Como vimos, dizemos que os conceitos de controlabilidade (estabilizabilidade,
respectivamente) e observabilidade (detectabilidade, respectivamente) são duais por
causa da dualidade entre (C , A, B ) e ( BT , AT , C T ) , ou seja a primeira tripla é controlável
(estabilizável) se a segunda for observável (detectável) e vice-versa.
Este conceito de dualidade pode ser generalizado, como segue.
Considere o diagrama de blocos padrão:
z
w
G
y
u
K
Figura 36
Agora considere o sistema:
z
w
GT
u
y
KT
Figura 37
Da figura 36 temos a matriz de transferência entre z e w dada por
Y l (G , K ) = G11 + G12 K ( I − G22 K ) −1 G21 .
Consequentemente, temos
(Y l (G , K ))T = (G11 )T + (G21 )T ( I − K T (G22 )T ) K T (G12 )T
−1
(
= (G11 )T + (G21 )T K T I − (G22 )T K T
)
−1
(G12 )T .
T
⎡ G11T ( s ) G21
(s) ⎤
⎥.
T
T
G
(
s
)
G
(
s
)
⎣ 12
⎦
22
E portanto a matriz de transferência entre z e w da figura 37 é
Por outro lado, G T ( s ) = ⎢
33
T
T
Y l (G T , K T ) = G11T + G21
K T ( I − G22
K T ) −1 G12T ( s ) .
Portanto,
(Y l (G , K ))T P Y l (G T , K T )
E então é claro que K estabiliza internamente G se só se K T estabilizar internamente G T .
Consideremos agora os quatro problemas mencionados antes.
FI (“full information”) com a planta:
⎡
⎢
⎢ A
GFI = ⎢⎢ C1
⎢⎡ I ⎤
⎢⎢ ⎥
⎢⎣ ⎣0⎦
B1
D11
⎡0⎤
⎢ ⎥
⎣I ⎦
⎤
⎥
B2 ⎥
D12 ⎥⎥
⎡0⎤ ⎥
⎢ ⎥⎥
⎣0⎦ ⎥⎦
O nome “full information” fica claro quando se vê que a resposta realimentada da planta
⎡ x⎤
é y =⎢ ⎥.
u
⎣ ⎦
FC (“full control”) com a planta:
A
B1
GFC = C1
C2
D11
D21
[I
[0
[0
0]
I]
0]
A justificativa do nome fica clara em vista do fato que a resposta do controlador, u, entra
diretamente na planta, sem passar pelas matrizes “ B2 ” e “ D2 ”.
DF (“disturbance forward”) com a planta correspondente:
GDF
⎡A
= ⎢⎢ C1
⎢⎣C2
B1
D11
I
B2 ⎤
D12 ⎥⎥
0 ⎥⎦
Agora é o sinal exógeno que entra diretamente.
OE (“output estimation”) com a planta correspondente:
34
GOE
⎡A
= ⎢⎢ C1
⎢⎣C2
B1
D11
D21
B2 ⎤
I ⎥⎥
0 ⎥⎦
Agora a saida do controlador entra diretamente na parte da planta que dá o sinal
controlado, z.
A seguir, temos
Lema:
Sejam GFI e GDF dados acima. Então,
(5)
⎡ I 0 0⎤
(i) GDF ( s ) = ⎢
⎥ GFI ( s ) ,
⎣ 0 C2 I ⎦
(ii) GFI = S(GDF , PDF ) , onde S(⋅,⋅) é o produto estrelado, indicado no diagrama de blocos
da figura 38 e PDF é dado também abaixo.
GDF
PDF
Figura 38
PDF ( s ) =
A − B1C2
B1
B2
0
0
I
⎡ I ⎤
⎢ −C ⎥
⎣ 2⎦
⎡0⎤ ⎡0⎤
⎢ I ⎥ ⎢0⎥
⎣ ⎦ ⎣ ⎦
Prova:
O Lema usa o “produto estrelado” de Redheffer. As ligações entre entradas e resposta é
“arrevesada”, e isto tem implicações em termos de complicação das expressões, a saber:
35
⎡ P11
⎣ P21
Sejam P = ⎢
P12 ⎤
⎡ K11
e K =⎢
⎥
P22 ⎦
⎣ K 21
K12 ⎤
.
K 22 ⎥⎦
Então o produto estrelado de Redheffer é definido como
⎡ Y l ( P, K11 )
S ( P, K ) := ⎢
−1
⎣ K 21 ( I − P22 K11 )
P12 ( I − K11P22 ) −1 K12 ⎤
⎥.
Y u ( K , P22 )
⎦
A prova do Lema, bem como as dos resultados que se segume são omitidas, posto que
•
muito complicadas.
(6)
Teorema:
Sejam GFI , GDF e PDF dados acima. Então,
(i) K FI = K DF [C2
I ] estabiliza internamente GFI se K DF estabilizar internamente
GDF . Alem disso, Y l ( GFI , K DF [C2
I ]) = Y l ( GDF , K DF ) .
(ii) Suponha que A − B1C2 seja estável. Então K DF = Y l ( PDF , K FI ) (mostrada na figura
39) estabiliza internamente GDF se K FI estabilizar inernamente GFI . Alem disso,
Y l ( GDF , Y l ( PDF , K FI ) ) = Y l ( GFI , K FI ) .
u
PDF
yDF
u
ŷ
K FI
Figura 39
36
Vejamos agora a equivalência entre os problemas FC e OE, que aparecem na figura
40.
z
w
GFC
w
z
GOE
u
yFC
K FC
u
yOE
K OE
Figura 40
Temos resultados semelhantes aos anteriores:
Lema:
Sejam GFC e GOE dados acima. Então,
(7)
⎡I 0 ⎤
(i) GOE ( s ) = GFC ( s ) ⎢⎢0 B2 ⎥⎥ ,
⎢⎣0 I ⎥⎦
(ii) GFC = S(GOE , POE ) , onde,
A − B2C1 0
POE ( s ) =
C1
0
C2
I
[ I − B2 ]
[0 I ]
[ 0 0]
Teorema:
Sejam GOE , POE e GFC dados acima.
(8)
⎡B ⎤
(i) K FC := ⎢ 2 ⎥ K OE estabiliza internamente GFC se K OE estabilizar internamente GOE .
⎣I ⎦
⎛
⎞
⎡B ⎤
Alem disso, Y l ⎜ GFC , ⎢ 2 ⎥ K OE ⎟ = Y l ( GOE , K OE ) .
⎣I ⎦
⎝
⎠
(ii) Suponha que A − B2C1 seja estável. Então, K OE = Y l ( POE , K FC ) (figura 41) estabiliza
internamente GOE se K FC estabilizar internamente GFC . Alem disso,
Y l ( GOE , Y l ( POE , K FC ) ) = Y l ( GFC , K FC ) .
37
u
y
POE
û
ŷ
K FC
Figura 41
7.3 Parametrização de todos os controladores estabilizadores
Considere novamente o diagrama de blocos padrão da figura 34, repetida abaixo
z
w
G
y
u
K
Figura 34 bis
onde, como vimos ao início do capítulo, G é definido como
⎡A
⎡ G11 ( s ) G12 ( s ) ⎤ ⎢
G (s) = ⎢
⎥ = ⎢ C1
(
)
(
)
G
s
G
s
⎣ 21
⎦ ⎢C
22
⎣ 2
B1
D11
D21
B2 ⎤
D12 ⎥⎥
D22 ⎥⎦
Supomos, como antes, que ( A, B2 ) é estabilizável e (C2 , A) é detectável.
Nosso objetivo nesta seção é resolver o seguinte problema: dada a planta G, parametrizar
todos os controladores K que estabilizam internamente G.
A parametrização de todos os controladores estabilizadores é chamada usualmente de
“parametrização de Youla”. Como visto antes, os controladores estabilizadores dependem
somente de G22 .
Suponhamos primeiramente que a planta G seja estável.
Teorema
(9)
38
Suponha que G ∈ RH ∞ . Então, o conjunto de todos os controladores estabilizadores
pode ser dado por K = Q( I + G22Q) −1 ,
onde Q ∈ RH ∞ , I + D22Q(∞) não singular.
Prova:
Do diagrama de blocos, temos
y = G21w + G22u , u = Ky = KG21w + KG22u ∴ u = ( I − KG22 ) −1 KG21w .
A estabilidade fica definida pelos zeros de I − KG22 , ou seja, ( I − KG22 ) −1 tem que ser
estável.
Substituindo K dado acima, temos
( I − KG22 ) −1 = ( I − Q( I + G22Q) −1 G22 ) = ( I − QG22 ( I + QG22 ) −1 )
−1
(
= ( I + QG22 − QG22 )( I + QG22 ) −1
)
−1
−1
= I + QG22 ∈ RH ∞ , estabelecendo a suficiência
da condição
Por outro lado, suponha que K seja um controlador estabilizador. Vimos no capítulo (?)
que
−1
−K ⎤
⎡ I
Estabilidade interna ⇔ ⎢
∈ RH ∞ . Mas o elemento (1,2) desta matriz é,
I ⎥⎦
⎣ −G22
como vimos, K ( I − G22 K ) −1 . Definamos Q := K ( I − G22 K ) −1 ∴ Q − QG22 K = K
∴ ( I + QG22 ) K = Q ∴ K = ( I + QG22 ) −1 Q = Q( I + G22Q) −1
E observe-se que a invertibilidade na última eq. é garantida pelo fato de o SMF ser bem
posto, visto que I + D22Q (∞ ) = ( I − D22 K (∞ )) −1 .
•
Quando G não é estável, a parametrização é mais complicada. Mais adiante, neste
capítulo, daremos a prova do respectivo teorema usando o método das fatorações
coprimas, que foi o método usado por Youla, que deu o nome a esta parametrizacao.
Por ora, temos o resultado usando as matrizes das eqs. de estado:
(10)
Teorema:
Sejam F e L tais que A + LC2 e A + B2 F são estáveis. Então, todos os controladores que
estabilizam G no SMF podem ser parametrizados como a matriz de transferência entre
y e u na figura abaixo:
39
u
y
J
Q
Figura 42
onde J é dado por
⎡ A + B2 F + LC2 + LD22 F
J = ⎢⎢
F
⎢⎣
−(C2 + D22 F )
− L B2 + LD22 ⎤
⎥
0
I
⎥
I
− D22 ⎥⎦
com qualquer Q ∈ RH ∞ tal que I + D22Q(∞) seja não singular.
A prova deste teorema segue os mesmos passos do anterior, mas não dá muita
compreensão do problema.
No que se segue, é apresentada uma nova (à época da edição do livro) abordagem,
reduzindo o problema de realimentação da resposta a problemas mais simples como o FI
e OE, ou FC e DF
Controladores estabilizadores para os problemas FI e FC
Vamos examinar primeiramente a estrutura FI, conforme a figura 43 abaixo
z
GFI
yFI
w
u
K FI
Figura 43
onde, como vimos,
40
⎡
⎢
⎢ A
GFI = ⎢⎢ C1
⎢⎡ I ⎤
⎢⎢ ⎥
⎢⎣ ⎣0⎦
B1
D11
⎡0⎤
⎢ ⎥
⎣I ⎦
⎤
⎥
B2 ⎥
D12 ⎥⎥
⎡0⎤ ⎥
⎢ ⎥⎥
⎣0⎦ ⎥⎦
Queremos obter a classe de todos os compensadores K FI que estabilizam GFI no SMF.
E obtemos um resultado bastante simples:
(11)
Lema:
Seja F uma matriz constante tal que A + B2 F seja estável. Então a classe de todos os
compensadores para o problema FI pode ser parametrizada por
K FI ( s ) = [ F Q( s ) ] , com qualquer Q( s ) ∈ RH ∞ .
Prova: imediata: com efeito, conforme a expressao de
GFI
acima,
⎡I ⎤
yFI = ⎢ ⎥ ( sI − A) −1 B2u .
⎣0 ⎦
•
Agora consideramos o problema dual do anterior, o FC, dado na figura 44 abaixo:
z
GFC
yFC
w
u
K FC
Figura 44
(12)
Lema
Seja L uma matriz constante tal que A + LC2 é estável. Então a classe de todos os
⎡ L ⎤
controladores estabilizadores pode ser parametrizada por K FC ( s ) = ⎢
⎥ , Q ( s ) ∈ RH ∞
⎣Q ( s ) ⎦
e de resto qualquer.
Controladores estabilizadores para problemas DF e OE
No caso do problema DF temos o diagrama de blocos da fig. 45 abaixo.
41
z
GDF
yDF
w
u
K DF
Figura 45
Recorda-se que a matriz de transferência acima é:
GDF
⎡A
= ⎢⎢ C1
⎣⎢C2
B1
D11
I
B2 ⎤
D12 ⎥⎥
0 ⎦⎥
Obtem-se o seguinte resultado, com a restrição que A − B1C2 seja estável. Esta hipótese é
feita para simplificar, ela não é necessária para a solução do problema.
(13)
Lema
Supondo que A − B1C2 seja estável, todos os controladores estabilizadores para o
problema DF podem ser caracterizados por K DF = Y l ( J DF , Q ) , com Q ∈ RH ∞ e
J DF
⎡ A + B2 F − B1C2
F
= ⎢⎢
⎢⎣
− C2
B1
0
I
B2 ⎤
I ⎥⎥
0 ⎥⎦
Prova: ZDG, p. 315.
E passamos ao dual do problema anterior, o OE. O diagrama de blocos correspondente
está na figura 46 abaixo:
z
GOE
yOE
w
u
K OE
Figura 46
42
Agora suporemos que A − B2C1 seja estável. Tal como no problema anterior, esta
hipótese é feita para simplificar, ela não é necessária para a solução do problema.
(14)
Lema:
Suponha que A − B2C1 seja estável. Então todos os controladores estabilizadores para o
problema OE podem ser caracterizados como Y l ( J OE , Q0 ) , com Q0 ∈ RH ∞ e J OE dado
por:
⎡ A − B2C1 + LC2 L − B2 ⎤
J OE = ⎢⎢
C1
I ⎥⎥
0
⎢⎣
I
− C2
0 ⎥⎦
Prova: ZDG, p. 316
Realimentação da resposta e separação:
A partir do que foi visto agora, pode-se demonstrar o Teorema (10), cuja prova é dada,
como dito, por ZDG, pp. 317s.
Observação:
O Teorema (10) mostra que qualquer controlador estabilizador K(s) pode ser
caracterizado como uma LFT de um parâmetro matricial Q ∈ RH ∞ , isto é,
(15)
K ( s ) = Y l ( J , Q ) . Mais ainda, usando os argumentos (omitidos neste texto, mas
encontrados em ZDG no local indicado) do Lema (13), uma realização de Q( s ) em
termos de K(s) pode ser obtida como
Q = Y l Jˆ , K ,
(
)
onde
⎡ A
Jˆ = ⎢⎢ − F
⎢⎣ C2
−L
0
I
B2 ⎤
I ⎥⎥
D22 ⎥⎦
e K(s) tem realização estabilizável e detectável.
7.4 Estrutura da parametrização do controlador
Recordando o que fizemos: começamos com uma realização estabilizável e detectável de
G22 :
43
⎡A
G22 = ⎢
⎣ C2
B2 ⎤
D22 ⎥⎦
Escolhemos F e L tais que A + B2 F e A + LC2 são estáveis. Definimos J pela
fórmula do Teorema (10), que repetimos aqui:
⎡ A + B2 F + LC2 + LD22 F
J =⎢
F
⎢
−(C2 + D22 F )
⎣⎢
−L
B2 + LD22 ⎤
0
I
I
− D22
⎥
⎥
⎦⎥
Então os K’s próprios que estabilizam internamente o SMF são preciasamente aqueles da
Figura 47 abaixo
Figura 47
com K = Y l ( J , Q ) , Q ∈ RH ∞ e I + D22Q(∞) , não singular.
É fato interessante que na figura acima, o que está dentro do tracejado é um controlador
estabilizador baseado em observador, caracterizado pelo fato de que não somente y, mas
também u, são entradas para o controlador.
O resultado acima também sugere outra interpretação interessante: toda estabilização
interna consiste em adicionar dinâmicas estáveis à planta e então estabilizar a planta
aumentada por meio de um observador.
O resultado preciso desta afirmação é dado pelo Teorema (16) abaixo, onde, para
simplificar os cálculos, e sem perda de generalidade, supomos que G22 e K são
estritamente próprias.
44
Teorema:
(16)
Suponha que G22 e K sejam estritamente próprias e que o sistema da figura 34, repetida
abaixo, seja internamente estável. Então o sistema pode ser embutido (“imbedded”) em
um sistema
⎡ Ae
⎢C
⎣ e
Be ⎤
, com
0 ⎥⎦
⎡A 0 ⎤
Ae = ⎢
⎥,
⎣ 0 Aa ⎦
⎡B ⎤
Be = ⎢ 2 ⎥ ,
⎣0⎦
Ce = [ C 2
0] ,
Aa estável e K
⎡ A + Be Fe + LeCe
K =⎢ e
Fe
⎣
− Le ⎤
0 ⎥⎦
onde Ae + Be Fe e Ae + LeCe são estáveis.
Prova:
Repetimos a figura 34:
z
w
G
y
u
K
Figura 34 ter
K pode ser representado pela figura 47 para algum Q ∈ RH ∞ . Para que K seja
estritamente própria, Q tem que ser também estritamente própria. Considere uma
realização mínima de Q:
⎡A
Q=⎢ a
⎣ Ca
Ba ⎤
0 ⎥⎦
Como Q ∈ RH ∞ , então Aa é estável. Sejam x e xa vetores de estado correspondentes a
J e Q, respectivamente.
As eqs. do sistema da figura 47 são:
x = ( A + B2 F + LC2 ) x − Ly + B2 y1 ,
u = Fx + y1 ,
u1 = −C2 x + y .
45
Por outro lado,
xa = Aa xa + Ba u1
y1 = Ca xa .
Definamos:
⎡x⎤
⎡ L ⎤
xe := ⎢ ⎥ , Fe := [ F Ca ] , Le := ⎢
⎥
⎣ xa ⎦
⎣ − Ba ⎦
As eqs. acima nos levam a
xe = ( Ae + Be Fe + LeCe ) xe − Le y ,
u = Fe xe .
•
7.5 Matriz de transferência do SMF
Lembra-se que o SMF entre w e z é uma LFT, Y l ( G , K ) , e que K estabiliza G se só se
estabilizar G22 . Ora, da figura 47 obtemos a figura 48, definindo tudo o que não é Q
como T de acordo com
z = Y l ( G, K ) w = Y l ( G, Y l ( J , Q) ) w = Y l (T , Q ) w .
z
w
T
Q
Figura 48
.
Uma realização de T é dada pelo
(17)
Teorema:
Sejam F e L tais que A + BF e A + LC sejam estáveis. Então, o conjunto de todas as
matrizes de transferência de w para z que podem ser obtidas com um contralador
estabilizador próprio é igual a
Y l (T , Q ) = {T11 + T12QT21 : Q ∈ RH ∞ , I + D22Q (∞) tem inversa} ,
onde T é dada por
⎡T
T = ⎢ 11
⎣T21
⎡ A + B2 F
0
T12 ⎤ ⎢⎢
=
⎥
T21 ⎦ ⎢C1 + D12 F
⎢
0
⎣
− B2 F
A + LC2
B1
B1 + LD21
− D12 F
D11
C2
D21
B2 ⎤
0 ⎥⎥
D12 ⎥
⎥
0 ⎦
46
Prova: A prova é, segundo ZDG, p. 323, “imediata” usando o produto estrelado no
espaço de estado, “com alguma álgebra tediosa”.
7.6 Parametrização de Youla através de fatorações coprimas.
Damos agora o que foi anunciado algumas páginas antes:
Teorema:
Sejam G22 = NM −1 = M −1 N , fatorações c.d. e c.e., respectivamente, sobre
(18)
RH ∞ . Sejam
U 0 ,V0 , U 0 e V0 ∈ RH ∞ e tais que satisfaçam a identidade de Bezout:
⎡ V0 −U 0 ⎤ ⎡ M U 0 ⎤ ⎡ I 0 ⎤
⎢
⎥⎢
⎥=⎢
⎥ . (A existência de U 0 , V0 , U 0 e V0 ∈ RH ∞ satisfazendo a
⎣ − N M ⎦ ⎣ N V0 ⎦ ⎣0 I ⎦
esta igualdade é garantida pelo fato de NM −1 = M −1 N serem fatorações coprimas).
Então o conjunto de todos os compensadores estabilizadores é parametrizado por uma das
duas fórmulas seguintes:
(18a)
K = (U 0 + MQr )(V0 + NQr ) −1 , det( I + V0−1 NQr )(∞) ≠ 0, Qr ∈ RH ∞ ,
K = (V0 + Ql N ) −1 (U 0 + Ql M ), det( I + Ql NV0 −1 )(∞) ≠ 0, Ql ∈ RH ∞ .
(18b)
Como Qr e Ql têm a mesma dimensão, nada impede de igualá-los, uma vez que são
arbitrários, a menos das condições det( I + V0−1 NQr )(∞) ≠ 0 e det( I + Ql NV0 −1 )(∞) ≠ 0 , as
quais são equivalentes, isto é, uma ocorre se só se a outra ocorrer. Então, definindo
Qy := Qr = Ql , temos K = (U 0 + MQy )(V0 + NQy ) −1
= (V0 + Qy N ) −1 (U 0 + Qy M )
= Y l ( J y , Qy ) ,
⎡U V −1 V0−1 ⎤
onde J y = ⎢ 0 −01
⎥.
V0−1 N ⎦
⎣ V0
(18c)
(18d)
Prova: Vamos provar (18a), a prova da outra sendo dual.
Primeiramente, vamos provar que se K for da forma (18a), estabiliza o SMF e é própria.
Sejam definidos U := U 0 + MQr , V := V0 + NQr , que são o numerador e denominador,
respectivamente, de (18a). Ora,
MV − NU = M (V0 + NQr ) − N (U 0 + MQr ) = MV0 − NU 0 + ( MN − NM )Qr = I ,
o que prova que K estabiliza o SMF e é própria, pois det( I + V0−1 NQr )(∞) ≠ 0 .
Agora vamos provar que se K for própria e estabilizar o SMF, então tem a forma de
(18a). Seja K = UV −1 , uma fatoração c.d. em RH ∞ . Então, Z := MV − NU tem inversa
em
RH ∞
porque K estabiliza o SMF.
Definamos Qr pela equação: U 0 + MQr = UZ −1 , ou seja, Qr = M −1 (UZ −1 − U 0 ) .
Então, usando a identidade de Bezout, temos
(19)
47
V0 + NQr = V0 + NM −1 (UZ −1 − U 0 ) = V0 + M −1 N (UZ −1 − U 0 ) = M −1 ( MV0 − NU 0 + NUZ −1 )
= M −1 ( I + NUZ −1 ) = M −1 ( Z + NU ) Z −1 = M −1MVZ −1 = VZ −1 .
Portanto K = UV −1 = (U 0 + MQr )(V0 + NQr )−1 .
Para ver que Qr ∈ RH ∞ , note que, como observado, Z tem inversa em
(20)
RH ∞
e portanto,
de (19), MQr ∈ RH ∞ e de (20) vemos que NQr ∈ RH ∞ . Ora,
Qr = (V0 M − U 0 N )Qr = V0 MQr − U 0 NQr ∈ RH ∞ .
•
E temos o Corolário imediato:
Corolário:
(21)
Seja um controlador admissível (isto é que estabiliza o SMF e é próprio) K com as
fatorações coprimas K = UV −1 = V −1U . Então o parâmetro livre Qy ∈ RH ∞ na
parametrização de Youla é dado por Qy = M −1 (UZ −1 − U 0 ) , onde Z = MV − NU .
O teorema seguinte dá a relação entre a parametrização acima, de Youla, e a que foi
obtida nas seções anteriores, utilizando LFT´s.
Teorema:
Sejam as fatorações coprimas de G22 tais que
⎡M
⎢N
⎣
⎡ V0
⎢
⎣− N
⎡ A + B2 F
U0 ⎤ ⎢
=
F
V0 ⎥⎦ ⎢
⎢⎣C2 + D22 F
⎡ A + LC2
−U 0 ⎤ ⎢
F
⎥=
M ⎦ ⎢
⎢⎣ C2
B2
I
D22
(22)
−L⎤
0 ⎥⎥
I ⎥⎦
−( B2 + LD22 ) L ⎤
I
0 ⎥⎥
− D22
I ⎥⎦
onde F e L são escolhidos tais que A + B2 F e A + LC2 são estáveis. Então, pode-se
verificar que
⎡ A + B2 F + LC2 + LD22 F
J y = ⎢⎢
F
⎢⎣
−(C2 + D22 F )
− L B2 + LD22 ⎤
⎥
0
I
⎥
⎥⎦
0
I
Prova: segue de álgebra “tediosa”, segundo ZDG, p. 326.
Observação:
(23)
−1
J y acima é o mesmo J do Teorema (10) e K 0 := U 0V0 é um controlador estabilizador
baseado em observador com
48
⎡ A + B2 F + LC2 + LD22 F
K 0 := ⎢
F
⎣
−L⎤
0 ⎥⎦
8º. Capítulo: Equações algébricas de Riccati
As eqs. algébricas de Riccati (abreviada ARE, “algebric Riccati equations”) têm várias
aplicações em problemas de síntese de Controle. De modo particular, elas têm um papel
central na solução dos problemas de controle ótimo em H 2 e H ∞ .
Sejam A, Q, e R matrizes reais, n × n, sendo Q e R simétricas.
Então, a ARE em X é definida por
A* X + XA + XRX + Q = 0 .
(1)
Associemos a esta equação a matriz
⎡A R ⎤
.
H := ⎢
*⎥
⎣Q − A ⎦
(2)
(Uma matriz desta forma é chamada de hamiltoniana). Esta matriz será usada para
obtermos as soluções de (2).
Observe-se que σ ( H ) , o spectrum de H, é simétrico em relação ao eixo imaginário. Para
ver isto, considere a seguinte matriz 2n × 2n
⎡0 − I ⎤
, a qual satisfaz à propriedade J 2 = − I ∴ J −1 = − J .
J := ⎢
⎥
⎣I 0 ⎦
Temos então J −1 HJ = − JHJ = − H * .
Consequentemente, H e − H * são similares, o que implica que λ é um autovalor de
H se só se −λ o for.
Para nosso curso estamos interessados somente nas chamadas soluções estabilizadoras
das ARE’s. (Ver logo abaixo a definição). Para a solução geral, o leitor interessado
poderá ver, entre outros textos, ZDG, pp.328-333.
8.1 Soluções estabilizadoras e o Operador de Riccati
Nesta seção veremos quando uma solução da eq. de Riccati é dita estabilizadora, isto é,
quando σ ( A + RX ) ⊂ C− .
(Observe-se a notação que é padrão: σ (⋅) é o spectrum de uma matriz, isto é, o conjunto
de seus autovalores; para valores singualares, usa-se σ i (⋅) , indicando o i-ésimo valor
singular, ou σ (⋅) , que indica o maior valor singular e σ (⋅) , que indica o menor valor
singular).
49
Suponha que H, definida em (2), não tenha autovalor no eixo imaginário. Então terá n
autovalore em Re[s] > 0 e outros tantos autovalores em Re[s] < 0, simétricos com
relação ao eixo imaginário.
Definamos os espaços invariantes X − ( H ) e X + ( H ) , o primeiro correspondendo a
autovalores em Re[s] < 0 da matriz H e o segundo correspondendo a autovalores em
Re[s] > 0.
⎡1 0 ⎤
⎧0⎫
⎧1 ⎫
. Então, X − ( H ) = ⎨ ⎬ e X + ( H ) = ⎨ ⎬ .
A título de exemplo, seja H = ⎢
⎥
⎣0 −1⎦
⎩ −1⎭
⎩0 ⎭
⎡1 a ⎤
⎡1 0 ⎤
Observe-se que teremos os mesmos espaços se H = ⎢
ou H = ⎢
⎥
⎥ . É fácil,
⎣0 −1⎦
⎣ a −1⎦
com efeito, verificar que por “operações elementares”, os dois espaços geram qualquer
destas matrizes.
X − ( H ) é por definição um espaço invariante com relação ao operador H (que no caso é
uma matriz) se H (X − ( H )) ⊂ X − ( H ) ; ou seja, aplicando-se o operador ao espaço, fica-se
⎧1 ⎫
dentro do espaço. Assim, por exemplo, o espaço gerado pelo vetor x = ⎨ ⎬ é invariante
⎩0 ⎭
⎡a b⎤
com relação a qualquer matriz A da forma A = ⎢
⎥ , com a, b e c números reais
⎣0 c ⎦
⎧a ⎫
quaisquer. Com efeito, Ax = ⎨ ⎬ . (Estamos distinguindo aqui a notação de vetor para
⎩0 ⎭
aquela de matrix coluna; frequentemente estas notações são confundidas).
Seja uma base para X − ( H ) , consideremos cada vetor da base como matriz coluna e
coloquemos um ao lado do outro. Definamos as matrizes X 1 e X 2 , ambas pertencentes a
Cn×n (mas a base pode ser sempre escolhida de modo que estas matrizes sejam reais) e
⎡X ⎤
⎡X ⎤
tais que X − ( H ) = Im ⎢ 1 ⎥ , onde “Im” significa o espaço gerado pelo argumento ⎢ 1 ⎥ .
⎣X2 ⎦
⎣X2 ⎦
As matrizes X 1 e X 2 têm o mesmo número de linhas, conforme a partição da matriz H.
⎡0 ⎤
Se X 1 for não singular, ou equivalentemente se X − ( H ) e Im ⎢ ⎥ forem
⎣I ⎦
complementares, definamos X := X 2 X 1−1 . Pode-se provar que X é unicamente
determinada por H.
Denominemos “Ric” a função que leva de H a X e “dom(Ric)” o conjunto das
matrizes hamiltonianas H com duas propriedades já mencionadas, a saber, H não tem
autovalor no eixo imaginário e os dois espaços mencionados acima são complementares.
Estas propriedades serão chamadas de “propriedade de estabilidade” e “propriedade de
complementaridade”, respectivamente da matriz H. E a solução correspondente da eq. de
Riccati será chamada de “solução estável”.
Temos X = Ric(H) e Ric : dom( Ric) ⊂ R 2 n×2 n → R n×n .
50
Os resultados “bem conhecidos” (segundo ZDG) seguintes dão algumas propriedades de
X bem como condições para que H pertença a dom(Ric).
(3)
Teorema:
Suponha que H ∈ dom( Ric) e X = Ric(H). Então,
(i) X é real e simétrica;
(ii) X satisfaz à ARE: AT X + XA + XRX + Q = 0 ;
(iii) A + RX é estável.
(1bis)
Prova: ZDG, pp. 334s
(4)
Teorema
Suponha que H não tenha autovalor imaginário e que R seja ou positiva semidefinida
ou negativa semidefinida. Então, H ∈ dom( Ric) se só se (A, R) for estabilizável.
Prova: ZDG, pp. 335s
Uma situação que ocorre com frequência é a da matriz H dada no enunciado do teorema
seguinte:
(5)
Teorema
⎡ A
− BB ⎤
. Então, H ∈ dom( Ric) se só se (A,
Suponha que H tenha a forma H = ⎢ T
T ⎥
⎣ −C C − A ⎦
B) for estabilizável e (C, A) não tiver modo inobservável no eixo imaginário.
Alem disso, X = Ric(H) ≥ 0 (ou seja, é positiva semidefinida) se H ∈ dom(Ric) e
Ker( X ) = 0 se só se (C, A) não tiver modos inobserváveis estáveis.
T
(Note-se que Ker( X ) ⊂ Ker(C ) ).
Prova do Teorema (5): ZDG, pp. 337s
Exemplo:
(6)
Este exemplo mostra que a observabilidade de (C, A) não é condição necessária para a
existência de uma solução estabilizadora positiva definida:
⎡1 0 ⎤
⎡1⎤
A=⎢
, B = ⎢ ⎥ e C = [ 0 0] . É fácil verificar que ( A, B) é estado-estabilizável e
⎥
⎣0 2 ⎦
⎣1⎦
⎡ 18 −24 ⎤
(C, A) não é detectável. Enretanto, X = ⎢
⎥ > 0 é a solução estabilizadora.
⎣ −24 36 ⎦
⎡1 0 ⎤
⎡1⎤
⎡ −1 −1⎤
Com efeito, R = − BBT = − ⎢ ⎥ [1 1] = ⎢
, A + RX = ⎢
⎥+
⎥
⎣1⎦
⎣ −1 −1⎦
⎣0 2 ⎦
⎡ −1 −1⎤ ⎡ 18 −24 ⎤
⎢ −1 −1⎥ ⎢ −24 36 ⎥ =
⎣
⎦⎣
⎦
⎡1 0 ⎤ ⎡6 −12 ⎤
⎢0 2 ⎥ + ⎢6 −12 ⎥ =
⎣
⎦ ⎣
⎦
⎡7 −12 ⎤
⎢ 6 −10 ⎥ , cujos autovalores são dados
⎣
⎦
51
⎛ ⎡λ 0 ⎤ ⎡ 7 −12 ⎤ ⎞
2
pelas raízes do polinômio característico: det ⎜ ⎢
−⎢
⎟ = λ + 3λ + 2 , que é
⎥
⎥
⎝ ⎣ 0 λ ⎦ ⎣ 6 −10 ⎦ ⎠
um polinômio Hruwitz, pois polin. do 2º. grau com todos os coeficientes com o mesmo
sinal são Hurwitz.
(7)
Corolário:
Suponha que ( A, B) seja estabilizável e (C, A) detectável. Então a eq. de Riccati
AT X + XA − XBBT X + C T C = 0 tem uma única solução positiva definida. Além disso,
esta solução é estabilizadora.
Prova: ZDG, p. 339.
8.2 Funções positivas reais
Definição:
(9)
Uma matriz quadrada G ( s ) ∈ RH ∞ é dita real positiva (RP) se G ( jω ) + G ∗ ( jω ) ≥ 0 para
todo ω ∈ R . A função é dita estritamente real positiva (ERP) se G ( jω ) + G ∗ ( jω ) > 0
para todo ω ∈ R .
Antes de enunciar o próximo teorema, relembramos a notação padrão: G ~ ( s ) = GT (− s ) .
(10a)
Teorema
Seja
⎡
⎤
G ( s) = ⎢ A B ⎥
⎣⎢C D ⎦⎥
com A estavel, uma realização que não é necessariamente mínima. Suponha que existam
X ≥ 0, Q e R tais que
XA + AT X = −QT Q ,
B T X +W TQ = C ,
D + DT = W T W .
Então, G ( s ) é RP e G ( s ) + G ~ ( s ) = M ~ ( s ) M ( s ) ,
(10b)
(10c)
(10d)
onde
⎡A B⎤
M (s) = ⎢
⎥
⎣Q W ⎦
.
Alem disso, se M ( jω ) tiver posto de coluna cheio para todo ω real, então G ( s ) é
estritamente positiva real.
Prova: ZDG, p. 362
52
8.3 Funções “inner”
Definição:
(11)
~
Uma matriz de transferência N é chamada “inner” se N ∈ RH ∞ e N N = I . Uma
função de transferência N é chamada “co-inner” se N ∈ RH ∞ e NN ~ = I .
As duas noções são claramente duais, isto é, N é “inner” se só se N T for “co-inner”.
Definição:
(12)
Uma matriz de transferência N ∈ RL∞ é chamada passa-tudo (“all pass”) se for quadrada
e N~N = I .
É claro que uma função “inner” quadrada é passa-tudo. Observe-se que se uma matriz for
inner, ela terá pelo menos tantas linhas quanto colunas.
Se N for inner, com m colunas, para qualquer q ∈C m (um vetor complexo), temos
Nq = q , porque N ( jω )∗ N ( jω ) = I . E pela mesma razão, se v ∈ L2 , temos
Nv 2 = v 2 . Por causa desta propriedade de preservação da norma, as funções inner têm
muita aplicação nos problemas de síntese em controles.
(12*)
Lema
Seja
⎡A B⎤
N =⎢
⎥ ∈ RH ∞
⎣C D ⎦
e uma matriz X = X * ≥ 0 tal que A* X + XA + C *C = 0 .
Então,
(a) D*C + B* X = 0 implica N ~ N = D* D .
(b) (A, B) controlável e N ~ N = D* D implicam D*C + B* X = 0 .
Prova:
Da definição de N ~ , temos
⎡ − A*
N ~ ( s) = N T (− s) = ⎢ *
⎣B
−C * ⎤
⎥
D* ⎦
Utilizando a fórmula do produto de matrizes de transferência (matrizes em cascata),
temos
53
⎡ A
N ~ N = ⎢⎢ −C *C
⎢⎣ D*C
0
− A*
B*
B ⎤
−C * D ⎥⎥
D* D ⎥⎦
Apliquemos a esta matriz de transferência uma transformação de similaridade (que
sabemos que não a altera):
⎡ I
⎢− X
⎣
⎡ I
⎢− X
⎣
0⎤ ⎡ A
0 ⎤ ⎡ I 0⎤ ⎡
A
0 ⎤
=
⎥
⎢
⎥
⎢
⎥
⎢
I ⎦ ⎣ −C *C − A* ⎦ ⎣ X I ⎦ ⎣ − XA − C *C − A* X − A* ⎥⎦
0⎤ ⎡ B ⎤ ⎡
B
⎤
⎡ I 0⎤
*
*
, ⎡ D*C B* ⎤⎦ ⎢
=⎢
⎥
⎢
⎥ = ⎡⎣ D C + B X ⎤⎦ .
* ⎥
* ⎥ ⎣
I ⎦ ⎣ −C D ⎦ ⎣ − XB − C D ⎦
X
I
⎣
⎦
Donde,
A
0
⎡
⎢
*
*
N N = ⎢ −C C − A X − XA − A*
⎢⎣ B* X + D*C
B*
~
B
⎤
* ⎥
− XB − C D ⎥
D* D ⎥⎦
Mas por hipótese (enunciado do Lema), o elemento (2,1) da matriz “A” acima é nulo,
donde
A
⎡
⎢
0
N N =⎢
⎢⎣ B* X + D*C
~
0
− A*
B*
B
⎤
* ⎥
− XB − C D ⎥
D* D ⎥⎦
Ora, se (a), isto é, se D*C + B* X = 0 , então
−1
0 ⎤ ⎡B⎤
⎡ sI − A
N N = ⎣⎡0 B ⎦⎤ ⎢
+ D* D = D* D .
*⎥ ⎢ ⎥
sI + A ⎦ ⎣ 0 ⎦
⎣ 0
~
*
Se (b), usando o critério PBH do posto, então não há cancelamento nem em ( sI − A) −1 B
nem em B* ( sI + A* ) −1 , donde a conclusão.
•
Observação:
Este lema conduz imediatamente à caracterização de matrizes “inner” em termos de suas
representações no espaço de estado: acresecente-se simplemente a condição D* D = I ao
último Lema anterior para se obter N ~ N = I .
Observe-se ainda que na condição A* X + XA + C *C = 0 do enunciado do Lema, X é o
gramiano de observabilidade.
Em vista destas duas observações e do Lema anterior, temos imediatamente:
Corolário:
(13)
54
Suponha que
N
⎡A B⎤
⎥ seja estável e mínima.
⎣C D ⎦
=⎢
Seja X o gramiano de observabilidade. Então N é inner se só se
(a) DT C + BT X = 0 ,
(b) DT D = I .
8.4 Fatorações “inner”
O livro aborda este tema de modo abrangente, incluindo as fatorações “outer”. Aqui nos
limitamos ao seguinte resultado:
(13*)
Teorema:
⎡A B⎤
G=⎢
⎥ seja própria
⎣C D ⎦
e que (C, A) seja detectável. Então existe uma fatoração coprima G = M −1 N tal que
M é “inner” se só se G não tiver polo no eixo imaginário.
Uma realização particular no espaço de estado destes fatores é
⎡⎣ M
⎡ A + LC
N ⎤⎦ = ⎢
⎣ C
L B + LD ⎤
I
D ⎥⎦
⎡ A*
onde L = −YC * e Y = Ric ⎢
⎣0
−C *C ⎤
⎥ ≥ 0.
−A ⎦
8.5 Fatorações coprimas normalizadas
(14)
Definição:
−1
Sejam N , M ∈ RL∞ , G = NM , uma fatoração c.d. Esta fatoração é dita normalizada se
M ~M + N ~ N = I ,
⎡M ⎤
ou seja, se ⎢ ⎥ for inner.
⎣N⎦
De modo semelhante, G = M −1 N é uma fatoração c.e. normalizada se ⎡⎣ M N ⎤⎦ for coinner.
O livro apresenta um teorema sobre isso, com enunciado enorme, de quase uma página
(ZDG, pp. 370s)
55
9º. Capítulo: Controle ótimo H 2
9.1 Introdução ao problema do Regulador
Neste capitulo trataremos de problema bastante comum na prática do controle ótimo com
um critério de desempenho quadrático, que logo adiante será pecisado.
Considere o sistema dinâmico:
(1)
x = Ax + B2u, x(t0 ) = x0 ,
onde x0 é dado (arbitrário).
Nosso objetivo é achar um controle u (t ) definido em [0, T], o qual pode ser uma função
do estado x(t ) , tal que o estado do sistema seja levado para uma (pequena) vizinhança da
origem do espaço de estado em um tempo T. Este é o chamado Problema do Regulador.
Sabemos que este problema tem solução par qualquer T > t0 se o sistema for controlável.
Mas isto é verdade somente se o controle puder ser arbitrariamente grande. Ora, este não
é o caso em problemas reais, evidentemente, não somente por limitações de potência, mas
também porque um sistema submetido a grandes esforços deixa de operar na faixa de
linearidade, eventualmente “queimando”, ou “explodindo”.
Consequentemente, os controles devem ser submetidos a restrições na maioria dos
problemas reais. As restrições nos problemas de controle podem ser medidas de muitos
modos como por exemplo através de
T
T
∫
t
0
u dt ,
∫
t
2
u dt
e supt∈[t0 ,T ] u , que são as normas L1 ,
L2
e
L∞ , respectivamente.
0
E podemos ponderar o controle através de “pesos”, que são matrizes no caso
multivariável:
T
∫
t
T
Wu u dt ,
0
∫t W u
2
dt e supt∈[t
0 ,T ]
u
Wu u .
0
E também é frequente desejar-se impor restrições no estado, de modo especial no
transiente, de modo que não haja um “overshoot” grande:
T
∫
t
0
T
Wx x dt ,
∫t W x
x
2
dt e supt∈[t0 ,T ] Wx x .
0
Neste texto nos concentraremos no regulador de tempo infinito, isto é quando T → ∞ .
Na prática, T → ∞ significa T “muito grande”, o que ocorrre com bastante frequência
nos problemas reais. Efetivamente, se o regime transitório for relativamente curto, chegase usualmente ao regime permanente ( T → ∞ ) em tempo médio e até rápido.
Nosso problema é então o seguinte:
Achar o controle u (t ) definido em [0, ∞) tal que o estado x(t ) seja levado à origem do
espaço de estado em t → ∞ e de tal modo que o seguinte índice de desempenho seja
minimizado (ou maximizado, bastando inverter o sinal algébrico):
56
∞
T
⎡ x(t ) ⎤ ⎡ Q S ⎤
(2)
min u ∫ ⎢ ⎥ ⎢ T
dt ,
u (t ) ⎦ ⎣ S
R ⎥⎦
0 ⎣
onde supomos Q = QT e R = RT > 0 .
Este problema é chamado usualmente problema do regulador linear quadrático (LQR =
linear quadratic regulator).
⎡Q S⎤
De modo geral, supõe-se também que ⎢ T
(3)
≥0.
R ⎥⎦
⎣S
Como R é positiva definida, tem uma raiz quadrada, R1/ 2 , que também é positiva
definida.
Substituindo u ← R1/ 2u , podemos fazer R =I .
Mais ainda, podemos supor S = 0, usando uma pré-realimentação do estado u = − S T x + v .
Mas não faremos esta hipótese no que se segue.
Como (3) é positiva semi-definida, com R=I, podemos fatorar:
⎡ Q S ⎤ ⎡ CT ⎤
(4)
⎢ T
⎥ = ⎢ 1T ⎥ ⎡⎣C1 D12 ⎤⎦ .
I ⎦⎥ ⎢⎣ D12 ⎥⎦
⎣⎢ S
Com isto, (2) pode ser re-escrita como
min u∈L2 [0,∞ ) C1 x + D12u 2 .
2
Efetivamente, o problema LQR é definido tradicionalmente como
⎧⎪min u∈L [0,∞ ) C1 x + D12u 2
2
2
.
⎨
⎪⎩ x = Ax + Bu , x(0) = x0
(5)
(Observe-se a diferença de notação nesta e na eq. precedente com relação a (1)).
Efetivamente, sendo o sistema invariante no tempo, a escolha do instante inicial é
irrelevante).
A definição do LQR acima não menciona que o estado deva ser levado à origem. Ao
invés, colocam-se condições em Q, S e R (ou equilvalentemente em C1 e D12 ) de modo
que o controle ótimo tenha esta propriedade. Vejamos um exemplo simples para entender
isto:
A = B = R = 1, Q = S = 0.
Portanto, o problema é
∞
min u∈L2 [0,∞ ) ∫ u 2 dt , x = x + u, x(0) = x0 .
0
É claro que a solução deste problema é u = 0.
Porem, com esta solução o sistema é instável, pois o estado diverge exponencialmente
para o infinito, x(t ) = et x(0) .
Portanto, este problema está mal formulado, o índice de desempenho não faz sentido em
termos reais, pois ele não “vê” o estado instável x(t ) .
E isto vale como um preceito na definição do índice de desempenho: é necessário que ele
“veja”, todas as componentes do vetor de estado que podem representar alguma “ameça”
à estabilidade. E isto é obtido se:
57
(6)
- O par (C1 , A) deve ser detectável.
Com esta condição satisfeita, o problema LQR é dito padrão.
Mas o problema tem solução em alguns casos, como veremos, se (6) não for satisfeita.
Neste caso o problema é chamado estendido.
9.2 O Problema LQR padrão
Seja o sistema:
x = Ax + Bu , x(0) = x0
z = C1 x + D12u
e suponha que o sistema satisfaz às seguintes condições:
(i) ( A, B2 ) é estabilizável;
(5bis)
(7)
(8a)
⎡0 D12 ⎤
D⊥ ] unitário, onde D = ⎢
⎥ e D⊥
⎣0 0 ⎦
⎡D⎤
(8b)
é o complemento ortogonal de D, isto é, tal que ⎢ ⎥ é unitário (ortogonal) ;
⎣ D⊥ ⎦
(ii) D12 tem posto de coluna cheio, com [ D12
(iii) (C1 , A) é detectável;
(8c)
⎡ A − jω B2 ⎤
(iv) ⎢
tem posto de coluna cheio para todo ω .
(8d)
D12 ⎥⎦
⎣ C1
A primeira condição acima é necessaria para que o problema tenha solução; a segunda é
feita para simplificação da notação que se segue; a terceira, como já foi mencionado, é
dispensada no problema estendido, ela deixa claro que a solução do problema vai levar a
uma lei de controle que estabiliza o sistema; efetivamente a 1ª. e 3ª. condições garantem
que a estabilidade da relação saída/entrada implica a estabilidade interna, ou seja, u ∈ L2
e z ∈ L2 implicam x ∈ L2 .
Lema
(9)
No sistema dado por (5bis) e (7), se u , z ∈ L2 [0, ∞) e se (C1 , A) é detectável, então
x ∈ L2 [0, ∞) . Alem disso, x → 0 se t → ∞ .
Prova:
Como (C1 , A) é detectável, existe L tal que A + LC1 é estável. Seja x̂ a estimação do
estado x através do observador:
xˆ = ( A + LC1 ) xˆ + ( LD12 + B2 )u − Lz .
Donde que xˆ ∈ L2 [0, ∞) , visto que z e u estão em L2 [0, ∞) .
Defina-se agora o erro de estimação e = x − xˆ . Donde,
e = ( A + LC1 )e , portanto e ∈ L2 [0, ∞) .
Donde que x = xˆ + e ∈ L2 [0, ∞) .
Mas e → 0 se t → ∞ , em vista da expressão de e . Donde finalmente x → 0 se t → ∞ em
vista do fato que xˆ ∈ L2 [0, ∞) .
•
58
Antes de enunciar o próximo teorema, definamos:
T
F = −( B2 X + D12
C1 ) ,
onde X é a solução da eq. de Riccati
( A − B2 D12T C1 )T X + X ( A − B2 D12T C1 ) − XB2 B2T X + C1T D⊥ D⊥T C1 = 0 ,
Definam-se AF = A + B2 F , CF = C1 + D12 F e
⎡A
Gc ( s ) = ⎢ F
⎣C F
I⎤
0 ⎥⎦
Teorema:
Existe um controle ótimo único para o problema LQR definido acima, a saber,
u = Fx . Alem disso,
min u∈L2 [0, ∞ ) z 2 = Gc x0 2 .
(10)
Prova: ZDG, pp. 378ss.
9.3 O problema LQR estendido
Neste problema, não há hipótese quanto à detectabilidade de (C1, A) .
Nosso problema é então, repetindo a formulação do problema anterior
x = Ax + Bu , x (0) = x0 ,
z = C1 x + D12u ,
com as seguintes hipóteses
- ( A, B2 ) é estabilizável;
- D12 tem posto de coluna cheio com [ D12
D⊥ ] unitario;
(5ter)
(7bis)
(8a, bis )
(8b, bis)
⎡ A − jω B2 ⎤
- ⎢
tem posto de coluna cheio para todo ω .
(8d, bis).
D12 ⎥⎦
⎣ C1
Nosso problema, tal como no caso anterior, é achar uma lei de controle u ∈ L2 [0, ∞) tal
que o sistema seja internamente estável , isto é, x ∈ L2 [0, ∞) e o índice de desempenho
z
2
seja minimizado.
E obtemos um teorema com o mesmo enunciado do anterior:
Teorema:
Existe um controle ótimo único para o problema LQR definido acima, a saber,
u = Fx . Alem disso,
min u∈L2 [0, ∞ ) z 2 = Gc x0 2 .
(11)
Prova: ZDG, pp. 381.
59
9.4 O problema H 2 padrão (outra versão)
Vamos considerar o problema padrão sob nova ótica. O problema desta seção é dado pelo
seguinte diagrama de blocos
z
w
G
y
u
K
Figura 34 ter
onde
⎡A
⎢
G ( s ) = ⎢ C1
⎢⎣C2
B1
0
D21
B2 ⎤
⎥
D12 ⎥
0 ⎥⎦
Observe-se que D22 = 0, donde que G22 ( s ) é estritamente própria.
São feitas as seguintes hipóteses:
(i) ( A, B2 ) é estabilizável e (C2 , A) é detectável;
(ii) D12 tem posto de coluna cheio com [ D12
D⊥ ] unitário e D21 tem posto de linha
⎡D ⎤
cheio com ⎢ 21 ⎥ unitário;
⎣ D⊥ ⎦
⎡ A − jω B2 ⎤
tem posto de colunas cheio para todo ω ;
(iii) ⎢
D12 ⎥⎦
⎣ C1
⎡ A − jω B1 ⎤
tem posto de linhas cheio para todo ω .
(iv) ⎢
D21 ⎥⎦
⎣ C2
O Problema H 2 :
Achar um controlador real, racional e próprio K que estabilize internamente G e
minimize a norma H 2 da matriz de transferência entre w e z, Tzw .
Definamos as seguintes matrizes:
T
F2 := −( B2T X 2 + D12T C1 ), L2 := −(Y2C2T + B1D21
),
AF2 := A + B2 F2 , C1F2 := C1 + D12 F2 , AL2 := A + L2C2 , B1L2 := B1 + L2 D21 ,
Aˆ 2 := A + B2 F2 + L2C2
e as seguintes matrizes de transferência
60
⎡ AF
Gc ( s) = ⎢ 2
⎢C1F
2
⎣
I⎤
⎥,
0⎥
⎦
⎡ AL
B1L2 ⎤
⎢⎣ I
0 ⎥⎦
G f ( s) = ⎢
⎥
2
Teorema:
Existe um único controlador ótimo
(12)
⎡ˆ
⎤
K opt (s) = ⎢ A2 − L2 ⎥ .
⎢⎣ F2
0 ⎥⎦
Alem disso,
min Tzw
2
2
= Gc B1 2 + F2G f
2
2
2
•
2
= Gc L2 2 + C1G f 2 .
2
Este controlador tem a propriedade da separação, que será estudada mais adiante.
Para melhor compararmos este resultado com aqueles em H ∞ , que estudaremos adiante,
vejamos agora os controladores subótimos no H 2 . São chamados “subótimos”, porque,
como já veremos no próximo teorema, procura-se um índice de desempenho cujo valor
seja inferior a um número escolhido, “pequeno”.
Recorda-se neste ponto que um controlador “admissível” é aquele que estabiliza o SMF e
é próprio.
Teorema
(13)
A família de todos os controladores admissíveis tais que Tzw 2 < γ é igual ao conjunto de
todas as matrizes de transferência de y para u no seguinte diagrama de blocos
u
M2
y
Q
Figura 49
com
⎡ A
ˆ
⎢ 2
M 2 ( s) = ⎢ F2
⎢ −C
⎢⎣ 2
− L2 B2 ⎤
⎥
I ⎥
0
I
0 ⎥⎥
⎦
61
onde Q ∈ RH 2 ,
(
Q 2 < γ 2 − Gc B1 2 + F2G f
2
2
2
2
).
•
Como se vê, os controladores sub-ótimos são parametrizados por uma LFT independente
de γ com um “parâmetro” livre Q. Com Q = 0, nós obtemos K opt do teorema anterior.
É digno de nota que a parametrização deste teorema dá Tzw afim em Q e nos dá uma
parametrização a la Youla. (Na parametrização de Youla, ao invés de
Q ∈RH ∞ ).
Q∈ RH 2 , temos
10º. Capítulo: Controle H ∞ - o caso simples
Neste capitulo estudaremos o ótimo e o sub-ótimo controle com norma em
Enfatizaremos o problema sub-ótimo e daremos a razão para isto.
H∞.
10.1 A formulação do problema
Considere-se de novo o diagram de blocos padrão:
z
w
G
y
u
K
Figura 34 bis bis
No diagrama de blocos acima, tanto G como K têm as matrizes de transferência reais,
racionais e próprias. As realizações das duas serão supostas estabilizáveis e detectáveis.
É claro que a estabilidade é uma propriedade fundamental de qualquer sistema que faça
sentido do ponto de vista prático, eis porque o controlador será suposto admissível.
Problema do Controle Ótimo no
H∞:
Achar todos os controladores admissíveis K ( s) tais que Tzw
∞
é minimizado.
Há que se notar que a solução do problema acima, no caso de sistemas MIMO, não é, em
geral, única. Alem disso, achar tal (tais) controlador(es) é tanto teoricamente como
numericamente complicado. Eis porque é mais importante do ponto de vista prático a
solução do
62
Problema do Controle sub – ótimo no
H∞:
Dado γ > 0 , achar todos os controladores admissíveis K ( s) , se existir algum, tais que
Tzw ∞ < γ .
10.2 Controle com realimentação da resposta
Suponha que K seja um controlador estabilizador para a planta G. Então a a establidade
interna garante que Tzw = Y l ( G, K ) ∈ RH ∞ , mas a recíproca não é verdadeira, ou seja,
a última condição não implica estabilidade interna.
O lema seguinte provê condições (brandas) para a equivalência entre estabilidade interna
e Tzw = Y l ( G , K ) ∈ RH ∞ .
Para estabelecer o resultado, suporemos que a planta e o controlador sejam estabilizáveis
e detectáveis com as seguintes realizações
⎡A
G ( s) = ⎢⎢ C1
⎢⎣C2
B1 B2 ⎤
⎡ Aˆ Bˆ ⎤
⎥
D11 D12 ⎥⎥ , K ( s) = ⎢
ˆ Dˆ ⎥
⎢
C
⎣
⎦
D21 D22 ⎥⎦
Lema:
(1)
Suponha que as realizações de G e K sejam ambas estabilizáveis e detectáveis. Então o
SMF com Tzw = Y l ( G , K ) é
⎡ A − λ I B2 ⎤
(a) detectável se ⎢
tiver posto de colunas cheio para todo Re[λ ] ≥ 0 ;
D12 ⎥⎦
⎣ C1
⎡ A − λ I B1 ⎤
(b) estabilizável se ⎢
⎥ tiver posto de linhas cheio para todo Re[λ ] ≥ 0 .
C
D
2
21
⎣
⎦
Além disto, se (a) e (b) forem satisfeitas, então K é um controlador que estabiliza
internamente o SMF se só se Tzw ∈ RH ∞ .
Prova:
Obtem-se através de cálculo tedioso
Y l ( G, K )
⎡ A + B DL
ˆ C
2
1 2
⎢
⎢
ˆ C
=⎢
BL
1 2
⎢
ˆ
⎢⎣C1 + D12 L2 DC2
ˆ D ⎤
B2 L2Cˆ
B1 + B2 DL
1 21 ⎥
⎥
ˆ D Cˆ
ˆ D
Aˆ + BL
BL
1 22
1 21
⎥
ˆ
ˆ
D12 L2C
D11 + D12 DL1D21 ⎥⎥
⎦
⎡
⎤
=: ⎢ Ac Bc ⎥
⎢⎣Cc
Dc ⎥⎦
63
onde
L1 := ( I − D22 Dˆ )
−1
,
ˆ
L2 := ( I − DD
22 )
−1
.
⎡x⎤
Suponha que Y l ( G, K ) tenha um estado indetectável ⎢ ⎥ , com o respectivo modo λ
⎣ y⎦
⎡ A − λI ⎤ ⎡ x⎤
tal que Re[λ ] ≥ 0 . Então o teste PBH nos dá: ⎢ c
⎥ ⎢ ⎥ = 0,
⎣ Cc ⎦ ⎣ y ⎦
o que, tendo em vista as expressões de Ac e Cc , nos dá
⎡ A − λI
⎢ C
⎣ 1
x
⎤
B2 ⎤ ⎡
ˆ ) + Ay
ˆ −λy = 0.
ˆ (C x + D Cy
= 0 e BL
⎢ˆ
1
2
22
⎥
ˆ ⎥
D12 ⎦ ⎣ DL1C2 x + L2Cy
⎦
⎡ A − λ I B2 ⎤
tiver posto de coluna cheio, então x = 0 e Ĉy = 0 e
Ora, daí vemos que se ⎢
D12 ⎥⎦
⎣ C1
a segunda igualdade acima implica Ây = λ y . Mas como por hipótese (Cˆ , Aˆ ) é
detectável, temos y = 0, levando a uma contradição, provando a parte (a). A parte (b) é
demonstrada da mesma forma, ou por dualidade.
•
O seguinte teorema é importante para o desenvolvimento posterior.
Teorema:
Considere o sistema da figura abaixo:
z
(2)
w
P
r
v
Q
Figura 50
⎡P P ⎤
com P = ⎢ 11 12 ⎥ . Suponha que P ~ P = I , P21−1 ∈RH ∞ e Q é uma matriz racional
⎣ P21 P21 ⎦
própria. Então, as seguintes afirmações são equivalentes:
(a) O SMF é bem posto, internamente estável e Tzw ∞ < 1 ;
(b) Q ∈ RH ∞ e Q
∞
<1.
Prova: ZDG, pp. 416s.
Hipóteses simplificadoras
64
Neste capitulo estamos tratando o caso mais simples do controle em H ∞ , a razão disso
sendo que o caso geral é bem mais difícil do ponto de visa algébrico, pelo que, se for
tratado logo, ficarão obscurecidos certos aspectos fundamentais para o aluno aplicado (e
para o professor idem).
A primeira simplificação é que consideramos que são nulos os elementos bloco-diagonais
da matriz D, a saber,
⎡A
G ( s ) = ⎢⎢ C1
⎢⎣C2
B1
0
D21
B2 ⎤
D12 ⎥⎥
0 ⎥⎦
E são feitas as seguintes hipóteses adicionais:
(i) ( A, B1 ) é estabilizável e (C1 , A) é detectável;
(ii) ( A, B2 ) é estabilizável e (C2 , A) é detectável;
T ⎡
(iii) D12
C D12 ⎤⎦ = ⎡⎣0 I ⎤⎦ ;
⎣ 1
⎡ B ⎤ T ⎡0⎤
(iv) ⎢ 1 ⎥ D21
=⎢ ⎥.
⎢⎣ D21 ⎥⎦
⎣⎢ I ⎦⎥
As duas primeiras hipóteses garantem que as duas matrizes hamiltonianas, H 2 e J 2 do
capitulo anterior pertencem a dom(Ric). Estas hipóteses permitem uma demonstração
mais simples. Como vimos, a hipótese (ii) é necessária e suficiente para G ser
internamente estabilizável.
Corolário:
(3)
Suponha que a planta satisfaça às hipóteses (i), (iii) e (iv). Então um controlador K é
admissível (isto é, estabiliza o SMF e é próprio) se só se Tzw ∈ RH ∞ .
Prova:
Como a planta é estabilizável e detectável de acordo com a hipótese (i), só temos que
verificar as condições de posto das duas matrizes do Lema (1).
Suponha que as duas condições sejam satisfeitas e seja D⊥ tal que [ D12 D⊥ ] seja uma
matriz unitária (na realidade, ortogonal, pois estamos lidando com matrizes reais).
Então,
0 ⎤
⎡I
⎡ A − λ I B2 ⎤
⎡ A − λ I B2 ⎤
⎢
T ⎥
⎡ D12
⎤⎥ ⎢
Posto ⎢
⎥ = Posto ⎢
D12 ⎦
D12 ⎥⎦
⎣ C1
⎢0 ⎢ DT ⎥ ⎥ ⎣ C1
⎣ ⊥ ⎦⎦
⎣
⎡ A − λ I B2 ⎤
⎢
⎥
= Posto ⎢ ⎡ 0 ⎤ ⎡ I ⎤ ⎥ .
⎢ ⎢ D⊥T C1 ⎥ ⎢0 ⎥ ⎥
⎦ ⎣ ⎦⎦
⎣⎣
65
⎡ A − λI
⎣ C1
B2 ⎤
tem posto cheio para todo Re[λ ] ≥ 0 se só se
D12 ⎥⎦
Consequentemente, ⎢
⎡ A − λI ⎤
⎢ T ⎥ tiver posto cheio para todo Re[λ ] ≥ 0 .
⎣ D⊥ C1 ⎦
Mas esta matriz tem posto cheio para todo Re[λ ] ≥ 0 se só se ( D⊥T C1 , A) for detectável..
T
Mas visto que D⊥ ( D⊥T C1 ) = ( I − D12 D12
C1 ) = C1 , segue-se que
( D⊥T C1, A) é detectável se só se (C1 , A) o for. E a condição de posto para a outra matriz
•
vem por dualidade.
Controladores
H ∞ sub-ótimos
{
Definamos γ opt = min Tzw
∞
: K ( s ) é admissivel} . Em um controlador sub-ótimo,
γ > γ opt .
H ∞ são mais difíceis de caracterizar do que os sub-ótimos, e
esta é uma grande diferença com relação aos controladores no H 2 . Recorde-se que esta
Os controladores ótimos no
dificuldade apareceu tembém no calculo da norma.
A solução do problema desta subseção involverá o uso das seguintes matrizes
hamiltonianas:
⎡ A
⎡ AT
γ −2 B1B1T − B2 B2T ⎤
H ∞ := ⎢ T
⎥ e J ∞ := ⎢
T
− AT
⎣ − B1B1
⎣ −C1 C1
⎦
Teorema
Existe um controlador admissível tal que Tzw
∞
<γ
γ −2C1T C1 − C2T C2 ⎤
−A
⎥.
⎦
(4)
se só se as três seguintes condições
forem satisfeitas:
(i) H ∞ ∈ dom( Ric) e X ∞ := Ric( H ∞ ) ≥ 0 ;
(ii) J ∞ ∈ dom( Ric) e Y∞ := Ric( J ∞ ) ≥ 0 ;
(iii) ρ ( X ∞Y∞ ) < γ 2 , lembrando que ρ (⋅) denota o raio spectral de uma matriz.
Alem disso, se estas condições forem satisfeitas, um controlador que resolve o problema
é
⎡ Aˆ
K sub ( s) = ⎢
∞
⎢⎣ F∞
− Z ∞ L∞ ⎤
⎥
0 ⎥⎦
com
Aˆ∞ := A + γ −2 B1B1T X ∞ + B2 F∞ + Z ∞ L∞C2 , F∞ := − B2T X ∞ , L∞ := −Y∞C2T e
Z ∞ := ( I − γ −2Y∞ X ∞ ) −1 .
•
66
O teorema seguinte parametriza todos os controladores que obtêm uma norma sub-ótima
menor que γ .
(5)
Teorema
Se as condições (i)-(iii) do teorema anterior forem satisfeitas, o conjunto de todos os
controladores admissíveis tais que Tzw ∞ < γ é igual ao conjunto de todas as matrizes
de transferência de y para u em
u
M∞
y
Q
Figura 51
onde
⎡ Aˆ∞
⎢
M ∞ ( s ) = ⎢ F∞
⎢ −C
⎣ 2
− Z ∞ L∞
0
I
com Q ∈ RH ∞ , Q
∞
Tal como no problema
Z ∞ B2 ⎤
⎥
I ⎥
0 ⎥⎦
<γ .
•
H 2 , os controladores sub-ótimos são parametrizados por uma
LFT com um parâmetro livre Q. Com Q = 0 (no “centro” do conjunto Q
∞
< γ ),
recuperamos o controlador central K sub ( s ) .
10.3 Controle com informação completa (FI)
(Como vimos, FI significa “full information”)
Nosso diagrama de blocos desta seção é o padrão:
67
z
w
G
y
u
K
Figura 34, 5ª.
com
⎡
⎤
⎢
⎥
B1 B2 ⎥
⎢ A
G ( s ) = ⎢ C1
0 D12 ⎥
⎢
⎥
⎢ ⎡ I ⎤ ⎡0⎤ ⎡0⎤ ⎥
⎢ ⎢0 ⎥ ⎢ I ⎥ ⎢0⎥ ⎥
⎣⎣ ⎦ ⎣ ⎦ ⎣ ⎦⎦
Este problema não é, estritamente falando, um caso particular do problema do controle
pela resposta, porque não satisfaz as hipóteses do mesmo. Em particular, no problema FI
(bem como no FC na próxima seção), a estabilidade interna não é equivalente a
⎡ A − λI
Tzw ∈ RH ∞ visto que ⎢⎢ ⎡ I ⎤
⎢⎣ ⎢⎣ 0 ⎥⎦
B1 ⎤
⎥
⎡ 0 ⎤ ⎥ nunca pode ter posto de linha cheio. Lembramos
⎢I ⎥⎥
⎣ ⎦⎦
que no problema FI, K admissível significa estabilidade interna e não somente
Tzw ∈ RH ∞ .
As hipóteses relevantes para o problema do FI são:
(i) (C1 , A) é detectável;
(ii) ( A, B2 ) é estabilizável;
T
(iii) D12
[C1
D12 ] = [ 0 I ] .
Teorema:
Existe um controlador admissível K ( s ) para o problema FI tal que Tzw
∞
(6)
< γ se só se
H ∞ ∈ dom( Ric) e X ∞ = Ric( H ∞ ) ≥ 0 . Alem disto, se estas condições forem
satisfeitas, uma classe de controladores admissíveis que satisfazem a Tzw
∞
< γ pode
ser parametrizada como
K ( s ) = ⎡⎣ F∞ − γ −2Q ( s ) B1T X ∞
Q ( s ) ⎤⎦ ,
(7)
68
com Q ∈ RH ∞ , Q
∞
<γ .
•
Prova: ZDG, pp. 426-428.
Comparando a solução do problema em
H∞
com o problema em
H 2 , verifica-se que
uma diferença fundamental entre os dois é que o primeiro depende do distúrbio através de
B1 , o que não é o caso do segundo.
O teorema seguinte dá todos os controladores de FI.
Teorema
(8)
Suponha que as condições do teorema anterior sejam satisfeitas. Então o conjunto de
todos os controladores satisfazendo a Tzw ∞ < γ pode ser parametrizado por
Y l ( M FI , Q ) , onde
u
y
M FI
Q
Figura 52
⎡
⎢
⎢ A + B2 F∞
M FI ( s) = ⎢
0
⎢
⎢ ⎡− I ⎤
⎢ ⎢ ⎥
⎣⎢ ⎣ 0 ⎦
onde Q = [Q1
⎡⎣0 B1 ⎤⎦
⎡⎣ F∞ 0 ⎤⎦
I
⎡
⎢ −2 T
⎣γ B1 X ∞
Q2 ] ∈ RH ∞ , Q2
∞
0⎤
I ⎥⎦
⎤
B2 ⎥⎥
I ⎥
⎥
⎥
0⎥
⎥⎦
<γ .
Prova: ZDG, pp. 427s.
•
Observação:
(9)
É fácil verificar que com Q1 = 0 , temos K = ⎡⎣ F∞ − γ −2Q2 B1T X ∞
parametrização do teorema anterior.
Q2 ⎤⎦ , que é a
69
10.4 Controle total (FC = “full control”)
Este problema é dual do anterior; isto pode ser visto tanto comparando as matrizes G(s), a
seguir, como as hipóteses que se seguem.
⎡A
⎢
G ( s) = ⎢ C1
⎢C2
⎣
B1
0
D21
⎡⎣ I 0⎤⎦ ⎤
⎥
⎡⎣0 I ⎤⎦ ⎥
⎡⎣0 0⎤⎦ ⎥⎦
As hipóteses tb. são duais:
(i) ( A, B1 ) é estabilizável;
(ii) (C2 , A) é detectável;
⎡ B1 ⎤ T ⎡0 ⎤
⎥ D21 = ⎢ I ⎥ .
⎣ ⎦
⎣ D21 ⎦
(iv) ⎢
Teorema
Existe um controlador admissível K ( s) para o problema FC tal que Tzw
∞
(10)
< γ se só se
J ∞ ∈ dom( Ric) e Y∞ = Ric( J ∞ ) ≥ 0 . Se estas condições forem satisfeitas, uma classe
de controladores admissíveis satisfazendo a Tzw
∞
< γ pode ser parametrizada por
⎡ L∞ − γ −2Y∞C1T Q( s ) ⎤
K ( s) = ⎢
⎥ , onde Q ∈ RH ∞ , Q
Q
(
s
)
⎣
⎦
∞
<γ .
10.5 Controle com “Disturbance feedforward” (DF)
Teorema
Existe um controlador admissível K ( s) para o problema DF tal que Tzw
∞
(11)
< γ se só
se H ∞ ∈ dom( Ric)∞ e X ∞ ∈ dom( Ric) ≥ 0 . Se estas condições forem satisfeitas, todos
os controladores admissíveis satisfazendo a Tzw
∞
< γ pode ser parametrizada por um
conjunto de matrizes de transferencia de y para u, com
70
u
y
M∞
Q
Figura 53
⎡ A + B2 F∞ − B1C2
M ∞ ( s) = ⎢⎢
F∞
⎢⎣ −C2 − γ −2 B1T X ∞
Q ∈ RH ∞ , Q
∞
B1 B2 ⎤
0 I ⎥⎥
I 0 ⎥⎦
<γ .
Prova: ZDG, pp. 432s
10.7 Controle com estimação da resposta (“output estimation = OE)
⎡A
⎢
G ( s) = ⎢ C1
⎢C2
⎣
B1 B2 ⎤
⎥
0
I ⎥
D21 0 ⎥⎦
O problema é dual do DF. As hipóteses são:
(i) ( A, B1 ) é estabilizável e A − B2C1 é estável;
(ii)
(C2 , A) é detectável;
⎡ B1 ⎤ T ⎡0 ⎤
⎥ D21 = ⎢ I ⎥ .
D
⎣ ⎦
⎣ 21 ⎦
(iv) ⎢
Teorema
Existe um controlador admissível K ( s) para o problema OE tal que Tzw
(12)
∞
< γ se só
se J ∞ ∈ dom( Ric) e Ric( J ∞ ) ≥ 0 . Se estas condições forem satisfeitas, todos os
controladores admissíveis satisfazendo a Tzw
∞
< γ pode ser parametrizada por um
conjunto de matrizes de transferencia de y para u, com
71
u
y
M∞
Q
Figura 53 bis
⎡ A + L∞C2 − B2C1
⎢
M ∞ (s) = ⎢
C1
⎢
C2
⎣
com Q ∈ RH ∞ , Q
∞
L∞ − B2 − γ −2Y∞C1T ⎤
I
0
0
I
⎥
⎥
⎥
⎦
<γ .
•
11º. Capítulo: Controle H ∞ - o caso geral.
Consideremos novamente, repetido agora pela 5ª. vez, o diagrama de blocos
z
w
G
y
u
K
Figura 34, 6ª.
onde G e K são supostas, como usulamente, reais, isto é, com coeficientes reais,
racionais e próprias, sendo que K torna o SMF estável, portanto K é admissível.
A planta é dada por
72
⎡A
⎡A B⎤ ⎢
G ( s) = ⎢
⎥ = ⎢ C1
⎣C D ⎦ ⎢C
⎣ 2
B1 B2 ⎤
⎥
D11 D12 ⎥
D21 0 ⎥⎦
São feitas as seguintes hipóteses:
(A1) ( A, B2 ) é estabilizável e (C2 , A) é detectável ;
(A2)
⎡0⎤
D12 = ⎢ ⎥ e D21 = [ 0 I ] ;
I
⎣ ⎦
⎡ A − jω I
(A3) ⎢
⎢⎣ C1
⎡ A − jω I
(A4) ⎢
⎣⎢ C2
B2 ⎤
tem posto de colunas cheio para todo ω ;
D12 ⎥⎥⎦
B1 ⎤
D21 ⎥⎦⎥
tem posto de linhas cheio para todo
ω.
As matrizes identidade que aparecem na hipótese (A2) parecem muito restritivas mas não
são: basta usar unidades convenientes para w, u, z e y.
Para enunciar o teorema, precisamos das seguintes definições:
⎡D ⎤
D12 ] , D•1 := ⎢ 11 ⎥ ,
⎣ D21 ⎦
⎡γ 2 I m 0 ⎤
⎡γ 2 I p 0 ⎤
T
T
1
1
R := D1• D1• − ⎢
⎥ , R := D•1D•1 − ⎢
⎥,
0 ⎥⎦
0 ⎥⎦
⎢⎣ 0
⎢⎣ 0
onde m1 é a dimensão de w e p1 é a dimensão de z,
0 ⎤ ⎡ B ⎤ −1 T
⎡ A
H ∞ := ⎢ T
− ⎢ T ⎥ R ⎡⎣ D•1C1 BT ⎤⎦ ,
T⎥
⎣ −C1 C1 − A ⎦ ⎣ −C1 D1• ⎦
D1• := [ D11
⎡ AT
J ∞ := ⎢
T
⎣⎢ − B1B1
0 ⎤ ⎡ C T ⎤ −1
R ⎡⎣ D•1B1T C ⎤⎦ ,
⎥−⎢
T ⎥
− A⎦⎥ ⎣⎢ − B1D•1 ⎦⎥
X ∞ := Ric( H ∞ ) , Y∞ := Ric( J ∞ ) ,
⎡F ⎤
F = ⎢ 1∞ ⎥ := − R −1 ( D1T•C1 + BT X ∞ ) ,
⎣ F2 ∞ ⎦
L := [ L1∞ L2 ∞ ] := − ( B1D•T1 + Y∞C T ) R −1 .
Fazemos as seguintes partições:
⎡ F11∞ ⎤
F = ⎢⎢ F12 ∞ ⎥⎥ , L = [ L11∞
⎢⎣ F2 ∞ ⎥⎦
L12 ∞
⎡ D1111
L2 ∞ ] , D = ⎢⎢ D1121
⎢⎣ 0
D1112
D1122
I
0⎤
I ⎥⎥ .
0 ⎥⎦
73
Observe-se que na partição acima algumas matrizes podem não existir, dependendo de
D12 e D21 serem matrizes quadradas, ou não.
Teorema:
Suponha que G satisfaça às condições (A1)-(A4) acima.
(a) Existe um controlador admissível K(s) tal que Y l ( G , K )
se só se
(
(1)
∞
< γ (isto é, Tzw
∞
<γ )
)
(i) γ > max σ [ D1111
T
T
⎤⎦ ;
D1112 ] ,σ ⎡⎣ D1111
D1121
(ii) H ∞ ∈ dom( Ric) , com X ∞ = Ric( H ∞ ) ≥ 0 ;
(iii) J ∞ ∈ dom( Ric) , com Y∞ = Ric( J ∞ ) ≥ 0 ;
(iv) ρ ( X ∞Y∞ ) < γ 2 .
(b) Se as condições acima forem satisfeitas, então todos os controladores estabilizadores
K(s) tais que Y l ( G, K ) < γ são dados por
∞
K ( s) = Y l ( M ∞ , Q ) , com Q ∈ RH ∞ , Q ∞ < γ , de resto arbitrário e
M∞
⎡ Aˆ
⎢
= ⎢ Cˆ1
⎢
⎢Cˆ 2
⎣
Bˆ1
Dˆ
11
Bˆ2 ⎤
⎥
Dˆ ⎥
Dˆ 21
0 ⎥
12
⎥
⎦
T
T
(γ 2 I − D1111 D1111
) −1 D1112 − D1122 ,
com Dˆ 11 = − D1121 D1111
Dˆ 12 e Dˆ 21 são quaisquer matrizes que satisfaçam a
T
T
T
(γ 2 I − D1111 D1111
) −1 D1112 .
Dˆ 12 Dˆ 12T =I − D1121 (γ 2 I − D1111
D1111 ) −1 e Dˆ 21T Dˆ 21 = I − D1112
Temos ainda: Z ∞ = ( I − γ −2Y∞ X ∞ ) −1 , Bˆ 2 = Z ∞ ( B2 + L12 ∞ ) Dˆ12 , Cˆ 2 = − Dˆ 21 (C2 + F12 ∞ ) ,
Bˆ1 = − Z ∞ L2 ∞ + Bˆ 2 Dˆ12−1Dˆ11 , Cˆ1 = F2 ∞ + Dˆ11Dˆ 21−1Cˆ 2 , Aˆ = A + BF + Bˆ1Dˆ 21−1Cˆ 2 .
•
Vejamos alguns casos especiais:
Caso 1: D12 = I
- A parte (a) se torna γ > σ ( D1121 ) ;
T
T
ˆ T Dˆ = I .
= I − γ −2 D1121 D1121
e D
- Na parte (b): D̂11 = − D1112 , Dˆ12 Dˆ12
21 21
Caso 2: D21 = I
- Na parte (a), (i) se torna γ > σ ( D1112 ) ,
T
T ˆ
T
- Na parte (b), obtemos D̂11 = − D1122 , Dˆ12 Dˆ12
= I e Dˆ 21
D21 = I − γ −2 D1112
D1112 .
Caso 3: D12 = I & D21 = I
74
- Na parte (a), (i) é cancelado;
T
T ˆ
- Na parte (b), obtemos D̂11 = − D1122 , D12 Dˆ12
= I , Dˆ 21
D21 = I .
12º. Capítulo: “Loop shaping” com
H∞
O título do capítulo segue o do livro, mas não estudaremos com profundidade que seria
desejável este topico, “loop shaping”, muito utilizado na prática. A técnica proposta usa
somente os conceitos básicos de “loop shaping” e a partir disso é obtido um controlador.
12.1 Estabilização robusta com fatores coprimos
Seja uma planta perturbada a partir do modelo nominal:
P∆ = ( M + ∆ M ) −1 ( N + ∆ N ) ,
com M , N , ∆ M , ∆ N ∈ RH ∞ e ⎡⎣ ∆ N ∆ M ⎤⎦ < ε .
∞
Abaixo o diagrama de blocos do SMF com a planta perturbada
_
∆M
∆N
z1
z2
w
r
K
N
M −1
y
_
Figura 54
A planta nominal é uma fatoração c.e. P = M −1 N e K estabiliza a planta nominal.
Vimos em capítulo anterior que o SMF é robustamente estável se só se (por aplicação do
teorema do pequeno ganho)
⎡K ⎤
−1
−1
⎢ I ⎥ ( I + PK ) M
⎣ ⎦
≤ 1/ ε
∞
Suponha que a planta tenha uma realização que seja estabilizável e detectável:
⎡A
B⎤
⎥
⎣C D ⎦
P=⎢
75
Seja uma matriz L tal que A + LC é estável. Então uma fatoração c.e. de P é dada por
⎡N
⎣
⎡ A + LC
M ⎤⎦ = ⎢
⎣
C
B + LD L ⎤
D
I ⎥⎦
Definamos K̂ = − K . Então o SMF pode ser descrito por uma LFT na forma da figura
55, com a planta generalizada
B ⎤
⎡ A −L
⎡⎡ 0 ⎤ ⎡ I ⎤⎤ ⎢
⎥
⎢ ⎢ −1 ⎥ ⎢ ⎥ ⎥ ⎢ ⎡ 0 ⎤ ⎡0 ⎤ ⎡ I ⎤ ⎥
G ( s) = ⎢ ⎢⎣ M ⎥⎦ ⎣ P ⎦ ⎥ = ⎢ ⎥ ⎢ ⎥ ⎢ ⎥
⎢
⎥
⎢
⎥ ⎢ ⎣C ⎦ ⎣ I ⎦ ⎣ D ⎦ ⎥
−1
P ⎥⎦
⎣⎢ M
I
D ⎥⎦
⎢⎣ C
⎡A
=: ⎢⎢ C1
⎢⎣C2
B1 B2 ⎤
D11 D12 ⎥⎥
D21 D22 ⎥⎦
z1
w
z2
M −1
N
y
u
K̂
Figura 55
Para aplicar as fórmulas do capítulo anterior, são necessárias algumas manipulações
algébricas, dadas em ZDG, pp. 479s. Obtemos:
Teorema:
(1)
Suponha que D = 0 e seja L definido antes. Então existe um controlador K tal que
⎡K ⎤
−1
⎢ I ⎥ ( I + PK )
⎣ ⎦
< γ se só se γ > 1 e existe uma solução X ∞ > 0 da seguinte
∞
equação de Riccati:
T
⎛ T
⎛
LC ⎞ ⎛
LC ⎞
LLT ⎞
γ 2C T C
X ∞ ⎜ A − 2 ⎟ + ⎜ A − 2 ⎟ X ∞ − X ∞ ⎜ BB − 2 ⎟ X ∞ + 2
= 0.
γ −1 ⎠ ⎝
γ −1⎠
γ −1⎠
γ −1
⎝
⎝
76
Além disso, um controlador “central” é dado por:
⎡ A − BBT X ∞ + LC
K =⎢
−B X ∞
T
⎣
L⎤
⎥
0⎦
•
12.2 “Loop shaping” usando estabilização coprima normalizada
Vamos tratar agora do problema enunciado no título deste capítulo: projeto (síntese) com
loop shaping e H ∞ .
Considere o diagrama de blocos da figura 56:
d
di
r
K
P
y
u
_
n
Figura 56
Recorda-se que bom desempenho do SMF exige que os seguintes números sejam
“pequenos” na faixa de frequências de interesse:
σ (( I + PK )-1 ), σ (( I + PK )-1 P), σ (( I + KP)-1 ) e σ ( K ( I + PK )-1 ).
(2)
E, por outro lado, boa robustez exige que os seguintes sejam “pequenos” nas altas
frequências:
(3)
σ ( PK ( I + PK )-1 ) e σ ( KP( I + KP)-1 ).
Estas condições, como vimos, são equivalentes a que, na faixa de frequências de
interesse, tenhamos:
σ ( PK ) 1, σ ( KP) 1 e σ ( K ) 1, nas frequências baixas, e
σ ( PK )
1, σ ( KP)
1 e σ (K )
M , nas freqüências altas, onde M não pode
ser muito grande.
Procedimento para o projeto por loop shaping
(1) Usando um pré-compensador W1 e / ou um pós-compensador W2 , os valores
singulares desejados da malha aberta são obtidos. (Ver a primeira da figura 57).
A planta com as funções W1 e W2 formam uma nova “planta” Ps , isto é, Ps = W2 PW1 .
Supomos que W1 e W2 são tais que Ps não contenha modos escondidos, ou seja, não há
cancelamento no produto. (Ver depois da figura o significado de K ∞ ).
77
W1
K∞
W2
P
W1
P
W2
W1
P
_
W2
K∞
_
Figura 57
(2) Estabilização robusta:
a) Seja uma fatoração c.e. normalizada
Calcular ε max dado por:
−1
Ps = M N s
s
, e portanto, M s M s~ +N s N s~ = I
−1
⎛
⎞
2
⎡I ⎤
−1
−1
⎡
⎤
=
+
ε max = ⎜ inf
(
)
1
−
N
M
<1 .
I
P
K
M
⎟
s⎦
s
s
⎣ s
⎜ K estabilizador ⎢⎣ K ⎥⎦
⎟
H
∞⎠
⎝
Se ε max 1 , voltar a (1) e ajustar W1 e W2 .
b) Selecionar ε ≤ ε max e calcular um controlador K ∞ que satisfaça a
⎡ I ⎤
−1
−1
⎢ K ⎥ ( I + Ps K ∞ ) M s
⎣ ∞⎦
≤ 1/ ε .
∞
(3) O controlador final K é então construído combinando o controlador K ∞ com os
“pesos” W1 e W2 , conforme a 3ª. da figura 56:
K = W1 K ∞W2 .
Observação:
(4)
O objetivo acima pode ser visto de outra forma, como um problema padrão em H ∞ .
Com efeito, temos as seguintes igualdades:
78
⎡ I ⎤
−1
−1
⎢ K ⎥ ( I + Ps K ∞ ) M s =
⎣ ∞⎦
∞
⎡ W2 ⎤
= ⎢ −1 ⎥ ( I + PK ) −1 ⎣⎡W2−1
⎣W1 K ⎦
⎡W ⎤
−1
⎥ ( I + KP) ⎡⎣W1
⎣W2 P ⎦
= ⎢
−1
1
⎡ I ⎤
−1
⎢ K ⎥ ( I + Ps K ∞ ) [ I Ps ]
⎣ ∞⎦
∞
⎡I ⎤
PW1 ⎦⎤ = ⎢ ⎥ ( I + K ∞ Ps ) −1 [ I
⎣ Ps ⎦
∞
K∞ ]
∞
PW2−1 ⎤⎦ .
∞
A partir disso, temos a seguinte formulação do problema, indicado na figura 58:
⎡ z1 ⎤ ⎡ W2 ⎤
−1
−1
⎢ z ⎥ = ⎢W −1K ⎥ ( I + PK ) ⎣⎡W2
⎣ 2⎦ ⎣ 1 ⎦
z2
⎡w ⎤
PW1 ⎦⎤ ⎢ 1 ⎥ .
⎣ w2 ⎦
w2
W1−1
w1
W1
K
W2
P
z1
W2−1
_
Figura 58
12.3 Justificação teórica para loop shaping com H ∞
Trata-se de justificar o uso do parâmetro ε como um indicador para o projeto. Pode-se
provar que ε é um bom indicador tanto para a estabilidade robusta do SMF e para o
sucesso do projeto ao se alcançar as especificações desejadas no loop shaping.
Examinaremos primeiramente a possibilidade de deterioração do loop shaping em
projetos de alto ganho (tipicamente, de frequências baixas). Esta deterioração pode ser
medida comparando σ ( PW1 K ∞W2 ) com σ ( Ps ) = σ (W2 PW1 ) .
Agora, note-se que
σ ( PK ) = σ ( PW1K ∞W2 ) = σ (W2−1W2 PW1K ∞W2 ) ≥
σ (W2 PW1 )σ ( K ∞ )
,
κ (W2 )
(5)
onde κ (⋅) , como vimos, é o número condicionante.
De modo semelhante, para deterioração da loop shaping na entrada da planta, temos
−1
σ ( KP) = σ (W1K ∞W2 P) = σ (W1K ∞W2 PWW
1 1 )≥
σ (W2 PW1 )σ ( K ∞ )
.
κ (W1 )
(6)
79
Observe-se que tanto κ (W1 ) como κ (W2 ) são escolhidos pelo projetista.
A seguir, notando-se que Ps designa a planta “shaped” e que K ∞ estabiliza robustamente
a fatoração normalizada de Ps com margem de estabilidade ε , temos
⎡ I ⎤
−1
−1
(7)
≤ ε −1 := γ ,
⎢ K ⎥ ( I + Ps K ∞ ) M s
⎣ ∞⎦
∞
onde M s é o denominador da fatoração normalizada de Ps e o parâmetro γ é introduzido
para simplificar a notação no que se segue.
O resultado seguinte mostra que σ ( K ∞ ) é limitado por funções de ε e de σ ( Ps ) .
Teorema
(8)
Qualquer controlador satisfazendo a (7), onde se supõe que Ps seja uma matriz quadrada,
σ ( Ps ( jω )) − γ 2 − 1
também satisfaz a σ ( K ∞ ( jω )) ≥
para todo ω tal que
Além disso, se
igual a 1/
γ 2 − 1σ ( Ps ( jω )) + 1
σ ( Ps ( jω )) > γ 2 − 1 .
σ ( Ps ( jω ))
γ 2 −1 , então σ ( K ∞ ( jω )) é assintoticamente maior ou
γ 2 −1 quando σ ( Ps ) → ∞
•
Prova: ZDG, pp. 490-492.
A implicação mais importante deste teorema é que o limite em σ ( K ∞ ) depende somente
da loop shape escolhida e da margem de estabilidade da planta “shaped”.
A seguir temos:
Teorema
Qualquer controlador K ∞ que satisfaça a (7) também satisfaz a
σ ( K ∞ ( jω )) ≤
γ 2 − 1 + σ ( Ps ( jω ))
1 − γ 2 − 1σ ( Ps ( jω ))
para todo ω tal que σ ( Ps ( jω )) <
Além disso, se σ ( Ps ( jω ))
igual a
(9)
1
γ 2 −1
1
γ 2 −1
.
, então σ ( K ∞ ( jω )) é assintoticamente menor ou
γ 2 − 1 quando σ ( Ps ) → 0 .
Prova: ZDG, pp. 492s.
•
80
Os resultados destes dois teoremas confirmam que γ (ou alternativamente ε ) indicam a
compatibilidade entre a “loop shape” especificada e as especificações de estabilidade do
SMF.
81