SISTEMAS LINEARES ESTOCÁSTICOS COM ATRASO GOVERNADO POR
PROCESSO DE BERNOULLI
Alessandro N. Vargas∗, João B. R. do Val†
∗
Universidade Tecnológica Federal do Paraná, UTFPR,
Av. Alberto Carazzai 1640, 86300-000 Cornelio Procópio-PR, Brasil;
∗
Basque Center for Applied Mathematics, BCAM,
Alameda de Mazarredo 14, E-48009 Bilbao, Vizcaya, España
(de 1o. janeiro à 28 de fevereiro de 2011).
†
Universidade Estadual de Campinas (UNICAMP)
Depto. de Telemática-FEEC, 13081-970, Campinas, SP, Brasil
Emails: [email protected], [email protected]
Resumo— Este artigo apresenta resultados que caracterizam a dinâmica do valor esperado do estado de
sistemas lineares estocásticos sujeitos a atraso. O atraso no sistema depende de um processo aleatório de Bernoulli,
com uma determinada probabilidade de ocorrência de sucessos e falhas, com aplicações imediatas em sistemas
sujeitos a falhas nos canais de transmissão. Apresentamos uma aplicação real, realizando o controle de nı́vel
num tanque, que emprega transmissão de dados sob uma rede sujeita a perda de pacotes, ilustrando assim a
potencialidade do uso dos resultados desenvolvidos.
Palavras-chave—
sistemas estocásticos, sistemas com atraso, processos sujeitos a falhas
Abstract— This paper presents results that characterize the dynamics of the expected value operator of the
system state for linear stochastic systems subject to delay. The delay in the system depends on a random
Bernoulli process with a fixed probability of ocurrence of successes and failures, specially adapted for systems
subject to failures on the communication links. We also present a real application that implements the control
level in a tank, considering the data transmitted over a network subject to packet dropouts, thus illustrating the
usefulness of the derived approach.
stochastic systems, systems with delay, processes subject to failures
Keywords—
1
Introdução
Sistemas sujeitos a atraso e falhas nas linhas de comunicação são muito comuns na prática, e muito
esforço têm-se empreendido nos últimos anos no
estudo e desenvolvimento de novos resultados para
essa classe de sistemas, veja por exemplo os trabalhos (Mahmoud, 2010), (Verriest and Michiels, 2009), (Hespanha and Naghshtabrizi, 2007),
(Xia et al., 2009), (Moayedi et al., 2011) como
uma pequena amostra. O resultado deste trabalho
contribui nessa direção por considerar um caso especial de sistemas lineares com atraso dependendo
de uma representação particular de sucessos e falhas na comunicação e governado por um processo
de Bernoulli.
Vamos agora apresentar o sistema sob estudo. Considere um espaço de probabilidade fixado (Ω, F, P ), e associado a este considere o sistema
x(k + 1) = Ax(k) + Bx(k − δk ) + Dw(k),
(1)
∀k ≥ 0, com x0 ∈ Rn e δ0 = 0, no qual xk e
wk , k ≥ 0 são processos tomando valores respectivamente em Rr e Rq . A entrada de ruı́do {wk }
Pesquisa financiada em parte pela FAPESP Processo 03/06736-7 e CNPq Processos 471557/2009-9 e
304856/2007-0, e em parte pela Fundación Carolina (Madrid, Espanha) – Programa “Movilidad de profesores e investigadores Brasil-España. C.2010”.
forma um processo iid com média nula e matrix
de covariância igual a identidade para cada k ≥ 0.
Associado a (1), consideramos um processo aleatório usual de Bernoulli com probabilidade de sucessos e falhas dada por p e 1−p, respectivamente,
e tomando valores “0” e “1”.
Os instantes de tempo
0 < k 1 < k2 < . . . < ki < . . .
representam o tempo no qual a informação é recebida com sucesso pelo sistema (1). De fato, o
processo de contagem das variáveis aleatórias de
Bernoulli formam um processo binomial que se encarrega da contagem de fracassos correspondentes
ao atraso, e quando ocorre o sucesso o instante
ki registra essa ocorrencia e reinicia o processo de
contagem fazendo δki = 0, veja a Fig. 1. Note
que o processo de atraso satisfaz a regra
δk = k − ki ,
k = ki , . . . , ki+1 − 1.
(2)
A principal contribuição deste trabalho é caracterizar a expressão da dinâmica do valor esperado de x(k). Em outras palavras, conseguimos
determinar a função ϕk : Rn × · · · × Rn 7→ Rn
para cada k > 0 tal que
E[x(k)] = ϕk (E[x(k − 1)], E[x(k − 2)], . . . , x0 ),
veja a expressão em (17) como comparação. Cabe
ressaltar que a função ϕk , para ser bem definida,
ou ainda de modo equivalente a
8

7
δk
6
x(ki + s) = As +
5
4
s−1
X
j=0
+

Aj B  x(ki )
s−1
X
As−j Dw(ki + j)
(4)
j=0
3
2
sempre que s ∈ {1, . . . , ki+1 − ki }. Visando simplificar a notação, defina
1
0
k0
k1 k2
k3
k4k5k6
s
M (s) = A +
s−1
X
Aj B,
s = 1, 2, . . . ,
(5)
j=0
Figura 1: Uma realização para o processo aleatório
de atraso {δk } com reinı́cio nos instantes de chegada
(sucesso) ki , i ≥ 0. O sucesso ou falha de Bernoulli
define o tempo de ocorrencia de cada ki .
requer que o raio espectral da matriz pA seja estritamente menor que um. Além disso, as expressões
encontradas nesse trabalho possibilitam a avaliação numérica de E[x(k)], e como subproduto é
possı́vel avaliar a estabilidade ou estabilidade assintótica de E[x(k)] quando k tende a infinito.
O resultado deste trabalho possui interesse
particular para o controle de sistemas via rede
com perdas de pacotes, pois a representação do
atraso que adotamos é geral o suficiente e pode ser
usada para incorporar falhas nas linhas de comunicação. Para ilustrar essa propriedade, apresentamos nesse artigo uma aplicação real que controla
o nı́vel de água num tanque através de uma rede
emulada sujeita a perda de pacotes de informação,
veja a Seção 3.
Este artigo está organizado da seguinte maneira. A Seção 2 apresenta a notação necessária, definições, e resultado principal. Finalmente,
apresentamos na Seção 3 uma aplicação num processo de nı́vel num tanque.
2
ν(s, k) =
s−1
X
As−j Dw(k + j),
k, s = 1, 2, . . . ,
j=0
(6)
com ν(0, k) = 0 para cada k ≥ 0. Observe desde
(4)-(6) que
x(ki + s) = M (s)x(ki ) + ν(s, ki ).
(7)
O processo {δk } é governado, por hipótese,
pelo processo de Bernoulli iid, e por isto o tempo
entre chegadas (definindo o tempo entre a ocorrência de dois sucessos sequenciais) é definido por
si = ki+1 − ki ,
∀i ≥ 0,
(8)
que por sua vez segue a distribuição geométrica
(Bertsekas and Tsitsiklis, 2002, Ch. 5).
Pr(si = n) = p(1 − p)n−1 ,
∀i ≥ 0, ∀n ≥ 1. (9)
Combinando (4)-(8), temos
x(ki+1 ) = M (si )x(ki ) + ν(si , ki ),
∀i ≥ 0. (10)
Comentário 1 Afirmamos que
E[ν(si , ki )] = 0,
i = 0, 1, . . . .
(11)
De fato, através da hipótese que o processo {si }
é iid e independente do processo de ruı́do aditivo
{w(ki )}, podemos escrever
Notação e resultado principal
Os números reais e naturais são denotados respectivamente por R e N. O superscript ′ indica
o transposto da matriz; k · k representa a norma
Euclideana em Rn . Seja σ(·) o operador de raio
espectral. A função indicadora do conjunto C é
representada por 11C .
Vamos agora relembrar o sistema (1). A identidade em (2) nos habilita a reescrever (1) de modo
equivalente a
k ∈ {ki , . . . , ki+1 − 1}
⇒ x(k + 1) = Ax(k) + Bx(ki ) + Dw(k),
com M (0) = I e
(3)

E
sX
i −1
j=0

Asi −j Dw(ki + j)

= E
sX
i −1
j=0

Asi −j D E[w(ki + j)].
Essa identidade e a hipótese que E[wk ] ≡ 0 produzem o resultado em (11).
O próximo resultado define uma matriz determinı́stica que será útil mais adiante.
Lema 1 Se σ(pA) < 1, então é válida
E[M (si )] = H(p),
i = 0, 1, . . .
(12)
Aplicando o operador de valor esperado em
ambos os lados de (10), e considerando (11) e (16),
obtemos
E[x(ki+1 )] = E[M (si )x(ki )] + E[ν(si , ki )]
no qual q = 1 − p e
= E[M (si )]E[x(ki )].
H(p) = pA[I + qA(I − qA)−1 ]
+ [I + qA(I − qA)−1 ]B.
(13)
Prova: Pela definição,
E[M (si )] =
∞
X
O resultado segue imediatamente do Lema 1.
✷
Estamos agora em condições de apresentar o
principal resultado deste artigo.
Teorema 3 Se σ(pA) < 1, então para cada k =
0, 1, . . ., temos que a fórmula em (17) é válida.
M (s) Pr(si = s).
s=1
Prova: Considere um instante de tempo k fixado.
Então pode ocorrer i = 0, 1, . . . , k sucessos até o
instante k. Considerando que ki denota o instante
do i-ésimo sucesso, podemos escrever a igualdade
Usando (5) e (9) na identidade acima, obtemos
E[M (si )] =
∞
X
M (s)q s−1 p
s=1
=p
∞
X
s=0

q s As+1 +
s
X
j=0

Aj B  .
E[x(k)] =
(14)
s=1 j=0
(15)
O segundo termo dentro dos parenteses em
(15) é igual a
qA2 (I − qA)−1 ,
e o terceiro é igual a
E[x(k)11ki ≤k<ki+1 ]
= E[x(k)|ki ≤ k < ki+1 ] Pr{ki ≤ k < ki+1 }.
(19)
A probabilidade de ocorrência do evento {ki ≤
k < ki+1 } é equivalente a ocorrerem i sucessos em
k tentativas, que por sua vez representa uma v.a.
com distribuição Binomial dada por (Bertsekas
and Tsitsiklis, 2002, Sec. 5.1)
k i
Pr{ki ≤ k < ki+1 } =
p (1 − p)k−i . (20)
i
Pr{k0 ≤ k < k1 } = (1 − p)k ,
Estes fatos nos habilitam a concluir que
+ qB + qA(I − qA)−1 B
= H(p),
x(k) = M (k)x0 + ν(k, 0).
✷
(22)
Podemos concluir de (19)-(22) com i = 0 que
O próximo resultado mostra que a matriz
H(p) é suficiente para caracterizar a dinâmica do
valor esperado do estado no caso especı́fico do
tempo entre chegadas.
E[x(k)11k0 ≤k<k1 ]
= E[x(k)|k0 ≤ k < k1 ] Pr{k0 ≤ k < k1 }
= E[M (k)x0 |k0 ≤ k < k1 ](1 − p)k
= (1 − p)k M (k)x0 .
Lema 2 Se σ(pA) < 1, então
(23)
Esta última igualdade, combinada com (18)–(20),
nos leva a concluir que
∀i ≥ 0,
no qual H(p) satisfaz (13).
E[x(k)] = (1 − p)k M (k)x0
Prova: Da hipótese de que si e x(ki ) são independentes para cada i ≥ 0, temos que
+
k
X
i=1
E[M (si )x(ki )] = E[M (si )]E[x(ki )].
(21)
o que significa que nos instantes 1, 2, . . . , k ocorrem somente fracassos. Isto nos permite obter de
(7) que (relembre que k0 = 0)
E[M (si )] = p(A + B) + pqA2 (I − qA)−1
que por sua vez prova o resultado.
(18)
No caso particular quando i = 0, temos de
(20) que
q
I + A(I − qA)−1 B.
p
E[x(ki+1 )] = H(p)E[x(ki )],
E[x(k)11ki ≤k<ki+1 ].
i=0
Note que
Fazendo um simples reajuste nos termos de (14),
é possı́vel mostrar que E[M (si )] é idêntico a


s
∞ X
∞
X
X
q s Aj B  .
(qA)s +
p (A + B) + A
s=1
k
X
(16)
E[x(k)|ki ≤ k < ki+1 ]
k i
p (1 − p)k−i .
i
(24)
k
E[x(k)] = (1 − p) M (k)x0 +
k
X
i=1
k−1
X
t−1 i
M (k − t)E[x(t)]
p (1 − p)t−i
i
−
1
t=i
! k−1 i
k i
k−i
i
p (1 − p)
p (1 − p)k−i .
+ H(p) x0
i−1
i
Considere agora i > 0. Perceba que o evento
{ki ≤ k < ki+1 , ki = t} implica que no instante
ki = t ocorre um sucesso e nos instantes subsequentes t + 1, . . . , k ocorrem fracassos. Temos então de (7) que
x(k) = M (k − t)x(t) + ν(k − t, t).
(25)
(17)
h(k)
Network
Podemos agora empregar (25) para escrever a
identidade
E[x(k)|ki ≤ k < ki+1 , ki = t]
= E[M (k − t)x(t) + ν(k − t)]
= M (k − t)E[x(t)].
(26)
Figura 2: Diagrama esquemático representando o
No caso particular em que ki = k em (26), temos
do Lema 2 que
processo de nı́vel de água e as linhas de comunicação correspondentes entre o processo e o computador,
de acordo com a aplicação da Seção 3.
E[x(k)|ki ≤ k < ki+1 , ki = k]
= E[x(ki )] = H(p)i x(k0 ) = H(p)i x0 .
(27)
Todavia, devido a igualdade condicional
E[x(k)|ki ≤ k < ki+1 ]
=
k
X
E[x(k)|ki ≤ k < ki+1 , ki = t] Pr{ki = t}
t=i
podemos recuperar as expressões em (26) e (27)
para escrever
E[x(k)|ki ≤ k < ki+1 ]
=
k−1
X
M (k − t)E[x(t)] Pr{ki = t}
t=i
+ H(p)i x0 Pr{ki = k}.
(28)
Note que Pr{ki = t}, que representa a probabilidade de ocorrencia do i-ésimo sucesso no instante t, obedece a distribuição de Pascal dada por
(Bertsekas and Tsitsiklis, 2002, Sec. 5.1)
t−1 i
Pr{ki = t} =
p (1 − p)t−i , t = i, . . . , k.
i−1
(29)
Finalmente, juntando (24), (28) e (29), obtemos imediatamente o resultado em (17).
✷
3
Aplicação: Processo de nı́vel de água
numa rede sujeita a perda de pacotes
É bastante conhecido que perda de pacotes ocorrem frequentemente em rede de dados, e em tais
situações é extremamente desejável verificar o
comportamento do sistema, e como via de regra a estabilidade do sistema global é um dos
principais objetivos a serem alcançados no projeto (Hespanha and Naghshtabrizi, 2007), (Zhang
and Yu, 2007), (Sun and Qin, 2011), (Ishido
et al., 2011), (Moayedi et al., 2011).
De modo a verificar o comportamento de
longo prazo do sistema sujeito a perda de pacotes
na comunicação, e como subproduto a sua estabilidade em termos do valor esperado do estado,
apresentamos uma aplicação real de controle de nı́vel num tanque no qual as linhas de comunicação
da realimentação dependem de linhas de transmissão que estão sujeitas a perda de pacotes, veja Fig.
2 para uma representação pictorial. O processo de
tentativas de Bernoulli emula uma rede através da
implementação do esquema de falhas e sucessos no
transito das informações entre o computador e o
sistema de nı́vel.
O aparato experimental usado é baseado no
Módulo 2325 - Controle de Nı́vel e Temperatura fabricado pela empresa Datapool Eletrônica Ltda,
Brasil, associado com um cartão de aquisição de
dados da National Instruments USB-6008 para
implementar a linha fı́sica com o computador, veja
a Fig. 3. A rede é emulada no software Matlab,
que implementa as linhas de realimentação, observando que estas estão sujeitas à variável de Bernoulli com probabilidade de sucessos fixada em p.
O computador é também usado para implementar
fisicamente um controlador remoto phase-lag. O
p = 0.01
p = 0.3
p = 0.7
p = 0.99
kE[x(k)]k
300
200
100
0
0
20
40
60
k
Figura 3: Aparato experimental utilizado no procedimento descrito na Seção 3.
perı́odo de amostragem usado é de 35 milisegundos.
O sistema linear estocástico representando o
processo de nı́vel de água no tanque é dado por
x(k + 1) = Ax(k) + By(k) + Dω(k),
y(k) = Cx(k − δk ), k ≥ 0,
Figura 4: Valor da norma do valor esperado de x(k),
para cada k ≥ 0, considerando quatro distintos valores
para a probabilidade p, de acordo com o modelo do
processo de nı́vel de água da Seção 3.
Nı́vel de água medido no tanque
12.8
p = 0.99
p = 0.01
11.2
(30)
h(k)
no qual {y(k)} representa a saı́da do sistema, e os
demais elementos coincidem com (1). Os parâmetros do sistema são
1.996439
−0.996454
A=
,
0.999996 −3.518042 · 10−6
1.878949
B = 10−3 ×
,
1.876749
C = 10−3 × 1.876762 1.874540 , D = 0.05I.
O nı́vel de água dentro do tanque, dado em centı́metros, satisfaz a expressão
h(k) = 4y(k) + 11.64,
9.6
8
0
4
k(×104 )
8
12
Figura 5: Nı́vel de água medido no tanque, dado em
centı́metros, para duas realizações distintas do processo de Bernoulli com duas probabilidades de sucesso
opostas, de acordo com a aplicação da Seção 3.
∀k ≥ 0.
Avaliando numericamente a fórmula (17) para
o modelo em (30), percebemos que para cada 0 <
p < 1 o sistema (30) é assintoticamente estável na
média (Arnold, 1974, p.188), (Vargas and do Val,
2010), ou seja,
lim kE[x(k)]k = 0,
k→∞
veja a Fig. 4 para a representação gráfica que
considera quatro probabilidades distintas.
Este comportamento de estabilidade obtido
numericamente também é confirmado no experimento, veja a Fig. 5. A figura apresenta a resposta real do processo considerando transmissão
de dados pela rede com probabilidades de sucesso alta e baixa, cujos valores são p = 0.99
e p = 0.01 respectivamente. Percebemos claramente que o controle no nı́vel de água no tanque
é mais pobre no segundo caso quando comparado
com o primeito, e este fato é razoável pois uma pequena probabilidade de sucessos representa uma
alta probabilidade de falhas que torna o ativamento do atuador da bomba de controle menos
eficiente.
Em resumo, mesmo no cenário real de falhas
de transmissão de dados em sistemas de controle
via rede, o equipamento mantém um comportamento estável conforme indicado pela avaliação
numérica obtida através da expressão em (17).
4
Comentários finais
Este trabalho desenvolve a expressão da dinâmica
do valor esperado do estado do sistema (1), ou de
modo equivalente, o resultado do Teorema 3 provê
a expressão para calcular E[x(k)]; essa expressão
é função de
Mahmoud, M. S. (2010). Switched Time-Delay
Systems: Stability and Control, Springer.
E[x(k − 1)], E[x(k − 2)], . . . , x0 .
Moayedi, M., Foo, Y. and Soh, Y. (2011). Networked LQG control over unreliable channels,
Int. J. Robust Nonlinear Control . doi:
10.1002/rnc.1822.
Como o sistema estocástico considera o atraso
governado por um processo de Bernoulli, as aplicações para sistemas de controle via rede sujeitos
a perda de pacotes são evidentes e uma aplicação
real é apresentada para ilustrar este fato.
Referências
Arnold, L. (1974). Stochastic differential equations: Theory and applications, WileyInterscience.
Bertsekas, D. P. and Tsitsiklis, J. N. (2002). Introduction to Probability, Athena Scientific; 1st
ed.
Hespanha, J. P. and Naghshtabrizi, Y. X. (2007).
A survey of recent results in networked control systems, Proc. IEEE Special Issue on
Technology of Networked Control Systems,
pp. 138–162.
Ishido, Y., Takaba, K. and Quevedo, D. E. (2011).
Stability analysis of networked control systems subject to packet-dropouts and finitelevel quantization, Systems Control Lett.
60(5): 325–332.
Sun, Y. and Qin, S. (2011). Stability of networked
control systems with packet dropout: an average dwell time approach, IET Control Theory Appl. 5(1): 47–53.
Vargas, A. N. and do Val, J. B. R. (2010). Average cost and stability of time-varying linear systems, IEEE Trans. Automat. Control
55: 714–720.
Verriest, E. I. and Michiels, W. (2009). Stability analysis of systems with stochastically
varying delays, Systems Control Lett. 58(1011): 783–791.
Xia, Y., Fu, M. and Shi, P. (2009). Analysis and
Synthesis of Dynamical Systems with TimeDelays, Springer. (Lecture Notes in Control
and Information Sciences).
Zhang, W.-A. and Yu, L. (2007). Output feedback stabilization of networked control systems with packet dropouts, IEEE Trans. Automat. Control 52(6): 1705–1710.
Download

Sistemas lineares estocásticos com atraso governado por