XVII Encontro de Modelagem Computacional
V Encontro de Ciência e Tecnologia de Materiais
Universidade Católica de Petrópolis (UCP), Petrópolis/RJ, Brasil. 15-17 out. 2014
RECONCILIAÇÃO ROBUSTA DE DADOS EM COLUNAS DE DESTILAÇÃO
UTILIZANDO O SIMULADOR EMSO
Diego Queiroz Farias de Menezes –[email protected]
Universidade Federal Fluminense, Departamento de Engenharia Química e de Petróleo, CEP
24210-240 – São Domingos, Niterói, RJ, Brasil
Irene Cristina Sarruf Pinheiro– [email protected]
Universidade Federal Fluminense, Programa de Pós Graduação em Engenharia Química, CEP
24210-240 – São Domingos, Niterói, RJ, Brasil
Diego Martinez Prata – [email protected]
Universidade Federal Fluminense, Departamento de Engenharia Química e de Petróleo, CEP
24210-240 – São Domingos, Niterói, RJ, Brasil
Fernando Cunha Peixoto – [email protected]
Universidade Federal Fluminense, Departamento de Engenharia Química e de Petróleo, CEP
24210-240 – São Domingos, Niterói, RJ, Brasil
Resumo. Este trabalho apresenta um estudo sobre reconciliação robusta de dados em estado
estacionário em colunas de destilação, com base em um trabalho publicado na literatura
científica. É realizada uma breve revisão bibliográfica com foco nos problemas que envolvem
colunas de destilação, e também, uma revisão dos estimadores-M robustos usados na
reconciliação de dados e detecção simultânea de erros grosseiros. O exemplo avaliado é
constituído por sete colunas de destilação de óleo cru com 26 variáveis medidas, sendo 3
destas variáveis corrompidas por erros grosseiros. O problema selecionado é resolvido no
pacote computacional EMSO (Ambiente para Modelagem, Simulação e Otimização) que
dispõe de rotinas computacionais propriamente desenvolvidas para reconciliação de dados
em estado estacionário com restrições lineares ou não lineares. São introduzidos três
estimadores-M robustos: Tangente Hiperbólica, Collins e Alamgir oriundos da estatística
robusta para aplicação em problemas de engenharia química. Outros estimadores já
presentes no pacote computacional EMSO foram também utilizados. Resultados satisfatórios
são obtidos comprovando a eficiência dos estimadores utilizados e o desempenho do pacote
computacional EMSO. Assim, são apresentadas as vantagens da reconciliação robusta de
dados e sua contribuição para processos de engenharia química.
Palavras-chave: Reconciliação de Dados, Estimadores Robustos, Colunas de Destilação
1.
INTRODUÇÃO
Medidas de processo precisas são de extrema importância para controle, otimização,
qualidade, segurança e eficiência do processo. Entretanto, essas medidas contêm erros,
aleatórios e grosseiros, causados, por exemplo, pela imprecisão intrínseca dos instrumentos de
medição. Desta forma, não se espera que os dados medidos obedeçam às leis de conservação.
Portanto, um procedimento de retificação de dados (RTD) é essencial para recuperar
satisfatoriamente a informação contida nos dados. Este é basicamente dividido em três etapas:
classificação de variáveis; detecção de erros grosseiros (DEG) e reconciliação de dados (RD).
O procedimento mais utilizado na RTD é a RD, onde dados medidos são ajustados de
maneira estatisticamente coerente pelo estimador (função objetivo) resultante da formulação
XVII Encontro de Modelagem Computacional
V Encontro de Ciência e Tecnologia de Materiais
Universidade Católica de Petrópolis (UCP), Petrópolis/RJ, Brasil. 15-17 out. 2014
de máxima verossimilhança sobre a distribuição estatística dos erros de medição assumida, de
forma a satisfazer às leis de conservação e demais restrições impostas ao sistema (modelo
matemático), obtendo estimativas confiáveis para as variáveis e parâmetros do processo (Prata
et al., 2010). Tradicionalmente é assumida distribuição Normal, que resulta no estimador de
Mínimos Quadrados Ponderados (MQP).
A primeira etapa na RTD é a classificação das variáveis. Esta etapa determina se a
informação disponível é suficiente para resolver o problema de reconciliação e identificar os
conjuntos de variáveis observáveis (variáveis medidas e não-medidas que podem ser
estimadas por meio das demais variáveis medidas e pelas restrições do processo) e nãoobserváveis (variáveis não medidas que não podem ser estimadas). A segunda etapa na RTD é
a DEG, um tipo especial de erro, que não segue a distribuição estatística de erros assumida.
Erros grosseiros podem ser divididos em valores espúrios (outliers) e desvios sistemáticos
(bias). Esses erros podem ser causados por má calibração dos instrumentos de medições,
deterioração dos sensores, flutuações súbitas de energia, entre outros. A abordagem clássica
para lidar com esse problema consiste na detecção e eliminação ou compensação desses erros,
o que pode ser feito iterativamente por estratégias sequenciais ou simultâneas (Narasimhan &
Jordache, 2000). A literatura científica tem mostrado que estimadores-M robustos derivados
da estatística robusta são ótimos candidatos para realizar este procedimento de maneira
simultânea. Os estimadores-M são resultantes da formulação de máxima verossimilhança
sobre uma distribuição da estatística robusta (função objetivo do problema de otimização
associado à estrutura do procedimento de RD). Utilizando-se os estimadores-M robustos é
possível minimizar ou eliminar os efeitos negativos dos erros grosseiros sobre as variáveis,
sem a necessidade de eliminar as variáveis identificadas com erros grosseiros,
simultaneamente com a RD, evitando estratégias iterativas e computacionalmente intensivas.
Isto é conhecido como Reconciliação Robusta de Dados (RDD) (Prata et al., 2010).
Outro procedimento importante é caracterização da matriz de variância/covariância dos
erros de medição, já que as variáveis envolvidas no processo possuem grandezas distintas,
obtidas por instrumentos de medição com diferentes graus de precisão. O inverso desta matriz
pondera coerentemente o peso dado às variáveis na função objetivo (estimador), evitando-se
ajustes tendenciosos. Geralmente, é assumido não haver correlação entre os erros de medição
(covariâncias), e, assim, esta matriz possui a forma diagonal (matriz de variâncias).
A RD tem sido aplicada nos mais diversos processos (Prata et al., 2010).
Um dos processos de interesse da indústria química e petroquímica é a destilação. Esta é
uma antiga operação unitária, tendo como principais aplicações o fracionamento do petróleo,
a obtenção de álcoois, a extração de essências e purificação de substâncias (Kister, 1992).
Atualmente, com a evolução dos computadores, modelos matemáticos e projetos de colunas
de destilação através de simuladores, como: Aspen/Hysys, ProII, ChemCAD e EMSO, entre
outros, tem se tornado uma prática bastante eficaz e precisa, porém, bastante complexa. Isto
se deve, em parte, a existência de correlações entre as variáveis de processo, e a utilização
conjunta dos procedimentos de RD/DEG, controle e otimização, para fins de aplicação real
nestes equipamentos em processos industriais.
O simulador EMSO - Ambiente para Modelagem, Simulação e Otimização - (Soares &
Secchi, 2003) dispõe de rotinas computacionais propriamente desenvolvidas para RD em
estado estacionário com restrições lineares ou não lineares, incluindo testes tradicionais para a
DEG e estimadores: robustos (Fair, Cauchy, Logística, Hampel e Lorenziana) e quase robusto
(Normal Contaminada), baseados no trabalho de Özyurt & Pike (2004).
Seguindo esta direção, este trabalho apresenta um estudo sobre RRD em estado
estacionário em colunas de destilação, utilizando o software EMSO (Soares & Secchi, 2003).
XVII Encontro de Modelagem Computacional
V Encontro de Ciência e Tecnologia de Materiais
Universidade Católica de Petrópolis (UCP), Petrópolis/RJ, Brasil. 15-17 out. 2014
2. REVISÃO DA LITERATURA
A aplicação de RD e DEG em problemas de engenharia química inicia-se nos anos 60. A
partir daí muitos artigos e livros aplicados a processos químicos vêm sendo escritos.
Entretanto, há um número pequeno de trabalhos de RD em aplicação reais (Prata et al., 2010).
Os estimadores robustos têm sido muito reportados na literatura técnica para lidar com o
problema de RD e DMEG simultaneamente - RRD. Tjoa & Biegler (1991) provaram que
usando o estimador baseado na distribuição Normal Contaminada, ao invés do tradicional
MQP, qualquer valor espúrio presente nas medidas podia ser substituído por valores
reconciliados, sem necessitar de esquemas iterativos. Johnston & Kramer (1995) reportaram a
viabilidade e o melhor desempenho de estimadores robustos para o problema de RD, bem
como introduziram o estimador robusto Lorenziana. Albuquerque & Biegler (1996) e Arora &
Biegler (2001) analisaram os estimadores robustos em sistemas dinâmicos utilizando dados
simulados. Estes últimos mostraram a eficiência do estimador Hampel. O primeiro estudo
comparativo entre alguns estimadores robustos, para problemas de RD operando em estado
estacionário, foi realizado por Özyurt & Pike (2004). Os autores concluíram que os
estimadores de Cauchy e Hampel obtiveram resultados promissores. Zhou et al. (2006)
também realizaram estudo comparativo entre estimadores robustos, introduzindo o estimador
de Huber. Posteriormente, Prata et al. (2008) desenvolveram o primeiro estudo comparativo
de estimadores-M robustos em problemas dinâmicos com restrições não-lineares,
representativo de um reator químico continuamente agitado e não isotérmico. Os autores
introduziram o estimador de Welsch (Holland & Welsch, 1977) em RDD, que juntamente
com o estimador Lorenziana mostraram-se mais eficiêntes. Prata et al. (2010) foram pioneiros
na aplicações de estimadores-M robustos em sistema dinâmico com restrições não lineares
utilizando dados industriais reais de um reator de polimerização. Subsequentemente,
diferentes estimadores-M robustos e seus desempenhos em reconciliação de dados foram
reportados em diversos problemas. Kong et al. (2000) e Jin et al. (2012) desenvolveram seus
próprios estimadores-M robustos. Estes estudos têm mostrado o enorme potencial da
estatística robusta, pois a insensibilidade dos estimadores robustos a divergências de hipóteses
ideais faz com que eles tendam a ignorar valores atípicos – erros grosseiros.
A complexidade de tratar com robustez a RD em um processo não trivial como a
destilação juntamente com modelos fenomenológicos rigorosos de colunas de destilação,
como por exemplo, as equações MESH - Mass, Equilibrium, Summation and Enthalpy (Kister, 1992), faz com que se tenha uma escassez de artigos neste campo. Geralmente, os
modelos são considerados em estado estacionário e representados apenas por balanço de
massa, equações de normalização e balanço de massa por componente. Os dois primeiros
resultam em sistemas lineares, e o último resulta em um problema não linear mais simples,
chamado de bilinear, uma vez que a não linearidade é representada especificamente pelo
produto de duas variáveis de decisão para o problema de RD (vazão e concentração).
Wang et al. (2004) avaliaram uma estratégia baseada na utilização conjunta dos testes de
medida e nodal (MT-NT) para RD e DEG em um conjunto de 7 colunas em série. Este
problema opera em estado estacionário, e as restrições são lineares, ou seja, apenas balanço
material global. Farzi et al. (2008) desenvolveram um modelo dinâmico e mais complexo para
realizar a RD dinâmica, em uma coluna de destilação, estimando as temperaturas por meio de
duas estratégias: redes neuronais artificiais e filtro de Kalman estendido.
Fica claro a escassez de trabalhos envolvendo processo de destilação e reconciliação de
dados com detecção de erros grosseiros. Isto motivou a realização deste trabalho e a pesquisa
em estimadores-M robustos.
XVII Encontro de Modelagem Computacional
V Encontro de Ciência e Tecnologia de Materiais
Universidade Católica de Petrópolis (UCP), Petrópolis/RJ, Brasil. 15-17 out. 2014
3. O PROBLEMA DE RECONCILIAÇÃO ROBUSTA DE DADOS ESTACIONÁRIA
Existem muitas classes de estimadores robustos, sendo as mais populares aquelas
utilizadas nos estimadores-M, que são generalizações de um estimador de máxima
verossimilhança (Prata et al., 2010). Assumindo que os erros de medição não são
correlacionados, o problema de RRD estacionário, de forma generalizada, adota a formulação,
x −z
min ∑ ρ  i i
i
 σi

 = min ∑ ρ (ξ i )
i

(1)
sujeito a
h ( x, u ) = 0
(2)
g ( x, u ) ≥ 0
(3)
onde ρ é uma função razoavelmente monotônica, ξi e σi são, respectivamente, o resíduo
padronizado e o desvio padrão da variável discreta medida zi, x e u são os vetores das
variáveis medidas reconciliadas e não medidas (observáveis) estimadas, respectivamente.
Finalmente, h e g são as restrições algébricas de igualdade e desigualdade, respectivamente.
Apresentam-se os estimadores-M: MQP (não robusto), Normal Contaminada (NC), Fair,
Collins, Tangente Hiperbólica (TanH), Alamgir e Welsch como possíveis escolhas para ρ
descritos nas Equações (4), (5), (6), (7), (8), (9) e (10), respectivamente.
ρ MQP (ξ i ) =
ξ i2
(4)
2
 ξ i2  p
 ξ2 
 + exp − i 2 
 2  b
 2b 
ρ NC (ξ i , b, p) = − ln[(1 − p )]exp −
(5)

ξ 
− ln 1 + i  
 c F
 c F  
(6)
 ξi
ρ Fair (ξ i , c F ) = c F2 

ξi2
 ξi  
2
  
a
 Cl  
 

a
 
ρ Collins  qCl  =  −2log cosh Cl ( ξ i − rCl )   + d Cl
 
 2
 
 
 rCl  

 
 d Cl  
d Cl

ξi ≤ qCl
qCl < ξ i ≤ rCl
ξ i > rCl
(7)
XVII Encontro de Modelagem Computacional
V Encontro de Ciência e Tecnologia de Materiais
Universidade Católica de Petrópolis (UCP), Petrópolis/RJ, Brasil. 15-17 out. 2014

ξi2
 ξi  
 
2
 A 
B 
 (k − 1) 12 B
 
 2 A  
  + D
(
)
−
r
ρTanH  k  =  − log cosh
ξ
i
 2 A 12

  
B 


 
 
q 
r 
D
D
  


 ξ i2 
 − 2 
1
+
3
exp

2
2
4c Al
 c Al  2c Al

−
ρ Alamgir (ξ i , c Al ) =
3
3 
3
 ξ i2 
1 + exp − 2 
 c Al 

 ξ 2 
c2 
ρWelsch (ξ i , cW ) = W 1 − exp − i2 
2 
 cW 
ξi ≤ q
q<
ξi ≤ r
(8)
ξi > r
(9)
(10)
Nestas funções b, p , cF, aCl, qCl, rCl, dCl, A, B, k, q, r, D, cAl e cw são parâmetros de
sintonia relacionados a eficiência relativa. Quanto mais robusto é um estimador, menos
eficiente ele é (Albuquerque & Biegler, 1996). Isto é importante para a comparação entre dois
ou mais estimadores, sendo calculados em relação a uma distribuição de referência, quase
sempre adotada a distribuição Normal (Prata et al., 2010). Para uma eficiência relativa de
95% os valores correspondentes das constantes de sintonia são: b=10, p=0,235, cF=1,3998,
aCl=1,65145901, qCl=1,590796619, rCl=4, dCl=3,894797324, A=0,726102131, B=0,82337002,
k=4,5, q=1,556166618, r=4, D=3,905316918, cAl=2,37110654 e cw=2,9846.
Os métodos usados para mensurar a robustez de um estimador envolvem a chamada
função de influência (FI). Para os estimadores-M, a FI corresponde à derivada da função ρ em
relação ao resíduo padronizado (ξi) e, de maneira simplificada, corresponde ao peso
(influência) dado ao efeito da magnitude de um erro grosseiro (quase sempre mensurado em
termos de múltiplos do resíduo padronizado) sobre as estimativas obtidas. O estimador-M
MQP não é robusto, pois sua função de influência é FIMQP=ξi, ou seja, a influência de erros
grosseiros nas estimativas é ilimitada (falta de robustez) e aumenta proporcionalmente com o
aumento da magnitude do erro grosseiro. O estimador-M NC é considerado quase robusto,
pois sua FI passa a se tornar ilimitada, após ξ = 4, 742. O estimador-M Fair sofre influência
dos erros grosseiros, mesmo que de forma limitada, por isso é classificado como "monótono".
Entretanto, os estimadores-M Alamgir e Welsch possuem FI que decresce de forma limitada
suavemente tendendo à zero, anulando o efeito negativo de erros grosseiros sobre as
estimativas, mesmo com o aumento de sua magnitude, por isso são classificados como "soft
redescending". Já os estimadores-M Collins e TanH possuem FI que decrescem bruscamente
até zero, anulando completamente o efeito negativo de erros grosseiros, por isso são
classificados como "hard redescending". Esta comparação é ilustrada na Fig. 1.
Cabe ressaltar que os estimadores-M "hard redescending" são construídos com cláusula
do tipo "if", em estágios. No último estágio sua FI é exatamente zero e a constante associada
ao respectivo estágio é chamada ponto de corte (do idioma inglês "cut-point"). Outra
observação importante se faz à respeito dos estimadores Collins e Tangente Hiperbólica que
possuem suas respectivas FI muito próximas, conforme descrito por Hampel et. al. (1981).
XVII Encontro de Modelagem Computacional
V Encontro de Ciência e Tecnologia de Materiais
Universidade Católica de Petrópolis (UCP), Petrópolis/RJ, Brasil. 15-17 out. 2014
Figura 1 - Função de Influência (FI) dos estimadores-M.
4. RECONCILIAÇÃO DE DADOS EM COLUNAS DE DESTILAÇÃO
O caso selecionado avalia um conjunto de 7 colunas de destilação em série, proposto
originalmente por Wang et al. (2004) e ilustrado na Fig. 2. Os autores consideraram estado
estacionário e apenas o balanço de massa global. Neste sistema há presença de múltiplos erros
grosseiros. Os autores avaliaram uma estratégia baseada na utilização conjunta dos Testes de
Medida e Teste Nodal (MT-NT) para RD e DEG.
Figura 2 – Fluxograma de destilação de óleo cru (Wang et al., 2004).
4.1 Critério de Avaliação
O critério TER (Total Error Reduction) é muito utilizado na avaliação de desempenho do
procedimento de RD e DEG, quando todos os valores exatos (base da simulação) são
fornecidos (Özyurt & Pike, 2004; Prata et al., 2008), conforme apresentado na Equação (11).
TER =
∑
(zmedido − zexato )2
σ2
∑
−
∑
(xreconciliado − zexato )2
(zmedido − zexato )2
σ2
σ2
(11)
XVII Encontro de Modelagem Computacional
V Encontro de Ciência e Tecnologia de Materiais
Universidade Católica de Petrópolis (UCP), Petrópolis/RJ, Brasil. 15-17 out. 2014
O critério TER mede a redução total dos erros, tomado por base os valores medidos e os
reconciliados em relação aos valores exatos. Quanto maior for o TER obtido, ou mais
próximo de 1, melhor terá sido o resultado. O critério TER pode ser utilizado
independentemente da função objetivo (estimador) utilizada, permitindo assim utilizado para
comparação de estimadores-M robustos e outras estratégias nos procedimentos de RD e DEG.
4. RESULTADOS E DISCUSSÃO
Para resolver o procedimento de RD e DEG simultaneamente utilizou-se os seguintes
estimadores-M: NC, Fair, Cauchy, Logistica, Hampel, Lorenziana, Welsch, Collins, TanH,
Alamgir e MQP. Este último é apresentado de duas maneiras: a primeira sem estratégia
alguma associada, somente para fins comparativos, e a segunda baseada na estratégia MT-NT.
Como restrições do problema utilizou-se o modelo linear associado ao balanço de massa
global conforme fluxograma ilustrado na Fig. 2. Os estimadores -M robustos Welsch, Collins,
TanH e Alamgir foram implementados no pacote de otimização do EMSO. Os demais são
parte integrante do pacote de reconciliação do EMSO, e por este pacote implementados.
Na Tabela 1 são apresentados os resultados obtidos e por Wang et. al. (2004), bem como
os valores exatos (zexato,i), os valores medidos (zi) e seus respectivos desvios-padrão (σi).
Tabela 1 – Resultados da RD para o estudo de caso.
MT-NT
zexato,i
x1
x2
x3
x4
x5
x6
x7
x8
x9
x10
x11
x12
x13
x14
x15
x16
x17
x18
x19
x20
x21
x22
x23
x24
x25
x26
zi
308
300,4
77
74
77
75,7
77
75,3
77
76
62
62,4
82
84,1
82
81,4
82
82,2
308
309,4
8,5
8,3
5,5
5,7
30
29,7
20
20,7
14
14,3
230
314,8
57,5
58,3
57,5
58,3
57,5
59,9
57,5
57,2
230
180,5
12
11,9
49
48,5
38
36,6
21
21,4
110
140,6
TER =
σi
7,7
1,925
1,925
1,925
1,925
1,55
2,05
2,05
2,05
7,7
0,2125
0,1375
0,75
0,5
0,35
5,75
1,4375
1,4375
1,4375
1,4375
5,75
0,3
1,225
0,95
0,525
2,75
Wang et. al.
(2004)
308,7
75,9
77,6
77,2
78
62,2
83,7
81
81,8
308,7
8,3
5,7
29,4
20,5
14,2
230,6
57,5
57,5
59,1
56,5
230,6
11,9
48,6
36,7
21,4
112
0,8366
EMSO - RRD
MQP
NC
Fair
Cauchy
Logística
312,9680
77,0666
78,6652
78,2891
78,9473
62,8700
84,8005
82,2746
83,0230
312,9680
8,2035
5,6584
28,5019
20,1521
14,0325
236,4200
58,9852
58,9852
60,5180
57,9314
236,4200
11,7166
45,5217
34,8194
20,8330
123,5290
0,6086
308,2750
75,8188
77,5189
77,1190
77,8188
62,1089
83,5886
80,8891
81,6889
308,2750
8,2785
5,6911
29,4265
20,5790
14,2410
230,0590
57,3897
57,3897
58,9903
56,2895
230,0590
11,8972
48,4431
36,5663
21,3903
111,7620
0,8314
310,8380
76,4983
78,1489
77,7748
78,4165
62,5121
84,2543
81,6609
82,4112
310,8380
8,3661
5,5372
29,2619
20,5237
14,2289
232,9210
58,1353
58,1353
59,6337
57,0163
232,9210
11,8582
47,4233
37,6512
21,2711
114,7170
0,8191
308,7340
75,9405
77,6290
77,2805
77,8844
62,1464
83,8431
80,9770
81,7679
308,7340
8,2372
5,6701
29,3819
20,7564
14,2604
230,4280
57,3748
57,3748
59,3602
56,3184
230,4280
11,8852
48,2643
38,7619
21,3940
110,1230
0,8309
309,5340
76,2753
77,7795
77,4884
77,9911
62,2377
84,2259
81,1404
81,9302
309,5340
8,1885
5,7707
29,2486
20,8063
14,2514
231,2690
57,4975
57,4975
59,8126
56,4613
231,2690
11,8616
47,8759
37,9239
21,3440
112,2640
0,7985
Valores em negrito: Variáveis com erros grosseiros.
XVII Encontro de Modelagem Computacional
V Encontro de Ciência e Tecnologia de Materiais
Universidade Católica de Petrópolis (UCP), Petrópolis/RJ, Brasil. 15-17 out. 2014
Tabela 1 (Continuação) – Resultados da RD para o estudo de caso.
EMSO - RRD
zexato,i
x1
x2
x3
x4
x5
x6
x7
x8
x9
x10
x11
x12
x13
x14
x15
x16
x17
x18
x19
x20
x21
x22
x23
x24
x25
x26
zi
308 300,4
77
74
77
75,7
77
75,3
77
76
62
62,4
82
84,1
82
81,4
82
82,2
308 309,4
8,5
8,3
5,5
5,7
30
29,7
20
20,7
14
14,3
230 314,8
57,5 58,3
57,5 58,3
57,5 59,9
57,5 57,2
230 180,5
12
11,9
49
48,5
38
36,6
21
21,4
110 140,6
TER =
σi
Hampel
Lorenziana
Welsch
Collins
TanH
Alamgir
7,7
1,925
1,925
1,925
1,925
1,55
2,05
2,05
2,05
7,7
0,2125
0,1375
0,75
0,5
0,35
5,75
1,4375
1,4375
1,4375
1,4375
5,75
0,3
1,225
0,95
0,525
2,75
308,0430
77,0161
77,0092
77,0067
77,0111
62,0074
82,0215
82,0045
82,0096
308,0430
8,4979
5,7672
29,9888
20,0265
14,0000
229,7630
57,4849
57,4849
57,3151
57,4778
229,7630
11,9994
48,9979
37,7061
21,0029
110,0560
0,9052
307,9630
75,7226
77,4476
77,0578
77,7349
62,0614
83,4951
80,8093
81,5971
307,9630
8,2846
5,5931
29,4475
20,5875
14,2490
229,8010
57,3148
57,3148
58,9433
56,2283
229,8010
11,9007
48,4439
36,5780
21,3946
111,4840
0,8429
308,2330
75,8085
77,5089
77,1058
77,8096
62,1025
83,5776
80,8764
81,6762
308,2330
8,2829
5,6261
29,4585
20,5746
14,2482
230,0430
57,3859
57,3859
58,9933
56,2773
230,0430
11,9006
48,5010
37,0503
21,4007
111,1900
0,8509
308,0520
75,8375
77,4362
77,0600
77,7183
62,0700
83,4285
80,9026
81,6510
308,0520
8,2805
5,6908
29,4491
20,5762
14,2411
229,8140
57,3136
57,3136
58,9272
56,2598
229,8140
11,9031
48,5456
36,6543
21,4005
111,3110
0,8371
308,3710
77,4224
77,0142
76,6381
77,2963
62,1219
83,5175
80,9916
81,7400
308,3710
8,2820
5,6914
29,4670
20,5842
14,2451
230,1010
57,3528
57,3528
59,0969
56,2989
230,1010
11,9034
48,5511
36,6577
21,4015
111,5880
0,8380
308,1180
75,7788
77,4797
77,0793
77,7799
62,0835
83,5445
80,8450
81,6447
308,1180
8,2796
5,6914
29,4415
20,5855
14,2442
229,8760
57,3437
57,3437
58,9451
56,2430
229,8760
11,9007
48,5018
36,6023
21,4010
111,4700
0,8331
Valores em negrito: Variáveis com erros grosseiros.
Na Tabela 1 observa-se com clareza que o estimador robusto do tipo "hard redescending"
Hampel, obteve o maior valor para o critério TER (0,9052), e consequentemente o melhor
resultado geral na presença de múltiplos erros grosseiros para o sistema colunas de destilação
em série enunciado por Wang et. al. (2004). Como era de se esperar, o estimador MQP sem
associação a estratégias de detecção e eliminação/compensação de erros grosseiros obteve o
pior resultado, com TER (0,6086). Os estimadores Fair e Logística, classificados como
robustos monótonos, obtiveram resultados melhores que o estimador MQP (não robusto), com
TER (0,8191) e TER (0,7985), respectivamente. Entretanto, por apresentarem FI que de certa
forma minimiza mas ainda sofre influência dos erros grosseiros, a medida que sua magnitude
aumenta, não conseguem o mesma eficiência dos estimadores robustos classificados como
"redescending" como os estimadores Lorenziana e Welsch que obtiveram TER (0,8429) e
TER (0,8509), respectivamente. Os resultados dos estimadores Hampel, Welsch e Lorenziana
foram superiores a estratégia MT-NT que apresentou TER (0,8366), e corroboram os
resultados apresentados anteriormente por Özyurt & Pike (2004) e Prata et al. (2008) nos
quais estes estimadores mostraram maior eficiência. Os estimadores do tipo "redescending"
de Collins, Tangente Hiperbólica e Alamgir introduzidos do campo de estatística para
engenharia química neste trabalho apresentaram resultados superiores ao estimador não
robusto MQP, quase robusto NC e robustos monotônicos de Fair e Logística. Seus
XVII Encontro de Modelagem Computacional
V Encontro de Ciência e Tecnologia de Materiais
Universidade Católica de Petrópolis (UCP), Petrópolis/RJ, Brasil. 15-17 out. 2014
desempenhos foram muito próximo a estratégia MT-NT, com TER (0,8371), TER(0,8380) e
TER (0,8331), respectivamente. Isto não inviabiliza a utilização destes estimadores-M, pelo
contrário, estimula a utilização destes em outros problemas, bem como a pesquisa histórica
por outros estimadores-M robustos, como aqueles anteriores ao ano de 1900, como, por
exemplo, o estimador de Smith de 1888, conforme relatado por Prata et al. (2010) e, ainda, o
desenvolvimento de outros, com bases nos avanços desta área da estatística robusta aplicada.
Todos os erros grosseiros foram corretamente detectados. Para os estimadores-M
robustos utilizou-se o teste clássico baseado na distribuição normal para 95% de confiança, o
que equivale ao resíduo padronizado de 1,96. Para estes estimadores, o teste é realizado após
a regressão, apenas para identificar os erros grosseiros, diferentemente da estratégia MT-NT
na qual a identificação ocorre durante o procedimento. Estes resultados mostram, também, a
essência da utilização dos estimadores robustos que são capazes de realizar o procedimento de
RD e DEG simultaneamente, evitando estratégias com base em procedimentos iterativos, em
geral computacionalmente intensivos.
Os resultados mostraram também a eficácia do procedimento de RRD implementado no
simulador EMSO, tanto no pacote de otimização ("optmization"), quanto no pacote de
reconciliação ("reconciliation") disponíveis neste software nacional e gratuito para fins
acadêmicos. Nestas implementações utilizou-se o otimizador IPOPT presente em ambos
pacotes do simulador EMSO. Este otimizador é conhecido por sua robustez e caráter de
otimização global, pelo o método primal-dual do ponto interior, que lida com as restrições
pelo uso de funções barreira, fornecendo assim os mínimos globais de funções não convexas,
que é o caso dos estimadores-M robustos classificados como “redescending”.
5. CONCLUSÕES
Este trabalho apresentou um estudo sobre reconciliação robusta de dados em estado
estacionário em um conjunto de 7 colunas de destilação em série com 26 variáveis medidas,
com base em um exemplo apresentado na literatura por Wang et. al. (2004). No estudo de
caso o procedimento foi implementado no pacote computacional EMSO, tanto no pacote de
otimização, quanto no pacote de reconciliação, sendo inseridos os estimadores-M robustos de
Collins, Tangente Hiperbólica e Alamgir à problemas de engenharia química. Os estimadoresM robustos do tipo “redescending” Hampel, Welsch, Lorenziana, Tangente Hiperbólica e
Collins, apresentaram os melhores resultados, comprovando a eficiência do procedimento de
Reconciliação de Dados e Detecção de Erros Grosseiros simultaneamente. Este trabalho
contribui para o desenvolvimento e aplicações reais de estimadores-M robustos.
Agradecimentos
O autor Diego Queiroz Faria de Menezes agradece a CAPES pelo suporte financeiro.
6. REFERÊNCIAS
Alamgir; Li, A. A.; Khan, S. A.; Khan, D. M.; Khalil, U., (2013), A new efficient redescending M-estimator:
Alamgir redescending M-estimator, Research Journal of Recent Sciences, 2, 79-91.
Albuquerque, J. S.; Biegler, L. T., (1996), Data Reconciliation and Gross-Error Detection for Dynamic Systems,
AIChE Journal, 42, 2841-2856.
Arora, N.; Biegler, L. T., (2001), Redescending estimators for Data Reconciliation and Parameter Estimation,
Computers and Chemical Engineering, 25, 1585-1599.
XVII Encontro de Modelagem Computacional
V Encontro de Ciência e Tecnologia de Materiais
Universidade Católica de Petrópolis (UCP), Petrópolis/RJ, Brasil. 15-17 out. 2014
Collins, J. R. (1976), Robust Estimation of a location parameter in the presence of asymmetry, The Annals of
Statistics, 4, 68-85.
Farzi, A.; Mehrabani-zeinabad, A.; Boozarjomehry, R. B. (2008), Data reconciliation: Development of an objectoriented software tool. Korean Journal of Chemical Engineering, 25, 955-965.
Hampel, F. R.;Rousseeuw, P.J.; Ronchetti, E. (1981), The change-of-variance curve and optimal redescending
M-estimators, Journal of the American Statistical Association, 76, 643-648.
Holland, P. W.; Welsch, R. E. (1977), Robust Regression Using Iteratively Reweighted Least-Squares,
Communications in Statistics, Theory and Methods, A6, 813-828.
Jin, S.; Li, X.; Huang, Z.; Liu, M. (2012), A new target function for robust data reconciliation. Industrial.
Engineering. Chemical. Researcher., 51, 10220−10224.
Johnson, L. P. M.; Kramer, M. A. (1995), Maximum Likelihood Data Rectification: Steady-State Systems,
AIChE Journal, 41, 2415-2426.
Kister, H. Z. (1992), “Distillation-Design”, McGraw-Hill, EUA.
Kong, M., Chen, B., Li, B. (2000), An Integral to Dynamic Data Rectification, Computers and Chemical
Engineering, 24, 749-753.
Narashimhan, S.; Jordache, C. (2000), “Data Reconciliation and Gross Error Detection: An Intelligent Use of
Process Data”, 1° ed., Gulf Professional Publishing, Texas.
Özyurt, D.B.; Pike, R.W. (2004), Theory and practice of simultaneous data Reconciliation and gross error
detection for chemical process. Computer and Chemical Engineering, 28, 381−402.
Prata, D. M.; Pinto, J. C.; Lima, E. L. (2008), Comparative analysis of robust estimators on nonlinear dynamic
data reconciliation. Computer Aided Chemical Engineering, 25, 501−506.
Prata, D. M.; Schwaab, M.; Lima, E. L.; Pinto, J. C. (2010), Simultaneous Robust Data Reconciliation and Gross
Error Detection through Particle Swarm Optimization for an Industrial Polypropylene Reactor. Chemical
Engineering Science, 65, 4943-4954.
Soares, R. P.; Secchi, A. R. (2003), EMSO: Environment for Modelling, Simulation and Optimisation. Computer
Aided Chemical Engineering, 14, 947−952.
Tjoa, I. B.; Biegler, L. T. (1991), Simultaneous strategy for data reconciliation and gross error detection of
nonlinear systems. Computers & Chemical Engineering, 15, 679-690.
Wang, F.; Jia, X.; Zheng, D.; Yue, J. (2004), An improved MT-NT method for gross error detection and data
reconciliation. Computers & Chemical Engineering, 28, 2189-2192.
Zhou, L.; Su, H.; Chu, J. (2006), A New Method to Solve Robust Data Reconciliation in Nonlinear Process,
Chinese Journal of Chemical Engineering, 14, 357-363.
ROBUST DATA RECONCILIATION IN DISTILLATION COLUMNS USING EMSO
SIMULATOR
Abstract. This paper presents a study about robust data reconciliation in steady state in
distillation columns, based on a paper published in scientific literature. It was performed a
brief literature review focusing on problems involving distillation columns and a review about
robust M-estimators used for data reconciliation and simultaneous gross error detection. The
example reported consists of seven crude oil distillation columns with 26 measured variables
where 3 of ones are corrupted by gross errors. The selected problem is solved in the computer
package EMSO (Environment for Modeling, Simulation and Optimization) which has
available developed computational routines for data reconciliation in steady state with linear
or nonlinear constraints. Three robust M-estimators are introduced: Hyperbolic Tangent,
Collins and Alamgir derived from robust statistic for application in chemical engineering
problems. Other estimators already present in the computer package EMSO were also used.
Satisfactory results are obtained proving the efficiency of estimator applied and the
performance of computational package EMSO. Thus, are presented the advantages of robust
data reconciliation and its contribution to chemical engineering processes.
Keywords: Data Reconciliation, Robust Estimators, Distillation Columns
Download

311 - Programa de Pós-Graduação em Modelagem Computacional