XVII Encontro de Modelagem Computacional V Encontro de Ciência e Tecnologia de Materiais Universidade Católica de Petrópolis (UCP), Petrópolis/RJ, Brasil. 15-17 out. 2014 RECONCILIAÇÃO ROBUSTA DE DADOS EM COLUNAS DE DESTILAÇÃO UTILIZANDO O SIMULADOR EMSO Diego Queiroz Farias de Menezes –[email protected] Universidade Federal Fluminense, Departamento de Engenharia Química e de Petróleo, CEP 24210-240 – São Domingos, Niterói, RJ, Brasil Irene Cristina Sarruf Pinheiro– [email protected] Universidade Federal Fluminense, Programa de Pós Graduação em Engenharia Química, CEP 24210-240 – São Domingos, Niterói, RJ, Brasil Diego Martinez Prata – [email protected] Universidade Federal Fluminense, Departamento de Engenharia Química e de Petróleo, CEP 24210-240 – São Domingos, Niterói, RJ, Brasil Fernando Cunha Peixoto – [email protected] Universidade Federal Fluminense, Departamento de Engenharia Química e de Petróleo, CEP 24210-240 – São Domingos, Niterói, RJ, Brasil Resumo. Este trabalho apresenta um estudo sobre reconciliação robusta de dados em estado estacionário em colunas de destilação, com base em um trabalho publicado na literatura científica. É realizada uma breve revisão bibliográfica com foco nos problemas que envolvem colunas de destilação, e também, uma revisão dos estimadores-M robustos usados na reconciliação de dados e detecção simultânea de erros grosseiros. O exemplo avaliado é constituído por sete colunas de destilação de óleo cru com 26 variáveis medidas, sendo 3 destas variáveis corrompidas por erros grosseiros. O problema selecionado é resolvido no pacote computacional EMSO (Ambiente para Modelagem, Simulação e Otimização) que dispõe de rotinas computacionais propriamente desenvolvidas para reconciliação de dados em estado estacionário com restrições lineares ou não lineares. São introduzidos três estimadores-M robustos: Tangente Hiperbólica, Collins e Alamgir oriundos da estatística robusta para aplicação em problemas de engenharia química. Outros estimadores já presentes no pacote computacional EMSO foram também utilizados. Resultados satisfatórios são obtidos comprovando a eficiência dos estimadores utilizados e o desempenho do pacote computacional EMSO. Assim, são apresentadas as vantagens da reconciliação robusta de dados e sua contribuição para processos de engenharia química. Palavras-chave: Reconciliação de Dados, Estimadores Robustos, Colunas de Destilação 1. INTRODUÇÃO Medidas de processo precisas são de extrema importância para controle, otimização, qualidade, segurança e eficiência do processo. Entretanto, essas medidas contêm erros, aleatórios e grosseiros, causados, por exemplo, pela imprecisão intrínseca dos instrumentos de medição. Desta forma, não se espera que os dados medidos obedeçam às leis de conservação. Portanto, um procedimento de retificação de dados (RTD) é essencial para recuperar satisfatoriamente a informação contida nos dados. Este é basicamente dividido em três etapas: classificação de variáveis; detecção de erros grosseiros (DEG) e reconciliação de dados (RD). O procedimento mais utilizado na RTD é a RD, onde dados medidos são ajustados de maneira estatisticamente coerente pelo estimador (função objetivo) resultante da formulação XVII Encontro de Modelagem Computacional V Encontro de Ciência e Tecnologia de Materiais Universidade Católica de Petrópolis (UCP), Petrópolis/RJ, Brasil. 15-17 out. 2014 de máxima verossimilhança sobre a distribuição estatística dos erros de medição assumida, de forma a satisfazer às leis de conservação e demais restrições impostas ao sistema (modelo matemático), obtendo estimativas confiáveis para as variáveis e parâmetros do processo (Prata et al., 2010). Tradicionalmente é assumida distribuição Normal, que resulta no estimador de Mínimos Quadrados Ponderados (MQP). A primeira etapa na RTD é a classificação das variáveis. Esta etapa determina se a informação disponível é suficiente para resolver o problema de reconciliação e identificar os conjuntos de variáveis observáveis (variáveis medidas e não-medidas que podem ser estimadas por meio das demais variáveis medidas e pelas restrições do processo) e nãoobserváveis (variáveis não medidas que não podem ser estimadas). A segunda etapa na RTD é a DEG, um tipo especial de erro, que não segue a distribuição estatística de erros assumida. Erros grosseiros podem ser divididos em valores espúrios (outliers) e desvios sistemáticos (bias). Esses erros podem ser causados por má calibração dos instrumentos de medições, deterioração dos sensores, flutuações súbitas de energia, entre outros. A abordagem clássica para lidar com esse problema consiste na detecção e eliminação ou compensação desses erros, o que pode ser feito iterativamente por estratégias sequenciais ou simultâneas (Narasimhan & Jordache, 2000). A literatura científica tem mostrado que estimadores-M robustos derivados da estatística robusta são ótimos candidatos para realizar este procedimento de maneira simultânea. Os estimadores-M são resultantes da formulação de máxima verossimilhança sobre uma distribuição da estatística robusta (função objetivo do problema de otimização associado à estrutura do procedimento de RD). Utilizando-se os estimadores-M robustos é possível minimizar ou eliminar os efeitos negativos dos erros grosseiros sobre as variáveis, sem a necessidade de eliminar as variáveis identificadas com erros grosseiros, simultaneamente com a RD, evitando estratégias iterativas e computacionalmente intensivas. Isto é conhecido como Reconciliação Robusta de Dados (RDD) (Prata et al., 2010). Outro procedimento importante é caracterização da matriz de variância/covariância dos erros de medição, já que as variáveis envolvidas no processo possuem grandezas distintas, obtidas por instrumentos de medição com diferentes graus de precisão. O inverso desta matriz pondera coerentemente o peso dado às variáveis na função objetivo (estimador), evitando-se ajustes tendenciosos. Geralmente, é assumido não haver correlação entre os erros de medição (covariâncias), e, assim, esta matriz possui a forma diagonal (matriz de variâncias). A RD tem sido aplicada nos mais diversos processos (Prata et al., 2010). Um dos processos de interesse da indústria química e petroquímica é a destilação. Esta é uma antiga operação unitária, tendo como principais aplicações o fracionamento do petróleo, a obtenção de álcoois, a extração de essências e purificação de substâncias (Kister, 1992). Atualmente, com a evolução dos computadores, modelos matemáticos e projetos de colunas de destilação através de simuladores, como: Aspen/Hysys, ProII, ChemCAD e EMSO, entre outros, tem se tornado uma prática bastante eficaz e precisa, porém, bastante complexa. Isto se deve, em parte, a existência de correlações entre as variáveis de processo, e a utilização conjunta dos procedimentos de RD/DEG, controle e otimização, para fins de aplicação real nestes equipamentos em processos industriais. O simulador EMSO - Ambiente para Modelagem, Simulação e Otimização - (Soares & Secchi, 2003) dispõe de rotinas computacionais propriamente desenvolvidas para RD em estado estacionário com restrições lineares ou não lineares, incluindo testes tradicionais para a DEG e estimadores: robustos (Fair, Cauchy, Logística, Hampel e Lorenziana) e quase robusto (Normal Contaminada), baseados no trabalho de Özyurt & Pike (2004). Seguindo esta direção, este trabalho apresenta um estudo sobre RRD em estado estacionário em colunas de destilação, utilizando o software EMSO (Soares & Secchi, 2003). XVII Encontro de Modelagem Computacional V Encontro de Ciência e Tecnologia de Materiais Universidade Católica de Petrópolis (UCP), Petrópolis/RJ, Brasil. 15-17 out. 2014 2. REVISÃO DA LITERATURA A aplicação de RD e DEG em problemas de engenharia química inicia-se nos anos 60. A partir daí muitos artigos e livros aplicados a processos químicos vêm sendo escritos. Entretanto, há um número pequeno de trabalhos de RD em aplicação reais (Prata et al., 2010). Os estimadores robustos têm sido muito reportados na literatura técnica para lidar com o problema de RD e DMEG simultaneamente - RRD. Tjoa & Biegler (1991) provaram que usando o estimador baseado na distribuição Normal Contaminada, ao invés do tradicional MQP, qualquer valor espúrio presente nas medidas podia ser substituído por valores reconciliados, sem necessitar de esquemas iterativos. Johnston & Kramer (1995) reportaram a viabilidade e o melhor desempenho de estimadores robustos para o problema de RD, bem como introduziram o estimador robusto Lorenziana. Albuquerque & Biegler (1996) e Arora & Biegler (2001) analisaram os estimadores robustos em sistemas dinâmicos utilizando dados simulados. Estes últimos mostraram a eficiência do estimador Hampel. O primeiro estudo comparativo entre alguns estimadores robustos, para problemas de RD operando em estado estacionário, foi realizado por Özyurt & Pike (2004). Os autores concluíram que os estimadores de Cauchy e Hampel obtiveram resultados promissores. Zhou et al. (2006) também realizaram estudo comparativo entre estimadores robustos, introduzindo o estimador de Huber. Posteriormente, Prata et al. (2008) desenvolveram o primeiro estudo comparativo de estimadores-M robustos em problemas dinâmicos com restrições não-lineares, representativo de um reator químico continuamente agitado e não isotérmico. Os autores introduziram o estimador de Welsch (Holland & Welsch, 1977) em RDD, que juntamente com o estimador Lorenziana mostraram-se mais eficiêntes. Prata et al. (2010) foram pioneiros na aplicações de estimadores-M robustos em sistema dinâmico com restrições não lineares utilizando dados industriais reais de um reator de polimerização. Subsequentemente, diferentes estimadores-M robustos e seus desempenhos em reconciliação de dados foram reportados em diversos problemas. Kong et al. (2000) e Jin et al. (2012) desenvolveram seus próprios estimadores-M robustos. Estes estudos têm mostrado o enorme potencial da estatística robusta, pois a insensibilidade dos estimadores robustos a divergências de hipóteses ideais faz com que eles tendam a ignorar valores atípicos – erros grosseiros. A complexidade de tratar com robustez a RD em um processo não trivial como a destilação juntamente com modelos fenomenológicos rigorosos de colunas de destilação, como por exemplo, as equações MESH - Mass, Equilibrium, Summation and Enthalpy (Kister, 1992), faz com que se tenha uma escassez de artigos neste campo. Geralmente, os modelos são considerados em estado estacionário e representados apenas por balanço de massa, equações de normalização e balanço de massa por componente. Os dois primeiros resultam em sistemas lineares, e o último resulta em um problema não linear mais simples, chamado de bilinear, uma vez que a não linearidade é representada especificamente pelo produto de duas variáveis de decisão para o problema de RD (vazão e concentração). Wang et al. (2004) avaliaram uma estratégia baseada na utilização conjunta dos testes de medida e nodal (MT-NT) para RD e DEG em um conjunto de 7 colunas em série. Este problema opera em estado estacionário, e as restrições são lineares, ou seja, apenas balanço material global. Farzi et al. (2008) desenvolveram um modelo dinâmico e mais complexo para realizar a RD dinâmica, em uma coluna de destilação, estimando as temperaturas por meio de duas estratégias: redes neuronais artificiais e filtro de Kalman estendido. Fica claro a escassez de trabalhos envolvendo processo de destilação e reconciliação de dados com detecção de erros grosseiros. Isto motivou a realização deste trabalho e a pesquisa em estimadores-M robustos. XVII Encontro de Modelagem Computacional V Encontro de Ciência e Tecnologia de Materiais Universidade Católica de Petrópolis (UCP), Petrópolis/RJ, Brasil. 15-17 out. 2014 3. O PROBLEMA DE RECONCILIAÇÃO ROBUSTA DE DADOS ESTACIONÁRIA Existem muitas classes de estimadores robustos, sendo as mais populares aquelas utilizadas nos estimadores-M, que são generalizações de um estimador de máxima verossimilhança (Prata et al., 2010). Assumindo que os erros de medição não são correlacionados, o problema de RRD estacionário, de forma generalizada, adota a formulação, x −z min ∑ ρ i i i σi = min ∑ ρ (ξ i ) i (1) sujeito a h ( x, u ) = 0 (2) g ( x, u ) ≥ 0 (3) onde ρ é uma função razoavelmente monotônica, ξi e σi são, respectivamente, o resíduo padronizado e o desvio padrão da variável discreta medida zi, x e u são os vetores das variáveis medidas reconciliadas e não medidas (observáveis) estimadas, respectivamente. Finalmente, h e g são as restrições algébricas de igualdade e desigualdade, respectivamente. Apresentam-se os estimadores-M: MQP (não robusto), Normal Contaminada (NC), Fair, Collins, Tangente Hiperbólica (TanH), Alamgir e Welsch como possíveis escolhas para ρ descritos nas Equações (4), (5), (6), (7), (8), (9) e (10), respectivamente. ρ MQP (ξ i ) = ξ i2 (4) 2 ξ i2 p ξ2 + exp − i 2 2 b 2b ρ NC (ξ i , b, p) = − ln[(1 − p )]exp − (5) ξ − ln 1 + i c F c F (6) ξi ρ Fair (ξ i , c F ) = c F2 ξi2 ξi 2 a Cl a ρ Collins qCl = −2log cosh Cl ( ξ i − rCl ) + d Cl 2 rCl d Cl d Cl ξi ≤ qCl qCl < ξ i ≤ rCl ξ i > rCl (7) XVII Encontro de Modelagem Computacional V Encontro de Ciência e Tecnologia de Materiais Universidade Católica de Petrópolis (UCP), Petrópolis/RJ, Brasil. 15-17 out. 2014 ξi2 ξi 2 A B (k − 1) 12 B 2 A + D ( ) − r ρTanH k = − log cosh ξ i 2 A 12 B q r D D ξ i2 − 2 1 + 3 exp 2 2 4c Al c Al 2c Al − ρ Alamgir (ξ i , c Al ) = 3 3 3 ξ i2 1 + exp − 2 c Al ξ 2 c2 ρWelsch (ξ i , cW ) = W 1 − exp − i2 2 cW ξi ≤ q q< ξi ≤ r (8) ξi > r (9) (10) Nestas funções b, p , cF, aCl, qCl, rCl, dCl, A, B, k, q, r, D, cAl e cw são parâmetros de sintonia relacionados a eficiência relativa. Quanto mais robusto é um estimador, menos eficiente ele é (Albuquerque & Biegler, 1996). Isto é importante para a comparação entre dois ou mais estimadores, sendo calculados em relação a uma distribuição de referência, quase sempre adotada a distribuição Normal (Prata et al., 2010). Para uma eficiência relativa de 95% os valores correspondentes das constantes de sintonia são: b=10, p=0,235, cF=1,3998, aCl=1,65145901, qCl=1,590796619, rCl=4, dCl=3,894797324, A=0,726102131, B=0,82337002, k=4,5, q=1,556166618, r=4, D=3,905316918, cAl=2,37110654 e cw=2,9846. Os métodos usados para mensurar a robustez de um estimador envolvem a chamada função de influência (FI). Para os estimadores-M, a FI corresponde à derivada da função ρ em relação ao resíduo padronizado (ξi) e, de maneira simplificada, corresponde ao peso (influência) dado ao efeito da magnitude de um erro grosseiro (quase sempre mensurado em termos de múltiplos do resíduo padronizado) sobre as estimativas obtidas. O estimador-M MQP não é robusto, pois sua função de influência é FIMQP=ξi, ou seja, a influência de erros grosseiros nas estimativas é ilimitada (falta de robustez) e aumenta proporcionalmente com o aumento da magnitude do erro grosseiro. O estimador-M NC é considerado quase robusto, pois sua FI passa a se tornar ilimitada, após ξ = 4, 742. O estimador-M Fair sofre influência dos erros grosseiros, mesmo que de forma limitada, por isso é classificado como "monótono". Entretanto, os estimadores-M Alamgir e Welsch possuem FI que decresce de forma limitada suavemente tendendo à zero, anulando o efeito negativo de erros grosseiros sobre as estimativas, mesmo com o aumento de sua magnitude, por isso são classificados como "soft redescending". Já os estimadores-M Collins e TanH possuem FI que decrescem bruscamente até zero, anulando completamente o efeito negativo de erros grosseiros, por isso são classificados como "hard redescending". Esta comparação é ilustrada na Fig. 1. Cabe ressaltar que os estimadores-M "hard redescending" são construídos com cláusula do tipo "if", em estágios. No último estágio sua FI é exatamente zero e a constante associada ao respectivo estágio é chamada ponto de corte (do idioma inglês "cut-point"). Outra observação importante se faz à respeito dos estimadores Collins e Tangente Hiperbólica que possuem suas respectivas FI muito próximas, conforme descrito por Hampel et. al. (1981). XVII Encontro de Modelagem Computacional V Encontro de Ciência e Tecnologia de Materiais Universidade Católica de Petrópolis (UCP), Petrópolis/RJ, Brasil. 15-17 out. 2014 Figura 1 - Função de Influência (FI) dos estimadores-M. 4. RECONCILIAÇÃO DE DADOS EM COLUNAS DE DESTILAÇÃO O caso selecionado avalia um conjunto de 7 colunas de destilação em série, proposto originalmente por Wang et al. (2004) e ilustrado na Fig. 2. Os autores consideraram estado estacionário e apenas o balanço de massa global. Neste sistema há presença de múltiplos erros grosseiros. Os autores avaliaram uma estratégia baseada na utilização conjunta dos Testes de Medida e Teste Nodal (MT-NT) para RD e DEG. Figura 2 – Fluxograma de destilação de óleo cru (Wang et al., 2004). 4.1 Critério de Avaliação O critério TER (Total Error Reduction) é muito utilizado na avaliação de desempenho do procedimento de RD e DEG, quando todos os valores exatos (base da simulação) são fornecidos (Özyurt & Pike, 2004; Prata et al., 2008), conforme apresentado na Equação (11). TER = ∑ (zmedido − zexato )2 σ2 ∑ − ∑ (xreconciliado − zexato )2 (zmedido − zexato )2 σ2 σ2 (11) XVII Encontro de Modelagem Computacional V Encontro de Ciência e Tecnologia de Materiais Universidade Católica de Petrópolis (UCP), Petrópolis/RJ, Brasil. 15-17 out. 2014 O critério TER mede a redução total dos erros, tomado por base os valores medidos e os reconciliados em relação aos valores exatos. Quanto maior for o TER obtido, ou mais próximo de 1, melhor terá sido o resultado. O critério TER pode ser utilizado independentemente da função objetivo (estimador) utilizada, permitindo assim utilizado para comparação de estimadores-M robustos e outras estratégias nos procedimentos de RD e DEG. 4. RESULTADOS E DISCUSSÃO Para resolver o procedimento de RD e DEG simultaneamente utilizou-se os seguintes estimadores-M: NC, Fair, Cauchy, Logistica, Hampel, Lorenziana, Welsch, Collins, TanH, Alamgir e MQP. Este último é apresentado de duas maneiras: a primeira sem estratégia alguma associada, somente para fins comparativos, e a segunda baseada na estratégia MT-NT. Como restrições do problema utilizou-se o modelo linear associado ao balanço de massa global conforme fluxograma ilustrado na Fig. 2. Os estimadores -M robustos Welsch, Collins, TanH e Alamgir foram implementados no pacote de otimização do EMSO. Os demais são parte integrante do pacote de reconciliação do EMSO, e por este pacote implementados. Na Tabela 1 são apresentados os resultados obtidos e por Wang et. al. (2004), bem como os valores exatos (zexato,i), os valores medidos (zi) e seus respectivos desvios-padrão (σi). Tabela 1 – Resultados da RD para o estudo de caso. MT-NT zexato,i x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11 x12 x13 x14 x15 x16 x17 x18 x19 x20 x21 x22 x23 x24 x25 x26 zi 308 300,4 77 74 77 75,7 77 75,3 77 76 62 62,4 82 84,1 82 81,4 82 82,2 308 309,4 8,5 8,3 5,5 5,7 30 29,7 20 20,7 14 14,3 230 314,8 57,5 58,3 57,5 58,3 57,5 59,9 57,5 57,2 230 180,5 12 11,9 49 48,5 38 36,6 21 21,4 110 140,6 TER = σi 7,7 1,925 1,925 1,925 1,925 1,55 2,05 2,05 2,05 7,7 0,2125 0,1375 0,75 0,5 0,35 5,75 1,4375 1,4375 1,4375 1,4375 5,75 0,3 1,225 0,95 0,525 2,75 Wang et. al. (2004) 308,7 75,9 77,6 77,2 78 62,2 83,7 81 81,8 308,7 8,3 5,7 29,4 20,5 14,2 230,6 57,5 57,5 59,1 56,5 230,6 11,9 48,6 36,7 21,4 112 0,8366 EMSO - RRD MQP NC Fair Cauchy Logística 312,9680 77,0666 78,6652 78,2891 78,9473 62,8700 84,8005 82,2746 83,0230 312,9680 8,2035 5,6584 28,5019 20,1521 14,0325 236,4200 58,9852 58,9852 60,5180 57,9314 236,4200 11,7166 45,5217 34,8194 20,8330 123,5290 0,6086 308,2750 75,8188 77,5189 77,1190 77,8188 62,1089 83,5886 80,8891 81,6889 308,2750 8,2785 5,6911 29,4265 20,5790 14,2410 230,0590 57,3897 57,3897 58,9903 56,2895 230,0590 11,8972 48,4431 36,5663 21,3903 111,7620 0,8314 310,8380 76,4983 78,1489 77,7748 78,4165 62,5121 84,2543 81,6609 82,4112 310,8380 8,3661 5,5372 29,2619 20,5237 14,2289 232,9210 58,1353 58,1353 59,6337 57,0163 232,9210 11,8582 47,4233 37,6512 21,2711 114,7170 0,8191 308,7340 75,9405 77,6290 77,2805 77,8844 62,1464 83,8431 80,9770 81,7679 308,7340 8,2372 5,6701 29,3819 20,7564 14,2604 230,4280 57,3748 57,3748 59,3602 56,3184 230,4280 11,8852 48,2643 38,7619 21,3940 110,1230 0,8309 309,5340 76,2753 77,7795 77,4884 77,9911 62,2377 84,2259 81,1404 81,9302 309,5340 8,1885 5,7707 29,2486 20,8063 14,2514 231,2690 57,4975 57,4975 59,8126 56,4613 231,2690 11,8616 47,8759 37,9239 21,3440 112,2640 0,7985 Valores em negrito: Variáveis com erros grosseiros. XVII Encontro de Modelagem Computacional V Encontro de Ciência e Tecnologia de Materiais Universidade Católica de Petrópolis (UCP), Petrópolis/RJ, Brasil. 15-17 out. 2014 Tabela 1 (Continuação) – Resultados da RD para o estudo de caso. EMSO - RRD zexato,i x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11 x12 x13 x14 x15 x16 x17 x18 x19 x20 x21 x22 x23 x24 x25 x26 zi 308 300,4 77 74 77 75,7 77 75,3 77 76 62 62,4 82 84,1 82 81,4 82 82,2 308 309,4 8,5 8,3 5,5 5,7 30 29,7 20 20,7 14 14,3 230 314,8 57,5 58,3 57,5 58,3 57,5 59,9 57,5 57,2 230 180,5 12 11,9 49 48,5 38 36,6 21 21,4 110 140,6 TER = σi Hampel Lorenziana Welsch Collins TanH Alamgir 7,7 1,925 1,925 1,925 1,925 1,55 2,05 2,05 2,05 7,7 0,2125 0,1375 0,75 0,5 0,35 5,75 1,4375 1,4375 1,4375 1,4375 5,75 0,3 1,225 0,95 0,525 2,75 308,0430 77,0161 77,0092 77,0067 77,0111 62,0074 82,0215 82,0045 82,0096 308,0430 8,4979 5,7672 29,9888 20,0265 14,0000 229,7630 57,4849 57,4849 57,3151 57,4778 229,7630 11,9994 48,9979 37,7061 21,0029 110,0560 0,9052 307,9630 75,7226 77,4476 77,0578 77,7349 62,0614 83,4951 80,8093 81,5971 307,9630 8,2846 5,5931 29,4475 20,5875 14,2490 229,8010 57,3148 57,3148 58,9433 56,2283 229,8010 11,9007 48,4439 36,5780 21,3946 111,4840 0,8429 308,2330 75,8085 77,5089 77,1058 77,8096 62,1025 83,5776 80,8764 81,6762 308,2330 8,2829 5,6261 29,4585 20,5746 14,2482 230,0430 57,3859 57,3859 58,9933 56,2773 230,0430 11,9006 48,5010 37,0503 21,4007 111,1900 0,8509 308,0520 75,8375 77,4362 77,0600 77,7183 62,0700 83,4285 80,9026 81,6510 308,0520 8,2805 5,6908 29,4491 20,5762 14,2411 229,8140 57,3136 57,3136 58,9272 56,2598 229,8140 11,9031 48,5456 36,6543 21,4005 111,3110 0,8371 308,3710 77,4224 77,0142 76,6381 77,2963 62,1219 83,5175 80,9916 81,7400 308,3710 8,2820 5,6914 29,4670 20,5842 14,2451 230,1010 57,3528 57,3528 59,0969 56,2989 230,1010 11,9034 48,5511 36,6577 21,4015 111,5880 0,8380 308,1180 75,7788 77,4797 77,0793 77,7799 62,0835 83,5445 80,8450 81,6447 308,1180 8,2796 5,6914 29,4415 20,5855 14,2442 229,8760 57,3437 57,3437 58,9451 56,2430 229,8760 11,9007 48,5018 36,6023 21,4010 111,4700 0,8331 Valores em negrito: Variáveis com erros grosseiros. Na Tabela 1 observa-se com clareza que o estimador robusto do tipo "hard redescending" Hampel, obteve o maior valor para o critério TER (0,9052), e consequentemente o melhor resultado geral na presença de múltiplos erros grosseiros para o sistema colunas de destilação em série enunciado por Wang et. al. (2004). Como era de se esperar, o estimador MQP sem associação a estratégias de detecção e eliminação/compensação de erros grosseiros obteve o pior resultado, com TER (0,6086). Os estimadores Fair e Logística, classificados como robustos monótonos, obtiveram resultados melhores que o estimador MQP (não robusto), com TER (0,8191) e TER (0,7985), respectivamente. Entretanto, por apresentarem FI que de certa forma minimiza mas ainda sofre influência dos erros grosseiros, a medida que sua magnitude aumenta, não conseguem o mesma eficiência dos estimadores robustos classificados como "redescending" como os estimadores Lorenziana e Welsch que obtiveram TER (0,8429) e TER (0,8509), respectivamente. Os resultados dos estimadores Hampel, Welsch e Lorenziana foram superiores a estratégia MT-NT que apresentou TER (0,8366), e corroboram os resultados apresentados anteriormente por Özyurt & Pike (2004) e Prata et al. (2008) nos quais estes estimadores mostraram maior eficiência. Os estimadores do tipo "redescending" de Collins, Tangente Hiperbólica e Alamgir introduzidos do campo de estatística para engenharia química neste trabalho apresentaram resultados superiores ao estimador não robusto MQP, quase robusto NC e robustos monotônicos de Fair e Logística. Seus XVII Encontro de Modelagem Computacional V Encontro de Ciência e Tecnologia de Materiais Universidade Católica de Petrópolis (UCP), Petrópolis/RJ, Brasil. 15-17 out. 2014 desempenhos foram muito próximo a estratégia MT-NT, com TER (0,8371), TER(0,8380) e TER (0,8331), respectivamente. Isto não inviabiliza a utilização destes estimadores-M, pelo contrário, estimula a utilização destes em outros problemas, bem como a pesquisa histórica por outros estimadores-M robustos, como aqueles anteriores ao ano de 1900, como, por exemplo, o estimador de Smith de 1888, conforme relatado por Prata et al. (2010) e, ainda, o desenvolvimento de outros, com bases nos avanços desta área da estatística robusta aplicada. Todos os erros grosseiros foram corretamente detectados. Para os estimadores-M robustos utilizou-se o teste clássico baseado na distribuição normal para 95% de confiança, o que equivale ao resíduo padronizado de 1,96. Para estes estimadores, o teste é realizado após a regressão, apenas para identificar os erros grosseiros, diferentemente da estratégia MT-NT na qual a identificação ocorre durante o procedimento. Estes resultados mostram, também, a essência da utilização dos estimadores robustos que são capazes de realizar o procedimento de RD e DEG simultaneamente, evitando estratégias com base em procedimentos iterativos, em geral computacionalmente intensivos. Os resultados mostraram também a eficácia do procedimento de RRD implementado no simulador EMSO, tanto no pacote de otimização ("optmization"), quanto no pacote de reconciliação ("reconciliation") disponíveis neste software nacional e gratuito para fins acadêmicos. Nestas implementações utilizou-se o otimizador IPOPT presente em ambos pacotes do simulador EMSO. Este otimizador é conhecido por sua robustez e caráter de otimização global, pelo o método primal-dual do ponto interior, que lida com as restrições pelo uso de funções barreira, fornecendo assim os mínimos globais de funções não convexas, que é o caso dos estimadores-M robustos classificados como “redescending”. 5. CONCLUSÕES Este trabalho apresentou um estudo sobre reconciliação robusta de dados em estado estacionário em um conjunto de 7 colunas de destilação em série com 26 variáveis medidas, com base em um exemplo apresentado na literatura por Wang et. al. (2004). No estudo de caso o procedimento foi implementado no pacote computacional EMSO, tanto no pacote de otimização, quanto no pacote de reconciliação, sendo inseridos os estimadores-M robustos de Collins, Tangente Hiperbólica e Alamgir à problemas de engenharia química. Os estimadoresM robustos do tipo “redescending” Hampel, Welsch, Lorenziana, Tangente Hiperbólica e Collins, apresentaram os melhores resultados, comprovando a eficiência do procedimento de Reconciliação de Dados e Detecção de Erros Grosseiros simultaneamente. Este trabalho contribui para o desenvolvimento e aplicações reais de estimadores-M robustos. Agradecimentos O autor Diego Queiroz Faria de Menezes agradece a CAPES pelo suporte financeiro. 6. REFERÊNCIAS Alamgir; Li, A. A.; Khan, S. A.; Khan, D. M.; Khalil, U., (2013), A new efficient redescending M-estimator: Alamgir redescending M-estimator, Research Journal of Recent Sciences, 2, 79-91. Albuquerque, J. S.; Biegler, L. T., (1996), Data Reconciliation and Gross-Error Detection for Dynamic Systems, AIChE Journal, 42, 2841-2856. Arora, N.; Biegler, L. T., (2001), Redescending estimators for Data Reconciliation and Parameter Estimation, Computers and Chemical Engineering, 25, 1585-1599. XVII Encontro de Modelagem Computacional V Encontro de Ciência e Tecnologia de Materiais Universidade Católica de Petrópolis (UCP), Petrópolis/RJ, Brasil. 15-17 out. 2014 Collins, J. R. (1976), Robust Estimation of a location parameter in the presence of asymmetry, The Annals of Statistics, 4, 68-85. Farzi, A.; Mehrabani-zeinabad, A.; Boozarjomehry, R. B. (2008), Data reconciliation: Development of an objectoriented software tool. Korean Journal of Chemical Engineering, 25, 955-965. Hampel, F. R.;Rousseeuw, P.J.; Ronchetti, E. (1981), The change-of-variance curve and optimal redescending M-estimators, Journal of the American Statistical Association, 76, 643-648. Holland, P. W.; Welsch, R. E. (1977), Robust Regression Using Iteratively Reweighted Least-Squares, Communications in Statistics, Theory and Methods, A6, 813-828. Jin, S.; Li, X.; Huang, Z.; Liu, M. (2012), A new target function for robust data reconciliation. Industrial. Engineering. Chemical. Researcher., 51, 10220−10224. Johnson, L. P. M.; Kramer, M. A. (1995), Maximum Likelihood Data Rectification: Steady-State Systems, AIChE Journal, 41, 2415-2426. Kister, H. Z. (1992), “Distillation-Design”, McGraw-Hill, EUA. Kong, M., Chen, B., Li, B. (2000), An Integral to Dynamic Data Rectification, Computers and Chemical Engineering, 24, 749-753. Narashimhan, S.; Jordache, C. (2000), “Data Reconciliation and Gross Error Detection: An Intelligent Use of Process Data”, 1° ed., Gulf Professional Publishing, Texas. Özyurt, D.B.; Pike, R.W. (2004), Theory and practice of simultaneous data Reconciliation and gross error detection for chemical process. Computer and Chemical Engineering, 28, 381−402. Prata, D. M.; Pinto, J. C.; Lima, E. L. (2008), Comparative analysis of robust estimators on nonlinear dynamic data reconciliation. Computer Aided Chemical Engineering, 25, 501−506. Prata, D. M.; Schwaab, M.; Lima, E. L.; Pinto, J. C. (2010), Simultaneous Robust Data Reconciliation and Gross Error Detection through Particle Swarm Optimization for an Industrial Polypropylene Reactor. Chemical Engineering Science, 65, 4943-4954. Soares, R. P.; Secchi, A. R. (2003), EMSO: Environment for Modelling, Simulation and Optimisation. Computer Aided Chemical Engineering, 14, 947−952. Tjoa, I. B.; Biegler, L. T. (1991), Simultaneous strategy for data reconciliation and gross error detection of nonlinear systems. Computers & Chemical Engineering, 15, 679-690. Wang, F.; Jia, X.; Zheng, D.; Yue, J. (2004), An improved MT-NT method for gross error detection and data reconciliation. Computers & Chemical Engineering, 28, 2189-2192. Zhou, L.; Su, H.; Chu, J. (2006), A New Method to Solve Robust Data Reconciliation in Nonlinear Process, Chinese Journal of Chemical Engineering, 14, 357-363. ROBUST DATA RECONCILIATION IN DISTILLATION COLUMNS USING EMSO SIMULATOR Abstract. This paper presents a study about robust data reconciliation in steady state in distillation columns, based on a paper published in scientific literature. It was performed a brief literature review focusing on problems involving distillation columns and a review about robust M-estimators used for data reconciliation and simultaneous gross error detection. The example reported consists of seven crude oil distillation columns with 26 measured variables where 3 of ones are corrupted by gross errors. The selected problem is solved in the computer package EMSO (Environment for Modeling, Simulation and Optimization) which has available developed computational routines for data reconciliation in steady state with linear or nonlinear constraints. Three robust M-estimators are introduced: Hyperbolic Tangent, Collins and Alamgir derived from robust statistic for application in chemical engineering problems. Other estimators already present in the computer package EMSO were also used. Satisfactory results are obtained proving the efficiency of estimator applied and the performance of computational package EMSO. Thus, are presented the advantages of robust data reconciliation and its contribution to chemical engineering processes. Keywords: Data Reconciliation, Robust Estimators, Distillation Columns