UM PROJECTO DE MONITORIZAÇÃO DO ESTADO DE CONDIÇÃO E PREDICÇÃO DE AVARIAS DE BORDO. Vairinhos, Valter Martins Lobo, Victor Escola Naval, Alfeite Sumário Neste artigo é apresentado o projecto MECPAB – Monitorização do Estado de Condição e Previsão de Avarias de Bordo, que está a ser desenvolvido na Escola Naval. Este projecto visa desenvolver métodos estatísticos para análise de dados multivariados gerados por sensores, ou oriundos de registos históricos de manutenção. Essas técnicas destinam-se a permitir fazer um diagnóstico contínuo do estado do sistema tendo em vista a previsão de avarias e o suporte a políticas de manutenção CBM (Condition Based Maintenance). São apresentadas três técnicas de análise e modelação de dados potencialmente úteis nesta tarefa, e mostra-se a aplicação destas técnicas a um conjunto de dados reais obtidos para teste. Palavras chave: Análise de dados, Manutenção, CBM, Biplots, SOM, SEM. 1. Introdução O benefício de registar, para análise futura, os dados históricos do material sempre foi reconhecido e traduzido na criação de sistemas de recolha de dados, para apoio da tomada de decisão na área da gestão da material. Os paradigmas de gestão da manutenção, actualmente dominantes, são o da manutenção segundo o estado e o da manutenção centrada na fiabilidade. Usando as siglas inglesas: CBM – Condition Based Maintenance, para Manutenção Segundo o Estado e RCM – Reliability Centered Maintenance para a Manutenção Centrada na Fiabilidade. A RCM reconhece que é necessária uma função manutenção gerida com base na fiabilidade dos sistemas pelo facto de existirem avarias e, portanto, ser necessária uma teoria matemática – a teoria da fiabilidade – capaz de modelar o facto básico de as avarias de material ocorrerem ao acaso. A CBM é uma política de manutenção específica assente no pressuposto de que só se deve realizar a manutenção necessária e adequada ao verdadeiro estado da máquina, estabelecido por técnicas específicas como a análise de vibrações, as análises ao óleo ou a termografia, no caso dos sistemas mecânicos. A concretização das políticas CBM cria problemas difíceis do ponto de vista estatístico. O problema básico é o de conhecer em cada instante o verdadeiro estado do sistema, como condição para a tomada de decisões adequadas a esse estado, acerca do que deve ser feito. A questão estatística básica é a de usar a informação disponível num certo instante acerca dessa máquina para inferir/estimar/decidir/diagnosticar qual o estado. Tendo estimado o estado, há que decidir que trabalhos devem ser realizados para garantir 1 uma certa fiabilidade num dado período futuro, para repor a máquina no seu estado de novo ou optar entre várias alternativas possíveis. Associado ao problema estatístico está associado um problema de decisão/optimização, em que as incertezas desempenham um papel importante. stas questões não são triviais e esse facto justifica, talvez, a razão pela qual, sendo o conceito de CBM relativamente velho se constate que são relativamente poucas as suas concretizações. As instalações mais recentes podem ser vistas como sistemas mistos de hardware e software, com a larga participação dos sistemas de controlo baseado em sensores. A existência de centenas ou milhares de sensores nas instalações modernas abre novas oportunidades à criação de sistemas de diagnóstico e previsão (de avarias) que tornam possíveis e mais realistas as concretizações de políticas CBM. Contudo, são necessárias investigações (Jardine, Lin et al. 2006) nas áreas de análise estatística dos dados multivariados gerados por esses sensores, na combinação/fusão dos dados de sensores com os dados do registo histórico dos equipamentos e com os dados gerados pela observação dos sistemas na concretização das existentes políticas CBM (Raheja, Llinas et al. 2006). O projecto MECPAB, recentemente criado na Escola Naval, reconhece as limitações da investigação actual nessa área e propõe-se contribuir, com investigação aplicada, tendo em conta os problemas específicos da Marinha de Guerra Portuguesa. 2. Objectivos do projecto MECPAB Os objectivos básicos do projecto de Monitorização dos Estados de Condição e Previsão de Avarias de Bordo (MECPAB) são os de conceber e testar algoritmos de análise de dados multivariados relevantes para os problemas de previsão de avarias de bordo dos navios e usar os algoritmos eventualmente desenvolvidos para servirem de base à elaboração de software aplicável na área da gestão de manutenção. Estes objectivos nada mais fazem do que tentar dar concretização aos objectivos definidos, já em 1984, na carta de promulgação do Sistema de Recolha e Tratamento (SRTD) de Dados de Manutenção da Armada e que aqui se transcrevem (Marinha 1984): • Registar os dados de natureza histórica, técnica, económica e operacional, gerados pela função manutenção de material e transformá-los em tempo útil, em informação utilizável nas tarefas de gestão de manutenção, planeamento, direcção, controlo e organização. • Registar a experiência passada de utilização do material naval sob forma que possibilite estudos estatísticos válidos como elementos de tomada de decisão acerca do material a escolher e a adquirir no futuro e no estabelecimento de políticas de manutenção adequadas. Aquele documento estabelecia assim – já lá vão 23 anos – os fundamentos para uma base de dados do material, repositório da experiência acumulada da Marinha com os seus sistemas e equipamentos, antevendo a necessidade de aplicar a estes dados aquilo que agora se designa data mining. Vicissitudes várias – entre elas a escassez de meios recolha automatizada de dados e a natureza não trivial dos problemas estatísticos que se põem nesta área – têm impedido a cabal concretização dessa componente do sistema de apoio à decisão na gestão do material da Armada. A introdução recente do sistema SICALN veio melhorar a situação sem resolver ainda a questão da exploração estatística dos dados acumulados. Considera-se importante a utilização de uma análise estatística sofisticada dos dados históricos acumulados nas bases de dados e dos que começam a ser gerados pelos sensores dos sistemas mais recentes. O projecto MECPAB é, pois, um projecto de investigação aplicada na área da análise estatística dos dados da gestão do material a decorrer no âmbito das atribuições de um organismo de ensino superior da Marinha (a Escola Naval) que integra o Sistema Nacional de Investigação, tutelado pelo Ministério da Ciência, Tecnologia, e Ensino Superior. A Figura 1 procura sintetizar os objectivos e abordagem geral do MECPAB aos problemas antes expostos: 2 H(t) Informação disponível no instante t Ri-1 Ri D t D+x x DWL (t) (Dynamic Work Load no instante t) Figura 1 -Ideia geral do projecto MECPAB. Na Figura 1, assumindo um instante genérico do período operacional que está a decorrer entre a última revisão (Ri-1) de um dado sistema e a próxima revisão (Ri) desse mesmo sistema (Ri) – a decorrer em futuro ainda não especificado. A questão básica, do ponto de vista da manutenção CBM é a de usar a informação H (t) disponível no instante t (tempo decorrido a partir do início do período operacional corrente com data de calendário D) para estimar/identificar o estado do sistema no instante t e usar o resultado desta identificação/predição/diagnóstico para decidir qual vai ser a fiabilidade no sistema no período [t, t + x] de duração x - entre as datas D, D+x – ou o que deve ser feito na próxima imobilização do sistema (Ri). A informação H (t) é composta por: 1. Informação gerada pelos sensores de bordo, recolhida em obediência a planos de amostragem predefinidos ou segundo outras necessidades e critérios; 2. Registos históricos relativos à ocorrência de avarias e suas reparações (o que avariou, quando, porquê, que recursos foram gastos, quando se recuperou e operacionalidade, que alterações de configuração se verificaram); 3. Registos das observações relativas à manutenção CBM, como por exemplo, registos das análises de vibrações, imagens termográficas e outras, resultados das análises do óleo e água de circulação, etc; 4. Experiência do pessoal ligado à operação e manutenção do material, eventualmente expressa por distribuições à priori dos tempos entre avarias, regras acerca do comportamento do material, sugestões, etc. Um conceito actualmente em avaliação como potencialmente útil na perspectiva da criação de indicadores do estado das máquinas é o de lista dinâmica de trabalho (DWL – Dynamic Work List) considerada como uma elaboração criada a partir de H (t) e contendo a identificação de todas as necessidade de manutenção do sistema/equipamento já identificadas mas ainda não satisfeitas no instante t. Intuitivamente, esta lista funcionaria como uma espécie de estatística suficiente na base da qual basear o processo de estimação acerca do estado do equipamento/sistema. Seria sobre esta DWL – mais restrita e precisa do que H (t) – que incidiriam as técnicas de análise de dados multivariados/reconhecimento de padrões a usar para gerar informação acerca do estado do sistema. 3. Metodologias potencialmente úteis. Jardine (2006) dá conta da grande actividade de investigação actual na área dos métodos e técnicas de análise de dados multivariados gerados pela actividade de manutenção. Tendo o projecto MECPAB tido início no Verão de 2006, rapidamente se chegou à conclusão de que no processo de diagnóstico e previsão de avarias de bordo um papel importante estaria reservado aos métodos gráficos de análise de dados, bem como às redes neuronais e sistemas de equações estruturais, tendo sido decidido proceder a uma avaliação preliminar de algumas dessas técnicas – ao mesmo tempo que decorria um processo paralelo de inventariação de dados disponíveis nas suas diversas formas; em 3 particular dos dados gerados pelas centenas de sensores do sistema NAUTOS que equipa as fragatas das classe Vasco da Gama. De entre as técnicas correntemente em avaliação pelo seu elevado potencial citam-se os biplots (Vairinhos 2004); SOMS (Self Organizing Maps) (Kohonen 2001); SEM’s (Strucutral Equation Models)(Bollen 1989). Nos parágrafos seguintes apresentam-se sínteses não técnicas destas metodologias e as características que, acredita-se nesta fase do projecto, as tornam potencialmente úteis para as tarefas de datamining e desenvolvimento de modelos de predição de avarias. Essas técnicas são ilustradas com dados de sensores gerados pelo funcionamento de um motor Diesel Propulsor de uma instalação naval. Esses dados compreendem 200 observações (correspondentes a 200 intervalos de 1 hora) relativos a 38 variáveis (sensores) observadas sobre um mesmo motor propulsor, agrupadas por: temperaturas dos gases de escape (12 variáveis); temperaturas do ar de sobrealimentação; pressão do ar de sobrealimentação, velocidade do motor (RPM), caudais de combustível, temperaturas e pressão do óleo em vários pontos. Os dados são apresentados apenas para ilustrar o tipo de resultados que se podem obter com as técnicas mencionadas, sem qualquer preocupação de apresentar o modelo de diagnóstico ou previsão de avarias. 4. Biplots O conceito de biplot deve-se a (Gabriel 1971). Os biplots podem considerar-se uma generalização dos gráficos de dispersão. Estes, como é conhecido, permitem representar até três variáveis: cada um dos eixos representa uma variável e as etiquetas dos pontos observados podem representar uma terceira variável. Em síntese, um gráfico de dispersão apresenta no mesmo gráfico dois tipos de informação: os identificadores dos objectos que foram observados e duas (ou três) variáveis observadas. Os biplots generalizam esta ideia: contêm marcadores para as variáveis e marcadores para os objectos observados. A Figura 2 ilustra o conceito através de um biplot em que as setas representam as 38 variáveis mencionadas, relativas ao funcionamento de um motor propulsor de uma instalação naval e os ‘*’ representam períodos de uma hora. O quadro de dados original continha no cruzamento da linha i (intervalo de 1 hora) com o sensor j o valor médio das observações desse sensor no período indicado. BONECO Figura 2 - Biplot relativo a 38 variáveis e 200 observações de variáveis estão representadas por setas e os objectos por ‘*’. Num gráfico deste tipo os ângulos entre vectores representativos das variáveis (marcadores das variáveis) representam correlações entre as variáveis e as distâncias entre os pontos representativos dos objectos observados (neste caso, períodos de 1 hora) significam dissemelhanças entre essas observações. Por exemplo, na Figura 2, o ângulo entre a variável ET0228 e ET0226 – temperaturas dos gases de escape de dois cilindros – é pequeno o que corresponde ao facto físico de que as temperaturas de escape entre os cilindros são muito próximas, em condições normais de funcionamento. 4 O centro do gráfico corresponde ao valor médio das variáveis observadas. Ângulos próximos de 90º entre os vectores representativos das diversas variáveis correspondem a fracas correlações entre as mesmas. É o caso das variáveis AP0251 (Pressão do ar de alimentação) e OP0257 (Pressão do óleo de lubrificação). Uma vez que os biplots contêm simultaneamente os objectos observados e as variáveis observadas, são um instrumento muito útil para a realização de operações de datamining, permitindo a apresentação sobre o mesmo gráfico dos resultados de queries expressos em função dos sensores e respectivos valores. Assim, na Figura 3 podem ver-se, representadas pelo fecho convexo, “o conjunto de observações – horas neste caso – em que as temperaturas dos gases de escape estiveram abaixo de 100º C”. Do mesmo modo, pode usar-se um biplot para expressar os resultados das análises obtidas por outras técnicas: análise classificatória, som’s, MDS, análise descriminante. A título de exemplo, a Figura 3 apresenta as 200 observações usadas para construir os biplots agrupados em 4 grupos representados pelos respectivos fechos convexos. O reconhecimento destas potencialidades dos biplots levou um dos autores deste trabalho a desenvolver um sistema protótipo de datamining funcionando inteiramente sobre biplots (Vairinhos 2004). No âmbito do projecto MECPAB encara-se a possibilidade de desenvolver e adaptar este conceito aplicando-o aos problemas específicos do projecto. BONECO Figura 3 - Representações, no biplot, dos fechos convexos de uma partição das observações em quatro grupos, obtida por análise classificatória. 5. SOM – Mapas Auto-Organizados (Self-Organizing Maps) Os mapas auto-organizados, mais conhecidos pela sigla inglesa SOM (de Self-Organizing Map) são um tipo de rede neuronal. Foram propostos pelo Prof. Tuevo Kohonen em 1982 (Kohonen 1982), tendo por isso a designação de Redes Neuronais de Kohonen (Kohonen Networks). Por vezes aparecem na literatura científica com outros nomes, como por exemplo Self-Organizing Feature Maps, Topology Preserving Feature Maps (Kohonen 1995), ou em português Mapas Auto-organizáveis (Lourenço 2005). Neste texto, por simplicidade, usaremos a sigla SOM (pronunciada sóme) para designar os mapas auto-organizados, não distinguindo nessa sigla o singular do plural. Os SOM são uma ferramenta que pode ser usada para tarefas muito distintas. Os exemplos de utilização mais frequentes são a determinação de agrupamentos (clustering determinístico), a visualização de dados multidimensionais, a detecção de agrupamentos (clustering exploratório) e excepções (outliers), a ordenação de entidades, a classificação de dados, a resolução de problemas do tipo caixeiro viajante, interpolação, e extracção de características. Na sua essência, um SOM faz um mapeamento não linear de um espaço multidimensional para um espaço (geralmente) bi-dimensional. Mapeamentos para espaços de outras dimensões também são possíveis e usados nalguns casos. A característica mais importante desse mapeamento é a preservação de relações topológicas, isto é, objectos que estiverem próximos no espaço original serão mapeados para zonas próximas no SOM (espaço de saída). Neste aspecto, o mapeamento realizado pelo SOM é semelhante ao Multidimensional Scaling (MDS)(Sammon 1969), embora com algumas vantagens sobre este método (Kohonen 2001). 5 Para visualizar o resultado do mapeamento efectuado por um SOM podem-se usar Matrizes-U, ou UMAT (Ultsch and Simeon 1989; Ultsch 2005), e planos de componentes (Kohonen 2001). Nas UMAT representa-se através de um código de cores, as distâncias entre unidades vizinhas no SOM. As zonas do SOM onde as unidades estão próximas entre si correspondem a zonas do espaço de entrada onde há grande concentração de dados, logo a grupos ou clusters. Zonas do SOM onde as unidades estão afastadas entre si correspondem a zonas do espaço de entrada onde há poucos ou nenhuns dados, correspondendo a dados anómalos ou que ocorrem raramente. Ao treinar um SOM com os dados descritos anteriormente obtemos a UMAT apresentada na ????. Nessa figura identificam-se claramente quatro zonas de operação bem distintas, representadas por zonas azuis separadas por zonas vermelhas. Isto significa que o motor em causa tem quatro grandes estados de funcionamento bem distintos. Em cada instante o estado do motor, definido através dos valores dos diversos sensores, é mapeado para um ponto no SOM. Podemos antever mudanças no estado de um motor analisando a evolução do seu mapeamento no SOM (ver Figura 4). t=23 t=28 Figura 4 – UMAT obtido a partir do SOM trienado com os dados de operação de um motor Diesel. À esquerda apresenta-se a UMAT simples, e à direita sobrepõe-se a identificação dos clusters (elipses) e da evolução no estado ao longo do tempo (setas) 6. Sistemas de equações estruturais Ao definir uma política CBM assume-se que é possível conhecer/estimar/identificar/diagnosticar ou de algum modo aceder ao verdadeiro estado de uma máquina ou sistema e que, na posse dessa informação, é possível decidir ou prescrever qual é a manutenção adequada a esse estado. Por exemplo, medindo o nível de vibrações em direcções ortogonais, em certos pontos escolhidos de um sistema mecânico, é possível inferir o grau de desiquilíbrio do motor de uma máquina rotativa e decidir que esse grau de desequilíbrio justifica – ou não –a desmontagem da máquina. Tal como sucede em medicina, no caso das máquinas, os meios auxiliares de diagnóstico permitem, nalguns casos, observar directamente o estado de certos órgãos. Noutros casos, esse estado é obtido por estimação, sendo necessário usar toda a informação disponível para realizar um diagnóstico. O fundamento da CBM é o de que o verdadeiro estado das máquinas – mesmo que não observável directamente – manifesta-se exteriormente através de indicadores observáveis. No caso dos sistemas mecânicos, por exemplo, o estado de um motor Diesel pode manifestar-se pelos níveis de vibração, pH da água de circulação, nível de partículas em suspensão nos óleos e sua natureza. Em síntese: muitas vezes o verdadeiro estado de uma máquina ou sistema não é observável directamente, pelo que pode ser representado por uma variável latente apropriada (qualitativa, quantitativa, escalas ou vectorial) cujas manifestações exteriores podem ser observadas. Uma técnica de modelação naturalmente indicada para situações deste tipo é o filtro de Kalman, como se confirma pelo uso recente desta metodologia no domínio da modelação e estimação em CBM (Barata, Guedes Soares et al. 2002; Young 2003; Pedregal and Carneiro 2006). Esta mesma situação é passível de modelação usando o conceito de variável latente e de equação estrutural (Bollen 1989). 6 Com efeito, seja ∑ o estado inacessível de uma máquina, que se manifesta exteriormente através de variáveis observáveis X1 … Xp.(lado esquerdo da Figura 5). Pode também suceder que o estado da máquina (não observável) resulte dos efeitos externos (formativos) observáveis (lado direito da Figura 5). X1 X2 … Xp Z1 ∑ a) Z2 … Zk ∑ b) Figura 5 - O estado da máquina ∑ manifesta-se exteriormente através das variáveis indicadoras X1 … X3 ou é determinado pelas variáveis Z1 … Zk. Quando o espaço de estados tem uma estrutura expressável pelas relações de um certo conjunto de variáveis latentes, é possível definir e estimar modelos estruturais cuja aplicação potencial aos dados gerados por sensores das instalações modernas se antecipa. 7. Conclusões Pode dizer-se, em síntese, que o projecto MECPAB configura um projecto de investigação aplicada na área das técnicas de análise de dados multivariados que busca identificar, definir e testar metodologias estatísticas nas quais baser, avaliar, e monitorizar políticas de CBM. Referências Barata, J., C. Guedes Soares, et al. (2002). "Simulation Modelling of repairable Multicomponent Deteriorating Systems for "on condition" Maintenance Optimization." Reliability and System Safety 76: 225-264. Bollen, K. A. (1989). Structural Equations with Latent Variables. New York, John Wiley & Sons. Gabriel, K. R. (1971). "The Biplot Graphic Metrics with Application to Principal Component Analysis." Biometrika 58: 453-467. Jardine, K. S. A., D. Lin, et al. (2006). "A review on Machimery diagnostics and prognostics implementing condition-based maintenance." Mechanical Systems and Signal Processing 20: 1483-1510. Kohonen, T. (1982). Clustering, Taxonomy, and Topological Maps of Patterns. Proceedings of the 6th International Conference on Pattern Recognition. Kohonen, T. (1995). Self-Organizing Maps. Berlin-Heidelberg, Springer. Kohonen, T. (2001). Self-Organizing Maps. Berlin-Heidelberg, Springer. Lourenço, F. (2005). Análise exploratória de dados geo-espaciais usando mapas auto-organizáveis. Instituto Superior de Estatística e Gestão de Informação. Lisbon, Universidade Nova de Lisboa. Marinha (1984). ILMANT512. Pedregal, D. J. and M. C. Carneiro (2006). "Space State Models for Condition Monitoring: A case study." Reliability and System Safety 91: 171-180. Raheja, D., J. Llinas, et al. (2006). "Data fusion/data mining-based architecture for condition-based maintenance." International Journal of Production Research 44(14): 2869–2887. Sammon, J. W., Jr (1969). "A Nonlinear Mapping for Data Structure Analysis." IEEE Transactions on Computers C-18(5). Ultsch, A. (2005). Clustering with SOM: U*C. WSOM 2005, Paris. Ultsch, A. and H. P. Simeon (1989). Exploratory Data Analysis Using Kohonen Networks on Transputers, Department of Computer Science, University of Dormund, FRG. Vairinhos, V. M. (2004). BiplotsPMD- data Mining Cebtrada em Biplots. Apresentação de Um Protótipo. JOCLAD'2004 - XI Jornadas de Classificação e análise de Dados, Lisbon. Young, S. K. (2003). "Condition Based Failiure Prediction and Processing - Scheme for Preventive Maintenance." IEEE Transactions on Reliability 52(3). 7 8