X X X I X SBPO 28 a 31/08/07 Fortaleza, CE A Pesquisa Operacional e o Desenvolvimento Sustentável REDUÇÃO DOS CUSTOS ENVOLVIDOS NOS PROCESSOS DE QUANTIFICAÇÃO DE REDES BAYESIANAS Regilda da Costa e Silva Menêzes UFPE, Av. Acadêmico Helio Ramos, s/n, Cidade Universitária, Recife-PE, Cep: 50740-530, [email protected] Enrique López Droguett UFPE, Av. Acadêmico Helio Ramos, s/n, Cidade Universitária, Recife-PE, Cep: 50740-530, [email protected] Rômulo FernandoTeixeira Vilela CHESF, Rua Delmiro Gouveia, 333, Bongi, Recife-PE, Cep: 50761-901, rvilela@ chesf.gov.br RESUMO Uma rede Bayesiana acumula conceitos de várias ciências, tais como: cognitivas, comportamentais, psicologia, matemática, probabilidade, computação e engenharia, possibilitando a estimação de vários parâmetros. Porém, ao tentar modelar as variáveis de interesse, pode-se chegar a altos níveis de detalhamento, elevando os custos envolvidos no processo quantitativo de redes Bayesianas. Estes custos estão relacionados ao tempo gasto na aplicação de métodos de edução para obter opiniões de especialistas, uma vez que normalmente as probabilidades necessárias não são encontradas em um banco de dados. Diante desse contexto, este artigo utiliza mecanismos de construção e quantificação de redes Bayesianas para reduzir o tempo de edução das probabilidades desejadas. Estes mecanismos foram aplicados para solucionar um problema real relacionado à análise de confiabilidade humana (ACH) em atividades de manutenção de linhas de transmissão resultando num ganho significativo em relação ao tempo gasto em eduções de opiniões de especialistas. PALAVRAS CHAVE. Mecanismos de construção e quantificação de redes Bayesianas (RBs); Redução do tempo de edução; Análise de confiabilidade humana. Qualidade. ABSTRACT A Bayesian belief network accumulates concepts of some sciences, such as: cognitive, behavior, psychology, mathematics, probability, computation and engineering, making possible the esteem of some parameters. However, when shape trying the interest variable, can be arrived the high levels of detailing; raising the involved costs in the quantitative process of Bayesian belief network. These costs are related to the time expense in the application of eliciting methods to get opinions of expert, a time that the necessary probabilities are normally not found in a data base. Thus, this article uses mechanisms of construction and quantification of Bayesian belief network to reduce the time of eliciting of the desired probabilities. These mechanisms had been applied to solve a real problem related to the Human Reliability Analysis (HRA) in activities of maintenance of transmission lines resulting in a significant profit in relation to the time expense in eliciting of opinions of experts. KEYWORDS. Human Reliability. Bayesian Belief Networks. Performance Shaping Factors. Quality. XXXIX SBPO [706] X X X I X SBPO 28 a 31/08/07 Fortaleza, CE A Pesquisa Operacional e o Desenvolvimento Sustentável 1. Introdução Redes Bayesinas (RBs) permitem representar as relações de causa e efeito entre variáveis. Diante dessa flexibilidade, podem-se acumular muitos conceitos e chegar a altos níveis de detalhamento. Dessa forma, torna-se necessário a estimação de vários parâmetros de interesse. Porém, estes parâmetros normalmente não são encontrados em um banco de dados. Assim, depende-se completamente de opiniões de especialistas nos processos quantitativos de RBs. Para obter estas opiniões é necessário aplicar um método de edução. Comumente, devido à sistematicidade desses métodos, os custos para eduzir as probabilidades da rede são elevados. Os custos aqui, correspondem ao tempo necessário para aplicação dos questionários de edução. Diante desse contexto, ao utilizar RBs para a análise da confiabilidade de sistemas, torna-se necessário a aplicação de métodos de edução mais eficientes, assim como a prática de mecanismos que reduzam a quantidade de parâmetros a serem eduzidos. Este artigo trata de mecanismos de construção e quantificação de RBs. Nos processos de construção, procura-se alterar a estrutura gráfica da rede de forma que não se perca em detalhamento e obtenha-se uma maior facilidade no processo de edução, bem como uma redução na quantidade das probabilidades a serem eduzidas. Na quantificação, aplica-se um modelo que permite eduzir apenas parte das probabilidades. A motivação para este trabalho surgiu ao aplicar RBs para a análise de confiabilidade humana em atividades de manutenção de linhas de transmissão (Menêzes, 2005), onde é apresentada uma rede com 126 parâmetros a serem eduzidos. Neste constexto, demonstra-se como a utilização desses mecanismos podem reduzir os custos envolvidos nos processos de edução. O artigo está assim organizado. Na próxima seção, apresenta-se os mecanismos de construção e quantificação de RBs. Na seção 3, aplicam-se estes mecanismos para a análise da confiabilidade humana (ACH) em atividades de manutenção de linhas de transmissão. Na seção 4, avalia-se a redução dos custos obtidos e o artigo conclui-se em seguida. 2. Mecanismos de construção e quantificação de redes Bayesianas Para uma discussão sobre os conceitos de RBs recomendam-se Pearl (1988), Korb & Nicholson (2003), Firmino & Droguett (2004) e Menêzes et al. (2005)]. Os sub-tópicos 2.1 e 2.2 apresentam a utilização da técnica Divorcing Multiple Parents para a construção de RBs e o modelo Noisy-OR para a quantificação de RBs. 2.1 Redes Bayesianas e a utilização da técnica Divorcing Multiple Parents (DPM) A DPM é tipicamente aplicada quando um nó tem muitos pais, o que ocasiona um grande número de probabilidades em sua tabela de probabilidades condicionais (TPC). Através desta técnica é possível alterar a estrutura da rede diminuindo assim, a quantidade de pais do nó em questão e conseqüentemente reduzindo a sua TPC. Korb & Nicholson (2003) recomendam utilizar esta técnica quando um nó tiver a partir de 4 pais. Observa-se que um nó dicotômico com 4 pais também dicotômicos gera uma TPC com 16 probabilidades condicionais. Utilizando esta técnica, tem-se combinações de duas ou três TPCs, cuja soma de suas probabilidades de cada combinação a ser eduzida é 12. Portanto, percebe-se uma redução bastante significativa. A seção 3.1 demonstra-se a utilização da DPM no contexto de ACH em linhas de transmissão. 2.2 Redes Bayesianas e o modelo Noisy-OR Alguns tipos de distribuições de probabilidades condicionais podem ser aproximadas por uma distribuição binomial. Esta aproximação permite que apenas parte das probabilidades condicionais da TPC de um determinado nó sejam especificadas, e a partir destas, as outras são calculadas. Este modelo, conhecido como Noisy-or, permite tal cálculo com a restrição de que os pais do nó sejam independentes entre si. Como as variavéis utilizadas neste artigo são dicotômicas, será utilizado o modelo Noisy-or binário. Pearl (1988) apud Onisko (2001) comenta que o modelo Noisy-or binário é XXXIX SBPO [707] X X X I X SBPO 28 a 31/08/07 Fortaleza, CE A Pesquisa Operacional e o Desenvolvimento Sustentável aplicado quando existem várias causas X1, X2,...., Xn para um efeito Y, onde, (1) cada causa Xi tem uma probabilidade pi de causar Y na ausência de todas as outras causas e (2) cada causa é independente da presença das outras causas. Estas duas condições permitem especificar a TPC de um nó com n parâmetros p1, p2,...., pn, onde pi representa a probabilidade do efeito Y ocorrer, uma vez que a causa Xi está presente e todas as outras causas Xj, i ≠ j estão ausentes. Probabilisticamente, tem-se: pi = P( y | x1, x 2 ,..., xi ,..., x n −1 , x n ) Equação 1 A probabilidade de y dado um conjunto de variáveis causadoras X p = [ X 1 , X 2 ,..., X n ] presente é calculada através da equação 2. P( y | X p ) = 1 − ∏ (1 − p ) i Equação 2 i: X i ∈ X p O modelo Noisy-or binário também se aplica a situações em que o modelo não captura todas as possíveis causas de Y, o que provavelmente acontece em todas as situações práticas. Esta situação resulta em uma fonte de incerteza conhecida como incerteza de modelos. Para maiores detalhes, recomenda-se Droguett et al. (2004). O parâmetro citado acima pode ser modelado através de uma probabilidade p 0 , que representa a probabilidade de Y ocorrer espontaneamente, isto é, na ausência de todas as outras causas explicitamente modeladas. Probabilisticamente, temse: p0 = P( y | x1, x 2 ,..., x n ) Equação 3 A seção seguinte apresenta a aplicação desses mecanismos para a ACH em atividades manutenção de LTs. 3. Construção e quantificação de RBs para a ACH em atividades de manutenção de LTs A análise de confiabilidade humana (ACH) estuda a execução das ações humanas em um determinado sistema, considerando os fatores que influenciam no seu desempenho. Os fatores de desempenho (FDs) são todos os fatores que de alguma forma afetam a confiabilidade humana e conseqüentemente auxiliam na determinação da probabilidade de erro humano (Swain & Guttmann, 1983). Os FDs comumente evidenciam a incompatibilidade existente entre as limitações humanas e as condições impostas para o trabalho. Exemplos desses fatores incluem restrições de tempo para executar uma atividade, carga de trabalho excessiva, treinamento inadequado do operador, procedimentos mal elaborados, complexidade da tarefa, entre outros. 3.1 Construção do modelo A construção da rede Bayesiana para ACH da equipe de manutenção de LTs foi realizada através de eduções qualitativas de especialistas, leitura de normas disponíveis e observações do procedimento na prática, as quais possibilitam uma melhor compreensão do contexto, ou seja, das condições ou circunstâncias nas quais o procedimento ocorre. Esta rede possui sete etapas interdependentes. Por questão de brevidade, será apresentada aqui apenas uma etapa para ilustrar a metodologia proposta. A Figura 1 mostra uma etapa do procedimento de substituição de cadeias de isoladores modelado por Menêzes (2005). Esta corresponde a “Retirada da cadeia de isoladores”, onde os eletricistas de topo e montagem, utilizando bastões isolantes, realizam a operação conjunta de retirada da cadeia de isoladores (nó E*2 da Figura 1). Para suporte desta atividade, os eletricistas de apoio (nó EA2 da Figura 1) e auxiliares (nó EAUX2 da Figura 1) realizam a colocação desses isoladores na linha de mão e sustentação da mesma respectivamente. O eletricista encarregado (nó EE2 da Figura 1) tem a função de monitorar a equipe. Estas variáveis aleatórias são dicotômicas, ou seja, representam o erro ou o sucesso dos eletricistas envolvidos na atividade. Os outros nós dessa rede representam os FDs dos eletricistas, cuja Tabela 1 mostra os possíveis XXXIX SBPO [708] X X X I X SBPO 28 a 31/08/07 Fortaleza, CE A Pesquisa Operacional e o Desenvolvimento Sustentável valores que esses nós podem assumir. A linha cheia em negrito representa a relação funcional entre os eletricistas. Os arcos tracejados representam as relações causais existentes entre as mesmas, i.e., a interação existente entre os eletricistas. Por exemplo, a influência que o EE tem sobre os outros eletricistas. Já as linhas cheias representam as relações causais existentes entre os FDs, bem como a sua influência nos eletricistas. CARGA DE TRABALHO COND. FISICOEE2 COND. FISICOEAUX2 FADIGA EE2 ESTADO EMOCIONAL EE2 ATENÇÃO EE2 DESIGN E*2 ESTADO EMOCIONAL E*2 COND. FISICOE*2 FADIGA EAUX2 ESTADO EMOCIONAL EAUX2 COMUNICAÇÃO DESIGN EA2 COND. FISICOEA2 FADIGA EA2 ATENÇÃO EAUX2 EE2 EAUX2 FADIGA E*2 ESTADO EMOCIONAL EA2 CONTROLE MOTOR E*2 EA2 ATENÇÃO EA2 ATENÇÃO E*2 INSETOS Figura 1 – Rede Bayesiana referente a retirada da cadeia de isoladores. NÓ VALORES * Nível de atenção {adequado, não adequado} Capacidade {adequada, não adequada} Carga de trabalho {excessiva, não excessiva} Comunicação {boa, ruim} Condicionamento físico {adequado, não adequado} Controle motor {adequado, não adequado} Design de equipamentos {adequado, não adequado} Estado emocional {favorável, não favorável} Fadiga {presente, não presente} Insetos {presentes, não presentes} *Valor favorável = 0, Valor desfavorável = 1 Tabela 1 – Valores dos FDs. 3.2 Aplicação da técnica Divorcing Multiple Parents (DPM) ao modelo de ACH Em se tratando de um nó com 3 pais, aparentemente nenhuma redução seria possível XXXIX SBPO [709] X X X I X SBPO 28 a 31/08/07 Fortaleza, CE A Pesquisa Operacional e o Desenvolvimento Sustentável através desta técnica. No entanto, algumas considerações precisam ser feitas, tais como: • Esta técnica também pode ser utilizada para outros propósitos. Observa-se claramente, por exemplo, que ela facilita a compreensão do especialista no processo de edução, pois quanto menor o número de variáveis inseridas em um contexto mais fácil será a sua percepção; • Com o objetivo de atingir a primeira consideração, às vezes são introduzidos na rede alguns nós fictícios, os quais apresentam algumas probabilidades já conhecidas, i.e., probabilidades determinísticas. Conseqüentemente, ocorre uma diminuição das probabilidades condicionais a serem eduzidas. Um exemplo prático vivenciado aqui é comentado a seguir. O EA2 da Figura 1 possui três pais (arcos chegando ao nó), os quais podem ser vistos na Figura 2. EAUX2 EE2 ATENÇÃO EA2 EA2 Figura 2 - Causadores imediatos do EA2 antes da utilização da DMP Percebe-se na Figura 2 que a TPC correspondente ao nó EA2 tem 8 probabilidades condicionais. Através da DMP, foi adicionado um nó fictício, IEB2, conforme Figura 3. Algumas probabilidades do nó IEB2 já são conhecidas, pois considera-se que se o eletricista encarregado (EE2) e os eletricistas auxiliares (EAUX2) estiverem desempenhado sua função corretamente, a influência destes eletricistas sobre o eletricista de apoio (EA2) é totalmente positiva. Porém, se os dois não estiverem desempenhado sua função corretamente, a influência é totalmente negativa. Probabilisticamente, tem-se: P ( IEB2 = 0 | EE 2 = 1, EAUX = 1) = 0 P ( IEB 2 = 0 | EE 2 = 0, EAUX = 0) = 1 Com as probabilidades conhecidas, percebe-se na Figura 3 que as probabilidades condicionais que faltam para compor as TPCs dos nós IEB2 e EA2 são 2 e 4 respectivamente, o que correspondente a um total de 6 probabilidades. Neste caso, a utilização da DPM apresenta uma redução de 2 probabilidades, além de facilitar bastante o entendimento do especialista no cenário. EAUX2 EE2 ATENÇÃO EA2 IEB2 EA2 Figura 3 - Causadores imediatos do EA2 depois da utilização da DMP A Figura 4 mostra a rede Bayesiana da Figura 1 depois da utilização da técnica DPM. O nó “capacidade” foi criado com a mesma finalidade do exemplo apresentado acima. Neste caso, considera-se que, se o nível de atenção e o controle motor encontram-se adequados, então a capacidade destes eletricistas realizarem a tarefa é ideal. Caso tanto o nível de atenção quanto o controle motor estiverem inadequados, a capacidade está totalmente comprometida. Probabilisticamente, tem-se: XXXIX SBPO [710] X X X I X SBPO 28 a 31/08/07 Fortaleza, CE A Pesquisa Operacional e o Desenvolvimento Sustentável P(Capacidade = 0 | Nível de atenção = 1, Controle motor = 1) = 0 P(Capacidade = 0 | Nível de atenção = 0, Controle motor = 0) = 1 . CARGA DE TRABALHO COND. FISICOEE2 COND. FISICOEAUX2 FADIGA EE2 DESIGN EA2 ESTADO EMOCIONAL ATENÇÃO EE2 DESIGN E*2 COND. FISICOE*2 FADIGA E*2 COND. FISICOEA2 ESTADO EMOCIONAL COMUNICAÇÃO ESTADO EMOCIONAL FADIGA EAUX2 FADIGA EA2 ATENÇÃO EAUX2 EAUX2 EE2 ESTADO EMOCIONAL IEB2 CONTROLE MOTOR E*2 EA2 ATENÇÃO EA2 CAPACIDADE ATENÇÃO E*2 INSETOS Figura 4 – Rede Bayesiana referente a retirada da cadeia de isoladores após a utilização da DPM. Após a construção da rede Bayesiana, inicia-se o processo de quantificação da mesma, o qual será comentado a seguir. 3.2 Aplicação do modelo Noisy-OR ao modelo de ACH Em uma análise dos nós da rede Bayesiana da Figura 4, observou-se que alguns nós são constituídos de causadores independentes, o que possibilitou a utilização do modelo Noisy-or binário. Por exemplo, os nós fadiga (Y) referente aos eletricistas E*2 e EA2, apresentam como causadores independentes entre si, as variáveis carga de trabalho (X1), condicionamento físico (X2) e design de equipamentos (X3), as quais possuem as probabilidades p1, p2 e p3 respectivamente de causar Y. As probabilidades p1, p2, p3 e p0 precisam ser eduzidas, enquanto as outras são calculadas de acordo com a equação 2. Estas estão apresentadas nas equações abaixo. p1 p 2 = 1 − (1 − p1 )(1 − p 2 ) Equação 4 p2 p3 = 1 − (1 − p2 )(1 − p3 ) Equação 5 p1 p3 = 1 − (1 − p1 )(1 − p3 ) Equação 6 A tabela 2 mostra a TPC da variável Y. Nestes cálculos, considera-se que o resultado favorável está representado pelo número 0 e o resultado desfavorável está representado pelo número 1. XXXIX SBPO [711] X X X I X SBPO 28 a 31/08/07 Fortaleza, CE A Pesquisa Operacional e o Desenvolvimento Sustentável X1 X2 X3 TPC de Y P (Y = 0 \ X 1 , X 2 , X 3 ) 0 0 0 1 − p0 p0 0 0 1 p3 1 − p3 0 1 0 0 1 1 1 0 0 1 0 1 p1 p3 1 − p1 p3 1 1 0 p1 p 2 1 − p1 p 2 1 1 1 p0 1 − p0 p2 p2 p3 p1 P(Y = 1 \ X 1 , X 2 , X 3 ) 1 − p2 1 − p 2 p3 1 − p1 Tabela 2 – TPC de Y. Este modelo foi aplicado aos nós “fadiga E*2”, “fadiga EA2”, “atenção E*2” e “atenção EA2” da rede Bayesiana mostrada na Figura 4. A fadiga é uma manifestação da carga de trabalho, do design de equipamentos e do condicionamento físico. No contexto deste trabalho, esses causadores são independentes entre si, pois a carga de trabalho não possui uma relação causal com os nós: design de equipamentos e condicionamento físico, ou seja, um eletricista pode estar sob carga de trabalho excessiva independentemente de estar com um condicionamento físico adequado e do design de equipamentos estarem adequados. O condicionamento físico, aqui, está relacionado com o estilo de vida do eletricista (qualidade do sono, exercício físico específico e nutrição). Portanto, a atividade física provinda do trabalho não promove condicionamento físico adequado. Em relação à atenção, esta é uma manifestação dos nós: estado emocional, fadiga e insetos. Percebe-se também, que no contexto deste trabalho, esses causadores são independentes entre si, pois a fadiga não possui uma relação causal com os nós: estado emocional e insetos, ou seja, um eletricista pode estar cansado independentemente de estar bem emocionalmente e da ausência de insetos no local de trabalho. A seção a seguir avalia os custos envolvidos no processo de quantificação de ACH em atividades de manutenção de LTs. 4. Avaliação da redução dos custos envolvidos A aplicação da técnica DPM aos cenários do procedimento de manutenção de LTs possibilitou uma redução de 20 probabilidades em toda rede Bayesiana. Para edução das probabilidades foi aplicado o método Firmino et al (2006). Considerando que este método possui um tempo médio de 5 minutos na aplicação do questionário para eduzir uma probabilidade, o custo correspondente para eduzir estas probabilidades seria de 1 hora e 40 minutos. Em relação ao modelo Noisy-or binário, observa-se claramente que quando se é possível utilizá-lo, o número das probabilidades a serem eduzidas é reduzido. Neste caso, o número de probabilidades foi reduzido em 50%, o que constitui uma diminuição bastante significativa das perguntas a serem eduzidas. No contexto de manutenção de LTs, foi possível aplicar este modelo a 28 parâmetros com três pais cada, o que corresponde a 224 probabilidades. Neste caso, apenas 112 probabilidades foram eduzidas, enquanto as outras foram calculadas conforme seção 3.2. O custo para eduzir 112 probabilidades corresponde a 5 horas. 5. Conclusão Percebe-se que ao aplicar RBs para solucionar problemas práticos, pode-se chegar a altos níveis de detalhamento, elevando-se os custos envolvidos no processo quantitativo de RBs. XXXIX SBPO [712] X X X I X SBPO 28 a 31/08/07 Fortaleza, CE A Pesquisa Operacional e o Desenvolvimento Sustentável Neste caso, torna-se necessário a aplicação de mecanismos que reduzam estes custos. Diante desse contexto, este artigo mostrou que a aplicação da técnica DPM na construção de RBs, bem como a aplicação do modelo Noisy-or binário na quantificação de RBs pode trazer uma redução de custo significativa em relação ao tempo gasto em processos de edução. Referências Droguett, E. L., Groen, F. & Mosleh, A. (2004)- The combined use data and expert estimates in population variability analysis. Reliability Engineering and Systems Safety. Vol. 83, p. 311-321. Firmino, P. R.; Menêzes, R. C., Droguett, E. L. & Duarte, D. L. (2006)- “Eliciting Engineering Judgments in Human Reliability Assessment”. Artigo submetido e aceito para o Annual Reliability & Maintainability Symposium (RAMS) 2006. California – EUA. Hollnagel, E. (1998)- Cognitive Reliability and Error Analysis Method. Elsevier Science. England. Korb, K. B. & Nicholson, A. E. (2003)- Bayesian artificial intelligence. Chapman & Hall/CRC. Florida. Menêzes, R. C. (2005)- Uma metodologia para a Avaliação da Confiabilidade Humana em atividades de substituição de cadeias de isoladores em linhas de transmissão. Engenharia de Produção, Universidade Federal de Pernambuco, Centro de Tecnologia e Geociências. Mosleh, A. & Chang, Y. H. (2004)- Model-based human reliability analysis: prospects and requirements. Reliability Engineering & System Safety. Vol. 83, p. 241-253. Onísko, A., Druzdzel, M. J. & Wasyluk, H. (2001)- Learning Bayesian Network parameters from small data sets: application of Noisy-OR gates. International Journal of Approximate Reasoning. Vol. 27, p. 165-182. Pearl, J. (1988)- Probabilistic Reasoning in Intelligent Systems: Networks of Plausible Inference. 2 ed. Morgan Kaufmann. California. Swain, A D & Guttmann, H. E. (1983)- Handbook of Human Reliability Analysis with Emphasis on Nuclear Power Plant Applications, US Nuclear Regulatory Commission. Washington. XXXIX SBPO [713]