XL SBPO 02 a 05/09/08 João Pessoa, PB A Pesquisa Operacional e o uso racional de recursos hídricos AVALIANDO O DESGASTE DE RODAS DE TRENS UTILIZANDO UM MODELO DE DEGRADAÇÃO SOB O ENFOQUE BAYESIANO Thiago Rezende dos Santos Departamento de Estatística, UFMG Av. Antônio Carlos 6627-Cep 31270-901 – Belo Horizonte – MG [email protected] Marta Afonso Freitas Departamento de Eng. de Produção, Escola de Engenharia, UFMG Av. Antônio Carlos 6627-Cep 30161-970- Caixa Postal 209 – Belo Horizonte - MG [email protected] Enrico Antônio Colosimo Departamento de Estatística, UFMG Av. Antônio Carlos 6627-Cep 31270-901 – Belo Horizonte – MG [email protected] RESUMO A estimação da distribuição do tempo de vida de sistemas e componentes é uma necessidade fundamental para fabricantes e consumidores. No entanto, a obtenção de dados de confibialidade é demorada e de alto custo. Neste contexto, os testes de degradação são uma abordagem alternativa aos testes de tempo de vida e aos testes de vida acelerados em estudos de confiabilidade. A principal vantagem desses testes é que a análise pode ser feita, ainda que não tenha ocorrido uma única falha. Neste trabalho, usamos métodos de inferência bayesiana para estimar os parâmetros de um modelo simples de degradação. Fazemos uma aplicação da metodologia aos dados do desgaste das rodas dos trens. A quilometragem média e mediana são 1.097 mil KM e 1.011 mil KM, para que as rodas estejam fora de operação, respectivamente. PALAVARAS CHAVE: Inferência Bayesiana; Testes de Degradação; Manutenção. ABSTRACT The estimation of the lifetime distribution of systems and components is a necessity for manufacturers and consumers. However, the attainment of the reliability data is time consuming and high cost. In this context, degradation tests are alternative approaches to lifetime tests and accelerated lifetime tests in reliability studies. The main advantage of these tests on others is that the analysis can be done without a single failure. In this work, it is used bayesian methods to estimate the parameters of a simple degradation model. It is presented an application to the real data of concerning the degradation of trains wheels, as an illustration of the methodology. The mean and median consumpion are 1.097 mil KM e 1.011 mil KM for that the wheels to fail, respectively. KEYWORDS. Bayesian inference. Degradation tests. Maintenance. 578 XL SBPO 02 a 05/09/08 João Pessoa, PB A Pesquisa Operacional e o uso racional de recursos hídricos 1. Introdução Uma parte substancial da literatura em Confiabilidade tem como foco o uso de dados de tempo de falha (ou tempo de vida) em estudos nos quais o objetivo é a caracterização da confiabilidade de produtos. Esses dados são oriundos de ensaios de vida. Entretanto para produtos que já têm um alto grau de confiabilidade, é comum estar-se diante da situação em que ao final do ensaio, poucas ou até mesmo nenhuma falha é observada, resultando em um alto índice de censuras. Este quadro também é observado mesmo em situações nas quais ensaios de vida acelerados são implementados. Dados com esta característica (alto índice de censuras) fornecem pouca informação à respeito da proporção de produtos que conseguem operar além do período de garantia estipulado. Recentemente, a literatura tem abordado a utilização de dados de degradação (oriundos de testes de degradação) como uma alternativa aos dados de tempo até a falha (Chiao e Hamada, 1996, 2001; Lu e Meeker, 1993; Lu, Meeker e Escobar, 1996; Tseng ,Hamada e Chiao, 1995; Hamada, 2005) . Nos testes de degradação, a resposta de interesse não é o tempo de falha, mas uma medida de degradação de alguma característica de qualidade do produto de interesse, tomada ao longo do tempo. Esta medida deve estar diretamente relacionada à falha. A justificativa reside no fato de que muitas falhas são o resultado de um mecanismo de degradação em atuação para o qual existem características que se degradam com o tempo. A principal vantagem desses testes sobre os ensaios de vida é que a análise pode ser feita de maneira satisfatória, ainda que não tenha ocorrido uma única falha durante o período estipulado de teste ou observação. A análise de dados deste tipo baseia-se na construção de modelos lineares ou não lineares que expliquem a degradação ao longo do tempo. Tais modelos possuem parâmetros aleatórios cujas distribuições dependem de parâmetros desconhecidos. Métodos de estimação baseados em inferência clássica podem ser empregados para obter estimativas dos parâmetros desconhecidos nos modelos de degradação e, a partir delas, estimar a distribuição do tempo de falha. Dentre os disponíveis na literatura estão o método analítico, numérico e o método aproximado (Meeker e Escobar, 1998). Entretanto, uma outra abordagem natural para o tratamento de tais dados é utilização de métodos Bayesianos através da utilização da informação contida na distribuição a priori dos parâmetros. Hamada (2005) utilizou métodos bayesianos em dados de degradação associados a falhas em equipamentos de laser. Neste trabalho, o nosso objetivo é utilizar métodos bayesianos para estimar os parâmetros de um modelo simples de degradação para os dados do desgaste de rodas de trens e, assim, obter a distribuição do tempo de falha. Para tanto, utilizamos o software WinBUGS (Spiegelhalter et al., 2000), para obtermos uma amostra da distribuição a posteriori dos parâmetros. A vantagem de trabalharmos sob a perspectiva bayesiana nos testes de degradação é que não existe restrição em tomarmos funções dos parâmetros. Este artigo está organizado da seguinte forma. Na Seção 2, apresentamos a situação real que motivou o trabalho. Na Seção 3, apresentamos um modelo simples de degradação e as suposições associadas a ele. Na Seção 4, apresentamos a inferência bayesiana. Os dados referentes ao desgaste das rodas de trens são analisados na Seção 5. A conclusão e considerações finais estão na Seção 6. 2. Desgaste de Rodas de Trens Os dados utilizados neste artigo são parte de uma banco de dados maior que reúne informações referentes a manutenções efetuadas em vagões de trens. As informações aqui utilizadas referem-se ao desgaste das rodas. Cada trem possui quatro vagões sendo que um deles é um vagão máquina que puxa os outros três. Cada vagão tem 4 eixos com duas rodas cada, totalizando 8 rodas por vagão. 579 XL SBPO 02 a 05/09/08 João Pessoa, PB A Pesquisa Operacional e o uso racional de recursos hídricos Neste estudo, 14 trens foram selecionados aleatoriamente de uma frota e o acompanhamento foi feito a cada 50 mil Km. Os dados registrados referem-se ao diâmetro das das rodas dos trens, que possuem um diâmetro inicial de 966 mm. O diâmetro mínimo tolerável é de 889 mm. Neste trabalho, analisamos os dados referentes a uma das rodas do vagão máquina. Por conveniência, trabalhamos com a variável “y= desgaste no tempo t ”definido como sendo “y= 966 mm - diâmetro no tempo t” . Neste caso, a “falha” é atingida quando o desgaste atingir o valor de 77 mm. A variável de degradação de interesse é, então, o desgaste da roda, sendo que uma unidade é considerada como falha quando o nível D f = 77 mm (valor crítico estabelecido) é 40 0 20 desgaste 60 80 atingido. Na Figura 1, mostramos os dados do desgaste das rodas dos trens versus a quilometragem para as 14 rodas em estudo. Observe que somente três unidades falharam até 600 mil KM. Estes perfis sugerem um modelo linear simples (uma reta), sem intercepto. 0 100 200 300 400 500 600 km Figura 1. Gráfico da degradação das rodas de trens. O objetivo é estimar a distribuição do tempo até a falha destas rodas e estimar características de interesse tais como a quilometragem média e o tempo (em Km) no qual 10% das unidades já terão alcançado o nível crítico e deverão ser substituídas. 3. Testes de degradação Como foi dito anteriormente, os testes de degradação são uma abordagem alternativa aos testes de tempo de vida e aos testes de vida acelerados em estudos de confiabilidade. Nos testes de degradação, a resposta de interesse é alguma medida de performance do produto ou componente (resistência à tração, oxidação), obtida ao longo do tempo. O objetivo aqui é estudar a degradação da performance do produto ao longo do tempo e utilizar esta informação para estimar a distribuição do tempo de vida do produto (componente). 580 XL SBPO 02 a 05/09/08 João Pessoa, PB A Pesquisa Operacional e o uso racional de recursos hídricos 3.1. Um Modelo Simples de Degradação Considere o seguinte modelo para a curva de degradação linear começando do valor 0 (Hamada, 2005). Suponha que tenhamos dados a respeito de n unidades experimentais ( no caso do banco de dados do desgaste das rodas, n=14). Para a i-ésima unidade, o valor verdadeiro da degradação é dado por Di (t ) = (1 / θ i )t ; onde o intercepto é zero e inclinação 1 / θ i . Uma unidade é considerada como tendo alcançado a falha quando a degradação atinge o valor crítico D f . Portando, o tempo de falha da i-ésima unidade é encontrado resolvendo D f = (1/ θ i )ti , ou seja Ti = D f θ i . Na prática, os dados de degradação são obtidos ao longo do tempo para cada unidade e estão sujeitos a um erro de medida. Além disso, para que o modelo possa ser capaz de incorporar as diferenças no perfil de degradação existentes de unidade para unidade, o recíproco da taxa de degradação, isto é, o parâmetro θ é considerado aleatório. Isso resulta no seguinte modelo aditivo da degradação observada y ij : y ij = Di (t ij ) + ε ij = (1 / θ i )t ij + ε ij ; em que: • y ij • i = 1,K , n e j = 1, K , mi (1) é a j-ésima medida de degradação obtida no tempo tij para a i-ésima unidade experimental; ε ij representa o erro aleatório associado à observação yij , sendo que assume-se que os ε ij ´s são independentes e identicamente distribuídos segundo uma Normal com média ind . zero e variância σ ε2 , isto é , ε ij ~ N (0, σ ε2 ) , i = 1, K , k e j = 1, K , mi ; • • θi (i = 1,..., n) são independentes e identicamente distribuídos segundo uma distribuição Λ (η ) onde η é o parâmetro desconhecido desta distribuição (pode ser um valor real ou um vetor de parâmetros) e {θ i }e{ε ij } são considerados independentes. Note por exemplo que para o tempo de vida de uma unidade siga uma distribuição de Weibull, é necessário que θi também siga uma distribuição de Weibull. Para tanto, note que se θi no modelo (1) segue uma distribuição Λ ( η) = Weibull ( βθ , λθ ) (i.e. η = ( βθ , λθ )) , com ( )x β exp ⎡ − ( x λθ ) θ ⎤ , é possível demonstrar ⎣ ⎦ que os tempos de vida T seguem uma distribuição Weibull ( βT , λT ) = Weibull ( βθ , D f λθ ) , ou função densidade dada por fθ ( x) = βθ λθ βθ βθ −1 seja, o parâmetro de forma é βT = βθ e o de escala é λT = D f λθ . Note ainda que os dados de degradação para i-ésima unidade provêm informação sobre θ i e σ ε . Portanto, com os dados de degradação para uma amostra de unidades, é preciso obter 2 informação sobre os parâmetros da distribuição de θ i e a variância do erro aleatório σ ε2 . Especificamente no caso exemplificado anteriormente, o vetor de parâmetros desconhecidos (assumindo uma Weibull) é η = ( βθ , λθ , σ ε2 ) . Algumas propriedades do modelo em (1) são necessárias para podermos descrever o tempo de vida de sistemas e componentes. 581 XL SBPO 02 a 05/09/08 João Pessoa, PB A Pesquisa Operacional e o uso racional de recursos hídricos A função de confiabilidade para o modelo em (1) , sob a suposição de que θ i segue uma Weibull ( βθ , λθ ) é dada por: R(t ) = 1 − F (t ) = exp[−(t / D f λθ ) βθ ] , o percentil p × 100% possui a seguinte forma: t p = ( D f λθ )[− ln(1 − p)]1/ βθ . (2) (3) Finalmente, a forma do tempo de vida médio (MTTF) é dada por: MTTF = ( D f λθ )1/ βθ Γ(1 + βθ −1 ) (4) 3.2. Outra distribuição de probabilidade para o parâmetro aleatório Na Seção 3.1 assumimos que θi tem uma distribuição Weibull. Podemos, da mesma forma, considerar outra distribuição para θi e, consequetemente, para T . Outra distribuição bastante utilizada em estudos de confibialidade é a lognormal. Dessa forma, o modelo em (1) com a seguinte alteração θ i ~ log normal ( μθ , σ θ2 ) ; i = 1,K , n , não é difícil mostrar que os tempos de vida ( T ) seguem uma distribuição lognormal com média ln( D f ) + μθ e variância σ θ2 . Logo, a função de confiabilidade é dada por: (5) R (t ) = 1 − F (t ) = Φ{−[ln(t ) − (ln( D f ) + μ θ )] / σ θ } ; onde F (t ) é a distribuição acumulada da v. a. T .O percentil α da distribuição do tempo de vida que possui a seguinte forma: tα = exp{ zα σ θ + ln( D f ) + μθ } . (6) O tempo de vida médio (MTTF) possui a seguinte forma: MTTF = exp{ln(D f ) + μθ + σ θ2 / 2} (7) 4. Inferência Bayesiana Após formularmos o modelo de interesse, o objetivo passa a ser a estimação das quantidades desconhecidas. Neste trabalho, utilizamos métodos bayesianos para atingir tal objetivo. Considere η o nosso vetor de parâmetros desconhecidos. A inferência bayesiana provê uma forma para estimar os parâmetros desconhecidos η e avaliar suas incertezas através dos resultados da distribuição a posteriori. Os componentes básicos da inferência bayesiana são a informação a priori, resumida através da distribuição a priori, π ( η) ; a informação trazida pela amostra de dados, que é resumida utilizando a função de verossimilhança, p ( y | η) ; a distribuição a posteriori π ( η | y ) , que é uma atualização da distribuição a priori pelos dados y, e, em alguns casos, o cálculo da distribuição de futuras observações. O teorema de Bayes fornece a forma da distribuição a posteriori , que é dada por: (8) π ( η | y ) = p (y | η)π ( η) / p ( y | γ )π ( γ )dγ ∫ onde ∫ p(y | γ )π ( γ )dγ corresponde a densidade marginal de y . Para uma explicação mais detalhada ver Zuazola et al. (1996). A seguir, falaremos um pouco sobre estimação pontual, pois, 582 XL SBPO 02 a 05/09/08 João Pessoa, PB A Pesquisa Operacional e o uso racional de recursos hídricos às vezes, não estamos interessados na distribuição a posteriori do parâmetro, mas apenas em um valor que a resuma. 4.1. Estimação Pontual A distribuição a posteriori é toda a informação disponível sobre η após observarmos os dados. Apesar disso, muitas vezes precisamos resumi-la em um único número. Esse número é denominado estimador de Bayes. Seja L ( d ,η ) a perda esperada, em que η é o valor verdadeiro do parâmetro (considerado aqui um escalar) e d são possíveis estimativas de η . O estimador de Bayes para η é o valor η que torna mínima a perda esperada, a posteriori, isto é: ηˆB = min E ( L(η , d ) | y ) = min ∫ L(η , d )π (η | y )dη d d (9) Considerando a função de perda quadrática L(η, d) = (η − d)2 , o estimador de Bayes é dˆ = E (η | y ) , ou seja, a média a posteriori. Devemos ressaltar que diferentes funções de perda geram diferentes estimadores de Bayes e devemos frisar que a escolha da função de perda é completamente subjetiva, a moda a posteriori é o estimador de Bayes quando a função de perda é a 0−1 e a mediana a posteriori é o estimador de Bayes quando a função de perda escolhida é a absoluta (Migon & Gamerman, 1999). Existem também resultados para casos em que o parâmetro η é um vetor. Em particular, no caso da função perda quadrática L( η, d) = ( η − d)t M ( η − d) ( η e d aqui são vetores e M é uma matriz positiva definida) pode ser demonstrado que o estimador de Bayes também é a média a posteriori . Os cálculos para encontrarmos a distribuição a posteriori podem ser muito complicados, dependendo da distribuição dos dados e da distribuição a priori especificada pelo pesquisador. Esse problema foi resolvido com a introdução dos métodos de simulação MCMC (Markov Chain Monte Carlo) (ver Gamerman, 1997; Casella & George, 1992; Chib & Greenberg, 1995) que nos permitem obter uma amostra da distribuição a posteriori, amostrando de uma distribuição de referência ou da própria distribuição condicional completa, sem conhecermos a forma fechada da distribuição a posteriori. Neste trabalho, utilizaremos o software WinBugs (Spiegelhalter et at., 2000) para obtermos a distribuição a posteriori π ( η | y ) . Uma metodologia MCMC utilizada no software WinBugs é o Gibbs Sampler (Geman & Geman, 1984), logo , a seguir, discutiremos um pouco sobre o Amostrador de Gibbs. 4.2. Intervalo de credibilidade Portanto, para um α fixado, qualquer intervalo (t1 , t 2 ) ' satisfazendo t2 ∫ π(η | y)dη = 1 − α (10) t1 é um intervalo de credibilidade 100 .(1 − α )% para η . Em geral, nós desejamos t1 e t 2 tais que t 2 − t1 seja mínimo, mantendo o mesmo nível de cobertura do intervalo. Este intervalo é conhecido na literatura como HPD (High Probability Density). Intervalos de alta densidade de probabilidade. Para maiores detalhes ver Migon & Gamerman (1999). 583 XL SBPO 02 a 05/09/08 João Pessoa, PB A Pesquisa Operacional e o uso racional de recursos hídricos Para calcular o intervalo HPD, utilizamos o pacote Coda (Plummer et at, 2005) intrínseco do software R (R Development Core Team, 2005). 4.3. Amostrador de Gibbs O Gibbs Sampler ou amostrador de Gibbs é uma técnica usada para gerar variáveis aleatórias de uma distribuição marginal indiretamente, sem precisarmos calcular a densidade. Sua idéia inicial foi apresentada por Geman & Geman (1984), mas a forma como o conhecemos hoje foi descrita por Gelfand & Smith (1990). O Gibbs Sampler é essencialmente simples de se implementar e sua metodologia tem causado grande impacto em problemas paramétricos, principalmente no uso de modelos Bayesianos. Ele é baseado nas propriedades elementares das Cadeias de Markov, sendo que a essência desse método, em um sentido assintótico, nos permite extrair uma amostra diretamente da densidade h(η ) tal que: h(η ) = f (η ) / ∫ f (η ) dη , (11) sem a necessidade de resolvermos a integral. O Gibbs Sampler é restrito a problemas onde as distribuições condicionais a posteriori são disponíveis, ou seja, a geração de variáveis aleatórias dessas distribuições é possível. O método Gibbs Sampler é muito útil em situações multidimensionais e quando temos mais de um parâmetro, por exemplo, na distribuição normal. Não descreveremos aqui detalhadamente a metodologia do Gibbs Sampler. Maiores detalhes podem ser obtidos em Casella & George (1992). A convergência da cadeia para uma distribuição estacionária é um tópico delicado e um tanto quanto controverso na literatura. Aqui apenas lançaremos mão de técnicas informais gráficas para a verificação da cadeia. Porém, há várias técnicas formais de diagnóstico da convergência da cadeia tais como Geweke (1992) e Raftery (1992), que não serão abordados neste trabalho. Para detectar o período de burn-in, usamos gráficos como a média ergódica e funções de autocorrelação. No gráfico da média ergódica, quando não houver variabilidade significativa, houve convergência. Já no gráfico de autocorrelações, quando não houver autocorrelações significativas, houve a convergência. Além disso, construímos histogramas e a densidade de Kernel para a amostra obtida da distribuição a posteriori. Esses gráficos estão disponíveis no software WinBugs (Spiegelhalter et at., 2000). 5. Análise dos dados de desgaste das rodas Dado o modelo yij = Di (t ) = 1 θi tij + ε ij i ( i = 1,K , n ), j = 1, K , mi (12) o primeiro passo é tentar identificar a distribuição mais adequada para o parâmetro aleatório θ . Essa investigação será feita de maneira indireta e os passos são descritos a seguir. 1) ajustar o modelo yij = 1 θi tij + ε ij , separadamente para cada unidade i ( i = 1,K , n ), e obter a estimativa de θi ( θˆi ) pelo método de mínimos quadrados; 2) calcular os “pseudo tempos de falha” substituindo cada valor θˆi na equação do modelo. Em 584 XL SBPO 02 a 05/09/08 João Pessoa, PB A Pesquisa Operacional e o uso racional de recursos hídricos outras palavras, para cada unidade i ( i = 1,K , n ), resolver a equação t̂ i = D f θˆ i = 77 θˆ i . 3) analisar os “pseudo tempos de falha” e identificar a distribuição de probabilidade que melhor se ajusta a estes dados. A Figura 2 apresenta os gráficos de probabilidade para os pseudo tempos de falha (14 valores) encontrados com base no modelo (12). Os gráficos foram construídos no software estatístico Minitab (v. 15). As distribuições Weibull e log-normal mostram-se adequadas para esses dados. Figura 2. Gráfico da aderência das distribuições. Tendo em vista que tanto a distribuição de Weibull como a log-normal mostraram-se adequadas aos pseudo tempos de falha, dois modelos foram considerados para o estudo do desgaste das rodas: ¾ Modelo 1: y ij = Di (t ij ) + ε ij = (1 / θ i )t ij + ε ij ; θi ~ weibull ( βθ , λθ ) , logo, yij | θ = θi ~ N ((1/ θi )tij , σ ε2 ) para i = 1, K ,14 e j = 1, K ,12 . Neste caso, as seguintes distribuições a priori foram consideradas: βθ ~ Gama(0, 01;0, 01), λθ ~ Gama(0, 01;0, 01), σ ε2 ~ GamaInversa(0, 01; 0, 01). A escolha da distribuição Weibull para o parâmetro θ é justificada pela discussão apresentada nas Seções 3.1 e 3.2. Em outras palavras, para que os tempos de falha possam seguir a distribução de Weibull (identificada através da análise dos pseudo tempos de falha), o parâmetro θ também deve seguir uma distribuição de Weibull. As distribuições a priori do tipo Gama foram escolhidas para βθ e λθ porque estas quantidades são positivas. A variância do erro σ ε2 também é uma quantidade positiva, mas a literatura Bayesiana indica a utilização de Gama inversa como priori para este tipo de parâmetro. Consequentemente, a distribuição a priori para o recíproco de σ ε2 também tem distribuição Gama. Além disso, tanto para a distribuição Gamma como para a Gama inversa, escolhemos valores de parâmetros (0,01) que as tornam “achatadas” (“não-informativas”). 585 XL SBPO 02 a 05/09/08 João Pessoa, PB A Pesquisa Operacional e o uso racional de recursos hídricos ¾ Modelo 2 : y ij = Di (t ij ) + ε ij = (1 / θ i )t ij + ε ij com θ i ~ log normal ( μθ , σ θ2 ) com as seguintes distribuições a priori: μθ ~ Normal (0;100), σ θ2 ~ GamaInversa (0, 02;0, 02), σ ε2 ~ GamaInvertida (0, 01;0, 01). Valem aqui as mesmas justificativas do modelo 1. A distribuição a posteriori em (8) é obtida via MCMC, usando o software WinBugs (Spiegelhalter et at., 2000). Consideramos uma amostra de 102.000 das quais retiramos as 2.000 primeiras (burn-in). As retiradas são feitas de 500 em 500 amostras. Os resultados obtidos com as distribuições Weibull e log-normal estão nas Tabelas 1 e 2 respectivamente. Na Tabela 1, note que a probabilidade de uma roda sobreviver a mais de 300 mil Km é de 0,92 e que a quilometragem necessária para que 10% das rodas estejam fora de operação é 382,80 mil KM. Um intervalo de credibilidade percentílico de 95% para R(300) e t 0,1 é dado por [0,80;0,98] e [163,65 mil Km; 624,66 mil KM], respectivamente. Apresentamos também o intervalo HPD com probabilidade de 95%. Tabela 1: Estimativas dos parâmetros e das quantidades de interesse, considerando a distribuição de Weibull Média Mediana DP Q 2,5% λθ δθ σε 0,01 0,01 0,01 0,00 0,00 0,04 0,03 1,95 1,93 0,41 1,22 1,18 2,80 2,75 0,99 0,99 0,06 0,88 0,88 1,11 1,11 MTTF 1097,00 1083,00 172,13 800,84 772,21 1473,13 1433,46 t 0,1 382,80 378,90 118,79 163,65 151,86 624,66 611,34 t 0,5 1011,00 1006,00 170,75 688,85 679,88 1361,00 1349,66 0,93 0,05 0,80 0,82 0,98 0,99 R(300*) 0,92 *Nota: 300 mil KM. HPD Linf Q 97,5% HPD Lsup Tabela 2: Estimativas dos parâmetros e das quantidades de interesse, considerando a Distribuição Log-normal Média Mediana DP Q 2,5% HPD Linf Q 97,5% HPD Lsup μθ σθ σε 2,46 2,46 0,18 2,10 2,08 2,81 2,81 0,65 0,62 0,14 0,44 0,41 0,98 0,92 0,99 0,99 0,06 0,88 0,88 1,11 1,11 MTTF 1147,00 1101,00 264,13 796,86 741,67 1776,64 1647,80 t 0,1 405,60 405,90 94,01 220,39 216,15 589,28 584,85 t 0,5 916,10 901,30 163,98 636,39 606,56 1264,10 1242,41 R(300*) 0,95 0,96 0,05 0,82 0,86 0,99 1,00 *Nota: 300 mil KM. No caso da utilização da distribuição log-normal, 10% das rodas estarão fora de 586 XL SBPO 02 a 05/09/08 João Pessoa, PB A Pesquisa Operacional e o uso racional de recursos hídricos operação com 405,60 mil Km ( int. de credib [216,15 mil Km ; 584,85 mil Km]). A probabilidade das rodas operarem por mais de 300 mil km é 0,95. O valor da estatística DIC (Deviance Information Criterion) (ver Spiegelhalter et at, 2002) para o modelo Weibull e log-normal é 6.309,27 e 6.309,50, respectivamente. Isso mostra que o ajuste de ambos os modelos são similares, tendo o modelo Weibull com uma performance ligeiramente melhor. Abaixo apresentamos o histograma do MTTF, R(300) e t 0,1 para o modelo onde θ tem Frequency 20000 Frequency 0.5 0.6 0.7 0.8 R(300) 0.9 1.0 0 0 0 10000 5000 5000 10000 Frequency 10000 30000 15000 40000 15000 20000 dist. Weibull (Figura 3) e lognormal (Figura 4). A distribuição de R(300) é bem assimétrica em ambas as figuras. 0 200 400 600 t0.1 KM(mil) 800 500 1500 2500 tempo médio KM(mil) Figura 3. Histograma de R(300) e t 0,1 e Tempo Médio Modelo Weibull. 587 XL SBPO 02 a 05/09/08 João Pessoa, PB 50000 20000 0 Frequency A Pesquisa Operacional e o uso racional de recursos hídricos 0.5 0.6 0.7 0.8 0.9 1.0 15000 5000 0 Frequency R(300) 0 200 400 600 800 50000 20000 0 Frequency t0.1 KM(mil) 1000 2000 3000 4000 5000 6000 tempo médio KM(mil) Figura 4. Histograma de R(300) e t 0,1 e Tempo Médio Modelo Lognormal. Lançamos mão apenas de métodos informais de verificação da convergência da cadeia. A convergência da cadeia para distribuição a posteriori alvo dos parâmetros foi verificada para os dois modelos considerados neste estudo. A amostra da distribuição a posteriori de βθ , λθ e σ ε , para o modelo weibull, e μθ , σ θ e σ ε , para o modelo lognormal, possuem baixas autocorrelações e convergiram para um determinado valor após o período de burn-in. 6. Conclusão e Considerações finais Como já havíamos dito, os testes de degradação são uma abordagem alternativa aos testes de tempo de vida e aos testes de vida acelerados em estudos de confiabilidade. A principal vantagem desses testes sobre os outros é que a análise pode ser feita, ainda que não tenha ocorrido uma única falha. A condição para que a análise seja implementada é que a variável de degradação que está sendo mensurada tenha relação com o mecanismo de falha. Fazer inferência bayesiana sobre os parâmetros de um simples modelo de degradação para os dados do desgaste das rodas de trens foi o objetivo principal do trabalho. O teste de degradação se ajustou perfeitamente para esses dados, haja vista que tínhamos poucas falhas. A quilometragem média e mediana é de 1.097 mil KM e 1.011 mil KM (sendo o estimador de Bayes a média), para que as rodas estejam fora de operação, respectivamente. A probabilidade de uma roda sobreviver a mais de 300 mil KM é de 0,93 com intervalo de credibilidade HPD de 95% de [0,82;0,99]. Avaliando a estatística DIC, não houve uma diferença significativa entre o ajuste dos dois modelos considerados (Weibull e lognormal). Os resultados das quantidades de interesse são similares em ambos os modelos. Para um trabalho futuro, poderíamos analisar os dados das outras rodas da degradação das rodas dos trens separadamente e conjuntamente e também comparar os testes de degradação com os outros métodos. 588 XL SBPO 02 a 05/09/08 João Pessoa, PB A Pesquisa Operacional e o uso racional de recursos hídricos Referências Bibliográficas Casella, G. & George, E. I. (1992), Explaining the gibbs sampler, The American Statistician 46(3), 167–174. Chiao, C.H. & Hamada, M. (1996). Using Degradation Data from an Experiment to Achieve Robust Reliability for Light Emitting Diodes. Quality And Reliability Engineering International 12, 89-94. Chiao, C.H. & Hamada, M. (2000). Experiments with Degradation Data for Improving Reliability and for Achieving Robust Reliability . Quality And Reliability Engineering International 17, 333-344. Chib, S. & Greenberg, E. (1995). Understanding The Metropolis-Hasting Algorithm. The American Statistician, Vol. 49, Nº 4. Gamerman, D. (1997). Markov Chain Monte Carlo. Sthocastic simulation for Bayesian inference. Texts in Statistical Science. Chapman & Hall. Gelfand, A. E. & Smith, A. F. M. (1990), Sampling-based approaches to calculating marginal densities, Journal of the American Statistical Association 85, 398–409. Gelman, A.(1996). Inference and monitoring convergence. In: W.R. Gilks et al. (ed.). Markov Chain Monte Carlo in Practice. London, Chapman & Hall. Geweke, J. (1992), Evaluating the accuracy of sampling-based approaches to calculating posterior moments, in A. D. J. Bernado, J. Berger & A. Smith, eds, ‘Bayesian Statistics 4’, University Press, Oxford, 169-193. Gilks, W.R. et al.(1996). Introducing Markov Chain Monte Carlo. In:W.R. Gilks et al. (ed.). Markov Chain Monte Carlo in Practice. London, Chapman & Hall. Hamada, M.(2005). Using Degradation Data to Assess Reliability.Quality Engineering, 17:615620. Lu, C.J. & Meeker, W.Q. (1993).Using Degradation Measurements to Estimate a Time-toFailure Distribution. Technometrics,35: 161-174. Lu, C.J., Meeker, W.Q. & Escobar, L.A. (1996).Using Degradation Measurements to Estimate a Time-to-Failure Distribution. Statistica Sinica, 6: 531-546. Meeker, W. & Escobar, L. A. (1998).Statistical Methods for Reliability Data.Wiley Series in Probability and Statistics. Migon, H.S. & Gamerman, D. (1999). Statistical Inference: An Integrated Approach. Londres, Arnold. Plummer, M., Best, N., Cowles, K. & Vines, K. (2005). Output analysis and diagnostics for MCMC. The Coda Package. Software R. Avaliable at http://www.fis.iarc.fr/coda/ Raftery, A.E. & Lewis, S.M.(1996). Implementing MCMC. In: W.R. Gilks et al. (ed.). Markov Chain Monte Carlo in Practice. London, Chapman & Hall. R Development Core Team. (2005). R: A language and environment for statistical computing, R Foundation for Statistical Computing, Vienna, Austria. Spiegelhalter, D. J., Best, N. G., Carlin, B.P. and van der Linde, A. (2002). Bayesian measures of model complexity and fit (with discussion and rejoinder). Journal of the Royal Statistical Society, Series B, 64, 583-639. Spiegelhalter, D., Thomas, A., Best, N. (2000). WinBUGS Version 1.3 User Manual, avaliable at http://www.mrc-bsu.cam.ac.uk/bugs/. Tseng, S.T., Hamada, M. & Chiao, C.H. (1995). Using degradation data from a factorial experiment to improve fluorescent lamp reliability. Journal of Quality Technology, 27: 363-369. Zuazola, I. P. L., da Silva, A. J. & Valle, R. B. A. (1996), Bayesian inference in errors in variables models under elliptical distribution, 12 SINAPE Anais. 589