APLICAÇÃO DA SIMULAÇÃO DE TEORIA DE FILAS NOS ESTUDOS DE
CONFIABILIDADE E OTIMIZAÇÃO DE EQUIPES DE MANUTENÇÃO
Alexandre Cottini Mendes (1)
Resumo
O trabalho técnico demonstra uma analogia entre a teoria de filas, modelo de
simulação probabilística usado para estudar e resolver problemas logísticos e
os processos de engenharia de planejamento e confiabilidade da manutenção.
A teoria de filas simula variáveis como tempos médios de espera em fila, de
atendimento e entre chegadas em fila. É aplicada no estudo de filas em portos,
terminais viários, aeroportos, logística industrial e outros sistemas complexos.
Transportando-se as variáveis e distribuições da logística para o contexto da
manutenção desenvolve-se uma analogia entre os tempos médios entre chegadas em fila e de atendimento com os tempos médios entre falhas (MTBF) e
tempo médio para reparos (MTTR) na manutenção. São também análogos o
tempo de fila ao Back Log aos parâmetros das distribuições às taxas de falhas.
Com auxílio de planilhas eletrônicas automatizadas e de um software específico de logística (ARENA 7.0), foi possível determinar um modelo para a definição de parâmetros probabilísticos de confiabilidade (MTTR e MTBF), taxas de
falhas além de simulação de eficiência de equipes de manutenção.
1 – O desenvolvimento da confiabilidade na manutenção
A função manutenção está a cada sendo mais gerenciada pelas empresas como uma forma de aumentar sua rentabilidade, diminuindo-se o uso de recursos
e aumentando-se a produtividade das instalações.
Pode-se definir a função manutenção nas empresas não mais como a função
responsável apenas por consertar equipamentos reativamente após uma falha,
mas sim como responsável por manter a disponibilidade e a confiabilidade dos
equipamentos pro ativamente, com uso otimizado de recursos, ou seja, a manutenção hoje busca a melhor relação eficiência x custo. Como eficiência, entende-se confiabilidade, disponibilidade e produtividade das instalações.
Para que essa relação ótima de eficiência x custo seja atingia, várias disciplinas foram se desenvolvendo na área de Engenharia de Manutenção, incluindose inúmeros avanços nos processos de manutenção, migrando-se de culturas
corretivas para preventivas, com adoção de metodologias de gerenciamento,
planejamento e controle da manutenção e com adoção de técnicas avançadas
(1) Engenheiro de Manutenção - Siemens
Graduado e Mestrando em Engenharia Mecânica pela Politécnica – USP.
MBA em Economia pela FIPE – USP.
Certificado como PMP pelo Project Management Institute.
de controle de disponibilidade, produtividade e principalmente, confiabilidade
de equipamentos.
De uma forma genérica, a confiabilidade está associada com a operação de um
equipamento com sucesso, ou seja, que ele execute as funcionalidades para
qual foi projetado por um período de tempo sem apresentar falhas.
A confiabilidade em projetos de sistemas complexos passou a ser desenvolvida
durante a segunda grande guerra mundial, quando os conceitos de estatística e
probabilidades já estavam plenamente consolidados e a indústria bélica passou
a usá-los para calcular a estimativa de vida e a probabilidade de sucesso na
operação de um equipamento.
De acordo com o prof. Dr. Gilberto Souza, um dos exemplos clássicos de aplicação da confiabilidade no desenvolvimento de projetos é a modelagem da
confiabilidade do sistema direcional das bombas atômicas V1 e V2 empregadas pela Alemanha, visando à redução de sua probabilidade de falha. A partir
daí a indústria aeroespacial passou a adotar tais conceitos em seus projetos.
Descendente deste processo, a confiabilidade foi inserida na manutenção através da indústria aeronáutica.
A aviação comercial na década de 50 tinha uma taxa de acidentes maior do
que 60 acidentes por milhão de decolagens. Se esta taxa fosse mantida atualmente, haveria uma média de mais de 2 acidentes com aviões comerciais de
grande porte, em algum lugar do mundo, todos os dias. Dados nos mostram
que cerca de 70% destes acidentes foram causados por falhas nos equipamentos.
Houve então, com o rápido crescimento do setor aéreo, a necessidade de uma
drástica mudança em relação à segurança. E devido à alta taxa de falhas constatada, o trabalho iniciou-se com foco em confiabilidade das aeronaves.
Nos anos 50, “manutenção” significava apenas revisões periódicas quando os
equipamentos apresentavam falhas. Quando isto pareceu não funcionar adequadamente, todos supuseram estar fazendo as revisões muito tarde: depois
que o desgaste já havia começado. Foi então reduzido o tempo médio entre as
revisões. Foi percebido então pelos engenheiros que essa metodologia era não
só ineficiente como extremamente cara.
Houve então a transformação de um processo tradicional para um processo
analítico e estruturado que transformou a aviação em um negócio que oferecia
mais segurança. Essa foi a base para o desenvolvimento de uma metodologia
de gerenciamento da manutenção baseada na confiabilidade dos equipamentos, desenvolvida entre as décadas de 60 e 70, e que ficou conhecida como
RCM, ou Reliability Centered Maintenance, nome do livro publicado pelos seus
criadores, dois funcionários da United Airlines chamados Stanley Nowlan e
Howard Heap.
O livro Reliability Centered Maintenance resultou de aproximadamente vinte
anos de pesquisa e testes na área da manutenção da indústria da aviação comercial americana.
Além de culminar na publicação do livro, durante o andamento do processo
publicaram-se em 1968 e 1972, respectivamente os documentos MSG-1, Manual: Avaliação de Manutenção e Desenvolvimento de Programa, e MSG-2,
Documento de Planejamento de Programa de Manutenção para Companhias
Aéreas/Fabricantes de Aviões – ambos publicados pela ATA - Air Transport
Association of America (Associação do Transporte Aéreo da América).
Mais recentemente, em 1980, a ATA introduziu o MSG-3, Documento de Desenvolvimento de Programa de Manutenção para Companhias Aéreas/Fabricantes de Aviões, que foi influenciado pelo livro de 1978 de Nowlan e
Heap, mas tinha o propósito de continuar a tradição iniciada pelos documentos
MSG anteriores. O MSG-3 é o documento que orienta o desenvolvimento de
programas iniciais de manutenção programada para os novos aviões comerciais norte-americanos até hoje.
Após o desenvolvimento do livro de Nowlan e Heap, a abordagem começou a
ser desenvolvida e adaptada em outras áreas e negócios. O Departamento de
Defesa norte-americano foi o pioneiro em adaptar a metodologia do RCM para
seus processos para buscar uma forma menos custosa de se gerenciar a manutenção.
Em paralelo, o EPRI - Electric Power Research Institute (Instituto de Pesquisa
em Energia Elétrica), desenvolveu duas aplicações de RCM na indústria de
energia nuclear norte-americana. Essa metodologia foi então adotada generalizadamente pelo segmento de energia nuclear norte-americana em 1987, e variações dessa abordagem foram subseqüentemente adotadas por várias outras
usinas nucleares, por outros ramos do segmento de geração e distribuição de
energia elétrica e por partes da indústria petroleira.
A partir daí se desenvolveu generalizadamente para outras áreas industriais,
ganhando até status de negócio com diferentes adaptações e marcas comerciais para os processos de RCM. Porém alguns setores da indústria, receosos de
que a metodologia se perdesse em seu foco com as adaptações comerciais
nem sempre baseadas no tema confiabilidade, levantaram a necessidade de se
criar um padrão para a metodologia. E a SAE, Society of Automotive Engineers, criou o seu padrão.
O Padrão SAE JA1011 (de agosto de 1999) estabelece alguns pontos fundamentais, de maneira que qualquer processo RCM deverá assegurar que todas
as seguintes perguntas sejam respondidas satisfatoriamente e na seqüência
mostrada abaixo:
1. Quais são as funções e padrões de desempenho associados desejados
do ativo em seu contexto de operação atual? (funções)
2. De que formas ele pode falhar em preencher as suas funções (falhas
funcionais)?
3. O que causa cada falha funcional? (modos de falha)
4. O que acontece quando cada falha ocorre? (efeitos da falha)
5. De que modo cada falha importa? (conseqüências da falha)
6. O que deve ser feito para predizer ou prevenir cada falha (tarefas próativas e intervalos das tarefas)?
7. O que deve ser feito caso uma tarefa pró-ativa adequada não possa ser
encontrada (ações padrão)?
Essa metodologia garante que o contexto operacional do equipamento seja
claramente definido antes de se iniciar a aplicação destas questões. Garantese também sejam identificadas as funções do equipamento/sistema em estudo
devem ser identificadas, os estados de falhas associados e os modos de falha
prováveis de causar cada falha funcional.
Levantam-se então os efeitos das falhas com informações necessárias para
suportar decisões de ações preventivas e planos de emergência.
Qualquer fórmula estatística ou matemática utilizada na aplicação do processo,
especialmente as de cálculo de intervalos de tarefas, devem ser logicamente
consistentes e devem estar disponíveis e aprovadas pelos usuários do equipamento/sistema em estudo.
Portanto, a norma define que se a metodologia utilizada não atender no mínimo
a estes requisitos, trata-se de uma outra metodologia, que não pode ser denominada RCM.
Assim a confiabilidade tornou-se cada vez mais presente na manutenção de
alta tecnologia, e tem a tendência de ser cada vez mais utilizada na manutenção industrial geral.
Mas questões importantes sobre este processo são:
•
•
Definido o processo, como medir se ele influi num aumento da confiabilidade na minha planta?
Medida a confiabilidade teoricamente, como posso usar estes valores na
prática para retro alimentar meu processo e definir oportunidades de melhoria de performance e custos?
São basicamente estas duas questões que este trabalho busca responder.
1.1 – A Caracterização da confiabilidade
A definição de confiabilidade do US Military Handbook, de 1970 diz que confiabilidade é “a probabilidade de um item executar sua função sob condições prédefinidas de uso e manutenção por um período de tempo específico”.
Qualquer definição de confiabilidade que se encontra nas referências importantes sobre o assunto tem os seguintes parâmetros em comum:
•
•
•
•
Desempenho específico é esperado (funcionalidade),
Condições de uso determinados,
Período de tempo definido,
Grandeza estatística.
Definindo-se a variável aleatória t, como o tempo até ocorrer a falha, temos a
função densidade de probabilidade de ocorrência de falha f(t). Assim sendo, a
probabilidade de falha e um intervalo de tempo específico é definida por:
f (t ) ⋅ ∆t = P{t < t < t + ∆t
}
Integrando-se f(t), chega-se à função de probabilidade acumulada F(t), que é a
probabilidade de uma falha ocorrer até o tempo t:
F (t ) = P{t < t}
Essa função é crescente com o tempo e tende a um valor unitário quando o
tempo tende ao infinito, ou seja, quanto maior o tempo decorrido, maior a probabilidade de falha, conforme indicado na figura a seguir.
1,0
F(t)
0,0
80
t
I – Função de probabilidade acumulada F(t) x tempo
Conforme a definição de confiabilidade, há dois estados para um equipamento,
o estado de operação regular e o estado de falha, que são mutuamente excludentes, então se pode definir a função confiabilidade R(t) como:
R (t ) = P{t > t}
ou seja, define-se confiabilidade como a função complementar à probabilidade
de falha:
R(t ) = 1 − F (t )
1,0
R(t)
0,0
80
t
II – Função de confiabilidade
A partir das definições e do gráfico da figura II, verifica-se que a confiabilidade
decai ao longo do tempo e o único instante em que a confiabilidade é 100% é o
instante em que o equipamento é colocado em operação.
Verifica-se também que a confiabilidade não pode ser restaurada, ou seja, não
dá saltos ao longo de sua vida operacional.
Assim a vida útil de um equipamento é determinada com o instante em que o
mesmo atinge um determinado nível de confiabilidade, que é determinado no
seu projeto.
Para exemplificar, em elementos estruturais críticos de navios, exige-se confiabilidade superior a 99,9968% em relação a falhas por fadiga. Em aeronaves,
alguns sistemas vitais tem exigência de probabilidade de falha inferior a 10-7.
Na engenharia de manutenção baseada em confiabilidade é de suma importância controlar-se a confiabilidade. Para o controle da confiabilidade exige-se
a adoção de medidas de confiabilidade. A medida que nos permite calcular os
valores de confiabilidade advém da taxa de falhas. Para o caso apresentado
neste texto, é importantíssimo entender o conceito de taxa de falha, representado por λ(t).
A taxa de falhas é a probabilidade de um sistema falhar num instante de tempo
t, dado que ainda não falhou até um instante de tempo t – ∆t, ou seja, λ(t) expressa a taxa de falha instantânea.
A taxa de falhas é calculada por:
λ (t ) =
f (t )
R(t )
O comportamento da taxa de falha em relação ao tempo é representado pela
conhecida curva da banheira, conforme a seguir, que representa graficamente
esta relação para um sistema simples sem redundância.
λ(t)
I
II
III
0,0
t
III – Representação da curva da banheira
Na representação acima, o intervalo de tempo indicado por I é uma região de
altas taxas de falha, chamada de mortalidade infantil, normalmente relacionados a problemas de fabricação, montagem ou mesmo de material.
O intervalo de tempo II, indica as mais constantes e menores taxas de falha e é
preferencialmente o período de operação do sistema. As falhas nesta fase, denominadas aleatórias, decorrem muito mais de carregamentos inesperados e
inevitáveis do que falhas inerentes ao equipamento.
Na região III, a taxa de falha é crescente e as causas de falha tem origem no
próprio desgaste do sistema, na fase final de sua vida útil, relacionadas a corrosão, fadiga, atrito, e outros fenômenos. O aumento rápido desta taxa fundamenta o critério de quando uma peça deve ser trocada e determinando o final
de sua vida útil.
Esta curva da banheira representada é considerada genérica, pois para cada
tipo de equipamento ou sistema, temos uma curva característica.
Por exemplo para sistemas eletro-eletrônicos, a curva apresenta tipicamente as
regiões I e II, ou seja , há mortalidade infantil e os mesmos apresentam taxa de
falha aleatória, sem apresentar características de envelhecimento.
Já para sistemas mecânicos pode-se afirmar que a variação temporal de sua
taxa de falha apresenta as regiões I e III, sendo que os elementos mecânicos
têm como característica falharem normalmente por desgaste, corrosão ou fadiga.
É coerente então afirmar que a natureza da variação temporal da taxa de falha
de um sistema provém da distribuição probabilística na qual pode ser modelado
o sistema, ou seja, para cada tipo de equipamentos ou sistema, pode-se modelar a confiabilidade a partir de uma distribuição diferente. A próxima seção discute brevemente algumas dessas distribuições, mais utilizadas neste tipo de
estudos.
1.1.1 – A distribuição normal
A distribuição normal é caracterizada por 2 parâmetros: a média da população
(mx) e o desvio padrão da população (σx). Esses dois parâmetros devem ser
conhecidos para que se tenha a completa definição da função de distribuição
acumulada, que na confiabilidade é a função probabilidade de falha, conforme
a seguir:
F (x ) =
x
∫
−∞
 1x−m
x
. exp − 
2.π .σ x
 2  σ x
1



2

.dx

A função densidade de probabilidade e a função de probabilidade acumulada
apresentam da normal apresentam respectivamente os seguintes formatos:
F(x)
f(x)
0,0
1,0
0,0
IV – Representação da distribuição normal
A função normal é simétrica e centrada na própria média da população, sendo
que 50% da distribuição está a esquerda da média e 50% a direita.
As caudas da distribuição, região de interesse para a análise de confiabilidade
localiza-se próximo às “caudas” do gráfico, região na qual qualquer variação
nos dados experimentais tem enorme influência na análise da probabilidade, e
consequentemente de confiabilidade. Esta distribuição é comumente usada
para representar erros de medição, variabilidade dimensional e propriedades
mecânicas de materiais.
1.1.2 – Distribuição exponencial
A distribuição exponencial tem apenas um parâmetro (λ) que é chamado de
taxa de ocorrência de eventos, o que no caso de confiabilidade é denominado
taxa de falhas.
A função acumulada de probabilidade da distribuição exponencial é dada por:
F (x ) = 1 − e −λ . x
Tomando-se a fórmula acima para o contexto da probabilidade, sendo R(t ) = 1 − F (t ) , teríamos a função confiabilidade para um sistema que possa
ser modelado como uma distribuição exponencial dado pela seguinte equação:
R(x ) = e − λ . x
A função densidade de probabilidade e a função de probabilidade acumulada
apresentam da distribuição exponencial apresentam respectivamente os seguintes formatos:
f(x)
F(x)
1,0
0,0
0,0
V – Representação da distribuição exponencial
A distribuição exponencial é bem aplicada na representação de equipamentos
que apresentam taxas de falhas aleatórias, como o exemplo de componentes
eletro-eletrônicos.
1.1.3 – Distribuição de Weibull
Esta distribuição foi proposta pelo Sueco Weibull, em 1951 e tem como característica a sua definição por 3 parâmetros, tornando-a bastante flexível, sendo
então possível modelar uma grande variedade de fenômenos. Daí o fato desta
curva ser muito utilizada em referências sobre confiabilidade.
A sua função densidade de probabilidade é dada por:
β  x − x0 

f ( x ) = .
η  η 
β −1
 x−x
0
. exp − 
η
 



β



onde x0 é a constante de localização, que define a origem da função densidade
de probabilidade, η é a constante de escala que define o espalhamento da distribuição ao longo do eixo x e β é a constante de forma.
A distribuição de Weibull tem a adaptabilidade como principal característica e
os seguintes dados são apresentados:
a.
b.
c.
d.
Para β < 1, a função f(x) é decrescente,
Para β = 1, a distribuição de Weibull é a própria distribuição exponencial,
Para β > 1, a curva f(x) apresenta picos bem definidos,
Para β = 3,44 a distribuição de Weibull toma a forma da normal.
Em função desta versatilidade a função de Weibull pode ser utilizada nos estudos da confiabilidade de vários sistemas.
Os dois principais parâmetros para se determinar o nível de confiabilidade de
um equipamento ou sistema são a taxa de falhas λ e o tempo médio entre falhas, também conhecido como MTBF, que é exatamente o valor médio da distribuição usada no estudo efetuado.
Outro indicador que será usado neste trabalho é o tempo médio para reparo,
ou MTTR.
2 – A teoria de filas
A teoria de filas é um modelo de simulação proveniente da pesquisa operacional que modela probabilisticamente os sistemas clientes / fila / servidor, conforme esquematizado na figura a seguir.
Servidor
Saída
Chegada
de
clientes
Clientes em fila
VI - Esquematização do sistema clientes / fila / servidor
De acordo com Rui Botter, fila é definida como “a espera de pessoas, veículos
ou qualquer outro elemento (clientes), que ao buscarem serviço num ou em
vários postos de atendimento (servidores), não podem ser atendidos no momento que chegam, pois todos os postos disponíveis estão ocupados”.
A teoria de filas se ocupa com a elaboração e solução de modelos matemáticos
que representem os processos de fila, com a finalidade de obter estimativas de
boa qualidade para parâmetros importantes do processo, tais como tempo médio de espera, tempo médio de permanência no sistema, número médio de elementos no sistema e na fila, e outras características menos agregadas, como
distribuição do tempo de espera e distribuição do número de clientes no sistema.
Com essas estimativas podem-se dimensionar as filas e os postos de atendimento (servidores) como em sistemas como aeroportos, terminais portuários,
agências bancárias, sistemas de logística industrial e de distribuição e os mais
diversos sistemas que apresentam o formato clientes / fila / servidor.
É importante que sejam conhecidas duas características intrínsecas a esta teoria. A primeira é que o modelo não é um método de otimização e sim uma po-
derosa ferramenta de simulação, ou seja, os resultados apresentados nem
sempre são definitivos e nem mesmo a melhor e mais barata solução. A segunda característica é o fato de que os valores de intervalos de tempo são apresentados por um valor médio, ou seja, são extraídos de uma distribuição
probabilística que deve adaptar-se o mais verossimilmente possível ao sistema
estudado para que os resultados sejam confiáveis.
2.1 – Determinação dos parâmetros do sistema
O primeiro passo para se estudar um sistema cliente servidor, é definir os seus
elementos, parâmetros, distribuições e variáveis envolvidas.
Para isso definem-se individualmente os elementos do sistema:
Cliente – Elementos principais do sistema, sobre os quais os tempos são medidos. Seu principal parâmetro é o tempo médio entre chegadas, simbolizado
pela letra grega λ. Esse tempo médio é extraído da distribuição de probabilidades do tempo entre chegadas do elemento cliente.
Servidor – Elemento que processa o atendimento do elemento cliente. Seu
principal parâmetro é o tempo médio de atendimento, simbolizado pela letra
grega µ. Esse tempo médio é extraído da distribuição de probabilidades dos
tempos de atendimento ao cliente.
Fila – Espera dos clientes que buscam atendimento nos servidores e não podem ser atendidos imediatamente porque todos os servidores estão ocupados.
Os principais parâmetros da fila são o tempo médio de espera em fila, o tempo
máximo de espera em fila, o número médio de clientes em fila e o número máximo de clientes em fila.
Para identificação rápida dos elementos, foi proposto por Kendall Lee uma notação que indica resumidamente os parâmetros do sistema. Essa notação segue o padrão:
A/B/X/Y/Z
No padrão acima, A indica o processo de chegadas dos clientes nos postos de
atendimento, B indica o processo de atendimento dos clientes nos postos, X
indica o número de servidores, Y indica a capacidade do sistema e Z indica a
disciplina do atendimento do serviço.
Enquanto A e B representam a distribuição dos tempos adotada no modelo, e X
e Y indicam valores numéricos de servidores e capacidade do sistema, Z é um
indicativo da disciplina do serviço processada pelo servidor conforme abaixo:
•
•
•
•
FIFO (first in/first out) – O primeiro cliente a chegar será o primeiro a ser
atendido
LCFS (last come/first served) – O último cliente a chegar será o primeiro
a ser atendido
SIRO (served in random order) – Atendimento aleatório aos clientes em
fila
GD (Generic discipline) – Disciplina genérica de atendimento
Quando a capacidade do sistema é infinita e a disciplina é FIFO, a notação é
simplificada para o sistema A/B/X. Sendo assim, para um exemplo de um sis-
tema simples onde a chegada dos clientes segue uma distribuição exponencial,
o tempo de atendimento é constante e tem-se um servidor apenas, indica-se o
sistema de fila como M/D/1, onde M simboliza a distribuição de Poisson (exponencial), D simboliza o atendimento constante, e apenas um servidor.
Para as outras distribuições e características diferentes dos sistemas, existem
diversas notações.
2.2 – Equacionamento do problema
Para um sistema simples, de notação M/M/1 (exponencial na entrada, no atendimento e com apenas um servidor), temos as seguintes hipóteses:
•
•
•
•
As chegadas processam-se de acordo com uma distribuição de Poisson
com média λ de unidade chegadas / tempo,
Há um servidor único e de tempo de atendimento que segue uma distribuição de Poisson com média µ,
O atendimento à fila segue a disciplina FIFO,
A população pode ser considerada infinita, assim não se limita o número
de elementos em fila.
Esse sistema é semelhante ao sistema exemplificado na figura VI.
A primeira definição a ser feita é a taxa de utilização do sistema, ou do servidor, definida por:
ρ=
λ
µ
O servidor deve ter uma capacidade média superior à taxa média de chegadas,
ou seja, a taxa de utilização deve ser inferior a um. Se isto não acontecer o sistema se torna instável, há um número indefinido de elementos em fila e o tempo de espera se torna infinito.
A fórmula de Little mostra que o número de elementos médio no sistema é dada pela multiplicação da taxa média de chegadas pelo tempo médio total no
sistema, conforme dado por:
N = λ .T
O tempo médio de permanência no sistema pode ser dividido entre tempo médio em fila (Tw) e tempo médio em atendimento (Ts), dados respectivamente
por:
Tw =
N
µ
e Ts =
1
µ
Daí sai também que o número médio de elementos no sistema pode ser dado
por:
N=
λ
µ −λ
O número de elementos do sistema pode também ser divido em Nw, número
de elementos em fila e Ns, número de elementos em atendimento, respectivamente:
Nw = ρ .N
e
Ns = ρ
É também possível calcular as probabilidades de que o sistema esteja ocioso e
a probabilidade de que haja um número superior a k elementos no sistema,
dados respectivamente por:
µ −λ
P(n = 0) =
µ
e
λ
P (n > k ) =  
µ
k +1
Estas equações puderam ser deduzidas a partir da equação de Little devido à
simplicidade da manipulação matemática que permite a distribuição exponencial e o sistema de um servidor na integração das equações. Para sistemas mais
complexos com distribuições que tenham mais parâmetros, o desenvolvimento
matemático das equações fica demasiadamente complexo, assim como os cálculos.
Para esses efeitos são utilizadas planilhas e softwares de simulação, dos quais
um dos mais conhecidos é o ARENA, utilizado neste trabalho e descrito no
próximo capítulo deste texto.
3 – A aplicação da teoria de filas na manutenção – Analogia proposta
O primeiro capítulo deste texto tem como objetivo responder à primeira pergunta feita no mesmo capítulo:
•
Definido o processo, como medir se ele influi num aumento da confiabilidade na minha planta?
As distribuições e equacionamentos apresentados têm como objetivo medir o
grau de confiabilidade de um sistema.
Este terceiro capítulo propõe uma analogia que visa responder à pergunta:
•
Medida a confiabilidade teoricamente, como posso usar estes valores na
prática para retro alimentar meu processo e definir oportunidades de melhoria de performance e custos?
Os valores de confiabilidade atualmente podem ser calculados via softwares
que normalmente estão ligados aos mesmos bancos de dados dos softwares
de gerenciamento de manutenção, conhecidos como CMMS (Computerized
Maintenance Management System).
Mas com esses valores em mãos, o que pode ser feito? Como posso comprovar o ganho prático de ter melhorado a confiabilidade de uma planta? Se eu
realizar um ganho em confiabilidade, posso reduzir custos de execução mantendo o mesmo nível de serviço?
A analogia proposta pode-se ser mostrada em um processo de manutenção
com base nas seguintes hipóteses:
•
•
•
•
Processo simples de manutenção estritamente corretiva,
Oficina eletroeletrônica (confiabilidade segue distribuição exponencial),
Ordens de serviço abertas apenas em caso de falhas de equipamentos,
Equipe dimensionada para executar um serviço a cada vez.
Estas hipóteses visam simular um sistema M/M/1, conforme apresentado no
capítulo 2.2 e esquematizado a seguir:
OS entra no sistema
λ = 1/MTBF
[OS/hora]
OS fica na carteira
de back log (fila)
[horas]
Execução do Serviço
µ = 1/MTTR
[OS/hora}
Serviço Executado
VII – Esquema do processo de manutenção proposto.
A analogia proposta com o sistema M/M/1, indica a distribuição de entrada de
OS`s no sistema análoga à taxa de falhas que é facilmente demonstrada por
1
λ=
, com unidade OS/hora. A taxa de execução de serviços é dada por
MTBF
1
µ=
com a mesma unidade e o tempo de fila é análogo ao tempo de
MTTR
back log registrado no sistema de gerenciamento de manutenção.
Ou seja, para este processo simples exponencial e corretivo, toda falha gera a
abertura de uma ordem de serviço (OS). A ordem de serviço entra em back log,
ou seja, na fila de espera, e passa a ser executada quando a oficina estiver
disponível para atendê-la e é executada num tempo médio dado pelo indicador
MTTR.
Com base nas equações apresentadas no capítulo 2.2, foi desenvolvida uma
planilha nas quais são inseridos os dados de MTBF, MTTR, e os dados referentes ao back log e custo de manutenção e são automaticamente calculados
os valores de taxa de congestionamento, probabilidade de sistema ocioso, número médio de OS`s em back log e sendo executadas, tempo médio em back
log, custo médio do back log acumulado e tempo estimado para que o sistema
atinja o status de back log igual a zero.
Pode também ser testado o nível de serviço dado pela probabilidade de uma
ordem de serviço ser encerrada após um determinado tempo. Com esse teste,
pode-se ampliar o teste para uma situação de melhoria de eficiência da equipe
de manutenção, que pode ser alcançada via aumento da equipe, treinamentos
ou investimento em ferramental e também para uma situação de melhoria de
confiabilidade da planta.
Ou seja, a partir da planilha mostrada a seguir para um processo real de um
dos contratos de manutenção da empresa Siemens, é possível a partir de valores de confiabilidade retirados do CMMS se determinar o nível de serviço atual
e se testar hipóteses que possam impactar diretamente no custo de manutenção, como melhoria de eficiência de equipes e confiabilidade.
Modelo M/M/s para analogia Filas - Manutenção Eletro-eletrônica
OS entra no sistema
λ = 1/MTBF
[OS/hora]
OS fica na carteira de
back log (fila)
[horas]
Execução do Serviço
µ = 1/MTTR
[OS/hora}
Serviço Executado
1 - Dados do sistema
MTBF Médio
2,4828
horas
Taxa de abertura de OS`s - λ = 1/MTBF
0,4028
OS/hora
MTTR Médio
1,03
Taxa de execução por MO µ = 1/MTTR
0,9709
horas
OS/hora
Número de servidores (c)
1,00
Equipe em t = 0
Número de OS em aberto (histórico)
135
OS`s
Valor ($) médio do Homem - hora
90,03
R$
2 - Resultados
Taxa de congestionamento (ρ =λ/ c µ)
0,41
Probabilidade de back log = 0
58,5%
Porcentagem de OS`s que entram em back log
41,5%
A tendência do back log é de redução
# médio de OS`s sendo executadas
0,4
# médio de OS`s na carteira de back log
0,3
OS`s
Tempo médio de back log por OS
0,7
horas
Tempo médio de processamento de uma OS
Back log acumulado
Custo do back log acumulado
Tempo estimado para back log = 0
OS`s
1,8
horas
139,1
horas
12518,67
R$
34,02
dias
Calcular
Probabilidades
3 - Testes
Tempo encerramento de OS em horas
6,00
Prob. de tempo de encerramento maior que 6 horas:
20%
Redução do custo do back log acumulado
1,37%
(Equipe e confiabilidade atuais)
Melhoria em eficiência da equipe
Redução do tempo estimado para back log = 0
Prob. de tempo de encerramento maior que 6 horas:
Melhoria da confiabilidade (MTBF)
30%
Redução do custo do back log acumulado
2.086,45
0,97
0,43%
31.040,67
Redução do tempo estimado para back log = 0
14,37
Prob. de tempo de encerramento maior que 6 horas:
0,66%
Instruções
1. Entrar com o valor de MTBF médio do CMMS na célula E7
2. Entrar com o valor de MTTR médio do CMMS na célula E9
3. Inicialmente entrar com o valor 1,0 na célula F10. Este valor corresponde à eficiência
atual de sua equipe. Conforme a eficiência aumenta, este fator aumenta.
4. Se a taxa de congestionamento for maior que 1, o sistema é instável, inviabilizando os cálculos
5. Clicar o botão "Calcular Probabilidades"
VIII – Planilha desenvolvida para a analogia proposta
No exemplo acima, com os dados de MTBF e MTTR retirados do CMMS, podese estimar os níveis de serviço, a tendência do back log, e testar hipóteses de
melhoria de eficiência em equipe e melhoria de confiabilidade.
O mesmo processo pode ser inserido no software de simulação de problemas
logísticos ARENA 7.0. A figura a seguir mostra o sistema inserido no software
com os mesmos parâmetros inseridos na situação estudada na figura VIII com
uma simulação executada para o período de 365 dias. Lembrando-se que para
uma simulação com tempo muito maior (tendendo a infinito) os valores encontrados no software devem ser exatamente iguais aos encontrados na planilha:
IX – Processo simples corretivo inserido no software arena
É interessante verificar que após a simulação para um período de tempo relativamente curto (365 dias) os resultados encontrados no software foram muito
próximos dos encontrados na planilha mostrada na figura VIII.
Há muitas vantagens na utilização do software dentre os quais se destacam:
•
•
•
O módulo de reporte detalhado de resultados,
A possibilidade de se inserir qualquer distribuição de probabilidades na
entrada de clientes e nos servidores,
A possibilidade de se estudar sistemas mais complexos, com n entradas
de clientes e n servidores, simulando processos reais de manutenção
com grande fidelidade.
Ou seja, todos os resultados que podem ser encontrados na planilha apresentada na figura VIII para um processo simples corretivo com distribuição exponencial, como tempos de back log, probabilidades, custos e testes de melhoria,
podem ser encontrados para processos mais complexos e reais, com qualquer
tipo de distribuição na entrada ou na execução, simulando as situações reais
das áreas de manutenção das empresas, estudando-se com correção propostas de melhorias em custos, equipes e confiabilidade das plantas. Não há limite
para a quantidade de processos inseridos e complexidade das distribuições de
probabilidade, pois os cálculos são feitos pelo software, descomplicando-se o
processo analítico.
Como exemplo foi criado o processo desenhado abaixo no software ARENA,
que demonstra esquematicamente uma planta virtual que tem as áreas de estamparia, pintura e montagem, que são atendidas tanto por manutenção corretiva quanto preventiva, e por duas oficinas distintas, a elétrica e a mecânica.
X – Processo preventivo e corretivo esquematizado para uma planta virtual
Prova-se então que se pode estudar qualquer processo de manutenção, por
mais complexo que sejam suas inter-relações e suas distribuições associadas,
determinando-se os níveis de serviço e custos atuais e testando-se o impacto
que projetos ou novas soluções possam trazer à manutenção da planta.
4- Estudo de caso real
Para este estudo de caso real, foi estudado o processo simples corretivo da
oficina eletroeletrônica do contrato de manutenção da Siemens na planta de
refrigeradores da empresa B/S/H Continental na cidade de Hortolândia, utilizando-se do modelo apresentado na planilha da figura VIII. A oficina tem 3 eletricistas nos dois primeiros turnos, e dois no turno da noite.
Como uma oficina eletroeletrônica, as falhas dos equipamentos atendidos pala
mesma seguem uma distribuição exponencial.
Foram retirados dados referentes somente às ordens de serviço corretivas da
oficina, descartando-se as preventivas a fim de utilizar-se do modelo simplificado apresentado, de notação M/M/1.
Foi verificado no sistema de gerenciamento de manutenção da planta uma geração de OS`s de média de 0,0732 OS/hora (uma ordem de serviço a cada
13,67 horas) nos últimos 5 meses, com um tempo médio de reparo de 1,192
horas, ou seja, são atendidas em média 0,8389 OS`s por hora.
Foi também verificado o custo/hora médio da equipe de 75,03 reais e uma
quantidade de OS`s em aberto no dia 31/04/05 de 46 OS`s.
Inseridos estes dados na planilha, obtém-se os resultados apresentados na
figura XI:
Modelo M/M/s para analogia Filas - Manutenção Eletro-eletrônica
OS entra no sistema
λ = 1/MTBF
[OS/hora]
OS fica na carteira de
back log (fila)
[horas]
Execução do Serviço
µ = 1/MTTR
[OS/hora}
Serviço Executado
1 - Dados do sistema
MTBF Médio
13,67
Taxa de abertura de OS`s - λ = 1/MTBF
0,0732
MTTR Médio
1,192
Taxa de execução por MO µ = 1/MTTR
0,8389
Número de servidores (c)
1,00
Número de OS em aberto (histórico)
horas
OS/hora
horas
OS/hora
Equipe em t = 0
46
Valor ($) médio do Homem - hora
OS`s
75,03
R$
2 - Resultados
Taxa de congestionamento (ρ =λ/ c µ)
0,09
Probabilidade de back log = 0
A tendência do back log é de redução
91,3%
Porcentagem de OS`s que entram em back log
8,7%
# médio de OS`s sendo executadas
0,1
# médio de OS`s na carteira de back log
0,0
OS`s
Tempo médio de back log por OS
0,1
horas
Tempo médio de processamento de uma OS
Back log acumulado
Custo do back log acumulado
Tempo estimado para back log = 0
OS`s
1,3
horas
54,8
horas
4113,77
R$
2,77
dias
Calcular
Probabilidades
3 - Testes
Tempo encerramento de OS em horas
3,00
Prob. de tempo de encerramento maior que 3 horas:
0%
Redução do custo do back log acumulado
0,88%
(Equipe e confiabilidade atuais)
Melhoria em eficiência da equipe
Redução do tempo estimado para back log = 0
Prob. de tempo de encerramento maior que 3 horas:
Melhoria da confiabilidade (MTBF)
0%
Redução do custo do back log acumulado
Redução do tempo estimado para back log = 0
Prob. de tempo de encerramento maior que 3 horas:
0,88%
0,88%
Instruções
1. Entrar com o valor de MTBF médio do CMMS na célula E7
2. Entrar com o valor de MTTR médio do CMMS na célula E9
3. Inicialmente entrar com o valor 1,0 na célula F10. Este valor corresponde à eficiência
atual de sua equipe. Conforme a eficiência aumenta, este fator aumenta.
4. Se a taxa de congestionamento for maior que 1, o sistema é instável, inviabilizando os cálculos
5. Clicar o botão "Calcular Probabilidades"
XI – Resultados do estudo do caso B/S/H Continental - Hortolândia
Verifica-se nos resultados um tempo de back log muito baixo e com tendência
de redução, com valor de em horas de um nível satisfatório, com um tempo
médio de encerramento de OS`s de apenas 1,3 horas, com probabilidade de
encerramento de OS`s em mais de 3 horas de apenas 0,88%, demonstrando
que o nível de serviço desta oficina, relacionada com as manutenções corretivas está muito alto, podendo estar até super-dimensionado.
Isso ocorre pelo fato de o sistema estar dimensionado para um atendimento
rápido e com uma equipe que tenha um MTTR baixo. O que ocorre é que a
geração de OS`s corretivas em relação ao MTTR é baixo (explicando-se o resultado ρ=0,09).
Há então uma oportunidade de se redimensionar o processo para um nível de
serviço mais adequado às necessidades desta oficina, que no processo de fabricação do cliente não representa um gargalo tão importante que se necessite
manter um nível de serviço tão alto. Se o exemplo fosse a oficina mecânica,
talvez fosse necessário um estudo oposto a esse, com necessidades de melhoria do nível de serviço para atender corretivas prioritárias com mais velocidade.
Foi então realizado um teste que avalia um impacto da redução de custo com
equipe de manutenção eletroeletrônica, por meio de redução do número de
profissionais ou de substituição por profissionais menos experientes, afetandose diretamente na eficiência da equipe. Esse estudo pôde ser efetuado devido
aos dados obtidos na modelagem do sistema indicando a tendência de que a
estrutura pode estar super-dimensionada. Fazendo-se os testes na planilha, os
resultados obtidos são apresentados a seguir:
Redução na Eficiência (%)
Aumento do tempo de back log (dias) Probabilidade de encerramento > 3 horas (%)
0,0
10,0
20,0
30,0
40,0
50,0
0
0,25
0,57
0,98
1,52
2,28
0,88
1,13
1,45
1,87
2,4
3,09
Estudo caso B/S/H Hortolândia
3,5
3
2,5
2
1,5
1
0,5
0
0,0
10,0
20,0
30,0
40,0
50,0
Redução na Eficiência Equipe
Aumento do tempo de back log (dias)
Probabilidade de encerramento > 3 horas (%)
XII – Resultados do teste de redução de eficiência da equipe
Com o resultado do estudo mostrado na figura XII, pode-se tomar a decisão de,
por exemplo reduzir a equipe desta oficina ou utilizar profissionais menos treinados e menos experientes, economizando-se recursos sem afetar excessivamente o nível de serviço da manutenção eletroeletrônica, conforme demonstrado no gráfico. Esses recursos podem ser utilizados para melhorar o nível de
serviço em outras oficinas deficitárias, como por exemplo, numa oficina mecânica que apresente um subdimensionamento de equipe.
O mesmo estudo pode ser realizado para o aumento de eficiência da equipe ou
também aumento e redução da confiabilidade, dependendo do objetivo do estudo e das condições da planta estudada. Por exemplo, se fosse verificada
uma equipe subdimensionada por apresentar um tampo de back log alto, ou
até mesmo uma tendência de aumento de back log , pode-se analisar o impacto de um aumento da equipe ou de melhoria da confiabilidade no nível de serviço do processo estudado e os custos envolvidos.
É importante salientar que este estudo pode ser desenvolvido também para
plantas mais complexas e para objetivos diferentes com auxilio do software de
logística, proporcionando testes de melhorias significativas nos processos, in-
dependentemente de sua complexidade ou de suas distribuições de confiabilidade e execução envolvidas.
5 – Conclusão
Hoje há muita dificuldade e pouco tempo disponível para as pessoas que gerenciam os processos de manutenção para desenvolverem trabalhos que
transpassem a teoria da confiabilidade para uma aplicação prática dos resultados de seus trabalhos. Há então a abertura para o desenvolvimento de uma
ferramenta prática e simples que sirva como apoio aos gerentes de manutenção para a sua tomada de decisões.
A analogia desenvolvida então, permite ao gerenciamento da manutenção simular o seu processo, independentemente da complexidade e das características de probabilidades envolvidas no mesmo, de forma a testar diferentes soluções, com base em valores de confiabilidade e taxas conhecidas, e retro alimentar o processo para que se tenha base concretas e confiáveis para se tomar decisões de melhoria de produtividade ou de custos, dependendo do resultado da análise, permitindo à manutenção estar sempre o mais próxima possível da relação ótima entre custo e confiabilidade.
As duas perguntas: “Definido o processo, como medir se ele influi num aumento da confiabilidade na minha planta?” e “Medida a confiabilidade teoricamente,
como posso usar estes valores na prática para retro alimentar meu processo e
definir oportunidades de melhoria de performance e custos?” podem então ser
respondidas, partindo-se de uma analogia em relação à teoria de filas, utilizada
até hoje em sua maior parte em problemas logísticos, para simular processos
de manutenção práticos e reais, desenvolvendo-se então testes alternativos e
simulações com variáveis relevantes, servindo então esta analogia como forma
de apoio às decisões do gerente de manutenção.
Bibliografia:
BOTTER, Rui Carlos. Apostila da disciplina logística e pesquisa operacional da
Escola Politécnica da USP. EPUSP. São Paulo, 2004.
SOUZA, Gilberto F. M. Análise da confiabilidade aplicada ao projeto de sistemas mecânicos. EPUSP. São Paulo, 2003.
SHERWIN, David. A review of overall models for maintenance management.
Journal of Quality in Maintenance, Vol 6, No. 3,2000, pp. 138 – 164,
SAHANI, Vandana;SAHANI,Vandana. Reliability analysis of a maintenance
network with repair and preventive maintenance, International Journal of Quality
& Reliability Management, Vol 20, No. 2, 2003, pp. 268 -280
SARANGA, Haritha. Relevant condition-parameter strategy for an effective
condition-based maintenance, Journal of Quality in Maintenance Engineering,
Vol 8, No. 1, 2002, oo. 92 - 105
.
Dependability management - Part 3-11: Application guide - Reliability centred
maintenance. International Electrotechnical Commission. Geneva. Doc. No.
56/651/FDIS
Guidelines for the Naval Aviation Reliability Centered Maintenance Process.
Department of Defense. Washington, D.C. NAVAIR 00-25-403
MOUBRAY, John. Reliability-Centred Maintenance. Butterworth-Heinemann,
Oxford. 1997
MSG-3. Maintenance Program Development Document. Air Transport Association, Washington, D.C. Revision 2, 1993.
Naval Engineering Standard 45 (NES45), Requirements for the Application of
Reliability-Centred Maintenance Techniques to HM Ships, Royal Fleet Auxiliaries and other Naval Auxiliary Vessels (Restricted-Commercial). U.K. Ministry of
Defence Publications
NOWLAN, F. Stanley; HOWARD E Heap. Reliability-Centered Maintenance.
Department of Defense, Washington, D.C. 1978. Report Number AD-A066579.
Planned Maintenance System: Development of Maintenance Requirement
Cards, Maintenance Index Pages, and Associated Documentation. Naval Sea
Systems Command. Washington, D.C. Military Specification MIL-P24534A(NAVY). 1985.
Procedures for Performing a Failure Mode, Effects and Criticality Analysis. Department of Defense. Washington, D.C. Military Standard MIL-STD-1629A. Notice 2, 1984.
Reliability-Centered Maintenance Handbook. Naval Sea Systems Command.
Washington, D.C. Handbook S9081-AB-GIB-010/MAINT. October 1983.
Reliability-Centered Maintenance Requirements for Naval Aircraft, Weapons
Systems and Support Equipment. Department of Defense. Washington, D.C.
MIL-STD 2173(AS)
Download

(1) Engenheiro de Manutenção - Siemens Graduado e