UNIVERSIDADE FEDERAL DE JUIZ DE FORA
DEPARTAMENTO DE ESTATÍSTICA
CURSO DE ESTATÍSTICA
Daniel Morais de Souza
Modelos ocultos de Markov: uma Abordagem em Controle de
Processos
JUIZ DE FORA
2013
1
Daniel Morais de Souza
MODELOS OCULTOS DE MARKOV: UMA ABORDAGEM EM CONTROLE DE
PROCESSOS
Monografia apresentada ao curso de
Estatística da Universidade Federal de Juiz
de Fora, como requisito para a obtenção do
grau de Bacharel em Estatística.
Orientador: Lupércio França Bessegato
Doutor em Estatística – UFMG
2
JUIZ DE FORA
2013
MODELOS OCULTOS DE MARKOV: UMA ABORDAGEM EM CONTROLE DE
PROCESSOS
Monografia apresentada ao curso de
Estatística da Universidade Federal de Juiz
de Fora, como requisito para a obtenção do
grau de Bacharel em Estatística.
Aprovada em ___ de ___________ de 2013.
BANCA EXAMINADORA
_________________________________________________
Lupércio França Bessegato (orientador)
Doutor em Estatística – Universidade Federal de Minas Gerais
__________________________________________________
Camila Borelli Zeller
Doutora em Estatística – UNICAMP
__________________________________________________
Alfredo Chaoubah
Doutor em Engenharia Elétrica- Pontifícia Universidade Católica do Rio de Janeiro
3
Souza, Daniel Morais – Juiz de Fora, 2013
Modelos ocultos de Markov: uma Abordagem em Controle de Processos/
Daniel Morais de Souza
72.p
Monografia – Universidade Federal de Juiz de Fora e Instituto de
Ciências Exatas
Orientador: Lupércio França Bessegato
4
À Deus por tudo.
E à minha família.
5
“Quem já passou por essa vida e não viveu,
pode saber mais,
mas sabe menos do que eu”.
Vinicius de Moraes
6
AGRADECIMENTOS
Primeiramente queria agradecer à minha família por estar sempre ao meu lado,
cada um de sua maneira única, sempre tornando momentos simples da vida, como um
jogo de cartas, momentos muito especiais pra mim.
Agradeço ao meu pai por sempre lutar comigo e, consequentemente, por mim.
Agradeço minha mãe e minha vó por sempre me protegerem. Agradeço minha tia Gina
e meu vô por sempre me ensinar lindas lições. Agradeço meu irmão e minha cunhada
Fa pelo companheirismo e por me ajudarem a concretizar este trabalho.
Devo agradecer muito, mais muito mesmo meus amigos Guilherme, Leandro e
Thalita por tudo. Tenho certeza que sem vocês não estaria me formando hoje.
Não posso deixar de agradecer aos meus amigos de Ciências Exatas: Bárbara,
Dadalti, Gi, Ju, Marcel, Vinícius e Yamashita. São amigos que levarei para o resto da
vida.
Aos meus amigos de colégio: Banana, Eduardim, Fefe, Micoline, Mônica,
Thiagão e Vitão por me ajudarem em momentos difíceis e compartilhar momentos
felizes.
Aos amigos Bebeto, Ni, Tuzim, Ronny e todos da banda, por sempre estarem ali
na hora da tão esperada cerveja do final de semana.
Aos professores do departamento, por serem ótimos profissionais e grandes
amigos. Em especial ao Joaquim e Clécio, hoje grandes amigos.
Ao meu orientador acadêmico e também orientador da vida, Lupércio, por toda
a paciência e pelas horas de conversa.
Aos membros da banca, Camila e Alfredo, pelo tempo e dedicação.
À Deus, que mesmo eu esquecendo Ele algumas vezes, tenho certeza que Ele
não fez o mesmo.
À todos vocês.
7
RESUMO
A metodologia do modelo oculto de Markov está sendo amplamente utilizada
em todos os campos do conhecimento nos dias de hoje. Com sua forte estrutura
matemática, esta metodologia é capaz de modelar diversos problemas por ser bastante
maleável e irrestrita, fato que não ocorre na metodologia de cadeia de Markov. Pode-se
enxergar esta metodologia como uma extensão de cadeia de Markov, uma vez que ela
pode conter mais de uma cadeia de Markov. Problemas de monitoramento de cartas de
controle e controle on-line podem ser modelados via cadeia de Markov, visto que o
intervalo de amostragem é regular e que a condição do processo ser Markoviano
geralmente é assumida. Dorea et al. (2012) assumiram a existência de um sistema
interno não observável de modo que o monitoramento por controle on-line é apenas
uma parte do processo. Com base nesta suposição, pode-se modelar este processo via
modelo oculto de Markov, já que o processo compreende duas cadeias de Markov (uma
observável e outra não observável). Este trabalho apresentará a metodologia do
modelo oculto de Markov para, em seguida, aplicar a metodologia no planejamento do
controle estatístico on-line a fim de estabelecer uma estimação para as probabilidades
de alarme falso e a de não detecção.
.
Palavras-chave: Modelo Oculto de Markov, Controle estatístico On-line, Alarme
Falso, Não Detecção.
8
Sumário
1- Introdução............................................................................................................................... 12
2- Controle estatístico de qualidade....................................................................................... 14
2.1- Introdução .......................................................................................................................... 14
2.2- Cartas de controle ......................................................................................................... 17
2.3- Planejamento econômico de cartas de controle ......................................................... 23
2.4- Controle On-line em cartas de controle ....................................................................... 26
3- Modelos Ocultos de Markov (HMM) .............................................................................. 28
3.1- Cadeias de Markov ........................................................................................................... 28
3.1.1- Processos Estocástico e Markoviano ........................................................................ 28
3.1.2- Principais Conceitos ...................................................................................................... 29
3.1.3- Irredutibilidade .............................................................................................................. 31
3.1.4- Periodicidade................................................................................................................... 32
3.1.5- Distribuição Invariante ................................................................................................ 32
3.2- Introdução do Modelo Oculto de Markov (HMM)................................................... 33
3.3- Elementos do HMM ........................................................................................................ 35
3.4- Os três problemas básicos do HMM ............................................................................ 37
3.4.1- Probabilidade de uma sequência de observações .................................................... 38
3.4.2- Melhor sequência de estados ....................................................................................... 44
3.4.3- Estimação dos parâmetros ........................................................................................... 47
4- HMM no controle estatístico on-line ................................................................................ 50
4.1- Introdução .......................................................................................................................... 50
4.2- Alarme falso e Não detecção ........................................................................................... 53
5- Análise de Sensibilidade....................................................................................................... 59
6- Conclusão e recomendações futuras.................................................................................. 69
Referências Bibliográficas............................................................................................................ 70
9
Lista de Figuras
Figura 1 - Ilustração de uma carta de controle ...................................................................... 15
Figura 2 - Tempo até o sinal ...................................................................................................... 23
Figura 3 - Modelo de urnas e bolas........................................................................................... 35
Figura 4 - Ilustração da sequência de operações requeridas para a computação da
variável Forward  (t 1) ( j ) .......................................................................................................... 41
Figura 5 - Implementação da computação de  t (i ) em termos das observações t e dos
estados i ........................................................................................................................................... 42
Figura 6 - Ilustração da sequência de operações requeridas para a computação da
variável Backward  t (i ) .............................................................................................................. 43
Figura 7 - Ilustração da sequência de operações requeridas para a computação do
evento conjunto do sistema estar no estado S i no tempo t e de estar no estado S j no
tempo t+1 ........................................................................................................................................ 48
Figura 8 - Descrição do processo de inspeção ........................................................................ 51
Lista de Gráficos
Gráfico 1 - Sensibilidade da probabilidade de alarme falso/ largura dos limites de
controle (k) ...................................................................................................................................... 60
Gráfico 2 – Sensibilidade da probabilidade de não detecção/ largura dos limites de
controle (k) ...................................................................................................................................... 61
Gráfico 3 - Sensibilidade da probabilidade de alarme falso / intervalo entre amostras
(m) ..................................................................................................................................................... 62
Gráfico 4 - Sensibilidade da probabilidade de não detecção / intervalo entre amostras
(m) ..................................................................................................................................................... 63
Gráfico 5 - Sensibilidade da probabilidade de alarme falso / parâmetro p ...................... 64
Gráfico 6 - Sensibilidade da probabilidade de não detecção / parâmetro p ..................... 65
Gráfico 7 - Sensibilidade da probabilidade de alarme falso / parâmetro ε ....................... 66
Gráfico 8 - Sensibilidade da probabilidade de não detecção / parâmetro ε ..................... 67
Gráfico 9 - Sensibilidade da probabilidade de não detecção / parâmetro  ................... 68
10
Lista de Tabelas
Tabela 1 - Valores de d 2 e d 3 ..................................................................................................... 19
Tabela 2 – Valores das probabilidades para diferentes larguras de limites de controle 60
Tabela 3 - Valores das probabilidades para diferentes intervalos entre amostras ......... 62
Tabela 4 - Valores das probabilidades para diferentes valores de parâmetro p .............. 63
Tabela 5 - Valores das probabilidades para diferentes valores de parâmetro  ............. 65
Tabela 6 - Valores das probabilidades para diferentes valores do parâmetro  ............ 67
Lista de Quadros
Quadro 1 - Teste de hipóteses do monitoramento ................................................................ 21
11
1-
Introdução
O controle estatístico de qualidade tem sido amplamente utilizado por
pesquisadores e indústrias com o intuito de otimizar os processos e garantir um nível
de qualidade à sua produção. Uma de suas principais ferramentas é o controle de
processos a partir de cartas de controle. Esta ferramenta monitora processos a fim de
garantir qualidade à produção e avisar quando o processo não opera normalmente.
Há vários modos de planejar estas cartas de controle, dentre as quais podem-se
destacar o planejamento econômico, que tem como objetivo minimizar os custos da
produção. Taguchi et al. (1989) propuseram um modelo econômico para monitorar, em
tempo real, uma determinada característica de qualidade que pode ser aplicado tanto
em cartas de controle por variáveis (característica de qualidade é uma variável
contínua) quanto em cartas de controle por atributos (característica de qualidade
qualitativa, geralmente dicotômica, ex: conforme e não conforme). Este método é
chamado de modelo de Taguchi para controle on-line de processos, e seu objetivo é
determinar um intervalo ótimo de inspeção que visa minimizar o custo por item de um
ciclo de produção.
De acordo com Dorea et al. (2012), é razoável assumir a existência de um
sistema interno não observável de modo que o monitoramento por controle on-line é
apenas uma parte do processo. Neste trabalho, sob a perspectiva dos modelos ocultos
de Markov, e assumindo que a evolução do sistema é governada por uma cadeia de
Markov de dois estágios, serão apresentadas as estimativas para o alarme falso e a não
detecção do mau funcionamento do processo para controle estatístico on-line.
O modelo oculto de Markov (HMM) é utilizado para modelar processos que são
governados por um processo Markoviano embutido, cujo sistema não pode ser
diretamente observado. Este processo evolui pelo tempo por meio de transições entre
seus estados, sendo que os estados são responsáveis pela emissão de sinais observáveis.
Pode-se visualizar o HMM como uma extensão da cadeia de Markov, pois o modelo
inclui o caso onde a observação é uma função de probabilidade.
O objetivo deste trabalho é apresentar a metodologia dos modelos ocultos de
Markov e posteriormente fazer uma aplicação da mesma no controle estatístico on-line
para definir algumas probabilidades importantes no planejamento econômico.
Apresentadas a metodologia do modelo oculto de Markov e a aplicação no controle
estatístico on-line, será feita uma simulação baseada em um exemplo retirado de Costa
et al. (2005) para a comprovação das probabilidades oriundas da metodologia do HMM.
12
A metodologia dos modelos ocultos de Markov está sendo cada vez mais
utilizada em diversas áreas, tais como saúde, biologia, computação, entre outras. Souza
(2010) propôs esta metodologia para resolver o problema da proliferação do mosquito
transmissor do vírus da dengue; já Khouri (2012) conseguiu fazer uma comparação e
classificação de proteínas por meio de HMM; Rabiner (1989) utilizou esta metodologia
no reconhecimento de fala.
Esta metodologia foi introduzida nos anos 60 e dois são os motivos que levam à
sua aplicação: i) estes modelos têm uma estrutura matemática que pode ser aplicada em
inúmeros problemas; e ii) quando aplicada corretamente, esta metodologia fornece
ótimos resultados.
Este trabalho será apresentado da seguinte forma: além da introdução, o
capítulo 2 apresenta algumas ferramentas do controle estatístico de qualidade como
cartas de controle, planejamento econômico e controle estatístico on-line; no capítulo 3
será feita uma breve revisão sobre a metodologia de cadeia de Markov e algumas de
suas propriedades, para, logo em seguida, ser apresentada a metodologia do modelo
oculto de Markov; no capítulo 4 será feita uma aplicação da metodologia dos modelos
ocultos de Markov no controle estatístico on-line e; o capítulo 5 apresenta as
conclusões e principais resultados.
13
2-
Controle estatístico de qualidade
Neste capítulo serão apresentados os conceitos do controle estatístico de
qualidade e suas principais ferramentas.
2.1- Introdução
O controle estatístico de qualidade vem sendo cada vez mais utilizado dentro
das indústrias, independente de suas áreas de atuação. Esta técnica estatística tem
como principal objetivo fornecer uma otimização do processo de produção tal que
reduza os custos e maximize os lucros respeitando certo nível de qualidade. Pode-se
dividir esta técnica em duas etapas: a primeira parte é onde o pesquisador/empresa
busca parâmetros estatísticos e econômicos que reduzam os custos e maximizem os
lucros; e a segunda parte funciona como o monitoramento do processo, ou seja, o
pesquisador/empresa monitora o processo para que os produtos sempre estejam
respeitando o nível de qualidade especificado.
Há diversas formas de definir qualidade: Para Montgomery (2004) qualidade é
inversamente proporcional à variabilidade, ou seja, quanto maior a variabilidade menor
a qualidade; segundo Deming (2000) qualidade significa atender, e se possível, exceder
as expectativas do consumidor; Taguchi et al. (1989) definiu a qualidade de um produto
como as perdas econômicas impostas à sociedade a partir do momento em que ele é
liberado para venda; Crosby (1995) afirma que qualidade significa atender às
especificações.
O controle de qualidade desenvolve sistemas que garantem que os produtos
sejam projetados e produzidos para atender ou superar as expectativas dos clientes. Em
processos de produção que há um controle estatístico de qualidade, geralmente é
delimitado limites de tolerância com o intuito de controlar a qualidade do produto.
Uma das principais técnicas de controle estatístico de qualidade em processos
de produção são as cartas de controle ou também, gráficos de controle. Desenvolvidas
pelo Dr. Walter A. Shewhart (1920), as cartas de controle podem ser classificadas em
dois grupos: cartas de controle por variáveis e cartas de controle por atributos.
Segundo Costa et al. (2005) as cartas de controle por variáveis servem para o
monitoramento de características de qualidade representadas por variáveis contínuas, e
as cartas de controle por atributos servem para o monitoramento de processos
qualitativos, em que os produtos podem ser classificados em defeituosos ou não
14
defeituosos. As cartas de controle por atributos também podem ser utilizadas para
monitorar o número de não conformidades presentes em um produto, como por
exemplo, em um chapa de metal.
As principais cartas de controle por variáveis são as cartas de controle
cartas de controle
e . As
são utilizadas para o controle da média de uma característica de
qualidade, enquanto as cartas de controle
controlam a dispersão da característica de
qualidade. Estas cartas de controle não são indicadas para mudanças pequenas e
moderadas nos parâmetros que estão sendo controlados, para isso preferem-se as cartas
de controle CUSUM e EWMA, que são as mais eficazes no monitoramento de
processos sujeito a pequenas perturbações (MONTGOMERY, 2004; LEIRAS et al.,
2007).
As principais cartas de controle por atributos são as cartas de controle np, p, C e
u. As cartas de controle np medem o número de produtos defeituosos que um processo
produz (ou que um lote tem), as cartas de controle n medem a fração defeituosa do
processo, as cartas de controle C medem o número de não-conformidades em uma
amostra (ex: o número de defeitos que uma chapa de metal apresenta), e as cartas de
controle u medem o número de não-conformidades por unidade de inspeção.
As cartas de controle contêm uma linha média (LM), representando o valor
médio da característica de qualidade, e duas outras linhas horizontais, chamadas de
limite superior de controle (LSC) e limite inferior de controle (LIC), representadas pela
figura a seguir:
Fonte: Elaboração própria.
Figura 1 - Ilustração de uma carta de controle
15
O valor médio das cartas de controle é o valor alvo da estatística da
característica de qualidade que se deseja para o produto, seja ela sua média, seu desviopadrão, ou qualquer outra estatística. Os limites superior e inferior de controle formam
um intervalo de aceitação para a qualidade do processo, ou seja, se a estatística da
característica de qualidade dos produtos estiver dentro deste intervalo, considera-se o
processo sob controle, caso contrário o processo é considerado fora de controle.
Escolhe-se a amplitude do intervalo LSC e LIC de maneira que, quando o
processo estiver operando sob controle, praticamente todos os pontos amostrais
estejam em seu interior. Geralmente utilizam-se os limites de controle com três
desvios-padrão de afastamento em relação à linha média (“limites de 3 sigma”), que
foram propostos por Shewhart baseados no seguinte lema: “se o processo estiver em
controle,
evite
ajustes
desnecessários,
que
só
tendem
a
aumentar
a
variabilidade”(COSTA et al., 2005).
O procedimento para o monitoramento dos processos proposto por Duncan
(1956) para cartas de controle é o seguinte: A cada intervalo de tempo
amostra de produtos de tamanho
é coletada uma
e é calculada a estatística da característica de
controle desejada (ex: média, desvio-padrão, entre outros); se a estatística calculada
estiver dentro dos limites de controle, o processo é considerado sob controle e ele
continua operando normalmente; se a estatística calculada estiver fora dos limites de
controle, o processo é considerado fora de controle e, portanto inicia-se uma
investigação e uma ação corretiva para encontrar e eliminar a causa (ou causas)
atribuível responsável por este comportamento.
Além das cartas de controle por variáveis e por atributos, Taguchi et al. (1989)
propuseram um método que consiste em retirar apenas um item da linha de produção a
cada intervalo fixo de
itens produzidos. Se o item for classificado não conforme, o
processo é interrompido para a investigação e ajuste. Este método, chamado de
controle On-line, pode ser aplicado tanto em cartas de controle por variáveis, quanto
em cartas de controle por atributos, sendo que o problema é determinar o intervalo
ótimo
e, no caso de controle de variáveis, o parâmetro dos limites de controle . De
acordo com Taguchi, este sistema deve ser empregado de um modo que os valores
alvos da característica de qualidade possam ser economicamente planejados e
controlados. Este assunto será abordado no final deste capítulo
Na próxima seção será discutida a metodologia de cartas de controle
com o
intuito de demonstrar como que as cartas de controle funcionam. Para a metodologia
16
das cartas de controle
ser apresentada, é preciso ser introduzidos alguns conceitos
das cartas de controle
necessários para a utilização de ambas as cartas, pois estas
cartas são geralmente utilizadas em conjunto.
2.2- Cartas de controle
Se a característica de qualidade a ser monitorada é uma variável contínua, como
por exemplo, o número de mililitros de uma lata de refrigerante, comumente a
monitoração do processo é dada por um par de cartas de controle: um para o
monitoramento da média da característica de qualidade e outro para a monitoração da
variabilidade da mesma. Geralmente as cartas empregadas são o da média amostral
para monitorar a média da característica e o da amplitude amostral
para monitorar a
variabilidade.
A linha média
para as cartas de controle
esperado) de , e os limites de controle superior
é localizada na média (valor
, e inferior
, são geralmente
estabelecidos a três desvios-padrão dessa média, dados por:
(01)
(02)
Pelo teorema central do limite pode-se afirmar que o valor esperado da
estatística
é igual ao valor esperado da característica de qualidade
, da variável
aleatória , isto é:
(03)
Ainda supondo independência entre os valores, pelo teorema central do limite
pode-se afirmar que o desvio-padrão amostral da característica de qualidade é dado por:
(04)
sendo que
representa o desvio-padrão da característica de qualidade monitorada
e
representa o tamanho amostral.
A variabilidade dos valores de
diminui à medida que aumenta o tamanho das
amostras. Por exemplo, para amostras de tamanho 9, o desvio-padrão amostral é igual
a um terço do desvio-padrão da característica de qualidade .
Porém na prática, estes parâmetros não são conhecidos, e quando conhecidos,
não apresentam uma boa precisão. Por isso são utilizadas estimativas que, sem perda de
representatividade, podem ser utilizadas nos cálculos das cartas de controle. Adotando
17
estas estimativas como
e
, temos os seguintes parâmetros para as
cartas de controle :
(05)
(06)
(07)
Para o cálculo destas estimativas, é necessário antecipar a definição dos
parâmetros das cartas de controle
, pois a estimativa do desvio-padrão amostral
depende destes parâmetros. Portanto, os limites de controle para as cartas de controle
são dados por:
(08)
(09)
(10)
sendo que
,
e
consecutivamente representam o limite superior de
controle, linha média e o limite inferior de controle das cartas de controle ; e que
e
consecutivamente representam a média da amplitude amostral e o desvio-padrão da
amplitude amostral.
O fator que multiplica
é definido como 3 pela literatura, porém pode assumir
qualquer valor dentre os reais.
Segundo Costa et al. (2005), se a característica de qualidade de interesse seguir
uma distribuição normal com desvio-padrão , a distribuição da amplitude amostral
terá média e desvio-padrão dados por:
(11)
(12)
onde
e
são constantes que dependem apenas do tamanho amostral
conforme a
tabela a seguir:
18
Tabela 1 - Valores de d 2 e d 3
Tamanho da amostra
n
2
3
4
5
6
7
8
9
10
11
12
13
14
15
Parâmetros da carta
de controle R
d2
d3
1,128
0,853
1,693
0,888
2,059
0,880
2,326
0,864
2,534
0,848
2,704
0,833
2,847
0,820
2,970
0,808
3,078
0,797
3,173
0,787
3,258
0,778
3,336
0,77
3,407
0,763
3,472
0,756
Fonte: Adaptado de Costa et al. (2005).
Com base em (11) e (12), e substituindo
por sua estimativa
(obtida com o
processo sob controle), pode-se então definir os limites de controle e a linha média para
as cartas de controle
como:
(13)
(14)
(15)
Porém deve-se fazer um lembrete: Como a amplitude é uma medida definida em
, ela não pode assumir valores negativos, portanto, quando (15) for calculado e
resultar em um número negativo, imediatamente adota-se
, significando que
não existe um limite inferior de controle.
A literatura revela que as estimativas da média, do desvio-padrão e da
amplitude devem ser baseadas em pelo menos 20 amostras. Dado um conjunto de
amostras, a estimativa da média da característica de qualidade
médio das médias amostrais, ou seja, suponha que
das
geralmente é o valor
sejam as médias amostrais
amostras coletadas, o melhor estimador é dado por:
(16)
19
Como
, pode-se afirmar que
, ou seja,
será usada como a linha
média das cartas de controle .
A estimativa do desvio-padrão da característica de qualidade
pelas amplitudes das
amostras. Suponha que
é calculada
sejam as amplitudes das
amostras. O estimador da amplitude da característica de qualidade será dado por:
(17)
e consequentemente o estimador do desvio-padrão da característica será dado por:
(18)
como
é um estimador não viciado para a amplitude, pode-se afirmar que
é um
estimador não viciado para o desvio-padrão.
Note que as cartas de controle
dependem da média e do desvio-padrão da
característica de qualidade. Já as cartas de controle
são independentes da média da
característica de qualidade, portanto, não conseguem identificar alterações na medida
central do processo.
Finalmente, podem-se definir as estimativas para os parâmetros das cartas de
controle
como:
(19)
(20)
(21)
Este intervalo de
mais preciso
engloba grande parte dos valores de
, para ser
deles, ou seja, se o processo estiver sob controle, raramente um
ponto caíra fora da região de aceitação da carta de controle.
Como dito anteriormente, o monitoramento do processo por meio das cartas de
controle
é feito retirando amostras de tamanho
a cada
horas. Retirado estas
amostras, é calculada para cada amostra a média amostral, e registrada graficamente
em uma carta de controle como mostrada na figura (1). É possível perceber que este
procedimento é constituído por sucessíveis testes de hipóteses, os quais podem ser
definidos como:
20
considere que quando o processo estiver sob controle, a média do processo
, e quando estiver fora de controle, a média do processo
Não rejeita
se o valor da estatística
Analogamente, rejeita
será diferente de
assumirá
.
estiver dentro dos limites de controle.
se o valor da estatística
estiver fora dos limites de controle.
Como toda técnica estatística, este procedimento é passível de erros. Estes erros
são chamados de erros de declaração, pois o erro ocorre quando a o pesquisador declara
que o processo está sob controle ou fora de controle quando na verdade não está. Como
todo teste de hipótese, este procedimento pode ter dois erros:
i)
Erro do tipo І: Ocorre quando é declarado que o processo está fora de
controle, quando na verdade o processo está sob controle, ou seja, a estatística
calculada está fora do intervalo de aceitação, porém o processo está sob controle. Na
prática, este erro resulta em intervir o processo na hora errada, quando ele está isento
de causas especiais que modificam a média da característica de qualidade. Este erro é
comumente chamado de alarme falso. A probabilidade do alarme falso é representada
por , isto é:
(22)
ii)
Erro do tipo ІІ: Ocorre quando é declarado que o processo está sob
controle, quando na verdade o processo está fora de controle, ou seja, a estatística
calculada está dentro do intervalo de aceitação, porém o processo está fora de controle.
Na prática, este erro resulta em não intervir o processo na hora certa, quando a média
da característica de qualidade do processo foi afetada por alguma causa especial. A
probabilidade deste erro ocorrer é representada por , isto é:
(23)
O quadro a seguir apresenta os possíveis resultados de um teste de hipóteses do
monitoramento por cartas de controle :
Quadro 1 - Teste de hipóteses do monitoramento
Decisão
Hipótese H 0
Aceitar H 0
Probabilidade
Verdadeira
Decisão correta
1
Falsa
Erro tipo II

Rejeitar H 0
Erro tipo I
Decisão correta
Probabilidade

1 
Fonte: Costa et al. (2005)
21
Um conceito importante nas cartas de controle é o poder
, dado por:
(24)
ou seja, o poder é a probabilidade do processo ser declarado corretamente fora de
controle. Muitos pesquisadores utilizam o poder para efeito de comparação de cartas de
controle, pois quanto mais rápido o processo detectar alguma causa especial que
modificou a média da característica de qualidade, melhor é a carta de controle.
A partir do poder, pode-se determinar o número médio de amostras entre a
ocorrência da mudança na média do processo e a detecção e declaração de uma causa
especial, dado por:
(25)
Para a determinação do número de amostras até o primeiro sinal de que o
processo desajustou, utiliza-se o número médio de amostras antes de um alarme falso.
Pode-se afirmar que este número segue uma distribuição geométrica de parâmetro
. A média da distribuição geométrica é
, logo, o número médio de amostras é
dado por:
(26)
Estes dois conceitos são amplamente utilizados para a comparação de modelos
por terem uma interpretação prática e fácil.
Outra medida de comparação de cartas de controle é o intervalo de tempo entre
a alteração da média do processo e a declaração do processo estar fora de controle.
Segundo Costa et al. (2005) este intervalo é chamado de tempo esperado até o sinal
, ou seja, tempo esperado até a declaração do processo estar fora controle.
Este conceito depende do intervalo de tempo entre amostras , do número de
amostras até o sinal e do intervalo de tempo entre a última amostragem com o
processo sob controle e o instante que a média se desloca. Portanto, pode-se definir o
tempo esperado até o sinal como:
(27)
onde
é o tempo até o sinal,
amostras até o sinal e
é o intervalo entre amostras,
é o número de
é o intervalo de tempo entre a última amostragem com o
processo sob controle e o instante que a média se desloca.
22
Pode-se definir que o valor esperado do número de amostras até o sinal
corresponde ao número médio de amostras entre a ocorrência da mudança na média do
processo e a detecção e declaração de uma causa especial, ou seja:
(28)
Como o deslocamento da média do processo pode ocorrer em qualquer tempo
entre um intervalo entre amostras
descolamento
, pode-se supor que o tempo que ocorre este
segue uma distribuição uniforme, e, portanto, o seu valor esperado é
dado por:
(29)
logo, chega-se a seguinte expressão:
(30)
A figura a seguir mostra como o
é medido:
Fonte: Costa et al. (2005).
Figura 2 - Tempo até o sinal
2.3- Planejamento econômico de cartas de controle
Como dito anteriormente, as cartas de controle são amplamente utilizadas para
o monitoramento da qualidade de processos, tanto na área industrial quando nos
setores de serviço. Para implementar as cartas de controle, devem-se escolher
23
parâmetros estatísticos que minimizem os custos do processo, e para isto, deve-se fazer
um planejamento.
O planejamento das cartas de controle pode ser feito utilizando quatro critérios
diferentes:

O heurístico de Shewhart

O econômico-estatístico

O semi-econômico

O econômico
O planejamento de cartas de controle heurístico de Shewhart é pouco utilizado
nos dias de hoje, pois ele não leva em consideração nenhum parâmetro de custo.
O planejamento econômico-estatístico foi proposto por Saniga (1989) com o
intuito de criar um planejamento econômico levando em consideração a probabilidade
dos erros de classificação, ou seja, os erros do tipo І e ІІ. Este planejamento adota
algumas restrições estatísticas no modelo econômico para as empresas obterem
processos com uma menor variabilidade e consequentemente, produtos com maior
qualidade. Portanto, este planejamento tem a vantagem de produzir produtos com
maior qualidade, porém gera um custo esperado maior do que os planejamentos semieconômico e econômico.
O planejamento semi-econômico considera algumas grandezas relacionadas aos
custos, como por exemplo o custo de amostragem, a frequência de alarmes falsos e o
tempo de detecção do processo fora de controle; porém este tipo de planejamento não
considera todos os custos relevantes e com isso não aplica técnicas otimização a uma
função de custo. Os principais trabalhos relacionados ao planejamento semi-econômico
são de Girshick e Rubin (1952) e Weiler (1952).
O planejamento econômico de cartas de controle busca minimizar uma função
que representa todos os custos relevantes do processo de produção. Segundo Woodall
(1986), este procedimento apresenta algumas fragilidades, tais como:

Maior incidência de alarmes falsos. Isto se deve ao fato do planejamento gerar
riscos muito grandes ao produtor, ou seja,

muito grande.
Não detecta rapidamente os desvios padrões esperados do processo, causado
pelo fato de que na maioria das vezes o risco do produtor também é grande, ou seja,
muito grande.

Não é eficaz na detecção de pequenos desvios não esperados pelo processo. Este
problema ocorre quando as cartas de controle utilizadas no planejamento econômico
24
são de , pois elas não são sensíveis a pequenas mudanças. Podem-se utilizar outras
cartas de controle que captam essas pequenas mudanças, como por exemplo, as cartas
CUSUM.
Em geral, os modelos econômicos buscam selecionar parâmetros de tal modo
que maximize o lucro total esperado do processo de produção (WOODALL, 1987). O
principal trabalho sobre planejamento econômico de cartas de controle foi apresentado
por Duncan (1956), no qual foi proposto um planejamento econômico de cartas de
controle
. Neste planejamento, Duncan considerou as seguintes suposições para o
modelo econômico de cartas de controle:
i)
O processo é caracterizado por ter somente um estado sob controle.
ii)
As causas especiais que o processo pode sofrer, resultando em uma mudança do
valor desejado, ocorrem de acordo com um Processo de Poisson.
iii)
A transição entre os estados é instantânea.
iv)
O processo não é autocorretivo, ou seja, só com intervenção humana que o
processo volta ao estado sob controle.
O objetivo é encontrar três parâmetros que minimizem o custo esperado do
processo, que são:
- O tamanho de amostra ;
- O intervalo entre amostras ;
- Largura dos limites de controle (que nas seções anteriores, foi considerada igual a
três) .
A média do processo sob controle é dada por
, e que uma única causa especial
de magnitude , provoca uma mudança da média do processo de
No modelo apresentado, considera-se que os parâmetros
que os parâmetros ,
e
,
para
e
.
são conhecidos, e
devem ser decididos.
Após o trabalho de Duncan, vários autores fizeram pesquisas na área de
planejamento econômico em cartas de controle. Ladany (1973) desenvolveu o
planejamento econômico para cartas de controle , e logo após, vieram vários trabalhos
sobre o planejamento econômico para as cartas de controle de Shewhart (incluindo
cartas de controle
e ). Gibra (1975) apresentou uma lista de referências de trabalhos
sobre técnicas de cartas de controle. Montgomery (1980) fez uma revisão da literatura
do planejamento econômico em cartas de controle. Vance (1983) apresenta uma
bibliografia das técnicas de controle estatístico em cartas de controle.
25
Lorenzen e Vance (1986) desenvolveram um método de planejamento
econômico unificado que englobasse todas as cartas de controle. Este modelo busca
encontrar o tamanho amostral, o intervalo amostral e os limites de controle que
minimize uma função de custo calculada sob algumas suposições (Como o de Duncan
(1956)).
Este tipo de planejamento também pode ser utilizado em controle estatístico
on-line. Taguchi (1981), Taguchi (1985) e Taguchi et al. (1989) propuseram técnicas de
controle estatístico on-line e como aplicá-lo no planejamento econômico de processos.
Na próxima seção será abordada a metodologia do controle estatístico on-line e os
principais trabalhos relacionados a este assunto.
2.4- Controle On-line em cartas de controle
Controle on-line de processos está sendo cada vez mais utilizado nos últimos
anos. Vários estudiosos e pesquisadores vêm utilizando este método pois ele apresenta
resultados interessantes no campo quantitativo, principalmente na área de produção.
Este procedimento pode ser utilizado em cartas de controle por variáveis e
cartas de controle por atributo.
O controle on-line por atributos primeiramente proposto por Taguchi e al.
(1989) consiste em retirar e analisar apenas um único item da linha de produção a cada
intervalo de
itens produzidos. Esse método é conhecido como modelo de Taguchi
para controle on-line de processos, e seu objetivo é determinar o intervalo ótimo de
inspeção, minimizando o custo por item em um ciclo de produção.
Muitos autores desenvolveram modelos de controle on-line com determinadas
particularidades para atender as necessidades de cada área: Nayebpour e Woodall
(1993) consideram um mecanismo de falha para o sistema, isto é, a mudança do
processo sob controle para o processo fora de controle por meio das amostras segue
uma distribuição geométrica; Borges et al. (2001) propuseram um método que
considera presença de erros de classificação, ou seja, considera que pode haver erro no
julgamento do estado de um item; Bessegato (2009), Bessegato (2011) e Bessegato
(2012) incorporou algumas características no modelo como intervalo de inspeção
variável, amostra não unitária e decisões não dicotômicas; Quinino e Ho (2004) e Ho e
Trindade (2007) consideram o uso de classificações repetidas visando minimizar os
custos.
26
Ho e Trindade (2007) garantem que esta metodologia pode ser utilizada em
sistemas de produção com controles automáticos como soldagem, produção de diodos
para placas de circuitos elétricos, produção de semicondutores e processos químicos em
geral.
O controle on-line por variáveis é um método proposto por Taguchi et al.
(1985, 1989) baseado na inspeção de um único item a cada
itens produzidos com o
intuito de minimizar os custos médios por meio de mudanças nos parâmetros do
processo. O item selecionado é inspecionado e classificado dentro da região de aceitação
ou não, sendo que se o item for classificado fora da região de aceitação, o processo é
interrompido e corrigido, caso contrário o processo continua operando normalmente.
No final deste trabalho, será feita uma aplicação dos modelos ocultos de Markov
em controle on-line de cartas de controle.
No próximo capítulo será revisada toda a metodologia de cadeias de Markov e
conseguinte, será apresentada a metodologia dos modelos ocultos de Markov.
27
3-
Modelos Ocultos de Markov (HMM)
Neste capítulo será feita uma breve revisão do método de cadeias de Markov
para, em seguida, apresentar a metodologia dos modelos ocultos de Markov.
3.1- Cadeias de Markov
Antes de iniciar as definições do método de cadeias de Markov, será introduzido
o conceito dos processos estocástico e Markoviano para melhor entendimento.
3.1.1- Processos Estocástico e Markoviano
Um processo estocástico
é uma sequência de variáveis aleatórias
indexadas por algum elemento , que geralmente é o tempo; ou seja, para cada
,
é uma variável aleatória.
O conjunto
é chamado de conjunto de índices de um processo estocástico, e se
este for contável, é dito que o processo estocástico é um processo de tempo discreto
(Este trabalho será voltado apenas para processos de tempos discretos). O espaço de
estados
de um processo estocástico é definido como o conjunto de todos os valores
possíveis que as variáveis aleatórias
podem assumir (ROSS, 2007).
Para fixar ideias, considere o seguinte exemplo: Imagine que nos dias do mês de
janeiro, a probabilidade de um dia estar nublado é 0,2; de estar chuvoso é 0,3; e de estar
ensolarado é 0,5. Este exemplo pode ser considerado como um processo estocástico de
tempo discreto, onde
é o clima do dia no mês de janeiro. Neste caso, o conjunto de
índices seria
seguinte
e
, admitindo que 32 seria o dia primeiro de janeiro no ano
assim
consecutivamente,
e
o
espaço
de
estados
seria
.
Portanto, um processo estocástico nada mais é que uma coleção de variáveis
aleatórias que descrevem o comportamento de algum processo com o passar do tempo.
Uma vez definido o que é um processo estocástico, é de fácil compreensão o conceito de
um processo Markoviano.
Um processo Markoviano é um processo estocástico que possui a propriedade
de Markov, ou seja, possui a seguinte propriedade (ATUNCAR, 2011):
(31)
28
Esta propriedade, que também pode ser chamada de memória Markoviana,
possui a peculiaridade de serem irrelevantes os estados anteriores para a predição do
estado seguinte, desde que o estado atual seja conhecido.
Agora considere o exemplo anterior reformulado: Sabe-se que no mês de
janeiro, considerando sempre o clima de determinado dia, há três probabilidades de
ocorrências de clima no dia seguinte: i) dado que determinado dia é nublado, a
probabilidade de o dia seguinte ser nublado é de 0,4, de ser chuvoso é de 0,3, e de ser
ensolarado é de 0,3; ii) dado que determinado dia é chuvoso, a probabilidade de o dia
seguinte ser nublado é de 0,3, de ser chuvoso é de 0,6, e de ser ensolarado é de 0,1; e iii)
dado que determinado dia é ensolarado, a probabilidade de o dia seguinte ser nublado é
de 0,2, de ser chuvoso é de 0,2, e de ser ensolarado é de 0,6. Este é um clássico exemplo
de processo Markoviano, já que o clima de um dia qualquer depende apenas do clima
do dia anterior. O conjunto de índices e o espaço de estados continua o mesmo do
exemplo antecedente a esse.
A partir destes conceitos, será introduzido na próxima seção o conceito de
cadeia de Markov, e conseguinte algumas de suas ferramentas e conceitos que
possibilitarão o seu uso no campo do controle estatístico on-line para o controle
estatístico de qualidade por meio de modelos ocultos de Markov. Esta seção será
voltada para cadeias de Markov em que o parâmetro do tempo é discreto e o espaço de
estados é finito e discreto.
3.1.2- Principais Conceitos
Cadeia de Markov é um processo estocástico com espaço de estados discretos
ou contínuos que apresenta a propriedade Markoviana, ou seja, em intervalos de
tempos regulares e discretos, este processo estocástico evolui de um estado para outro
dependentemente
apenas
do
seu
último
estado,
e
consequentemente
independentemente dos demais.
Considere um problema no qual em qualquer tempo o processo pode estar em
um estado de
estados distintos,
. Em espaços de tempos regulares e
discretos, este processo evolui de um estado para outro (ou possivelmente permanece
no mesmo estado) de acordo com uma matriz de probabilidades associada com cada
estado. Será denotado os instantes de tempo associados a cada mudança como
, e será denotado
como o atual estado do processo. Será dito que o processo
é uma cadeia de Markov se para todo (RABINER, 1989):
29
(32)
Sem formalidades, pode ser visto que (32) impõe que a distribuição condicional
de
dado o passado do processo dependa apenas do estado imediatamente anterior.
Portanto, pode-se definir a probabilidade de transição
do estado para o estado no
instante de tempo como:
(33)
Estas probabilidades de transição podem ser organizadas em uma matriz
quadrada de ordem
transição
que comumente é chamada de Matriz de probabilidades de
, ou seja:
(34)
Pode-se observar que para cada estado ,
define-se uma
função de distribuição de probabilidades. Com base nesta afirmação é possível
determinar duas propriedades para estas probabilidades de transição:
(35)
(36)
Uma matriz
que respeita (35) e (36) é chamada de Matriz Estocástica.
Agora será definido um vetor de probabilidades que determinará a distribuição
de probabilidades inicias de uma cadeia de Markov, que será chamada de Distribuição
inicial:
(37)
É possível modelar o último exemplo do clima dos dias de Janeiro por cadeia de
Markov. Veja que o processo é Markoviano com
(Nublado, chuvoso, ensolarado)
e que as probabilidades de transição respeitam as duas propriedades anteriores. O clima
será denotado para a melhor compreensão do exemplo como:
- Estado 1: Nublado
- Estado 2: Chuvoso
- Estado 3: Ensolarado
A partir das probabilidades de transição determinadas, e da notação definida
anteriormente para o clima do dia, a matriz de probabilidades de transição é dada por:
30
Formulado este modelo, é possível responder a várias perguntas como, por
exemplo: Dado que o clima do dia 4 de Janeiro foi ensolarado, qual é a probabilidade de
nos próximos cinco dias o clima ser “ensolarado, chuvoso, nublado, nublado e
chuvoso”?
Definindo formalmente o problema, a sequência de observações
determinada como
pode ser
sendo que o tempo corresponde é
. A probabilidade desta sequência dado o modelo pode ser expressa
por:
Agora serão apresentadas algumas definições de cadeia de Markov necessárias
para o estudo dos modelos ocultos de Markov no controle estatístico on-line. Primeiro
serão apresentadas as definições de irredutibilidade e periodicidade para conseguinte
apresentar o conceito da distribuição invariante.
3.1.3- Irredutibilidade
É dito que o estado
é acessível desde o estado
se existe uma trajetória do
estado ao estado , ou seja, se existe um número inteiro não negativo finito
tal que
. Se é acessível desde e é acessível desde , é dito que e comunicam.
Uma cadeia é irredutível quando todos os estados comunicam entre eles (ATUNCAR
2011).
Em problemas de controle estatístico de qualidade, como por exemplo, inspeção
de itens de uma linha de produção, a literatura revela que geralmente quando os
pesquisadores modelam estes problemas por meio de cadeias de Markov essas cadeias
31
se mostram irredutíveis, o que os possibilitam aplicar a técnica da distribuição
invariante para os cálculos desejáveis.
3.1.4- Periodicidade
É definido como período de um estado , representado por
divisor comum de todos os inteiros tais que
, o máximo
, ou seja:
(38)
Por exemplo, o processo começando no estado , é possível que o processo apenas possa
retornar ao estado nos tempos
estado com o período
, neste caso o estado tem período . Um
é chamado de aperiódico (ROSS, 2007).
É natural que os modelos probabilísticos por cadeia de Markov no controle
estatístico on-line tenham cadeias de Markov aperiódicas, uma vez que todos estados se
comunicam (o que implica em uma periodicidade igual a
de toda a cadeia).
3.1.5- Distribuição Invariante
Como neste presente trabalho não é tratado nenhuma aplicação de Modelos
Ocultos de Markov com espaço de estados infinitos, não foi necessário tratar de
recorrência, uma vez que esta definição é importante apenas no caso em que o modelo
tenha espaço de estados infinitos.
Se uma cadeia de Markov for finita, irredutível e aperiódica, pode-se afirmar que
existe a distribuição invariante e esta tem a seguinte forma:
(39)
Outra forma de calcular a distribuição invariante é dada a seguir:
(40)
em que
é a matriz de transição de probabilidades transposta de tamanho
é a matriz identidade de tamanho
distribuição invariante de tamanho
Se
,
é o vetor nulo de tamanho
,
e
éa
.
é a distribuição invariante de uma cadeia de Markov,
representa a probabilidade de que a cadeia se encontra no estado
após ela entrar em
32
equilíbrio. Outra interpretação importante para a distribuição invariante no controle
estatístico de qualidade é que ela representa a proporção de tempo em que o sistema de
produção visita cada estado após um número suficientemente grande de inspeções.
Nesta seção foi feita uma breve revisão dos principais conceitos de cadeia de
Markov para introduzir os modelos ocultos de Markov, que pode ser visto como uma
extensão de cadeia de Markov. Nas próximas seções serão discutidos: introdução à
metodologia dos modelos ocultos de Markov, alguns exemplos e aplicações, elementos
do modelo e os três problemas básicos e suas soluções.
3.2- Introdução do Modelo Oculto de Markov (HMM)
Em cadeia de Markov é considerado que cada estado corresponde a uma
observação. A literatura mostra que este modelo é muito restrito para ser aplicado em
muitos problemas. O modelo oculto de Markov (HMM) vem como uma extensão da
cadeia de Markov, pois agora o modelo inclui o caso no qual a observação é uma função
de probabilidade do estado, isto é, o modelo resultante é um processo estocástico de
dupla camada, na qual um processo estocástico é subjacente e não observável (oculto)
que pode ser apenas observado pelo outro processo estocástico que produz as
sequências de observações (RABINER 1989).
Os HMM’s formam uma classe de processos estocásticos que estão sendo
aplicados com sucesso em uma ampla variedade de problemas (COUVREUR 1996).
Por exemplo, em problemas de reconhecimento de fala, os modelos ocultos de Markov
conseguem caracterizar os sinais do mundo real em sinais do modelo; em dependências
no DNA, segundo Silva (2003), estes modelos conseguem capturar a heterogeneidade
que pode estar presente em diferentes regiões da mesma sequência de DNA; segundo
Souza (2010) este modelo pode ser aplicado na classificação de comportamentos
animais; em controle estatístico de qualidade no monitoramento de cartas de controle e
no controle on-line, que é o principal tema deste trabalho, entre outros.
Serão mostrados dois exemplos didáticos com o intuito de exemplificar o
HMM:
i) Suponha que há dois grupos mistos de pessoas, compostos por pessoas que
conseguem assobiar e pessoas que não conseguem assobiar. Contudo, todas as pessoas
conseguem bater palmas. No primeiro grupo, há três pessoas que conseguem assobiar e
uma que não consegue e, no segundo grupo, duas conseguem assobiar e duas não
conseguem. São gravadas algumas sequências de assobios e palmas, sendo que cada
33
pessoa assobia ou bate palma e, em seguida, escolhe aleatoriamente outra pessoa (ou a
si próprio) para fazer o mesmo. Se uma sequência qualquer de assobios e palmas for
coletada, é de interesse saber qual a probabilidade de uma observação ter sido gerada
pelo primeiro grupo ou pelo segundo grupo. Este processo pode ser facilmente
modelado por HMM, sendo que o grupo a qual é escolhida a pessoa é o processo não
observável e a sequência de assobios e palmas (observações) é o processo observável.
O termo “observações” pode ter diferentes interpretações quando utilizado em
cadeia de Markov ou em modelo oculto de Markov; no primeiro, significa que são os
estados percorridos pelo modelo; enquanto que no segundo são os símbolos gerados
nos estados do modelo (SOUZA, 2010).
ii) Considere que em uma sala há
cada uma delas. Assume-se que há
urnas com diferentes números de bolas em
cores de bolas distintas. O processo é dado pela
seguinte maneira: Primeiro a pessoa escolhe uma urna inicial, e desta urna uma bola é
escolhida ao acaso; observa-se a cor da bola e consequentemente essa cor se torna a
observação do processo. A bola é recolocada em sua urna e então uma nova urna é
escolhida aleatoriamente de acordo com alguma distribuição de probabilidades
associada com a atual urna; uma bola é escolhida aleatoriamente, observa-se a cor e a
recoloca em sua urna. O processo é repetido muitas vezes e, portanto gera uma
sequência observações constituída pelas cores das bolas.
Este processo pode ser modelado por HMM, já que são nítidas as duas camadas
de um processo estocástico: o processo observável, que representa a cor da bola; e o
processo não observável, que representa a escolha da urna. Como a sequência das cores
não revela a sequência de urnas pode-se considerar que o processo das urnas é não
observável (RABINER 1989). A figura a seguir ilustra este exemplo:
34
Fonte: Rabiner (1989).
Figura 3 - Modelo de urnas e bolas
3.3- Elementos do HMM
Os dois exemplos apresentados anteriormente mostram basicamente o que é um
HMM e como ele pode ser aplicado em diferentes e simples cenários. Agora serão
apresentados formalmente os elementos que constituem um HMM e como estes
modelos geram as sequências de observações. Sempre que apresentado algum elemento
do HMM será remetido ao exemplo ii da seção 3.3 para facilitar a compreensão. Será
preservada a notação utilizada no primeiro tópico deste capítulo.
Um HMM é caracterizado pelos seguintes elementos:
i)
representa o número de estados do modelo. Embora os estados sejam
ocultos, em muitos problemas práticos há um significado importante para os estados ou
para uma sequência de estados. No modelo das urnas e bolas, os estados
corresponderiam às urnas.
ii)
corresponde ao conjunto dos estados individuais do
modelo. No modelo das urnas e bolas seria cada urna, como por exemplo,
seria a
segunda urna da sala.
iii)
exemplo,
iv)
corresponde ao estado no tempo . No modelo das urnas e bolas, por
significa que a terceira urna escolhida foi a primeira urna.
representa o número de observações distintas por estado. No modelo
das urnas e bolas, o número de observações distintas corresponderia ao número de
bolas distintas.
35
v)
corresponde
ao
conjunto
de
observações
individuais. No modelo das urnas e bolas seria o conjunto de bolas de uma urna.
vi)
corresponde a distribuição de probabilidades de transição dos
estados, dada por:
(41)
Para os problemas relacionados ao controle estatístico de qualidade, essas
probabilidades seguem um caso especial onde qualquer estado pode ser alcançado por
outro estado com um único passo, ou seja,
para todo e ; para outros casos de
HMM’s alguns estados não podem ser alcançados ou é necessário mais de um passo
para serem alcançados. No modelo das urnas e bolas, supondo que a escolha das urnas
tenha a mesma probabilidade, independente do estado anterior, essa distribuição de
probabilidades respeitaria um distribuição uniforme discreta, resultando em uma
probabilidade igual para as urnas:
vii)
para todo e .
corresponde a distribuição de probabilidade da observação
no estado, dada por:
(42)
.
No modelo das urnas e bolas, supondo que a urna escolhida foi a urna dois na
primeira escolha tenha duas bolas brancas, uma preta e duas vermelhas, a distribuição
de probabilidades das observações neste estado são:
viii)
corresponde a distribuição inicial dos estados, dada por:
(43)
No modelo das urnas e bolas, supondo que a probabilidade de escolher
inicialmente uma urna fosse igual, a distribuição inicial dos estados respeitaria uma
distribuição uniforme discreta, resultando em uma probabilidade igual para as urnas:
para todo e .
Dados os valores apropriados dos elementos do HMM, este pode ser usado para
gerar uma sequência de observações
, onde cada observação
é um
36
dos símbolos de
, e
é o número de observações da sequência. Para gerar essa
sequência de observações basta seguir os seguintes passos:
1)
Escolha um estado inicial
de acordo com a distribuição inicial
dos estados .
2)
Compute
3)
Escolha
de acordo com a distribuição de probabilidade de
observação do estado
4)
.
, isto é,
.
Transite para um novo estado
probabilidade de transição do estado para o estado
5)
Compute
de acordo com a distribuição de
, isto é,
.
; retorne para o passo 3) se
; caso contrário
termine o procedimento.
O procedimento pode ser usado tanto para gerar uma sequência de observações
quanto para mostrar como que uma dada sequência de observações foi gerada pelo
apropriado HMM (RABINER 1989).
Claramente pode-se constatar que um HMM pode ser completamente definido
pela distribuição de probabilidades de transição dos estados
, pela distribuição de
probabilidade da observação no estado , e pela distribuição inicial dos estados ; logo
é definida uma notação compacta para representar um HMM, dada por:
(44)
Nesta seção foram apresentados os elementos que constituem um HMM. Na
próxima seção estes elementos serão utilizados para resolver os três problemas básicos
dos HMM.
3.4- Os três problemas básicos do HMM
Na última seção foram apresentados os elementos do HMM. Porém definidos
estes elementos, aparecem três problemas que devem ser solucionados para que este
tipo de modelo seja útil em aplicações do mundo real. Os três problemas do HMM são
(RABINER 1989):
- Problema 1: Dado uma sequência de observações
e o HMM
, como de maneira eficiente se pode calcular a probabilidade da sequência
dado o modelo
?
37
- Problema 2: Dado uma sequência de observações
e o HMM
, como escolher a sequência de estados que maximize a sequência de
observações?
- Problema 3: Como ajustar os parâmetros de um HMM com o intuito de maximizar a
probabilidade da sequência
?
O problema 1 se trata de definir a probabilidade de uma sequência dado o
HMM, ou também, este problema pode ser interpretado como quão bem um modelo se
ajusta a uma sequência de observações. Esta última interpretação é extremamente útil,
como por exemplo, no reconhecimento de fala. Quando se utiliza HMM em
reconhecimento de fala, ao se produzir um fonema qualquer, essa entrada pode ser
classificada como pertencente ao modelo que indicar a maior probabilidade
, ou
seja, um método eficaz para fazer comparação de modelos (SOUZA 2010).
O problema 2 se trata de definir a sequência de estados que melhor explica a
sequência de observações, ou seja, a sequência de estados cuja probabilidade seja a
maior dentre todas as sequências de estados possíveis do modelo. Informalmente, este
problema busca desvendar a parte oculta do modelo, isto é, achar a sequência de
estados “correta”. Porém deve ficar claro que este problema não determina a sequência
de estados correta, apenas a sequência que tem maior probabilidade de corresponder a
uma determinada sequência de observações.
O problema 3 se trata da otimização dos parâmetros do modelo, ou seja, a
configuração de . As sequências de observações utilizadas para ajustar o modelo são
chamadas de sequências de treinamento, pois que são usadas para treinar o HMM. Esta
etapa é de suma importância, pois ela permite adaptar os parâmetros do modelo,
criando os melhores modelos para o mundo real.
Nos próximos tópicos serão apresentadas as soluções destes problemas.
3.4.1- Probabilidade de uma sequência de observações
O objetivo desta seção é calcular a probabilidade de uma sequência de
observações
dado o HMM , isto é,
. O modo mais trivial e
direto para calcular essa probabilidade é através da verificação de todas as sequências
de estados possíveis de tamanho
que o modelo pode gerar, e, conseguinte, efetuar o
cálculo das sequências de observações terem sido geradas pelos respectivos estados
dessas sequências.
38
Para efetuar o cálculo por este modo trivial, considere uma sequência de estados
fixa :
Onde
e
representam os estados iniciais e finais da sequência de estados. Dado
esta sequência de estados, é possível definir a probabilidade de uma sequência de
observações
por:
(45)
Assumindo independência entre as observações, tem-se que:
(46)
A probabilidade de uma sequência de estados pode ser escrita por:
(47)
Pelo lema da probabilidade condicional, a probabilidade conjunta de
e
é dada por:
(48)
Por fim, pelo lema da probabilidade total, a probabilidade de uma sequência de
observações
ter sido gerada pelo modelo é a soma de (48) para todas as sequências de
estados possíveis em , dada por:
(49)
Que também pode ser escrita como:
(50)
Por esta formula, pode-se fazer a seguinte interpretação: i) Inicializa-se o
processo
escolhendo o primeiro estado
uma observação
com probabilidade
com probabilidade
com probabilidade
última transição do estado
probabilidade
; ii) gera-se
; iii) o tempo muda para
processo transita para o estado
observação
com probabilidade
eo
; iv) gera-se uma
. Este processo continua até acontecer a
para
e gerar a última observação
com
.
O problema para efetuar este cálculo é que o número de possíveis sequências de
estados de tamanho
utilizando os
estados é
. E se for reescrita apenas o termo
dentro do somatório de (50), é obtido:
(51)
Pode-se visualizar que em cada produtório realiza-se
multiplicações, logo, para
efetuar o cálculo de (51), deve-se realizar
39
multiplicações para cada sequência de estados. Dessa forma, para efetuar o cálculo da
probabilidade de uma sequência de observações a partir das equações anteriores, é
preciso realizar
multiplicações e
adições, o que torna o processo
impraticável computacionalmente para diversos casos (SOUZA 2010).
Para a solução deste problema ser possível, é preciso um procedimento mais
eficiente e computacionalmente possível. Baum e Egon (1967) e Baum e Shel (1968)
propuseram dois procedimentos independentes e capazes de resolver este problema de
uma maneira eficiente e computacionalmente praticável, chamados de Forward
Backward.
Os procedimentos Forward e Backward utilizam técnicas de programação
dinâmica, e com isso requer um número de multiplicações e adições consideravelmente
menor do que o procedimento anterior para efetuar o cálculo da probabilidade da
sequência de uma observação dado o HMM.
Considere a variável Forward definida por:
(52)
Isto é, a variável Forward é a probabilidade conjunta da sequência de
observações parcial
e do estado ser
no tempo
, dado o HMM.
Indutivamente pode-se usar a variável Forward para efetuar o cálculo de
como
descrito abaixo:
1)
Inicialização:
(53)
ou seja, a variável Forward em
observação
2)
é a probabilidade conjunta de observar a
e o sistema estar no estado
dado o modelo.
Indução:
(54)
Será mostrado o segundo passo deste procedimento com um intuito didático.
(55)
A variável Forward em
sequência de observações
produto
é a probabilidade conjunta de observar a
e o sistema estar no estado
dado o modelo. O
pode ser interpretado como
último produto por todos os estados que
, obtêm-se
; somando este
pode assumir em
, ou seja,
; e finalmente, se multiplicar este último
40
termo pela probabilidade da segunda observação ser
resulta em
3)
. Esta etapa do cálculo é repetido até
dado
, ou seja,
,
.
Terminação:
(56)
Pela definição, pode-se afirmar que:
(57)
Pelo teorema da probabilidade total, basta somar todos os
a probabilidade desejada, ou seja,
’s para se obter
.
Inicializa-se o processo definindo a variável Forward como a probabilidade
conjunta do estado
e a observação inicial
. O segundo passo, que é a indução, é
ilustrada nas figuras a seguir:
Fonte: Rabiner (1989).
Figura 4 - Ilustração da sequência de operações requeridas para a computação da
variável Forward  (t 1) ( j )
41
Fonte: Rabiner (1989).
Figura 5 - Implementação da computação de  t (i ) em termos das observações t
e dos estados i
Esta figura mostra como o estado
estados possíveis
pode ser alcançado no tempo
pelos
, no tempo .
O número de cálculos computacionais utilizados para realizar este
procedimento é apenas
, enquanto que no procedimento direto seria
.
De modo análogo e independente, o procedimento Backward também fornece a
probabilidade de uma sequência de observações dado o modelo. Este procedimento
também utiliza técnicas de programação dinâmica, porém vale ressaltar que ele é
independente do procedimento Forward e que apenas um dos procedimentos é
necessário para o cálculo da probabilidade desejada.
Considere a variável Backward definida por:
1)
Inicialização:
(58)
Este procedimento começa pela última observação da sequência, e assim sendo,
a variável Backward assume um no tempo
, pois considera todas as sequências de
observações possíveis.
2)
Indução:
(59)
Como este procedimento funciona “de trás para frente”, será considerado agora
o segundo tempo para procedimento, que para o processo seria
:
42
(60)
Como
é igual a um, chega-se a
. Esta expressão mostra
que a variável Backward capta todas as mudanças dos possíveis
assumir fixando o estado
por meio das probabilidades de transição
probabilidades das observações nos estados
3)
estados que
pode
e das
.
Terminação:
(61)
Para visualizar como que o processo de indução termina, considere as
expressões abaixo:
(62)
Por estes passos, pode-se visualizar que a variável Backward regride capturando
todos os possíveis caminhos que a sequência de observações pode apresentar.
Inicializa-se o processo definindo como um a variável Backward no tempo
. O segundo passo, que é a indução, é ilustrada na figura a seguir:
Fonte: Rabiner (1989).
Figura 6 - Ilustração da sequência de operações requeridas para a computação da
variável Backward  t (i )
43
Esta figura mostra que o processo estando no estado
considerar todos os estados possíveis
probabilidades de transição
no tempo , deve-se
no tempo
de acordo com as
, com as probabilidades da observação no estado
, e com a sequência de observações parcial para o estado ,
.
O procedimento Backward requer o mesmo número de operações para efetuar o
cálculo da probabilidade desejada, ou seja,
. Na resolução dos próximos dois
problemas do HMM, as variáveis estudadas nesta seção serão conjuntamente
necessárias.
Como citado anteriormente, este problema é comumente utilizado para a
comparação e escolha de modelos. A informação desejada é a probabilidade do modelo
dada uma sequência de observações, ou seja,
. Com base no teorema de Bayes,
pode-se reescrever essa probabilidade da seguinte forma (SOUZA 2010):
(63)
Do ponto de vista Bayesiano,
representa a posteriori,
a verossimilhança da sequência de observações dado o modelo, e
representa
seria a apriori; ou
seja, geralmente a probabilidade de ocorrência de determinado modelo pode ser
estimada matematicamente por meio de um conhecimento apriori sobre a aplicação em
questão. A probabilidade da sequência das observações
geralmente não é simples
de ser calculada, porém, se o objetivo for a comparação de modelos e
consequentemente, a comparação de
, pode-se considerar
como uma
constante, pois esta probabilidade não depende de nenhum parâmetro.
3.4.2- Melhor sequência de estados
Este problema, diferentemente do problema apresentado na seção anterior,
pode ter vários modos de ser solucionado, isto é, de encontrar a sequência de estados
que melhor explica a sequência de observações. Isto se deve ao fato de cada solução ter
diferentes critérios para efetuar esta busca. Por exemplo, pode-se definir o critério de
buscar sempre o estado
que individualmente é o mais provável para dada
observação. Este método maximiza o número esperado de estados individuais corretos,
porem pode apresentar alguns problemas como, por exemplo, sequências de estados
impossíveis. Para implementar a solução deste problema, será definido a seguinte
variável:
(64)
44
Isto é, a probabilidade do processo estar no estado
no tempo
dado a
sequência de observações e o modelo. Pelo teorema da probabilidade condicional, podese mostrar que:
(65)
Consequentemente pode-se reescrever (64) como:
(66)
Foi mostrado que esta variável pode ser expressa em termos de variáveis
Forward e Backward, pois a variável Forward representa a sequência de observações
parcial
e o processo estar no estado
no tempo , e a variável Backward
representa a sequência de observações parcial
e o processo estar no estado
no tempo . O fator de normalização
faz a variável
se torna
uma medida de probabilidade, e portanto, tem-se que:
(67)
Para o critério do estado individualmente mais provável, pode-se usar esta
variável para solucionar o problema como:
(68)
Porém o foco deste problema não será por este critério, pois como já dito, pode
criar sequências de estados impossíveis para o processo. O critério mais razoável e mais
utilizado para solucionar este problema é buscar uma única sequência de estados que
melhor explica a sequência das observações, isto é, maximiza
consequentemente maximiza
, e
. Uma técnica para encontrar a única sequência
de estados que maximiza esta probabilidade é baseada no método da programação
dinâmica, e é chamada de algoritmo Viterbi (VITERBI, 1967 e FORNEY, 1973).
Dada um sequência de observações
sequência de estados,
, para encontrar a melhor
, deve-se definir a seguinte variável:
(69)
ou seja,
é a maior probabilidade ao longo de uma única sequência no tempo .
Esta variável carrega a probabilidade das primeiras
tempo terminar no estado
observações e do processo no
. Por indução tem-se:
45
(70)
Para guardar a sequência de estados é necessário manter a faixa do argumento
que maximiza (70) para cada e . É possível fazer tal feito pelo vetor
Este procedimento utiliza a variável
.
para o armazenamento das
probabilidades da sequência dos estados e a variável
para o armazenamento da
sequência de estados. O procedimento completo para encontrar a melhor sequência de
estados segue os seguintes passos (RABINER, 1989):
1)
Inicialização:
(71)
(72)
Esta etapa do procedimento apenas serve para inicializa-lo, uma vez que
não consegue fornecer o melhor estado para o tempo
, logo, ele apenas guarda
para o passo da recursão. Como nenhum estado é selecionado como o
melhor, atribui-se zero para
2)
.
Recursão:
(73)
(74)
Esta etapa acumula as probabilidades das melhores sequências parciais a cada
passo por
, e acumula as melhores sequências parciais por
. Será considerado
agora o segundo tempo do procedimento afim de uma melhor visualização do mesmo:
(75)
ou seja,
procura qual o estado que maximiza a probabilidade conjunta da primeira
observação e o primeiro estado dado o modelo a partir da distribuição inicial
probabilidade da primeira observação dado o estado
transição
3)
,
, da
, a probabilidade de
, e a probabilidade da segunda observação dado o estado
,
.
Terminação:
(76)
(77)
Esta etapa fornece a melhor sequência de estados
4)
, e sua probabilidade,
.
“Caminho de volta” (Sequência de estados):
46
(78)
Por meio de (78), pode-se determinar a sequência de estados parcial, muitas
vezes importante para o pesquisador.
3.4.3- Estimação dos parâmetros
Este último problema está atento em estimar os três parâmetros do HMM, os
quais são: a matriz de transição de probabilidade , a distribuição de probabilidades da
observação no estado
, e a distribuição inicial do modelo . O objetivo é determinar
um método que ajusta os parâmetros do modelo que maximiza a probabilidade de uma
sequência de observação, geralmente chamada de sequência de treinamento.
Não há analiticamente um método para estimar estes parâmetros de modo que
maximize a probabilidade das sequências de observações, contudo, é possível
determinar um modelo
tal que
é maximizada localmente. Para a
solução deste problema será utilizado o algoritmo de Baum-Welch (DEMPSTER et al,
1977), que se trata de uma particularização do algoritmo EM aplicado aos HMM’s.
Com o intuito de apresentar o procedimento para a reestimação dos parâmetros
do modelo, será definida a variável
estar no estado
no tempo
, que é a probabilidade conjunta do processo
e do processo estar no estado
no tempo
dado o
modelo e a sequência de observações, isto é:
(79)
Esta variável pode ser interpretada pela seguinte forma:
(80)
ou seja, esta variável também pode ser expressa em termos das variáveis Forward e
Backward. O termo
foi adicionado na expressão apenas para dar uma medida de
47
probabilidade na variável. Com base nestes resultados, é possível afirmar que esta
variável pode ser ilustrada da seguinte maneira:
Fonte: Rabiner (1989).
Figura 7 - Ilustração da sequência de operações requeridas para a computação do
evento conjunto do sistema estar no estado S i no tempo t e de estar no estado
S j no tempo t+1
Previamente vista na seção 2.4.2, a variável
variável
pode ser relacionada à
da seguinte maneira:
(81)
Se somar
pelo índice de tempo
chega-se a quantidade
interpretada como o número esperado de vezes que o estado
que pode ser
é visitado pelo processo,
ou seja:
(82)
Similarmente, se somar
chega-se a quantidade
transições do estado
pelo índice de tempo
(de
a
)
que pode ser interpretada como o número esperado de
para o estado
, isto é:
(83)
Utilizando (82) e (83) pode-se estabelecer um método de reestimação dos
parâmetros do modelo, ,
e , dados por:
(84)
48
(85)
(86)
Dado o modelo
parâmetros
modelo antigo
, o procedimento de reestimação estabelece novos
, e foi provado por Baker (1975), Baum e Sell (1968) que ou o
é o ponto máximo da função de verossimilhança, que neste caso
ou o modelo novo
é mais provável que o modelo antigo , ou seja,
,
.
Com o intuito de reestimar os parâmetros do modelo, o algoritmo Baum-Welch
realiza muitas iterações sobre a sequência de observações dada, por isso deve-se criar
um critério para finalizar a reestimação dos parâmetros. O resultado final do
procedimento de reestimação é chamado de estimativa de máxima verossimilhança do
modelo.
Uma vez apresentados os conceitos de controle estatístico de qualidade, de
controle estatístico on-line e dos modelos ocultos de Markov, o próximo capítulo será
apresentado uma aplicação do HMM no controle estatístico on-line para a estimação
das probabilidades de alarme falso e a não detecção, que são importantes para o
planejamento do processo.
49
4-
HMM no controle estatístico on-line
No capítulo 2 foi apresentado o controle estatístico de qualidade e uma de suas
ferramentas mais utilizadas hoje em dia, o controle estatístico on-line, que serve para
monitorar processos de produção a fim de estabelecer níveis de qualidade adequados
para os produtos. No capítulo 3 foi apresentado o modelo oculto de Markov e alguns
exemplos.
O controle on-line tem a característica de ter intervalos de amostragem iguais, o
que possibilita o uso de cadeias de Markov para sua modelagem. Porém, pode-se
considerar que este processo tem um sistema não observável importante para o
modelo, o qual é a real situação da linha de produção, isto é, se o processo está
operando sob controle ou fora dele. Com base nesta informação, pode-se concluir que
este sistema é regido por duas cadeias de Markov, sendo elas dependente entre si, ou
seja, um modelo oculto de Markov.
Visto que é possível modelar o controle estatístico on-line via modelo oculto de
Markov, este capítulo apresenta esta metodologia com o intuito de realizar a estimação
das probabilidades de alarme falso e a de não detecção.
Este capítulo está disposto em 4.1 Introdução, 4.2 Alarme falso e Não detecção.
4.1- Introdução
Considere o seguinte monitoramento por controle on-line por variável para
processos de produção: Um intervalo de aceitação
é proposto baseado nos
requerimentos de qualidade da indústria e na distribuição da característica de
qualidade. A cada
itens produzidos, um único item é retirado do processo de
produção e examinado. Se o item examinado estiver dentro deste intervalo de aceitação
o processo é dito estar sob controle estatístico e o processo continua, caso contrário, o
processo é declarado fora de controle estatístico e é interrompido para o ajuste. Após o
ajuste do processo um novo ciclo começa.
Um ciclo, como definido antes, é o intervalo de tempo que o processo está sob
controle e a detecção e eliminação de alguma causa especial, ou seja, a cada parada para
ajuste um novo ciclo é iniciado.
Agora suponha que este processo possa ser modelado por dois processos
estocásticos distintos, porém dependentes. O primeiro processo seria a verdadeira
situação do processo (não observável), isto é, se realmente está sob controle ou fora de
controle. O segundo processo seria a declaração do processo, ou seja, se o item
50
examinado estiver dentro do intervalo de aceitação o processo é considerado sob
controle, caso contrário, é considerado fora de controle.
Ho et al. (2007) propuseram um modelo para este tipo de processo que é
governado por uma cadeia de Markov de dois estágios, ou melhor, um modelo oculto
de Markov (HMM).
Como todo HMM, este modelo possui dois processos estocásticos, sendo que o
primeiro é não observável, e o segundo, que está interligado ao primeiro, é observável.
O primeiro processo estocástico é definido por
sob controle e
, onde
o processo está
o processo está fora de controle. Como nunca se sabe qual é o
verdadeiro estado em que o processo se encontra, este processo estocástico é não
observável. O segundo processo estocástico é definido pela variável observável
relativa a característica de qualidade que está se medindo. A cada
,
amostras seleciona
um item e examina o produto com o intuito de saber se a estatística calculada está no
intervalo de aceitação
definido por:
(87)
que pela literatura é definido considerando uma função de custo a ser minimizada.
A figura a seguir descreve o monitoramento do processo via HMM:
 0   m   2m   km 
X 0  X m  X 2m  X km 
Inspeção
0  m  2m  km 
Fonte: Adaptado de Ho et al. (2007).
Figura 8 - Descrição do processo de inspeção
Portanto, pode-se notar que uma cadeia de Markov
descreve a evolução
da real situação do processo e, associada a esta cadeia, pode-se observar uma sequência
de variáveis aleatórias independentes condicionadas
variável
, com a distribuição de cada
dependendo de cada estado correspondente
. Como este processo
representa um HMM, têm-se as seguintes propriedades (DOREA et al., 2012):
(88)
51
(89)
sendo que
são eventos.
A expressão (88) representa a propriedade de Markov, ou seja, é irrelevante o
conhecimento dos estados anteriores para a predição do estado seguinte, desde que o
estado atual seja conhecido. (89) mostra que as observações são independentes uma das
outras, uma propriedade muito importante para várias suposições e definições deste
trabalho.
Utilizando as definições do capítulo 3 têm-se que:
i)
representa o número de estados do modelo, ou seja, nesta aplicação
, pois o processo pode se encontrar sob controle ou fora de controle.
ii)
corresponde ao conjunto dos estados individuais
do modelo, que neste caso serão definidos por:
iii)
corresponde ao estado no tempo .
iv)
representa o número de observações distintas por estado, isto é,
, pois o processo pode ser declarado sob controle ou fora de controle.
v)
corresponde
ao
conjunto
de
observações
individuais. Neste modelo as observações individuais são definidas por:
vi)
corresponde a distribuição de probabilidades de transição dos
estados, dada por:
(90)
Para esta aplicação, esta distribuição de probabilidades de transição é governada
por uma distribuição geométrica.
vii)
corresponde a distribuição de probabilidade da observação
no estado, dada por:
(91)
No modelo em destaque, definem-se duas probabilidades das observações em
cada estado, dado por:
52
- Probabilidade de declarar o processo sob controle sendo que ele está sob
controle:
(92)
- Probabilidade de declarar o processo sob controle sendo que ele está fora de
controle (Não detecção):
(93)
- Probabilidade de declarar o processo fora de controle sendo que ele está sob
controle (Alarme falso):
(94)
- Probabilidade de declarar o processo fora de controle sendo que ele está fora
de controle (Poder):
(95)
No modelo proposto, o alarme falso acontece quando a característica de
qualidade observada caia fora do intervalo de aceitação , ou seja,
processo está sob controle
, sendo que o
. A não detecção ocorre quando a característica de
qualidade observada caia dentro do intervalo de aceitação, isto é,
processo está fora de controle
, sendo que o
.
Na próxima seção serão definidas as probabilidades de alarme falso e de não
detecção assumindo conhecidas as equações (88) e (89).
4.2- Alarme falso e Não detecção
Para um HMM
, assume-se que a cadeia
probabilidades conhecida, e dada por:
tem distribuição de
(96)
Assume-se que a distribuição condicional de
dado
também é conhecida, e
baseada na distribuição de probabilidades, uma região de controle
é pré-selecionada.
Tem-se que (DOREA, 2012):
(97)
A partir de (97), pode-se definir a probabilidade de um item selecionado cair
fora da região de aceitação dado que o processo está sob cotrole, dada por:
53
(98)
e podem-se definir as probabilidades do item selecionado cair fora da região de
aceitação dado que o processo está fora de controle e do item selecionado cair dentro da
região de aceitação dado que o processo está fora de controle, consecutivamente dadas
por:
(99)
(100)
Supondo que o intervalo amostral seja fixo e igual a um, ou seja,
, o
monitoramente de qualidade das cartas de controle on-line adota a seguinte estratégia:
i)
Os itens
são inspecionados e verificados enquanto todos
pertençam à região de aceitação .
ii)
A manutenção é necessária no tempo se
.
Podem-se definir os tempos de alerta, ou seja, tanto quando acontece o alarme
falso quanto o alarme é verdadeiro, como (DOREA et al., 2012):
(101)
isto é, o tempo de alerta é definido como o menor valor de tempo
em que a
característica de qualidade está fora da região de confiança. Portanto, o alarme falso
acontece no tempo
se
e o processo não observável esteja sob controle, ou seja,
. Agora será definido o primeiro tempo em que o processo atinge o estado fora
de controle como:
(102)
A partir destas variáveis, pode-se afirmar que o alarme falso acontece quando
, e que a não detecção acontece quando
Seja
.
a probabilidade quando a distribuição inicial de
denota as probabilidades quando
distribuição inicial de
e
é , ou seja,
respectivamente. Definindo
e
como a
, a probabilidade de alarme falso é dada por:
(103)
Prova:
Para
, pode-se mostrar por (96), (97), (98), (99) e (100) que:
54
(
)
(
)
E similarmente, se
(
)
(
)
, pode-se mostrar por (96), (97), (98), (99) e (100) que:
Com base nestes resultados, será feita uma analogia a uma simples
probabilidade condicional com o teorema da probabilidade total, para provar (103):
55
Provado a probabilidade do alarme falso, agora será definida a probabilidade de
não detecção, dada por:
(104)
Prova:
Note que:
(
)
(
)
E similarmente, para
(
)
(
)
, têm-se:
A partir destas definições, tem-se que:
(105)
56
Com esta expressão, tem-se:
Agora, assume-se que um único item é inspecionado a cada
Então, para
itens produzidos.
, pode-se definir o tempo de alerta como:
(106)
Usando os mesmos argumentos utilizados para provar (103) e (104),
analogamente pode-se mostrar que:
e consequentemente:
Além disso, têm-se que:
57
e consequentemente:
A partir destes resultados e assumindo que a estratégia de monitoramento do
processo tem um intervalo amostral
, pode-se determinar a probabilidade do alarme
falso como:
(107)
e para
, a probabilidade de não detecção é dada por:
(108)
Estas probabilidades de alarme falso e de não detecção são importantes para o
planejamento e monitoramento das cartas de controle On-line, pois elas estão
diretamente ligadas aos custos e ao modelo estatístico.
No próximo capítulo será feita uma análise de sensibilidade destas
probabilidades com o intuito de descobrir quais parâmetros que mais influenciam nesta
estimação.
58
5-
Análise de Sensibilidade
Neste capítulo será feita uma análise de sensibilidade das probabilidades de
alarme falso e de não detecção baseada no exemplo numérico de Ho et al. (2007) a fim
de constatar quais os parâmetros que influenciam mais em cada probabilidade . O
programa que será utilizado para efetuar os cálculos será o R, um software estatístico
de código livre.
Ho et al. (2007) considera o problema em que uma fabrica de circuitos
integrados quer instalar um sistema de controle a fim de medir a dimensão de uma
característica de qualidade. Esta variável segue uma distribuição normal com média
e desvio-padrão
, sendo que o especialista na área de planejamento determinou um
intervalo de itens entre amostras igual a 5 itens, e por questões de qualidade, definiu a
largura dos limites de controle igual a 3.
A partir de alguns cálculos, constata-se que em média, o processo muda do
estado sob controle para o estado fora de controle depois de 20 itens produzidos e que
a magnitude desta mudança são de
desvio-padrão na média, sendo que a
variabilidade do processo continua a mesma, ou seja, o processo fora de controle segue
uma distribuição normal com média
e com o mesmo desvio-padrão
.
O processo fora de controle retorna para as condições normais sem intervenção
humana com probabilidade igual a
.
Logo as probabilidades de alarme falso e de não detecção são dadas por (107) e
(108) respectivamente, com
,
,
,
,
,
,
,
.
Com base nestes parâmetros, foram obtidas as seguintes probabilidades:
Agora serão feitas análises dos seguintes parâmetros: largura dos limites de
controle
, os parâmetros da cadeia da real situação do processo
, do intervalo
59
entre amostras
e da magnitude da mudança da média do processo
. Esta análise
permitirá concluir quais parâmetros que mais influenciam nas probabilidades de alarme
falso e de não detecção.

Variação da largura dos limites de controle
:
A tabela (2) apresenta a variação das probabilidades de alarme falso e de não
detecção com a variação da largura dos limites de controle:
Tabela 2 – Valores das probabilidades para diferentes larguras de limites de
controle
Largura dos limites de controle (k)
Probabilidades
Alarme Falso Não detecção
1
1,7
2
2,5
3
3,3
0,5081394
0,2281075
0,1314841
0,0397841
0,0089334
0,0032181
0,4330581
0,7151274
0,8215546
0,9334613
0,9794312
0,9904874
Fonte: Elaboração própria com base nos resultados da pesquisa.
A partir desta tabela, pode-se afirmar que ambas as probabilidades são bastante
sensíveis com a variação da largura dos limites de controle, pois sua variação provoca
grandes mudanças nestas probabilidades.
O gráfico (1) apresenta a variação da probabilidade de alarme falso com a
variação da largura dos limites de controle:
0.3
0.2
0.0
0.1
Prob. de Alarme Falso
0.4
0.5
Sensibilidade da Probabilidade de Alarme Falso
1.0
1.5
2.0
2.5
3.0
Limite de Controle (k)
Fonte: Elaboração própria com base nos resultados da pesquisa.
Gráfico 1 - Sensibilidade da probabilidade de alarme falso/ largura dos limites
de controle (k)
60
De acordo com o gráfico (1), quando a largura dos limites de controle aumenta,
a probabilidade de alarme falso cai exponencialmente. Isto se deve ao fato de quanto
maior for a região de aceitação, ou seja, a largura dos limites de controle, menor será a
probabilidade de um item cair fora da região de aceitação dado que o processo está sob
controle.
O gráfico (2) apresenta a variação da probabilidade de não detecção com a
variação da largura dos limites de controle:
0.8
0.7
0.6
0.5
Prob. de Não Detecção
0.9
1.0
Sensibilidade da Probabilidade de Não Detecção
1.0
1.5
2.0
2.5
3.0
Limite de Controle (k)
Fonte: Elaboração própria com base nos resultados da pesquisa.
Gráfico 2 – Sensibilidade da probabilidade de não detecção/ largura dos limites
de controle (k)
Ao contrário da probabilidade de alarme falso, pode-se afirmar a partir do
gráfico (2) que a probabilidade de não detecção aumenta quando a largura dos limites
de controle. Isto acontece pois quanto maior for a região de aceitação, mais itens cairão
na região de aceitação enquanto o processo estiver fora de controle.

Variação do intervalo entre amostras
:
A tabela (3) apresenta a variação das probabilidades de alarme falso e de não
detecção com a variação do intervalo entre amostras:
61
Tabela 3 - Valores das probabilidades para diferentes intervalos entre amostras
Probabilidades
Alarme Falso Não detecção
Intervalo entre amostras (m)
2
5
10
15
30
100
0,0238036
0,0089334
0,0039172
0,0022699
0,0007198
0,0000156
0,9451932
0,9794312
0,9898077
0,9947734
0,9983426
0,9999639
Fonte: Elaboração própria com base nos resultados da pesquisa.
A partir desta tabela, pode-se afirmar que ambas as probabilidades são bastante
sensíveis com a variação do intervalo entre amostras, pois sua variação provoca
grandes mudanças nestas probabilidades.
O gráfico (3) apresenta a variação da probabilidade de alarme falso com a
0.015
0.010
0.000
0.005
Prob. de Alarme Falso
0.020
variação do intervalo entre
amostras:
Sensibilidade da Probabilidade de Alarme Falso
0
20
40
60
80
100
Intervalo entre amostras (m)
Fonte: Elaboração própria com base nos resultados da pesquisa.
Gráfico 3 - Sensibilidade da probabilidade de alarme falso / intervalo entre
amostras (m)
A partir do gráfico (3), pode-se dizer que quando o intervalo entre amostras
aumenta, a probabilidade de alarme falso cai exponencialmente. Esta diminuição se
62
deve ao fato do sistema coletar menos amostras, o que resulta consequentemente em
mais alarmes verdadeiros do que alarmes falsos.
O gráfico (4) apresenta a variação da probabilidade de não detecção com a
variação do intervalo entre amostras:
0.98
0.97
0.96
0.95
Prob. de Não Detecção
0.99
1.00
Sensibilidade da Probabilidade de Não Detecção
0
20
40
60
80
100
Intervalo entre amostras (m)
Fonte: Elaboração própria com base nos resultados da pesquisa.
Gráfico 4 - Sensibilidade da probabilidade de não detecção / intervalo entre
amostras (m)
Pode-se afirmar a partir do gráfico (4) que quando o intervalo de amostras
aumenta, a probabilidade de não detecção aumenta também. Isto se deve ao fato de
quanto maior for o intervalo entre amostras, maior chance o processo tem de voltar
para o estado fora de controle dado que ele está fora de controle. Esta análise está
muito ligada aos parâmetros

e ; caso fossem diferentes, esta análise não seria válida.
Variação do parâmetro :
A tabela (4) apresenta a variação das probabilidades de alarme falso e de não
detecção com a variação parâmetro
da cadeia:
Tabela 4 - Valores das probabilidades para diferentes valores de parâmetro p
Parâmetro p
0,01
0,05
0,1
Probabilidades
Alarme Falso Não detecção
0,0495327
0,0089334
0,0037055
0,9380858
0,9794312
0,9861058
Fonte: Elaboração própria com base nos resultados da pesquisa.
63
A partir desta tabela, pode-se afirmar que ambas as probabilidades são bastante
sensíveis com a variação do parâmetro , pois sua variação provoca grandes mudanças
nestas probabilidades.
O gráfico (5) apresenta a variação da probabilidade de alarme falso com a
variação do parâmetro :
0.03
0.02
0.01
Prob. de Alarme Falso
0.04
0.05
Sensibilidade da Probabilidade de Alarme Falso
0.02
0.04
0.06
0.08
0.10
p
Fonte: Elaboração própria com base nos resultados da pesquisa.
Gráfico 5 - Sensibilidade da probabilidade de alarme falso / parâmetro p
De acordo com o gráfico (5), tem-se que quando o parâmetro
aumenta, a
probabilidade de alarme falso cai. Isto acontece pois a mudança da média do processo
ocorre mais rápido, o que faz com que o período que o processo permanece sob controle
seja menor.
O gráfico (6) apresenta a variação da probabilidade de não detecção com a
variação do parâmetro :
64
0.97
0.96
0.95
0.94
Prob. de Não Detecção
0.98
Sensibilidade da Probabilidade de Não Detecção
0.02
0.04
0.06
0.08
0.10
p
Fonte: Elaboração própria com base nos resultados da pesquisa.
Gráfico 6 - Sensibilidade da probabilidade de não detecção / parâmetro p
Quando o parâmetro
aumenta, a probabilidade de não detecção aumenta
também, pois o período que o processo permanece fora de controle é maior, o que
resulta em média mais amostras que os itens estão dentro da região de aceitação dado
que o processo está fora de controle.
Perceba que neste caso a mudança do parâmetro
afeta na distribuição inicial
do processo , pois esta distribuição depende deste parâmetro.

Variação do parâmetro :
A tabela (5) apresenta a variação das probabilidades de alarme falso e de não
detecção com a variação parâmetro da cadeia:
Tabela 5 - Valores das probabilidades para diferentes valores de parâmetro 
Parâmetro 
0,01
0,5
1
Probabilidades
Alarme Falso
0,0087407
0,0089334
0,0091742
Não detecção
0,9798748
0,9794312
0,9788768
Fonte: Elaboração própria com base nos resultados da pesquisa.
A partir desta tabela, pode-se afirmar que ambas as probabilidades não são
sensíveis com a variação do parâmetro , pois sua variação provoca pequenas mudanças
nestas probabilidades.
65
O gráfico (7) apresenta a variação da probabilidade de alarme falso com a
Sensibilidade da Probabilidade de Alarme Falso
0.0090
0.0089
0.0088
Prob. de Alarme Falso
0.0091
variação do parâmetro :
0.2
0.4
0.6
0.8
1.0
Epsilon
Fonte: Elaboração própria com base nos resultados da pesquisa.
Gráfico 7 - Sensibilidade da probabilidade de alarme falso / parâmetro ε
Pode-se visualizar a partir do gráfico (7) que há uma dependência linear positiva
entra o parâmetro
parâmetro
e a probabilidade de alarme falso, ou seja, à medida que o
aumenta, a probabilidade de alarme falso aumenta linearmente. Isto
acontece pois o período sob controle do processo será maior, pois a probabilidade do
processo retornar ao estado sob controle dado que ele está fora de controle é maior.
O gráfico (8) apresenta a variação da probabilidade de não detecção com a
variação do parâmetro :
66
0.9796
0.9794
0.9792
0.9790
Prob. de Não Detecção
0.9798
Sensibilidade da Probabilidade de Não Detecção
0.2
0.4
0.6
0.8
1.0
Epsilon
Fonte: Elaboração própria com base nos resultados da pesquisa.
Gráfico 8 - Sensibilidade da probabilidade de não detecção / parâmetro ε
Pode-se visualizar a partir do gráfico (8) que há uma dependência linear
negativa entra o parâmetro
parâmetro
e a probabilidade de não detecção, ou seja, à medida que o
aumenta, a probabilidade de não detecção diminui linearmente. Isto
acontece pois o período fora controle do processo será menor, pois a probabilidade do
processo retornar ao estado sob controle dado que ele está fora de controle é maior.

Variação da magnitude da mudança da média do processo
:
A tabela (6) apresenta a variação das probabilidades de alarme falso e de não
detecção com a variação do parâmetro :
Tabela 6 - Valores das probabilidades para diferentes valores do parâmetro 
Parâmetro 
0,5
1,5
2
2,5
3
Probabilidades
Alarme Falso Não detecção
0,0089334
0,0089334
0,0089334
0,0089334
0,0089334
0,9899446
0,9794312
0,9634361
0,9373335
0,9039896
Fonte: Elaboração própria com base nos resultados da pesquisa.
A partir da tabela (6), pode-se notar que a probabilidade do alarme falso não é
influenciada pela variação da magnitude da mudança da média do processo, já a
probabilidade de não detecção é bastante sensível com a variação do parâmetro .
67
O gráfico (9) apresenta a variação da probabilidade de não detecção com a
variação do parâmetro :
0.96
0.94
0.92
Prob. de Não Detecção
0.98
Sensibilidade da Probabilidade de Não Detecção
0.5
1.0
1.5
2.0
2.5
3.0
Delta
Fonte: Elaboração própria com base nos resultados da pesquisa.
Gráfico 9 - Sensibilidade da probabilidade de não detecção / parâmetro 
A partir do gráfico (9) pode-se afirmar que a probabilidade de não detecção cai
quando
aumenta. Isto é pelo fato de quanto maior fora a mudança da média do
processo, maior será a probabilidade de um item cair fora da região de aceitação dado
que o processo está fora de controle.
De acordo com a análise de sensibilidade feita neste capítulo, pode-se afirmar
que a probabilidade de alarme falso é bastante sensível às variações dos parâmetros ,
e
; contudo, não é sensível às variações do parâmetro . Vale ressaltar que a
probabilidade de alarme falso não depende do parâmetro .
Já a probabilidade de não detecção é bastante sensível às variações dos
parâmetros ,
,
e ; contudo, não é sensível às variações do parâmetro .
68
6-
Conclusão e recomendações futuras
O objetivo inicial deste trabalho foi apresentar a metodologia do modelo oculto
de Markov e aplicá-lo no controle estatístico on-line para a estimação das
probabilidades de alarme falso e não detecção
Além da introdução, no capítulo 2 foi feita uma apresentação de algumas
ferramentas do controle estatístico de qualidade para conseguinte, introduzir o
problema de controle estatístico on-line. No capítulo 3 foi revisada a metodologia de
cadeias de Markov e posteriormente apresentada a metodologia do modelo oculto de
Markov, sendo principalmente abordados os elementos de um HMM e as soluções dos
três problemas básicos.
No capítulo 4 foi apresentada a metodologia proposta por Dorea et al. (2012),
que é uma aplicação do modelo oculto de Markov no controle estatístico on-line para a
estimação das probabilidades de alarme falso e a de não detecção. No capítulo 5 foi
aplicada a metodologia proposta por Dorea et al. (2012) em um exemplo retirado de Ho
et al. (2007) com o intuito de realizar uma análise de sensibilidade de alguns
parâmetros. Foi possível constatar que as probabilidades de alarme falso e de não
detecção são influenciadas por diferentes parâmetros em diferentes proporções.
Como extensões para este trabalho é relevante considerar erros de classificação
na inspeção dos itens do controle estatístico on-line por variáveis via modelo oculto de
Markov. Deve-se explorar também o planejamento econômico do controle estatístico
on-line por variáveis via modelo oculto de Markov.
69
Referências Bibliográficas
Atuncar, G. S. Conceitos básicos de processos estocásticos. UFMG. Belo Horizonte, 2011.
Baker, J. K. The dragon system-An overview. IEEE Trans. Acoust. Speech Signal
Processing, v. ASS-23, n. 1, p. 24-29, 1975.
Baum, L. E. e Egon, J. A. An inequality with applications to statistical estimation for
probabilistic functions of a Markov process and to a model for ecology. Bull. Amer.
Meterol. soc., v. 73, n. 3, p. 360-363, 1967.
Baum, L. E. e Sell, G. R. Growth functions for transformations on manifolds. Pac. J.
Math, v. 27, n. 2, p. 211-227, 1968.
Bessegato, L. F. Extensão para Controle On-line por atributo com erros de classificação:
Intervalo de inspeção variável, Amostragem não-unitária. 2009. 181f. tese (Doutorado em
estatística) – Instituto de Ciências Exatas, UFMG, Belo Horizonte, 2009.
Borges, W., Ho, L. L. e Turnes, O. An analysis of Taguchi’s on-line quality monitoring
procedure for attributes with diagnosis errors. Applied Stochastic Models in Business and
Industry, v. 17, n.3, p. 261-276, 2001.
Costa, A. F., Epprecht, E. K. e Carpinetti, L. C. Controle Estatístico de Qualidade. São
Paulo: ATLAS, 2005.
Couvreur, C. Hidden Markov Models and Their Mixtures. 1996. 158f. dissertação
(Mestrado em Matemática) – Département de mathématiques, Université catholique
de Louvain, Louvain, 1996.
Crosby, P. B. Quality without tears: the art of hassle free management. New York: McGrawHill, 1995.
Deming, W. E. Out of crisis. Cambride: MIT Press, 2000.
Dempster, A. P., Laird N. M. e Rubin, D. B. Maximum likelihood from incomplete data
via the EM algorithm. J. Roy. Stat. Soc, v. 39, n.1, p. 1-38, 1977.
Dorea, C. C. Y., Gonçalves, C. R., Medeiros, P. G. E., Santos, W. B. False-Alarm and
Non-Detection Probabilities for On-line Quality Control via HMM. Int. Journal of
Math. Analysis, v. 6, n. 24, p. 1153-1162, 2012.
Duncan, A. J., The economic design of charts used to maintain current control of a
process. Journal of American Statistical Association, v. 51, n. 274, p. 228-242, 1956.
Forney, G. D. The Viterbi algorithm. Proc. IEEE, v. 61, n. 3, p. 268-278, 1973.
Gibra, I. N. Recent development in control chart techniques. Journal of Quality
Technology, v.7, n. 4, p. 183-192.
70
Girshick, M. e Rubin, H. A Bayes Approach to a Quality Control Model. Annals of
Mathematical Statistics, v. 23, n. 1, p. 114-125, 1952.
Ho, L. L., Medeiros, P. G. e Borges, W. Na alternative model for on-line quality
monitoring for variables. International Journal of production economics, v. 107, n. 1, p.
202-222, 2007.
Khouri, C. M. B. Modelos Escondidos de Markov para Classificação de Proteínas. 2004.
115f. dissertação (Mestrado em Ciência da Computação) - Cetro da informática, UFPE,
Recife, 2004.
Ladany, S. P. Optimal use of control charts for controlling current production.
Management Science, v.19, n. , p. 763-772.
Leiras, A., Epprecht, E. K., Costa, A. F. B. Planejamento do controle estatístico de
processos com baixa fração não conforme restrito a amostras pequenas. Produção, v. 17,
n. 1, p. 139-150, 2007.
Lorenzen, T. J., Vance, L. C., The economic design of control charts: A unified
approach. Technometrics, v. 28, n. 1, p. 3-10.
Montgomery, D. C. Introdução ao controle estatístico da qualidade. Rio de Janeiro: LTC,
2004.
Montgomery, D. C. The economic design of control charts: A review and literarute
survey. Journal of Quality Technology, v.12 n. 2 , p. 75-87.
Nayebpour, M. R. e Woodall, W. H. An analysis of Taguchi’s on-line qualitymonitoring procedures for attributes. Technometrics, v. 35, n. 1, p. 53-60.
Quinino, R. C. e Ho, L. L. Repetitive tests as na economic alternative procedure to
control attributes with diagnosis errors. European Journal of Operation Research., v.155,
n. 1, 209-225, 2004.
Rabiner, L. R. A Tutorial on Hidden Markov Models and Selected Applications in
Speech Recognition. Proceedings of the IEEE, v. 77, n. 2, p. 257-286, 1989.
Ross, S. M. Introduction to probability models, 9 edition. Academic Press: San Diego,
2007.
Saniga, E. M. Economic statistical control-chat designs with an application to
charts. Technometrics, v. 31, n. 3, p. 313-320, 1989.
and R
Souza, K. P. Aplicação de Modelos de Markov Ocultos na Obtenção de Taxas de mortalidade
das Larvas do Mosquito da Dengue. 2010. 78f. dissertação (Mestrado em computação) Centro de Ciências Exatas e Tecnologia, UFMGS, Campo Grande, 2010.
Taguchi, G., Elsayed, E. A. e Hsiang, T. Quality Engineering in Production Systems. New
York: McGraw-Hill, 1989.
71
Vance, L. C. A bibliography of statistical quality control chart techniques, 1970-1980.
Journal of Quality Technology, v. 15, n. 2 , p. 59-62.
Viterbi, A. J. Error bounds for convolutional codes and an asymptotically optimal
decoding algorithm. IEEE Trans Informat. Theory, v. IT-13, n. 2,p.260-269, 1967.
Weiler, H. On the Most Economical Sample size for Controlling the Mean of a
Population. Annals of Mathematical Statistics, v.23, n. 2, p. 247-254, 1952.
Woodall, W. H. Conflicts between Deming’s philosophy and the economic design of
control charts. In Lenz, H. J., Wetherill, G. B. e Wilrich, P. T., editors, Frontiers in
Statistical Quality Control. Physica-Verlag, Heidelberg, 1987.
Woodall, W. H. Weaknesses of economic design of control charts (Letter to the
Editor). Technometrics, v.28, n. 4, p. 408-410, 1986.
72
Download

Modelos ocultos de Markov: uma Abordagem em Controle de