XXV Encontro Nac. de Eng. de Produção – Porto Alegre, RS, Brasil, 29 out a 01 de nov de 2005
Modelagem da proporção de produtos defeituosos usando Modelo de
Quase-verossimilhança
Ângelo Márcio O. Sant’Anna (UFRGS) [email protected]
Carla Schwengber ten Caten (UFRGS) [email protected]
Resumo
A proporção de produtos defeituosos em um determinado conjunto de observações, ou
proporção de produtos não conforme as especificações, é uma importante informação a
respeito do comportamento do processo de produção de uma indústria. A modelagem da
proporção de produtos defeituosos ou de itens não conforme as especificações através de um
modelo de regressão tradicional nem sempre é recomendada, uma vez que estes modelos
requerem certas pressuposições para uso. Desta forma, o uso dos modelos de Quaseverossimilhança (MQV’s) propostos por Wedderburn (1974) são mais adequados. O objetivo
deste artigo é apresentar o uso do MQV, bem como a sua flexibilidade na modelagem de
dados mensurados em proporção, ilustrada por uma aplicação numérica.
Palavras-chave: MLG, Quase-verossimilhança, Proporções.
1. Introdução
O processo de fabricação de um produto consiste basicamente na determinação das
características de qualidade conforme uma dada especificação, entretanto em muitos casos,
fatores de variabilidade podem dar origem à fabricação de produtos que apresentem as suas
características de qualidade fora das especificações, ou seja, como produtos defeituosos. A
identificação da proporção de produtos defeituosos ou não conforme as especificações é feita
a partir de uma inspeção nos produtos após a sua fabricação e constatado que estes produtos
não apresentam um funcionamento adequado para uso.
Segundo Park (1996) é fundamental que as empresas busquem desenvolver um processo
robusto, de produção de bens e fornecimento de serviços. Embora, apenas o desenvolvimento
deste processo não garanta a empresa o fim da produção de produtos defeituosos, fazendo-se
importante a realização de etapas complementares, como por exemplo, a modelagem das
informações produzidas pelo processo. Neste contexto, Montgomery e Peck (1992) relatam,
que a construção de um modelo de regressão permite investigar possíveis efeitos que
influenciam no processo.
Conforme Montgomery e Peck (1992) para uso da abordagem estatística, ao analisar um
processo, é necessário previamente possuir uma idéia do que será estudado, como os dados
serão coletados, classificação da natureza dos dados (discretos ou contínuos) e um
entendimento qualitativo de como serão analisados, portanto, antes de se iniciar a modelagem
dos dados é necessário caracterizar a variável dependente como discreta ou contínua. O
número de produtos defeituosos em uma amostra é classificado como uma variável aleatória
discreta, pois esta pode ser representada por um valor de grandeza no conjunto dos números
reais (LEWIS et al.,2001) e esta variável segue a distribuição de probabilidade binomial.
Segundo Cordeiro e Lima Neto (2004) a proporção de produtos defeituosos também segue
uma distribuição binomial, as quais apresentam mensurações sempre positivas e restritas ao
intervalo [0,1]. Portanto, conhecer as causas (variáveis independentes) e os respectivos
efeitos sobre a proporção de produtos defeituosos (variável dependente) através de modelos
ENEGEP 2005
ABEPRO
1459
XXV Encontro Nac. de Eng. de Produção – Porto Alegre, RS, Brasil, 29 out a 01 de nov de 2005
de regressão pode ser uma estratégia poderosa.
A modelagem da proporção de produtos defeituosos em um determinado conjunto de
observações através de um modelo de regressão linear múltipla nem sempre é recomendada,
uma vez que este modelo requer a suposição de que os dados seguem a distribuição normal.
Pelo fato dos dados serem uma proporção dificilmente apresentará normalidade, portanto
deve-se buscar uma nova forma de relacionar as variáveis independentes à variável
dependente, para isto pode-se utilizar os conceitos de modelos lineares generalizados, mais
especificamente os modelos de quase-verossimilhança.
Este trabalho tem como objetivo apresentar o uso do modelo de quase-verossimilhança, bem
como a sua eficiência na modelagem da proporção de produtos defeituosos. Ademais,
apresenta-se uma aplicação numérica para ilustrar os conceitos teóricos abordados.
2. Modelos Lineares Generalizados
Os Modelos Lineares Generalizados (MLG’s) englobam uma classe de modelos de regressão
usuais em Estatística, tais como o modelo linear normal, modelo logístico, modelos loglineares, modelos de quase-verossimilhança, entre outros. Na verdade, esta capacidade de
"unificação" de modelos é uma das características principais dos MLG’s.
Segundo McCullagh e Nelder (1989) estes modelos de regressão são utilizados para investigar
e modelar a relação entre a variável dependente e duas ou mais variáveis independentes,
sendo esta relação descrita por uma função matemática, com diversos termos associados a
cada variável independente. A partir da expressão matemática que modela o fenômeno em
estudo é possível estimar o valor da variável dependente para diferentes valores das variáveis
independentes.
Conforme Dobson (1990) os modelos lineares generalizados, propostos por Nelder e
Wedderburn (1972), permitem o ajuste de modelos de regressão quando a distribuição da
variável dependente pertencer à família exponencial de distribuições, que contempla, as
distribuições binomial, normal e poisson, dentre outras. Em linhas gerais, as distribuições
pertencentes à família exponencial devem possuir a mesma função densidade de
probabilidade dependente de um parâmetro θ. Esta função pode ser escrita na forma: f(y;θ) =
exp [a(y)b(θ) + c(θ) + d(y)], onde a(y), b(θ) e c(θ) são funções específicas, sendo θ o
parâmetro natural da distribuição e y a variável aleatória da distribuição. Para McCullagh e
Nelder (1989) a função pode ser escrita da forma f(y;θ, φ) = exp {a(φ)-1[yθ - b(θ)] + c(y;φ)},
onde a(.), b(.) e c(.) são funções conhecidas, θ é o parâmetro de localização e φ > 0 é o
parâmetro de dispersão, algumas vezes denominado de σ2.
Os MLG’s são essencialmente caracterizados por possuírem três componentes: a componente
aleatória, que identifica a distribuição de probabilidade da variável dependente y pertencente
à família exponencial; a componente sistemática, que especifica a estrutura das variáveis
independentes, que é utilizada como preditor linear η; e a função de ligação, que descreve a
relação funcional entre a componente sistemática e o valor esperado da componente aleatória
(a média µ da variável dependente y). Além disso, tais modelos admitem não-homogeneidade
de variância da variável dependente e uma função de variância específica (FAHRMEIR e
TUTZ, 1994).
Conforme Dobson (1990) a variável dependente (proporção de produtos defeituosos) segue
uma distribuição de probabilidade binomial, esta distribuição é demonstrada na literatura que
pertence à família exponencial. Segundo Cordeiro et al.(2004) o estudo de dados na forma de
proporção é descrito formalmente como um modelo linear, pois modela a proporção esperada
πi de sucesso de um referido evento ocorrer (por exemplo, possuir defeito), em um conjunto
ENEGEP 2005
ABEPRO
1460
XXV Encontro Nac. de Eng. de Produção – Porto Alegre, RS, Brasil, 29 out a 01 de nov de 2005
de ni dados investigados, em termos das variáveis independentes xi, através de uma função de
ligação que relaciona a média (µi) da variável dependente à estrutura linear das variáveis
independentes (xi), i = (1, ..., p).
A forma da estrutura das variáveis independentes que compõem o modelo de regressão é de
uma soma linear, caracterizando a parte sistemática do modelo, definida como η = β0 + β1x1
+ ... + βpxp, onde a função linear η é denominada de preditor linear e β’s parâmetros
desconhecidos. Além disso, outra característica da componente sistemática de um modelo
linear é que a média µ da variável dependente y pode ser expressa por uma função conhecida
g(.), denominada de função de ligação (MYERS et al., 1997), a qual descreve a relação
funcional (ligação) entre a média µ e o preditor linear η, descrevendo a forma g(µi) = ηi =β0
+ β1xi1 + ... + βpxip.
Conforme Lewis et al.(2001) a função de ligação g(.) é responsável pela transformação da
média da variável dependente, e não dos dados. A escolha da função de ligação depende do
problema de modelagem em particular e, que em muitas vezes pode apresentar uma função de
ligação diferente conforme o conjunto de observações. Segundo McCullagh e Nelder (1989)
quando os dados seguem uma distribuição binomial, as funções de ligação g(.) mais
 π 
adequadas são: função Logit g (µ i ) = log i  , função Probit g (µ i ) = Φ −1 (π i ) e função
1− π i 
Complemento log-log g (µ i ) = log{− log(1 − π i )} , pois preservam as restrições sobre o valor
da probabilidade πi. Para Kieschnick e McCullogh (2003) a escolha da função de ligação mais
adequada não implica em qualidade de ajuste do modelo de regressão, o que é mais
importante. Assim como, o uso da função de log-verossimilhança, que é definida pelo
logaritmo da distribuição de probabilidade da variável dependente, na estimação dos
parâmetros desconhecidos (β’s) do modelo.
2.2 Modelo de Quase-verossimilhança
Como foi visto anteriormente, para alguns modelos de regressão realizar a modelagem de um
conjunto de observações, primeiro deve-se assumir que os dados seguem uma distribuição de
probabilidade conhecida e que esta pertença à família exponencial, em alguns casos não é
adequado escolher uma distribuição de probabilidade a priori para os dados, pois os dados
podem não seguir algumas distribuições de probabilidade. Nestes casos, Weddeburn (1974)
propôs os modelos de quase-verossimilhança (MQV’s) pertencentes à classe dos MLG’s, pois
estes modelos apresentam uma componente sistemática (estrutura linear das variáveis
independentes) e função de ligação que relaciona a média (µi) da variável dependente à
estrutura linear das variáveis independentes (xi), i = (1, ..., p). Porém para estes modelos, não
há a necessidade de assumir a princípio alguma distribuição de probabilidade para a variável
dependente. Por conseguinte, a esperança matemática e a variância da variável aleatória não
são conhecidas a priori.
Segundo Cox (1996) quando modelamos um conjunto de dados usando os MQV’s, a
variância é modelada como uma função da média da variável dependente, multiplicada ainda
por um parâmetro de dispersão constante. Desta forma, a distribuição da variável dependente
ficará determinada quando a função de variância escolhida coincidir com a função de
variância de alguma distribuição de probabilidade pertencente à família exponencial.
Vejamos então, seja yi uma variável aleatória qualquer de interesse, que assume a E[yi] = µi e
uma variância definida por Var[yi] = φ*V (µ), onde a função de variância V (µ) = µ(1- µ) é
uma função conhecida da média µi e φ é o parâmetro de dispersão constante. A função de
ENEGEP 2005
ABEPRO
1461
XXV Encontro Nac. de Eng. de Produção – Porto Alegre, RS, Brasil, 29 out a 01 de nov de 2005
quase-verossimilhança para um modelo de regressão é definida por Q( y i ; µ i ) = ∫ µ y i − t dt , para
y
esta variável aleatória apresenta a forma Q( y i ; µ i ) =
1
φ
∫
µ
y
φ ⋅ V (t )
yi − µ i
dt . O logaritmo da função de
µ i (1 − µ i )
quase-verossimilhança fica nesse caso dado por Q( y i ; µ i ) = y i ln µ i  + ln(1 − µ i ) , que


 1 − µi 
conforme McCullagh e Nelder (1989), corresponde a função de variância V[µ] =µ(1-µ) e a
função de log-verossimilhança da distribuição binomial L( y i ; µ i ) = y i ln µ i  + ni ln(1 − µ i ) .


 1 − µi 
Nota-se portanto, que a principal diferença está em que quando se usa a função de quaseverossimilhança para estimar os coeficientes (parâmetros desconhecidos), apenas se define a
relação da variância da variável dependente com a sua média, não sendo necessário definir
anteriormente uma distribuição de probabilidade.
De acordo com Cox (1996) uma vantagem da flexibilidade de uso dos MQV’s na modelagem
de uma variável dependente em conjunto de dados, é que poderíamos utilizar uma função de
variância que melhor se ajuste aos dados, sem assumir a priori uma distribuição de
probabilidade para esta variável dependente.
2.3 Adeqüabilidade do Modelo
A adequação de um modelo é avaliada pela sua capacidade preditiva e definida a partir dos
próprios dados utilizados na determinação do modelo. Modelos de regressão com bom
desempenho estatístico apresentam pequena discrepância entre os dados reais e seus
respectivos valores preditos. Em muitas aplicações, o coeficiente de determinação (R2) é
utilizado como indicador numérico que permite comparar o desempenho de diferentes
modelos. Ademais, segundo Cordeiro e Lima Neto (2004) na adequação do modelo aos dados
é fundamental a análise de técnicas gráficas como, avaliação do gráfico de resíduos, presença
de possíveis outlier (valores anômalos) e a observação de pontos influentes (valores que
influenciam na estimativa da média da variável dependente).
Em uma modelagem, variáveis independentes e/ou a combinação destas variáveis (tal como
interação de variáveis independentes) só devem ser acrescentadas ao modelo se apresentarem
sobre o comportamento da variável dependente, um nível explanatório significativo. Para
garantir a inclusão somente de variáveis significativas no modelo, procedem-se testes de
significância estatística.
3. Aplicação Numérica
O estudo de aplicação dos modelos foi desenvolvido com as informações de uma empresa de
artefatos de couro, onde se buscou avaliar a qualidade das peças de couro, conforme certas
características na sua linha de produção. Tais características foram definidas como variáveis
relevantes para a modelagem, mesmo apresentando uma natureza qualitativa. Neste caso, as
variáveis independentes qualitativas foram tratadas com o auxílio de variáveis dummy. O uso
deste tipo de variável permite uma análise de associação entre os níveis das variáveis
independentes em relação a variável dependente. Sendo elas:
ƒ Seleção - A matéria-prima em cinco diferentes estágios (conforme qualidade e preço,
escala de 1 = baixo a 5 = alto);
ƒ Procedência - A origem da matéria-prima adquirida pela empresa (locais de origem, escala
de 1 a 5);
ƒ Classificador - Profissional que avalia as peças de couro, de diferentes seleções e origem
ENEGEP 2005
ABEPRO
1462
XXV Encontro Nac. de Eng. de Produção – Porto Alegre, RS, Brasil, 29 out a 01 de nov de 2005
(profissionais, escala de 1 a 3);
ƒ Rebaixamento - Estado da textura da matéria-prima couro (escala: 1 = não e 2 = sim);
O classificador recebe um lote de diferentes tamanhos contendo os produtos e as avalia se os
mesmos encontram-se conforme a especificação, por métodos cognitivos (utilizando alguns
dos sentidos: visão, olfato e tato). Assim, a proporção de produtos defeituosos ou produtos
não conforme as especificações foi considerada a variável de investigação (variável
dependente) e a seleção (x1), procedência (x2), classificador (x3) e rebaixamento (x4) foram
consideradas possíveis fatores de influência (variáveis independentes), numa amostra de 754
lotes. O interesse encontra-se na modelagem da proporção de produtos defeituosos pelas
variáveis independentes acima descritas avaliada segundo o modelo de quaseverossimilhança. O modelo de quase-verossimilhança proposto foi realizado no software
estatístico R 2.0.1.
3.1 Análise dos Efeitos
0,3
24,4%
0,25
21,4%
0,2
16,3%
16,2%
0,15
0,1
0,05
2,3%
0
Tipo 1
Tipo 2
Tipo 3
Tipo 4
Tipo 5
Proporção de defeituosos
Proporção de defeituosos
Realizando uma análise preliminar dos efeitos das variáveis independentes e a variável
dependente “proporção de produtos defeituosos”, nota-se na Figura 2 (a), que a proporção de
produtos defeituosos para a variável “seleção” apresenta uma tendência crescente da
proporção à medida que aumenta o nível da variável “seleção”. Na Figura 2 (b) a variável
“procedência” não apresenta uma relação de tendência com a proporção de defeituosos.
Observa-se que o avaliador 3 da variável “classificador” apresentou maior proporção de
defeituosos que os outros dois avaliadores e que o nível rebaixado da variável “rebaixamento”
apresenta menor proporção de defeituosos, conforme Figuras 2(c) e (d).
0,3
0,2
24,2%
23,7%
0,25
16,8%
0,15
0,1
0,05
0
Origem 1
Origem 2
Seleção
Proporção de defeituosos
Proporção de defeituosos
0,25
0,2
15,8%
14,7%
0,1
0,05
0
Avaliador 1
Avaliador 2
Origem 4
Origem 5
(b)
25,6%
0,15
Origem 3
Procedência
(a)
0,3
24,2%
20,6%
Avaliador 3
0,3
23,5%
0,25
0,2
12,4%
0,15
0,1
0,05
0
Não
Sim
Classificador
Rebaixamento
(c)
(d)
Figura 2 – Gráficos das proporções de defeituosos em função das variáveis independentes
3.2 Análise do Ajuste do Modelo
A análise inicial deste conjunto de dados foi realizada por Arriba (2005), consistindo num
ajuste de um modelo de regressão linear múltipla com as quatro variáveis independentes e
ENEGEP 2005
ABEPRO
1463
XXV Encontro Nac. de Eng. de Produção – Porto Alegre, RS, Brasil, 29 out a 01 de nov de 2005
sem utilizar transformação na variável dependente. O ajuste deste modelo apresentou a
variável “procedência” sem significância estatística e um coeficiente de determinação de 0,24
(R2 = 0,24). Ademais, seu ajuste foi feito de uma forma geral, sem avaliar a influência dos
níveis de cada variável independente.
Neste artigo utilizou-se um modelo pertencente à classe dos modelos lineares generalizados, o
modelo de quase-verossimilhança, apresentado anteriormente. Considerando inicialmente o
modelo g(µi) = β0+∑βjxij+ε, com i = (1, ..., 754) ; j = (1, ..., 4) e não é assumido a priori que a
variável dependente (proporção de produtos defeituosos) possui uma distribuição de
probabilidade, apenas escolheu-se uma função de variância, do tipo V (µ) = µ(1- µ), as
variáveis independentes (x1, x2, x3 e x4) como estrutura linear e a função de ligação “logit”
(descrita anteriormente). A estimação dos parâmetros foi realizada pelo método da
maximização da função de quase-verossimilhança apresentada pelo modelo.
Na Tabela 1, apresenta-se as estimativas dos parâmetros e teste t para o modelo de quaseverossimilhança ajustado, contendo apenas as variáveis independentes que são
estatisticamente significantes para explicar a variável dependente “proporção de produtos
defeituosos ou produtos não conforme as especificações”, ao nível explanatório de 1%.
Construindo então o modelo, ŷ = -3,7692 + 2,0475(seleção 2) + 2,2857(seleção 3) +
2,5226(seleção 4) + 2,7583(seleção 5) + 0,2672(avaliador 2) + 0,4483(avaliador 3) –
0,8357(rebaixado), o qual apresenta um coeficiente de determinação (R2) de 0,467. Nota-se
que a variável “procedência” não apresentou um nível explanatório significativo para
permanecer no modelo, confirmando com os resultados apresentados por Arriba (2005).
Avaliando as estimativas encontradas pelo modelo, observa-se que exp[β1] = exp [2,0475] =
7,75 o que significa estimar que, a seleção tipo 2 apresenta 7,75 vezes mais chances de
produzir proporção de produtos defeituosos que a seleção tipo 1. Bem como a seleção tipo 5,
apresenta 15,77 vezes mais chances (exp[β4] = exp [2,7583] = 15,77) que a seleção tipo 1. O
mesmo ocorre para a variável independente “classificador”, que os avaliadores 2 e 3
aumentam as chances de produzir produtos não conforme as especificações em 30% e 56%
respectivamente. Para a variável independente “rebaixamento”, o fato de a estimativa do
parâmetro ser negativa (β7 = -0,8357), indica que com o estado de textura da matéria-prima
estar rebaixado à chance de produzir proporção de produtos não conforme as especificações
diminui em 43,3% (exp[β7] = exp [-0,8357] = 0,4335).
Parâmetro
Intercepto
Seleção de Couro
Tipo 1
Tipo 2
Tipo 3
Tipo 4
Tipo 5
Classificador
Avaliador 1
Avaliador 2
Avaliador 3
Rebaixamento
Não
Sim
Dispersão (φ)
Estimativa
-3,7692
Erro padrão
0,3844
t0
-9,805
P-valor
< 0,001
2,0475
2,2857
2,5226
2,7583
0,4219
0,3886
0,3878
0,3913
4,853
5,882
6,505
7,049
< 0,001
< 0,001
< 0,001
< 0,001
0,2672
0,4483
0,1095
0,0877
2,441
5,111
0,0150
< 0,001
-0,8357
0,15512
0,0917
0,5015
-9,113
< 0,001
Tabela 1 – Estimativas dos parâmetros e Teste t para o Modelo de Quase-verossimilhança
ENEGEP 2005
ABEPRO
1464
XXV Encontro Nac. de Eng. de Produção – Porto Alegre, RS, Brasil, 29 out a 01 de nov de 2005
3.3 Análise da Adequação do Modelo
Para avaliar a adequação do modelo, apresenta-se alguns gráficos de diagnóstico (resíduos
padronizados versus valores preditos, resíduos padronizados versus índices das observações,
resíduos Deviance versus índices das observações e distância de Cook’s versus índices das
observações). Nota-se na Figura 1 (a) e (b) que há dois pontos com valor residual acima 2,0,
correspondendo às observações 685 e 702. Na Figura 1 (c) verifica-se apenas os pontos 685 e
702 que estão com valor residual superior aos outros. Fahrmeir e Tutz (1994) recomendam
que na análise dos resíduos convêm observar a aleatoriedade dos resíduos e investigar quando
há valores discrepantes, pois auxiliam na verificação da adequação das funções: de ligação e
de variância, utilizadas. Em relação à distância de Cook’s, McCullagh e Nelder (1989)
sugerem que é conveniente analisar os casos em que di > 0,5, ou seja, que no gráfico da
distância de Cook’s se verifique a presença de observações com valores acima de 0,5. Nota-se
na Figura 1 (d) que as observações 685, 702 e 745 aparecem em destaque, indicando que elas
são observações influentes. Segundo Cordeiro e Lima Neto (2004) as observações influentes
não devem ser retiradas do modelo, pois sua exclusão pode implicar mudanças substâncias
nas estatísticas do modelo. Portanto, as observações 685 e 702 que embora apareceram como
pontos discrepantes nos gráficos de resíduos, são também pontos influentes e não podem ser
retiradas do modelo.
(b)
(a)
(d)
(c)
Figura 2 – Gráficos de diagnóstico para os dados com o ajuste do modelo de quase-verossimilhança
ENEGEP 2005
ABEPRO
1465
XXV Encontro Nac. de Eng. de Produção – Porto Alegre, RS, Brasil, 29 out a 01 de nov de 2005
4. Considerações Finais
Este trabalho apresenta a modelagem estatística da proporção de produtos defeituosos em uma
empresa de artefatos de couro. Para os fins da modelagem, realizou-se a avaliação das
características na linha de produção através de um conjunto de variáveis independentes
relevantes, consideradas como possíveis fatores de influência.
O uso dos modelos de regressão tradicionais, tal como modelo linear múltiplo, necessita
certas pressuposições. Entretanto, sabe-se que tais suposições são frequentemente violadas na
prática, já que nem todos os fenômenos podem ser bem modelados supondo distribuição
normal, pois conforme muitos autores o valor em proporção ou percentual seguem a
distribuição binomial. Foi demonstrado neste artigo que os MLG’s, mais especificamente os
modelos de quase-verossimilhança, apresentam flexibilidade na modelagem de dados na
forma de proporções ou percentuais, facilidade na utilização e bom ajuste do modelo.
O modelo de quase-verossimilhança usado se mostrou estar adequado na modelagem da
proporção de produtos defeituosos, gerando o valor do coeficiente de determinação (R2)
superior ao encontrado pela regressão linear múltipla e estimativas precisas e confiáveis dos
parâmetros do modelo, bem como a identificação dos níveis das variáveis independentes que
influenciam na proporção de produtos defeituosos produzidos na linha de produção da
empresa de artefatos de couro.
Observa-se a importância da escolha adequada do modelo de regressão a ser utilizado e os
procedimentos a serem realizados nas possíveis variáveis independentes para avaliar a
influência na variável dependente.
Referências
ARRIBA, G.D. (2005) – Otimização de um processo de classificação de couros wet blue: Um caso em uma
indústria curtidora. Dissertação de Mestrado. Universidade Federal do Rio Grande do Sul – UFRGS. Escola de
Engenharia – EE/PPGEP/UFRGS. Porto Algegre. RS. Brasil.
CORDEIRO, G.M. & LIMA NETO, E.A. (2004) – Modelos Paramétricos. Livro texto de minicurso, XVI
Simpósio Nacional de Probabilidade e Estatística. Águas de Lindóia. São Paulo. 246 p.
COX, C. (1996) – Nonlinear quasi-likelihood models: applications to continuous proportions. Computational
Statistical & Data Analysis, Vol. 21, p. 449-461.
DOBSON, A.J. (1990) – An Introduction to Generalized Linear Models. Chapman & Hall. London.
FAHRMEIR, L. & TUTZ, G. (1994) – Multivariate Statistical Modeling based on Generalized Linear Models.
Springer. New York.
KIESCHNICK, R. & McCULLOUGH, B.D. (2003) – Regression Analysis of variates observed on (0,1):
percetages, proportions and fractions. Statistical Modelling, Vol. 3, p. 193-213.
LEWIS, S.R.; MONTGOMERY, D.C. & MYERS, R.H. (2001) – Examples of designed experiments with
nonnormal responses. Journal of Quality Technology, Vol. 33, p. 265-278.
McCULLAGH, P. & NELDER, J.A. (1989) – Generalized Linear Models. Chapman & Hall. 2a Edição. London.
MYERS, R.H. & MONTGOMERY, D.C. (1997) – A Tutorial on Generalized Linear Models. Journal of Quality
Technology, Vol. 29, p. 274-290.
MONTGOMERY, D.C. & PECK, E.A. (1992) – Introduction to Linear Regression. John Wiley. New York.
NELDER, J.A. & WEDDERBURN, R.W.M. (1972) – Generalized Linear Models. Journal of the Royal
Statistical Society A, Vol. 135, p. 370–384.
PARK, S.H. (1996) – Robust Design and Analysis for Quality Control. Chapman & Hall. London.
WEDDERBURN, R.W.M. (1974) – Quasi-likelihood functions, generalized linear models and the GaussNewton method. Biometrika. Vol. 61, p. 439-447.
ENEGEP 2005
ABEPRO
1466
Download

Modelagem da proporção de produtos defeituosos usando