XXV Encontro Nac. de Eng. de Produção – Porto Alegre, RS, Brasil, 29 out a 01 de nov de 2005 Modelagem da proporção de produtos defeituosos usando Modelo de Quase-verossimilhança Ângelo Márcio O. Sant’Anna (UFRGS) [email protected] Carla Schwengber ten Caten (UFRGS) [email protected] Resumo A proporção de produtos defeituosos em um determinado conjunto de observações, ou proporção de produtos não conforme as especificações, é uma importante informação a respeito do comportamento do processo de produção de uma indústria. A modelagem da proporção de produtos defeituosos ou de itens não conforme as especificações através de um modelo de regressão tradicional nem sempre é recomendada, uma vez que estes modelos requerem certas pressuposições para uso. Desta forma, o uso dos modelos de Quaseverossimilhança (MQV’s) propostos por Wedderburn (1974) são mais adequados. O objetivo deste artigo é apresentar o uso do MQV, bem como a sua flexibilidade na modelagem de dados mensurados em proporção, ilustrada por uma aplicação numérica. Palavras-chave: MLG, Quase-verossimilhança, Proporções. 1. Introdução O processo de fabricação de um produto consiste basicamente na determinação das características de qualidade conforme uma dada especificação, entretanto em muitos casos, fatores de variabilidade podem dar origem à fabricação de produtos que apresentem as suas características de qualidade fora das especificações, ou seja, como produtos defeituosos. A identificação da proporção de produtos defeituosos ou não conforme as especificações é feita a partir de uma inspeção nos produtos após a sua fabricação e constatado que estes produtos não apresentam um funcionamento adequado para uso. Segundo Park (1996) é fundamental que as empresas busquem desenvolver um processo robusto, de produção de bens e fornecimento de serviços. Embora, apenas o desenvolvimento deste processo não garanta a empresa o fim da produção de produtos defeituosos, fazendo-se importante a realização de etapas complementares, como por exemplo, a modelagem das informações produzidas pelo processo. Neste contexto, Montgomery e Peck (1992) relatam, que a construção de um modelo de regressão permite investigar possíveis efeitos que influenciam no processo. Conforme Montgomery e Peck (1992) para uso da abordagem estatística, ao analisar um processo, é necessário previamente possuir uma idéia do que será estudado, como os dados serão coletados, classificação da natureza dos dados (discretos ou contínuos) e um entendimento qualitativo de como serão analisados, portanto, antes de se iniciar a modelagem dos dados é necessário caracterizar a variável dependente como discreta ou contínua. O número de produtos defeituosos em uma amostra é classificado como uma variável aleatória discreta, pois esta pode ser representada por um valor de grandeza no conjunto dos números reais (LEWIS et al.,2001) e esta variável segue a distribuição de probabilidade binomial. Segundo Cordeiro e Lima Neto (2004) a proporção de produtos defeituosos também segue uma distribuição binomial, as quais apresentam mensurações sempre positivas e restritas ao intervalo [0,1]. Portanto, conhecer as causas (variáveis independentes) e os respectivos efeitos sobre a proporção de produtos defeituosos (variável dependente) através de modelos ENEGEP 2005 ABEPRO 1459 XXV Encontro Nac. de Eng. de Produção – Porto Alegre, RS, Brasil, 29 out a 01 de nov de 2005 de regressão pode ser uma estratégia poderosa. A modelagem da proporção de produtos defeituosos em um determinado conjunto de observações através de um modelo de regressão linear múltipla nem sempre é recomendada, uma vez que este modelo requer a suposição de que os dados seguem a distribuição normal. Pelo fato dos dados serem uma proporção dificilmente apresentará normalidade, portanto deve-se buscar uma nova forma de relacionar as variáveis independentes à variável dependente, para isto pode-se utilizar os conceitos de modelos lineares generalizados, mais especificamente os modelos de quase-verossimilhança. Este trabalho tem como objetivo apresentar o uso do modelo de quase-verossimilhança, bem como a sua eficiência na modelagem da proporção de produtos defeituosos. Ademais, apresenta-se uma aplicação numérica para ilustrar os conceitos teóricos abordados. 2. Modelos Lineares Generalizados Os Modelos Lineares Generalizados (MLG’s) englobam uma classe de modelos de regressão usuais em Estatística, tais como o modelo linear normal, modelo logístico, modelos loglineares, modelos de quase-verossimilhança, entre outros. Na verdade, esta capacidade de "unificação" de modelos é uma das características principais dos MLG’s. Segundo McCullagh e Nelder (1989) estes modelos de regressão são utilizados para investigar e modelar a relação entre a variável dependente e duas ou mais variáveis independentes, sendo esta relação descrita por uma função matemática, com diversos termos associados a cada variável independente. A partir da expressão matemática que modela o fenômeno em estudo é possível estimar o valor da variável dependente para diferentes valores das variáveis independentes. Conforme Dobson (1990) os modelos lineares generalizados, propostos por Nelder e Wedderburn (1972), permitem o ajuste de modelos de regressão quando a distribuição da variável dependente pertencer à família exponencial de distribuições, que contempla, as distribuições binomial, normal e poisson, dentre outras. Em linhas gerais, as distribuições pertencentes à família exponencial devem possuir a mesma função densidade de probabilidade dependente de um parâmetro θ. Esta função pode ser escrita na forma: f(y;θ) = exp [a(y)b(θ) + c(θ) + d(y)], onde a(y), b(θ) e c(θ) são funções específicas, sendo θ o parâmetro natural da distribuição e y a variável aleatória da distribuição. Para McCullagh e Nelder (1989) a função pode ser escrita da forma f(y;θ, φ) = exp {a(φ)-1[yθ - b(θ)] + c(y;φ)}, onde a(.), b(.) e c(.) são funções conhecidas, θ é o parâmetro de localização e φ > 0 é o parâmetro de dispersão, algumas vezes denominado de σ2. Os MLG’s são essencialmente caracterizados por possuírem três componentes: a componente aleatória, que identifica a distribuição de probabilidade da variável dependente y pertencente à família exponencial; a componente sistemática, que especifica a estrutura das variáveis independentes, que é utilizada como preditor linear η; e a função de ligação, que descreve a relação funcional entre a componente sistemática e o valor esperado da componente aleatória (a média µ da variável dependente y). Além disso, tais modelos admitem não-homogeneidade de variância da variável dependente e uma função de variância específica (FAHRMEIR e TUTZ, 1994). Conforme Dobson (1990) a variável dependente (proporção de produtos defeituosos) segue uma distribuição de probabilidade binomial, esta distribuição é demonstrada na literatura que pertence à família exponencial. Segundo Cordeiro et al.(2004) o estudo de dados na forma de proporção é descrito formalmente como um modelo linear, pois modela a proporção esperada πi de sucesso de um referido evento ocorrer (por exemplo, possuir defeito), em um conjunto ENEGEP 2005 ABEPRO 1460 XXV Encontro Nac. de Eng. de Produção – Porto Alegre, RS, Brasil, 29 out a 01 de nov de 2005 de ni dados investigados, em termos das variáveis independentes xi, através de uma função de ligação que relaciona a média (µi) da variável dependente à estrutura linear das variáveis independentes (xi), i = (1, ..., p). A forma da estrutura das variáveis independentes que compõem o modelo de regressão é de uma soma linear, caracterizando a parte sistemática do modelo, definida como η = β0 + β1x1 + ... + βpxp, onde a função linear η é denominada de preditor linear e β’s parâmetros desconhecidos. Além disso, outra característica da componente sistemática de um modelo linear é que a média µ da variável dependente y pode ser expressa por uma função conhecida g(.), denominada de função de ligação (MYERS et al., 1997), a qual descreve a relação funcional (ligação) entre a média µ e o preditor linear η, descrevendo a forma g(µi) = ηi =β0 + β1xi1 + ... + βpxip. Conforme Lewis et al.(2001) a função de ligação g(.) é responsável pela transformação da média da variável dependente, e não dos dados. A escolha da função de ligação depende do problema de modelagem em particular e, que em muitas vezes pode apresentar uma função de ligação diferente conforme o conjunto de observações. Segundo McCullagh e Nelder (1989) quando os dados seguem uma distribuição binomial, as funções de ligação g(.) mais π adequadas são: função Logit g (µ i ) = log i , função Probit g (µ i ) = Φ −1 (π i ) e função 1− π i Complemento log-log g (µ i ) = log{− log(1 − π i )} , pois preservam as restrições sobre o valor da probabilidade πi. Para Kieschnick e McCullogh (2003) a escolha da função de ligação mais adequada não implica em qualidade de ajuste do modelo de regressão, o que é mais importante. Assim como, o uso da função de log-verossimilhança, que é definida pelo logaritmo da distribuição de probabilidade da variável dependente, na estimação dos parâmetros desconhecidos (β’s) do modelo. 2.2 Modelo de Quase-verossimilhança Como foi visto anteriormente, para alguns modelos de regressão realizar a modelagem de um conjunto de observações, primeiro deve-se assumir que os dados seguem uma distribuição de probabilidade conhecida e que esta pertença à família exponencial, em alguns casos não é adequado escolher uma distribuição de probabilidade a priori para os dados, pois os dados podem não seguir algumas distribuições de probabilidade. Nestes casos, Weddeburn (1974) propôs os modelos de quase-verossimilhança (MQV’s) pertencentes à classe dos MLG’s, pois estes modelos apresentam uma componente sistemática (estrutura linear das variáveis independentes) e função de ligação que relaciona a média (µi) da variável dependente à estrutura linear das variáveis independentes (xi), i = (1, ..., p). Porém para estes modelos, não há a necessidade de assumir a princípio alguma distribuição de probabilidade para a variável dependente. Por conseguinte, a esperança matemática e a variância da variável aleatória não são conhecidas a priori. Segundo Cox (1996) quando modelamos um conjunto de dados usando os MQV’s, a variância é modelada como uma função da média da variável dependente, multiplicada ainda por um parâmetro de dispersão constante. Desta forma, a distribuição da variável dependente ficará determinada quando a função de variância escolhida coincidir com a função de variância de alguma distribuição de probabilidade pertencente à família exponencial. Vejamos então, seja yi uma variável aleatória qualquer de interesse, que assume a E[yi] = µi e uma variância definida por Var[yi] = φ*V (µ), onde a função de variância V (µ) = µ(1- µ) é uma função conhecida da média µi e φ é o parâmetro de dispersão constante. A função de ENEGEP 2005 ABEPRO 1461 XXV Encontro Nac. de Eng. de Produção – Porto Alegre, RS, Brasil, 29 out a 01 de nov de 2005 quase-verossimilhança para um modelo de regressão é definida por Q( y i ; µ i ) = ∫ µ y i − t dt , para y esta variável aleatória apresenta a forma Q( y i ; µ i ) = 1 φ ∫ µ y φ ⋅ V (t ) yi − µ i dt . O logaritmo da função de µ i (1 − µ i ) quase-verossimilhança fica nesse caso dado por Q( y i ; µ i ) = y i ln µ i + ln(1 − µ i ) , que 1 − µi conforme McCullagh e Nelder (1989), corresponde a função de variância V[µ] =µ(1-µ) e a função de log-verossimilhança da distribuição binomial L( y i ; µ i ) = y i ln µ i + ni ln(1 − µ i ) . 1 − µi Nota-se portanto, que a principal diferença está em que quando se usa a função de quaseverossimilhança para estimar os coeficientes (parâmetros desconhecidos), apenas se define a relação da variância da variável dependente com a sua média, não sendo necessário definir anteriormente uma distribuição de probabilidade. De acordo com Cox (1996) uma vantagem da flexibilidade de uso dos MQV’s na modelagem de uma variável dependente em conjunto de dados, é que poderíamos utilizar uma função de variância que melhor se ajuste aos dados, sem assumir a priori uma distribuição de probabilidade para esta variável dependente. 2.3 Adeqüabilidade do Modelo A adequação de um modelo é avaliada pela sua capacidade preditiva e definida a partir dos próprios dados utilizados na determinação do modelo. Modelos de regressão com bom desempenho estatístico apresentam pequena discrepância entre os dados reais e seus respectivos valores preditos. Em muitas aplicações, o coeficiente de determinação (R2) é utilizado como indicador numérico que permite comparar o desempenho de diferentes modelos. Ademais, segundo Cordeiro e Lima Neto (2004) na adequação do modelo aos dados é fundamental a análise de técnicas gráficas como, avaliação do gráfico de resíduos, presença de possíveis outlier (valores anômalos) e a observação de pontos influentes (valores que influenciam na estimativa da média da variável dependente). Em uma modelagem, variáveis independentes e/ou a combinação destas variáveis (tal como interação de variáveis independentes) só devem ser acrescentadas ao modelo se apresentarem sobre o comportamento da variável dependente, um nível explanatório significativo. Para garantir a inclusão somente de variáveis significativas no modelo, procedem-se testes de significância estatística. 3. Aplicação Numérica O estudo de aplicação dos modelos foi desenvolvido com as informações de uma empresa de artefatos de couro, onde se buscou avaliar a qualidade das peças de couro, conforme certas características na sua linha de produção. Tais características foram definidas como variáveis relevantes para a modelagem, mesmo apresentando uma natureza qualitativa. Neste caso, as variáveis independentes qualitativas foram tratadas com o auxílio de variáveis dummy. O uso deste tipo de variável permite uma análise de associação entre os níveis das variáveis independentes em relação a variável dependente. Sendo elas: Seleção - A matéria-prima em cinco diferentes estágios (conforme qualidade e preço, escala de 1 = baixo a 5 = alto); Procedência - A origem da matéria-prima adquirida pela empresa (locais de origem, escala de 1 a 5); Classificador - Profissional que avalia as peças de couro, de diferentes seleções e origem ENEGEP 2005 ABEPRO 1462 XXV Encontro Nac. de Eng. de Produção – Porto Alegre, RS, Brasil, 29 out a 01 de nov de 2005 (profissionais, escala de 1 a 3); Rebaixamento - Estado da textura da matéria-prima couro (escala: 1 = não e 2 = sim); O classificador recebe um lote de diferentes tamanhos contendo os produtos e as avalia se os mesmos encontram-se conforme a especificação, por métodos cognitivos (utilizando alguns dos sentidos: visão, olfato e tato). Assim, a proporção de produtos defeituosos ou produtos não conforme as especificações foi considerada a variável de investigação (variável dependente) e a seleção (x1), procedência (x2), classificador (x3) e rebaixamento (x4) foram consideradas possíveis fatores de influência (variáveis independentes), numa amostra de 754 lotes. O interesse encontra-se na modelagem da proporção de produtos defeituosos pelas variáveis independentes acima descritas avaliada segundo o modelo de quaseverossimilhança. O modelo de quase-verossimilhança proposto foi realizado no software estatístico R 2.0.1. 3.1 Análise dos Efeitos 0,3 24,4% 0,25 21,4% 0,2 16,3% 16,2% 0,15 0,1 0,05 2,3% 0 Tipo 1 Tipo 2 Tipo 3 Tipo 4 Tipo 5 Proporção de defeituosos Proporção de defeituosos Realizando uma análise preliminar dos efeitos das variáveis independentes e a variável dependente “proporção de produtos defeituosos”, nota-se na Figura 2 (a), que a proporção de produtos defeituosos para a variável “seleção” apresenta uma tendência crescente da proporção à medida que aumenta o nível da variável “seleção”. Na Figura 2 (b) a variável “procedência” não apresenta uma relação de tendência com a proporção de defeituosos. Observa-se que o avaliador 3 da variável “classificador” apresentou maior proporção de defeituosos que os outros dois avaliadores e que o nível rebaixado da variável “rebaixamento” apresenta menor proporção de defeituosos, conforme Figuras 2(c) e (d). 0,3 0,2 24,2% 23,7% 0,25 16,8% 0,15 0,1 0,05 0 Origem 1 Origem 2 Seleção Proporção de defeituosos Proporção de defeituosos 0,25 0,2 15,8% 14,7% 0,1 0,05 0 Avaliador 1 Avaliador 2 Origem 4 Origem 5 (b) 25,6% 0,15 Origem 3 Procedência (a) 0,3 24,2% 20,6% Avaliador 3 0,3 23,5% 0,25 0,2 12,4% 0,15 0,1 0,05 0 Não Sim Classificador Rebaixamento (c) (d) Figura 2 – Gráficos das proporções de defeituosos em função das variáveis independentes 3.2 Análise do Ajuste do Modelo A análise inicial deste conjunto de dados foi realizada por Arriba (2005), consistindo num ajuste de um modelo de regressão linear múltipla com as quatro variáveis independentes e ENEGEP 2005 ABEPRO 1463 XXV Encontro Nac. de Eng. de Produção – Porto Alegre, RS, Brasil, 29 out a 01 de nov de 2005 sem utilizar transformação na variável dependente. O ajuste deste modelo apresentou a variável “procedência” sem significância estatística e um coeficiente de determinação de 0,24 (R2 = 0,24). Ademais, seu ajuste foi feito de uma forma geral, sem avaliar a influência dos níveis de cada variável independente. Neste artigo utilizou-se um modelo pertencente à classe dos modelos lineares generalizados, o modelo de quase-verossimilhança, apresentado anteriormente. Considerando inicialmente o modelo g(µi) = β0+∑βjxij+ε, com i = (1, ..., 754) ; j = (1, ..., 4) e não é assumido a priori que a variável dependente (proporção de produtos defeituosos) possui uma distribuição de probabilidade, apenas escolheu-se uma função de variância, do tipo V (µ) = µ(1- µ), as variáveis independentes (x1, x2, x3 e x4) como estrutura linear e a função de ligação “logit” (descrita anteriormente). A estimação dos parâmetros foi realizada pelo método da maximização da função de quase-verossimilhança apresentada pelo modelo. Na Tabela 1, apresenta-se as estimativas dos parâmetros e teste t para o modelo de quaseverossimilhança ajustado, contendo apenas as variáveis independentes que são estatisticamente significantes para explicar a variável dependente “proporção de produtos defeituosos ou produtos não conforme as especificações”, ao nível explanatório de 1%. Construindo então o modelo, ŷ = -3,7692 + 2,0475(seleção 2) + 2,2857(seleção 3) + 2,5226(seleção 4) + 2,7583(seleção 5) + 0,2672(avaliador 2) + 0,4483(avaliador 3) – 0,8357(rebaixado), o qual apresenta um coeficiente de determinação (R2) de 0,467. Nota-se que a variável “procedência” não apresentou um nível explanatório significativo para permanecer no modelo, confirmando com os resultados apresentados por Arriba (2005). Avaliando as estimativas encontradas pelo modelo, observa-se que exp[β1] = exp [2,0475] = 7,75 o que significa estimar que, a seleção tipo 2 apresenta 7,75 vezes mais chances de produzir proporção de produtos defeituosos que a seleção tipo 1. Bem como a seleção tipo 5, apresenta 15,77 vezes mais chances (exp[β4] = exp [2,7583] = 15,77) que a seleção tipo 1. O mesmo ocorre para a variável independente “classificador”, que os avaliadores 2 e 3 aumentam as chances de produzir produtos não conforme as especificações em 30% e 56% respectivamente. Para a variável independente “rebaixamento”, o fato de a estimativa do parâmetro ser negativa (β7 = -0,8357), indica que com o estado de textura da matéria-prima estar rebaixado à chance de produzir proporção de produtos não conforme as especificações diminui em 43,3% (exp[β7] = exp [-0,8357] = 0,4335). Parâmetro Intercepto Seleção de Couro Tipo 1 Tipo 2 Tipo 3 Tipo 4 Tipo 5 Classificador Avaliador 1 Avaliador 2 Avaliador 3 Rebaixamento Não Sim Dispersão (φ) Estimativa -3,7692 Erro padrão 0,3844 t0 -9,805 P-valor < 0,001 2,0475 2,2857 2,5226 2,7583 0,4219 0,3886 0,3878 0,3913 4,853 5,882 6,505 7,049 < 0,001 < 0,001 < 0,001 < 0,001 0,2672 0,4483 0,1095 0,0877 2,441 5,111 0,0150 < 0,001 -0,8357 0,15512 0,0917 0,5015 -9,113 < 0,001 Tabela 1 – Estimativas dos parâmetros e Teste t para o Modelo de Quase-verossimilhança ENEGEP 2005 ABEPRO 1464 XXV Encontro Nac. de Eng. de Produção – Porto Alegre, RS, Brasil, 29 out a 01 de nov de 2005 3.3 Análise da Adequação do Modelo Para avaliar a adequação do modelo, apresenta-se alguns gráficos de diagnóstico (resíduos padronizados versus valores preditos, resíduos padronizados versus índices das observações, resíduos Deviance versus índices das observações e distância de Cook’s versus índices das observações). Nota-se na Figura 1 (a) e (b) que há dois pontos com valor residual acima 2,0, correspondendo às observações 685 e 702. Na Figura 1 (c) verifica-se apenas os pontos 685 e 702 que estão com valor residual superior aos outros. Fahrmeir e Tutz (1994) recomendam que na análise dos resíduos convêm observar a aleatoriedade dos resíduos e investigar quando há valores discrepantes, pois auxiliam na verificação da adequação das funções: de ligação e de variância, utilizadas. Em relação à distância de Cook’s, McCullagh e Nelder (1989) sugerem que é conveniente analisar os casos em que di > 0,5, ou seja, que no gráfico da distância de Cook’s se verifique a presença de observações com valores acima de 0,5. Nota-se na Figura 1 (d) que as observações 685, 702 e 745 aparecem em destaque, indicando que elas são observações influentes. Segundo Cordeiro e Lima Neto (2004) as observações influentes não devem ser retiradas do modelo, pois sua exclusão pode implicar mudanças substâncias nas estatísticas do modelo. Portanto, as observações 685 e 702 que embora apareceram como pontos discrepantes nos gráficos de resíduos, são também pontos influentes e não podem ser retiradas do modelo. (b) (a) (d) (c) Figura 2 – Gráficos de diagnóstico para os dados com o ajuste do modelo de quase-verossimilhança ENEGEP 2005 ABEPRO 1465 XXV Encontro Nac. de Eng. de Produção – Porto Alegre, RS, Brasil, 29 out a 01 de nov de 2005 4. Considerações Finais Este trabalho apresenta a modelagem estatística da proporção de produtos defeituosos em uma empresa de artefatos de couro. Para os fins da modelagem, realizou-se a avaliação das características na linha de produção através de um conjunto de variáveis independentes relevantes, consideradas como possíveis fatores de influência. O uso dos modelos de regressão tradicionais, tal como modelo linear múltiplo, necessita certas pressuposições. Entretanto, sabe-se que tais suposições são frequentemente violadas na prática, já que nem todos os fenômenos podem ser bem modelados supondo distribuição normal, pois conforme muitos autores o valor em proporção ou percentual seguem a distribuição binomial. Foi demonstrado neste artigo que os MLG’s, mais especificamente os modelos de quase-verossimilhança, apresentam flexibilidade na modelagem de dados na forma de proporções ou percentuais, facilidade na utilização e bom ajuste do modelo. O modelo de quase-verossimilhança usado se mostrou estar adequado na modelagem da proporção de produtos defeituosos, gerando o valor do coeficiente de determinação (R2) superior ao encontrado pela regressão linear múltipla e estimativas precisas e confiáveis dos parâmetros do modelo, bem como a identificação dos níveis das variáveis independentes que influenciam na proporção de produtos defeituosos produzidos na linha de produção da empresa de artefatos de couro. Observa-se a importância da escolha adequada do modelo de regressão a ser utilizado e os procedimentos a serem realizados nas possíveis variáveis independentes para avaliar a influência na variável dependente. Referências ARRIBA, G.D. (2005) – Otimização de um processo de classificação de couros wet blue: Um caso em uma indústria curtidora. Dissertação de Mestrado. Universidade Federal do Rio Grande do Sul – UFRGS. Escola de Engenharia – EE/PPGEP/UFRGS. Porto Algegre. RS. Brasil. CORDEIRO, G.M. & LIMA NETO, E.A. (2004) – Modelos Paramétricos. Livro texto de minicurso, XVI Simpósio Nacional de Probabilidade e Estatística. Águas de Lindóia. São Paulo. 246 p. COX, C. (1996) – Nonlinear quasi-likelihood models: applications to continuous proportions. Computational Statistical & Data Analysis, Vol. 21, p. 449-461. DOBSON, A.J. (1990) – An Introduction to Generalized Linear Models. Chapman & Hall. London. FAHRMEIR, L. & TUTZ, G. (1994) – Multivariate Statistical Modeling based on Generalized Linear Models. Springer. New York. KIESCHNICK, R. & McCULLOUGH, B.D. (2003) – Regression Analysis of variates observed on (0,1): percetages, proportions and fractions. Statistical Modelling, Vol. 3, p. 193-213. LEWIS, S.R.; MONTGOMERY, D.C. & MYERS, R.H. (2001) – Examples of designed experiments with nonnormal responses. Journal of Quality Technology, Vol. 33, p. 265-278. McCULLAGH, P. & NELDER, J.A. (1989) – Generalized Linear Models. Chapman & Hall. 2a Edição. London. MYERS, R.H. & MONTGOMERY, D.C. (1997) – A Tutorial on Generalized Linear Models. Journal of Quality Technology, Vol. 29, p. 274-290. MONTGOMERY, D.C. & PECK, E.A. (1992) – Introduction to Linear Regression. John Wiley. New York. NELDER, J.A. & WEDDERBURN, R.W.M. (1972) – Generalized Linear Models. Journal of the Royal Statistical Society A, Vol. 135, p. 370–384. PARK, S.H. (1996) – Robust Design and Analysis for Quality Control. Chapman & Hall. London. WEDDERBURN, R.W.M. (1974) – Quasi-likelihood functions, generalized linear models and the GaussNewton method. Biometrika. Vol. 61, p. 439-447. ENEGEP 2005 ABEPRO 1466