UTILIZAÇÃO DE SPLINE NA AVALIAÇÃO DO ADITIVO ANTIOXIDANTE DBPC EM ÓLEO ISOLANTE Terezinha Ferreira OLIVEIRA1 Joaquim Carlos Barbosa QUEIROZ1 Augusto César Fonseca SARAIVA2 Helyelson Paredes MOURA3 RESUMO: Foram realizados vários ensaios para se encontrar as concentrações percentuais em peso do aditivo antioxidante 2,6 – diterc butil para cresol (DBPC) de uma mesma amostra de óleo isolante usado em transformador monofásico (138/69/13.8 Kv), com base na norma ASTM D 2668 – 92. Na avaliação desses resultados, foi utilizado o método de suavização por spline. A importância deste método reside na diminuição de custos e implementação de uma metodologia para as referidas análises. A partir do controle do parâmetro de suavização do modelo avaliou-se o número mínimo de ensaios necessários para o melhor ajuste de uma função polinomial aos dados experimentais. Como medidas de precisão do ajuste, utilizou-se o erro quadrático médio (MSE) e o coeficiente de explicação (R2). Obtiveram-se os melhores resultados para 15 e 20 ensaios PALAVRAS-CHAVE: Diterc butil para cresol; suavização por spline; mínimos quadrados penalizados; erro quadrático médio. 1 Introdução Campos e Leontsinis (1990) mostram que, a partir do petróleo bruto, chega-se ao óleo mineral isolante pela destilação fracionada e tratamento físico-químico para acabamento final. O óleo mineral isolante, ou apenas óleo isolante, é uma associação de hidrocarbonetos. Embora com aparente sensibilidade, os hidrocarbonetos que o compõe possuem propriedades físico-químicas distintas, variando tanto na quantidade de hidrogênio e carbono, como em suas formas de ligação. A aplicação do óleo isolante nos equipamentos eletromecânicos, principalmente para fins de isolação e dissipação de calor, protege a celulose de isolação, a qual é empregada no isolamento elétrico das bobinas propiciando a isolação elétrica entre espirais e núcleo. A presença da umidade diminui a qualidade de isolação elétrica e a resistência mecânica do papel, e por meio de reações químicas fornece água degradando a celulose. Uma forma de tornar mais lenta a absorção total da umidade pelo papel é impregná-lo com óleo isolante, protegendo-o dessa forma 1 Departamento de Estatística, Universidade Federal do Pará - UFPA, CEP 66075-110, Belém, PA, Brasil, Email: [email protected] / [email protected] 2 ELETRONORTE, Laboratório Central, CEP 66077-530, Belém, PA, Brasil. E-mail: [email protected] 3 Departamento de Matemática, Universidade Federal do Amapá – UNIFAP, CEP 68.902-280, Macapá, AP, Brasil, E-mail: [email protected] Rev. Mat. Estat., São Paulo, v.23, n.3, p.7-18, 2005 7 da umidade e do calor excessivo. Daí a importância de acompanhar seu estado, para se obter um bom desempenho dos equipamentos, sendo a estabilidade à oxidação uma das mais importantes características apresentadas. Por não se polimerizar e não interferir nas características dielétricas do óleo isolante, o 2 – 6 diterc butil para cresol, conhecido por DBPC é usado como inibidor de oxidação em óleos minerais. O DBPC é um fenol trisubstituido com bloqueamento estérico. Não reage em condições ambientes com ácidos, aldeídos, glicóis ou esteres e tem alto grau de estabilidade quando exposto a luz, calor e ar, e a ação de radicais livres, sendo, portanto antioxidante eficaz. Em geral, as concentrações dos compostos de interesse numa amostra são determinadas pelos sistemas de equações obtidos pela Lei de Beer em tantos comprimentos de onda quantos forem os analitos (Ferreira et al. 1999). Quando o óleo como o aditivo é submetido ao infravermelho, produz um incremento na absorbância de 2,72 µm (3680 cm-1) a 11,63 µm (860 cm-1) (ASTM, 1996). A absorção no infravermelho é uma ferramenta de alta resolução. Conclusões com relação à continuidade da qualidade de óleo, não devem ser tomadas até que suficientes dados sejam acumulados de modo que o nível de variação esteja claramente estabelecido. Para a avaliação da variação do DBPC, utilizando o método de suavização por spline, observou-se o conjunto de dados experimentais que apresentou menor erro quadrático médio (Snedecor e Cochran, 1989). 2 Metodologia 2.1 Materiais e métodos Realizou-se no equipamento infravermelho NICOLET FTIR Modelo MAGNA 550, no Laboratório Central das Centrais Elétricas do Norte do Brasil S.A. - Eletronorte, Lacen, vários ensaios para se encontrar as concentrações percentuais em peso do aditivo antioxidante 2,6 – diterc butil para cresol (DBPC) de uma mesma amostra de óleo isolante usado em transformador monofásico (138/69/13.8 Kv), com base na norma ASTM D 2668 – 92. De acordo com o fabricante as condições ambientais que podem influenciar na leitura do infravermelho são: eletricidade estática, sendo necessário que a umidade esteja na faixa de 20% a 80% não condensada; mudanças de temperaturas, devendo estar entre 16ºC e 27ºC; carpetes; dutos de ar condicionados e janelas largas perto do sistema. Para garantir o controle no processo de obtenção dos dados alguns procedimentos foram adotados: temperatura ambiente a 19ºC; umidade relativa em 65%; utilização de uma cela de KBr de 0,5mm; lavagem da cela com CHCl3; lavagem do material utilizado no experimento em cada amostragem e a realização das medidas pelo mesmo técnico. Foram realizados 100 ensaios e os resultados obtidos apresentaram-se praticamente normais e sem outliers, conforme se pode observar nas Figuras 1 e 2. Em seguida foram obtidas amostras aleatórias de 10, 15, 20, 25, 30, 35, 40, 45 e 50 dos ensaios, mantendo-se constante o parâmetro de suavização e simulando-se um critério de eficiência: erro quadrático médio (EQM), que é comumente empregado na comparação de estimadores. 8 Rev. Mat. Estat., São Paulo, v.23, n.3, p.7-18, 200x 11 10 3 9 2 8 1 6 Probabilidade Freqüência 7 5 4 3 2 0 -1 -2 1 0 .1755 .1757 .1759 .1761 .1763 .1765 .1767 .1769 .1771 -3 0.175 0.176 0.176 0.176 DBPC FIGURA 1 - Histograma das concentrações em percentuais de peso do aditivo antioxidante Teste W (DBPC) no óleo isolante. Média = 0,176322; Desviopadrão = 0,0004007; n = 100. o EQM( θˆ1 ) ≤ EQM( θˆ2 ) para todo θ 2. Se os estimadores 0.177 0.178 FIGURA 2 - Teste de normalidade para as concentrações de DBPC. (Shapiro-Wilk): W = 0,9842; p = 0, 2788. Bolfarine e Sandoval (2001, p.7) mostram que um estimador valor de 0.177 DBPC θˆ1 é melhor que θˆ2 se θ 2, com “≤” substituído por “<” pelo menos para um são não viciados, então θˆ é dito ser o estimador de 1 variância uniformemente mínima se Var( θˆ1 ) ≤ Var( θˆ2 ) para todo θ 2, com ≤ substituído por < pelo menos para um valor de θ 2. Ou seja, o estimador não tendencioso que possui variância mínima pode ser considerado um estimador eficiente. 3 A teoria clássica de spline Pode-se considerar, em um sentido prático, o método spline uma evolução da inferência paramétrica clássica tornando-se uma ponte entre métodos paramétricos e nãoparamétricos. Embora spline não esteja em uma forma funcional, em muitos casos pode ser escrito como uma combinação linear de funções básicas que geralmente têm uma representação polinomial. Existe, desta forma, uma classe extremamente rica de funções com a vantagem adicional de poder usar propriedades de suavização com maior eficiência (Wegman e Wright, 1983). O problema da interpolação é ajustar uma curva através dos pontos (xi, yi), i=1, 2,..., n no plano. Uma malha ∆ = {ξ1 ( = x1 ) < ξ 2 < ... < ξ N ( = xn )} é escolhida com os ξ i sendo designados como nós. Um spline cúbico de interpolação com malha ∆ , escrito como s ∆ (x ) , é uma função com derivadas contínuas de ordem igual e superior a pontos 2 que coincide exatamente com um polinômio cúbico, possivelmente diferindo em cada intervalo [ ξ i , ξ i +1 ], i = 1,2, ... , N − 1 , interpolando {(xi, yi), i = 1,2,...,n}. Rev. Mat. Estat., São Paulo, v.23, n.3, p.7-18, 2005 9 Fazendo a malha coincidir com {xi, i = 1,2,..., n}, considerando h = xi+1 - xi e Mi = '' s ∆ ( xi ) , i =1,2, ... , n, a interpolação polinomial (xi, yi) e (xi+1, yi+1) torna-se: y = ai ( x − xi ) 3 + bi ( x − xi ) 2 + ci ( x − xi ) + d i (1) Após calcular as derivadas de várias ordens e avaliar os nós, encontra-se: ai = ci = ( M i +1 − M i ) Mi , bi = , 6hi 2 yi +1 − yi 2(hi M i + hi M i +1 ) − , d i = yi hi 6 (2) Desse modo, o problema do ajuste da curva se reduz a encontrar o valor de Mi. Sendo L um operador diferencial de ordem m com coeficientes constantes, D o operador de diferenciação e L2 o conjunto de funções quadráticas integráveis no intervalo [0,1], chega-se ao seguinte problema: minimizar D f ∈ L2 (−∞, ∞), j ∞ −∞ ( Lf ( x)) 2 dx sujeita a (3) j = 1, 2, ... , m e f(xi) = yi, i = 1, 2,..., n o qual tem única solução, s(xi) que satisfaz L*L s(x) = 0 nos intervalos entre os pontos de nós, nos quais L* é o operador adjunto de L. A solução s(x) é chamada de interpolação spline L. Quando L = D2, s(x) é um polinomial piecewise de ordem 2m –1 = 3 (Wegman e Wright, 1983). 2.2 Suavização por splines: mínimos quadrados penalizados As interpolações splines são estabelecidas sobre dados sem ruídos. Para usar os métodos de ajustamento de suavização por splines, que consideram os ruídos, escolhe-se uma função fˆ , estimativa da função f, com m derivadas que minimize: s( f ) = n i =1 [ y i − fˆ ( xi )] + λ 2 b a df m ( x) dx m 2 dx (4) em que yi : variável resposta (concentração de DBPC) xi : pontos em um intervalo real no qual as observações yi foram registradas λ : parâmetro de suavização 10 Rev. Mat. Estat., São Paulo, v.23, n.3, p.7-18, 200x O primeiro termo assegura o ajuste dos dados segundo o enfoque dos mínimos quadrados. O segundo termo é uma forte penalização para evitar que a curva fˆ tenha muitos nós, ou seja, mede a suavização associada com a função fˆ . O parâmetro λ refere-se ao grau de suavização e m é a ordem de suavização. O valor de m comumente mais usado na penalização de qualquer função é m = 2. Na prática para se usar o método de suavização por spline é necessário escolher um valor para o parâmetro de suavização λ . Pode-se fazer essa escolha subjetivamente, entretanto, em algumas situações é conveniente utilizar algum método automático na escolha de λ . Diversos trabalhos sugerem o método da validação cruzada para a escolha de λ (Seber e Wild, 1989; Silverman, 1984; Wahba, 1983). A idéia básica do método de validação cruzada é retirar o dado (informação) do conjunto de dados e escolher aquele valor de λ que melhor estima o valor retirado da amostra. O parâmetro de suavização λ , é escolhido de modo a minimizar o critério de validação cruzada generalizada (VCG), onde são escolhidos pesos que refletem espaçamentos desiguais dos dados e outros efeitos (Wegman e Wright, 1983), que é dado por: VCG( λ ) = EQM( λ )/[1 – n– 1trH( λ )]2 (5) onde EQM é o estimador do erro quadrático médio, calculado por: EQM = 1 n − DF n i =1 [ yi − fˆ ( xi )]2 em que DF = traço(H) e H é uma matriz nxn que depende do valor de λ e valor ajustado em xi. O parâmetro λ é independente da variável X e é expresso como: λ = c * Q3/100 (6) fˆ ( xi ) é o (7) no qual Q é a amplitude interquartílica da variável em estudo (concentração de DBPC) e c é uma constante especificada. O coeficiente de determinação R2 é calculado como: n R2 = 1 − i =1 ( yi − fˆ ( xi )) 2 n i =1 ( yi − y ) 2 (8) Wahba (1983) e Silverman (1985) apresentam uma estimativa da variância para as estimativas de splines suavizados como, σ λ2 = n EQM( λ )/[n – trH( λ )] (9) e os intervalos de confiança são obtidos por (Wahba, 1983), Rev. Mat. Estat., São Paulo, v.23, n.3, p.7-18, 2005 11 fˆ ( xi ) ± zα / 2 σ λ2α ii (λ ) (10) onde α ii (λ ) é o i-ésimo elemento diagonal da matriz H( λ ) e distribuição normal. zα / 2 é o ponto α / 2 da 4 Resultados e discussão Os resultados da aplicação da suavização por splines nos dados são mostrados nas Figuras 3 a 8 e Tabelas 1 e 2. A arte de usar a suavização por spline consiste na escolha de um parâmetro de suavização, λ , de modo que s(f) contenha tanto quanto possível, o máximo de informação e mínimo do suposto ruído nos dados (Stone e Brooks, 1990), (Lancaster e Ketustis, 1990). Desse modo, considerando-se os 100 ensaios, foram utilizados vários parâmetros de suavização e o melhor ajuste foi conseguido para λ = 0,0013, que apresentou menor valor em relação ao critério VCG. Na Figura 3 e Tabela 1 são apresentados alguns resultados obtidos para a escolha de λ. Pode-se observar na Figura 3 que, à medida que o valor de λ aumenta, mais suavizados (com menos ruído) ficam os ajustes. Na Figura 4 é mostrada a curva ajustada para λ = 0,0013 com os intervalos de confiança para 95% em que se observa que a maioria dos valores observados se encontram dentro dos respectivos intervalos. 0,1774 0,1772 0,177 0,1768 DBPC 0,1766 0,1764 0,1762 0,176 0,1758 0,1756 0,1754 0 10 20 30 40 50 60 70 80 90 100 Número de Ensaios Observado =0.0001 =0.0013 =0.0050 FIGURA 3 – Ajuste de splines suavizados para dados de DBPC com diferentes valores do parâmetro de suavização, λ. Os asteriscos indicam os valores observados. 12 Rev. Mat. Estat., São Paulo, v.23, n.3, p.7-18, 200x 0,178 0,1775 DBPC 0,177 0,1765 0,176 0,1755 0,175 0,1745 0 10 20 30 40 50 60 70 80 90 100 Número de Ensaios FIGURA 4 – Splines suavizados com λ = 0,0013 para o DBPC para n = 100 ensaios. Os asteriscos indicam os valores observados, a linha sólida o spline ajustado e as linhas tracejadas os intervalos de confiança para 95%. Table 1 – Valores da Função VCG de acordo com λ λ 0,00010 0,00130 0,00500 VCG (*10 – 7) 3,53 2,71 2,85 Desvio-padrão (10–4) 2,0 3,0 4,0 Para várias amostras com tamanhos diferentes obtidas aleatoriamente foram ajustados os valores por meio de splines suavizados mantendo-se constante o parâmetro de suavização em 0,0013. Para cada amostra foi calculado o EQM e, em seguida, avaliados os resultados que são apresentados na Tabela 2 e Figuras 5 a 9. Observa-se na Tabela 2 uma tendência crescente no EQM à medida que o tamanho da amostra aumenta. Conseqüentemente a qualidade do ajuste vai diminuindo. Menores EQM foram obtidos para conjuntos com 15, 20 e 35 amostras. Por outro lado, os maiores valores do coeficiente de explicação, R2, que indicam melhores ajustes do modelo aos valores observados, foram obtidos para amostras de tamanhos 15, 10 e 20, com 96,23%, 94,22% e 94,00%, respectivamente. Observa-se nas Figuras 5, 6 e 7 que representam as amostras de tamanhos 10, 15 e 20, maior suavização, ou seja, ajuste com menos ruído, e os pontos observados mais próximos da curva ajustada e, conseqüentemente, menores valores do EQM, e maiores valores de R2. Observa-se que, à medida que o tamanho das amostras aumentam (Figuras 8 e 9) os ajustes ficam menos suaves, parecem com mais ruídos, e os valores observados se encontram mais distantes da curva ajustada, levando a maiores EQM e menores R2, uma indicação de diminuição da qualidade do ajuste. Os intervalos de confiança de 95% mostrados nas figuras contém, em todos os casos, os valores observados, indicando a não significância entre as observações e as estimativas obtidas Rev. Mat. Estat., São Paulo, v.23, n.3, p.7-18, 2005 13 pela suavização por splines, ou seja, pode-se considerar que os modelos se ajustaram aos dados observados. Foram acrescentadas à Tabela 2 as medidas dos desvios-padrão e médias das amostras. Pode-se verificar que, enquanto os valores das médias permanecem praticamente constantes à medida que se aumenta o tamanho da amostra, os desviospadrão apresentam grandes variações, indicando que a estabilização da variabilidade deve ocorrer somente com amostras muito maiores de que 100. 0,1776 DBPC 0,1772 0,1768 0,1764 0,176 0,1756 1 2 3 4 5 6 7 8 9 10 Número do ensaio FIGURA 5 – Splines suavizados com λ = 0,0013 para o DBPC para n = 10 ensaios. Os asteriscos indicam os valores observados, a linha sólida o spline ajustado e as linhas tracejadas os intervalos de confiança para 95%. 0,1775 DBPC 0,177 0,1765 0,176 0,1755 0,175 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Número do ensaio FIGURA 6 – Splines suavizados com λ = 0,0013 para o DBPC para n = 15 ensaios. Os asteriscos indicam os valores observados, a linha sólida o spline ajustado e as linhas tracejadas os intervalos de confiança para 95%. 14 Rev. Mat. Estat., São Paulo, v.23, n.3, p.7-18, 200x 0,1777 DBPC 0,1772 0,1767 0,1762 0,1757 0,1752 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Número do ensaio FIGURA 7 – Splines suavizados com λ = 0,0013 para o DBPC para n = 20 ensaios. Os asteriscos indicam os valores observados, a linha sólida o spline ajustado e as linhas tracejadas os intervalos de confiança para 95%. 0,178 0,1775 DBPC 0,177 0,1765 0,176 0,1755 0,175 0 5 10 15 20 25 Número do Ensaio FIGURA 8 – Splines suavizados com λ = 0,0013 para o DBPC para n = 25 ensaios. Os asteriscos indicam os valores observados, a linha sólida o spline ajustado e as linhas tracejadas os intervalos de confiança para 95%. Rev. Mat. Estat., São Paulo, v.23, n.3, p.7-18, 2005 15 0,178 0,1775 DBPC 0,177 0,1765 0,176 0,1755 0,175 0 5 10 15 20 25 Número do ensaio FIGURA 9 – Splines suavizados com λ = 0,0013 para o DBPC para n = 30 ensaios. Os asteriscos indicam os valores observados, a linha sólida o spline ajustado e as linhas tracejadas os intervalos de confiança para 95%. Table 2 – Resultados da suavização por spline para tamanhos de amostras, n 16 λ = 0,0013, em função dos diferentes σy N EQM (×10-8) y 10 3,96 0.1764 3,680 94,22 15 2,00 0,1762 3,770 96,23 20 2,56 0,1762 3,912 94,00 25 5,00 0,1763 3,955 90,11 30 5,09 0,1764 4,621 88,98 35 2,79 0,1764 3,148 90,78 40 4,07 0,1764 3,704 91,01 45 8,01 0,1763 3,563 81,94 50 7,31 0,1763 4,130 82,51 100 9,42 0,1763 4,007 70,42 (×10-4) R2 (%) Rev. Mat. Estat., São Paulo, v.23, n.3, p.7-18, 200x 30 Conclusões A suavização por spline utilizando mínimos quadrados penalizados apresentou uma boa solução para o problema ora proposto, uma vez que estima a verdadeira função devido a sua flexibilidade para responder as variações locais sem permitir comportamentos anormais e o grau de suavização controlável. Os resultados obtidos neste trabalho mostraram que se pode otimizar o número de ensaios para avaliação de DBPC em óleos isolantes. Com base nas análises realizadas recomenda-se que entre 15 e 20 ensaios são suficientes para uma avaliação confiável nos níveis de concentração do DBPC. A importância desse trabalho reside na diminuição de custos pela definição de um número de ensaios, uma vez que cada ensaio custa em torno de R$ 35,00, e na implementação de uma metodologia alternativa a ser utilizada em estudos para avaliação de outros componentes em óleos isolantes. OLIVEIRA, T. F.; QUEIROZ, J. C. B.; SARAIVA, A. C. F.; MOURA, H. P. Use of spline in the evaluation of addictive antioxidant DBPC in insulating oil. Rev. Mat. Est., São Paulo, v.23, n.3, p.7-18, 2005. ABSTRACT: Based on the ASTM D 2668 – 92 standard, various essays were performed to find the percentile concentrations in weight of the antioxidant addictive 2,6 – diterc butyl per cresol (DBPC) of a sample of insulating oil used in single-phase transformers ( 138/69/13.8 Kv). The smoothing spline method was used for results evaluation, since the importance of such method lies in the reduction of costs and in the use of a methodology for analyses. Based on the control of the model´s smoothing parameter, the minimum number of necessary essays for the best adjustment of a polynomial function for the experimental data was evaluated. The mean square error ( MSE ) and the determination coefficient (R2) were used as measures of adjustment precision. The best results were obtained for 15 and 20 essay. KEYWORDS: Diterc butyl per cresol; smoothing spline; polynomial interpolation; least square penalized; means square error. REFERÊNCIAS ASTM. Standard methods for 2,6-ditertiary-butyl para crescl nd 2,6-ditertiary-butil phenol in ectrical insulating oil by infrared absorption. Ann. Book ASTM Standards, Philadelphia, v.10, n.3, p.2668-2692, 1996. BOLFARINE, H.; SANDOVAL, M. C. Introdução à inferência estatística. Rio de Janeiro: Sociedade Brasileira de Matemática, 2001. 125p. CAMPOS, A. C.; LEONTSINIS, E. Petróleo e derivados: obtenção, especificação e requisitos de desempenho. Rio de Janeiro: JR Editora Técnica, 1990. 258p. FERREIRA, M. C. et al. Quimiometria I: calibração multivariada, um tutorial. Química Nova, Campinas, v.22, n.5, 1999 LANCASTER, P.; SALKASUSKAS, K. S. Curve and Surface fiting: an introduction. London: Academic Press,1990. 280p. Rev. Mat. Estat., São Paulo, v.23, n.3, p.7-18, 2005 17 SEBER, G. A. F.; WILD, G. J. Nonlinear Regression. New York: John Wiley & Sons, 1989. 768p. SILVERMAN, B. W. Some aspects of the splines smoothing approach to non-parametric regression curve fitting. J. R. Stat. Soc., Série B, London , v.47, n.1, p.1-52. 1985 SNEDECOR, G. W.; COCHRAN, W. G. Statistical Methods. Iowa: Iowa State University Press, 1989. 503p. STONE, M.; BROOKS, R. J. Continuum regression: cross – validated sequentially constructed prediction embracing ordinary least square, partial least square and principal components regression. J. R. Stat. Soc., London, v.52, n.2, p.237-269, 1990. WAHBA, G. Bayesian "Confidence intervals" for the cross validated smoothing spline. J. R. Stat. Soc., Ser. B, London, v.45, p.133 –150, 1983. WEGMAN, E. J.; WRIGTH, I. W. Splines in statistics. J. Am. Stat. Assoc., New York, v.78, n.382, p.351-365, 1983. Recebido em 09.04.2004. Aprovado após revisão em 28.10.2005. 18 Rev. Mat. Estat., São Paulo, v.23, n.3, p.7-18, 200x