Metodologia de Superfície de Resposta Marília Canabarro Zordan Sabrina Letícia Couto da Silva MAT 02014 - Planejamento de Experimentos II MÉTODOS DE SUPERFÍCIE DE RESPOSTA -Conjunto de técnicas estatísticas usadas para analisar problemas com variáveis independentes contínuas em relação a variável aleatória. - O objetivo é buscar a combinação dos fatores que otimizam a resposta. -É usado quando: • Fixa-se um fator A e varia-se o outro B. • Fixa-se B onde a resposta é máxima e varia-se A. • Variando os dois fatores conjuntamente. - A modelagem é usada para estabelecer a relação entre a variável resposta e a(s) variável (is) independente(s), pois em geral esta não é conhecida e precisa de aproximação. O procedimento seqüencial na MSR é encontrar os resultados da ANOVA e verificar se: * São distante do ótimo, com pouca curvatura → Modelo de 1ª ordem Leva de forma rápida e vizinhança do valor ótimo. eficiente até a * A região ótima é encontrada → Modelo de 2ª ordem e análise do ótimo Função e Representação Gráfica • y é a resposta (variável dependente, p.e, produção de um objeto) • x1 e x2 são os fatores (p.e, temperatura e pressão) • y = f(x1,x2) + erro • E(y) = η → η = f(x1,x2) = Superfície de Resposta • y = η + erro Uma possível representação gráfica para a SR seria: x1 e x2 aparecem no plano y aparece no eixo perpendicular Um representação alternativa é o gráfico de contornos. Desenham-se linhas de igual resposta de um gráfico cujas coordenadas representam os níveis dos fatores: Para três ou mais fatores é mais comum a representação gráfica da superfície através do gráfico de contornos no espaço bidimensional, fixando um ou mais fatores no nível ótimo. Exemplo: Y = produção de uma reação química min) A = Tempo de Reação (60,90,120,150,180 B = Temperatura (210,220,230,240,250°C) Procedimento Clássico • Fixando B = 225°C → 130 min e 75g • Fixando A = 130min → 225°C e 75g E como os fatores se comportam conjuntamente? É preciso conduzir o experimento variando ambos os fatores simultaneamente e então para representação gráfica usar um gráfico de contornos. Continuando o exemplo... A = 65 minutos B = 225°C Y = 91g Conclusão do Exemplo: O procedimento de investigar uma variável independente (fator) de cada vez falha, pois ele assume que o máximo valor produzido por um fator é independente do máximo produzido pelo outro fator, o que nem sempre acontece. Aproximações Como nem sempre a relação entre fatores e resposta é conhecida, o primeiro passo em MSR é encontrar uma aproximação adequada para a relação entre eles, dentro de uma faixa limitada do “espaço de fatores”. Se a resposta é bem modelada por uma função linear das var. independentes: y = β0 + β1x1 + ... + βkxk + ε A análise da SR é então feita em termos da SR ajustada. Modelos de Primeira Ordem Método da Máxima Inclinação Ascendente 1 - Delineamentos Exploratórios de Tratamentos 2 – Fatoriais da série 2k Onde, K = n° de fatores completos ou fracionados 2 = n° de níveis 3 – Verificar se há acréscimo (decréscimo) na resposta ou não, com a presença dos fatores • Condições iniciais estão afastadas daquelas que otimizam a resposta → Modelo de 1ª Ordem • O objetivo é mover o experimento rapidamente para a vizinhança geral do ótimo utilizando um procedimento experimental simples, rápido, econômico e eficiente. • MMIA procura a MÁXIMA inclinação ascendente • MMID procura a MÍNIMA inclinação descendente • O gráfico de contornos da SR de 1ª ordem são uma série de linhas paralelas. A direção da MIA é a direção na qual y estimado cresce mais rapidamente. X2 X1 Usualmente, toma-se como caminho da MIA a linha a partir do centro da região de interesse e os “passos” ao longo do caminho são determinados pela experiência do pesquisador. Utiliza-se um conjunto de tratamentos em torno do ponto inicial e estima-se por Mínimos Quadrados as inclinações βi. A partir das magnitudes e sinais destas inclinações, calcula-se a direção da MIA. • Experimentos são conduzidos ao longo do caminho da MIA até que nenhum incremento na resposta seja observado. E repetir a seqüência novamente. •Eventualmente chega-se a vizinhança do valor ótimo e isto será indicado pela falta de ajuste do modelo de 1ª ordem. • A aproximação por um plano se torna insatisfatória pelo fato dos efeitos de ordens mais elevadas, particularmente os de 2ª ordem (quadrático e de interação linear), se tornarem relativamente mais importantes. Nesse caso usa-se Modelo Quadráticos. EXEMPLO (produção do reagente): O processo normal é operado com um tempo de 35min e uma temperatura de 155°F, que resulta numa produção de 40%. Como a região ótima é desconhecida ajustase um modelo de 1ª ordem por MMIA. A região experimental será (30,40) min para o tempo de reação e (150,160)°F para temperatura. As variáveis recodificadas para cálculos. independentes podem ser (-1,1) para simplificar os Se ξ1 e ξ2 representam as variáveis naturais para tempo e temperatura respectivamente, os valores são codificados: 135 x1 5 1155 x2 5 “Tamanho do Passo” Média do Intervalo O delineamento a ser utilizado nesse experimento consiste de um Fatorial 22 aumentado por CINCO PONTOS (Tratamentos) CENTRAIS. Com a utilização dos pontos centrais é possível estimar o erro experimental e testar a adequabilidade (“lack of fit”) do modelo de 1ª ordem. Além disso, nesse caso, o tratamento central representa as condições de operação normalmente empregadas. Deve-se ajustar aos dados um modelo de primeira ordem, ou seja, a equação de regressão yˆ ˆ oˆ1x1 ˆ 2x 2 Dados Variáveis Naturais ξ1 30 30 40 40 35 35 35 35 35 ξ2 150 160 150 160 155 155 155 155 155 Variáveis Codificadas x1 -1 -1 1 1 0 0 0 0 0 x2 -1 1 -1 1 0 0 0 0 0 Resposta y 39,3 40,0 40,9 41,5 40,3 40,5 40,7 40,2 40,6 A equação de regressão encontrada é: yˆ 40,44 0,775x1 0,325x 2 A SQTotal é encontrada da mesma forma de qualquer outra análise, mas é particionada em SQRegressão e SQResíduos. A SQErro com 4GL também é obtida de forma tradicional, porém só com os valores dos pontos centrais. Assim, o modelo de primeira ordem assume que os fatores possuem um efeito aditivo sobre a resposta. A interação entre os fatores pode ser obtida adicionando o termo x1x2 e é medida pelo coeficiente β12. A estimativa é obtida (considerando as variáveis codificadas) por: ˆ 12 1 ( x1y1 x1y 2 x 2 y3 x 2 y 4 ) n de trat SQInt ( y extremos y meio ) n de trat 2 Para o exemplo... ˆ 1 1* 39,3 (1* 40) (1* 40,9) 1* 41,55 0,025 12 4 [(39,3 41,5) (40 40,5)]2 SQInt 0,0025 4 1 GL A estatística da falta de ajuste é: SQInt 0,0025 F 0,058 QME 0,043 F(1,4)=7,71 a 5% Logo, NS. Outra verificação da adequabilidade do modelo é obtida pela comparação da resposta média dos quatro pontos do fatorial (40,425), com a resposta média do centro do delineamento (40,46). Se β11 e β22 são os coeficientes dos termos quadráticos x 2 e x 2 , então a diferença das médias 1 2 é uma estimativa de β11+ β22. ˆ11ˆ12 y1 y2 40,425 40,46 0,035 n f n c ( y1 y 2 ) 2 (4 * 5)(0,035) 2 SQQuad 0,0027 nf nc 45 SQQuadrático 0,0027 F 0,0663 QME 0,0430 Efeito quadrático NS a 5% de significância. Causas da Variação SQ GL QM F Regressão 2,8250 2 1,4125 47,83* Resíduo 0,1772 6 0,0295 Interação 0,0025 1 0,0025 0,058 Quadr. Puro 0,0027 1 0,027 0,063 Erro 0,1720 4 0,0430 Total 3,0022 8 * Significante a 1% Assim, não existe nenhuma razão para questionar o modelo de primeira ordem. Os próximos passos da MIA devem seguir. Os fatores devem variar nas proporções das estimativas dos Betas, ou seja, para cada 0,775 unidades acrescidas em x1, x2 deve aumentar 0,325 unidades. Destransformando-a, direção da MIA é definida por: 5x0,775 = 3,875 minutos → 5x0,325=1,625° O caminho principal a partir da origem (0,0) nesta direção pode ser obtido por um incremento conveniente a um dos fatores (p.e, 5 minutos para tempo). As mudanças proporcionais do outro fator: 0,325/0,775=0,42. Assim, estas quantidades devem ser acrescidas aos níveis base dando origem ao caminho da MIA. O engenheiro realizou os ensaios de acordo com esse caminho e observou a produção nesses pontos até que um decréscimo na resposta foi notado. Os resultados estão na tabela a seguir: Variáveis Codificadas Nível Base X1 X2 ξ1 ξ2 0 0 35 155 5 5 3,875 1,625 Unidade Unidade* Variação do Nível Variáveis Naturais Resposta y ˆ i 1,00 0,42 5 2 Ensaio 1 1 0,42 40 157 41,0 Ensaio 2 2 0,84 45 159 42,9 Ensaio 3 3 1,26 50 151 47,1 Ensaio 4 4 1,68 55 163 49,7 Ensaio 5 5 2,10 60 165 53,8 Ensaio 6 6 2,52 65 167 59,9 Ensaio 7 7 2,96 70 169 65,0 Ensaio 8 8 3,36 75 171 70,4 Ensaio 9 9 3,78 80 173 77,6 Ensaio 10 10 4,20 85 175 80,3 Ensaio 11 11 4,62 90 177 76,2 Ensaio 12 12 5,04 95 179 75,1 Incrementos na resposta são observados até o 10° passo; depois há um decréscimo na produção. Portanto, outro modelo de primeira ordem pode ser ajustado em torno do ponto (85,175). A região de exploração para tempo seria (80,90) e de temperatura (170,180). Codificam-se os níveis das variáveis tempo e temperatura novamente como (-1,1) e um delineamento fatorial 22 acrescido de 5 pts centrais será utilizado. Assim repete-se todo o processo resultados são analisados a seguir: e os Dados para ajuste do segundo modelo de 1ª Ordem: Variáveis Naturais Variáveis Codificadas 1 2 X1 X2 y 80 170 -1 -1 76.5 80 180 -1 1 77.0 90 170 1 -1 78.0 90 180 1 1 79.5 85 175 0 0 79.9 85 175 0 0 80.3 85 175 0 0 80.0 85 175 0 0 79.7 85 175 0 0 79.8 x1 1 85 5 e Resposta x2 2 175 5 O modelo de 1ª Ordem ajustado aos dados codificados é dado por: Ŷ = 78.97 + 1.00 X1 + 0.50 X2 Causas da Variação SQ GL QM F Regressão 5,0000 2 2,5000 47,17* Resíduo 11,1200 6 Interação 0,2500 1 0,2500 4,72 Quadr. Puro 10,6580 1 10,6580 201,09 * Erro Puro 0,2120 4 0,0530 Total 16,1200 8 * Significativo a 1% - Pela tabela de ANOVA, o componente do termo quadrático puro foi significativo, isso implica que o modelo de 1ª Ordem não é uma aproximação adequada; - Essa curvatura na real superfície pode indicar que se está próximo do ótimo. Assim, análises adicionais devem ser feitas para localizar o ótimo com mais precisão. Algoritmo geral para determinar as coordenadas de um ponto no caminho da máxima inclinação ascendente: - assumir que o ponto x1=0, x2=0, ...,xk=0 é a base ou origem. 1. Escolha um tamanho para uma das variáveis independentes, por exemplo, xj. Geralmente, selecionamos a variável que temos maior conhecimento, ou aquela que tem maior coeficiente de regressão em módulo | ˆ j | . 2. O passo nas demais variáveis é: xi ˆi ˆ j / x j i 1,2,...,k; i j 3. Converter xi das variáveis codificadas para as variáveis naturais. Análise de Modelos de Segunda Ordem - Quando o pesquisador está próximo da região de ótimo, um modelo que incorpora o efeito de curvatura é indicado. O modelo de 2ª Ordem é dado por: k k y 0 i xi x ij xi x j i 1 i 1 2 ii i • Como encontrar o ponto ótimo (estacionário)? • Qual a natureza da superfície de reposta? Localização do ponto estacionário Desejamos encontrar os níveis de x1, x2, ...,xk, que maximizam a resposta estimada (predita). Este ponto, se existir, será um conjunto de x1, x2, ...,xk para o qual as derivadas parciais são iguais a zero: yˆ / x1 yˆ / x2 .... yˆ / xk 0. Esse ponto, x1.S, x2.S, ...,xk.S é o dito PONTO ESTACIONÁRIO. Este ponto pode representar um MÁXIMO, MÍNIMO ou PONTO DE SELA. Ponto de máximo (xS) x2 • Ponto de mínimo (xS) x2 80 • 60 70 70 60 x1 80 x1 Determinação do ponto estacionário: Solução matemática geral. O modelo de 2ª Ordem escrito na forma matricial fica: yˆ ˆ0 x'b x' Bx x1 x 2 . x . . xk ˆ1 ˆ 2 . b . . ˆk ˆ11 ˆ12 / 2, ˆ22 B sim . . . . . . . . ˆ1k / 2 ˆ2k / 2 . . ˆkk Onde: b é um vetor (k x 1) dos coeficientes de regressão de 1ª ordem e B é uma matriz simétrica (k x k) onde na diagonal têm-se os coeficientes de regressão de 2ª ordem e fora da diagonal os coeficientes de interação. As derivadas parciais dos valores preditos da resposta ( y chapéu) com relação aos elementos de x e colocadas iguais a zero são dadas por: yˆ x b 2Bx 0 O ponto estacionário é a solução da equação anterior, ou seja, xs 12 B1b O valor predito da variável resposta no ponto estacionário é: yˆ s ˆ0 12 xs' b Demonstração: yˆ ˆ 0 x' b x' Bx 1 1 yˆ ˆ 0 b' B1b b' B1BB 1b 2 4 ˆy ˆ 0 1 b' B1b 1 b' IB1b 2 4 1 yˆ ˆ 0 b' B1b 2 1 yˆ ˆ 0 x' b 2 Natureza da superfície de resposta Desejamos saber se o ponto estacionário é um ponto de máximo, mínimo ou ponto de cela. -Forma mais direta: gráfico de contorno do modelo de regressão ajustado aos dados. -Mesmo com poucas variáveis independentes, uma análise mais formal, denominada de Análise Canônica, pode ser útil. Análise Canônica (Facilita a interpretação dos resultados!!!) Considere uma translação (novo sistema de coordenadas) da superfície de resposta da origem (x1, x2,...,xk)=(0, 0,...,0) para o ponto estacionário xS e então rotacione os eixos desse sistema até que eles fiquem paralelos aos eixos principais da superfície de resposta ajustada. Na figura no próximo slide isso pode ser visualizado... x2 w1 x1,S w2 x1,S x1 A função de resposta em termos das novas variáveis w1, w2,...,wk (forma canônica) é dada por: yˆ yˆ s 1w12 2 w22 ... k wk2 FORMA CANÔNICA DO MODELO Onde os wi são as variáveis indep. transformadas e os i são constantes. O ŷs é a resposta estimada no ponto estacionário xS. Os i são os autovalores ou raízes características da matriz B. Estudo da natureza da Superfície de Resposta - Este estudo pode ser feito considerando o ponto estacionário e os sinais e magnitudes dos (i). - Suponha que o ponto estacionário esteja dentro da região na qual foi ajustado o modelo de 2ª ordem. - Se todos os valores de (i) são positivos, então, xs é um ponto de resposta mínima; se os (i) são todos negativos, então, xs é um ponto de resposta máxima; se os valores de (i) tem sinais positivos e negativos, então, xs é um ponto de sela. - Além disso, a superfície tem inclinação na direção de wi para o qual o valor de |i| é maior. - Por exemplo, na figura anterior, xs é um ponto de máximo (todos os (i) são negativos) e |1| > |2|. Exemplo 2: vamos continuar com a análise do processo químico do ex 1 (2ª fase do estudo). Para ajustar um modelo de 2ª ordem, o pesquisador decide aumentar o delineamento com pontos adicionais (o engenheiro usou 4 OBS adicionais mais ou menos no mesmo tempo em que executou os 9 tratamentos anteriores). Os 4 tratamentos adicionais foram: (x1=0; x2=± 1,414) (x1=± 1,414; x2=0) Este delineamento denomina-se de DELINEAMENTO CENTRAL COMPOSTO. VARIÁVEL RESPOSTA Variáveis naturais 2 1 80 80 90 90 85 85 85 85 85 92,07 77,93 85 85 170 180 170 180 175 175 175 175 175 175 175 182,07 167,93 Delineamento central composto Respostas Variáveis codificadas y3 y2 y1 x2 x1 (produção) (viscosidade) (peso molecular) 2940 62 76.5 -1 -1 3470 60 77.0 1 -1 3680 66 78.0 -1 1 3890 59 79.5 1 1 3480 72 79.9 0 0 3200 69 80.3 0 0 3410 68 80.0 0 0 3290 70 79.7 0 0 3500 71 79.8 0 0 3360 68 78.4 0 1,414 3020 71 75.6 0 -1,414 3630 58 78.5 1,414 0 3150 57 77.0 -1,414 0 x2 •(0,1,414) (-1,1) • • (-1,414,0) •(1,1) • • (1,414,0) (0,0) (-1,-1) • •(1,-1) •(0,-1,414) Delineamento Central Composto para o exemplo 1 (processo químico) x1 Response Surface for Variable PRODUCAO Response Mean Root MSE R-Square Coef. of Variation Regression Linear Quadratic Crossproduct Total Regress Residual Lack of Fit Pure Error Total Error Degrees of Freedom 2 2 1 5 Degrees of Freedom 3 4 7 Type I Sum of Squares 10.042955 17.953749 0.250000 28.246703 Sum of Squares 0.284373 0.212000 0.496373 78.476923 0.266290 0.9827 0.3393 R-Square F-Ratio 0.3494 0.6246 0.0087 0.9827 70.814 126.6 3.526 79.669 Prob > F Mean Square F-Ratio 0.094791 0.053000 0.070910 1.789 0.0000 0.0000** 0.1025 NS 0.0000 Prob > F 0.2886 NS Análise no DOE do SAS 8.0: Efeito Quadrático significativo a 1%. O modelo de 2ª Ordem será ajustado! Gráfico de Contorno Pelo gráfico de contornos, observa-se que o processo é mais sensível (levemente) à mudanças no tempo de reação do que para mudanças na temperatura. Superfície de Resposta Ponto Ótimo (85 min; 175º F) Observa-se que o ótimo está próximo de 175oF e 85 min e que a resposta neste ponto é um ponto de máximo. Determinação da localização do ponto estacionário (máximo). Temos que: 0,995 b 0 , 515 1,376 0,1250 B 0 , 1250 1 , 001 O ponto estacionário é dado por: 1 xs B b 1 2 X1,s 0,7345 0,0917 0,995 0,389 - . 0,0917 1,0096 0,515 0,306 1 2 X2,s Em termos das variáveis naturais, o ponto estacionário é dado por: 0 ,389 1 585 1 86 ,95 87 0 ,306 2 5175 2 176 ,5 O valor da resposta estimada no ponto estacionário é: yˆ s ˆ0 12 x 'sb 0,995 ˆys 79.94 12 0,389 0,306 80,21. 0 , 515 ANÁLISE CANÔNICA - Objetivo: caracterizar a superfície de resposta Vamos expressar o modelo ajustado na forma canônica. 1º precisamos encontrar os autovalores, 1 e 2. Os autovalores são as raízes do determinante da equação: B I 0 A equação fica: 1,3770 0 ,1250 0 ,1250 1,0013 0 2 2.377786 1.36266393 7 0 As raízes desta equação de segundo grau são: 1=-0,9635 e 2=-1,4143. A forma canônica do modelo ajustado fica: yˆ 80 ,21 0 ,9635w12 1,4143w22 Ambos negativos Ponto de máximo