Introdução aos experimentos fatoriais Blocagem – cap. 5 (5.6) Blocagem em um experimento fatorial: modelo • Considere um experimento fatorial a dois fatores (A e B) com n replicações. O modelo estatístico linear para esse experimento é: i 1, 2,..., a yijk i j ( )ij ijk j 1, 2,..., b k 1, 2,..., n Suponha que para uma realização um material particular é exigido e que esse material está disponível em lotes que não são suficientemente grandes para permitir que todas as abn combinações de tratamentos sejam realizadas com o mesmo lote. Porém, se um lote contém material suficiente para ab realizações, então um plano alternativo é rodar cada uma das n replicações usando um lote diferente de material. Blocagem em um experimento fatorial: modelo • Consequentemente, os lotes de material representam uma restrição em aleatorização ou um bloco, e uma replicação de um experimento fatorial completo é realizada para cada bloco. • O modelo de efeitos para esse novo plano é: y ijk i 1,2,...,a i j ( ) ij k ijk , j 1,2,...,b k 1,2,...,n com k representando o efeito do k-ésimo bloco. Dentro de cada bloco, é claro, as realizações são feitas de modo completamente aleatorizado. Tabela ANOVA FV Blocos A B AB Erro Total SQ gl y...2 1 2 y..k abn ab k n-1 y...2 1 2 y i.. abn bn i a-1 y...2 1 2 y. j. abn an j y...2 1 2 yij. abn SSA SSB n i j Diferença y...2 yijk abn b-1 (a-1)(b-1) (ab-1)(n-1) abn-1 QM QMBl QMa QMb QMab QMe -- F -- --- Blocagem • O modelo assume que a interação entre blocos e tratamentos é desprezível. Isso foi suposto anteriormente na análise dos planejamentos em bloco aleatorizados. Se essas interações de fato existem, elas não podem ser separadas da componente de erro. • De fato, o termo de erro nesse modelo consiste das interações entre cada fator principal e bloco e entre os três (fatores A, B e bloco). Exercício 19 O resultado de um processo químico está sendo estudado. Os dois fatores de interesse são temperatura e pressão. Três níveis de cada fator foram selecionados. Porém, somente nove realizações podem ser feitas num dia. O experimentador rodou as replicações em dias diferentes. Analise os dados, supondo que os dias são blocos. y=read.table("e:\\dox\\procquim.txt",header=T) pr=as.factor(y$Pressure) temp=as.factor(y$Temperature) bloco=as.factor(y$dia) modeloB=y$Yield~pr+temp+pr:temp+bloco fitB=aov(modeloB) fv gl SQ QM F value Pr(>F) pr 2 5.508 2.754 5.1838 0.035988 * temp 2 99.854 49.927 93.9807 2.778e-06 *** bloco 1 13.005 13.005 24.4800 0.001124 ** pr:temp 4 4.452 1.113 2.0952 0.173314 Residuals 8 4.250 0.531 --Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Perfis das médias por combinação de níveis apresentam paralelismo, confirmando a não-rejeição da hipótese de ausência de efeito de Interação entre temperatura e pressão. 94 92 90 Low 88 Medium 86 High 84 82 80 250 260 270 Experimentos fatoriais 2k – Cap. 6 • Os experimentos fatoriais são muito usados em experimentos envolvendo vários fatores para os quais é necessário estudar o efeito conjunto dos fatores sobre a resposta. • No capítulo 5 apresentamos métodos gerais de análise do experimento fatorial. • Existem casos especiais do experimento fatorial geral. • O caso mais importante, entre os especiais, é o de k fatores cada um com apenas 2 níveis. • Os níveis podem ser quantitativos ou qualitativos. • O plano 2k é particularmente útil nos estágios iniciais do trabalho experimental, quando muitos fatores deverão ser investigados. • Ele fornece o menor número de realizações com o qual k fatores podem ser simultaneamente investigados em um planejamento fatorial completo. Experimentos fatoriais 2k • Consequentemente, esses planos são muito usados em experimentos chamados factor screening experiments (filtragem, peneiramento de fatores). • Como há somente dois níveis para cada fator, supõe-se que a resposta é aproximadamente linear sobre a variedade de níveis dos fatores escolhidos. • Em muitos experimentos de filtragem de fatores, quando estamos apenas começando a estudar o processo, essa suposição costuma ser razoável. • Na seção 6.8 são apresentados um método simples para verificar se essa suposição é violada e ações em caso afirmativo. The Simplest Case: The 22 “-” and “+” denote the low and high levels of a factor, respectively • Low and high are arbitrary terms • Geometrically, the four runs form the corners of a square • Factors can be quantitative or qualitative, although their treatment in the final model will be different Chemical Process Example A = reactant concentration, B = catalyst amount, y = recovery Analysis Procedure for a Factorial Design • Estimate factor effects • Formulate model – With replication, use full model – With an unreplicated design, use normal probability plots • • • • Statistical testing (ANOVA) Refine the model Analyze residuals (graphical) Interpret results Estimation of Factor Effects A y A y A ab a b (1) 2n 2n 21n [ab a b (1)] B yB yB ab b a (1) 2n 2n 21n [ab b a (1)] ab (1) a b AB 2n 2n 21n [ab (1) a b] See textbook, pg. 209-210 For manual calculations The effect estimates are: A = 8.33, B = -5.00, AB = 1.67 Practical interpretation? Design-Expert analysis Estimation of Factor Effects Form Tentative Model Model Model Model Model Error Error Term Effect SumSqr % Contribution Intercept A 8.33333 208.333 64.4995 B -5 75 23.2198 AB 1.66667 8.33333 2.57998 Lack Of Fit 0 0 P Error 31.3333 9.70072 Lenth's ME Lenth's SME 6.15809 7.95671 Obs.: As somas de quadrados aqui são bastante simples. Statistical Testing - ANOVA The F-test for the “model” source is testing the significance of the overall model; that is, is either A, B, or AB or some combination of these effects important? Residuals and Diagnostic Checking The 23 Factorial Design Effects in The 23 Factorial Design A y A y A B yB yB C yC yC etc, etc, ... Analysis done via computer An Example of a 23 Factorial Design A = gap, B = Flow, C = Power, y = Etch Rate Table of – and + Signs for the 23 Factorial Design (pg. 218) Properties of the Table • Except for column I, every column has an equal number of + and – signs • The sum of the product of signs in any two columns is zero • Multiplying any column by I leaves that column unchanged (identity element) • The product of any two columns yields a column in the table: A B AB AB BC AB 2C AC • Orthogonal design • Orthogonality is an important property shared by all factorial designs Estimation of Factor Effects ANOVA Summary – Full Model Model Interpretation Cube plots are often useful visual displays of experimental results Cube Plot of Ranges What do the large ranges when gap and power are at the high level tell you?