Experimentos Fatoriais Hierárquicos Alan Birck Cecília Martins Introdução • Experimento Fatorial: as características (fatores) não dependem entre eles. Todos fatores estão no mesmo nível. • Experimento Fatorial Hierárquico: quando um fator está dentro de outro fator. Os fatores estão em níveis diferentes. Fatorial Hierárquico com 2 estágios • Os níveis do fator B são similares, mas não idênticos para diferentes níveis de outro fator A. • Ou seja, um fator está dentro de outro fator Fatorial Hierárquico com 2 estágios • Exemplo: Uma companhia compra matéria-prima de 3 fornecedores diferentes. A companhia deseja determinar se a pureza da matériaprima é a mesma para cada fornecedor. Existe 4 lotes de matérias-prima disponível de cada fornecedor e 3 determinação de pureza em cada lote. Exemplo Fornecedor 2 Fornecedor 1 Fornecedor 3 Lote1 Lote 2 Lote 3 Lote 4 Lote1 Lote 2 Lote 3 Lote 4 Lote1 Lote 2 Lote 3 Lote 4 Y111 Y112 y113 Y121 Y122 y123 Y131 Y132 y133 Y141 Y142 y143 Y211 Y212 y213 2121 Y222 y223 y231 Y232 y233 Y241 Y242 y243 Y311 Y312 y313 Y321 Y322 y323 Y331 Y332 y333 Y341 Y342 y343 Exemplo Fornecedor 3 Fornecedor 2 Fornecedor 1 Lote1 Lote 2 Lote 3 Lote 4 Lote5 Lote 6 Lote 7 Lote 8 Lote9 Lote 10 Lote 11 Lote 12 Y111 Y112 y113 Y121 Y122 y123 Y131 Y132 y133 Y141 Y142 y143 Y251 Y252 y253 Y261 Y262 y263 Y271 Y272 y273 Y281 Y282 y283 Y391 Y392 y393 Y3101 Y3102 y3103 Y3111 Y3112 y3113 Y3121 Y3122 y3123 Fatorial Hierárquico com 2 estágios Modelo linear yijk = μ + αi + βj(i) + εijk μ é a média αi é o ef. do i-ésimo nível do fator A βj(i) é o ef. do j-ésimo nível do fator B dentro do i-ésimo nível do fator A εijk é o erro i= 1,2,...,a j= 1,2,...,b k=1,2,...,r 2 fatores Fatores Mod. I ou Mod. II ou Mod. Misto Mod. Fixo Mod. Aleat. A Fixo Aleatório Fixo B fixo Aleatório Aleatório Modelo I (A e B fixos) • Suposições: εijk ~ N(0,σ2) independentes yijk ~N(μ + αi + βj(i) ,σ2) independentes • Restrições: a ˆ i 0 i 1 a ; ˆ 0 j (i ) j 1 para todo i Modelo I (A e B fixos) • Hipóteses H0: α1= α2= ...= efeito do fator A) αa= 0 (não existe H0: β1(i)= β2(i)=...= βb(i)=0 (não existe efeito do fator B dentro do i-ésimo nível do fator A, para todo i ) Modelo II (A e B aleatórios) • Suposições: αi~N(0, σ2A) independentes βj(i)~N(0, σ2B) independentes εijk ~ N(0,σ2) independentes αi , βj(i) e εijk são independentes yijk ~N( μ ; σ2+σ2A+σ2B) e indep. se estão em caselas diferentes Modelo II (A e B aleatórios) • Restrições: não tem restrições. • Hipóteses: H0: σ2A =0 H0: σ2B = 0 Modelo Misto (A fixo e B aleatório) • Suposições: βj(i)~N(0, σ2B) independentes εijk ~ N(0,σ2) independentes βj(i) e εijk são independentes yijk ~N( μ+ αi ; σ2+σ2B) e indep. se estão em caselas diferentes Modelo Misto (A fixo e B aleatório) • Restrições: a ˆ i 1 i 0 • Hipóteses: H0: α1= α2= ...= do fator A) H0: σ2B =0 αa= 0 (não existe efeito Análise de Variância para 2 fatores Causas de variação G.L. SQ QM A a-1 SQA QMA B(A) a(b-1) SQB(A) QMB(A) Erro ab(r-1) SQE QME Total abr-1 SQTotal Análise de Variância para 2 fatores Quadrados Médios Esperados C.de var. Mod. I rb a 2 i a 1 i 1 2 A Mod. II Mod. Misto 2 r 2 B 2 r 2 B rb 2 A rb a a 1 i 1 a b r 2 2 j (i ) B(A) a(b 1) i 1 j 1 Erro Total 2 2 r 2 B 2 2 i 2 r 2 B 2 Análise de Variância para 2 fatores Causas de Variação A B(A) Erro Mod.I QMA QME QMB(A) QME QME F Mod.II e Misto QMA QMB(A) QMB(A) QME QME Regra para construção dos QM Esperados: o fator (A) terá o componente do subfator (B) se o subfator (B) for aleatório. Estimação dos componentes de Variância QMA QMB( A) ˆ ˆ r B brˆ A QMA ˆ A br QMB ( A) 2 2 2 2 QMB ( A) QME ˆ rˆ B QMB ( A) ˆ B r 2 2 2 ˆ QME 2 Soma de quadrados • As expressões são calculadas de forma usual: 2 SQTotal y FC 2 ijk i , j ,k a y... FC rab 2 i .. y SQA FC i 1 rb 2 yij. SQB( A) FC SQA i, j r SQE SQTotal SQA SQB(A) exemplo(continuando o anterior) • Companhia compra matéria-prima, em lotes, de 3 diferentes fornecedores. A companhia deseja determinar se a pureza de matéria-prima é a mesma para cada fornecedor. Dos lotes existentes de cada fornecedor, selecionou-se aleatoriamente 4 lotes para cada um dos 3 fornecedores, e dos lotes selecionados foram tomadas 3 determinações de pureza. Os dados foram codificados: yijk= pureza – 93 . exemplo (dados já codificados) Fornecedor 1 Fornecedor 2 lote1 lote2 lote3 lote4 lote1 lote2 lote3 lote4 1 -2 -2 1 1 0 -1 0 -1 -3 0 4 -2 4 0 3 0 -4 1 0 -3 2 -2 2 r=3; a=3; b=4 Fornecedor 3 lote1 lote2 lote3 lote4 2 -2 1 3 4 0 -1 2 0 2 2 1 exemplo • No SAS(Analyst): • Statistcs/ANOVA/mixed model/ dep: resposta class:A,B MODEL: Fixed effects: A;Random effects: B(A) OPTION: type 1 TE exemplo ST: type 1 e “test of variance components” PLOTS: RESIDUAL/Residual plot (including random effects) 1-plot residuals x predicted 2-plot residuals x independents exemplo (resultados) c.v. g.l SQ fornec. 2 lotes/fornec. 9 p 15,06 2 2 2 3 B 6 i 7,53 F 0,97 0,41 69,92 7,77 2 3 2 B 2,94 0,01 Erro 24 63,33 Total 35 148,31 QM 2,64 E(QM) i 2 • Não se evidencia diferença entre os fornec. quanto à pureza da matéria-prima fornecida; • A pureza da matéria-prima difere de lote a lote para um mesmo fornecedor, ou seja, existe variabilidade na pureza de lote a lote para cada fornecedor. Gráfico dos resíduos x preditos Gráfico dos resíduos x fornecedores Observação • Interação → não podemos fazer interação pois se fizéssemos, estaríamos comparando, além de: Se há diferença entre os fornec. 1, 2 e 3(correto) • Compararíamos: Se há diferença entre os lotes 1, 2, 3 e 4 de cada fornecedor e se o fornecedor está na dependência do lote e vice-versa Essa comparação não pode ser feita pois cada lote pertence a um único fornecedor. Fatorial Hierárquico com m estágios • É o mesmo raciocínio que o delineamento fatorial hierárquico com 2 fatores, com uma diferença que tem um fator C a mais, e esse fator C está dentro de um outro fator B, que por sua vez, está dentro de um fator A. Fatorial Hierárquico com m estágios • Exemplo: Desejamos investigar a dureza de duas diferentes formulação de liga. Três calores de cada liga é preparado, duas barras de metal fundido são selecionada aleatoriamente dentro de cada calor testado, e duas medidas de dureza são medida em cada barra. (Delineamento fatorial Hierárquico em 3 estágios com 2 repetições). exemplo Formulação da liga 1 calor1 Barra 1 Formulação da liga 2 calor 2 Barra 2 Y1111 y1112 Barra 1 Y1121 y1122 calor 3 Barra 2 Y1211 y1212 Barra 1 Y1221 y1222 calor1 Barra 2 Y1311 y1312 Y1321 y1322 Barra 1 calor 2 Barra 2 Y2111 y2112 Barra 1 Y2121 y2122 calor 3 Barra 2 Y2211 y2212 Barra 1 Y2221 y2222 Barra 2 Y2311 y2312 Y2321 y2322 Fatorial Hierárquico com 3 estágios Modelo linear (DCC) yijkl = μ + αi + βj(i) + ck(j)+ εijkl μ é a média αi é o ef. do i-ésimo nível do fator A βj(i) é o ef. do j-ésimo nível do fator B dentro do i-ésimo nível do fator A ck(j) é o ef. do k-ésimo nível do fator C dentro do j-ésimo nível do fator B(e do i-ésimo nível do fator A-Montgomery) εijkl é o erro i= 1,2,...,a j= 1,2,...,b k=1,2,...,c l=1,2,...,r 3 fatores Fatores Mod. I ou Mod. Fixo Mod. II ou Mod. Aleat. A Fixo Aleatório Fixo Fixo B Fixo Aleatório Aleatório Fixo C Fixo Aleatório Aleatório Aleatório Mod. Misto Modelo I (A,B e C fixos) • Suposições: εijkl ~ N(0,σ2) independentes yijkl ~N(μ + αi + βj(i)+ck(j) ,σ2) independ. • Restrições: a a ˆ j (i ) 0 para todo i ; ˆ 0 ; i 1 i j 1 a cˆ j 1 k( j) 0 para todo j Modelo I (A,B e C fixos) • Hipóteses: H0: α1= α2= ...= αa= 0 H0: β1(i)= β2(i)=...= βb(i)=0;para todo i H0: c1(j)= c2(j)=...= cc(j)=0;para todo j Modelo II (A,B e C aleatórios) • • • • • • • Suposições: αi~N(0, σ2A) independentes βj(i)~N(0, σ2B) independentes c k(j) ~N(0, σ2C) independentes εijkl ~ N(0,σ2) independentes αi , βj(i) ,c k(j) e εijkl são independentes yijkl ~N( μ ; σ2+σ2A+σ2B+ σ2C) e indep. se estão em caselas diferentes Modelo II (A,B e C aleatórios) • • • • • • Restrições: não tem restrições. Hipóteses: H0: σ2A = 0 H0: σ2B = 0 H0: σ2B = 0 Modelo Misto(A fixo, B e C aleatórios) • • • • • • Suposições: βj(i)~N(0, σ2B) independentes ck(j)~N(0, σ2C) independentes εijkl ~ N(0,σ2) independentes βj(i) ck(j) e εijkl são independentes yijkl ~N( μ+ αi ; σ2+σ2B+ σ2C) e indep. se estão em caselas diferentes Modelo Misto(A fixo, B e C aleatórios) • Restrições: a ˆ i 1 i 0 • Hipóteses: • H0: α1= α2= ...= αa= 0 (não existe efeito do fator A) • H0: σ2B = 0 • H0: σ2C = 0 Análise de Variância para 3 fatores Causas de variação G.L. SQ QM A a-1 SQA QMA B(A) a(b-1) SQB(A) QMB(A) C(B) ab(c-1) SQC(B) QMC(B) Erro abc(r-1) SQE QME Total abcr-1 SQTotal Análise de Variância para 3 fatores Quadrados médios esperados c.v. A B(A) C(B) Erro Total Modelo I a rbc 2 2 i a 1 i 1 Modelo II 2 r 2C rc 2 B rbc 2 A a b rb 2 2 2 2 2 j (i ) r C rc B a(b 1) i 1 j 1 a b c r 2 2 2 2 ck ( j ) r C ab(c 1) i 1 j 1 k 1 2 2 Análise de Variância para 3 fatores c.v. A B(A) Quadrado Médio esperado Modelo Misto a rbc 2 2 2 2 r C rc B i a 1 i 1 r C rc B 2 2 2 C(B) r C Erro Total 2 2 2 Análise de Variância para 3 fatores Causas de Variação A B(A) C(B) Erro F Mod.I QMA QME QMB(A) QME QMC(B) QME QME Mod.II e Misto QMA QMB(A) QMB(A) QMC(B) QMC(B) QME QME • Regra para construção dos QM Esperados:o fator (A) terá o componente do subfator (B) e do subsubfator C, se o subfator e o subsubfator forem aleatórios. O subfator (B) terá componente do subsubfator(C) se o subsubfator for aleatório. Soma de quadrados • As expressões são calculadas de forma usual: 2 SQTotal y 2 ijkl i , j , k ,l 2 i ... FC y.... FC rabc 2 ij.. y y SQA FC SQB( A) FC SQA i , j rbc i , j rc 2 yijk. SQC( B) FC SQB( A) SQA i , j ,k r SQE SQTotal SQA SQB( A) SQC( B) exemplo (super fictício) • 2 fazendas, uma em cada região • escolhidas, aleatoriamente, 3 árvores em cada fazenda • dentro de cada árvore, foram escolhidas 3 folhas, aleatoriamente • de cada folha foi medida, em 2 lugares diferentes, a quantidade de fungo • var. resposta: quantidade de fungos • fator fixo: fazendas • fatores aleatórios: árvores e folhas exemplo Fazenda 1 árvore 1 árvore 2 árvore 3 Folha 1 Folha 2 Folha 3 Folha 1 Folha 2 Folha 3 Folha 1 Folha 2 Folha 3 Fazenda 2 Y1111 y1112 Y1121 y1122 Y1211 y1212 Y1221 y1222 Y1311 y1312 Y1321 y1322 árvore 1 árvore 2 árvore 3 Folha 1 Folha 2 folha 3 Folha 1 Folha 2 folha 3 Folha 1 Folha 2 folha 3 Y1111 y1112 Y1121 y1122 Y1211 y1212 Y1221 y1222 Y1311 y1312 Y1321 y1322 exemplo • • • • • • • No SAS(Analyst): Statistcs/ANOVA/mixed model/ dep: resposta class:A,B,C MODEL: Fixed effects: A;Random effects: B(A),C(B) OPTION: type 1 TE exemplo ST: type 1 e “test of variance components” • PLOTS: RESIDUAL/Residual plot (including random effects) • 1-plot residuals x predicted • 2-plot residuals x independents Experimento Fatorial Hierárquico Cruzado • Esse delineamento é usado quando temos um fator dentro de outro e também temos dois fatores que podem ser cruzados (pois estão no mesmo nível). Experimento Fatorial Hierárquico Cruzado • Exemplo: fatorA fatorB cruzados fixos fatorC hierárquico a B aleatório Experimento Fatorial Hierárquico Cruzado Modelo linear yijkl Ai B j ABij Ck ( j ) ACik ( j ) ijkl fixos aleatórios i=1,2,...,a ; j=1,2,...,b ; k=1,2,...,c ; l=1,2,...,r Experimento Fatorial Hierárquico Cruzado • Hipóteses: H0:A1= A2 =...=Aa =0 H0:B1= B2 =...=Bb =0 H0:AB11=...=ABab =0 H0: σ2C = 0 H0: σ2AC = 0 Análise de variância para experm. fatorial hierárquicos cruzados c.v. A B AXB C(B) AxC(B) Erro Total g.l. a-1 b-1 (a-1)(b-1) b(c-1) b(a-1)(c-1) abc(r-1) abcr-1 SQ SQA SQB SQAxB SQC(B) SQAxC(B) SQE QM QMA QMB QMAxB QMC(B) QMAxC(B) QME Análise de variância para experm. fatorial hierárquicos cruzados c.v. Quadrado Médio esperado a rbc 2 2 r 2 AC A A i a 1 i 1 a rac 2 2 2 ar C B B j b 1 i 1 a rc 2 2 2 r AC AB AxB ij (a 1)(b 1) i 1 C(B) ar C AxC(B) r AC 2 2 2 2 F QMA QMAxC(B) QMB QMC(B) QMAxB QMAxC(B) QMC(B) QME QMAxC(B) QME Análise de variância para experm. fatorial hierárquicos cruzados • Regras para obtenção dos expressões de soma de quadrados e graus de liberdade: Regra 1: subtrai-se uma das letras que não aparecem dentro dos parênteses no índice dos efeitos; Regra 2: desenvolve-se algebricamente as expressões obtidas pela regra 1; • g.l.:substituindo-se os índices pelas suas dimensões na regra 1 obtém-se os g.l.; • SQ: considerando-se G e os índices de operação da regra 2 obtem-se as expressões das SQ. exemplo fatorA fatorB cruzados fixos fatorC hierárquico a B aleatório Fator A: fixture (1,2 e 3) Fator B: layouts (1 e 2) Fator C: operadores (4 para cada layout) 2 repetições exemplo layout 1 layout 2 oper. 1 2 3 4 1 2 3 4 Fix.1 22 23 28 25 26 27 28 24 24 24 29 23 28 25 25 23 30 29 30 27 29 30 24 28 27 28 32 25 28 27 23 30 25 24 27 26 27 26 24 28 21 22 25 23 25 24 27 27 Fix.2 Fix.3 exemplo • • • • • • • • • • No SAS(Analyst): Statistcs/ANOVA/mixed model/ dep: resposta class:A,B MODEL: Fixed effects: A, B, A*B Random effects: C(B), A*C(B) A*C+A*B*C OPTION: type 1 TE exemplo ST: type 1 e “test of variance components” PLOTS: RESIDUAL/Residual plot (including random effects) 1-plot residuals x predicted 2-plot residuals x independents exemplo c.v. g.l. SQ QM F fixture 2 82,80 41,40 7,54 0,01 layout 1 4,08 4,09 0,34 0,58 operator(layout) 6 71,91 11,99 5,15 <0,01 fixture*layout 2 19,04 9,52 1,73 0,22 fixture*oper(layout) 12 [F*O + F*L*O] Erro 24 65,84 5,49 2,36 0,04 56,00 2,33 Total 299,67 47 p exemplo • Conclusões: • Olhando nos totais das fix. podemos notar que as fix. 1 e 3 são menores que a 2. • Um operador é melhor se ele usar um tipo de fixação • Pode ser que esses oper*fix pode sumir se nós treinarmos os operadores.