ME623A Planejamento e Pesquisa Blocagem em Experimentos Fatoriais Em algumas ocasiões, pode não ser possível aleatorizar completamente todas as rodadas de um experimento fatorial Por exemplo, a presença de um fator ruído pode sugerir que o experimento seja realizado em blocos Uma variedade de fenômenos podem causar restrições na aleatorização (blocos): operador, lote de material, tempo, dia Um experimentador pode conseguir uma replicação completa no dia 1, uma segunda replicação no dia 2, e assim por diante. Nesse caso, cada dia é considerado um bloco Blocagem em Experimentos Fatoriais Considere um fatorial com dois fatores (A e B) e n replicações O modelo estatístico para esse delineamento é: onde τi, βj e (τβ)ij representam os efeitos dos fatores A, B e da interação AB, respecitvamente Suponha que precisemos de uma certa matériaprima e esta é disponibilidade em lotes. Se o lote não for grande o suficiente para executar as abn rodadas, mas este for suficiente para ab observações, então faremos o experimento em blocos Blocagem em Experimentos Fatoriais O modelo estatístico para para um fatorial com dois fatores e blocos é dado por: onde δk representa o efeitos do k-ésimo bloco Cada bloco contém uma replicação do fatorial completo (todos os tratamentos) A ordem com que os tratamentos são aplicados é completamente aleatória dentro de cada bloco Blocagem em Experimentos Fatoriais O modelo assume que a interação entre blocos e tratamentos são desprezíveis. Isto também foi assumido no experimento de blocos completos aleatorizados. Se estas interações existirem, elas não podem ser distinguidas do componente de erro. Na verdade, o erro deste modelo consiste realmente das interações (td )ik ,(bd ) jk ,(tbd )ijk Blocagem em Experimentos Fatoriais Tabela ANOVA para um fatorial com dois fatores e blocos Exemplo – Radar Um engenheiro está estudando métodos para melhorar a habilidade de detectar alvos num radar Dois fatores são considerados: ruído de fundo (3 níveis) e tipo de filtro colocado na tela (2 tipos) O experimento consiste em aumentar a intensidade de um sinal até que este seja detectado. A variável resposta é então esta intensidade do sinal emitido quando o operador consegue detectá-lo Diferentes operadores participarão do experimento, e como eles têm habilidades diferentes, é razoável considerar cada operador como um bloco Exemplo – Radar Dados observados: Operador 1 Filtro 1 2 Ruído Baixo 90 86 Médio 102 87 Alto 114 93 2 1 3 2 96 84 106 90 112 91 1 4 2 100 92 105 97 108 95 1 2 92 81 96 80 98 83 Vamos analisar os dados acima e verificar se o nível de ruído e o tipo de filtro influenciam na detecção do sinal Também veremos se existe interação Exemplo – Radar O modelo linear para esse experimento é: em que τi representa o efeito do nível de ruído, βj representa o tipo de filtro, (τβ)ij é a interação e δk é o efeito do operador (bloco) As SS dos efeitos principais e da interação são calculadas da maneira usual. E a SSBloco: Exemplo – Radar Tabela ANOVA: aov(formula = dados ~ filtro * ruido + Error(oper)) Ambos efeitos principais (nível de ruído e tipo de filtro) são significantes A interação é significante a um nível de significância de 10% Experimentos Fatoriais em Quadrados Latinos Suponha que existem duas restrições na aleatorização, ou seja, dois fatores ruído e cada um tem p níveis Se além disso, o número de tratamentos no experimento com k fatores é exatamente p Então o experimento fatorial pode ser realizado num quadrado latino p x p Experimentos Fatoriais em Quadrados Latinos Suponha a seguinte modificação para o exemplo do radar: Suponha que apenas 6 rodadas podem ser feitas por dia. Assim, “dias” se torna uma segunda restrição na aleatorização, resultando em um quadrado latino 6x6 Experimentos Fatoriais em Quadrados Latinos Operador Dia 1 2 3 4 5 6 1 A(90) B(106) C(108) D(81) F(90) E(88) 2 C(114) A(96) B(105) F(83) E(86) D(84) 3 B(102) E(90) F(95) A(92) D(85) C(104) 4 E(87) D(84) A(100) B(96) C(110) F(91) 5 F(93) C(112) D(92) E(80) A(90) B(98) 6 D(86) F(91) E(97) C(98) B(100) A(92) A = f1g1, B = f1g2, C = f1g3, D = f2g1, E = f2g2, F = f2g3 onde f = filtro, e g = ruído Experimentos Fatoriais em Quadrados Latinos O Modelo é: Yijkl = m + ai + t j + bk + (tb ) jk + ql + eijkl Onde ai , q l São os efeitos dos dias e operadores, que indicam a restrição na aleatorização. Experimentos Fatoriais em Quadrados Latinos Dados não balanceados em Modelos Fatoriais É comum encontrar situações onde a número de observações nas células é diferente. Isso pode acontecer por várias razões: O pesquisador pode ter planejado um experimento balanceado, mas problemas surgiram no meio do caminho a algumas UE foram perdidas Dados não balanceados em Modelos Fatoriais As vezes experimentos não balanceados são planejados para serem assim Alguns tratamentos podem ser muito caros ou mais difíceis de se aplicar, então poucas observações são feitas nestas células Ou algumas combinações podem ser de maior interesse Dados não balanceados em Modelos Fatoriais Suponha um experimento fatorial(2) Número de observações em cada célula é nij b Seja ni. = å nij o número de obs. na ij=1 e ésima linha a n. j = å nij o número de obs. na ji=1 ésima coluna Dados não balanceados em Modelos Fatoriais Caso 1: Dados proporcionais(+fácil) ni. n. j nij = n.. O número de observações em quaisquer duas linhas ou colunas são proporcionais Neste caso, a análise de variância é a mesma, apenas com algumas modificações nas somas de quadrados: Dados não balanceados em Modelos Fatoriais Caso 1: Dados proporcionais(+fácil) a SST = å i=1 b å j=1 nij 2 y 2 ... y å ijk n .. k=1 a yi..2 y...2 SSA = å n.. i=1 ni. b y.2j. y...2 SSB = å n.. j=1 n. j Dados não balanceados em Modelos Fatoriais Caso 1: Dados proporcionais(+fácil) a SSAB = å i=1 b å j=1 yij.2 y - - SSA - SSB nij n.. 2 ... SSE = SST - SSA - SSB - SSAB Dados não balanceados em Modelos Fatoriais Caso 1: Dados proporcionais(+fácil) Exemplo: Temperatura Material 1 15 70 125 130 155 34 40 74 180 80 75 2 159 126 136 115 45 3 138 160 150 139 96 Mostre que é balanceado! 70 58 Dados não balanceados em Modelos Fatoriais Caso 1: Dados proporcionais(+fácil) Exemplo: Temperatura Material 1 15 70 125 130 155 34 40 74 180 80 75 2 159 126 136 115 45 3 138 160 150 139 96 70 58 Exercício: verificar o resultado do R e comparar com o livro Dados não balanceados em Modelos Fatoriais Caso 1: Dados proporcionais(+fácil) Métodos de aproximação: Quando os dados não estão “longe” de serem balanceados. Faz o problema ficar bem mais fácil, dada a dificuldade de lidar com dados muito desbalanceados Dados não balanceados em Modelos Fatoriais Caso 1: Dados proporcionais(+fácil) Métodos de aproximação: a) Estimar observações faltantes Se apenas algumas observações faltam Para um modelo com interação, o estimador da célula faltante que minimiza a soma dos quadrados dos erros é y ij. Dados não balanceados em Modelos Fatoriais Caso 1: Dados proporcionais(+fácil) Métodos de aproximação: a) Estimar observações faltantes Então estimamos aquele valor por A análise procede como usual, exceto que tiramos graus de liberdade do erro yij. Dados não balanceados em Modelos Fatoriais Caso 1: Dados proporcionais(+fácil) Métodos de aproximação: b) Deixar dados de lado Suponha que em um experimento fatorial com dois fatores (3 niveis cada), temos 4 observações para cada tratamento, mas um só tratamento tem 5 observações Não compensa estimar todas as outras observações (18% dos dados) Dados não balanceados em Modelos Fatoriais Caso 1: Dados proporcionais(+fácil) Métodos de aproximação: b) Deixar dados de lado Deixa esta observação de lado e fique com dados balanceados de n = 4 Escolha uma observação deste tratamento aleatoriamente Dados não balanceados em Modelos Fatoriais Caso 1: Dados proporcionais(+fácil) Métodos de aproximação: b) Médias Ponderadas Yates(1934) Tratar as médias das células como os dados e fazer a análise usual. a MSE = b nij å åå i=1 (yijk - yij. )2 j=1 k=1 n.. - ab Dados não balanceados em Modelos Fatoriais Caso 1: Dados proporcionais(+fácil) Métodos de aproximação: b) Médias Ponderadas Mas MSE estima a variância de 1 observacao y e estamos tratando das médias de cada célula, então usamos a MSE MSE ' = å ab i=1 b å j=1 1 nij Com n.. – ab graus de liberdade Grande vantagem computacional Dados não balanceados em Modelos Fatoriais Caso 2: Método exato Ver artigos citados no livro do Montgomery Usar SAS Exercício Considere o modelo fatorial de 3 fatores Yijkl = m + t i + b j + g k + (tb )ij + (bg ) jk + eijk i = 1…a j = 1…b k = 1…c Note que só há uma replicação. Se todos os fatores forem fixos, escreva a tabela ANOVA, incluindo as esperanças dos erros quadráticos médios.