ME623 Planejamento e Pesquisa Experimentos com um Único Fator (Completamente Aleatorizados) 2 Experimentos com um Único Fator One-Way ANOVA ANOVA = Analysis of Variance Qual a relação de uma ANOVA com o Teste t se temos apenas um fator com 2 níveis? 3 Experimentos com um Único Fator One-Way ANOVA ANOVA = Analysis of Variance Qual a relação de uma ANOVA com o Teste t se temos apenas um fator com 2 níveis? Em ANOVA geralmente temos o fator A com a tratamentos(níveis) 4 Experimentos com um Único Fator One-Way ANOVA ANOVA = Analysis of Variance Qual a relação de uma ANOVA com o Teste t se temos apenas um fator com 2 níveis? Em ANOVA geralmente temos o fator A com a tratamentos(níveis) Qual é então a motivação para ANOVA? 5 Teste t da aula anterior > y1 <- c(1.85, 2.40,-1.21, 0.35, 3.52, 4.04, 4.96, 0.15, -0.59, 2.57) > y2 <- c(-1.62, -0.75, 1.70, 2.12, 3.98, -4.87, -2.34, 3.02, -0.08, 1.27) > t.test(y1, y2, var.equal=TRUE) ANOVA: > grupo <- factor(rep(1:2, each=10), labels=c(“Supl", “Placebo")) fit <- aov(c(y1,y2) ~ grupo) 6 Vamos começar com um exemplo... Uma engenheira quer investigar a resistência de uma nova fibra sintética usada para fazer camisetas. Ela sabe que a porcentagem de algodão na composição da fibra afeta a resistência. Será quer aumentar a porcentagem de algodão aumentará a resistência da fibra? A porcentagem de algodão deve ser entre 10 e 40% para que o produto final tenha outras características de qualidade desejáveis (como poder aplicar uma estampa) 7 Exemplo (cont.) Testar 5 níveis do percentual de algodão: 15, 20, 25, 30, e 35% Repetir o experimento 5 vezes para cada percentual Perguntas 1. 2. 3. 4. 5. Quantos fatores? Qual é o fator? Quantos níveis? Quais são? Quantas replicações? Quantas UE são necessárias? 8 Aleatorização % Algodã o Ordem Ensaio U E Orde m Ensaio % Algodã o 1 8 20 2 18 30 3 10 20 15 1 2 3 4 5 4 23 35 20 6 7 8 9 10 5 1 15 25 11 12 13 14 15 6 5 15 30 16 17 18 19 20 7 14 25 35 21 22 23 24 25 . . . . . . . . . 22 16 30 23 25 35 24 19 30 25 3 15 Por que mesmo que a aleatorização é importante? 9 DADOS EXPERIMENTAIS % Algodã o 15 20 Observações 1 2 3 4 5 7 12 7 17 15 12 11 18 9 18 25 30 35 14 19 7 18 25 10 18 22 11 19 19 15 19 23 11 Resistência medida em lb/in2 Tota l Média 49 9.8 77 15.4 88 17.6 108 21.6 54 10.8 376 15.04 10 Visualização dos Dados Figura: Boxplot da resistência para cada % de algodão Figura: Dotplot da resistência versus % de algodão Existe alguma indicação de que a porcentagem de algodão afeta a resistência da fibra sintética? 11 A Análise de Variância Queremos testar se existe diferença entre as resistências média para todos os a=5 níveis do fator A E por que não aplicar o teste t para todos os pares de médias? P(não rejeitar H0| H0 é verdadeira) = (1 − 0.05)10 = 0.60 P(Erro Tipo I) = 1 – 0.60 = 0.40 O procedimento apropriado para testar a igualdade de várias médias é conhecido como Análise de Variância 12 A Análise de Variância (ANOVA) Representação típica dos dados em experimentos com um fator Tratamento ou Fator A (nível) 1 2 . . . a y11 y21 . . . ya1 Observações y12 . . . y1n y22 . . . y2n . . . ... . . . ya2 . . . yan Totais Médias y1· y2· y1· y2· . . . ya· y·· ya· y·· 13 Modelo As observações do experimento (variáveis aleatórias) são descritas através do modelo: 14 Modelo As observações do experimento (variáveis aleatórias) são descritas através do modelo: Restrição: 15 Modelo As observações do experimento (variáveis aleatórias) são descritas através do modelo: Porque precisamos da Restrição? 16 Modelo As observações do experimento (variáveis aleatórias) são descritas através do modelo: Porque precisamos da Restrição? Temos k médias m + t i : média pop. do fator I k+1 parâmetros! Identificabilidade! 17 Efeito Fixo ou Aleatório? Efeito Fixo: os a tratamentos foram especificamente escolhidos. Conclusões aplicam-se APENAS aos tratamentos considerados na análise Efeito Aleatório: os a tratamentos são uma amostra aleatória de uma população de tratamentos. Conclusões podem ser estendidas à população de tratamentos 18 Formulando as Hipóteses Queremos testar a igualdade das médias dos a tratamentos, ou seja, Veja que Portanto, a hipótese acima é equivalente a testar se os efeitos dos tratamentos são nulos: 19 Notação 20 Decomposição da Soma de Quadrados Soma de Quadrados Total (SST) Exercício: Demonstrar!!! 21 Decomposição da Soma de Quadrados Soma de Quadrados Total (SST) SSA é a soma de que? SSE é a soma de que? 22 Decomposição da Soma de Quadrados Soma de Quadrados Total (SST) SSA é a soma de que? Mede dif. média dos trat SSE é a soma de que? Sobra: devido ao erro 23 Graus de Liberdade das Soma de Quadrados Soma de Graus de Quadrados Liberdade (gl) Explicação a–1 a níveis do Fator A SSA SSE a(n – 1) = N – a n – 1 gl dentro de cada nível do fator A SST N–1 N observações no total 24 Estimador de σ2 Soma de Quadrados dos Erros O termo entre colchetes dividido por éa variância amostral para o i-ésimo tratamento: Então um estimador de é dado por 25 Quadrados Médios (MS) Definição: Quadrado Médio do Erro (MSE) Quadrado Médio do Fator A (MSA) 26