Universidade Tecnológica Federal do Paraná Mestrado Profissional em Tecnologia de Alimentos Análise Estatística de Experimentos Profª Sheila Regina Oro EXPERIMENTOS FATORIAIS Francisco Beltrão Agosto, 2013 Experimentos Fatoriais • Projeto experimental em que os ensaios são realizados de forma proposital e com causas controladas (fatores). • É necessário o controle das causas para que as respostas obtidas nos ensaios sejam devidas somente aos efeitos dos tratamentos realizados e não a outras causas. • O pesquisador deve considerar a presença de efeitos “não controláveis” (variação ao acaso). 2 Experimentos Fatoriais • Cada nível de um fator é ensaiado com todos os níveis dos outros fatores, para testar principalmente se há diferença no valor esperado da resposta entre os níveis de cada fator e se há interação entre os fatores. • Fator: variável independente • Ex.: solventes, aditivos, temperatura • Níveis: • Ex.: ausência ou presença; -1, controle, +1; 50ºC , 75ºC , 100ºC 3 Exemplo 1: Solventes • Um pesquisador está interessado em estudar a extração de pigmentos naturais, com aplicação como corante em alimentos. Numa primeira etapa tem-se a necessidade de escolher o melhor solvente extrator dentre os seguintes: E50, EAW, MAW, E70, M1M. A escolha do(s) melhor(es) solventes foi realizada através da medida da absorbância de um pigmento natural do fruto de baguaçú. 4 Exemplo 1: Solventes • Fator: solvente • Níveis: 5 (E50, EAW, MAW, E70, M1M) • Repetições: 5 • Tratamentos: 5 • Ensaios: 25 (Repetições x Tratamentos) • Unidade experimental: 10 gramas de polpa • Casualização: a partir de 1kg de polpa, foram retiradas as amostras de 10g para a aplicação dos tratamentos, numa ordem aleatória. 5 ANOVA – 1 Fator Tabela1-2Dadosgeraisdeumexperim entocomumúnicofator Tratam entos Observações Totais M édias (níveis) 1 y11 y12 . . . y1n y1. y1 2 y21 y22 . . . y2n y2. y2 . . . . . . . . . . . . . . . yan ya. ya . . a . . . . ya1 ya2 6 Modelo – 1 Fator Média geral Efeito de cada nível Erro Resposta nível i repetição j Suposições: y ij =μ+α i +ε ij 1) os erros aleatórios são independentes; 2) os erros aleatórios são normalmente distribuídos; 3) os erros aleatórios tem média 0 (zero) e variância 2; 4) a variância, 2, deve ser constante para todos os níveis do fator. 5) as observações são adequadamente descritas pelo modelo 1 Fator – Efeito Fixo • Níveis do fator selecionados pelo pesquisador • Hipóteses: H0: 1= 2=...= a H1: i j para pelo menos um par (i,j) 1-3.1 Decomposição da soma de quadrados total y a n ij y.. =n yi. y.. + yij yi. 2 i=1 j=1 a i=1 2 a n 2 i=1 j=1 Corrigida para a média SSTotal = SSTratamentos + SSErro 8 1 Fator – Efeito Fixo Decomposição da soma de quadrados total y a n ij y.. i=1 j=1 2 a = n yi. y.. 2 i=1 SSTotal = SSTratamentos y a + n ij yi. 2 i=1 j=1 + SSErro 9 1 Fator – Efeito Fixo Variância do tratamento i 1 n 2 yij yi. n 1 j=1 Variância combinada dos a tratamentos y a n ij yi. an 1 2 i=1 j=1 10 1 Fator – Efeito Fixo Variância entre tratamentos 1 a 2 yi. y.. a 1 i=1 Graus de liberdade SSTotal : an-1 SSTratamentos : a-1 SSerro : a(n-1) 11 1 Fator – Efeito Fixo Quadrados médios QMTrat = SQTratam entos a 1 SQErro QMErro= a( n - 1 ) Esperança dos quadrados médios E( QMT ratamen tos) = σ 2 + E(QMErro)= σ a n τ i2 i=1 a 1 2 12 1 Fator – Efeito Fixo QMTtratam entos Teste: Fo = QMErro Análise Estatística • Critério para rejeição de H0: F0 > F,a-1,N-a valor p < 5% • valor-p: probabilidade de rejeitar a hipótese nula devido a variações aleatórias. 13 1 Fator – Efeito Fixo Tabela da análise de variância de um experimento com um fator. Causas de Soma de Graus de Quadrados F0 variação quadrados liberdade médios Entre tratamentos a-1 QMTratamentos QMTratamentos QMErro Erro (dentro SSErro de trata/os) N-a QMErro Total N-1 N = an SSTratamentos SST CV = Valor p QMErro .100 Média 14 1 Fator – Efeito Fixo Teste de Tukey d .m.s. q ;r ; glerro QM erro r dms = diferença mínima significativa qα; r; gl_erro: valor tabelado QMerro: quadrado médio do resíduo (ANOVA) r: número de repetições de cada tratamento Exemplo 1: Solventes Tabela 1.1 Dados de absorbância de cada um dos solventes E50 EAW MAW E70 M1M 0,5553 0,5436 0,4748 0,6286 0,1651 0,5623 0,5660 0,4321 0,6143 0,1840 0,5585 0,5860 0,4309 0,5826 0,2144 0,5096 0,5731 0,5010 0,7498 0,2249 0,5110 0,5656 0,4094 0,6060 0,1954 16 Exemplo 1: Solventes • • • Há suspeita de que o tipo de solvente esteja afetando a absorbância. Distribuições assimétricas. Valor discrepante observado para o solvente E70. 17 Exemplo 1: Solventes • Minitab Stat – Basic Statistics – Display Descriptive Statistics Total Variable Count E50 5 EAW 5 MAW 5 E70 5 M1M 5 Mean 0,5393 0,5669 0,4496 0,6363 0,1968 StDev CoefVar 0,0266 4,94 0,0154 2,72 0,0372 8,28 0,0656 10,31 0,0238 12,11 Minimum 0,5096 0,5436 0,4094 0,5826 0,1651 Median Maximum 0,5553 0,5623 0,5660 0,5860 0,4321 0,5010 0,6143 0,7498 0,1954 0,2249 Range 0,0527 0,0424 0,0916 0,1672 0,0598 18 Exemplo 1: Solventes • Minitab Stat – ANOVA – One-Way (Unstacked) – Comparisons – Tukey’s Fonte de Variação Graus de liberdade Soma de Quadrados Quadrados Médios F Valor-p Solvente 4 0,583024 0,145756 101,11 0,0000 Erro 20 0,028832 0,001442 Total 24 0,611856 R² 95,29% CV • • • • 7,95% O teste da ANOVA confirma que o tipo de solvente afeta a absorbância. F5%;4;20 = 2,87 Valor-p < 5% 95,29% da variância total é explicada pela reta obtida do modelo de regressão linear 19 Exemplo 1: Solventes • • • Solvente Média Grupos Homogêneos M1M 0,19676 a MAW 0,44964 E50 0,53934 c EAW 0,56686 c d E70 0,63626 d b O teste de Tukey apontou que os solventes que não diferem entre si quanto aos valores esperados de absorbância são: • E50 e EAW • E70 e EAW Todos os demais diferem significativamente entre si. A diferença mínima significativa (dms) calculada foi de 0,0718783. 20 1 Fator – Efeito Fixo Qual teste de comparações múltiplas usar? O LSD é eficiente para detectar diferenças verdadeiras nas médias se ele for aplicado apenas depois do teste F da ANOVA, se significativo a 5%. Idem para o Duncan. Estes métodos não contém o erro tipo I (erro geral ou experimentwise error). Como o teste de Tukey controla este erro, ele é o preferido pelos estatísticos. Se a comparação for com um grupo controle, utiliza-se Dunnett. 21 1 Fator – Efeito Fixo Estimação dos parâmetros do modelo Estimativas da média geral e dos efeitos dos tratamentos: Estimativa pontual de i: dado i= + i, temos: μˆ i = μˆ + τˆi = yi. 22 1 Fator – Efeito Fixo Um intervalo de confiança para i é dado por: yi. ± tα/2,Na QMErro/n Intervalo de confiança para a diferença entre quaisquer duas médias i-j: yi. y j. ± tα/2, Na 2QMErro/n 23 Exemplo 1: Solventes Estimativas da média geral e dos efeitos dos tratamentos: μˆ = 0,4778 τˆ1 = 0,5393 0,4778= 0,0615 E50 τˆ2 = 0,5669 0,4778= 0,0891 EAW τˆ3 = 0,4496 0,4778= 0,0282 MAW τˆ4 = 0,6363 0,4778= 0,1585 E70 τˆ5 = 0,1968 0,4778= 0,2810 M1M 24 Exemplo 1: Solventes Um intervalo de confiança para 4 é dado por: 0,6363± 2,086 ( 0,0014) / 5 0,6014 μ4 0,6712 Intervalo de confiança para a diferença entre as médias 3 e 4: ( 0,4496 0,6363) ± 2,086 2( 0,0014)/5 0,2361 μ3 μ4 0,1373 25 1 Fator – Efeito Fixo Dados desbalanceados: O número de observações dentro de cada tratamento é diferente. a ni SQT otal= yij2 y..2 /N i=1 j=1 a SQT ratamentos= i=1 yi2. y..2 ni N 26 1 Fator – Efeito Fixo Diagnóstico do Modelo Verificar se as pressuposições básicas do modelo são válidas fazendo a análise de resíduos. Define-se o resíduo da ij-ésima observação como: eij = yij yˆij A suposição de normalidade Vamos usar o gráfico normal de probabilidades: sob normalidade dos erros, estes devem seguir uma reta de 45o. 27 Exemplo 1: Solventes • • Alguns valores negativos dos resíduos (mais extremos) deveriam ser maiores; alguns valores positivos dos resíduos deveriam ser menores, com exceção do último valor que deveria ser maior. O gráfico indica que os resíduos (erros) podem ter distribuição normal. d ij= eij QM erro • Existe um resíduo que é muito maior que os demais, este valor é denominado outlier. Deve-se fazer uma investigação sobre esse valor. Só eliminar um outlier se tiver uma justificativa não estatística, caso contrário, fazer duas análises: uma com e outra sem o outlier. Usar métodos não paramétricos. Transformação. • Se algum resíduo padronizado (dij) for maior do que |3| ele é um outlier. 28 Exemplo 1: Solventes Gráfico de resíduos no tempo Usado para verificar se existe correlação entre os resíduos. Uma tendência de ter resíduos positivos e negativos indica uma correlação positiva. Isto implica que a suposição de independência dos erros foi violada. Isto é um problema sério, e até difícil de resolver. Se possível evitar este problema. A casualização adequada pode garantir a independência. 29 Exemplo 1: Solventes Gráfico dos resíduos versos valores preditos A distribuição dos pontos é aleatória. Útil para verificar se as variâncias são heterogêneas (forma de megafone). Devido à presença de um outlier as variâncias podem não ser homogêneas. Na presença de heterogeneidade de variâncias é usual aplicar uma transformação nos dados (Box-Cox). Pode-se usar os testes não-paramétricos (Kruskal30 Wallis). Exemplo 1: Solventes Transformação Box-Cox Usada para homogeneizar as variâncias. As conclusões são realizadas para os dados transformados. 31 Exemplo 1: Solventes Teste de Levene 1) Calcular os resíduos da análise de variância; 2) Fazer uma análise de variância dos valores absolutos desses resíduos; 3) Se as variâncias são homogêneas, o resultado do teste F será não significativo. FV GL SQ QM F P Solventes 4 0,003576 0,000894 2,00 0,134 Error 20 0,008944 0,000447 Total 24 0,012519 Conclusão: Aceita-se a hipótese de que as variâncias são homogêneas, pois valor-p > 5%. 32 ANOVA 2 Fatores Fator A com i níveis e fator B com j níveis. ij = diferentes combinações de níveis dos dois fatores (tratamentos). kij = número de observações do tratamento. Fatores A e B podem influir na variável dependente de forma isolada, denominados efeitos principais, e de forma combinada, efeito de uma combinação específica dos fatores A e B. ANOVA 2 Fatores O teste de hipóteses para dois fatores A e B tem três hipóteses nulas: H0 : Não há efeito principal do fator A H0 : Não há efeito principal do fator B. H0 : Não há combinação de efeitos. H1 : Há efeito em cada um dos três casos. ANOVA 2 Fatores Modelo Efeito de cada nível do fator A Efeito de cada nível do fator B Média geral Cada observação da variável resposta Efeito de cada nível da interação yijk = μ + αi + β j + αβij + εijk Erro ANOVA 2 Fatores Suposições do modelo Observações de cada célula ab: amostra aleatória de tamanho r; Cada uma das ab populações é normalmente distribuída; Todas as populações têm a mesma variância; εijk ~ N 0,α Os parâmetros a 2 αi , β j e αβij satisfazem as α = β = 0 i i=1 a b i i=1 e αβ ij i=1 condições: b = αβ ij = 0 j=1 ANOVA 2 Fatores Exemplo 2: Antibiótico e Vitamina • Considere o experimento que visa estudar o efeito simultâneo do uso (ou não) de antibióticos e de vitamina B12 (ou não) no aumento de peso (kg) diário em suínos. Faça uma análise estatística do experimento com a finalidade de verificar se existe diferença estatisticamente significativa entre os tratamentos, adotando um nível de confiança de 95%. Experimento: 2 fatores, 2 níveis e 3 repetições. Tratamentos: 4 Unidades experimentais: 12 Exemplo 2: Antibiótico e Vitamina A tabela a seguir indica os valores observados na amostragem. - sem antibiótico (a0) - com 40g de antibiótico (a1) - sem vitamina B12 (b0) - com 5mg de vitamina B12 (b1) Nível do Fator a0 a1 b0 b1 1,30 1,26 1,19 1,21 1,08 1,19 1,05 1,52 1,00 1,56 1,05 1,55 Exemplo 2: Antibiótico e Vitamina • Nesse experimento vamos verificar os efeitos individuais do uso de antibiótico ou da vitamina B12 no aumento de peso dos suínos, além de estudar a interação desses dois fatores. Fatores: Antibiótico (A) e Vitamina B12 (B); Níveis: a0 (sem antibiótico) e a1 (com antibiótico); b0 (sem Vitamina B12) e b1 (com vitamina B12), respectivamente, adicionados a uma dieta básica de suínos. Exemplo 2: Antibiótico e Vitamina • • Há suspeita de que os níveis de antibiótico e/ou vitamina influenciam o peso dos suínos. Distribuições simétricas. Exemplo 2: Antibiótico e Vitamina 1,30+ ...+1,55² = 0,4418 SQtotal = 1,30²+ ...+1,55² 2.2.3 3,57²+ 3,61²+ 3,10²+ 4,63² 1,30+ ...+1,55² = 0,4124 SQtrat = 2.2.3 3 SQerro = SQtotal SQerro = 0,4418 0,4124= 0,0294 SQmod elo SQA SQB SQAB 0,412333 SQmod elo 100 93,36% R² SQtotal Exemplo 2: Antibiótico e Vitamina MINITAB:/Stat/ANOVA/Two-way Fonte de Variação Graus de liberdade Soma de Quadrados Quadrados Médios F Valor-p Antibiótico 1 0,020833 0,020833 5,68 0,044 Vitamina 1 0,218700 0,218700 59,65 0,000 Interação 1 0,172800 0,172800 47,13 0,000 Erro 8 0,029333 0,003667 Total 11 0,441667 R² 93,36% CV 4,86% F1,8;0,05 = 5,32 Conclusão: pelo menos duas médias de tratamentos diferem significativamente entre si quanto ao ganho de peso diário de suínos. Como a interação é significativa (valor-p < 5%), os fatores antibiótico e vitamina não atuam independentemente na variável resposta (peso). Exemplo 2: Antibiótico e Vitamina O que fazer agora? • Como a interação é significativa deve-se fazer o desdobramento da interação. • Além disso, como os dois efeitos principais são significativos deve-se estudar o comportamento de um fator dentro dos níveis do outro; • Caso apenas um dos efeitos principais fosse significativo, seria necessário estudar apenas o comportamento do fator não significativo dentro dos níveis do outro fator. Exemplo 2: Antibiótico e Vitamina EFEITO SIMPLES DE UM FATOR Medida da variação que ocorre com a característica em estudo (peso, neste caso) correspondente às variações nos níveis desse fator, em cada um dos níveis do outro fator. = a1b0 a0b0 = 1,05 1,30= 0,25 ( dentro b0 ) A = a1b1 a0b1 = 1,52 1,26= 0,26 ( dentro b1 ) B = a0b1 a0b0 = 1,26 1,30= 0,04 ( dentro a 0 ) A B = a1b1 a1b0 = 1,52 1,05= 0,47 ( dentro a1 ) Exemplo 2: Antibiótico e Vitamina EFEITO SIMPLES DE UM FATOR • Na ausência da vitamina existe uma diferença no peso diário dos suínos. A estimativa desta diferença é dada por A • ( dentro de b0 = a b a b = 3,10 3,57= 0,47Kg ) 10 0 0 Somente o efeito do antibiótico prejudica o peso diário dos suínos. Exemplo 2: Antibiótico e Vitamina EFEITO SIMPLES DE UM FATOR • Quando se utiliza a dose de vitamina B12, também existe uma diferença no peso diário dos suínos. A ( dentro de b1 = a b a b = 4,63 3,66= 0,97Kg ) 11 01 • A combinação do uso de antibiótico e vitamina favorece o peso diário dos suínos. Exemplo 2: Antibiótico e Vitamina EFEITO PRINCIPAL DE UM FATOR Quanto mudou a variável resposta devido à mudança no nível do fator. Exemplo 2: Antibiótico e Vitamina Efeito principal de A a1b0 a1b1 a0b0 a0b1 1,05 1,52 1,30 1,26 0,005 2 2 2 2 A presença de antibiótico proporciona um aumento de 0,005kg no peso dos suínos; Efeito principal de B a0b1 a1b1 a0b0 a1b0 1,26 1,52 1,30 1,05 0,215 2 2 2 2 A presença de vitamina B12 proporciona um aumento de 0,215kg no peso dos suínos; Exemplo 2: Antibiótico e Vitamina Exemplo 2: Antibiótico e Vitamina EFEITO DA INTERAÇÃO ENTRE OS FATORES Medida da variação que ocorre com a característica em estudo, correspondente às variações nos níveis de um fator, ao passar de um nível a outro do outro fator. Efeito da interação A x B = B x A A A ( dentro de b1 ) ( dentro de b0 ) 0,26 ( 0,25) = = 0,255 2 2 Exemplo 2: Antibiótico e Vitamina Interaction Plot for peso Data Means B0 B1 1,6 1,4 niv elFA A0 A1 nivelFA 1,2 1,0 1,6 1,4 nivelFB 1,2 1,0 A0 A1 niv elFB B0 B1 Exemplo 2: Antibiótico e Vitamina Interações 2 X 112 + X 21 X +2+ + 3,57²+ 3,10² 6,67² SQ(Adentrob ) = = = 0,0368 0 r 2r 3 2.3 2 X 122 + X 22 X +2+ + 3,66²+ 4,63² 8,29² SQ(Adentrob1 ) = = = 0,1568 r 2r 3 2.3 F1,8;0,05 = 5,32 Exemplo 2: Antibiótico e Vitamina Conclusão • O teste para a interação AxB foi significativo (p < 0,05); • Como nas fontes de variação do desdobramento A (dentro de b0) e A(dentro de b1) o teste F foi significativo e o fator “Antibiótico” possui dois níveis, não é necessário realizar um teste de comparação de médias. • Interpretações dos testes dos efeitos simples de antibiótico (A) e de vitamina (B) perdem significado. Experimento 2k fatorial • Há apenas 2 níveis para cada fator; • Ex.: Um experimento com 3 fatores e 2 níveis, em duplicata, corresponde a 23 x 2, ou seja, ou 2 x 2 x 2 = 8 experimentos; • Por que realizar experimento fatorial com dois níveis? • ƒFacilidade de realização e de análise gráfica; • Número reduzido de experimentos. • Pode ser aplicado na maioria das situações e na resolução de problemas. • Possibilidade de uso numa sequência de estudos, inclusive em casos multivariados. • Mesmo com um número elevado de fatores, este tipo de planejamento mantém os experimentos em uma quantidade e complexidade razoável. Exemplo 3 - Hipotético Fatores A B C valor observado 1 -1 -1 352,761 1 -1 -1 347,335 -1 -1 1 353,872 1 1 -1 351,813 -1 1 1 339,947 -1 1 1 347,432 -1 1 -1 353,754 1 -1 1 350,932 1 1 -1 351,716 1 1 1 345,387 -1 -1 -1 348,340 -1 -1 1 359,257 -1 1 -1 350,073 1 -1 1 352,454 -1 -1 -1 353,298 1 1 1 348,374 Experimento fatorial: 3 fatores (A, B, C) 2 níveis (-1, 1) Duplicata 2³ x 2 = 16 observações Exemplo 3 - Hipotético Apenas a interação entre 2 fatores foi significativa, com 10% de significância. Exemplo 3 - Hipotético Com um nível de confiança de 90% conclui-se que: Os efeitos do fator B foram significativos; Os efeitos da interação BC foram significativos. Exemplo 3 - Hipotético Podemos assumir que os erros são normalmente distribuídos. Exemplo 3 - Hipotético A distribuição dos pontos é aleatória, indicando variâncias homogêneas. Exemplo 3 - Hipotético Os pontos dispostos ao acaso, indicando erros independentes. Exemplo 3 - Hipotético Os efeitos do fator B e da interação entre os fatores B e C são significativo (5%). Exemplo 3 - Hipotético Exemplo 3 - Hipotético Exemplo 3 - Hipotético