3 - Blocos Casualizados, Quadrado Latino e Outros Delineamentos 3 -1 Delineamento em blocos completos casualizados Um fator de perturbação (nuisance factor) é um fator que provavelmente tem um efeito sobre a resposta, mas o pesquisador não está interessado neste efeito. Quando este efeito é conhecido e controlável, então pode-se usar a técnica de blocagem para eliminar esse efeito da comparação entre os tratamentos. Blocos 72 Caso típico: julgador=bloco. Entre os blocos deve haver diferenças marcantes; dentro do bloco deve haver homogeneidade. Geralmente, blocos é igual a repetições. Exemplo. Suponha que uma pesquisadora deseja verificar se a potência e o tempo de microondas produzem diferentes resultados para população de bactérias psicrotroficas (ufc/cm2), obtidas de amostras (50 cm2) de carcaça de frangos resfriados. Os tratamentos utilizados foram: 700 w e 2 minutos; 350 w e 1 minuto e o controle. A pesquisadora decidiu usar seis repetições por tratamento e fazer as medições ao longo de seis dias, desse modo, as repetições (blocos) são os dias. Como as unidades experimentais provavelmente comportam-se de modo diferente nestes dias (mais calor, menos calor, etc.), isto pode inflacionar o erro experimental. Assim, deseja-se remover a variabilidade entre unidades do erro experimental. Para este fim, vamos usar cada tratamento apenas uma vez em cada um dos 6 dias. Dentro do bloco (dias), a ordem de aplicação dos tratamentos deve ser realizada de forma aleatória (por sorteio). Este delineamento é mostrado na tabela a seguir. 73 Delineamento em blocos completos casualizados para dados de populações de bactérias psicrotroficas (log de ufc/cm2) Tratamentos Blocos Total Média I II III IV V VI 700 w / 2 min 14,60 15,01 14,15 15,07 15,07 15,46 89,37 14,89 350 w / 1 min 14,84 15,40 14,08 14,69 15,40 14,65 91,26 15,21 Controle 13,40 14,20 13,22 13,81 13,98 14,42 83,04 13,84 Total 42,85 44,61 41,45 43,57 44,45 44,54 261,47 14,53 74 Considerações sobre o gráfico: Apresenta variações entre blocos Em todos os blocos o controle foi o que apresentou a menor população de bactérias Há indicativo de interação entre blocos e tratamentos 3-1.1 Análise estatística Bloco I Bloco II Bloco b * a tratamentos; y11 y21 . . . ya1 y12 y22 . . . ya2 . . . y1b y2b . . . yab * b blocos; * uma observação por bloco por tratamento; * é feita a casualização dentro de cada bloco. 75 O modelo estatístico y ij μ τ i β j ε ij para i=1,2,...,a tratamentos j=1,2,...,b blocos é a média geral i é o efeito fixo do i-ésimo tratamento j é o efeito fixo do j-ésimo bloco ij é o erro aleatório. Assume-se que ij ~ NID(0,2) Hipóteses: H 0 : μ 1 μ 2 ... μ a vs H a :μ i μ j para i j Partição da soma de quadrados total corrigida é dada por: y a i 1 b j1 y .. b y i. y .. a y .j y .. y ij y i. y .j y .. a 2 ij b 2 i 1 a b i 1 j1 2 2 j1 S.Q.Total (corrigida) = S.Q Tratamentos + S.Q Blocos + S.Q.Erro 76 Fórmulas operacionais: 2 y SQ T y ij2 .. N i 1 j1 a SQ Blocos b 1 b 2 y ..2 y .j a j1 N 1 a 2 y ..2 SQ Tratamento s y i. b i1 N SQ Erro SQ T SQ Blocos SQ Tratamento s Graus de liberdade: Quadrados médios: SQT N-1 SQBlocos b-1 SQTratamentos a-1 SQErro ab-1-(a-1)-(b-1)=(a-1)(b-1) QMtratamentos SQtra ta m en to s a 1 77 Esperanças dos quadrados médios: a bτ E(QMTratamento s ) σ 2 2 i i 1 a 1 b E(QMBlocos ) σ 2 a β 2j j1 b 1 E(QMErro ) σ 2 Teste de igualdade de médias de tratamentos (Teste F) QMTratamento s F0 QM Erro Rejeita-se H0 se F0 > F,a-1,(a-1)(b-1) Usar o valor p do teste (p-value). 78 Análise de variância para blocos completos casualizados Causas de Soma de Graus de Quadrado F0 variação quadrados liberdade médio Tratamentos SQTratamentos a-1 SQTratamentos QMTratamentos / QMErro a-1 Blocos SQBlocos b-1 SQBlocos b-1 Erro SQErro (a-1)(b-1) SQErro (a-1)(b-1) Total SQT N-1 Exemplo 3-1. Dados de população de bactérias psicrotroficas (log). Arquivo: psicrotroficasblocoscasualizados.sas Obtenção das somas de quadrados: (266,47)2 SQ Total (14,60 15,01 ... 14,42 ) 7,6147 18 1 (266,47)2 2 2 2 SQ Tratamento s [(89,37) (89,07) (83,04) ] 4,2511 6 18 1 (266,67)2 2 2 SQ Blocos [(42,85) ... (44,54) ] 2,6016 3 18 SQ Erro 7,6147 2,6016 4,2511 0,7620 2 2 2 79 Tabela da análise de variância Causas de Variação Tratamentos Blocos Resíduo Total S.Q. 4,2511 2,6016 0,7620 7,6147 G.L. 2 5 10 17 Q.M. F0 2,1256 0,5203 0,0762 27,90 Valor p 0,0001 Concluímos que devemos rejeitar a hipótese de igualdade entre as médias dos 3 tratamentos. O R 2 = (SQModelo / SQT), para este modelo, vale 89,99%, isto indica que o modelo está muito bem ajustado aos dados. O valor do coeficiente de variação foi igual a 1,90%, indicando ótima precisão. Resíduos: eij yij yˆ ij yˆ ij yi. y.j y.. Exemplo: e11 14,60 14,89 14,28 14,53 0,04 eij yij yi. y.j y.. Comparações múltiplas: como o teste F da ANOVA foi significativo deve-se proceder as comparações múltiplas. Se o fator for quantitativo usar regressão. Todos os procedimentos discutidos para o delineamento IC podem aqui ser utilizados. Nas fórmulas anteriores substitui-se o número de repetições, n, pelo número de blocos, b. Também deve-se usar os graus de liberdade do erro para o BCC, (a-1)(b-1), ao invés de [a(n-1)], do delineamento IC. 80 Teste de Tukey – a saída do statistica mostra os resultados. Conclusão: a média do tratamento controle é diferente e menor do que as médias dos tratamentos 350 w +1 min e 700 w + 2 min, ao nível de significância de 5%. Não existe diferença significante entre os tratamentos 350 w +1 min e 700 w + 2 min, ao nível de significância de 5%, pelo teste de Tukey. 81 Diagnóstico do modelo: 1 - Normalidade. 2 - Heterogeneidade de variâncias (por tratamento e por bloco). 3 - Interação bloco e tratamento 4- Efeito do tempo Gráfico normal de probabilidades (normal probability plot) Não existe uma severa indicação de falta de normalidade. Existe a indicação de um valor discrepantte. d26=-0,51167/0,2760 d26=-1,85 Não é valor discrepante. 82 Teste de Levene: Blocos F=0,2745 p=0,9184 Trat/os F=0,0145 p=0,9856 DFFitS(i) - mede a alteração provocada no valor ajustado pela retirada da observação i 83 Se o padrão é curvilíneo indica interação entre blocos e tratamentos, nesse caso, pode-se usar uma transformação (ln). Teste de Tukey para verificar a presença de interação. Médias Variâncias 1 14.2800 0.59520 2 14.8700 0.37470 3 13.8167 0.26823 4 14.5233 0.41773 5 14.8167 0.55223 6 14.8433 0.29843 Blocos 84 Análise de covariância para o delineamento em blocos ao acaso. yij μ τi β j α xij x εij 85 3-1.3 Outros aspectos do delineamento em Blocos Completos Casualizados 1) Aditividade do modelo No delineamento em blocos casualizados parte-se do pressuposto de que não existe interação entre blocos e tratamento. Existe o Teste de Tukey para não-aditividade. Fazer o diagnóstico do modelo. Comentar sobre Julgadores (Blocos). Quando o pesquisador tem interesse em estudar os fatores e a interação entre eles, deve usar os experimentos fatoriais. 2) Blocos aleatórios Exemplos: seleção aleatória de escolas; ninhadas de ratos; julgadores; pacientes. Interpretação: as comparações entre os tratamentos são válidas para toda a população de blocos da qual aqueles utilizados no experimento foram aleatoriamente selecionados. Dois modelos podem ser utilizados: 86 1 - Modelo Aditivo yij μ τi β j εij Esperanças dos quadrados médios: E(QMBlocos ) σ 2 aσ β2 a E(QMTratamento s ) σ 2 bτ i i1 a 1 E(QMErro ) σ 2 Teste F para tratamentos: QMTratamentos/QMErro 87 Exemplo. Oito provadores avaliaram o quanto gostavam ou desgostavam de três marcas diferentes de salsichas usando a ficha 8 (estruturada mista – escala hedônica). Os resultados foram: Provador Amostras A B C 1 6 8 6 2 5 8 7 3 5 7 6 4 5 8 5 5 7 7 4 6 7 8 3 7 7 8 2 8 7 8 1 Total 49 62 34 Média 6,13 7,75 4,25 88 2 - Modelo com interação Blocos x Tratamentos yij μ τi β j τβij εij Nas situações onde o efeito de blocos é aleatória e a interação blocos x tratamento está presente, o teste para tratamentos não é afetado. A obtenção das somas de quadrados e os graus de liberdade são calculados da forma usual. A diferença ocorre nas esperanças dos quadrados médios. Esperanças dos quadrados médios: E(QMBlocos ) σ 2 aσ β2 E(QMTratamento s ) σ σ 2 2 βτ b a τ a 1 i1 2 i E(QMBl.Tr ) σ 2 σ βτ2 Teste F para tratamentos: QMTratamentos/QMBl.Tr 89 3) Determinação do tamanho da amostra ou número de blocos Utiliza-se as mesmas técnicas discutidas para o delineamento inteiramente casualizado. Tratamentos de efeito fixo: as CCO podem ser usadas com, a 2 b τ i 1 aσ 2 2 i bD2 ou 2aσ 2 2 Com (a-1) graus de liberdade no numerador e (a-1)(b-1) gl no denominador. Tratamentos de efeito aleatório: usamos as CCO com, bσ τ2 λ 1 2 σ Com (a-1) graus de liberdade no numerador e (a-1)(b-1) gl no denominador. Exemplo: dados de população de bactérias psicrotroficas. Vamos considerar que a pesquisadora deseja detectar uma diferença de 1 (no log) entre as médias com uma alta probabilidade, por exemplo, 95%. De um experimento anterior sabe-se que a estimativa de 2 é igual a 0,10. 90 CCO para (a-1)=(3-1)=2 e (a-1)(b-1) g.l. e =0,05 b (a-1)(b-1) 2 5 8,4 2,9 8 0,04 4 6,7 2,6 6 0,10 (1-) 0,96 0,90 A pesquisadora deve usar b=5 blocos. Método do intervalo de confiança Exemplo: dados de pop. de psicrotroficas. A pesquisadora deseja construir intervalos de confiança para a diferença entre duas médias de populações de bactérias com precisão (metade do intervalo de confiança)de 0,5 (no log), com confiança de 95%. Tem-se uma estimativa de 2=0,10. Para b=5, a precisão do intervalo é dada por: 2,306 2 0,10 0,4612 5 Para b=4, a precisão do intervalo é dada por: 2,447 2 0,10 0,5471 4 A pesquisadora deve usar b=5 blocos. 91 3-2 Delineamento Quadrado Latino Este delineamento utiliza um duplo bloqueamento. Deseja-se controlar duas fontes de variabilidade, portanto vamos ter duas restrições na casualização. C O L U N A S L I N H A S 92 Exemplo: um pesquisador está estudando o efeito de 4 tratamentos (A, B, C e D), sobre o aroma (escala hedônica de 7 pontos) de um legume. Foram utilizados 4 julgadores, provavelmente existe diferenças (exemplo: experiência, capacidade) entre os mesmos. Além disso, foram utilizadas 4 ordens de atribuição dos tratamentos aos julgadores geradas pela casualização do delineamento. Dois fatores de perturbação (nuisance): julgadores e ordens. Cada tratamento será testado uma única vez por cada julgador e para cada ordem. A tabela a seguir mostra o esquema geral deste delineamento. Delineamento em quadrado latino (4 x 4) para aparência (médias de triplicatas com aredondamento) Julgador Ordem 1 2 3 4 1 D (7) A (6) C (5) B (7) 2 A (6) C (7) B (7) D (7) 3 C (7) B (7) D (6) A (7) 4 B (7) D (7) A (6) C (6) 93 Casualização de um quadrado latino: Existem muitos quadrados latinos para um dado número de tratamentos ( a), veja tabela 4-12, página 140, Montgomery (2005). Vamos utilizar um quadrado latino padrão, os quais são quadrados latinos cujos elementos da primeira linha e primeira coluna são ordenados alfabeticamente. Procedimento: 1 - Para a = 3 tratamentos fazer um sorteio aleatório das linhas e das colunas (independentemente). 2 – Para a = 4, fazer um sorteio aleatório de um dos 4 quadrados latinos padrões. Então fazer um sorteio aleatório das linhas e das colunas (independentemente). 3 – Para a = 5 ou mais, fazer um sorteio aleatório de todas as linhas, de todas as colunas e de todos os tratamentos de um quadrado latino padrão selecionado aleatoriamente. 4 – Faça um sorteio aleatório dos tratamentos às letras. Para a=3 tratamentos: Quadrado latino padrão A B C B C A C A B A B C B C A C A B A B C B C A C A B Sorteio das linhas Sorteio das colunas 94 Modelo estatístico: y ijk μ α i τ j β k ε ijk i 1,..., p j 1,..., p k 1,..., p yijk é a observação na i-ésima linha e k-ésima coluna do j-ésimo tratamento; é a média geral; i é o efeito da i-ésima coluna; j é o efeito do j-ésimo tratamento; k é o efeito da k-ésima linha. ijk é o erro aleatório e supõe-se que tenham distribuição normal, sejam independentemente distribuídos com média 0 (zero) e variância 2. Alternativamente, os testes de hipóteses e intervalos de confiança podem ser justificados aproximadamente pela teoria da aleatorização. 95 Análise de variância: A partição da variabilidade total é dada por: SQT = SQLinhas + SQColunas + SQTratamentos +SQE Onde: y...2 SQT y N i1 j 1 k 1 p p p 2 ijk SQLinhas 1 p 2 y...2 y i .. p i1 N SQTratamento s y...2 1 p 2 y. j . p j 1 N N p2 SQColunas 1 p 2 y...2 y.. k p k 1 N SQE por diferença 96 O teste estatístico de igualdade entre as médias de tratamento é dado por: F0 QM Tratamento s QM E Rejeita-se a hipótese nula se F0>F;(p-1);(p-2)(p-1). (Usar o nível descritivo) Tabela da análise de variância de um quadrado latino Causas de Soma de Graus de Quadrados F0 Variação quadrados liberdade Médios SQTratamentos/(p-1) Tratamentos SQTratamentos p-1 QMTratamentos QME Linhas Colunas Erro Total SQLinhas SQColunas Por diferença SQTotal p-1 p-1 (p-2)(p-1) p2-1 SQLinhas/(p-1) SQColunas/(p-1) SQE/[(p-2)(p-1)] 97 Exemplo 3-4. Dados de aroma. Os resultados da análise de variância foram obtidas através do software SAS (Statistical Analysis System) e estão representados na tabela a seguir. Resultados da ANOVA para os dados de aroma Causas de Soma de Graus de Quadrados F0 Variação Quadrados Liberdade médios Tratamentos 1,6875 3 0,5625 1,80 Julgadores 1,6875 3 0,5625 Ordem 0,6875 3 0,2292 Erro 1,8750 6 0,3125 Total 5,9375 15 Nível descritivo 0,2473 Interpretações: conclui-se que não há diferenças significativas entre os 4 tratamentos. Neste experimento não há forte evidência de diferenças entre julgadores e entre as ordens de realização dos tratamentos. Análise de resíduos: eij yijk yi.. y. j . y.. k 2y... Repetições de quadrados latinos A desvantagem de quadrados latinos pequenos é que eles fornecem poucos graus de liberdade para o resíduo, como, por exemplo, na análise acima em que tem-se apenas 6 gl para o resíduo. Nestes casos é desejável repetir o quadrado latino. 98 Maneiras de repetir um quadrado latino: 1 - Usar os mesmos julgadores e as mesmas ordens; 2 - Usar os mesmos julgadores mas diferentes ordens em cada repetição, ou, de forma equivalente, usar as mesmas ordens mas diferentes julgadores; Obs: Maneira mais adequada 3 - Usar diferentes ordens e diferentes julgadores. Vamos considerar o caso 2, onde outros 4 novos julgadores nas mesmas ordens serão utilizados numa nova repetição. Assim, temos 4 novas colunas dentro de cada repetição.O segundo quadrado latino é selecionado independentemente do primeiro. Neste exemplo o fator (ordem) é de classificação, ou seja não permite o sorteio. Delineamento em quadrado repetição. Julgador 1 5 D (7) 6 A (6) 7 C (6) 8 B (5) latino (4 x 4) para aroma, segunda Ordem 2 A (6) C (7) B (7) D (7) 3 C (6) B (6) D (6) A (6) 4 B (7) D (7) A (5) C (5) 99 Modelo matemático: yijkl i j l k l ijkl A análise estatística, considerando as duas réplicas, foi realizada no SAS, cujos resultados são apresentados a seguir. Resultados da ANOVA para os dados de aroma, considerando duas repetições Causas de Soma de Graus de Quadrados F0 Nível Variação Quadrados Liberdade médios descritivo Tratamentos 3,25 3 1,08 3,25 0,046 Julgadores d. 3,38 6 0,56 repetições Ordens 1,75 3 0,58 Repetições 1,13 1 1,13 Erro 6,00 18 0,33 Total 15,50 31 Interpretações: Existe diferenças entre os tratamentos ao nível de significância de 0,046. Não existe indicativo nesse experimento de diferenças entre julgadores e ordens. Para Julgadores dentro de repetições temos 2(4-1)=6 graus de liberdade, ou seja n(p-1) gl. 100 Delineamento cross-over quadrado latino Em algumas situações, períodos de tempo (sessões), são um fator de estudo. Neste delineamento os “subjects” (julgadores, animais, lojas, etc.) são aleatoriamente designados para as diferentes ordens. Assume-se que todos os efeitos são aditivos e fixos, com exceção do efeito de julgadores o qual é considerado aleatório. Cada julgador recebe todos os tratamentos durante o tempo do experimento, por isso o nome de cross-over. Na tabela a seguir apresenta-se o esquema geral do delineamento cross-over. Foram utilizados 8 julgadores. Delineamento cross-over Ordens Sessões (j) (i) Julgadores 1 2 3 1 m=1 D=7 A=7 C=7 m=2 D=7 A=6 C=7 2 m=1 A=6 C=6 B=7 m=2 A=6 C=6 B=7 3 m=1 C=6 B=6 D=7 m=2 C=7 B=7 D=6 4 m=1 B=7 D=7 A=7 m=2 B=5 D=6 A=7 4 B=7 B=7 D=7 D=7 A=5 A=4 C=7 C=5 101 O modelo matemático: y ijkm i j k mi ijkm ordem sessão Tratamento Julgador dentro de ordem Esquema da ANOVA para o delineamento cross-over, onde n é o número de julgadores por ordem, e p = número de tratamentos = número de ordens = número de sessões. Esquema da ANOVA para o delineamento cross-over Variações no modelo Graus de liberdade Ordem p-1 Sessão p-1 Tratamentos p-1 Julgadores d. ordem p(n-1) Erro (p-1)(np-2) Total np2-1 102 Esperanças dos quadrados médios: p 2 i E( QM Ordem ) 2 p S2 np i 1 p 1 p 2 i E( QM Sessão ) 2 np i 1 p 1 p 2 i E( QM Tratamento s ) 2 np i 1 p 1 E( QM Ju lg( ordem ) ) 2 p S2 E( QM Erro ) 2 103 Exemplo: dados de aroma (cross-over), os resultados da análise de variância foram obtidas com o uso do SAS. Causas de Soma de Graus de Quadrados variação quadrados liberdade médios Tratamentos 2,63 3 0,88 Ordem 3,13 3 1,04 Sessão 2,38 3 0,79 Julga d. ordem 3,25 4 0,81 Erro 8,50 18 0,47 Total 19,88 31 F0 1,85 Nível descritivo 0,1738 Interpretação: concluímos que os 4 tratamentos são equivalentes quanto ao aroma. Os testes para os demais efeitos também não apresentaram significância estatística. 104 3-3 Quadrados de Youden e Graeco-Latino Quadrado Graeco-Latino É uma extensão de um quadrado latino p x p, e é obtido através da superposição de um segundo quadrado latino no qual os tratamentos são representados por letras gregas. Cada letra grega deve aparecer uma e somente uma vez com cada letra latina (quadrados latinos ortogonais). A tabela abaixo ilustra esse delineamento. Ilustração do delineamento em Quadrado Graeco-Latino Blocos nas Blocos nas colunas linhas 1 2 3 4 1 :A :B :C :D 2 :C :D :A :B 3 :B :A :D :C 4 :D :C :B :A Permite o controle de três fatores de perturbação (nuisance), assim, pode-se usar 3 variáveis de bloqueamento. Pode-se estudar 4 fatores, cada um com p níveis, num total de p2 realizações. Obs: não existe QGL para p=6. A primeira classe de cada uma das 3 variáveis de bloqueamento recebe o tratamento A, e assim por diante. Um exemplo, pode ser: ordens, sessões e julgadores. 105 Quadrado de Youden Quando não for possível utilizar um quadrado latino porque o número de níveis de colunas é menos do que o número de níveis de linhas, então pode-se fazer uso do Quadrado de Youden. Exemplo: Têm-se 4 tratamentos; 4 julgadores; para cada julgador pode-se utilizar somente 3 tratamentos; Esquema do delineamento Quadrado de Youden Ordem dos tratamentos Julgador 1 2 3 1 A B C 2 D A B 3 C D A 4 B C D Este delineamento torna-se um quadrado latino com a adição da coluna D, C, B, A. Todo par de tratamentos aparece o mesmo número de vezes dentro de julgador. Para análise consultar livro: Cochran, W.G., and G.M.Cox. Experimental Designs. 106 3-4 Blocos Incompletos Balanceados Em certos experimentos não é possível utilizar todos os tratamentos em cada bloco. Por exemplo, num experimento para testar o efeito de 10 formulações de um produto, com relação ao sabor, aroma ou textura, devido a questões de sensibilidade, etc. , cada julgador pode testar apenas 5 formulações. Assim, cada julgador não pode testar todas as formulações. Nesses casos, pode-se usar o delineamento em blocos incompletos casualizados, onde, para cada julgador (bloco), é designado uma parte das formulações (tratamentos). Blocos Incompletos Balanceados: qualquer dois tratamentos aparecem juntos (no mesmo bloco) o mesmo número de vezes (). Exemplo: um pesquisador formula a hipótese que a aceitabilidade de um alimento depende da sua forma de preparo. Quatro formulações de um produto estão sendo pesquisadas. As amostras são preparadas e designadas aos julgadores, os quais irão atribuir notas, dentro de uma escala. Serão utilizados 4 julgadores. Como existem diferenças entre os julgadores, estes serão tomados como blocos. Entretanto, cada julgador pode testar apenas três formulações. Então, deve-se usar um delineamento em Blocos Incompletos Balanceados. Dentro de cada bloco deve-se fazer o sorteio dos tratamentos. O esquema desse delineamento é mostrado na tabela a seguir. 107 Blocos incompletos balanceados para o experimento de formulação de um produto Tratamentos Julgadores (formulações) 1 2 3 4 yi. 1 7,3 7,4 7,1 21,8 2 7,5 6,7 7,2 21,4 3 7,3 7,5 6,8 21,6 4 7,5 7,2 7,5 22,2 y.j 22,1 22,4 20,7 21,8 87,0=y.. Este plano foi construído formando todas as possíveis combinações de a tratamentos em blocos de tamanho k. 4 4 blocos b 3 a b blocos k Referência bibliográfica: Cochran, W.G. and Cox, G.M. Experimental Designs. 3-4.1 Análise estatística: vamos assumir: a tratamentos k tratamentos por bloco b blocos r repetições por tratamento n=ar=bk observações b=ar/k blocos 108 Propriedade: o número de vezes que cada par de tratamento aparece junto no mesmo bloco é: r(k 1) λ a 1 No exemplo, 3(4311) 2 Características dos BIB: » Todos os blocos tem o mesmo tamanho » Todos os tratamentos tem o mesmo número de repetições » Todos os pares de tratamentos ocorrem o mesmo número de vezes () Se ocorrer esta igualdade é BIB: (a 1) r(k 1) Usar estes resultados r(k 1) λ a 1 n b k ar 109 O modelo estatístico yij j i ij Onde yij é a observação do i-ésimo tratamento no j-ésimo bloco; é a média geral; i é o efeito do i-ésimo tratamento; j é o efeito do j-ésimo bloco e ij é o erro aleatório, NID(0,2). 2 y SQT yij2 .. N i 1 j 1 a Somas de quadrados: SQBlocos b 1 b 2 y..2 y. j k j 1 N a SQTratamento s ( ajustado ) k Qi2 i 1 a 110 Onde Qi é o total ajustado do i-ésimo tratamento e é calculado por: 1 b Qi yi. nij y. j k j 1 i 1,2,...,a Com nij = 1 se o tratamento i aparece no bloco j e nij = 0 se o tratamento i não aparece no bloco j. A soma de quadrados do erro é calculada por diferença: SQE=SQT-SQTratamentos(ajustado)-SQBlocos A tabela a seguir resume a análise de variância deste delineamento. Variações no modelo Blocos Tratamentos (ajustado) Erro Total Análise de variância de um BIB Somas de Graus de Quadrados F0 quadrados liberdade médios SQBlocos b-1 SQBlocos b-1 SQTratamentos a-1 SQTratamentos QMTratamentos a-1 QMErro Por diferença N-a-b+1 SQErro N-a-b+1 SQT N-1 111 Teste de igualdade de médias de tratamentos: F0 QMTratamentos(ajustado) QME Exemplo 3-6: dados de aceitabilidade de um produto. É um BIB com a=4, b=4, k=3, r=3, =2, e N = (a x r) =(4 x 3)=12. (87) 2 SQT 631,56 0,8100 12 1 (87) 2 2 2 SQBlocos (22,1) ... (21,8) 0,5500 3 12 1 Q1 21,8 (22,1 22,4 21,8) 0.30 3 1 Q2 21,4 (22,4 20,7 21,8) 0,23 3 1 Q3 21,6 (22,1 22,4 20,7) 0,13 3 1 Q4 22,2 (22,1 20,7 21,8) 0,67 3 112 SQTratamento s ( ajustado ) 3 (0,30) 2 (0,23) 2 (0,13) 2 (0,67) 2 0,2275 (2)(4) SQE 0,8100 0,5500 0,2275 0,0325 Análise de variância dos dados de aceitabilidade Causas de Soma de Graus de Quadrados F0 Valor p variação quadrados liberdade médios Blocos 0,5500 3 0,1833 Tratamentos 0,2275 3 0,0758 11,67 0,0107 (ajustado para blocos) Erro 0,0325 5 0,0065 Total 0,8100 11 Interpretação: como o nível descritivo é baixo (< 5%) concluímos que as formulações utilizadas tem efeito significativo na aceitabilidade do produto. 113 Contrastes ortogonais: Os contrastes ortogonais devem ser calculados com relação aos totais de tratamentos ajustados (Qi). A soma dos quadrados do contraste é dado por: a k ci Qi SQc i 1 a a ci2 2 i 1 Onde ci são os coeficientes dos contrastes. 114 Comparações múltiplas dos efeitos dos tratamentos: Um efeito de tratamento ajustado é dado por: O erro padrão deste efeito é: S ˆi kQi /(a) k (QM E ) a Exemplo 3-6 ˆ 1 ( 3 )( 0 ,30 ) /( 2 )( 4 ) 0 ,90 / 8 0 ,1125 ˆ 2 ( 3 )( 0 ,23 ) /( 2 )( 4 ) 0 ,69 / 8 0 ,0875 ˆ 3 ( 3 )( 0 ,13 ) /( 2 )( 4 ) 0 ,40 / 8 0 ,0500 ˆ 4 ( 3 )( 0 ,67 ) /( 2 )( 4 ) 2 ,00 / 8 0 ,25 S 3.0 ,0065 0 ,04937 2.4 Não bate com o Statistica e o SAS. 115 Teste de Tukey q (a, f ) q0, 05 (4,5) 5,22 DMS q (a, f ) S q (a, f ) kQM E 3(0,0065) 5,22 0,2577 a 2(4) 4 vs 1 : 2 / 8 - ( 0,9 / 8 ) 0,3625 0 ,2577* 4 vs 2 : 2 / 8 - ( 0,69 / 8 ) 0,3338 0 ,2577* Conclusão: a formulação 4 difere significativamente das outras três, todos os outros pares de efeitos de tratamentos ajustados não diferem entre si. Os mesmos resultados são obtidos para as médias. 4 vs 3 : 2 / 8 - ( 0,4 / 8 ) 0,3000 0,2577* 3 vs 1 : - 0,4 / 8 - ( 0,9 / 8 ) 0,0625 0,2577 3 vs 2 : - 0,4 / 8 - ( 0,69 / 8 ) 0,0338 0,2577 2 vs 1 : - 0,69 / 8 - ( 0,9 / 8 ) 0 ,0288 0,2577 116 Médias de mínimos quadrados: são calculadas como, yi . y.. ˆi y1. 7,25 0,1125 7,1375 y2. 7,25 0,08625 7,1625 y3. 7,25 0,05 7,2000 y4. 7,25 0,25 7,5000 Pode-se aplicar um teste de comparações múltiplas com estas médias ajustadas (dá o mesmo resultado do que nos efeitos dos tratamentos). General Linear Models Procedure Least Squares Means Adjustment for multiple comparisons: Tukey-Kramer FORMULA 1 2 3 4 ACEITABI LSMEAN 7.13750000 7.16250000 7.20000000 7.50000000 Pr > |T| H0: LSMEAN(i)=LSMEAN(j) i/j 1 2 3 4 1 2 3 4 . 0.9825 0.8085 0.0130 0.9825 . 0.9462 0.0175 0.8085 0.9462 . 0.0281 0.0130 0.0175 0.0281 . 117 Blocos Incompletos Balanceados (Teste Não Paramétrico) Durbin (1951) apresentou um teste de postos que pode ser usado para testar a hipótese nula de não haver diferenças entre os tratamentos num delineamento de blocos incompletos balanceados. O teste de Durbin deve ser preferido aos testes paramétricos quando: • as pressuposições de normalidade não são atendidas; • deseja-se aplicar um método mais fácil; • as observações correspondem meramente de postos 118 Exemplo (Instituto de Tecnologia de Alimentos - ITAL, 1982): Foi realizado um experimento sensorial de ordenação para se avaliar o efeito de cultivares de soja na sabor de “paçoca” de soja. Os tratamentos testados foram: A = “paçoca” de soja cultivar Bragg; B = “paçoca” de soja cultivar Bossie; C = “paçoca” de soja cultivar Davis; D = “paçoca” de soja cultivar Doko; E = “paçoca” de soja cultivar IAC-2; F = “paçoca” de soja cultivar Paraná; G = “paçoca” de soja cultivar Santa Rosa; H = “paçoca” de soja cultivar Tropical; I = “paçoca” de soja cultivar UFV-1; J = “paçoca” de soja cultivar União; O experimento é um BIB com 30 provadores (blocos), cada um avaliando 3 tratamentos e ordenando em primeiro lugar a amostra de melhor sabor e em último a de pior sabor. Os resultados estão na próxima tabela. 119 Provadores 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 1 A=3 H=2 B=2 C=3 F=2 J=3 I=3 E=3 G=2 D=3 C=3 H=1 J=3 G=3 B=2 F=2 D=3 E=1 A=2 I=2 J=2 I=1 B=2 C=3 G=3 D=2 H=2 E=3 F=1 A=2 Ordem de avaliação 2 B=2 A=1 C=3 D=2 H=3 F=1 E=1 G=1 J=1 I=2 D=1 B=3 E=1 A=1 H=1 I=3 F=2 G=2 C=3 J=1 D=3 C=2 G=3 E=2 H=2 J=1 F=3 A=1 B=3 I=1 3 D=1 J=3 F=1 H=1 I=1 G=2 B=2 A=2 C=3 E=1 G=2 J=2 F=2 I=2 E=3 D=1 A=1 H=3 B=1 C=3 B=1 H=3 I=1 F=1 D=1 E=3 A=1 C=2 G=2 J=3 120 Neste experimento temos: a = 10 tratamentos k = 3 unidades experimentais por bloco b = 30 blocos r = 9 repetições = 2 blocos nos quais os tratamentos i e i’ aparecem juntos 121 O teste de Durbin Notação: Xij os resultados do tratamento j no bloco i se o tratamento j aparece no bloco i Ordene os Xij dentro de cada bloco assinalando o posto 1 à menor observação no bloco, posto 2 à segunda menor, e assim por diante, até o posto k, que é assinalado a maior de todas as observações no bloco i, já que existe apenas k observações dentro de cada bloco. Denotase por R(Xij) o posto de Xij onde Xij existe. Compute-se a soma dos postos assinalados aos r valores observados para o j-ésimo tratamento e chame esta soma de Rj. Então, Rj pode ser escrito como: b R j R( X ij ) i 1 Onde somente r valores de R(Xij) existem para cada tratamento j. 122 Observação: 1) Se as observações são não numéricas, por exemplo: ruim, médio, bom, muito bom, mas são passíveis de serem ordenadas dentro dos blocos de acordo com algum critério de interesse, o posto de cada observação é anotado e os valores de Rj são calculados como antes. 2) Se houver empates, recomenda-se assinalar o posto médio às observações empatadas. Pressuposições do teste de Durbin 1. Os blocos são mutuamente independentes um do outro; 2. Dentro de cada bloco as observações podem ser ordenadas em ordem crescente, de acordo com algum critério de interesse. Hipóteses: H0: Os tratamentos tem efeitos idênticos; H1: Pelo menos um tratamento tende a produzir valores maiores do que pelo menos um dos outros tratamentos. 123 O teste estatístico de Durbin é definido como: t 12( a 1 ) r( a 1 )( k 1 ) 2 T Rj 3 ra( k 1 )( k 1 ) j 1 k 1 Regra de decisão do teste: 2 Se T 0, 05 com a - 1 graus de liberdade rejeitar a H0 124 Exemplo: a = 10 tratamentos k = 3 unidades experimentais por bloco b = 30 blocos r = 9 repetições = 2 blocos nos quais os tratamentos i e i’ aparecem juntos RA=14 RB=16 RI=16 RJ=19 RC=25 RD=17 RE=18 RF=15 RG=20 RH=18 12( 10 1 ) 3.9( 10 1 )( 3 1 ) ( 142 16 2 252 172 182 152 202 182 16 2 192 ) 9.10( 3 1 )( 3 1 ) 3 1 T 0 ,15( 3324,00 ) 486,00 T T 498,60 486,00 T 12,6 125 Com a utilização de um programa estatístico, obtemos o valor de qui-quadrado (2), com 101=9 graus de liberdade e nível de significância de 5%, igual a 16,918978. Como a estatística de Durbin é menor do que o valor de qui-quadrado tabelado, devemos aceitar a hipótese nula e, assim, não foi observado diferenças significativas entre os tratamentos quanto ao sabor. P(2>12,6)=0,1816 (valor p) Comparações múltiplas O método que se segue pode ser usado para comparar pares de tratamentos se e somente se a hipótese nula for rejeitada. Considere dois tratamentos i e i’ diferentes se as suas somas de postos satisfazem a desigualdade: Ri' Ri t( 1 / 2 ) r( k 1)( k 1)[ bk( a 1) aT ] 6( a 1)( bk a b 1) Onde t(1-/2) é o quantil da distribuição t de Student com bk-a-b+1 graus de liberdade. Chamamos o lado direito da desigualdade de Diferença Mínima Significativa. 126 Continuação do exemplo: Neste exemplo, faremos os testes de comparação de pares de tratamentos, somente para fins didáticos, pois o teste de Durbin não foi significativo. Vamos, inicialmente, encontrar o valor da d.m.s. Ri' Ri t( 1 / 2 ) r ( k 1)( k 1)[ bk( a 1) aT ] 6( a 1)( bk a b 1) t( 1 0,05 / 2; 51 ) 2,007584 Ri' Ri 2,0076 9( 3 1)( 3 1)[ 30.3( 10 1) 10.12,6 ] 6( 10 1)( 30.3 10 30 1) Ri' Ri 2,0076 49248 2754 Ri' Ri 8,4896 127 Temos 10(9)/2=45 pares de tratamentos. Vamos ver somente as seguintes diferenças. R R 25 14 11 C A R R 25 15 10 C F R R 25 16 9 C I R R 25 17 8 C D O tratamento C apresenta diferenças significativas com relação aos tratamentos A, F e I, ao nível de significância de 5%. Ele não é diferente estatisticamente do tratamento D, ao nível de significância de 5%. 128