Universidade Estadual da Paraı́ba Centro de Ciências e Tecnologia Departamento de Estatı́stica Bruno Henrique Gomes dos Santos Aspectos teóricos e práticos com aplicação da análise estatı́stica de um experimento em blocos completos casualizados com repetições dentro dos blocos Campina Grande Dezembro de 2012. Bruno Henrique Gomes dos Santos Aspectos teóricos e práticos com aplicação da análise estatı́stica de um experimento em blocos completos casualizados com repetições dentro dos blocos Trabalho de Conclusão de Curso apresentado ao curso de Bacharelado em Estatı́stica do Departamento de Estatı́stica do Centro de Ciências e Tecnologia da Universidade Estadual da Paraı́ba em cumprimento as exigências legais para obtenção do tı́tulo de Bacharel em Estatı́stica. Orientador: João Gil de Luna Campina Grande Dezembro de 2012. FICHA CATALOGRÁFICA ELABORADA PELA BIBLIOTECA CENTRAL – UEPB S237a Santos, Bruno Henrique Gomes dos. Aspectos teóricos e práticos com aplicação da análise estatística de um experimento em blocos completos casualizados com repetições dentro dos blocos [manuscrito] / Bruno Henrique Gomes dos Santos. – 2012. 63f. : il. Trabalho de Conclusão de Curso (Graduação em Estatística) – Universidade Estadual da Paraíba, Centro de Ciências e Tecnologia, 2012. “Orientação: Prof. Dr. João Gil de Luna, Departamento de Estatística”. 1. Estatística Experimental. 2. Probabilidade. 3. Pesquisa Experimental. I. Título. 21. ed. CDD 519.2 Dedicatória Dedico este trabalho a minha esposa Cida, a meu querido filho Lucas e a minha entiada Mariana que me impulsionaram a buscar vida nova a cada dia, concedendo a mim a oportunidade de me realizar ainda mais. Dedico também a minha mãe Cristina, que em nenhum momento mediu esforços para realização dos meus sonhos, que me guiou pelos caminhos corretos, me ensinou a fazer as melhores escolhas, me mostrou que a honestidade e o respeito são essenciais à vida, e que devemos sempre lutar pelo que queremos. Obrigado! Agradecimentos Agradeço primeiramente a Deus por ter me dado forças para enfrentar os obstáculos que insistiam em aparecer no decorrer dessa caminhada, fazendo-me concluir um grande passo em minha vida. Agradeço a minha famı́lia por terem aceito se privar de minha companhia pelos estudos, compreendendo que buscava a todo tempo o melhor para todos. A UEPB por todos os recursos oferecidos durante o curso, conseguindo assim êxito em todas as pesquisas. Ao Prof. Gil pela imensa atenção e dedicação ao nosso trabalho, e o encorajamento nos momentos difı́ceis, como também a todo conhecimento passado por ele em diversos campos da estatı́stica. Ao Prof. Gustavo por todo aprendizado proporcionado por ele me fazendo ter sempre confiança em trabalhos realizados extra classe. A todos os meus colegas de classe que juntos transferiram conhecimentos para que fosse possı́vel a conclusão do nosso curso. Que essas amizades durem tanto quanto foram intensas. Resumo A pesquisa experimental é amplamente utilizada em diversas áreas do conhecimento, para tal é desenvolvido um método em que o pesquisador intervém na amostra, impondo deliberadamente os nı́veis de uma ou mais caracterı́sticas explanatórias com o propósito de encontrar inferências referentes aos efeitos causais dessas caracterı́sticas sobre caracterı́sticas respostas. Essas caracterı́sticas explanatórias são denominadas caracterı́sticas de tratamento e seus nı́veis, tratamentos. Exemplos comuns de tratamentos são diferentes estı́mulos apresentados ou impostos a animais ou plantas, tais como diferentes dietas administradas a animais ou diferentes fungicidas aplicados a plantas. As conclusões desses experimentos são obtidas utilizando-se da estatı́stica experimental, estatı́stica essa que usa os dados coletados para inferir resultados com o objetivo de aprimorar ou até mesmo, quando necessário, refazer o experimento. Neste trabalho aborda-se todo o desenvolvimento teórico dos procedimentos que dão suporte a uma análise estatı́stica dos dados de um experimento em blocos completos casualizados de efeitos fixos e com repetições dentro dos blocos. Será apresentado um possı́vel desenho desse tipo de experimento no campo, juntamente com a tabela para o recolhimento dos dados, defini-se o modelo matemático para descrever as observações experimentais, utiliza-se o método de mı́nimos quadrados para encontrar os estimadores dos termos do modelo, apresenta-se os resultados da decomposição da variabilidade total que são organizados na tabela da análise da variância (ANOVA), estuda-se as distribuições de probabilidade dos estimadores e por fim calcula-se os valores esperados das somas de quadrados. Por fim, um exmplo real será utilizado para ilustrar a metodologia, e os resultados serão discutidos e interpretados convenientemente. Palavras-chave: Estatı́stica Experimental, Soma de Quadrados, ANOVA. Abstract The experimental research is widely used in various areas of knowledge, such a method is developed in which the researcher intervenes in the sample, levels of deliberately imposing one or more characteristics explanatory in order to find causal inferences regarding the effects of these characteristics on response characteristics. These features are termed features explanatory treatment and its levels treatments. Examples of common treatments are different stimuli or imposed animals or plants, such as different diets administered to animals or applied to plant fungicides. The conclusions of these experiments are obtained using the experimental statistics, this statistic that uses the collected data to infer results in order to enhance or even, when necessary, redo the experiment. This paper addresses to the entire theoretical development of procedures that support a statistical analysis of an experiment in randomized complete block design with fixed effects and replicates within the blocks. We will present a possible design of this type of experiment in the field, along with the table for the collection of data, set up the mathematical model to describe the experimental observations, we use the method of least squares estimators to find the terms of the model presents the results of the decomposition of the total variance that are arranged in the table analysis of variance (ANOVA) is studied probability distributions of the estimators and finally calculates the expected values of the sums of squares. Finally, a real exmplo will be used to illustrate the methodology and results discussed and interpreted properly. Keywords: Experimental Statistics, Sum of Squares, ANOVA. Sumário 1 Inrodução p. 9 2 Fundamentação Teórica p. 12 2.1 Um possı́vel desenho do experimento no campo . . . . . . . . . . . . . p. 12 2.2 Organização dos dados experimentais . . . . . . . . . . . . . . . . . . . p. 13 2.3 O Modelo matemático . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 13 2.4 Estimação dos parâmetros, dos erros e das observações . . . . . . . . . p. 14 2.5 Decomposição da variabilidade total . . . . . . . . . . . . . . . . . . . . p. 17 2.6 Distribuição de probabilidade dos estimadores . . . . . . . . . . . . . . p. 21 2.6.1 Distribuição de probabilidade de ȳ... , o estimador de µ. . . . . . p. 22 2.6.2 Distribuição de probabilidade da correção para média, C. . . . . p. 23 2.6.3 Distribuição de probabilidade de ti , o estimador de τi . . . . . . . p. 23 2.6.4 Distribuição de probabilidade da SQT rat . . . . . . . . . . . . . . p. 25 2.6.5 Distribuição de probabilidade de bj , o estimador de βj . . . . . . p. 25 2.6.6 Distribuição de probabilidade da SQBlocos . . . . . . . . . . . . p. 27 2.6.7 Distribuições de probabilidade de mi , o estimador de µi = µ + τi , (a média do tratamento i) e de mj , o estimador de µj = µ + βj , (a média do bloco j). . . . . . . . . . . . . . . . . . . . . . . . . p. 27 2.6.8 Distribuições de probabilidade de contrastes de interesse . . . . p. 28 2.6.9 Distribuição de probabilidade da soma de quadrados da h-ésima combinação linear das médias dos tratamentos . . . . . . . . . . p. 30 2.6.10 Distribuição de probabilidade de ˆij , o estimador de ij . . . . . . p. 31 2.6.11 Distribuição de probabilidade da SQErro Entre . . . . . . . . . . . p. 36 2.6.12 Distribuição de probabilidade de ε̂ijr , o estimador de εijr . . . . . p. 36 2.7 Valores Esperados das Somas de Quadrados . . . . . . . . . . . . . . . p. 38 2.8 Comparações múltiplas das médias duas a duas . . . . . . . . . . . . . p. 47 2.9 Análises estatı́sticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 47 2.9.1 Hipóteses sobre tratamento . . . . . . . . . . . . . . . . . . . . p. 48 2.9.2 Hipóteses sobre Bloco . . . . . . . . . . . . . . . . . . . . . . . p. 50 2.9.3 A tabela da ANOVA . . . . . . . . . . . . . . . . . . . . . . . . p. 52 3 Aplicação da teoria a um exemplo real p. 53 3.1 Descrição do conjunto de dados experimentais . . . . . . . . . . . . . . p. 53 3.2 Cálculos das somas de quadrados e análise da variância . . . . . . . . . p. 54 3.3 Comprovação da idoneidade do modelo . . . . . . . . . . . . . . . . . . p. 57 4 Conclusão Final p. 60 Referências p. 62 9 1 Inrodução Tem-se registros que o método experimental remonta a pelo menos 4 séculos antes de Cristo, quando Aristóteles (384-322 a.C.) fez diversas descobertas referentes ao mundo natural, com base em experimentos, axiomas e argumentos filosóficos, ele concluiu, por exemplo, que a aceleração de um corpo em queda livre depende de sua massa, e que a terra devia ser uma esfera, já que a esfera é o sólido mais ”perfeito”. Porém foi no inı́cio do século XX com Ronald Aylmer Fisher (1890-1962), um jovem matemático do Colégio Caius de Cambridge, que iniciou-se o desenvolvimento do ramo da estatı́stica relacionado com o planejamento e a análise de experimentos. Fisher lançou os fundamentos modernos da pesquisa experimental, as bases da inferência estatı́stica e delineou muitos métodos originais para os vários problemas encontrados na Estação Experimental de Rothamsted, onde realizava seus trabalhos e em outras instituições de pesquisa. Introduziu diversas técnicas de análise de dados, como a análise da variação, que passou a ser amplamente utilizada na análise estatı́stica de dados de experimentos, e a técnica de polinômios ortogonais para o uso de caracterı́sticas ambientais. A metodologia moderna da pesquisa experimental, desenvolvida a partir dos fundamentos e idéias lançados por Fisher para a pesquisa agrı́cola, teve muitos contribuintes em diversos paı́ses e passou a aplicar-se aos demais ramos da ciência e da tecnologia, tais como biologia, medicina, engenharia, indústria e ciências sociais. Como conseqüência da origem da pesquisa experimental na agricultura, muito da terminologia ainda hoje utilizada compreende termos próprios da pesquisa agrı́cola. Assim, por exemplo, as designações ”tratamento”, ”parcela”e ”bloco”perderam suas conotações particulares da agricultura e são amplamente usadas na pesquisa experimental em muitas áreas da ciência (SILVA, 2007). O delineamento em blocos ao acaso trata-se de um método para eliminar a heterogeneidade das unidades experimentais, e é o projeto mais fundamental em todos os tipos de experimentação. Historicamente, esse delineamento foi o primeiro projeto a estimar o erro 10 experimental e a testar a significância dos efeitos dos tratamentos, apesar da heterogeneidade das unidades experimentais em que as observacões são adquiridas (LOVE, 1964). Os delineamentos experimentais são planejados de forma que a variação ao acaso seja reduzida o máximo possı́vel. Os principais delineamentos são: Inteiramente Casualizado, Blocos Completos Casualizados e Quadrados Latinos. Neste trabalho será abordado a teoria do Delineamento em Blocos Completos Casualizados com repetições dentro dos Blocos. O modelo matemático referente ao delineamento aqui estudado, propõe que os fatores sejam com interação e de efeito fixo. Para obtenção dos estimadores dos efeitos envolvidos no modelo, utilizou-se o metodo da Mı́nimos Quadrados, esse método será escolhido porque é mais simples, e oferece os mesmos estimadores do de Máxima Verossimilhança. Objetivos Tem-se como principal objetivo desenvolver a teoria desse tipo de delineamento e tentar elucidar problemas eventualmente existentes nos experimentos com repetições dentro dos blocos, pois, essas teorias estatı́sticas que dão suporte as análises de dados de pesquisas experimentais são dificilmente encontradas na literatura, com isso a pouca aplicabilidade em pesquisas com um número razoavelmente grande de tratamentos, com tudo, o planejamento de experimento é de fundamental importância para a obteção de resultados mais confiáveis além de proporcionar a diminuição da variabilidade e encontrar valores mais próximos dos esperados. Para isso será utiliado um modelo matemático com o objetivo de representar e descrever o problema aqui colocado, de um experimento em blocos com repetições dentro dos blocos, estimando-se os termos do modelo com o uso do método de mı́nimos quadrados, que procura encontrar o melhor ajuste para um conjunto de dados tentando-se minimizar a soma dos quadrados das diferenças entre o valor estimado e os dados observados, com os resultado encontrados iremos decompor a variabilidade total e por fim encontramemos as somas de quadrados, dispostas na tabela da Análise de Variância (ANOVA). Com base em análises estatı́sticas, será mostrado que os estimadores do modelo matemático seguem todos uma distribuições de probabilidade normal e que as somas de quadrados seguem todas uma distribuição de probabilidade qui-quadrada, com esses definições expostas pode-se definir os valores esperados das somas de quadrado que irá ajudar 11 a definir as estatı́sticas de teste utilizadas na contrastação das hipóteses de interesse para tratamentos e para blocos, mostrando-se que o interesse maior em um experimento como esse é fazer inferências no efeito dos tratamentos, pois, será visto que os blocos por serem ambientes homogênios não teram efeito sobre os tratamentos apresentados. Será apresentado algumas estatı́sticas de teste que podem ser utilizadas para se fazer inferências marginais para alguns estimadores de tratamentos e de blocos. 12 2 Fundamentação Teórica O foco principal deste trabalho é apresentar de modo claro o desenvolvimento da teoria que dar suporte as análises estatı́sticas de um experimento em blocos completos casualizados com repetições dentro dos blocos. Neste sentido, faz-se necessário apresentar um desenho no espaço desse tipo de experimento, bem como, sugerir a construção de uma tabela para recolhimento das observações. 2.1 Um possı́vel desenho do experimento no campo Para ilustrar a localização espacial das unidades experinetais levou-se em conta um experimento com I = 3 tratamentos, J = 4 blocos e R = 2 repetições dos tratamentos dentro de cada bloco. Com estas caracterı́sticas o experimento poderá ter o seguinte desenho no campo: Bloco I Bloco II T2 T1 T3 T1 T3 T2 T1 T3 T2 T2 T1 T3 T3 T1 T2 T3 T1 T2 T2 T3 T1 T1 T2 T3 Bloco III Bloco IV 13 2.2 Organização dos dados experimentais A organização dos dados coletados no campo em tabelas apropriadas, facilitará o tratamento estatı́stico posteriormente. Neste sentido, a tabela a seguir é uma sugestão para esta finalidade. Tabela 1: Tabela para recolhimento dos dados no campo. Tratamento 1 Repetição 1 2 .. . R 1 2 .. . 2 R y111 y112 .. . Bloco 2 ··· y121 · · · y122 · · · .. . y11R y11. y211 y212 .. . y21R y12. y221 y222 .. . y22R y22. .. . .. . 1 .. . .. . .. . .. . y21R y21. .. . .. . I 1 2 .. . yI11 yI12 .. . yI21 yI22 .. . R yI1R yI1. y.1. yI2R yI2. y.2. Soma J y1J1 y1J2 .. . Soma y1.1 y1.2 .. . ··· ··· ··· ··· y1JR y1J. y2J1 y2J2 .. . y1.R y1.. y2.1 y2.2 .. . ··· ··· y2JR y2J. .. . .. . y2.R y2.. .. . .. . yIJ1 yIJ2 .. . yI.1 yI.2 .. . yIJR yIJ. y.J. yI.R yI.. y... ··· ··· ··· ··· ··· ··· ··· Em que, yijr é a observação obtida da r-ésima unidade experimental que recebeu o trataR J P P mento I no bloco J, yi.. = yijr é o total das JR observações que receberam o i-ésimo j=1 r=1 tratamento, y.j. = R I P P yijr é a soma das IR observações do j-ésimo bloco, yij. = i=1 r=1 R P r=1 yijr é a soma das R observações oriundas das unidades experimentais que receberam o trataR J P I P P yijr é a soma de todas as observações. mento I no bloco J e y... = i=1 j=1 r=1 2.3 O Modelo matemático 14 O modelo matemático adequado para descrever as observações de um experimento em blocos ao acaso com repetições dentro dos blocos é, conforme Barbin (1993), como segue: yijr = µ + τi + βj + ij + εijr , no qual: i = 1, 2, ..., I, j = 1, 2, ..., J, r = 1, 2, ..., R, (2.1) yijr é a observação obtida da r-ésima unidade experimental do bloco j que recebeu o i-ésimo tratamento; µ é a média geral; τi é o efeito do tratamento i sobre a variável resposta, considerado fixo; βj é o efeito do bloco j sobre a variável resposta, também considerado fixo; ij e εijr são respectivamente, erros atribuı́dos as unidades experimentais, entre e dentro dos blocos, ambos aleatóros, independentes e identicamente distribuı́dos como uma normal de médias zero e variâncias σ2 e σ 2 , respectivamente os quais serão denotados por: iid iid ij ∼ N (0; σ2 ) e εijr ∼ N (0; σ 2 ). Decorre das suposições acerca dos termos no modelo (2.1) que: E(µ) = µ; E(µ2 ) = µ2 ; E(τi ) = τi ; E(βj2 ) = βj2 ; E(ij ) = 0; E(ij εks ) E(τi2 ) = τi2 ; E(βj ) = βj ; E(2ij ) = σ2 ; E(εijr ) = 0; E(ε2ijr ) = σ 2 ; = E(ij )E(εks ) = 0, ∀ i 6= k ou j 6= s; E(εijr εksv ) = E(εijr )E(εksv ) = 0, ∀ i 6= k, j 6= s ou r 6= v; E(ij εijr ) 2.4 = E(ij )E(εijr ) = 0, ∀ i, j, r. Estimação dos parâmetros, dos erros e das observações O conjunto de dados observados num experimento em blocos ao acaso com repetições dentro dos blocos, podem ser escrito da seguinte forma: 15 {y111 , · · · , y11R , y121 , · · · , y12R , · · · , · · · , yIJ1 , · · · , yIJR } e podem ser representadas pelo modelo: i = 1, 2, · · · , I yijr = m + ti + bj + eij + uijr j = 1, 2, · · · , J r = 1, 2, · · · , R em que, (2.2) m é o estimador de µ, a média geral; ti é o estimador de τi , o efeito do tratamento i sobre a variável resposta; bj é o estimador de βj , o efeito do bloco j sobre a variável resposta; eij é o estimador de ij , o erro entre blocos; uijr é o estimador de εijr , o erro dentro dos blocos. Como foi dito no inı́cio, o método utilizado para encontrar os estimadores dos termos no modelo (2.2), foi o de mı́nimos quadrados, que consiste de encontrar os estimadores, de modo que torne mı́nima a soma dos quadrados dos erros dentro dos blocos. Do modelo (2.2), tem-se que, uijr = yijr − m − ti − bj − eij =⇒ u2ijr = (yijr − m − ti − bj − eij )2 Somando-se para todas as observações, vem Z= X ijr u2ijr = X (yijr − m − ti − bj − eij )2 ijr Derivando-se parcialmente a função Z em relação a cada estimador, igualando-se a zero e explicitando cada um deles, vem: X ∂Z = 2 (yijr − m − ti − bj )(−1) = 0 ∂m ijr X X = y... − IJRm − JR ti − IR bj = 0 i ∴ IJRm + JR X i ti + IR j X j bj = y... (2.3) 16 ∂Z ∂ti = 2 X (yijr − m − ti − bj − eij )(−1) = 0 jr = yi.. − JRm − JRti − R X bj − R j ∴ JRm + JRti + R X = 2 X eij = 0 j bj + R j ∂Z ∂bj X X eij = yi.. (2.4) j (yijr − m − ti − bj − eij )(−1) = 0 ir = y.j. − IRm − R X ti − IRbj − R i ∴ IRm + R X = 2 X eij = 0 j ti + IRbj + R i ∂Z ∂eij X X eij = y.j. (2.5) j (yijr − m − ti − bj − eij )(−1) = 0 r = yij. − Rm − Rti − Rbj − Reij = 0 ∴ Rm + Rti + Rbj + Reij = yij. (2.6) O sistema formado pelas Equações de (2.3) a (2.6) é conhecido na literatura por sistema de equações normais. Isto é, X X IJRm + JR t + IR bj = y... i i X Xj + R bj + R eij = yi.. JRm + JRti IRm Rm + R X j ti + IRbj + R i + Rti j X (2.7) eij = y.j. j + Rbj + Reij = yij. O sistema de equações em (2.7) é inconsistente, e para resolve-lo é preciso impor as seguintes restrições: X i ti = X j bj = X i eij = X j eij = X ij eij = 0. 17 Assim sendo, o sistema (2.7), fica: IJRm JRm + JRt i IRm + IRbj Rm + Rti + Rbj + Reij = y... = yi.. = y.j. (2.8) = yij. Resolvendo o sistema (2.8) obtém-se os estimadores de mı́nimos quadrados: m = ȳ... ; ti = ȳi.. − ȳ... ; bj = ȳ.j. − ȳ... ; eij = ȳij. − ȳi.. − ȳ.j. + ȳ... (2.9) Além disso, tem-se que ŷijr = m + ti + bj + eij = ȳ... + ȳi.. − ȳ... + ȳ.j. − ȳ... + ȳij. − ȳi.. − ȳ.j. + ȳ... = ȳij. daı́, tem-se que ȳij. é um estimador de mı́nimos quadrados de yijr . Fazendo-se as devidas substituições na Equação (2.2), obtém-se o estimador do erro dentro dos blocos, isto é, uijr = yijr − ŷijr = (yijr − ȳ... ) − (ȳi.. − ȳ... ) − (ȳ.j. − ȳ... ) − (ȳij. − ȳi.. − ȳ.j. + ȳ... ). (2.10) Um resumo dos resultados obtidos nesta seção é apresentado na Tabela 2 a seguir. Tabela 2: Estimadores das caracterı́sticas envolvidas no modelo matemático. Caracterı́sticas µ τi βj ij εijr yijr 2.5 Estimador µ̂ = m = ȳ... τ̂i = ti = ȳi.. − ȳ... β̂j = bj = ȳ.j. − ȳ... ˆij = eij = ȳij. − ȳi.. − ȳ.j. + ȳ... ε̂ijr = uijr = yijr − ȳij. ŷijr = ȳij. Decomposição da variabilidade total 18 Elevando-se ao quadrado os dois lados da Equação (2.10) e somando-se para todas as observações, vem: X u2ijr = ijr X [(yijr − ȳ... ) − (ȳi.. − ȳ... ) − (ȳ.j. − ȳ... ) − (ȳij. − ȳi.. − ȳ.j. + ȳ... )]2 ijr = X (yijr − ȳ... )2 + JR ijr | {z (1) +R X (ȳi.. − ȳ... )2 + IR i | } X {z (2) (ȳij . − ȳi.. − ȳ.j. + ȳ... )2 − 2 −2 } (yijr − ȳ... )(ȳ.j. − ȳ... ) − 2 ijr | | {z } X | (yijr − ȳ... )(ȳi.. − ȳ... ) {z } (yijr − ȳ... )(ȳij. − ȳi.. − ȳ.j. + ȳ... ) X {z } (7) (ȳi.. − ȳ... )(ȳ.j. − ȳ... ) + 2R X (ȳi.. − ȳ... )(ȳij. − ȳi.. − ȳ.j . + ȳ... ) ij {z } (8) + 2R } (5) X ij | {z (3) ijr (6) + 2R X | ijr {z (4) X (ȳ.j. − ȳ... )2 j } ij | X | {z (9) (ȳ.j. − ȳ... )(ȳij. − ȳi.. − ȳ.j. + ȳ... ) } (2.11) ij | {z } (10) Desenvolvedo-se algebricamente os termos de (1) a (10) da expressão (2.11), obtém-se os seguintes resultados: (1) = X (yijr − ȳ... )2 = ijr (2) = JR X 2 yijr − C, em que C = ijr | {z SQT otal 2 y... ; IJR } X 1 X 2 (ȳi.. − ȳ... )2 = y − C; JR i i.. i | {z } SQT ratamento (3) = IR X (ȳ.j. − ȳ... )2 = j 1 X 2 y − C; IR j .j. {z } | SQBlocos (4) = R X (ȳij. − ȳi.. − ȳ.j. + ȳ... )2 ij 1 X 1 X 2 2 = −C − y −C − y −C ; R ij JR i i.. IR j .j. {z } | {z } {z } | | SQT ratamento SQP arcelas SQBlocos {z } | 1 X 2 yij. SQErro Entre 19 (5) = X (yijr − ȳ... )(ȳi.. − ȳ... ) = ijr 1 X 2 y − C; JR i i.. | {z } SQT ratamento (6) = 1 X 2 y.j. − C ; (yijr − ȳ... )(ȳ.j. − ȳ... ) = IR j ijr {z } | X SQBlocos (7) = X (yijr − ȳ... )(ȳij. − ȳi.. − ȳ.j. + ȳ... ) ijr = 1 X R | (8) = R ij SQT ratamento SQP arcelas X ij = R 1 X 1 X 2 2 2 yij. −C − yi.. −C − y.j. −C ; JR i IR j | {z } {z } {z } | i X yi.. i SQBlocos X X (ȳi.. − ȳ... )(ȳ.j. − ȳ... ) = R (ȳi.. − ȳ... ) (ȳ.j. − ȳ... ) JR − ȳ... X y j .j. IR − y... j y y... y... y... ... − IR − RJ R = R IR IJR y JR y IJR y... y... ... ... = − − =0 J J I I X (9) = R (ȳi.. − ȳ... )(ȳij. − ȳi.. − ȳ.j. + ȳ... ) ij y... X yij. yi.. y.j. y... − − − + = R JR IJR j R JR IR IJR i X yi.. y... yi.. yi.. y... y... = − −J − +J =0 J IJ R JR IR IJR i X (10) = R (ȳ.j. − ȳ... )(ȳij. − ȳi.. − ȳ.j. + ȳ... ) X yi.. ij y... X yij. yi.. y.j. y... − − + IR IJR i R JR IR IJR j X y.j. y... y.j. y... y.j. y... − − −I +I =0 = I IJ R JR IR IJR j = R X y.j. − Substituindo-se estes resultados em (2.11), vem ! ! ! X X 1 X 2 1 X 2 2 2 yijr − C + uijr = y −C + y −C JR i i.. IR j .j. ijr ijr ! ! !# " 1 X 2 1 X 2 1X 2 y −C − y −C − y −C − R ij ij. JR i i.. IR j .j. ! ! 1 X 2 1 X 2 y −C −2 y −C −2 JR i i.. IR j .j. 20 −2 X u2ijr ijr " 1X 2 y −C R ij ij. ! − 1 X 2 y −C JR i i.. ! 1 X 2 y −C IR j .j. − !# +2 × 0 + 2 × ! 0+2×0 ! ! X X X 1 1 2 2 2 yijr −C − yi.. −C − y.j. −C = JR IR ijr i j " ! ! !# 1X 2 1 X 2 1 X 2 − y −C − y −C − y −C R ij ij. JR i i.. IR j .j. ou, X 2 yijr −C ijr | {z SQT otal = } 1 X 1 X 2 2 y −C + y −C + JR i i.. IR j .j. ijr | {z } | {z } | {z } X u2ijr SQT ratamento SQErro Dentro SQBlocos 1 X 1 X 2 2 2 yij. −C − yi.. −C − y.j. −C + R ij JR i IR j | {z } {z } {z } | | SQT ratamento SQP arcelas SQBlocos {z } | 1 X SQErro Entre Portanto, a soma dos quadrados total é decomposta em quatro partes, a saber, SQT otal = SQBlocos + SQT ratamentos + SQErro Entre + SQErro Dentro . Na prática, a SQErro Dentro é calculada da seguinte maneira: X u2ijr = ijr | {z } SQErro Dentro X ijr | ! X 1 2 y2 − C . yijr −C − R ij ij. {z } | {z } SQT otal ! (2.12) SQP arcelas Os resultados da decomposição da variabilidade total é organizada na Tabela 3, a qual é conhecida na literatura por Tabela da Análise da Variância - ANOVA. 21 Tabela 3: Tabela da Análise da Variância - ANOVA F.V. Tratamento G.L. I −1 Blocos J −1 S.Q. P 2 yi.. − C i P 1 2 y.j. −C IR Q.M. QMT rat 1 JR F QMBlocos j Erro Entre Parcelas (I − 1)(J − 1) (IJ − 1) Erro Dentro Total IJ(R − 1) IJR − 1 SQP arc − SQ P T2rat − SQBlocos 1 yij. − C R QMErro Entre - ij SQT otal − SQP arc P 2 yijr − C QMErro Entre - ijr em que, os resultados da coluna 4, da Tabela 3, referentes aos Quadrados Médios (Q.M.), são obtidos por meio da divisão dos elementos da coluna 3, (S.Q.) pelos respectivos elementos da coluna 2, (G.L.). Os elementos da coluna 5, (F), serão discutidos e apresentados posteriormente. 2.6 Distribuição de probabilidade dos estimadores Nesta seção será estudada as distribuições de probabilidade dos estimadores, bem como algumas propriedades destes. Os elementos a seguir ajudarão nas demonstrações das caracerı́sticas associadas às distribuições de probabilidade dos estimadores a serem desenvolvidas. yijr = µ + τi + βj + ij + εijr e que, E(ij ) = 0, E(εijr ) = 0, iid E(2ij ) = σ2 =⇒ ij ∼ N (0; σ2 ), iid E(ε2ijr ) = σ 2 =⇒ εijr ∼ N (0; σ 2 ), consequentemente, tem-se: E(yijr ) = µ + τi + βj , V ar(yijr ) = σ2 + σ 2 e segue que yijr ∼ N µ + τi + βj ; σ2 + σ 2 . 22 2.6.1 Distribuição de probabilidade de ȳ... , o estimador de µ. 1 X 1 (y111 + y112 + ... + yIJR ), que é uma combinação linear dos yijr , yijr = IJR ijr IJR os quais seguem distribuição normal. Como sabe-se que combinação linear de variáveis ȳ... = normais é também normal, então ȳ... segue uma distribuição normal; Mas, sendo ȳ... = 1 X 1 X yijr = (µ + τi + βj + ij + εijr ) IJR ijr IJR ijr 1 = IJR = µ+ IJRµ + JR X τi + IR i X βj + R j 1 X 1 X ij + εijr , IJ ij IJR ijr X ij ij + X ijr εijr ! as caracterı́sticas da distribuição de ȳ... serão determinadas como segue: ! X 1 X 1 X 1 yijr = E E (yijr ) = (µ + τi + βj ) E(ȳ... ) = IJR IJR ijr IJR ijr ijr ! X X 1 = IJRµ + JR τi + IR βj , IJR i j mas por definição µ é a média geral e, portanto, cumpre-se que X i τi = X βj = 0, j logo, E(ȳ... ) = µ. Além disso, V ar(ȳ... ) = E[ȳ... − E(ȳ... )]2 = E[ȳ... − µ]2 #2 " 1 X 1 X ij + εijr − µ = E µ+ IJ ij IJR ijr #2 " 1 X 1 X = E ij + εijr IJ ij IJR ijr 2 1 1 (11 + ... + IJ ) + (ε111 + ... + εIJR ) = E IJ IJR (2.13) 23 h 1 (2 + ... + 2IJ + dp) I 2 J 2 11 i 1 + 2 2 2 (ε2111 + ... + ε2IJR + dp) + dp I J R 1 1 = 2 2 (σ2 + ... + σ2 + 0) + 2 2 2 (σ 2 + ... + σ 2 + 0) + 0 I J I J R 1 σ2 1 σ2 2 2 = 2 2 IJσ + 2 2 2 IJRσ = + I J I J R IJ IJR = E e segue que 1 2 σ + Rσ2 . IJR (2.14) 1 2 2 µ; (σ + Rσ ) . IJR (2.15) V ar(ȳ... ) = Portanto, ȳ... ∼ N Obs.: dp = duplos produtos da equação. 2.6.2 Distribuição de probabilidade da correção para média, C. A distribuição de probabilidade de C é obtida do seguinte modo: Sendo, ȳ... ∼ N 1 (σ 2 + Rσ2 ) µ; IJR =⇒ r ȳ... − µ σ 2 + Rσ2 IJR ∼ N (0; 1). Assim, sob H0 : µ = 0 ȳ − 0 q... ∼ N (0; 1) =⇒ σ 2 +Rσ2 IJR Isto é, a estatı́stica C σ 2 +Rσ2 2 ȳ... σ 2 +Rσ2 IJR segue uma distribuição de qui-quadrado com 1 grau de liberdade e será denotado por: σ2 em que C = 2.6.3 2 y... IJR y... y... IJR = ∼ χ2(1) . = 2 IJR IJR 2 2 2 σ + Rσ σ + Rσ C ∼ χ2(1) , + Rσ2 (2.16) 2 y... . IJR Distribuição de probabilidade de ti , o estimador de τi . Para se obter a distribuição de probabilidade do estimador do efeito do i-ésimo tra- 24 tamento pode ser usado o seguinte procedimento: 1 X 1 X yijr − yijr , que é uma combinação linear dos yijr JR jr IJR ijr que segue uma distribuição normal e, portanto, ti é normal. ti = ȳi.. − ȳ... = Além disso, ti 0 X X X 1 = βj + R ij + εijr JRµ + JRτi + R JR j j ijr 0 X 0 X X X 1 − IJRµ + JR βj + R ij + εijr τ i + IR IJR j ij ijr i ! ! 1X 1 X 1 X 1 X = µ + τi + ij + εijr − µ + ij + εijr J j JR jr IJ ij IJR ijr 1 X 1 X 1 X 1X ij + εijr − ij − εijr . = τi + J j JR jr IJ ij IJR ijr Portanto, E(ti ) = τi . (2.17) Além disso, tem-se que V ar(ti ) = E[ti − E(ti )]2 h i2 1X 1 X 1 X 1 X = E τi + ij + εijr − ij − εijr − τi J j JR jr IJ ij IJR ijr i2 h1 X 1 X 1 X 1 X ij + εijr − ij − εijr = E J j JR jr IJ ij IJR ijr h 1 X 2 2 1 X 1 X 2 = E 2 ij + 2 2 εijr + 2 2 ij J J R jr I J j ij 2 2 X X 2 X X 1 X εijr + 2 ij ij ij εijr − 2 + 2 2 2 I J R ijr J R j IJ j ij jr X 2 X 2 X X ij εijr εijr − 2 ij − 2 IJ R j IJ R jr ijr ij X i 2 X 2 X X − 2 2 εijr εijr + 2 2 ij εijr IJ R I J R ij ij ijr ijr σ2 σ2 σ2 σ2 σ2 σ2 σ2 σ2 σ2 σ2 + + + −2 −2 = + − − J JR IJ IJR IJ IJR J JR IJ IJR i 1 h 1 2 2 2 2 2 2 (IRσ − Rσ + Iσ − σ ) = = R(I − 1)σ + (I − 1)σ IJR IJR (I − 1) 2 (σ + Rσ2 ). = IJR = 25 Portanto, V ar(ti ) = Assim sendo, conclui-se que (I − 1) 2 σ + Rσ2 . IJR (2.18) (I − 1) 2 t i ∼ N τi ; σ + Rσ2 . IJR Ou seja, ti , tem distribuição normal com média τi e variância (2.19) (I−1) IJR (σ 2 + Rσ2 ), para todo i = 1, 2, · · · , I. 2.6.4 Distribuição de probabilidade da SQT rat . A partir dos resultados da subseção anterior resumida na expressão (2.19) deduz-se que, Z=q ȳi .. − ȳ... − τi =q ∼ N (0; 1) (I−1) (I−1) 2 + Rσ 2 ) 2 + Rσ 2 ) (σ (σ IJR IJR t i − τi e sob a hipótese de que os tratamentos não têm efeitos sobre a variável resposta, Y , isto é, sob H0 : τ1 = τ2 = ... = τI = 0, então, ȳi .. − ȳ... e q (I−1) (σ 2 IJR ∼ N (0; 1) =⇒ + Rσ2 ) (ȳi .. − ȳ...)2 (I−1) (σ 2 IJR + Rσ2 ) ∼ χ2(1) (I − 1) 2 JR(ȳi .. − ȳ...)2 JR(ȳi .. − ȳ...)2 ∼ ∼ χ2(1) ⇒ χ(1) ⇒ (I − 1) 2 σ 2 + Rσ2 I 2 (σ + Rσ ) I P JR i (ȳi .. − ȳ...)2 ∼ (I − 1)χ2(1) . σ 2 + Rσ2 Portanto, JR P i (ȳi .. − ȳ...) 2 σ + Rσ2 2 = SQT rat ∼ χ2(I−1) . σ 2 + Rσ2 (2.20) Em palavras, a soma de quadrados devida aos tratamentos dividida por σ 2 + Rσ2 é distribuı́da como uma qui-quadrado com (I − 1) graus de liberdade. 2.6.5 Distribuição de probabilidade de bj , o estimador de βj . 26 Para se obter a distribuição de probabilidade do estimador do efeito do j-ésimo bloco pode ser usado o seguinte procedimento: 1 X 1 X yijr − yijr , é uma combinaçãao linear dos yijr os IR ir IJR ijr quais seguem uma distribuição normal portanto, bj também é normal; bj = ȳ.j. − ȳ... = Além disso, 0 X X X 1 IRµ + R τ ij + εijr = i + IRβj + R IR i i ijr 0 0 X X X X 1 − IJRµ + JR βj + R ij + εijr τi + IR IJR j ij ijr i bj 1X 1 X 1 X 1 X ij + εijr − µ − ij − εijr I i IR ir IJ ij IJR ijr 1 X 1 X 1 X 1X ij + εijr − ij − εijr = βj + I i IR ir IJ ij IJR ijr = µ + βj + Portanto E(bj ) = βj . (2.21) Além disso, tem-se que V ar(bj ) = E[bj − E(bj )]2 #2 " 1 X 1 X 1 X 1X ij + εijr − ij − εijr − βj = E βj + I i IR ir IJ ij IJR ijr !2 !2 !2 X X 1 X 1 1 = E 2 ij + 2 2 εijr + 2 2 ij I I R I J i ir ij ! ! !2 X X X 1 2 + 2 2 2 ij − dp ij εijr + dp − 2 I J R I J ij i ijr ! ! X X 2 −dp + 2 2 εijr + dp εijr I JR ijr ir σ2 σ2 σ2 σ2 σ2 σ2 + + + −2 −2 I IR IJ IJR IJ IJR σ2 σ2 σ2 σ2 = + − − I IR IJ IJR 1 1 (JRσ2 + Jσ 2 − Rσ2 − σ 2 ) = (R(J − 1)σ2 + (J − 1)σ 2 ) = IJR IJR = 27 Portanto V ar(bj ) = Com isso, obtém-se bj ∼ N J −1 2 (σ + Rσ2 ). IJR J −1 2 2 βj ; (σ + Rσ ) . IJR (2.22) (2.23) Ou seja, o estimador bj do efeito do bloco j segue uma distribuição normal com média βj e variância 2.6.6 J−1 (σ 2 IJR + Rσ2 ). Distribuição de probabilidade da SQBlocos Como já se sabe, bj ∼ N J −1 2 2 βj ; (σ + Rσ ) . Portanto, é possı́vel deduzir que IJR ȳ.j. − ȳ... − βj bj − E(bj ) p =r ∼ N (0; 1). V ar(bj ) J −1 2 2 (σ + Rσ ) IJR Assim, sob H0 : β1 = β2 = ... = βj = 0, ȳ.j. − ȳ... r ∼ N (0; 1) =⇒ J −1 2 (σ + Rσ2 ) IJR IR(ȳ.j. − ȳ... )2 (J − 1) 2 ∼ χ(1) 2 2 σ + Rσ J Portanto, IR X (ȳ.j. − ȳ... )2 ∼ χ2(1) ⇒ J −1 2 2 (σ + Rσ ) IJR (ȳ.j. − ȳ... )2 j σ 2 + Rσ2 = SQBlocos ∼ χ2(J−1) σ 2 + Rσ2 (2.24) ou seja, a soma de quadrados de blocos dividida por (σ 2 + Rσ2 ) segue uma distribuição de qui-quadrado com (J − 1) graus de liberdade. 2.6.7 Distribuições de probabilidade de mi , o estimador de µi = µ + τi , (a média do tratamento i) e de mj , o estimador de µj = µ + βj , (a média do bloco j). Sabe-se que mi , o estimador da média do i-ésimo tratamento, µi = µ + τi , é definido por mi = m + ti = ȳ... + ȳi.. − ȳ... = ȳi.. = 1 X yijr JR j,r 28 que é uma combinação linear dos yijk ’s os quais seguem uma distribuição normal e, portanto, mi também é normal. Continuando-se o desenvolvimento algébrico de mi , vem 0 X X X X 1 1 mi = βj + R ij + εijr JRµ + JRτi + R yijr = JR j,r JR j j j,r = µi + 1X 1 X ij + εijr . J j JR j,r (2.25) O valor esperado de mi é então E(mi ) = E 1X 1 X µi + ij + εijr J j JR j,r ! = µi (2.26) Por outro lado, a variância de mi pode ser obtida como, #2 " X X 1 1 ij + εijr − µi V ar(mi ) = E[mi − E(mi )]2 = E µi + J j JR j,r 1 1 2 2 2 2 = E 2 (i1 + · · · + 1J + dp) + 2 2 (εi11 + · · · + εiJR + dp) + odp J J R J 2 JR 1 = σ + 2 2 σ 2 = (σ 2 + Rσ2 ). (2.27) 2 J J R JR Assim sendo, conclui-se que iid mi ∼ N 1 2 2 (σ + Rσ ) , i = 1, 2, · · · , I. µi , JR (2.28) Daı́, conclui-se que o estimador da média do i-ésimo tratamento segue uma disribuição normal de média µi e variância 1 (σ 2 IR + Rσ2 ). Por procedimento análogo, obtém-se a distribuição de probabilidade de mj , ou seja, 1 2 iid 2 (σ + Rσ ) , j = 1, 2, · · · , J. (2.29) m j ∼ N µj , IR E, conclui-se que o estimador da média do j-ésimo bloco segue uma disribuição normal com média µj e variância 2.6.8 1 (σ 2 IR + Rσ2 ). Distribuições de probabilidade de contrastes de interesse Dois resultados de grande interesse neste trabalho diz respeito as distribuições de probabilidade dos estimadores de combinações lineares das médias dos tratamentos ou dos 29 blocos, Ψ̂h = I P chi mi ou Ψ̂h = J P chj mj , respectivamente, em que j=1 i=1 P i chi = P j chj = 0. Aqui, serão apresentadas as demonstrações relativas as combinações lineares de médias dos tratamentos e intuitivamente serão apresentados os resultados para uma combinação linear de médias dos blocos. Considere o estimador de uma combinação linear das médias dos tratamentos Ψ̂h = I X chi mi = i=1 I X chi ȳi.. = i=1 X chi i 1 X yijr JR j,r que é uma combinação linear de variáveis normais e, portanto, Ψ̂h também segue uma distribuição normal. Continuando-se o desenvolvimento algébrico, vem Ψ̂h = I X chi i=1 = I X i=1 = I X i=1 1 X yijr JR j,r 0 7 J J X X X 1 βj + R JRµ + JRτ + R + ε chi i ij ijr JR j=1 j=1 j,r chi J 1 X 1X ij + εijr µi + J j=1 JR j,r ! . (2.30) Daı́, o valor esperado do estimador Ψ̂h , fica " I !# J I X X 1X 1 X E(Ψ̂h ) = E chi µi + = ij + chi µi εijr J j=1 JR j,r i=1 i=1 Para obter a variância do estimador Ψ̂h procedeu-se do seguinte modo V ar(Ψ̂h ) = E[Ψ̂h − E(Ψ̂h )]2 2 I I I J I X X X X X X 1 1 chi µi chi µi + chi εijr − ij + = E chi J JR i=1 i=1 i=1 j,r j=1 i=1 # " I 2 J I X 1X X 1 X = E εijr chi ij + chi J JR j,r i=1 j=1 i=1 ! !#2 " I I I I X X X 1 1 X chi i1 + · · · + chi εi11 + · · · + chi iJ + chi εiJR = E J i=1 JR i=1 i=1 i=1 " ! !# I I X X 1 1 2 2 2 c = Jσ JRσ c2hi + hi 2 2 2 J J R i=1 i=1 30 = I I X 1 2 1 2 X 2 1 2 2 σ + σ chi = (σ + Rσ ) c2hi . J JR JR i=1 i=1 (2.31) Assim sendo, conclui-se que o estimador de um contraste das médias dos tratamentos I P h chi µi e variância K segue uma distribuição normal com média Ψh = (σ 2 + Rσ2 ), em JR i=1 que Kh é a soma dos quadrados dos coeficientes do contraste h, isto é, Kh = I P i=1 denotado por Ψ̂h ∼ N I X i=1 Kh 2 (σ + Rσ2 ) chi µi , JR ! c2hi e será (2.32) Usando um procedimento análogo, demonstra-se que o estimador de um contraste das J P chj µj e variância médias dos blocos segue uma distribuição normal com média Ψh = j=1 Kh (σ 2 IR + Rσ2 ) o qual será denotado como Ψ̂h ∼ N ! Kh 2 chj µj , (σ + Rσ2 ) , IR j=1 J X (2.33) em que Kh é a soma dos quadrados dos coeficientes do contraste h, isto é, Kh = J P j=1 2.6.9 c2hj . Distribuição de probabilidade da soma de quadrados da h-ésima combinação linear das médias dos tratamentos Foi demonstrado que a distribuição de probabilidade de Ψ̂h = I P chi ȳi.. , o estimador do i=1 h-ésimo contraste de médias dos tratamentos, Ψh = I P chi µi é, de acordo com a expressão i=1 (2.32), distribuı́da como Ψ̂h ∼ N I X i=1 ! Kh 2 chi µi , (σ + Rσ2 ) . JR Usando resultados conhecidos da teoria de probabilidade, deduz-se que I P chi µi chi ȳi.. − Ψ̂h − E(Ψ̂h ) i=1 i=1 q = q ∼ N (0, 1). Kh Kh 2 + Rσ 2 ) 2 + Rσ 2 ) (σ (σ JR JR I P (Ψ) e, sob a hipóteses de que o contraste h é nulo, isto é, sob H0 : Ψh = I P i=1 chi µi = 0, a 31 estatı́stica q e segue que I P chi ȳi.. i=1 Kh (σ 2 JR 2 + Rσ2 ) = I P JRKh chi ȳi.. i=1 Kh (σ 2 JR chi yi.. i=1 (σ 2 em que, SQContraste = SQ(Ψ̂h ) = 2.6.10 I P + ∼ N (0, 1) + Rσ2 ) 2 Rσ2 ) I P chi yi.. i=1 = SQ(Ψ̂h ) SQContraste = 2 ∼ χ2(1) 2 2 σ + Rσ σ + Rσ2 !2 JRKh e Kh = I P i=1 (2.34) c2hi . Distribuição de probabilidade de ˆij , o estimador de ij . Um outro resultado útil diz respeito a distribuição de probabilidade de ˆij , o estimador do erro entre parcelas, o qual pode ser obtido utilizando-se o seguinte procedimento: ˆij = ȳij. − ȳi.. − ȳ.j. + ȳ... = 1 X 1 X 1 X 1X yijr − yijr − yijr + yijr , R r JR jr IR i IJR ijr como pode-se observar, ˆij é uma combinação linear dos yijr os quais seguem distribuição normal. Portanto, ˆij também segue uma distribuição normal. É necessário agora, saber quais as caracterı́sticas da distribuição de ˆij . E(ˆij ) = 1X 1 X E(µ + τi + βj + ij + εijr ) − E(µ + τi + βj + ij + εijr ) R r JR jr 1 X 1 X − E(µ + τi + βj + ij + εijr ) + E(µ + τi + βj + ij + εijr ) IR ir IJR ijr 1 1 (Rµ + Rτi + Rβj ) − (JRµ + JRτi + Rβj ) R JR X X 1 1 − (IRµ + Rτi + IRβj ) + (µ + JR τi IR +βj ) IR IJR i j 1X 1X 1X 1X βj − µ − τi − βj + µ + τi + βj . = µ + τi + βj − µ − τi − J j I i I i J j = Portanto, E(ˆij ) = 0. 32 Além disso, V ar(ˆij ) = E[ȳij. − ȳi.. − ȳ.j. + ȳ... ]2 " #2 X X X X 1 1 1 1 = E yijr − yijr − yijr + yijr R r JR jr IR ir IJR ijr !2 !2 !2 h 1 X X X 1 1 yijr + 2 2 yijr + 2 2 yijr = E 2 R J R I R r jr ir | {z } | {z } {z } | (1) (3) (2) !2 X 1 2 + 2 2 2 yijr − I J R JR2 ijr {z } | | X (4) 2 + IJR2 | X (1) = {z X yijr ijr (7) 2 − 2 2 IJ R | onde, yijr r ! X yijr jr {z ! X (9) {z X ! 2 + IJR2 } | X 2 − 2 2 I JR } | 2 2 X r ! {z 2 − IR2 } | X yijr ir (8) ! E 2 2 = (R µ + R2 τi2 + R2 βj2 + R2 2ij + R2 yijr jr X 1 E(Rµ + Rτ + Rβ + R + εijr )2 i j ij R2 r 2 yijr jr ! (5) yijr ijr yijr r ! εijr X yijr ir ! {z (10) X ijr X r yijr ! {z (6) ! } yijr ! i } !2 +2R µτi + 2R µβj + 2R τi βj + dp) 1 = µ2 + τi2 + βj2 + σ2 + σ 2 + 2µτi + 2µβj + 2τi βj R 0 X X X > 1 E(JRµ + JRτ + R β + R + εijr )2 (2) = i j ij J 2 R2 j jr j !2 !2 X X E εijr + 2J 2 R2 µτi + dp) (J 2 R2 µ2 + J 2 R2 τi2 + R2 ij + = J 2 R2 jr j = µ2 + τi2 + 1 2 1 2 σ + σ + 2µτi J JR X 0 X X 1 τi + IRβj + R ij + εijr )2 (3) = 2 2 E(IRµ + R I R i i ir X ir yijr ! } 33 E = 2 2 [I 2 R2 µ2 + I 2 R2 βj2 + R2 I R X ij i !2 X + ir εijr ! + 2I 2 R2 µβj ] 1 2 1 σ + 2µβj = µ2 + βj2 σ2 + I IR 0 X X 0 X X > 1 (4) = 2 2 2 E[IJRµ + JR τi + IRR βj + R ij + εijr ]2 I J R j i ij ijr !2 ! 2 X X E εijr + dp] = 2 2 2 [I 2 J 2 R2 µ2 + R2 ij + I J R ijr ij = µ2 + 1 2 1 2 σ + σ IJ IJR 0 X X > 1 E[(Rµ + Rτi + Rβj + Rij + εijr )(JRµ + JRτi + R βj (5) = JR2 r j X X +R ij + εijr )] j jr 1 E[JR2 µ2 + JR2 µτi + JR2 µτi + JR2 τi2 + JR2 µβj = 2 JR ! ! ! X X X εijr + dp] εijr ij + +JR2 τi βj + R2 ij r j jr 1 (JR2 µ2 + 2JR2 µτi + JR2 τi2 + JR2 µβj + JR2 τi βj + R2 σ2 + Rσ 2 ) JR2 1 1 2 = µ2 + τi2 + 2µτi + µβj + τi βj + σ2 + σ J JR X X 0 1 (6) = E[(Rµ + Rτi + Rβj + Rij + εijr )(IRµ + R τi IR2 r i X X +IRβj + R ij + εijr )] = i ir 1 E[IR2 µ2 + IR2 µβj + IR2 µτi + IR2 τi βj + IR2 µβj = IR2 ! ! ! X X X εijr + dp] εijr ij + +IR2 βj2 + R2 ij i r ir 1 = (IR2 µ2 + 2IR2 µβj + IR2 µτi + IR2 τi βj + IR2 βj2 + R2 σ2 + Rσ 2 ) IR2 1 1 2 = µ2 + βj2 + 2µβj + µτi + τi βj + σ2 + σ I IR X X 1 E[(Rµ + Rτ + Rβ + R + ε )(IJRµ + JR τi (7) = i j ij ijr IJR2 r i 0 34 0 X X > X +IRR βj + R ij + εijr )] j ij ijr 1 = E[IJR2 µ2 + IJR2 µτi + IJR2 µβj + R2 ij IJR2 ! ! X X + εijr + dp] εijr r X ij ij ! ijr 1 (IJR2 µ2 + IJR2 µτi + IJR2 µβj + R2 σ2 + σ 2 ) 2 IJR 1 2 1 2 = µ2 + µτi + µβj + σ + σ IJ IJR 0 X X X X 0 > 1 (8) = E[(JRµ + JRτ + R β + R + ε )(IRµ + R τi i ij ijr j IJR2 j j jr i X X +IRβj + R ij + εijr )] = i ir 1 E[IJR2 µ2 + IJR2 µβj + IJR2 µτi + IJR2 τi βj + R2 = IJR2 ! ! X X εijr + dp] εijr + jr X ij j ! X ir 1 = (IJR2 µ2 + IJR2 µτi + IJR2 µβj + IJR2 τi βj + R2 σ2 + σ 2 ) IJR2 1 2 1 2 = µ2 + µτi + µβj + τi βj + σ + σ IJ IJR 0 X X X > 1 E[(JRµ + JRτ + R β + R + εijr )(IJRµ (9) = i j ij IJ 2 R2 j j jr X 0 X X X 0 +JR βj + R ij + εijr )] τi + IR i j ij 1 E[IJ 2 R2 µ2 + IJ 2 R2 µτi + R2 = IJ 2 R2 ! ! X X εijr + dp] εijr + jr ijr X j ij ! X ij ij ! ijr 1 (IJ 2 R2 µ2 + IJ 2 R2 µτi + JR2 σ2 + JRσ 2 ) IJ 2 R2 1 2 1 2 = µ2 + µτi + σ + σ IJ IJR = (10) = X 0 X X 1 E[(IRµ + R τ + IRβ + R + εijr )(IJRµ i j ij I 2 JR2 i i ir j ij ! 35 X 0 X X X 0 +JR βj + R ij + εijr )] τi + IR i j ij 1 = 2 2 E[I 2 JR2 µ2 + I 2 JR2 µβj + R2 I JR ! ! X X εijr + dp] εijr + 1 I 2 JR2 X j ij ! X ij ij ! ijr ir = ijr (I 2 JR2 µ2 + I 2 JR2 µβj + IR2 σ2 + IRσ 2 ) = µ2 + µβj + 1 2 1 2 σ + σ IJ IJR Agora, 1 2 σ + 2µτi + 2µβj + 2τi βj R 1 1 2 +µ2 + τi2 + σ2 + σ + 2µτi J JR 1 2 1 2 1 2 1 σ + 2µβj + µ2 + σ + σ +µ2 + βj2 + σ2 + I IR IJ IJR 2 2 2 −2µ2 − 2τi2 − 4µτi − 2µβj − 2τi βj − σ2 − σ J JR 2 2 2 −2µ2 − 2βj2 − 4µβj − 2µτi − 2τi βj − σ2 − σ I IR 2 2 2 2 σ − σ −2µ2 − 2µτi − 2µβj − IJ IJR 2 2 2 2 +2µ2 + 2µτi + 2µβj + 2τi βj + σ + σ IJ IJR 2 2 2 2 2 2 2 2 −2µ2 − 2µτi − σ − σ − 2µ2 − 2µβj − σ − σ IJ IJR IJ IJR V ar(ˆij ) = 0µ2 + 0τi2 + 0βj2 + 0µτi + 0µβj + 0τi βj 1 2 2 2 2 2 2 1 1 σ2 − − − + − − + 1+ + + J I IJ J I IJ IJ IJ IJ 1 1 1 1 2 2 4 4 + σ2 + + + − − + − R JR IR IJR JR IR IJR IJR V ar(ˆij ) = µ2 + τi2 + βj2 + σ2 + 1 1 1 1 1 1 1 2 − − + σ + σ2 V ar(ˆij ) = 1− − + J I IJ R JR IR IJR 1 1 = (IJ − I − J + 1)σ2 + (IJ − I − J + 1)σ 2 IJ IJR 1 1 = (J(I − 1) − (I − 1))σ2 + (J(I − 1) − (I − 1))σ 2 IJ IJR (I − 1)(J − 1) 2 (I − 1)(J − 1) 2 σ + σ = IJ IJR (I − 1)(J − 1) V ar(ˆij ) = (Rσ2 + σ 2 ). IJR 36 Assim sendo, conclui-se que ˆij = ȳij. − ȳi.. − ȳ.j. + ȳ... ∼ N (I − 1)(J − 1) 2 2 0; (σ + Rσ ) , IJR (2.35) ou seja, o estimador do erro entre, ˆij , é distribuı́do como uma normal de média zero e variância 2.6.11 (I−1)(J−1) (σ 2 IJR + Rσ2 ). Distribuição de probabilidade da SQErro Entre . Partindo da expressão (2.35) e lembrando dos resultados da teoria de probabilidade para a distribuição normal padrão, vem ˆij − E(ˆij ) r (I − 1)(J − 1) 2 (σ + Rσ2 ) IJR ∼ N (0; 1) ou ȳ − ȳi.. − ȳ.j. + ȳ... − 0 (ȳij. − ȳi.. − ȳ.j. + ȳ... )2 r ij. ∼ N (0; 1) ⇒ ∼ χ2(1) ⇒ (I − 1)(J − 1) (I − 1)(J − 1) 2 (σ 2 + Rσ2 ) (σ + Rσ2 ) IJR IJR (I − 1)(J − 1) 2 (ȳij. − ȳi.. − ȳ.j. + ȳ... )2 = χ(1) ⇒ 2 2 σ + Rσ IJR P Portanto, ijr (ȳij. − ȳi.. − ȳ.j. + ȳ... )2 SQErro Entre IJR(I − 1)(J − 1) 2 = = χ(1) . 2 2 2 2 σ + Rσ σ + Rσ IJR SQErro Entre ∼ χ2[(I−1)(J−1)] . 2 2 σ + Rσ (2.36) Em palavras, a soma de quadrados do erro entre parcelas dividida por σ 2 + Rσ2 tem uma distribuição de qui-quadrado com (I − 1)(J − 1) graus de liberdade. 2.6.12 Distribuição de probabilidade de ε̂ijr , o estimador de εijr . Finalmente, as caracterı́stcas da distribuição do estimador do erro dentro, ε̂ijr , é obtido a partir da expressão (2.10), isto é, ε̂ijr = yijr − ŷijr = (yijr − ȳ... ) − (ȳi.. − ȳ... ) − (ȳ.j. − ȳ... ) − (ȳij. − ȳi.. − ȳ.j. + ȳ... ) 37 na qual pode-se observar que ε̂ijr é uma combinação linear dos yijr ’s os quais seguem distribuição normal. Portanto, ε̂ijr também segue uma distribuição normal. Isto posto, é necessário, agora, saber quais as caracterı́sticas da distribuição de ε̂ijr . " # 1X E(ε̂ijr ) = E yijr − yijr R r = E µ + τi + βj + ij + εijr X 1 Rµ + Rτi + Rβj + Rij + εijr − R r " # 1X εijr . = E µ + τi + βj + ij + εijr − µ − τi − βj − ij − R r Logo, # 1X εijr = 0. E(ε̂ijr ) = E εijr − R r " Além do mais, " #2 1X V ar(ε̂ijr ) = [ε̂ijr − E(ε̂ijr )] = E εijr − εijr R r !2 X X 1 2 = E ε2ijr + 2 εijr − εijr εijr R R r r 2 = σ2 + 1 E(ε2ij1 + ε2ij2 + ... + ε2ijR + dp) R2 2 − E[εijr (εij1 + εij2 + ... + εijr + ... + εijR )] R σ2 1 R 2 2 2 2 2 = (R − 1)σ 2 = σ + 2σ − σ = σ − R R R R (R − 1) 2 V ar(ε̂ijr ) = σ . R Portanto, ε̂ijr = (yijr − ŷijr ) = yijr − ȳij . ∼ N (R − 1) 2 0; σ . R Isto é, o estimador do erro dentro, ε̂ijr , segue uma distribuição normal com média zero e variância (R−1) 2 σ . R 38 Além disso, yijr − ȳij. − 0 (yijr − ȳij. )2 r ∼ χ2(1) ⇒ ∼ N (0; 1) ⇒ (R − 1) (R − 1) 2 σ2 σ R R X (yijr − ȳij. )2 R−1 2 IJR(R − 1) 2 (yijr − ȳij. )2 ijr ∼ χ(1) ⇒ ∼ χ(1) . 2 2 σ R σ R Portanto, 2.7 P ijr (yijr − σ2 ȳij. )2 = SQErro Dentro ∼ χ2[IJ(R−1)] . σ2 (2.37) Valores Esperados das Somas de Quadrados Os valores esperados dos quadrados médios são argumentos importantes para a compreenção da escolha das estatı́sticas de teste utilizadas na contrastação das hipóteses de interesse. Nesta seção serão abordados detalhadamente como estes resultados são obtidos. Viu-se, na seção 2.5, que a soma de quadrados total é decomposta em partes componentes cujas expressões são dadas a seguir. y...2 IJR ijr X 1 X 2 = JR (ȳi.. − ȳ... )2 = y −C JR i i.. i X 1 X 2 y −C = IR (ȳ.j. − ȳ... )2 = IR j .j. j X 1X 2 y −C = R (ȳij. − ȳ... )2 = R ij ij. ij SQT otal = SQT rat SQBlocos SQP arcelas X 2 yijr − C, emque C = SQErro Entre = SQP arcelas − SQT rat − SQBlocos SQErro Dentro = SQT otal − SQP arcelas Os valores esperados dos quadrados médios são obtidos a partir das expressões acima. Esperança da Soma de Quadrados Total Em primeiro lugar optou-se pelo cálculo do valor esperado da soma de quadrados 39 total. Isto é, X E(SQT otal ) = E 2 yijr −C ijr ! X =E 2 yijr ijr ! − E(C) Mas, E(C) = E 2 y... IJR 1 E = IJR X yijr ijr !2 X 0 X X X 0 1 βj + R ij + εijr )2 E(IJRµ + JR τi + IRR = IJR j ij ijr i X X 1 = E(IJRµ + +R ij + εijr )2 IJR ij ijr !2 !2 X X 1 εijr + dp] E[I 2 J 2 R2 µ2 + R2 ij + = IJR ijr ij = 1 (I 2 J 2 R2 µ2 + IJR2 σ2 + IJRσ 2 ). IJR Portanto, E(C) = IJRµ2 + Rσ2 + σ 2 (I) e E X ijr 2 yijr ! = E " = E " = X # X (µ + τi + βj + ij + εijr )2 X (µ2 + τi2 + βj2 + 2ij + ε2ijr + 2µτi + 2µβj + 2τi βj + dp) ijr ijr E(µ2 + τi2 + βj2 + 2ij + ε2ijr + 2µτi + 2µβj + 2τi βj + dp) ijr = X (µ2 + τi2 + βj2 + σ2 + σ 2 + 2µτi + 2µβj + 2τi βj ) ijr = IJRµ2 + JR X τi2 + IR X τi2 i X βj2 + IJRσ2 + IJRσ 2 X βj2 j 0 0 X 0 X 0 X X +2JRµ βj + 2R τi + 2IRµ τi βj j i 2 = IJRµ + JR + IR i i j + IJRσ2 + IJRσ 2 j Subtraindo-se (I) de (II), vem E(SQT otal ) = IJRµ2 + JR X i τi2 + IR X j βj2 + IJRσ2 + IJRσ 2 (II) # 40 −IJRµ2 − Rσ2 − σ 2 Portanto, o valor esperado da soma de quadrados total é definido por: E(SQT otal ) = R(IJ − 1)σ2 + (IJR − 1)σ 2 + JR X τi2 + IR i X βj2 . (2.38) j Esperança da Soma de Quadrados de Tratamento Em segundo lugar procurou-se deduzir o valor esperado da soma de quadrados de tratamentos, ou seja " # 1 X 2 1 E(SQT rat ) = yi.. − C = E JR i JR X 2 yi.. i ! − E(C) Mas, 1 E JR X i 2 yi.. ! = 1 E JR X i 2 X 0 X X JRµ + JRτi + R βj + R ij + εij j X 1 = E J 2 R2 µ2 + J 2 R2 τi2 + R2 JR i 2 2 +2J R µτi + 0dp j X ij j jr !2 + X εir jr !2 1 X 2 2 2 [J R µ + J 2 R2 τi2 + JR2 σ2 + JRσ 2 + 2J 2 R2 µτi ] JR i X 1 τi2 + IJR2 σ2 + IJRσ 2 + 0]. [IJ 2 R2 µ2 + J 2 R2 = JR i = Assim sendo, tem-se 1 E JR X i 2 yi.. ! = IJRµ2 + JR X τi2 + IRσ2 + Iσ 2 . (III) i Subtraindo-se (I) de (III), obtém-se o valor esperado da soma de quadrados de tratamentos, isto é, E(SQT rat ) = (I − 1)(σ 2 + Rσ2 ) + JR X τi2 . (2.39) i A esperança do quadrado médio de tratamentos é dada pelo valor esperado da soma de quadrados de tratamentos dividida pelos seus respectivos graus de liberdade, ou seja, JR X 2 SQT rat = σ 2 + Rσ2 + τ (2.40) E(QMT rat ) = E I −1 I −1 i i 41 ou E(QMT rat ) = σ 2 + Rσ2 + em que µi = µ + τi . JR X (µi − µ)2 , I −1 i (2.41) Esperança da soma de quadrados de uma combinação linear das médias dos tratamentos: h-ésimo contraste de médias dos tratamentos De acordo com a expressão (2.34), a soma de quadrados de um contraste h é dada por SQ(Ψ̂h ) = I P chi yi.. i=1 2 . JRKh Desenvolvendo-se algebricamente a expressão acima, vem SQ(Ψ̂h ) = = = I P chi yi.. i=1 JRKh 1 JRKh 2 X I chi i=1 1 J 2 R2 JRKh 0 2 7 J J J X R X X X εijr JRµi + R βj + R ij + X I j=1 chi µi i=1 2 +R j=1 r=1 j=1 2 X I chi i=1 J X ij j=1 2 + X I chi R J X X εijr j=1 r=1 i=1 2 + dp . Agora, calculando o valor esperado, obtém-se após algumas operações algébricas o seguinte resultado I 2 E[SQ(Ψ̂h )] = E[QM (Ψ̂h )] = σ + Rσ2 2 JR X + chi µi . Kh i=1 (2.42) uma vez que, por (2.34), há apenas um grau de liberdade associado a soma de quadrados de um contraste entre as médias dos tratamentos. Esperança da Soma de Quadrados de Blocos Para calcular a esperança da soma de quadrados de blocos, procedeu-se da seguinte forma, " X E(SQBlocos ) = E IR (ȳ.j. − ȳ... )2 j # # 1 1 X 2 E y.j. − C = = E IR j IR " X j 2 y.j. ! − E(C) 42 Mas, 1 E IR X j 2 y.j. ! 1 E IR = X j 2 X 0 X X IRµ + R τi + IRβj + R ij + εijr i i X 1 = E I 2 R2 µ2 + I 2 R2 βj2 + R2 IR j 2 2 +2I R µβj + 0dp X ij i ir !2 + X εijr ir !2 1 X 2 2 2 I R µ + I 2 R2 βj2 + IR2 σ2 + IRσ 2 + 2I 2 R2 µβj IR j X 0 X 1 2 2 2 = βj . βj2 + IJR2 σ2 + IJRσ 2 + 2I 2 JR2 µ I JR µ + I 2 R2 IR j j = Portanto, 1 E IR X j 2 y.j. ! = IJRµ2 + IR X βj2 + JR2 σ2 + Jσ 2 (IV ) j Subtraindo-se (I) de (IV), encontrou-se, E(SQBlocos ) = IJRµ2 + IR X βj2 + JR2 σ2 + Jσ 2 − IJRµ2 − Rσ2 − σ 2 j = (J − 1)σ 2 + R(J − 1)σ2 + IR X βj2 j E(SQBlocos ) = (J − 1)(σ 2 + Rσ ) + IR X βj2 . (2.43) j A esperança do quadrado médio de blocos é dada pelo valor esperado da soma de quadrados de blocos dividida pelos seus respectivos graus de liberdade, ou seja, X SQBlocos = σ 2 + Rσ2 + IR βj2 E(QMBlocos ) = E J −1 j ou E(QMBlocos ) = σ 2 + Rσ + em que µj = µ + βj . IR X (µj − µ)2 , J −1 j Esperança da Soma de Quadrados de Parcelas (2.44) (2.45) 43 Para a soma de quadrados de parcelas procedeu-se como segue, " E(SQP arcelas ) = E R X (ȳij. − ȳ... )2 ij " # # 1X 2 1 = E yij. − C = E R ij R X ! 2 yij. ij − E(C) Mas, 1 E R X 2 yij. ij ! = 1 E R X X Rµ + Rτi + Rβj + Rij + εijr r ij 1 hX 2 2 = E R µ + R2 τi2 + R2 βj2 + R2 2ij + R ij i +2R2 µβj + 2R2 τi βj + 0dp !2 X εijr r !2 + 2R2 µτi 1 E(R2 µ2 + R2 τi2 + R2 βj2 + R2 σ2 + σ 2 + 2R2 µτi + 2R2 µβj R +2R2 τi βj ) X X 1 = βj2 + IJR2 σ2 + IJRσ 2 τi2 + IR2 (IJR2 µ2 + JR2 R j i = 0 0 X 0 X X X 0 2 2 βj + 2R τi βj ). τi + 2IR µ +2JR µ 2 j i i j Logo, 1 E R X ij 2 yij. ! = IJRµ2 + JR X τi2 + IR i X βj2 + IJR2 σ2 + IJσ 2 . (V ) j Subtraindo-se (I) de (V), obtém-se E(SQP arcelas ) = IJRµ2 + JR 2 −IJRµ − X i 2 Rσ τi2 + IR −σ X βj2 + IJR2 σ2 + IJσ 2 j 2 = (IJ − 1)σ 2 + R(IJ − 1)σ2 + JR X τi2 + IR i E(SQP arcelas ) = (IJ − 1)(σ 2 + Rσ2 ) + JR X i τi2 + IR X βj2 j X βj2 . (2.46) j De modo análogo aos casos anteriores, o valor esperado do quadrado médio de parcelas 44 fica, E(QMP arcelas ) = E SQP arcelas IJ − 1 = (σ 2 + Rσ2 ) + JR X 2 IR X 2 τi + β (2.47) IJ − 1 i IJ − 1 j j ou E(QMP arcelas ) = (σ 2 + Rσ2 ) + IR X JR X (µi − µ)2 + (µj − µ)2 , IJ − 1 i IJ − 1 j (2.48) em que, µi = µ + τi e µj = µ + βj . Esperança da Soma de Quadrados do Erro Entre O valor esperado da soma de quadrados do erro entre é obtida pela subtração dos valores esperados da soma de quadrados de bloco e soma de quadrados de tratamento da soma de quadrados de parcela, ou seja, SQErro Entre = E(SQP arcelas − SQT rat − SQBlocos ) = E(SQP arcela ) − E(SQT rat ) − E(SQBloco ) X X = (IJ − 1)(σ 2 + Rσ2 ) + JR τi2 + IR βj2 i 2 −(I − 1)(σ + Rσ2 ) − JR X j τi2 i 2 −(J − 1)(σ + Rσ ) − IR X βj2 j 2 = (σ + Rσ2 )[IJ − 1 − I + 1 − J + 1] E(SQErro Entre ) = (I − 1)(J − 1)(σ 2 + Rσ2 ) (2.49) Como feito anteriormente, tem-se a esperança do quadrado médio do erro entre da sequinte forma, E(QMErro Entre ) = E SQErro Entre (I − 1)(J − 1) = σ 2 + Rσ2 ; (2.50) Esperança da Soma de Quadrados do Erro Dentro Obtém-se o valor esperado da soma de quadrado de erro dentro com a seguinte subtração, E(SQErro Dentro ) = E(SQT otal − SQP arcelas ) 45 = E(SQT otal ) − E(SQP arcelas ) = R(IJ − 1)σ2 + (IJR − 1)σ 2 + JR X τi2 + IR i −(IJ − 1)(σ 2 + Rσ2 ) − JR X = 2 2 2 βj2 j τi2 − IR i IJRσ2 X X βj2 j 2 2 − Rσ + IJR − σ − IJσ + σ − IJRσ2 + Rσ2 . Portanto, E(SQErro Dentro ) = IJ(R − 1)σ 2 (2.51) Dividindo-se a soma de quadrado de erro dentro pelos seus respectivos graus de liberdade tem-se o valor esperado do quadrado médio do erro dentro, SQErro Dentro E(QMErro Dentro ) = E = σ2. IJ(R − 1) (2.52) Portanto, o valor esperado da SQErro Dentro dividido pela variância do erro dentro segue uma distribuição de qui-quadrado com IJ(R − 1) graus de liberdade. Os resultados obtidos nesta seção encontram-se apresentados de forma resumida na Tabela 4, como sugere Barbin (1993). Tabela 4: Análise da variância com os valores esperados dos quadrados médios F.V. G.L. Tratamento I-1 Blocos J-1 Erro Entre Parcelas Erro Dentro Total (I-1)(J-1) (IJ-1) IJ(R-1) IJR-1 S.Q. 1 X 2 y −C JR i i.. 1 X 2 y −C IR j .j. SQP arc − SQT rat − SQBlocos 1 X 2 y −C R ij ij. SQT otal − SQP arcelas X 2 yijr −C E(QM) JR X (µi − µ)2 I −1 i IR X σ 2 + Rσ2 + (µj − µ)2 J −1 j σ 2 + Rσ2 + σ 2 + Rσ2 σ2 - ijr A tabela 5 contém informações acerca dos parâmetros associados ao modelo matemático, aos seus estimadores e suas respectivas distribuições de probabilidade, bem como, as distribuições de probabilidade das somas de quadrados associadas. Tabela 5: Caracterı́sticas, seus estimadores e distribuições de probabilidade de estatı́sticas associadas. Estimador da caracterı́stica Caracterı́stica Distribuição de Probabilidade do Estimador h µ µ̂ = m = ȳ... µ̂ ∼ N µ; τi τˆi = ti = ȳi.. − ȳ... h τ̂i ∼ N τi ; µi µ̂i = mi = ȳi.. βj βˆj = bj = ȳ.j. − ȳ... µj µ̂j = mj = ȳ.j. 1 (σ 2 IJR (I−1) (σ 2 IJR h µ̂i ∼ N µi , 1 (σ 2 JR h β̂j ∼ N βj ; h µj ∼ N µj , + Rσ2 ) i + Rσ2 ) + Rσ2 ) (J−1) (σ 2 IJR i + chi µi , 1 (σ 2 JR Rσ2 ) C σ 2 +Rσ2 Sob H0 : µ = 0, i i i q q ∼ χ2(I−1) µ̂i −µ0 QMErro Entre JR Sob H0 : βj = 0, ∀ j, Sob H0 : µj = µ0 , ∼ χ2(1) SQT rat σ 2 +Rσ2 Sob H0 : τi = 0, ∀ i, Sob H0 : µi = µ0 , + Rσ2 ) 1 (σ 2 IR Distribuição de Probabilidade das Estatı́sticas de Interesse sob H0 SQBlocos σ 2 +Rσ2 Ψh = i=1 ij chi µi Ψ̂h = I P chi ȳi.. Ψ̂h ∼ N i=1 i=1 ˆij = ȳij. − ȳi.. − ȳ.j. − ȳ... hP I h ˆij ∼ N 0; h εijr ε̂ijr = yijr − ȳij. ε̂ijr ∼ N 0; yijr ŷijr = ȳij. - + (I−1)(J−1) (σ 2 IJR IJ(R−1) 2 σ IJR i Rσ2 ) + i Rσ2 ) Sob H0 : Ψh = 0, i ∼ χ2(J−1) µ̂j −µ0 QMErro Entre IR I I P ( P chi yi.. ) ∼ t[(I−1)(J−1)] ∼ t[(I−1)(J−1)] 2 i=1 JRKh (σ 2 +Rσ2 ) SQErro Entre σ 2 +Rσ2 ∼ χ2[(I−1)(J−1)] SQErro Dentro σ2 ∼ χ2[IJ(R−1)] ∼ χ2(1) - 46 47 2.8 Comparações múltiplas das médias duas a duas Como o desenvolvimento da teoria dos métodos de comparações múltiplas não faz parte dos objetivos deste trabalho, achou-se conveniente apresentar simplesmente um procedimento prático para comparar os possı́veis pares de médias dos tratamentos por meio do teste de Tukey. Para testar as hipóteses do tipo H0 : µi = µi0 contra H1 : µi 6= µi0 , ao nı́vel de significância α, calcula-se a Diferença Mı́nima Significativa - DMS por meio da expressão r QMErro Entre DM S = q[I; (I−1)(J−1); α] (2.53) JR na qual q[I; (I−1)(J−1); α] é o valor crı́tico da aplitude estudentizada de Tukey para I = número de tratamentos envolvidos no ensaio, (I −1)(J −1) = número de graus de liberdade do Erro Entre e nı́vel de significância α (em geral α = 0, 05). Em seguida calcular os valores absolutos das diferenças entre as estimativas dos possı́veis pares de médias dos tratamentos envolvidos no experimento, |ȳi − ȳi0 |, i 6= i0 , i, i0 = 1, 2, · · · , I. Finalmente, adotar a regra de decisão: Rejeiar H0 em favor de H1 , ao nı́vel de significância α se, e somente se |ȳi − ȳi0 | > DM S. Este procedimento será ilustrado na seção 3. 2.9 Análises estatı́sticas Tal como no experimento em blocos ao acaso usual, as análises estatı́sticas de um experimento em blocos casualizados com repetição do conjunto de tratamentos dentro dos blocos, em geral, levam em consideração as seguintes hipótese: Hipóteses sobre a não (τ ) existência de efeito dos tratamentos sobre a variável resposta, H0 1, 2, · · · , I existência (τ ) (ou equivalentemente, H0 (β) do efeito dos blocos: H0 : τi = 0, ∀ i = : µ1 = · · · = µI = µ); Hipótese sobre a não : βj = 0, ∀ j = 1, 2, · · · , J. De modo geral, o pesquisador planeja seus experimentos em blocos casualizados com o objetivo apenas de proporcionar ambientes homogêneos (blocos) dentro dos quais ele distribui de modo aleatório um conjunto de tratamentos (ou mais de um conjunto), favorecendo-se o controle local. Assim sendo, quase sempre, o pesquisador não tem interesse em fazer inferência sobre o efeito dos blocos, fixando-se apenas nas análises baseadas no efeito dos tratamentos. Neste sentido, as análises são conduzidas priorizado-se os contrastes entre as médias 48 dos tratamentos de interesse do pesquisador, bem como, as comparações múltiplas das médias. Na seção a seguir, serão discutidas as bases teóricas que possibilitam essa possı́veis análises. 2.9.1 Hipóteses sobre tratamento Esta hipótese pode ser representada de duas maneiras, a saber: (τ ) H0 : τi = 0, ∀ i = 1, 2, · · · , I a) vs H (τ ) : τ 6= 0, para pelo menos um τ i 1 ou b) i (2.54) (τ ) H0 : µ1 = µ2 = · · · = µ I = µ vs H (τ ) : µ 6= µ 0 , para pelo menos um par (µ , µ 0 ) i 6= i0 = 1, 2, · · · , I i i i i 1 Considerando-se os resultados obtidos no desenvolvimento da teoria, pode ser observado que: a.1) De acordo com a equação (2.50), E(QMErro Entre ) = σ 2 + Rσ2 . Isto é, o valor esperado do quadrado médio do erro entre é um estimador não viciado para σ 2 +Rσ2 (τ ) independentemente de que H0 seja verdadeiro; a.2) Pela expressão (2.41), E(QMT rat ) = σ 2 + Rσ2 + nula (τ ) H0 JR I−1 : µ1 = · · · = µI = µ é verdadeira, então I P (µi − µ)2 e se a hipótese i=1 I P JR (µi I−1 i=1 − µ)2 = 0 e QMT rat (τ ) será um estimador não viciado para σ 2 + Rσ2 . No entanto, se H1 é verdadeira E(QMT rat ) > σ 2 +Rσ2 . Assim sendo, é razoável comparar QMT rat com QMErro Entre (τ ) para se efetuar o teste da hipótese H0 , tendo em vista que quanto maior for o QMT rat comparado com QMErro Entre mais evidência se tem de que as médias dos tratamentos são diferentes entre si (ou que o efeito dos tratamentos não são nulos). (τ ) SQT rat ∼ χ2[I−1] e independentemente σ 2 +Rσ2 Eentre ∼ χ2[(I−1)(J−1)] . (2.35), SQσErro 2 +Rσ 2 a.3) Conforme equação (2.20), tem-se que sob H0 , (τ ) de que H0 se verifique e pela expressão Como se sabe, de acordo com a teoria de estatı́stica matemática, [ver Rohatgi (1976), Roussas (1997), dentre outros], se uma variável aleatória U segue uma distribuição 49 de qui-quadrado com ν1 graus de liberdade e uma outra variável aleatória V segue uma distribuição de qui-quadrado com ν2 graus de liberdade e, além disso, U e V são variáveis aleatórias independentes, então a razão entre a variável aleatória U dividida pelos seus graus de liberdade e a variável aleatória V dividida pelos seus graus de liberdade, segue uma distribuição F de Snedecor e Cochran com ν1 graus de liberdade do numerador e ν2 graus de liberdade do denominador a qual pode ser escrita como U/ν1 ∼ F[ν1 , ν2 ] V /ν2 (2.55) Tomando como base este resultado, e considerando-se as distribuições de probabilidade das somas de quadrados apresentadas na Tabela 5, pode-se verificar que SQT rat σ 2 +Rσ2 F = (I−1) SQErro Entre σ 2 +Rσ2 = QMT rat ∼ F[(I−1), (I−1)(J−1)] QMErro Entre (2.56) (I−1)(J−1) (τ ) que será a estatı́stica de teste para testar a hipótese H0 vs (τ ) H0 : τi 6= 0 para pelo menos um τi . Rejeita-se α, se F = QMT rat QMErro Entre (τ ) H0 , : τi = 0, para todo i, ao nı́vel de significância > F[(I−1), (I−1)(J−1), α] , em que F[(I−1), (I−1)(J−1), α] é o 100(1 − α)-ésimo percentil superior da distribuição F com (I − 1) graus de liberdade do numerador e (I − 1)(J − 1) graus de liberdade do denominador. a.4) Como pode ser observado na expressão (2.50), o valor esperado do QMErro Entre é (Ψ) σ 2 + Rσ2 independentemente de que a hipótese H0 : Ψh = 0 se verifique ou não. Isto é, QMErro Entre é um estimador não tendencioso para σ 2 + Rσ2 . (Ψ) a.5) Da expressão (2.42), se H0 : I P chi µi = 0 é verdadeiro, QM (Ψ̂h ) também é um i=1 (Ψ) estimador não tendencioso para σ 2 + Rσ2 . Porém, se H0 for falsa, I P chi µi 6= 0 e i=1 E[QM (Ψ̂h )] > σ 2 + Rσ2 . Portanto, para se efetuar um teste de hipótese sobre um contraste de médias dos tratamentos é intuitivo que seja feita uma comparação entre o quadrado médio do contraste e o quadrado médio do erro entre. Pois, espera-se que quanto maior for QM (Ψ̂h ) comparado com QMErro Entre , mais evidência se tem I P chi µi não é nulo e quanto mais aproxima-se de zero de que o comtraste Ψh = i=1 mais eviência se tem a favor de H0 . (Ψ) a.6) Conforme equação (2.34), tem-se que sob H0 , a estatı́stica expressão (2.35), rifique. SQErro Eentre σ 2 +Rσ2 SQ(Ψ̂h ) σ 2 +Rσ2 ∼ χ2[1] e, pela (Ψ) ∼ χ2[(I−1)(J−1)] independentemente de que H0 se ve- 50 Portanto, adotando os mesmos argumentos do ı́tem a.3) verifica-se facilmento que a estatı́stica SQ(Ψ̂h ) σ 2 +Rσ2 F = 1 SQErro Entre σ 2 +Rσ2 = QM (Ψ̂h ) ∼ F[1, (I−1)(J−1)] QMErro Entre (2.57) (I−1)(J−1) (Ψ) e será a estatı́stica de teste para testar a hipótese H0 (Ψ) (Ψ) : Ψh = 0 vs H1 regra de decisão será, rejeita H0 , ao nı́vel de significância α, se F = : Ψh 6= 0. A QM (Ψ̂h ) QMErro Entre > F[1, (I−1)(J−1), α] , em que F[1, (I−1)(J−1), α] é o 100(1 − α)-ésimo percentil superior da distribuição F com 1 grau de liberdade do numerador e (I − 1)(J − 1) graus de liberdade do denominador. a.7) Para comparar os possı́veis pares de médias da variável resposta relativas aos tratamentos, poderá ser empregado qualquer método de comparações múltiplas, embora neste trabalho deu-se preferência ao teste de Tukey, cuja teoria pode ser vista em (LEAL; PORRAS, 1998), (MONTGOMERY, 2007). 2.9.2 Hipóteses sobre Bloco Tal como nas hipóteses sobre tratamento, estas também podem ser representada de duas maneiras, a saber: (β) H0 : βj = 0, ∀ j = 1, 2, · · · , J a) vs H (β) : β 6= 0, para pelo menos um β j j 1 ou (2.58) (β) H0 : µ1 = µ2 = · · · = µ J = µ b) vs H (β) : µ 6= µ 0 , para pelo menos um par (µ , µ 0 ) j 6= j 0 = 1, 2, · · · , J j j j j 1 Levando-se em conta os resultados obtidos no desenvolvimento da teoria e por ar- gumentos semelhantes aos utilizados na seção 2.9.1, para as hipóteses sobre tratamento, pode-se verificar facilmente que 51 b.1) A estatı́stica SQBloco σ 2 +Rσ2 F = (J−1) SQErro Entre σ 2 +Rσ2 = QMBloco ∼ F[(J−1), (I−1)(J−1)] QMErro Entre (2.59) (I−1)(J−1) será a estatı́stica de teste para testar a hipótese H0 (β) : βj = 0, para todo j, vs (β) H0 (β) H0 , ao nı́vel de significância α, : βj 6= 0 para pelo menos um βj . Rejeita-se se F = QMBloco QMErro Entre > F[(J−1), (I−1)(J−1), α] , em que F[(J−1), (I−1)(J−1), α] é o 100(1 − α)-ésimo percentil superior da distribuição F com (J − 1) graus de liberdade do numerador e (I − 1)(J − 1) graus de liberdade do denominador. b.2) A estatı́stica SQ(Ψ̂h ) σ 2 +Rσ2 F = 1 SQErro Entre σ 2 +Rσ2 = QM (Ψ̂h ) ∼ F[1, (I−1)(J−1)] QMErro Entre (2.60) (I−1)(J−1) será a estatı́stica de teste para testar a hipótese de nulidade de um contraste h sobre (Ψ) as médias dos bocos, H0 (Ψ) : Ψh = 0 vs H1 : Ψh 6= 0. A regra de decisão será, (Ψ) rejeita H0 , ao nı́vel de significância α, se F = QM (Ψ̂h ) QMErro Entre > F[1, (I−1)(J−1), α] , em que F[1, (I−1)(J−1), α] é o 100(1 − α)-ésimo percentil superior da distribuição F com 1 grau de liberdade do numerador e (I − 1)(J − 1) graus de liberdade do denominador. b.3) As comparações múltiplas das médias dos blocos pelo teste Tukey, poderão ser feitas por meio do mesmo procedimento adotado no ı́tem a.7) com as seguintes modificações: QMErro Entre (2.61) IR é o valor crı́tico da aplitude estudentizada de Tukey para DM S = q[J; (I−1)(J−1); α] na qual q[J; (I−1)(J−1); α] r J = número de blocos envolvidos no ensaio, (I − 1)(J − 1) = número de graus de liberdade do Erro Entre e nı́vel de significância α (em geral α = 0, 05). Em seguida calcular os valores absolutos das diferenças entre as estimativas dos possı́veis pares de médias dos blocos envolvidos no experimento, |ȳ.j. − ȳ.j 0 . |, j 6= j 0 , j, j 0 = 1, 2, · · · , J. Finalmente, adotar a regra de decisão: Rejeiar H0 em favor de H1 , ao nı́vel de significância α se, e somente se |ȳ.j. − ȳ.j 0 . | > DM S. 52 2.9.3 A tabela da ANOVA A partir do conhecimento das partes componentes da variabilidade total representadas pelas somas de quadrados e das distribuições de probabilidade das estatı́sticas de teste das hipóteses sobre tratamento e Bloco deduzidas nas Seções 2.9.1 e 2.9.2, e, de acordo com Leal e Porras (1998) e Montgomery (2007), pode-se organizar a tabela completa da análise de variância - ANOVA, tal como se apresenta na literatura especializada, isto é, Tabela 6: Tabela da Análise de Variância F. Variação Tratamento GL I −1 SQ SQT rat QM T rat QMT rat = SQI−1 Bloco J −1 SQBloco QMBloco = Erro Entre Parcela (I − 1)(J − 1) IJ − 1 SQErro Entre SQP arcela QMErro Entre = - Erro Entre IJ(R − 1) SQErro Dentro QMErro Dentro = IJR − 1 SQT otal Total - SQBloco J−1 F QMT rat QMErro Entre QMBloco QMErro Entre SQErro Entre (I−1)(J−1) - SQErro Dentro IJ(R−1) - 53 3 Aplicação da teoria a um exemplo real O objetivo deste Capı́tulo é apresentar uma aplicação da teoria desenvolvida neste trabalho a um conjunto de dados real recolhido de um experimento em blocos completos casualizados com repetições dos tratamentos dentro dos blocos. 3.1 Descrição do conjunto de dados experimentais Para ilustrar o método, levou-se em conta um experimento analisado por Ferreira (1996), página 254, no qual considerou-se três variedades de cana-de-açúcar, três blocos e três repetições. A variável resposta analisada foi a porcentagem de açúcar provável, cujos valores observados encontram-se na Tabela 7, a seguir. Tabela 7: Porcentagem de açúcar provável em variedades de cana-de-açúcar Variedade 1 Repetição 1 2 3 2 1 2 3 3 1 2 3 Soma 1 13,03 13,72 14,16 40,91 15,73 15,62 15,55 46,90 14,69 15,65 14,52 44,86 132,67 Bloco 2 13,20 13,84 13,11 40,15 15,13 15,52 16,27 46,92 14,75 15,54 14,13 44,42 131,49 3 13,30 12,33 13,79 39,42 15,40 15,57 15,77 46,74 14,95 15,72 14,51 45,18 131,34 Soma 120,48 140,56 134,46 395,50 Fonte: Cortesia de Ms. Paulo Vanderlei Ferreira. 54 3.2 Cálculos das somas de quadrados e análise da variância A partir dos dados da Tabela 7, calculou-se: SQT otal = I X J X R X i=1 j=1 r=1 2 yijr (y... )2 − IJR = (13, 03)2 + (13, 72)2 + · · · + (14, 51)2 − (395, 5)2 = 29, 3418; 3×3×3 I SQV ariedade 1 X 2 (y... )2 = yi.. − JR i=1 IJR = (395, 5)2 1 (120, 48)2 + (140, 56)2 + (134, 46)2 − = 23, 5503; 3×3 3×3×3 J SQBloco 1 X 2 (y... )2 = y.j. − IR j=1 IJR (395, 5)2 1 2 2 2 (132, 67) + (131, 49) + (131, 34) − = 0, 1179; = 3×3 3×3×3 I SQP arcela J 1 XX 2 (y... )2 = y − R i=1 j=1 ij. IJR = (395, 5)2 1 (40, 91)2 + (40, 15)2 + · · · + (45, 18)2 − = 24, 0239; 3 3×3×3 SQErro Entre = SQP arcela − SQV ariedade − SQBloco = 24, 0239 − 23, 5503 − 0, 1179 = 0, 3557 e SQErro Dentro = SQT otal − SQP arcela = 29, 3418 − 24, 0239 = 5, 3179. De posse dos resultados acima organiza-se a Tabela da Análise de Variância - ANOVA, de acordo como foi sugerido na Tabela 8, ou seja, 55 Tabela 8: Análise de variância para os dados da porcentagem de açúcar provável em variedades de cana-de-açúcar. F. Variação Variedade Bloco Erro Entre Parcela Erro Dentro Total GL SQ 2 23,5503 2 0,1179 4 0,3557 8 24,0239 18 5,3179 26 29,3479 QM 11,7752 0,0590 0,0889 3,0030 0,2954 - F 132,45 0,66 - Como pode ser observado na Tabela 8, F = 132, 45 e da tabela da distribuição F observa-se que F[2; 4; 0,01] = 18, 00. Como F > F[2; 4; 0,01] , então rejeita-se a hipótese de igualdade das médias da porcentagem de açúcar provável relativas as variedades de canade-açúcar e concluı́-se ao nı́vel de significância α = 0, 01 que existe pelo menos um par de médias (µi , µi0 ) que diferem estatisticamente entre si. Para verificar quais médias diferem entre si, adotou-se o seguinte procedimento: 1. Desdobrar os dois graus de liberdade de variedade em dois contrastes de interesse, cada um com um grau de liberdade. Imagine que são de interesse do pesquisador (2) (3) os seguintes contrastes representados pelas hipóteses H0 e H0 a seguir: (2) (3) µ1 +µ3 H : µ − = 0 2 2 0 H0 : µ3 − µ1 = 0 com 1 gl com 1 gl e vs vs H (2) : µ − µ1 +µ3 6= 0 H (3) : µ − µ 6= 0 2 1 1 2 3 1 As estimativas desses contrastes são representadas por: Ψ̂1 = ȳ2.. − ȳ1.. + ȳ3 13, 39 + 14, 94 = 15, 62 − = 1, 46% 2 2 e Ψ̂2 = ȳ3.. − ȳ1.. = 14, 94 − 13, 39 = 1, 55% Para facilitar os cálculos das respectivas somas de quadrados dos contrastes é conve(2) (3) niente reescrever as hipóteses H0 e H0 na forma equivalente, da seguinte maneira, (2) (3) H0 : −µ1 + 2µ1 − µ3 = 0 e H0 : µ3 − µ1 = 0. Daı́, obtém-se: SQ(Ψ̂1 ) = P c1i yi.. i JRK1 2 = [(−1)(120, 48)2 + (2)(140, 56) + (−1)(134, 46)]2 3 × 3 × [(−1)2 + (2)2 + (−1)2 ] {z } | K1 56 (26, 18)2 = = 12, 6925 com 1 gl 54 e SQ(Ψ̂2 ) = P c2i yi.. i JRK2 2 [(−1)(120, 48)2 + (1)(134, 46)]2 = 3 × 3 × [(−1)2 + (1)2 ] {z } | K2 2 = (13, 98) = 10, 8578 com um gl. 18 Com estes resultados reorganiza-se a tabela da análise da variância, obtendo-se: Tabela 9: Análise de variância para os dados da porcentagem de açúcar provável em variedades de cana-de-açúcar. F. Variação (2) 3 H0 : Ψ1 = µ2 − µ1 +µ =0 2 (3) H0 : Ψ 2 = µ3 − µ1 = 0 (1) Variedade (H0 = µ1 = µ2 = µ3 = µ) Bloco Erro Entre Parcela Erro Dentro Total GL SQ 1 1 (2) 2 4 8 18 26 12,6925 10,8578 (23,5503) 0,1179 0,3557 24,0239 5,3179 29,3479 QM 12,6925 10,8578 11,7752 0,0590 0,0889 3,0030 0,2954 - F 142,77 122,13 132,45 0,66 - Com base nos resultados da Tabela 9 conclui-se que a média da porcentagem de açúcar provável da variedade V 2 difere estatisticamente da média combinada das variedades V 1 e V 3, ao nı́vel α = 0, 01 de significância, tendo em vista que F[1; 4; 0,01] = 21, 20. De modo análogo, pode-se concluir, ao nı́vel α = 0, 01 de significância, que a porcentagem média de açúcar provável da variedade V 3 difere estatisticamente da variedade V 1. 2. Comparações das médias duas a duas pelo teste de Tukey: Inicialmente calculou-se as estimativas das médias todas com desvio-padrão s(ȳi ) e a diferença mı́nima significativa -DMS, pelo método de Tukey ao nı́vel α = 0, 05: ȳ1 = 13, 30% ȳ2 = 15, 62% todas com erro-padrão s(ȳi ) = ȳ3 = 14, 94% r QMErro Entre = 0, 0994%. JR 57 e r QMErro Entre DM S = q[I; (I−1)(J−1); α] JR r r 0, 0889 0, 0889 = 5, 04 = 0, 50%; = q[3; 4; 0,05] 3×3 3×3 em seguida cauculou-se os valores absolutos das possı́veis diferenças entre as estimativas das médias das variedades. Isto é, |ȳ1.. − ȳ2 | = |13, 39 − 15, 62| = 2, 23% |ȳ1.. − ȳ3 | = |13, 39 − 14, 94| = 1, 55% |ȳ2.. − ȳ3 | = |15, 62 − 14, 94| = 0, 68%; Adotando-se a regra de decisão: rejeitar H0 : µi = µi0 , ao nı́vel de significância α = 0, 05, se |ȳi.. − ȳi0 .. | > DM S, conclui-se que as variedades de cana-de-açúcar estudadas produzem porcentagens médias de açúcar provável diferentes entre si. 3.3 Comprovação da idoneidade do modelo Figura 1: Função de distribuição acumulada sob normalidade por meio da estatı́stica de Kolmogorov-Smirnov. Figura 2: Histograma e polı́gono das frequências para cada variedade de cana-de-açucar estudada. 58 Figura 3: Valores plotados no gráfico Quantil para as variedades de cana-de-açucar estudadas. Conforme pode ser observado nas Figuras 1, 2 e 3 os erros são normalmente distribuı́dos. A execussão das análises pode ser facilitada empregando o softwere estatı́stico SAS por meio do seguinte procedimento: OPTIONS NODATE PS=500; DATA EXEMPLO; DO VAR=1 TO 3; DO REP=1 TO 3; DO BLOCO=1 TO 3; INPUT PORCENTAGEM @@; OUTPUT; END; END; END; DATALINES; 13.03 13.20 13.30 13.72 13.84 12.33 14.16 13.11 13.79 15.73 15.13 15.40 15.62 15.52 15.57 15.55 16.27 15.77 59 14.69 14.75 14.95 15.65 15.54 15.72 14.52 14.13 14.51 ; RUN; PROC PRINT DATA=EXEMPLO; RUN; PROC GLM DATA=EXEMPLO; CLASS VAR BLOCO; MODEL PORCENTAGEM=VAR BLOCO VAR*BLOCO / SS3; TEST H=VAR BLOCO E=VAR*BLOCO; CONTRAST "V2 vs (V1+V3)" VAR -1 2 -1; CONTRAST "V3 vs V1" MEANS VAR / TUKEY; RUN; VAR -1 0 1; 60 4 Conclusão Final As análises estatı́sticas para os dados de um experimento instalado num delineamento de Blocos completos casualizados com repetições dos tratamentos dentro dos blocos, consideram que as observações são representadas por um modelo matemático aditivo envolvendo uma média geral, os efeitos dos tratamentos, dos blocos e dois tipos de erros experimentais aleatórios: um, entre as unidades experimentais que receberam o mesmo tratamento em blocos diferentes, o Erro Entre, e outro, entre as unidades experimentais que receberam o mesmo tratamento dentro do mesmo bloco, o Erro Dentro. Neste delineamento, o Erro Entre pode se visto como o efeito da interação entre Tratamento e Bloco (T × B). Além disso, supõe-se a priori que esses erros são independentemente distribuı́dos (um do outro e entre si) como uma normal de médias zero e variâncias comuns σ2 e σ 2 , iid iid respectivamente. Isto é, ij ∼ N (0, σ2 ), εijr ∼ N (0, σ 2 ) e Cov(ij , εijr ) = 0. Diante do exposto e após o desenvolvimento e aplicação da teoria que dar sutentatação a estas análises, concluiu-se que: 1. Do pondo de vista prático, o planejamento de um experimento em blocos completos casualizados com repetição do conjunto de tratamentos nos blocos tem pouca aplicabilidade, uma vez que é apropriado a pesquisas envolvendo poucos tratamentos. E, do ponto de vista teórico, as contribuições tem sido muito poucas, dificultando de certa forma, a expansão das técnicas estatı́sticas envolvendo outras distribuições de probabilidade para os erros neste delineamento. 2. O método utilizado para estimar os parâmetros do modelo aqui adotado foi o dos mı́nimos quadrados. Preferiu-se esse método em detrimento do método da Máxima verossimilhança porque ele é mais simples e, sob normalidade, os dois métodos fornecem os mesmos estimadores, os quais têm excelentes propriedades; 3. Algunas estatı́sticas de teste apresentadas na Tabela 9 podem ser utilizadas para se fazer inferências marginais sobre, por exemplo, τi , µi , βj e µj , embora, na prática, não sejam rotineiramente empregadas como ferramentas em busca de achados nas 61 pesquisas cientificamente planejadas nesse tipo de delineamento; 4. Não foi encontrado na literatura nenhum trabalho que justificasse completamente a base estatı́stica que suporta as análises dos dados de um experimento em blocos completos casualizados com repetições dentro dos blocos. E, esta é, na opinião dos autores, a maior contribuição que se pode extrair deste trabalho. 5. É importante lembrar que em qualquer análise estatı́stica, onde as observações foram obtidas a partir de um experimento cientificamente planejado, deve ser adotado como regra, a validação das suposições impostas aos termos no modelo matemático utilizado para descrever as observações experimentais. As conclusões acerca dos achados na pesquisa só deverão ser consideradas verdadeiras após a comprovação estatı́stica da Aditividade, Normalidade, Homocedasticidade e Independência dos erros; 6. As análises estatı́sticas dos dados do experimento utilizado para ilustrar a teoria (β) desenvolvida, apresentaram-se adequadas e constataram que a hipótese H0 : βj = 0 não foi rejeitada, ao nı́vel de significância α = 0, 05. Isto indica que os blocos não têm efeito sobre a porcentagem de açúcar provável nas variedades de cana-de-açúcar (τ ) estudadas. Por outro lado, observou-se que a hipótese H0 : τi = 0, ∀ i, foi rejeitada ao nı́vel de significância α = 0, 01. Daı́, conclui-se que as variedades têm efeito sobre a porcentagem de açúcar provável (ou ainda, que existe pelo menos duas variedades que diferem entre si quanto a porcentagem média de açúcar provável). Ao testar a hipótese sobre o contraste entre a média de açúcar provável da variedade 2 contra a média combinada das variedades 1 e 3, verificou-se que este apresentou significância estatı́stica. Finalmente, ao confrontar as porcentagens médias de açúcar provável das variedades pelo teste de Tukey, ao nı́vel α = 0, 05, constatou-se que todas diferem estatisticamente entre si. 62 Referências BARBIN, D. Componentes de Variância - Teoria e Aplicações. 2. ed. Piracicaba - SP: FEALQ - Fundação de Estudos Agrários Luiz de Queiroz, 1993. 117 p. FERREIRA, P. V. Estatı́stica Experimental Aplicada à Agronomia. Maceió - AL: Edufal, 1996. LEAL, J. G.; PORRAS, A. M. L. Deseño estadı́stico de experimentos - Análises de la varianza. Granada - ES: Grupo Editorial Universitario, 1998. 357 p. LOVE, H. H. Introduction to Experimental Statistics. New York: Mcgraw-Hill, 1964. 174 p. MONTGOMERY, D. C. Design and Analysis of Experiments. Singapore: Posts & Telecom Press, 2007. 642 p. ROHATGI, V. K. An Introduction to Probability Theory and Mathematical Statistics. New York: John Wiley, 1976. 684 p. ROUSSAS, G. G. A Course in Mathematical Statistics. 2. ed. New York: Academic Press, 1997. 572 p. SILVA, J. G. C. da. Estatı́stica experimental: Planejamento de experimentos. Versão Preliminar, p. 130–154, 2007.