Universidade Estadual da Paraı́ba
Centro de Ciências e Tecnologia
Departamento de Estatı́stica
Bruno Henrique Gomes dos Santos
Aspectos teóricos e práticos com aplicação da análise
estatı́stica de um experimento em blocos completos
casualizados com repetições dentro dos blocos
Campina Grande
Dezembro de 2012.
Bruno Henrique Gomes dos Santos
Aspectos teóricos e práticos com aplicação
da análise estatı́stica de um experimento em
blocos completos casualizados com
repetições dentro dos blocos
Trabalho de Conclusão de Curso apresentado ao curso de Bacharelado em Estatı́stica
do Departamento de Estatı́stica do Centro
de Ciências e Tecnologia da Universidade
Estadual da Paraı́ba em cumprimento as
exigências legais para obtenção do tı́tulo de
Bacharel em Estatı́stica.
Orientador:
João Gil de Luna
Campina Grande
Dezembro de 2012.
FICHA CATALOGRÁFICA ELABORADA PELA BIBLIOTECA CENTRAL – UEPB
S237a
Santos, Bruno Henrique Gomes dos.
Aspectos teóricos e práticos com aplicação da análise
estatística de um experimento em blocos completos casualizados
com repetições dentro dos blocos [manuscrito] / Bruno Henrique
Gomes dos Santos. – 2012.
63f. : il.
Trabalho de Conclusão de Curso (Graduação em Estatística)
– Universidade Estadual da Paraíba, Centro de Ciências e
Tecnologia, 2012.
“Orientação: Prof. Dr. João Gil de Luna, Departamento de
Estatística”.
1. Estatística Experimental. 2. Probabilidade. 3. Pesquisa
Experimental. I. Título.
21. ed. CDD 519.2
Dedicatória
Dedico este trabalho a minha esposa Cida, a meu querido
filho Lucas e a minha entiada Mariana que me impulsionaram a buscar vida nova a cada dia, concedendo a mim a
oportunidade de me realizar ainda mais. Dedico também
a minha mãe Cristina, que em nenhum momento mediu
esforços para realização dos meus sonhos, que me guiou
pelos caminhos corretos, me ensinou a fazer as melhores
escolhas, me mostrou que a honestidade e o respeito são
essenciais à vida, e que devemos sempre lutar pelo que
queremos.
Obrigado!
Agradecimentos
Agradeço primeiramente a Deus por ter me dado forças para enfrentar os obstáculos
que insistiam em aparecer no decorrer dessa caminhada, fazendo-me concluir um grande
passo em minha vida.
Agradeço a minha famı́lia por terem aceito se privar de minha companhia pelos estudos, compreendendo que buscava a todo tempo o melhor para todos.
A UEPB por todos os recursos oferecidos durante o curso, conseguindo assim êxito
em todas as pesquisas.
Ao Prof. Gil pela imensa atenção e dedicação ao nosso trabalho, e o encorajamento
nos momentos difı́ceis, como também a todo conhecimento passado por ele em diversos
campos da estatı́stica. Ao Prof. Gustavo por todo aprendizado proporcionado por ele me
fazendo ter sempre confiança em trabalhos realizados extra classe.
A todos os meus colegas de classe que juntos transferiram conhecimentos para que
fosse possı́vel a conclusão do nosso curso. Que essas amizades durem tanto quanto foram
intensas.
Resumo
A pesquisa experimental é amplamente utilizada em diversas áreas do conhecimento,
para tal é desenvolvido um método em que o pesquisador intervém na amostra, impondo
deliberadamente os nı́veis de uma ou mais caracterı́sticas explanatórias com o propósito
de encontrar inferências referentes aos efeitos causais dessas caracterı́sticas sobre caracterı́sticas respostas. Essas caracterı́sticas explanatórias são denominadas caracterı́sticas
de tratamento e seus nı́veis, tratamentos. Exemplos comuns de tratamentos são diferentes
estı́mulos apresentados ou impostos a animais ou plantas, tais como diferentes dietas administradas a animais ou diferentes fungicidas aplicados a plantas. As conclusões desses
experimentos são obtidas utilizando-se da estatı́stica experimental, estatı́stica essa que
usa os dados coletados para inferir resultados com o objetivo de aprimorar ou até mesmo,
quando necessário, refazer o experimento. Neste trabalho aborda-se todo o desenvolvimento teórico dos procedimentos que dão suporte a uma análise estatı́stica dos dados de
um experimento em blocos completos casualizados de efeitos fixos e com repetições dentro
dos blocos. Será apresentado um possı́vel desenho desse tipo de experimento no campo,
juntamente com a tabela para o recolhimento dos dados, defini-se o modelo matemático
para descrever as observações experimentais, utiliza-se o método de mı́nimos quadrados
para encontrar os estimadores dos termos do modelo, apresenta-se os resultados da decomposição da variabilidade total que são organizados na tabela da análise da variância
(ANOVA), estuda-se as distribuições de probabilidade dos estimadores e por fim calcula-se
os valores esperados das somas de quadrados. Por fim, um exmplo real será utilizado para
ilustrar a metodologia, e os resultados serão discutidos e interpretados convenientemente.
Palavras-chave: Estatı́stica Experimental, Soma de Quadrados, ANOVA.
Abstract
The experimental research is widely used in various areas of knowledge, such a method
is developed in which the researcher intervenes in the sample, levels of deliberately imposing one or more characteristics explanatory in order to find causal inferences regarding
the effects of these characteristics on response characteristics. These features are termed
features explanatory treatment and its levels treatments. Examples of common treatments
are different stimuli or imposed animals or plants, such as different diets administered to
animals or applied to plant fungicides. The conclusions of these experiments are obtained
using the experimental statistics, this statistic that uses the collected data to infer results
in order to enhance or even, when necessary, redo the experiment. This paper addresses
to the entire theoretical development of procedures that support a statistical analysis
of an experiment in randomized complete block design with fixed effects and replicates
within the blocks. We will present a possible design of this type of experiment in the field,
along with the table for the collection of data, set up the mathematical model to describe
the experimental observations, we use the method of least squares estimators to find the
terms of the model presents the results of the decomposition of the total variance that are
arranged in the table analysis of variance (ANOVA) is studied probability distributions
of the estimators and finally calculates the expected values of the sums of squares. Finally, a real exmplo will be used to illustrate the methodology and results discussed and
interpreted properly.
Keywords: Experimental Statistics, Sum of Squares, ANOVA.
Sumário
1 Inrodução
p. 9
2 Fundamentação Teórica
p. 12
2.1
Um possı́vel desenho do experimento no campo . . . . . . . . . . . . .
p. 12
2.2
Organização dos dados experimentais . . . . . . . . . . . . . . . . . . .
p. 13
2.3
O Modelo matemático . . . . . . . . . . . . . . . . . . . . . . . . . . .
p. 13
2.4
Estimação dos parâmetros, dos erros e das observações . . . . . . . . .
p. 14
2.5
Decomposição da variabilidade total . . . . . . . . . . . . . . . . . . . .
p. 17
2.6
Distribuição de probabilidade dos estimadores . . . . . . . . . . . . . .
p. 21
2.6.1
Distribuição de probabilidade de ȳ... , o estimador de µ. . . . . .
p. 22
2.6.2
Distribuição de probabilidade da correção para média, C. . . . .
p. 23
2.6.3
Distribuição de probabilidade de ti , o estimador de τi . . . . . . .
p. 23
2.6.4
Distribuição de probabilidade da SQT rat . . . . . . . . . . . . . .
p. 25
2.6.5
Distribuição de probabilidade de bj , o estimador de βj . . . . . .
p. 25
2.6.6
Distribuição de probabilidade da SQBlocos . . . . . . . . . . . .
p. 27
2.6.7
Distribuições de probabilidade de mi , o estimador de µi = µ + τi ,
(a média do tratamento i) e de mj , o estimador de µj = µ + βj ,
(a média do bloco j). . . . . . . . . . . . . . . . . . . . . . . . .
p. 27
2.6.8
Distribuições de probabilidade de contrastes de interesse . . . .
p. 28
2.6.9
Distribuição de probabilidade da soma de quadrados da h-ésima
combinação linear das médias dos tratamentos . . . . . . . . . .
p. 30
2.6.10 Distribuição de probabilidade de ˆij , o estimador de ij . . . . . .
p. 31
2.6.11 Distribuição de probabilidade da SQErro Entre . . . . . . . . . . .
p. 36
2.6.12 Distribuição de probabilidade de ε̂ijr , o estimador de εijr . . . . .
p. 36
2.7
Valores Esperados das Somas de Quadrados . . . . . . . . . . . . . . .
p. 38
2.8
Comparações múltiplas das médias duas a duas . . . . . . . . . . . . .
p. 47
2.9
Análises estatı́sticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
p. 47
2.9.1
Hipóteses sobre tratamento . . . . . . . . . . . . . . . . . . . .
p. 48
2.9.2
Hipóteses sobre Bloco
. . . . . . . . . . . . . . . . . . . . . . .
p. 50
2.9.3
A tabela da ANOVA . . . . . . . . . . . . . . . . . . . . . . . .
p. 52
3 Aplicação da teoria a um exemplo real
p. 53
3.1
Descrição do conjunto de dados experimentais . . . . . . . . . . . . . .
p. 53
3.2
Cálculos das somas de quadrados e análise da variância . . . . . . . . .
p. 54
3.3
Comprovação da idoneidade do modelo . . . . . . . . . . . . . . . . . .
p. 57
4 Conclusão Final
p. 60
Referências
p. 62
9
1
Inrodução
Tem-se registros que o método experimental remonta a pelo menos 4 séculos antes de
Cristo, quando Aristóteles (384-322 a.C.) fez diversas descobertas referentes ao mundo
natural, com base em experimentos, axiomas e argumentos filosóficos, ele concluiu, por
exemplo, que a aceleração de um corpo em queda livre depende de sua massa, e que a
terra devia ser uma esfera, já que a esfera é o sólido mais ”perfeito”. Porém foi no inı́cio
do século XX com Ronald Aylmer Fisher (1890-1962), um jovem matemático do Colégio
Caius de Cambridge, que iniciou-se o desenvolvimento do ramo da estatı́stica relacionado
com o planejamento e a análise de experimentos. Fisher lançou os fundamentos modernos
da pesquisa experimental, as bases da inferência estatı́stica e delineou muitos métodos
originais para os vários problemas encontrados na Estação Experimental de Rothamsted,
onde realizava seus trabalhos e em outras instituições de pesquisa. Introduziu diversas
técnicas de análise de dados, como a análise da variação, que passou a ser amplamente
utilizada na análise estatı́stica de dados de experimentos, e a técnica de polinômios ortogonais para o uso de caracterı́sticas ambientais.
A metodologia moderna da pesquisa experimental, desenvolvida a partir dos fundamentos e idéias lançados por Fisher para a pesquisa agrı́cola, teve muitos contribuintes
em diversos paı́ses e passou a aplicar-se aos demais ramos da ciência e da tecnologia, tais
como biologia, medicina, engenharia, indústria e ciências sociais.
Como conseqüência da origem da pesquisa experimental na agricultura, muito da terminologia ainda hoje utilizada compreende termos próprios da pesquisa agrı́cola. Assim,
por exemplo, as designações ”tratamento”, ”parcela”e ”bloco”perderam suas conotações
particulares da agricultura e são amplamente usadas na pesquisa experimental em muitas
áreas da ciência (SILVA, 2007).
O delineamento em blocos ao acaso trata-se de um método para eliminar a heterogeneidade das unidades experimentais, e é o projeto mais fundamental em todos os tipos de
experimentação. Historicamente, esse delineamento foi o primeiro projeto a estimar o erro
10
experimental e a testar a significância dos efeitos dos tratamentos, apesar da heterogeneidade das unidades experimentais em que as observacões são adquiridas (LOVE, 1964).
Os delineamentos experimentais são planejados de forma que a variação ao acaso seja
reduzida o máximo possı́vel. Os principais delineamentos são: Inteiramente Casualizado,
Blocos Completos Casualizados e Quadrados Latinos.
Neste trabalho será abordado a teoria do Delineamento em Blocos Completos Casualizados com repetições dentro dos Blocos. O modelo matemático referente ao delineamento
aqui estudado, propõe que os fatores sejam com interação e de efeito fixo.
Para obtenção dos estimadores dos efeitos envolvidos no modelo, utilizou-se o metodo
da Mı́nimos Quadrados, esse método será escolhido porque é mais simples, e oferece os
mesmos estimadores do de Máxima Verossimilhança.
Objetivos
Tem-se como principal objetivo desenvolver a teoria desse tipo de delineamento e tentar elucidar problemas eventualmente existentes nos experimentos com repetições dentro
dos blocos, pois, essas teorias estatı́sticas que dão suporte as análises de dados de pesquisas
experimentais são dificilmente encontradas na literatura, com isso a pouca aplicabilidade
em pesquisas com um número razoavelmente grande de tratamentos, com tudo, o planejamento de experimento é de fundamental importância para a obteção de resultados mais
confiáveis além de proporcionar a diminuição da variabilidade e encontrar valores mais
próximos dos esperados.
Para isso será utiliado um modelo matemático com o objetivo de representar e descrever o problema aqui colocado, de um experimento em blocos com repetições dentro dos
blocos, estimando-se os termos do modelo com o uso do método de mı́nimos quadrados,
que procura encontrar o melhor ajuste para um conjunto de dados tentando-se minimizar
a soma dos quadrados das diferenças entre o valor estimado e os dados observados, com
os resultado encontrados iremos decompor a variabilidade total e por fim encontramemos
as somas de quadrados, dispostas na tabela da Análise de Variância (ANOVA).
Com base em análises estatı́sticas, será mostrado que os estimadores do modelo matemático seguem todos uma distribuições de probabilidade normal e que as somas de
quadrados seguem todas uma distribuição de probabilidade qui-quadrada, com esses definições expostas pode-se definir os valores esperados das somas de quadrado que irá ajudar
11
a definir as estatı́sticas de teste utilizadas na contrastação das hipóteses de interesse para
tratamentos e para blocos, mostrando-se que o interesse maior em um experimento como
esse é fazer inferências no efeito dos tratamentos, pois, será visto que os blocos por serem
ambientes homogênios não teram efeito sobre os tratamentos apresentados.
Será apresentado algumas estatı́sticas de teste que podem ser utilizadas para se fazer
inferências marginais para alguns estimadores de tratamentos e de blocos.
12
2
Fundamentação Teórica
O foco principal deste trabalho é apresentar de modo claro o desenvolvimento da
teoria que dar suporte as análises estatı́sticas de um experimento em blocos completos
casualizados com repetições dentro dos blocos. Neste sentido, faz-se necessário apresentar
um desenho no espaço desse tipo de experimento, bem como, sugerir a construção de uma
tabela para recolhimento das observações.
2.1
Um possı́vel desenho do experimento no campo
Para ilustrar a localização espacial das unidades experinetais levou-se em conta um
experimento com I = 3 tratamentos, J = 4 blocos e R = 2 repetições dos tratamentos
dentro de cada bloco. Com estas caracterı́sticas o experimento poderá ter o seguinte
desenho no campo:
Bloco I
Bloco II
T2
T1
T3
T1
T3
T2
T1
T3
T2
T2
T1
T3
T3
T1
T2
T3
T1
T2
T2
T3
T1
T1
T2
T3
Bloco III
Bloco IV
13
2.2
Organização dos dados experimentais
A organização dos dados coletados no campo em tabelas apropriadas, facilitará o
tratamento estatı́stico posteriormente. Neste sentido, a tabela a seguir é uma sugestão
para esta finalidade.
Tabela 1: Tabela para recolhimento dos dados no campo.
Tratamento
1
Repetição
1
2
..
.
R
1
2
..
.
2
R
y111
y112
..
.
Bloco
2
···
y121 · · ·
y122 · · ·
..
.
y11R
y11.
y211
y212
..
.
y21R
y12.
y221
y222
..
.
y22R
y22.
..
.
..
.
1
..
.
..
.
..
.
..
.
y21R
y21.
..
.
..
.
I
1
2
..
.
yI11
yI12
..
.
yI21
yI22
..
.
R
yI1R
yI1.
y.1.
yI2R
yI2.
y.2.
Soma
J
y1J1
y1J2
..
.
Soma
y1.1
y1.2
..
.
···
···
···
···
y1JR
y1J.
y2J1
y2J2
..
.
y1.R
y1..
y2.1
y2.2
..
.
···
···
y2JR
y2J.
..
.
..
.
y2.R
y2..
..
.
..
.
yIJ1
yIJ2
..
.
yI.1
yI.2
..
.
yIJR
yIJ.
y.J.
yI.R
yI..
y...
···
···
···
···
···
···
···
Em que, yijr é a observação obtida da r-ésima unidade experimental que recebeu o trataR
J P
P
mento I no bloco J, yi.. =
yijr é o total das JR observações que receberam o i-ésimo
j=1 r=1
tratamento, y.j. =
R
I P
P
yijr é a soma das IR observações do j-ésimo bloco, yij. =
i=1 r=1
R
P
r=1
yijr
é a soma das R observações oriundas das unidades experimentais que receberam o trataR
J P
I P
P
yijr é a soma de todas as observações.
mento I no bloco J e y... =
i=1 j=1 r=1
2.3
O Modelo matemático
14
O modelo matemático adequado para descrever as observações de um experimento em
blocos ao acaso com repetições dentro dos blocos é, conforme Barbin (1993), como segue:
yijr = µ + τi + βj + ij + εijr ,
no qual:



 i = 1, 2, ..., I,
j = 1, 2, ..., J,


 r = 1, 2, ..., R,
(2.1)
yijr é a observação obtida da r-ésima unidade experimental do bloco j que recebeu o
i-ésimo tratamento;
µ é a média geral;
τi é o efeito do tratamento i sobre a variável resposta, considerado fixo;
βj é o efeito do bloco j sobre a variável resposta, também considerado fixo;
ij e εijr são respectivamente, erros atribuı́dos as unidades experimentais, entre e dentro
dos blocos, ambos aleatóros, independentes e identicamente distribuı́dos como uma
normal de médias zero e variâncias σ2 e σ 2 , respectivamente os quais serão denotados
por:
iid
iid
ij ∼ N (0; σ2 ) e εijr ∼ N (0; σ 2 ).
Decorre das suposições acerca dos termos no modelo (2.1) que:
E(µ) = µ;
E(µ2 ) = µ2 ; E(τi ) = τi ;
E(βj2 ) = βj2 ; E(ij ) = 0;
E(ij εks )
E(τi2 ) = τi2 ; E(βj ) = βj ;
E(2ij ) = σ2 ; E(εijr ) = 0; E(ε2ijr ) = σ 2 ;
= E(ij )E(εks )
= 0, ∀ i 6= k ou j 6= s;
E(εijr εksv ) = E(εijr )E(εksv ) = 0, ∀ i 6= k, j 6= s ou r 6= v;
E(ij εijr )
2.4
= E(ij )E(εijr )
= 0, ∀ i, j, r.
Estimação dos parâmetros, dos erros e das observações
O conjunto de dados observados num experimento em blocos ao acaso com repetições
dentro dos blocos, podem ser escrito da seguinte forma:
15
{y111 , · · · , y11R , y121 , · · · , y12R , · · · , · · · , yIJ1 , · · · , yIJR }
e podem ser representadas pelo modelo:



 i = 1, 2, · · · , I
yijr = m + ti + bj + eij + uijr
j = 1, 2, · · · , J


 r = 1, 2, · · · , R
em que,
(2.2)
m é o estimador de µ, a média geral;
ti é o estimador de τi , o efeito do tratamento i sobre a variável resposta;
bj é o estimador de βj , o efeito do bloco j sobre a variável resposta;
eij é o estimador de ij , o erro entre blocos;
uijr é o estimador de εijr , o erro dentro dos blocos.
Como foi dito no inı́cio, o método utilizado para encontrar os estimadores dos termos
no modelo (2.2), foi o de mı́nimos quadrados, que consiste de encontrar os estimadores,
de modo que torne mı́nima a soma dos quadrados dos erros dentro dos blocos.
Do modelo (2.2), tem-se que,
uijr = yijr − m − ti − bj − eij =⇒ u2ijr = (yijr − m − ti − bj − eij )2
Somando-se para todas as observações, vem
Z=
X
ijr
u2ijr =
X
(yijr − m − ti − bj − eij )2
ijr
Derivando-se parcialmente a função Z em relação a cada estimador, igualando-se a zero e explicitando cada um deles, vem:
X
∂Z
= 2
(yijr − m − ti − bj )(−1) = 0
∂m
ijr
X
X
= y... − IJRm − JR
ti − IR
bj = 0
i
∴ IJRm + JR
X
i
ti + IR
j
X
j
bj = y...
(2.3)
16
∂Z
∂ti
= 2
X
(yijr − m − ti − bj − eij )(−1) = 0
jr
= yi.. − JRm − JRti − R
X
bj − R
j
∴ JRm + JRti + R
X
= 2
X
eij = 0
j
bj + R
j
∂Z
∂bj
X
X
eij = yi..
(2.4)
j
(yijr − m − ti − bj − eij )(−1) = 0
ir
= y.j. − IRm − R
X
ti − IRbj − R
i
∴ IRm + R
X
= 2
X
eij = 0
j
ti + IRbj + R
i
∂Z
∂eij
X
X
eij = y.j.
(2.5)
j
(yijr − m − ti − bj − eij )(−1) = 0
r
= yij. − Rm − Rti − Rbj − Reij = 0
∴ Rm + Rti + Rbj + Reij = yij.
(2.6)
O sistema formado pelas Equações de (2.3) a (2.6) é conhecido na literatura por
sistema de equações normais. Isto é,

X
X

IJRm
+
JR
t
+
IR
bj
= y...
i




i

X
Xj



+ R
bj + R
eij = yi..
 JRm + JRti



IRm







Rm
+ R
X
j
ti
+ IRbj
+ R
i
+ Rti
j
X
(2.7)
eij = y.j.
j
+ Rbj
+ Reij
= yij.
O sistema de equações em (2.7) é inconsistente, e para resolve-lo é preciso impor as
seguintes restrições:
X
i
ti =
X
j
bj =
X
i
eij =
X
j
eij =
X
ij
eij = 0.
17
Assim sendo, o sistema (2.7), fica:


IJRm




 JRm + JRt
i

IRm
+ IRbj





Rm + Rti + Rbj + Reij
= y...
= yi..
= y.j.
(2.8)
= yij.
Resolvendo o sistema (2.8) obtém-se os estimadores de mı́nimos quadrados:
m = ȳ... ;
ti = ȳi.. − ȳ... ;
bj = ȳ.j. − ȳ... ;
eij = ȳij. − ȳi.. − ȳ.j. + ȳ...
(2.9)
Além disso, tem-se que
ŷijr = m + ti + bj + eij
= ȳ... + ȳi.. − ȳ... + ȳ.j. − ȳ... + ȳij. − ȳi.. − ȳ.j. + ȳ...
= ȳij.
daı́, tem-se que ȳij. é um estimador de mı́nimos quadrados de yijr .
Fazendo-se as devidas substituições na Equação (2.2), obtém-se o estimador do erro dentro
dos blocos, isto é,
uijr = yijr − ŷijr = (yijr − ȳ... ) − (ȳi.. − ȳ... ) − (ȳ.j. − ȳ... ) − (ȳij. − ȳi.. − ȳ.j. + ȳ... ). (2.10)
Um resumo dos resultados obtidos nesta seção é apresentado na Tabela 2 a seguir.
Tabela 2: Estimadores das caracterı́sticas envolvidas no modelo matemático.
Caracterı́sticas
µ
τi
βj
ij
εijr
yijr
2.5
Estimador
µ̂ = m = ȳ...
τ̂i = ti = ȳi.. − ȳ...
β̂j = bj = ȳ.j. − ȳ...
ˆij = eij = ȳij. − ȳi.. − ȳ.j. + ȳ...
ε̂ijr = uijr = yijr − ȳij.
ŷijr = ȳij.
Decomposição da variabilidade total
18
Elevando-se ao quadrado os dois lados da Equação (2.10) e somando-se para todas as
observações, vem:
X
u2ijr =
ijr
X
[(yijr − ȳ... ) − (ȳi.. − ȳ... ) − (ȳ.j. − ȳ... ) − (ȳij. − ȳi.. − ȳ.j. + ȳ... )]2
ijr
=
X
(yijr − ȳ... )2 + JR
ijr
|
{z
(1)
+R
X
(ȳi.. − ȳ... )2 + IR
i
|
}
X
{z
(2)
(ȳij . − ȳi.. − ȳ.j. + ȳ... )2 − 2
−2
}
(yijr − ȳ... )(ȳ.j. − ȳ... ) − 2
ijr
|
|
{z
}
X
|
(yijr − ȳ... )(ȳi.. − ȳ... )
{z
}
(yijr − ȳ... )(ȳij. − ȳi.. − ȳ.j. + ȳ... )
X
{z
}
(7)
(ȳi.. − ȳ... )(ȳ.j. − ȳ... ) + 2R
X
(ȳi.. − ȳ... )(ȳij. − ȳi.. − ȳ.j . + ȳ... )
ij
{z
}
(8)
+ 2R
}
(5)
X
ij
|
{z
(3)
ijr
(6)
+ 2R
X
|
ijr
{z
(4)
X
(ȳ.j. − ȳ... )2
j
}
ij
|
X
|
{z
(9)
(ȳ.j. − ȳ... )(ȳij. − ȳi.. − ȳ.j. + ȳ... )
}
(2.11)
ij
|
{z
}
(10)
Desenvolvedo-se algebricamente os termos de (1) a (10) da expressão (2.11), obtém-se
os seguintes resultados:
(1) =
X
(yijr − ȳ... )2 =
ijr
(2) = JR
X
2
yijr
− C,
em que C =
ijr
|
{z
SQT otal
2
y...
;
IJR
}
X
1 X 2
(ȳi.. − ȳ... )2 =
y − C;
JR i i..
i
|
{z
}
SQT ratamento
(3) = IR
X
(ȳ.j. − ȳ... )2 =
j
1 X 2
y − C;
IR j .j.
{z
}
|
SQBlocos
(4) = R
X
(ȳij. − ȳi.. − ȳ.j. + ȳ... )2
ij
1 X
1 X
2
2
=
−C −
y −C −
y −C ;
R ij
JR i i..
IR j .j.
{z
}
|
{z
}
{z
}
|
|
SQT ratamento
SQP arcelas
SQBlocos
{z
}
|
1 X
2
yij.
SQErro Entre
19
(5) =
X
(yijr − ȳ... )(ȳi.. − ȳ... ) =
ijr
1 X 2
y − C;
JR i i..
|
{z
}
SQT ratamento
(6) =
1 X 2
y.j. − C ;
(yijr − ȳ... )(ȳ.j. − ȳ... ) =
IR
j
ijr
{z
}
|
X
SQBlocos
(7) =
X
(yijr − ȳ... )(ȳij. − ȳi.. − ȳ.j. + ȳ... )
ijr
=
1 X
R
|
(8) = R
ij
SQT ratamento
SQP arcelas
X
ij
= R
1 X
1 X
2
2
2
yij.
−C −
yi..
−C −
y.j.
−C ;
JR i
IR j
|
{z
}
{z
}
{z
}
|
i
X yi..
i
SQBlocos
X
X
(ȳi.. − ȳ... )(ȳ.j. − ȳ... ) = R
(ȳi.. − ȳ... )
(ȳ.j. − ȳ... )
JR
− ȳ...
X y
j
.j.
IR
− y...
j
y
y... y...
y... ...
− IR
− RJ
R
= R
IR
IJR
y JR y IJR
y... y... ...
...
=
−
−
=0
J
J
I
I
X
(9) = R
(ȳi.. − ȳ... )(ȳij. − ȳi.. − ȳ.j. + ȳ... )
ij
y... X yij.
yi..
y.j.
y... −
−
−
+
= R
JR IJR j
R
JR IR IJR
i
X yi.. y... yi..
yi..
y...
y... =
−
−J
−
+J
=0
J
IJ
R
JR IR
IJR
i
X
(10) = R
(ȳ.j. − ȳ... )(ȳij. − ȳi.. − ȳ.j. + ȳ... )
X yi..
ij
y... X yij.
yi..
y.j.
y... −
−
+
IR IJR i
R
JR IR IJR
j
X y.j. y... y.j.
y...
y.j.
y... −
−
−I
+I
=0
=
I
IJ
R
JR
IR
IJR
j
= R
X y.j.
−
Substituindo-se estes resultados em (2.11), vem
!
!
!
X
X
1 X 2
1 X 2
2
2
yijr − C +
uijr =
y −C +
y −C
JR i i..
IR j .j.
ijr
ijr
!
!
!#
"
1 X 2
1 X 2
1X 2
y −C −
y −C −
y −C
−
R ij ij.
JR i i..
IR j .j.
!
!
1 X 2
1 X 2
y −C −2
y −C
−2
JR i i..
IR j .j.
20
−2
X
u2ijr
ijr
"
1X 2
y −C
R ij ij.
!
−
1 X 2
y −C
JR i i..
!
1 X 2
y −C
IR j .j.
−
!#
+2 × 0 + 2 × !
0+2×0
!
!
X
X
X
1
1
2
2
2
yijr
−C −
yi..
−C −
y.j.
−C
=
JR
IR
ijr
i
j
"
!
!
!#
1X 2
1 X 2
1 X 2
−
y −C −
y −C −
y −C
R ij ij.
JR i i..
IR j .j.
ou,
X
2
yijr
−C
ijr
|
{z
SQT otal
=
}
1 X
1 X
2
2
y −C +
y −C
+
JR i i..
IR j .j.
ijr
|
{z
} |
{z
}
| {z }
X
u2ijr
SQT ratamento
SQErro Dentro
SQBlocos
1 X
1 X
2
2
2
yij.
−C −
yi..
−C −
y.j.
−C
+
R ij
JR i
IR j
|
{z
}
{z
}
{z
}
|
|
SQT ratamento
SQP arcelas
SQBlocos
{z
}
|
1 X
SQErro Entre
Portanto, a soma dos quadrados total é decomposta em quatro partes, a saber,
SQT otal = SQBlocos + SQT ratamentos + SQErro Entre + SQErro Dentro .
Na prática, a SQErro Dentro é calculada da seguinte maneira:
X
u2ijr
=
ijr
| {z }
SQErro Dentro
X
ijr
|
!
X
1
2
y2 − C .
yijr
−C −
R ij ij.
{z
} |
{z
}
SQT otal
!
(2.12)
SQP arcelas
Os resultados da decomposição da variabilidade total é organizada na Tabela 3, a qual
é conhecida na literatura por Tabela da Análise da Variância - ANOVA.
21
Tabela 3: Tabela da Análise da Variância - ANOVA
F.V.
Tratamento
G.L.
I −1
Blocos
J −1
S.Q.
P 2
yi.. − C
i
P
1
2
y.j.
−C
IR
Q.M.
QMT rat
1
JR
F
QMBlocos
j
Erro Entre
Parcelas
(I − 1)(J − 1)
(IJ − 1)
Erro Dentro
Total
IJ(R − 1)
IJR − 1
SQP arc − SQ
P T2rat − SQBlocos
1
yij. − C
R
QMErro Entre
-
ij
SQT otal − SQP arc
P 2
yijr − C
QMErro Entre
-
ijr
em que, os resultados da coluna 4, da Tabela 3, referentes aos Quadrados Médios
(Q.M.), são obtidos por meio da divisão dos elementos da coluna 3, (S.Q.) pelos respectivos elementos da coluna 2, (G.L.). Os elementos da coluna 5, (F), serão discutidos e
apresentados posteriormente.
2.6
Distribuição de probabilidade dos estimadores
Nesta seção será estudada as distribuições de probabilidade dos estimadores, bem
como algumas propriedades destes. Os elementos a seguir ajudarão nas demonstrações
das caracerı́sticas associadas às distribuições de probabilidade dos estimadores a serem
desenvolvidas.
yijr = µ + τi + βj + ij + εijr
e que,
E(ij ) = 0,
E(εijr ) = 0,
iid
E(2ij ) = σ2 =⇒ ij ∼ N (0; σ2 ),
iid
E(ε2ijr ) = σ 2 =⇒ εijr ∼ N (0; σ 2 ),
consequentemente, tem-se:
E(yijr ) = µ + τi + βj ,
V ar(yijr ) = σ2 + σ 2
e segue que
yijr ∼ N µ + τi + βj ; σ2 + σ 2 .
22
2.6.1
Distribuição de probabilidade de ȳ... , o estimador de µ.
1 X
1
(y111 + y112 + ... + yIJR ), que é uma combinação linear dos yijr ,
yijr =
IJR ijr
IJR
os quais seguem distribuição normal. Como sabe-se que combinação linear de variáveis
ȳ... =
normais é também normal, então ȳ... segue uma distribuição normal;
Mas, sendo
ȳ... =
1 X
1 X
yijr =
(µ + τi + βj + ij + εijr )
IJR ijr
IJR ijr
1
=
IJR
= µ+
IJRµ + JR
X
τi + IR
i
X
βj + R
j
1 X
1 X
ij +
εijr ,
IJ ij
IJR ijr
X
ij
ij +
X
ijr
εijr
!
as caracterı́sticas da distribuição de ȳ... serão determinadas como segue:
!
X
1 X
1 X
1
yijr =
E
E (yijr ) =
(µ + τi + βj )
E(ȳ... ) =
IJR
IJR ijr
IJR ijr
ijr
!
X
X
1
=
IJRµ + JR
τi + IR
βj ,
IJR
i
j
mas por definição µ é a média geral e, portanto, cumpre-se que
X
i
τi =
X
βj = 0,
j
logo,
E(ȳ... ) = µ.
Além disso,
V ar(ȳ... ) = E[ȳ... − E(ȳ... )]2 = E[ȳ... − µ]2
#2
"
1 X
1 X
ij +
εijr − µ
= E µ+
IJ ij
IJR ijr
#2
"
1 X
1 X
= E
ij +
εijr
IJ ij
IJR ijr
2
1
1
(11 + ... + IJ ) +
(ε111 + ... + εIJR )
= E
IJ
IJR
(2.13)
23
h 1
(2 + ... + 2IJ + dp)
I 2 J 2 11
i
1
+ 2 2 2 (ε2111 + ... + ε2IJR + dp) + dp
I J R
1
1
= 2 2 (σ2 + ... + σ2 + 0) + 2 2 2 (σ 2 + ... + σ 2 + 0) + 0
I J
I J R
1
σ2
1
σ2
2
2
= 2 2 IJσ + 2 2 2 IJRσ =
+
I J
I J R
IJ IJR
= E
e segue que
1 2
σ + Rσ2 .
IJR
(2.14)
1
2
2
µ;
(σ + Rσ ) .
IJR
(2.15)
V ar(ȳ... ) =
Portanto,
ȳ... ∼ N
Obs.: dp = duplos produtos da equação.
2.6.2
Distribuição de probabilidade da correção para média, C.
A distribuição de probabilidade de C é obtida do seguinte modo:
Sendo,
ȳ... ∼ N
1
(σ 2 + Rσ2 )
µ;
IJR
=⇒ r
ȳ... − µ
σ 2 + Rσ2
IJR
∼ N (0; 1).
Assim, sob H0 : µ = 0
ȳ − 0
q...
∼ N (0; 1) =⇒
σ 2 +Rσ2
IJR
Isto é, a estatı́stica
C
σ 2 +Rσ2
2
ȳ...
σ 2 +Rσ2
IJR
segue uma distribuição de qui-quadrado com 1 grau de liberdade
e será denotado por:
σ2
em que C =
2.6.3
2
y...
IJR y... y...
IJR
=
∼ χ2(1) .
= 2 IJR IJR
2
2
2
σ + Rσ
σ + Rσ
C
∼ χ2(1) ,
+ Rσ2
(2.16)
2
y...
.
IJR
Distribuição de probabilidade de ti , o estimador de τi .
Para se obter a distribuição de probabilidade do estimador do efeito do i-ésimo tra-
24
tamento pode ser usado o seguinte procedimento:
1 X
1 X
yijr −
yijr , que é uma combinação linear dos yijr
JR jr
IJR ijr
que segue uma distribuição normal e, portanto, ti é normal.
ti = ȳi.. − ȳ... =
Além disso,
ti

0 X
X
X
1 
=
βj + R
ij +
εijr 
JRµ + JRτi + R
JR
j
j
ijr


0 X
0
X
X
X
1 
−
IJRµ + JR
βj + R
ij +
εijr 
τ
i + IR
IJR
j
ij
ijr
i
!
!
1X
1 X
1 X
1 X
=
µ + τi +
ij +
εijr − µ +
ij +
εijr
J j
JR jr
IJ ij
IJR ijr
1 X
1 X
1 X
1X
ij +
εijr −
ij −
εijr .
= τi +
J j
JR jr
IJ ij
IJR ijr

Portanto,
E(ti ) = τi .
(2.17)
Além disso, tem-se que
V ar(ti ) = E[ti − E(ti )]2
h
i2
1X
1 X
1 X
1 X
= E τi +
ij +
εijr −
ij −
εijr − τi
J j
JR jr
IJ ij
IJR ijr
i2
h1 X
1 X
1 X
1 X
ij +
εijr −
ij −
εijr
= E
J j
JR jr
IJ ij
IJR ijr
h 1 X 2
2
1 X
1 X 2
= E 2
ij + 2 2
εijr + 2 2
ij
J
J R jr
I J
j
ij
2
2 X X
2 X X 1 X
εijr + 2
ij
ij
ij
εijr − 2
+ 2 2 2
I J R ijr
J R j
IJ
j
ij
jr
X 2 X
2 X X
ij
εijr
εijr − 2
ij
− 2
IJ R j
IJ R jr
ijr
ij
X
i
2 X
2 X X
− 2 2
εijr
εijr + 2 2
ij
εijr
IJ R
I J R ij
ij
ijr
ijr
σ2
σ2
σ2
σ2
σ2
σ2
σ2
σ2
σ2
σ2
+
+ +
−2 −2
= +
− −
J
JR IJ IJR
IJ
IJR
J
JR IJ
IJR
i
1 h
1
2
2
2
2
2
2
(IRσ − Rσ + Iσ − σ ) =
=
R(I − 1)σ + (I − 1)σ
IJR
IJR
(I − 1) 2
(σ + Rσ2 ).
=
IJR
=
25
Portanto,
V ar(ti ) =
Assim sendo, conclui-se que
(I − 1) 2
σ + Rσ2 .
IJR
(2.18)
(I − 1) 2
t i ∼ N τi ;
σ + Rσ2 .
IJR
Ou seja, ti , tem distribuição normal com média τi e variância
(2.19)
(I−1)
IJR
(σ 2 + Rσ2 ), para
todo i = 1, 2, · · · , I.
2.6.4
Distribuição de probabilidade da SQT rat .
A partir dos resultados da subseção anterior resumida na expressão (2.19) deduz-se
que,
Z=q
ȳi .. − ȳ... − τi
=q
∼ N (0; 1)
(I−1)
(I−1)
2 + Rσ 2 )
2 + Rσ 2 )
(σ
(σ
IJR
IJR
t i − τi
e sob a hipótese de que os tratamentos não têm efeitos sobre a variável resposta, Y , isto
é, sob H0 : τ1 = τ2 = ... = τI = 0, então,
ȳi .. − ȳ...
e
q
(I−1)
(σ 2
IJR
∼ N (0; 1) =⇒
+ Rσ2 )
(ȳi .. − ȳ...)2
(I−1)
(σ 2
IJR
+ Rσ2 )
∼ χ2(1)
(I − 1) 2
JR(ȳi .. − ȳ...)2
JR(ȳi .. − ȳ...)2
∼
∼ χ2(1) ⇒
χ(1) ⇒
(I − 1) 2
σ 2 + Rσ2
I
2
(σ + Rσ )
I
P
JR i (ȳi .. − ȳ...)2
∼ (I − 1)χ2(1) .
σ 2 + Rσ2
Portanto,
JR
P
i (ȳi .. − ȳ...)
2
σ + Rσ2
2
=
SQT rat
∼ χ2(I−1) .
σ 2 + Rσ2
(2.20)
Em palavras, a soma de quadrados devida aos tratamentos dividida por σ 2 + Rσ2 é
distribuı́da como uma qui-quadrado com (I − 1) graus de liberdade.
2.6.5
Distribuição de probabilidade de bj , o estimador de βj .
26
Para se obter a distribuição de probabilidade do estimador do efeito do j-ésimo bloco
pode ser usado o seguinte procedimento:
1 X
1 X
yijr −
yijr , é uma combinaçãao linear dos yijr os
IR ir
IJR ijr
quais seguem uma distribuição normal portanto, bj também é normal;
bj = ȳ.j. − ȳ... =
Além disso,

0
X
X
X
1 
IRµ + R
τ
ij +
εijr 
=
i + IRβj + R
IR
i
i
ijr


0
0
X X
X
X
1 
−
IJRµ + JR
βj + R
ij +
εijr 
τi + IR
IJR
j
ij
ijr
i

bj
1X
1 X
1 X
1 X
ij +
εijr − µ −
ij −
εijr
I i
IR ir
IJ ij
IJR ijr
1 X
1 X
1 X
1X
ij +
εijr −
ij −
εijr
= βj +
I i
IR ir
IJ ij
IJR ijr
= µ + βj +
Portanto
E(bj ) = βj .
(2.21)
Além disso, tem-se que
V ar(bj ) = E[bj − E(bj )]2
#2
"
1 X
1 X
1 X
1X
ij +
εijr −
ij −
εijr − βj
= E βj +
I i
IR ir
IJ ij
IJR ijr
!2
!2
!2
X
X
1 X
1
1
= E 2
ij + 2 2
εijr + 2 2
ij
I
I R
I J
i
ir
ij
!
!
!2
X
X
X
1
2
+ 2 2 2
ij − dp
ij
εijr + dp − 2
I J R
I J
ij
i
ijr
!
!
X
X
2
−dp + 2 2
εijr + dp
εijr
I JR
ijr
ir
σ2
σ2
σ2
σ2
σ2
σ2
+
+ +
−2 −2
I
IR IJ IJR
IJ
IJR
σ2
σ2
σ2
σ2
=
+
−
−
I
IR IJ
IJR
1
1
(JRσ2 + Jσ 2 − Rσ2 − σ 2 ) =
(R(J − 1)σ2 + (J − 1)σ 2 )
=
IJR
IJR
=
27
Portanto
V ar(bj ) =
Com isso, obtém-se
bj ∼ N
J −1 2
(σ + Rσ2 ).
IJR
J −1 2
2
βj ;
(σ + Rσ ) .
IJR
(2.22)
(2.23)
Ou seja, o estimador bj do efeito do bloco j segue uma distribuição normal com média
βj e variância
2.6.6
J−1
(σ 2
IJR
+ Rσ2 ).
Distribuição de probabilidade da SQBlocos
Como já se sabe, bj ∼ N
J −1 2
2
βj ;
(σ + Rσ ) . Portanto, é possı́vel deduzir que
IJR
ȳ.j. − ȳ... − βj
bj − E(bj )
p
=r
∼ N (0; 1).
V ar(bj )
J −1 2
2
(σ + Rσ )
IJR
Assim, sob H0 : β1 = β2 = ... = βj = 0,
ȳ.j. − ȳ...
r
∼ N (0; 1) =⇒
J −1 2
(σ + Rσ2 )
IJR
IR(ȳ.j. − ȳ... )2
(J − 1) 2
∼
χ(1)
2
2
σ + Rσ
J
Portanto,
IR
X
(ȳ.j. − ȳ... )2
∼ χ2(1) ⇒
J −1 2
2
(σ + Rσ )
IJR
(ȳ.j. − ȳ... )2
j
σ 2 + Rσ2
=
SQBlocos
∼ χ2(J−1)
σ 2 + Rσ2
(2.24)
ou seja, a soma de quadrados de blocos dividida por (σ 2 + Rσ2 ) segue uma distribuição
de qui-quadrado com (J − 1) graus de liberdade.
2.6.7
Distribuições de probabilidade de mi , o estimador de µi =
µ + τi , (a média do tratamento i) e de mj , o estimador de
µj = µ + βj , (a média do bloco j).
Sabe-se que mi , o estimador da média do i-ésimo tratamento, µi = µ + τi , é definido
por
mi = m + ti = ȳ... + ȳi.. − ȳ... = ȳi.. =
1 X
yijr
JR j,r
28
que é uma combinação linear dos yijk ’s os quais seguem uma distribuição normal e, portanto, mi também é normal. Continuando-se o desenvolvimento algébrico de mi , vem


0 X
X
X
X
1
1 
mi =
βj + R
ij +
εijr 
JRµ + JRτi + R
yijr =
JR j,r
JR
j
j
j,r
= µi +
1X
1 X
ij +
εijr .
J j
JR j,r
(2.25)
O valor esperado de mi é então
E(mi ) = E
1X
1 X
µi +
ij +
εijr
J j
JR j,r
!
= µi
(2.26)
Por outro lado, a variância de mi pode ser obtida como,
#2
"
X
X
1
1
ij +
εijr − µi
V ar(mi ) = E[mi − E(mi )]2 = E µi +
J j
JR j,r
1
1 2
2
2
2
= E 2 (i1 + · · · + 1J + dp) + 2 2 (εi11 + · · · + εiJR + dp) + odp
J
J R
J 2
JR
1
=
σ + 2 2 σ 2 =
(σ 2 + Rσ2 ).
(2.27)
2
J
J R
JR
Assim sendo, conclui-se que
iid
mi ∼ N
1
2
2
(σ + Rσ ) , i = 1, 2, · · · , I.
µi ,
JR
(2.28)
Daı́, conclui-se que o estimador da média do i-ésimo tratamento segue uma disribuição
normal de média µi e variância
1
(σ 2
IR
+ Rσ2 ).
Por procedimento análogo, obtém-se a distribuição de probabilidade de mj , ou seja,
1 2
iid
2
(σ + Rσ ) , j = 1, 2, · · · , J.
(2.29)
m j ∼ N µj ,
IR
E, conclui-se que o estimador da média do j-ésimo bloco segue uma disribuição normal
com média µj e variância
2.6.8
1
(σ 2
IR
+ Rσ2 ).
Distribuições de probabilidade de contrastes de interesse
Dois resultados de grande interesse neste trabalho diz respeito as distribuições de
probabilidade dos estimadores de combinações lineares das médias dos tratamentos ou dos
29
blocos, Ψ̂h =
I
P
chi mi ou Ψ̂h =
J
P
chj mj , respectivamente, em que
j=1
i=1
P
i chi =
P
j
chj = 0.
Aqui, serão apresentadas as demonstrações relativas as combinações lineares de médias
dos tratamentos e intuitivamente serão apresentados os resultados para uma combinação
linear de médias dos blocos. Considere o estimador de uma combinação linear das médias
dos tratamentos
Ψ̂h =
I
X
chi mi =
i=1
I
X
chi ȳi.. =
i=1
X
chi
i
1 X
yijr
JR j,r
que é uma combinação linear de variáveis normais e, portanto, Ψ̂h também segue uma
distribuição normal.
Continuando-se o desenvolvimento algébrico, vem
Ψ̂h =
I
X
chi
i=1
=
I
X
i=1
=
I
X
i=1
1 X
yijr
JR j,r


0
7
J J
X
X
X

1 


βj + R
JRµ
+
JRτ
+
R
+
ε
chi
i
ij
ijr

JR 
j=1
j=1
j,r
chi
J
1 X
1X
ij +
εijr
µi +
J j=1
JR j,r
!
.
(2.30)
Daı́, o valor esperado do estimador Ψ̂h , fica
" I
!#
J
I
X
X
1X
1 X
E(Ψ̂h ) = E
chi µi +
=
ij +
chi µi
εijr
J j=1
JR j,r
i=1
i=1
Para obter a variância do estimador Ψ̂h procedeu-se do seguinte modo
V ar(Ψ̂h ) = E[Ψ̂h − E(Ψ̂h )]2
2

I
I
I
J
I
X
X
X
X
X
X
1
1
chi µi 
chi µi +
chi
εijr −
ij +
= E
chi
J
JR
i=1
i=1
i=1
j,r
j=1
i=1
#
" I
2
J
I
X 1X
X
1 X
= E
εijr
chi
ij +
chi
J
JR
j,r
i=1
j=1
i=1
!
!#2
"
I
I
I
I
X
X
X
1
1 X
chi i1 + · · · +
chi εi11 + · · · +
chi iJ +
chi εiJR
= E
J i=1
JR
i=1
i=1
i=1
"
!
!#
I
I
X
X
1
1
2
2
2
c
=
Jσ
JRσ
c2hi
+
hi
2
2
2
J
J R
i=1
i=1
30
=
I
I
X
1 2
1 2 X 2
1
2
2
σ +
σ
chi =
(σ + Rσ )
c2hi .
J
JR
JR
i=1
i=1
(2.31)
Assim sendo, conclui-se que o estimador de um contraste das médias dos tratamentos
I
P
h
chi µi e variância K
segue uma distribuição normal com média Ψh =
(σ 2 + Rσ2 ), em
JR
i=1
que Kh é a soma dos quadrados dos coeficientes do contraste h, isto é, Kh =
I
P
i=1
denotado por
Ψ̂h ∼ N
I
X
i=1
Kh 2
(σ + Rσ2 )
chi µi ,
JR
!
c2hi e será
(2.32)
Usando um procedimento análogo, demonstra-se que o estimador de um contraste das
J
P
chj µj e variância
médias dos blocos segue uma distribuição normal com média Ψh =
j=1
Kh
(σ 2
IR
+
Rσ2 )
o qual será denotado como
Ψ̂h ∼ N
!
Kh 2
chj µj ,
(σ + Rσ2 ) ,
IR
j=1
J
X
(2.33)
em que Kh é a soma dos quadrados dos coeficientes do contraste h, isto é, Kh =
J
P
j=1
2.6.9
c2hj .
Distribuição de probabilidade da soma de quadrados da
h-ésima combinação linear das médias dos tratamentos
Foi demonstrado que a distribuição de probabilidade de Ψ̂h =
I
P
chi ȳi.. , o estimador do
i=1
h-ésimo contraste de médias dos tratamentos, Ψh =
I
P
chi µi é, de acordo com a expressão
i=1
(2.32), distribuı́da como
Ψ̂h ∼ N
I
X
i=1
!
Kh 2
chi µi ,
(σ + Rσ2 ) .
JR
Usando resultados conhecidos da teoria de probabilidade, deduz-se que
I
P
chi µi
chi ȳi.. −
Ψ̂h − E(Ψ̂h )
i=1
i=1
q
= q
∼ N (0, 1).
Kh
Kh
2 + Rσ 2 )
2 + Rσ 2 )
(σ
(σ
JR
JR
I
P
(Ψ)
e, sob a hipóteses de que o contraste h é nulo, isto é, sob H0
: Ψh =
I
P
i=1
chi µi = 0, a
31
estatı́stica
q
e segue que
I
P
chi ȳi..
i=1
Kh
(σ 2
JR
2
+ Rσ2 )
=
I
P
JRKh
chi ȳi..
i=1
Kh
(σ 2
JR
chi yi..
i=1
(σ 2
em que, SQContraste = SQ(Ψ̂h ) =
2.6.10
I
P
+
∼ N (0, 1)
+ Rσ2 )
2
Rσ2 )
I
P
chi yi..
i=1
=
SQ(Ψ̂h )
SQContraste
= 2
∼ χ2(1)
2
2
σ + Rσ
σ + Rσ2
!2
JRKh
e Kh =
I
P
i=1
(2.34)
c2hi .
Distribuição de probabilidade de ˆij , o estimador de ij .
Um outro resultado útil diz respeito a distribuição de probabilidade de ˆij , o estimador
do erro entre parcelas, o qual pode ser obtido utilizando-se o seguinte procedimento:
ˆij = ȳij. − ȳi.. − ȳ.j. + ȳ... =
1 X
1 X
1 X
1X
yijr −
yijr −
yijr +
yijr ,
R r
JR jr
IR i
IJR ijr
como pode-se observar, ˆij é uma combinação linear dos yijr os quais seguem distribuição
normal. Portanto, ˆij também segue uma distribuição normal. É necessário agora, saber
quais as caracterı́sticas da distribuição de ˆij .
E(ˆij ) =
1X
1 X
E(µ + τi + βj + ij + εijr ) −
E(µ + τi + βj + ij + εijr )
R r
JR jr
1 X
1 X
−
E(µ + τi + βj + ij + εijr ) +
E(µ + τi + βj + ij + εijr )
IR ir
IJR ijr
1
1
(Rµ + Rτi + Rβj ) −
(JRµ + JRτi + Rβj )
R
JR
X
X
1
1
− (IRµ + Rτi + IRβj ) +
(µ + JR
τi IR
+βj )
IR
IJR
i
j
1X
1X
1X
1X
βj − µ −
τi − βj + µ +
τi +
βj .
= µ + τi + βj − µ − τi −
J j
I i
I i
J j
=
Portanto,
E(ˆij ) = 0.
32
Além disso,
V ar(ˆij ) = E[ȳij. − ȳi.. − ȳ.j. + ȳ... ]2
"
#2
X
X
X
X
1
1
1
1
= E
yijr −
yijr −
yijr +
yijr
R r
JR jr
IR ir
IJR ijr
!2
!2
!2
h 1 X
X
X
1
1
yijr + 2 2
yijr + 2 2
yijr
= E 2
R
J
R
I
R
r
jr
ir
|
{z
} |
{z
}
{z
} |
(1)
(3)
(2)
!2
X
1
2
+ 2 2 2
yijr −
I J R
JR2
ijr
{z
} |
|
X
(4)
2
+
IJR2
|
X
(1) =
{z
X
yijr
ijr
(7)
2
− 2 2
IJ R
|
onde,
yijr
r
!
X
yijr
jr
{z
!
X
(9)
{z
X
!
2
+
IJR2
} |
X
2
− 2 2
I JR
} |
2
2
X
r
!
{z
2
−
IR2
} |
X
yijr
ir
(8)
!
E 2 2
=
(R µ + R2 τi2 + R2 βj2 + R2 2ij +
R2
yijr
jr
X
1
E(Rµ
+
Rτ
+
Rβ
+
R
+
εijr )2
i
j
ij
R2
r
2
yijr
jr
!
(5)
yijr
ijr
yijr
r
!
εijr
X
yijr
ir
!
{z
(10)
X
ijr
X
r
yijr
!
{z
(6)
!
}
yijr
!
i
}
!2
+2R µτi + 2R µβj + 2R τi βj + dp)
1
= µ2 + τi2 + βj2 + σ2 + σ 2 + 2µτi + 2µβj + 2τi βj
R
0 X
X X
>
1
E(JRµ
+
JRτ
+
R
β
+
R
+
εijr )2
(2) =
i
j
ij
J 2 R2
j
jr
j
!2
!2
X
X
E
εijr + 2J 2 R2 µτi + dp)
(J 2 R2 µ2 + J 2 R2 τi2 + R2
ij +
=
J 2 R2
jr
j
= µ2 + τi2 +
1 2
1 2
σ +
σ + 2µτi
J
JR
X 0
X
X
1
τi + IRβj + R
ij +
εijr )2
(3) = 2 2 E(IRµ + R
I R
i
i
ir
X
ir
yijr
!
}
33
E
= 2 2 [I 2 R2 µ2 + I 2 R2 βj2 + R2
I R
X
ij
i
!2
X
+
ir
εijr
!
+ 2I 2 R2 µβj ]
1 2
1
σ + 2µβj
= µ2 + βj2 σ2 +
I
IR
0 X
X 0
X X
>
1
(4) = 2 2 2 E[IJRµ + JR
τi + IRR βj + R
ij +
εijr ]2
I J R
j
i
ij
ijr
!2
!
2
X
X
E
εijr + dp]
= 2 2 2 [I 2 J 2 R2 µ2 + R2
ij +
I J R
ijr
ij
= µ2 +
1 2
1 2
σ +
σ
IJ
IJR
0
X
X >
1
E[(Rµ + Rτi + Rβj + Rij +
εijr )(JRµ + JRτi + R βj
(5) =
JR2
r
j
X
X
+R
ij +
εijr )]
j
jr
1
E[JR2 µ2 + JR2 µτi + JR2 µτi + JR2 τi2 + JR2 µβj
=
2
JR
!
!
!
X
X
X
εijr + dp]
εijr
ij +
+JR2 τi βj + R2 ij
r
j
jr
1
(JR2 µ2 + 2JR2 µτi + JR2 τi2 + JR2 µβj + JR2 τi βj + R2 σ2 + Rσ 2 )
JR2
1
1 2
= µ2 + τi2 + 2µτi + µβj + τi βj + σ2 +
σ
J
JR
X
X 0
1
(6) =
E[(Rµ + Rτi + Rβj + Rij +
εijr )(IRµ + R
τi
IR2
r
i
X
X
+IRβj + R
ij +
εijr )]
=
i
ir
1
E[IR2 µ2 + IR2 µβj + IR2 µτi + IR2 τi βj + IR2 µβj
=
IR2
!
!
!
X
X
X
εijr + dp]
εijr
ij +
+IR2 βj2 + R2 ij
i
r
ir
1
=
(IR2 µ2 + 2IR2 µβj + IR2 µτi + IR2 τi βj + IR2 βj2 + R2 σ2 + Rσ 2 )
IR2
1
1 2
= µ2 + βj2 + 2µβj + µτi + τi βj + σ2 +
σ
I
IR
X
X
1
E[(Rµ
+
Rτ
+
Rβ
+
R
+
ε
)(IJRµ
+
JR
τi
(7) =
i
j
ij
ijr
IJR2
r
i
0
34
0 X
X >
X
+IRR βj + R
ij +
εijr )]
j
ij
ijr
1
=
E[IJR2 µ2 + IJR2 µτi + IJR2 µβj + R2 ij
IJR2
!
!
X
X
+
εijr + dp]
εijr
r
X
ij
ij
!
ijr
1
(IJR2 µ2 + IJR2 µτi + IJR2 µβj + R2 σ2 + σ 2 )
2
IJR
1 2
1 2
= µ2 + µτi + µβj +
σ +
σ
IJ
IJR
0 X
X X
X 0
>
1
(8) =
E[(JRµ
+
JRτ
+
R
β
+
R
+
ε
)(IRµ
+
R
τi
i
ij
ijr
j
IJR2
j
j
jr
i
X
X
+IRβj + R
ij +
εijr )]
=
i
ir
1
E[IJR2 µ2 + IJR2 µβj + IJR2 µτi + IJR2 τi βj + R2
=
IJR2
!
!
X
X
εijr + dp]
εijr
+
jr
X
ij
j
!
X
ir
1
=
(IJR2 µ2 + IJR2 µτi + IJR2 µβj + IJR2 τi βj + R2 σ2 + σ 2 )
IJR2
1 2
1 2
= µ2 + µτi + µβj + τi βj +
σ +
σ
IJ
IJR
0 X
X X
>
1
E[(JRµ
+
JRτ
+
R
β
+
R
+
εijr )(IJRµ
(9) =
i
j
ij
IJ 2 R2
j
j
jr
X 0 X
X
X 0
+JR
βj + R
ij +
εijr )]
τi + IR
i
j
ij
1
E[IJ 2 R2 µ2 + IJ 2 R2 µτi + R2
=
IJ 2 R2
!
!
X
X
εijr + dp]
εijr
+
jr
ijr
X
j
ij
!
X
ij
ij
!
ijr
1
(IJ 2 R2 µ2 + IJ 2 R2 µτi + JR2 σ2 + JRσ 2 )
IJ 2 R2
1 2
1 2
= µ2 + µτi +
σ +
σ
IJ
IJR
=
(10) =
X 0
X
X
1
E[(IRµ
+
R
τ
+
IRβ
+
R
+
εijr )(IJRµ
i
j
ij
I 2 JR2
i
i
ir
j
ij
!
35
X 0 X
X
X 0
+JR
βj + R
ij +
εijr )]
τi + IR
i
j
ij
1
= 2 2 E[I 2 JR2 µ2 + I 2 JR2 µβj + R2
I JR
!
!
X
X
εijr + dp]
εijr
+
1
I 2 JR2
X
j
ij
!
X
ij
ij
!
ijr
ir
=
ijr
(I 2 JR2 µ2 + I 2 JR2 µβj + IR2 σ2 + IRσ 2 )
= µ2 + µβj +
1 2
1 2
σ +
σ
IJ
IJR
Agora,
1 2
σ + 2µτi + 2µβj + 2τi βj
R
1
1 2
+µ2 + τi2 + σ2 +
σ + 2µτi
J
JR
1 2
1 2
1 2
1
σ + 2µβj + µ2 +
σ +
σ
+µ2 + βj2 + σ2 +
I
IR
IJ
IJR
2
2 2
−2µ2 − 2τi2 − 4µτi − 2µβj − 2τi βj − σ2 −
σ
J
JR
2
2 2
−2µ2 − 2βj2 − 4µβj − 2µτi − 2τi βj − σ2 −
σ
I
IR
2 2
2 2
σ −
σ
−2µ2 − 2µτi − 2µβj −
IJ
IJR
2 2
2 2
+2µ2 + 2µτi + 2µβj + 2τi βj +
σ +
σ
IJ
IJR
2 2
2 2
2 2
2 2
−2µ2 − 2µτi −
σ −
σ − 2µ2 − 2µβj −
σ −
σ
IJ
IJR
IJ
IJR
V ar(ˆij ) = 0µ2 + 0τi2 + 0βj2 + 0µτi + 0µβj + 0τi βj
1
2
2
2
2
2
2
1 1
σ2
− − −
+
−
−
+ 1+ + +
J I IJ
J
I
IJ IJ
IJ
IJ
1
1
1
1
2
2
4
4
+
σ2
+
+
+
−
−
+
−
R JR IR IJR JR IR IJR IJR
V ar(ˆij ) = µ2 + τi2 + βj2 + σ2 +
1
1
1
1
1
1
1
2
−
−
+
σ +
σ2
V ar(ˆij ) =
1− − +
J
I IJ
R JR IR IJR
1
1
=
(IJ − I − J + 1)σ2 +
(IJ − I − J + 1)σ 2
IJ
IJR
1
1
=
(J(I − 1) − (I − 1))σ2 +
(J(I − 1) − (I − 1))σ 2
IJ
IJR
(I − 1)(J − 1) 2 (I − 1)(J − 1) 2
σ +
σ
=
IJ
IJR
(I − 1)(J − 1)
V ar(ˆij ) =
(Rσ2 + σ 2 ).
IJR
36
Assim sendo, conclui-se que
ˆij = ȳij. − ȳi.. − ȳ.j. + ȳ... ∼ N
(I − 1)(J − 1) 2
2
0;
(σ + Rσ ) ,
IJR
(2.35)
ou seja, o estimador do erro entre, ˆij , é distribuı́do como uma normal de média zero e
variância
2.6.11
(I−1)(J−1)
(σ 2
IJR
+ Rσ2 ).
Distribuição de probabilidade da SQErro Entre .
Partindo da expressão (2.35) e lembrando dos resultados da teoria de probabilidade
para a distribuição normal padrão, vem
ˆij − E(ˆij )
r
(I − 1)(J − 1) 2
(σ + Rσ2 )
IJR
∼ N (0; 1)
ou
ȳ − ȳi.. − ȳ.j. + ȳ... − 0
(ȳij. − ȳi.. − ȳ.j. + ȳ... )2
r ij.
∼ N (0; 1) ⇒
∼ χ2(1) ⇒
(I
−
1)(J
−
1)
(I − 1)(J − 1) 2
(σ 2 + Rσ2 )
(σ + Rσ2 )
IJR
IJR
(I − 1)(J − 1) 2
(ȳij. − ȳi.. − ȳ.j. + ȳ... )2
=
χ(1) ⇒
2
2
σ + Rσ
IJR
P
Portanto,
ijr (ȳij.
− ȳi.. − ȳ.j. + ȳ... )2
SQErro Entre
IJR(I − 1)(J − 1) 2
=
=
χ(1) .
2
2
2
2
σ + Rσ
σ + Rσ
IJR
SQErro Entre
∼ χ2[(I−1)(J−1)] .
2
2
σ + Rσ
(2.36)
Em palavras, a soma de quadrados do erro entre parcelas dividida por σ 2 + Rσ2 tem uma
distribuição de qui-quadrado com (I − 1)(J − 1) graus de liberdade.
2.6.12
Distribuição de probabilidade de ε̂ijr , o estimador de εijr .
Finalmente, as caracterı́stcas da distribuição do estimador do erro dentro, ε̂ijr , é
obtido a partir da expressão (2.10), isto é,
ε̂ijr = yijr − ŷijr = (yijr − ȳ... ) − (ȳi.. − ȳ... ) − (ȳ.j. − ȳ... ) − (ȳij. − ȳi.. − ȳ.j. + ȳ... )
37
na qual pode-se observar que ε̂ijr é uma combinação linear dos yijr ’s os quais seguem
distribuição normal. Portanto, ε̂ijr também segue uma distribuição normal. Isto posto, é
necessário, agora, saber quais as caracterı́sticas da distribuição de ε̂ijr .
"
#
1X
E(ε̂ijr ) = E yijr −
yijr
R r
= E µ + τi + βj + ij + εijr
X
1
Rµ + Rτi + Rβj + Rij +
εijr
−
R
r
"
#
1X
εijr .
= E µ + τi + βj + ij + εijr − µ − τi − βj − ij −
R r
Logo,
#
1X
εijr = 0.
E(ε̂ijr ) = E εijr −
R r
"
Além do mais,
"
#2
1X
V ar(ε̂ijr ) = [ε̂ijr − E(ε̂ijr )] = E εijr −
εijr
R r


!2
X
X
1
2
= E ε2ijr + 2
εijr − εijr
εijr 
R
R
r
r
2
= σ2 +
1
E(ε2ij1 + ε2ij2 + ... + ε2ijR + dp)
R2
2
− E[εijr (εij1 + εij2 + ... + εijr + ... + εijR )]
R
σ2
1
R 2 2 2
2
2
= (R − 1)σ 2
= σ + 2σ − σ = σ −
R
R
R
R
(R − 1) 2
V ar(ε̂ijr ) =
σ .
R
Portanto,
ε̂ijr = (yijr − ŷijr ) = yijr − ȳij . ∼ N
(R − 1) 2
0;
σ .
R
Isto é, o estimador do erro dentro, ε̂ijr , segue uma distribuição normal com média zero e
variância
(R−1) 2
σ .
R
38
Além disso,
yijr − ȳij. − 0
(yijr − ȳij. )2
r
∼ χ2(1) ⇒
∼ N (0; 1) ⇒
(R
−
1)
(R − 1) 2
σ2
σ
R
R
X
(yijr − ȳij. )2
R−1 2
IJR(R − 1) 2
(yijr − ȳij. )2
ijr
∼
χ(1) ⇒
∼
χ(1) .
2
2
σ
R
σ
R
Portanto,
2.7
P
ijr (yijr −
σ2
ȳij. )2
=
SQErro Dentro
∼ χ2[IJ(R−1)] .
σ2
(2.37)
Valores Esperados das Somas de Quadrados
Os valores esperados dos quadrados médios são argumentos importantes para a compreenção da escolha das estatı́sticas de teste utilizadas na contrastação das hipóteses de
interesse. Nesta seção serão abordados detalhadamente como estes resultados são obtidos.
Viu-se, na seção 2.5, que a soma de quadrados total é decomposta em partes componentes cujas expressões são dadas a seguir.
y...2
IJR
ijr
X
1 X 2
= JR
(ȳi.. − ȳ... )2 =
y −C
JR i i..
i
X
1 X 2
y −C
= IR
(ȳ.j. − ȳ... )2 =
IR j .j.
j
X
1X 2
y −C
= R
(ȳij. − ȳ... )2 =
R ij ij.
ij
SQT otal =
SQT rat
SQBlocos
SQP arcelas
X
2
yijr
− C, emque C =
SQErro Entre = SQP arcelas − SQT rat − SQBlocos
SQErro Dentro = SQT otal − SQP arcelas
Os valores esperados dos quadrados médios são obtidos a partir das expressões acima.
Esperança da Soma de Quadrados Total
Em primeiro lugar optou-se pelo cálculo do valor esperado da soma de quadrados
39
total. Isto é,
X
E(SQT otal ) = E
2
yijr
−C
ijr
!
X
=E
2
yijr
ijr
!
− E(C)
Mas,
E(C) = E
2
y...
IJR
1
E
=
IJR
X
yijr
ijr
!2
X 0 X
X
X 0
1
βj + R
ij +
εijr )2
E(IJRµ + JR
τi + IRR
=
IJR
j
ij
ijr
i
X
X
1
=
E(IJRµ + +R
ij +
εijr )2
IJR
ij
ijr
!2
!2
X
X
1
εijr + dp]
E[I 2 J 2 R2 µ2 + R2
ij +
=
IJR
ijr
ij
=
1
(I 2 J 2 R2 µ2 + IJR2 σ2 + IJRσ 2 ).
IJR
Portanto,
E(C) = IJRµ2 + Rσ2 + σ 2
(I)
e
E
X
ijr
2
yijr
!
= E
"
= E
"
=
X
#
X
(µ + τi + βj + ij + εijr )2
X
(µ2 + τi2 + βj2 + 2ij + ε2ijr + 2µτi + 2µβj + 2τi βj + dp)
ijr
ijr
E(µ2 + τi2 + βj2 + 2ij + ε2ijr + 2µτi + 2µβj + 2τi βj + dp)
ijr
=
X
(µ2 + τi2 + βj2 + σ2 + σ 2 + 2µτi + 2µβj + 2τi βj )
ijr
= IJRµ2 + JR
X
τi2 + IR
X
τi2
i
X
βj2 + IJRσ2 + IJRσ 2
X
βj2
j
0
0
X 0
X 0
X X
+2JRµ
βj + 2R
τi + 2IRµ
τi
βj
j
i
2
= IJRµ + JR
+ IR
i
i
j
+ IJRσ2 + IJRσ 2
j
Subtraindo-se (I) de (II), vem
E(SQT otal ) = IJRµ2 + JR
X
i
τi2 + IR
X
j
βj2 + IJRσ2 + IJRσ 2
(II)
#
40
−IJRµ2 − Rσ2 − σ 2
Portanto, o valor esperado da soma de quadrados total é definido por:
E(SQT otal ) = R(IJ − 1)σ2 + (IJR − 1)σ 2 + JR
X
τi2 + IR
i
X
βj2 .
(2.38)
j
Esperança da Soma de Quadrados de Tratamento
Em segundo lugar procurou-se deduzir o valor esperado da soma de quadrados de
tratamentos, ou seja
"
#
1 X 2
1
E(SQT rat ) =
yi.. − C =
E
JR i
JR
X
2
yi..
i
!
− E(C)
Mas,
1
E
JR
X
i
2
yi..
!
=

1 
E
JR
X
i
2 
X 0 X
X
JRµ + JRτi + R
βj + R
ij +
εij  

j
X
1
=
E
J 2 R2 µ2 + J 2 R2 τi2 + R2
JR
i
2 2
+2J R µτi + 0dp
j
X
ij
j
jr
!2
+
X
εir
jr
!2
1 X 2 2 2
[J R µ + J 2 R2 τi2 + JR2 σ2 + JRσ 2 + 2J 2 R2 µτi ]
JR i
X
1
τi2 + IJR2 σ2 + IJRσ 2 + 0].
[IJ 2 R2 µ2 + J 2 R2
=
JR
i
=
Assim sendo, tem-se
1
E
JR
X
i
2
yi..
!
= IJRµ2 + JR
X
τi2 + IRσ2 + Iσ 2 .
(III)
i
Subtraindo-se (I) de (III), obtém-se o valor esperado da soma de quadrados de tratamentos, isto é,
E(SQT rat ) = (I − 1)(σ 2 + Rσ2 ) + JR
X
τi2 .
(2.39)
i
A esperança do quadrado médio de tratamentos é dada pelo valor esperado da soma de
quadrados de tratamentos dividida pelos seus respectivos graus de liberdade, ou seja,
JR X 2
SQT rat
= σ 2 + Rσ2 +
τ
(2.40)
E(QMT rat ) = E
I −1
I −1 i i
41
ou
E(QMT rat ) = σ 2 + Rσ2 +
em que µi = µ + τi .
JR X
(µi − µ)2 ,
I −1 i
(2.41)
Esperança da soma de quadrados de uma combinação linear das médias dos
tratamentos: h-ésimo contraste de médias dos tratamentos
De acordo com a expressão (2.34), a soma de quadrados de um contraste h é dada
por
SQ(Ψ̂h ) =
I
P
chi yi..
i=1
2
.
JRKh
Desenvolvendo-se algebricamente a expressão acima, vem
SQ(Ψ̂h ) =
=
=
I
P
chi yi..
i=1
JRKh
1
JRKh
2
X
I
chi
i=1
1
J 2 R2
JRKh
0
2
7
J J
J X
R
X
X
X
εijr
JRµi + R
βj + R
ij +
X
I
j=1
chi µi
i=1
2
+R
j=1 r=1
j=1
2
X
I
chi
i=1
J
X
ij
j=1
2
+
X
I
chi
R
J X
X
εijr
j=1 r=1
i=1
2
+ dp .
Agora, calculando o valor esperado, obtém-se após algumas operações algébricas o seguinte resultado
I
2
E[SQ(Ψ̂h )] = E[QM (Ψ̂h )] = σ +
Rσ2
2
JR X
+
chi µi .
Kh i=1
(2.42)
uma vez que, por (2.34), há apenas um grau de liberdade associado a soma de quadrados
de um contraste entre as médias dos tratamentos.
Esperança da Soma de Quadrados de Blocos
Para calcular a esperança da soma de quadrados de blocos, procedeu-se da seguinte
forma,
"
X
E(SQBlocos ) = E IR
(ȳ.j. − ȳ... )2
j
#
#
1
1 X 2
E
y.j. − C =
= E
IR j
IR
"
X
j
2
y.j.
!
− E(C)
42
Mas,
1
E
IR
X
j
2
y.j.
!

1 
E
IR
=
X
j
2 
X 0
X
X
IRµ + R
τi + IRβj + R
ij +
εijr  

i
i
X
1
=
E
I 2 R2 µ2 + I 2 R2 βj2 + R2
IR
j
2 2
+2I R µβj + 0dp
X
ij
i
ir
!2
+
X
εijr
ir
!2
1 X 2 2 2
I R µ + I 2 R2 βj2 + IR2 σ2 + IRσ 2 + 2I 2 R2 µβj
IR j


X 0
X
1  2 2 2
=
βj  .
βj2 + IJR2 σ2 + IJRσ 2 + 2I 2 JR2 µ
I JR µ + I 2 R2
IR
j
j
=
Portanto,
1
E
IR
X
j
2
y.j.
!
= IJRµ2 + IR
X
βj2 + JR2 σ2 + Jσ 2
(IV )
j
Subtraindo-se (I) de (IV), encontrou-se,
E(SQBlocos ) = IJRµ2 + IR
X
βj2 + JR2 σ2 + Jσ 2 − IJRµ2 − Rσ2 − σ 2
j
= (J − 1)σ 2 + R(J − 1)σ2 + IR
X
βj2
j
E(SQBlocos ) = (J − 1)(σ 2 + Rσ ) + IR
X
βj2 .
(2.43)
j
A esperança do quadrado médio de blocos é dada pelo valor esperado da soma de quadrados de blocos dividida pelos seus respectivos graus de liberdade, ou seja,
X
SQBlocos
= σ 2 + Rσ2 + IR
βj2
E(QMBlocos ) = E
J −1
j
ou
E(QMBlocos ) = σ 2 + Rσ +
em que µj = µ + βj .
IR X
(µj − µ)2 ,
J −1 j
Esperança da Soma de Quadrados de Parcelas
(2.44)
(2.45)
43
Para a soma de quadrados de parcelas procedeu-se como segue,
"
E(SQP arcelas ) = E R
X
(ȳij. − ȳ... )2
ij
"
#
#
1X 2
1
= E
yij. − C = E
R ij
R
X
!
2
yij.
ij
− E(C)
Mas,
1
E
R
X
2
yij.
ij
!
=

1 
E
R
X
X
Rµ + Rτi + Rβj + Rij +
εijr
r
ij
1 hX 2 2
=
E
R µ + R2 τi2 + R2 βj2 + R2 2ij +
R
ij
i
+2R2 µβj + 2R2 τi βj + 0dp
!2 
X

εijr
r
!2
+ 2R2 µτi
1
E(R2 µ2 + R2 τi2 + R2 βj2 + R2 σ2 + σ 2 + 2R2 µτi + 2R2 µβj
R
+2R2 τi βj )
X
X
1
=
βj2 + IJR2 σ2 + IJRσ 2
τi2 + IR2
(IJR2 µ2 + JR2
R
j
i
=
0
0
X 0
X X
X 0
2
2
βj + 2R
τi
βj ).
τi + 2IR µ
+2JR µ
2
j
i
i
j
Logo,
1
E
R
X
ij
2
yij.
!
= IJRµ2 + JR
X
τi2 + IR
i
X
βj2 + IJR2 σ2 + IJσ 2 .
(V )
j
Subtraindo-se (I) de (V), obtém-se
E(SQP arcelas ) = IJRµ2 + JR
2
−IJRµ −
X
i
2
Rσ
τi2 + IR
−σ
X
βj2 + IJR2 σ2 + IJσ 2
j
2
= (IJ − 1)σ 2 + R(IJ − 1)σ2 + JR
X
τi2 + IR
i
E(SQP arcelas ) = (IJ − 1)(σ 2 + Rσ2 ) + JR
X
i
τi2 + IR
X
βj2
j
X
βj2 .
(2.46)
j
De modo análogo aos casos anteriores, o valor esperado do quadrado médio de parcelas
44
fica,
E(QMP arcelas ) = E
SQP arcelas
IJ − 1
= (σ 2 + Rσ2 ) +
JR X 2
IR X 2
τi +
β (2.47)
IJ − 1 i
IJ − 1 j j
ou
E(QMP arcelas ) = (σ 2 + Rσ2 ) +
IR X
JR X
(µi − µ)2 +
(µj − µ)2 ,
IJ − 1 i
IJ − 1 j
(2.48)
em que, µi = µ + τi e µj = µ + βj .
Esperança da Soma de Quadrados do Erro Entre
O valor esperado da soma de quadrados do erro entre é obtida pela subtração dos
valores esperados da soma de quadrados de bloco e soma de quadrados de tratamento da
soma de quadrados de parcela, ou seja,
SQErro Entre = E(SQP arcelas − SQT rat − SQBlocos )
= E(SQP arcela ) − E(SQT rat ) − E(SQBloco )
X
X
= (IJ − 1)(σ 2 + Rσ2 ) + JR
τi2 + IR
βj2
i
2
−(I − 1)(σ +
Rσ2 )
− JR
X
j
τi2
i
2
−(J − 1)(σ + Rσ ) − IR
X
βj2
j
2
= (σ +
Rσ2 )[IJ
− 1 − I + 1 − J + 1]
E(SQErro Entre ) = (I − 1)(J − 1)(σ 2 + Rσ2 )
(2.49)
Como feito anteriormente, tem-se a esperança do quadrado médio do erro entre da sequinte
forma,
E(QMErro Entre ) = E
SQErro Entre
(I − 1)(J − 1)
= σ 2 + Rσ2 ;
(2.50)
Esperança da Soma de Quadrados do Erro Dentro
Obtém-se o valor esperado da soma de quadrado de erro dentro com a seguinte subtração,
E(SQErro Dentro ) = E(SQT otal − SQP arcelas )
45
= E(SQT otal ) − E(SQP arcelas )
= R(IJ − 1)σ2 + (IJR − 1)σ 2 + JR
X
τi2 + IR
i
−(IJ − 1)(σ 2 + Rσ2 ) − JR
X
=
2
2
2
βj2
j
τi2 − IR
i
IJRσ2
X
X
βj2
j
2
2
− Rσ + IJR − σ − IJσ + σ − IJRσ2 + Rσ2 .
Portanto,
E(SQErro Dentro ) = IJ(R − 1)σ 2
(2.51)
Dividindo-se a soma de quadrado de erro dentro pelos seus respectivos graus de liberdade
tem-se o valor esperado do quadrado médio do erro dentro,
SQErro Dentro
E(QMErro Dentro ) = E
= σ2.
IJ(R − 1)
(2.52)
Portanto, o valor esperado da SQErro Dentro dividido pela variância do erro dentro
segue uma distribuição de qui-quadrado com IJ(R − 1) graus de liberdade.
Os resultados obtidos nesta seção encontram-se apresentados de forma resumida na
Tabela 4, como sugere Barbin (1993).
Tabela 4: Análise da variância com os valores esperados dos quadrados médios
F.V.
G.L.
Tratamento
I-1
Blocos
J-1
Erro Entre
Parcelas
Erro Dentro
Total
(I-1)(J-1)
(IJ-1)
IJ(R-1)
IJR-1
S.Q.
1 X 2
y −C
JR i i..
1 X 2
y −C
IR j .j.
SQP arc − SQT rat − SQBlocos
1 X 2
y −C
R ij ij.
SQT otal − SQP arcelas
X
2
yijr
−C
E(QM)
JR X
(µi − µ)2
I −1 i
IR X
σ 2 + Rσ2 +
(µj − µ)2
J −1 j
σ 2 + Rσ2 +
σ 2 + Rσ2
σ2
-
ijr
A tabela 5 contém informações acerca dos parâmetros associados ao modelo matemático, aos seus estimadores e suas respectivas distribuições de probabilidade, bem
como, as distribuições de probabilidade das somas de quadrados associadas.
Tabela 5: Caracterı́sticas, seus estimadores e distribuições de probabilidade de estatı́sticas associadas.
Estimador da
caracterı́stica
Caracterı́stica
Distribuição de Probabilidade
do Estimador
h
µ
µ̂ = m = ȳ...
µ̂ ∼ N µ;
τi
τˆi = ti = ȳi.. − ȳ...
h
τ̂i ∼ N τi ;
µi
µ̂i = mi = ȳi..
βj
βˆj = bj = ȳ.j. − ȳ...
µj
µ̂j = mj = ȳ.j.
1
(σ 2
IJR
(I−1)
(σ 2
IJR
h
µ̂i ∼ N µi ,
1
(σ 2
JR
h
β̂j ∼ N βj ;
h
µj ∼ N µj ,
+
Rσ2 )
i
+ Rσ2 )
+ Rσ2 )
(J−1)
(σ 2
IJR
i
+
chi µi ,
1
(σ 2
JR
Rσ2 )
C
σ 2 +Rσ2
Sob H0 : µ = 0,
i
i
i
q
q
∼ χ2(I−1)
µ̂i −µ0
QMErro Entre
JR
Sob H0 : βj = 0, ∀ j,
Sob H0 : µj = µ0 ,
∼ χ2(1)
SQT rat
σ 2 +Rσ2
Sob H0 : τi = 0, ∀ i,
Sob H0 : µi = µ0 ,
+ Rσ2 )
1
(σ 2
IR
Distribuição de Probabilidade das
Estatı́sticas de Interesse sob H0
SQBlocos
σ 2 +Rσ2
Ψh =
i=1
ij
chi µi
Ψ̂h =
I
P
chi ȳi..
Ψ̂h ∼ N
i=1
i=1
ˆij = ȳij. − ȳi.. − ȳ.j. − ȳ...
hP
I
h
ˆij ∼ N 0;
h
εijr
ε̂ijr = yijr − ȳij.
ε̂ijr ∼ N 0;
yijr
ŷijr = ȳij.
-
+
(I−1)(J−1)
(σ 2
IJR
IJ(R−1) 2
σ
IJR
i
Rσ2 )
+
i
Rσ2 )
Sob H0 : Ψh = 0,
i
∼ χ2(J−1)
µ̂j −µ0
QMErro Entre
IR
I
I
P
( P chi yi.. )
∼ t[(I−1)(J−1)]
∼ t[(I−1)(J−1)]
2
i=1
JRKh (σ 2 +Rσ2 )
SQErro Entre
σ 2 +Rσ2
∼ χ2[(I−1)(J−1)]
SQErro Dentro
σ2
∼ χ2[IJ(R−1)]
∼ χ2(1)
-
46
47
2.8
Comparações múltiplas das médias duas a duas
Como o desenvolvimento da teoria dos métodos de comparações múltiplas não faz
parte dos objetivos deste trabalho, achou-se conveniente apresentar simplesmente um
procedimento prático para comparar os possı́veis pares de médias dos tratamentos por
meio do teste de Tukey.
Para testar as hipóteses do tipo H0 : µi = µi0 contra H1 : µi 6= µi0 , ao nı́vel de
significância α, calcula-se a Diferença Mı́nima Significativa - DMS por meio da expressão
r
QMErro Entre
DM S = q[I; (I−1)(J−1); α]
(2.53)
JR
na qual q[I; (I−1)(J−1); α] é o valor crı́tico da aplitude estudentizada de Tukey para I =
número de tratamentos envolvidos no ensaio, (I −1)(J −1) = número de graus de liberdade
do Erro Entre e nı́vel de significância α (em geral α = 0, 05).
Em seguida calcular os valores absolutos das diferenças entre as estimativas dos
possı́veis pares de médias dos tratamentos envolvidos no experimento, |ȳi − ȳi0 |, i 6= i0 ,
i, i0 = 1, 2, · · · , I. Finalmente, adotar a regra de decisão: Rejeiar H0 em favor de H1 ,
ao nı́vel de significância α se, e somente se |ȳi − ȳi0 | > DM S. Este procedimento será
ilustrado na seção 3.
2.9
Análises estatı́sticas
Tal como no experimento em blocos ao acaso usual, as análises estatı́sticas de um
experimento em blocos casualizados com repetição do conjunto de tratamentos dentro
dos blocos, em geral, levam em consideração as seguintes hipótese: Hipóteses sobre a não
(τ )
existência de efeito dos tratamentos sobre a variável resposta, H0
1, 2, · · · , I
existência
(τ )
(ou equivalentemente, H0
(β)
do efeito dos blocos: H0
: τi = 0, ∀ i =
: µ1 = · · · = µI = µ); Hipótese sobre a não
: βj = 0, ∀ j = 1, 2, · · · , J. De modo geral, o
pesquisador planeja seus experimentos em blocos casualizados com o objetivo apenas
de proporcionar ambientes homogêneos (blocos) dentro dos quais ele distribui de modo
aleatório um conjunto de tratamentos (ou mais de um conjunto), favorecendo-se o controle
local. Assim sendo, quase sempre, o pesquisador não tem interesse em fazer inferência
sobre o efeito dos blocos, fixando-se apenas nas análises baseadas no efeito dos tratamentos. Neste sentido, as análises são conduzidas priorizado-se os contrastes entre as médias
48
dos tratamentos de interesse do pesquisador, bem como, as comparações múltiplas das
médias. Na seção a seguir, serão discutidas as bases teóricas que possibilitam essa possı́veis
análises.
2.9.1
Hipóteses sobre tratamento
Esta hipótese pode ser representada de duas maneiras, a saber:

(τ )


 H0 : τi = 0, ∀ i = 1, 2, · · · , I
a)
vs


 H (τ ) : τ 6= 0, para pelo menos um τ
i
1
ou
b)
i
(2.54)

(τ )


 H0 : µ1 = µ2 = · · · = µ I = µ
vs


 H (τ ) : µ 6= µ 0 , para pelo menos um par (µ , µ 0 ) i 6= i0 = 1, 2, · · · , I
i
i
i
i
1
Considerando-se os resultados obtidos no desenvolvimento da teoria, pode ser observado que:
a.1) De acordo com a equação (2.50), E(QMErro Entre ) = σ 2 + Rσ2 . Isto é, o valor
esperado do quadrado médio do erro entre é um estimador não viciado para σ 2 +Rσ2
(τ )
independentemente de que H0
seja verdadeiro;
a.2) Pela expressão (2.41), E(QMT rat ) = σ 2 + Rσ2 +
nula
(τ )
H0
JR
I−1
: µ1 = · · · = µI = µ é verdadeira, então
I
P
(µi − µ)2 e se a hipótese
i=1
I
P
JR
(µi
I−1
i=1
− µ)2 = 0 e QMT rat
(τ )
será um estimador não viciado para σ 2 + Rσ2 . No entanto, se H1
é verdadeira
E(QMT rat ) > σ 2 +Rσ2 . Assim sendo, é razoável comparar QMT rat com QMErro Entre
(τ )
para se efetuar o teste da hipótese H0 , tendo em vista que quanto maior for o
QMT rat comparado com QMErro Entre mais evidência se tem de que as médias dos
tratamentos são diferentes entre si (ou que o efeito dos tratamentos não são nulos).
(τ )
SQT rat
∼ χ2[I−1] e independentemente
σ 2 +Rσ2
Eentre
∼ χ2[(I−1)(J−1)] .
(2.35), SQσErro
2 +Rσ 2
a.3) Conforme equação (2.20), tem-se que sob H0 ,
(τ )
de que H0
se verifique e pela expressão
Como se sabe, de acordo com a teoria de estatı́stica matemática, [ver Rohatgi (1976),
Roussas (1997), dentre outros], se uma variável aleatória U segue uma distribuição
49
de qui-quadrado com ν1 graus de liberdade e uma outra variável aleatória V segue
uma distribuição de qui-quadrado com ν2 graus de liberdade e, além disso, U e V
são variáveis aleatórias independentes, então a razão entre a variável aleatória U
dividida pelos seus graus de liberdade e a variável aleatória V dividida pelos seus
graus de liberdade, segue uma distribuição F de Snedecor e Cochran com ν1 graus
de liberdade do numerador e ν2 graus de liberdade do denominador a qual pode ser
escrita como
U/ν1
∼ F[ν1 , ν2 ]
V /ν2
(2.55)
Tomando como base este resultado, e considerando-se as distribuições de probabilidade das somas de quadrados apresentadas na Tabela 5, pode-se verificar que
SQT rat
σ 2 +Rσ2
F =
(I−1)
SQErro Entre
σ 2 +Rσ2
=
QMT rat
∼ F[(I−1), (I−1)(J−1)]
QMErro Entre
(2.56)
(I−1)(J−1)
(τ )
que será a estatı́stica de teste para testar a hipótese H0
vs
(τ )
H0
: τi 6= 0 para pelo menos um τi . Rejeita-se
α, se F =
QMT rat
QMErro Entre
(τ )
H0 ,
: τi = 0, para todo i,
ao nı́vel de significância
> F[(I−1), (I−1)(J−1), α] , em que F[(I−1), (I−1)(J−1), α] é o 100(1 −
α)-ésimo percentil superior da distribuição F com (I − 1) graus de liberdade do
numerador e (I − 1)(J − 1) graus de liberdade do denominador.
a.4) Como pode ser observado na expressão (2.50), o valor esperado do QMErro Entre é
(Ψ)
σ 2 + Rσ2 independentemente de que a hipótese H0
: Ψh = 0 se verifique ou não.
Isto é, QMErro Entre é um estimador não tendencioso para σ 2 + Rσ2 .
(Ψ)
a.5) Da expressão (2.42), se H0
:
I
P
chi µi = 0 é verdadeiro, QM (Ψ̂h ) também é um
i=1
(Ψ)
estimador não tendencioso para σ 2 + Rσ2 . Porém, se H0
for falsa,
I
P
chi µi 6= 0 e
i=1
E[QM (Ψ̂h )] > σ 2 + Rσ2 . Portanto, para se efetuar um teste de hipótese sobre um
contraste de médias dos tratamentos é intuitivo que seja feita uma comparação entre
o quadrado médio do contraste e o quadrado médio do erro entre. Pois, espera-se
que quanto maior for QM (Ψ̂h ) comparado com QMErro Entre , mais evidência se tem
I
P
chi µi não é nulo e quanto mais aproxima-se de zero
de que o comtraste Ψh =
i=1
mais eviência se tem a favor de H0 .
(Ψ)
a.6) Conforme equação (2.34), tem-se que sob H0 , a estatı́stica
expressão (2.35),
rifique.
SQErro Eentre
σ 2 +Rσ2
SQ(Ψ̂h )
σ 2 +Rσ2
∼ χ2[1] e, pela
(Ψ)
∼ χ2[(I−1)(J−1)] independentemente de que H0
se ve-
50
Portanto, adotando os mesmos argumentos do ı́tem a.3) verifica-se facilmento que
a estatı́stica
SQ(Ψ̂h )
σ 2 +Rσ2
F =
1
SQErro Entre
σ 2 +Rσ2
=
QM (Ψ̂h )
∼ F[1, (I−1)(J−1)]
QMErro Entre
(2.57)
(I−1)(J−1)
(Ψ)
e será a estatı́stica de teste para testar a hipótese H0
(Ψ)
(Ψ)
: Ψh = 0 vs H1
regra de decisão será, rejeita H0 , ao nı́vel de significância α, se F =
: Ψh 6= 0. A
QM (Ψ̂h )
QMErro Entre
>
F[1, (I−1)(J−1), α] , em que F[1, (I−1)(J−1), α] é o 100(1 − α)-ésimo percentil superior da
distribuição F com 1 grau de liberdade do numerador e (I − 1)(J − 1) graus de
liberdade do denominador.
a.7) Para comparar os possı́veis pares de médias da variável resposta relativas aos tratamentos, poderá ser empregado qualquer método de comparações múltiplas, embora
neste trabalho deu-se preferência ao teste de Tukey, cuja teoria pode ser vista em
(LEAL; PORRAS, 1998), (MONTGOMERY, 2007).
2.9.2
Hipóteses sobre Bloco
Tal como nas hipóteses sobre tratamento, estas também podem ser representada de
duas maneiras, a saber:

(β)


 H0 : βj = 0, ∀ j = 1, 2, · · · , J
a)
vs


 H (β) : β 6= 0, para pelo menos um β
j
j
1
ou
(2.58)

(β)


 H0 : µ1 = µ2 = · · · = µ J = µ
b)
vs


 H (β) : µ 6= µ 0 , para pelo menos um par (µ , µ 0 ) j 6= j 0 = 1, 2, · · · , J
j
j
j
j
1
Levando-se em conta os resultados obtidos no desenvolvimento da teoria e por ar-
gumentos semelhantes aos utilizados na seção 2.9.1, para as hipóteses sobre tratamento,
pode-se verificar facilmente que
51
b.1) A estatı́stica
SQBloco
σ 2 +Rσ2
F =
(J−1)
SQErro Entre
σ 2 +Rσ2
=
QMBloco
∼ F[(J−1), (I−1)(J−1)]
QMErro Entre
(2.59)
(I−1)(J−1)
será a estatı́stica de teste para testar a hipótese H0
(β)
: βj = 0, para todo j, vs
(β)
H0
(β)
H0 ,
ao nı́vel de significância α,
: βj 6= 0 para pelo menos um βj . Rejeita-se
se F =
QMBloco
QMErro Entre
> F[(J−1), (I−1)(J−1), α] , em que F[(J−1), (I−1)(J−1), α] é o 100(1 −
α)-ésimo percentil superior da distribuição F com (J − 1) graus de liberdade do
numerador e (I − 1)(J − 1) graus de liberdade do denominador.
b.2) A estatı́stica
SQ(Ψ̂h )
σ 2 +Rσ2
F =
1
SQErro Entre
σ 2 +Rσ2
=
QM (Ψ̂h )
∼ F[1, (I−1)(J−1)]
QMErro Entre
(2.60)
(I−1)(J−1)
será a estatı́stica de teste para testar a hipótese de nulidade de um contraste h sobre
(Ψ)
as médias dos bocos, H0
(Ψ)
: Ψh = 0 vs H1
: Ψh 6= 0. A regra de decisão será,
(Ψ)
rejeita H0 , ao nı́vel de significância α, se F =
QM (Ψ̂h )
QMErro Entre
> F[1, (I−1)(J−1), α] , em
que F[1, (I−1)(J−1), α] é o 100(1 − α)-ésimo percentil superior da distribuição F com 1
grau de liberdade do numerador e (I − 1)(J − 1) graus de liberdade do denominador.
b.3) As comparações múltiplas das médias dos blocos pelo teste Tukey, poderão ser
feitas por meio do mesmo procedimento adotado no ı́tem a.7) com as seguintes
modificações:
QMErro Entre
(2.61)
IR
é o valor crı́tico da aplitude estudentizada de Tukey para
DM S = q[J; (I−1)(J−1); α]
na qual q[J; (I−1)(J−1); α]
r
J = número de blocos envolvidos no ensaio, (I − 1)(J − 1) = número de graus de
liberdade do Erro Entre e nı́vel de significância α (em geral α = 0, 05).
Em seguida calcular os valores absolutos das diferenças entre as estimativas dos
possı́veis pares de médias dos blocos envolvidos no experimento, |ȳ.j. − ȳ.j 0 . |, j 6= j 0 ,
j, j 0 = 1, 2, · · · , J. Finalmente, adotar a regra de decisão: Rejeiar H0 em favor de
H1 , ao nı́vel de significância α se, e somente se |ȳ.j. − ȳ.j 0 . | > DM S.
52
2.9.3
A tabela da ANOVA
A partir do conhecimento das partes componentes da variabilidade total representadas
pelas somas de quadrados e das distribuições de probabilidade das estatı́sticas de teste
das hipóteses sobre tratamento e Bloco deduzidas nas Seções 2.9.1 e 2.9.2, e, de acordo
com Leal e Porras (1998) e Montgomery (2007), pode-se organizar a tabela completa da
análise de variância - ANOVA, tal como se apresenta na literatura especializada, isto é,
Tabela 6: Tabela da Análise de Variância
F. Variação
Tratamento
GL
I −1
SQ
SQT rat
QM
T rat
QMT rat = SQI−1
Bloco
J −1
SQBloco
QMBloco =
Erro Entre
Parcela
(I − 1)(J − 1)
IJ − 1
SQErro Entre
SQP arcela
QMErro Entre =
-
Erro Entre
IJ(R − 1)
SQErro Dentro
QMErro Dentro =
IJR − 1
SQT otal
Total
-
SQBloco
J−1
F
QMT rat
QMErro Entre
QMBloco
QMErro Entre
SQErro Entre
(I−1)(J−1)
-
SQErro Dentro
IJ(R−1)
-
53
3
Aplicação da teoria a um
exemplo real
O objetivo deste Capı́tulo é apresentar uma aplicação da teoria desenvolvida neste
trabalho a um conjunto de dados real recolhido de um experimento em blocos completos
casualizados com repetições dos tratamentos dentro dos blocos.
3.1
Descrição do conjunto de dados experimentais
Para ilustrar o método, levou-se em conta um experimento analisado por Ferreira
(1996), página 254, no qual considerou-se três variedades de cana-de-açúcar, três blocos e
três repetições. A variável resposta analisada foi a porcentagem de açúcar provável, cujos
valores observados encontram-se na Tabela 7, a seguir.
Tabela 7: Porcentagem de açúcar provável em variedades de cana-de-açúcar
Variedade
1
Repetição
1
2
3
2
1
2
3
3
1
2
3
Soma
1
13,03
13,72
14,16
40,91
15,73
15,62
15,55
46,90
14,69
15,65
14,52
44,86
132,67
Bloco
2
13,20
13,84
13,11
40,15
15,13
15,52
16,27
46,92
14,75
15,54
14,13
44,42
131,49
3
13,30
12,33
13,79
39,42
15,40
15,57
15,77
46,74
14,95
15,72
14,51
45,18
131,34
Soma
120,48
140,56
134,46
395,50
Fonte: Cortesia de Ms. Paulo Vanderlei Ferreira.
54
3.2
Cálculos das somas de quadrados e análise da
variância
A partir dos dados da Tabela 7, calculou-se:
SQT otal =
I X
J X
R
X
i=1 j=1 r=1
2
yijr
(y... )2
−
IJR
= (13, 03)2 + (13, 72)2 + · · · + (14, 51)2 −
(395, 5)2
= 29, 3418;
3×3×3
I
SQV ariedade
1 X 2
(y... )2
=
yi.. −
JR i=1
IJR
=
(395, 5)2
1 (120, 48)2 + (140, 56)2 + (134, 46)2 −
= 23, 5503;
3×3
3×3×3
J
SQBloco
1 X 2
(y... )2
=
y.j. −
IR j=1
IJR
(395, 5)2
1 2
2
2
(132, 67) + (131, 49) + (131, 34) −
= 0, 1179;
=
3×3
3×3×3
I
SQP arcela
J
1 XX 2
(y... )2
=
y −
R i=1 j=1 ij.
IJR
=
(395, 5)2
1
(40, 91)2 + (40, 15)2 + · · · + (45, 18)2 −
= 24, 0239;
3
3×3×3
SQErro Entre = SQP arcela − SQV ariedade − SQBloco
= 24, 0239 − 23, 5503 − 0, 1179 = 0, 3557
e
SQErro Dentro = SQT otal − SQP arcela
= 29, 3418 − 24, 0239 = 5, 3179.
De posse dos resultados acima organiza-se a Tabela da Análise de Variância - ANOVA,
de acordo como foi sugerido na Tabela 8, ou seja,
55
Tabela 8: Análise de variância para os dados da porcentagem de açúcar provável em
variedades de cana-de-açúcar.
F. Variação
Variedade
Bloco
Erro Entre
Parcela
Erro Dentro
Total
GL
SQ
2 23,5503
2
0,1179
4
0,3557
8 24,0239
18
5,3179
26 29,3479
QM
11,7752
0,0590
0,0889
3,0030
0,2954
-
F
132,45
0,66
-
Como pode ser observado na Tabela 8, F = 132, 45 e da tabela da distribuição F
observa-se que F[2; 4; 0,01] = 18, 00. Como F > F[2; 4; 0,01] , então rejeita-se a hipótese de
igualdade das médias da porcentagem de açúcar provável relativas as variedades de canade-açúcar e concluı́-se ao nı́vel de significância α = 0, 01 que existe pelo menos um par de
médias (µi , µi0 ) que diferem estatisticamente entre si.
Para verificar quais médias diferem entre si, adotou-se o seguinte procedimento:
1. Desdobrar os dois graus de liberdade de variedade em dois contrastes de interesse,
cada um com um grau de liberdade. Imagine que são de interesse do pesquisador
(2)
(3)
os seguintes contrastes representados pelas hipóteses H0 e H0 a seguir:


(2)
(3)
µ1 +µ3


H
:
µ
−
=
0


2
2
 0
 H0 : µ3 − µ1 = 0
com 1 gl
com 1 gl e
vs
vs




 H (2) : µ − µ1 +µ3 6= 0
 H (3) : µ − µ 6= 0
2
1
1
2
3
1
As estimativas desses contrastes são representadas por:
Ψ̂1 = ȳ2.. −
ȳ1.. + ȳ3
13, 39 + 14, 94
= 15, 62 −
= 1, 46%
2
2
e
Ψ̂2 = ȳ3.. − ȳ1.. = 14, 94 − 13, 39 = 1, 55%
Para facilitar os cálculos das respectivas somas de quadrados dos contrastes é conve(2)
(3)
niente reescrever as hipóteses H0 e H0 na forma equivalente, da seguinte maneira,
(2)
(3)
H0 : −µ1 + 2µ1 − µ3 = 0 e H0 : µ3 − µ1 = 0. Daı́, obtém-se:
SQ(Ψ̂1 ) =
P
c1i yi..
i
JRK1
2
=
[(−1)(120, 48)2 + (2)(140, 56) + (−1)(134, 46)]2
3 × 3 × [(−1)2 + (2)2 + (−1)2 ]
{z
}
|
K1
56
(26, 18)2
=
= 12, 6925 com 1 gl
54
e
SQ(Ψ̂2 ) =
P
c2i yi..
i
JRK2
2
[(−1)(120, 48)2 + (1)(134, 46)]2
=
3 × 3 × [(−1)2 + (1)2 ]
{z
}
|
K2
2
=
(13, 98)
= 10, 8578 com um gl.
18
Com estes resultados reorganiza-se a tabela da análise da variância, obtendo-se:
Tabela 9: Análise de variância para os dados da porcentagem de açúcar provável em
variedades de cana-de-açúcar.
F. Variação
(2)
3
H0 : Ψ1 = µ2 − µ1 +µ
=0
2
(3)
H0 : Ψ 2 = µ3 − µ1 = 0
(1)
Variedade (H0 = µ1 = µ2 = µ3 = µ)
Bloco
Erro Entre
Parcela
Erro Dentro
Total
GL
SQ
1
1
(2)
2
4
8
18
26
12,6925
10,8578
(23,5503)
0,1179
0,3557
24,0239
5,3179
29,3479
QM
12,6925
10,8578
11,7752
0,0590
0,0889
3,0030
0,2954
-
F
142,77
122,13
132,45
0,66
-
Com base nos resultados da Tabela 9 conclui-se que a média da porcentagem
de açúcar provável da variedade V 2 difere estatisticamente da média combinada
das variedades V 1 e V 3, ao nı́vel α = 0, 01 de significância, tendo em vista que
F[1; 4; 0,01] = 21, 20. De modo análogo, pode-se concluir, ao nı́vel α = 0, 01 de significância, que a porcentagem média de açúcar provável da variedade V 3 difere
estatisticamente da variedade V 1.
2. Comparações das médias duas a duas pelo teste de Tukey:
Inicialmente calculou-se as estimativas das médias todas com desvio-padrão s(ȳi ) e
a diferença mı́nima significativa -DMS, pelo método de Tukey ao nı́vel α = 0, 05:
ȳ1 = 13, 30%
ȳ2 = 15, 62% todas com erro-padrão s(ȳi ) =
ȳ3 = 14, 94%
r
QMErro Entre
= 0, 0994%.
JR
57
e
r
QMErro Entre
DM S = q[I; (I−1)(J−1); α]
JR r
r
0, 0889
0, 0889
= 5, 04
= 0, 50%;
= q[3; 4; 0,05]
3×3
3×3
em seguida cauculou-se os valores absolutos das possı́veis diferenças entre as estimativas das médias das variedades. Isto é,
|ȳ1.. − ȳ2 | = |13, 39 − 15, 62| = 2, 23%
|ȳ1.. − ȳ3 | = |13, 39 − 14, 94| = 1, 55%
|ȳ2.. − ȳ3 | = |15, 62 − 14, 94| = 0, 68%;
Adotando-se a regra de decisão: rejeitar H0 : µi = µi0 , ao nı́vel de significância
α = 0, 05, se |ȳi.. − ȳi0 .. | > DM S, conclui-se que as variedades de cana-de-açúcar
estudadas produzem porcentagens médias de açúcar provável diferentes entre si.
3.3
Comprovação da idoneidade do modelo
Figura 1: Função de distribuição acumulada sob normalidade por meio da estatı́stica de
Kolmogorov-Smirnov.
Figura 2: Histograma e polı́gono das frequências para cada variedade de cana-de-açucar
estudada.
58
Figura 3: Valores plotados no gráfico Quantil para as variedades de cana-de-açucar estudadas.
Conforme pode ser observado nas Figuras 1, 2 e 3 os erros são normalmente distribuı́dos.
A execussão das análises pode ser facilitada empregando o softwere estatı́stico SAS
por meio do seguinte procedimento:
OPTIONS NODATE PS=500;
DATA EXEMPLO;
DO VAR=1 TO 3;
DO REP=1 TO 3;
DO BLOCO=1 TO 3;
INPUT PORCENTAGEM @@;
OUTPUT;
END;
END;
END;
DATALINES;
13.03 13.20 13.30
13.72 13.84 12.33
14.16 13.11 13.79
15.73 15.13 15.40
15.62 15.52 15.57
15.55 16.27 15.77
59
14.69 14.75 14.95
15.65 15.54 15.72
14.52 14.13 14.51
;
RUN;
PROC PRINT DATA=EXEMPLO;
RUN;
PROC GLM DATA=EXEMPLO;
CLASS VAR BLOCO;
MODEL PORCENTAGEM=VAR BLOCO VAR*BLOCO / SS3;
TEST H=VAR BLOCO E=VAR*BLOCO;
CONTRAST "V2 vs (V1+V3)" VAR -1 2 -1;
CONTRAST "V3 vs V1"
MEANS VAR / TUKEY;
RUN;
VAR -1 0
1;
60
4
Conclusão Final
As análises estatı́sticas para os dados de um experimento instalado num delineamento de Blocos completos casualizados com repetições dos tratamentos dentro dos blocos,
consideram que as observações são representadas por um modelo matemático aditivo
envolvendo uma média geral, os efeitos dos tratamentos, dos blocos e dois tipos de erros
experimentais aleatórios: um, entre as unidades experimentais que receberam o mesmo
tratamento em blocos diferentes, o Erro Entre, e outro, entre as unidades experimentais
que receberam o mesmo tratamento dentro do mesmo bloco, o Erro Dentro. Neste delineamento, o Erro Entre pode se visto como o efeito da interação entre Tratamento e Bloco
(T × B). Além disso, supõe-se a priori que esses erros são independentemente distribuı́dos
(um do outro e entre si) como uma normal de médias zero e variâncias comuns σ2 e σ 2 ,
iid
iid
respectivamente. Isto é, ij ∼ N (0, σ2 ), εijr ∼ N (0, σ 2 ) e Cov(ij , εijr ) = 0. Diante
do exposto e após o desenvolvimento e aplicação da teoria que dar sutentatação a estas
análises, concluiu-se que:
1. Do pondo de vista prático, o planejamento de um experimento em blocos completos
casualizados com repetição do conjunto de tratamentos nos blocos tem pouca aplicabilidade, uma vez que é apropriado a pesquisas envolvendo poucos tratamentos.
E, do ponto de vista teórico, as contribuições tem sido muito poucas, dificultando
de certa forma, a expansão das técnicas estatı́sticas envolvendo outras distribuições
de probabilidade para os erros neste delineamento.
2. O método utilizado para estimar os parâmetros do modelo aqui adotado foi o dos
mı́nimos quadrados. Preferiu-se esse método em detrimento do método da Máxima
verossimilhança porque ele é mais simples e, sob normalidade, os dois métodos
fornecem os mesmos estimadores, os quais têm excelentes propriedades;
3. Algunas estatı́sticas de teste apresentadas na Tabela 9 podem ser utilizadas para se
fazer inferências marginais sobre, por exemplo, τi , µi , βj e µj , embora, na prática,
não sejam rotineiramente empregadas como ferramentas em busca de achados nas
61
pesquisas cientificamente planejadas nesse tipo de delineamento;
4. Não foi encontrado na literatura nenhum trabalho que justificasse completamente
a base estatı́stica que suporta as análises dos dados de um experimento em blocos
completos casualizados com repetições dentro dos blocos. E, esta é, na opinião dos
autores, a maior contribuição que se pode extrair deste trabalho.
5. É importante lembrar que em qualquer análise estatı́stica, onde as observações foram
obtidas a partir de um experimento cientificamente planejado, deve ser adotado
como regra, a validação das suposições impostas aos termos no modelo matemático
utilizado para descrever as observações experimentais. As conclusões acerca dos
achados na pesquisa só deverão ser consideradas verdadeiras após a comprovação
estatı́stica da Aditividade, Normalidade, Homocedasticidade e Independência dos
erros;
6. As análises estatı́sticas dos dados do experimento utilizado para ilustrar a teoria
(β)
desenvolvida, apresentaram-se adequadas e constataram que a hipótese H0
: βj = 0
não foi rejeitada, ao nı́vel de significância α = 0, 05. Isto indica que os blocos não
têm efeito sobre a porcentagem de açúcar provável nas variedades de cana-de-açúcar
(τ )
estudadas. Por outro lado, observou-se que a hipótese H0 : τi = 0, ∀ i, foi rejeitada
ao nı́vel de significância α = 0, 01. Daı́, conclui-se que as variedades têm efeito sobre
a porcentagem de açúcar provável (ou ainda, que existe pelo menos duas variedades
que diferem entre si quanto a porcentagem média de açúcar provável). Ao testar a
hipótese sobre o contraste entre a média de açúcar provável da variedade 2 contra a
média combinada das variedades 1 e 3, verificou-se que este apresentou significância
estatı́stica. Finalmente, ao confrontar as porcentagens médias de açúcar provável
das variedades pelo teste de Tukey, ao nı́vel α = 0, 05, constatou-se que todas
diferem estatisticamente entre si.
62
Referências
BARBIN, D. Componentes de Variância - Teoria e Aplicações. 2. ed. Piracicaba - SP:
FEALQ - Fundação de Estudos Agrários Luiz de Queiroz, 1993. 117 p.
FERREIRA, P. V. Estatı́stica Experimental Aplicada à Agronomia. Maceió - AL: Edufal,
1996.
LEAL, J. G.; PORRAS, A. M. L. Deseño estadı́stico de experimentos - Análises de la
varianza. Granada - ES: Grupo Editorial Universitario, 1998. 357 p.
LOVE, H. H. Introduction to Experimental Statistics. New York: Mcgraw-Hill, 1964.
174 p.
MONTGOMERY, D. C. Design and Analysis of Experiments. Singapore: Posts &
Telecom Press, 2007. 642 p.
ROHATGI, V. K. An Introduction to Probability Theory and Mathematical Statistics.
New York: John Wiley, 1976. 684 p.
ROUSSAS, G. G. A Course in Mathematical Statistics. 2. ed. New York: Academic
Press, 1997. 572 p.
SILVA, J. G. C. da. Estatı́stica experimental: Planejamento de experimentos. Versão
Preliminar, p. 130–154, 2007.