Universidade Estadual da Paraı́ba
Centro de Ciências e Tecnologia
Departamento de Estatı́stica
Bruno Henrique Gomes dos Santos
Aspectos teóricos e práticos com aplicação da análise
estatı́stica de um experimento em blocos completos
casualizados com repetições dentro dos blocos
Campina Grande
Dezembro de 2012.
Bruno Henrique Gomes dos Santos
Aspectos teóricos e práticos com aplicação
da análise estatı́stica de um experimento em
blocos completos casualizados com
repetições dentro dos blocos
Trabalho de Conclusão de Curso apresentado ao curso de Bacharelado em Estatı́stica
do Departamento de Estatı́stica do Centro
de Ciências e Tecnologia da Universidade
Estadual da Paraı́ba em cumprimento as
exigências legais para obtenção do tı́tulo de
Bacharel em Estatı́stica.
Orientador:
João Gil de Luna
Campina Grande
Dezembro de 2012.
FICHA CATALOGRÁFICA ELABORADA PELA BIBLIOTECA CENTRAL – UEPB
S237a
Santos, Bruno Henrique Gomes dos.
Aspectos teóricos e práticos com aplicação da análise
estatística de um experimento em blocos completos casualizados
com repetições dentro dos blocos [manuscrito] / Bruno Henrique
Gomes dos Santos. – 2012.
63f. : il.
Trabalho de Conclusão de Curso (Graduação em Estatística)
– Universidade Estadual da Paraíba, Centro de Ciências e
Tecnologia, 2012.
“Orientação: Prof. Dr. João Gil de Luna, Departamento de
Estatística”.
1. Estatística Experimental. 2. Probabilidade. 3. Pesquisa
Experimental. I. Título.
21. ed. CDD 519.2
Dedicatória
Dedico este trabalho a minha esposa Cida, a meu querido
filho Lucas e a minha entiada Mariana que me impulsionaram a buscar vida nova a cada dia, concedendo a mim a
oportunidade de me realizar ainda mais. Dedico também
a minha mãe Cristina, que em nenhum momento mediu
esforços para realização dos meus sonhos, que me guiou
pelos caminhos corretos, me ensinou a fazer as melhores
escolhas, me mostrou que a honestidade e o respeito são
essenciais à vida, e que devemos sempre lutar pelo que
queremos.
Obrigado!
Agradecimentos
Agradeço primeiramente a Deus por ter me dado forças para enfrentar os obstáculos
que insistiam em aparecer no decorrer dessa caminhada, fazendo-me concluir um grande
passo em minha vida.
Agradeço a minha famı́lia por terem aceito se privar de minha companhia pelos estudos, compreendendo que buscava a todo tempo o melhor para todos.
A UEPB por todos os recursos oferecidos durante o curso, conseguindo assim êxito
em todas as pesquisas.
Ao Prof. Gil pela imensa atenção e dedicação ao nosso trabalho, e o encorajamento
nos momentos difı́ceis, como também a todo conhecimento passado por ele em diversos
campos da estatı́stica. Ao Prof. Gustavo por todo aprendizado proporcionado por ele me
fazendo ter sempre confiança em trabalhos realizados extra classe.
A todos os meus colegas de classe que juntos transferiram conhecimentos para que
fosse possı́vel a conclusão do nosso curso. Que essas amizades durem tanto quanto foram
intensas.
Resumo
A pesquisa experimental é amplamente utilizada em diversas áreas do conhecimento,
para tal é desenvolvido um método em que o pesquisador intervém na amostra, impondo
deliberadamente os nı́veis de uma ou mais caracterı́sticas explanatórias com o propósito
de encontrar inferências referentes aos efeitos causais dessas caracterı́sticas sobre caracterı́sticas respostas. Essas caracterı́sticas explanatórias são denominadas caracterı́sticas
de tratamento e seus nı́veis, tratamentos. Exemplos comuns de tratamentos são diferentes
estı́mulos apresentados ou impostos a animais ou plantas, tais como diferentes dietas administradas a animais ou diferentes fungicidas aplicados a plantas. As conclusões desses
experimentos são obtidas utilizando-se da estatı́stica experimental, estatı́stica essa que
usa os dados coletados para inferir resultados com o objetivo de aprimorar ou até mesmo,
quando necessário, refazer o experimento. Neste trabalho aborda-se todo o desenvolvimento teórico dos procedimentos que dão suporte a uma análise estatı́stica dos dados de
um experimento em blocos completos casualizados de efeitos fixos e com repetições dentro
dos blocos. Será apresentado um possı́vel desenho desse tipo de experimento no campo,
juntamente com a tabela para o recolhimento dos dados, defini-se o modelo matemático
para descrever as observações experimentais, utiliza-se o método de mı́nimos quadrados
para encontrar os estimadores dos termos do modelo, apresenta-se os resultados da decomposição da variabilidade total que são organizados na tabela da análise da variância
(ANOVA), estuda-se as distribuições de probabilidade dos estimadores e por fim calcula-se
os valores esperados das somas de quadrados. Por fim, um exmplo real será utilizado para
ilustrar a metodologia, e os resultados serão discutidos e interpretados convenientemente.
Palavras-chave: Estatı́stica Experimental, Soma de Quadrados, ANOVA.
Abstract
The experimental research is widely used in various areas of knowledge, such a method
is developed in which the researcher intervenes in the sample, levels of deliberately imposing one or more characteristics explanatory in order to find causal inferences regarding
the effects of these characteristics on response characteristics. These features are termed
features explanatory treatment and its levels treatments. Examples of common treatments
are different stimuli or imposed animals or plants, such as different diets administered to
animals or applied to plant fungicides. The conclusions of these experiments are obtained
using the experimental statistics, this statistic that uses the collected data to infer results
in order to enhance or even, when necessary, redo the experiment. This paper addresses
to the entire theoretical development of procedures that support a statistical analysis
of an experiment in randomized complete block design with fixed effects and replicates
within the blocks. We will present a possible design of this type of experiment in the field,
along with the table for the collection of data, set up the mathematical model to describe
the experimental observations, we use the method of least squares estimators to find the
terms of the model presents the results of the decomposition of the total variance that are
arranged in the table analysis of variance (ANOVA) is studied probability distributions
of the estimators and finally calculates the expected values of the sums of squares. Finally, a real exmplo will be used to illustrate the methodology and results discussed and
interpreted properly.
Keywords: Experimental Statistics, Sum of Squares, ANOVA.
Sumário
1 Inrodução
p. 9
2 Fundamentação Teórica
p. 12
2.1
Um possı́vel desenho do experimento no campo . . . . . . . . . . . . .
p. 12
2.2
Organização dos dados experimentais . . . . . . . . . . . . . . . . . . .
p. 13
2.3
O Modelo matemático . . . . . . . . . . . . . . . . . . . . . . . . . . .
p. 13
2.4
Estimação dos parâmetros, dos erros e das observações . . . . . . . . .
p. 14
2.5
Decomposição da variabilidade total . . . . . . . . . . . . . . . . . . . .
p. 17
2.6
Distribuição de probabilidade dos estimadores . . . . . . . . . . . . . .
p. 21
2.6.1
Distribuição de probabilidade de ȳ... , o estimador de µ. . . . . .
p. 22
2.6.2
Distribuição de probabilidade da correção para média, C. . . . .
p. 23
2.6.3
Distribuição de probabilidade de ti , o estimador de τi . . . . . . .
p. 23
2.6.4
Distribuição de probabilidade da SQT rat . . . . . . . . . . . . . .
p. 25
2.6.5
Distribuição de probabilidade de bj , o estimador de βj . . . . . .
p. 25
2.6.6
Distribuição de probabilidade da SQBlocos . . . . . . . . . . . .
p. 27
2.6.7
Distribuições de probabilidade de mi , o estimador de µi = µ + τi ,
(a média do tratamento i) e de mj , o estimador de µj = µ + βj ,
(a média do bloco j). . . . . . . . . . . . . . . . . . . . . . . . .
p. 27
2.6.8
Distribuições de probabilidade de contrastes de interesse . . . .
p. 28
2.6.9
Distribuição de probabilidade da soma de quadrados da h-ésima
combinação linear das médias dos tratamentos . . . . . . . . . .
p. 30
2.6.10 Distribuição de probabilidade de ˆij , o estimador de ij . . . . . .
p. 31
2.6.11 Distribuição de probabilidade da SQErro Entre . . . . . . . . . . .
p. 36
2.6.12 Distribuição de probabilidade de ε̂ijr , o estimador de εijr . . . . .
p. 36
2.7
Valores Esperados das Somas de Quadrados . . . . . . . . . . . . . . .
p. 38
2.8
Comparações múltiplas das médias duas a duas . . . . . . . . . . . . .
p. 47
2.9
Análises estatı́sticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
p. 47
2.9.1
Hipóteses sobre tratamento . . . . . . . . . . . . . . . . . . . .
p. 48
2.9.2
Hipóteses sobre Bloco
. . . . . . . . . . . . . . . . . . . . . . .
p. 50
2.9.3
A tabela da ANOVA . . . . . . . . . . . . . . . . . . . . . . . .
p. 52
3 Aplicação da teoria a um exemplo real
p. 53
3.1
Descrição do conjunto de dados experimentais . . . . . . . . . . . . . .
p. 53
3.2
Cálculos das somas de quadrados e análise da variância . . . . . . . . .
p. 54
3.3
Comprovação da idoneidade do modelo . . . . . . . . . . . . . . . . . .
p. 57
4 Conclusão Final
p. 60
Referências
p. 62
9
1
Inrodução
Tem-se registros que o método experimental remonta a pelo menos 4 séculos antes de
Cristo, quando Aristóteles (384-322 a.C.) fez diversas descobertas referentes ao mundo
natural, com base em experimentos, axiomas e argumentos filosóficos, ele concluiu, por
exemplo, que a aceleração de um corpo em queda livre depende de sua massa, e que a
terra devia ser uma esfera, já que a esfera é o sólido mais ”perfeito”. Porém foi no inı́cio
do século XX com Ronald Aylmer Fisher (1890-1962), um jovem matemático do Colégio
Caius de Cambridge, que iniciou-se o desenvolvimento do ramo da estatı́stica relacionado
com o planejamento e a análise de experimentos. Fisher lançou os fundamentos modernos
da pesquisa experimental, as bases da inferência estatı́stica e delineou muitos métodos
originais para os vários problemas encontrados na Estação Experimental de Rothamsted,
onde realizava seus trabalhos e em outras instituições de pesquisa. Introduziu diversas
técnicas de análise de dados, como a análise da variação, que passou a ser amplamente
utilizada na análise estatı́stica de dados de experimentos, e a técnica de polinômios ortogonais para o uso de caracterı́sticas ambientais.
A metodologia moderna da pesquisa experimental, desenvolvida a partir dos fundamentos e idéias lançados por Fisher para a pesquisa agrı́cola, teve muitos contribuintes
em diversos paı́ses e passou a aplicar-se aos demais ramos da ciência e da tecnologia, tais
como biologia, medicina, engenharia, indústria e ciências sociais.
Como conseqüência da origem da pesquisa experimental na agricultura, muito da terminologia ainda hoje utilizada compreende termos próprios da pesquisa agrı́cola. Assim,
por exemplo, as designações ”tratamento”, ”parcela”e ”bloco”perderam suas conotações
particulares da agricultura e são amplamente usadas na pesquisa experimental em muitas
áreas da ciência (SILVA, 2007).
O delineamento em blocos ao acaso trata-se de um método para eliminar a heterogeneidade das unidades experimentais, e é o projeto mais fundamental em todos os tipos de
experimentação. Historicamente, esse delineamento foi o primeiro projeto a estimar o erro
10
experimental e a testar a significância dos efeitos dos tratamentos, apesar da heterogeneidade das unidades experimentais em que as observacões são adquiridas (LOVE, 1964).
Os delineamentos experimentais são planejados de forma que a variação ao acaso seja
reduzida o máximo possı́vel. Os principais delineamentos são: Inteiramente Casualizado,
Blocos Completos Casualizados e Quadrados Latinos.
Neste trabalho será abordado a teoria do Delineamento em Blocos Completos Casualizados com repetições dentro dos Blocos. O modelo matemático referente ao delineamento
aqui estudado, propõe que os fatores sejam com interação e de efeito fixo.
Para obtenção dos estimadores dos efeitos envolvidos no modelo, utilizou-se o metodo
da Mı́nimos Quadrados, esse método será escolhido porque é mais simples, e oferece os
mesmos estimadores do de Máxima Verossimilhança.
Objetivos
Tem-se como principal objetivo desenvolver a teoria desse tipo de delineamento e tentar elucidar problemas eventualmente existentes nos experimentos com repetições dentro
dos blocos, pois, essas teorias estatı́sticas que dão suporte as análises de dados de pesquisas
experimentais são dificilmente encontradas na literatura, com isso a pouca aplicabilidade
em pesquisas com um número razoavelmente grande de tratamentos, com tudo, o planejamento de experimento é de fundamental importância para a obteção de resultados mais
confiáveis além de proporcionar a diminuição da variabilidade e encontrar valores mais
próximos dos esperados.
Para isso será utiliado um modelo matemático com o objetivo de representar e descrever o problema aqui colocado, de um experimento em blocos com repetições dentro dos
blocos, estimando-se os termos do modelo com o uso do método de mı́nimos quadrados,
que procura encontrar o melhor ajuste para um conjunto de dados tentando-se minimizar
a soma dos quadrados das diferenças entre o valor estimado e os dados observados, com
os resultado encontrados iremos decompor a variabilidade total e por fim encontramemos
as somas de quadrados, dispostas na tabela da Análise de Variância (ANOVA).
Com base em análises estatı́sticas, será mostrado que os estimadores do modelo matemático seguem todos uma distribuições de probabilidade normal e que as somas de
quadrados seguem todas uma distribuição de probabilidade qui-quadrada, com esses definições expostas pode-se definir os valores esperados das somas de quadrado que irá ajudar
11
a definir as estatı́sticas de teste utilizadas na contrastação das hipóteses de interesse para
tratamentos e para blocos, mostrando-se que o interesse maior em um experimento como
esse é fazer inferências no efeito dos tratamentos, pois, será visto que os blocos por serem
ambientes homogênios não teram efeito sobre os tratamentos apresentados.
Será apresentado algumas estatı́sticas de teste que podem ser utilizadas para se fazer
inferências marginais para alguns estimadores de tratamentos e de blocos.
12
2
Fundamentação Teórica
O foco principal deste trabalho é apresentar de modo claro o desenvolvimento da
teoria que dar suporte as análises estatı́sticas de um experimento em blocos completos
casualizados com repetições dentro dos blocos. Neste sentido, faz-se necessário apresentar
um desenho no espaço desse tipo de experimento, bem como, sugerir a construção de uma
tabela para recolhimento das observações.
2.1
Um possı́vel desenho do experimento no campo
Para ilustrar a localização espacial das unidades experinetais levou-se em conta um
experimento com I = 3 tratamentos, J = 4 blocos e R = 2 repetições dos tratamentos
dentro de cada bloco. Com estas caracterı́sticas o experimento poderá ter o seguinte
desenho no campo:
Bloco I
Bloco II
T2
T1
T3
T1
T3
T2
T1
T3
T2
T2
T1
T3
T3
T1
T2
T3
T1
T2
T2
T3
T1
T1
T2
T3
Bloco III
Bloco IV
13
2.2
Organização dos dados experimentais
A organização dos dados coletados no campo em tabelas apropriadas, facilitará o
tratamento estatı́stico posteriormente. Neste sentido, a tabela a seguir é uma sugestão
para esta finalidade.
Tabela 1: Tabela para recolhimento dos dados no campo.
Tratamento
1
Repetição
1
2
..
.
R
1
2
..
.
2
R
y111
y112
..
.
Bloco
2
···
y121 · · ·
y122 · · ·
..
.
y11R
y11.
y211
y212
..
.
y21R
y12.
y221
y222
..
.
y22R
y22.
..
.
..
.
1
..
.
..
.
..
.
..
.
y21R
y21.
..
.
..
.
I
1
2
..
.
yI11
yI12
..
.
yI21
yI22
..
.
R
yI1R
yI1.
y.1.
yI2R
yI2.
y.2.
Soma
J
y1J1
y1J2
..
.
Soma
y1.1
y1.2
..
.
···
···
···
···
y1JR
y1J.
y2J1
y2J2
..
.
y1.R
y1..
y2.1
y2.2
..
.
···
···
y2JR
y2J.
..
.
..
.
y2.R
y2..
..
.
..
.
yIJ1
yIJ2
..
.
yI.1
yI.2
..
.
yIJR
yIJ.
y.J.
yI.R
yI..
y...
···
···
···
···
···
···
···
Em que, yijr é a observação obtida da r-ésima unidade experimental que recebeu o trataR
J P
P
mento I no bloco J, yi.. =
yijr é o total das JR observações que receberam o i-ésimo
j=1 r=1
tratamento, y.j. =
R
I P
P
yijr é a soma das IR observações do j-ésimo bloco, yij. =
i=1 r=1
R
P
r=1
yijr
é a soma das R observações oriundas das unidades experimentais que receberam o trataR
J P
I P
P
yijr é a soma de todas as observações.
mento I no bloco J e y... =
i=1 j=1 r=1
2.3
O Modelo matemático
14
O modelo matemático adequado para descrever as observações de um experimento em
blocos ao acaso com repetições dentro dos blocos é, conforme Barbin (1993), como segue:
yijr = µ + τi + βj + ij + εijr ,
no qual:



 i = 1, 2, ..., I,
j = 1, 2, ..., J,


 r = 1, 2, ..., R,
(2.1)
yijr é a observação obtida da r-ésima unidade experimental do bloco j que recebeu o
i-ésimo tratamento;
µ é a média geral;
τi é o efeito do tratamento i sobre a variável resposta, considerado fixo;
βj é o efeito do bloco j sobre a variável resposta, também considerado fixo;
ij e εijr são respectivamente, erros atribuı́dos as unidades experimentais, entre e dentro
dos blocos, ambos aleatóros, independentes e identicamente distribuı́dos como uma
normal de médias zero e variâncias σ2 e σ 2 , respectivamente os quais serão denotados
por:
iid
iid
ij ∼ N (0; σ2 ) e εijr ∼ N (0; σ 2 ).
Decorre das suposições acerca dos termos no modelo (2.1) que:
E(µ) = µ;
E(µ2 ) = µ2 ; E(τi ) = τi ;
E(βj2 ) = βj2 ; E(ij ) = 0;
E(ij εks )
E(τi2 ) = τi2 ; E(βj ) = βj ;
E(2ij ) = σ2 ; E(εijr ) = 0; E(ε2ijr ) = σ 2 ;
= E(ij )E(εks )
= 0, ∀ i 6= k ou j 6= s;
E(εijr εksv ) = E(εijr )E(εksv ) = 0, ∀ i 6= k, j 6= s ou r 6= v;
E(ij εijr )
2.4
= E(ij )E(εijr )
= 0, ∀ i, j, r.
Estimação dos parâmetros, dos erros e das observações
O conjunto de dados observados num experimento em blocos ao acaso com repetições
dentro dos blocos, podem ser escrito da seguinte forma:
15
{y111 , · · · , y11R , y121 , · · · , y12R , · · · , · · · , yIJ1 , · · · , yIJR }
e podem ser representadas pelo modelo:



 i = 1, 2, · · · , I
yijr = m + ti + bj + eij + uijr
j = 1, 2, · · · , J


 r = 1, 2, · · · , R
em que,
(2.2)
m é o estimador de µ, a média geral;
ti é o estimador de τi , o efeito do tratamento i sobre a variável resposta;
bj é o estimador de βj , o efeito do bloco j sobre a variável resposta;
eij é o estimador de ij , o erro entre blocos;
uijr é o estimador de εijr , o erro dentro dos blocos.
Como foi dito no inı́cio, o método utilizado para encontrar os estimadores dos termos
no modelo (2.2), foi o de mı́nimos quadrados, que consiste de encontrar os estimadores,
de modo que torne mı́nima a soma dos quadrados dos erros dentro dos blocos.
Do modelo (2.2), tem-se que,
uijr = yijr − m − ti − bj − eij =⇒ u2ijr = (yijr − m − ti − bj − eij )2
Somando-se para todas as observações, vem
Z=
X
ijr
u2ijr =
X
(yijr − m − ti − bj − eij )2
ijr
Derivando-se parcialmente a função Z em relação a cada estimador, igualando-se a zero e explicitando cada um deles, vem:
X
∂Z
= 2
(yijr − m − ti − bj )(−1) = 0
∂m
ijr
X
X
= y... − IJRm − JR
ti − IR
bj = 0
i
∴ IJRm + JR
X
i
ti + IR
j
X
j
bj = y...
(2.3)
16
∂Z
∂ti
= 2
X
(yijr − m − ti − bj − eij )(−1) = 0
jr
= yi.. − JRm − JRti − R
X
bj − R
j
∴ JRm + JRti + R
X
= 2
X
eij = 0
j
bj + R
j
∂Z
∂bj
X
X
eij = yi..
(2.4)
j
(yijr − m − ti − bj − eij )(−1) = 0
ir
= y.j. − IRm − R
X
ti − IRbj − R
i
∴ IRm + R
X
= 2
X
eij = 0
j
ti + IRbj + R
i
∂Z
∂eij
X
X
eij = y.j.
(2.5)
j
(yijr − m − ti − bj − eij )(−1) = 0
r
= yij. − Rm − Rti − Rbj − Reij = 0
∴ Rm + Rti + Rbj + Reij = yij.
(2.6)
O sistema formado pelas Equações de (2.3) a (2.6) é conhecido na literatura por
sistema de equações normais. Isto é,

X
X

IJRm
+
JR
t
+
IR
bj
= y...
i




i

X
Xj



+ R
bj + R
eij = yi..
 JRm + JRti



IRm







Rm
+ R
X
j
ti
+ IRbj
+ R
i
+ Rti
j
X
(2.7)
eij = y.j.
j
+ Rbj
+ Reij
= yij.
O sistema de equações em (2.7) é inconsistente, e para resolve-lo é preciso impor as
seguintes restrições:
X
i
ti =
X
j
bj =
X
i
eij =
X
j
eij =
X
ij
eij = 0.
17
Assim sendo, o sistema (2.7), fica:


IJRm




 JRm + JRt
i

IRm
+ IRbj





Rm + Rti + Rbj + Reij
= y...
= yi..
= y.j.
(2.8)
= yij.
Resolvendo o sistema (2.8) obtém-se os estimadores de mı́nimos quadrados:
m = ȳ... ;
ti = ȳi.. − ȳ... ;
bj = ȳ.j. − ȳ... ;
eij = ȳij. − ȳi.. − ȳ.j. + ȳ...
(2.9)
Além disso, tem-se que
ŷijr = m + ti + bj + eij
= ȳ... + ȳi.. − ȳ... + ȳ.j. − ȳ... + ȳij. − ȳi.. − ȳ.j. + ȳ...
= ȳij.
daı́, tem-se que ȳij. é um estimador de mı́nimos quadrados de yijr .
Fazendo-se as devidas substituições na Equação (2.2), obtém-se o estimador do erro dentro
dos blocos, isto é,
uijr = yijr − ŷijr = (yijr − ȳ... ) − (ȳi.. − ȳ... ) − (ȳ.j. − ȳ... ) − (ȳij. − ȳi.. − ȳ.j. + ȳ... ). (2.10)
Um resumo dos resultados obtidos nesta seção é apresentado na Tabela 2 a seguir.
Tabela 2: Estimadores das caracterı́sticas envolvidas no modelo matemático.
Caracterı́sticas
µ
τi
βj
ij
εijr
yijr
2.5
Estimador
µ̂ = m = ȳ...
τ̂i = ti = ȳi.. − ȳ...
β̂j = bj = ȳ.j. − ȳ...
ˆij = eij = ȳij. − ȳi.. − ȳ.j. + ȳ...
ε̂ijr = uijr = yijr − ȳij.
ŷijr = ȳij.
Decomposição da variabilidade total
18
Elevando-se ao quadrado os dois lados da Equação (2.10) e somando-se para todas as
observações, vem:
X
u2ijr =
ijr
X
[(yijr − ȳ... ) − (ȳi.. − ȳ... ) − (ȳ.j. − ȳ... ) − (ȳij. − ȳi.. − ȳ.j. + ȳ... )]2
ijr
=
X
(yijr − ȳ... )2 + JR
ijr
|
{z
(1)
+R
X
(ȳi.. − ȳ... )2 + IR
i
|
}
X
{z
(2)
(ȳij . − ȳi.. − ȳ.j. + ȳ... )2 − 2
−2
}
(yijr − ȳ... )(ȳ.j. − ȳ... ) − 2
ijr
|
|
{z
}
X
|
(yijr − ȳ... )(ȳi.. − ȳ... )
{z
}
(yijr − ȳ... )(ȳij. − ȳi.. − ȳ.j. + ȳ... )
X
{z
}
(7)
(ȳi.. − ȳ... )(ȳ.j. − ȳ... ) + 2R
X
(ȳi.. − ȳ... )(ȳij. − ȳi.. − ȳ.j . + ȳ... )
ij
{z
}
(8)
+ 2R
}
(5)
X
ij
|
{z
(3)
ijr
(6)
+ 2R
X
|
ijr
{z
(4)
X
(ȳ.j. − ȳ... )2
j
}
ij
|
X
|
{z
(9)
(ȳ.j. − ȳ... )(ȳij. − ȳi.. − ȳ.j. + ȳ... )
}
(2.11)
ij
|
{z
}
(10)
Desenvolvedo-se algebricamente os termos de (1) a (10) da expressão (2.11), obtém-se
os seguintes resultados:
(1) =
X
(yijr − ȳ... )2 =
ijr
(2) = JR
X
2
yijr
− C,
em que C =
ijr
|
{z
SQT otal
2
y...
;
IJR
}
X
1 X 2
(ȳi.. − ȳ... )2 =
y − C;
JR i i..
i
|
{z
}
SQT ratamento
(3) = IR
X
(ȳ.j. − ȳ... )2 =
j
1 X 2
y − C;
IR j .j.
{z
}
|
SQBlocos
(4) = R
X
(ȳij. − ȳi.. − ȳ.j. + ȳ... )2
ij
1 X
1 X
2
2
=
−C −
y −C −
y −C ;
R ij
JR i i..
IR j .j.
{z
}
|
{z
}
{z
}
|
|
SQT ratamento
SQP arcelas
SQBlocos
{z
}
|
1 X
2
yij.
SQErro Entre
19
(5) =
X
(yijr − ȳ... )(ȳi.. − ȳ... ) =
ijr
1 X 2
y − C;
JR i i..
|
{z
}
SQT ratamento
(6) =
1 X 2
y.j. − C ;
(yijr − ȳ... )(ȳ.j. − ȳ... ) =
IR
j
ijr
{z
}
|
X
SQBlocos
(7) =
X
(yijr − ȳ... )(ȳij. − ȳi.. − ȳ.j. + ȳ... )
ijr
=
1 X
R
|
(8) = R
ij
SQT ratamento
SQP arcelas
X
ij
= R
1 X
1 X
2
2
2
yij.
−C −
yi..
−C −
y.j.
−C ;
JR i
IR j
|
{z
}
{z
}
{z
}
|
i
X yi..
i
SQBlocos
X
X
(ȳi.. − ȳ... )(ȳ.j. − ȳ... ) = R
(ȳi.. − ȳ... )
(ȳ.j. − ȳ... )
JR
− ȳ...
X y
j
.j.
IR
− y...
j
y
y... y...
y... ...
− IR
− RJ
R
= R
IR
IJR
y JR y IJR
y... y... ...
...
=
−
−
=0
J
J
I
I
X
(9) = R
(ȳi.. − ȳ... )(ȳij. − ȳi.. − ȳ.j. + ȳ... )
ij
y... X yij.
yi..
y.j.
y... −
−
−
+
= R
JR IJR j
R
JR IR IJR
i
X yi.. y... yi..
yi..
y...
y... =
−
−J
−
+J
=0
J
IJ
R
JR IR
IJR
i
X
(10) = R
(ȳ.j. − ȳ... )(ȳij. − ȳi.. − ȳ.j. + ȳ... )
X yi..
ij
y... X yij.
yi..
y.j.
y... −
−
+
IR IJR i
R
JR IR IJR
j
X y.j. y... y.j.
y...
y.j.
y... −
−
−I
+I
=0
=
I
IJ
R
JR
IR
IJR
j
= R
X y.j.
−
Substituindo-se estes resultados em (2.11), vem
!
!
!
X
X
1 X 2
1 X 2
2
2
yijr − C +
uijr =
y −C +
y −C
JR i i..
IR j .j.
ijr
ijr
!
!
!#
"
1 X 2
1 X 2
1X 2
y −C −
y −C −
y −C
−
R ij ij.
JR i i..
IR j .j.
!
!
1 X 2
1 X 2
y −C −2
y −C
−2
JR i i..
IR j .j.
20
−2
X
u2ijr
ijr
"
1X 2
y −C
R ij ij.
!
−
1 X 2
y −C
JR i i..
!
1 X 2
y −C
IR j .j.
−
!#
+2 × 0 + 2 × !
0+2×0
!
!
X
X
X
1
1
2
2
2
yijr
−C −
yi..
−C −
y.j.
−C
=
JR
IR
ijr
i
j
"
!
!
!#
1X 2
1 X 2
1 X 2
−
y −C −
y −C −
y −C
R ij ij.
JR i i..
IR j .j.
ou,
X
2
yijr
−C
ijr
|
{z
SQT otal
=
}
1 X
1 X
2
2
y −C +
y −C
+
JR i i..
IR j .j.
ijr
|
{z
} |
{z
}
| {z }
X
u2ijr
SQT ratamento
SQErro Dentro
SQBlocos
1 X
1 X
2
2
2
yij.
−C −
yi..
−C −
y.j.
−C
+
R ij
JR i
IR j
|
{z
}
{z
}
{z
}
|
|
SQT ratamento
SQP arcelas
SQBlocos
{z
}
|
1 X
SQErro Entre
Portanto, a soma dos quadrados total é decomposta em quatro partes, a saber,
SQT otal = SQBlocos + SQT ratamentos + SQErro Entre + SQErro Dentro .
Na prática, a SQErro Dentro é calculada da seguinte maneira:
X
u2ijr
=
ijr
| {z }
SQErro Dentro
X
ijr
|
!
X
1
2
y2 − C .
yijr
−C −
R ij ij.
{z
} |
{z
}
SQT otal
!
(2.12)
SQP arcelas
Os resultados da decomposição da variabilidade total é organizada na Tabela 3, a qual
é conhecida na literatura por Tabela da Análise da Variância - ANOVA.
21
Tabela 3: Tabela da Análise da Variância - ANOVA
F.V.
Tratamento
G.L.
I −1
Blocos
J −1
S.Q.
P 2
yi.. − C
i
P
1
2
y.j.
−C
IR
Q.M.
QMT rat
1
JR
F
QMBlocos
j
Erro Entre
Parcelas
(I − 1)(J − 1)
(IJ − 1)
Erro Dentro
Total
IJ(R − 1)
IJR − 1
SQP arc − SQ
P T2rat − SQBlocos
1
yij. − C
R
QMErro Entre
-
ij
SQT otal − SQP arc
P 2
yijr − C
QMErro Entre
-
ijr
em que, os resultados da coluna 4, da Tabela 3, referentes aos Quadrados Médios
(Q.M.), são obtidos por meio da divisão dos elementos da coluna 3, (S.Q.) pelos respectivos elementos da coluna 2, (G.L.). Os elementos da coluna 5, (F), serão discutidos e
apresentados posteriormente.
2.6
Distribuição de probabilidade dos estimadores
Nesta seção será estudada as distribuições de probabilidade dos estimadores, bem
como algumas propriedades destes. Os elementos a seguir ajudarão nas demonstrações
das caracerı́sticas associadas às distribuições de probabilidade dos estimadores a serem
desenvolvidas.
yijr = µ + τi + βj + ij + εijr
e que,
E(ij ) = 0,
E(εijr ) = 0,
iid
E(2ij ) = σ2 =⇒ ij ∼ N (0; σ2 ),
iid
E(ε2ijr ) = σ 2 =⇒ εijr ∼ N (0; σ 2 ),
consequentemente, tem-se:
E(yijr ) = µ + τi + βj ,
V ar(yijr ) = σ2 + σ 2
e segue que
yijr ∼ N µ + τi + βj ; σ2 + σ 2 .
22
2.6.1
Distribuição de probabilidade de ȳ... , o estimador de µ.
1 X
1
(y111 + y112 + ... + yIJR ), que é uma combinação linear dos yijr ,
yijr =
IJR ijr
IJR
os quais seguem distribuição normal. Como sabe-se que combinação linear de variáveis
ȳ... =
normais é também normal, então ȳ... segue uma distribuição normal;
Mas, sendo
ȳ... =
1 X
1 X
yijr =
(µ + τi + βj + ij + εijr )
IJR ijr
IJR ijr
1
=
IJR
= µ+
IJRµ + JR
X
τi + IR
i
X
βj + R
j
1 X
1 X
ij +
εijr ,
IJ ij
IJR ijr
X
ij
ij +
X
ijr
εijr
!
as caracterı́sticas da distribuição de ȳ... serão determinadas como segue:
!
X
1 X
1 X
1
yijr =
E
E (yijr ) =
(µ + τi + βj )
E(ȳ... ) =
IJR
IJR ijr
IJR ijr
ijr
!
X
X
1
=
IJRµ + JR
τi + IR
βj ,
IJR
i
j
mas por definição µ é a média geral e, portanto, cumpre-se que
X
i
τi =
X
βj = 0,
j
logo,
E(ȳ... ) = µ.
Além disso,
V ar(ȳ... ) = E[ȳ... − E(ȳ... )]2 = E[ȳ... − µ]2
#2
"
1 X
1 X
ij +
εijr − µ
= E µ+
IJ ij
IJR ijr
#2
"
1 X
1 X
= E
ij +
εijr
IJ ij
IJR ijr
2
1
1
(11 + ... + IJ ) +
(ε111 + ... + εIJR )
= E
IJ
IJR
(2.13)
23
h 1
(2 + ... + 2IJ + dp)
I 2 J 2 11
i
1
+ 2 2 2 (ε2111 + ... + ε2IJR + dp) + dp
I J R
1
1
= 2 2 (σ2 + ... + σ2 + 0) + 2 2 2 (σ 2 + ... + σ 2 + 0) + 0
I J
I J R
1
σ2
1
σ2
2
2
= 2 2 IJσ + 2 2 2 IJRσ =
+
I J
I J R
IJ IJR
= E
e segue que
1 2
σ + Rσ2 .
IJR
(2.14)
1
2
2
µ;
(σ + Rσ ) .
IJR
(2.15)
V ar(ȳ... ) =
Portanto,
ȳ... ∼ N
Obs.: dp = duplos produtos da equação.
2.6.2
Distribuição de probabilidade da correção para média, C.
A distribuição de probabilidade de C é obtida do seguinte modo:
Sendo,
ȳ... ∼ N
1
(σ 2 + Rσ2 )
µ;
IJR
=⇒ r
ȳ... − µ
σ 2 + Rσ2
IJR
∼ N (0; 1).
Assim, sob H0 : µ = 0
ȳ − 0
q...
∼ N (0; 1) =⇒
σ 2 +Rσ2
IJR
Isto é, a estatı́stica
C
σ 2 +Rσ2
2
ȳ...
σ 2 +Rσ2
IJR
segue uma distribuição de qui-quadrado com 1 grau de liberdade
e será denotado por:
σ2
em que C =
2.6.3
2
y...
IJR y... y...
IJR
=
∼ χ2(1) .
= 2 IJR IJR
2
2
2
σ + Rσ
σ + Rσ
C
∼ χ2(1) ,
+ Rσ2
(2.16)
2
y...
.
IJR
Distribuição de probabilidade de ti , o estimador de τi .
Para se obter a distribuição de probabilidade do estimador do efeito do i-ésimo tra-
24
tamento pode ser usado o seguinte procedimento:
1 X
1 X
yijr −
yijr , que é uma combinação linear dos yijr
JR jr
IJR ijr
que segue uma distribuição normal e, portanto, ti é normal.
ti = ȳi.. − ȳ... =
Além disso,
ti

0 X
X
X
1 
=
βj + R
ij +
εijr 
JRµ + JRτi + R
JR
j
j
ijr


0 X
0
X
X
X
1 
−
IJRµ + JR
βj + R
ij +
εijr 
τ
i + IR
IJR
j
ij
ijr
i
!
!
1X
1 X
1 X
1 X
=
µ + τi +
ij +
εijr − µ +
ij +
εijr
J j
JR jr
IJ ij
IJR ijr
1 X
1 X
1 X
1X
ij +
εijr −
ij −
εijr .
= τi +
J j
JR jr
IJ ij
IJR ijr

Portanto,
E(ti ) = τi .
(2.17)
Além disso, tem-se que
V ar(ti ) = E[ti − E(ti )]2
h
i2
1X
1 X
1 X
1 X
= E τi +
ij +
εijr −
ij −
εijr − τi
J j
JR jr
IJ ij
IJR ijr
i2
h1 X
1 X
1 X
1 X
ij +
εijr −
ij −
εijr
= E
J j
JR jr
IJ ij
IJR ijr
h 1 X 2
2
1 X
1 X 2
= E 2
ij + 2 2
εijr + 2 2
ij
J
J R jr
I J
j
ij
2
2 X X
2 X X 1 X
εijr + 2
ij
ij
ij
εijr − 2
+ 2 2 2
I J R ijr
J R j
IJ
j
ij
jr
X 2 X
2 X X
ij
εijr
εijr − 2
ij
− 2
IJ R j
IJ R jr
ijr
ij
X
i
2 X
2 X X
− 2 2
εijr
εijr + 2 2
ij
εijr
IJ R
I J R ij
ij
ijr
ijr
σ2
σ2
σ2
σ2
σ2
σ2
σ2
σ2
σ2
σ2
+
+ +
−2 −2
= +
− −
J
JR IJ IJR
IJ
IJR
J
JR IJ
IJR
i
1 h
1
2
2
2
2
2
2
(IRσ − Rσ + Iσ − σ ) =
=
R(I − 1)σ + (I − 1)σ
IJR
IJR
(I − 1) 2
(σ + Rσ2 ).
=
IJR
=
25
Portanto,
V ar(ti ) =
Assim sendo, conclui-se que
(I − 1) 2
σ + Rσ2 .
IJR
(2.18)
(I − 1) 2
t i ∼ N τi ;
σ + Rσ2 .
IJR
Ou seja, ti , tem distribuição normal com média τi e variância
(2.19)
(I−1)
IJR
(σ 2 + Rσ2 ), para
todo i = 1, 2, · · · , I.
2.6.4
Distribuição de probabilidade da SQT rat .
A partir dos resultados da subseção anterior resumida na expressão (2.19) deduz-se
que,
Z=q
ȳi .. − ȳ... − τi
=q
∼ N (0; 1)
(I−1)
(I−1)
2 + Rσ 2 )
2 + Rσ 2 )
(σ
(σ
IJR
IJR
t i − τi
e sob a hipótese de que os tratamentos não têm efeitos sobre a variável resposta, Y , isto
é, sob H0 : τ1 = τ2 = ... = τI = 0, então,
ȳi .. − ȳ...
e
q
(I−1)
(σ 2
IJR
∼ N (0; 1) =⇒
+ Rσ2 )
(ȳi .. − ȳ...)2
(I−1)
(σ 2
IJR
+ Rσ2 )
∼ χ2(1)
(I − 1) 2
JR(ȳi .. − ȳ...)2
JR(ȳi .. − ȳ...)2
∼
∼ χ2(1) ⇒
χ(1) ⇒
(I − 1) 2
σ 2 + Rσ2
I
2
(σ + Rσ )
I
P
JR i (ȳi .. − ȳ...)2
∼ (I − 1)χ2(1) .
σ 2 + Rσ2
Portanto,
JR
P
i (ȳi .. − ȳ...)
2
σ + Rσ2
2
=
SQT rat
∼ χ2(I−1) .
σ 2 + Rσ2
(2.20)
Em palavras, a soma de quadrados devida aos tratamentos dividida por σ 2 + Rσ2 é
distribuı́da como uma qui-quadrado com (I − 1) graus de liberdade.
2.6.5
Distribuição de probabilidade de bj , o estimador de βj .
26
Para se obter a distribuição de probabilidade do estimador do efeito do j-ésimo bloco
pode ser usado o seguinte procedimento:
1 X
1 X
yijr −
yijr , é uma combinaçãao linear dos yijr os
IR ir
IJR ijr
quais seguem uma distribuição normal portanto, bj também é normal;
bj = ȳ.j. − ȳ... =
Além disso,

0
X
X
X
1 
IRµ + R
τ
ij +
εijr 
=
i + IRβj + R
IR
i
i
ijr


0
0
X X
X
X
1 
−
IJRµ + JR
βj + R
ij +
εijr 
τi + IR
IJR
j
ij
ijr
i

bj
1X
1 X
1 X
1 X
ij +
εijr − µ −
ij −
εijr
I i
IR ir
IJ ij
IJR ijr
1 X
1 X
1 X
1X
ij +
εijr −
ij −
εijr
= βj +
I i
IR ir
IJ ij
IJR ijr
= µ + βj +
Portanto
E(bj ) = βj .
(2.21)
Além disso, tem-se que
V ar(bj ) = E[bj − E(bj )]2
#2
"
1 X
1 X
1 X
1X
ij +
εijr −
ij −
εijr − βj
= E βj +
I i
IR ir
IJ ij
IJR ijr
!2
!2
!2
X
X
1 X
1
1
= E 2
ij + 2 2
εijr + 2 2
ij
I
I R
I J
i
ir
ij
!
!
!2
X
X
X
1
2
+ 2 2 2
ij − dp
ij
εijr + dp − 2
I J R
I J
ij
i
ijr
!
!
X
X
2
−dp + 2 2
εijr + dp
εijr
I JR
ijr
ir
σ2
σ2
σ2
σ2
σ2
σ2
+
+ +
−2 −2
I
IR IJ IJR
IJ
IJR
σ2
σ2
σ2
σ2
=
+
−
−
I
IR IJ
IJR
1
1
(JRσ2 + Jσ 2 − Rσ2 − σ 2 ) =
(R(J − 1)σ2 + (J − 1)σ 2 )
=
IJR
IJR
=
27
Portanto
V ar(bj ) =
Com isso, obtém-se
bj ∼ N
J −1 2
(σ + Rσ2 ).
IJR
J −1 2
2
βj ;
(σ + Rσ ) .
IJR
(2.22)
(2.23)
Ou seja, o estimador bj do efeito do bloco j segue uma distribuição normal com média
βj e variância
2.6.6
J−1
(σ 2
IJR
+ Rσ2 ).
Distribuição de probabilidade da SQBlocos
Como já se sabe, bj ∼ N
J −1 2
2
βj ;
(σ + Rσ ) . Portanto, é possı́vel deduzir que
IJR
ȳ.j. − ȳ... − βj
bj − E(bj )
p
=r
∼ N (0; 1).
V ar(bj )
J −1 2
2
(σ + Rσ )
IJR
Assim, sob H0 : β1 = β2 = ... = βj = 0,
ȳ.j. − ȳ...
r
∼ N (0; 1) =⇒
J −1 2
(σ + Rσ2 )
IJR
IR(ȳ.j. − ȳ... )2
(J − 1) 2
∼
χ(1)
2
2
σ + Rσ
J
Portanto,
IR
X
(ȳ.j. − ȳ... )2
∼ χ2(1) ⇒
J −1 2
2
(σ + Rσ )
IJR
(ȳ.j. − ȳ... )2
j
σ 2 + Rσ2
=
SQBlocos
∼ χ2(J−1)
σ 2 + Rσ2
(2.24)
ou seja, a soma de quadrados de blocos dividida por (σ 2 + Rσ2 ) segue uma distribuição
de qui-quadrado com (J − 1) graus de liberdade.
2.6.7
Distribuições de probabilidade de mi , o estimador de µi =
µ + τi , (a média do tratamento i) e de mj , o estimador de
µj = µ + βj , (a média do bloco j).
Sabe-se que mi , o estimador da média do i-ésimo tratamento, µi = µ + τi , é definido
por
mi = m + ti = ȳ... + ȳi.. − ȳ... = ȳi.. =
1 X
yijr
JR j,r
28
que é uma combinação linear dos yijk ’s os quais seguem uma distribuição normal e, portanto, mi também é normal. Continuando-se o desenvolvimento algébrico de mi , vem


0 X
X
X
X
1
1 
mi =
βj + R
ij +
εijr 
JRµ + JRτi + R
yijr =
JR j,r
JR
j
j
j,r
= µi +
1X
1 X
ij +
εijr .
J j
JR j,r
(2.25)
O valor esperado de mi é então
E(mi ) = E
1X
1 X
µi +
ij +
εijr
J j
JR j,r
!
= µi
(2.26)
Por outro lado, a variância de mi pode ser obtida como,
#2
"
X
X
1
1
ij +
εijr − µi
V ar(mi ) = E[mi − E(mi )]2 = E µi +
J j
JR j,r
1
1 2
2
2
2
= E 2 (i1 + · · · + 1J + dp) + 2 2 (εi11 + · · · + εiJR + dp) + odp
J
J R
J 2
JR
1
=
σ + 2 2 σ 2 =
(σ 2 + Rσ2 ).
(2.27)
2
J
J R
JR
Assim sendo, conclui-se que
iid
mi ∼ N
1
2
2
(σ + Rσ ) , i = 1, 2, · · · , I.
µi ,
JR
(2.28)
Daı́, conclui-se que o estimador da média do i-ésimo tratamento segue uma disribuição
normal de média µi e variância
1
(σ 2
IR
+ Rσ2 ).
Por procedimento análogo, obtém-se a distribuição de probabilidade de mj , ou seja,
1 2
iid
2
(σ + Rσ ) , j = 1, 2, · · · , J.
(2.29)
m j ∼ N µj ,
IR
E, conclui-se que o estimador da média do j-ésimo bloco segue uma disribuição normal
com média µj e variância
2.6.8
1
(σ 2
IR
+ Rσ2 ).
Distribuições de probabilidade de contrastes de interesse
Dois resultados de grande interesse neste trabalho diz respeito as distribuições de
probabilidade dos estimadores de combinações lineares das médias dos tratamentos ou dos
29
blocos, Ψ̂h =
I
P
chi mi ou Ψ̂h =
J
P
chj mj , respectivamente, em que
j=1
i=1
P
i chi =
P
j
chj = 0.
Aqui, serão apresentadas as demonstrações relativas as combinações lineares de médias
dos tratamentos e intuitivamente serão apresentados os resultados para uma combinação
linear de médias dos blocos. Considere o estimador de uma combinação linear das médias
dos tratamentos
Ψ̂h =
I
X
chi mi =
i=1
I
X
chi ȳi.. =
i=1
X
chi
i
1 X
yijr
JR j,r
que é uma combinação linear de variáveis normais e, portanto, Ψ̂h também segue uma
distribuição normal.
Continuando-se o desenvolvimento algébrico, vem
Ψ̂h =
I
X
chi
i=1
=
I
X
i=1
=
I
X
i=1
1 X
yijr
JR j,r


0
7
J J
X
X
X

1 


βj + R
JRµ
+
JRτ
+
R
+
ε
chi
i
ij
ijr

JR 
j=1
j=1
j,r
chi
J
1 X
1X
ij +
εijr
µi +
J j=1
JR j,r
!
.
(2.30)
Daı́, o valor esperado do estimador Ψ̂h , fica
" I
!#
J
I
X
X
1X
1 X
E(Ψ̂h ) = E
chi µi +
=
ij +
chi µi
εijr
J j=1
JR j,r
i=1
i=1
Para obter a variância do estimador Ψ̂h procedeu-se do seguinte modo
V ar(Ψ̂h ) = E[Ψ̂h − E(Ψ̂h )]2
2

I
I
I
J
I
X
X
X
X
X
X
1
1
chi µi 
chi µi +
chi
εijr −
ij +
= E
chi
J
JR
i=1
i=1
i=1
j,r
j=1
i=1
#
" I
2
J
I
X 1X
X
1 X
= E
εijr
chi
ij +
chi
J
JR
j,r
i=1
j=1
i=1
!
!#2
"
I
I
I
I
X
X
X
1
1 X
chi i1 + · · · +
chi εi11 + · · · +
chi iJ +
chi εiJR
= E
J i=1
JR
i=1
i=1
i=1
"
!
!#
I
I
X
X
1
1
2
2
2
c
=
Jσ
JRσ
c2hi
+
hi
2
2
2
J
J R
i=1
i=1
30
=
I
I
X
1 2
1 2 X 2
1
2
2
σ +
σ
chi =
(σ + Rσ )
c2hi .
J
JR
JR
i=1
i=1
(2.31)
Assim sendo, conclui-se que o estimador de um contraste das médias dos tratamentos
I
P
h
chi µi e variância K
segue uma distribuição normal com média Ψh =
(σ 2 + Rσ2 ), em
JR
i=1
que Kh é a soma dos quadrados dos coeficientes do contraste h, isto é, Kh =
I
P
i=1
denotado por
Ψ̂h ∼ N
I
X
i=1
Kh 2
(σ + Rσ2 )
chi µi ,
JR
!
c2hi e será
(2.32)
Usando um procedimento análogo, demonstra-se que o estimador de um contraste das
J
P
chj µj e variância
médias dos blocos segue uma distribuição normal com média Ψh =
j=1
Kh
(σ 2
IR
+
Rσ2 )
o qual será denotado como
Ψ̂h ∼ N
!
Kh 2
chj µj ,
(σ + Rσ2 ) ,
IR
j=1
J
X
(2.33)
em que Kh é a soma dos quadrados dos coeficientes do contraste h, isto é, Kh =
J
P
j=1
2.6.9
c2hj .
Distribuição de probabilidade da soma de quadrados da
h-ésima combinação linear das médias dos tratamentos
Foi demonstrado que a distribuição de probabilidade de Ψ̂h =
I
P
chi ȳi.. , o estimador do
i=1
h-ésimo contraste de médias dos tratamentos, Ψh =
I
P
chi µi é, de acordo com a expressão
i=1
(2.32), distribuı́da como
Ψ̂h ∼ N
I
X
i=1
!
Kh 2
chi µi ,
(σ + Rσ2 ) .
JR
Usando resultados conhecidos da teoria de probabilidade, deduz-se que
I
P
chi µi
chi ȳi.. −
Ψ̂h − E(Ψ̂h )
i=1
i=1
q
= q
∼ N (0, 1).
Kh
Kh
2 + Rσ 2 )
2 + Rσ 2 )
(σ
(σ
JR
JR
I
P
(Ψ)
e, sob a hipóteses de que o contraste h é nulo, isto é, sob H0
: Ψh =
I
P
i=1
chi µi = 0, a
31
estatı́stica
q
e segue que
I
P
chi ȳi..
i=1
Kh
(σ 2
JR
2
+ Rσ2 )
=
I
P
JRKh
chi ȳi..
i=1
Kh
(σ 2
JR
chi yi..
i=1
(σ 2
em que, SQContraste = SQ(Ψ̂h ) =
2.6.10
I
P
+
∼ N (0, 1)
+ Rσ2 )
2
Rσ2 )
I
P
chi yi..
i=1
=
SQ(Ψ̂h )
SQContraste
= 2
∼ χ2(1)
2
2
σ + Rσ
σ + Rσ2
!2
JRKh
e Kh =
I
P
i=1
(2.34)
c2hi .
Distribuição de probabilidade de ˆij , o estimador de ij .
Um outro resultado útil diz respeito a distribuição de probabilidade de ˆij , o estimador
do erro entre parcelas, o qual pode ser obtido utilizando-se o seguinte procedimento:
ˆij = ȳij. − ȳi.. − ȳ.j. + ȳ... =
1 X
1 X
1 X
1X
yijr −
yijr −
yijr +
yijr ,
R r
JR jr
IR i
IJR ijr
como pode-se observar, ˆij é uma combinação linear dos yijr os quais seguem distribuição
normal. Portanto, ˆij também segue uma distribuição normal. É necessário agora, saber
quais as caracterı́sticas da distribuição de ˆij .
E(ˆij ) =
1X
1 X
E(µ + τi + βj + ij + εijr ) −
E(µ + τi + βj + ij + εijr )
R r
JR jr
1 X
1 X
−
E(µ + τi + βj + ij + εijr ) +
E(µ + τi + βj + ij + εijr )
IR ir
IJR ijr
1
1
(Rµ + Rτi + Rβj ) −
(JRµ + JRτi + Rβj )
R
JR
X
X
1
1
− (IRµ + Rτi + IRβj ) +
(µ + JR
τi IR
+βj )
IR
IJR
i
j
1X
1X
1X
1X
βj − µ −
τi − βj + µ +
τi +
βj .
= µ + τi + βj − µ − τi −
J j
I i
I i
J j
=
Portanto,
E(ˆij ) = 0.
32
Além disso,
V ar(ˆij ) = E[ȳij. − ȳi.. − ȳ.j. + ȳ... ]2
"
#2
X
X
X
X
1
1
1
1
= E
yijr −
yijr −
yijr +
yijr
R r
JR jr
IR ir
IJR ijr
!2
!2
!2
h 1 X
X
X
1
1
yijr + 2 2
yijr + 2 2
yijr
= E 2
R
J
R
I
R
r
jr
ir
|
{z
} |
{z
}
{z
} |
(1)
(3)
(2)
!2
X
1
2
+ 2 2 2
yijr −
I J R
JR2
ijr
{z
} |
|
X
(4)
2
+
IJR2
|
X
(1) =
{z
X
yijr
ijr
(7)
2
− 2 2
IJ R
|
onde,
yijr
r
!
X
yijr
jr
{z
!
X
(9)
{z
X
!
2
+
IJR2
} |
X
2
− 2 2
I JR
} |
2
2
X
r
!
{z
2
−
IR2
} |
X
yijr
ir
(8)
!
E 2 2
=
(R µ + R2 τi2 + R2 βj2 + R2 2ij +
R2
yijr
jr
X
1
E(Rµ
+
Rτ
+
Rβ
+
R
+
εijr )2
i
j
ij
R2
r
2
yijr
jr
!
(5)
yijr
ijr
yijr
r
!
εijr
X
yijr
ir
!
{z
(10)
X
ijr
X
r
yijr
!
{z
(6)
!
}
yijr
!
i
}
!2
+2R µτi + 2R µβj + 2R τi βj + dp)
1
= µ2 + τi2 + βj2 + σ2 + σ 2 + 2µτi + 2µβj + 2τi βj
R
0 X
X X
>
1
E(JRµ
+
JRτ
+
R
β
+
R
+
εijr )2
(2) =
i
j
ij
J 2 R2
j
jr
j
!2
!2
X
X
E
εijr + 2J 2 R2 µτi + dp)
(J 2 R2 µ2 + J 2 R2 τi2 + R2
ij +
=
J 2 R2
jr
j
= µ2 + τi2 +
1 2
1 2
σ +
σ + 2µτi
J
JR
X 0
X
X
1
τi + IRβj + R
ij +
εijr )2
(3) = 2 2 E(IRµ + R
I R
i
i
ir
X
ir
yijr
!
}
33
E
= 2 2 [I 2 R2 µ2 + I 2 R2 βj2 + R2
I R
X
ij
i
!2
X
+
ir
εijr
!
+ 2I 2 R2 µβj ]
1 2
1
σ + 2µβj
= µ2 + βj2 σ2 +
I
IR
0 X
X 0
X X
>
1
(4) = 2 2 2 E[IJRµ + JR
τi + IRR βj + R
ij +
εijr ]2
I J R
j
i
ij
ijr
!2
!
2
X
X
E
εijr + dp]
= 2 2 2 [I 2 J 2 R2 µ2 + R2
ij +
I J R
ijr
ij
= µ2 +
1 2
1 2
σ +
σ
IJ
IJR
0
X
X >
1
E[(Rµ + Rτi + Rβj + Rij +
εijr )(JRµ + JRτi + R βj
(5) =
JR2
r
j
X
X
+R
ij +
εijr )]
j
jr
1
E[JR2 µ2 + JR2 µτi + JR2 µτi + JR2 τi2 + JR2 µβj
=
2
JR
!
!
!
X
X
X
εijr + dp]
εijr
ij +
+JR2 τi βj + R2 ij
r
j
jr
1
(JR2 µ2 + 2JR2 µτi + JR2 τi2 + JR2 µβj + JR2 τi βj + R2 σ2 + Rσ 2 )
JR2
1
1 2
= µ2 + τi2 + 2µτi + µβj + τi βj + σ2 +
σ
J
JR
X
X 0
1
(6) =
E[(Rµ + Rτi + Rβj + Rij +
εijr )(IRµ + R
τi
IR2
r
i
X
X
+IRβj + R
ij +
εijr )]
=
i
ir
1
E[IR2 µ2 + IR2 µβj + IR2 µτi + IR2 τi βj + IR2 µβj
=
IR2
!
!
!
X
X
X
εijr + dp]
εijr
ij +
+IR2 βj2 + R2 ij
i
r
ir
1
=
(IR2 µ2 + 2IR2 µβj + IR2 µτi + IR2 τi βj + IR2 βj2 + R2 σ2 + Rσ 2 )
IR2
1
1 2
= µ2 + βj2 + 2µβj + µτi + τi βj + σ2 +
σ
I
IR
X
X
1
E[(Rµ
+
Rτ
+
Rβ
+
R
+
ε
)(IJRµ
+
JR
τi
(7) =
i
j
ij
ijr
IJR2
r
i
0
34
0 X
X >
X
+IRR βj + R
ij +
εijr )]
j
ij
ijr
1
=
E[IJR2 µ2 + IJR2 µτi + IJR2 µβj + R2 ij
IJR2
!
!
X
X
+
εijr + dp]
εijr
r
X
ij
ij
!
ijr
1
(IJR2 µ2 + IJR2 µτi + IJR2 µβj + R2 σ2 + σ 2 )
2
IJR
1 2
1 2
= µ2 + µτi + µβj +
σ +
σ
IJ
IJR
0 X
X X
X 0
>
1
(8) =
E[(JRµ
+
JRτ
+
R
β
+
R
+
ε
)(IRµ
+
R
τi
i
ij
ijr
j
IJR2
j
j
jr
i
X
X
+IRβj + R
ij +
εijr )]
=
i
ir
1
E[IJR2 µ2 + IJR2 µβj + IJR2 µτi + IJR2 τi βj + R2
=
IJR2
!
!
X
X
εijr + dp]
εijr
+
jr
X
ij
j
!
X
ir
1
=
(IJR2 µ2 + IJR2 µτi + IJR2 µβj + IJR2 τi βj + R2 σ2 + σ 2 )
IJR2
1 2
1 2
= µ2 + µτi + µβj + τi βj +
σ +
σ
IJ
IJR
0 X
X X
>
1
E[(JRµ
+
JRτ
+
R
β
+
R
+
εijr )(IJRµ
(9) =
i
j
ij
IJ 2 R2
j
j
jr
X 0 X
X
X 0
+JR
βj + R
ij +
εijr )]
τi + IR
i
j
ij
1
E[IJ 2 R2 µ2 + IJ 2 R2 µτi + R2
=
IJ 2 R2
!
!
X
X
εijr + dp]
εijr
+
jr
ijr
X
j
ij
!
X
ij
ij
!
ijr
1
(IJ 2 R2 µ2 + IJ 2 R2 µτi + JR2 σ2 + JRσ 2 )
IJ 2 R2
1 2
1 2
= µ2 + µτi +
σ +
σ
IJ
IJR
=
(10) =
X 0
X
X
1
E[(IRµ
+
R
τ
+
IRβ
+
R
+
εijr )(IJRµ
i
j
ij
I 2 JR2
i
i
ir
j
ij
!
35
X 0 X
X
X 0
+JR
βj + R
ij +
εijr )]
τi + IR
i
j
ij
1
= 2 2 E[I 2 JR2 µ2 + I 2 JR2 µβj + R2
I JR
!
!
X
X
εijr + dp]
εijr
+
1
I 2 JR2
X
j
ij
!
X
ij
ij
!
ijr
ir
=
ijr
(I 2 JR2 µ2 + I 2 JR2 µβj + IR2 σ2 + IRσ 2 )
= µ2 + µβj +
1 2
1 2
σ +
σ
IJ
IJR
Agora,
1 2
σ + 2µτi + 2µβj + 2τi βj
R
1
1 2
+µ2 + τi2 + σ2 +
σ + 2µτi
J
JR
1 2
1 2
1 2
1
σ + 2µβj + µ2 +
σ +
σ
+µ2 + βj2 + σ2 +
I
IR
IJ
IJR
2
2 2
−2µ2 − 2τi2 − 4µτi − 2µβj − 2τi βj − σ2 −
σ
J
JR
2
2 2
−2µ2 − 2βj2 − 4µβj − 2µτi − 2τi βj − σ2 −
σ
I
IR
2 2
2 2
σ −
σ
−2µ2 − 2µτi − 2µβj −
IJ
IJR
2 2
2 2
+2µ2 + 2µτi + 2µβj + 2τi βj +
σ +
σ
IJ
IJR
2 2
2 2
2 2
2 2
−2µ2 − 2µτi −
σ −
σ − 2µ2 − 2µβj −
σ −
σ
IJ
IJR
IJ
IJR
V ar(ˆij ) = 0µ2 + 0τi2 + 0βj2 + 0µτi + 0µβj + 0τi βj
1
2
2
2
2
2
2
1 1
σ2
− − −
+
−
−
+ 1+ + +
J I IJ
J
I
IJ IJ
IJ
IJ
1
1
1
1
2
2
4
4
+
σ2
+
+
+
−
−
+
−
R JR IR IJR JR IR IJR IJR
V ar(ˆij ) = µ2 + τi2 + βj2 + σ2 +
1
1
1
1
1
1
1
2
−
−
+
σ +
σ2
V ar(ˆij ) =
1− − +
J
I IJ
R JR IR IJR
1
1
=
(IJ − I − J + 1)σ2 +
(IJ − I − J + 1)σ 2
IJ
IJR
1
1
=
(J(I − 1) − (I − 1))σ2 +
(J(I − 1) − (I − 1))σ 2
IJ
IJR
(I − 1)(J − 1) 2 (I − 1)(J − 1) 2
σ +
σ
=
IJ
IJR
(I − 1)(J − 1)
V ar(ˆij ) =
(Rσ2 + σ 2 ).
IJR
36
Assim sendo, conclui-se que
ˆij = ȳij. − ȳi.. − ȳ.j. + ȳ... ∼ N
(I − 1)(J − 1) 2
2
0;
(σ + Rσ ) ,
IJR
(2.35)
ou seja, o estimador do erro entre, ˆij , é distribuı́do como uma normal de média zero e
variância
2.6.11
(I−1)(J−1)
(σ 2
IJR
+ Rσ2 ).
Distribuição de probabilidade da SQErro Entre .
Partindo da expressão (2.35) e lembrando dos resultados da teoria de probabilidade
para a distribuição normal padrão, vem
ˆij − E(ˆij )
r
(I − 1)(J − 1) 2
(σ + Rσ2 )
IJR
∼ N (0; 1)
ou
ȳ − ȳi.. − ȳ.j. + ȳ... − 0
(ȳij. − ȳi.. − ȳ.j. + ȳ... )2
r ij.
∼ N (0; 1) ⇒
∼ χ2(1) ⇒
(I
−
1)(J
−
1)
(I − 1)(J − 1) 2
(σ 2 + Rσ2 )
(σ + Rσ2 )
IJR
IJR
(I − 1)(J − 1) 2
(ȳij. − ȳi.. − ȳ.j. + ȳ... )2
=
χ(1) ⇒
2
2
σ + Rσ
IJR
P
Portanto,
ijr (ȳij.
− ȳi.. − ȳ.j. + ȳ... )2
SQErro Entre
IJR(I − 1)(J − 1) 2
=
=
χ(1) .
2
2
2
2
σ + Rσ
σ + Rσ
IJR
SQErro Entre
∼ χ2[(I−1)(J−1)] .
2
2
σ + Rσ
(2.36)
Em palavras, a soma de quadrados do erro entre parcelas dividida por σ 2 + Rσ2 tem uma
distribuição de qui-quadrado com (I − 1)(J − 1) graus de liberdade.
2.6.12
Distribuição de probabilidade de ε̂ijr , o estimador de εijr .
Finalmente, as caracterı́stcas da distribuição do estimador do erro dentro, ε̂ijr , é
obtido a partir da expressão (2.10), isto é,
ε̂ijr = yijr − ŷijr = (yijr − ȳ... ) − (ȳi.. − ȳ... ) − (ȳ.j. − ȳ... ) − (ȳij. − ȳi.. − ȳ.j. + ȳ... )
37
na qual pode-se observar que ε̂ijr é uma combinação linear dos yijr ’s os quais seguem
distribuição normal. Portanto, ε̂ijr também segue uma distribuição normal. Isto posto, é
necessário, agora, saber quais as caracterı́sticas da distribuição de ε̂ijr .
"
#
1X
E(ε̂ijr ) = E yijr −
yijr
R r
= E µ + τi + βj + ij + εijr
X
1
Rµ + Rτi + Rβj + Rij +
εijr
−
R
r
"
#
1X
εijr .
= E µ + τi + βj + ij + εijr − µ − τi − βj − ij −
R r
Logo,
#
1X
εijr = 0.
E(ε̂ijr ) = E εijr −
R r
"
Além do mais,
"
#2
1X
V ar(ε̂ijr ) = [ε̂ijr − E(ε̂ijr )] = E εijr −
εijr
R r


!2
X
X
1
2
= E ε2ijr + 2
εijr − εijr
εijr 
R
R
r
r
2
= σ2 +
1
E(ε2ij1 + ε2ij2 + ... + ε2ijR + dp)
R2
2
− E[εijr (εij1 + εij2 + ... + εijr + ... + εijR )]
R
σ2
1
R 2 2 2
2
2
= (R − 1)σ 2
= σ + 2σ − σ = σ −
R
R
R
R
(R − 1) 2
V ar(ε̂ijr ) =
σ .
R
Portanto,
ε̂ijr = (yijr − ŷijr ) = yijr − ȳij . ∼ N
(R − 1) 2
0;
σ .
R
Isto é, o estimador do erro dentro, ε̂ijr , segue uma distribuição normal com média zero e
variância
(R−1) 2
σ .
R
38
Além disso,
yijr − ȳij. − 0
(yijr − ȳij. )2
r
∼ χ2(1) ⇒
∼ N (0; 1) ⇒
(R
−
1)
(R − 1) 2
σ2
σ
R
R
X
(yijr − ȳij. )2
R−1 2
IJR(R − 1) 2
(yijr − ȳij. )2
ijr
∼
χ(1) ⇒
∼
χ(1) .
2
2
σ
R
σ
R
Portanto,
2.7
P
ijr (yijr −
σ2
ȳij. )2
=
SQErro Dentro
∼ χ2[IJ(R−1)] .
σ2
(2.37)
Valores Esperados das Somas de Quadrados
Os valores esperados dos quadrados médios são argumentos importantes para a compreenção da escolha das estatı́sticas de teste utilizadas na contrastação das hipóteses de
interesse. Nesta seção serão abordados detalhadamente como estes resultados são obtidos.
Viu-se, na seção 2.5, que a soma de quadrados total é decomposta em partes componentes cujas expressões são dadas a seguir.
y...2
IJR
ijr
X
1 X 2
= JR
(ȳi.. − ȳ... )2 =
y −C
JR i i..
i
X
1 X 2
y −C
= IR
(ȳ.j. − ȳ... )2 =
IR j .j.
j
X
1X 2
y −C
= R
(ȳij. − ȳ... )2 =
R ij ij.
ij
SQT otal =
SQT rat
SQBlocos
SQP arcelas
X
2
yijr
− C, emque C =
SQErro Entre = SQP arcelas − SQT rat − SQBlocos
SQErro Dentro = SQT otal − SQP arcelas
Os valores esperados dos quadrados médios são obtidos a partir das expressões acima.
Esperança da Soma de Quadrados Total
Em primeiro lugar optou-se pelo cálculo do valor esperado da soma de quadrados
39
total. Isto é,
X
E(SQT otal ) = E
2
yijr
−C
ijr
!
X
=E
2
yijr
ijr
!
− E(C)
Mas,
E(C) = E
2
y...
IJR
1
E
=
IJR
X
yijr
ijr
!2
X 0 X
X
X 0
1
βj + R
ij +
εijr )2
E(IJRµ + JR
τi + IRR
=
IJR
j
ij
ijr
i
X
X
1
=
E(IJRµ + +R
ij +
εijr )2
IJR
ij
ijr
!2
!2
X
X
1
εijr + dp]
E[I 2 J 2 R2 µ2 + R2
ij +
=
IJR
ijr
ij
=
1
(I 2 J 2 R2 µ2 + IJR2 σ2 + IJRσ 2 ).
IJR
Portanto,
E(C) = IJRµ2 + Rσ2 + σ 2
(I)
e
E
X
ijr
2
yijr
!
= E
"
= E
"
=
X
#
X
(µ + τi + βj + ij + εijr )2
X
(µ2 + τi2 + βj2 + 2ij + ε2ijr + 2µτi + 2µβj + 2τi βj + dp)
ijr
ijr
E(µ2 + τi2 + βj2 + 2ij + ε2ijr + 2µτi + 2µβj + 2τi βj + dp)
ijr
=
X
(µ2 + τi2 + βj2 + σ2 + σ 2 + 2µτi + 2µβj + 2τi βj )
ijr
= IJRµ2 + JR
X
τi2 + IR
X
τi2
i
X
βj2 + IJRσ2 + IJRσ 2
X
βj2
j
0
0
X 0
X 0
X X
+2JRµ
βj + 2R
τi + 2IRµ
τi
βj
j
i
2
= IJRµ + JR
+ IR
i
i
j
+ IJRσ2 + IJRσ 2
j
Subtraindo-se (I) de (II), vem
E(SQT otal ) = IJRµ2 + JR
X
i
τi2 + IR
X
j
βj2 + IJRσ2 + IJRσ 2
(II)
#
40
−IJRµ2 − Rσ2 − σ 2
Portanto, o valor esperado da soma de quadrados total é definido por:
E(SQT otal ) = R(IJ − 1)σ2 + (IJR − 1)σ 2 + JR
X
τi2 + IR
i
X
βj2 .
(2.38)
j
Esperança da Soma de Quadrados de Tratamento
Em segundo lugar procurou-se deduzir o valor esperado da soma de quadrados de
tratamentos, ou seja
"
#
1 X 2
1
E(SQT rat ) =
yi.. − C =
E
JR i
JR
X
2
yi..
i
!
− E(C)
Mas,
1
E
JR
X
i
2
yi..
!
=

1 
E
JR
X
i
2 
X 0 X
X
JRµ + JRτi + R
βj + R
ij +
εij  

j
X
1
=
E
J 2 R2 µ2 + J 2 R2 τi2 + R2
JR
i
2 2
+2J R µτi + 0dp
j
X
ij
j
jr
!2
+
X
εir
jr
!2
1 X 2 2 2
[J R µ + J 2 R2 τi2 + JR2 σ2 + JRσ 2 + 2J 2 R2 µτi ]
JR i
X
1
τi2 + IJR2 σ2 + IJRσ 2 + 0].
[IJ 2 R2 µ2 + J 2 R2
=
JR
i
=
Assim sendo, tem-se
1
E
JR
X
i
2
yi..
!
= IJRµ2 + JR
X
τi2 + IRσ2 + Iσ 2 .
(III)
i
Subtraindo-se (I) de (III), obtém-se o valor esperado da soma de quadrados de tratamentos, isto é,
E(SQT rat ) = (I − 1)(σ 2 + Rσ2 ) + JR
X
τi2 .
(2.39)
i
A esperança do quadrado médio de tratamentos é dada pelo valor esperado da soma de
quadrados de tratamentos dividida pelos seus respectivos graus de liberdade, ou seja,
JR X 2
SQT rat
= σ 2 + Rσ2 +
τ
(2.40)
E(QMT rat ) = E
I −1
I −1 i i
41
ou
E(QMT rat ) = σ 2 + Rσ2 +
em que µi = µ + τi .
JR X
(µi − µ)2 ,
I −1 i
(2.41)
Esperança da soma de quadrados de uma combinação linear das médias dos
tratamentos: h-ésimo contraste de médias dos tratamentos
De acordo com a expressão (2.34), a soma de quadrados de um contraste h é dada
por
SQ(Ψ̂h ) =
I
P
chi yi..
i=1
2
.
JRKh
Desenvolvendo-se algebricamente a expressão acima, vem
SQ(Ψ̂h ) =
=
=
I
P
chi yi..
i=1
JRKh
1
JRKh
2
X
I
chi
i=1
1
J 2 R2
JRKh
0
2
7
J J
J X
R
X
X
X
εijr
JRµi + R
βj + R
ij +
X
I
j=1
chi µi
i=1
2
+R
j=1 r=1
j=1
2
X
I
chi
i=1
J
X
ij
j=1
2
+
X
I
chi
R
J X
X
εijr
j=1 r=1
i=1
2
+ dp .
Agora, calculando o valor esperado, obtém-se após algumas operações algébricas o seguinte resultado
I
2
E[SQ(Ψ̂h )] = E[QM (Ψ̂h )] = σ +
Rσ2
2
JR X
+
chi µi .
Kh i=1
(2.42)
uma vez que, por (2.34), há apenas um grau de liberdade associado a soma de quadrados
de um contraste entre as médias dos tratamentos.
Esperança da Soma de Quadrados de Blocos
Para calcular a esperança da soma de quadrados de blocos, procedeu-se da seguinte
forma,
"
X
E(SQBlocos ) = E IR
(ȳ.j. − ȳ... )2
j
#
#
1
1 X 2
E
y.j. − C =
= E
IR j
IR
"
X
j
2
y.j.
!
− E(C)
42
Mas,
1
E
IR
X
j
2
y.j.
!

1 
E
IR
=
X
j
2 
X 0
X
X
IRµ + R
τi + IRβj + R
ij +
εijr  

i
i
X
1
=
E
I 2 R2 µ2 + I 2 R2 βj2 + R2
IR
j
2 2
+2I R µβj + 0dp
X
ij
i
ir
!2
+
X
εijr
ir
!2
1 X 2 2 2
I R µ + I 2 R2 βj2 + IR2 σ2 + IRσ 2 + 2I 2 R2 µβj
IR j


X 0
X
1  2 2 2
=
βj  .
βj2 + IJR2 σ2 + IJRσ 2 + 2I 2 JR2 µ
I JR µ + I 2 R2
IR
j
j
=
Portanto,
1
E
IR
X
j
2
y.j.
!
= IJRµ2 + IR
X
βj2 + JR2 σ2 + Jσ 2
(IV )
j
Subtraindo-se (I) de (IV), encontrou-se,
E(SQBlocos ) = IJRµ2 + IR
X
βj2 + JR2 σ2 + Jσ 2 − IJRµ2 − Rσ2 − σ 2
j
= (J − 1)σ 2 + R(J − 1)σ2 + IR
X
βj2
j
E(SQBlocos ) = (J − 1)(σ 2 + Rσ ) + IR
X
βj2 .
(2.43)
j
A esperança do quadrado médio de blocos é dada pelo valor esperado da soma de quadrados de blocos dividida pelos seus respectivos graus de liberdade, ou seja,
X
SQBlocos
= σ 2 + Rσ2 + IR
βj2
E(QMBlocos ) = E
J −1
j
ou
E(QMBlocos ) = σ 2 + Rσ +
em que µj = µ + βj .
IR X
(µj − µ)2 ,
J −1 j
Esperança da Soma de Quadrados de Parcelas
(2.44)
(2.45)
43
Para a soma de quadrados de parcelas procedeu-se como segue,
"
E(SQP arcelas ) = E R
X
(ȳij. − ȳ... )2
ij
"
#
#
1X 2
1
= E
yij. − C = E
R ij
R
X
!
2
yij.
ij
− E(C)
Mas,
1
E
R
X
2
yij.
ij
!
=

1 
E
R
X
X
Rµ + Rτi + Rβj + Rij +
εijr
r
ij
1 hX 2 2
=
E
R µ + R2 τi2 + R2 βj2 + R2 2ij +
R
ij
i
+2R2 µβj + 2R2 τi βj + 0dp
!2 
X

εijr
r
!2
+ 2R2 µτi
1
E(R2 µ2 + R2 τi2 + R2 βj2 + R2 σ2 + σ 2 + 2R2 µτi + 2R2 µβj
R
+2R2 τi βj )
X
X
1
=
βj2 + IJR2 σ2 + IJRσ 2
τi2 + IR2
(IJR2 µ2 + JR2
R
j
i
=
0
0
X 0
X X
X 0
2
2
βj + 2R
τi
βj ).
τi + 2IR µ
+2JR µ
2
j
i
i
j
Logo,
1
E
R
X
ij
2
yij.
!
= IJRµ2 + JR
X
τi2 + IR
i
X
βj2 + IJR2 σ2 + IJσ 2 .
(V )
j
Subtraindo-se (I) de (V), obtém-se
E(SQP arcelas ) = IJRµ2 + JR
2
−IJRµ −
X
i
2
Rσ
τi2 + IR
−σ
X
βj2 + IJR2 σ2 + IJσ 2
j
2
= (IJ − 1)σ 2 + R(IJ − 1)σ2 + JR
X
τi2 + IR
i
E(SQP arcelas ) = (IJ − 1)(σ 2 + Rσ2 ) + JR
X
i
τi2 + IR
X
βj2
j
X
βj2 .
(2.46)
j
De modo análogo aos casos anteriores, o valor esperado do quadrado médio de parcelas
44
fica,
E(QMP arcelas ) = E
SQP arcelas
IJ − 1
= (σ 2 + Rσ2 ) +
JR X 2
IR X 2
τi +
β (2.47)
IJ − 1 i
IJ − 1 j j
ou
E(QMP arcelas ) = (σ 2 + Rσ2 ) +
IR X
JR X
(µi − µ)2 +
(µj − µ)2 ,
IJ − 1 i
IJ − 1 j
(2.48)
em que, µi = µ + τi e µj = µ + βj .
Esperança da Soma de Quadrados do Erro Entre
O valor esperado da soma de quadrados do erro entre é obtida pela subtração dos
valores esperados da soma de quadrados de bloco e soma de quadrados de tratamento da
soma de quadrados de parcela, ou seja,
SQErro Entre = E(SQP arcelas − SQT rat − SQBlocos )
= E(SQP arcela ) − E(SQT rat ) − E(SQBloco )
X
X
= (IJ − 1)(σ 2 + Rσ2 ) + JR
τi2 + IR
βj2
i
2
−(I − 1)(σ +
Rσ2 )
− JR
X
j
τi2
i
2
−(J − 1)(σ + Rσ ) − IR
X
βj2
j
2
= (σ +
Rσ2 )[IJ
− 1 − I + 1 − J + 1]
E(SQErro Entre ) = (I − 1)(J − 1)(σ 2 + Rσ2 )
(2.49)
Como feito anteriormente, tem-se a esperança do quadrado médio do erro entre da sequinte
forma,
E(QMErro Entre ) = E
SQErro Entre
(I − 1)(J − 1)
= σ 2 + Rσ2 ;
(2.50)
Esperança da Soma de Quadrados do Erro Dentro
Obtém-se o valor esperado da soma de quadrado de erro dentro com a seguinte subtração,
E(SQErro Dentro ) = E(SQT otal − SQP arcelas )
45
= E(SQT otal ) − E(SQP arcelas )
= R(IJ − 1)σ2 + (IJR − 1)σ 2 + JR
X
τi2 + IR
i
−(IJ − 1)(σ 2 + Rσ2 ) − JR
X
=
2
2
2
βj2
j
τi2 − IR
i
IJRσ2
X
X
βj2
j
2
2
− Rσ + IJR − σ − IJσ + σ − IJRσ2 + Rσ2 .
Portanto,
E(SQErro Dentro ) = IJ(R − 1)σ 2
(2.51)
Dividindo-se a soma de quadrado de erro dentro pelos seus respectivos graus de liberdade
tem-se o valor esperado do quadrado médio do erro dentro,
SQErro Dentro
E(QMErro Dentro ) = E
= σ2.
IJ(R − 1)
(2.52)
Portanto, o valor esperado da SQErro Dentro dividido pela variância do erro dentro
segue uma distribuição de qui-quadrado com IJ(R − 1) graus de liberdade.
Os resultados obtidos nesta seção encontram-se apresentados de forma resumida na
Tabela 4, como sugere Barbin (1993).
Tabela 4: Análise da variância com os valores esperados dos quadrados médios
F.V.
G.L.
Tratamento
I-1
Blocos
J-1
Erro Entre
Parcelas
Erro Dentro
Total
(I-1)(J-1)
(IJ-1)
IJ(R-1)
IJR-1
S.Q.
1 X 2
y −C
JR i i..
1 X 2
y −C
IR j .j.
SQP arc − SQT rat − SQBlocos
1 X 2
y −C
R ij ij.
SQT otal − SQP arcelas
X
2
yijr
−C
E(QM)
JR X
(µi − µ)2
I −1 i
IR X
σ 2 + Rσ2 +
(µj − µ)2
J −1 j
σ 2 + Rσ2 +
σ 2 + Rσ2
σ2
-
ijr
A tabela 5 contém informações acerca dos parâmetros associados ao modelo matemático, aos seus estimadores e suas respectivas distribuições de probabilidade, bem
como, as distribuições de probabilidade das somas de quadrados associadas.
Tabela 5: Caracterı́sticas, seus estimadores e distribuições de probabilidade de estatı́sticas associadas.
Estimador da
caracterı́stica
Caracterı́stica
Distribuição de Probabilidade
do Estimador
h
µ
µ̂ = m = ȳ...
µ̂ ∼ N µ;
τi
τˆi = ti = ȳi.. − ȳ...
h
τ̂i ∼ N τi ;
µi
µ̂i = mi = ȳi..
βj
βˆj = bj = ȳ.j. − ȳ...
µj
µ̂j = mj = ȳ.j.
1
(σ 2
IJR
(I−1)
(σ 2
IJR
h
µ̂i ∼ N µi ,
1
(σ 2
JR
h
β̂j ∼ N βj ;
h
µj ∼ N µj ,
+
Rσ2 )
i
+ Rσ2 )
+ Rσ2 )
(J−1)
(σ 2
IJR
i
+
chi µi ,
1
(σ 2
JR
Rσ2 )
C
σ 2 +Rσ2
Sob H0 : µ = 0,
i
i
i
q
q
∼ χ2(I−1)
µ̂i −µ0
QMErro Entre
JR
Sob H0 : βj = 0, ∀ j,
Sob H0 : µj = µ0 ,
∼ χ2(1)
SQT rat
σ 2 +Rσ2
Sob H0 : τi = 0, ∀ i,
Sob H0 : µi = µ0 ,
+ Rσ2 )
1
(σ 2
IR
Distribuição de Probabilidade das
Estatı́sticas de Interesse sob H0
SQBlocos
σ 2 +Rσ2
Ψh =
i=1
ij
chi µi
Ψ̂h =
I
P
chi ȳi..
Ψ̂h ∼ N
i=1
i=1
ˆij = ȳij. − ȳi.. − ȳ.j. − ȳ...
hP
I
h
ˆij ∼ N 0;
h
εijr
ε̂ijr = yijr − ȳij.
ε̂ijr ∼ N 0;
yijr
ŷijr = ȳij.
-
+
(I−1)(J−1)
(σ 2
IJR
IJ(R−1) 2
σ
IJR
i
Rσ2 )
+
i
Rσ2 )
Sob H0 : Ψh = 0,
i
∼ χ2(J−1)
µ̂j −µ0
QMErro Entre
IR
I
I
P
( P chi yi.. )
∼ t[(I−1)(J−1)]
∼ t[(I−1)(J−1)]
2
i=1
JRKh (σ 2 +Rσ2 )
SQErro Entre
σ 2 +Rσ2
∼ χ2[(I−1)(J−1)]
SQErro Dentro
σ2
∼ χ2[IJ(R−1)]
∼ χ2(1)
-
46
47
2.8
Comparações múltiplas das médias duas a duas
Como o desenvolvimento da teoria dos métodos de comparações múltiplas não faz
parte dos objetivos deste trabalho, achou-se conveniente apresentar simplesmente um
procedimento prático para comparar os possı́veis pares de médias dos tratamentos por
meio do teste de Tukey.
Para testar as hipóteses do tipo H0 : µi = µi0 contra H1 : µi 6= µi0 , ao nı́vel de
significância α, calcula-se a Diferença Mı́nima Significativa - DMS por meio da expressão
r
QMErro Entre
DM S = q[I; (I−1)(J−1); α]
(2.53)
JR
na qual q[I; (I−1)(J−1); α] é o valor crı́tico da aplitude estudentizada de Tukey para I =
número de tratamentos envolvidos no ensaio, (I −1)(J −1) = número de graus de liberdade
do Erro Entre e nı́vel de significância α (em geral α = 0, 05).
Em seguida calcular os valores absolutos das diferenças entre as estimativas dos
possı́veis pares de médias dos tratamentos envolvidos no experimento, |ȳi − ȳi0 |, i 6= i0 ,
i, i0 = 1, 2, · · · , I. Finalmente, adotar a regra de decisão: Rejeiar H0 em favor de H1 ,
ao nı́vel de significância α se, e somente se |ȳi − ȳi0 | > DM S. Este procedimento será
ilustrado na seção 3.
2.9
Análises estatı́sticas
Tal como no experimento em blocos ao acaso usual, as análises estatı́sticas de um
experimento em blocos casualizados com repetição do conjunto de tratamentos dentro
dos blocos, em geral, levam em consideração as seguintes hipótese: Hipóteses sobre a não
(τ )
existência de efeito dos tratamentos sobre a variável resposta, H0
1, 2, · · · , I
existência
(τ )
(ou equivalentemente, H0
(β)
do efeito dos blocos: H0
: τi = 0, ∀ i =
: µ1 = · · · = µI = µ); Hipótese sobre a não
: βj = 0, ∀ j = 1, 2, · · · , J. De modo geral, o
pesquisador planeja seus experimentos em blocos casualizados com o objetivo apenas
de proporcionar ambientes homogêneos (blocos) dentro dos quais ele distribui de modo
aleatório um conjunto de tratamentos (ou mais de um conjunto), favorecendo-se o controle
local. Assim sendo, quase sempre, o pesquisador não tem interesse em fazer inferência
sobre o efeito dos blocos, fixando-se apenas nas análises baseadas no efeito dos tratamentos. Neste sentido, as análises são conduzidas priorizado-se os contrastes entre as médias
48
dos tratamentos de interesse do pesquisador, bem como, as comparações múltiplas das
médias. Na seção a seguir, serão discutidas as bases teóricas que possibilitam essa possı́veis
análises.
2.9.1
Hipóteses sobre tratamento
Esta hipótese pode ser representada de duas maneiras, a saber:

(τ )


 H0 : τi = 0, ∀ i = 1, 2, · · · , I
a)
vs


 H (τ ) : τ 6= 0, para pelo menos um τ
i
1
ou
b)
i
(2.54)

(τ )


 H0 : µ1 = µ2 = · · · = µ I = µ
vs


 H (τ ) : µ 6= µ 0 , para pelo menos um par (µ , µ 0 ) i 6= i0 = 1, 2, · · · , I
i
i
i
i
1
Considerando-se os resultados obtidos no desenvolvimento da teoria, pode ser observado que:
a.1) De acordo com a equação (2.50), E(QMErro Entre ) = σ 2 + Rσ2 . Isto é, o valor
esperado do quadrado médio do erro entre é um estimador não viciado para σ 2 +Rσ2
(τ )
independentemente de que H0
seja verdadeiro;
a.2) Pela expressão (2.41), E(QMT rat ) = σ 2 + Rσ2 +
nula
(τ )
H0
JR
I−1
: µ1 = · · · = µI = µ é verdadeira, então
I
P
(µi − µ)2 e se a hipótese
i=1
I
P
JR
(µi
I−1
i=1
− µ)2 = 0 e QMT rat
(τ )
será um estimador não viciado para σ 2 + Rσ2 . No entanto, se H1
é verdadeira
E(QMT rat ) > σ 2 +Rσ2 . Assim sendo, é razoável comparar QMT rat com QMErro Entre
(τ )
para se efetuar o teste da hipótese H0 , tendo em vista que quanto maior for o
QMT rat comparado com QMErro Entre mais evidência se tem de que as médias dos
tratamentos são diferentes entre si (ou que o efeito dos tratamentos não são nulos).
(τ )
SQT rat
∼ χ2[I−1] e independentemente
σ 2 +Rσ2
Eentre
∼ χ2[(I−1)(J−1)] .
(2.35), SQσErro
2 +Rσ 2
a.3) Conforme equação (2.20), tem-se que sob H0 ,
(τ )
de que H0
se verifique e pela expressão
Como se sabe, de acordo com a teoria de estatı́stica matemática, [ver Rohatgi (1976),
Roussas (1997), dentre outros], se uma variável aleatória U segue uma distribuição
49
de qui-quadrado com ν1 graus de liberdade e uma outra variável aleatória V segue
uma distribuição de qui-quadrado com ν2 graus de liberdade e, além disso, U e V
são variáveis aleatórias independentes, então a razão entre a variável aleatória U
dividida pelos seus graus de liberdade e a variável aleatória V dividida pelos seus
graus de liberdade, segue uma distribuição F de Snedecor e Cochran com ν1 graus
de liberdade do numerador e ν2 graus de liberdade do denominador a qual pode ser
escrita como
U/ν1
∼ F[ν1 , ν2 ]
V /ν2
(2.55)
Tomando como base este resultado, e considerando-se as distribuições de probabilidade das somas de quadrados apresentadas na Tabela 5, pode-se verificar que
SQT rat
σ 2 +Rσ2
F =
(I−1)
SQErro Entre
σ 2 +Rσ2
=
QMT rat
∼ F[(I−1), (I−1)(J−1)]
QMErro Entre
(2.56)
(I−1)(J−1)
(τ )
que será a estatı́stica de teste para testar a hipótese H0
vs
(τ )
H0
: τi 6= 0 para pelo menos um τi . Rejeita-se
α, se F =
QMT rat
QMErro Entre
(τ )
H0 ,
: τi = 0, para todo i,
ao nı́vel de significância
> F[(I−1), (I−1)(J−1), α] , em que F[(I−1), (I−1)(J−1), α] é o 100(1 −
α)-ésimo percentil superior da distribuição F com (I − 1) graus de liberdade do
numerador e (I − 1)(J − 1) graus de liberdade do denominador.
a.4) Como pode ser observado na expressão (2.50), o valor esperado do QMErro Entre é
(Ψ)
σ 2 + Rσ2 independentemente de que a hipótese H0
: Ψh = 0 se verifique ou não.
Isto é, QMErro Entre é um estimador não tendencioso para σ 2 + Rσ2 .
(Ψ)
a.5) Da expressão (2.42), se H0
:
I
P
chi µi = 0 é verdadeiro, QM (Ψ̂h ) também é um
i=1
(Ψ)
estimador não tendencioso para σ 2 + Rσ2 . Porém, se H0
for falsa,
I
P
chi µi 6= 0 e
i=1
E[QM (Ψ̂h )] > σ 2 + Rσ2 . Portanto, para se efetuar um teste de hipótese sobre um
contraste de médias dos tratamentos é intuitivo que seja feita uma comparação entre
o quadrado médio do contraste e o quadrado médio do erro entre. Pois, espera-se
que quanto maior for QM (Ψ̂h ) comparado com QMErro Entre , mais evidência se tem
I
P
chi µi não é nulo e quanto mais aproxima-se de zero
de que o comtraste Ψh =
i=1
mais eviência se tem a favor de H0 .
(Ψ)
a.6) Conforme equação (2.34), tem-se que sob H0 , a estatı́stica
expressão (2.35),
rifique.
SQErro Eentre
σ 2 +Rσ2
SQ(Ψ̂h )
σ 2 +Rσ2
∼ χ2[1] e, pela
(Ψ)
∼ χ2[(I−1)(J−1)] independentemente de que H0
se ve-
50
Portanto, adotando os mesmos argumentos do ı́tem a.3) verifica-se facilmento que
a estatı́stica
SQ(Ψ̂h )
σ 2 +Rσ2
F =
1
SQErro Entre
σ 2 +Rσ2
=
QM (Ψ̂h )
∼ F[1, (I−1)(J−1)]
QMErro Entre
(2.57)
(I−1)(J−1)
(Ψ)
e será a estatı́stica de teste para testar a hipótese H0
(Ψ)
(Ψ)
: Ψh = 0 vs H1
regra de decisão será, rejeita H0 , ao nı́vel de significância α, se F =
: Ψh 6= 0. A
QM (Ψ̂h )
QMErro Entre
>
F[1, (I−1)(J−1), α] , em que F[1, (I−1)(J−1), α] é o 100(1 − α)-ésimo percentil superior da
distribuição F com 1 grau de liberdade do numerador e (I − 1)(J − 1) graus de
liberdade do denominador.
a.7) Para comparar os possı́veis pares de médias da variável resposta relativas aos tratamentos, poderá ser empregado qualquer método de comparações múltiplas, embora
neste trabalho deu-se preferência ao teste de Tukey, cuja teoria pode ser vista em
(LEAL; PORRAS, 1998), (MONTGOMERY, 2007).
2.9.2
Hipóteses sobre Bloco
Tal como nas hipóteses sobre tratamento, estas também podem ser representada de
duas maneiras, a saber:

(β)


 H0 : βj = 0, ∀ j = 1, 2, · · · , J
a)
vs


 H (β) : β 6= 0, para pelo menos um β
j
j
1
ou
(2.58)

(β)


 H0 : µ1 = µ2 = · · · = µ J = µ
b)
vs


 H (β) : µ 6= µ 0 , para pelo menos um par (µ , µ 0 ) j 6= j 0 = 1, 2, · · · , J
j
j
j
j
1
Levando-se em conta os resultados obtidos no desenvolvimento da teoria e por ar-
gumentos semelhantes aos utilizados na seção 2.9.1, para as hipóteses sobre tratamento,
pode-se verificar facilmente que
51
b.1) A estatı́stica
SQBloco
σ 2 +Rσ2
F =
(J−1)
SQErro Entre
σ 2 +Rσ2
=
QMBloco
∼ F[(J−1), (I−1)(J−1)]
QMErro Entre
(2.59)
(I−1)(J−1)
será a estatı́stica de teste para testar a hipótese H0
(β)
: βj = 0, para todo j, vs
(β)
H0
(β)
H0 ,
ao nı́vel de significância α,
: βj 6= 0 para pelo menos um βj . Rejeita-se
se F =
QMBloco
QMErro Entre
> F[(J−1), (I−1)(J−1), α] , em que F[(J−1), (I−1)(J−1), α] é o 100(1 −
α)-ésimo percentil superior da distribuição F com (J − 1) graus de liberdade do
numerador e (I − 1)(J − 1) graus de liberdade do denominador.
b.2) A estatı́stica
SQ(Ψ̂h )
σ 2 +Rσ2
F =
1
SQErro Entre
σ 2 +Rσ2
=
QM (Ψ̂h )
∼ F[1, (I−1)(J−1)]
QMErro Entre
(2.60)
(I−1)(J−1)
será a estatı́stica de teste para testar a hipótese de nulidade de um contraste h sobre
(Ψ)
as médias dos bocos, H0
(Ψ)
: Ψh = 0 vs H1
: Ψh 6= 0. A regra de decisão será,
(Ψ)
rejeita H0 , ao nı́vel de significância α, se F =
QM (Ψ̂h )
QMErro Entre
> F[1, (I−1)(J−1), α] , em
que F[1, (I−1)(J−1), α] é o 100(1 − α)-ésimo percentil superior da distribuição F com 1
grau de liberdade do numerador e (I − 1)(J − 1) graus de liberdade do denominador.
b.3) As comparações múltiplas das médias dos blocos pelo teste Tukey, poderão ser
feitas por meio do mesmo procedimento adotado no ı́tem a.7) com as seguintes
modificações:
QMErro Entre
(2.61)
IR
é o valor crı́tico da aplitude estudentizada de Tukey para
DM S = q[J; (I−1)(J−1); α]
na qual q[J; (I−1)(J−1); α]
r
J = número de blocos envolvidos no ensaio, (I − 1)(J − 1) = número de graus de
liberdade do Erro Entre e nı́vel de significância α (em geral α = 0, 05).
Em seguida calcular os valores absolutos das diferenças entre as estimativas dos
possı́veis pares de médias dos blocos envolvidos no experimento, |ȳ.j. − ȳ.j 0 . |, j 6= j 0 ,
j, j 0 = 1, 2, · · · , J. Finalmente, adotar a regra de decisão: Rejeiar H0 em favor de
H1 , ao nı́vel de significância α se, e somente se |ȳ.j. − ȳ.j 0 . | > DM S.
52
2.9.3
A tabela da ANOVA
A partir do conhecimento das partes componentes da variabilidade total representadas
pelas somas de quadrados e das distribuições de probabilidade das estatı́sticas de teste
das hipóteses sobre tratamento e Bloco deduzidas nas Seções 2.9.1 e 2.9.2, e, de acordo
com Leal e Porras (1998) e Montgomery (2007), pode-se organizar a tabela completa da
análise de variância - ANOVA, tal como se apresenta na literatura especializada, isto é,
Tabela 6: Tabela da Análise de Variância
F. Variação
Tratamento
GL
I −1
SQ
SQT rat
QM
T rat
QMT rat = SQI−1
Bloco
J −1
SQBloco
QMBloco =
Erro Entre
Parcela
(I − 1)(J − 1)
IJ − 1
SQErro Entre
SQP arcela
QMErro Entre =
-
Erro Entre
IJ(R − 1)
SQErro Dentro
QMErro Dentro =
IJR − 1
SQT otal
Total
-
SQBloco
J−1
F
QMT rat
QMErro Entre
QMBloco
QMErro Entre
SQErro Entre
(I−1)(J−1)
-
SQErro Dentro
IJ(R−1)
-
53
3
Aplicação da teoria a um
exemplo real
O objetivo deste Capı́tulo é apresentar uma aplicação da teoria desenvolvida neste
trabalho a um conjunto de dados real recolhido de um experimento em blocos completos
casualizados com repetições dos tratamentos dentro dos blocos.
3.1
Descrição do conjunto de dados experimentais
Para ilustrar o método, levou-se em conta um experimento analisado por Ferreira
(1996), página 254, no qual considerou-se três variedades de cana-de-açúcar, três blocos e
três repetições. A variável resposta analisada foi a porcentagem de açúcar provável, cujos
valores observados encontram-se na Tabela 7, a seguir.
Tabela 7: Porcentagem de açúcar provável em variedades de cana-de-açúcar
Variedade
1
Repetição
1
2
3
2
1
2
3
3
1
2
3
Soma
1
13,03
13,72
14,16
40,91
15,73
15,62
15,55
46,90
14,69
15,65
14,52
44,86
132,67
Bloco
2
13,20
13,84
13,11
40,15
15,13
15,52
16,27
46,92
14,75
15,54
14,13
44,42
131,49
3
13,30
12,33
13,79
39,42
15,40
15,57
15,77
46,74
14,95
15,72
14,51
45,18
131,34
Soma
120,48
140,56
134,46
395,50
Fonte: Cortesia de Ms. Paulo Vanderlei Ferreira.
54
3.2
Cálculos das somas de quadrados e análise da
variância
A partir dos dados da Tabela 7, calculou-se:
SQT otal =
I X
J X
R
X
i=1 j=1 r=1
2
yijr
(y... )2
−
IJR
= (13, 03)2 + (13, 72)2 + · · · + (14, 51)2 −
(395, 5)2
= 29, 3418;
3×3×3
I
SQV ariedade
1 X 2
(y... )2
=
yi.. −
JR i=1
IJR
=
(395, 5)2
1 (120, 48)2 + (140, 56)2 + (134, 46)2 −
= 23, 5503;
3×3
3×3×3
J
SQBloco
1 X 2
(y... )2
=
y.j. −
IR j=1
IJR
(395, 5)2
1 2
2
2
(132, 67) + (131, 49) + (131, 34) −
= 0, 1179;
=
3×3
3×3×3
I
SQP arcela
J
1 XX 2
(y... )2
=
y −
R i=1 j=1 ij.
IJR
=
(395, 5)2
1
(40, 91)2 + (40, 15)2 + · · · + (45, 18)2 −
= 24, 0239;
3
3×3×3
SQErro Entre = SQP arcela − SQV ariedade − SQBloco
= 24, 0239 − 23, 5503 − 0, 1179 = 0, 3557
e
SQErro Dentro = SQT otal − SQP arcela
= 29, 3418 − 24, 0239 = 5, 3179.
De posse dos resultados acima organiza-se a Tabela da Análise de Variância - ANOVA,
de acordo como foi sugerido na Tabela 8, ou seja,
55
Tabela 8: Análise de variância para os dados da porcentagem de açúcar provável em
variedades de cana-de-açúcar.
F. Variação
Variedade
Bloco
Erro Entre
Parcela
Erro Dentro
Total
GL
SQ
2 23,5503
2
0,1179
4
0,3557
8 24,0239
18
5,3179
26 29,3479
QM
11,7752
0,0590
0,0889
3,0030
0,2954
-
F
132,45
0,66
-
Como pode ser observado na Tabela 8, F = 132, 45 e da tabela da distribuição F
observa-se que F[2; 4; 0,01] = 18, 00. Como F > F[2; 4; 0,01] , então rejeita-se a hipótese de
igualdade das médias da porcentagem de açúcar provável relativas as variedades de canade-açúcar e concluı́-se ao nı́vel de significância α = 0, 01 que existe pelo menos um par de
médias (µi , µi0 ) que diferem estatisticamente entre si.
Para verificar quais médias diferem entre si, adotou-se o seguinte procedimento:
1. Desdobrar os dois graus de liberdade de variedade em dois contrastes de interesse,
cada um com um grau de liberdade. Imagine que são de interesse do pesquisador
(2)
(3)
os seguintes contrastes representados pelas hipóteses H0 e H0 a seguir:


(2)
(3)
µ1 +µ3


H
:
µ
−
=
0


2
2
 0
 H0 : µ3 − µ1 = 0
com 1 gl
com 1 gl e
vs
vs




 H (2) : µ − µ1 +µ3 6= 0
 H (3) : µ − µ 6= 0
2
1
1
2
3
1
As estimativas desses contrastes são representadas por:
Ψ̂1 = ȳ2.. −
ȳ1.. + ȳ3
13, 39 + 14, 94
= 15, 62 −
= 1, 46%
2
2
e
Ψ̂2 = ȳ3.. − ȳ1.. = 14, 94 − 13, 39 = 1, 55%
Para facilitar os cálculos das respectivas somas de quadrados dos contrastes é conve(2)
(3)
niente reescrever as hipóteses H0 e H0 na forma equivalente, da seguinte maneira,
(2)
(3)
H0 : −µ1 + 2µ1 − µ3 = 0 e H0 : µ3 − µ1 = 0. Daı́, obtém-se:
SQ(Ψ̂1 ) =
P
c1i yi..
i
JRK1
2
=
[(−1)(120, 48)2 + (2)(140, 56) + (−1)(134, 46)]2
3 × 3 × [(−1)2 + (2)2 + (−1)2 ]
{z
}
|
K1
56
(26, 18)2
=
= 12, 6925 com 1 gl
54
e
SQ(Ψ̂2 ) =
P
c2i yi..
i
JRK2
2
[(−1)(120, 48)2 + (1)(134, 46)]2
=
3 × 3 × [(−1)2 + (1)2 ]
{z
}
|
K2
2
=
(13, 98)
= 10, 8578 com um gl.
18
Com estes resultados reorganiza-se a tabela da análise da variância, obtendo-se:
Tabela 9: Análise de variância para os dados da porcentagem de açúcar provável em
variedades de cana-de-açúcar.
F. Variação
(2)
3
H0 : Ψ1 = µ2 − µ1 +µ
=0
2
(3)
H0 : Ψ 2 = µ3 − µ1 = 0
(1)
Variedade (H0 = µ1 = µ2 = µ3 = µ)
Bloco
Erro Entre
Parcela
Erro Dentro
Total
GL
SQ
1
1
(2)
2
4
8
18
26
12,6925
10,8578
(23,5503)
0,1179
0,3557
24,0239
5,3179
29,3479
QM
12,6925
10,8578
11,7752
0,0590
0,0889
3,0030
0,2954
-
F
142,77
122,13
132,45
0,66
-
Com base nos resultados da Tabela 9 conclui-se que a média da porcentagem
de açúcar provável da variedade V 2 difere estatisticamente da média combinada
das variedades V 1 e V 3, ao nı́vel α = 0, 01 de significância, tendo em vista que
F[1; 4; 0,01] = 21, 20. De modo análogo, pode-se concluir, ao nı́vel α = 0, 01 de significância, que a porcentagem média de açúcar provável da variedade V 3 difere
estatisticamente da variedade V 1.
2. Comparações das médias duas a duas pelo teste de Tukey:
Inicialmente calculou-se as estimativas das médias todas com desvio-padrão s(ȳi ) e
a diferença mı́nima significativa -DMS, pelo método de Tukey ao nı́vel α = 0, 05:
ȳ1 = 13, 30%
ȳ2 = 15, 62% todas com erro-padrão s(ȳi ) =
ȳ3 = 14, 94%
r
QMErro Entre
= 0, 0994%.
JR
57
e
r
QMErro Entre
DM S = q[I; (I−1)(J−1); α]
JR r
r
0, 0889
0, 0889
= 5, 04
= 0, 50%;
= q[3; 4; 0,05]
3×3
3×3
em seguida cauculou-se os valores absolutos das possı́veis diferenças entre as estimativas das médias das variedades. Isto é,
|ȳ1.. − ȳ2 | = |13, 39 − 15, 62| = 2, 23%
|ȳ1.. − ȳ3 | = |13, 39 − 14, 94| = 1, 55%
|ȳ2.. − ȳ3 | = |15, 62 − 14, 94| = 0, 68%;
Adotando-se a regra de decisão: rejeitar H0 : µi = µi0 , ao nı́vel de significância
α = 0, 05, se |ȳi.. − ȳi0 .. | > DM S, conclui-se que as variedades de cana-de-açúcar
estudadas produzem porcentagens médias de açúcar provável diferentes entre si.
3.3
Comprovação da idoneidade do modelo
Figura 1: Função de distribuição acumulada sob normalidade por meio da estatı́stica de
Kolmogorov-Smirnov.
Figura 2: Histograma e polı́gono das frequências para cada variedade de cana-de-açucar
estudada.
58
Figura 3: Valores plotados no gráfico Quantil para as variedades de cana-de-açucar estudadas.
Conforme pode ser observado nas Figuras 1, 2 e 3 os erros são normalmente distribuı́dos.
A execussão das análises pode ser facilitada empregando o softwere estatı́stico SAS
por meio do seguinte procedimento:
OPTIONS NODATE PS=500;
DATA EXEMPLO;
DO VAR=1 TO 3;
DO REP=1 TO 3;
DO BLOCO=1 TO 3;
INPUT PORCENTAGEM @@;
OUTPUT;
END;
END;
END;
DATALINES;
13.03 13.20 13.30
13.72 13.84 12.33
14.16 13.11 13.79
15.73 15.13 15.40
15.62 15.52 15.57
15.55 16.27 15.77
59
14.69 14.75 14.95
15.65 15.54 15.72
14.52 14.13 14.51
;
RUN;
PROC PRINT DATA=EXEMPLO;
RUN;
PROC GLM DATA=EXEMPLO;
CLASS VAR BLOCO;
MODEL PORCENTAGEM=VAR BLOCO VAR*BLOCO / SS3;
TEST H=VAR BLOCO E=VAR*BLOCO;
CONTRAST "V2 vs (V1+V3)" VAR -1 2 -1;
CONTRAST "V3 vs V1"
MEANS VAR / TUKEY;
RUN;
VAR -1 0
1;
60
4
Conclusão Final
As análises estatı́sticas para os dados de um experimento instalado num delineamento de Blocos completos casualizados com repetições dos tratamentos dentro dos blocos,
consideram que as observações são representadas por um modelo matemático aditivo
envolvendo uma média geral, os efeitos dos tratamentos, dos blocos e dois tipos de erros
experimentais aleatórios: um, entre as unidades experimentais que receberam o mesmo
tratamento em blocos diferentes, o Erro Entre, e outro, entre as unidades experimentais
que receberam o mesmo tratamento dentro do mesmo bloco, o Erro Dentro. Neste delineamento, o Erro Entre pode se visto como o efeito da interação entre Tratamento e Bloco
(T × B). Além disso, supõe-se a priori que esses erros são independentemente distribuı́dos
(um do outro e entre si) como uma normal de médias zero e variâncias comuns σ2 e σ 2 ,
iid
iid
respectivamente. Isto é, ij ∼ N (0, σ2 ), εijr ∼ N (0, σ 2 ) e Cov(ij , εijr ) = 0. Diante
do exposto e após o desenvolvimento e aplicação da teoria que dar sutentatação a estas
análises, concluiu-se que:
1. Do pondo de vista prático, o planejamento de um experimento em blocos completos
casualizados com repetição do conjunto de tratamentos nos blocos tem pouca aplicabilidade, uma vez que é apropriado a pesquisas envolvendo poucos tratamentos.
E, do ponto de vista teórico, as contribuições tem sido muito poucas, dificultando
de certa forma, a expansão das técnicas estatı́sticas envolvendo outras distribuições
de probabilidade para os erros neste delineamento.
2. O método utilizado para estimar os parâmetros do modelo aqui adotado foi o dos
mı́nimos quadrados. Preferiu-se esse método em detrimento do método da Máxima
verossimilhança porque ele é mais simples e, sob normalidade, os dois métodos
fornecem os mesmos estimadores, os quais têm excelentes propriedades;
3. Algunas estatı́sticas de teste apresentadas na Tabela 9 podem ser utilizadas para se
fazer inferências marginais sobre, por exemplo, τi , µi , βj e µj , embora, na prática,
não sejam rotineiramente empregadas como ferramentas em busca de achados nas
61
pesquisas cientificamente planejadas nesse tipo de delineamento;
4. Não foi encontrado na literatura nenhum trabalho que justificasse completamente
a base estatı́stica que suporta as análises dos dados de um experimento em blocos
completos casualizados com repetições dentro dos blocos. E, esta é, na opinião dos
autores, a maior contribuição que se pode extrair deste trabalho.
5. É importante lembrar que em qualquer análise estatı́stica, onde as observações foram
obtidas a partir de um experimento cientificamente planejado, deve ser adotado
como regra, a validação das suposições impostas aos termos no modelo matemático
utilizado para descrever as observações experimentais. As conclusões acerca dos
achados na pesquisa só deverão ser consideradas verdadeiras após a comprovação
estatı́stica da Aditividade, Normalidade, Homocedasticidade e Independência dos
erros;
6. As análises estatı́sticas dos dados do experimento utilizado para ilustrar a teoria
(β)
desenvolvida, apresentaram-se adequadas e constataram que a hipótese H0
: βj = 0
não foi rejeitada, ao nı́vel de significância α = 0, 05. Isto indica que os blocos não
têm efeito sobre a porcentagem de açúcar provável nas variedades de cana-de-açúcar
(τ )
estudadas. Por outro lado, observou-se que a hipótese H0 : τi = 0, ∀ i, foi rejeitada
ao nı́vel de significância α = 0, 01. Daı́, conclui-se que as variedades têm efeito sobre
a porcentagem de açúcar provável (ou ainda, que existe pelo menos duas variedades
que diferem entre si quanto a porcentagem média de açúcar provável). Ao testar a
hipótese sobre o contraste entre a média de açúcar provável da variedade 2 contra a
média combinada das variedades 1 e 3, verificou-se que este apresentou significância
estatı́stica. Finalmente, ao confrontar as porcentagens médias de açúcar provável
das variedades pelo teste de Tukey, ao nı́vel α = 0, 05, constatou-se que todas
diferem estatisticamente entre si.
62
Referências
BARBIN, D. Componentes de Variância - Teoria e Aplicações. 2. ed. Piracicaba - SP:
FEALQ - Fundação de Estudos Agrários Luiz de Queiroz, 1993. 117 p.
FERREIRA, P. V. Estatı́stica Experimental Aplicada à Agronomia. Maceió - AL: Edufal,
1996.
LEAL, J. G.; PORRAS, A. M. L. Deseño estadı́stico de experimentos - Análises de la
varianza. Granada - ES: Grupo Editorial Universitario, 1998. 357 p.
LOVE, H. H. Introduction to Experimental Statistics. New York: Mcgraw-Hill, 1964.
174 p.
MONTGOMERY, D. C. Design and Analysis of Experiments. Singapore: Posts &
Telecom Press, 2007. 642 p.
ROHATGI, V. K. An Introduction to Probability Theory and Mathematical Statistics.
New York: John Wiley, 1976. 684 p.
ROUSSAS, G. G. A Course in Mathematical Statistics. 2. ed. New York: Academic
Press, 1997. 572 p.
SILVA, J. G. C. da. Estatı́stica experimental: Planejamento de experimentos. Versão
Preliminar, p. 130–154, 2007.
Download

Bruno Henrique Gomes dos Santos