Carlos Roberto Padovani
Cultura
Acadêmica
Carlos Roberto Padovani
Carlos Roberto Padovani é professor titular de Bioestatística do Instituto de Biociências, Unesp, câmpus de Botucatu, tendo atuado como professor e/ou orientador
de Programas de Pós-Graduação da USP, Unicamp, Unesp, UFMT e UnB. Foi bolsista produtividade do CNPq; membro da Comissão de Avaliação de Programas de
Pós-Graduação junto à Capes; coordenador da Área de Ciências Biológicas junto
à Runesp, presidente da Região Brasileira da Sociedade Internacional de Biometria.
Atualmente ministra disciplinas da área de Estatística na graduação e de Bioestatística
e Metodologia da Pesquisa Científica em vários programas de Pós-Graduação na Unesp,
com orientações em nível de Mestrado e Doutorado e supervisão de Pós-Doutorado.
DELINEAMENTO DE EXPERIMENTOS
O texto apresenta noções básicas, históricas e conceituais de delineamentos experimentais, em particular dos planejamentos inteiramente casualizado e em blocos completos
casualizados, complementado com os esquemas fatoriais, correlação e regressão linear
simples e testes de aderência e associação para variáveis categorizadas. A abordagem não
os cálculos estatísticos, mas sim, trazendo à realidade o planejamento e o desenvolvimento
da experimentação aos alunos das áreas de Ciências Biológicas e da Saúde.
Capa_Delineamento_minha versao.indd 1
DELINEAMENTO DE EXPERIMENTOS
é realizada sob o aspecto tradicional de fórmulas e uso de “pacotes” computacionais para
19/05/2014 18:17:16
DELINEAMENTO DE
EXPERIMENTOS
delineamento_de_experimentos-prova4.indd 1
28/05/2014 15:49:15
Universidade Estadual Paulista
Reitorr Julio Cezar Durigan
Pró-Reitor de Graduação Laurence Duarte Colvara
Pró-Reitor de Pós-Graduação Eduardo Kokubun
Pró-Reitora de Pesquisa Maria José Soares Mendes Giannini
Pró-Reitora de Extensão Universitária Mariângela Spotti Lopes Fujita
Pró-Reitor de Administração Carlos Antonio Gamero
Secretária Gerall Maria Dalva Silva Pagotto
Chefe de Gabinete Roberval Daiton Vieira
delineamento_de_experimentos-prova4.indd 2
28/05/2014 15:49:17
Cultura
Acadêmica
Carlos Roberto Padovani
DELINEAMENTO DE
EXPERIMENTOS
São Paulo
2014
delineamento_de_experimentos-prova4.indd 3
28/05/2014 15:49:17
©Pró-Reitoria de Graduação, Universidade Estadual Paulista, 2014.
Padovani, Carlos Roberto
Delineamento de experimentos / Carlos Roberto Padovani. –
São Paulo : Cultura Acadêmica : Universidade Estadual Paulista,
Pró-Reitoria de Graduação, 2014
128 p. : tabs.
P124d
Bibliografia
ISBN: 978-85-7983-523-0
1. Planejamento Experimental. 2. Bioestatística. I. Título. II.
Universidade Estadual Paulista. Pró-Reitoria de Graduação.
CDD 378.8161
Ficha catalográfica elaborada pela Coordenadoria Geral de Bibliotecas da Unesp
equipe
Pró-reitorr Laurence Duarte Colvara
Secretária Joana Gabriela Vasconcelos Deconto
Assessoria José Brás Barreto de Oliveira
Maria de Lourdes Spazziani
Valéria Nobre Leal de Souza Oliva
Técnica Bambina Maria Migliori
Camila Gomes da Silva
Cecília Specian
Eduardo Luis Campos Lima
Gisleide Alves Anhesim Portes
Ivonette de Mattos
Maria Emília Araújo Gonçalves
Maria Selma Souza Santos
Renata Sampaio Alves de Souza
Sergio Henrique Carregari
Projeto gráfico e diagramação Andrea Yanaguita
delineamento_de_experimentos-prova4.indd 4
28/05/2014 15:49:17
PROGRAMA DE APOIO
À PRODUÇÃO DE MATERIAL DIDÁTICO
Considerando a importância da produção de material didático-pedagógico dedicado ao ensino de graduação e de pós-graduação, a Reitoria da UNESP,
por meio da Pró-Reitoria de Graduação (PROGRAD) e em parceria com a
Fundação Editora UNESP (FEU), mantém o Programa de Apoio à Produção
de Material Didático de Docentes da UNESP, que contempla textos de apoio
às aulas, material audiovisual, homepages, softwares, material artístico e outras
mídias, sob o selo CULTURA ACADÊMICA da Editora da UNESP, disponibilizando aos alunos material didático de qualidade com baixo custo e editado
sob demanda.
Assim, é com satisfação que colocamos à disposição da comunidade
acadêmica mais esta obra, “Delineamento de Experimentos”, de autoria do
Prof. Dr. Carlos Roberto Padovani, do Instituto de Biociências do Câmpus de
Botucatu, esperando que ela traga contribuição não apenas para estudantes da
UNESP, mas para todos aqueles interessados no assunto abordado.
delineamento_de_experimentos-prova4.indd 5
28/05/2014 15:49:17
delineamento_de_experimentos-prova4.indd 6
28/05/2014 15:49:18
SUMÁRIO
1.
Delineamento de Experimentos 9
1.1. Introdução 9
1.2. Delineamento ou Planejamento ou Desenho (“Design”) do Experimento 13
1.3. Delineamentos Experimentais 17
1.4. Exemplos 18
2.
Delineamento Inteiramente Casualizado (DIC) 20
2.1. Introdução 20
2.2. Modelo do Experimento DIC com Dados Balanceados 20
2.3. Procedimento Estatístico: Análise de Variância 22
2.4. Independência dos Erros 23
2.5. Variância Constante (Homocedasticidade) 25
2.6. Normalidade dos Erros 26
2.7. Técnica da Análise de Variância (ANOVA) 29
2.8. Coeficientes de Determinação e Variação de um Experimento 33
2.9. Comparações Múltiplas 34
2.10. Exercícios (DIC com Dados Balanceados) 36
2.11. Respostas dos Exercícios (DIC com Dados Balanceados) 38
2.12. Modelo do Experimento DIC com Dados Não Balanceados 40
2.13. Exercícios (DIC Não Balanceado) 43
2.14. Respostas dos Exercícios (DIC Não Balanceado) 44
3.
Delineamento em Blocos Completos Casualizados (DBCC)
3.1. Introdução 47
3.2. Modelo do Experimento (Biológico) 49
3.3. Procedimento Estatístico: Análise de Variância 50
3.4. Comparações Múltiplas 53
3.5. Exercícios (DBCC) 54
3.6. Respostas dos Exercícios (DBCC) 55
4.
Esquemas Fatoriais 57
4.1. Introdução 57
4.2. Esquema Fatorial a*b no DIC 58
4.3. Exemplo de Fatorial a*b no DIC 63
4.4. Esquema Fatorial a*b no DBCC 65
4.5. Exemplo de Fatorial a*b no DBCC 68
4.6. Exercícios (Esquemas Fatoriais: DIC e DBCC) 71
4.7. Respostas dos Exercícios (Esquemas Fatoriais : DIC e DBCC)
5.
47
72
Análise de Aderência e Associação 75
5.1. Introdução 75
5.2. Teste de Aderência 75
5.3. Teste de Homogeneidade 78
5.4. Teste de Independência 82
delineamento_de_experimentos-prova4.indd 7
28/05/2014 15:49:18
5.5.
5.6.
6.
7.
Exercícios (Testes de Aderência e Associação) 84
Respostas dos Exercícios (Testes de Aderência e Associação)
Correlação Linear Simples 89
6.1. Introdução 89
6.2. Diagrama de Dispersão 90
6.3. Coeficiente de Correlação 91
6.4. Teste de Hipótese da Correlação 94
6.5. Exercícios (Correlação Linear Simples) 95
6.6. Respostas dos Exercícios (Correlação Linear Simples)
98
Regressão Linear Simples 101
7.1. Introdução 101
7.2. Modelo de Regressão Linear Simples 102
7.3. Coeficiente de Determinação 107
7.4. Teste do Coeficiente (Angular) de Regressão 108
7.5. Exercícios (Regressão Linear Simples) 109
7.6. Respostas dos Exercícios (Regressão Linear Simples)
112
8.
Bibliografia
9.
Tabelas 117
87
115
Tabela 9.1 Distribuição t de Student
⎡ P (−t 0 < t < t 0 ) = 1− a ⎤
⎣
⎦
Tabela 9.2 Distribuição Qui-quadrado
⎡ P (χ 2 > χ 2 ) = α ⎤
0
⎢⎣
⎥⎦
Tabela 9.3 Distribuição F
⎡ P (F > F0 ) = 0, 01⎤
⎣
⎦
119
Tabela 9.4 Distribuição F
⎡ P (F > F0 ) = 0, 05⎤
⎣
⎦
120
Tabela 9.5 Distribuição F
⎡ P (F > F0 ) = 0,10⎤
⎣
⎦
121
117
118
Tabela 9.6 Distribuição “studentized range” [ q(0 ,01;ϕ) ] : Tukey (1%)
122
Tabela 9.7 Distribuição “studentized range” [ q(0 ,05;ϕ) ] : Tukey (5%)
124
Tabela 9.8 Distribuição “studentized range” [ q(0 ,10 ;ϕ) ] : Tukey (10%)
126
Tabela 9.9 Valores críticos do coeficiente de correlação linear de Pearson
(teste bilateral) 128
delineamento_de_experimentos-prova4.indd 8
28/05/2014 15:49:18
1
DELINEAMENTO DE EXPERIMENTOS
1.1 INTRODUÇÃO
Sir Ronald Aylmer Fisher (1890-1962) nasceu em Londres no dia 17 de
fevereiro de 1890 e bacharelou-se em Matemática pela Universidade de Cambridge em 1912. Sua miopia exagerada salvou da convocação para o serviço militar na 1ª Guerra Mundial, defeito que possibilitou desenvolver um treinamento
matemático de alta abstração (visualização no plano imaginário) o que deve ter
contribuído para sua preferência pela apresentação hipergeométrica, possibilitando assim a exibir soluções singulares independentes de simbolismo algébrico.
No início do século XX, em 1919, após trabalhar dois anos como estatístico e mais quatro como professor de matemática e física em escolas públicas
recebeu o convite para criar e chefiar um laboratório de estatística na Estação
Experimental de Agricultura de Rothamstead, Inglaterra, onde permaneceu
até 1933.
Durante este período, unido a outros estatísticos e pelo contato diário
com problemas da área agrícola, Fisher desenvolveu os métodos de análise e
os delineamentos experimentais, conforme descreve SALSBURG(2009). Caracteriza-se por delineamento do experimento ou delineamento experimental
(experimental design, em inglês, diseño experimental, em espanhol) o modo
de dispor as parcelas no experimento, ou seja, a maneira de designar os tratamentos às unidades experimentais ou parcelas. A técnica mais fisheriana tratase de análise de variância. Juntamente com a análise de covariância, também
de sua autoria, constitui-se no instrumental básico para interpretação dos resultados dos experimentos planejados. Deve ser destacado que esses métodos
procedentes do cotidiano agrícola se tornaram universais e aplicáveis em todas
delineamento_de_experimentos-prova4.indd 9
28/05/2014 15:49:21
10
| DELINEAMENTO DE EXPERIMENTOS
as áreas de conhecimento: medicina, psicologia, engenharia, odontologia, biologia, ecologia, entre outras.
Porém, como a formalização dos procedimentos ocorreu em um ambiente
agrícola, a origem dos termos técnicos da experimentação apresenta conotação bem agronômica. Assim o termo parcela foi criado para designar a unidade de área usada no experimento. Essa unidade de área era, originalmente,
uma faixa de terra ou um vaso. Hoje, parcela, tem um significado mais geral,
pois, dependendo do experimento pode ser um animal, uma pessoa, uma peça
anatômica, um corpo de prova, entre várias outras possibilidades que podem
ser utilizadas como unidades experimentais. A terminologia mais utilizada,
atualmente consiste em designar parcela por unidade experimental, que consiste na unidade física ou biológica para conduzir o experimento.
De mesma maneira, o termo tratamento também foi introduzido pela área
agrícola. Indicava o que estava em comparação: fertilizantes, inseticidas, variedades, nutrientes. Hoje o termo tratamento tem um significado mais geral.
Muitos experimentos são feitos para comparar métodos, grupos, produtos, máquinas, materiais e, inclusive, combinações destes. Mas o interesse, em
experimentação, nem sempre é de comparar tratamentos. Muitas vezes, pretende-se apenas saber se determinado tratamento produz efeito (nesse caso,
compara-se um grupo que recebeu tratamento - Grupo Tratado – com um
grupo que não recebeu o tratamento – Grupo Controle ou Testemunha).
A respeito do grupo controle duas considerações quanto à sua constituição podem ser feitas: Controle Negativo e Controle Positivo. O grupo controle
negativo é composto por unidades experimentais que não recebem tratamento
(“virgem de tratamento”), ou recebem apenas placebo (substância inerte). No
entanto, o grupo controle positivo, constitui-se de unidades que recebem o
tratamento padrão ou convencional. Na prática, a terminologia grupo controle
ou testemunha é utilizada como sinônimo de controle negativo.
delineamento_de_experimentos-prova4.indd 10
28/05/2014 15:49:21
Delineamento de Experimentos | 11
Embora o uso de grupo controle já esteja consagrado em experimentação,
na área médica, torna-se fundamental discutir a ética de constituir o grupo
controle negativo. Neste sentido, a experimentação com seres humanos exige
um aprofundamento quanto às questões éticas do uso de placebo (controle
negativo), inclusive pelo fato de se caracterizar por omissão de tratamento.
A exequibilidade do experimento está subordinada ao princípio básico da
repetição, segundo o qual indica que se deve ter repetições do experimento
para que seja possível produzir uma medida de variabilidade que permitirá a
realização dos testes de hipóteses sobre a presença de efeitos dos tratamentos
ou à estimação desses efeitos. O número de unidades experimentais (parcelas
ou repetições) para cada tratamento deve ser determinado a partir de informações sobre a variabilidade das parcelas em termos da variável resposta (dependente), custo e poder dos testes de significância.
Em experimentação a proposta básica que se formula consiste em comparar grupos, não apenas unidades. As medidas experimentais do mesmo
grupo recebem o nome de repetições. Do ponto de vista estatístico é sempre desejável que os experimentos tenham grande número de repetições por
grupo. Na prática, muitas vezes, o número de repetições fica limitado aos recursos (físicos, financeiros, materiais,...) disponíveis. Um dado importante que
deve ser considerado para o tamanho dos grupos, consiste em: quanto mais
homogêneo for o material - em termos de características que possam interferir nas observações ou medições que serão feitas - menor será o número de
repetições necessário para evidenciar o efeito significativo de tratamentos.
No contexto experimental, define-se fator como uma característica em estudo da qual há interesse em verificar a inferência sobre uma resposta do experimento, conforme destacam ANDRADE & OGLIARI (2007). Os níveis do fator
constituem os tratamentos do estudo. Um fator é indicado como quantitativo
quando seus níveis são referentes a quantidades (doses de uma droga, níveis de
delineamento_de_experimentos-prova4.indd 11
28/05/2014 15:49:21
12
| DELINEAMENTO DE EXPERIMENTOS
adubação, etc). Por outro lado, um fator é referido qualitativo quando seus níveis
são relativos a atributos (diferentes dietas, variedades de capim, etc).
Definidos os fatores e seus respectivos níveis que serão designados como
os tratamentos do estudo, a unidade experimental (parcela) e a variável dependente, torna-se necessário estabelecer qual o esquema de alocação dos
tratamentos às unidades experimentais será utilizado, ou seja, como deve ser
conduzido o delineamento experimental.
Para formar grupos tão iguais quanto possível é fundamental que os tratamentos sejam sorteados às unidades experimentais (casualização). Ou seja, o
que importa é entender que os tratamentos devem ser designados às unidades
experimentais por puro e simples sorteio. A casualização teve início em 1920
na área agronômica, porém, na pesquisa médica, só começou a ser aceita muito mais tarde. A idéia de “sortear” os pacientes que irão receber o tratamento
pode levantar questões de ética. Os que fazem objeções ao uso de casualização
em experimentos médicos usam o argumento de que não é ético “sortear” o
tratamento para alguns pacientes e deixar outros sem tratamento. Ora, essa
objeção refere-se à condução do experimento e não à técnica de casualizar.
Não existem alternativas válidas para a casualização. O pesquisador que
escolhe as unidades por critério próprio por melhores que sejam as intenções,
introduz tendenciosamente nos resultados.
O princípio da casualização pode ser considerado como uma das maiores contribuições dos procedimentos estatísticos à ciência experimental, pois
nele está assegurada a fidedignidade das conclusões. O efeito de proceder a
casualização constitui-se na garantia que parcelas (unidades experimentais)
com características diferentes tenham igual probabilidade de serem designadas para todos os grupos.
delineamento_de_experimentos-prova4.indd 12
28/05/2014 15:49:22
Delineamento de Experimentos | 13
1.2 DELINEAMENTO OU PLANEJAMENTO OU DESENHO (“DESIGN”) DO
EXPERIMENTO
O procedimento geral e comum na pesquisa científica consiste em formular hipóteses (afirmativas sob julgamento) e verificá-las diretamente ou por suas
consequências. Neste sentido, faz-se necessário um conjunto de observações e o
planejamento de experimentos é então imprescindível para indicar o procedimento que será utilizado para verificar se as hipóteses são verdadeiras ou falsas.
As hipóteses são avaliadas por meio de métodos de tomada de decisão
estatística (teoria das probabilidades) cujos procedimentos quantitativos e
análises objetivas (teoria estatística) dependem da maneira sob a qual as observações foram obtidas. Procedimento bem distinto da matemática no qual
para calcular a área de uma figura plana, por exemplo, de um triângulo, basta
multiplicar sua base por sua altura e dividir por dois que se obtém de maneira
exata o valor numérico relativo à área desejada.
Nas áreas das ciências biológicas a situação é bem mais complexa, surgem
inúmeras causas de variação de controle impossível ou só parcialmente possível (variações genéticas, erros de medidas inerentes à precisão dos aparelhos,
efeitos sazonais, etc). Essas causas de variação, várias e às vezes até desconhecidas ou mal conhecidas, acumulam variações nos dados observados que possibilitam alterar em menor ou maior intensidade os resultados das unidades
experimentais, cuja precisão deve ser discutida em termos probabilísticos de
quão prováveis são os valores encontrados. Neste contexto, troca-se a exatidão
da matemática pela construção probabilística das possibilidades dos resultados encontrados nos dados (precisão das informações estatísticas). O planejamento experimental e a análise estatística dos resultados estão interligados
e, desta forma, devem ser considerados de maneira sucessiva nas pesquisas
científicas de todas as áreas de conhecimento (Sampaio, 2010).
delineamento_de_experimentos-prova4.indd 13
28/05/2014 15:49:22
14
| DELINEAMENTO DE EXPERIMENTOS
Existe uma semelhança muito expressiva entre o médico e o estatístico
(“cuidador da saúde dos números”).
O primeiro passo para o médico é o diagnóstico (para o estatístico, o
planejamento); saber onde há necessidade de cura (qual o modelo para coleta
de dados). A primeira atitude dos médicos é examinar os sintomas – se você
chegar ao médico já pedindo determinado remédio, não será atendido; antes,
é preciso saber quais os sintomas aparentes do problema, detectando os sintomas físicos (material e métodos) e emocionais (imparcialidade e não viés de
planejamento) – para finalmente realizar a prescrição.
Assim acontece com a estatística, a análise dos dados (prescrição de remédio) deve acontecer após o conhecimento dos sintomas (características da pesquisa em estudo) para que se tenha o diagnóstico (modelo do delineamento
experimental).
Segundo Sir Ronald Aylmer Fisher, o arquiteto da estatística experimental:
“Chamar o especialista em estatística depois que o experimento foi feito pode
ser o mesmo que pedir para ele fazer um exame post-mortem. Talvez ele consiga dizer de que foi que o experimento morreu”.
A melhor maneira para a visualização sequencial destes aspectos consiste
em considerar a circularidade do método científico, no qual pode-se verificar
a necessidade e a importância do planejamento experimental juntamente com
a análise estatística de dados.
delineamento_de_experimentos-prova4.indd 14
28/05/2014 15:49:22
Delineamento de Experimentos | 15
Observações (2)
(Planejamento)
Formulação de hipóteses (1)
Verificação das hipóteses (3)
(Planejamento)
(Análise)
Desenvolvimento
da Teoria (4)
Uma pesquisa científica estatisticamente planejada deve seguir a seguinte
sequência de passos quanto ao planejamento e execução:
1.
Enunciado claro do problema e formulação das hipóteses que serão estudadas (as hipóteses científica e estatística devem manter uma correspondência perfeita e o enunciado apresentar-se de maneira clara e objetiva).
2.
Indicação dos fatores (variáveis independentes – variáveis controladas
pelo pesquisador) do estudo (a escolha dos fatores e seus respectivos níveis
constituirão os tratamentos).
3.
Indicação da unidade experimental (parcela). Deve ser definida no sentido
de minimizar o erro experimental.
4.
Indicação das variáveis (variáveis respostas) que serão medidas na unidade
experimental (a distribuição probabilística associada à variável resposta é
essencial para a escolha do método de análise estatística).
5.
Indicação das regras e procedimentos pelos quais os diferentes tratamentos (combinação de níveis de fatores) serão atribuídos às unidades experimentais (processo de casualização ou aleatorização).
6.
Análise estatística dos dados do experimento (tem como objetivo verificar
as hipóteses estabelecidas no início da pesquisa).
7.
Descrição dos resultados analíticos com as medidas de precisão das estimativas e o respectivo nível de significância nas interpretações inferenciais.
delineamento_de_experimentos-prova4.indd 15
28/05/2014 15:49:22
16
| DELINEAMENTO DE EXPERIMENTOS
Para melhor entendimento das características e as etapas do planejamento
experimental, suponha que o interesse de um pesquisador consista em comparar duas dietas (normocalórica e hipercalórica) quanto ao desempenho
ponderal final de ratos Wistar-Kyoto submetidos aos tratamentos (dietas) por
um período final de 12 semanas.
Caracteriza-se que o experimento está planejado quando estão definidos:
i.
a unidade experimental (animal – rato Wistar);
ii.
a variável em análise (resposta) e a forma como será medida (variação percentual do ganho de peso, medido pela diferença 100(PF - PI ) % ), sendo
PI
PF o peso final e PI o peso inicial;
iii.
tratamentos em comparação (dieta normocalórica e dieta hipercalórica);
iv.
forma de designar os tratamentos às unidades experimentais (por sorteio)
considerando que os animais são homogêneos;
v.
o número de ratos de cada dieta será de 12 unidades.
Os itens iv e v formam os princípios básicos da experimentação: casualiza-
ção (fidedignidade) e a repetição (exequibilidade).
As hipóteses de interesse da pesquisa são verificadas com a utilização de
métodos de análise estatística que dependem da maneira sob a qual as observações foram obtidas, ou seja, sob qual modelo de casualização dos tratamentos
às unidades experimentais os dados foram coletados. Portanto, planejamento
de experimentos e análise dos dados coletados sob o modelo operacional utilizado não podem ser considerados isolados, pois a ordem dos acontecimentos
está em uma sequência dentro do desenvolvimento nas pesquisas.
O procedimento estatístico exigido ao analisar dados experimentais ou observacionais fundamenta-se em gerar modelos que explicitem as estruturas do
fenômeno biológico, as quais continuamente estão misturadas com variações
casuais, aleatórias ou acidentais. Quanto mais identificada e entendida forem
essas estruturas, maior conhecimento do fenômeno, assim como, melhores
delineamento_de_experimentos-prova4.indd 16
28/05/2014 15:49:22
Delineamento de Experimentos | 17
serão as informações sobre os possíveis comportamentos do mesmo. Ou seja,
tem-se uma aproximação consistente da realidade biológica expressa num
modelo considerado (modelo é uma expressão resumida de algum fenômeno).
A percepção biológica e a identidade estatística com o processo estocástico
ponderam admitir cada observação composta por duas partes: uma previsível
(controlada) e outra aleatória (não previsível).
Cada observação pode ser representada pelo modelo:
OBSERVAÇÃO = PREVISÍVEL + ALEATÓRIO , no caso aditivo, ou
OBSERVAÇÃO = PREVISÍVEL × ALEATÓRIO , no caso multiplicativo.
A parte previsível sistematiza o conhecimento que o pesquisador tem sobre o fenômeno, normalmente expressada por uma função matemática envolvendo parâmetros desconhecidos. À parte aleatória, dada sua característica de
não previsibilidade, exige-se que esteja sujeita a algum modelo probabilístico.
A partir destas considerações, seguindo o planejamento proposto para a
coleta de informações (dados) nas unidades experimentais, o procedimento
estatístico consiste em estabelecer estimativas para os parâmetros desconhecidos (propostos na parte sistematizada previsível segundo as hipóteses e os
objetivos do pesquisador), baseando-se em amostras observadas.
1.3 DELINEAMENTOS EXPERIMENTAIS
No contexto do planejamento de um experimento, torna-se essencial
definir a maneira como os tratamentos serão designados às unidades. O processo de casualização envolvido no planejamento designando como os tratamentos serão alocados às unidades experimentais estabelecem o delineamento
do experimento. Nesse contexto, serão apresentados no presente texto, duas
situações comuns na área biológica, quais são: unidades homogêneas e unidades heterogêneas, conforme descrito a seguir.
delineamento_de_experimentos-prova4.indd 17
28/05/2014 15:49:23
18
| DELINEAMENTO DE EXPERIMENTOS
i.
Delineamento Inteiramente Casualizado (DIC)
Consiste em alocar de maneira inteiramente ao acaso os tratamentos às
unidades experimentais. Para sua realização, exigem-se unidades experimentais homogêneas (similares).
ii.
Delineamento em Blocos Completos Casualizados (DBCC)
Consiste em considerar grupos similares (blocos) de unidades experimentais, quando o conjunto é heterogêneo, e alocar casualmente os tratamentos às unidades experimentais dentro dos blocos.
Na área biomédica o termo bloco é, geralmente, substituído por estrato.
1.4 EXEMPLOS
Para melhor entendimento de um planejamento experimental são apresentados a seguir dois exemplos práticos.
4.1 Planeje um experimento para estudar (comparar) o uso de sobredoses de vitamina B12 na diminuição de aterosclerose, em pacientes com a doença.
Unidade experimental: paciente com a doença.
Variável resposta: diminuição da aterosclerose (diâmetro do calibre em mm).
Tratamentos em comparação: dose padrão, sobredoses baixa, média e alta.
Designação dos tratamentos: por sorteio.
Número de repetições: oito doentes por tratamento.
4.2 Planeje um experimento para comparar quatro métodos de ensino da Linguagem
Americana de Sinais em alunos de uma turma homogênea de 120 alunos.
Unidade experimental: aluno da turma.
Variável resposta: nota de um teste padrão de linguagem (0 a 100 pontos
inteiros).
delineamento_de_experimentos-prova4.indd 18
28/05/2014 15:49:23
Delineamento de Experimentos | 19
Tratamentos em comparação: métodos A, B, C, D.
Designação dos tratamentos: sorteio do aluno participante.
Número de repetições: 15 alunos por método.
Sob o aspecto dos delineamentos experimentais mais utilizados nos exemplos práticos propostos em 1.4.1 e 1.4.2; o primeiro envolve como unidade
experimental o ser humano (paciente com doença) com suas características
biológicas heterogêneas, levando a necessidade do DBCC (são construídos
grupos de quatro pacientes com características biológicas tão próximas quanto
possível e então, procede-se o sorteio dos tratamentos). No segundo, como se
trata de uma turma homogênea, o DIC é mais apropriado.
delineamento_de_experimentos-prova4.indd 19
28/05/2014 15:49:23
delineamento_de_experimentos-prova4.indd 20
28/05/2014 15:49:23
2
DELINEAMENTO INTEIRAMENTE CASUALIZADO (DIC)
2.1 INTRODUÇÃO
O primeiro planejamento experimental a ser abordado trata-se do Delineamento Inteiramente Casualizado (DIC), bastante simples quanto ao processo de alocação dos tratamentos às unidades experimentais. Para melhor desenvolvimento didático será apresentado, primeiramente com dados balanceados
(mesmo número de repetições por tratamento) e, na sequência, com dados
não balanceados (ausência da consideração de mesmo número de repetições
por tratamento).
2.2 MODELO DO EXPERIMENTO DIC COM DADOS BALANCEADOS
Este delineamento consiste em designar os tratamentos às unidades experimentais por puro e simples sorteio, isto é, sem qualquer tipo de restrição
(equiprobabilidade para cada unidade experimental receber qualquer um dos
tratamentos). A operacionalização do procedimento de alocação dos tratamentos fica condicionada à disponibilidade de parcelas similares no experimento
(parcelas homogêneas). O entendimento de similaridade ou semelhança não
deve ser confundido com igualdade (igualdade conceito muito matemático e
“nada” provável em biologia).
Esse plano experimental é tão mais eficiente quanto maior for o grau de
homogeneidade entre as unidades experimentais em termos da variável dependente. Se as unidades experimentais são heterogêneas, o número de parcelas necessário para uma boa precisão pode ser muito grande (na prática devese procurar outros planejamentos experimentais, tais como blocos ou utilizar
delineamento_de_experimentos-prova4.indd 21
28/05/2014 15:49:23
22
| DELINEAMENTO DE EXPERIMENTOS
variáveis auxiliares – covariáveis, pois estes podem reduzir o erro experimental).
Sob o aspecto dos procedimentos de testes estatísticos é aconselhável o
balanceamento das repetições (todos tratamentos com igual número de
repetições), embora nem sempre isso seja possível (principalmente na pesquisa com seres humanos quando o uso de grupo controle tem restrições de
natureza ética).
O modelo estocástico que indica a forma da resposta biológica de uma
unidade experimental submetida a um dos tratamentos, isto é:
Resposta Biológica = Média Tratamento + Erro Casual Biológico, é descrito como
yij = μi + εij (i = 1,...k e j = 1,...,r)
sendo i o índice referente ao tratamento e j à unidade experimental.
2.3 PROCEDIMENTO ESTATÍSTICO: ANÁLISE DE VARIÂNCIA
A análise de variância (ANOVA), embora exija o cálculo de variâncias,
na verdade compara as médias dos tratamentos. Constitui-se numa extensão
do teste t de Student (que compara apenas duas e só duas médias) para um
número qualquer de médias. A estatística do teste para a ANOVA é calculada
por meio do teste F (Fisher-Snedecor).
A lógica de uma análise de variância consiste em considerar a variação
total existente nos dados desmembrada em duas partes: uma variação devida
aos tratamentos e outra devida ao acaso (ou resíduo). A idéia é comparar a
variação devida aos tratamentos com a variação devida ao acaso.
Algumas pressuposições básicas precisam estar satisfeitas para o uso da
técnica da análise de variância, que são: i) os erros são variáveis aleatórias independentes; ii) a variância é constante (homogênea nos tratamentos); iii) a
distribuição dos erros é normal ou aproximadamente normal.
delineamento_de_experimentos-prova4.indd 22
28/05/2014 15:49:23
Delineamento Inteiramente Casualizado (DIC) | 23
2.4
INDEPENDÊNCIA DOS ERROS
Uma regra prática consiste em utilizar um gráfico de resíduos padronizados versus a ordem de coleta dos dados. Se a pressuposição de independência
estiver satisfeita, os resíduos devem ficar distribuídos casualmente ao redor de
zero, sem um padrão definido. Para a construção gráfica devem ser consideradas as seguintes definições:
Resíduo ⇒ eij = yij − yi• (resíduo relativo à j-ésima observação do i-ésimo
grupo), i = 1,..., k; j = 1,..., r .
Resíduo padronizado ⇒ zij =
eij
QMRes
(resíduo padronizado relativo à j-
ésima observação do i-ésimo grupo ), onde QMRes significa Quadrado Médio
⎛
k
⎞
Residual e tem seu valor dado por: QMRes = S 2pool = ⎜⎜∑(ni −1)Si2 ⎟⎟⎟ (n − k ) .
⎟
⎜
⎝ i=1
⎠
Para o entendimento da regra prática considere um conjunto homogêneo
de 20 animais e quatro dietas para a comparação das alterações de pesos, cujos
5 animais de cada dieta foram escolhidos por processo randômico (sorteio).
As dietas estudadas foram:
A: dieta padrão;
B: dieta padrão suplementada com amendoim;
C: dieta padrão suplementada com girassol;
D: dieta padrão suplementada com abóbora.
Os ganhos de peso(g) avaliados considerando a variação absoluta entre o
início e o final do experimento, são apresentados na Tabela 2.1.
delineamento_de_experimentos-prova4.indd 23
28/05/2014 15:49:25
24
| DELINEAMENTO DE EXPERIMENTOS
Tabela 2.1
Ganhos de peso segundo dieta (g)
Dieta A
25
26
20
23
21
Dieta B
31
25
28
27
24
Dieta C
22
26
28
25
29
Dieta D
33
29
31
34
28
A Tabela 2.2 apresenta o resultado da estatística descritiva dos dados:
Tabela 2.2
Estatística descritiva das dietas
Dieta
Média
Variância
A
23,0
6,5
B
27,0
7,5
C
26,0
7,5
D
31,0
6,5
Portanto,
QMRes = S 2pool = (4×6, 5 + 4×7, 5 + 4×7, 5 + 4×6, 5) (20 − 4) = 7, 0 .
Os resíduos estão apresentados na Tabela 2.3.
Tabela 2.3 Resíduos dos ganhos de peso segundo dieta (g)
Resíduo (eijj)
Resíduo Padronizado (zzijj)
A
B
C
D
A
B
C
D
2
4
-4
2
0,756
1,512
-1,512
0,756
3
-2
0
-2
1,134
-0,756
0,000
-0,756
-3
1
2
0
-1,134
0,378
0,756
0,000
0
0
-1
3
0,000
0,000
-0,378
1,134
-2
-3
3
-3
-0,756
-1,134
1,134
-1,134
O gráfico bidimensional dos pares (ordem da observação; resíduo padronizado) está apresentado na Figura 2.1.
delineamento_de_experimentos-prova4.indd 24
28/05/2014 15:49:28
Delineamento Inteiramente Casualizado (DIC) | 25
Zij
1,890
1,512
1,134
0,756
0,378
0,000
0
1
2
3
4
5
6
7
8
9
10 11 12
13 14 15 16
-0,378
17 18 19 20
21
Observação
-0,756
-1,134
-1,512
-1,890
Figura 2.1.
Gráfico dos resíduos padronizados zij
A inspeção gráfica dos resíduos permite indicar que a pressuposição de
independência pode ser aceita.
Em situações que se deseja um resultado mais objetivo, isto é, se há interesse em um estudo mais avançado de delineamento de experimentos, recomenda-se aplicar o teste de Durbin-Watson para avaliar a significância da
presença de dependência (autocorrelação) dos erros (Draper & Smith, 1998).
2.5 VARIÂNCIA CONSTANTE (HOMOCEDASTICIDADE)
Uma regra prática indicada por DEAN & VOSS (1999) sugere pressupor
que os resultados de uma ANOVA sejam considerados válidos desde que a
maior variância não exceda em três vezes a menor. BOX (1953) sugere que a
maior variância não deva exceder em quatro vezes a menor. No nível analítico,
no qual exige-se decisão mais objetiva, foram propostos diversos testes para a
igualdade de variâncias, destacando-se entre eles: Cochran, Hartley, Bartlett e
Levene. Em nosso caso, será utilizado o teste de Hartley que considera a razão
delineamento_de_experimentos-prova4.indd 25
28/05/2014 15:49:28
26
| DELINEAMENTO DE EXPERIMENTOS
entre a maior e a menor variância, cuja estatística do teste é dada pela distribuição F.
Ou seja,
H 0 : s12 = s22 = ... = sk2 (Variâncias Homogêneas)
H1 : Existe si2 ¹ si2’ , para i ¹ i ’ (Variâncias Heterogêneas)
A estatística do teste é obtida considerando
max(S12 ,...,Sk2 )
~ F(glnum;glden) .
min(S12 ,...,Sk2 )
Sob a veracidade de H 0 , a estatística F do teste de hipótese da homogeneiF=
dade de variâncias tem distribuição F (Fisher-Snedecor) com os parâmetros:
graus de liberdade do numerador (glnum) e graus de liberdade do denominador (glden).
A regra de decisão é a habitual, isto é, F > F(α; glnum;glden), rejeita-se
H 0 ; caso contrário, não há rejeição.
No exemplo:
max(S12 ,..., S42 )
7,5
=
= 1,15
2
2
min(S1 ,..., S4 )
6,5
t H0 .
α = 0, 05,então glnum = glden = 4 ⇒ F(0,05;4 ;4 ) = 6, 39; portanto, não se rejeita
F=
2.6
NORMALIDADE DOS ERROS
Um processo prático consiste em fazer um gráfico de probabilidades normais (“NORMAL PROBABILITY PLOT”). O gráfico de probabilidade normal
consiste em uma técnica gráfica que permite avaliar se existe ou não um conjunto de dados que apresenta aderência à distribuição normal de probabilidades.
Os dados são plotados em um gráfico cartesiano para verificar se os pontos
formam uma reta aproximada, levando-se em consideração que quanto mais
afastados da reta situarem os pontos, maior fuga da normalidade apresenta a
situação. Os resíduos padronizados ( Zij ) são colocados no eixo das abscissas
e os escores da distribuição normal padronizada [valores esperados obtidos
delineamento_de_experimentos-prova4.indd 26
28/05/2014 15:49:29
Delineamento Inteiramente Casualizado (DIC) | 27
de P (Z £ Fi ) ] no eixo das ordenadas, para i =1,, n . A cada i-ésimo resíduo,
associa-se a frequência percentual acumulada empírica Fi =
seguida calcula-se P (Z £ Fi ) .
100(i − 12 )
%, em
n
Na presença da normalidade, os pontos ficarão em torno de uma reta que
passa pela origem e tem coeficiente angular 1. De maneira analítica, a hipótese
de que a distribuição dos erros é normal pode ser colocada em teste utilizandose os testes de aderência de: Kolmogorov-Smirnov(KS), Shapiro-Wilks(SW) e
Qui-quadrado(χ2).
Em linhas gerais, o pesquisador não precisa preocupar-se com a nãonormalidade, o teste estatístico F é bastante robusto, ou seja, pequenas transgressões à pressuposição de normalidade não afetam, substancialmente, o resultado da análise de variância ANOVA, a menos que a distribuição dos erros
tenha: i) curtose positiva; ii) assimetria. Nesses dois casos, têm-se falsas rejeições (mais diferenças significantes do que, na realidade, existem).
Considerando o exemplo dos ganhos de peso segundo dieta com o total 20
animais, tem-se Fi = 100(i − 0, 5) % = 5(i − 0, 5)% . Com os valores dos resíduos pa20
dronizados ordenados em ordem crescente de magnitude constrói-se a Tabela 2.4.
delineamento_de_experimentos-prova4.indd 27
28/05/2014 15:49:34
28
| DELINEAMENTO DE EXPERIMENTOS
Tabela 2.4 Resíduos padronizados ordenados e escores esperados sob normalidade
(Distribuição Z)
Ordem ( i )
Zij (ordenado)
Fi (%)
Escore Esperado
1
-1,512
2,5
-1,96
2
-1,134
7,5
-1,44
3
-1,134
12,5
-1,15
4
-1,134
17,5
-0,93
5
-0,756
22,5
-0,76
6
-0,756
27,5
-0,60
7
-0,756
32,5
-0,45
8
-0,378
37,5
-0,32
9
0,000
42,5
-0,19
10
0,000
47,5
-0,06
11
0,000
52,5
0,06
12
0,000
57,5
0,19
13
0,378
62,5
0,32
14
0,756
67,5
0,45
15
0,756
72,5
0,60
16
0,756
77,5
0,76
17
1,134
82,5
0,93
18
1,134
87,5
1,15
19
1,134
92,5
1,44
20
1,512
97,5
1,96
Para melhor entendimento do processo considere o resíduo padronizado
de menor magnitude (-1,512). A ordem associada ao valor é i =1 e, logo,
F1 (%) = 5(1− 0, 5)% = 2, 5% . O escore esperado sob a distribuição normal pa-
dronizada é dado por P (Z ≤ 0, 025) = −1, 96 . E assim, procede-se sucessivamente até o escore padronizado de maior magnitude (1,512).
delineamento_de_experimentos-prova4.indd 28
28/05/2014 15:49:37
Delineamento Inteiramente Casualizado (DIC) | 29
Escore
Esperado
2,5
2,0
1,5
1,0
0,5
-2,0
-1,5
-1,0
-0,5
0
-0,5
0,5
1,0
1,5
2,0
Zij
-1,0
-1,5
-2,0
-2,5
2.7 TÉCNICA DA ANÁLISE DE VARIÂNCIA (ANOVA)
Quando se tem um experimento completamente ao acaso com um fator
fixo (fonte de variação controlada em estudo), o interesse consiste em verificar a influência dos k níveis desse fator (k grupos ou k tratamentos) sobre
uma variável dependente (resposta) biológica Y em estudo. Uma maneira de
verificar a existência dessa influência do fator consiste em comparar as médias
populacionais da variável Y sob os níveis do fator (tratamento = agente causal).
Um teste estatístico para verificar a igualdade dessas k médias relativas aos
N
O VAriOf
níveis do fator consiste na técnica da análise de variância (ANalysis
ance, título em inglês que deriva a sigla ANOVA, utilizada na língua inglesa e,
muitas vezes na língua portuguesa). Embora o procedimento envolva o cálculo
de variâncias, seu objetivo fundamenta-se em comparar as médias dos níveis
do fator (tratamento).
A lógica da ANOVA para o delineamento inteiramente ao acaso é muito
simples, ou seja, resume-se em fracionar a variabilidade total dos dados em
duas fontes de variação ortogonais entre si, sendo uma devido a variação en-
delineamento_de_experimentos-prova4.indd 29
28/05/2014 15:49:40
30
| DELINEAMENTO DE EXPERIMENTOS
tre os níveis do fator (variação entre tratamentos) e outra, devido a variação
dentro dos níveis (dentro de tratamentos). Esta última tem a finalidade específica de estimar a variação atribuída ao acaso; enquanto a primeira, envolve
a variação do acaso acumulada, devido aos níveis de tratamento. Feito isso,
determina-se a razão da variação entre os níveis e a variação dentro dos níveis
e, se o resultado obtido for “muito grande” a conclusão é estabelecida a favor
das diferenças entre as médias dos níveis do fator (diferenças entre as médias
dos tratamentos).
Deve ser considerado que para a utilização da técnica da ANOVA, embora
o entendimento da lógica seja muito fácil, algumas pressuposições devem estar satisfeitas, quais sejam: independência dos erros, normalidade dos dados
e homogeneidade de variâncias; conforme será mostrado a seguir a partir dos
dados da Tabela 2.5.
Considere um conjunto homogêneo de 20 animais e quatro dietas para a
comparação das alterações de pesos, cujos 5 animais de cada dieta foram escolhidos por processo randômico (sorteio). As dietas estudadas foram:
A: dieta padrão;
B: dieta padrão suplementada com amendoim;
C: dieta padrão suplementada com girassol;
D: dieta padrão suplementada com abóbora.
Tabela 2.5 Ganhos de peso segundo dieta
Dieta A
Dieta B
Dieta C
Dieta D
25
31
22
33
26
25
26
29
20
28
28
31
23
27
25
34
21
24
29
28
23 (2,55) (*)
27 (2,74)
26 (2,74)
31 (2,55)
(*) média (desvio padrão)
delineamento_de_experimentos-prova4.indd 30
28/05/2014 15:49:40
Delineamento Inteiramente Casualizado (DIC) | 31
Cada ganho de peso é uma resposta biológica do modelo geral
yij = μi + εij = μ + τi + εij , com i =1,..., k (número de tratamentos) e j =1,..., r
(número de repetições por tratamento), onde:
μ é a média geral comum a todas as observações definida como
, sendo
μi a média populacional de Y no i-ésimo tratamento;
ri o número de repetições no i-ésimo tratamento (no caso balanceado é o
valor comum r para todos tratamentos);
ti é o efeito do i-ésimo nível do fator na variável dependente Y e mede
o desvio da média μi em relação a m, isto é: τi = μi − μ ;
eij é o erro casual não observável (em nosso estudo, variável aleatória independente e identicamente distribuída como N (0,s 2 ) ).
Neste sentido, tem-se:
a)
E (Yij ) = μ + τi = μi
b)
Var = (Yij ) = s 2
c)
Yij ~ N (μi , σ 2 )
Considerando satisfeitas as suposições de independência dos erros, normalidade dos dados e homogeneidade das variâncias de tratamentos, a técnica
da ANOVA consiste em comparar a variação devida aos tratamentos (entre
tratamentos) com a variação devida ao acaso (ou resíduo, ou dentro de tratamentos).
Para o cálculo das causas de variação são determinadas:
a)
Graus de liberdade (GL)
Total = n − 1, onde n = kr;
Tratamento = k − 1;
Resí duo = n − k= k (r − 1)
b) Somas de quadrados (SQ)
delineamento_de_experimentos-prova4.indd 31
28/05/2014 15:49:40
32
| DELINEAMENTO DE EXPERIMENTOS
k
SQTot = ∑
i=1
k
SQTrat = ∑
i=1
yi• =
r
∑( y
r
k
ij
j=1
− y•• )2 = ∑
i=1
r
∑( y
j=1
∑y
j=1
k
i•
2
ij
− y•• )2 = ∑
i=1
− ny••2 onde y•• =
yi2•
− ny••2 =
r
1 k
∑
n i=1
r
∑y ;
ij
j=1
k
∑ ry
i=1
2
i•
- ny••2 ; onde
1 r
∑ yij ;
r j=1
k
SQRes = ∑
i=1
r
∑( y
k
ij
j=1
− yi• )2 = ∑
i=1
k
r
∑ y −∑
2
ij
j=1
i=1
yi2•
= SQTot − SQTrat .
r
c) Quadrados Médios (QM)
QMTrat = SQTrat / (k −1)
QMRes = SQRes / (n − k )
F = QMTrat / QMRes
As quantidades obtidas anteriormente são dispostas na Tabela 2.6, denominada tabela de análise de variância.
Tabela 2.6 Tabela geral de ANOVA de um DIC balanceado
Causa de variação
GL
SQ
QM
F
Tratamentos
k -1
SQTrat
QMTrat
QMTrat / QMRes
Resíduo
n-k
SQRes
QMRes
Total
n-1
SQTot
O teste de hipóteses relativo à Tabela 2.6 consiste em:
H 0 : Não existe efeito de tratamentos ⇔ H 0 : τ1 = ... = τ k = 0 ⇔ H 0 : μ1 = ... = μk = μ
H1 : Existe efeito de tratamentos ⇔ H1 : Existe ti ≠ 0 (i = 1,..., k)
Se F ≥ F(a ;k−1;n−k ) , rejeita-se H0. Caso contrário não há rejeição.
No exemplo, tem-se:
k = 4 (tratamentos) e r = 5 (repetições por tratamento);
delineamento_de_experimentos-prova4.indd 32
28/05/2014 15:49:47
Delineamento Inteiramente Casualizado (DIC) | 33
y•• = 535, logo, y•• = 535 / 20 = 26, 75
y1• = 115( y1• = 23); y2• = 135( y2• = 27); y3• = 130( y3• = 26); y 4• = 155( y 4• = 31)
SQTot = 14587, 00 −14311, 25 = 275, 75
SQTrat = 14475, 00 −14311, 25 = 163, 75
SQRes = 275, 75 −163, 75 = 112, 00
QMTrat = 163, 75 / 3 = 54, 58
QMRes = 112, 00 / 16 = 7, 00
Tabela 2.7
ANOVA dos ganhos de peso
Causa de variação
GL
SQ
QM
F
Dietas
3
163,75
54,58
7,80 (p < 0,005)
Resíduo
16
112,00
7,00
Total
19
275,75
Conclui-se, no nível de significância 5%, que existem diferenças entre as
médias das alterações (ganhos) de pesos segundo as dietas estudadas (rejeitase H 0 : t1 = t2 = t3 = t 4 = 0 ). Ou seja, os resultados experimentais (com base
no “p-value”) permitem rejeitar a hipótese de que as médias de tratamentos
são iguais, ao nível de significância de 5%.
2.8 COEFICIENTES DE DETERMINAÇÃO E VARIAÇÃO DE UM EXPERIMENTO
2
O coeficiente de determinação ( R ) de um experimento é dado pela razão
entre a SQTrat (variação devida aos tratamentos) e a SQTot (variação total
dos valores observados), indicando a proporção da variação total explicada
pela variação devida aos tratamentos ( 0 £ R2 £ 1 ).
O coeficiente de variação ( CV ) de um experimento é dado pela razão entre
o desvio padrão (na ANOVA, consiste na raiz quadrada positiva de QMRes ) e
delineamento_de_experimentos-prova4.indd 33
28/05/2014 15:49:57
34
| DELINEAMENTO DE EXPERIMENTOS
a média geral dos dados ( y·· ), indicando como os dados comportam-se (dispersão) em relação à média geral. A grandeza inversa do CV remete à idéia da
precisão dos dados experimentais.
No exemplo anterior, tem-se
R2 = SQTrat / SQTot = 163, 75 / 275, 75 = 0, 5938
(59,38% da variação total é explicada pela variação de tratamentos);
CV = QMRes / y•• = 7, 00 / 26, 75 = 0, 0989
(9,89% estabelece-se como a dispersão relativa dos dados experimentais)
2.9 COMPARAÇÕES MÚLTIPLAS
A técnica da ANOVA permite ao pesquisador verificar se existe efeito
dos tratamentos, mas não como as médias dos tratamentos diferem entre
si. Portanto, se constatar que existe efeito do fator em estudo, é interessante
complementar a análise a fim de localizar as diferenças entre as médias dos
tratamentos. A resposta à complementação da ANOVA pode ser concretizada
(principalmente quando os níveis do fator são qualitativos) com um teste de
comparações múltiplas de médias.
Nessa linha de busca de uma resposta biológica mais interessante e informativa foram propostos diversos testes que, em geral, levam o nome do
seu autor (Tukey, Duncan, Dunnet, Bonferroni, Scheffé, Newman-Keuls ou
Student-Newman-Keuls (SNK), e outros). Não existe um teste aceito como o
“melhor” deles; todos apresentam vantagens e desvantagens e situação mais
indicada para seu uso.
Os testes de comparações múltiplas permitem testar hipóteses do tipo:
H 0 : c1μ1 + ... + ck μk = 0 “versus” H1 : c1μ1 + ... + ck μk ≠ 0, com c1 + ... + ck = 0 . Essa
combinação linear de médias, que reflete uma situação de interesse biológico,
é denominada contraste de médias.
delineamento_de_experimentos-prova4.indd 34
28/05/2014 15:50:04
Delineamento Inteiramente Casualizado (DIC) | 35
Na maioria das vezes, o interesse consiste na comparação de todas as diferenças entre médias de dois tratamentos. Dentro dessa linha de curiosidade a
opção será pelo método de Tukey.
O método de Tukey baseia-se na diferença honestamente significante
(HSD=”Honestly Significant Difference”), cujo princípio é encontrar a diferença mínima significante que assegura a todas as comparações um nível comum
de significância estabelecido a priori. Segundo Gomes (2009), o teste pode ser
utilizado para comparar todo e qualquer contraste entre pares de médias.
No experimento com dados balanceados o teste de Tukey é exato com o
seguinte procedimento operacional:
H0 : μi − μi ’ = 0
e
H1 : μi − μi ’ ≠ 0, com i ≠ i’ .
Calcula-se HSD (α ) = Δ (α ) = q(α ;k ;ϕ)
QMRes
r
q(α ;k ;ϕ) é o quantil de or-
dem (1-α/2) da distribuição estatística denominada “studentized range” com
parâmetros k (número de tratamentos) e j = n − k (graus de liberdade do resíduo). Os valores de q, considerando a=0,01 e a=0,05, estão tabelados e são
encontrados em diversos livros de estatística experimental.
A regra de decisão é a habitual, ou seja:
Se yi• − yi ’• ≥ Δ(a ) , rejeita-se H 0 . Caso contrário, não há rejeição.
Similarmente, pode-se apresentar o intervalo de confiança 100(1− a )%
para a diferença de médias, cujos limites são dados por:
LI = ( yi• − yi •’ )− q(α;k ;ϕ)
QMRes
r
LS = ( yi• − yi •’ ) + q(α; k;ϕ)
QMRes
r
No exemplo relativo à Tabela 1, tem-se
q(0,05;4 ;16) = 4, 05 ; logo, Δ(5%) = HSD (5%) = 4, 05
7, 00
= 4, 79 .
5
Ou seja, o valor mínimo que expressa a diferença significante entre as médias dos ganhos de peso é da ordem de 4,79 unidades de peso. Neste sentido, as
delineamento_de_experimentos-prova4.indd 35
28/05/2014 15:50:04
36
| DELINEAMENTO DE EXPERIMENTOS
únicas diferenças encontradas aconteceram entre as dietas A e D (8,00>4,79)
e C e D (5,00>4,79).
Uma maneira elegante e redacional (textos científicos e biológicos) de
apresentar os resultados está disposta na Tabela 2.8.
Tabela 2.8 Média e desvio padrão do ganho de peso segundo a dieta
Dieta
A
B
C
D
23 (2,55)a(1)
27 (2,74)ab
26 (2,74)a
31 (2,55)b
HSD
4,79
(1) duas médias seguidas de pelo menos uma mesma letra não diferem entre si (p>0,05) pelo teste de Tukey
2.10
EXERCÍCIOS (DIC COM DADOS BALANCEADOS)
A seguir são apresentados alguns exercícios para o entendimento do
planejamento experimental envolvido no DIC Balanceado (mesmo número de
repetições por tratamento) e também para o treinamento dos cálculos abrangidos na técnica da ANOVA e no teste de comparações múltiplas de Tukey. As
respostas dos exercícios são apresentadas no próximo item.
1.
Para testar duas drogas diferentes usando grupo controle, um farmacologista pretende fazer um experimento com cobaias. Estão disponíveis 24
cobaias, bastante similares. Como você planejaria o experimento?
2.
Explique com detalhes o procedimento que você faria para designar cinco
tratamentos (A, B, C, D, E) para 25 unidades experimentais (ratos) similares.
3.
Num laboratório de biofísica são usados quatro voltímetros diferentes.
Para verificar se os quatro voltímetros estão igualmente calibrados, mediuse a mesma força constante de 100 volts cinco vezes cada voltímetro. Os
delineamento_de_experimentos-prova4.indd 36
28/05/2014 15:50:04
Delineamento Inteiramente Casualizado (DIC) | 37
dados estão na tabela abaixo. Faça uma análise de variância e interprete o
resultado (considerar α=0,05).
Voltagem segundo o voltímetro
Voltímetro
4.
A
B
C
D
117
115
118
125
120
110
123
121
114
116
119
123
119
115
122
118
115
114
118
118
Para detectar a presença de insetos daninhos nas plantações, colocam-se
papelões untados com uma substância pegajosa e examinam-se os insetos
capturados. Ao nível de 5% de significância, que cores atraem mais insetos? Os pesquisadores colocaram seus papelões de cada cor em posições
aleatórias em um campo de aveia, e contaram o número de insetos capturados.
Cor do papelão
Insetos Capturados
Azul
16
11
20
21
14
17
Verde
37
32
20
29
37
32
Branco
21
12
14
17
13
20
Amarelo
45
59
48
46
38
47
Obs.: Como a variável “número de insetos” (contagem) não apresenta distribuição normal (variável discreta), para a análise
dos dados considerar os valores observados sob a transformação raiz quadrada.
5.
Considere o seguinte quadro de ANOVA da PAM:
Fonte de variação
Entre Grupos
Intragrupos
Total
Soma Quadrados
GL
QM
F
800
3
?
?
?
?
33,33
-
2000
a.
Qual tipo de ANOVA está apresentado no quadro?
b.
Qual a conclusão no nível de 5% de significância?
c.
Qual a redação científica mais adequada para a conclusão sobre o resultado do teste estatístico empregado?
delineamento_de_experimentos-prova4.indd 37
28/05/2014 15:50:05
38
| DELINEAMENTO DE EXPERIMENTOS
6.
Considere as seguintes dosimetrias de mercúrio no sangue (ppb) de grupos expostos em garimpos da Amazônia Legal (Ferrari et al., Revista de
Saúde Ocupacional, v.20, n.75, p.54-60, 1992).
Grupo
Dosimetria Hg
Garimpeiros
24
19
25
23
13
Ribeirinhos
16
8
10
7
15
Índios
28
30
19
23
22
Controle
12
6
8
7
9
Verificar, considerando o nível de significância 5%, as diferenças entre as
respostas médias dos grupos.
2.11 RESPOSTAS DOS EXERCÍCIOS (DIC COM DADOS BALANCEADOS)
1.
Cada grupo ( Controle, Droga 1 e Droga 2 ) será composto de oito cobaias alocadas por processo aleatório simples (casual ou randomizado ). A
variável resposta será comparada quanto às médias dos grupos pela técnica da ANOVA complementada com o teste de comparações múltiplas de
Tukey, considerando o nível de 5% de significância.
2.
Os ratos são enumerados de 1 a 25 e, em uma urna são colocadas 25 etiquetas idênticas quanto ao tamanho, forma e cor sendo cinco marcadas
com a letra A, cinco com B, cinco com C, cinco com D e, finalmente cinco
com E. Em outra urna, são colocadas outras etiquetas enumeradas de 1
a 25, correspondente aos 25 ratos da pesquisa. Procede-se com a realização de sorteios em ambas as urnas, formando 25 pares constituídos pelo
tratamento sorteado na primeira urna e o rato correspondente ao número
sorteado na segunda.
delineamento_de_experimentos-prova4.indd 38
28/05/2014 15:50:05
Delineamento Inteiramente Casualizado (DIC) | 39
3.
Tabela 1.
ANOVA para a força dos voltímetros
Causa de variação
Tabela 2.
GL
SQ
QM
F
Voltímetro
3
150,00
50,00
7,41 (p<0,005)
Resíduo
16
108,00
6,75
Total
19
258,00
Média (desvio padrão) da força segundo tipo de voltímetro
A
B
C
D
117,00 (2,55) ab
114,00 (2,35) a
120,00 (2,35) b
121,00 (3,08) b
DHS (5%) = 4,71
4.
Tabela 1.
Tabela 2.
ANOVA para a raiz quadrada do número de insetos capturados
Causa variação
GL
SQ
QM
F
Cor do papelão
3
33,72
11,24
43,57 (p<0,001)
Resíduo
20
5,16
0,26
Total
23
38,88
Média (desvio padrão) do número de insetos capturados(*) segundo cor
Azul
Verde
Branco
Amarelo
4,04 (0,47) a
5,56 (0,60) b
4,00 (0,47) a
6,85 (0,49) c
DHS (5%) = 0,82
(*) Variável sob a transformação raiz quadrada
5. a.
b.
ANOVA para DIC balanceado (10 animais por grupo).
F= 266,67/33,33 = 8,00 (p < 0,001); portanto rejeita-se a hipótese de
ausência de efeito de tratamentos.
c.
No nível de 5% de significância conclui-se que existe diferença entre as
médias da PAM nos grupos estudados.
6.
Tabela 1.
ANOVA para a dosimetria de mercúrio no sangue (ppb)
Causa variação
GL
SQ
QM
F
Grupo
3
871,20
290,40
17,47 (p<0,001)
Resíduo
16
266,00
16,63
Total
19
1137,20
delineamento_de_experimentos-prova4.indd 39
28/05/2014 15:50:05
40
| DELINEAMENTO DE EXPERIMENTOS
Tabela 2.
grupo
Média (desvio padrão) da dosimetria de mercúrio no sangue segundo o
Garimpeiros
20,80 (4,92) b
Ribeirinhos
Índios
Controle
11,20 (4,09) a
24,40 (4,51) b
8,40 (2,30) a
DHS (5%) = 7,39
2.12 MODELO DO EXPERIMENTO DIC COM DADOS NÃO BALANCEADOS
Em algumas situações, pode acontecer que o número de unidades experimentais disponível não seja múltiplo do número de tratamentos que se pretende comparar ou, ainda, começar o experimento com dados balanceados e
algumas unidades, por algum motivo alheio à vontade do pesquisador, tornarem-se perdidas para o experimento. Nessas situações, os tratamentos podem
ficar com números de repetições total ou parcialmente diferentes, ou seja, experimento com número diferente de repetições (dados não balanceados).
Talvez a primeira sugestão, com base no que já foi visto, seria “descartar
utilizando critérios randômicos” unidades experimentais para se ter os dados
balanceados nos tratamentos. Mesmo sendo, do ponto de vista da Estatística
Experimental, melhor que todos os tratamentos apresentem o mesmo número
de parcelas (a análise é realizada por procedimento exato), a importância biológica das informações das unidades experimentais é mais imperativa que
a simplicidade dos cálculos matemáticos do procedimento e, neste sentido,
torna-se imprescindível um comportamento mais requintado para a situação.
Nessa situação, o caminho mais próximo às características da biologia acaba sendo dado pelo procedimento anterior realizado com os dados balanceados, adaptando-se as fórmulas dos cálculos aos experimentos com dados nãobalanceados. Esta nova maneira faz com que o processo exato seja direcionado
à forma aproximada.
delineamento_de_experimentos-prova4.indd 40
28/05/2014 15:50:05
Delineamento Inteiramente Casualizado (DIC) | 41
Portanto, a teoria desenvolvida no DIC balanceado passa a ser explicitada
com pequenas modificações nas somas de quadrados e no procedimento de
Tukey.
Tem-se:
ri
k
2
SQTot = ∑ ∑ yij2 − ny••
, onde ri consiste nas repetições do i-ésimo tratai=1 j=1
k
ri
mento e y•• = 1 ∑ ∑ yij
n
k
i=1 j=1
2
i•
SQTrat = ∑
i=1
k
ri
y
− ny••2
ri
ri
k
yi• = ∑ yij
j=1
SQRes = ∑ ∑ yij2 − ∑ yrii• = SQTot − SQRes .
i=1 j=1
2
i=1
O quadro da ANOVA permanece o mesmo do DIC para dados balanceados.
Em relação ao teste de Tukey, calcula-se
k
e
Se yi• − yi ’• ≥ Δii ’ (a ) , rejeita-se a hipótese de igualdade de médias. Caso
contrário, não há rejeição.
A Tabela 2.9 mostra os ganhos de peso (kg) no final do experimento realizado para comparar três rações comerciais em um lote de animais (suínos)
homogêneos (PADOVANI, 2002).
delineamento_de_experimentos-prova4.indd 41
28/05/2014 15:50:05
42
| DELINEAMENTO DE EXPERIMENTOS
Tabela 2.9 Ganho de peso (kg) segundo ração
Ração
Ganho de Peso
A
7,12
6,91
6,30
6,72
B
8,15
8,45
8,92
9,15
C
6,58
7,04
6,46
7,12
6,68
6,80
7,06
r1 = 6; r2 = 4; r3 = 5; n = 15
y1• = 40, 53 ; y2• = 34, 67 ; y3• = 34, 26 ; y•• = 109, 46 ; y•• = 7, 2973
SQTot = 810, 3948 −15×7, 29732 = 810, 3948 − 798, 7588 = 11, 6360
SQTrat =
40, 532 34, 672 34, 262
+
+
− 798, 7588 = 809, 0319 − 798, 7588 = 10, 2731
6
4
5
Tabela 2.10
Quadro da ANOVA do ganho de peso
Causa Variação
GL
SQ
QM
F
Ração
2
10,2731
5,1366
42,22 (P<0,001)
Resíduo
12
1,3629
0,1136
Total
14
11,6360
Coeficiente de Variação do experimento: CV = 100
Coeficiente de Determinação: R2 =
0,1136
% = 4, 62%
7, 2973
10, 2731
= 0, 8829 (88, 29%)
11, 6360
Teste de Tukey
a = 0, 05 ; k = 3 (tratamentos); ϕ =12 (graus de liberdade do resíduo)
Δii ’ = 3, 77
0,1136 ⎛⎜ 1 1 ⎞⎟
r +r
⎜⎜ + ⎟⎟ = 0, 8985 i ’ i
2 ⎝ ri ri ’ ⎟⎠
ri ri ’
Δ12 = 0, 580 ; Δ13 = 0, 544 ; Δ23 = 0, 603
y1• − y2• = 6, 755 − 8, 6675 = 1, 9125 > Δ12 ( A ≠ B )
y1• − y3• = 6, 755 − 6, 852 = 0, 097 < Δ13 ( A = C )
y2• − y3• = 8, 6675 − 6, 852 = 1, 8155 > Δ23 ( B ≠ C )
A Tabela 2.11 mostra a média e o desvio padrão do ganho de peso segundo
a ração comercial administrada.
delineamento_de_experimentos-prova4.indd 42
28/05/2014 15:50:05
Delineamento Inteiramente Casualizado (DIC) | 43
Tabela 2.11
Média e desvio padrão do ganho de peso segundo ração
Ração A
Ração B
Ração C
6,755(0,273)a(1)
8,668(0,452)b
6,852(0,307)a
(1) duas médias seguidas de uma mesma letra não diferem (P>0,05) pelo teste de Tukey.
2.13 EXERCÍCIOS (DIC NÃO BALANCEADO)
1.
Para testar duas drogas diferentes usando grupo controle, um farmacologista pretende fazer um experimento com cobaias. Estão disponíveis
24 cobaias, bastante similares. Discuta o uso de grupos com diferentes
repetições.
2.
Considere as seguintes dosimetrias de mercúrio no sangue (ppb) de grupos expostos em garimpos da Amazônia Legal (Ferrari et al., Revista de
Saúde Ocupacional, v.20, n.75, p.54-60, 1992).
Grupo
Dosimetria Hg
Garimpeiros
24
19
25
23
Ribeirinhos
13
10
12
8
Índios
28
30
24
26
Controle
10
6
8
9
18
25
Verificar, considerando o nível de significância 5%, as diferenças entre as
respostas médias dos grupos.
3.
Considerar as seguintes avaliações nasométricas
[nasalância(%)=100*(energia acústica nasal) / (energia acústica nasal+energia otoacústica oral)]
do vocábulo “papai” isolado e inserido em frase (Di Ninno et al., Revista de
Atualização Científica PRÓ-FONO, v.13, n.1, p.71-77, 2001)
delineamento_de_experimentos-prova4.indd 43
28/05/2014 15:50:14
44
| DELINEAMENTO DE EXPERIMENTOS
4.
Faixa Etária
Nasalância (%)
Criança
10,5
11,6
12,3
8,9
9,2
9,6
10,9
Adolescente
11,5
10,2
13,9
12,0
10,4
10,0
14,1
Adulto
18,5
16,6
20,2
17,8
21,8
17,4
11,0
Considerando o nível de significância 5%, avaliar as diferenças entre as
respostas médias das nasalâncias.
2.14 RESPOSTAS DOS EXERCÍCIOS (DIC NÃO BALANCEADO)
1.
Do ponto de vista biológico, o grupo controle (animais que recebem o
placebo, ou seja, soro fisiológico por exemplo) é o referencial das comparações (padrão de referência para testar o efeito das drogas), logo deve
ser o grupo agraciado com mais animais. O restante dos animais pode ser
balanceado entre as duas drogas.
2.
Tabela 1.
Quadro da ANOVA da dosimetria de Hg
Causa variação
Tabela 2.
GL
SQ
QM
F
Grupos
3
1030,50
343,50
56,22 (p<0,001)
Resíduo
14
85,50
6,11
Total
17
1116,00
Média (desvio padrão) da dosimetria segundo grupo
Garimpeiro
Ribeirinho
Índio
Controle
21,80 (3,11) b
10,75 (2,22) a
26,60 (2,41) c
8,25 (1,71) a
DHS (G x R) = 4,82
DHS (G x I) = 4,54
DHS (G x C) = 4,82
DHS (R x I) = 4,82
DHS (R x C) = 5,08
DHS (I x C) = 4,82
3.
Tabela 1. Quadro da ANOVA da nasalância
Causa variação
GL
SQ
QM
F
Faixas Etárias
2
256,01
128,01
49,81 (p<0,001)
Resíduo
18
46,28
2,57
Total
20
302,29
delineamento_de_experimentos-prova4.indd 44
28/05/2014 15:50:14
Delineamento Inteiramente Casualizado (DIC) | 45
Tabela 2.
Média (desvio padrão) da nasalância segundo faixa etária
Criança
Adolescente
Adulto
10,50 (1,19) a
11,73 (1,71) a
18,72 (1,94) b
DHS (Cr x Adol)=2,12
DHS (Cr x Adul)=2,21
DHS (Adol x Adul)=2,28
delineamento_de_experimentos-prova4.indd 45
28/05/2014 15:50:14
delineamento_de_experimentos-prova4.indd 46
28/05/2014 15:50:14
3
DELINEAMENTO EM BLOCOS COMPLETOS
CASUALIZADOS (DBCC)
3.1
INTRODUÇÃO
Quando o conjunto de unidades experimentais for relativamente heterogêneo (pequenos grupos de unidades similares, mas nenhum suficientemente
grande para um planejamento), o plano experimental inteiramente casualizado
torna-se pouco preciso, porque o erro experimental torna-se muito grande. A
partir das informações disponíveis, antes da realização do experimento, é possível agrupar as unidades experimentais em subconjuntos de unidades mais homogêneas, denominados blocos. A alocação das unidades experimentais entre
os tratamentos obedece a uma restrição imposta pelos blocos, ou seja, o procedimento de casualização dos tratamentos às unidades experimentais é realizado
dentro de cada bloco. Quando todos os tratamentos aparecerem em todos os
blocos uma única vez, tem-se o Delineamento em Blocos Completo. Toda vez
que os tratamentos tornam-se presentes uma única vez em cada bloco, o número
de blocos coincide com o número de repetições (Banzatto & Kronka, 2006). Deve
ser observado, inclusive por possível confusão de nome, que a aleatorização está
sendo realizada nos tratamentos dentro dos blocos (restrição na casualização).
Na análise estatística de um experimento em blocos casualizados, ou como
normalmente se diz, um experimento em blocos, além dos fatores de interesse,
deve-se levar em conta o fator de controle experimental, blocos, diminuindo
desta maneira o erro experimental. Quanto maior for a heterogeneidade entre
blocos, maior será a eficiência deste plano experimental em relação ao completamente aleatorizado. O delineamento em blocos também pode ser planejado
com repetições dos tratamentos dentro do bloco e além disso, de forma incom-
delineamento_de_experimentos-prova4.indd 47
28/05/2014 15:50:14
48
| DELINEAMENTO DE EXPERIMENTOS
pleta. A análise estatística do delineamento em blocos completos ao acaso com
repetições torna-se relativamente fácil quando o número de unidades dentro
de cada bloco é múltiplo do número de tratamentos em comparação.
O termo bloco (sua origem é de fato agronômica, cujo objetivo referia-se
a faixa de terra de mesma fertilidade – fertilidade homogênea) tem um sentido prático interessante na área biológica, ou seja, caracteriza-se como estrato
e tem como finalidade, o controle da homogeneidade dos animais quanto às
variáveis intervenientes.
No presente estudo os blocos são completos quanto aos tratamentos, isto
é, um bloco possui todos os tratamentos de interesse do estudo, alocados por
processo aleatório com uma repetição por bloco. A vantagem mais destacada
dos experimentos em blocos consiste em permitir o uso de unidades experimentais heterogêneas. Os blocos controlam uma causa de variação e estabelecem uma restrição à casualização. Essa restrição à casualização devido à
constituição dos blocos indica para a não realização do teste estatístico para a
causa de variação blocos, ou seja, não faz sentido, pois se trata de uma fonte de
variação de controle e não de interesse para a comparação. Se a fonte colocada
como blocos está no interesse do pesquisador para comparação, o esquema de
fatores torna-se o procedimento adequado para a combinação dos níveis dos
dois fatores em estudo.
Em resumo, podem ser destacados:
a.
A casualização ocorre dentro dos blocos (os blocos são estratos definidos
quanto à heterogeneidade das unidades experimentais e, portanto fixados
como controles).
b.
Os blocos são completos quanto aos tratamentos pesquisados (cada bloco
deve conter todos os tratamentos do estudo).
c.
É essencial que os blocos reúnam unidades similares (unidades semelhantes
dentro de blocos asseguram aos tratamentos única fonte de variação).
delineamento_de_experimentos-prova4.indd 48
28/05/2014 15:50:14
Delineamento em Blocos Completos Casualizados (DBCC) | 49
d.
Quanto maior a heterogeneidade entre blocos maior a eficiência do delineamento (a perda de heterogeneidade entre blocos indica a falta da necessidade de controle local).
e.
O tratamento aparece uma única vez dentro de cada bloco (razão de ser
denominado completo).
f.
Os experimentos em blocos são feitos, essencialmente, para comparar
tratamentos (os blocos não são construídos para teste estatístico, mas
como necessidade de controle).
g.
Não deve ser feito o teste estatístico de blocos (blocos são utilizados como
fonte de controle da heterogeneidade, sem qualquer interesse de comparação).
h.
Fazer blocos significa impor uma restrição como controle às unidades experimentais (a designação casual dos tratamentos às unidades experimentais dentro de cada bloco).
i.
Exemplos biológicos de blocos: posição na estufa, ninhada, faixa de idade,
faixa de peso, uma partida de animais (lote), entre outros.
3.2 MODELO DO EXPERIMENTO (BIOLÓGICO)
O modelo de DBCC com k tratamentos e t blocos é dado por:
yij = μi + β j + εij (μi = μ + τi ; i = 1,..., k; j = 1,..., t ) ; onde:
m é a média geral comum a todas as observações;
ti é o efeito do i-ésimo nível do fator na variável dependente Y ;
b j é o efeito do j-ésimo bloco experimental;
eij é o erro casual não observável (independente e identicamente distribuí-
do com N (0,s 2 ) ).
Neste sentido, para o modelo de efeitos fixos, tem-se:
a)
E (Yij ) = μ + τi + β j ;
b)
Var (Yij ) = s 2 ;
delineamento_de_experimentos-prova4.indd 49
28/05/2014 15:50:14
50
| DELINEAMENTO DE EXPERIMENTOS
c)
Yij ~ N (μi + τi + β j , σ 2 ) .
3.3 PROCEDIMENTO ESTATÍSTICO: ANÁLISE DE VARIÂNCIA
Todas as considerações realizadas para o DIC são também válidas para o
DBCC (independência dos erros; variâncias homogêneas e normalidade dos
dados).
Considere o seguinte conjunto de pesos de carcaças (kg) de coelhos (Tabela 3.1) no acabamento segundo o tipo de dieta randomizada oferecida aos
animais.
Tabela 3.1
Peso de carcaças (kg) de coelhos segundo dieta
Dieta
Raça
Norfolk
Angorá I
Angorá II
Nova Zelândia I
Nova Zelândia II
Padrão
1,28
1,08
1,06
1,36
1,19
Padrão+Rami
1,45
1,15
1,28
1,50
1,41
Padrão+Alfafa
1,38
1,08
1,17
1,43
1,26
Padovani, C. R. (2002). Exercícios de Estatística Básica e Experimental. Depto. Bioestatística, IB/UNESP, Botucatu-SP, 40p.
Cada peso de carcaça (kg) é uma resposta biológica do sorteio de três dietas dentro dos conjuntos de três animais tornados homogêneos pelas raças,
cujo resultado biológico responde ao modelo:
yij = μ + τi + β j + εij , com i =1,..., k (tratamentos) e j =1,..., t (blocos).
Neste modelo, a técnica da ANOVA consiste em fracionar a SQTotal em
três fontes de variação: a primeira referente aos tratamentos ( SQTrat ), a segunda relativa aos blocos ( SQBloco ) e, por fim, a expressa nas flutuações casuais ( SQRes ).
Para a construção da tabela geral de ANOVA segundo as causas de variação são determinados:
delineamento_de_experimentos-prova4.indd 50
28/05/2014 15:50:18
Delineamento em Blocos Completos Casualizados (DBCC) | 51
a) Graus de liberdade (GL)
Total = n −1 = kt −1 , onde n = kt ;
Tratamento = k −1 ;
Bloco = t −1 ;
Resíduo = (t − 1)(k − 1) .
b) Somas de quadrados (SQ)
k
t
k
t
1 k t
2
SQTot = ∑ ∑ ( yij − y•• ) = ∑ ∑ yij2 − ny••2 ; onde y•• = ∑ ∑ yij ;
n
i=1 j=1
i=1 j=1
i=1 j=1
1 t
y
2
2
y
=
;
onde
∑ yij ;
•
i
SQTrat = ∑ ∑ ( yi• − y•• ) = ∑ − ny •
t j=1
i=1 t
i=1 j=1
k
t
t y2
1 k
2
•j
SQBloc = ∑ ∑( y• j − y•• ) = ∑
− ny••2 ; onde y• j = ∑ yij ;
k i=1
i=1 j=1
j=1 k
k
k
t
2
i•
SQRes = SQTot − SQTrat − SQBloc .
c) Quadrados médios (QM)
QMTrat = SQTrat (k −1)
QMBloco = SQBloco (t −1)
QMRes = SQRes ⎡⎣(k −1)(t −1)⎤⎦
d) Estatística F
F = QMTrat QMRes
As quantidades obtidas são dispostas na Tabela 3.2 da ANOVA.
Tabela 3.2
Tabela geral de ANOVA de um DBCC
Causa de variação
GL
SQ
QM
F
Blocos
t -1
SQBloc
QMBloc
—
Tratamentos
k -1
SQTrat
QMTrat
QMTrat QMRes
(t −1)(k −1)
SQRes
QMRes
tk -1
SQTot
Resíduo
Total
delineamento_de_experimentos-prova4.indd 51
28/05/2014 15:50:22
52
| DELINEAMENTO DE EXPERIMENTOS
O teste de hipótese relativo à Tabela 3.2 consiste em:
H0: Não existe efeito de tratamento  H1:t1=tk=...=0  H0 : m1=...=mk=m
H1 : Existe efeito de tratamento ⇔ H 0 : Existe ti ≠ 0 (i = 1,..., k )
Sob a veracidade de H 0 , a estatística F = QMTrat tem distribuição F
QMRes
(Fisher-Snedecor) com parâmetros (k -1) (graus de liberdade do numerador)
e (t -1)(k -1) (graus de liberdade do denominador).
A regra de decisão é a habitual, ou seja:
Se F ≥ F(a;k−1;(t−1)(k−1)) , rejeita-se H 0 . Caso contrário, não há rejeição.
No exemplo, tem-se:
k = 3 (tratamentos) e t = 5 (blocos);
y•• =19, 08 , logo, y•• = 19, 08 15 = 1, 272 ;
SQTot = 24, 5678 − 24, 2698 = 0, 2980 ;
y1• = 5, 97( y1• = 1,194) ; y2• = 6, 79( y2• = 1, 358) ; y3• = 6, 32( y3• = 1, 264)
SQTrat = 24, 3375 − 24, 2698 = 0, 0677
y•1 = 4,11 ; y•2 = 3, 31 ; y•3 = 3, 51 ; y•4 = 4, 29 ; y•5 = 3, 86 ;
SQBloc = 24, 4907 − 24, 2698 = 0, 2209 ;
SQRes = 0, 2980 − 0, 2209 − 0, 0677 = 0, 0094
A Tabela 3.3 apresenta o resultado da ANOVA.
Tabela 3.3
Tabela ANOVA para o peso das carcaças
Causa Variação
GL
SQ
QM
Blocos
4
0,2209
0,0552
Tratamentos
2
0,0677
0,0339
Resíduo
8
0,0094
0,0012
Total
14
0,2980
F (valor p)
28,25 (p<0,01)
Conclui-se, no nível de 5% de significância, que existem diferenças entre
os pesos médios de carcaças dos coelhos segundo as dietas estudadas.
delineamento_de_experimentos-prova4.indd 52
28/05/2014 15:50:36
Delineamento em Blocos Completos Casualizados (DBCC) | 53
3.4
COMPARAÇÕES MÚLTIPLAS
O procedimento de comparações múltiplas de Tukey para o DBCC consiste nos seguintes passos:
H 0 : μi − μi ’ = 0 e H1 : μi − μi ’ ≠ 0 , para i ¹ i ’ .
Calcula-se a “Honestly Significante Diference”
HSD (a ) = Δ(a ) = q(a ;k ;(t −1)(k−1))
QMRes , onde t é o número de repetição de
t
tratamentos (coincide com o número de blocos) e q(α;k ;ϕ) é o quantil de ordem
(1-a/2) da distribuição “studentized range” com parâmetros k (número de
tratamentos) e j = (t −1)(k −1) (graus de liberdade do resíduo).
A regra de decisão do teste de hipóteses é a habitual, ou seja:
Se yi• − yi ’• ≥ Δ(a ) , rejeita-se H 0 . Caso contrário, não há rejeição.
Similarmente, pode-se apresentar o intervalo de confiança de Tukey
100(1-a)% para a diferença de médias, cujos limites são dados por:
LI = ( yi• − yi •’ )− q(α;k ;ϕ)
QMRes
,
t
LS = ( yi• − yi •’ ) + q(α;k ;ϕ)
QMRes .
t
No exemplo relativo aos dados do peso das carcaças tem-se:
q(0,05;3;8) = 4, 04 ; logo, Δ(5%) = 4, 04 0, 0012 = 0, 063 .
5
Ou seja, o valor mínimo que expressa a diferença significante α=0,05 entre
os pesos médios das carcaças é 0,063kg. Os resultados das comparações estão
expressos na Tabela 3.4.
Tabela 3.4
Média e desvio padrão dos pesos segundo dieta
Dieta Padrão
Padrão Suplementação Rami
Padrão Suplementação Alfafa
1,194(0,128)a
1,358(0,142)c
1,264(0,145)b
delineamento_de_experimentos-prova4.indd 53
28/05/2014 15:50:48
54
| DELINEAMENTO DE EXPERIMENTOS
Conclui-se, no nível de 5% de significância, que as dietas modificam o peso
médio da carcaça dos coelhos e que entre elas, a dieta suplementada com rami
produz maior peso médio.
3.5 EXERCÍCIOS (DBCC)
A seguir são apresentados exercícios sobre o Delineamento em Blocos
Completamente Casualizados contendo planejamento, técnica da análise de
variância, teste de comparações múltiplas e, em especial, o último para aprofundamento das considerações apresentadas no capítulo.
1.
Planeje um experimento para comparar dois testes de QI, usando dez pares
de gêmeos. Considere cada par de gêmeos como um bloco.
2.
Faça a análise de variância dos dados apresentados na tabela a seguir, considerando o nível de 5% de significância:
Dados de um experimento em blocos ao acaso
Bloco
3.
Tratamento
A
B
C
I
74
53
58
II
90
68
78
III
78
54
64
IV
98
72
74
Pretende-se verificar a durabilidade de três marcas de tintas que tem preços
de custo bem diferentes. Para isso, foram selecionados seis muros, em que
cada terça parte foi pintada por uma marca sorteada nos terços. Após um
período de dez meses, foi atribuída a cada parte uma nota, resultante de
vários quesitos. Os resultados das notas são apresentados a seguir:
Marca
Muro 1
Muro 2
Muro 3
Muro 4
Muro 5
Muro 6
A
8,5
8,9
8,8
8,2
8,6
8,9
B
9,1
9,4
9,1
9,6
9,0
9,3
C
7,3
7,6
7,8
7,5
6,1
7,2
delineamento_de_experimentos-prova4.indd 54
28/05/2014 15:50:48
Delineamento em Blocos Completos Casualizados (DBCC) | 55
Com esses dados, você diria (α=0,05) que uma das marcas é melhor que
as outras?
4.
Supondo que haja interesse em calcular F =
QMBloco
em um experiQMRes
mento, qual a interpretação biológica que sugere o resultado significativo
(p<0,05)? E o não significativo (p>0,05)?
3.6 RESPOSTAS DOS EXERCÍCIOS (DBCC)
1.
Considerando 10 pares de gêmeos (G1, G2), para cada par será efetuado o
sorteio dos dois testes de QI. Neste sentido, constituídos os pares por processo randomizado dos testes de QI os dados coletados nos gêmeos serão
submetidos à técnica da análise de variância para o modelo experimental
em blocos completamente casualizados (10 blocos no presente estudo) envolvendo dois tratamentos independentes (dois testes de QI).
2.
Tabela 1.
Tabela ANOVA
C. Variação
Tabela 2.
GL
SQ
QM
Blocos
3
847,58
282,53
-
Tratamentos
2
1144,50
572,25
71,26 (p<0,001)
8,03
Resíduo
6
48,17
Total
11
2040,25
F
Média (desvio padrão) dos tratamentos
A
B
C
85,00 (11,02) b
61,75 (9,67) a
68,50 (9,15) a
DHS (5%)=7,47
delineamento_de_experimentos-prova4.indd 55
28/05/2014 15:50:48
56
| DELINEAMENTO DE EXPERIMENTOS
3.
Tabela 1.
ANOVA para a durabilidade
C. Variação
Tabela 2.
GL
SQ
QM
Blocos (Muro)
5
1,04
0,21
F
-
Tratamentos (Marca)
2
12,64
6,32
45,14 (p<0,001)
Resíduo
10
1,41
0,14
Total
17
15,09
Média (desvio padrão) das marcas
A
B
C
8,65 (0,27) b
9,25 (0,23) c
7,25 (0,60) a
DHS (5%)=0,59
4.
Se o resultado do teste estatístico for significativo (p < 0,05) existe comprovação biológica de heterogeneidade entre os blocos, corroborando com
a suspeita do pesquisador no controle fonte de variação bloqueada. Se o
resultado do teste estatístico for não significativo (p > 0,05) existe comprovação biológica de homogeneidade entre os blocos, contradizendo com a
suspeita do pesquisador no controle fonte de variação bloqueada.
delineamento_de_experimentos-prova4.indd 56
28/05/2014 15:50:49
4
ESQUEMAS FATORIAIS
4.1 INTRODUÇÃO
Existem situações práticas na experimentação em que o interesse do pesquisador envolve o estudo de dois ou mais fatores combinados, cujos cruzamentos dos níveis dos fatores são os tratamentos empenhados nas comparações. No presente texto, será apenas enfocado o caso de dois fatores, ou seja, A
e B. Será admitido que o fator A possui a níveis, e o fator B, b níveis.
Nos experimentos onde cada nível de um fator está combinado com todos os níveis do outro, diz-se que os fatores obedecem a uma classificação
cruzada (experimentos cruzados). As combinações desses fatores resultam os
tratamentos do estudo, cuja configuração recebe o nome de esquema fatorial
a*b (combinações entre os a níveis do fator A e b níveis do fator B).
O esquema de fatores mais simples consiste em considerar dois fatores A
e B, com dois níveis cada um, isto é, o esquema fatorial 2*2. No esquema fatorial dois por dois, Tabela 4.1, tem-se como resultado das combinações quatro
tratamentos, que são combinações de dois níveis do fator A com dois níveis
do fator B.
Tabela 4.1 Esquema fatorial 2*2
Fator A
Fator B
B1
B2
A1
A1 B1
A1 B2
A2
A2 B1
A2B2
Outras combinações dos fatores podem surgir à medida que o número de
níveis dos fatores tornam-se maiores. Ademais, o número de níveis dos fatores
não precisa ter o mesmo valor, ou seja, os níveis a do fator A podem ser nu-
delineamento_de_experimentos-prova4.indd 57
28/05/2014 15:50:49
58
| DELINEAMENTO DE EXPERIMENTOS
mericamente diferente dos níveis b do fator B. Quando a=b, tem-se um arranjo
quadrático e, se a≠b, o arranjo é retangular. Uma notação interessante que se
utiliza quando o número de níveis é igual para os dois fatores (a=b; arranjo
quadrático) e descrita por 22, 32, 42,... O expoente indica o número de fatores
do estudo e a base da potência indica o número de níveis dos fatores. Por exemplo, um fatorial 32 tem dois fatores em três níveis.
Três hipóteses básicas são avaliadas no esquema fatorial a*b, que são: i) a
interação (A*B) entre os fatores A e B; ii) o efeito do fator principal A e iii) o
efeito do fator principal B. Dependendo do resultado do teste de significância
da interação A*B, duas novas hipóteses podem ser avaliadas: i) efeito do fator A
dentro de um nível fixo de B e ii) efeito do fator B dentro de um nível fixo de A.
Como o esquema fatorial é um arranjo dos níveis dos fatores (combinações de níveis) ele pode ser delineado em vários tipos de experimentos. No
enfoque do texto, o esquema fatorial a*b será apresentado no Delineamento
Inteiramente Casualizado (DIC) e no Delineamento em Blocos Completos Casualizados (DBCC).
4.2 ESQUEMA FATORIAL A*B NO DIC
Considere a Tabela 4.2, genérica de observações yijk de um esquema fatorial a*b em um DIC com r repetições por tratamento.
delineamento_de_experimentos-prova4.indd 58
28/05/2014 15:50:49
Esquemas Fatoriais | 59
Tabela 4.2
Esquema fatorial a*b com r repetições
Fator A
Fator B
B1

Bb
A1
y111

y11r

y1b1

y1br




Aa
ya11

ya1r

yab1

yabr
O elemento yijk representa a k-ésima repetição do i-ésimo nível do fator A
e j-ésimo nível do fator B ( i = 1,, a; j = 1,, b; k = 1,, r ).
O modelo de resposta é expresso por:
yijk = μ + θi + γ j + (θγ )ij + εijk ;
onde:
m: efeito médio comum;
qi : efeito do i-ésimo nível de A;
g j : efeito do j-ésimo nível de B;
(θγ )ij : efeito de interação entre os níveis i e j dos fatores A e B, respectiva-
mente;
eijk : erro casual independente, com distribuição N (0,s 2 ) .
Considerando os fatores A e B de efeitos fixos, tem-se a Tabela 4.3 da
ANOVA.
delineamento_de_experimentos-prova4.indd 59
28/05/2014 15:50:50
60
| DELINEAMENTO DE EXPERIMENTOS
Tabela 4.3 Tabela geral de ANOVA para um esquema fatorial a*b no DIC
Causa de variação
GL
SQ
QM
F
ab-1
SQTrat
QMTrat
FTrat
a -1
SQA
QMA
FA
b-1
SQB
QMB
FB
(a −1)(b −1)
SQA´ B
QMA´ B
FA´B
ab(r −1)
SQRes
QMRes
abr -1
SQTot
Tratamentos
B
AxB
Resíduo
Total
Desmembramento
da
SQTratamentos
Os cálculos das somas de quadrados são estabelecidos por:
a
b
r
2
2
SQTot = ∑ ∑ ∑ yijk
− ny•••
, onde y••• =
i=1 j=1 k =1
2
a
b
ij•
SQTrat = ∑ ∑
i=1 j=1
y
r
1 a b r
∑ ∑ ∑ yijk e n = abr ;
n i=1 j=1 k=1
r
2
− ny•••
, onde yij• = ∑ yijk ;
k =1
SQRes = SQTot − SQTrat
b
r
yi2••
2
− ny•••
, onde yi•• = ∑ ∑ yijk ;
j=1 k =1
i=1 br
a
r
b y2
• j•
2
y• j• = ∑ ∑ yijk ;
SQB = ∑
− ny•••
i=1 k =1
j=1 ar
a
SQA = ∑
SQAxB = SQTrat − SQA − SQB
A obtenção dos quadrados médios é realizada pela divisão entre a soma de
quadrados e os respectivos graus de liberdade.
Em relação aos testes de hipóteses, que serão apresentados a seguir, duas
situações interessantes para a discussão biológica devem ser consideradas: a
primeira consiste no caso onde os efeitos dos fatores A e B na variável resposta
(dependente) serão aditivos e, portanto, toda a informação biológica pode ser
obtida fazendo-se inferências apenas sobre as médias mi· e m·j· (médias marginais); a segunda, onde existe efeito da interação entre os fatores A e B; onde para
delineamento_de_experimentos-prova4.indd 60
28/05/2014 15:50:57
Esquemas Fatoriais | 61
avaliar os efeitos existentes na variável dependente, as inferências devem ser
feitas sobre todos os mij.
As hipóteses gerais com os respectivos testes estatísticos acompanhados
das regras de decisão são estabelecidas conforme detalhes na sequência.
H 0A : Não existe efeito do fator A ⇔ θ1 = θ2 = … = θa = 0
H 0A a estatística do teste é dada por
QMA
FA =
~F
j = ab(r −1) .
QMRes (a− 1,ϕres ) , com a regra de decisão habitual e res
H 0B : Não existe efeito do fator B ⇔ g1 = g2 =  = gb = 0
Sob a veracidade de H 0 a estatística do teste é dada por
B
QMB
FB =
~F
, com a regra de decisão habitual.
QMRes (b− 1,ϕres )
H 0AxB : Não existe efeito de interação AxB ⇔ (θγ )11 =  = (θγ )ab = 0
Sob a veracidade de H 0
AxB
a estatística do teste é dada por
QMA×B
FAxB =
~ F((a− 1)(b− 1);ϕres ) , com a regra de decisão habitual.
QMRes
Toda vez que o resultado de algum teste de hipóteses possibilitar a rejeição
da hipótese nula, para melhorar a qualidade da informação biológica, torna-se
interessante complementar a técnica da ANOVA com algum procedimento de
comparações múltiplas para as médias. No caso, como já vem sendo rotina, a
continuidade tem sido realizada pelo teste de Tukey para os contrastes entre
todos os pares de médias. Neste sentido, duas considerações serão apresentadas; a primeira normalmente utilizada quando o resultado do teste de interação entre os fatores A e B mostrou-se não significante; a segunda, quando o
resultado foi significante.
Teste de Tukey para o caso FAxB não significante ( pAxB > a )
H 0A : μi• = μi ’• (i, i ’ = 1,..., a ) ⇔ não existe diferença entre as respostas médias
dos níveis i e i’ do fator A.
Calcula-se DMSA (α) = ΔA (α) = q(α ;a ;ϕ
res
)
QMRes
e se yi•• − yi ’•• ≥ ΔA (a ) ,
br
rejeita-se a hipótese H 0 . Caso contrário, não há rejeição.
A
delineamento_de_experimentos-prova4.indd 61
28/05/2014 15:51:11
62
| DELINEAMENTO DE EXPERIMENTOS
H 0B : μ•j = μ•j ’ ( j, j ’ = 1,..., b) ⇔ não existe diferença entre as respostas médias
dos níveis j e j’ do fator B.
Calcula-se DMSB (α ) = Δ B (α) = q(α ;b;ϕ
res
QMRes
e se y• j• − y• j ’• ≥ ΔB (a ) ,
ar
)
rejeita-se a hipótese H 0 . Caso contrário, não há rejeição.
B
Teste de Tukey para o caso FAxB significante ( pAxB < a )
H 0A/B j : μij = μi ’ j (i, i ’ = 1,..., a e j fixo) ⇔ não existe diferença entre as respos-
tas médias dos níveis i e i’ do fator A dentro do j-ésimo nível do fator B.
Calcula-se DMSA/ B (α) = ΔA/ B (α ) = q(α ;a ;μ
res
rejeita-se H 0
A/ B j
)
QMRes
e se yij• − yi ’ j• ≥ ΔA/ B (a ) ,
r
. Caso contrário, não há rejeição.
H 0B/Ai : μij = μij ’ ( j, j ’ = 1,..., b e i fixo) ⇔ não existe diferença entre as respos-
tas médias dos níveis j e j’ do fator B dentro do i-ésimo nível do fator A.
Calcula-se DMSB/ A ( α) = Δ B/ A (α ) = q(α;b;μ
res
rejeita-se H 0
B / Ai
)
QMRes
e se yij• − yij ’• ≥ ΔB/ A (a ) ,
r
. Caso contrário, não há rejeição.
4.3 EXEMPLO DE FATORIAL A*B NO DIC
Considere o seguinte conjunto de dados de um esquema fatorial 2x2 em
um delineamento inteiramente casualizado para avaliar o perfil cardiovascular
de ratos hipertensos submetidos a uma dieta hipercalórica (OLIVEIRA Jr, et
al., 2007, Arquivos Brasileiros de Cardiologia, v.89, Supl I, p.927).
Os dois fatores de interesse do estudo são Dieta e Hipertensão, tendo como
variável resposta escolhida para o desenvolvimento do exemplo a Pressão Arterial Sistólica.
Fator A(Dieta): A1(Normocalórica) e A2(Hipercalórica);
Fator B(Hipertensão): B1(WKY-Controle) e B2(SHR-Hipertenso);
Isto é:
delineamento_de_experimentos-prova4.indd 62
28/05/2014 15:51:15
Esquemas Fatoriais | 63
Hipertensão
Dieta
Ausente(WKY)
Presente(SHR)
Normocalórica(C)
WKYC(A1B1)
SHRC(A1B2)
Hipercalórica(OB)
WKYOB(A2B1)
SHROB(A2B2)
Pressão arterial sistólica (mm Hg) dos ratos
WKYC
WKYOB
SHRC
SHROB
130
120
160
210
120
130
158
205
110
125
162
206
112
140
152
215
128
135
168
214
y11• = 120, 00 ± 9, 06
y12• = 160, 00 ± 5, 83
y21• = 130, 00 ± 7, 91
y22• = 210, 00 ± 4, 53
Quadro auxiliar para o cálculo das SQ
B(Hipertensão)
A
(Dieta)
B1 (WKY)
B2 (SHR)
Total
(Fator A)
A1 (C)
600
800
1400
A2 (OB)
650
1050
1700
Total
(Fator B)
1250
1850
3100
a = 2 ; b = 2 ; r = 5 ; n = 20
y••• = 155, 00
A seguir são calculadas as somas de quadrados para construção da tabela
de ANOVA para o esquma fatorial no DIC.
SQTot = 1302 +  + 2142 − 20×155, 002 = 505796, 00 − 480500, 00 = 25296, 00
2
SQTrat =
2
600
8002 650 10502
+
+
+
− 20×155, 002 = 505000, 00 − 480500, 00 = 24500, 00
5
5
5
5
SQRes = 25296, 00 − 24500, 00 = 796, 00
2
2
1400 1700
+
− 20×155, 002 = 485000, 00 − 480500, 00 = 4500,000
2×5
2×5
2
2
1250 1850
SQB =
+
− 20×155, 002 = 498500, 00 − 480500, 00 = 18000, 00
2×5
2×5
SQAxB = SQTrat − SQA − SQB = 2000, 00
SQA =
A Tabela 4.4 mostra o resultado da ANOVA.
delineamento_de_experimentos-prova4.indd 63
28/05/2014 15:51:22
64
| DELINEAMENTO DE EXPERIMENTOS
Tabela 4.4
ANOVA para a PAS (mm Hg) dos ratos
Causa de Variação
GL
SQ
QM
F
Tratamento
3
24500,00
8166,67
164,15 (p<0,01)
A (Dieta)
1
4500,00
4500,00
90,45 (P<0,01)
B (Hipertensão)
1
18000,00
18000,00
361,81 (p<0,01)
AxB
1
2000,00
2000,00
40,20 (p<0,01)
Resíduo
16
796,00
49,75
Total
19
25296,00
Como o resultado do teste de interação entre os fatores A e B foi significante (p<0,01), o procedimento de comparações múltiplas será efetuado considerando o estudo do fator A fixado o nível de B e, vice-versa.
DMSA/ B j (1%) = Δ A/ B j (1%) = q(1%;2;16)
QMRes
49, 75
= 4,13
= 13, 03 mm Hg
5
5
DMSB / Ai (1%) = ΔB / Ai (1%) = q(1%;2;16)
QMRes
49, 75
= 4,13
= 13, 03 mm Hg
5
5
das médias e os desvios padrão da hipertensão segundo dieta com as significâncias das comparações múltiplas (Teste de Tukey).
Tabela 4.5 Média e desvio padrão da PAS (mm Hg) segundo dieta e hipertensão
Dieta
Hipertensão
Ausente
Presente
Normocalórica
120,00(9,06) a(1)A(2)
160,00(5,83) a B
Hipercalórica
130,00(7,91) a A
210,00(4,53) b B
(1) duas médias seguidas de uma mesma letra minúscula não diferem (p>0,01) quanto às respectivas dietas dentro da classe
de hipertensão.
(2) duas médias seguidas de uma mesma letra maiúscula não diferem (p>0,01) quanto às classes de hipertensão dentro da
dieta em consideração.
delineamento_de_experimentos-prova4.indd 64
28/05/2014 15:51:27
Esquemas Fatoriais |
65
4.4 ESQUEMA FATORIAL A*B NO DBCC
Considere a observação yijk de um esquema com dois fatores A (com a
níveis) e B(com b níveis) com os tratamentos casualizados em t blocos completos (fator fixo de controle).
O modelo de resposta é expresso por:
yijk = μ + θi + γ j + (θγ )ij + βk + εijk ;
onde:
m: efeito médio comum;
qi : efeito do i-ésimo nível de A ( i =1,, a );
g j : efeito do j-ésimo nível de B ( j =1,, b );
(θγ )ij : efeito de interação entre os níveis i e j dos fatores A e B, respectiva-
mente;
bk : efeito do k-ésimo nível de bloco ( k =1,, t );
eijk : erro casual independente, com distribuição N (0,s 2 ) .
A disposição geral das observações pode ser feita conforme Tabela 4.6 a
seguir.
Tabela 4.6
Quadro genérico de um experimento em DBCC
Bloco
Tratamento
A1B1
…
A1Bb
…
AaB1
…
AaBb
Bloco 1
Y111
…
y1b1
…
ya11
…
yab1
Bloco 2
Y112
…
y1b2
…
ya12
…
yab2
Y11t
…
y1bt
…
ya1t
…
yabt

Bloco t

Como anteriormente (DIC), considerando os fatores A e B fixos tem-se, a
seguir, na Tabela 4.7 ANOVA para o esquema fatorial a*b no DBCC.
delineamento_de_experimentos-prova4.indd 65
28/05/2014 15:51:28
66
| DELINEAMENTO DE EXPERIMENTOS
Tabela 4.7
Tabela geral de ANOVA para um esquema fatorial a*b em DBCC
Causa de
Variação
GL
SQ
QM
F
t -1
SQBloc
QMBloc
-
ab-1
SQTrat
QMTrat
FTrat
a -1
SQA
QMA
FA
b-1
SQB
QMB
FB
(a −1)(b −1)
SQA´ B
QMA´ B
FA´B
(ab −1)(t −1)
SQRes
QMRes
abt -1
SQTot
Blocos
Tratamentos
B
Resíduo
Os cálculos das somas de quadrados são estabelecidos por:
a
b
t
a
b
t
1
2
2
SQTot = ∑ ∑ ∑ yijk
− ny•••
, onde y••• = ∑ ∑ ∑ yijk e n = abt ;
n i=1 j=1 k=1
i=1 j=1 k =1
a
b
SQTrat = ∑ ∑
i=1 j=1
2
t
••k
SQBloc = ∑
k =1
yij2•
t
t
2 , onde y ij• = ∑ yijk ;
− ny•••
k =1
a
b
y••k = ∑ ∑ yijk ;
y
2
− ny•••
ab
i=1 j=1
SQRes = SQTot − SQTrat − SQBloc
a
SQA = ∑
i=1
b
y•2 j•
j=1
at
SQB = ∑
b
t
a
t
yi2••
2
, onde yi•• = ∑ ∑ yijk ;
− ny•••
j=1 k =1
bt
2
− ny•••
y• j• = ∑ ∑ yijk ;
i=1 k =1
SQAxB = SQTrat − SQA − SQB
A obtenção dos quadrados médios é realizada pela divisão entre as somas
de quadrados e os respectivos graus de liberdade.
As ponderações sobre os testes de hipóteses são as mesmas realizadas no
DIC, cujas hipóteses gerais são estabelecidas por:
H 0A : Não existe efeito do fator A ⇔ q1 = q2 =  = qa = 0
delineamento_de_experimentos-prova4.indd 66
28/05/2014 15:51:34
Esquemas Fatoriais | 67
Sob a veracidade de H 0 a estatística do teste é dada por
A
QMA
FA =
~F
, com a regra de decisão habitual (rejeita-se H 0A quanQMRes (a− 1;ϕres )
do FA > F(α ;a− 1;ϕres ) )) e jres = (ab −1)(t −1) .
H 0B : Não existe efeito do fator B ⇔ g1 = g2 =  = gb = 0
Sob a veracidade de H 0 a estatística do teste é dada por
B
QMB
~F
, com a regra de decisão habitual.
QMRes (b− 1,ϕres )
H 0AxB : Não existe efeito de interação AxB ⇔ (θγ ) =  = (θγ ) = 0
11
ab
FB =
Sob a veracidade de H 0
AxB
a estatística do teste é dada por
QMAxB
FAxB =
~ F((a− 1)(b− 1);ϕres ), com a regra de decisão habitual.
QMRes
À semelhança do DIC, têm-se os dois casos para o teste de comparações
múltiplas de Tukey.
Teste de Tukey para o caso FAxB não significante ( pAxB > a )
H 0A : μi• = μi •’ (i, i ’ = 1,..., a ) ⇔ não existe diferença entre as respostas médias
dos níveis i e i’ do fator A.
Calcula-se DMSA (α) = ΔA (α ) = q(α;a ;ϕ
res
QMRes
e se yi•• − yi ’•• ≥ ΔA (a ) ,
bt
)
rejeita-se a hipótese H 0 . Caso contrário, não há rejeição.
A
H 0B : μ•j = μ•j’ ( j, j ’ = 1,..., b) ⇔ não existe diferença entre as respostas médias
dos níveis j e j’ do fator B.
Calcula-se DMSB (α) = ΔB (α ) = q(α ;b;ϕ
res
QMRes
e se y• j• − y• j ’• ≥ ΔB (a ) ,
at
)
rejeita-se H 0 . Caso contrário, não há rejeição.
B
Teste de Tukey para o caso FAxB significante ( pAxB < a )
H 0A/B j : μij = μi ’ j (i, i ’ = 1,..., a e j fixo) ⇔ não existe diferença entre as respos-
tas médias dos níveis i e i’ do fator A dentro do j-ésimo nível do fator B.
Calcula-se DMSA/ B (α ) = Δ A/ B (α ) = q(α ;a ;ϕ
res
)
QMRes
e se yij• − yi ’ j• ≥ ΔA/ B (a ) ,
t
rejeita-se H 0 . Caso contrário, não há rejeição.
A/ B j
delineamento_de_experimentos-prova4.indd 67
28/05/2014 15:51:52
68
| DELINEAMENTO DE EXPERIMENTOS
H 0B/Ai : μij = μij ’ ( j, j ’ = 1,..., b e i fixo) ⇔ não existe diferença entre as respos-
tas médias dos níveis j e j’ do fator B dentro do i-ésimo nível do fator A.
Calcula-se DMS B /A(α ) = Δ B /A(α ) = q(α ;b;ϕ
res
rejeita-se H 0
B / Ai
QMRes
e se yij• − yij ’• ≥ ΔB/ A (a ) ,
t
)
. Caso contrário, não há rejeição.
4.5 EXEMPLO DE FATORIAL A*B NO DBCC
Considere o seguinte conjunto de dados de um esquema fatorial 2x2 em
um delineamento em blocos completos casualizados para avaliar o efeito da
inibição prolongada de enzima de conversão da angiotensina sobre o diâmetro
diastólico do ventrículo esquerdo (DDVE), avaliado em mm, em ratos com sobrecarga pressórica persistente (Bregagnollo et al.,2005, Arquivos Brasileiros
de Cardiologia, v.84, n.3, p.225-232). Os fatores A e B são droga (Lisinopril) e
momento de sacrifício, respectivamente:
Fator A (Droga): A1(bandagem aórtica (EA0)-não tratados) e A2(bandagem
aórtica (EA0)-tratados com lisinopril);
Fator B (Momento Sacrifício): B1(6ª semana) e B2(21ª semana).
Foram estabelecidos seis blocos correspondentes às faixas de peso do animal: Bloco1(70‒|75g), Bloco2(75‒|80g), Bloco3(80‒|85g), Bloco4(85‒|90g),
Bloco5(90‒|95g) e Bloco6(95‒|100g).
O esquema de fatores pode ser apresentado como a seguir:
Droga
Momento Sacrifício
6ª Semana (B1)
21ª Semana (B2)
Ausente (Não tratado) (A1)
A1B1
A1B2
Presente (Lisinopril) (A2)
A2B1
A2B2
delineamento_de_experimentos-prova4.indd 68
28/05/2014 15:52:07
Esquemas Fatoriais | 69
Diâmetro Diastólico do Ventrículo Esquerdo (mm)
Faixa de peso
Tratamento
A1B1
A1B2
A2B1
A2B2
70 –| 75g
7,8
9,8
8,0
8,6
75 –| 80g
7,2
10,0
7,6
8,8
80 –| 85g
8,4
9,9
8,3
8,5
85 –| 90g
7,8
10,8
7,5
8,4
90 –| 95g
8,0
9,6
8,6
8,9
95 –| 100g
7,6
8,7
8,0
7,8
Média (DP)
7,8(0,40)
9,80(0,68)
8,00(0,42)
8,50(0,39)
Quadro auxiliar para o cálculo das SQ
A
(Droga)
Total
(Fator A)
B (Sacrifício)
B1
B2
A1
46,8
58,8
105,6
A2
48,0
51,0
99,0
Total
(Fator B)
94,8
109,8
204,6
a = 2 ; b = 2 ; r = 6 ; n = 24
y••• = 8, 525
Na sequência são obtidos as somas de quadrados para a construção da
ANOVA para o esquema fatorial no DBCC.
SQTot = 7, 82 +  + 7, 82 − 24×8, 5252 = 1763, 5 −1744, 215 = 19, 285
2
SQTrat =
2
46, 8
58, 82 48, 0
51, 02
+
+
+
− 24×8, 5252 = 1758, 78 −1744,2215 = 14, 565
6
6
6
6
2
2
SQA =
105, 6
99, 0
+
− 24×8, 5252 = 1746, 03 −1744, 215 = 1, 815
2×6
2×6
SQB =
94, 8 109, 8
+
− 24×8, 5252 = 1753, 59 −1744, 215 = 9, 375
2×6
2×6
2
2
SQAxB = 14, 565 −1, 815 − 9, 375 = 3, 375
y••1 = 7, 8 + 9, 8 + 8, 0 + 8, 6 = 34, 2
y••2 = 7, 2 + 10, 0 + 7, 6 + 8, 8 = 33, 6
y••3 = 8, 4 + 9, 9 + 8, 3 + 8, 5 = 35,1
y••4 = 7, 8 + 10, 8 + 7, 5 + 8, 4 = 34, 5
delineamento_de_experimentos-prova4.indd 69
28/05/2014 15:52:09
70
| DELINEAMENTO DE EXPERIMENTOS
y••5 = 8, 0 + 9, 6 + 8, 6 + 8, 9 = 35,1
y••6 = 7, 6 + 8, 7 + 8, 0 + 7, 8 = 32,1
2
2
34, 2
33, 6
32,12
SQBloc =
+
++
− 24×8, 5252 = 1745, 82 −1744, 215 = 1, 605
2×2
2×2
2×2
SQRes = 19, 285 −1, 605 −14, 565 = 3,115
Tabela 4.5
ANOVA para o DDVE
Causa de Variação
GL
SQ
QM
Blocos
5
1,605
0,321
F
-
Tratamentos
3
14,565
4,855
23,34 (p<0,01)
A (Droga)
1
1,815
1,815
8,73 (P<0,01)
B (Sacrifício)
1
9,375
9,375
45,07 (p<0,01)
AxB
1
3,375
3,375
16,23 (p<0,01)
Resíduo
15
3,115
0,208
Total
23
19,285
O resultado do teste de interação entre os fatores A e B mostrou-se significante (p<0,01), logo, o teste de Tukey deve ser feito no desmembramento da
interação.
Considere α=0,05, então tem-se:
DMSA/ B j (5%) = Δ A/ B j (5%) = q(5%;2;15)
QMRes
0, 208
= 3, 01
= 0, 56 mm
6
6
DMSB / Ai (5%) = ΔB / Ai (5%) = q(5%;2;15)
QMRes
0, 208
= 3, 01
= 0, 56 mm
6
6
Tabela 5.6
sacrifício
Média e desvio padrão do DDVE (mm) segundo droga e momento de
Droga (Grupo)
Momento de Sacrifício
6ª Semana
21ª Semana
Ausente (Controle)
7,80(0,40) a(1)A(2)
9,80(0,68) b B
Presente (Lisinopril)
8,00(0,42) a A
8,50(0,39) a A
(1) duas médias seguidas de uma mesma letra minúscula não diferem (p>0,05) quanto aos respectivos grupos, fixada a
semana de sacrifício.
(2) duas médias seguidas de uma mesma letra maiúscula não diferem (p>0,05) quanto aos respectivos momentos de sacrifício, dentro do grupo.
delineamento_de_experimentos-prova4.indd 70
28/05/2014 15:52:16
Esquemas Fatoriais | 71
4.6 EXERCÍCIOS (ESQUEMAS FATORIAIS: DIC E DBCC)
1.
O consumo diário de ração em kg/dia, no período de crescimento-acabamento de suínos foi observado em um esquema envolvendo tipos de
ração e formas de arraçoamento em um delineamento em blocos completos ao acaso. Considerando α=0,05 estudar o consumo médio diário em
função dos dois fatores.
Ração
Arraçoamento
Farelada
Farelada
2.
Bloco
A
B
C
D
E
Livre (Vontade)
2,63
2,68
2,74
2,84
2,76
Controlada
2,45
2,36
2,44
2,50
2,40
Granulada
Livre (Vontade)
2,32
2,25
2,16
2,24
2,38
Granulada
Controlada
2,44
2,50
2,42
2,55
2,54
Um experimento visando verificar o efeito do inseticida e do meio de cultura em organismos biológicos foi planejado utilizando-se drosófilas e observando a longevidade (dias de sobrevida) destas moscas. Os tratamentos
utilizados foram os seguintes:
A1B1: atrazine e carência de glicose;
A1B2: atrazine e carência de hidrato de carbono;
A2B1: dalapon e carência de glicose;
A2B2: dalapon e carência de hidrato de carbono.
Tratamento
Repetição
A1B1
49
50
51
54
A1B2
36
37
35
32
A2B1
38
31
35
37
A2B2
34
30
28
25
Considerando o nível de significância 5% e os dados sob a transformação
raiz quadrada, avaliar a sobrevida média das moscas segundo os tipos de
inseticida e meios de cultura.
delineamento_de_experimentos-prova4.indd 71
28/05/2014 15:52:20
72
| DELINEAMENTO DE EXPERIMENTOS
3.
Organize os tratamentos de um esquema fatorial para estudar a interação
de uma droga administrada em três condutas diferentes (manhã, tarde,
noite) com bebida alcoólica.
4.
Verificar se existe interação significante (p<0,05) entre os fatores A e B
estudados em um delineamento em blocos completos casualizados cujos
dados são apresentados a seguir.
Fator A
Fator B
A1
Bloco
I
II
III
IV
B1
16
17
19
12
A1
B2
24
23
27
22
A2
B1
22
21
23
22
A2
B2
33
35
35
32
4.7 RESPOSTAS DOS EXERCÍCIOS (ESQUEMAS FATORIAIS : DIC E DBCC)
1.
Tabela 1.
ANOVA para o consumo de ração
C. Variação
Tabela 2.
mento
GL
SQ
QM
F
Blocos
4
0,030
0,008
-
Tratamentos
3
0,546
0,182
45,50 (p<0,001)
Ração ( R )
1
0,200
0,200
50,00 (p<0,001)
Arraçoamento ( A )
1
0,008
0,008
2,00 (p>0,05)
R´ A
1
0,338
0,338
84,50 (p<0,001)
Resíduo
12
0,048
0,004
Total
19
0,624
Média (desvio padrão) do consumo de ração segundo ração e arraçoa-
Ração
Arraçoamento
Livre
Controlada
Farelada
2,730 (0,080) b B
2,430 (0,053) a A
Granulada
2,270 (0,084) a A
2,490 (0,058) a B
DHS (Ração/Arraçoamento) = 0,087 (letras minúsculas)
DHS (Arraçoamento/Ração) = 0,087 (letras maiúsculas)
delineamento_de_experimentos-prova4.indd 72
28/05/2014 15:52:21
Esquemas Fatoriais | 73
Tabela 1.
ANOVA para os dias de sobrevida (*)
C. Variação
GL
SQ
QM
F
Tratamento
3
6,539
2,180
35,21 (p<0,001)
Inseticida ( I )
1
2,967
2,967
47,86 (p<0,001)
Meio ( M )
1
3,089
3,089
49,82 (p<0,001)
I ´M
1
0,483
0,483
7,79 (p<0,05)
Resíduo
12
0,743
0,062
Total
15
7,282
(*) Variável sob a transformação raiz quadrada
Tabela 2. Média (desvio padrão) da raiz quadrada da sobrevida segundo inseticida e
meio de cultura
Meio de cultura (carência)
Inseticida
Glicose
Hidrato de Carbono
Atrazine
7,140 (0,150) b B
5,914 (0,184) b A
Dalapon
5,933 (0,264) a B
5,400 (0,348) a A
DHS (Inseticida/Meio) = 0,384 (letras minúsculas)
DHS (Meio/Inseticida) = 0,384 (letras maiúsculas)
2.
Fator A (Bebida Alcoólica): A1 (Ausente) e A2(Presente)
Fator B (Período de Administração): B1(Manhã), B2(Tarde) e B3(Noite)
Tratamentos: A1B1(Bebida Ausente e Período Manhã)
A1B2(Bebida Ausente e Período Tarde)
A1B3(Bebida Ausente e Período Noite)
A2B1(Bebida Presente e Período Manhã)
A2B2(Bebida Presente e Período Tarde)
A2B3(Bebida Presente e Período Noite)
3.
Tabela 1.
ANOVA para a variável estudada
C. Variação
GL
SQ
QM
Blocos
3
32,19
10,73
F
-
Tratamento
3
652,19
217,40
118,15 (p<0,001)
A
1
248,07
248,07
134,82 (p<0,001)
B
1
390,07
390,07
212,00 (p<0,001)
7,64 (p<0,05)
A´ B
1
14,05
14,05
Resíduo
9
16,56
1,84
Total
15
700,94
delineamento_de_experimentos-prova4.indd 73
28/05/2014 15:52:22
74
| DELINEAMENTO DE EXPERIMENTOS
FINT = 7, 64( p < 0, 05) ; ou seja, o resultado do teste da interação dos fatores
A e B é significante, indicando que há necessidade de estudo conjunto
dos fatores para a discussão dos resultados.
delineamento_de_experimentos-prova4.indd 74
28/05/2014 15:52:25
5
ANÁLISE DE ADERÊNCIA E ASSOCIAÇÃO
5.1 INTRODUÇÃO
Considere o estudo de variáveis aleatórias (que podem ser qualitativas ou
quantitativas) cujos elementos da amostra podem ser classificados em categorias, ou intervalos, ou ainda atributos. Em particular, o estudo será aprofundado em tabelas de dupla entrada em que se apresenta a situação geral, em que
duas variáveis aleatórias qualitativas X e Y foram classificadas em c categorias
para X e s categorias para Y.
5.2 TESTE DE ADERÊNCIA
Considere que se tem uma população π e que o objetivo proposto consiste em verificar se ela segue uma distribuição especificada π0, ou seja, testar a
hipótese H 0 : p = p0 . Nesta situação, o teste estatístico comparará o número de
casos ocorridos (frequências observadas) em categorias especificadas, com o
número esperado (frequências esperadas) de casos sob a veracidade da hipótese nula H 0 .
O procedimento consiste em considerar classes, segundo as quais a variável X, característica em estudo da população, pode ser classificada (a variável X
pode ser qualitativa ou quantitativa).
A situação geral com c categorias pode ser apresentada conforme Tabela 5.1.
delineamento_de_experimentos-prova4.indd 75
28/05/2014 15:52:26
76
| DELINEAMENTO DE EXPERIMENTOS
Tabela 5.1
Distribuição do número de casos segundo classe de X
Classe de X
Número de casos
Classe 1
n1 ( fo1 )
Classe 2
n2 ( fo2 )

Classe c
nc ( foc )
Total
n( foi)
Lembrar que:
n1 + n2 + ... + nc = n , ou seja,
fo1 + fo2 + ... + foc = foi (total de casos). O número de casos (ocorrências) da classe i, designado por ni , será nomindo
de frequência observada na classe i e indicado por foi , com i =1,..., c .
As hipóteses são apresentadas como:
H 0 : p1 = p01 ; p2 = p02 ;pc = p0c ; H1 : Existe pi ¹ p0i para algum i .
As frequências esperadas ((fei) do modelo multinomial (cc classes) são obtidas sob a veracidade de H0, especificadas na expressão: fei = np0 ; onde n é
i
o número total de casos e p0 a proporção teórica da classe i expressa em H 0 .
i
A estatística do teste, sob veracidade de
c
c2 = ∑
i=1
( foi − fei )
2
fei
H0 ,
é dada por
~ c(2c−1) , com a regra de decisão habitual (isto é, χ2 ≥ χ(2α ;c−1), re-
jeita-se H 0 . Caso contrário, não há rejeição). Deve ser considerado a unilateralidade direita do teste, pois quanto maiores os afastamentos entre as frequências observadas e esperadas mais expressiva torna-se a falta de aderência dos
dados ao modelo proposto e, em consequência, mais provável a veracidade de
H1 em favor da rejeição de H 0 .
O emprego apropriado do teste recomenda sua utilização somente quando
não existir mais de 20% das caselas com frequências esperadas menores que 5.
A prática biológica permite a junção de classes adjacentes para contornar essa
situação sempre que possível.
Na sequência serão apresentados dois exemplos para o estudo da aderência.
delineamento_de_experimentos-prova4.indd 76
28/05/2014 15:52:27
Análise de Aderência e Associação | 77
Exemplos
1.
Um modelo genético especifica que animais de certa população devem
estar classificados em quatro categorias, nas proporções 8:1:1:2. Numa
amostra de 180 animais da população encontra-se 116, 15, 20 e 29 animais
de cada categoria, respectivamente. Verificar, no nível de significância 5%,
se os dados estão de acordo com o modelo genético especificado.
Categoria
Frequência
Observada
C1
116
C2
15
C3
20
C4
29
Total
180
H 0 : Modelo Especificado 8:1:1:2
8
1
1
2
p01 = ; p02 = ; p03 = ; p04 =
12
12
12
12
H1 : Existe pi ¹ p0i , para pelo menos um i(i =1, 2, 3, 4)
Frequências Esperadas
8
= 120 animais ,
12
1
Categoria 2 → fe2 = 180× = 15 animais ,
12
1
Categoria 3 → fe3 = 180× = 15 animais ,
12
2
Categoria 4 → fe4 = 180× = 30 animais .
12
Categoria 1 → fei = 180×
Logo, tem-se
(116 −120)
2
c2 =
120
(15 −15)
2
+
15
(20 −15)
2
+
15
(29 − 30)
2
+
30
= 0,133 + 0,0000 + 1, 667 + 0, 033 = 1, 833
α = 0, 05⎫⎪⎪ 2
= 7, 81 ∴ χ2 = 1, 833( p > 0, 05)
⎬χ
c = 4 ⎪⎪⎭ (0,05;3)
Não há rejeição de H 0 no nível de 5% de significância. Ou seja, a amostra
de animais está em acordo com modelo genético especificado.
2.
Considerando-se uma amostra de 100 descendentes de uma população,
verificar (nível de 5% de significância) a adequabilidade dos dados ao
modelo genético – Equilíbrio Hardy-Weinberg.
delineamento_de_experimentos-prova4.indd 77
28/05/2014 15:52:39
78
| DELINEAMENTO DE EXPERIMENTOS
H0: Equilíbrio Hardy-Weinberg (Eq HW)
Genótipo
Frequência
Observada
AA
26
Aa
35
Aa
Aa
AA
Aa
aa
¼
½
¼
aa
39
Total
100
1
1
1
π01 = ; π02 = ; π03 =
4
2
4
: Não há Eq HW na descendência
1
Frequência Esperada
Genótipo AA → fe1 = 100× 1 = 25
Genótipo Aa →
Genótipo aa →
4
1
fe2 = 100× = 50
2
1
fe3 = 100× = 25
4
Logo, tem-se
(26 − 25)
2
c2 =
(35 − 50)
2
+
(39 − 25)
2
+
= 0, 04 + 4, 50 + 7, 84 = 12, 38
25
50
25
α = 0, 05⎪⎫⎪ 2
= 5, 99 ∴ χ2 = 12, 38( p < 0, 05)
⎬χ
c = 3 ⎪⎪⎭ (0,05;2)
Para α=0,05, há rejeição de H0, ou seja, a população não segue o equilíbrio
Hardy-Weinberg.
5.3 TESTE DE HOMOGENEIDADE
Considere m populações π1, π2,..., πm distribuídas em c categorias mutuamente exclusivas. Objetiva-se verificar se as m populações
(π1,...,πm) podem ser representadas por uma distribuição comum a todas
(H 0 : p1 = p2 =  = pm ) contra a alternativa em que pelo menos duas são distintas (H1 : Existe pi ≠ pi ’ para i ≠ i ’; i, i ’ = 1,, m) .
Contemplando as m populações em c categorias, as frequências observadas podem ser apresentadas na tabela de dupla entrada m x c (Tabela de
Contingência m x c )
delineamento_de_experimentos-prova4.indd 78
28/05/2014 15:52:46
Análise de Aderência e Associação | 79
Tabela 5.2 Resultados da categoria segundo população
População
Categoria
Total
C1
C2
...
Cc
P1
fo11
fo12
...
fo1c
fo1i
P2
fo21
fo22
...
fo2c
fo2i





Pm
fom1
fom2
...
fomc
fomi
Total
foi1
foi2
...
foi c
foii
A hipótese de nulidade a ser testada é estabelecida como:
⎪⎧⎪p11 = p21 = = pm1
, ou equivalentemente, π1= π2=...=πm; contra
⎪⎪
⎪p12 = p22 = = pm2
H0 : ⎨
⎪⎪ ⎪⎪
⎪⎪⎩p1c = p2c = = pmc
a alternativa
H1 : pelo menos uma das igualdades não é verificada.
As frequências esperadas, considerando-se a hipótese H0 verdade são obtidas como:
feij = foi• ×p j =
foi• × fo• j
fo••
, para i = 1,..., m e j = 1,..., c .
Sob a veracidade de H0, a estatística do teste é dada por:
m
c
c = ∑∑
2
i=1 j=1
( foij − feij )
2
feij
~ c(2m−1)(c−1) , com a regra de decisão habitual. Ou seja,
χ2 ≥ χ(2α ;(m−1)(c−1)) rejeita-se H ; caso contrário, não há rejeição.
0
Exemplos
1.
Duas novas drogas vão ser testadas em 200 pessoas portadoras de rinite
alérgica. Metade das pessoas recebe a droga A e a outra metade recebe a
droga B. Considerando os dados apresentados a seguir, teste a hipótese de
delineamento_de_experimentos-prova4.indd 79
28/05/2014 15:52:49
80
| DELINEAMENTO DE EXPERIMENTOS
que as duas drogas são igualmente eficazes para tratar a doença (adotar
a=0,05).
Droga
Eficaz
Total
Não
Sim
A
25
75
100
B
32
68
100
Total
57
143
200
H 0 : Droga A = Droga B
⎪⎧⎪p11 = p21
⎨
⎪⎪⎩p12 = p22
H1 : Droga A ≠ Droga B
Frequências Esperadas
fe11 =
57×100
= 28, 5
200
fe12 =
143×100
= 71, 5
200
fe21 =
57×100
= 28, 5
200
fe22 =
143×100
= 71, 5
200
(25 − 28, 5)
2
c2 =
28, 5
(32 − 28, 5)
2
+
28, 5
(75 − 71, 5)
2
+
71, 5
(68 − 71, 5)
2
+
71, 5
= 0, 43 + 0, 43 + 0,17 + 0,17 = 1, 20
α = 0, 05⎫⎪⎪
⎪
m = 2 ⎪⎬ χ(20,05;1) = 3, 84 ∴ χ2 = 1, 20( p > 0, 05)
⎪
c = 2 ⎪⎪⎪⎭
No nível de 5% de significância, não há rejeição de H 0 . Isto é, as duas drogas são igualmente eficazes, no nível de 5% de significância.
2.
Foram consideradas as distribuições do tipo sanguíneo do sistema MN
em três populações (grupos) de indivíduos, conforme dados apresentados
abaixo:
delineamento_de_experimentos-prova4.indd 80
28/05/2014 15:53:01
Análise de Aderência e Associação | 81
Grupo
Tipo Sanguíneo
Total
MM
MN
NN
Controle
50
40
50
140
Gastrite
15
15
25
55
Úlcera
25
22
8
55
Total
90
77
83
250
Verificar, no nível de 5% de significância, se há diferença entre os grupos
quanto a distribuição do tipo sanguíneo (isto é, se a patologia está associada ao sistema sanguíneo).
H 0 : Controle = Gastrite = Úlcera
H1 : Existe pelo menos uma diferença entre os grupos
A seguinte tabela de frequências esperadas pode ser elaborada:
Grupo
NN
Controle
50,40
43,12
46,48
140
Gastrite
19,80
16,94
18,26
55
Úlcera
19,80
16,94
18,26
55
90
77
83
250
(50 − 50, 40)
2
50, 40
Total
MN
Total
c2 =
Tipo Sanguíneo
MM
(40 − 43,12)
2
+
43,12
(8 −18, 26)
2
++
18, 26
c2 = 0, 0032 + 0, 2258 + 0, 2666 + 1,1636 + 0, 2222 + 2, 4878 + 1, 3657 + 1, 5114 + 5, 7649
c2 = 13, 01
α = 0, 05⎫⎪⎪
⎪
m = 3 ⎪⎬ χ(20,05;4) = 9, 49 ∴ χ2 = 13, 01( p < 0, 05)
⎪
c = 3 ⎪⎪⎪⎭
Há rejeição de H0, ou seja, no nível de 5% de significância os grupos diferem quanto a distribuição do tipo sanguíneo (a patologia está associada ao
sistema sanguíneo).
delineamento_de_experimentos-prova4.indd 81
28/05/2014 15:53:01
82
| DELINEAMENTO DE EXPERIMENTOS
5.4 TESTE DE INDEPENDÊNCIA
Uma situação muito interessante na área biológica consiste em considerar
duas características (variáveis biológicas) avaliadas numa amostra de indivíduos e, verificar se a probabilidade de um indivíduo qualquer ser classificado
nas categorias i (i = 1,..., m) e j ( j = 1,..., c ) simultaneamente, pode ser obtida pelo
produto das probabilidades marginais. Ou seja, verificar se as duas características são independentes.
Considerando a tabela de dupla entrada com m linhas e c colunas, objetiva-se testar as hipóteses:
H 0 : pij = pi• ×p• j para todo par ( i, j )  as características estudadas são
independentes;
H1 : pij ≠ pi• ×p• j para algum par ( i, j )  as características estudadas são
dependentes.
As frequências esperadas, considerando-se H0 verdade, são dadas por
feij =
foi• fo• j
fo••
. Resultado idêntico ao utilizado no teste de homogeneidade.
Sob a veracidade de H0, a estatística do teste é expressa como
m
c
c = ∑∑
2
( foij − feij )
2
feij
i=1 j=1
~ c(2m−1)(c−1) , com a regra de decisão habitual.
Exemplos
1.
A tabela a seguir relaciona resultados de uma pesquisa obtidos de uma
amostra aleatória de vítimas de diferentes crimes. Utilizando a=0,05, verificar se o tipo de crime é independente do fato do criminoso ser um estranho.
Criminoso
Crime
Total
Homicídio
Roubo
Assalto
Estranho
15
400
230
Conhecido
45
100
210
355
Total
60
500
440
1000
delineamento_de_experimentos-prova4.indd 82
645
28/05/2014 15:53:01
Análise de Aderência e Associação | 83
⎛para todo
⎞⎟
⎟⇔
H 0 : pij = pi• ×p• j ⎜⎜⎜
⎜⎝i = 1,2;j = 1,2,3⎟⎟⎠
⎛para algum ⎞⎟
⎟⎟ ⇔
H1 : pij ≠ pi• ×p• j ⎜⎜⎜
⎝⎜i = 1,2;j = 1,2,3⎠⎟
Independência entre criminoso ser estranho e tipo de crime;
Dependência entre criminoso ser estranho e tipo de crime.
Frequências Esperadas
fe11 =
60×645
= 38, 7 ; fe12 = 500×645 = 322, 5 ; fe13 = 440×645 = 283, 8
1000
1000
1000
fe21 =
60×355
= 21, 3 ; fe22 = 500×355 = 177, 5 ; fe23 = 440×355 = 156, 2 .
1000
1000
1000
(15 − 38, 7)
2
c2 =
38, 7
(400 − 322, 5)
2
+
322, 5
(210 −156, 2)
2
++
156, 2
=
c2 = 14, 51 + 18, 62 + 10, 20 + 26, 37 + 33, 84 + 18, 53 = 122, 07
α = 0, 05⎪⎫⎪
⎪
m = 2 ⎪⎬ χ(20,05;2) = 5, 99 ∴ χ2 = 122, 07( p < 0, 001)
⎪
c = 3 ⎪⎪⎪⎭
No nível de 5% de significância existe dependência entre o tipo de crime
cometido e o fato do criminoso ser um estranho.
2.
Os resultados da classificação de 100 pessoas segundo a cor dos olhos e do
cabelo foram os seguintes:
Cor do Cabelo
Cor dos Olhos
Cinza
Total
Castanhos
Azuis
Claro
13
18
9
Escuro
24
24
12
60
Total
37
42
21
100
40
No nível de 5% de significância a cor dos olhos está relacionada com a cor
do cabelo?
H 0 : Há independência entre a cor dos olhos e a cor do cabelo (pij = pi• ×p• j )
H1 : Há dependência entre a cor dos olhos e a cor do cabelo (pij ≠ pi• ×p• j )
Frequências Esperadas
delineamento_de_experimentos-prova4.indd 83
28/05/2014 15:53:05
84
| DELINEAMENTO DE EXPERIMENTOS
fe11 =
40×37
40×21
= 14, 8 ; fe12 = 40× 42 = 16, 8 ; fe13 =
= 8, 4
100
100
100
fe21 =
60×37
= 22, 2 ; fe22 = 60× 42 = 25, 2 ; fe23 = 60×21 = 12, 6 .
100
100
100
(13 −14, 8)
2
c2 =
14, 8
(18 −16, 8)
2
+
16, 8
(12 −12, 6)
2
++
12, 6
c = 0, 22 + 0, 09 + 0, 04 + 0,15 + 0, 06 + 0, 03 = 0, 59
2
α = 0, 05⎪⎫⎪
⎪
m = 2 ⎪⎬ χ(20,05;2) = 5, 99 ∴ χ2 = 0, 59( p > 0, 05)
⎪
c = 3 ⎪⎪⎪⎭
No nível de 5% de significância não se rejeita H0, ou seja, existe independência entre a cor dos olhos e a cor do cabelo.
5.5 EXERCÍCIOS (TESTES DE ADERÊNCIA E ASSOCIAÇÃO)
1.
Suponha que um teste de aptidão verbal tenha sido aplicado a um grupo
de 120 adolescentes do gênero masculino e 100 do gênero feminino. Os
resultados estão a seguir. Qual a conclusão a respeito da associação entre
gênero e aptidão verbal no nível de 5% de significância?
Gênero
2.
Nível de Aptidão
Total
Superior
Médio
Inferior
Feminino
25
55
20
100
Masculino
20
80
20
120
Total
45
135
40
220
Desejando-se colocar à prova a hipótese de que a idade da mãe tem certa influência sobre o nascimento de criança prematura, um pesquisador
verificou que, dentre 90 casos de prematuridade, 40 envolviam mães com
idade inferior a 18 anos; 15 envolviam mães de 18 a 35 anos e 35 mães com
idade acima de 35 anos. No nível de 5% de significância, isto leva o pesquisador a manter sua hipótese?
delineamento_de_experimentos-prova4.indd 84
28/05/2014 15:53:15
Análise de Aderência e Associação | 85
3.
Em um teste quiquadrado, quanto maior a diferença entre frequências esperadas e observadas, maior chance temos de: a) aceitar (não rejeitar) H0
ou b) rejeitar H0? Explicar a resposta.
4.
Considere o seguinte resultado quanto ao tabagismo dos pais e filhos
Pais
Filhos
Tabagistas
Não Tabagistas
Tabagistas
49
16
Não Tabagistas
106
79
Verificar no nível de 5% de significância a associação entre pais e filhos
quanto ao tabagismo
5.
Conforme a herança mendeliana, a descendência de certo cruzamento deveria ser vermelha, preta ou branca na seguinte proporção: 9:3:4. Se um
experimento mostrou 74, 32 e 38 descendentes nessas categorias, a teoria
está confirmada, sendo α=0,05?
6.
A seguir são apresentados dados sobre a presença (ou não) de anomalia
em recém-nascidos vivos segundo o sexo.
Sexo
Anomalia
Ausente
Presente
Masculino
586
14
Feminino
674
26
Verifique, no nível de significância 5%, se a proporção de recém-nascidos
vivos portadores de anomalia é a mesma nos dois sexos.
7.
Com base nos dados apresentados a seguir, verificar se a condição de vivo
ou natimorto é homogênea nos dois sexos, considerando-se a=0,01.
Sexo
delineamento_de_experimentos-prova4.indd 85
Condição
Vivo
Natimorto
Masculino
825
25
Feminino
960
40
28/05/2014 15:53:20
86
| DELINEAMENTO DE EXPERIMENTOS
8.
Considere a distribuição de ervilhas do cruzamento de plantas de sementes lisas e albume amarelo com plantas de sementes rugosas e albume verde.
Sementes
Frequência
Amarelo-lisas
380
Amarelo-rugosas
100
Verde-lisas
130
Verde-rugosas
30
No nível de significância de 5%, os resultados estão de acordo com a teoria
postulada por Mendel (9:3:3:1, para as classes de sementes).
9.
Considere uma amostra do mês de nascimento de 200 políticos brasileiros.
Verificar (α=0,05) a hipótese de que o mês de nascimento tem uma distribuição uniforme nos políticos brasileiros.
Mês
Jan
Fev
Mar
Abr
Maio
Jun
Jul
Ago
Set
Out
Nov
Dez
Frequência
16
18
13
15
16
12
20
20
18
14
18
20
10.
Numa Universidade, os estudantes de dois programas de pós-graduação
diferentes são submetidos ao mesmo exame de conhecimentos de redação
científica. Os conceitos obtidos foram os seguintes:
Programa de PG
Conceito
Fraco
Regular
Bom
XY
16
8
20
Excelente
9
WZ
18
12
26
22
No nível de significância 5%, a distribuição dos conceitos é homogênea
nos dois programas?
11.
Numa pesquisa 120 pares de gêmeos foram classificados segundo o sexo e
a ordem que ocorreu o nascimento.
delineamento_de_experimentos-prova4.indd 86
28/05/2014 15:53:20
Análise de Aderência e Associação | 87
Primeiro a nascer
Segundo a nascer
Masculino
Feminino
Masculino
38
22
Feminino
26
34
No nível de significância 5% verificar se o sexo e a ordem de nascimento
são independentes.
12.
Foram amostrados 120 pares de gêmeos classificados de acordo com o
sexo com o seguinte resultado:
Situação
Dois meninos
Duas meninas
Um menino e Uma menina
34
38
48
Frequência
Verificar, no nível de significância 5%, se a classificação do sexo está em
acordo com o modelo binomial B (2; 1 2 ) .
5.6 RESPOSTAS DOS EXERCÍCIOS (TESTES DE ADERÊNCIA E ASSOCIAÇÃO)
1.
c2 = 3, 40( p > 0, 05)
2.
c2 = 11, 67( p < 0, 01)
3.
Quanto mais os valores observados se afastam dos esperados, têm-se
maiores desvios (sendo o numerador do cálculo elevado ao quadrado) e,
portanto, aumenta a chance de rejeitar a hipótese de nulidade (H0).
4.
c2 = 6, 68( p < 0, 01)
5.
c2 = 1, 64( p > 0, 05)
6.
c2 = 2, 07( p > 0, 05)
7.
c2 = 1, 52( p > 0, 05)
8.
c2 = 7, 78( p > 0, 05)
9.
c2 = 5, 08( p > 0, 05)
2
10. c = 2, 47( p > 0, 05)
delineamento_de_experimentos-prova4.indd 87
28/05/2014 15:53:20
88
| DELINEAMENTO DE EXPERIMENTOS
2
11. c = 4, 82( p < 0, 05)
2
12. c = 5, 07( p > 0, 05)
delineamento_de_experimentos-prova4.indd 88
28/05/2014 15:53:26
6
CORRELAÇÃO LINEAR SIMPLES
6.1
INTRODUÇÃO
Nas áreas biológicas, em algumas situações, o pesquisador está interessado
em estudar a maneira como duas variáveis X e Y estão associadas e, mais ainda, medir o seu grau de associação. Alguns exemplos que podem esclarecer
essa situação são bastante comuns em nosso cotidiano, quais são: afirmar que
a pressão arterial aumenta quando a idade avança; a altura de uma árvore está
relacionada ao perímetro do tronco; o desempenho de um atleta melhora com
o treinamento, e assim por diante.
Em todas as situações estão sendo considerados, simultaneamente, os valores de duas variáveis aleatórias mensuradas num mesmo indivíduo, isto é,
observações pareadas. Como já descrito anteriormente, busca-se verificar qual
o sentido e a intensidade da associação entre as variáveis, mas jamais utilizar
essa busca como uma relação de causa e efeito. Ou seja, a observação de que
duas grandezas podem variar simultaneamente no mesmo sentido ou em sentidos contrários, não implica a presença de um relacionamento causal entre
elas.
No presente texto será considerado que a associação entre as variáveis
pode ser estudada por meio de uma relação linear, ou seja, os pares de pontos
distribuídos na vizinhança de uma reta.
Para melhorar o entendimento entre correlação e causalidade, suponha,
por exemplo, uma associação positiva entre o consumo de líquido de uma cidade e o número de internações por desidratação. A falácia da causalidade
poderia levar a diminuição de ingestão de líquido para diminuir o número
de internações por desidratação. Lógico, que neste caso, uma terceira ou mais
delineamento_de_experimentos-prova4.indd 89
28/05/2014 15:53:28
90
| DELINEAMENTO DE EXPERIMENTOS
variáveis (temperatura, umidade relativa do ar,...) podem estar causando a correlação entre consumo de líquido e número de internações. Essas variáveis são
denominadas de variáveis intercorrentes (não conhecidas) e a falsa correlação
que elas fornecem é chamada de correlação espúria.
6.2 DIAGRAMA DE DISPERSÃO
O diagrama de dispersão consiste de um gráfico bidimensional (sistema
de eixos cartesianos (X,Y)) onde são alocados os n pares de observações das
variáveis aleatórias X e Y.
O objetivo do diagrama de dispersão é possibilitar a visualização da relação existente entre as variáveis X e Y. Se os pontos estiverem localizados na vizinhança de uma reta há indicação de correlação, se X e Y crescem no mesmo
sentido, a indicação é no sentido de correlação positiva, caso a variação aconteça no sentido oposto (contrário), existe correlação negativa entre as variáveis.
A Tabela 6.1 apresenta o desempenho físico e psicológico de mulheres obesas
submetidas aos testes relativos à qualidade de vida das participantes.
Tabela 6.1 Desempenho físico e psicológico de mulheres obesas submetidas ao
“Deep water running and quality of life in obese women (Arquivos Médicos do ABC,
v.32, p.5-10, 2007)”
delineamento_de_experimentos-prova4.indd 90
Mulher
D. Físico (%)
D. Psicológico (%)
M1
30
35
M2
40
50
M3
75
70
M4
50
50
M5
35
30
M6
60
65
M7
70
55
M8
55
55
28/05/2014 15:53:28
Correlação Linear Simples | 91
D. Psicológico
80
70
60
50
40
30
20
20
30
Figura 6.1
40
50
60
70
80
90 D. Físico
Diagrama de Dispersão dos Domínios Físico (%) e Psicológico (%)
A inspeção visual, mostra de maneira subjetiva, a tendência linear nas
observações no sentido positivo, ou seja, as mulheres mostraram associação
direta nas respostas dos domínios físico e psicológico. A intensidade dessa associação pode ser mensurada, objetivamente, pelo coeficiente de correlação
linear de Pearson, sendo que a intensidade será tanto maior quanto menor for
a dispersão dos pontos em relação à tendência linear.
6.3 COEFICIENTE DE CORRELAÇÃO
A medida do grau (intensidade) de associação linear entre duas variáveis
aleatórias quantitativas (numéricas) pode ser estabelecida pelo coeficiente de
correlação de Pearson, representado por r e expresso para n pares (xi, yi) de
uma amostra aleatória das variáveis X e Y como:
r=
Sxy
Sxx S yy
, onde
n
n
Sxy = SP ( X ,Y ) = ∑( xi − x )( yi − y ) = ∑ xi yi − nxy ;
i=1
n
i=1
n
Sxx = SQ ( X ) = ∑ ( xi − x ) = ∑ xi2 − nx 2 ;
2
i=1
n
i=1
n
S yy = SQ (Y ) = ∑ ( yi − y ) = ∑ yi2 − ny 2 .
i=1
delineamento_de_experimentos-prova4.indd 91
2
i =1
28/05/2014 15:53:28
92
| DELINEAMENTO DE EXPERIMENTOS
Algumas considerações interessantes podem ser feitas a respeito do valor
de r:
a)
−1 ≤ r ≤ 1 ;
b)
r = +1 , correlação perfeita positiva (todos os pontos estão sobre uma
linha reta crescente);
r = −1 , correlação perfeita negativa (todos os pontos estão sobre uma
c)
linha reta decrescente);
r = 0 ; correlação nula (ausência de associação linear entre as variáveis
d)
X e Y);
e)
r é adimensional.
A seguir serão apresentados dois exemplos para o cálculo da correlação
linear simples.
Exemplos
1.
Considerando os dados da Tabela 6.1, tem-se:
8
∑x
= 30 +  + 55 = 415 , portanto, x = 51, 875 ;
i
i=1
8
∑x
= 302 +  + 552 = 23375 ;
2
i
i=1
Sxx = SQ ( X ) = 23375 − 8×51, 8752 = 1846, 875 ;
8
∑y
i
= 35 +  + 55 = 410 , portanto, y = 51, 25 ;
2
i
= 352 +  + 552 = 22300 ;
i=1
8
∑y
i=1
S yy = SQ (Y ) = 22300 − 8×51, 252 = 1287, 5 ;
8
∑x y
i
i
= 30×35 + 40×50 +  + 55×55 = 1050 + 2000 +  + 3025 = 22625 ;
i=1
Sxy = SP ( X ,Y ) = 22625 − 8×51, 875×51, 25 = 1356, 25 ;
logo r =
1356, 25
1356, 25
=
= 0, 8795 ≈ 0, 88
1846, 875×1287, 5 1542, 0284
delineamento_de_experimentos-prova4.indd 92
28/05/2014 15:53:30
Correlação Linear Simples | 93
A magnitude da associação linear entre as variáveis é da ordem de 0,88,
mostrando que as mulheres que tiveram maiores porcentagens no domínio
físico são também as de maiores valores percentuais no domínio psicológico.
2.
Considere as seguintes notas em Bioestatística e Biofísica de 11 alunos de
Ciências Biológicas selecionados aleatoriamente entre todos os matriculados, conforme Tabela 6.2
Tabela 6.2 Notas de 11 alunos em Bioestatística e Biofísica
Aluno
A
B
C
D
E
F
G
H
I
J
K
Bioestatística (X)
6,7
8,1
6,5
4,2
5,3
4,0
7,1
6,4
6,0
6,8
4,9
Biofísica (Y)
9,2
6,5
8,1
7,5
8,5
7,8
7,7
7,9
8,1
8,2
8,5
∑ xi = 66, 0 , logo x = 6, 0 ;
∑y
11
i=1
11
∑( x − x )
2
i
i=1
11
i
= 88, 0 , logo y = 8, 0 ;
i=1
= (0, 7) + (2,1) + (0, 5) + (−1, 8) + (−0, 7) + (−2, 0) + (1,1) + (0, 4)
2
2
2
2
2
2
2
2
+(0, 0) + (0, 8) + (−1,1) = 16,1 ;
2
2
11
∑( y − y )
2
i
i=1
2
= (1, 2) + (−1, 5) + (0,1) + (−0, 5) + (0, 5) + (−0, 2) + (−0, 3)
2
2
2
2
2
2
2
+(−0,1) + (0,1) + (0, 2) + (0, 5) = 4, 64 ;
2
2
2
2
11
∑(x − x )( y − y ) = (0, 7)(1, 2) + (2,1)(−1, 5) + (0, 5)(0,1) ++ (0, 8)(0, 2) + (−1,1)(0, 5) = −2, 07 ;
i
i
i=1
r=
−2, 07
−2, 07
=
= −0, 24
8, 64
16,1× 4, 64
O coeficiente de correlação negativo (-0,24) mostra que os alunos com
maiores notas em Bioestatística estão com menores notas em Biofísica, e viceversa. Porém, deve ser observado que o valor r = −0, 24 expressa uma fraca
correlação linear negativa entre as variáveis.
delineamento_de_experimentos-prova4.indd 93
28/05/2014 15:53:40
94
| DELINEAMENTO DE EXPERIMENTOS
6.4
TESTE DE HIPÓTESE DA CORRELAÇÃO
Considerando as variáveis aleatórias X ~ N (μx , σx2 ) e Y ~ N (μy , σ 2y ) , as
hipóteses a respeito da ausência ou presença de associação linear entre as
variáveis X e Y podem ser estabelecidas como:
H 0 : rxy = 0 (ausência de associação linear entre as variáveis X e Y)
H1 : rxy ¹ 0 (presença de associação linear entre as variáveis X e Y).
r n−2
~ t(n−2) ,
Sob a veracidade de H0 a estatística do teste é dada por: t =
1− r 2
com a regra de decisão habitual ( ou seja, se t ≥ t(a 2 ,n−2) , rejeita-se a hipótese
H0; caso contrário, não há rejeição).
Alternativamente, o valor do resultado do coeficiente de correlação linear
de Pearson ( r ) pode ser comparado com os valores críticos da Tabela 9.9, com
a seguinte regra de decisão:
Se r > r(
a
2 ;n )
, rejeita-se H 0 ao nível a (0,05 ou 0,01) de significância estabe-
lecido. Caso contrário, não há rejeição da hipótese nula (ausência de associação linear entre X e Y).
Exemplos
1.
Considerando os dados da Tabela 6.1 e a=0,05, tem-se
H 0 : rxy = 0 (ausência de associação linear)
H1 : rxy ¹ 0 (presença de associação linear)
t=
0, 88 6
=
2,156
= 4, 54( p < 0, 01)
0, 475
1− 0, 88
α = 0, 05
= 2, 45; t > 2, 45 , portanto, rejeita-se H0.
t
ϕ = 8 − 2 = 6 (0,025;6)
2
}
No nível de significância 5% existe associação linear entre os domínios
físico e psicológico.
delineamento_de_experimentos-prova4.indd 94
28/05/2014 15:53:46
Correlação Linear Simples | 95
2.
Considerando os dados das notas de Bioestatística e Biofísica da Tabela
6.2, tem-se:
H 0 : rxy = 0 (ausência de associação linear)
H1 : rxy ¹ 0 (presença de associação linear)
t=
−0, 24 9
1−(−0, 24)
2
=
−0, 72
= −0, 74( p > 0, 05)
0, 97
}
α = 0, 05
t(0,025;9) = 2, 26; t < 2, 26 , não se rejeita H0.
ϕ=9
No nível de significância 5%, não foi possível mostrar associação linear entre as notas de Bioestatística e Biofísica nos alunos de Ciências Biológicas.
6.5 EXERCÍCIOS (CORRELAÇÃO LINEAR SIMPLES)
1.
Um antropólogo mediu a largura e o comprimento de 30 crânios amostrados de uma população, obtendo um coeficiente de correlação r=0,75. Supondo α=0,05, verificar se existe associação entre as variáveis.
2.
Os valores das variáveis X e Y devem ser medidos na mesma unidade para
que se possa calcular o coeficiente de correlação linear?
3.
Considere a idade gestacional (semanas) e o peso ao nascer (kg), de uma
amostra casual de 10 recém-nascidos no HC/UNESP-Botucatu(SP).
Recém-nascido
Idade Gestacional
Peso ao Nascer
RN1
RN2
RN3
RN4
RN5
RN6
RN7
RN8
RN9
34
35
37
32
42
40
41
39
28
RN10
38
1,60
1,70
2,00
1,55
4,30
3,00
3,40
3,30
1,25
2,35
No nível de significância 5%, verificar se existe associação linear entre a
idade gestacional e o peso ao nascer.
delineamento_de_experimentos-prova4.indd 95
28/05/2014 15:53:55
96
| DELINEAMENTO DE EXPERIMENTOS
4.
Em um experimento com carneiros foram determinados os seguintes resultados no plasma dos animais:
Carneiro
1
2
3
4
5
6
7
8
9
Conc. Albumina (g%)
2,3
3,5
4,8
1,9
2,7
5,8
4,6
5,4
3,9
Horm. Crescimento (mμg/ml)
41,4
48,6
56,4
40,3
45,3
61,4
52,0
54,0
42,8
Verificar se existe associação linear (a=0,05) entre a concentração de albumina e o hormônio de crescimento no plasma de carneiros.
5.
Apresenta-se a seguir uma matriz de correlação para instrução (X), salário
(Y) e idade (Z) de uma amostra de 50 indivíduos.
Variável
Variável
Instrução
Salário
Idade
Instrução
1,00
0,60
-0,40
1,00
0,50
Salário
Idade
1,00
Quais são significantes no nível 0,05?
6.
A correlação entre aptidão matemática e línguas estrangeiras, baseada em
testes para medir aptidões, está por volta de 0,40. Qual deve ser o tamanho
de uma amostra de estudantes para estarmos certos (nível de significância
5%) de que o valor do r obtido refutaria a hipótese H 0 : r = 0 ?
7.
Como deve ser afetado o valor do coeficiente de correlação r se trocarmos
as variáveis X por Y e Y por X?
8.
Dê um exemplo de duas variáveis que, sem dúvida, estão altamente relacionadas mas para as quais o valor de r seria pequeno pelo fato de a relação
não ser linear.
9.
Considere os seguintes dados relativos a altura e peso de 10 estudantes de
uma sala de aula e verifique, no nível de significância 5%, se as variáveis
estão associadas linearmente.
delineamento_de_experimentos-prova4.indd 96
28/05/2014 15:53:58
Correlação Linear Simples | 97
Estudante
10.
E1
E2
E3
E4
E5
E6
E7
E8
E9
E10
Altura
124
161
126
184
172
140
158
135
180
174
Peso
65
76
64
95
86
68
70
68
92
87
Indique o erro na conclusão
Fato: Há uma associação linear significante (p<0,05) entre a renda pessoal
e o número de anos de escolaridade.
Conclusão: Mais instrução tem como resultado maior renda pessoal.
11.
Como é afetado o valor do coeficiente de correlação linear quando se adiciona a mesma constante a cada valor da variável X?
12.
Com base em uma amostra de 38 pares de valores foi obtido o coeficiente
de correlação r=0,45. Teste (α=0,05) a hipótese de que o coeficiente de correlação das variáveis é zero.
13.
Verificar se existe associação significativa (α=0,05) entre horas de estudo e
nota da prova, segundo os dados abaixo:
14.
Aluno
A
B
C
D
E
F
G
H
I
K
L
M
Horas de estudo
4
1
3
5
8
3
6
7
7
6
2
4
Nota da prova
5
2
4
7
9
5
7
10
8
6
3
3
Um coeficiente de correlação linear de Pearson, baseado em uma amostra
de tamanho 18, foi calculado como 0,45. Pode-se concluir, no nível de 5%
de significância, que há associação entre as variáveis X e Y?
15.
Para uma amostra de tamanho 11, determinar o valor mínimo do coeficiente de correlação r, de modo que a hipótese de ausência de associação
linear entre X e Y( H 0 ) seja rejeitada ao nível de confiança 99% (isto é,
sempre que r > r(0,01;11) ).
16.
Nas questões seguintes aprofunde a discussão no erro de conclusão.
a.
Fato: Há uma correlação linear significativa entre a renda pessoal e o
delineamento_de_experimentos-prova4.indd 97
28/05/2014 15:54:00
98
| DELINEAMENTO DE EXPERIMENTOS
número de anos de escolaridade. Conclusão: mais instrução tem como
resultado maior renda pessoal.
b.
Fato: Indivíduos fazem um teste de habilidade verbal e um
teste de destreza manual; os pares de observação acusam
um coeficiente de correlação linear muito próximo de zero.
Conclusão: Não há qualquer relacionamento entre os escores dos dois
testes.
17.
Explique o que está errado na seguinte afirmação: “Determinou-se uma
associação linear forte, expressa pelo valor r=1,16, entre a avaliação do ensino ministrado pela universidade indicada pelos estudantes e outra feito
por membros externos à instituição”.
6.6 RESPOSTAS DOS EXERCÍCIOS (CORRELAÇÃO LINEAR SIMPLES)
1.
t = 6, 00( p < 0, 001)
2.
Não. Basta que sejam variáveis quantitativas
3.
r = 0, 900 ; t = 5, 84( p < 0, 001)
4.
r = 0, 914 ; t = 5, 96( p < 0, 001)
5.
t(INST×SAL) = 5, 20( p < 0, 001)
t(INST×IDADE) = −3, 02( p < 0, 01)
t(SAL×IDADE) = 4, 00( p < 0, 001)
6.
No mínimo composta por 25 estudantes
7.
O valor permanece inalterado
8.
Quantidade de adubação no solo e produção
9.
r = 0, 949 ; t = 8, 52( p < 0, 001)
10.
A conclusão está fazendo uma relação de causa e efeito, quando na realidade existe apenas uma associação linear
delineamento_de_experimentos-prova4.indd 98
28/05/2014 15:54:02
Correlação Linear Simples | 99
11.
O valor permanece inalterado
12. t = 2, 70( p < 0, 05)
13. r = 0, 921 ; t = 7, 48( p < 0, 01)
14. t = 2, 02( p > 0, 05)
15. r ³ 0, 7348 ; portanto r = 0, 7348
16. a.
b.
(valor mínimo)
Relação de causa e efeito para um indicativo apenas de associação.
b) Não há associação linear, fato que não exclui a possibilidade de outro
tipo de relação.
17.
O valor de r não pode ser maior que a unidade.
delineamento_de_experimentos-prova4.indd 99
28/05/2014 15:54:10
delineamento_de_experimentos-prova4.indd 100
28/05/2014 15:54:14
7
REGRESSÃO LINEAR SIMPLES
7.1 INTRODUÇÃO
Os fenômenos biológicos, quase que na plenitude das situações, podem
ser explicados por meio de modelos matemáticos e estocásticos (modelos
matemáticos que incorporam elementos probabilísticos). Um modelo comum
e de fácil entendimento biológico que tem sido utilizado para estudar a relação
funcional entre duas variáveis consiste na função linear simples (Y = a + bX ) .
Neste modelo, a idéia consiste em estudar a variação da variável aleatória
contínua Y (variável dependente, variável resposta ou variável exógena) em
função de uma variável fixa X, isto é, determinística (variável independente,
variável explanatória ou variável endógena). Por exemplo, verificar as quedas
na quantidade de açúcar no sangue de coelhos submetidos a doses diferentes
de insulina (doses controladas).
Para melhor entendimento, considere o seguinte experimento realizado na
área de Bioquímica. Um bioquímico colocou plasma humano em cinco tubos
de ensaio e depois adicionou procaína (quantidade fixa em cada tubo). Essa
substância é um anestésico local que se decompõe por hidrólise. Para estudar a
velocidade da hidrólise, o pesquisador observou, em tempos definidos e diferentes (4 min., 8 min., 12 min., 16 min. e 20 min.), a quantidade (moles/litro)
de procaína hidrolisada em cada tubo de ensaio.
Esquematicamente:
delineamento_de_experimentos-prova4.indd 101
28/05/2014 15:54:14
102
| DELINEAMENTO DE EXPERIMENTOS
41
33
23
16
6
4 min
8 min
12 min
16 min
20 min
Considerando o tempo com variável independente (X) e a quantidade de
procaína hidrolisada, como a variável dependente (Y), como estabelecer o
modelo da resposta linear de Y em função de X?
7.2 MODELO DE REGRESSÃO LINEAR SIMPLES
A origem do termo regressão deve-se a Sir Francis Galton ( 1822-1911 ),
inglês de classe alta que estudou medicina em Cambridge e explorou a África
antes de se dedicar ao estudo da hereditariedade. A data do pioneirismo do
uso aconteceu por volta de 1885, quando estava investigando relações antropométricas de sucessivas gerações, em resposta a seguinte interrogativa que
fazia: “Se as alturas das pessoas estão distribuídas normalmente em cada geração, e se a altura é hereditária, qual é a relação entre as gerações?”. Uma das
constatações verificada por Galton apontava que cada particularidade de um
homem é transmitida aos seus descendentes, mas, em média, numa intensidade menor. Ou seja, embora pais com baixa estatura tendam a ter filhos também com baixa estatura, os filhos têm altura média maior que seus pais. Fato
semelhante, em sentido reverso, ocorre com pais com estatura alta. Isto é, os
filhos apresentam estatura alta, mas, em média, menor que seus pais. Galton
chamou esse fenômeno de “regressão para a mediocridade”.
delineamento_de_experimentos-prova4.indd 102
28/05/2014 15:54:15
Regressão Linear Simples | 103
Em sua análise, Galton denominou esse fenômeno de a altura mover-se em
direção à altura dos pais de regressão, e às vezes de reversão, expressado num
artigo de 1885, publicado no Journal of the Anthropological Institute (Bussab
& Morettin, 2003).
No contexto matemático, que não foi o caso de Galton, o ajuste de uma
linha reta a quaisquer dados de duas variáveis quantitativas pode ser feito pelo
método dos mínimos quadrados criado pelo matemático francês Legendre,
por volta de 1805, cujo procedimento de obtenção dos parâmetros envolvidos
no modelo linear será objeto de estudo no presente texto.
Em relação ao experimento da procaína, inicialmente, como análise exploratória, torna-se interessante representar os pares de pontos ( xi , yi ) em
um gráfico no sistema cartesiano para verificar se há uma tendência linear
nos dados. Caso exista a tendência, o passo seguinte consiste em estabelecer o
modelo de resposta linear Y = a + bX . Se não for verificada a tendência, a alternativa seria procurar outros modelos (não-lineares), cujo enfoque não será
abordado neste texto.
Para o gráfico considere a Tabela 7.1 de valores do tempo e da quantidade
de procaína hidrolisada.
delineamento_de_experimentos-prova4.indd 103
28/05/2014 15:54:15
104
| DELINEAMENTO DE EXPERIMENTOS
Tabela 7.1
Valores observados nos tubos de ensaio
Tempo (X)
4
8
12
16
20
Quantidade hidrolisada (Y)
6
16
23
33
41
Quantidade
Hidrolisada
(moles/litro)
45
40
35
30
25
20
15
10
5
0
0
4
8
12
16
Figura 7.1
Diagrama de dispersão dos dados
20
Tempo (min)
Como pode ser visualizado existe uma tendência linear nos valores observados no experimento. Então, indaga-se: como procurar a equação da reta
que “melhor” descreve a hidrólise da procaína em função do tempo que foi
adicionado no plasma? Ou seja, como proceder ao ajuste de uma regressão
linear simples (RLS) ao conjunto de dados?
Ajustar uma RLS aos dados significa encontrar a equação da reta que
melhor descreve o fenômeno biológico. Um procedimento matemático que
permite encontrar esse modelo de resposta denomina-se Método de Mínimos
Quadrados (MQ), cujo objetivo consiste em minimizar a soma dos quadrados
dos erros (ou desvios).
Para o ajuste da RLS e, posteriormente, para os testes de hipóteses as seguintes pressuposições são básicas:
i.
A relação entre as duas variáveis é linear.
ii.
Os valores de X são fixos, isto é, X é variável determinística.
iii.
A variabilidade de Y, para qualquer valor dado de X, é sempre a mesma.
delineamento_de_experimentos-prova4.indd 104
28/05/2014 15:54:16
Regressão Linear Simples | 105
iv.
O erro de uma observação não está correlacionado com o erro de outra
observação (erros não correlacionados).
v.
Para qualquer dado valor de X, Y tem distribuição condicional normal (
E ( y x ) = α + β x ; Var ( y x ) = σ 2 ).
Como descrito anteriormente, encontrar os estimadores de mínimos
quadrados para os parâmetros (a, b) do modelo, consiste em considerar uma
amostra aleatória de n pares ( xi , yi ), i = 1,, n ; e minimizar a quantidade de
informação perdida pelo modelo, ou seja, a soma dos quadrados dos erros
dada por:
n
n
i=1
i=1
SQ (α, β ) = ∑ ei2 = ∑ ( yi −(α + β xi )) , com ei sendo o i-ésimo erro entre o
2
valor observado yi e o proposto pelo modelo E ( y xi ) = α + β xi .
Derivando SQ (α, β ) em relação a a e b e igualando a zero, tem-se que as
soluções α̂ (ou a) e β̂ (ou b) devem satisfazer:
n
n
nαˆ + βˆ ∑ xi = ∑ yi ;
i=1
i=1
n
n
n
i=1
i=1
i=1
αˆ ∑ xi + βˆ ∑ xi2 = ∑ xi yi ;
as quais produzem as soluções:
αˆ = a = y − βˆ x ;
β̂ = b =
Sxy ; onde
Sxx
n
n
Sxx = ∑ ( xi − x ) = ∑ xi2 − nx 2 e
2
i=1
i=1
n
n
i=1
i=1
Sxy = ∑ ( xi − x )( yi − y ) = ∑ xi yi − nxy .
Portanto, o modelo de regressão ajustado é dado como:
yˆ i = αˆ + βˆ xi = a + bxi = y + b( xi − x ).
No experimento bioquímico, tem-se
n = 5 ; X : tempo(min) ; Y : quantidade hidrolisada (moles/L);
delineamento_de_experimentos-prova4.indd 105
28/05/2014 15:54:16
106
| DELINEAMENTO DE EXPERIMENTOS
5
∑x
i
= 4 + 8 + 12 + 16 + 20 = 60 , logo x =12 ;
2
i
= 42 + 82 + 122 + 162 + 202 = 880
i=1
5
∑x
;
i=1
Sxx = 880 − 5×122 = 880 − 720 = 160 ;
5
∑y
i
= 6 + 16 + 23 + 33 + 41 = 119
y = 23, 8 ;
i=1
5
∑x y
i
i
= 4×6 + 8×16 + 12×23 + 16×33 + 20× 41 = 1776 ;
i=1
Sxy = 1776 − 5×12, 0×23, 8 = 348 ;
b=
Sxy
Sxx
=
348
= 2,175 ;
160
a = y − bx = 23, 8 − 2,175×12 = −2, 3 ;
ˆ = − 2, 3 + 2,175tempo .
logo, yˆi = − 2, 3 + 2,175xi , isto é, QtHid
O modelo yˆi = − 2, 3 + 2,175xi , constitui-se num preditor da quantidade de
procaína hidrolisada para qualquer tempo considerado no intervalo de 4min
a 20min. Além disso, o valor 2,175 (denominado coeficiente angular da regressão) indica a variação da variável Y por unidade de variação em X, ou
seja, para cada minuto decorrido a quantidade de procaína hidrolisada tem
um acréscimo de 2,175 moles/litro.
O modelo estimado pode ser representado no sistema cartesiano por meio
de uma reta correspondente à relação linear encontrada entre as variáveis.
Então, considerando yˆi = − 2, 3 + 2,175xi , tem-se:
xi = 4 → yˆ i = − 2, 3 + 2,175(4) = 6, 4 ;
xi = 20 → yˆ i = − 2, 3 + 2,175(20) = 41, 2.
delineamento_de_experimentos-prova4.indd 106
28/05/2014 15:54:26
Regressão Linear Simples | 107
Quantidade
Hidrolisada
40
30
20
yˆ i = − 2, 3 + 2,175xi
10
0
Tempo
7.3 COEFICIENTE DE DETERMINAÇÃO
O coeficiente de determinação (R2) indica a proporção da variação de Y
que é explicada pela reta de regressão, ou seja, uma medida de precisão do
modelo. Portanto, sendo uma proporção seu valor varia entre zero e um, inclu2
sive (0 ≤ R ≤ 1) . Fica mais prático interpretar quando seu valor é expresso em
porcentagem, sendo 0% o caso extremo de imprecisão do modelo e, opostamente, 100% a retenção de toda informação do fenômeno biológico explicada
pelo modelo ajustado. Valores entre essas porcentagens limites são tão pouco
ou mais representativos quanto aos próximos dos extremos que se alinharem.
O cálculo do coeficiente de determinação (R2) envolve a relação entre a soma
de quadrados devida à regressão e a soma total de quadrados expressa na seguinte fórmula: R2 = SQRegressão =
SQTotal
Sxy2
Sxx S yy
. Se não existisse qualquer variação
em torno da reta de regressão (todos os pontos observados estivessem sobre
a reta estimada), não haveria resíduos (erros) e, portanto, a soma de quadrados devida à regressão coincidiria com a soma total de quadrados, resultando
R 2 = 1, 0 (100%) . Dificilmente essa condição acontece em biologia, uma vez que
existe sempre uma componente aleatória nas respostas biológicas.
No experimento bioquímico, tem-se:
5
∑x
i
= 60 , com x =12 ;
i=1
delineamento_de_experimentos-prova4.indd 107
5
∑y
i
= 119 , com y = 23, 8 ;
i=1
28/05/2014 15:54:34
108
| DELINEAMENTO DE EXPERIMENTOS
5
∑ xi2 = 880 ;
i=1
5
∑ yi2 = 3591 ;
i=1
5
∑x y
i
i
= 1776 ; resultando,
i=1
Sxx =160 ; S yy = 758, 8 ; Sxy = 348 .
Logo, R2 =
3482
= 0, 9975(99, 75%) , mostrando que o modelo ajusta160×758, 8
do explica 99,75% da variação da quantidade de procaína hidrolisada em função do tempo.
7.4 TESTE DO COEFICIENTE (ANGULAR) DE REGRESSÃO
H 0 : b = 0 (não existe RLS de Y em X)
H1 : b ¹ 0 (existe RLS de Y em X).
Sob a veracidade de H0, a estatística do teste é dada por t =
(n − 2)R2
1− R 2
~ t(n−2) ,
com a regra de decisão habitual (rejeita-se H0, quando t ≥ t(a 2;n−2) ). Alternativamente o valor da estatística pode ser obtido como:
t=
S2 ⎞
1 ⎛⎜
b Sxx
⎜⎜S yy − xy ⎟⎟⎟ .
, onde Se2 =
Sxx ⎟⎠
(n − 2)⎜⎝
Se
No experimento bioquímico, tem-se
H 0 : b = 0 (ausência de RLS da quantidade de procaína hidrolisada sobre
o tempo)
H1 : b ¹ 0 (presença de RLS da quantidade de procaína hidrolisada sobre
o tempo).
(5 − 2)0, 9975
= 34, 6( p < 0, 001) ;
1− 0, 9975
a = 0, 05 e n− 2 = 3 , tem-se t(0,025;3) = 3,18 , logo ( t > t(0,025;3) ) rejeita-se H0.
n = 5 e R 2 = 0, 9975 , então t =
Alternativamente:
Sxx =160 ; S yy = 758, 8 ; Sxy = 348 e b = 2,175
1 ⎛⎜
3482 ⎞⎟
Se = 0, 7958
⎟ = 0, 6333
Se2 =
⎜⎜758, 8 −
5−2 ⎝
160 ⎟⎟⎠
delineamento_de_experimentos-prova4.indd 108
28/05/2014 15:54:38
Regressão Linear Simples | 109
t=
2,175 160
= 34, 6( p < 0, 001)
0, 7958
Nesse sentido, conclui-se que existe regressão linear significativa (p<0,001)
da quantidade de procaína hidrolisada em função do tempo.
7.5 EXERCÍCIOS (REGRESSÃO LINEAR SIMPLES)
1.
Um laboratório está interessado em medir o efeito da temperatura sobre a
potência de um antibiótico. Oito amostras de 50 gramas foram armazenadas a diferentes temperaturas, e após uma semana mediu-se a potência. Os
resultados estão descritos a seguir.
Temperatura (ºC)
30
38
46
54
62
70
78
86
Potência
45
41
39
32
28
23
10
17
a.
Faça a representação gráfica dos dados.
b.
Ajuste a regressão linear simples da potência como função da temperatura.
c.
2.
A que temperatura a potência seria nula?
Sejam X (duração da viagem, em dias) e Y(despesa, em US$, com viagem).
Para uma amostra de 102 viagens, obteve-se:
∑x
2
= 4150 ;
∑y
2
= 740200 e
∑ x = 510 ; ∑ y = 7140 ;
∑ xy = 54900 .
a.
Qual a reta de regressão de Y em função de X?
b.
Uma viagem irá durar sete dias. Qual a estimativa de despesa para a
viagem?
3.
Para construir um modelo linear relacionando a quantidade de erros datilográficos (Y) e o tempo de experiência (X) em meses, constituiu-se uma
amostra casual de 10 funcionários, obtendo-se os seguintes resultados numéricos:
delineamento_de_experimentos-prova4.indd 109
28/05/2014 15:54:56
110
| DELINEAMENTO DE EXPERIMENTOS
n =10 ; x = 6, 0 ; y =17, 0 ; Sxx =100 ; S yy = 644 e r = −0, 993 .
4.
a.
Determine o modelo de regressão linear de Y em X.
b.
No nível de significância 5%, faça o teste de hipótese da regressão.
c.
Encontre o valor do coeficiente de determinação.
Os dados a seguir referem-se a precipitação anual (cm) e a produção de
algodão (kg/ha) de uma amostra de sete produtores de uma dada região do
estado.
Precipitação
160
140
130
100
70
50
40
Produção
620
510
450
280
140
80
30
No nível de significância de 5%, verificar se existe RLS da produção de
algodão em função de precipitação anual.
5.
Se os filhos fossem exatamente 3 cm mais altos do que seus pais, como
ficaria a reta de regressão que daria a altura dos filhos em função da altura
dos pais?
6.
Considere os dados da idade (em dias) e o peso (em gramas) de ratos machos da raça Wistar.
Idade
25
28
30
32
34
35
38
40
42
43
45
46
47
48
49
50
Peso
62
61
66
69
74
75
80
82
88
89
91
95
95
97
99
99
Considerando o modelo RLS para o peso em função da idade, quanto deve
ser o peso estimado de um rato com 33 dias de idade?
7.
Suponha que, com base em 16 pares de observações, obteve-se as seguintes
informações:
∑ x = 896 ; ∑ y = 655 ; ∑ x
2
= 52300 ;
∑y
2
= 29652 ;
∑ xy = 38368 . Qual é a proporção da variabilidade total dos dados que
pode ser explicada pela regressão de Y em X?
delineamento_de_experimentos-prova4.indd 110
28/05/2014 15:54:59
Regressão Linear Simples | 111
8.
Considere os valores de X e Y obtidos em uma amostra com cinco observações.
X
1
2
3
4
5
Y
16
12
8
7
5
Mostre com os dados que b = r
9.
S yy
Sxx
Numa análise de RLS foram obtidos a partir de uma amostra de 6 pares de
valores X e Y, os seguintes resultados:
16
; sx = 3 (desvio padrão de X); s y = 5 (desvio padrão de Y); x = 3 e
25
y =10 .
R2 =
10.
a.
Qual a equação de RLS de Y em X?
b.
No nível de significância 5%, teste as hipóteses H 0 : b = 0× H1 : b ≠ 0 .
Para os pares (1,6);(2,5);(3,3);(4,3);(6,1), determine a equação de RLS de Y
em X. Qual a variação de Y por unidade de variação de X?
11.
Um laboratório está interessado em medir a influência da temperatura sobre a potência de um antibiótico. Dez amostras de 50g cada foram guardadas a diferentes temperaturas, e após 15 dias mediu-se a potência (quadro
a seguir).
a.
Faça a representação gráfica dos dados.
b.
Ajuste a reta da potência como função da temperatura.
c.
A que temperatura a potência seria nula?
Temperatura (ºC)
12.
Potência
30
38
50
32
26
43
33
70
19
27
23
90
14
21
Qual o indicador estatístico que fornece o acréscimo ou decréscimo de Y
esperado para cada variação unitária de X, numa relação linear entre Y e X?
delineamento_de_experimentos-prova4.indd 111
28/05/2014 15:55:06
112
| DELINEAMENTO DE EXPERIMENTOS
13.
Considere os seguintes pesos de pais e filhos, em kg.
Família
F1
F2
F3
F4
F5
F6
F7
F8
F9
F10
Peso do Pai
65
63
67
64
68
62
70
66
68
67
Peso do Filho
68
66
68
65
69
66
68
65
71
67
a.
Construir o diagrama de dispersão.
b.
Estabelecer a regressão do peso do filho em função do peso do pai.
Verificar a significância considerando a=0,05.
14.
Suponha que, com base em 16 pares de observações, obteve-se as seguintes
informações:
∑ x = 896; ∑ y = 655; ∑ x
2
= 52330; ∑ y 2 = 29652; ∑ xy = 38368
Utilizando essas informações, responda as questões a seguir:
a.
Determine a regressão linear de Y em X.
b.
Qual é a proporção da variabilidade total dos Y que pode ser explicada
pela regressão de Y em X?
15.
Considere os seguintes resultados de uma pesquisa envolvendo registro de
armas automáticas e taxa de criminalidade em oito estados.
Armas automáticas
11800
8300
3600
1800
6900
2600
4200
5960
Taxa de criminalidade(%)
18,1
16,8
9,4
6,4
14,6
8,8
10,6
11,8
Qual a predição linear para a taxa de criminalidade (%) em um estado com
10000 armas automáticas registradas?
7.6 RESPOSTAS DOS EXERCÍCIOS (REGRESSÃO LINEAR SIMPLES)
1. b.
POTÊNCIA = 64,158 − 0, 600TEMPERATURA; 30 £ TEMP £ 86
c. TEMPERATURA =106, 93˚ C
2. a. Ŷ (DESPESA) = 10 + 12 X (DURAÇÃO)
b. Yˆ (DESPESA7 DIAS ) = U $94, 00
delineamento_de_experimentos-prova4.indd 112
28/05/2014 15:55:11
Regressão Linear Simples | 113
3. a. Yˆ = 32,12 − 2, 52 X
b. t = 23, 74 ( p < 0, 001)
c.
R 2 = 0, 986
ˆ = − 181, 528 + 4, 900 PRECIP t = 27, 01( p < 0, 001)
4. PROD
5. ALTˆ FILHO = 3 + ALT PAI
ˆ = 17, 011 + 1, 661 IDADE , 25 £ IDADE £ 50 .
6. PESO
ˆ (33DIAS ) = 71, 824gramas
PESO
7.
R 2 = 0, 676 (67,6% da variabilidade total dos dados é explicada pelo mod-
elo).
8.
SXX =10 ;
SYY = 77, 2 ; SXY = −27
SYY
r = −0, 9718 ; b = −2, 7 ; r S = −2, 7
XX
Ou seja, fica mostrado que b = r SYY .
SXX
9. a. Yˆ = 6, 01 + 1, 33 X , 1 £ X £ 6
b. t = 2, 67 ( p > 0, 05) .
10. Yˆ = 6, 757 − 0, 986 X ;
ou seja, para cada unidade de X há uma decréscimo
de 0,986 unidades em Y .
ˆ = 50, 457 − 0, 381TEMP , 30 £ TEMP £ 90
11. b. POT
c. TEMP =132, 43˚ C
12.
Coeficiente de regressão linear ( b )
ˆ
13. b. PFILHO
= 35, 479 + 0, 482PPAI ; 62 £ PPAI £ 70 ; t = 2, 34( p < 0, 05)
14. a. Yˆ = − 2, 8856 + 0, 7826 X
b. R 2 = 0, 4654 = 46, 54%
ˆ
ˆ
= 5, 304 + 0, 0012 ARMAS AUT ; TAXACRIM
15. TAXACRIM
(10000) = 17, 304%
delineamento_de_experimentos-prova4.indd 113
28/05/2014 15:55:13
delineamento_de_experimentos-prova4.indd 114
28/05/2014 15:55:28
8
BIBLIOGRAFIA
ANDRADE, D.F.; OGLIARI, P.J. Estatística para as ciências agrárias e biológicas com
noções de experimentação. 2.ed, Florianópolis: Editora UFSC, 2007.
BANZATTO, D.A. & KRONKA, S.N. Experimentação agrícola, 3ªed. São Paulo: FUNEP,
2006.
BOX, G. E. P. Non-normality and tests on variances. Biometrika, v.20, p.318-335, 1953.
BUSSAB, W.O. Análise de variância e regressão. São Paulo: Atual, 1986.
BUSSAB, W.O.; MORETTIN, P.A. Estatística básica. 5. ed. São Paulo: Saraiva, 2003.
DEAN, A. M.; VOSS D. T. Design and analysis of experiments. New York: SpringerVerlag, 1999.
DRAPER, N. R.; SMITH, H. Applied regression analysis. 3. ed. New York: John Willey,
1998.
GOMES, F. P. Curso de estatística experimentall 15ª ed., São Paulo :FEALQ, 2009.
MLODINOW, L. O andar do bêbado. Como o acaso determina nossas vidas. Rio de
Janeiro: Zahar, 2009.
MONTGOMERY, D.C. Design and analysis of experiment, 6. ed. New York: John Willey, 2005.
MOORE,D. A estatística básica e sua prática. Rio de Janeiro: LTC Editora,1995.
NORMAN, G.R.; STREINER, D.L. Biostatistics: the bare essentials. 3. ed. St. Louis:
Mosby, 2008.
PADOVANI, C.R. Exercícios de estatística básica e experimental. Botucatu: Depto de
Bioestatística, 2002.
PADOVANI, C.R. Planejamento de experimentos. Botucatu: Depto de Bioestatística,
2009.
PERES, C.A.; SALDIVA, C.D. Planejamento de experimentos. São Paulo: 5. SINAPE,
1982.
SAMPAIO, I. B. M. Estatística aplicada a experimentação animal, 3ªed. Minas Gerais:
FEPMVZ, 2010.
delineamento_de_experimentos-prova4.indd 115
28/05/2014 15:55:29
116
| DELINEAMENTO DE EXPERIMENTOS
SALSBURG, D. Uma senhora toma chá … como a estatística revolucionou a ciência no
século XX. Rio de Janeiro: Zahar, 2009.
VIEIRA, S. Estatística experimental. 2. ed. São Paulo: Atlas, 1999.
VIEIRA, S. Análise de variância (ANOVA). São Paulo: Atlas, 2006.
ZAR, J.H. Boestatistical analysis, 5. ed. New Jersey: Prentice-Hall, 2009.
delineamento_de_experimentos-prova4.indd 116
28/05/2014 15:55:29
9
TABELAS
Tabela 9.1 Distribuição t de Student ⎡⎣ P (−t 0 < t < t 0 ) = 1− a ⎤⎦
Nível de significância para o teste bilateral (a)
Número de graus
de liberdade
0,01
0,05
0,10
1
63,657
12,706
6,314
2
9,925
4,303
2,920
3
5,841
3,182
2,353
4
4,604
2,776
2,132
5
4,032
2,571
2,015
6
3,707
2,447
1,943
7
3,499
2,365
1,895
8
3,355
2,306
1,860
9
3,250
2,262
1,833
10
3,169
2,228
1,812
11
3,106
2,201
1,796
12
3,055
2,179
1,782
13
3,012
2,160
1,771
14
2,977
2,145
1,761
15
2,947
2,131
1,753
16
2,921
2,120
1,746
17
2,898
2,110
1,740
18
2,878
2,101
1,734
19
2,861
2,093
1,729
20
2,845
2,086
1,725
21
2,831
2,080
1,721
22
2,819
2,074
1,717
23
2,807
2,069
1,714
24
2,797
2,064
1,711
25
2,787
2,060
1,708
26
2,779
2,056
1,706
27
2,771
2,052
1,703
28
2,763
2,048
1,701
29
2,756
2,045
1,699
30
2,750
2,042
1,697
40
2,704
2,021
1,684
60
2,660
2,000
1,671
120
2,617
1,980
1,658
∞
2,576
1,960
1,645
Interpolações devem ser feitas com base nos recíprocos dos graus de liberdade (interpolação harmônica)
delineamento_de_experimentos-prova4.indd 117
28/05/2014 15:55:29
118
| DELINEAMENTO DE EXPERIMENTOS
Tabela 9.2 Distribuição Qui-quadrado ⎡⎢ P (χ2 > χ02 ) = α ⎤⎥
⎦
⎣
delineamento_de_experimentos-prova4.indd 118
a
Graus de
liberdade
10%
5%
1%
1
2,71
3,84
6,64
2
4,60
5,99
9,21
3
6,25
7,82
11,34
4
7,78
9,49
13,28
5
9,24
11,07
15,09
6
10,64
12,59
16,81
7
12,02
14,07
18,48
8
13,36
15,51
20,09
9
14,68
16,92
21,67
10
15,99
18,31
23,21
11
17,28
19,68
24,72
12
18,55
21,03
26,22
13
19,81
22,36
27,69
14
21,06
23,68
29,14
15
22,31
25,00
30,58
16
23,54
26,30
32,00
17
24,77
27,59
33,41
18
25,99
28,87
34,80
19
27,20
30,14
36,19
20
28,41
31,41
37,57
21
29,62
32,67
38,93
22
30,81
33,92
40,29
23
32,01
35,17
41,64
24
33,20
36,42
42,98
25
34,38
37,65
44,31
26
35,56
38,88
45,64
27
36,74
40,11
46,96
28
37,92
41,34
48,28
29
39,09
42,56
49,59
30
40,26
43,77
50,89
28/05/2014 15:55:29
Tabelas | 119
Tabela 9.3 Distribuição F ⎡ P (F > F0 ) = 0, 01⎤
⎣
⎦
Nº de graus de
liberdade do
denominador
1
2
3
4
5
6
7
8
9
1
4052
5000
5403
5625
5764
5859
5928
5982
6022
2
98,50
99,00
99,20
99,20
99,30
99,30
99,40
99,40
99,40
3
34,10
30,80
29,50
28,70
28,20
27,90
27,70
27,50
27,30
4
21,20
18,00
16,70
16,00
15,50
15,20
15,00
14,80
14,70
5
16,30
13,30
12,10
11,40
11,00
10,70
10,50
10,30
10,20
6
13,70
10,90
9,78
9,15
8,75
8,47
8,26
8,10
7,98
7
12,20
9,55
8,45
7,85
7,46
7,19
6,99
6,84
6,72
8
11,30
8,65
7,59
7,01
6,63
6,37
6,18
6,03
5,91
Nº de graus de liberdade do numerador
9
10,60
8,02
6,99
6,42
6,06
5,80
5,61
5,47
5,35
10
10,00
7,56
6,55
5,99
5,64
5,39
5,20
5,06
4,94
11
9,65
7,21
6,22
5,67
5,32
5,07
4,89
4,74
4,63
12
9,33
6,93
5,95
5,41
5,06
4,82
4,64
4,50
4,39
13
9,07
6,70
5,74
5,21
4,86
4,62
4,44
4,30
4,19
14
8,86
6,51
5,56
5,04
4,69
4,46
4,28
4,14
4,03
15
8,68
6,36
5,42
4,89
4,56
4,32
4,14
4,00
3,89
16
8,53
6,23
5,29
4,77
4,44
4,20
4,03
3,89
3,78
17
8,40
6,11
5,18
4,67
4,34
4,10
3,93
3,79
3,68
18
8,29
6,01
5,09
4,58
4,25
4,01
3,84
3,71
3,60
19
8,18
5,93
5,01
4,50
4,17
3,94
3,77
3,63
3,52
20
8,10
5,85
4,94
4,43
4,10
3,87
3,70
3,56
3,46
21
8,02
5,78
4,87
4,37
4,04
3,81
3,64
3,51
3,40
22
7,95
5,72
4,82
4,31
3,99
3,76
3,59
3,45
3,35
23
7,88
5,66
4,76
4,26
3,94
3,71
3,54
3,41
3,30
24
7,82
5,61
4,72
4,22
3,90
3,67
3,50
3,36
3,26
25
7,77
5,57
4,68
4,18
3,85
3,63
3,46
3,32
3,22
26
7,72
5,53
4,64
4,14
3,82
3,59
3,42
3,29
3,18
27
7,68
5,49
4,60
4,11
3,78
3,56
3,39
3,26
3,15
28
7,64
5,45
4,57
4,07
3,75
3,53
3,36
3,23
3,12
29
7,60
5,42
4,54
4,04
3,73
3,50
3,33
3,20
3,09
30
7,56
5,39
4,51
4,02
3,70
3,47
3,30
3,17
3,07
40
7,31
5,18
4,31
3,83
3,51
3,29
3,12
2,99
2,89
60
7,08
4,98
4,13
3,65
3,34
3,12
2,95
2,82
2,72
120
6,85
4,79
3,95
3,48
3,17
2,96
2,79
2,66
2,56
∞
6,63
4,61
3,78
3,32
3,02
2,80
2,64
2,51
2,41
delineamento_de_experimentos-prova4.indd 119
28/05/2014 15:55:29
120
| DELINEAMENTO DE EXPERIMENTOS
Tabela 9.4 Distribuição F ⎡⎣ P (F > F0 ) = 0, 05⎤⎦
Nº de graus de
liberdade do
denominador
Nº de graus de liberdade do numerador
1
2
3
4
5
6
7
8
9
1
161
200
216
225
230
234
237
239
241
2
18,50
19,00
19,20
19,20
19,30
19,30
19,40
19,40
19,40
3
10,10
9,55
9,28
9,12
9,01
8,94
8,89
8,85
8,81
4
7,71
6,94
6,59
6,39
6,26
6,16
6,09
6,04
6,00
5
6,61
5,79
5,41
5,19
5,05
4,95
4,88
4,82
4,77
6
5,99
5,14
4,76
4,53
4,39
4,28
4,21
4,15
4,10
7
5,59
4,74
4,35
4,12
3,97
3,87
3,79
3,73
3,68
8
5,32
4,46
4,07
3,84
3,69
3,58
3,50
3,44
3,39
9
5,12
4,26
3,86
3,63
3,48
3,37
3,29
3,23
3,18
10
4,96
4,10
3,71
3,48
3,33
3,22
3,14
3,07
3,02
11
4,84
3,98
3,59
3,36
3,20
3,09
3,01
2,95
2,90
12
4,75
3,89
3,49
3,26
3,11
3,00
2,91
2,85
2,80
13
4,67
3,81
3,41
3,18
3,03
2,92
2,83
2,77
2,71
14
4,60
3,74
3,34
3,11
2,96
2,85
2,76
2,70
2,65
15
4,54
3,68
3,29
3,06
2,90
2,79
2,71
2,64
2,59
16
4,49
3,63
3,24
3,01
2,85
2,74
2,66
2,59
2,54
17
4,45
3,59
3,20
2,96
2,81
2,70
2,61
2,55
2,49
18
4,41
3,55
3,16
2,93
2,77
2,66
2,58
2,51
2,46
19
4,38
3,52
3,13
2,90
2,74
2,63
2,54
2,48
2,42
20
4,35
3,49
3,10
2,87
2,71
2,60
2,51
2,45
2,39
21
4,32
3,47
3,07
2,84
2,68
2,57
2,49
2,42
2,37
22
4,30
3,44
3,05
2,82
2,66
2,55
2,46
2,40
2,34
23
4,28
3,42
3,03
2,80
2,64
2,53
2,44
2,37
2,32
24
4,26
3,40
3,01
2,78
2,62
2,51
2,42
2,36
2,30
25
4,24
3,39
2,99
2,76
2,60
2,49
2,40
2,34
2,28
26
4,23
3,37
2,98
2,74
2,59
2,47
2,39
2,32
2,27
27
4,21
3,35
2,96
2,73
2,57
2,46
2,37
2,31
2,25
28
4,20
3,34
2,95
2,71
2,56
2,45
2,36
2,29
2,24
29
4,18
3,33
2,93
2,70
2,55
2,43
2,35
2,28
2,22
30
4,17
3,32
2,92
2,69
2,53
2,42
2,33
2,27
2,21
40
4,08
3,23
2,84
2,61
2,45
2,34
2,25
2,18
2,12
60
4,00
3,15
2,76
2,53
2,37
2,25
2,17
2,10
2,04
120
3,92
3,07
2,68
2,45
2,29
2,17
2,09
2,02
1,96
∞
3,84
3,00
2,60
2,37
2,21
2,10
2,01
1,94
1,88
delineamento_de_experimentos-prova4.indd 120
28/05/2014 15:55:29
Tabelas | 121
Tabela 9.5 Distribuição F ⎡⎣ P (F > F0 ) = 0,10⎤⎦
Nº de graus de
liberdade do
denominador
Nº de graus de liberdade do numerador
1
2
3
4
5
6
7
8
9
1
39,9
49,5
53,6
55,8
57,2
58,2
58,9
59,4
59,9
2
8,53
9,00
9,16
9,24
9,29
9,33
9,35
9,37
9,38
3
5,54
5,46
5,39
5,34
5,31
5,28
5,27
5,25
5,24
4
4,54
4,32
4,19
4,11
4,05
4,01
3,98
3,95
3,94
5
4,06
3,78
3,62
3,52
3,45
3,40
3,37
3,34
3,32
6
3,78
3,46
3,29
3,18
3,11
3,05
3,01
2,98
2,96
7
3,59
3,26
3,07
2,96
2,88
2,83
2,78
2,75
2,72
8
3,46
3,11
2,92
2,81
2,73
2,67
2,62
2,59
2,56
9
3,36
3,01
2,81
2,69
2,61
2,55
2,51
2,47
2,44
10
3,29
2,92
2,73
2,61
2,52
2,46
2,41
2,38
2,35
11
3,23
2,86
2,66
2,54
2,45
2,39
2,34
2,30
2,27
12
3,18
2,81
2,61
2,48
2,39
2,33
2,28
2,24
2,21
13
3,14
2,76
2,56
2,43
2,35
2,28
2,23
2,20
2,16
14
3,10
2,73
2,52
2,39
2,31
2,24
2,19
2,15
2,12
15
3,07
2,70
2,49
2,36
2,27
2,21
2,16
2,12
2,09
16
3,05
2,67
2,46
2,33
2,24
2,18
2,13
2,09
2,06
17
3,03
2,64
2,44
2,31
2,22
2,15
2,10
2,06
2,03
18
3,01
2,62
2,42
2,29
2,20
2,13
2,08
2,04
2,00
19
2,99
2,61
2,40
2,27
2,18
2,11
2,06
2,02
1,98
20
2,97
2,59
2,38
2,25
2,16
2,09
2,04
2,00
1,96
21
2,96
2,57
2,36
2,23
2,14
2,08
2,02
1,98
1,95
22
2,95
2,56
2,35
2,22
2,13
2,06
2,01
1,97
1,93
23
2,94
2,55
2,34
2,21
2,11
2,05
1,99
1,95
1,92
24
2,93
2,54
2,33
2,19
2,10
2,04
1,98
1,94
1,91
25
2,92
2,53
2,32
2,18
2,09
2,02
1,97
1,93
1,89
26
2,91
2,52
2,31
2,17
2,08
2,01
1,96
1,92
1,88
27
2,90
2,51
2,30
2,17
2,07
2,00
1,95
1,91
1,87
28
2,89
2,50
2,29
2,16
2,06
2,00
1,94
1,90
1,87
29
2,89
2,50
2,28
2,15
2,06
1,99
1,93
1,89
1,86
30
2,88
2,49
2,28
2,14
2,05
1,98
1,93
1,88
1,85
40
2,84
2,44
2,23
2,09
2,00
1,93
1,87
1,83
1,79
60
2,79
2,39
2,18
2,04
1,95
1,87
1,82
1,77
1,74
120
2,75
2,35
2,13
1,99
1,90
1,82
1,77
1,72
1,68
∞
2,71
2,30
2,08
1,94
1,85
1,77
1,72
1,67
1,63
delineamento_de_experimentos-prova4.indd 121
28/05/2014 15:55:30
90
14,0
8,26
6,51
5,70
5,24
4,95
4,74
4,60
4,48
4,39
4,32
4,26
4,21
4,17
4,13
4,10
4,07
4,05
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
2
delineamento_de_experimentos-prova4.indd 122
4,67
4,70
4,74
4,78
4,83
4,89
4,96
5,04
5,14
5,27
5,43
5,63
5,92
6,33
6,97
8,12
10,6
19,0
135
3
5,05
5,09
5,14
5,19
5,25
5,32
5,40
5,50
5,62
5,77
5,96
6,20
6,54
7,03
7,80
9,17
12,2
22,3
164
4
5,33
5,38
5,43
5,49
5,56
5,63
5,73
5,84
5,97
6,14
6,35
6,63
7,01
7,56
8,42
9,96
13,3
24,7
186
5
5,55
5,60
5,66
5,72
5,80
5,88
5,98
6,10
6,25
6,43
6,66
6,96
7,37
7,97
8,91
10,60
14,2
26,6
202
6
5,73
5,79
5,85
5,92
5,99
6,08
6,19
6,32
6,48
6,67
6,91
7,24
7,68
8,32
9,32
11,10
15,0
28,2
216
7
5,89
5,94
6,01
6,08
6,16
6,26
6,37
6,51
6,67
6,87
7,13
7,47
7,94
8,61
9,67
11,50
15,6
29,5
227
8
6,02
6,08
6,15
6,22
6,31
6,41
6,53
6,67
6,84
7,05
7,32
7,68
8,17
8,87
9,97
11,90
16,2
30,7
237
9
6,14
6,20
6,27
6,35
6,44
6,54
6,67
6,81
6,99
7,21
7,49
7,87
8,37
9,10
10,20
12,30
16,7
31,7
246
10
6,25
6,31
6,38
6,46
6,55
6,66
6,79
6,94
7,13
7,36
7,65
8,03
8,55
9,30
10,50
12,60
17,1
32,6
253
11
6,34
6,41
6,48
6,56
6,66
6,77
6,90
7,06
7,25
7,48
7,78
8,18
8,71
9,49
10,70
12,80
17,5
33,4
260
12
Número de tratamentos (k)
Distribuição “studentized range” [ q(0,01;ϕ) ] : Tukey (1%)
1
Nº de graus de
liberdade do
resíduo
Tabela 9.6
6,43
6,50
6,57
6,66
6,76
6,87
7,01
7,17
7,36
7,60
7,91
8,31
8,86
8,65
10,90
13,10
17,9
34,1
266
13
6,51
6,58
6,66
6,74
6,84
6,96
7,10
7,26
7,46
7,71
8,03
8,44
9,00
9,81
11,10
13,30
18,2
34,8
272
14
6,58
6,65
6,73
6,82
6,93
7,05
7,19
7,36
7,56
7,81
8,13
8,55
9,12
9,95
11,20
13,50
18,5
35,4
277
15
6,65
6,72
6,80
6,90
7,00
7,12
7,27
7,44
7,65
7,91
8,23
8,66
9,24
10,10
11,40
13,70
18,8
36,0
282
16
6,72
6,79
6,87
6,97
7,07
7,20
7,34
7,52
7,73
7,99
8,32
8,76
9,35
10,20
11,60
13,90
19,1
36,5
286
17
6,78
6,85
6,94
7,03
7,14
7,27
7,42
7,59
7,81
8,07
8,41
8,85
9,46
10,30
11,70
14,10
19,3
37,0
290
18
6,84
6,91
7,00
7,09
7,20
7,33
7,48
7,66
7,88
8,15
8,49
8,94
9,55
10,40
11,80
14,20
19,5
37,5
294
19
122
| DELINEAMENTO DE EXPERIMENTOS
28/05/2014 15:55:30
4,37
4,28
3,89
3,82
3,76
3,70
3,64
30
40
60
120
delineamento_de_experimentos-prova4.indd 123
∞
4,12
4,20
4,45
4,54
3,96
24
4,64
4,02
20
4,40
4,50
4,60
4,70
4,80
4,91
5,02
4,60
4,71
4,82
4,93
5,05
5,17
5,29
4,76
4,87
4,99
5,11
5,24
5,37
5,51
4,88
5,01
5,13
5,27
5,40
5,54
5,69
4,99
5,12
5,25
5,39
5,54
5,69
5,84
5,08
5,21
5,36
5,50
5,65
5,81
5,97
5,16
5,30
5,45
5,60
5,76
5,92
6,09
5,23
5,38
5,53
5,69
5,85
6,02
6,19
5,29
5,44
5,60
5,77
5,93
6,11
6,29
5,35
5,51
5,67
5,84
6,01
6,19
6,37
5,40
5,56
5,73
5,90
6,08
6,26
6,45
5,45
5,61
5,79
5,96
6,14
6,33
6,52
5,49
5,66
5,84
6,02
6,20
6,39
6,59
5,54
5,71
5,89
6,07
6,26
6,45
6,65
5,57
5,75
5,93
6,12
6,31
6,51
6,71
5,61
5,79
5,98
6,17
6,36
6,56
6,76
Tabelas | 123
28/05/2014 15:55:30
18
6,08
4,50
3,93
3,64
3,46
3,34
3,26
3,20
3,15
3,11
3,08
3,06
3,03
3,01
3,00
2,98
2,97
2,96
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
2
1
Nº de graus de
liberdade do
resíduo
delineamento_de_experimentos-prova4.indd 124
3,59
3,61
3,63
3,65
3,67
3,70
3,73
3,77
3,82
3,88
3,95
4,04
4,16
4,34
4,60
5,04
5,9
8,33
27
3
3,98
4,00
4,02
4,05
4,08
4,11
4,15
4,20
4,26
4,33
4,41
4,53
4,68
4,90
5,22
5,76
6,8
9,80
32,8
4
4,25
4,28
4,30
4,33
4,37
4,41
4,45
4,51
4,57
4,65
4,76
4,89
5,06
5,30
5,67
6,29
7,5
10,9
37,1
5
4,47
4,49
4,52
4,56
4,59
4,64
4,69
4,75
4,82
4,91
5,02
5,17
5,36
5,63
6,03
6,71
8,0
11,7
40,4
6
4,65
4,67
4,70
4,74
4,78
4,83
4,88
4,95
5,03
5,12
5,24
5,40
5,61
5,90
6,33
7,05
8,5
12,4
43,1
7
4,79
4,82
4,86
4,90
4,94
4,99
5,05
5,12
5,20
5,30
5,43
5,60
5,82
6,12
6,58
7,35
8,9
13,0
45,4
8
4,92
4,96
4,99
5,03
5,08
5,13
5,19
5,27
5,35
5,46
5,59
5,77
6,00
6,32
6,80
7,60
9,2
13,5
47,4
9
5,04
5,07
5,11
5,15
5,20
5,25
5,32
5,39
5,49
5,60
5,74
5,92
6,16
6,49
6,99
7,83
9,5
14,0
49,1
10
5,14
5,17
5,21
5,26
5,31
5,36
5,43
5,51
5,61
5,72
5,87
6,05
6,30
6,65
7,17
8,03
9,7
14,4
50,6
11
5,23
5,27
5,31
5,35
5,40
5,46
5,53
5,61
5,71
5,83
5,98
6,18
6,43
6,79
7,32
8,21
10,0
14,7
52
12
Número de tratamentos (k)
Tabela 9.7 Distribuição “studentized range” [ q(0,05;ϕ) ] : Tukey (5%)
5,31
5,35
5,39
5,44
5,49
5,55
5,63
5,71
5,81
5,93
6,09
6,29
6,55
6,92
7,47
8,37
10,2
15,1
53,2
13
5,39
5,43
5,47
5,52
5,57
5,64
5,71
5,80
5,90
6,03
6,19
6,39
6,66
7,03
7,60
8,52
10,3
15,4
54,3
14
5,46
5,50
5,54
5,59
5,65
5,71
5,79
5,88
5,98
6,11
6,28
6,48
6,76
7,14
7,72
8,66
10,5
15,7
55,4
15
5,53
5,57
5,61
5,66
5,72
5,79
5,86
5,95
6,06
6,19
6,36
6,57
6,85
7,24
7,83
8,79
10,7
15,9
56,3
16
5,59
5,63
5,67
5,73
5,78
5,85
5,93
6,02
6,13
6,27
6,44
6,65
6,94
7,34
7,93
8,91
10,8
16,1
57,2
17
5,65
5,69
5,73
5,79
5,85
5,91
5,99
6,09
6,20
6,34
6,51
6,73
7,02
7,43
8,03
9,03
11,0
16,4
58
18
5,70
5,74
5,79
5,84
5,90
5,97
6,05
6,15
6,27
6,40
6,58
6,80
7,10
7,51
8,12
9,13
11,1
16,6
58,8
19
5,75
5,79
5,84
5,90
5,96
6,03
6,11
6,21
6,33
6,47
6,64
6,87
7,17
7,59
8,21
9,23
11,2
16,8
59,6
20
124
| DELINEAMENTO DE EXPERIMENTOS
28/05/2014 15:55:30
3,44
3,40
2,89
2,86
2,83
2,80
2,77
30
40
60
120
delineamento_de_experimentos-prova4.indd 125
∞
3,31
3,36
3,49
3,53
2,92
24
3,58
2,95
20
3,63
3,68
3,74
3,79
3,85
3,90
3,96
3,86
3,92
3,98
4,04
4,10
4,17
4,23
4,03
4,10
4,16
4,23
4,30
4,37
4,45
4,17
4,24
4,31
4,39
4,46
4,54
4,62
4,29
4,36
4,44
4,52
4,60
4,68
4,77
4,39
4,47
4,55
4,63
4,72
4,81
4,90
4,47
4,56
4,65
4,73
4,82
4,92
5,01
4,55
4,64
4,73
4,82
4,92
5,01
5,11
4,62
4,71
4,81
4,90
5,00
5,10
5,20
4,68
4,78
4,88
4,98
5,08
5,18
5,28
4,74
4,84
4,94
5,04
5,15
5,25
5,36
4,80
4,90
5,00
5,11
5,21
5,32
5,43
4,85
4,95
5,06
5,16
5,27
5,38
5,49
4,89
5,00
5,11
5,22
5,33
5,44
5,55
4,93
5,04
5,15
5,27
5,38
5,49
5,61
4,97
5,09
5,20
5,31
5,43
5,55
5,66
5,01
5,13
5,24
5,36
5,47
5,59
5,71
Tabelas | 125
28/05/2014 15:55:31
delineamento_de_experimentos-prova4.indd 126
3,32
3,27
3,33
3,01
2,85
2,75
2,68
2,63
2,59
2,56
2,54
2,52
2,50
2,49
2,48
2,47
2,46
2,45
2,45
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
3,09
3,10
3,11
3,12
3,14
3,16
3,18
3,20
3,23
3,37
3,45
3,56
3,72
3,98
4,47
5,73
4,13
3
3
13,40
2
2
8,93
4
3,47
3,49
3,50
3,52
3,54
3,56
3,59
3,62
3,66
3,70
3,76
3,83
3,93
4,07
4,26
4,59
5,20
6,77
16,40
5
3,75
3,77
3,78
3,80
3,83
3,85
3,88
3,92
3,96
4,02
4,08
4,17
4,28
4,44
4,66
5,03
5,74
7,54
18,50
6
3,97
3,98
4,00
4,03
4,05
4,08
4,12
4,16
4,20
4,26
4,34
4,43
4,55
4,73
4,98
5,39
6,16
8,14
20,20
7
4,14
4,16
4,18
4,21
4,23
4,27
4,30
4,35
4,40
4,47
4,54
4,65
4,78
4,97
5,24
5,68
6,51
8,63
21,50
8
4,29
4,31
4,33
4,36
4,39
4,42
4,46
4,51
4,57
4,64
4,72
4,83
4,97
5,17
5,46
5,93
6,81
9,05
22,60
9
4,42
4,44
4,46
4,49
4,52
4,56
4,60
4,65
4,71
4,78
4,87
4,99
5,14
5,34
5,65
6,14
7,06
9,41
23,60
4,53
4,55
4,58
4,61
4,64
4,68
4,72
4,78
4,84
4,91
5,01
5,13
5,28
5,50
5,82
6,33
7,29
9,72
24,50
10
4,63
4,65
4,68
4,71
4,75
4,79
4,83
4,89
4,95
5,03
5,13
5,25
5,41
5,64
5,97
6,49
7,49
10,00
25,20
11
4,72
4,75
4,77
4,81
4,84
4,88
4,93
4,99
5,05
5,13
5,23
5,36
5,53
5,76
6,10
6,65
7,67
10,30
25,90
12
Número de tratamentos (k)
Distribuição “studentized range” [ q(0,10;ϕ) ] : Tukey (10%)
1
Nº de graus
de liberdade
do resíduo
Tabela 9.8
13
4,80
4,83
4,86
4,89
4,93
4,97
5,02
5,08
5,15
5,23
5,33
5,46
5,64
5,87
6,22
6,78
7,83
10,50
26,50
14
4,88
4,90
4,93
4,97
5,01
5,05
5,10
5,16
5,23
5,32
5,42
5,56
5,74
5,98
6,34
6,91
7,98
10,70
27,10
15
4,95
4,98
5,01
5,04
5,08
5,12
5,18
5,24
5,31
5,40
5,51
5,64
5,83
6,07
6,44
7,02
8,12
10,90
27,60
16
5,01
5,04
5,07
5,11
5,15
5,19
5,25
5,31
5,38
5,47
5,58
5,72
5,91
6,16
6,54
7,13
8,25
11,10
28,10
17
5,07
5,10
5,13
5,17
5,21
5,26
5,31
5,37
5,45
5,54
5,66
5,80
5,99
6,25
6,63
7,23
8,37
11,20
28,50
18
5,13
5,16
5,19
5,23
5,27
5,32
5,37
5,44
5,51
5,61
5,72
5,87
6,06
6,32
6,71
7,33
8,48
11,40
29,00
19
5,18
5,21
5,24
5,28
5,32
5,37
5,43
5,49
5,57
5,67
5,79
5,93
6,13
6,40
6,79
7,41
8,58
11,50
29,30
20
5,23
5,26
5,30
5,33
5,38
5,43
5,48
5,55
5,63
5,73
5,85
6,00
6,19
6,47
6,86
7,50
8,68
11,70
29,70
126
| DELINEAMENTO DE EXPERIMENTOS
28/05/2014 15:55:31
2,99
2,96
2,40
2,38
2,36
2,34
2,33
30
40
60
120
delineamento_de_experimentos-prova4.indd 127
∞
2,90
2,93
3,02
3,05
2,42
24
3,08
2,44
20
3,24
3,28
3,31
3,35
3,39
3,42
3,46
3,48
3,52
3,56
3,60
3,65
3,69
3,74
3,66
3,71
3,75
3,80
3,85
3,90
3,95
3,81
3,86
3,91
3,96
4,02
4,07
4,12
3,93
3,99
4,04
4,10
4,16
4,21
4,27
4,04
4,10
4,16
4,21
4,28
4,34
4,40
4,13
4,19
4,25
4,32
4,38
4,44
4,51
4,21
4,28
4,34
4,41
4,47
4,54
4,61
4,28
4,35
4,42
4,49
4,56
4,63
4,70
4,35
4,42
4,49
4,56
4,64
4,71
4,78
4,41
4,48
4,56
4,63
4,71
4,78
4,85
4,47
4,54
4,62
4,69
4,77
4,85
4,92
4,52
4,60
4,67
4,75
4,83
4,91
4,99
4,57
4,65
4,73
4,81
4,89
4,97
5,05
4,61
4,69
4,78
4,86
4,94
5,02
5,10
4,65
4,74
4,82
4,90
4,99
5,07
5,16
4,69
4,78
4,86
4,95
5,03
5,12
5,20
Tabelas | 127
28/05/2014 15:55:31
128
| DELINEAMENTO DE EXPERIMENTOS
Tabela 9.9 Valores críticos do coeficiente de correlação linear de Pearson (teste bilateral)
delineamento_de_experimentos-prova4.indd 128
n
a=0,05
a=0,01
4
0,95
0,99
5
0,878
0,959
6
0,811
0,917
7
0,754
0,874
8
0,707
0,834
9
0,666
0,798
10
0,632
0,765
11
0,602
0,735
12
0,576
0,708
13
0,553
0,684
14
0,532
0,661
15
0,514
0,641
16
0,497
0,623
17
0,482
0,606
18
0,468
0,59
19
0,456
0,575
20
0,444
0,561
21
0,433
0,549
22
0,423
0,537
23
0,413
0,526
24
0,404
0,515
25
0,396
0,505
26
0,388
0,496
27
0,381
0,487
28
0,374
0,478
29
0,367
0,47
30
0,361
0,463
35
0,335
0,43
40
0,312
0,402
45
0,294
0,378
50
0,279
0,361
60
0,254
0,33
70
0,236
0,305
80
0,22
0,286
90
0,207
0,269
100
0,196
0,256
28/05/2014 15:55:31
Carlos Roberto Padovani
Cultura
Acadêmica
Carlos Roberto Padovani
Carlos Roberto Padovani é professor titular de Bioestatística do Instituto de Biociências, Unesp, câmpus de Botucatu, tendo atuado como professor e/ou orientador
de Programas de Pós-Graduação da USP, Unicamp, Unesp, UFMT e UnB. Foi bolsista produtividade do CNPq; membro da Comissão de Avaliação de Programas de
Pós-Graduação junto à Capes; coordenador da Área de Ciências Biológicas junto
à Runesp, presidente da Região Brasileira da Sociedade Internacional de Biometria.
Atualmente ministra disciplinas da área de Estatística na graduação e de Bioestatística
e Metodologia da Pesquisa Científica em vários programas de Pós-Graduação na Unesp,
com orientações em nível de Mestrado e Doutorado e supervisão de Pós-Doutorado.
DELINEAMENTO DE EXPERIMENTOS
O texto apresenta noções básicas, históricas e conceituais de delineamentos experimentais, em particular dos planejamentos inteiramente casualizado e em blocos completos
casualizados, complementado com os esquemas fatoriais, correlação e regressão linear
simples e testes de aderência e associação para variáveis categorizadas. A abordagem não
os cálculos estatísticos, mas sim, trazendo à realidade o planejamento e o desenvolvimento
da experimentação aos alunos das áreas de Ciências Biológicas e da Saúde.
Capa_Delineamento_minha versao.indd 1
DELINEAMENTO DE EXPERIMENTOS
é realizada sob o aspecto tradicional de fórmulas e uso de “pacotes” computacionais para
19/05/2014 18:17:16
Download

DELINEAMENTO DE EXPERIMENTOS