Carlos Roberto Padovani Cultura Acadêmica Carlos Roberto Padovani Carlos Roberto Padovani é professor titular de Bioestatística do Instituto de Biociências, Unesp, câmpus de Botucatu, tendo atuado como professor e/ou orientador de Programas de Pós-Graduação da USP, Unicamp, Unesp, UFMT e UnB. Foi bolsista produtividade do CNPq; membro da Comissão de Avaliação de Programas de Pós-Graduação junto à Capes; coordenador da Área de Ciências Biológicas junto à Runesp, presidente da Região Brasileira da Sociedade Internacional de Biometria. Atualmente ministra disciplinas da área de Estatística na graduação e de Bioestatística e Metodologia da Pesquisa Científica em vários programas de Pós-Graduação na Unesp, com orientações em nível de Mestrado e Doutorado e supervisão de Pós-Doutorado. DELINEAMENTO DE EXPERIMENTOS O texto apresenta noções básicas, históricas e conceituais de delineamentos experimentais, em particular dos planejamentos inteiramente casualizado e em blocos completos casualizados, complementado com os esquemas fatoriais, correlação e regressão linear simples e testes de aderência e associação para variáveis categorizadas. A abordagem não os cálculos estatísticos, mas sim, trazendo à realidade o planejamento e o desenvolvimento da experimentação aos alunos das áreas de Ciências Biológicas e da Saúde. Capa_Delineamento_minha versao.indd 1 DELINEAMENTO DE EXPERIMENTOS é realizada sob o aspecto tradicional de fórmulas e uso de “pacotes” computacionais para 19/05/2014 18:17:16 DELINEAMENTO DE EXPERIMENTOS delineamento_de_experimentos-prova4.indd 1 28/05/2014 15:49:15 Universidade Estadual Paulista Reitorr Julio Cezar Durigan Pró-Reitor de Graduação Laurence Duarte Colvara Pró-Reitor de Pós-Graduação Eduardo Kokubun Pró-Reitora de Pesquisa Maria José Soares Mendes Giannini Pró-Reitora de Extensão Universitária Mariângela Spotti Lopes Fujita Pró-Reitor de Administração Carlos Antonio Gamero Secretária Gerall Maria Dalva Silva Pagotto Chefe de Gabinete Roberval Daiton Vieira delineamento_de_experimentos-prova4.indd 2 28/05/2014 15:49:17 Cultura Acadêmica Carlos Roberto Padovani DELINEAMENTO DE EXPERIMENTOS São Paulo 2014 delineamento_de_experimentos-prova4.indd 3 28/05/2014 15:49:17 ©Pró-Reitoria de Graduação, Universidade Estadual Paulista, 2014. Padovani, Carlos Roberto Delineamento de experimentos / Carlos Roberto Padovani. – São Paulo : Cultura Acadêmica : Universidade Estadual Paulista, Pró-Reitoria de Graduação, 2014 128 p. : tabs. P124d Bibliografia ISBN: 978-85-7983-523-0 1. Planejamento Experimental. 2. Bioestatística. I. Título. II. Universidade Estadual Paulista. Pró-Reitoria de Graduação. CDD 378.8161 Ficha catalográfica elaborada pela Coordenadoria Geral de Bibliotecas da Unesp equipe Pró-reitorr Laurence Duarte Colvara Secretária Joana Gabriela Vasconcelos Deconto Assessoria José Brás Barreto de Oliveira Maria de Lourdes Spazziani Valéria Nobre Leal de Souza Oliva Técnica Bambina Maria Migliori Camila Gomes da Silva Cecília Specian Eduardo Luis Campos Lima Gisleide Alves Anhesim Portes Ivonette de Mattos Maria Emília Araújo Gonçalves Maria Selma Souza Santos Renata Sampaio Alves de Souza Sergio Henrique Carregari Projeto gráfico e diagramação Andrea Yanaguita delineamento_de_experimentos-prova4.indd 4 28/05/2014 15:49:17 PROGRAMA DE APOIO À PRODUÇÃO DE MATERIAL DIDÁTICO Considerando a importância da produção de material didático-pedagógico dedicado ao ensino de graduação e de pós-graduação, a Reitoria da UNESP, por meio da Pró-Reitoria de Graduação (PROGRAD) e em parceria com a Fundação Editora UNESP (FEU), mantém o Programa de Apoio à Produção de Material Didático de Docentes da UNESP, que contempla textos de apoio às aulas, material audiovisual, homepages, softwares, material artístico e outras mídias, sob o selo CULTURA ACADÊMICA da Editora da UNESP, disponibilizando aos alunos material didático de qualidade com baixo custo e editado sob demanda. Assim, é com satisfação que colocamos à disposição da comunidade acadêmica mais esta obra, “Delineamento de Experimentos”, de autoria do Prof. Dr. Carlos Roberto Padovani, do Instituto de Biociências do Câmpus de Botucatu, esperando que ela traga contribuição não apenas para estudantes da UNESP, mas para todos aqueles interessados no assunto abordado. delineamento_de_experimentos-prova4.indd 5 28/05/2014 15:49:17 delineamento_de_experimentos-prova4.indd 6 28/05/2014 15:49:18 SUMÁRIO 1. Delineamento de Experimentos 9 1.1. Introdução 9 1.2. Delineamento ou Planejamento ou Desenho (“Design”) do Experimento 13 1.3. Delineamentos Experimentais 17 1.4. Exemplos 18 2. Delineamento Inteiramente Casualizado (DIC) 20 2.1. Introdução 20 2.2. Modelo do Experimento DIC com Dados Balanceados 20 2.3. Procedimento Estatístico: Análise de Variância 22 2.4. Independência dos Erros 23 2.5. Variância Constante (Homocedasticidade) 25 2.6. Normalidade dos Erros 26 2.7. Técnica da Análise de Variância (ANOVA) 29 2.8. Coeficientes de Determinação e Variação de um Experimento 33 2.9. Comparações Múltiplas 34 2.10. Exercícios (DIC com Dados Balanceados) 36 2.11. Respostas dos Exercícios (DIC com Dados Balanceados) 38 2.12. Modelo do Experimento DIC com Dados Não Balanceados 40 2.13. Exercícios (DIC Não Balanceado) 43 2.14. Respostas dos Exercícios (DIC Não Balanceado) 44 3. Delineamento em Blocos Completos Casualizados (DBCC) 3.1. Introdução 47 3.2. Modelo do Experimento (Biológico) 49 3.3. Procedimento Estatístico: Análise de Variância 50 3.4. Comparações Múltiplas 53 3.5. Exercícios (DBCC) 54 3.6. Respostas dos Exercícios (DBCC) 55 4. Esquemas Fatoriais 57 4.1. Introdução 57 4.2. Esquema Fatorial a*b no DIC 58 4.3. Exemplo de Fatorial a*b no DIC 63 4.4. Esquema Fatorial a*b no DBCC 65 4.5. Exemplo de Fatorial a*b no DBCC 68 4.6. Exercícios (Esquemas Fatoriais: DIC e DBCC) 71 4.7. Respostas dos Exercícios (Esquemas Fatoriais : DIC e DBCC) 5. 47 72 Análise de Aderência e Associação 75 5.1. Introdução 75 5.2. Teste de Aderência 75 5.3. Teste de Homogeneidade 78 5.4. Teste de Independência 82 delineamento_de_experimentos-prova4.indd 7 28/05/2014 15:49:18 5.5. 5.6. 6. 7. Exercícios (Testes de Aderência e Associação) 84 Respostas dos Exercícios (Testes de Aderência e Associação) Correlação Linear Simples 89 6.1. Introdução 89 6.2. Diagrama de Dispersão 90 6.3. Coeficiente de Correlação 91 6.4. Teste de Hipótese da Correlação 94 6.5. Exercícios (Correlação Linear Simples) 95 6.6. Respostas dos Exercícios (Correlação Linear Simples) 98 Regressão Linear Simples 101 7.1. Introdução 101 7.2. Modelo de Regressão Linear Simples 102 7.3. Coeficiente de Determinação 107 7.4. Teste do Coeficiente (Angular) de Regressão 108 7.5. Exercícios (Regressão Linear Simples) 109 7.6. Respostas dos Exercícios (Regressão Linear Simples) 112 8. Bibliografia 9. Tabelas 117 87 115 Tabela 9.1 Distribuição t de Student ⎡ P (−t 0 < t < t 0 ) = 1− a ⎤ ⎣ ⎦ Tabela 9.2 Distribuição Qui-quadrado ⎡ P (χ 2 > χ 2 ) = α ⎤ 0 ⎢⎣ ⎥⎦ Tabela 9.3 Distribuição F ⎡ P (F > F0 ) = 0, 01⎤ ⎣ ⎦ 119 Tabela 9.4 Distribuição F ⎡ P (F > F0 ) = 0, 05⎤ ⎣ ⎦ 120 Tabela 9.5 Distribuição F ⎡ P (F > F0 ) = 0,10⎤ ⎣ ⎦ 121 117 118 Tabela 9.6 Distribuição “studentized range” [ q(0 ,01;ϕ) ] : Tukey (1%) 122 Tabela 9.7 Distribuição “studentized range” [ q(0 ,05;ϕ) ] : Tukey (5%) 124 Tabela 9.8 Distribuição “studentized range” [ q(0 ,10 ;ϕ) ] : Tukey (10%) 126 Tabela 9.9 Valores críticos do coeficiente de correlação linear de Pearson (teste bilateral) 128 delineamento_de_experimentos-prova4.indd 8 28/05/2014 15:49:18 1 DELINEAMENTO DE EXPERIMENTOS 1.1 INTRODUÇÃO Sir Ronald Aylmer Fisher (1890-1962) nasceu em Londres no dia 17 de fevereiro de 1890 e bacharelou-se em Matemática pela Universidade de Cambridge em 1912. Sua miopia exagerada salvou da convocação para o serviço militar na 1ª Guerra Mundial, defeito que possibilitou desenvolver um treinamento matemático de alta abstração (visualização no plano imaginário) o que deve ter contribuído para sua preferência pela apresentação hipergeométrica, possibilitando assim a exibir soluções singulares independentes de simbolismo algébrico. No início do século XX, em 1919, após trabalhar dois anos como estatístico e mais quatro como professor de matemática e física em escolas públicas recebeu o convite para criar e chefiar um laboratório de estatística na Estação Experimental de Agricultura de Rothamstead, Inglaterra, onde permaneceu até 1933. Durante este período, unido a outros estatísticos e pelo contato diário com problemas da área agrícola, Fisher desenvolveu os métodos de análise e os delineamentos experimentais, conforme descreve SALSBURG(2009). Caracteriza-se por delineamento do experimento ou delineamento experimental (experimental design, em inglês, diseño experimental, em espanhol) o modo de dispor as parcelas no experimento, ou seja, a maneira de designar os tratamentos às unidades experimentais ou parcelas. A técnica mais fisheriana tratase de análise de variância. Juntamente com a análise de covariância, também de sua autoria, constitui-se no instrumental básico para interpretação dos resultados dos experimentos planejados. Deve ser destacado que esses métodos procedentes do cotidiano agrícola se tornaram universais e aplicáveis em todas delineamento_de_experimentos-prova4.indd 9 28/05/2014 15:49:21 10 | DELINEAMENTO DE EXPERIMENTOS as áreas de conhecimento: medicina, psicologia, engenharia, odontologia, biologia, ecologia, entre outras. Porém, como a formalização dos procedimentos ocorreu em um ambiente agrícola, a origem dos termos técnicos da experimentação apresenta conotação bem agronômica. Assim o termo parcela foi criado para designar a unidade de área usada no experimento. Essa unidade de área era, originalmente, uma faixa de terra ou um vaso. Hoje, parcela, tem um significado mais geral, pois, dependendo do experimento pode ser um animal, uma pessoa, uma peça anatômica, um corpo de prova, entre várias outras possibilidades que podem ser utilizadas como unidades experimentais. A terminologia mais utilizada, atualmente consiste em designar parcela por unidade experimental, que consiste na unidade física ou biológica para conduzir o experimento. De mesma maneira, o termo tratamento também foi introduzido pela área agrícola. Indicava o que estava em comparação: fertilizantes, inseticidas, variedades, nutrientes. Hoje o termo tratamento tem um significado mais geral. Muitos experimentos são feitos para comparar métodos, grupos, produtos, máquinas, materiais e, inclusive, combinações destes. Mas o interesse, em experimentação, nem sempre é de comparar tratamentos. Muitas vezes, pretende-se apenas saber se determinado tratamento produz efeito (nesse caso, compara-se um grupo que recebeu tratamento - Grupo Tratado – com um grupo que não recebeu o tratamento – Grupo Controle ou Testemunha). A respeito do grupo controle duas considerações quanto à sua constituição podem ser feitas: Controle Negativo e Controle Positivo. O grupo controle negativo é composto por unidades experimentais que não recebem tratamento (“virgem de tratamento”), ou recebem apenas placebo (substância inerte). No entanto, o grupo controle positivo, constitui-se de unidades que recebem o tratamento padrão ou convencional. Na prática, a terminologia grupo controle ou testemunha é utilizada como sinônimo de controle negativo. delineamento_de_experimentos-prova4.indd 10 28/05/2014 15:49:21 Delineamento de Experimentos | 11 Embora o uso de grupo controle já esteja consagrado em experimentação, na área médica, torna-se fundamental discutir a ética de constituir o grupo controle negativo. Neste sentido, a experimentação com seres humanos exige um aprofundamento quanto às questões éticas do uso de placebo (controle negativo), inclusive pelo fato de se caracterizar por omissão de tratamento. A exequibilidade do experimento está subordinada ao princípio básico da repetição, segundo o qual indica que se deve ter repetições do experimento para que seja possível produzir uma medida de variabilidade que permitirá a realização dos testes de hipóteses sobre a presença de efeitos dos tratamentos ou à estimação desses efeitos. O número de unidades experimentais (parcelas ou repetições) para cada tratamento deve ser determinado a partir de informações sobre a variabilidade das parcelas em termos da variável resposta (dependente), custo e poder dos testes de significância. Em experimentação a proposta básica que se formula consiste em comparar grupos, não apenas unidades. As medidas experimentais do mesmo grupo recebem o nome de repetições. Do ponto de vista estatístico é sempre desejável que os experimentos tenham grande número de repetições por grupo. Na prática, muitas vezes, o número de repetições fica limitado aos recursos (físicos, financeiros, materiais,...) disponíveis. Um dado importante que deve ser considerado para o tamanho dos grupos, consiste em: quanto mais homogêneo for o material - em termos de características que possam interferir nas observações ou medições que serão feitas - menor será o número de repetições necessário para evidenciar o efeito significativo de tratamentos. No contexto experimental, define-se fator como uma característica em estudo da qual há interesse em verificar a inferência sobre uma resposta do experimento, conforme destacam ANDRADE & OGLIARI (2007). Os níveis do fator constituem os tratamentos do estudo. Um fator é indicado como quantitativo quando seus níveis são referentes a quantidades (doses de uma droga, níveis de delineamento_de_experimentos-prova4.indd 11 28/05/2014 15:49:21 12 | DELINEAMENTO DE EXPERIMENTOS adubação, etc). Por outro lado, um fator é referido qualitativo quando seus níveis são relativos a atributos (diferentes dietas, variedades de capim, etc). Definidos os fatores e seus respectivos níveis que serão designados como os tratamentos do estudo, a unidade experimental (parcela) e a variável dependente, torna-se necessário estabelecer qual o esquema de alocação dos tratamentos às unidades experimentais será utilizado, ou seja, como deve ser conduzido o delineamento experimental. Para formar grupos tão iguais quanto possível é fundamental que os tratamentos sejam sorteados às unidades experimentais (casualização). Ou seja, o que importa é entender que os tratamentos devem ser designados às unidades experimentais por puro e simples sorteio. A casualização teve início em 1920 na área agronômica, porém, na pesquisa médica, só começou a ser aceita muito mais tarde. A idéia de “sortear” os pacientes que irão receber o tratamento pode levantar questões de ética. Os que fazem objeções ao uso de casualização em experimentos médicos usam o argumento de que não é ético “sortear” o tratamento para alguns pacientes e deixar outros sem tratamento. Ora, essa objeção refere-se à condução do experimento e não à técnica de casualizar. Não existem alternativas válidas para a casualização. O pesquisador que escolhe as unidades por critério próprio por melhores que sejam as intenções, introduz tendenciosamente nos resultados. O princípio da casualização pode ser considerado como uma das maiores contribuições dos procedimentos estatísticos à ciência experimental, pois nele está assegurada a fidedignidade das conclusões. O efeito de proceder a casualização constitui-se na garantia que parcelas (unidades experimentais) com características diferentes tenham igual probabilidade de serem designadas para todos os grupos. delineamento_de_experimentos-prova4.indd 12 28/05/2014 15:49:22 Delineamento de Experimentos | 13 1.2 DELINEAMENTO OU PLANEJAMENTO OU DESENHO (“DESIGN”) DO EXPERIMENTO O procedimento geral e comum na pesquisa científica consiste em formular hipóteses (afirmativas sob julgamento) e verificá-las diretamente ou por suas consequências. Neste sentido, faz-se necessário um conjunto de observações e o planejamento de experimentos é então imprescindível para indicar o procedimento que será utilizado para verificar se as hipóteses são verdadeiras ou falsas. As hipóteses são avaliadas por meio de métodos de tomada de decisão estatística (teoria das probabilidades) cujos procedimentos quantitativos e análises objetivas (teoria estatística) dependem da maneira sob a qual as observações foram obtidas. Procedimento bem distinto da matemática no qual para calcular a área de uma figura plana, por exemplo, de um triângulo, basta multiplicar sua base por sua altura e dividir por dois que se obtém de maneira exata o valor numérico relativo à área desejada. Nas áreas das ciências biológicas a situação é bem mais complexa, surgem inúmeras causas de variação de controle impossível ou só parcialmente possível (variações genéticas, erros de medidas inerentes à precisão dos aparelhos, efeitos sazonais, etc). Essas causas de variação, várias e às vezes até desconhecidas ou mal conhecidas, acumulam variações nos dados observados que possibilitam alterar em menor ou maior intensidade os resultados das unidades experimentais, cuja precisão deve ser discutida em termos probabilísticos de quão prováveis são os valores encontrados. Neste contexto, troca-se a exatidão da matemática pela construção probabilística das possibilidades dos resultados encontrados nos dados (precisão das informações estatísticas). O planejamento experimental e a análise estatística dos resultados estão interligados e, desta forma, devem ser considerados de maneira sucessiva nas pesquisas científicas de todas as áreas de conhecimento (Sampaio, 2010). delineamento_de_experimentos-prova4.indd 13 28/05/2014 15:49:22 14 | DELINEAMENTO DE EXPERIMENTOS Existe uma semelhança muito expressiva entre o médico e o estatístico (“cuidador da saúde dos números”). O primeiro passo para o médico é o diagnóstico (para o estatístico, o planejamento); saber onde há necessidade de cura (qual o modelo para coleta de dados). A primeira atitude dos médicos é examinar os sintomas – se você chegar ao médico já pedindo determinado remédio, não será atendido; antes, é preciso saber quais os sintomas aparentes do problema, detectando os sintomas físicos (material e métodos) e emocionais (imparcialidade e não viés de planejamento) – para finalmente realizar a prescrição. Assim acontece com a estatística, a análise dos dados (prescrição de remédio) deve acontecer após o conhecimento dos sintomas (características da pesquisa em estudo) para que se tenha o diagnóstico (modelo do delineamento experimental). Segundo Sir Ronald Aylmer Fisher, o arquiteto da estatística experimental: “Chamar o especialista em estatística depois que o experimento foi feito pode ser o mesmo que pedir para ele fazer um exame post-mortem. Talvez ele consiga dizer de que foi que o experimento morreu”. A melhor maneira para a visualização sequencial destes aspectos consiste em considerar a circularidade do método científico, no qual pode-se verificar a necessidade e a importância do planejamento experimental juntamente com a análise estatística de dados. delineamento_de_experimentos-prova4.indd 14 28/05/2014 15:49:22 Delineamento de Experimentos | 15 Observações (2) (Planejamento) Formulação de hipóteses (1) Verificação das hipóteses (3) (Planejamento) (Análise) Desenvolvimento da Teoria (4) Uma pesquisa científica estatisticamente planejada deve seguir a seguinte sequência de passos quanto ao planejamento e execução: 1. Enunciado claro do problema e formulação das hipóteses que serão estudadas (as hipóteses científica e estatística devem manter uma correspondência perfeita e o enunciado apresentar-se de maneira clara e objetiva). 2. Indicação dos fatores (variáveis independentes – variáveis controladas pelo pesquisador) do estudo (a escolha dos fatores e seus respectivos níveis constituirão os tratamentos). 3. Indicação da unidade experimental (parcela). Deve ser definida no sentido de minimizar o erro experimental. 4. Indicação das variáveis (variáveis respostas) que serão medidas na unidade experimental (a distribuição probabilística associada à variável resposta é essencial para a escolha do método de análise estatística). 5. Indicação das regras e procedimentos pelos quais os diferentes tratamentos (combinação de níveis de fatores) serão atribuídos às unidades experimentais (processo de casualização ou aleatorização). 6. Análise estatística dos dados do experimento (tem como objetivo verificar as hipóteses estabelecidas no início da pesquisa). 7. Descrição dos resultados analíticos com as medidas de precisão das estimativas e o respectivo nível de significância nas interpretações inferenciais. delineamento_de_experimentos-prova4.indd 15 28/05/2014 15:49:22 16 | DELINEAMENTO DE EXPERIMENTOS Para melhor entendimento das características e as etapas do planejamento experimental, suponha que o interesse de um pesquisador consista em comparar duas dietas (normocalórica e hipercalórica) quanto ao desempenho ponderal final de ratos Wistar-Kyoto submetidos aos tratamentos (dietas) por um período final de 12 semanas. Caracteriza-se que o experimento está planejado quando estão definidos: i. a unidade experimental (animal – rato Wistar); ii. a variável em análise (resposta) e a forma como será medida (variação percentual do ganho de peso, medido pela diferença 100(PF - PI ) % ), sendo PI PF o peso final e PI o peso inicial; iii. tratamentos em comparação (dieta normocalórica e dieta hipercalórica); iv. forma de designar os tratamentos às unidades experimentais (por sorteio) considerando que os animais são homogêneos; v. o número de ratos de cada dieta será de 12 unidades. Os itens iv e v formam os princípios básicos da experimentação: casualiza- ção (fidedignidade) e a repetição (exequibilidade). As hipóteses de interesse da pesquisa são verificadas com a utilização de métodos de análise estatística que dependem da maneira sob a qual as observações foram obtidas, ou seja, sob qual modelo de casualização dos tratamentos às unidades experimentais os dados foram coletados. Portanto, planejamento de experimentos e análise dos dados coletados sob o modelo operacional utilizado não podem ser considerados isolados, pois a ordem dos acontecimentos está em uma sequência dentro do desenvolvimento nas pesquisas. O procedimento estatístico exigido ao analisar dados experimentais ou observacionais fundamenta-se em gerar modelos que explicitem as estruturas do fenômeno biológico, as quais continuamente estão misturadas com variações casuais, aleatórias ou acidentais. Quanto mais identificada e entendida forem essas estruturas, maior conhecimento do fenômeno, assim como, melhores delineamento_de_experimentos-prova4.indd 16 28/05/2014 15:49:22 Delineamento de Experimentos | 17 serão as informações sobre os possíveis comportamentos do mesmo. Ou seja, tem-se uma aproximação consistente da realidade biológica expressa num modelo considerado (modelo é uma expressão resumida de algum fenômeno). A percepção biológica e a identidade estatística com o processo estocástico ponderam admitir cada observação composta por duas partes: uma previsível (controlada) e outra aleatória (não previsível). Cada observação pode ser representada pelo modelo: OBSERVAÇÃO = PREVISÍVEL + ALEATÓRIO , no caso aditivo, ou OBSERVAÇÃO = PREVISÍVEL × ALEATÓRIO , no caso multiplicativo. A parte previsível sistematiza o conhecimento que o pesquisador tem sobre o fenômeno, normalmente expressada por uma função matemática envolvendo parâmetros desconhecidos. À parte aleatória, dada sua característica de não previsibilidade, exige-se que esteja sujeita a algum modelo probabilístico. A partir destas considerações, seguindo o planejamento proposto para a coleta de informações (dados) nas unidades experimentais, o procedimento estatístico consiste em estabelecer estimativas para os parâmetros desconhecidos (propostos na parte sistematizada previsível segundo as hipóteses e os objetivos do pesquisador), baseando-se em amostras observadas. 1.3 DELINEAMENTOS EXPERIMENTAIS No contexto do planejamento de um experimento, torna-se essencial definir a maneira como os tratamentos serão designados às unidades. O processo de casualização envolvido no planejamento designando como os tratamentos serão alocados às unidades experimentais estabelecem o delineamento do experimento. Nesse contexto, serão apresentados no presente texto, duas situações comuns na área biológica, quais são: unidades homogêneas e unidades heterogêneas, conforme descrito a seguir. delineamento_de_experimentos-prova4.indd 17 28/05/2014 15:49:23 18 | DELINEAMENTO DE EXPERIMENTOS i. Delineamento Inteiramente Casualizado (DIC) Consiste em alocar de maneira inteiramente ao acaso os tratamentos às unidades experimentais. Para sua realização, exigem-se unidades experimentais homogêneas (similares). ii. Delineamento em Blocos Completos Casualizados (DBCC) Consiste em considerar grupos similares (blocos) de unidades experimentais, quando o conjunto é heterogêneo, e alocar casualmente os tratamentos às unidades experimentais dentro dos blocos. Na área biomédica o termo bloco é, geralmente, substituído por estrato. 1.4 EXEMPLOS Para melhor entendimento de um planejamento experimental são apresentados a seguir dois exemplos práticos. 4.1 Planeje um experimento para estudar (comparar) o uso de sobredoses de vitamina B12 na diminuição de aterosclerose, em pacientes com a doença. Unidade experimental: paciente com a doença. Variável resposta: diminuição da aterosclerose (diâmetro do calibre em mm). Tratamentos em comparação: dose padrão, sobredoses baixa, média e alta. Designação dos tratamentos: por sorteio. Número de repetições: oito doentes por tratamento. 4.2 Planeje um experimento para comparar quatro métodos de ensino da Linguagem Americana de Sinais em alunos de uma turma homogênea de 120 alunos. Unidade experimental: aluno da turma. Variável resposta: nota de um teste padrão de linguagem (0 a 100 pontos inteiros). delineamento_de_experimentos-prova4.indd 18 28/05/2014 15:49:23 Delineamento de Experimentos | 19 Tratamentos em comparação: métodos A, B, C, D. Designação dos tratamentos: sorteio do aluno participante. Número de repetições: 15 alunos por método. Sob o aspecto dos delineamentos experimentais mais utilizados nos exemplos práticos propostos em 1.4.1 e 1.4.2; o primeiro envolve como unidade experimental o ser humano (paciente com doença) com suas características biológicas heterogêneas, levando a necessidade do DBCC (são construídos grupos de quatro pacientes com características biológicas tão próximas quanto possível e então, procede-se o sorteio dos tratamentos). No segundo, como se trata de uma turma homogênea, o DIC é mais apropriado. delineamento_de_experimentos-prova4.indd 19 28/05/2014 15:49:23 delineamento_de_experimentos-prova4.indd 20 28/05/2014 15:49:23 2 DELINEAMENTO INTEIRAMENTE CASUALIZADO (DIC) 2.1 INTRODUÇÃO O primeiro planejamento experimental a ser abordado trata-se do Delineamento Inteiramente Casualizado (DIC), bastante simples quanto ao processo de alocação dos tratamentos às unidades experimentais. Para melhor desenvolvimento didático será apresentado, primeiramente com dados balanceados (mesmo número de repetições por tratamento) e, na sequência, com dados não balanceados (ausência da consideração de mesmo número de repetições por tratamento). 2.2 MODELO DO EXPERIMENTO DIC COM DADOS BALANCEADOS Este delineamento consiste em designar os tratamentos às unidades experimentais por puro e simples sorteio, isto é, sem qualquer tipo de restrição (equiprobabilidade para cada unidade experimental receber qualquer um dos tratamentos). A operacionalização do procedimento de alocação dos tratamentos fica condicionada à disponibilidade de parcelas similares no experimento (parcelas homogêneas). O entendimento de similaridade ou semelhança não deve ser confundido com igualdade (igualdade conceito muito matemático e “nada” provável em biologia). Esse plano experimental é tão mais eficiente quanto maior for o grau de homogeneidade entre as unidades experimentais em termos da variável dependente. Se as unidades experimentais são heterogêneas, o número de parcelas necessário para uma boa precisão pode ser muito grande (na prática devese procurar outros planejamentos experimentais, tais como blocos ou utilizar delineamento_de_experimentos-prova4.indd 21 28/05/2014 15:49:23 22 | DELINEAMENTO DE EXPERIMENTOS variáveis auxiliares – covariáveis, pois estes podem reduzir o erro experimental). Sob o aspecto dos procedimentos de testes estatísticos é aconselhável o balanceamento das repetições (todos tratamentos com igual número de repetições), embora nem sempre isso seja possível (principalmente na pesquisa com seres humanos quando o uso de grupo controle tem restrições de natureza ética). O modelo estocástico que indica a forma da resposta biológica de uma unidade experimental submetida a um dos tratamentos, isto é: Resposta Biológica = Média Tratamento + Erro Casual Biológico, é descrito como yij = μi + εij (i = 1,...k e j = 1,...,r) sendo i o índice referente ao tratamento e j à unidade experimental. 2.3 PROCEDIMENTO ESTATÍSTICO: ANÁLISE DE VARIÂNCIA A análise de variância (ANOVA), embora exija o cálculo de variâncias, na verdade compara as médias dos tratamentos. Constitui-se numa extensão do teste t de Student (que compara apenas duas e só duas médias) para um número qualquer de médias. A estatística do teste para a ANOVA é calculada por meio do teste F (Fisher-Snedecor). A lógica de uma análise de variância consiste em considerar a variação total existente nos dados desmembrada em duas partes: uma variação devida aos tratamentos e outra devida ao acaso (ou resíduo). A idéia é comparar a variação devida aos tratamentos com a variação devida ao acaso. Algumas pressuposições básicas precisam estar satisfeitas para o uso da técnica da análise de variância, que são: i) os erros são variáveis aleatórias independentes; ii) a variância é constante (homogênea nos tratamentos); iii) a distribuição dos erros é normal ou aproximadamente normal. delineamento_de_experimentos-prova4.indd 22 28/05/2014 15:49:23 Delineamento Inteiramente Casualizado (DIC) | 23 2.4 INDEPENDÊNCIA DOS ERROS Uma regra prática consiste em utilizar um gráfico de resíduos padronizados versus a ordem de coleta dos dados. Se a pressuposição de independência estiver satisfeita, os resíduos devem ficar distribuídos casualmente ao redor de zero, sem um padrão definido. Para a construção gráfica devem ser consideradas as seguintes definições: Resíduo ⇒ eij = yij − yi• (resíduo relativo à j-ésima observação do i-ésimo grupo), i = 1,..., k; j = 1,..., r . Resíduo padronizado ⇒ zij = eij QMRes (resíduo padronizado relativo à j- ésima observação do i-ésimo grupo ), onde QMRes significa Quadrado Médio ⎛ k ⎞ Residual e tem seu valor dado por: QMRes = S 2pool = ⎜⎜∑(ni −1)Si2 ⎟⎟⎟ (n − k ) . ⎟ ⎜ ⎝ i=1 ⎠ Para o entendimento da regra prática considere um conjunto homogêneo de 20 animais e quatro dietas para a comparação das alterações de pesos, cujos 5 animais de cada dieta foram escolhidos por processo randômico (sorteio). As dietas estudadas foram: A: dieta padrão; B: dieta padrão suplementada com amendoim; C: dieta padrão suplementada com girassol; D: dieta padrão suplementada com abóbora. Os ganhos de peso(g) avaliados considerando a variação absoluta entre o início e o final do experimento, são apresentados na Tabela 2.1. delineamento_de_experimentos-prova4.indd 23 28/05/2014 15:49:25 24 | DELINEAMENTO DE EXPERIMENTOS Tabela 2.1 Ganhos de peso segundo dieta (g) Dieta A 25 26 20 23 21 Dieta B 31 25 28 27 24 Dieta C 22 26 28 25 29 Dieta D 33 29 31 34 28 A Tabela 2.2 apresenta o resultado da estatística descritiva dos dados: Tabela 2.2 Estatística descritiva das dietas Dieta Média Variância A 23,0 6,5 B 27,0 7,5 C 26,0 7,5 D 31,0 6,5 Portanto, QMRes = S 2pool = (4×6, 5 + 4×7, 5 + 4×7, 5 + 4×6, 5) (20 − 4) = 7, 0 . Os resíduos estão apresentados na Tabela 2.3. Tabela 2.3 Resíduos dos ganhos de peso segundo dieta (g) Resíduo (eijj) Resíduo Padronizado (zzijj) A B C D A B C D 2 4 -4 2 0,756 1,512 -1,512 0,756 3 -2 0 -2 1,134 -0,756 0,000 -0,756 -3 1 2 0 -1,134 0,378 0,756 0,000 0 0 -1 3 0,000 0,000 -0,378 1,134 -2 -3 3 -3 -0,756 -1,134 1,134 -1,134 O gráfico bidimensional dos pares (ordem da observação; resíduo padronizado) está apresentado na Figura 2.1. delineamento_de_experimentos-prova4.indd 24 28/05/2014 15:49:28 Delineamento Inteiramente Casualizado (DIC) | 25 Zij 1,890 1,512 1,134 0,756 0,378 0,000 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 -0,378 17 18 19 20 21 Observação -0,756 -1,134 -1,512 -1,890 Figura 2.1. Gráfico dos resíduos padronizados zij A inspeção gráfica dos resíduos permite indicar que a pressuposição de independência pode ser aceita. Em situações que se deseja um resultado mais objetivo, isto é, se há interesse em um estudo mais avançado de delineamento de experimentos, recomenda-se aplicar o teste de Durbin-Watson para avaliar a significância da presença de dependência (autocorrelação) dos erros (Draper & Smith, 1998). 2.5 VARIÂNCIA CONSTANTE (HOMOCEDASTICIDADE) Uma regra prática indicada por DEAN & VOSS (1999) sugere pressupor que os resultados de uma ANOVA sejam considerados válidos desde que a maior variância não exceda em três vezes a menor. BOX (1953) sugere que a maior variância não deva exceder em quatro vezes a menor. No nível analítico, no qual exige-se decisão mais objetiva, foram propostos diversos testes para a igualdade de variâncias, destacando-se entre eles: Cochran, Hartley, Bartlett e Levene. Em nosso caso, será utilizado o teste de Hartley que considera a razão delineamento_de_experimentos-prova4.indd 25 28/05/2014 15:49:28 26 | DELINEAMENTO DE EXPERIMENTOS entre a maior e a menor variância, cuja estatística do teste é dada pela distribuição F. Ou seja, H 0 : s12 = s22 = ... = sk2 (Variâncias Homogêneas) H1 : Existe si2 ¹ si2’ , para i ¹ i ’ (Variâncias Heterogêneas) A estatística do teste é obtida considerando max(S12 ,...,Sk2 ) ~ F(glnum;glden) . min(S12 ,...,Sk2 ) Sob a veracidade de H 0 , a estatística F do teste de hipótese da homogeneiF= dade de variâncias tem distribuição F (Fisher-Snedecor) com os parâmetros: graus de liberdade do numerador (glnum) e graus de liberdade do denominador (glden). A regra de decisão é a habitual, isto é, F > F(α; glnum;glden), rejeita-se H 0 ; caso contrário, não há rejeição. No exemplo: max(S12 ,..., S42 ) 7,5 = = 1,15 2 2 min(S1 ,..., S4 ) 6,5 t H0 . α = 0, 05,então glnum = glden = 4 ⇒ F(0,05;4 ;4 ) = 6, 39; portanto, não se rejeita F= 2.6 NORMALIDADE DOS ERROS Um processo prático consiste em fazer um gráfico de probabilidades normais (“NORMAL PROBABILITY PLOT”). O gráfico de probabilidade normal consiste em uma técnica gráfica que permite avaliar se existe ou não um conjunto de dados que apresenta aderência à distribuição normal de probabilidades. Os dados são plotados em um gráfico cartesiano para verificar se os pontos formam uma reta aproximada, levando-se em consideração que quanto mais afastados da reta situarem os pontos, maior fuga da normalidade apresenta a situação. Os resíduos padronizados ( Zij ) são colocados no eixo das abscissas e os escores da distribuição normal padronizada [valores esperados obtidos delineamento_de_experimentos-prova4.indd 26 28/05/2014 15:49:29 Delineamento Inteiramente Casualizado (DIC) | 27 de P (Z £ Fi ) ] no eixo das ordenadas, para i =1,, n . A cada i-ésimo resíduo, associa-se a frequência percentual acumulada empírica Fi = seguida calcula-se P (Z £ Fi ) . 100(i − 12 ) %, em n Na presença da normalidade, os pontos ficarão em torno de uma reta que passa pela origem e tem coeficiente angular 1. De maneira analítica, a hipótese de que a distribuição dos erros é normal pode ser colocada em teste utilizandose os testes de aderência de: Kolmogorov-Smirnov(KS), Shapiro-Wilks(SW) e Qui-quadrado(χ2). Em linhas gerais, o pesquisador não precisa preocupar-se com a nãonormalidade, o teste estatístico F é bastante robusto, ou seja, pequenas transgressões à pressuposição de normalidade não afetam, substancialmente, o resultado da análise de variância ANOVA, a menos que a distribuição dos erros tenha: i) curtose positiva; ii) assimetria. Nesses dois casos, têm-se falsas rejeições (mais diferenças significantes do que, na realidade, existem). Considerando o exemplo dos ganhos de peso segundo dieta com o total 20 animais, tem-se Fi = 100(i − 0, 5) % = 5(i − 0, 5)% . Com os valores dos resíduos pa20 dronizados ordenados em ordem crescente de magnitude constrói-se a Tabela 2.4. delineamento_de_experimentos-prova4.indd 27 28/05/2014 15:49:34 28 | DELINEAMENTO DE EXPERIMENTOS Tabela 2.4 Resíduos padronizados ordenados e escores esperados sob normalidade (Distribuição Z) Ordem ( i ) Zij (ordenado) Fi (%) Escore Esperado 1 -1,512 2,5 -1,96 2 -1,134 7,5 -1,44 3 -1,134 12,5 -1,15 4 -1,134 17,5 -0,93 5 -0,756 22,5 -0,76 6 -0,756 27,5 -0,60 7 -0,756 32,5 -0,45 8 -0,378 37,5 -0,32 9 0,000 42,5 -0,19 10 0,000 47,5 -0,06 11 0,000 52,5 0,06 12 0,000 57,5 0,19 13 0,378 62,5 0,32 14 0,756 67,5 0,45 15 0,756 72,5 0,60 16 0,756 77,5 0,76 17 1,134 82,5 0,93 18 1,134 87,5 1,15 19 1,134 92,5 1,44 20 1,512 97,5 1,96 Para melhor entendimento do processo considere o resíduo padronizado de menor magnitude (-1,512). A ordem associada ao valor é i =1 e, logo, F1 (%) = 5(1− 0, 5)% = 2, 5% . O escore esperado sob a distribuição normal pa- dronizada é dado por P (Z ≤ 0, 025) = −1, 96 . E assim, procede-se sucessivamente até o escore padronizado de maior magnitude (1,512). delineamento_de_experimentos-prova4.indd 28 28/05/2014 15:49:37 Delineamento Inteiramente Casualizado (DIC) | 29 Escore Esperado 2,5 2,0 1,5 1,0 0,5 -2,0 -1,5 -1,0 -0,5 0 -0,5 0,5 1,0 1,5 2,0 Zij -1,0 -1,5 -2,0 -2,5 2.7 TÉCNICA DA ANÁLISE DE VARIÂNCIA (ANOVA) Quando se tem um experimento completamente ao acaso com um fator fixo (fonte de variação controlada em estudo), o interesse consiste em verificar a influência dos k níveis desse fator (k grupos ou k tratamentos) sobre uma variável dependente (resposta) biológica Y em estudo. Uma maneira de verificar a existência dessa influência do fator consiste em comparar as médias populacionais da variável Y sob os níveis do fator (tratamento = agente causal). Um teste estatístico para verificar a igualdade dessas k médias relativas aos N O VAriOf níveis do fator consiste na técnica da análise de variância (ANalysis ance, título em inglês que deriva a sigla ANOVA, utilizada na língua inglesa e, muitas vezes na língua portuguesa). Embora o procedimento envolva o cálculo de variâncias, seu objetivo fundamenta-se em comparar as médias dos níveis do fator (tratamento). A lógica da ANOVA para o delineamento inteiramente ao acaso é muito simples, ou seja, resume-se em fracionar a variabilidade total dos dados em duas fontes de variação ortogonais entre si, sendo uma devido a variação en- delineamento_de_experimentos-prova4.indd 29 28/05/2014 15:49:40 30 | DELINEAMENTO DE EXPERIMENTOS tre os níveis do fator (variação entre tratamentos) e outra, devido a variação dentro dos níveis (dentro de tratamentos). Esta última tem a finalidade específica de estimar a variação atribuída ao acaso; enquanto a primeira, envolve a variação do acaso acumulada, devido aos níveis de tratamento. Feito isso, determina-se a razão da variação entre os níveis e a variação dentro dos níveis e, se o resultado obtido for “muito grande” a conclusão é estabelecida a favor das diferenças entre as médias dos níveis do fator (diferenças entre as médias dos tratamentos). Deve ser considerado que para a utilização da técnica da ANOVA, embora o entendimento da lógica seja muito fácil, algumas pressuposições devem estar satisfeitas, quais sejam: independência dos erros, normalidade dos dados e homogeneidade de variâncias; conforme será mostrado a seguir a partir dos dados da Tabela 2.5. Considere um conjunto homogêneo de 20 animais e quatro dietas para a comparação das alterações de pesos, cujos 5 animais de cada dieta foram escolhidos por processo randômico (sorteio). As dietas estudadas foram: A: dieta padrão; B: dieta padrão suplementada com amendoim; C: dieta padrão suplementada com girassol; D: dieta padrão suplementada com abóbora. Tabela 2.5 Ganhos de peso segundo dieta Dieta A Dieta B Dieta C Dieta D 25 31 22 33 26 25 26 29 20 28 28 31 23 27 25 34 21 24 29 28 23 (2,55) (*) 27 (2,74) 26 (2,74) 31 (2,55) (*) média (desvio padrão) delineamento_de_experimentos-prova4.indd 30 28/05/2014 15:49:40 Delineamento Inteiramente Casualizado (DIC) | 31 Cada ganho de peso é uma resposta biológica do modelo geral yij = μi + εij = μ + τi + εij , com i =1,..., k (número de tratamentos) e j =1,..., r (número de repetições por tratamento), onde: μ é a média geral comum a todas as observações definida como , sendo μi a média populacional de Y no i-ésimo tratamento; ri o número de repetições no i-ésimo tratamento (no caso balanceado é o valor comum r para todos tratamentos); ti é o efeito do i-ésimo nível do fator na variável dependente Y e mede o desvio da média μi em relação a m, isto é: τi = μi − μ ; eij é o erro casual não observável (em nosso estudo, variável aleatória independente e identicamente distribuída como N (0,s 2 ) ). Neste sentido, tem-se: a) E (Yij ) = μ + τi = μi b) Var = (Yij ) = s 2 c) Yij ~ N (μi , σ 2 ) Considerando satisfeitas as suposições de independência dos erros, normalidade dos dados e homogeneidade das variâncias de tratamentos, a técnica da ANOVA consiste em comparar a variação devida aos tratamentos (entre tratamentos) com a variação devida ao acaso (ou resíduo, ou dentro de tratamentos). Para o cálculo das causas de variação são determinadas: a) Graus de liberdade (GL) Total = n − 1, onde n = kr; Tratamento = k − 1; Resí duo = n − k= k (r − 1) b) Somas de quadrados (SQ) delineamento_de_experimentos-prova4.indd 31 28/05/2014 15:49:40 32 | DELINEAMENTO DE EXPERIMENTOS k SQTot = ∑ i=1 k SQTrat = ∑ i=1 yi• = r ∑( y r k ij j=1 − y•• )2 = ∑ i=1 r ∑( y j=1 ∑y j=1 k i• 2 ij − y•• )2 = ∑ i=1 − ny••2 onde y•• = yi2• − ny••2 = r 1 k ∑ n i=1 r ∑y ; ij j=1 k ∑ ry i=1 2 i• - ny••2 ; onde 1 r ∑ yij ; r j=1 k SQRes = ∑ i=1 r ∑( y k ij j=1 − yi• )2 = ∑ i=1 k r ∑ y −∑ 2 ij j=1 i=1 yi2• = SQTot − SQTrat . r c) Quadrados Médios (QM) QMTrat = SQTrat / (k −1) QMRes = SQRes / (n − k ) F = QMTrat / QMRes As quantidades obtidas anteriormente são dispostas na Tabela 2.6, denominada tabela de análise de variância. Tabela 2.6 Tabela geral de ANOVA de um DIC balanceado Causa de variação GL SQ QM F Tratamentos k -1 SQTrat QMTrat QMTrat / QMRes Resíduo n-k SQRes QMRes Total n-1 SQTot O teste de hipóteses relativo à Tabela 2.6 consiste em: H 0 : Não existe efeito de tratamentos ⇔ H 0 : τ1 = ... = τ k = 0 ⇔ H 0 : μ1 = ... = μk = μ H1 : Existe efeito de tratamentos ⇔ H1 : Existe ti ≠ 0 (i = 1,..., k) Se F ≥ F(a ;k−1;n−k ) , rejeita-se H0. Caso contrário não há rejeição. No exemplo, tem-se: k = 4 (tratamentos) e r = 5 (repetições por tratamento); delineamento_de_experimentos-prova4.indd 32 28/05/2014 15:49:47 Delineamento Inteiramente Casualizado (DIC) | 33 y•• = 535, logo, y•• = 535 / 20 = 26, 75 y1• = 115( y1• = 23); y2• = 135( y2• = 27); y3• = 130( y3• = 26); y 4• = 155( y 4• = 31) SQTot = 14587, 00 −14311, 25 = 275, 75 SQTrat = 14475, 00 −14311, 25 = 163, 75 SQRes = 275, 75 −163, 75 = 112, 00 QMTrat = 163, 75 / 3 = 54, 58 QMRes = 112, 00 / 16 = 7, 00 Tabela 2.7 ANOVA dos ganhos de peso Causa de variação GL SQ QM F Dietas 3 163,75 54,58 7,80 (p < 0,005) Resíduo 16 112,00 7,00 Total 19 275,75 Conclui-se, no nível de significância 5%, que existem diferenças entre as médias das alterações (ganhos) de pesos segundo as dietas estudadas (rejeitase H 0 : t1 = t2 = t3 = t 4 = 0 ). Ou seja, os resultados experimentais (com base no “p-value”) permitem rejeitar a hipótese de que as médias de tratamentos são iguais, ao nível de significância de 5%. 2.8 COEFICIENTES DE DETERMINAÇÃO E VARIAÇÃO DE UM EXPERIMENTO 2 O coeficiente de determinação ( R ) de um experimento é dado pela razão entre a SQTrat (variação devida aos tratamentos) e a SQTot (variação total dos valores observados), indicando a proporção da variação total explicada pela variação devida aos tratamentos ( 0 £ R2 £ 1 ). O coeficiente de variação ( CV ) de um experimento é dado pela razão entre o desvio padrão (na ANOVA, consiste na raiz quadrada positiva de QMRes ) e delineamento_de_experimentos-prova4.indd 33 28/05/2014 15:49:57 34 | DELINEAMENTO DE EXPERIMENTOS a média geral dos dados ( y·· ), indicando como os dados comportam-se (dispersão) em relação à média geral. A grandeza inversa do CV remete à idéia da precisão dos dados experimentais. No exemplo anterior, tem-se R2 = SQTrat / SQTot = 163, 75 / 275, 75 = 0, 5938 (59,38% da variação total é explicada pela variação de tratamentos); CV = QMRes / y•• = 7, 00 / 26, 75 = 0, 0989 (9,89% estabelece-se como a dispersão relativa dos dados experimentais) 2.9 COMPARAÇÕES MÚLTIPLAS A técnica da ANOVA permite ao pesquisador verificar se existe efeito dos tratamentos, mas não como as médias dos tratamentos diferem entre si. Portanto, se constatar que existe efeito do fator em estudo, é interessante complementar a análise a fim de localizar as diferenças entre as médias dos tratamentos. A resposta à complementação da ANOVA pode ser concretizada (principalmente quando os níveis do fator são qualitativos) com um teste de comparações múltiplas de médias. Nessa linha de busca de uma resposta biológica mais interessante e informativa foram propostos diversos testes que, em geral, levam o nome do seu autor (Tukey, Duncan, Dunnet, Bonferroni, Scheffé, Newman-Keuls ou Student-Newman-Keuls (SNK), e outros). Não existe um teste aceito como o “melhor” deles; todos apresentam vantagens e desvantagens e situação mais indicada para seu uso. Os testes de comparações múltiplas permitem testar hipóteses do tipo: H 0 : c1μ1 + ... + ck μk = 0 “versus” H1 : c1μ1 + ... + ck μk ≠ 0, com c1 + ... + ck = 0 . Essa combinação linear de médias, que reflete uma situação de interesse biológico, é denominada contraste de médias. delineamento_de_experimentos-prova4.indd 34 28/05/2014 15:50:04 Delineamento Inteiramente Casualizado (DIC) | 35 Na maioria das vezes, o interesse consiste na comparação de todas as diferenças entre médias de dois tratamentos. Dentro dessa linha de curiosidade a opção será pelo método de Tukey. O método de Tukey baseia-se na diferença honestamente significante (HSD=”Honestly Significant Difference”), cujo princípio é encontrar a diferença mínima significante que assegura a todas as comparações um nível comum de significância estabelecido a priori. Segundo Gomes (2009), o teste pode ser utilizado para comparar todo e qualquer contraste entre pares de médias. No experimento com dados balanceados o teste de Tukey é exato com o seguinte procedimento operacional: H0 : μi − μi ’ = 0 e H1 : μi − μi ’ ≠ 0, com i ≠ i’ . Calcula-se HSD (α ) = Δ (α ) = q(α ;k ;ϕ) QMRes r q(α ;k ;ϕ) é o quantil de or- dem (1-α/2) da distribuição estatística denominada “studentized range” com parâmetros k (número de tratamentos) e j = n − k (graus de liberdade do resíduo). Os valores de q, considerando a=0,01 e a=0,05, estão tabelados e são encontrados em diversos livros de estatística experimental. A regra de decisão é a habitual, ou seja: Se yi• − yi ’• ≥ Δ(a ) , rejeita-se H 0 . Caso contrário, não há rejeição. Similarmente, pode-se apresentar o intervalo de confiança 100(1− a )% para a diferença de médias, cujos limites são dados por: LI = ( yi• − yi •’ )− q(α;k ;ϕ) QMRes r LS = ( yi• − yi •’ ) + q(α; k;ϕ) QMRes r No exemplo relativo à Tabela 1, tem-se q(0,05;4 ;16) = 4, 05 ; logo, Δ(5%) = HSD (5%) = 4, 05 7, 00 = 4, 79 . 5 Ou seja, o valor mínimo que expressa a diferença significante entre as médias dos ganhos de peso é da ordem de 4,79 unidades de peso. Neste sentido, as delineamento_de_experimentos-prova4.indd 35 28/05/2014 15:50:04 36 | DELINEAMENTO DE EXPERIMENTOS únicas diferenças encontradas aconteceram entre as dietas A e D (8,00>4,79) e C e D (5,00>4,79). Uma maneira elegante e redacional (textos científicos e biológicos) de apresentar os resultados está disposta na Tabela 2.8. Tabela 2.8 Média e desvio padrão do ganho de peso segundo a dieta Dieta A B C D 23 (2,55)a(1) 27 (2,74)ab 26 (2,74)a 31 (2,55)b HSD 4,79 (1) duas médias seguidas de pelo menos uma mesma letra não diferem entre si (p>0,05) pelo teste de Tukey 2.10 EXERCÍCIOS (DIC COM DADOS BALANCEADOS) A seguir são apresentados alguns exercícios para o entendimento do planejamento experimental envolvido no DIC Balanceado (mesmo número de repetições por tratamento) e também para o treinamento dos cálculos abrangidos na técnica da ANOVA e no teste de comparações múltiplas de Tukey. As respostas dos exercícios são apresentadas no próximo item. 1. Para testar duas drogas diferentes usando grupo controle, um farmacologista pretende fazer um experimento com cobaias. Estão disponíveis 24 cobaias, bastante similares. Como você planejaria o experimento? 2. Explique com detalhes o procedimento que você faria para designar cinco tratamentos (A, B, C, D, E) para 25 unidades experimentais (ratos) similares. 3. Num laboratório de biofísica são usados quatro voltímetros diferentes. Para verificar se os quatro voltímetros estão igualmente calibrados, mediuse a mesma força constante de 100 volts cinco vezes cada voltímetro. Os delineamento_de_experimentos-prova4.indd 36 28/05/2014 15:50:04 Delineamento Inteiramente Casualizado (DIC) | 37 dados estão na tabela abaixo. Faça uma análise de variância e interprete o resultado (considerar α=0,05). Voltagem segundo o voltímetro Voltímetro 4. A B C D 117 115 118 125 120 110 123 121 114 116 119 123 119 115 122 118 115 114 118 118 Para detectar a presença de insetos daninhos nas plantações, colocam-se papelões untados com uma substância pegajosa e examinam-se os insetos capturados. Ao nível de 5% de significância, que cores atraem mais insetos? Os pesquisadores colocaram seus papelões de cada cor em posições aleatórias em um campo de aveia, e contaram o número de insetos capturados. Cor do papelão Insetos Capturados Azul 16 11 20 21 14 17 Verde 37 32 20 29 37 32 Branco 21 12 14 17 13 20 Amarelo 45 59 48 46 38 47 Obs.: Como a variável “número de insetos” (contagem) não apresenta distribuição normal (variável discreta), para a análise dos dados considerar os valores observados sob a transformação raiz quadrada. 5. Considere o seguinte quadro de ANOVA da PAM: Fonte de variação Entre Grupos Intragrupos Total Soma Quadrados GL QM F 800 3 ? ? ? ? 33,33 - 2000 a. Qual tipo de ANOVA está apresentado no quadro? b. Qual a conclusão no nível de 5% de significância? c. Qual a redação científica mais adequada para a conclusão sobre o resultado do teste estatístico empregado? delineamento_de_experimentos-prova4.indd 37 28/05/2014 15:50:05 38 | DELINEAMENTO DE EXPERIMENTOS 6. Considere as seguintes dosimetrias de mercúrio no sangue (ppb) de grupos expostos em garimpos da Amazônia Legal (Ferrari et al., Revista de Saúde Ocupacional, v.20, n.75, p.54-60, 1992). Grupo Dosimetria Hg Garimpeiros 24 19 25 23 13 Ribeirinhos 16 8 10 7 15 Índios 28 30 19 23 22 Controle 12 6 8 7 9 Verificar, considerando o nível de significância 5%, as diferenças entre as respostas médias dos grupos. 2.11 RESPOSTAS DOS EXERCÍCIOS (DIC COM DADOS BALANCEADOS) 1. Cada grupo ( Controle, Droga 1 e Droga 2 ) será composto de oito cobaias alocadas por processo aleatório simples (casual ou randomizado ). A variável resposta será comparada quanto às médias dos grupos pela técnica da ANOVA complementada com o teste de comparações múltiplas de Tukey, considerando o nível de 5% de significância. 2. Os ratos são enumerados de 1 a 25 e, em uma urna são colocadas 25 etiquetas idênticas quanto ao tamanho, forma e cor sendo cinco marcadas com a letra A, cinco com B, cinco com C, cinco com D e, finalmente cinco com E. Em outra urna, são colocadas outras etiquetas enumeradas de 1 a 25, correspondente aos 25 ratos da pesquisa. Procede-se com a realização de sorteios em ambas as urnas, formando 25 pares constituídos pelo tratamento sorteado na primeira urna e o rato correspondente ao número sorteado na segunda. delineamento_de_experimentos-prova4.indd 38 28/05/2014 15:50:05 Delineamento Inteiramente Casualizado (DIC) | 39 3. Tabela 1. ANOVA para a força dos voltímetros Causa de variação Tabela 2. GL SQ QM F Voltímetro 3 150,00 50,00 7,41 (p<0,005) Resíduo 16 108,00 6,75 Total 19 258,00 Média (desvio padrão) da força segundo tipo de voltímetro A B C D 117,00 (2,55) ab 114,00 (2,35) a 120,00 (2,35) b 121,00 (3,08) b DHS (5%) = 4,71 4. Tabela 1. Tabela 2. ANOVA para a raiz quadrada do número de insetos capturados Causa variação GL SQ QM F Cor do papelão 3 33,72 11,24 43,57 (p<0,001) Resíduo 20 5,16 0,26 Total 23 38,88 Média (desvio padrão) do número de insetos capturados(*) segundo cor Azul Verde Branco Amarelo 4,04 (0,47) a 5,56 (0,60) b 4,00 (0,47) a 6,85 (0,49) c DHS (5%) = 0,82 (*) Variável sob a transformação raiz quadrada 5. a. b. ANOVA para DIC balanceado (10 animais por grupo). F= 266,67/33,33 = 8,00 (p < 0,001); portanto rejeita-se a hipótese de ausência de efeito de tratamentos. c. No nível de 5% de significância conclui-se que existe diferença entre as médias da PAM nos grupos estudados. 6. Tabela 1. ANOVA para a dosimetria de mercúrio no sangue (ppb) Causa variação GL SQ QM F Grupo 3 871,20 290,40 17,47 (p<0,001) Resíduo 16 266,00 16,63 Total 19 1137,20 delineamento_de_experimentos-prova4.indd 39 28/05/2014 15:50:05 40 | DELINEAMENTO DE EXPERIMENTOS Tabela 2. grupo Média (desvio padrão) da dosimetria de mercúrio no sangue segundo o Garimpeiros 20,80 (4,92) b Ribeirinhos Índios Controle 11,20 (4,09) a 24,40 (4,51) b 8,40 (2,30) a DHS (5%) = 7,39 2.12 MODELO DO EXPERIMENTO DIC COM DADOS NÃO BALANCEADOS Em algumas situações, pode acontecer que o número de unidades experimentais disponível não seja múltiplo do número de tratamentos que se pretende comparar ou, ainda, começar o experimento com dados balanceados e algumas unidades, por algum motivo alheio à vontade do pesquisador, tornarem-se perdidas para o experimento. Nessas situações, os tratamentos podem ficar com números de repetições total ou parcialmente diferentes, ou seja, experimento com número diferente de repetições (dados não balanceados). Talvez a primeira sugestão, com base no que já foi visto, seria “descartar utilizando critérios randômicos” unidades experimentais para se ter os dados balanceados nos tratamentos. Mesmo sendo, do ponto de vista da Estatística Experimental, melhor que todos os tratamentos apresentem o mesmo número de parcelas (a análise é realizada por procedimento exato), a importância biológica das informações das unidades experimentais é mais imperativa que a simplicidade dos cálculos matemáticos do procedimento e, neste sentido, torna-se imprescindível um comportamento mais requintado para a situação. Nessa situação, o caminho mais próximo às características da biologia acaba sendo dado pelo procedimento anterior realizado com os dados balanceados, adaptando-se as fórmulas dos cálculos aos experimentos com dados nãobalanceados. Esta nova maneira faz com que o processo exato seja direcionado à forma aproximada. delineamento_de_experimentos-prova4.indd 40 28/05/2014 15:50:05 Delineamento Inteiramente Casualizado (DIC) | 41 Portanto, a teoria desenvolvida no DIC balanceado passa a ser explicitada com pequenas modificações nas somas de quadrados e no procedimento de Tukey. Tem-se: ri k 2 SQTot = ∑ ∑ yij2 − ny•• , onde ri consiste nas repetições do i-ésimo tratai=1 j=1 k ri mento e y•• = 1 ∑ ∑ yij n k i=1 j=1 2 i• SQTrat = ∑ i=1 k ri y − ny••2 ri ri k yi• = ∑ yij j=1 SQRes = ∑ ∑ yij2 − ∑ yrii• = SQTot − SQRes . i=1 j=1 2 i=1 O quadro da ANOVA permanece o mesmo do DIC para dados balanceados. Em relação ao teste de Tukey, calcula-se k e Se yi• − yi ’• ≥ Δii ’ (a ) , rejeita-se a hipótese de igualdade de médias. Caso contrário, não há rejeição. A Tabela 2.9 mostra os ganhos de peso (kg) no final do experimento realizado para comparar três rações comerciais em um lote de animais (suínos) homogêneos (PADOVANI, 2002). delineamento_de_experimentos-prova4.indd 41 28/05/2014 15:50:05 42 | DELINEAMENTO DE EXPERIMENTOS Tabela 2.9 Ganho de peso (kg) segundo ração Ração Ganho de Peso A 7,12 6,91 6,30 6,72 B 8,15 8,45 8,92 9,15 C 6,58 7,04 6,46 7,12 6,68 6,80 7,06 r1 = 6; r2 = 4; r3 = 5; n = 15 y1• = 40, 53 ; y2• = 34, 67 ; y3• = 34, 26 ; y•• = 109, 46 ; y•• = 7, 2973 SQTot = 810, 3948 −15×7, 29732 = 810, 3948 − 798, 7588 = 11, 6360 SQTrat = 40, 532 34, 672 34, 262 + + − 798, 7588 = 809, 0319 − 798, 7588 = 10, 2731 6 4 5 Tabela 2.10 Quadro da ANOVA do ganho de peso Causa Variação GL SQ QM F Ração 2 10,2731 5,1366 42,22 (P<0,001) Resíduo 12 1,3629 0,1136 Total 14 11,6360 Coeficiente de Variação do experimento: CV = 100 Coeficiente de Determinação: R2 = 0,1136 % = 4, 62% 7, 2973 10, 2731 = 0, 8829 (88, 29%) 11, 6360 Teste de Tukey a = 0, 05 ; k = 3 (tratamentos); ϕ =12 (graus de liberdade do resíduo) Δii ’ = 3, 77 0,1136 ⎛⎜ 1 1 ⎞⎟ r +r ⎜⎜ + ⎟⎟ = 0, 8985 i ’ i 2 ⎝ ri ri ’ ⎟⎠ ri ri ’ Δ12 = 0, 580 ; Δ13 = 0, 544 ; Δ23 = 0, 603 y1• − y2• = 6, 755 − 8, 6675 = 1, 9125 > Δ12 ( A ≠ B ) y1• − y3• = 6, 755 − 6, 852 = 0, 097 < Δ13 ( A = C ) y2• − y3• = 8, 6675 − 6, 852 = 1, 8155 > Δ23 ( B ≠ C ) A Tabela 2.11 mostra a média e o desvio padrão do ganho de peso segundo a ração comercial administrada. delineamento_de_experimentos-prova4.indd 42 28/05/2014 15:50:05 Delineamento Inteiramente Casualizado (DIC) | 43 Tabela 2.11 Média e desvio padrão do ganho de peso segundo ração Ração A Ração B Ração C 6,755(0,273)a(1) 8,668(0,452)b 6,852(0,307)a (1) duas médias seguidas de uma mesma letra não diferem (P>0,05) pelo teste de Tukey. 2.13 EXERCÍCIOS (DIC NÃO BALANCEADO) 1. Para testar duas drogas diferentes usando grupo controle, um farmacologista pretende fazer um experimento com cobaias. Estão disponíveis 24 cobaias, bastante similares. Discuta o uso de grupos com diferentes repetições. 2. Considere as seguintes dosimetrias de mercúrio no sangue (ppb) de grupos expostos em garimpos da Amazônia Legal (Ferrari et al., Revista de Saúde Ocupacional, v.20, n.75, p.54-60, 1992). Grupo Dosimetria Hg Garimpeiros 24 19 25 23 Ribeirinhos 13 10 12 8 Índios 28 30 24 26 Controle 10 6 8 9 18 25 Verificar, considerando o nível de significância 5%, as diferenças entre as respostas médias dos grupos. 3. Considerar as seguintes avaliações nasométricas [nasalância(%)=100*(energia acústica nasal) / (energia acústica nasal+energia otoacústica oral)] do vocábulo “papai” isolado e inserido em frase (Di Ninno et al., Revista de Atualização Científica PRÓ-FONO, v.13, n.1, p.71-77, 2001) delineamento_de_experimentos-prova4.indd 43 28/05/2014 15:50:14 44 | DELINEAMENTO DE EXPERIMENTOS 4. Faixa Etária Nasalância (%) Criança 10,5 11,6 12,3 8,9 9,2 9,6 10,9 Adolescente 11,5 10,2 13,9 12,0 10,4 10,0 14,1 Adulto 18,5 16,6 20,2 17,8 21,8 17,4 11,0 Considerando o nível de significância 5%, avaliar as diferenças entre as respostas médias das nasalâncias. 2.14 RESPOSTAS DOS EXERCÍCIOS (DIC NÃO BALANCEADO) 1. Do ponto de vista biológico, o grupo controle (animais que recebem o placebo, ou seja, soro fisiológico por exemplo) é o referencial das comparações (padrão de referência para testar o efeito das drogas), logo deve ser o grupo agraciado com mais animais. O restante dos animais pode ser balanceado entre as duas drogas. 2. Tabela 1. Quadro da ANOVA da dosimetria de Hg Causa variação Tabela 2. GL SQ QM F Grupos 3 1030,50 343,50 56,22 (p<0,001) Resíduo 14 85,50 6,11 Total 17 1116,00 Média (desvio padrão) da dosimetria segundo grupo Garimpeiro Ribeirinho Índio Controle 21,80 (3,11) b 10,75 (2,22) a 26,60 (2,41) c 8,25 (1,71) a DHS (G x R) = 4,82 DHS (G x I) = 4,54 DHS (G x C) = 4,82 DHS (R x I) = 4,82 DHS (R x C) = 5,08 DHS (I x C) = 4,82 3. Tabela 1. Quadro da ANOVA da nasalância Causa variação GL SQ QM F Faixas Etárias 2 256,01 128,01 49,81 (p<0,001) Resíduo 18 46,28 2,57 Total 20 302,29 delineamento_de_experimentos-prova4.indd 44 28/05/2014 15:50:14 Delineamento Inteiramente Casualizado (DIC) | 45 Tabela 2. Média (desvio padrão) da nasalância segundo faixa etária Criança Adolescente Adulto 10,50 (1,19) a 11,73 (1,71) a 18,72 (1,94) b DHS (Cr x Adol)=2,12 DHS (Cr x Adul)=2,21 DHS (Adol x Adul)=2,28 delineamento_de_experimentos-prova4.indd 45 28/05/2014 15:50:14 delineamento_de_experimentos-prova4.indd 46 28/05/2014 15:50:14 3 DELINEAMENTO EM BLOCOS COMPLETOS CASUALIZADOS (DBCC) 3.1 INTRODUÇÃO Quando o conjunto de unidades experimentais for relativamente heterogêneo (pequenos grupos de unidades similares, mas nenhum suficientemente grande para um planejamento), o plano experimental inteiramente casualizado torna-se pouco preciso, porque o erro experimental torna-se muito grande. A partir das informações disponíveis, antes da realização do experimento, é possível agrupar as unidades experimentais em subconjuntos de unidades mais homogêneas, denominados blocos. A alocação das unidades experimentais entre os tratamentos obedece a uma restrição imposta pelos blocos, ou seja, o procedimento de casualização dos tratamentos às unidades experimentais é realizado dentro de cada bloco. Quando todos os tratamentos aparecerem em todos os blocos uma única vez, tem-se o Delineamento em Blocos Completo. Toda vez que os tratamentos tornam-se presentes uma única vez em cada bloco, o número de blocos coincide com o número de repetições (Banzatto & Kronka, 2006). Deve ser observado, inclusive por possível confusão de nome, que a aleatorização está sendo realizada nos tratamentos dentro dos blocos (restrição na casualização). Na análise estatística de um experimento em blocos casualizados, ou como normalmente se diz, um experimento em blocos, além dos fatores de interesse, deve-se levar em conta o fator de controle experimental, blocos, diminuindo desta maneira o erro experimental. Quanto maior for a heterogeneidade entre blocos, maior será a eficiência deste plano experimental em relação ao completamente aleatorizado. O delineamento em blocos também pode ser planejado com repetições dos tratamentos dentro do bloco e além disso, de forma incom- delineamento_de_experimentos-prova4.indd 47 28/05/2014 15:50:14 48 | DELINEAMENTO DE EXPERIMENTOS pleta. A análise estatística do delineamento em blocos completos ao acaso com repetições torna-se relativamente fácil quando o número de unidades dentro de cada bloco é múltiplo do número de tratamentos em comparação. O termo bloco (sua origem é de fato agronômica, cujo objetivo referia-se a faixa de terra de mesma fertilidade – fertilidade homogênea) tem um sentido prático interessante na área biológica, ou seja, caracteriza-se como estrato e tem como finalidade, o controle da homogeneidade dos animais quanto às variáveis intervenientes. No presente estudo os blocos são completos quanto aos tratamentos, isto é, um bloco possui todos os tratamentos de interesse do estudo, alocados por processo aleatório com uma repetição por bloco. A vantagem mais destacada dos experimentos em blocos consiste em permitir o uso de unidades experimentais heterogêneas. Os blocos controlam uma causa de variação e estabelecem uma restrição à casualização. Essa restrição à casualização devido à constituição dos blocos indica para a não realização do teste estatístico para a causa de variação blocos, ou seja, não faz sentido, pois se trata de uma fonte de variação de controle e não de interesse para a comparação. Se a fonte colocada como blocos está no interesse do pesquisador para comparação, o esquema de fatores torna-se o procedimento adequado para a combinação dos níveis dos dois fatores em estudo. Em resumo, podem ser destacados: a. A casualização ocorre dentro dos blocos (os blocos são estratos definidos quanto à heterogeneidade das unidades experimentais e, portanto fixados como controles). b. Os blocos são completos quanto aos tratamentos pesquisados (cada bloco deve conter todos os tratamentos do estudo). c. É essencial que os blocos reúnam unidades similares (unidades semelhantes dentro de blocos asseguram aos tratamentos única fonte de variação). delineamento_de_experimentos-prova4.indd 48 28/05/2014 15:50:14 Delineamento em Blocos Completos Casualizados (DBCC) | 49 d. Quanto maior a heterogeneidade entre blocos maior a eficiência do delineamento (a perda de heterogeneidade entre blocos indica a falta da necessidade de controle local). e. O tratamento aparece uma única vez dentro de cada bloco (razão de ser denominado completo). f. Os experimentos em blocos são feitos, essencialmente, para comparar tratamentos (os blocos não são construídos para teste estatístico, mas como necessidade de controle). g. Não deve ser feito o teste estatístico de blocos (blocos são utilizados como fonte de controle da heterogeneidade, sem qualquer interesse de comparação). h. Fazer blocos significa impor uma restrição como controle às unidades experimentais (a designação casual dos tratamentos às unidades experimentais dentro de cada bloco). i. Exemplos biológicos de blocos: posição na estufa, ninhada, faixa de idade, faixa de peso, uma partida de animais (lote), entre outros. 3.2 MODELO DO EXPERIMENTO (BIOLÓGICO) O modelo de DBCC com k tratamentos e t blocos é dado por: yij = μi + β j + εij (μi = μ + τi ; i = 1,..., k; j = 1,..., t ) ; onde: m é a média geral comum a todas as observações; ti é o efeito do i-ésimo nível do fator na variável dependente Y ; b j é o efeito do j-ésimo bloco experimental; eij é o erro casual não observável (independente e identicamente distribuí- do com N (0,s 2 ) ). Neste sentido, para o modelo de efeitos fixos, tem-se: a) E (Yij ) = μ + τi + β j ; b) Var (Yij ) = s 2 ; delineamento_de_experimentos-prova4.indd 49 28/05/2014 15:50:14 50 | DELINEAMENTO DE EXPERIMENTOS c) Yij ~ N (μi + τi + β j , σ 2 ) . 3.3 PROCEDIMENTO ESTATÍSTICO: ANÁLISE DE VARIÂNCIA Todas as considerações realizadas para o DIC são também válidas para o DBCC (independência dos erros; variâncias homogêneas e normalidade dos dados). Considere o seguinte conjunto de pesos de carcaças (kg) de coelhos (Tabela 3.1) no acabamento segundo o tipo de dieta randomizada oferecida aos animais. Tabela 3.1 Peso de carcaças (kg) de coelhos segundo dieta Dieta Raça Norfolk Angorá I Angorá II Nova Zelândia I Nova Zelândia II Padrão 1,28 1,08 1,06 1,36 1,19 Padrão+Rami 1,45 1,15 1,28 1,50 1,41 Padrão+Alfafa 1,38 1,08 1,17 1,43 1,26 Padovani, C. R. (2002). Exercícios de Estatística Básica e Experimental. Depto. Bioestatística, IB/UNESP, Botucatu-SP, 40p. Cada peso de carcaça (kg) é uma resposta biológica do sorteio de três dietas dentro dos conjuntos de três animais tornados homogêneos pelas raças, cujo resultado biológico responde ao modelo: yij = μ + τi + β j + εij , com i =1,..., k (tratamentos) e j =1,..., t (blocos). Neste modelo, a técnica da ANOVA consiste em fracionar a SQTotal em três fontes de variação: a primeira referente aos tratamentos ( SQTrat ), a segunda relativa aos blocos ( SQBloco ) e, por fim, a expressa nas flutuações casuais ( SQRes ). Para a construção da tabela geral de ANOVA segundo as causas de variação são determinados: delineamento_de_experimentos-prova4.indd 50 28/05/2014 15:50:18 Delineamento em Blocos Completos Casualizados (DBCC) | 51 a) Graus de liberdade (GL) Total = n −1 = kt −1 , onde n = kt ; Tratamento = k −1 ; Bloco = t −1 ; Resíduo = (t − 1)(k − 1) . b) Somas de quadrados (SQ) k t k t 1 k t 2 SQTot = ∑ ∑ ( yij − y•• ) = ∑ ∑ yij2 − ny••2 ; onde y•• = ∑ ∑ yij ; n i=1 j=1 i=1 j=1 i=1 j=1 1 t y 2 2 y = ; onde ∑ yij ; • i SQTrat = ∑ ∑ ( yi• − y•• ) = ∑ − ny • t j=1 i=1 t i=1 j=1 k t t y2 1 k 2 •j SQBloc = ∑ ∑( y• j − y•• ) = ∑ − ny••2 ; onde y• j = ∑ yij ; k i=1 i=1 j=1 j=1 k k k t 2 i• SQRes = SQTot − SQTrat − SQBloc . c) Quadrados médios (QM) QMTrat = SQTrat (k −1) QMBloco = SQBloco (t −1) QMRes = SQRes ⎡⎣(k −1)(t −1)⎤⎦ d) Estatística F F = QMTrat QMRes As quantidades obtidas são dispostas na Tabela 3.2 da ANOVA. Tabela 3.2 Tabela geral de ANOVA de um DBCC Causa de variação GL SQ QM F Blocos t -1 SQBloc QMBloc — Tratamentos k -1 SQTrat QMTrat QMTrat QMRes (t −1)(k −1) SQRes QMRes tk -1 SQTot Resíduo Total delineamento_de_experimentos-prova4.indd 51 28/05/2014 15:50:22 52 | DELINEAMENTO DE EXPERIMENTOS O teste de hipótese relativo à Tabela 3.2 consiste em: H0: Não existe efeito de tratamento H1:t1=tk=...=0 H0 : m1=...=mk=m H1 : Existe efeito de tratamento ⇔ H 0 : Existe ti ≠ 0 (i = 1,..., k ) Sob a veracidade de H 0 , a estatística F = QMTrat tem distribuição F QMRes (Fisher-Snedecor) com parâmetros (k -1) (graus de liberdade do numerador) e (t -1)(k -1) (graus de liberdade do denominador). A regra de decisão é a habitual, ou seja: Se F ≥ F(a;k−1;(t−1)(k−1)) , rejeita-se H 0 . Caso contrário, não há rejeição. No exemplo, tem-se: k = 3 (tratamentos) e t = 5 (blocos); y•• =19, 08 , logo, y•• = 19, 08 15 = 1, 272 ; SQTot = 24, 5678 − 24, 2698 = 0, 2980 ; y1• = 5, 97( y1• = 1,194) ; y2• = 6, 79( y2• = 1, 358) ; y3• = 6, 32( y3• = 1, 264) SQTrat = 24, 3375 − 24, 2698 = 0, 0677 y•1 = 4,11 ; y•2 = 3, 31 ; y•3 = 3, 51 ; y•4 = 4, 29 ; y•5 = 3, 86 ; SQBloc = 24, 4907 − 24, 2698 = 0, 2209 ; SQRes = 0, 2980 − 0, 2209 − 0, 0677 = 0, 0094 A Tabela 3.3 apresenta o resultado da ANOVA. Tabela 3.3 Tabela ANOVA para o peso das carcaças Causa Variação GL SQ QM Blocos 4 0,2209 0,0552 Tratamentos 2 0,0677 0,0339 Resíduo 8 0,0094 0,0012 Total 14 0,2980 F (valor p) 28,25 (p<0,01) Conclui-se, no nível de 5% de significância, que existem diferenças entre os pesos médios de carcaças dos coelhos segundo as dietas estudadas. delineamento_de_experimentos-prova4.indd 52 28/05/2014 15:50:36 Delineamento em Blocos Completos Casualizados (DBCC) | 53 3.4 COMPARAÇÕES MÚLTIPLAS O procedimento de comparações múltiplas de Tukey para o DBCC consiste nos seguintes passos: H 0 : μi − μi ’ = 0 e H1 : μi − μi ’ ≠ 0 , para i ¹ i ’ . Calcula-se a “Honestly Significante Diference” HSD (a ) = Δ(a ) = q(a ;k ;(t −1)(k−1)) QMRes , onde t é o número de repetição de t tratamentos (coincide com o número de blocos) e q(α;k ;ϕ) é o quantil de ordem (1-a/2) da distribuição “studentized range” com parâmetros k (número de tratamentos) e j = (t −1)(k −1) (graus de liberdade do resíduo). A regra de decisão do teste de hipóteses é a habitual, ou seja: Se yi• − yi ’• ≥ Δ(a ) , rejeita-se H 0 . Caso contrário, não há rejeição. Similarmente, pode-se apresentar o intervalo de confiança de Tukey 100(1-a)% para a diferença de médias, cujos limites são dados por: LI = ( yi• − yi •’ )− q(α;k ;ϕ) QMRes , t LS = ( yi• − yi •’ ) + q(α;k ;ϕ) QMRes . t No exemplo relativo aos dados do peso das carcaças tem-se: q(0,05;3;8) = 4, 04 ; logo, Δ(5%) = 4, 04 0, 0012 = 0, 063 . 5 Ou seja, o valor mínimo que expressa a diferença significante α=0,05 entre os pesos médios das carcaças é 0,063kg. Os resultados das comparações estão expressos na Tabela 3.4. Tabela 3.4 Média e desvio padrão dos pesos segundo dieta Dieta Padrão Padrão Suplementação Rami Padrão Suplementação Alfafa 1,194(0,128)a 1,358(0,142)c 1,264(0,145)b delineamento_de_experimentos-prova4.indd 53 28/05/2014 15:50:48 54 | DELINEAMENTO DE EXPERIMENTOS Conclui-se, no nível de 5% de significância, que as dietas modificam o peso médio da carcaça dos coelhos e que entre elas, a dieta suplementada com rami produz maior peso médio. 3.5 EXERCÍCIOS (DBCC) A seguir são apresentados exercícios sobre o Delineamento em Blocos Completamente Casualizados contendo planejamento, técnica da análise de variância, teste de comparações múltiplas e, em especial, o último para aprofundamento das considerações apresentadas no capítulo. 1. Planeje um experimento para comparar dois testes de QI, usando dez pares de gêmeos. Considere cada par de gêmeos como um bloco. 2. Faça a análise de variância dos dados apresentados na tabela a seguir, considerando o nível de 5% de significância: Dados de um experimento em blocos ao acaso Bloco 3. Tratamento A B C I 74 53 58 II 90 68 78 III 78 54 64 IV 98 72 74 Pretende-se verificar a durabilidade de três marcas de tintas que tem preços de custo bem diferentes. Para isso, foram selecionados seis muros, em que cada terça parte foi pintada por uma marca sorteada nos terços. Após um período de dez meses, foi atribuída a cada parte uma nota, resultante de vários quesitos. Os resultados das notas são apresentados a seguir: Marca Muro 1 Muro 2 Muro 3 Muro 4 Muro 5 Muro 6 A 8,5 8,9 8,8 8,2 8,6 8,9 B 9,1 9,4 9,1 9,6 9,0 9,3 C 7,3 7,6 7,8 7,5 6,1 7,2 delineamento_de_experimentos-prova4.indd 54 28/05/2014 15:50:48 Delineamento em Blocos Completos Casualizados (DBCC) | 55 Com esses dados, você diria (α=0,05) que uma das marcas é melhor que as outras? 4. Supondo que haja interesse em calcular F = QMBloco em um experiQMRes mento, qual a interpretação biológica que sugere o resultado significativo (p<0,05)? E o não significativo (p>0,05)? 3.6 RESPOSTAS DOS EXERCÍCIOS (DBCC) 1. Considerando 10 pares de gêmeos (G1, G2), para cada par será efetuado o sorteio dos dois testes de QI. Neste sentido, constituídos os pares por processo randomizado dos testes de QI os dados coletados nos gêmeos serão submetidos à técnica da análise de variância para o modelo experimental em blocos completamente casualizados (10 blocos no presente estudo) envolvendo dois tratamentos independentes (dois testes de QI). 2. Tabela 1. Tabela ANOVA C. Variação Tabela 2. GL SQ QM Blocos 3 847,58 282,53 - Tratamentos 2 1144,50 572,25 71,26 (p<0,001) 8,03 Resíduo 6 48,17 Total 11 2040,25 F Média (desvio padrão) dos tratamentos A B C 85,00 (11,02) b 61,75 (9,67) a 68,50 (9,15) a DHS (5%)=7,47 delineamento_de_experimentos-prova4.indd 55 28/05/2014 15:50:48 56 | DELINEAMENTO DE EXPERIMENTOS 3. Tabela 1. ANOVA para a durabilidade C. Variação Tabela 2. GL SQ QM Blocos (Muro) 5 1,04 0,21 F - Tratamentos (Marca) 2 12,64 6,32 45,14 (p<0,001) Resíduo 10 1,41 0,14 Total 17 15,09 Média (desvio padrão) das marcas A B C 8,65 (0,27) b 9,25 (0,23) c 7,25 (0,60) a DHS (5%)=0,59 4. Se o resultado do teste estatístico for significativo (p < 0,05) existe comprovação biológica de heterogeneidade entre os blocos, corroborando com a suspeita do pesquisador no controle fonte de variação bloqueada. Se o resultado do teste estatístico for não significativo (p > 0,05) existe comprovação biológica de homogeneidade entre os blocos, contradizendo com a suspeita do pesquisador no controle fonte de variação bloqueada. delineamento_de_experimentos-prova4.indd 56 28/05/2014 15:50:49 4 ESQUEMAS FATORIAIS 4.1 INTRODUÇÃO Existem situações práticas na experimentação em que o interesse do pesquisador envolve o estudo de dois ou mais fatores combinados, cujos cruzamentos dos níveis dos fatores são os tratamentos empenhados nas comparações. No presente texto, será apenas enfocado o caso de dois fatores, ou seja, A e B. Será admitido que o fator A possui a níveis, e o fator B, b níveis. Nos experimentos onde cada nível de um fator está combinado com todos os níveis do outro, diz-se que os fatores obedecem a uma classificação cruzada (experimentos cruzados). As combinações desses fatores resultam os tratamentos do estudo, cuja configuração recebe o nome de esquema fatorial a*b (combinações entre os a níveis do fator A e b níveis do fator B). O esquema de fatores mais simples consiste em considerar dois fatores A e B, com dois níveis cada um, isto é, o esquema fatorial 2*2. No esquema fatorial dois por dois, Tabela 4.1, tem-se como resultado das combinações quatro tratamentos, que são combinações de dois níveis do fator A com dois níveis do fator B. Tabela 4.1 Esquema fatorial 2*2 Fator A Fator B B1 B2 A1 A1 B1 A1 B2 A2 A2 B1 A2B2 Outras combinações dos fatores podem surgir à medida que o número de níveis dos fatores tornam-se maiores. Ademais, o número de níveis dos fatores não precisa ter o mesmo valor, ou seja, os níveis a do fator A podem ser nu- delineamento_de_experimentos-prova4.indd 57 28/05/2014 15:50:49 58 | DELINEAMENTO DE EXPERIMENTOS mericamente diferente dos níveis b do fator B. Quando a=b, tem-se um arranjo quadrático e, se a≠b, o arranjo é retangular. Uma notação interessante que se utiliza quando o número de níveis é igual para os dois fatores (a=b; arranjo quadrático) e descrita por 22, 32, 42,... O expoente indica o número de fatores do estudo e a base da potência indica o número de níveis dos fatores. Por exemplo, um fatorial 32 tem dois fatores em três níveis. Três hipóteses básicas são avaliadas no esquema fatorial a*b, que são: i) a interação (A*B) entre os fatores A e B; ii) o efeito do fator principal A e iii) o efeito do fator principal B. Dependendo do resultado do teste de significância da interação A*B, duas novas hipóteses podem ser avaliadas: i) efeito do fator A dentro de um nível fixo de B e ii) efeito do fator B dentro de um nível fixo de A. Como o esquema fatorial é um arranjo dos níveis dos fatores (combinações de níveis) ele pode ser delineado em vários tipos de experimentos. No enfoque do texto, o esquema fatorial a*b será apresentado no Delineamento Inteiramente Casualizado (DIC) e no Delineamento em Blocos Completos Casualizados (DBCC). 4.2 ESQUEMA FATORIAL A*B NO DIC Considere a Tabela 4.2, genérica de observações yijk de um esquema fatorial a*b em um DIC com r repetições por tratamento. delineamento_de_experimentos-prova4.indd 58 28/05/2014 15:50:49 Esquemas Fatoriais | 59 Tabela 4.2 Esquema fatorial a*b com r repetições Fator A Fator B B1 Bb A1 y111 y11r y1b1 y1br Aa ya11 ya1r yab1 yabr O elemento yijk representa a k-ésima repetição do i-ésimo nível do fator A e j-ésimo nível do fator B ( i = 1,, a; j = 1,, b; k = 1,, r ). O modelo de resposta é expresso por: yijk = μ + θi + γ j + (θγ )ij + εijk ; onde: m: efeito médio comum; qi : efeito do i-ésimo nível de A; g j : efeito do j-ésimo nível de B; (θγ )ij : efeito de interação entre os níveis i e j dos fatores A e B, respectiva- mente; eijk : erro casual independente, com distribuição N (0,s 2 ) . Considerando os fatores A e B de efeitos fixos, tem-se a Tabela 4.3 da ANOVA. delineamento_de_experimentos-prova4.indd 59 28/05/2014 15:50:50 60 | DELINEAMENTO DE EXPERIMENTOS Tabela 4.3 Tabela geral de ANOVA para um esquema fatorial a*b no DIC Causa de variação GL SQ QM F ab-1 SQTrat QMTrat FTrat a -1 SQA QMA FA b-1 SQB QMB FB (a −1)(b −1) SQA´ B QMA´ B FA´B ab(r −1) SQRes QMRes abr -1 SQTot Tratamentos B AxB Resíduo Total Desmembramento da SQTratamentos Os cálculos das somas de quadrados são estabelecidos por: a b r 2 2 SQTot = ∑ ∑ ∑ yijk − ny••• , onde y••• = i=1 j=1 k =1 2 a b ij• SQTrat = ∑ ∑ i=1 j=1 y r 1 a b r ∑ ∑ ∑ yijk e n = abr ; n i=1 j=1 k=1 r 2 − ny••• , onde yij• = ∑ yijk ; k =1 SQRes = SQTot − SQTrat b r yi2•• 2 − ny••• , onde yi•• = ∑ ∑ yijk ; j=1 k =1 i=1 br a r b y2 • j• 2 y• j• = ∑ ∑ yijk ; SQB = ∑ − ny••• i=1 k =1 j=1 ar a SQA = ∑ SQAxB = SQTrat − SQA − SQB A obtenção dos quadrados médios é realizada pela divisão entre a soma de quadrados e os respectivos graus de liberdade. Em relação aos testes de hipóteses, que serão apresentados a seguir, duas situações interessantes para a discussão biológica devem ser consideradas: a primeira consiste no caso onde os efeitos dos fatores A e B na variável resposta (dependente) serão aditivos e, portanto, toda a informação biológica pode ser obtida fazendo-se inferências apenas sobre as médias mi· e m·j· (médias marginais); a segunda, onde existe efeito da interação entre os fatores A e B; onde para delineamento_de_experimentos-prova4.indd 60 28/05/2014 15:50:57 Esquemas Fatoriais | 61 avaliar os efeitos existentes na variável dependente, as inferências devem ser feitas sobre todos os mij. As hipóteses gerais com os respectivos testes estatísticos acompanhados das regras de decisão são estabelecidas conforme detalhes na sequência. H 0A : Não existe efeito do fator A ⇔ θ1 = θ2 = … = θa = 0 H 0A a estatística do teste é dada por QMA FA = ~F j = ab(r −1) . QMRes (a− 1,ϕres ) , com a regra de decisão habitual e res H 0B : Não existe efeito do fator B ⇔ g1 = g2 = = gb = 0 Sob a veracidade de H 0 a estatística do teste é dada por B QMB FB = ~F , com a regra de decisão habitual. QMRes (b− 1,ϕres ) H 0AxB : Não existe efeito de interação AxB ⇔ (θγ )11 = = (θγ )ab = 0 Sob a veracidade de H 0 AxB a estatística do teste é dada por QMA×B FAxB = ~ F((a− 1)(b− 1);ϕres ) , com a regra de decisão habitual. QMRes Toda vez que o resultado de algum teste de hipóteses possibilitar a rejeição da hipótese nula, para melhorar a qualidade da informação biológica, torna-se interessante complementar a técnica da ANOVA com algum procedimento de comparações múltiplas para as médias. No caso, como já vem sendo rotina, a continuidade tem sido realizada pelo teste de Tukey para os contrastes entre todos os pares de médias. Neste sentido, duas considerações serão apresentadas; a primeira normalmente utilizada quando o resultado do teste de interação entre os fatores A e B mostrou-se não significante; a segunda, quando o resultado foi significante. Teste de Tukey para o caso FAxB não significante ( pAxB > a ) H 0A : μi• = μi ’• (i, i ’ = 1,..., a ) ⇔ não existe diferença entre as respostas médias dos níveis i e i’ do fator A. Calcula-se DMSA (α) = ΔA (α) = q(α ;a ;ϕ res ) QMRes e se yi•• − yi ’•• ≥ ΔA (a ) , br rejeita-se a hipótese H 0 . Caso contrário, não há rejeição. A delineamento_de_experimentos-prova4.indd 61 28/05/2014 15:51:11 62 | DELINEAMENTO DE EXPERIMENTOS H 0B : μ•j = μ•j ’ ( j, j ’ = 1,..., b) ⇔ não existe diferença entre as respostas médias dos níveis j e j’ do fator B. Calcula-se DMSB (α ) = Δ B (α) = q(α ;b;ϕ res QMRes e se y• j• − y• j ’• ≥ ΔB (a ) , ar ) rejeita-se a hipótese H 0 . Caso contrário, não há rejeição. B Teste de Tukey para o caso FAxB significante ( pAxB < a ) H 0A/B j : μij = μi ’ j (i, i ’ = 1,..., a e j fixo) ⇔ não existe diferença entre as respos- tas médias dos níveis i e i’ do fator A dentro do j-ésimo nível do fator B. Calcula-se DMSA/ B (α) = ΔA/ B (α ) = q(α ;a ;μ res rejeita-se H 0 A/ B j ) QMRes e se yij• − yi ’ j• ≥ ΔA/ B (a ) , r . Caso contrário, não há rejeição. H 0B/Ai : μij = μij ’ ( j, j ’ = 1,..., b e i fixo) ⇔ não existe diferença entre as respos- tas médias dos níveis j e j’ do fator B dentro do i-ésimo nível do fator A. Calcula-se DMSB/ A ( α) = Δ B/ A (α ) = q(α;b;μ res rejeita-se H 0 B / Ai ) QMRes e se yij• − yij ’• ≥ ΔB/ A (a ) , r . Caso contrário, não há rejeição. 4.3 EXEMPLO DE FATORIAL A*B NO DIC Considere o seguinte conjunto de dados de um esquema fatorial 2x2 em um delineamento inteiramente casualizado para avaliar o perfil cardiovascular de ratos hipertensos submetidos a uma dieta hipercalórica (OLIVEIRA Jr, et al., 2007, Arquivos Brasileiros de Cardiologia, v.89, Supl I, p.927). Os dois fatores de interesse do estudo são Dieta e Hipertensão, tendo como variável resposta escolhida para o desenvolvimento do exemplo a Pressão Arterial Sistólica. Fator A(Dieta): A1(Normocalórica) e A2(Hipercalórica); Fator B(Hipertensão): B1(WKY-Controle) e B2(SHR-Hipertenso); Isto é: delineamento_de_experimentos-prova4.indd 62 28/05/2014 15:51:15 Esquemas Fatoriais | 63 Hipertensão Dieta Ausente(WKY) Presente(SHR) Normocalórica(C) WKYC(A1B1) SHRC(A1B2) Hipercalórica(OB) WKYOB(A2B1) SHROB(A2B2) Pressão arterial sistólica (mm Hg) dos ratos WKYC WKYOB SHRC SHROB 130 120 160 210 120 130 158 205 110 125 162 206 112 140 152 215 128 135 168 214 y11• = 120, 00 ± 9, 06 y12• = 160, 00 ± 5, 83 y21• = 130, 00 ± 7, 91 y22• = 210, 00 ± 4, 53 Quadro auxiliar para o cálculo das SQ B(Hipertensão) A (Dieta) B1 (WKY) B2 (SHR) Total (Fator A) A1 (C) 600 800 1400 A2 (OB) 650 1050 1700 Total (Fator B) 1250 1850 3100 a = 2 ; b = 2 ; r = 5 ; n = 20 y••• = 155, 00 A seguir são calculadas as somas de quadrados para construção da tabela de ANOVA para o esquma fatorial no DIC. SQTot = 1302 + + 2142 − 20×155, 002 = 505796, 00 − 480500, 00 = 25296, 00 2 SQTrat = 2 600 8002 650 10502 + + + − 20×155, 002 = 505000, 00 − 480500, 00 = 24500, 00 5 5 5 5 SQRes = 25296, 00 − 24500, 00 = 796, 00 2 2 1400 1700 + − 20×155, 002 = 485000, 00 − 480500, 00 = 4500,000 2×5 2×5 2 2 1250 1850 SQB = + − 20×155, 002 = 498500, 00 − 480500, 00 = 18000, 00 2×5 2×5 SQAxB = SQTrat − SQA − SQB = 2000, 00 SQA = A Tabela 4.4 mostra o resultado da ANOVA. delineamento_de_experimentos-prova4.indd 63 28/05/2014 15:51:22 64 | DELINEAMENTO DE EXPERIMENTOS Tabela 4.4 ANOVA para a PAS (mm Hg) dos ratos Causa de Variação GL SQ QM F Tratamento 3 24500,00 8166,67 164,15 (p<0,01) A (Dieta) 1 4500,00 4500,00 90,45 (P<0,01) B (Hipertensão) 1 18000,00 18000,00 361,81 (p<0,01) AxB 1 2000,00 2000,00 40,20 (p<0,01) Resíduo 16 796,00 49,75 Total 19 25296,00 Como o resultado do teste de interação entre os fatores A e B foi significante (p<0,01), o procedimento de comparações múltiplas será efetuado considerando o estudo do fator A fixado o nível de B e, vice-versa. DMSA/ B j (1%) = Δ A/ B j (1%) = q(1%;2;16) QMRes 49, 75 = 4,13 = 13, 03 mm Hg 5 5 DMSB / Ai (1%) = ΔB / Ai (1%) = q(1%;2;16) QMRes 49, 75 = 4,13 = 13, 03 mm Hg 5 5 das médias e os desvios padrão da hipertensão segundo dieta com as significâncias das comparações múltiplas (Teste de Tukey). Tabela 4.5 Média e desvio padrão da PAS (mm Hg) segundo dieta e hipertensão Dieta Hipertensão Ausente Presente Normocalórica 120,00(9,06) a(1)A(2) 160,00(5,83) a B Hipercalórica 130,00(7,91) a A 210,00(4,53) b B (1) duas médias seguidas de uma mesma letra minúscula não diferem (p>0,01) quanto às respectivas dietas dentro da classe de hipertensão. (2) duas médias seguidas de uma mesma letra maiúscula não diferem (p>0,01) quanto às classes de hipertensão dentro da dieta em consideração. delineamento_de_experimentos-prova4.indd 64 28/05/2014 15:51:27 Esquemas Fatoriais | 65 4.4 ESQUEMA FATORIAL A*B NO DBCC Considere a observação yijk de um esquema com dois fatores A (com a níveis) e B(com b níveis) com os tratamentos casualizados em t blocos completos (fator fixo de controle). O modelo de resposta é expresso por: yijk = μ + θi + γ j + (θγ )ij + βk + εijk ; onde: m: efeito médio comum; qi : efeito do i-ésimo nível de A ( i =1,, a ); g j : efeito do j-ésimo nível de B ( j =1,, b ); (θγ )ij : efeito de interação entre os níveis i e j dos fatores A e B, respectiva- mente; bk : efeito do k-ésimo nível de bloco ( k =1,, t ); eijk : erro casual independente, com distribuição N (0,s 2 ) . A disposição geral das observações pode ser feita conforme Tabela 4.6 a seguir. Tabela 4.6 Quadro genérico de um experimento em DBCC Bloco Tratamento A1B1 … A1Bb … AaB1 … AaBb Bloco 1 Y111 … y1b1 … ya11 … yab1 Bloco 2 Y112 … y1b2 … ya12 … yab2 Y11t … y1bt … ya1t … yabt Bloco t Como anteriormente (DIC), considerando os fatores A e B fixos tem-se, a seguir, na Tabela 4.7 ANOVA para o esquema fatorial a*b no DBCC. delineamento_de_experimentos-prova4.indd 65 28/05/2014 15:51:28 66 | DELINEAMENTO DE EXPERIMENTOS Tabela 4.7 Tabela geral de ANOVA para um esquema fatorial a*b em DBCC Causa de Variação GL SQ QM F t -1 SQBloc QMBloc - ab-1 SQTrat QMTrat FTrat a -1 SQA QMA FA b-1 SQB QMB FB (a −1)(b −1) SQA´ B QMA´ B FA´B (ab −1)(t −1) SQRes QMRes abt -1 SQTot Blocos Tratamentos B Resíduo Os cálculos das somas de quadrados são estabelecidos por: a b t a b t 1 2 2 SQTot = ∑ ∑ ∑ yijk − ny••• , onde y••• = ∑ ∑ ∑ yijk e n = abt ; n i=1 j=1 k=1 i=1 j=1 k =1 a b SQTrat = ∑ ∑ i=1 j=1 2 t ••k SQBloc = ∑ k =1 yij2• t t 2 , onde y ij• = ∑ yijk ; − ny••• k =1 a b y••k = ∑ ∑ yijk ; y 2 − ny••• ab i=1 j=1 SQRes = SQTot − SQTrat − SQBloc a SQA = ∑ i=1 b y•2 j• j=1 at SQB = ∑ b t a t yi2•• 2 , onde yi•• = ∑ ∑ yijk ; − ny••• j=1 k =1 bt 2 − ny••• y• j• = ∑ ∑ yijk ; i=1 k =1 SQAxB = SQTrat − SQA − SQB A obtenção dos quadrados médios é realizada pela divisão entre as somas de quadrados e os respectivos graus de liberdade. As ponderações sobre os testes de hipóteses são as mesmas realizadas no DIC, cujas hipóteses gerais são estabelecidas por: H 0A : Não existe efeito do fator A ⇔ q1 = q2 = = qa = 0 delineamento_de_experimentos-prova4.indd 66 28/05/2014 15:51:34 Esquemas Fatoriais | 67 Sob a veracidade de H 0 a estatística do teste é dada por A QMA FA = ~F , com a regra de decisão habitual (rejeita-se H 0A quanQMRes (a− 1;ϕres ) do FA > F(α ;a− 1;ϕres ) )) e jres = (ab −1)(t −1) . H 0B : Não existe efeito do fator B ⇔ g1 = g2 = = gb = 0 Sob a veracidade de H 0 a estatística do teste é dada por B QMB ~F , com a regra de decisão habitual. QMRes (b− 1,ϕres ) H 0AxB : Não existe efeito de interação AxB ⇔ (θγ ) = = (θγ ) = 0 11 ab FB = Sob a veracidade de H 0 AxB a estatística do teste é dada por QMAxB FAxB = ~ F((a− 1)(b− 1);ϕres ), com a regra de decisão habitual. QMRes À semelhança do DIC, têm-se os dois casos para o teste de comparações múltiplas de Tukey. Teste de Tukey para o caso FAxB não significante ( pAxB > a ) H 0A : μi• = μi •’ (i, i ’ = 1,..., a ) ⇔ não existe diferença entre as respostas médias dos níveis i e i’ do fator A. Calcula-se DMSA (α) = ΔA (α ) = q(α;a ;ϕ res QMRes e se yi•• − yi ’•• ≥ ΔA (a ) , bt ) rejeita-se a hipótese H 0 . Caso contrário, não há rejeição. A H 0B : μ•j = μ•j’ ( j, j ’ = 1,..., b) ⇔ não existe diferença entre as respostas médias dos níveis j e j’ do fator B. Calcula-se DMSB (α) = ΔB (α ) = q(α ;b;ϕ res QMRes e se y• j• − y• j ’• ≥ ΔB (a ) , at ) rejeita-se H 0 . Caso contrário, não há rejeição. B Teste de Tukey para o caso FAxB significante ( pAxB < a ) H 0A/B j : μij = μi ’ j (i, i ’ = 1,..., a e j fixo) ⇔ não existe diferença entre as respos- tas médias dos níveis i e i’ do fator A dentro do j-ésimo nível do fator B. Calcula-se DMSA/ B (α ) = Δ A/ B (α ) = q(α ;a ;ϕ res ) QMRes e se yij• − yi ’ j• ≥ ΔA/ B (a ) , t rejeita-se H 0 . Caso contrário, não há rejeição. A/ B j delineamento_de_experimentos-prova4.indd 67 28/05/2014 15:51:52 68 | DELINEAMENTO DE EXPERIMENTOS H 0B/Ai : μij = μij ’ ( j, j ’ = 1,..., b e i fixo) ⇔ não existe diferença entre as respos- tas médias dos níveis j e j’ do fator B dentro do i-ésimo nível do fator A. Calcula-se DMS B /A(α ) = Δ B /A(α ) = q(α ;b;ϕ res rejeita-se H 0 B / Ai QMRes e se yij• − yij ’• ≥ ΔB/ A (a ) , t ) . Caso contrário, não há rejeição. 4.5 EXEMPLO DE FATORIAL A*B NO DBCC Considere o seguinte conjunto de dados de um esquema fatorial 2x2 em um delineamento em blocos completos casualizados para avaliar o efeito da inibição prolongada de enzima de conversão da angiotensina sobre o diâmetro diastólico do ventrículo esquerdo (DDVE), avaliado em mm, em ratos com sobrecarga pressórica persistente (Bregagnollo et al.,2005, Arquivos Brasileiros de Cardiologia, v.84, n.3, p.225-232). Os fatores A e B são droga (Lisinopril) e momento de sacrifício, respectivamente: Fator A (Droga): A1(bandagem aórtica (EA0)-não tratados) e A2(bandagem aórtica (EA0)-tratados com lisinopril); Fator B (Momento Sacrifício): B1(6ª semana) e B2(21ª semana). Foram estabelecidos seis blocos correspondentes às faixas de peso do animal: Bloco1(70‒|75g), Bloco2(75‒|80g), Bloco3(80‒|85g), Bloco4(85‒|90g), Bloco5(90‒|95g) e Bloco6(95‒|100g). O esquema de fatores pode ser apresentado como a seguir: Droga Momento Sacrifício 6ª Semana (B1) 21ª Semana (B2) Ausente (Não tratado) (A1) A1B1 A1B2 Presente (Lisinopril) (A2) A2B1 A2B2 delineamento_de_experimentos-prova4.indd 68 28/05/2014 15:52:07 Esquemas Fatoriais | 69 Diâmetro Diastólico do Ventrículo Esquerdo (mm) Faixa de peso Tratamento A1B1 A1B2 A2B1 A2B2 70 –| 75g 7,8 9,8 8,0 8,6 75 –| 80g 7,2 10,0 7,6 8,8 80 –| 85g 8,4 9,9 8,3 8,5 85 –| 90g 7,8 10,8 7,5 8,4 90 –| 95g 8,0 9,6 8,6 8,9 95 –| 100g 7,6 8,7 8,0 7,8 Média (DP) 7,8(0,40) 9,80(0,68) 8,00(0,42) 8,50(0,39) Quadro auxiliar para o cálculo das SQ A (Droga) Total (Fator A) B (Sacrifício) B1 B2 A1 46,8 58,8 105,6 A2 48,0 51,0 99,0 Total (Fator B) 94,8 109,8 204,6 a = 2 ; b = 2 ; r = 6 ; n = 24 y••• = 8, 525 Na sequência são obtidos as somas de quadrados para a construção da ANOVA para o esquema fatorial no DBCC. SQTot = 7, 82 + + 7, 82 − 24×8, 5252 = 1763, 5 −1744, 215 = 19, 285 2 SQTrat = 2 46, 8 58, 82 48, 0 51, 02 + + + − 24×8, 5252 = 1758, 78 −1744,2215 = 14, 565 6 6 6 6 2 2 SQA = 105, 6 99, 0 + − 24×8, 5252 = 1746, 03 −1744, 215 = 1, 815 2×6 2×6 SQB = 94, 8 109, 8 + − 24×8, 5252 = 1753, 59 −1744, 215 = 9, 375 2×6 2×6 2 2 SQAxB = 14, 565 −1, 815 − 9, 375 = 3, 375 y••1 = 7, 8 + 9, 8 + 8, 0 + 8, 6 = 34, 2 y••2 = 7, 2 + 10, 0 + 7, 6 + 8, 8 = 33, 6 y••3 = 8, 4 + 9, 9 + 8, 3 + 8, 5 = 35,1 y••4 = 7, 8 + 10, 8 + 7, 5 + 8, 4 = 34, 5 delineamento_de_experimentos-prova4.indd 69 28/05/2014 15:52:09 70 | DELINEAMENTO DE EXPERIMENTOS y••5 = 8, 0 + 9, 6 + 8, 6 + 8, 9 = 35,1 y••6 = 7, 6 + 8, 7 + 8, 0 + 7, 8 = 32,1 2 2 34, 2 33, 6 32,12 SQBloc = + ++ − 24×8, 5252 = 1745, 82 −1744, 215 = 1, 605 2×2 2×2 2×2 SQRes = 19, 285 −1, 605 −14, 565 = 3,115 Tabela 4.5 ANOVA para o DDVE Causa de Variação GL SQ QM Blocos 5 1,605 0,321 F - Tratamentos 3 14,565 4,855 23,34 (p<0,01) A (Droga) 1 1,815 1,815 8,73 (P<0,01) B (Sacrifício) 1 9,375 9,375 45,07 (p<0,01) AxB 1 3,375 3,375 16,23 (p<0,01) Resíduo 15 3,115 0,208 Total 23 19,285 O resultado do teste de interação entre os fatores A e B mostrou-se significante (p<0,01), logo, o teste de Tukey deve ser feito no desmembramento da interação. Considere α=0,05, então tem-se: DMSA/ B j (5%) = Δ A/ B j (5%) = q(5%;2;15) QMRes 0, 208 = 3, 01 = 0, 56 mm 6 6 DMSB / Ai (5%) = ΔB / Ai (5%) = q(5%;2;15) QMRes 0, 208 = 3, 01 = 0, 56 mm 6 6 Tabela 5.6 sacrifício Média e desvio padrão do DDVE (mm) segundo droga e momento de Droga (Grupo) Momento de Sacrifício 6ª Semana 21ª Semana Ausente (Controle) 7,80(0,40) a(1)A(2) 9,80(0,68) b B Presente (Lisinopril) 8,00(0,42) a A 8,50(0,39) a A (1) duas médias seguidas de uma mesma letra minúscula não diferem (p>0,05) quanto aos respectivos grupos, fixada a semana de sacrifício. (2) duas médias seguidas de uma mesma letra maiúscula não diferem (p>0,05) quanto aos respectivos momentos de sacrifício, dentro do grupo. delineamento_de_experimentos-prova4.indd 70 28/05/2014 15:52:16 Esquemas Fatoriais | 71 4.6 EXERCÍCIOS (ESQUEMAS FATORIAIS: DIC E DBCC) 1. O consumo diário de ração em kg/dia, no período de crescimento-acabamento de suínos foi observado em um esquema envolvendo tipos de ração e formas de arraçoamento em um delineamento em blocos completos ao acaso. Considerando α=0,05 estudar o consumo médio diário em função dos dois fatores. Ração Arraçoamento Farelada Farelada 2. Bloco A B C D E Livre (Vontade) 2,63 2,68 2,74 2,84 2,76 Controlada 2,45 2,36 2,44 2,50 2,40 Granulada Livre (Vontade) 2,32 2,25 2,16 2,24 2,38 Granulada Controlada 2,44 2,50 2,42 2,55 2,54 Um experimento visando verificar o efeito do inseticida e do meio de cultura em organismos biológicos foi planejado utilizando-se drosófilas e observando a longevidade (dias de sobrevida) destas moscas. Os tratamentos utilizados foram os seguintes: A1B1: atrazine e carência de glicose; A1B2: atrazine e carência de hidrato de carbono; A2B1: dalapon e carência de glicose; A2B2: dalapon e carência de hidrato de carbono. Tratamento Repetição A1B1 49 50 51 54 A1B2 36 37 35 32 A2B1 38 31 35 37 A2B2 34 30 28 25 Considerando o nível de significância 5% e os dados sob a transformação raiz quadrada, avaliar a sobrevida média das moscas segundo os tipos de inseticida e meios de cultura. delineamento_de_experimentos-prova4.indd 71 28/05/2014 15:52:20 72 | DELINEAMENTO DE EXPERIMENTOS 3. Organize os tratamentos de um esquema fatorial para estudar a interação de uma droga administrada em três condutas diferentes (manhã, tarde, noite) com bebida alcoólica. 4. Verificar se existe interação significante (p<0,05) entre os fatores A e B estudados em um delineamento em blocos completos casualizados cujos dados são apresentados a seguir. Fator A Fator B A1 Bloco I II III IV B1 16 17 19 12 A1 B2 24 23 27 22 A2 B1 22 21 23 22 A2 B2 33 35 35 32 4.7 RESPOSTAS DOS EXERCÍCIOS (ESQUEMAS FATORIAIS : DIC E DBCC) 1. Tabela 1. ANOVA para o consumo de ração C. Variação Tabela 2. mento GL SQ QM F Blocos 4 0,030 0,008 - Tratamentos 3 0,546 0,182 45,50 (p<0,001) Ração ( R ) 1 0,200 0,200 50,00 (p<0,001) Arraçoamento ( A ) 1 0,008 0,008 2,00 (p>0,05) R´ A 1 0,338 0,338 84,50 (p<0,001) Resíduo 12 0,048 0,004 Total 19 0,624 Média (desvio padrão) do consumo de ração segundo ração e arraçoa- Ração Arraçoamento Livre Controlada Farelada 2,730 (0,080) b B 2,430 (0,053) a A Granulada 2,270 (0,084) a A 2,490 (0,058) a B DHS (Ração/Arraçoamento) = 0,087 (letras minúsculas) DHS (Arraçoamento/Ração) = 0,087 (letras maiúsculas) delineamento_de_experimentos-prova4.indd 72 28/05/2014 15:52:21 Esquemas Fatoriais | 73 Tabela 1. ANOVA para os dias de sobrevida (*) C. Variação GL SQ QM F Tratamento 3 6,539 2,180 35,21 (p<0,001) Inseticida ( I ) 1 2,967 2,967 47,86 (p<0,001) Meio ( M ) 1 3,089 3,089 49,82 (p<0,001) I ´M 1 0,483 0,483 7,79 (p<0,05) Resíduo 12 0,743 0,062 Total 15 7,282 (*) Variável sob a transformação raiz quadrada Tabela 2. Média (desvio padrão) da raiz quadrada da sobrevida segundo inseticida e meio de cultura Meio de cultura (carência) Inseticida Glicose Hidrato de Carbono Atrazine 7,140 (0,150) b B 5,914 (0,184) b A Dalapon 5,933 (0,264) a B 5,400 (0,348) a A DHS (Inseticida/Meio) = 0,384 (letras minúsculas) DHS (Meio/Inseticida) = 0,384 (letras maiúsculas) 2. Fator A (Bebida Alcoólica): A1 (Ausente) e A2(Presente) Fator B (Período de Administração): B1(Manhã), B2(Tarde) e B3(Noite) Tratamentos: A1B1(Bebida Ausente e Período Manhã) A1B2(Bebida Ausente e Período Tarde) A1B3(Bebida Ausente e Período Noite) A2B1(Bebida Presente e Período Manhã) A2B2(Bebida Presente e Período Tarde) A2B3(Bebida Presente e Período Noite) 3. Tabela 1. ANOVA para a variável estudada C. Variação GL SQ QM Blocos 3 32,19 10,73 F - Tratamento 3 652,19 217,40 118,15 (p<0,001) A 1 248,07 248,07 134,82 (p<0,001) B 1 390,07 390,07 212,00 (p<0,001) 7,64 (p<0,05) A´ B 1 14,05 14,05 Resíduo 9 16,56 1,84 Total 15 700,94 delineamento_de_experimentos-prova4.indd 73 28/05/2014 15:52:22 74 | DELINEAMENTO DE EXPERIMENTOS FINT = 7, 64( p < 0, 05) ; ou seja, o resultado do teste da interação dos fatores A e B é significante, indicando que há necessidade de estudo conjunto dos fatores para a discussão dos resultados. delineamento_de_experimentos-prova4.indd 74 28/05/2014 15:52:25 5 ANÁLISE DE ADERÊNCIA E ASSOCIAÇÃO 5.1 INTRODUÇÃO Considere o estudo de variáveis aleatórias (que podem ser qualitativas ou quantitativas) cujos elementos da amostra podem ser classificados em categorias, ou intervalos, ou ainda atributos. Em particular, o estudo será aprofundado em tabelas de dupla entrada em que se apresenta a situação geral, em que duas variáveis aleatórias qualitativas X e Y foram classificadas em c categorias para X e s categorias para Y. 5.2 TESTE DE ADERÊNCIA Considere que se tem uma população π e que o objetivo proposto consiste em verificar se ela segue uma distribuição especificada π0, ou seja, testar a hipótese H 0 : p = p0 . Nesta situação, o teste estatístico comparará o número de casos ocorridos (frequências observadas) em categorias especificadas, com o número esperado (frequências esperadas) de casos sob a veracidade da hipótese nula H 0 . O procedimento consiste em considerar classes, segundo as quais a variável X, característica em estudo da população, pode ser classificada (a variável X pode ser qualitativa ou quantitativa). A situação geral com c categorias pode ser apresentada conforme Tabela 5.1. delineamento_de_experimentos-prova4.indd 75 28/05/2014 15:52:26 76 | DELINEAMENTO DE EXPERIMENTOS Tabela 5.1 Distribuição do número de casos segundo classe de X Classe de X Número de casos Classe 1 n1 ( fo1 ) Classe 2 n2 ( fo2 ) Classe c nc ( foc ) Total n( foi) Lembrar que: n1 + n2 + ... + nc = n , ou seja, fo1 + fo2 + ... + foc = foi (total de casos). O número de casos (ocorrências) da classe i, designado por ni , será nomindo de frequência observada na classe i e indicado por foi , com i =1,..., c . As hipóteses são apresentadas como: H 0 : p1 = p01 ; p2 = p02 ;pc = p0c ; H1 : Existe pi ¹ p0i para algum i . As frequências esperadas ((fei) do modelo multinomial (cc classes) são obtidas sob a veracidade de H0, especificadas na expressão: fei = np0 ; onde n é i o número total de casos e p0 a proporção teórica da classe i expressa em H 0 . i A estatística do teste, sob veracidade de c c2 = ∑ i=1 ( foi − fei ) 2 fei H0 , é dada por ~ c(2c−1) , com a regra de decisão habitual (isto é, χ2 ≥ χ(2α ;c−1), re- jeita-se H 0 . Caso contrário, não há rejeição). Deve ser considerado a unilateralidade direita do teste, pois quanto maiores os afastamentos entre as frequências observadas e esperadas mais expressiva torna-se a falta de aderência dos dados ao modelo proposto e, em consequência, mais provável a veracidade de H1 em favor da rejeição de H 0 . O emprego apropriado do teste recomenda sua utilização somente quando não existir mais de 20% das caselas com frequências esperadas menores que 5. A prática biológica permite a junção de classes adjacentes para contornar essa situação sempre que possível. Na sequência serão apresentados dois exemplos para o estudo da aderência. delineamento_de_experimentos-prova4.indd 76 28/05/2014 15:52:27 Análise de Aderência e Associação | 77 Exemplos 1. Um modelo genético especifica que animais de certa população devem estar classificados em quatro categorias, nas proporções 8:1:1:2. Numa amostra de 180 animais da população encontra-se 116, 15, 20 e 29 animais de cada categoria, respectivamente. Verificar, no nível de significância 5%, se os dados estão de acordo com o modelo genético especificado. Categoria Frequência Observada C1 116 C2 15 C3 20 C4 29 Total 180 H 0 : Modelo Especificado 8:1:1:2 8 1 1 2 p01 = ; p02 = ; p03 = ; p04 = 12 12 12 12 H1 : Existe pi ¹ p0i , para pelo menos um i(i =1, 2, 3, 4) Frequências Esperadas 8 = 120 animais , 12 1 Categoria 2 → fe2 = 180× = 15 animais , 12 1 Categoria 3 → fe3 = 180× = 15 animais , 12 2 Categoria 4 → fe4 = 180× = 30 animais . 12 Categoria 1 → fei = 180× Logo, tem-se (116 −120) 2 c2 = 120 (15 −15) 2 + 15 (20 −15) 2 + 15 (29 − 30) 2 + 30 = 0,133 + 0,0000 + 1, 667 + 0, 033 = 1, 833 α = 0, 05⎫⎪⎪ 2 = 7, 81 ∴ χ2 = 1, 833( p > 0, 05) ⎬χ c = 4 ⎪⎪⎭ (0,05;3) Não há rejeição de H 0 no nível de 5% de significância. Ou seja, a amostra de animais está em acordo com modelo genético especificado. 2. Considerando-se uma amostra de 100 descendentes de uma população, verificar (nível de 5% de significância) a adequabilidade dos dados ao modelo genético – Equilíbrio Hardy-Weinberg. delineamento_de_experimentos-prova4.indd 77 28/05/2014 15:52:39 78 | DELINEAMENTO DE EXPERIMENTOS H0: Equilíbrio Hardy-Weinberg (Eq HW) Genótipo Frequência Observada AA 26 Aa 35 Aa Aa AA Aa aa ¼ ½ ¼ aa 39 Total 100 1 1 1 π01 = ; π02 = ; π03 = 4 2 4 : Não há Eq HW na descendência 1 Frequência Esperada Genótipo AA → fe1 = 100× 1 = 25 Genótipo Aa → Genótipo aa → 4 1 fe2 = 100× = 50 2 1 fe3 = 100× = 25 4 Logo, tem-se (26 − 25) 2 c2 = (35 − 50) 2 + (39 − 25) 2 + = 0, 04 + 4, 50 + 7, 84 = 12, 38 25 50 25 α = 0, 05⎪⎫⎪ 2 = 5, 99 ∴ χ2 = 12, 38( p < 0, 05) ⎬χ c = 3 ⎪⎪⎭ (0,05;2) Para α=0,05, há rejeição de H0, ou seja, a população não segue o equilíbrio Hardy-Weinberg. 5.3 TESTE DE HOMOGENEIDADE Considere m populações π1, π2,..., πm distribuídas em c categorias mutuamente exclusivas. Objetiva-se verificar se as m populações (π1,...,πm) podem ser representadas por uma distribuição comum a todas (H 0 : p1 = p2 = = pm ) contra a alternativa em que pelo menos duas são distintas (H1 : Existe pi ≠ pi ’ para i ≠ i ’; i, i ’ = 1,, m) . Contemplando as m populações em c categorias, as frequências observadas podem ser apresentadas na tabela de dupla entrada m x c (Tabela de Contingência m x c ) delineamento_de_experimentos-prova4.indd 78 28/05/2014 15:52:46 Análise de Aderência e Associação | 79 Tabela 5.2 Resultados da categoria segundo população População Categoria Total C1 C2 ... Cc P1 fo11 fo12 ... fo1c fo1i P2 fo21 fo22 ... fo2c fo2i Pm fom1 fom2 ... fomc fomi Total foi1 foi2 ... foi c foii A hipótese de nulidade a ser testada é estabelecida como: ⎪⎧⎪p11 = p21 = = pm1 , ou equivalentemente, π1= π2=...=πm; contra ⎪⎪ ⎪p12 = p22 = = pm2 H0 : ⎨ ⎪⎪ ⎪⎪ ⎪⎪⎩p1c = p2c = = pmc a alternativa H1 : pelo menos uma das igualdades não é verificada. As frequências esperadas, considerando-se a hipótese H0 verdade são obtidas como: feij = foi• ×p j = foi• × fo• j fo•• , para i = 1,..., m e j = 1,..., c . Sob a veracidade de H0, a estatística do teste é dada por: m c c = ∑∑ 2 i=1 j=1 ( foij − feij ) 2 feij ~ c(2m−1)(c−1) , com a regra de decisão habitual. Ou seja, χ2 ≥ χ(2α ;(m−1)(c−1)) rejeita-se H ; caso contrário, não há rejeição. 0 Exemplos 1. Duas novas drogas vão ser testadas em 200 pessoas portadoras de rinite alérgica. Metade das pessoas recebe a droga A e a outra metade recebe a droga B. Considerando os dados apresentados a seguir, teste a hipótese de delineamento_de_experimentos-prova4.indd 79 28/05/2014 15:52:49 80 | DELINEAMENTO DE EXPERIMENTOS que as duas drogas são igualmente eficazes para tratar a doença (adotar a=0,05). Droga Eficaz Total Não Sim A 25 75 100 B 32 68 100 Total 57 143 200 H 0 : Droga A = Droga B ⎪⎧⎪p11 = p21 ⎨ ⎪⎪⎩p12 = p22 H1 : Droga A ≠ Droga B Frequências Esperadas fe11 = 57×100 = 28, 5 200 fe12 = 143×100 = 71, 5 200 fe21 = 57×100 = 28, 5 200 fe22 = 143×100 = 71, 5 200 (25 − 28, 5) 2 c2 = 28, 5 (32 − 28, 5) 2 + 28, 5 (75 − 71, 5) 2 + 71, 5 (68 − 71, 5) 2 + 71, 5 = 0, 43 + 0, 43 + 0,17 + 0,17 = 1, 20 α = 0, 05⎫⎪⎪ ⎪ m = 2 ⎪⎬ χ(20,05;1) = 3, 84 ∴ χ2 = 1, 20( p > 0, 05) ⎪ c = 2 ⎪⎪⎪⎭ No nível de 5% de significância, não há rejeição de H 0 . Isto é, as duas drogas são igualmente eficazes, no nível de 5% de significância. 2. Foram consideradas as distribuições do tipo sanguíneo do sistema MN em três populações (grupos) de indivíduos, conforme dados apresentados abaixo: delineamento_de_experimentos-prova4.indd 80 28/05/2014 15:53:01 Análise de Aderência e Associação | 81 Grupo Tipo Sanguíneo Total MM MN NN Controle 50 40 50 140 Gastrite 15 15 25 55 Úlcera 25 22 8 55 Total 90 77 83 250 Verificar, no nível de 5% de significância, se há diferença entre os grupos quanto a distribuição do tipo sanguíneo (isto é, se a patologia está associada ao sistema sanguíneo). H 0 : Controle = Gastrite = Úlcera H1 : Existe pelo menos uma diferença entre os grupos A seguinte tabela de frequências esperadas pode ser elaborada: Grupo NN Controle 50,40 43,12 46,48 140 Gastrite 19,80 16,94 18,26 55 Úlcera 19,80 16,94 18,26 55 90 77 83 250 (50 − 50, 40) 2 50, 40 Total MN Total c2 = Tipo Sanguíneo MM (40 − 43,12) 2 + 43,12 (8 −18, 26) 2 ++ 18, 26 c2 = 0, 0032 + 0, 2258 + 0, 2666 + 1,1636 + 0, 2222 + 2, 4878 + 1, 3657 + 1, 5114 + 5, 7649 c2 = 13, 01 α = 0, 05⎫⎪⎪ ⎪ m = 3 ⎪⎬ χ(20,05;4) = 9, 49 ∴ χ2 = 13, 01( p < 0, 05) ⎪ c = 3 ⎪⎪⎪⎭ Há rejeição de H0, ou seja, no nível de 5% de significância os grupos diferem quanto a distribuição do tipo sanguíneo (a patologia está associada ao sistema sanguíneo). delineamento_de_experimentos-prova4.indd 81 28/05/2014 15:53:01 82 | DELINEAMENTO DE EXPERIMENTOS 5.4 TESTE DE INDEPENDÊNCIA Uma situação muito interessante na área biológica consiste em considerar duas características (variáveis biológicas) avaliadas numa amostra de indivíduos e, verificar se a probabilidade de um indivíduo qualquer ser classificado nas categorias i (i = 1,..., m) e j ( j = 1,..., c ) simultaneamente, pode ser obtida pelo produto das probabilidades marginais. Ou seja, verificar se as duas características são independentes. Considerando a tabela de dupla entrada com m linhas e c colunas, objetiva-se testar as hipóteses: H 0 : pij = pi• ×p• j para todo par ( i, j ) as características estudadas são independentes; H1 : pij ≠ pi• ×p• j para algum par ( i, j ) as características estudadas são dependentes. As frequências esperadas, considerando-se H0 verdade, são dadas por feij = foi• fo• j fo•• . Resultado idêntico ao utilizado no teste de homogeneidade. Sob a veracidade de H0, a estatística do teste é expressa como m c c = ∑∑ 2 ( foij − feij ) 2 feij i=1 j=1 ~ c(2m−1)(c−1) , com a regra de decisão habitual. Exemplos 1. A tabela a seguir relaciona resultados de uma pesquisa obtidos de uma amostra aleatória de vítimas de diferentes crimes. Utilizando a=0,05, verificar se o tipo de crime é independente do fato do criminoso ser um estranho. Criminoso Crime Total Homicídio Roubo Assalto Estranho 15 400 230 Conhecido 45 100 210 355 Total 60 500 440 1000 delineamento_de_experimentos-prova4.indd 82 645 28/05/2014 15:53:01 Análise de Aderência e Associação | 83 ⎛para todo ⎞⎟ ⎟⇔ H 0 : pij = pi• ×p• j ⎜⎜⎜ ⎜⎝i = 1,2;j = 1,2,3⎟⎟⎠ ⎛para algum ⎞⎟ ⎟⎟ ⇔ H1 : pij ≠ pi• ×p• j ⎜⎜⎜ ⎝⎜i = 1,2;j = 1,2,3⎠⎟ Independência entre criminoso ser estranho e tipo de crime; Dependência entre criminoso ser estranho e tipo de crime. Frequências Esperadas fe11 = 60×645 = 38, 7 ; fe12 = 500×645 = 322, 5 ; fe13 = 440×645 = 283, 8 1000 1000 1000 fe21 = 60×355 = 21, 3 ; fe22 = 500×355 = 177, 5 ; fe23 = 440×355 = 156, 2 . 1000 1000 1000 (15 − 38, 7) 2 c2 = 38, 7 (400 − 322, 5) 2 + 322, 5 (210 −156, 2) 2 ++ 156, 2 = c2 = 14, 51 + 18, 62 + 10, 20 + 26, 37 + 33, 84 + 18, 53 = 122, 07 α = 0, 05⎪⎫⎪ ⎪ m = 2 ⎪⎬ χ(20,05;2) = 5, 99 ∴ χ2 = 122, 07( p < 0, 001) ⎪ c = 3 ⎪⎪⎪⎭ No nível de 5% de significância existe dependência entre o tipo de crime cometido e o fato do criminoso ser um estranho. 2. Os resultados da classificação de 100 pessoas segundo a cor dos olhos e do cabelo foram os seguintes: Cor do Cabelo Cor dos Olhos Cinza Total Castanhos Azuis Claro 13 18 9 Escuro 24 24 12 60 Total 37 42 21 100 40 No nível de 5% de significância a cor dos olhos está relacionada com a cor do cabelo? H 0 : Há independência entre a cor dos olhos e a cor do cabelo (pij = pi• ×p• j ) H1 : Há dependência entre a cor dos olhos e a cor do cabelo (pij ≠ pi• ×p• j ) Frequências Esperadas delineamento_de_experimentos-prova4.indd 83 28/05/2014 15:53:05 84 | DELINEAMENTO DE EXPERIMENTOS fe11 = 40×37 40×21 = 14, 8 ; fe12 = 40× 42 = 16, 8 ; fe13 = = 8, 4 100 100 100 fe21 = 60×37 = 22, 2 ; fe22 = 60× 42 = 25, 2 ; fe23 = 60×21 = 12, 6 . 100 100 100 (13 −14, 8) 2 c2 = 14, 8 (18 −16, 8) 2 + 16, 8 (12 −12, 6) 2 ++ 12, 6 c = 0, 22 + 0, 09 + 0, 04 + 0,15 + 0, 06 + 0, 03 = 0, 59 2 α = 0, 05⎪⎫⎪ ⎪ m = 2 ⎪⎬ χ(20,05;2) = 5, 99 ∴ χ2 = 0, 59( p > 0, 05) ⎪ c = 3 ⎪⎪⎪⎭ No nível de 5% de significância não se rejeita H0, ou seja, existe independência entre a cor dos olhos e a cor do cabelo. 5.5 EXERCÍCIOS (TESTES DE ADERÊNCIA E ASSOCIAÇÃO) 1. Suponha que um teste de aptidão verbal tenha sido aplicado a um grupo de 120 adolescentes do gênero masculino e 100 do gênero feminino. Os resultados estão a seguir. Qual a conclusão a respeito da associação entre gênero e aptidão verbal no nível de 5% de significância? Gênero 2. Nível de Aptidão Total Superior Médio Inferior Feminino 25 55 20 100 Masculino 20 80 20 120 Total 45 135 40 220 Desejando-se colocar à prova a hipótese de que a idade da mãe tem certa influência sobre o nascimento de criança prematura, um pesquisador verificou que, dentre 90 casos de prematuridade, 40 envolviam mães com idade inferior a 18 anos; 15 envolviam mães de 18 a 35 anos e 35 mães com idade acima de 35 anos. No nível de 5% de significância, isto leva o pesquisador a manter sua hipótese? delineamento_de_experimentos-prova4.indd 84 28/05/2014 15:53:15 Análise de Aderência e Associação | 85 3. Em um teste quiquadrado, quanto maior a diferença entre frequências esperadas e observadas, maior chance temos de: a) aceitar (não rejeitar) H0 ou b) rejeitar H0? Explicar a resposta. 4. Considere o seguinte resultado quanto ao tabagismo dos pais e filhos Pais Filhos Tabagistas Não Tabagistas Tabagistas 49 16 Não Tabagistas 106 79 Verificar no nível de 5% de significância a associação entre pais e filhos quanto ao tabagismo 5. Conforme a herança mendeliana, a descendência de certo cruzamento deveria ser vermelha, preta ou branca na seguinte proporção: 9:3:4. Se um experimento mostrou 74, 32 e 38 descendentes nessas categorias, a teoria está confirmada, sendo α=0,05? 6. A seguir são apresentados dados sobre a presença (ou não) de anomalia em recém-nascidos vivos segundo o sexo. Sexo Anomalia Ausente Presente Masculino 586 14 Feminino 674 26 Verifique, no nível de significância 5%, se a proporção de recém-nascidos vivos portadores de anomalia é a mesma nos dois sexos. 7. Com base nos dados apresentados a seguir, verificar se a condição de vivo ou natimorto é homogênea nos dois sexos, considerando-se a=0,01. Sexo delineamento_de_experimentos-prova4.indd 85 Condição Vivo Natimorto Masculino 825 25 Feminino 960 40 28/05/2014 15:53:20 86 | DELINEAMENTO DE EXPERIMENTOS 8. Considere a distribuição de ervilhas do cruzamento de plantas de sementes lisas e albume amarelo com plantas de sementes rugosas e albume verde. Sementes Frequência Amarelo-lisas 380 Amarelo-rugosas 100 Verde-lisas 130 Verde-rugosas 30 No nível de significância de 5%, os resultados estão de acordo com a teoria postulada por Mendel (9:3:3:1, para as classes de sementes). 9. Considere uma amostra do mês de nascimento de 200 políticos brasileiros. Verificar (α=0,05) a hipótese de que o mês de nascimento tem uma distribuição uniforme nos políticos brasileiros. Mês Jan Fev Mar Abr Maio Jun Jul Ago Set Out Nov Dez Frequência 16 18 13 15 16 12 20 20 18 14 18 20 10. Numa Universidade, os estudantes de dois programas de pós-graduação diferentes são submetidos ao mesmo exame de conhecimentos de redação científica. Os conceitos obtidos foram os seguintes: Programa de PG Conceito Fraco Regular Bom XY 16 8 20 Excelente 9 WZ 18 12 26 22 No nível de significância 5%, a distribuição dos conceitos é homogênea nos dois programas? 11. Numa pesquisa 120 pares de gêmeos foram classificados segundo o sexo e a ordem que ocorreu o nascimento. delineamento_de_experimentos-prova4.indd 86 28/05/2014 15:53:20 Análise de Aderência e Associação | 87 Primeiro a nascer Segundo a nascer Masculino Feminino Masculino 38 22 Feminino 26 34 No nível de significância 5% verificar se o sexo e a ordem de nascimento são independentes. 12. Foram amostrados 120 pares de gêmeos classificados de acordo com o sexo com o seguinte resultado: Situação Dois meninos Duas meninas Um menino e Uma menina 34 38 48 Frequência Verificar, no nível de significância 5%, se a classificação do sexo está em acordo com o modelo binomial B (2; 1 2 ) . 5.6 RESPOSTAS DOS EXERCÍCIOS (TESTES DE ADERÊNCIA E ASSOCIAÇÃO) 1. c2 = 3, 40( p > 0, 05) 2. c2 = 11, 67( p < 0, 01) 3. Quanto mais os valores observados se afastam dos esperados, têm-se maiores desvios (sendo o numerador do cálculo elevado ao quadrado) e, portanto, aumenta a chance de rejeitar a hipótese de nulidade (H0). 4. c2 = 6, 68( p < 0, 01) 5. c2 = 1, 64( p > 0, 05) 6. c2 = 2, 07( p > 0, 05) 7. c2 = 1, 52( p > 0, 05) 8. c2 = 7, 78( p > 0, 05) 9. c2 = 5, 08( p > 0, 05) 2 10. c = 2, 47( p > 0, 05) delineamento_de_experimentos-prova4.indd 87 28/05/2014 15:53:20 88 | DELINEAMENTO DE EXPERIMENTOS 2 11. c = 4, 82( p < 0, 05) 2 12. c = 5, 07( p > 0, 05) delineamento_de_experimentos-prova4.indd 88 28/05/2014 15:53:26 6 CORRELAÇÃO LINEAR SIMPLES 6.1 INTRODUÇÃO Nas áreas biológicas, em algumas situações, o pesquisador está interessado em estudar a maneira como duas variáveis X e Y estão associadas e, mais ainda, medir o seu grau de associação. Alguns exemplos que podem esclarecer essa situação são bastante comuns em nosso cotidiano, quais são: afirmar que a pressão arterial aumenta quando a idade avança; a altura de uma árvore está relacionada ao perímetro do tronco; o desempenho de um atleta melhora com o treinamento, e assim por diante. Em todas as situações estão sendo considerados, simultaneamente, os valores de duas variáveis aleatórias mensuradas num mesmo indivíduo, isto é, observações pareadas. Como já descrito anteriormente, busca-se verificar qual o sentido e a intensidade da associação entre as variáveis, mas jamais utilizar essa busca como uma relação de causa e efeito. Ou seja, a observação de que duas grandezas podem variar simultaneamente no mesmo sentido ou em sentidos contrários, não implica a presença de um relacionamento causal entre elas. No presente texto será considerado que a associação entre as variáveis pode ser estudada por meio de uma relação linear, ou seja, os pares de pontos distribuídos na vizinhança de uma reta. Para melhorar o entendimento entre correlação e causalidade, suponha, por exemplo, uma associação positiva entre o consumo de líquido de uma cidade e o número de internações por desidratação. A falácia da causalidade poderia levar a diminuição de ingestão de líquido para diminuir o número de internações por desidratação. Lógico, que neste caso, uma terceira ou mais delineamento_de_experimentos-prova4.indd 89 28/05/2014 15:53:28 90 | DELINEAMENTO DE EXPERIMENTOS variáveis (temperatura, umidade relativa do ar,...) podem estar causando a correlação entre consumo de líquido e número de internações. Essas variáveis são denominadas de variáveis intercorrentes (não conhecidas) e a falsa correlação que elas fornecem é chamada de correlação espúria. 6.2 DIAGRAMA DE DISPERSÃO O diagrama de dispersão consiste de um gráfico bidimensional (sistema de eixos cartesianos (X,Y)) onde são alocados os n pares de observações das variáveis aleatórias X e Y. O objetivo do diagrama de dispersão é possibilitar a visualização da relação existente entre as variáveis X e Y. Se os pontos estiverem localizados na vizinhança de uma reta há indicação de correlação, se X e Y crescem no mesmo sentido, a indicação é no sentido de correlação positiva, caso a variação aconteça no sentido oposto (contrário), existe correlação negativa entre as variáveis. A Tabela 6.1 apresenta o desempenho físico e psicológico de mulheres obesas submetidas aos testes relativos à qualidade de vida das participantes. Tabela 6.1 Desempenho físico e psicológico de mulheres obesas submetidas ao “Deep water running and quality of life in obese women (Arquivos Médicos do ABC, v.32, p.5-10, 2007)” delineamento_de_experimentos-prova4.indd 90 Mulher D. Físico (%) D. Psicológico (%) M1 30 35 M2 40 50 M3 75 70 M4 50 50 M5 35 30 M6 60 65 M7 70 55 M8 55 55 28/05/2014 15:53:28 Correlação Linear Simples | 91 D. Psicológico 80 70 60 50 40 30 20 20 30 Figura 6.1 40 50 60 70 80 90 D. Físico Diagrama de Dispersão dos Domínios Físico (%) e Psicológico (%) A inspeção visual, mostra de maneira subjetiva, a tendência linear nas observações no sentido positivo, ou seja, as mulheres mostraram associação direta nas respostas dos domínios físico e psicológico. A intensidade dessa associação pode ser mensurada, objetivamente, pelo coeficiente de correlação linear de Pearson, sendo que a intensidade será tanto maior quanto menor for a dispersão dos pontos em relação à tendência linear. 6.3 COEFICIENTE DE CORRELAÇÃO A medida do grau (intensidade) de associação linear entre duas variáveis aleatórias quantitativas (numéricas) pode ser estabelecida pelo coeficiente de correlação de Pearson, representado por r e expresso para n pares (xi, yi) de uma amostra aleatória das variáveis X e Y como: r= Sxy Sxx S yy , onde n n Sxy = SP ( X ,Y ) = ∑( xi − x )( yi − y ) = ∑ xi yi − nxy ; i=1 n i=1 n Sxx = SQ ( X ) = ∑ ( xi − x ) = ∑ xi2 − nx 2 ; 2 i=1 n i=1 n S yy = SQ (Y ) = ∑ ( yi − y ) = ∑ yi2 − ny 2 . i=1 delineamento_de_experimentos-prova4.indd 91 2 i =1 28/05/2014 15:53:28 92 | DELINEAMENTO DE EXPERIMENTOS Algumas considerações interessantes podem ser feitas a respeito do valor de r: a) −1 ≤ r ≤ 1 ; b) r = +1 , correlação perfeita positiva (todos os pontos estão sobre uma linha reta crescente); r = −1 , correlação perfeita negativa (todos os pontos estão sobre uma c) linha reta decrescente); r = 0 ; correlação nula (ausência de associação linear entre as variáveis d) X e Y); e) r é adimensional. A seguir serão apresentados dois exemplos para o cálculo da correlação linear simples. Exemplos 1. Considerando os dados da Tabela 6.1, tem-se: 8 ∑x = 30 + + 55 = 415 , portanto, x = 51, 875 ; i i=1 8 ∑x = 302 + + 552 = 23375 ; 2 i i=1 Sxx = SQ ( X ) = 23375 − 8×51, 8752 = 1846, 875 ; 8 ∑y i = 35 + + 55 = 410 , portanto, y = 51, 25 ; 2 i = 352 + + 552 = 22300 ; i=1 8 ∑y i=1 S yy = SQ (Y ) = 22300 − 8×51, 252 = 1287, 5 ; 8 ∑x y i i = 30×35 + 40×50 + + 55×55 = 1050 + 2000 + + 3025 = 22625 ; i=1 Sxy = SP ( X ,Y ) = 22625 − 8×51, 875×51, 25 = 1356, 25 ; logo r = 1356, 25 1356, 25 = = 0, 8795 ≈ 0, 88 1846, 875×1287, 5 1542, 0284 delineamento_de_experimentos-prova4.indd 92 28/05/2014 15:53:30 Correlação Linear Simples | 93 A magnitude da associação linear entre as variáveis é da ordem de 0,88, mostrando que as mulheres que tiveram maiores porcentagens no domínio físico são também as de maiores valores percentuais no domínio psicológico. 2. Considere as seguintes notas em Bioestatística e Biofísica de 11 alunos de Ciências Biológicas selecionados aleatoriamente entre todos os matriculados, conforme Tabela 6.2 Tabela 6.2 Notas de 11 alunos em Bioestatística e Biofísica Aluno A B C D E F G H I J K Bioestatística (X) 6,7 8,1 6,5 4,2 5,3 4,0 7,1 6,4 6,0 6,8 4,9 Biofísica (Y) 9,2 6,5 8,1 7,5 8,5 7,8 7,7 7,9 8,1 8,2 8,5 ∑ xi = 66, 0 , logo x = 6, 0 ; ∑y 11 i=1 11 ∑( x − x ) 2 i i=1 11 i = 88, 0 , logo y = 8, 0 ; i=1 = (0, 7) + (2,1) + (0, 5) + (−1, 8) + (−0, 7) + (−2, 0) + (1,1) + (0, 4) 2 2 2 2 2 2 2 2 +(0, 0) + (0, 8) + (−1,1) = 16,1 ; 2 2 11 ∑( y − y ) 2 i i=1 2 = (1, 2) + (−1, 5) + (0,1) + (−0, 5) + (0, 5) + (−0, 2) + (−0, 3) 2 2 2 2 2 2 2 +(−0,1) + (0,1) + (0, 2) + (0, 5) = 4, 64 ; 2 2 2 2 11 ∑(x − x )( y − y ) = (0, 7)(1, 2) + (2,1)(−1, 5) + (0, 5)(0,1) ++ (0, 8)(0, 2) + (−1,1)(0, 5) = −2, 07 ; i i i=1 r= −2, 07 −2, 07 = = −0, 24 8, 64 16,1× 4, 64 O coeficiente de correlação negativo (-0,24) mostra que os alunos com maiores notas em Bioestatística estão com menores notas em Biofísica, e viceversa. Porém, deve ser observado que o valor r = −0, 24 expressa uma fraca correlação linear negativa entre as variáveis. delineamento_de_experimentos-prova4.indd 93 28/05/2014 15:53:40 94 | DELINEAMENTO DE EXPERIMENTOS 6.4 TESTE DE HIPÓTESE DA CORRELAÇÃO Considerando as variáveis aleatórias X ~ N (μx , σx2 ) e Y ~ N (μy , σ 2y ) , as hipóteses a respeito da ausência ou presença de associação linear entre as variáveis X e Y podem ser estabelecidas como: H 0 : rxy = 0 (ausência de associação linear entre as variáveis X e Y) H1 : rxy ¹ 0 (presença de associação linear entre as variáveis X e Y). r n−2 ~ t(n−2) , Sob a veracidade de H0 a estatística do teste é dada por: t = 1− r 2 com a regra de decisão habitual ( ou seja, se t ≥ t(a 2 ,n−2) , rejeita-se a hipótese H0; caso contrário, não há rejeição). Alternativamente, o valor do resultado do coeficiente de correlação linear de Pearson ( r ) pode ser comparado com os valores críticos da Tabela 9.9, com a seguinte regra de decisão: Se r > r( a 2 ;n ) , rejeita-se H 0 ao nível a (0,05 ou 0,01) de significância estabe- lecido. Caso contrário, não há rejeição da hipótese nula (ausência de associação linear entre X e Y). Exemplos 1. Considerando os dados da Tabela 6.1 e a=0,05, tem-se H 0 : rxy = 0 (ausência de associação linear) H1 : rxy ¹ 0 (presença de associação linear) t= 0, 88 6 = 2,156 = 4, 54( p < 0, 01) 0, 475 1− 0, 88 α = 0, 05 = 2, 45; t > 2, 45 , portanto, rejeita-se H0. t ϕ = 8 − 2 = 6 (0,025;6) 2 } No nível de significância 5% existe associação linear entre os domínios físico e psicológico. delineamento_de_experimentos-prova4.indd 94 28/05/2014 15:53:46 Correlação Linear Simples | 95 2. Considerando os dados das notas de Bioestatística e Biofísica da Tabela 6.2, tem-se: H 0 : rxy = 0 (ausência de associação linear) H1 : rxy ¹ 0 (presença de associação linear) t= −0, 24 9 1−(−0, 24) 2 = −0, 72 = −0, 74( p > 0, 05) 0, 97 } α = 0, 05 t(0,025;9) = 2, 26; t < 2, 26 , não se rejeita H0. ϕ=9 No nível de significância 5%, não foi possível mostrar associação linear entre as notas de Bioestatística e Biofísica nos alunos de Ciências Biológicas. 6.5 EXERCÍCIOS (CORRELAÇÃO LINEAR SIMPLES) 1. Um antropólogo mediu a largura e o comprimento de 30 crânios amostrados de uma população, obtendo um coeficiente de correlação r=0,75. Supondo α=0,05, verificar se existe associação entre as variáveis. 2. Os valores das variáveis X e Y devem ser medidos na mesma unidade para que se possa calcular o coeficiente de correlação linear? 3. Considere a idade gestacional (semanas) e o peso ao nascer (kg), de uma amostra casual de 10 recém-nascidos no HC/UNESP-Botucatu(SP). Recém-nascido Idade Gestacional Peso ao Nascer RN1 RN2 RN3 RN4 RN5 RN6 RN7 RN8 RN9 34 35 37 32 42 40 41 39 28 RN10 38 1,60 1,70 2,00 1,55 4,30 3,00 3,40 3,30 1,25 2,35 No nível de significância 5%, verificar se existe associação linear entre a idade gestacional e o peso ao nascer. delineamento_de_experimentos-prova4.indd 95 28/05/2014 15:53:55 96 | DELINEAMENTO DE EXPERIMENTOS 4. Em um experimento com carneiros foram determinados os seguintes resultados no plasma dos animais: Carneiro 1 2 3 4 5 6 7 8 9 Conc. Albumina (g%) 2,3 3,5 4,8 1,9 2,7 5,8 4,6 5,4 3,9 Horm. Crescimento (mμg/ml) 41,4 48,6 56,4 40,3 45,3 61,4 52,0 54,0 42,8 Verificar se existe associação linear (a=0,05) entre a concentração de albumina e o hormônio de crescimento no plasma de carneiros. 5. Apresenta-se a seguir uma matriz de correlação para instrução (X), salário (Y) e idade (Z) de uma amostra de 50 indivíduos. Variável Variável Instrução Salário Idade Instrução 1,00 0,60 -0,40 1,00 0,50 Salário Idade 1,00 Quais são significantes no nível 0,05? 6. A correlação entre aptidão matemática e línguas estrangeiras, baseada em testes para medir aptidões, está por volta de 0,40. Qual deve ser o tamanho de uma amostra de estudantes para estarmos certos (nível de significância 5%) de que o valor do r obtido refutaria a hipótese H 0 : r = 0 ? 7. Como deve ser afetado o valor do coeficiente de correlação r se trocarmos as variáveis X por Y e Y por X? 8. Dê um exemplo de duas variáveis que, sem dúvida, estão altamente relacionadas mas para as quais o valor de r seria pequeno pelo fato de a relação não ser linear. 9. Considere os seguintes dados relativos a altura e peso de 10 estudantes de uma sala de aula e verifique, no nível de significância 5%, se as variáveis estão associadas linearmente. delineamento_de_experimentos-prova4.indd 96 28/05/2014 15:53:58 Correlação Linear Simples | 97 Estudante 10. E1 E2 E3 E4 E5 E6 E7 E8 E9 E10 Altura 124 161 126 184 172 140 158 135 180 174 Peso 65 76 64 95 86 68 70 68 92 87 Indique o erro na conclusão Fato: Há uma associação linear significante (p<0,05) entre a renda pessoal e o número de anos de escolaridade. Conclusão: Mais instrução tem como resultado maior renda pessoal. 11. Como é afetado o valor do coeficiente de correlação linear quando se adiciona a mesma constante a cada valor da variável X? 12. Com base em uma amostra de 38 pares de valores foi obtido o coeficiente de correlação r=0,45. Teste (α=0,05) a hipótese de que o coeficiente de correlação das variáveis é zero. 13. Verificar se existe associação significativa (α=0,05) entre horas de estudo e nota da prova, segundo os dados abaixo: 14. Aluno A B C D E F G H I K L M Horas de estudo 4 1 3 5 8 3 6 7 7 6 2 4 Nota da prova 5 2 4 7 9 5 7 10 8 6 3 3 Um coeficiente de correlação linear de Pearson, baseado em uma amostra de tamanho 18, foi calculado como 0,45. Pode-se concluir, no nível de 5% de significância, que há associação entre as variáveis X e Y? 15. Para uma amostra de tamanho 11, determinar o valor mínimo do coeficiente de correlação r, de modo que a hipótese de ausência de associação linear entre X e Y( H 0 ) seja rejeitada ao nível de confiança 99% (isto é, sempre que r > r(0,01;11) ). 16. Nas questões seguintes aprofunde a discussão no erro de conclusão. a. Fato: Há uma correlação linear significativa entre a renda pessoal e o delineamento_de_experimentos-prova4.indd 97 28/05/2014 15:54:00 98 | DELINEAMENTO DE EXPERIMENTOS número de anos de escolaridade. Conclusão: mais instrução tem como resultado maior renda pessoal. b. Fato: Indivíduos fazem um teste de habilidade verbal e um teste de destreza manual; os pares de observação acusam um coeficiente de correlação linear muito próximo de zero. Conclusão: Não há qualquer relacionamento entre os escores dos dois testes. 17. Explique o que está errado na seguinte afirmação: “Determinou-se uma associação linear forte, expressa pelo valor r=1,16, entre a avaliação do ensino ministrado pela universidade indicada pelos estudantes e outra feito por membros externos à instituição”. 6.6 RESPOSTAS DOS EXERCÍCIOS (CORRELAÇÃO LINEAR SIMPLES) 1. t = 6, 00( p < 0, 001) 2. Não. Basta que sejam variáveis quantitativas 3. r = 0, 900 ; t = 5, 84( p < 0, 001) 4. r = 0, 914 ; t = 5, 96( p < 0, 001) 5. t(INST×SAL) = 5, 20( p < 0, 001) t(INST×IDADE) = −3, 02( p < 0, 01) t(SAL×IDADE) = 4, 00( p < 0, 001) 6. No mínimo composta por 25 estudantes 7. O valor permanece inalterado 8. Quantidade de adubação no solo e produção 9. r = 0, 949 ; t = 8, 52( p < 0, 001) 10. A conclusão está fazendo uma relação de causa e efeito, quando na realidade existe apenas uma associação linear delineamento_de_experimentos-prova4.indd 98 28/05/2014 15:54:02 Correlação Linear Simples | 99 11. O valor permanece inalterado 12. t = 2, 70( p < 0, 05) 13. r = 0, 921 ; t = 7, 48( p < 0, 01) 14. t = 2, 02( p > 0, 05) 15. r ³ 0, 7348 ; portanto r = 0, 7348 16. a. b. (valor mínimo) Relação de causa e efeito para um indicativo apenas de associação. b) Não há associação linear, fato que não exclui a possibilidade de outro tipo de relação. 17. O valor de r não pode ser maior que a unidade. delineamento_de_experimentos-prova4.indd 99 28/05/2014 15:54:10 delineamento_de_experimentos-prova4.indd 100 28/05/2014 15:54:14 7 REGRESSÃO LINEAR SIMPLES 7.1 INTRODUÇÃO Os fenômenos biológicos, quase que na plenitude das situações, podem ser explicados por meio de modelos matemáticos e estocásticos (modelos matemáticos que incorporam elementos probabilísticos). Um modelo comum e de fácil entendimento biológico que tem sido utilizado para estudar a relação funcional entre duas variáveis consiste na função linear simples (Y = a + bX ) . Neste modelo, a idéia consiste em estudar a variação da variável aleatória contínua Y (variável dependente, variável resposta ou variável exógena) em função de uma variável fixa X, isto é, determinística (variável independente, variável explanatória ou variável endógena). Por exemplo, verificar as quedas na quantidade de açúcar no sangue de coelhos submetidos a doses diferentes de insulina (doses controladas). Para melhor entendimento, considere o seguinte experimento realizado na área de Bioquímica. Um bioquímico colocou plasma humano em cinco tubos de ensaio e depois adicionou procaína (quantidade fixa em cada tubo). Essa substância é um anestésico local que se decompõe por hidrólise. Para estudar a velocidade da hidrólise, o pesquisador observou, em tempos definidos e diferentes (4 min., 8 min., 12 min., 16 min. e 20 min.), a quantidade (moles/litro) de procaína hidrolisada em cada tubo de ensaio. Esquematicamente: delineamento_de_experimentos-prova4.indd 101 28/05/2014 15:54:14 102 | DELINEAMENTO DE EXPERIMENTOS 41 33 23 16 6 4 min 8 min 12 min 16 min 20 min Considerando o tempo com variável independente (X) e a quantidade de procaína hidrolisada, como a variável dependente (Y), como estabelecer o modelo da resposta linear de Y em função de X? 7.2 MODELO DE REGRESSÃO LINEAR SIMPLES A origem do termo regressão deve-se a Sir Francis Galton ( 1822-1911 ), inglês de classe alta que estudou medicina em Cambridge e explorou a África antes de se dedicar ao estudo da hereditariedade. A data do pioneirismo do uso aconteceu por volta de 1885, quando estava investigando relações antropométricas de sucessivas gerações, em resposta a seguinte interrogativa que fazia: “Se as alturas das pessoas estão distribuídas normalmente em cada geração, e se a altura é hereditária, qual é a relação entre as gerações?”. Uma das constatações verificada por Galton apontava que cada particularidade de um homem é transmitida aos seus descendentes, mas, em média, numa intensidade menor. Ou seja, embora pais com baixa estatura tendam a ter filhos também com baixa estatura, os filhos têm altura média maior que seus pais. Fato semelhante, em sentido reverso, ocorre com pais com estatura alta. Isto é, os filhos apresentam estatura alta, mas, em média, menor que seus pais. Galton chamou esse fenômeno de “regressão para a mediocridade”. delineamento_de_experimentos-prova4.indd 102 28/05/2014 15:54:15 Regressão Linear Simples | 103 Em sua análise, Galton denominou esse fenômeno de a altura mover-se em direção à altura dos pais de regressão, e às vezes de reversão, expressado num artigo de 1885, publicado no Journal of the Anthropological Institute (Bussab & Morettin, 2003). No contexto matemático, que não foi o caso de Galton, o ajuste de uma linha reta a quaisquer dados de duas variáveis quantitativas pode ser feito pelo método dos mínimos quadrados criado pelo matemático francês Legendre, por volta de 1805, cujo procedimento de obtenção dos parâmetros envolvidos no modelo linear será objeto de estudo no presente texto. Em relação ao experimento da procaína, inicialmente, como análise exploratória, torna-se interessante representar os pares de pontos ( xi , yi ) em um gráfico no sistema cartesiano para verificar se há uma tendência linear nos dados. Caso exista a tendência, o passo seguinte consiste em estabelecer o modelo de resposta linear Y = a + bX . Se não for verificada a tendência, a alternativa seria procurar outros modelos (não-lineares), cujo enfoque não será abordado neste texto. Para o gráfico considere a Tabela 7.1 de valores do tempo e da quantidade de procaína hidrolisada. delineamento_de_experimentos-prova4.indd 103 28/05/2014 15:54:15 104 | DELINEAMENTO DE EXPERIMENTOS Tabela 7.1 Valores observados nos tubos de ensaio Tempo (X) 4 8 12 16 20 Quantidade hidrolisada (Y) 6 16 23 33 41 Quantidade Hidrolisada (moles/litro) 45 40 35 30 25 20 15 10 5 0 0 4 8 12 16 Figura 7.1 Diagrama de dispersão dos dados 20 Tempo (min) Como pode ser visualizado existe uma tendência linear nos valores observados no experimento. Então, indaga-se: como procurar a equação da reta que “melhor” descreve a hidrólise da procaína em função do tempo que foi adicionado no plasma? Ou seja, como proceder ao ajuste de uma regressão linear simples (RLS) ao conjunto de dados? Ajustar uma RLS aos dados significa encontrar a equação da reta que melhor descreve o fenômeno biológico. Um procedimento matemático que permite encontrar esse modelo de resposta denomina-se Método de Mínimos Quadrados (MQ), cujo objetivo consiste em minimizar a soma dos quadrados dos erros (ou desvios). Para o ajuste da RLS e, posteriormente, para os testes de hipóteses as seguintes pressuposições são básicas: i. A relação entre as duas variáveis é linear. ii. Os valores de X são fixos, isto é, X é variável determinística. iii. A variabilidade de Y, para qualquer valor dado de X, é sempre a mesma. delineamento_de_experimentos-prova4.indd 104 28/05/2014 15:54:16 Regressão Linear Simples | 105 iv. O erro de uma observação não está correlacionado com o erro de outra observação (erros não correlacionados). v. Para qualquer dado valor de X, Y tem distribuição condicional normal ( E ( y x ) = α + β x ; Var ( y x ) = σ 2 ). Como descrito anteriormente, encontrar os estimadores de mínimos quadrados para os parâmetros (a, b) do modelo, consiste em considerar uma amostra aleatória de n pares ( xi , yi ), i = 1,, n ; e minimizar a quantidade de informação perdida pelo modelo, ou seja, a soma dos quadrados dos erros dada por: n n i=1 i=1 SQ (α, β ) = ∑ ei2 = ∑ ( yi −(α + β xi )) , com ei sendo o i-ésimo erro entre o 2 valor observado yi e o proposto pelo modelo E ( y xi ) = α + β xi . Derivando SQ (α, β ) em relação a a e b e igualando a zero, tem-se que as soluções α̂ (ou a) e β̂ (ou b) devem satisfazer: n n nαˆ + βˆ ∑ xi = ∑ yi ; i=1 i=1 n n n i=1 i=1 i=1 αˆ ∑ xi + βˆ ∑ xi2 = ∑ xi yi ; as quais produzem as soluções: αˆ = a = y − βˆ x ; β̂ = b = Sxy ; onde Sxx n n Sxx = ∑ ( xi − x ) = ∑ xi2 − nx 2 e 2 i=1 i=1 n n i=1 i=1 Sxy = ∑ ( xi − x )( yi − y ) = ∑ xi yi − nxy . Portanto, o modelo de regressão ajustado é dado como: yˆ i = αˆ + βˆ xi = a + bxi = y + b( xi − x ). No experimento bioquímico, tem-se n = 5 ; X : tempo(min) ; Y : quantidade hidrolisada (moles/L); delineamento_de_experimentos-prova4.indd 105 28/05/2014 15:54:16 106 | DELINEAMENTO DE EXPERIMENTOS 5 ∑x i = 4 + 8 + 12 + 16 + 20 = 60 , logo x =12 ; 2 i = 42 + 82 + 122 + 162 + 202 = 880 i=1 5 ∑x ; i=1 Sxx = 880 − 5×122 = 880 − 720 = 160 ; 5 ∑y i = 6 + 16 + 23 + 33 + 41 = 119 y = 23, 8 ; i=1 5 ∑x y i i = 4×6 + 8×16 + 12×23 + 16×33 + 20× 41 = 1776 ; i=1 Sxy = 1776 − 5×12, 0×23, 8 = 348 ; b= Sxy Sxx = 348 = 2,175 ; 160 a = y − bx = 23, 8 − 2,175×12 = −2, 3 ; ˆ = − 2, 3 + 2,175tempo . logo, yˆi = − 2, 3 + 2,175xi , isto é, QtHid O modelo yˆi = − 2, 3 + 2,175xi , constitui-se num preditor da quantidade de procaína hidrolisada para qualquer tempo considerado no intervalo de 4min a 20min. Além disso, o valor 2,175 (denominado coeficiente angular da regressão) indica a variação da variável Y por unidade de variação em X, ou seja, para cada minuto decorrido a quantidade de procaína hidrolisada tem um acréscimo de 2,175 moles/litro. O modelo estimado pode ser representado no sistema cartesiano por meio de uma reta correspondente à relação linear encontrada entre as variáveis. Então, considerando yˆi = − 2, 3 + 2,175xi , tem-se: xi = 4 → yˆ i = − 2, 3 + 2,175(4) = 6, 4 ; xi = 20 → yˆ i = − 2, 3 + 2,175(20) = 41, 2. delineamento_de_experimentos-prova4.indd 106 28/05/2014 15:54:26 Regressão Linear Simples | 107 Quantidade Hidrolisada 40 30 20 yˆ i = − 2, 3 + 2,175xi 10 0 Tempo 7.3 COEFICIENTE DE DETERMINAÇÃO O coeficiente de determinação (R2) indica a proporção da variação de Y que é explicada pela reta de regressão, ou seja, uma medida de precisão do modelo. Portanto, sendo uma proporção seu valor varia entre zero e um, inclu2 sive (0 ≤ R ≤ 1) . Fica mais prático interpretar quando seu valor é expresso em porcentagem, sendo 0% o caso extremo de imprecisão do modelo e, opostamente, 100% a retenção de toda informação do fenômeno biológico explicada pelo modelo ajustado. Valores entre essas porcentagens limites são tão pouco ou mais representativos quanto aos próximos dos extremos que se alinharem. O cálculo do coeficiente de determinação (R2) envolve a relação entre a soma de quadrados devida à regressão e a soma total de quadrados expressa na seguinte fórmula: R2 = SQRegressão = SQTotal Sxy2 Sxx S yy . Se não existisse qualquer variação em torno da reta de regressão (todos os pontos observados estivessem sobre a reta estimada), não haveria resíduos (erros) e, portanto, a soma de quadrados devida à regressão coincidiria com a soma total de quadrados, resultando R 2 = 1, 0 (100%) . Dificilmente essa condição acontece em biologia, uma vez que existe sempre uma componente aleatória nas respostas biológicas. No experimento bioquímico, tem-se: 5 ∑x i = 60 , com x =12 ; i=1 delineamento_de_experimentos-prova4.indd 107 5 ∑y i = 119 , com y = 23, 8 ; i=1 28/05/2014 15:54:34 108 | DELINEAMENTO DE EXPERIMENTOS 5 ∑ xi2 = 880 ; i=1 5 ∑ yi2 = 3591 ; i=1 5 ∑x y i i = 1776 ; resultando, i=1 Sxx =160 ; S yy = 758, 8 ; Sxy = 348 . Logo, R2 = 3482 = 0, 9975(99, 75%) , mostrando que o modelo ajusta160×758, 8 do explica 99,75% da variação da quantidade de procaína hidrolisada em função do tempo. 7.4 TESTE DO COEFICIENTE (ANGULAR) DE REGRESSÃO H 0 : b = 0 (não existe RLS de Y em X) H1 : b ¹ 0 (existe RLS de Y em X). Sob a veracidade de H0, a estatística do teste é dada por t = (n − 2)R2 1− R 2 ~ t(n−2) , com a regra de decisão habitual (rejeita-se H0, quando t ≥ t(a 2;n−2) ). Alternativamente o valor da estatística pode ser obtido como: t= S2 ⎞ 1 ⎛⎜ b Sxx ⎜⎜S yy − xy ⎟⎟⎟ . , onde Se2 = Sxx ⎟⎠ (n − 2)⎜⎝ Se No experimento bioquímico, tem-se H 0 : b = 0 (ausência de RLS da quantidade de procaína hidrolisada sobre o tempo) H1 : b ¹ 0 (presença de RLS da quantidade de procaína hidrolisada sobre o tempo). (5 − 2)0, 9975 = 34, 6( p < 0, 001) ; 1− 0, 9975 a = 0, 05 e n− 2 = 3 , tem-se t(0,025;3) = 3,18 , logo ( t > t(0,025;3) ) rejeita-se H0. n = 5 e R 2 = 0, 9975 , então t = Alternativamente: Sxx =160 ; S yy = 758, 8 ; Sxy = 348 e b = 2,175 1 ⎛⎜ 3482 ⎞⎟ Se = 0, 7958 ⎟ = 0, 6333 Se2 = ⎜⎜758, 8 − 5−2 ⎝ 160 ⎟⎟⎠ delineamento_de_experimentos-prova4.indd 108 28/05/2014 15:54:38 Regressão Linear Simples | 109 t= 2,175 160 = 34, 6( p < 0, 001) 0, 7958 Nesse sentido, conclui-se que existe regressão linear significativa (p<0,001) da quantidade de procaína hidrolisada em função do tempo. 7.5 EXERCÍCIOS (REGRESSÃO LINEAR SIMPLES) 1. Um laboratório está interessado em medir o efeito da temperatura sobre a potência de um antibiótico. Oito amostras de 50 gramas foram armazenadas a diferentes temperaturas, e após uma semana mediu-se a potência. Os resultados estão descritos a seguir. Temperatura (ºC) 30 38 46 54 62 70 78 86 Potência 45 41 39 32 28 23 10 17 a. Faça a representação gráfica dos dados. b. Ajuste a regressão linear simples da potência como função da temperatura. c. 2. A que temperatura a potência seria nula? Sejam X (duração da viagem, em dias) e Y(despesa, em US$, com viagem). Para uma amostra de 102 viagens, obteve-se: ∑x 2 = 4150 ; ∑y 2 = 740200 e ∑ x = 510 ; ∑ y = 7140 ; ∑ xy = 54900 . a. Qual a reta de regressão de Y em função de X? b. Uma viagem irá durar sete dias. Qual a estimativa de despesa para a viagem? 3. Para construir um modelo linear relacionando a quantidade de erros datilográficos (Y) e o tempo de experiência (X) em meses, constituiu-se uma amostra casual de 10 funcionários, obtendo-se os seguintes resultados numéricos: delineamento_de_experimentos-prova4.indd 109 28/05/2014 15:54:56 110 | DELINEAMENTO DE EXPERIMENTOS n =10 ; x = 6, 0 ; y =17, 0 ; Sxx =100 ; S yy = 644 e r = −0, 993 . 4. a. Determine o modelo de regressão linear de Y em X. b. No nível de significância 5%, faça o teste de hipótese da regressão. c. Encontre o valor do coeficiente de determinação. Os dados a seguir referem-se a precipitação anual (cm) e a produção de algodão (kg/ha) de uma amostra de sete produtores de uma dada região do estado. Precipitação 160 140 130 100 70 50 40 Produção 620 510 450 280 140 80 30 No nível de significância de 5%, verificar se existe RLS da produção de algodão em função de precipitação anual. 5. Se os filhos fossem exatamente 3 cm mais altos do que seus pais, como ficaria a reta de regressão que daria a altura dos filhos em função da altura dos pais? 6. Considere os dados da idade (em dias) e o peso (em gramas) de ratos machos da raça Wistar. Idade 25 28 30 32 34 35 38 40 42 43 45 46 47 48 49 50 Peso 62 61 66 69 74 75 80 82 88 89 91 95 95 97 99 99 Considerando o modelo RLS para o peso em função da idade, quanto deve ser o peso estimado de um rato com 33 dias de idade? 7. Suponha que, com base em 16 pares de observações, obteve-se as seguintes informações: ∑ x = 896 ; ∑ y = 655 ; ∑ x 2 = 52300 ; ∑y 2 = 29652 ; ∑ xy = 38368 . Qual é a proporção da variabilidade total dos dados que pode ser explicada pela regressão de Y em X? delineamento_de_experimentos-prova4.indd 110 28/05/2014 15:54:59 Regressão Linear Simples | 111 8. Considere os valores de X e Y obtidos em uma amostra com cinco observações. X 1 2 3 4 5 Y 16 12 8 7 5 Mostre com os dados que b = r 9. S yy Sxx Numa análise de RLS foram obtidos a partir de uma amostra de 6 pares de valores X e Y, os seguintes resultados: 16 ; sx = 3 (desvio padrão de X); s y = 5 (desvio padrão de Y); x = 3 e 25 y =10 . R2 = 10. a. Qual a equação de RLS de Y em X? b. No nível de significância 5%, teste as hipóteses H 0 : b = 0× H1 : b ≠ 0 . Para os pares (1,6);(2,5);(3,3);(4,3);(6,1), determine a equação de RLS de Y em X. Qual a variação de Y por unidade de variação de X? 11. Um laboratório está interessado em medir a influência da temperatura sobre a potência de um antibiótico. Dez amostras de 50g cada foram guardadas a diferentes temperaturas, e após 15 dias mediu-se a potência (quadro a seguir). a. Faça a representação gráfica dos dados. b. Ajuste a reta da potência como função da temperatura. c. A que temperatura a potência seria nula? Temperatura (ºC) 12. Potência 30 38 50 32 26 43 33 70 19 27 23 90 14 21 Qual o indicador estatístico que fornece o acréscimo ou decréscimo de Y esperado para cada variação unitária de X, numa relação linear entre Y e X? delineamento_de_experimentos-prova4.indd 111 28/05/2014 15:55:06 112 | DELINEAMENTO DE EXPERIMENTOS 13. Considere os seguintes pesos de pais e filhos, em kg. Família F1 F2 F3 F4 F5 F6 F7 F8 F9 F10 Peso do Pai 65 63 67 64 68 62 70 66 68 67 Peso do Filho 68 66 68 65 69 66 68 65 71 67 a. Construir o diagrama de dispersão. b. Estabelecer a regressão do peso do filho em função do peso do pai. Verificar a significância considerando a=0,05. 14. Suponha que, com base em 16 pares de observações, obteve-se as seguintes informações: ∑ x = 896; ∑ y = 655; ∑ x 2 = 52330; ∑ y 2 = 29652; ∑ xy = 38368 Utilizando essas informações, responda as questões a seguir: a. Determine a regressão linear de Y em X. b. Qual é a proporção da variabilidade total dos Y que pode ser explicada pela regressão de Y em X? 15. Considere os seguintes resultados de uma pesquisa envolvendo registro de armas automáticas e taxa de criminalidade em oito estados. Armas automáticas 11800 8300 3600 1800 6900 2600 4200 5960 Taxa de criminalidade(%) 18,1 16,8 9,4 6,4 14,6 8,8 10,6 11,8 Qual a predição linear para a taxa de criminalidade (%) em um estado com 10000 armas automáticas registradas? 7.6 RESPOSTAS DOS EXERCÍCIOS (REGRESSÃO LINEAR SIMPLES) 1. b. POTÊNCIA = 64,158 − 0, 600TEMPERATURA; 30 £ TEMP £ 86 c. TEMPERATURA =106, 93˚ C 2. a. Ŷ (DESPESA) = 10 + 12 X (DURAÇÃO) b. Yˆ (DESPESA7 DIAS ) = U $94, 00 delineamento_de_experimentos-prova4.indd 112 28/05/2014 15:55:11 Regressão Linear Simples | 113 3. a. Yˆ = 32,12 − 2, 52 X b. t = 23, 74 ( p < 0, 001) c. R 2 = 0, 986 ˆ = − 181, 528 + 4, 900 PRECIP t = 27, 01( p < 0, 001) 4. PROD 5. ALTˆ FILHO = 3 + ALT PAI ˆ = 17, 011 + 1, 661 IDADE , 25 £ IDADE £ 50 . 6. PESO ˆ (33DIAS ) = 71, 824gramas PESO 7. R 2 = 0, 676 (67,6% da variabilidade total dos dados é explicada pelo mod- elo). 8. SXX =10 ; SYY = 77, 2 ; SXY = −27 SYY r = −0, 9718 ; b = −2, 7 ; r S = −2, 7 XX Ou seja, fica mostrado que b = r SYY . SXX 9. a. Yˆ = 6, 01 + 1, 33 X , 1 £ X £ 6 b. t = 2, 67 ( p > 0, 05) . 10. Yˆ = 6, 757 − 0, 986 X ; ou seja, para cada unidade de X há uma decréscimo de 0,986 unidades em Y . ˆ = 50, 457 − 0, 381TEMP , 30 £ TEMP £ 90 11. b. POT c. TEMP =132, 43˚ C 12. Coeficiente de regressão linear ( b ) ˆ 13. b. PFILHO = 35, 479 + 0, 482PPAI ; 62 £ PPAI £ 70 ; t = 2, 34( p < 0, 05) 14. a. Yˆ = − 2, 8856 + 0, 7826 X b. R 2 = 0, 4654 = 46, 54% ˆ ˆ = 5, 304 + 0, 0012 ARMAS AUT ; TAXACRIM 15. TAXACRIM (10000) = 17, 304% delineamento_de_experimentos-prova4.indd 113 28/05/2014 15:55:13 delineamento_de_experimentos-prova4.indd 114 28/05/2014 15:55:28 8 BIBLIOGRAFIA ANDRADE, D.F.; OGLIARI, P.J. Estatística para as ciências agrárias e biológicas com noções de experimentação. 2.ed, Florianópolis: Editora UFSC, 2007. BANZATTO, D.A. & KRONKA, S.N. Experimentação agrícola, 3ªed. São Paulo: FUNEP, 2006. BOX, G. E. P. Non-normality and tests on variances. Biometrika, v.20, p.318-335, 1953. BUSSAB, W.O. Análise de variância e regressão. São Paulo: Atual, 1986. BUSSAB, W.O.; MORETTIN, P.A. Estatística básica. 5. ed. São Paulo: Saraiva, 2003. DEAN, A. M.; VOSS D. T. Design and analysis of experiments. New York: SpringerVerlag, 1999. DRAPER, N. R.; SMITH, H. Applied regression analysis. 3. ed. New York: John Willey, 1998. GOMES, F. P. Curso de estatística experimentall 15ª ed., São Paulo :FEALQ, 2009. MLODINOW, L. O andar do bêbado. Como o acaso determina nossas vidas. Rio de Janeiro: Zahar, 2009. MONTGOMERY, D.C. Design and analysis of experiment, 6. ed. New York: John Willey, 2005. MOORE,D. A estatística básica e sua prática. Rio de Janeiro: LTC Editora,1995. NORMAN, G.R.; STREINER, D.L. Biostatistics: the bare essentials. 3. ed. St. Louis: Mosby, 2008. PADOVANI, C.R. Exercícios de estatística básica e experimental. Botucatu: Depto de Bioestatística, 2002. PADOVANI, C.R. Planejamento de experimentos. Botucatu: Depto de Bioestatística, 2009. PERES, C.A.; SALDIVA, C.D. Planejamento de experimentos. São Paulo: 5. SINAPE, 1982. SAMPAIO, I. B. M. Estatística aplicada a experimentação animal, 3ªed. Minas Gerais: FEPMVZ, 2010. delineamento_de_experimentos-prova4.indd 115 28/05/2014 15:55:29 116 | DELINEAMENTO DE EXPERIMENTOS SALSBURG, D. Uma senhora toma chá … como a estatística revolucionou a ciência no século XX. Rio de Janeiro: Zahar, 2009. VIEIRA, S. Estatística experimental. 2. ed. São Paulo: Atlas, 1999. VIEIRA, S. Análise de variância (ANOVA). São Paulo: Atlas, 2006. ZAR, J.H. Boestatistical analysis, 5. ed. New Jersey: Prentice-Hall, 2009. delineamento_de_experimentos-prova4.indd 116 28/05/2014 15:55:29 9 TABELAS Tabela 9.1 Distribuição t de Student ⎡⎣ P (−t 0 < t < t 0 ) = 1− a ⎤⎦ Nível de significância para o teste bilateral (a) Número de graus de liberdade 0,01 0,05 0,10 1 63,657 12,706 6,314 2 9,925 4,303 2,920 3 5,841 3,182 2,353 4 4,604 2,776 2,132 5 4,032 2,571 2,015 6 3,707 2,447 1,943 7 3,499 2,365 1,895 8 3,355 2,306 1,860 9 3,250 2,262 1,833 10 3,169 2,228 1,812 11 3,106 2,201 1,796 12 3,055 2,179 1,782 13 3,012 2,160 1,771 14 2,977 2,145 1,761 15 2,947 2,131 1,753 16 2,921 2,120 1,746 17 2,898 2,110 1,740 18 2,878 2,101 1,734 19 2,861 2,093 1,729 20 2,845 2,086 1,725 21 2,831 2,080 1,721 22 2,819 2,074 1,717 23 2,807 2,069 1,714 24 2,797 2,064 1,711 25 2,787 2,060 1,708 26 2,779 2,056 1,706 27 2,771 2,052 1,703 28 2,763 2,048 1,701 29 2,756 2,045 1,699 30 2,750 2,042 1,697 40 2,704 2,021 1,684 60 2,660 2,000 1,671 120 2,617 1,980 1,658 ∞ 2,576 1,960 1,645 Interpolações devem ser feitas com base nos recíprocos dos graus de liberdade (interpolação harmônica) delineamento_de_experimentos-prova4.indd 117 28/05/2014 15:55:29 118 | DELINEAMENTO DE EXPERIMENTOS Tabela 9.2 Distribuição Qui-quadrado ⎡⎢ P (χ2 > χ02 ) = α ⎤⎥ ⎦ ⎣ delineamento_de_experimentos-prova4.indd 118 a Graus de liberdade 10% 5% 1% 1 2,71 3,84 6,64 2 4,60 5,99 9,21 3 6,25 7,82 11,34 4 7,78 9,49 13,28 5 9,24 11,07 15,09 6 10,64 12,59 16,81 7 12,02 14,07 18,48 8 13,36 15,51 20,09 9 14,68 16,92 21,67 10 15,99 18,31 23,21 11 17,28 19,68 24,72 12 18,55 21,03 26,22 13 19,81 22,36 27,69 14 21,06 23,68 29,14 15 22,31 25,00 30,58 16 23,54 26,30 32,00 17 24,77 27,59 33,41 18 25,99 28,87 34,80 19 27,20 30,14 36,19 20 28,41 31,41 37,57 21 29,62 32,67 38,93 22 30,81 33,92 40,29 23 32,01 35,17 41,64 24 33,20 36,42 42,98 25 34,38 37,65 44,31 26 35,56 38,88 45,64 27 36,74 40,11 46,96 28 37,92 41,34 48,28 29 39,09 42,56 49,59 30 40,26 43,77 50,89 28/05/2014 15:55:29 Tabelas | 119 Tabela 9.3 Distribuição F ⎡ P (F > F0 ) = 0, 01⎤ ⎣ ⎦ Nº de graus de liberdade do denominador 1 2 3 4 5 6 7 8 9 1 4052 5000 5403 5625 5764 5859 5928 5982 6022 2 98,50 99,00 99,20 99,20 99,30 99,30 99,40 99,40 99,40 3 34,10 30,80 29,50 28,70 28,20 27,90 27,70 27,50 27,30 4 21,20 18,00 16,70 16,00 15,50 15,20 15,00 14,80 14,70 5 16,30 13,30 12,10 11,40 11,00 10,70 10,50 10,30 10,20 6 13,70 10,90 9,78 9,15 8,75 8,47 8,26 8,10 7,98 7 12,20 9,55 8,45 7,85 7,46 7,19 6,99 6,84 6,72 8 11,30 8,65 7,59 7,01 6,63 6,37 6,18 6,03 5,91 Nº de graus de liberdade do numerador 9 10,60 8,02 6,99 6,42 6,06 5,80 5,61 5,47 5,35 10 10,00 7,56 6,55 5,99 5,64 5,39 5,20 5,06 4,94 11 9,65 7,21 6,22 5,67 5,32 5,07 4,89 4,74 4,63 12 9,33 6,93 5,95 5,41 5,06 4,82 4,64 4,50 4,39 13 9,07 6,70 5,74 5,21 4,86 4,62 4,44 4,30 4,19 14 8,86 6,51 5,56 5,04 4,69 4,46 4,28 4,14 4,03 15 8,68 6,36 5,42 4,89 4,56 4,32 4,14 4,00 3,89 16 8,53 6,23 5,29 4,77 4,44 4,20 4,03 3,89 3,78 17 8,40 6,11 5,18 4,67 4,34 4,10 3,93 3,79 3,68 18 8,29 6,01 5,09 4,58 4,25 4,01 3,84 3,71 3,60 19 8,18 5,93 5,01 4,50 4,17 3,94 3,77 3,63 3,52 20 8,10 5,85 4,94 4,43 4,10 3,87 3,70 3,56 3,46 21 8,02 5,78 4,87 4,37 4,04 3,81 3,64 3,51 3,40 22 7,95 5,72 4,82 4,31 3,99 3,76 3,59 3,45 3,35 23 7,88 5,66 4,76 4,26 3,94 3,71 3,54 3,41 3,30 24 7,82 5,61 4,72 4,22 3,90 3,67 3,50 3,36 3,26 25 7,77 5,57 4,68 4,18 3,85 3,63 3,46 3,32 3,22 26 7,72 5,53 4,64 4,14 3,82 3,59 3,42 3,29 3,18 27 7,68 5,49 4,60 4,11 3,78 3,56 3,39 3,26 3,15 28 7,64 5,45 4,57 4,07 3,75 3,53 3,36 3,23 3,12 29 7,60 5,42 4,54 4,04 3,73 3,50 3,33 3,20 3,09 30 7,56 5,39 4,51 4,02 3,70 3,47 3,30 3,17 3,07 40 7,31 5,18 4,31 3,83 3,51 3,29 3,12 2,99 2,89 60 7,08 4,98 4,13 3,65 3,34 3,12 2,95 2,82 2,72 120 6,85 4,79 3,95 3,48 3,17 2,96 2,79 2,66 2,56 ∞ 6,63 4,61 3,78 3,32 3,02 2,80 2,64 2,51 2,41 delineamento_de_experimentos-prova4.indd 119 28/05/2014 15:55:29 120 | DELINEAMENTO DE EXPERIMENTOS Tabela 9.4 Distribuição F ⎡⎣ P (F > F0 ) = 0, 05⎤⎦ Nº de graus de liberdade do denominador Nº de graus de liberdade do numerador 1 2 3 4 5 6 7 8 9 1 161 200 216 225 230 234 237 239 241 2 18,50 19,00 19,20 19,20 19,30 19,30 19,40 19,40 19,40 3 10,10 9,55 9,28 9,12 9,01 8,94 8,89 8,85 8,81 4 7,71 6,94 6,59 6,39 6,26 6,16 6,09 6,04 6,00 5 6,61 5,79 5,41 5,19 5,05 4,95 4,88 4,82 4,77 6 5,99 5,14 4,76 4,53 4,39 4,28 4,21 4,15 4,10 7 5,59 4,74 4,35 4,12 3,97 3,87 3,79 3,73 3,68 8 5,32 4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,39 9 5,12 4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,18 10 4,96 4,10 3,71 3,48 3,33 3,22 3,14 3,07 3,02 11 4,84 3,98 3,59 3,36 3,20 3,09 3,01 2,95 2,90 12 4,75 3,89 3,49 3,26 3,11 3,00 2,91 2,85 2,80 13 4,67 3,81 3,41 3,18 3,03 2,92 2,83 2,77 2,71 14 4,60 3,74 3,34 3,11 2,96 2,85 2,76 2,70 2,65 15 4,54 3,68 3,29 3,06 2,90 2,79 2,71 2,64 2,59 16 4,49 3,63 3,24 3,01 2,85 2,74 2,66 2,59 2,54 17 4,45 3,59 3,20 2,96 2,81 2,70 2,61 2,55 2,49 18 4,41 3,55 3,16 2,93 2,77 2,66 2,58 2,51 2,46 19 4,38 3,52 3,13 2,90 2,74 2,63 2,54 2,48 2,42 20 4,35 3,49 3,10 2,87 2,71 2,60 2,51 2,45 2,39 21 4,32 3,47 3,07 2,84 2,68 2,57 2,49 2,42 2,37 22 4,30 3,44 3,05 2,82 2,66 2,55 2,46 2,40 2,34 23 4,28 3,42 3,03 2,80 2,64 2,53 2,44 2,37 2,32 24 4,26 3,40 3,01 2,78 2,62 2,51 2,42 2,36 2,30 25 4,24 3,39 2,99 2,76 2,60 2,49 2,40 2,34 2,28 26 4,23 3,37 2,98 2,74 2,59 2,47 2,39 2,32 2,27 27 4,21 3,35 2,96 2,73 2,57 2,46 2,37 2,31 2,25 28 4,20 3,34 2,95 2,71 2,56 2,45 2,36 2,29 2,24 29 4,18 3,33 2,93 2,70 2,55 2,43 2,35 2,28 2,22 30 4,17 3,32 2,92 2,69 2,53 2,42 2,33 2,27 2,21 40 4,08 3,23 2,84 2,61 2,45 2,34 2,25 2,18 2,12 60 4,00 3,15 2,76 2,53 2,37 2,25 2,17 2,10 2,04 120 3,92 3,07 2,68 2,45 2,29 2,17 2,09 2,02 1,96 ∞ 3,84 3,00 2,60 2,37 2,21 2,10 2,01 1,94 1,88 delineamento_de_experimentos-prova4.indd 120 28/05/2014 15:55:29 Tabelas | 121 Tabela 9.5 Distribuição F ⎡⎣ P (F > F0 ) = 0,10⎤⎦ Nº de graus de liberdade do denominador Nº de graus de liberdade do numerador 1 2 3 4 5 6 7 8 9 1 39,9 49,5 53,6 55,8 57,2 58,2 58,9 59,4 59,9 2 8,53 9,00 9,16 9,24 9,29 9,33 9,35 9,37 9,38 3 5,54 5,46 5,39 5,34 5,31 5,28 5,27 5,25 5,24 4 4,54 4,32 4,19 4,11 4,05 4,01 3,98 3,95 3,94 5 4,06 3,78 3,62 3,52 3,45 3,40 3,37 3,34 3,32 6 3,78 3,46 3,29 3,18 3,11 3,05 3,01 2,98 2,96 7 3,59 3,26 3,07 2,96 2,88 2,83 2,78 2,75 2,72 8 3,46 3,11 2,92 2,81 2,73 2,67 2,62 2,59 2,56 9 3,36 3,01 2,81 2,69 2,61 2,55 2,51 2,47 2,44 10 3,29 2,92 2,73 2,61 2,52 2,46 2,41 2,38 2,35 11 3,23 2,86 2,66 2,54 2,45 2,39 2,34 2,30 2,27 12 3,18 2,81 2,61 2,48 2,39 2,33 2,28 2,24 2,21 13 3,14 2,76 2,56 2,43 2,35 2,28 2,23 2,20 2,16 14 3,10 2,73 2,52 2,39 2,31 2,24 2,19 2,15 2,12 15 3,07 2,70 2,49 2,36 2,27 2,21 2,16 2,12 2,09 16 3,05 2,67 2,46 2,33 2,24 2,18 2,13 2,09 2,06 17 3,03 2,64 2,44 2,31 2,22 2,15 2,10 2,06 2,03 18 3,01 2,62 2,42 2,29 2,20 2,13 2,08 2,04 2,00 19 2,99 2,61 2,40 2,27 2,18 2,11 2,06 2,02 1,98 20 2,97 2,59 2,38 2,25 2,16 2,09 2,04 2,00 1,96 21 2,96 2,57 2,36 2,23 2,14 2,08 2,02 1,98 1,95 22 2,95 2,56 2,35 2,22 2,13 2,06 2,01 1,97 1,93 23 2,94 2,55 2,34 2,21 2,11 2,05 1,99 1,95 1,92 24 2,93 2,54 2,33 2,19 2,10 2,04 1,98 1,94 1,91 25 2,92 2,53 2,32 2,18 2,09 2,02 1,97 1,93 1,89 26 2,91 2,52 2,31 2,17 2,08 2,01 1,96 1,92 1,88 27 2,90 2,51 2,30 2,17 2,07 2,00 1,95 1,91 1,87 28 2,89 2,50 2,29 2,16 2,06 2,00 1,94 1,90 1,87 29 2,89 2,50 2,28 2,15 2,06 1,99 1,93 1,89 1,86 30 2,88 2,49 2,28 2,14 2,05 1,98 1,93 1,88 1,85 40 2,84 2,44 2,23 2,09 2,00 1,93 1,87 1,83 1,79 60 2,79 2,39 2,18 2,04 1,95 1,87 1,82 1,77 1,74 120 2,75 2,35 2,13 1,99 1,90 1,82 1,77 1,72 1,68 ∞ 2,71 2,30 2,08 1,94 1,85 1,77 1,72 1,67 1,63 delineamento_de_experimentos-prova4.indd 121 28/05/2014 15:55:30 90 14,0 8,26 6,51 5,70 5,24 4,95 4,74 4,60 4,48 4,39 4,32 4,26 4,21 4,17 4,13 4,10 4,07 4,05 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 2 delineamento_de_experimentos-prova4.indd 122 4,67 4,70 4,74 4,78 4,83 4,89 4,96 5,04 5,14 5,27 5,43 5,63 5,92 6,33 6,97 8,12 10,6 19,0 135 3 5,05 5,09 5,14 5,19 5,25 5,32 5,40 5,50 5,62 5,77 5,96 6,20 6,54 7,03 7,80 9,17 12,2 22,3 164 4 5,33 5,38 5,43 5,49 5,56 5,63 5,73 5,84 5,97 6,14 6,35 6,63 7,01 7,56 8,42 9,96 13,3 24,7 186 5 5,55 5,60 5,66 5,72 5,80 5,88 5,98 6,10 6,25 6,43 6,66 6,96 7,37 7,97 8,91 10,60 14,2 26,6 202 6 5,73 5,79 5,85 5,92 5,99 6,08 6,19 6,32 6,48 6,67 6,91 7,24 7,68 8,32 9,32 11,10 15,0 28,2 216 7 5,89 5,94 6,01 6,08 6,16 6,26 6,37 6,51 6,67 6,87 7,13 7,47 7,94 8,61 9,67 11,50 15,6 29,5 227 8 6,02 6,08 6,15 6,22 6,31 6,41 6,53 6,67 6,84 7,05 7,32 7,68 8,17 8,87 9,97 11,90 16,2 30,7 237 9 6,14 6,20 6,27 6,35 6,44 6,54 6,67 6,81 6,99 7,21 7,49 7,87 8,37 9,10 10,20 12,30 16,7 31,7 246 10 6,25 6,31 6,38 6,46 6,55 6,66 6,79 6,94 7,13 7,36 7,65 8,03 8,55 9,30 10,50 12,60 17,1 32,6 253 11 6,34 6,41 6,48 6,56 6,66 6,77 6,90 7,06 7,25 7,48 7,78 8,18 8,71 9,49 10,70 12,80 17,5 33,4 260 12 Número de tratamentos (k) Distribuição “studentized range” [ q(0,01;ϕ) ] : Tukey (1%) 1 Nº de graus de liberdade do resíduo Tabela 9.6 6,43 6,50 6,57 6,66 6,76 6,87 7,01 7,17 7,36 7,60 7,91 8,31 8,86 8,65 10,90 13,10 17,9 34,1 266 13 6,51 6,58 6,66 6,74 6,84 6,96 7,10 7,26 7,46 7,71 8,03 8,44 9,00 9,81 11,10 13,30 18,2 34,8 272 14 6,58 6,65 6,73 6,82 6,93 7,05 7,19 7,36 7,56 7,81 8,13 8,55 9,12 9,95 11,20 13,50 18,5 35,4 277 15 6,65 6,72 6,80 6,90 7,00 7,12 7,27 7,44 7,65 7,91 8,23 8,66 9,24 10,10 11,40 13,70 18,8 36,0 282 16 6,72 6,79 6,87 6,97 7,07 7,20 7,34 7,52 7,73 7,99 8,32 8,76 9,35 10,20 11,60 13,90 19,1 36,5 286 17 6,78 6,85 6,94 7,03 7,14 7,27 7,42 7,59 7,81 8,07 8,41 8,85 9,46 10,30 11,70 14,10 19,3 37,0 290 18 6,84 6,91 7,00 7,09 7,20 7,33 7,48 7,66 7,88 8,15 8,49 8,94 9,55 10,40 11,80 14,20 19,5 37,5 294 19 122 | DELINEAMENTO DE EXPERIMENTOS 28/05/2014 15:55:30 4,37 4,28 3,89 3,82 3,76 3,70 3,64 30 40 60 120 delineamento_de_experimentos-prova4.indd 123 ∞ 4,12 4,20 4,45 4,54 3,96 24 4,64 4,02 20 4,40 4,50 4,60 4,70 4,80 4,91 5,02 4,60 4,71 4,82 4,93 5,05 5,17 5,29 4,76 4,87 4,99 5,11 5,24 5,37 5,51 4,88 5,01 5,13 5,27 5,40 5,54 5,69 4,99 5,12 5,25 5,39 5,54 5,69 5,84 5,08 5,21 5,36 5,50 5,65 5,81 5,97 5,16 5,30 5,45 5,60 5,76 5,92 6,09 5,23 5,38 5,53 5,69 5,85 6,02 6,19 5,29 5,44 5,60 5,77 5,93 6,11 6,29 5,35 5,51 5,67 5,84 6,01 6,19 6,37 5,40 5,56 5,73 5,90 6,08 6,26 6,45 5,45 5,61 5,79 5,96 6,14 6,33 6,52 5,49 5,66 5,84 6,02 6,20 6,39 6,59 5,54 5,71 5,89 6,07 6,26 6,45 6,65 5,57 5,75 5,93 6,12 6,31 6,51 6,71 5,61 5,79 5,98 6,17 6,36 6,56 6,76 Tabelas | 123 28/05/2014 15:55:30 18 6,08 4,50 3,93 3,64 3,46 3,34 3,26 3,20 3,15 3,11 3,08 3,06 3,03 3,01 3,00 2,98 2,97 2,96 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 2 1 Nº de graus de liberdade do resíduo delineamento_de_experimentos-prova4.indd 124 3,59 3,61 3,63 3,65 3,67 3,70 3,73 3,77 3,82 3,88 3,95 4,04 4,16 4,34 4,60 5,04 5,9 8,33 27 3 3,98 4,00 4,02 4,05 4,08 4,11 4,15 4,20 4,26 4,33 4,41 4,53 4,68 4,90 5,22 5,76 6,8 9,80 32,8 4 4,25 4,28 4,30 4,33 4,37 4,41 4,45 4,51 4,57 4,65 4,76 4,89 5,06 5,30 5,67 6,29 7,5 10,9 37,1 5 4,47 4,49 4,52 4,56 4,59 4,64 4,69 4,75 4,82 4,91 5,02 5,17 5,36 5,63 6,03 6,71 8,0 11,7 40,4 6 4,65 4,67 4,70 4,74 4,78 4,83 4,88 4,95 5,03 5,12 5,24 5,40 5,61 5,90 6,33 7,05 8,5 12,4 43,1 7 4,79 4,82 4,86 4,90 4,94 4,99 5,05 5,12 5,20 5,30 5,43 5,60 5,82 6,12 6,58 7,35 8,9 13,0 45,4 8 4,92 4,96 4,99 5,03 5,08 5,13 5,19 5,27 5,35 5,46 5,59 5,77 6,00 6,32 6,80 7,60 9,2 13,5 47,4 9 5,04 5,07 5,11 5,15 5,20 5,25 5,32 5,39 5,49 5,60 5,74 5,92 6,16 6,49 6,99 7,83 9,5 14,0 49,1 10 5,14 5,17 5,21 5,26 5,31 5,36 5,43 5,51 5,61 5,72 5,87 6,05 6,30 6,65 7,17 8,03 9,7 14,4 50,6 11 5,23 5,27 5,31 5,35 5,40 5,46 5,53 5,61 5,71 5,83 5,98 6,18 6,43 6,79 7,32 8,21 10,0 14,7 52 12 Número de tratamentos (k) Tabela 9.7 Distribuição “studentized range” [ q(0,05;ϕ) ] : Tukey (5%) 5,31 5,35 5,39 5,44 5,49 5,55 5,63 5,71 5,81 5,93 6,09 6,29 6,55 6,92 7,47 8,37 10,2 15,1 53,2 13 5,39 5,43 5,47 5,52 5,57 5,64 5,71 5,80 5,90 6,03 6,19 6,39 6,66 7,03 7,60 8,52 10,3 15,4 54,3 14 5,46 5,50 5,54 5,59 5,65 5,71 5,79 5,88 5,98 6,11 6,28 6,48 6,76 7,14 7,72 8,66 10,5 15,7 55,4 15 5,53 5,57 5,61 5,66 5,72 5,79 5,86 5,95 6,06 6,19 6,36 6,57 6,85 7,24 7,83 8,79 10,7 15,9 56,3 16 5,59 5,63 5,67 5,73 5,78 5,85 5,93 6,02 6,13 6,27 6,44 6,65 6,94 7,34 7,93 8,91 10,8 16,1 57,2 17 5,65 5,69 5,73 5,79 5,85 5,91 5,99 6,09 6,20 6,34 6,51 6,73 7,02 7,43 8,03 9,03 11,0 16,4 58 18 5,70 5,74 5,79 5,84 5,90 5,97 6,05 6,15 6,27 6,40 6,58 6,80 7,10 7,51 8,12 9,13 11,1 16,6 58,8 19 5,75 5,79 5,84 5,90 5,96 6,03 6,11 6,21 6,33 6,47 6,64 6,87 7,17 7,59 8,21 9,23 11,2 16,8 59,6 20 124 | DELINEAMENTO DE EXPERIMENTOS 28/05/2014 15:55:30 3,44 3,40 2,89 2,86 2,83 2,80 2,77 30 40 60 120 delineamento_de_experimentos-prova4.indd 125 ∞ 3,31 3,36 3,49 3,53 2,92 24 3,58 2,95 20 3,63 3,68 3,74 3,79 3,85 3,90 3,96 3,86 3,92 3,98 4,04 4,10 4,17 4,23 4,03 4,10 4,16 4,23 4,30 4,37 4,45 4,17 4,24 4,31 4,39 4,46 4,54 4,62 4,29 4,36 4,44 4,52 4,60 4,68 4,77 4,39 4,47 4,55 4,63 4,72 4,81 4,90 4,47 4,56 4,65 4,73 4,82 4,92 5,01 4,55 4,64 4,73 4,82 4,92 5,01 5,11 4,62 4,71 4,81 4,90 5,00 5,10 5,20 4,68 4,78 4,88 4,98 5,08 5,18 5,28 4,74 4,84 4,94 5,04 5,15 5,25 5,36 4,80 4,90 5,00 5,11 5,21 5,32 5,43 4,85 4,95 5,06 5,16 5,27 5,38 5,49 4,89 5,00 5,11 5,22 5,33 5,44 5,55 4,93 5,04 5,15 5,27 5,38 5,49 5,61 4,97 5,09 5,20 5,31 5,43 5,55 5,66 5,01 5,13 5,24 5,36 5,47 5,59 5,71 Tabelas | 125 28/05/2014 15:55:31 delineamento_de_experimentos-prova4.indd 126 3,32 3,27 3,33 3,01 2,85 2,75 2,68 2,63 2,59 2,56 2,54 2,52 2,50 2,49 2,48 2,47 2,46 2,45 2,45 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 3,09 3,10 3,11 3,12 3,14 3,16 3,18 3,20 3,23 3,37 3,45 3,56 3,72 3,98 4,47 5,73 4,13 3 3 13,40 2 2 8,93 4 3,47 3,49 3,50 3,52 3,54 3,56 3,59 3,62 3,66 3,70 3,76 3,83 3,93 4,07 4,26 4,59 5,20 6,77 16,40 5 3,75 3,77 3,78 3,80 3,83 3,85 3,88 3,92 3,96 4,02 4,08 4,17 4,28 4,44 4,66 5,03 5,74 7,54 18,50 6 3,97 3,98 4,00 4,03 4,05 4,08 4,12 4,16 4,20 4,26 4,34 4,43 4,55 4,73 4,98 5,39 6,16 8,14 20,20 7 4,14 4,16 4,18 4,21 4,23 4,27 4,30 4,35 4,40 4,47 4,54 4,65 4,78 4,97 5,24 5,68 6,51 8,63 21,50 8 4,29 4,31 4,33 4,36 4,39 4,42 4,46 4,51 4,57 4,64 4,72 4,83 4,97 5,17 5,46 5,93 6,81 9,05 22,60 9 4,42 4,44 4,46 4,49 4,52 4,56 4,60 4,65 4,71 4,78 4,87 4,99 5,14 5,34 5,65 6,14 7,06 9,41 23,60 4,53 4,55 4,58 4,61 4,64 4,68 4,72 4,78 4,84 4,91 5,01 5,13 5,28 5,50 5,82 6,33 7,29 9,72 24,50 10 4,63 4,65 4,68 4,71 4,75 4,79 4,83 4,89 4,95 5,03 5,13 5,25 5,41 5,64 5,97 6,49 7,49 10,00 25,20 11 4,72 4,75 4,77 4,81 4,84 4,88 4,93 4,99 5,05 5,13 5,23 5,36 5,53 5,76 6,10 6,65 7,67 10,30 25,90 12 Número de tratamentos (k) Distribuição “studentized range” [ q(0,10;ϕ) ] : Tukey (10%) 1 Nº de graus de liberdade do resíduo Tabela 9.8 13 4,80 4,83 4,86 4,89 4,93 4,97 5,02 5,08 5,15 5,23 5,33 5,46 5,64 5,87 6,22 6,78 7,83 10,50 26,50 14 4,88 4,90 4,93 4,97 5,01 5,05 5,10 5,16 5,23 5,32 5,42 5,56 5,74 5,98 6,34 6,91 7,98 10,70 27,10 15 4,95 4,98 5,01 5,04 5,08 5,12 5,18 5,24 5,31 5,40 5,51 5,64 5,83 6,07 6,44 7,02 8,12 10,90 27,60 16 5,01 5,04 5,07 5,11 5,15 5,19 5,25 5,31 5,38 5,47 5,58 5,72 5,91 6,16 6,54 7,13 8,25 11,10 28,10 17 5,07 5,10 5,13 5,17 5,21 5,26 5,31 5,37 5,45 5,54 5,66 5,80 5,99 6,25 6,63 7,23 8,37 11,20 28,50 18 5,13 5,16 5,19 5,23 5,27 5,32 5,37 5,44 5,51 5,61 5,72 5,87 6,06 6,32 6,71 7,33 8,48 11,40 29,00 19 5,18 5,21 5,24 5,28 5,32 5,37 5,43 5,49 5,57 5,67 5,79 5,93 6,13 6,40 6,79 7,41 8,58 11,50 29,30 20 5,23 5,26 5,30 5,33 5,38 5,43 5,48 5,55 5,63 5,73 5,85 6,00 6,19 6,47 6,86 7,50 8,68 11,70 29,70 126 | DELINEAMENTO DE EXPERIMENTOS 28/05/2014 15:55:31 2,99 2,96 2,40 2,38 2,36 2,34 2,33 30 40 60 120 delineamento_de_experimentos-prova4.indd 127 ∞ 2,90 2,93 3,02 3,05 2,42 24 3,08 2,44 20 3,24 3,28 3,31 3,35 3,39 3,42 3,46 3,48 3,52 3,56 3,60 3,65 3,69 3,74 3,66 3,71 3,75 3,80 3,85 3,90 3,95 3,81 3,86 3,91 3,96 4,02 4,07 4,12 3,93 3,99 4,04 4,10 4,16 4,21 4,27 4,04 4,10 4,16 4,21 4,28 4,34 4,40 4,13 4,19 4,25 4,32 4,38 4,44 4,51 4,21 4,28 4,34 4,41 4,47 4,54 4,61 4,28 4,35 4,42 4,49 4,56 4,63 4,70 4,35 4,42 4,49 4,56 4,64 4,71 4,78 4,41 4,48 4,56 4,63 4,71 4,78 4,85 4,47 4,54 4,62 4,69 4,77 4,85 4,92 4,52 4,60 4,67 4,75 4,83 4,91 4,99 4,57 4,65 4,73 4,81 4,89 4,97 5,05 4,61 4,69 4,78 4,86 4,94 5,02 5,10 4,65 4,74 4,82 4,90 4,99 5,07 5,16 4,69 4,78 4,86 4,95 5,03 5,12 5,20 Tabelas | 127 28/05/2014 15:55:31 128 | DELINEAMENTO DE EXPERIMENTOS Tabela 9.9 Valores críticos do coeficiente de correlação linear de Pearson (teste bilateral) delineamento_de_experimentos-prova4.indd 128 n a=0,05 a=0,01 4 0,95 0,99 5 0,878 0,959 6 0,811 0,917 7 0,754 0,874 8 0,707 0,834 9 0,666 0,798 10 0,632 0,765 11 0,602 0,735 12 0,576 0,708 13 0,553 0,684 14 0,532 0,661 15 0,514 0,641 16 0,497 0,623 17 0,482 0,606 18 0,468 0,59 19 0,456 0,575 20 0,444 0,561 21 0,433 0,549 22 0,423 0,537 23 0,413 0,526 24 0,404 0,515 25 0,396 0,505 26 0,388 0,496 27 0,381 0,487 28 0,374 0,478 29 0,367 0,47 30 0,361 0,463 35 0,335 0,43 40 0,312 0,402 45 0,294 0,378 50 0,279 0,361 60 0,254 0,33 70 0,236 0,305 80 0,22 0,286 90 0,207 0,269 100 0,196 0,256 28/05/2014 15:55:31 Carlos Roberto Padovani Cultura Acadêmica Carlos Roberto Padovani Carlos Roberto Padovani é professor titular de Bioestatística do Instituto de Biociências, Unesp, câmpus de Botucatu, tendo atuado como professor e/ou orientador de Programas de Pós-Graduação da USP, Unicamp, Unesp, UFMT e UnB. Foi bolsista produtividade do CNPq; membro da Comissão de Avaliação de Programas de Pós-Graduação junto à Capes; coordenador da Área de Ciências Biológicas junto à Runesp, presidente da Região Brasileira da Sociedade Internacional de Biometria. Atualmente ministra disciplinas da área de Estatística na graduação e de Bioestatística e Metodologia da Pesquisa Científica em vários programas de Pós-Graduação na Unesp, com orientações em nível de Mestrado e Doutorado e supervisão de Pós-Doutorado. DELINEAMENTO DE EXPERIMENTOS O texto apresenta noções básicas, históricas e conceituais de delineamentos experimentais, em particular dos planejamentos inteiramente casualizado e em blocos completos casualizados, complementado com os esquemas fatoriais, correlação e regressão linear simples e testes de aderência e associação para variáveis categorizadas. A abordagem não os cálculos estatísticos, mas sim, trazendo à realidade o planejamento e o desenvolvimento da experimentação aos alunos das áreas de Ciências Biológicas e da Saúde. Capa_Delineamento_minha versao.indd 1 DELINEAMENTO DE EXPERIMENTOS é realizada sob o aspecto tradicional de fórmulas e uso de “pacotes” computacionais para 19/05/2014 18:17:16