ANÁLISE ESTATÍSTICA NA GERMINAÇÃO1 DENISE GARCIA DE SANTANA2 AND MARLI A. RANAL2 Universidade Federal de Uberlândia, Uberlândia - MG. RESUMO - Este texto representa um resumo do que foi tratado no mini-curso sobre o tema, ministrado no 51° Congresso Nacional de Botânica. O referido curso foi ministrado para atender dois objetivos. Primeiro, para fornecer ao iniciante em pesquisa informações da estatística básica que permitem a escolha de valores representativos das amostras estudadas e de testes estatísticos mais adequados para analisá-los. Por meio de exemplos específicos da área de germinação, foi sugerida uma seqüência para a análise estatística dos dados obtidos em laboratório ou campo. O segundo objetivo foi discutir o significado estatístico e fisiológico de algumas medidas como tempo médio e velocidade média de germinação, índice de velocidade de emergência, índice de Timson, coeficiente de uniformidade de germinação e índice de sincronização, além de suas limitações. TERMOS ADICIONAIS PARA INDEXAÇÃO: Tempo médio de germinação, velocidade média de germinação, índice de velocidade de emergência, índice de Timson, coeficiente de uniformidade de germinação, índice de sincronização. STATISTICAL ANALYSIS IN GERMINATION ABSTRACT - The content of this text was presented and discussed during the 51o Congresso Nacional de Botânica with two objectives. First, to provide information for new students about basic statistic that permit the choice of representative values of the studied samples and suitable statistical tests to analyse them. By means of specific examples about germination, a sequence to analyse statistically the obtained data in laboratory or in field conditions was suggested. The second objective was to discuss the statistical and physiological meaning of some measurements like average germination time, average germination rate, emergence velocity index, Timson's index, coefficient of the uniformity of germination, synchronization index, and their limitations. ADDITIONAL INDEX TERMS: Average germination time, average germination rate, emergence velocity index, Timson's index, coefficient of the uniformity of germination, synchronization index. 1. Mini-curso ministrado durante o 51o Congresso Nacional de Botânica, Brasília - DF, de 24 a 28/07/2000. 2. Universidade Federal de Uberlândia, Caixa Postal 593, 38.400-902, Uberlândia - MG. 206 Santana e Ranal Este curso terá por finalidade apresentar medidas estatísticas conhecidas e amplamente utilizadas na análise da germinação, com o objetivo de dar ao estudante subsídios para escolher melhor os valores que representarão as amostras por ele estudadas e os testes estatísticos mais adequados para analisá-los. Em função da limitação de tempo, não se pretende ensinar como calcular os números e como montar os testes, mas apenas discutir seu significado e as condições para sua aplicação. Para os iniciantes, é necessário que os exemplos envolvendo testes estatísticos sejamsejam acompanhados da leitura de textos específicos, encontrados em bons livros de estatística. Quando se começa a estudar germinação, a grande dificuldade é a interpretação do número obtido que, infelizmente acaba sendo dificultada pela diversidade de expressões matemáticas e simbologias que vêm sendo adotadas ao longo desses anos. É muito comum encontrar duas expressões matemáticas diferentes, com nomes diferentes, que geram números iguais do ponto de vista matemático e fisiológico. Por outro lado, também é muito comum encontrar nomes iguais para expressões completamente diferentes, que geram informações diversas. Antes de falar das medidas e da melhor forma de analisá-las, é interessante apresentar alguns conceitos de termos que, apesar de serem amplamente utilizados, podem gerar confusão. Por definição, população é o conjunto de elementos que têm em comum determinada característica (Vieira, 1986), ou seja, é o conjunto de elementos mantido sob as mesmas condições, sejam elas naturais ou artificiais. Toda porção retirada aleatoriamente da população é, por definição, uma amostra dessa população. O termo tratamento é utilizado para designar o método, elemento ou material, cujo efeito se deseja medir ou comparar (Banzatto & Kronka, 1992). Quando o método é aplicado às porções da população, estas são denominadas repetições (r) e correspondem ao número de vezes que a população é reproduzida. O conjunto de sementes de uma única árvore pode ser considerada uma população já que, em termos genéticos, ela é única e o pesquisador pode ter interesse específico em avaliar determinadas qualidades desse indivíduo, comparando-as com outros. A população também pode ser o conjunto de sementes que germina numa temperatura específica. Quando um experimento é instalado em laboratório, casa de vegetação ou campo, organizado de maneira específica, de acordo com os delineamentos conhecidos, fala-se em número de tratamentos (t). Quando o pesquisador vai a campo e coleta dados de plantas crescendo sob as mesmas condições, ele retira amostras e, portanto, fala-se em número de amostras (a). Portanto, número de tratamentos e número de amostras, nesse sentido, são equivalentes e representam as diferentes populações analisadas. O tamanho da amostra (n) ou o número de repetições (r) correspondem ao número de vezes que a população é reproduzida. Por exemplo, um experimento instalado em laboratório com cinco tratamentos e sete repetições tem as seguintes características: t=5, r=7, onde cada tratamento representa uma amostra de uma população que está sendo analisada. Duas populações (sentido biológico) da mesma espécie, ocorrentes em mata e em cerrado, podem ser analisadas quanto à produção de sementes. Se a espécie for arbórea, o pesquisador poderá coletar uma porção de sementes de cada indivíduo, estabelecendo a posição dos ramos dos quais as sementes serão coletadas. Supondo-se que a população ocorrente na mata tenha 10 indivíduos crescendo próximos e a de cerrado 15 e o pesquisador tenha interesse em avaliar a produção de sementes nos dois ambientes. Pode-se então calcular o número médio de sementes produzido pelos indivíduos da mata e o número médio produzido no cerrado, para então se efetuar testes R. Bras.Fisiol.Veg. 12(Edição Especial):205-237, 2000 207 Análise Estatística na Germinação. de comparações entre as médias obtidas. Neste caso, o pesquisador está trabalhando com duas amostras (a=2) oriundas de duas populações, sendo cada população representada por todos os indivíduos daquela espécie, ocorrentes em cada ambiente, e tem n=10 para mata e n=15 para cerrado, números estes que equivalem à quantidade de vezes que cada população está sendo reproduzida. O pesquisador pode ainda manifestar interesse em avaliar a qualidade de cada indivíduo ocorrente em mata, como matriz produtora de sementes. Neste caso, deve coletar vários grupos de sementes de cada indivíduo, por exemplo 20, para então calcular o número médio de sementes produzido por planta e efetuar um teste de comparação entre essas médias. Diz-se então que o pesquisador está com a=10 porque são 10 indivíduos de mata que estão sendo avaliados e cada um representa uma amostra da população que é constituída por todos os indivíduos da mesma espécie que ocorrem na mata. O pesquisador tem ainda n=20 porque estão sendo retiradas 20 porções de sementes de cada indivíduo. Apesar da literatura corrente apresentar uma distinção entre os conceitos de tratamento (t) e amostra (a), número de repetições (r) e tamanho da amostra (n) com o intuito de diferenciar planejamentos experimentais (inteiramente casualizado, blocos casualizados e outros) de processos de amostragem (estratificação, conglomerado e outros), os diferentes testes para comparações entre médias e proporções, os intervalos de confiança, os testes para comparações múltiplas ou mesmo os testes de normalidade e homogeneidade, não são específicos para cada tipo de pesquisa (experimental ou por amostragem), o que permite associar t e a, n e r. Diante disso, este curso objetiva apresentar aos estudiosos da área de germinação algumas possibilidades de utilização de testes estatísticos, pressupondo-se que os princípios de casualização específicos dos delineamentos experimentais e dos métodos de amostragem, tenham sido cumpridos. Após a coleta de dados, a primeira atitude do pesquisador é calcular uma medida de tendência central ou de posição que seja representativa da amostra estudada e que sintetize a informação contida nos dados coletados. Assim, pretende-se substituir um conjunto de observações, por apenas uma que seja indicadora da tendência central dos dados. A média aritmética ( x ) é a soma de todos os valores da amostra, dividida pelo seu tamanho. É a medida de posição mais utilizada, em função do cálculo simplificado e da interpretação facilitada. Contudo, o valor da média por si, só será representativo se houver uma concentração dos dados em torno do seu valor. Assim, quando a amostra tiver dados discrepantes, o valor médio poderá subestimar ou superestimar o valor do parâmetro medido. Para descrever a amostra, é fundamental então que a média esteja acompanhada de uma medida de dispersão que indicará o grau de variabilidade existente na amostra analisada. Essas duas medidas associadas enriquecem a interpretação da média (aritmética, harmônica e ponderada) que é a única medida de posição influenciada por todos os elementos da amostra, ou seja, por aqueles que giram ao seu redor e por aqueles que estão muito acima ou muito abaixo do seu valor. A mediana (Md) é uma medida de tendência central que deixa 50% dos valores observados abaixo dela e 50% acima. Se o tamanho da amostra (n) a ser analisada apresentar um número ímpar de dados, o valor da mediana será o valor central dos dados ordenados (ordem crescente ou decrescente). Caso n seja par, a mediana será a média entre os elementos centrais dos dados ordenados. Esta é uma medida importante quando a amostra trabalhada apresenta dados discrepantes. Neste caso, a mediana usada isoladamente é melhor alternativa do que a média aritmética que acaba por subestimar ou R. Bras.Fisiol.Veg. 12(Edição Especial):205-237, 2000 208 Santana e Ranal superestimar o valor do parâmetro medido, conforme já mencionado. A moda (Mo) é definida como o valor mais freqüente, sendo pouco empregada, uma vez que o valor mais freqüente pode não representar o conjunto de dados. Basta lembrar que há amostras com duas modas e amostras sem valor modal. Por outro lado, se o pesquisador tiver interesse em mostrar o valor mais freqüente, esta é a medida de posição mais adequada para este fim. Do ponto de vista prático, a escolha de uma medida de dispersão depende da finalidade da medida e, do ponto de vista teórico, do que ela representa. Discutir dispersão é discutir variabilidade específica, ou seja, a variação existente no conjunto de valores da amostra, que surge em função das variações não controladas pelo pesquisador, sejam elas em decorrência de flutuações mínimas de temperatura, umidade, ou mesmo das características genéticas do material em estudo, dentre outras. Dentre as várias medidas de dispersão, encontra-se a amplitude (R), definida como a diferença entre o maior e o menor valor observado na amostra. É uma medida de dispersão muito limitada, pois leva em consideração apenas os valores extremos, não sendo afetada pela dispersão dos demais valores da amostra. Uma outra medida de dispersão, boa para qualquer amostra de tamanho n, exceto quando n=1 observação, é a variância ( s 2 ). Quando há uma única observação, a média pode ser calculada, mas não há como calcular a dispersão. Desta forma, pode-se ter a variância somente quando n excede 1, onde (n-1) elementos de informações são considerados para o cálculo da medida. Esses n-1 elementos são os chamados graus de liberdade de uma soma, pois se o valor de todas as parcelas é conhecido, exceto o de uma, a parcela desconhecida é determinada automaticamente pela diferença entre o total e a soma das n-1 parcelas fornecidas. Esta é uma medida teoricamente muito utilizada, uma vez que cálculos algébricos são facilitados, mas do ponto de vista prático, é de difícil interpretação por apresentar como unidade a mesma dos dados, elevada ao quadrado. Assim, usa-se o desvio padrão (s), calculado como a raiz quadrada da variância, expresso agora na mesma unidade dos dados. Isso facilita a interpretação dos resultados obtidos, principalmente quando o valor numérico da medida de dispersão é um indicativo prático e indutivo do processo em estudo. Por fim, tem-se o coeficiente de variação (CV), que tem por vantagem caracterizar a dispersão dos dados em termos relativos a seu valor médio. É uma medida relativa importante, pois ao se comparar a variabilidade de duas amostras usando o desvio padrão ou a variância, pode-se concluir que uma é mais variável que a outra, quando o resultado diferenciado pode ser devido ao fato das amostras possuírem médias ou grandezas diferentes. Uma amostra pode ter a variância alta em relação a uma outra, pelo fato da primeira ter média mais alta. Assim, ao comparar a variabilidade de amostras, deve-se observar a média. Se as médias forem iguais, pode-se utilizar para comparações de variabilidade o desvio padrão, a variância ou o coeficiente de variação. No entanto, se as médias forem diferentes ou se forem referentes a medidas com unidades diferentes, é obrigatório o uso do coeficiente de variação para compará-las. É comum nos trabalhos, principalmente nos que envolvem análise da variância, utilizar o coeficiente de variação para julgamento da variabilidade do experimento. Nesse caso, o coeficiente de variação é uma medida comparativa da variabilidade existente entre dois experimentos quanto a fatores não controlados, mas nunca quanto à qualidade do ensaio. Cabe ao pesquisador decidir se essa variabilidade comunicada deve ser diminuída ou não, em experimentos futuros. Se o objetivo do pesquisador é comunicar uma informação que tenha aplicação prática, o aprimoramento das R. Bras.Fisiol.Veg. 12(Edição Especial):205-237, 2000 209 Análise Estatística na Germinação. condições experimentais, o aumento no tamanho da amostra, ou mesmo o melhoramento genético do material biológico em estudo podem diminuir os valores do coeficiente de variação do experimento. Um experimento realizado com sementes de uma espécie silvestre, com certeza apresentará maior valor de CV do que o realizado com sementes de uma espécie melhorada geneticamente. No segundo caso, a menor variabilidade das sementes, expressa por um baixo valor de CV, gera também maior precisão do experimento no sentido de que as sementes são homogêneas quanto ao caráter ou processo estudado. A chance de um pesquisador errar ao dizer que o lote de sementes analisado apresenta, por exemplo, germinabilidade de 95%, é menor para a espécie melhorada do que para a silvestre. A medidas citadas anteriormente têm a finalidade de quantificar a variabilidade da amostra, seja por valores extremos como a amplitude, seja pela fuga de cada elemento da amostra em relação a um valor central, representado pela média. Há ainda uma medida de dispersão que quantifica a fuga da média da amostra em relação à média populacional desconhecida, sendo denominada erro padrão ( s x ) e tem por finalidade medir a precisão (magnitude da variabilidade) com que a média foi estimada. Um erro padrão alto significa que a média da amostra estudada está distante da média populacional e vice-versa. Com o intuito de resgatar a massa de informações contida nos trabalhos de Labouriau e colaboradores, associando estatística e germinação, será tomado como exemplo a tabela 5 de Labouriau & Pacheco (1979). Entretanto, serão feitas algumas adaptações a partir do trabalho original, apenas com a finalidade didática de tentar mostrar os possíveis resultados que podem ocorrer nos ensaios (Tabela 1). O conjunto de dados apresentado na tabela 1 possibilita uma discussão importante quanto ao uso da medida de posição mais adequada, quando o objetivo é sintetizar a informação. Por exemplo, a repetição 3 da temperatura 8,0 ± 0,05 oC acabou por diminuir o valor médio da germinação naquela temperatura (46%) que ficou subestimado, provando-se assim que a média é influenciada pelos valores extremos da amostra. Neste caso, a mediana de germinação (52%) é mais representativa da amostra e está mais adequada ao objetivo que é sintetizar a informação. TABELA 1 - Porcentagem de sementes de Dolichos biflorus L. (Leguminosae, Lotoidae) germinadas em diferentes temperaturas. Adaptação de parte da tabela 5 de Labouriau & Pacheco (1979). Os dados de porcentagem na temperatura 11,7 ± 0,03oC são fictícios e não correspondem ao trabalho original; nem mesmo representam a característica da espécie quanto à média de germinação e variabilidade. r Temp. (oC) 1 2 3 4 5 x Md Mo s s2 R CV sx 8,0 ± 0,05 52 58 26 42 52 46,0 52 52 12,57 158,0 32 27,33 5,62 9,0 ± 0,04 58 78 72 76 78 72,4 76 78 8,41 70,8 20 11,62 3,76 10,0 ± 0,05 84 86 76 86 84 83,2 84 84;86 4,15 17,2 10 4,99 1,85 10,8 ± 0,02 100 86 86 94 86 90,4 86 86 6,39 40,8 14 7,07 2,86 11,7 ± 0,03 100 92 100 80 80 90,4 92 80;100 10,04 100,8 20 11,11 4,49 R. Bras.Fisiol.Veg. 12(Edição Especial):205-237, 2000 210 Santana e Ranal Na temperatura de 10,0 ± 0,05 oC, a proximidade entre a média, mediana e moda confirmam que, quando não há dados discrepantes, qualquer uma das três medidas de posição citadas, pode ser usada para representar a amostra. Na temperatura de 11,7 ± 0,03 oC, observa-se a discrepância dos dois valores modais, 80 e 100%, mostrando que nem sempre o valor mais freqüente é representativo da amostra. A importância das medidas de variabilidade é que amostras com mesma média podem não ser oriundas da mesma população. Esta observação pode ser exemplificada quando são comparadas as médias de germinação das sementes submetidas às temperaturas de 10,8 ± 0,02oC e 11,7 ± 0,03oC.Em ambas as temperaturas a porcentagem média de germinação foi de 90,4%. Entretanto, na temperatura de 11,7 ± 0,03 oC observa-se maior discrepância das observações quando comparada com a temperatura de 10,8 ± 0,02 oC, discrepância essa que pode ser observada pelos maiores valores de desvio padrão, da variância, amplitude e coeficiente de variação para a temperatura de 11,7 oC. A comparação entre a variabilidade das amostras só foi possível porque ambas as temperaturas possuem a mesma média de germinação. A idéia do coeficiente de variação é quantificar o peso que uma determinada variabilidade tem em relação à média. Para melhor entendimento, pode-se tomar como exemplo as temperaturas de 8,0 ± 0,05 oC e 11,7 ± 0,03 oC e os respectivos desvios padrões de 12,57% e 10,04%. Na temperatura de 8,0oC, um desvio de 12,57% em uma germinação média de 46,0% tem um peso maior que um desvio de 10,04% para uma média de germinação de 90,4% na temperatura de 11,7 o C. Este peso maior da variabilidade pode ser quantificado pelo coeficiente de variação, que foi de 27,33% para a temperatura de 8,0 ± 0,05 oC e de 11,11% para a temperatura de 11,7 ± 0,03 oC. Considere-se agora as temperaturas de 9,0± 0,04 oC e 11,7 ± 0,03 oC e os respectivos desvios padrões de 8,41% e 10,04%. A maior diferença entre os desvios padrões, quando comparados aos coeficientes de variação de ambas as temperaturas (11,62% e 11,11%), indica que um desvio de 8,41% sobre uma média de germinação de 72,4% tem o mesmo peso que um desvio de 10,04% sobre uma média de germinação de 90,4%. As medidas do desvio padrão e da variância são de grande importância para se conhecer a variabilidade intrínseca do material, sendo o desvio padrão mais utilizado para discussões, por apresentar a mesma unidade dos dados. Na temperatura de 10,8 ± 0,02 oC, uma média de 90,4% e um desvio padrão de 6,39% indicam que, em média, o percentual de germinação varia 6,39% em torno do valor 90,4%. Daí a idéia do pesquisador em expressar os dados de germinação como x ± s , mostrando assim como está a concentração dos dados em torno da média. Outra possibilidade é expressar os dados como x ± s x , ou seja, média e erro padrão da média. Quando são comunicadas as duas medidas, a intenção é evidenciar que a média calculada pode sofrer uma variação, quantificada por seu erro padrão. Assim, na temperatura de 10,0 ± 0,05 oC que tem média de germinação de 83,2%, um erro padrão de 1,86% indica que a média de germinação na população pode variar de 81,34 até 85,06%. Apesar das medidas de posição e dispersão sintetizarem a informação contida na amostra ou amostras, a grande aplicação da estatística na germinação se concentra na comparação entre amostras ou tratamentos, a partir de suas médias ou proporções, ou mesmo na construção de intervalos de confiança. Para essas aplicações, há alguns princípios básicos que devem ser obedecidos. O primeiro princípio é que a amostra retirada da população seja aleatória, o segundo é que uma ou mais amostras sejam oriundas de populações com distribuição normal e R. Bras.Fisiol.Veg. 12(Edição Especial):205-237, 2000 Análise Estatística na Germinação. 211 o terceiro, que duas ou mais populações tenham variâncias homogêneas, isto é, que sejam homocedásticas. O primeiro princípio é válido para a estatística como um todo e os dois últimos são exigidos para a aplicação de testes estatísticos paramétricos. A aleatoriedade da amostra, na maioria dos casos, é garantida quando a amostra é retirada da população por sorteio, pelo uso de tabelas de números aleatórios ou calculadoras (função randon). O sorteio também deve ser realizado para distribuir parcelas experimentais em campo ou laboratório, dentro dos planejamentos para delineamentos inteiramente casualizados, blocos casualizados, dentre outros. Apesar do sorteio, testes podem ser aplicados para conferir se a amostra retirada da população ou se as parcelas de um experimento estão distribuídas de maneira aleatória. Dentre esses, encontra-se o teste de aleatoriedade ou teste de iterações. Na seqüência, serão apresentados dois exemplos, sendo que o primeiro testará se a distribuição das parcelas de um experimento montado em delineamento inteiramente casualizado é aleatória e o segundo testará se a amostra do peso da matéria fresca de sementes de Sesbania virgata (Caz.) Pers.foi retirada aleatoriamente de uma população. 1o Exemplo: Experimento composto de dois tratamentos (A e B) e oito repetições, totalizando 16 parcelas distribuídas aleatoriamente em laboratório ou campo, por sorteio. o (1) A (2) B (3) B (4) B (5) A (6) B (7) A (8) B (9) A (10) A (11) A (12) B (13) B (14) A (15) A (16) B 1 Passo: Hipóteses Ho: As parcelas experimentais estão distribuídas aleatoriamente. H1: As parcelas não estão distribuídas aleatoriamente. 2o Passo: Significância estabelecida α = 0,05 3o Passo: Estatística apropriada A estatística apropriada é função do número de iterações (r) onde, segundo Siegel (1975), iteração é definida como uma sucessão de símbolos idênticos (repetição) que aparecem seguidos e precedidos por símbolos diferentes dele próprio. Aplicando a definição para o exemplo e acompanhando a seqüência, da parcela 1 até a parcela 16 em ordem crescente (números entre parênteses), pode-se observar as 10 interações, fazendo-se a leitura do quadro acima em linhas, seguidas no sentido de leitura normal: A, BBB, A, B, A, B, AAA, BB, AA e B. Portanto, o exemplo mostra r= 10 iterações. 4o Passo: Conclusão Como o valor r = 10 está entre os valores tabelados, 4 < r < 14, para n1 = n2 = 8 (repetições de cada tratamento), aceita-se Ho e conclui-se que as parcelas estão distribuídas aleatoriamente. 2o Exemplo: Para os dados apresentados na tabela 2, os passos para a realização do teste são: 1o Passo: Hipóteses H0: Os sinais "+" e "-" ocorrem em ordem aleatória, ou seja, as repetições foram retiradas da amostra aleatoriamente. H1: As repetições não foram retiradas da amostra aleatoriamente. 2o Passo: Significância estabelecida α = 0,05 3o Passo: Estatística apropriada R. Bras.Fisiol.Veg. 12(Edição Especial):205-237, 2000 212 Santana e Ranal TABELA 2 - Dados da matéria fresca oriundos de uma amostra com 42 repetições de sementes de Sesbania virgata (Caz.) Pers. Adaptado de Zayat (1996) que trabalhou com uma amostra de tamanho 30. As características da espécie quanto às medidas de posição e variabilidade não foram alteradas. Teste de aleatoriedade Repetições Matéria fresca (mg) Sinais “runs” 1 748,9 - 1 2 807,8 + 2 ... ... ... 40 759,9 - 41 776,8 - 42 742,8 - Mediana 784,2 n1 = n2 =21 Para os ensaios ou amostragens onde os valores de n1 (número de escores classificados com o sinal "-") e n2 (número de escores classificados com o sinal "+") são menores que 20, a estatística apropriada do teste é o próprio número de iterações, sendo o valor julgado diretamente a partir do valor tabelado. Quando os valores de n1 e n2 são maiores que 20, como no exemplo 2, a distribuição do número de iterações (r) se aproxima da distribuição normal e a estatística é dada por: 2 n1 n2 r − + 1 n + n 2 1 zc = 2 n1 n2 (2 n1 n2 − n1 − n2) = −0,9373 (n1 + n2) 2 (n1 + n2 − 1) 4o Passo: Conclusão Como - z c = −0,9373 > - z t = -1,96 (valores calculado e tabelado da distribuição z) 19 para α/2=0,025 (teste bilateral) e n1 = n2 =21, aceita-se Ho e conclui-se que a amostra de peso da matéria fresca de Sesbania virgata é aleatória. O outro princípio para os testes estatísticos como o t de Student, a análise da variância, os testes para comparações entre médias e proporções, é que a amostra ou amostras oriundas de uma ou mais populações tenham distribuição normal. Um dos testes mais utilizados para verificar a normalidade é o teste de aderência, recomendado apenas quando o tamanho da amostra (n) ou o número de repetições (r) é maior que 50. Para exemplificar (Tabela 3), serão tomados os dados da matéria fresca (mg) de 500 sementes de Vicia graminea Sm.(parte da tabela 1 de Labouriau, 1970). Os passos para a realização do teste são: 1o Passo: Hipóteses Ho :As freqüências observadas não diferem das freqüências esperadas para a distribuição normal, R. Bras.Fisiol.Veg. 12(Edição Especial):205-237, 2000 Análise Estatística na Germinação. 213 TABELA 3 - A matéria fresca (mg) de 500 sementes de Vicia graminea Sm. Parte da tabela 1 de Labouriau (1970). Antes do agrupamento com fˆi < 1 Peso(mg) Li fi zi fˆr Prob. Depois do agrupamento fˆi fi fˆi ( f i − fˆi )2 fˆ i 1,25 1,75 1,25 1 -3,78 0,4999 0,0010 0,50 1,75 2,25 1,75 3 -3,07 0,4989 0,0080 4,00 4 4,50 0,056 2,25 2,75 2,25 14 -2,36 0,4909 0,0414 20,70 14 20,70 2,169 2,75 3,25 2,75 74 -1,64 0,4495 0,1257 62,85 74 62,85 1,978 3,25 3,75 3,25 119 -0,93 0,3238 0,2406 120,30 119 120,30 0,014 3,75 4,25 3,75 155 -0,21 0,0832 0,2748 137,40 155 137,40 2,254 4,25 4,75 4,25 91 0,50 0,1915 0,1954 97,70 91 97,70 0,459 4,75 5,25 4,75 26 1,21 0,3869 0,0863 43,15 26 43,15 6,816 5,25 5,75 5,25 12 1,93 0,4732 0,0227 11,35 12 11,35 0,037 5,75 6,25 5,75 4 2,64 0,4959 0,0037 1,85 5 2,05 4,245 6,25 6,75 6,25 1 3,36 0,4996 0,0004 0,20 Total 500 1,0000 500 18,028 ˆ L i : limite inferior da classe; f i : freqüência observada; zi: valores da distribuição de z; f r : freqüências relativas esperadas; fˆi : freqüências esperadas para a distribuição normal. ou seja, a matéria fresca de sementes de Vicia graminea segue a distribuição normal. H1 : A matéria fresca não segue a distribuição normal. 2o Passo: Significância estabelecida α=0,05 3o Passo: Estatística apropriada ( f i − fˆi )2 fˆ i =1 k χ c2 = ∑ = 18,028 i 4o Passo: Conclusão Como χc2 = 18,028 > χ t2 = 12,592 (valores calculado e tabelado da distribuição χ2 ) para α=0,05 e v=6 (graus de liberdade), a hipótese Ho é rejeitada e conclui-se que a matéria fresca de sementes de Vicia graminea não segue a distribuição normal. Um outro teste de normalidade de aplicação mais ampla, uma vez que não apresenta restrição quanto ao tamanho da amostra, é o teste de Kolmogorov-Smirnov. Este é um teste que não exige o agrupamento dos dados em classes como o teste de aderência, evitando com isso a perda de informações. Na seqüência, serão apresentados dois exemplos da aplicação do teste, o primeiro envolvendo uma única amostra e o segundo, várias amostras. 1o Exemplo: Aplicação do teste para uma amostra (Tabela 4). R. Bras.Fisiol.Veg. 12(Edição Especial):205-237, 2000 214 Santana e Ranal TABELA 4 - Dados da matéria fresca (ordem crescente), de 1 amostra com 10 repetições (n=r=10) de 100 sementes de Dolichos biflorus L. Parte da tabela 1 de Labouriau & Pacheco (1979). Repetições Peso (g) zi Fˆ (z i ) F0,5 g = Fˆ (z i ) − F0,5 1 2,9909 -1,56 0,0594 0,05 0,0094 2 3,0286 -1,05 0,1469 0,15 0,0031 3 3,0481 -0,78 0,2177 0,25 0,0323 4 3,0570 -0,66 0,2546 0,35 0,0954 5 3,0823 -0,31 0,3783 0,45 0,0717 6 3,1278 0,31 0,6217 0,55 0,0717 7 3,1590 0,74 0,7704 0,65 g máx = 0,1204 8 3,1737 0,94 0,8264 0,75 0,0764 9 3,1898 1,16 0,8770 0,85 0,0270 10 3,1935 1,21 0,8869 0,95 0,0631 zi: valores da distribuição de z; Fˆ (z i ) : valores da área sob a curva normal padronizada; F0,5 : freqüência relativa observada acumulada da repetição. 1o Passo: Hipóteses Ho: A matéria fresca de sementes de Dolichos biflorus segue a distribuição normal. H1: A matéria fresca não segue a distribuição normal. 2o Passo: Significância estabelecida α=0,05 3o Passo: Estatística apropriada Dmáx = gmáx + 1 1 = 0,1204 + = 0,1704 2n 20 4o Passo: Conclusão Como Dmáx = 0,1704 < Dt = 0,21072 (valores calculado e tabelado da diferença D) para n=10, δ = 0,5 (correção) e α=0,05, a hipótese Ho é aceita e conclui-se que o peso de matéria fresca de Dolichos biflorus segue a distribuição normal. 2o Exemplo: Aplicação do teste para várias amostras. Nos trabalhos que envolvem duas ou mais amostras, o teste de normalidade é realizado sob os erros, que correspondem à diferença entre a repetição de cada tratamento e sua respectiva média. Esses experimentos são mais comuns quando os dados serão submetidos à análise da variância. Os passos para a execução do teste para o exemplo da Tabela 5 são os seguintes: 1o Passo: Hipóteses Ho: Os erros da porcentagem de sementes germinadas de Dolichos biflorus seguem a distribuição normal. H1: Os erros não seguem a distribuição normal. 2o Passo: Significância estabelecida α=0,05 3o Passo: Estatística apropriada R. Bras.Fisiol.Veg. 12(Edição Especial):205-237, 2000 Análise Estatística na Germinação. 215 TABELA 5 - Porcentagem de sementes de Dolichos biflorus L. germinadas em diferentes temperaturas. Parte da tabela 5 de Labouriau & Pacheco (1979). n=r Temperaturas (oC) 1 2 3 4 5 35,0 ± 0,04 96,0 100,0 98,0 100,0 96,0 37,8 ± 0,04 76,0 92,0 88,0 84,0 94,0 38,5 ± 0,03 72,0 94,0 64,0 82,0 32,0 39,2 ± 0,06 38,0 30,0 54,0 40,0 42,0 Na Tabela 6 estão apresentados os valores dos erros da porcentagem de sementes de Dolichos biflorus germinadas que permitem concluir o teste. 4o Passo: Conclusão Como Dmáx=0,2168>Dt = 0,1672 para n=20, δ = 0,5 e α=0,05, rejeita-se Ho e conclui-se que os erros da porcentagem de sementes germinadas de Dolichos biflorus não seguem a distribuição normal. Uma outra forma de quantificar o desvio de normalidade é o emprego das medidas de assimetria e curtose que, com seus valores de referência, indicam o quanto a distribuição dos dados se afasta da normalidade. O coeficiente de TABELA 6 - Valores dos erros da porcentagem (ei) de sementes de Dolichos biflorus L. germinadas em diferentes temperaturas, calculados da tabela 5, para obtenção do valor da estatística apropriada. i ei zi Fˆ (z i ) F0,5 g = Fˆ (z i ) − F0,5 1 -36,8 -2,82 0,0024 0,025 0,0226 2 -10,8 -0,83 0,2033 0,075 0,1283 3 -10,8 -0,83 0,2033 0,125 0,0783 4 -4,8 -0,37 0,3557 0,175 0,1807 5 -2,8 -0,21 0,4168 0,225 g máx = 0,1918 6 -2,8 -0,21 0,4168 0,275 0,1418 ... ... ... ... ... ... 19 13,2 1,01 0,8438 0,925 0,0813 20 25,2 1,93 0,9731 0,975 0,0018 Dmáx = g máx + 1 1 = 0,1918 + = 0,2168 2n 40 R. Bras.Fisiol.Veg. 12(Edição Especial):205-237, 2000 216 Santana e Ranal assimetria ( g1 ) indica que para g1 = 0 a distribuição dos dados é simétrica, havendo uma coincidência entre os valores da média, mediana e moda (Mo = Md = x ), g1 > 0 indica uma assimetria positiva (Mo< Md < x ) e g1 < 0 uma assimetria negativa (Mo > Md > x ). O coeficiente de curtose ( g 2 ) ou grau de achatamento g2 = 0 a indica que para g 2 = 3 ou distribuição é mesocúrtica; g 2 > 3 ou g 2 > 0 que a distribuição é leptocúrtica e g 2 < 3 ou g 2 < 0 que a distribuição é platicúrtica. Na tabela 7 encontram-se, além dos dados do exemplo, os valores necessários para calcular as medidas de desvio da normalidade. Assim, os valores de assimetria e curtose para o exemplo são: m3 = g1 = 16 .466 .368 489 .264 − (3 )(30,392 ) + (2) (30,392 )2 = − 54.438,186 g 500 500 − 54.438,186 7,414 3 = − 133,581 (assimetria negativa) Quando o teste envolver mais de duas amostras (t >2 ou a >2), pode-se aplicar tanto o teste de Bartlett (2o exemplo), quanto o F máximo de Hartley, sendo este último de baixa precisão. 1o Exemplo: Teste F de "Snedecor" para duas amostras (Tabela 8). Os passos para a realização do teste são: 1o Passo: Hipóteses H o : As variâncias da matéria seca de sementes de Dolichos biflorus após 27 dias de secagem a 70oC e após 24 horas de secagem a 105oC são homogêneas, ou seja, σ12 = σ 22 . H1 : As variâncias da matéria seca são heterogêneas, ou seja, σ12 ≠ σ 22 . 2o Passo: Escolha da significância α =0,05 3o Passo: Estatística apropriada Fc = m3: momento centrado de terceira ordem; 3 s : desvio padrão da amostra ao cubo. m4 = 574 . 206 .720 16 . 466 .368 489 .264 − (4 ) (30,392 ) + (6 ) (30,392 )2 − (3) (30 ,392 )4 = 8 .370 ,734 g 500 500 500 g2 = ou m4 s4 = 8.370,734 g2 = 7,414 4 m4 s4 −3 = = 2,79 (platicúrtica) 8.370,734 7,414 4 − 3 = −0,21 (platicúrtica) m4: momento centrado de quarta ordem; s4: desvio padrão da amostra à quarta. Uma última pressuposição para a aplicação dos testes estatísticos que serão discutidos neste texto, é a homogeneidade das variâncias entre duas ou mais populações. Como a normalidade também é uma pressuposição para os testes de homogeneidade, estes só podem ser efetuados se os dados tiverem distribuição normal. Quando o teste de homogeneidade envolver apenas duas amostras (t=2 ou a=2), aplica-se o teste F de “Snedecor”(1o exemplo). s12 s 22 = 1,4483 4o Passo: Conclusão Como Ft=0,3144 < Fc = 1,4483 < Ft=3,18 (valores tabelado e calculado da distribuição F de "Snedecor") para α=0,05 e v1 = v 2 = 9 (graus de liberdade do numerador e denominador), aceita-se Ho e conclui-se que as variâncias da matéria seca de Dolichos biflorus após 27 dias de secagem a 70oC e após 24 horas de secagem a 105oC são homogêneas. 2o Exemplo: Teste de Bartlett para mais de duas amostras (Tabela 9). 1o Passo: Hipóteses H o : As variâncias da porcentagem de germinação entre as temperaturas são homogêneas, ou seja, . 2 = σ2 σ12 = σ 22 = σ 4 3 H1 : As variâncias da porcentagem de germinação são heterogêneas. R. Bras.Fisiol.Veg. 12(Edição Especial):205-237, 2000 Análise Estatística na Germinação. 217 TABELA 7 - Distribuição de freqüência da matéria fresca de 500 sementes de Dolichos biflorus L. Adaptação da figura 1 de Labouriau & Pacheco (1979), uma vez que a figura não fornece os valores exatos das freqüências observadas. Matéria Fresca xi fi x i2 x i3 x i4 f i xi f i x i2 f i x i3 f i x i4 8 1 64 512 4.096 8 64 512 4.096 10 14 12 10 144 1.728 20.736 120 1.440 17.280 207.360 14 18 16 17 256 4.096 65.536 272 4.352 69.632 1.114.112 18 22 20 49 400 8.000 160.000 980 19.600 392.000 7.840.000 22 26 24 50 576 13.824 331.776 1.200 28.800 691.200 16.588.800 26 30 28 90 784 21.952 614.656 2.520 70.560 1.975.680 55.319.040 30 34 32 120 1.024 32.768 1.048.576 3.840 122.880 3.932.160 125.829.120 34 38 36 90 1.296 46.656 1.679.616 3.240 116.640 4.199.040 151.165.440 38 42 40 51 1.600 64.000 2.560.000 2.040 81.600 3.264.000 130.560.000 42 46 44 20 1.936 85.184 3.748.096 880 38.720 1.703.680 74.961.920 46 50 48 2 2.304 110.592 5.308.416 96 4.608 221.184 10.616.832 10.384 389.312 15.541.504 15.196 489.264 16.466.368 574.206.720 6 10 Total 500 xi : ponto médio da classe; f i : freqüências observadas. TABELA 8 - Dados da matéria seca de sementes de Dolichos biflorus L. Parte das tabelas 1 e 2 de Labouriau & Pacheco (1979). Após 27 dias de secagem a 70oC Após 24 horas de secagem a 105oC n1 = 10 n 2 = 10 Média x1 = 2,7680g x 2 = 2,6992g Desvio Padrão s1 = 0,0645g s 2 = 0,0543g Tamanho da amostra Variância s12 = 0,0042(g) 2 R. Bras.Fisiol.Veg. 12(Edição Especial):205-237, 2000 s 22 = 0,0029(g) 2 218 Santana e Ranal TABELA 9 - Porcentagem de sementes de Dolichos biflorus L. germinadas em diferentes temperaturas. Parte da tabela 5 de Labouriau & Pacheco (1979). n=r Temp. ( C) 1 2 3 4 5 ni − 1 si2 ln si2 35,0 ± 0,04 96 100 98 100 96 4 4,0 37,8 ± 0,04 76 92 88 84 94 4 38,5 ± 0,03 72 94 64 82 32 39,2 ± 0,06 38 30 54 40 42 o Total (n i − 1) ln si2 (n i −1)si2 1,3863 5,5452 16,0 51,2 3,9357 15,7428 204,8 4 549,2 6,3085 25,2340 2.196,8 4 75,2 4,3202 17,2808 300,8 63,8028 2.718,4 16 2o Passo: Significância estabelecida α=0,05 3o Passo: Estatística apropriada a 2 ∑ (n i −1)si s 2 = i =1 a ∑ (n i −1) = 2.718,4 = 169,9 16 i =1 a a χc2 = ∑(ni −1) lns 2 − ∑ (ni −1) lnsi2 = 18,3606 i =1 i =1 4o Passo: Conclusão Como χc2 = 18,3606 > χ 2t = 7,815 (valores calculado e tabelado da distribuição ÷2) para α=0,05 e v=3, rejeita-se a hipótese Ho e conclui-se que as variâncias das porcentagens de germinação entre as temperaturas são heterogêneas. Quando os dados originais não atendemàs pressuposições básicas da estatística paramétrica, ou seja, quando a população ou populações estudadas não apresentam distribuição normal e possuem variâncias heterogêneas, há duas decisões a serem tomadas. O pesquisador pode tentar a transformação dos dados para corrigir desvios de normalidade e heterogeneidade, ou pode optar diretamente pela estatística nãoparamétrica. Entretanto, a transformação não garante que as pressuposições sejam atendidas, daí a necessidade de se testar novamente a normalidade e a homogeneidade sobre os dados transformados. É interessante destacar que as transformações reduzem a escala dos valores e portanto são mais apropriadas quando o problema é heterogeneidade e não normalidade, uma vez que esta última reflete o comportamento da espécie. Dentre as transformações recomendadas, em função da natureza da variável, encontra-se a x + k , usada transformação raiz quadrada quando os dados são oriundos de contagens, principalmente quando não se sabe previamente o tamanho da amostra; a transformação log (x + k ) ou ln (x + k ) , logarítmica, também utilizada para contagens, especialmente quando a amplitude das observações é muito grande e a transformação arco seno ou transformação Arco seno x /100 , angular, utilizada principalmente para dados de contagem que seguem a distribuição binomial e são expressos em porcentagens ou proporções. As transformações citadas têm como objetivo quebrar a dependência entre a média e a variância, característica dos dados de contagem e porcentagens. Para apresentar um exemplo com a aplicação da transformação, serão utilizados dados de porcentagem de germinação, onde se concentra o maior interesse desse curso (Tabela 10). R. Bras.Fisiol.Veg. 12(Edição Especial):205-237, 2000 Análise Estatística na Germinação. 219 Inicialmente aplicou-se o teste de Kolmogorov-Smirnov aos dados originais, obtendo-se um valor D máx = 0,19907 > D t = 0,14082 para n=30, δ = 0,5 e α=0,05 e, portanto, rejeitou-se a hipótese Ho , concluindo-se que os erros da porcentagem de sementes de Dolichos biflorus que germinam não seguem a distribuição normal. Dada a não normalidade, transformou-se os dados segundo Arco seno porcentagem/100 , aplicandose novamente o teste de Kolmogorov-Smirnov sobre os dados transformados. Como D máx = 0,13715 < D t = 0,14082 para n=30, δ = 0,5 e α=0,05, concluiu-se que os erros da porcentagem de sementes de Dolichos biflorus que germinam, na escala transformada, seguem a distribuição normal. Dada a normalidade, aplicou-se o teste de Bartlett para os dados transformados que 2 2 apresentou χaj . = 9,146 < χ t = 11,070 para α=0,05 e v=5, concluindo-se que as variâncias das porcentagens de germinação entre as temperaturas, na escala transformada, são homogêneas. Como as pressuposições foram atendidas, testes como a análise da variância, teste t, comparações múltiplas, dentre outros, podem ser aplicados aos dados transformados. Nos testes de comparações, sejam eles de duas ou mais populações, a escolha do teste dependerá principalmente do planejamento do experimento ou ensaio. Nos experimentos planejados para a comparação entre médias ou proporções de duas populações, as opções são o teste t de "Student" e o teste z, sendo a escolha entre os dois dependente, dentre outras características, do tamanho das amostras. Na Tabela 11 estão apresentadas as condições para a escolha da estatística apropriada dos testes t e z, para os casos possíveis de comparações entre médias ou proporções de duas populações. TABELA 10 - Porcentagem de germinação de sementes de Dolichos biflorus L. germinadas em diferentes temperaturas. Parte da tabela 5 de Labouriau & Pacheco (1979). Porcentagem Arco seno porcentagem/100 n=r n=r Temp. (oC) 1 2 3 4 5 1 2 35,0 ± 0,04 96,0 100,0 98,0 100,0 96,0 78,46 90,00 81,87 90,00 78,46 36,3 ± 0,02 98,0 100,0 96,0 98,0 100,0 81,87 90,00 78,46 81,87 90,00 37,2 ± 0,02 92,0 84,0 80,0 94,0 92,0 73,57 66,42 63,44 75,82 73,57 37,8 ± 0,04 76,0 92,0 88,0 84,0 94,0 60,67 73,57 69,73 66,42 75,82 38,5 ± 0,03 72,0 94,0 64,0 82,0 32,0 58,05 75,82 53,13 64,90 34,45 39,2 ± 0,06 38,0 30,0 54,0 40,0 42,0 38,06 33,21 47,29 39,23 40,40 R. Bras.Fisiol.Veg. 12(Edição Especial):205-237, 2000 3 4 5 220 Santana e Ranal TABELA 11 - Condições de escolha para os testes de comparações entre médias e proporções de duas populações. Ho Condição Estatística apropriada 1. Independente do tamanho das µ1 − µ 2 = 0 amostras; σ12 e σ 22 conh. µ1 − µ2 = 0 e desconh., homogêneas ou heterogêneas µ1 − µ2 = 0 e x1 − x 2 sp sp = 1 1 + n1 n 2 desconh. e heterogênas 5. n1 ≥ 30 , n 2 ≥ 30 ; p1 − p2 = 0 n1 pˆ1 > 5 , n 2 pˆ 2 > 5 ; n1qˆ1 > 5 , n 2qˆ 2 > 5 n2 v= v = n1 + n 2 − 2 s12 s 22 + n1 n 2 (s12 /n1 (s12 /n1 )2 n1 − 1 z c ≈ tc = qˆ1 = 1 − pˆ1 Rejeita-se Ho quando µ1 − µ2 ≠ 0 ⇒ zc > z t ou − zc < −z t µ1 − µ2 > 0 ⇒ zc > zt µ1 − µ2 < 0 ⇒ −zc < − zt µ1 − µ2 ≠ 0 ⇒ tc > t t ou − tc < −tt µ1 − µ2 > 0 ⇒ tc > t t µ1 − µ2 < 0 ⇒ −tc < −t t µ1 − µ2 ≠ 0 ⇒ tc > t t ou − tc < −tt µ1 − µ2 > 0 ⇒ tc > t t µ1 − µ2 < 0 ⇒ −tc < −t t µ1 − µ2 ≠ 0 ⇒ tc > t t ou − tc < −tt µ1 − µ2 > 0 ⇒ tc > t t µ1 − µ2 < 0 ⇒ −tc < −t t p1 − p 2 ≠ 0 ⇒ tc > t t ou − tc < −tt p1 − p2 > 0 ⇒ tc > t t p1 − p2 < 0 ⇒ −tc < −t t x1 − x 2 4. n1 < 30, n 2 < 30 ; σ12 e σ 22 + s22 (n1 − 1) s12 + (n 2 − 1) s22 n1 + n 2 − 2 tc = µ1 − µ2 = 0 n2 v = n1 + n 2 − 2 σ 22 desconh. e homogêneas s12 n1 tc = σ12 + σ22 x1 − x 2 z c ≈ tc = σ 22 3. n1 < 30, n 2 < 30 ; σ12 n1 2. n1 ≥ 30, n2 ≥ 30 ; σ12 x1 − x 2 zc = Hipótese Alternativa + s 22 /n 2 )2 (s 22 /n 2 )2 + n 2 −1 pˆ1 − pˆ 2 pˆ1qˆ1 pˆ 2qˆ2 + n1 n2 e qˆ2 = 1 − pˆ 2 R. Bras.Fisiol.Veg. 12(Edição Especial):205-237, 2000 Análise Estatística na Germinação. Tomando-se como exemplo os dados apresentados na tabela 8, tem-se: 1o Passo: Hipóteses H0 : A matéria seca de sementes de Dolichos biflorus após 27 dias de secagem à temperatura de 70oC, sob pressão reduzida, e após 24 horas de secagem a 105oC são estatisticamente iguais, ou seja, µ1 − µ 2 = 0 (médias populacionais iguais). H1 : µ1 − µ 2 ≠ 0 (bilateral). 2o Passo: Significância estabelecida α = 0,05 3o Passo: Estatística apropriada Como as variâncias populacionais σ12 e σ 22 são desconhecidas, aplica-se o teste F de "Snedecor" ( Fc = 1,4483 entre Ft = 0,2481 e Ft = 4,03 para α / 2 = 0,025 e v1 = v 2 = 9 ). Assim, aceita-se a hipótese H o e conclui-se que as variâncias dos pesos médios das duas populações são homogêneas. Como as variâncias, apesar de desconhecidas, são homogêneas e n1 = n 2 = 10 (condição 3, Tabela 11), a estatística apropriada é dada por: tc = sp = 2,7680 − 2,6992 1 1 0,00596 + 10 10 = 2,58 (10 − 1) 0,0042 + (10 − 1) 0,0029 = 0,0596 10 + 10 − 2 4o Passo: Conclusão tc = 2,58 > t t = 2,101 Como (valores calculado e tabelado da distribuição t) para α / 2 = 0,025 (bilateral) e v=18, a hipótese H o é rejeitada e conclui-se que a média da matéria seca de sementes de Dolichos biflorus após 27 dias de secagem à temperatura de 70oC, sob pressão 221 reduzida, e após 24 horas de secagem a 105oC são diferentes. A aplicação de testes de comparações envolvendo mais de duas médias requer uma análise prévia dos dados, conhecida como análise da variância, que tem as mesmas pressuposições dos testes para comparação de duas médias. Desde que as pressuposições da estatística paramétrica sejam atendidas, ou seja, desde que as amostras tenham sido distribuídas aleatoriamente em campo ou laboratório, que as populações de onde provêm tenham distribuição normal e que as variâncias entre elas sejam homogêneas, a análise da variância pode ser realizada. Entretanto, variações da análise da variância podem ocorrer um função de algumas restrições como o controle local em um ou dois sentidos. Em função disso, nomes específicos são dados a essas diferentes variações, como delineamento inteiramente casualizado, blocos casualizados, quadrado latino, dentre outros. No entanto, a utilização da análise da variância só depende que as pressuposições mencionadas sejam atendidas. Para mostrar um exemplo e discutir os passos para a realização dessa análise até os testes para comparações das médias ou proporções (Tabelas 12 e 13), serão tomados os dados da tabela 10, utilizando-se os valores transformados segundo Arco seno porcentagem/100 , pois os dados originais apresentaram problemas quanto à normalidade. 1o Passo: Hipóteses H o : As porcentagens médias de sementes de Dolichos biflorus germinadas nas seis temperaturas são estatisticamente iguais, ˆ 2 = pˆ 3 = pˆ 4 = pˆ 5 = pˆ 6 . pˆ1 = p H 1 : Pelo menos uma combinação de médias é diferente. R. Bras.Fisiol.Veg. 12(Edição Especial):205-237, 2000 222 Santana e Ranal TABELA 12 - Análise da variância dos valores angulares dos dados apresentados na tabela 10. Causas da variação gl Soma de Quadrados Quadrado Médio Temperaturas 5 7223,5611 1444,7122 Resíduo 24 1549,7489 64,5729 Total 29 FC 22,37 gl: graus de liberdade TABELA 13 - Testes de Tukey e Duncan para comparação das temperaturas do exemplo da tabela 10. Temp. (oC) Médias originais 35,0 ± 0,04 98,0 83,76 a 83,76 a 36,3 ± 0,02 98,4 84,44 a 84,44 a 37,2 ± 0,02 88,4 70,56 a b 70,56 b 37,8 ± 0,04 86,8 69,24 a b 69,24 b 38,5 ± 0,03 68,8 57,27 57,27 39,2 ± 0,06 40,8 39,64 2o Passo: Escolha da significância α =0,05 3o Passo: Estatística apropriada (Tabela 12). 4o Passo: Conclusão Como Fc=22,37 > Ft= 2,62 para α=0,05 e v1=5 (graus de liberdade do numerador) e v2=24 (graus de liberdade do denominador), rejeita-se Ho e conclui-se que pelo menos uma combinação de médias difere entre si (Tabela 12). Entretanto, o teste F não indica qual combinação de temperaturas é diferente. Assim, logo após a rejeição de Ho, são aplicados os testes para comparações múltiplas. Tukey Duncan b c 39,64 c d 5o Passo: Testes para comparações múltiplas (testes de Tukey e Duncan). Dentre os testes mais utilizados para comparações de médias, tem-se o teste de Tukey e o teste de Duncan, sendo o primeiro mais rigoroso em relação ao segundo. Na tabela 13 estão apresentados os resultados dos dois testes aplicados aos dados transformados da tabela 10, além da coluna com os dados originais, coluna esta indispensável para discussão e visualização dos resultados. A diferença quanto ao rigor dos dois testes apresentados na tabela 13 pode ser comprovada quando se compara os resultados das temperaturas 37,2 ± 0,02 oC e 37,8 ± 0,04oC. Nos dois testes, as duas médias não diferiram R. Bras.Fisiol.Veg. 12(Edição Especial):205-237, 2000 Análise Estatística na Germinação. significativamente entre si, mas no teste de Tukey as duas médias também não diferiram significativamente das médias registradas nas temperaturas de 35,0 ± 0,04oC e 36,3 ± 0,02oC. Portanto, conclui-se que o teste de Tukey é mais resistente ao determinar que duas médias são estatisticamente diferentes, isto é, ele é mais resistente em rejeitar Ho , mostrando assim o seu rigor. Quando a população ou populações não seguem a distribuição normal ou apresentam variâncias heterogêneas, mesmo após a transformação dos dados, deve-se então utilizar os testes estatísticos nãoparamétricos. Na seqüência, serão discutidos dois testes, o de Kruskal-Wallis que é uma alternativa não paramétrica à análise da variância e o de Mann-Whitney que é uma alternativa ao teste t. O teste de Kruskal-Wallis é aplicado para comparar médias oriundas de mais de duas populações. Variações na aplicação do teste ocorrem, principalmente em função do tamanho da amostra ou número de tratamentos. Neste curso será discutido apenas um dos casos que está apresentado na tabela 14. 1o Passo: Hipóteses Ho: As velocidades médias de germinação de sementes de Dolichos biflorus são iguais para todas as temperaturas, ou seja, v1 = v 2 = ... = v13 . H1: Pelo menos uma combinação de velocidades médias é diferente. o 2 Passo: Significância estabelecida α=0,05 3o Passo: Estatística apropriada 12 k Ri2 H= ∑ − 3(N +1) = N(N +1) i =1ni 152 402 12 3122 + + ... + − 3 (65 + 1) = 62,20 (65) (65 + 1) 5 5 5 223 sendo: N= tr= (13) (5)= 65 Como houve empates nos postos, é necessário corrigir o valor da estatística H calculada (Tabela 15). 4o Passo: Conclusão Como H*=62,20 > χ 2 =21,03 para α=0,05 e v=12 (Tabela 15), a hipótese Ho é rejeitada e conclui-se que pelo menos um par de velocidades médias difere entre si. Apesar do teste de Kruskal-Wallis indicar que há uma combinação entre médias diferente, ele não indica qual a combinação que gerou a diferença. Portanto, o outro passo é testar as médias, duas a duas, para indicar qual par difere significativamente entre si. O teste nãoparamétrico que compara amostras, duas a duas, é o de Mann-Whitney. Para exemplificar a aplicação do teste, serão comparadas apenas as velocidades nas temperaturas de 20,1oC e 26,1oC. Os passos para a execução do teste encontram-se a seguir (Tabela 16). 1o Passo: Hipóteses Ho: As velocidades médias de germinação de sementes de Dolichos biflorus são iguais para as temperaturas de 20,1oC e 26,1oC, ou seja, v1 = v 2 . H1: As velocidades médias de germinação são diferentes. 2o Passo: Estatística apropriada (Tabela 16). 3o Passo: Conclusão Como Uc=19 < Ut=21 (valores calculado e tabelado da estatística U) para α/2=0,025 e n1 = n 2 = 5 , aceita-se Ho e conclui-se que as velocidades médias de germinação de Dolichos biflorus são iguais para as temperaturas de 20,1oC e 26,1oC (Tabela 16). Tudo o que foi apresentado e discutido até o momento pode ser aplicado para qualquer R. Bras.Fisiol.Veg. 12(Edição Especial):205-237, 2000 224 Santana e Ranal TABELA 14 - Velocidade média de germinação ( v ) de sementes de Dolichos biflorus L. mantidas sob diferentes temperaturas. Parte da tabela 5 de Labouriau & Pacheco (1979). Temp (oC) r 3 postos 4 5 1 2 3 Soma dos 1 2 4 5 12,8 12,8 14,0 13,1 11,0 13,6 2 5 3 1 4 15,0 13,7 16,0 16,9 16,6 15,2 15,8 8 10 9 6 7 40,0 14,7 21,1 19,1 20,0 20,6 21,0 15 11 12 13 14 65,0 16,4 28,1 26,4 27,1 28,0 27,8 20 16 17 19 18 90,0 17,4 31,0 32,6 30,2 31,0 29,8 23,5 25 22 23,5 21 115,0 19,3 41,0 40,0 39,6 39,9 38,2 32 31 28 30 27 148,0 20,1 35,1 39,7 43,8 43,5 43,7 26 29 39 36 37,5 167,5 21,1 41,9 47,0 44,8 43,2 48,2 33 46 41 34 48 202,0 21,9 44,9 45,5 43,7 44,7 45,9 42 44 37,5 40 45 208,5 22,8 47,3 50,2 49,1 45,3 43,3 47 50 49 43 35 224,0 23,5 55,2 54,8 52,4 52,9 51,5 56 55 52 53 51 267,0 24,8 60,4 60,8 53,4 55,4 56,1 60 62 54 57 58 291,0 26,1 59,5 66,4 60,6 63,6 62,2 59 65 61 64 63 312,0 Postos ( Ri ) TABELA 15 - Valores de velocidade média de germinação ( v ) com o respectivo número de observações empatadas, a serem utilizados para o cálculo da correção de H. Velocidade média de germinação ( v ) Observações empatadas ( t′ ) T = (t − 1) t (t + 1) 31,0 2 6 43,7 2 6 C =1 − ∑T (N − 1) N (N + 1) = 1 − (64) (12 = 1,00 65) (66) H* = H C ,20 = 62 = 62,20 1,00 R. Bras.Fisiol.Veg. 12(Edição Especial):205-237, 2000 Análise Estatística na Germinação. 225 TABELA 16 - Velocidade média de germinação ( v ) de sementes de Dolichos biflorus L., mantidas sob duas diferentes temperaturas e postos atribuídos. Parte da tabela 5 de Labouriau & Pacheco (1979). Temperatura 20,1oC Repetições Temperatura 21,1 oC v Posto v Posto 1 35,1 1 41,9 3 2 39,7 2 47,0 9 3 43,8 7 44,8 8 4 43,5 5 43,2 4 5 43,7 6 48,2 10 R1 = 21 U = n1 n 2 + 5 (5 + 1) n1 (n1 + 1) − R1 = (5) (5) + − 21 = 19 2 2 conjunto de dados, sejam eles relativos à germinação ou não. Como o enfoque do curso é germinação de sementes, a seguir serão apresentadas algumas das medidas exploradas pelos pesquisadores da área para entender o processo de germinação. Dentre essas medidas, podem ser destacadas a germinabilidade, em geral expressa em porcentagem, para informar a quantidade de sementes que germina nas condições do ensaio. Apesar de ser um termo pouco conhecido em algumas áreas do conhecimento que trabalham com germinação como as ciências agrárias, é amplamente utilizado na fisiologia da germinação, como pode ser verificado na literatura específica (Labouriau, 1983a; Bewley & Black, 1994). Grande número de trabalhos expressa os resultados por meio de curvas de germinação (Nichols & Heydecker, 1968; Goodchild & Walker, 1971; Janssen, 1973; Nobs & Hagar, 1974; Labouriau & Pacheco, 1978; Labouriau & Pacheco, 1979; Richter & Switzer, 1982; Duran & Tortosa, 1985; Labouriau & Agudo, 1987a; Hilhorst & Karssen, 1988), com ou sem ajustes por meio de regressões variadas. Há vários modelos matemáticos descritos na literatura que podem ser utilizados para esses U = n1 n 2 + R2 = 34 5 (5 + 1) n 2 (n 2 + 1) − R2 = (5) (5) + − 34 = 6 2 2 ajustes, dentre eles, os modelos sigmoidais que, por serem bons para um grande número de espécies, possibilitam a utilização das curvas para previsões. A qualidade do ajuste pode ser empiricamente avaliada, verificando-se se o modelo ajustado é compatível com o processo biológico em estudo. Esta qualidade pode ainda ser precisamente avaliada após o estudo de algumas medidas associadas ao modelo, como a análise da variância, o erro padrão, o intervalo de confiança das estimativas (intercepto, inclinação, dentre outros) e o coeficiente de determinação que, conjuntamente, indicam se o modelo está ou não bem ajustado. Assim como nos testes paramétricos, os modelos para o ajuste de curvas exigem que determinadas pressuposições sejam atendidas, por exemplo, os modelos polinomiais exigem que os erros tenham distribuição normal. Além da quantidade de sementes que germina ao longo do tempo, há uma preocupação antiga em expressar quando a germinação começa, quando termina, quanto tempo isso dura e quando alcança seu máximo valor ou seu valor médio. Parte dessa história pode ser resgatada, examinando-se os trabalhos de Edwards (1932) e de Labouriau (1983a). Sabendo-se que a R. Bras.Fisiol.Veg. 12(Edição Especial):205-237, 2000 226 Santana e Ranal germinação é o resultado de um complexo trabalho metabólico, mediado por uma série de enzimas, houve a preocupação em medir a velocidade desse processo. A maneira pela qual a idéia de quantificar a velocidade do processo germinativo cresceu ao longo dos anos também pode ser recuperada analisando-se os trabalhos de Edwards (1932) e Labouriau (1983a). Índices variados também vêm sendo utilizados como o índice de velocidade de germinação (Maguire, 1962), amplamente conhecido na área agronômica, o coeficiente de uniformidade da germinação citado por Nichols & Heydecker (1968), Heydecker (1973), Bewley & Black (1994), dentre outros, e o índice de sincronização, bastante explorado nos trabalhos de Labouriau e colaboradores (Labouriau & Valadares, 1976; Labouriau & Pacheco, 1978; Labouriau & Osborn, 1984; Labouriau & Agudo, 1987b). O tempo para a primeira e a última germinação, o intervalo de tempo em que isto ocorre, quando ocorre o máximo e a variação do processo ao longo do tempo podem ser inferidos observando-se as curvas de germinação. No entanto, o tempo para a primeira e a última germinação representam medidas extremas que levam em consideração apenas as sementes de germinação mais rápida e as de germinação mais lenta, respectivamente. Em função disso, recomenda-se obter medidas de tendência central que sejam mais representativas da amostra em estudo. Em seus trabalhos, Labouriau e colaboradores deram grande importância ao tempo médio de germinação, usado diretamente ou para o cálculo da velocidade média de germinação. O tempo médio de germinação utilizado por Labouriau (1983a) é uma média ponderada, onde o número de sementes germinadas é o peso de ponderação do tempo. Observando-se a expressão abaixo, pode-se verificar que se trata de uma média calculada para distribuições de freqüência, onde o número de sementes germinadas representa a freqüência de germinação. k t = ∑ni ti i =1 k (1) ∑ni i =1 onde: ti: tempo entre o início do experimento e a i-ésima observação (dia ou hora); ni: número de sementes que germinam no tempo ti ( não o número acumulado, mas o número referido para a i-ésima observação); k: último dia da observação. Como já foi mencionado no início, é importante o cálculo de medidas de dispersão para se ter idéia da variabilidade da medida na amostra em estudo. Desta forma, deve-se calcular a variância do tempo médio de germinação (2), de onde poderão sair o desvio padrão, o erro padrão e o coeficiente de variação. k 2 ∑ n i (t i − t ) st2 = i =1 k ∑ ni − 1 (2) i =1 onde: t : tempo médio de germinação; ti: tempo entre o início do experimento e a i-ésima (dia ou hora) observação; ni: número de sementes que germinam no tempo ti ( não o número acumulado, mas o número referido para a i-ésima observação); k: último dia da observação. Para ilustrar o cálculo dessas medidas, será tomado o exemplo apresentado na tabela 17, cujo tempo médio é: k t = ∑ n i ti i =1 k = ∑n i i =1 R. Bras.Fisiol.Veg. 12(Edição Especial):205-237, 2000 444 = 2,04 218 dias Análise Estatística na Germinação. 227 A variância e o desvio padrão do tempo médio são: k st2 = ∑ n i (ti i =1 k ∑ni i =1 2 −t) = −1 417,7162 = 1,9250 (dias)2 217 que estão iniciando seus estudos na área de germinação. A primeira idéia de velocidade de germinação foi apresentada por Kotowski (1926) e expressa como: coeficiente de velocidade = 100 então st = st2 = 1,3874 dias (5) onde: Edmond & Drapala (1958) propuseram o cálculo da velocidade de germinação segundo a expressão (3). VG = A1 + A 2 + ... + A x A1T1 + A2T2 + ... + A x T x N 1G1 + N 2G 2 + ... + N n G n G1 + G 2 + ... + G n (3) A1 , A2 ,..., A x : número de plântulas colhidas no primeiro dia, segundo dia, terceiro dia e assim sucessivamente até o último (x) dia ; T1, T2 ,...,Tx: número de dias entre a semeadura e a primeira coleta; entre a semeadura e a segunda coleta e assim sucessivamente até a última (x) coleta. onde: G1, G 2 ,...,G n : número de plântulas normais emergidas ou sementes germinadas no dia da observação; Posteriormente, Nichols & Heydecker (1968) apresentaram o coeficiente de velocidade de germinação de Kotowski (1926) como: k N 1, N 2 ,..., N n : número de dias contados da semeadura ao dia da observação. C .V .G . = ∑ fi i =1 k 100 (6) ∑ f i xi i =1 Se a expressão acima for escrita utilizando uma notação de somatório, será dada por: ∑ N iG i i =1 k ∑Gi fi: número de sementes germinadas no i-ésimo dia; xi: número de dias contados da semeadura até o dia k VG = onde: (4) da leitura (i); k: último dia da observação. i =1 que é o próprio tempo médio de germinação, dado pela expressão (1). Este exemplo ilustra a diversificação de expressões encontrada na literatura que acaba por dificultar o trabalho, especialmente dos estudantes Analisando-se a expressão (6), pode-se verificar que ela é o recíproco do tempo médio de germinação, multiplicado por 100. Isto significa que os valores de C.V.G. variam de 0 (zero) a 100, sendo o valor máximo alcançado quando todas as sementes germinarem no primeiro tempo. R. Bras.Fisiol.Veg. 12(Edição Especial):205-237, 2000 228 Santana e Ranal Labouriau (1970) demonstrou que o coeficiente de velocidade de germinação de Kotowski (1926) pode ser usado para gerar a velocidade média de germinação. Assim: v = C .V . 1 = 100 t (7) onde: t : tempo médio de germinação; C.V.: coeficiente de velocidade de germinação de Kotowski (1926), denominado como C.V.G. por Nichols & Heydecker (1968). Da mesma forma, esta medida de tendência central precisa vir acompanhada de uma medida de dispersão. Pode-se calcular então a variância da velocidade média de germinação, dada por: sv2 = v 4 st2 (8) onde: st2 : v4: variância do tempo médio de germinação; velocidade média elevada à quarta potência. Como não se conhece a distribuição de 1 t , a variância da velocidade média de germinação é uma medida aproximada, calculada pelo desenvolvimento em série de Taylor (para informações mais detalhadas sobre esse desenvolvimento, consultar Labouriau, 1983b). Para ilustrar a obtenção dessas medidas, será tomado o exemplo apresentado na tabela 18. Os dados apresentados mostram que quanto menor for o tempo médio, maior será a velocidade de germinação das sementes e que, de fato, tempo médio e velocidade média são duas grandezas inversamente proporcionais. A velocidade de germinação (calculada para trabalhos de laboratório) ou de emergência (calculada para trabalhos de campo) apresentada por Maguire (1962) é uma das medidas mais amplamente utilizadas por pesquisadores da área de ciências agrárias. Em geral, os pesquisadores a expressam como um índice (IVE= índice de velocidade de emergência) e a utilizam como uma medida adimensional (sem unidade), para predizer o vigor relativo de amostras de sementes. Apesar de não assumirem uma unidade para o número obtido, a expressão (9) comunica o número de plântulas emergidas em campo ou germinadas em laboratório, por dia. VE = no. de plântulas normais no. de plântulas normais + ... + dias até a primeira contagem dias até a contagem final (9) O valor obtido com esta expressão é influenciado pelo tempo médio de germinação e conseqüentemente pela velocidade de germinação das sementes, ou seja, se a germinação ocorrer logo no início da semeadura, o valor do índice será maior do que se isto ocorrer mais tardiamente (Tabela 19). Esta é a grande vantagem do índice que, de fato, mede velocidade de germinação. O valor de VE também é influenciado pelo número total de sementes que germinam nas condições do ensaio (germinabilidade) e portanto, é adequado para comparações, somente quando as amostras ou tratamentos apresentarem o mesmo número de sementes germinadas. Na tabela 19, as duas amostras apresentaram 20 plântulas emergidas ao final do experimento. Neste caso, como na amostra A as plântulas começaram a emergir no terceiro dia após a semeadura, o vigor do lote é maior do que o da amostra B, cujas plântulas começaram a emergir somente no 15° dia. O valor de VE é influenciado ainda pela uniformidade da germinação, calculada pelo coeficiente de uniformidade de germinação que será discutido mais adiante. Se a germinação estiver mais espalhada no tempo, seu valor aumenta, o que não é desejável para um índice que comunica vigor de lote (quanto maior o valor de CUG, mais concentrada no tempo está a germinação das sementes). R. Bras.Fisiol.Veg. 12(Edição Especial):205-237, 2000 Análise Estatística na Germinação. 229 TABELA 17 - Cálculo do tempo médio de germinação e medidas de dispersão de sementes de Brassica chinensis var. parachinensis mantidas em solução de hipoclorito de sódio, sob luz contínua (Ferreira & Ranal, 1999). ti ni (t i − t ) ni ti (t i − t )2 n i (t i − t )2 1 82 82 -1,03 1,0609 86,9938 2 108 216 -0,03 0,0009 0,0972 3 4 12 0,97 0,9409 3,7636 4 3 12 1,97 3,8809 11,6427 5 10 50 2,97 8,8209 88,2090 6 5 30 3,97 15,7609 78,8045 7 6 42 4,97 24,7009 148,2054 218 444 Soma 417,7162 TABELA 18 - Tempo médio e velocidade média de germinação, com suas respectivas variâncias, para sementes de Lycopersicum esculentum mantidas em diferentes temperaturas. Parte da tabela 3 de Labouriau & Osborn (1984). Tempo médio de germinação Velocidade de Germinação Temp (oC) t (h ) st2 (h 2 ) v (h −1.10 −4 ) sv2 (h −2 10 −7 ) 8,7 ± 0,02 998,6 43.300,0 10 0,4 11,6 ± 0,02 421,6 78.803,0 24 2,5 13,9 ± 0,02 216,5 27.414,0 46 12,5 15,8 ± 0,02 139,9 8.893,0 72 23,2 17,9 ± 0,03 101,5 6.971,0 98 65,7 20,4 ± 0,10 78,2 4.435,0 128 118,0 23,3 ± 0,05 56,8 3.662,0 176 352,0 29,5 ± 0,10 51,8 4.094,0 193 570,0 34,0 ± 0,10 82,1 10.121,0 122 222,0 35,8 ± 0,10 116,7 16.819,0 86 90,6 R. Bras.Fisiol.Veg. 12(Edição Especial):205-237, 2000 230 Santana e Ranal TABELA 19 - Germinação de duas amostras de sementes de uma determinada espécie e suas respectivas velocidades de germinação ou emergência. Amostra A di ni Amostra B ni / di di ni ni / di 3 2 0,6667 15 2 0,1333 4 0 0,0000 16 0 0,0000 5 3 0,6000 17 3 0,1765 6 0 0,0000 18 0 0,0000 7 2 0,2857 19 2 0,1053 8 0 0,0000 20 0 0,0000 9 0 0,0000 21 0 0,0000 10 6 0,6000 22 6 0,2727 11 4 0,3636 23 4 0,1739 12 1 0,0833 24 1 0,0417 13 1 0,0769 25 1 0,0400 14 1 0,0714 26 1 0,0385 Soma 20 2,7476 Soma 20 0,9819 VEA = 0,6667 + 0,6000 +...+ 0,0714 = 2,7476 CUGA= 0,1001 dias-2 t = 8,9 dias VEB = 0,9819 plântulas/dia CUGB = 0,1001 dias-2 t = 20,9 dias Resumindo: VE é alto quando: • a amostra tem alta germinabilidade e alta velocidade média de germinação (cerrado 1, Tabela 20) • a amostra tem baixa germinabilidade e alta velocidade (cerrado 2, Tabela 20). VE é baixo quando: • a amostra tem baixa germinabilidade e baixa velocidade (cerrado 3, Tabela 20) • a amostra tem alta germinabilidade e baixa velocidade (mata 3, Tabela 20) Porém, quando as germinabilidades forem iguais e as velocidades médias de germinação similares, o valor de CUG definirá se o valor de VE será alto ou baixo. Com valor de CUG baixo (germinabilidade espalhada no tempo) VE é alto (cerrado 3, Tabela 20) e vice-versa (cerrado 4, Tabela 20). Timson (1965) modificou o índice de George (1961), substituindo números parciais de sementes germinadas por porcentagens parciais de germinação. Este é conhecido como índice de Timson ou somatório de 10 e é expresso por: R. Bras.Fisiol.Veg. 12(Edição Especial):205-237, 2000 Análise Estatística na Germinação. t T = ∑ gi (t − j ) 231 sendo: j = i − 1 i =1 (10) onde: gi: porcentagem de germinação acumulada no intervalo de tempo i; t: número total de intervalos de tempo do experimento; i: intervalo de tempo entre as observações. Timson (1965) sugeriu fixar o intervalo de tempo dos experimentos em 10 dias de observações (t=10), uma vez que a maioria das sementes de espécies cultivadas termina de germinar nesse intervalo. No entanto, nada impede que se calcule Σ5 ou Σ20, utilizando-se a expressão (10). Este índice dá uma idéia da velocidade de germinação das sementes, podendo ser usado para comparações, somente se as amostras ou tratamentos tiverem a mesma porcentagem final de germinação. Uma tentativa para minimizar o efeito da porcentagem final de germinação foi sugerida por Labouriau (comunicação pessoal), ponderando-se o próprio índice por esta porcentagem. Assim: t ∑ gi i =1 = ∑ g i (t − j ) i =1 t k CUG = ∑ ni k i =1 2 ∑ (D − Di ) ni i =1 k sendo : 100 D= = t ; CRG = CRG ∑ ni i =1 k 100 (Kotowski, 1926) (12) ∑ Di n i i =1 onde: ni: número de sementes germinadas no i-ésimo dia; t T Para as sementes de Matayba guianensis mantidas em solo oriundo da mata, as maiores velocidades médias foram registradas para as repetições 1 e 4 (Tabela 22). Resultado similar é observado quando se analisa os valores do índice de Timson modificados por Labouriau, que cancelam o efeito da porcentagem final de germinação. Isto confirma que este índice repassa uma idéia de velocidade. O coeficiente de uniformidade da germinação - CUG (Heydecker, 1973) mede a variabilidade da germinação de cada semente em torno do seu tempo médio, uma vez que ele é expresso como o inverso da variância dos tempos médios de germinação. sendo: j = i − 1 (11) ∑ gi i =1 Uma outra característica desse índice é que ele combina valores de germinabilidade e de velocidade na mesma expressão, valores estes que podem se contrabalançar, gerando uma medida ambígua. Isto significa que o valor de T pode ser alto se a germinabilidade for alta e a velocidade de germinação baixa ou vice-versa. Nas Tabelas 21 e 22 estão alguns dados que permitem informações apresentadas para este os dados da tabela 21, T ou Σ10 somatório das multiplicações dos última coluna. apresentados ilustrar as índice. Para é dado pelo números da Di: número de dias contados da instalação do experimento até o dia da leitura (i); k: último dia da observação. Do ponto de vista prático, quanto maior o valor de CUG, mais concentrada no tempo será a germinação (Tabelas 19, 20, 22). Porém, este coeficiente só pode ser usado para comparações, quando os tempos médios de germinação forem iguais. Como este índice é uma medida de variabilidade, ele tem as mesmas limitações que a variância, ou seja, as variâncias só podem ser usadas para fins comparativos quando as médias forem iguais. Desta forma, parece mais apropriado denominá-lo coeficiente de variabilidade da germinação. R. Bras.Fisiol.Veg. 12(Edição Especial):205-237, 2000 232 Santana e Ranal TABELA 20 - Germinação de sementes de Matayba guianensis Aubl. em solo de mata e de cerrado, sob luz contínua (Santos & Ranal, dados não publicados). Tratamento/repetição ni v VE CUG t mata/1 13 0,2826 3,9167 1,7979 3,5385 mata/2 19 0,2088 4,6246 0,2597 4,7895 mata/3 18 0,1935 3,9841 0,2628 5,1667 mata/4 17 0,2698 5,3190 0,4530 3,7059 Média 16,75 0,2387 4,4611 0,6934 4,3002 cerrado/1 20 0,3077 6,7262 0,8421 3,2500 cerrado/2 16 0,2807 4,6500 2,0157 3,5625 cerrado/3 15 0,2459 4,3333 0,4294 4,0667 cerrado/4 15 0,2632 4,0667 2,3438 3,8000 16,5 0,2744 4,9440 1,4078 3,6698 Média v : velocidade média de germinação calculada com base na expressão (7); VE: velocidade de germinação calculada com base na expressão (9); t : tempo médio de germinação calculado com base na expressão (1). TABELA 21 - Dados de germinação de sementes de uma determinada espécie ao longo de 10 dias, para o cálculo do índice de Timson. Dia da observação (i) j=i-1 (t - j) gi (t – j) 1 0 10 (15) (10) 2 1 9 (18) (9) 3 2 8 (21) (8) 4 3 7 (25) (7) 5 4 6 (38) (6) 6 5 5 (40) (5) 7 6 4 (68) (4) 8 7 3 (75) (3) 9 8 2 (85) (2) 10 9 1 (88) (1) Soma 1838 R. Bras.Fisiol.Veg. 12(Edição Especial):205-237, 2000 Análise Estatística na Germinação. 233 TABELA 22 - Germinação de sementes de Matayba guianensis Aubl. em solo de mata e de cerrado, sob luz contínua (Santos & Ranal, dados não publicados). Trat/repetição ni G(%) t v VE CUG T(Timson) T(Labouriau) mata/1 13 52 3,5385 0,2826 3,9167 1,7979 1664 4,2886 mata/2 19 76 4,7895 0,2088 4,6246 0,2597 1848 3,9152 mata/3 18 72 5,1667 0,1935 3,9841 0,2628 1572 3,7428 mata/4 17 68 3,7059 0,2698 5,3190 0,4530 2132 4,2984 Média 16,75 67 4,3002 0,2387 4,4611 0,6934 1804 4,0612 cerrado/1 20 80 3,2500 0,3077 6,7262 0,8421 2760 4,4516 cerrado/2 16 64 3,5625 0,2807 4,6500 2,0157 2024 4,2521 cerrado/3 15 60 4,0667 0,2459 4,3333 0,4294 1720 4,1346 cerrado/4 15 60 3,8000 0,2632 4,0667 2,3438 1784 4,1296 16,5 66 3,6698 0,2744 4,9440 1,4078 2072 4,2420 Média v : velocidade média de germinação calculada com base na expressão (7); VE: velocidade de germinação calculada com base na expressão (9); t : tempo médio de germinação calculado com base na expressão (1). Como a germinação das sementes, em geral, não é perfeitamente sincronizada, é possível quantificar essa variação da germinação ao longo do tempo por meio de uma medida denominada índice de sincronização ou incerteza ( E , U, H ou I). Para isso, utiliza-se a seguinte expressão (Labouriau, 1983a): k E = − ∑ f i . log 2 f i i =1 sendo: f i = ni k ∑ ni i =1 onde: fi : freqüência relativa de germinação; (13) n i : número de sementes germinadas no dia i; k: último dia da observação. Do ponto de vista prático, quanto menor for o valor de E , mais sincronizada será a germinação das sementes. A vantagem desse índice é que seu valor não é influenciado pelo número total de sementes germinadas, nem pelo tempo médio ou velocidade média de germinação. O índice é expresso em bits, sendo bit uma medida binária que conta, por exemplo, germina/não germina, ligado/desligado. A transformação das freqüências de germinação (fi) R. Bras.Fisiol.Veg. 12(Edição Especial):205-237, 2000 234 Santana e Ranal em logaritmo da freqüência na base 2, converte esta medida binária em um peso de ponderação. Desta forma, log 2 f i é o peso de ponderação de cada freqüência registrada, cujo resultado é expresso em f i log 2 f i . Observando-se a quarta coluna da Tabela 23, pode-se verificar que 40 sementes germinadas no sétimo dia têm massa TABELA 23 - Número de sementes germinadas (ni) a cada dia (ti), para sementes de Ficus enormis (Mart. ex Miq.) Miq. que passaram pelo trato digestivo de morcegos e foram colocadas para germinar na luz (DL) e sementes submetidas à escarificação química (EQ), também mantidas para germinar na luz (Bobrowiec & Ranal, 2000). DL ti ni fi log 2 f i EQ f i log 2 f i ni fi log 2 f i f i log 2 f i 6 20 0,1587 -2,6554 -0,4215 0 0,0000 7 40 0,3175 -1,6554 -0,5255 1 0,0100 -6,6439 -0,0664 8 24 0,1905 -2,3923 -0,4557 4 0,0400 -4,6439 -0,1858 9 18 0,1429 -2,8074 -0,4010 11 0,1100 -3,1844 -0,3503 10 10 0,0794 -3,6554 -0,2901 15 0,1500 -2,7370 -0,4105 11 6 0,0476 -4,3923 -0,2092 13 0,1300 -2,9434 -0,3826 12 2 0,0159 -5,9773 -0,0949 6 0,0600 -4,0589 -0,2435 13 0 0,0000 12 0,1200 -3,0589 -0,3671 14 3 0,0238 9 0,0900 -3,4739 -0,3126 15 0 0,0000 14 0,1400 -2,8365 -0,3971 16 1 0,0079 -6,9773 -0,0554 2 0,0200 -5,6439 -0,1129 17 1 0,0079 -6,9773 -0,0554 5 0,0500 -4,3219 -0,2161 18 0 0,0000 2 0,0200 -5,6439 -0,1129 19 1 0,0794 3 0,0300 -5,0589 -0,1518 20 0 0,0000 1 0,0100 -6,6439 -0,0664 21 0 0,0000 2 0,0200 -5,6439 -0,1129 ∑ 126 1,0000 100 1,0000 E DL = 2,6924 bits -5,3923 -6,9773 -0,1284 -0,0554 -2,6924 E EQ = 3,4890 bits R. Bras.Fisiol.Veg. 12(Edição Especial):205-237, 2000 -3,4890 Análise Estatística na Germinação. 235 muito menor (1,66) do que uma única semente germinada no 19o dia (6,98). Isto significa que uma única semente germinando em um dia, é capaz de assincronizar o processo de germinação da amostra como um todo. Se for contado o número de vezes que a amostra de sementes foi "acionada" para germinar, tem-se 11 vezes para as sementes que passaram pelo trato digestivo de morcegos (DL) e 15 vezes para as que foram submetidas à escarificação química (EQ). Isto significa que a primeira amostra foi mais sincronizada que a segunda, sendo seu índice de sincronização de menor valor em relação à primeira. Para facilitar, na tabela 24 está apresentado um resumo das principais características das medidas de germinação apresentadas e discutidas nesse curso. AGRADECIMENTOS As autoras agradecem ao Núcleo de Especialistas em Germinação - NEG que, em 1995, as estimulou a começar esse estudo; à Comissão Organizadora do 51o Congresso Nacional de Botânica e aos Congressistas que participaram do mini-curso, pelo apoio e oportunidade para discutir o assunto; à Dra. Linda Caldas e Mirian Eira pelo gentil e estimulante oferecimento do espaço da RBFV para a inclusão deste texto. TABELA 24 - Resumo das principais medidas de germinação apresentadas. Medida Unidade O que mede Adequado quando Tempo médio ( t ) h ou d tempo qualquer situação Velocidade média ( v ) h-1 ou d-1 velocidade qualquer situação Coeficiente de velocidade de % velocidade qualquer situação Plânt./dia velocidade germinação (C.V.G.) germinabilidades forem iguais Velocidade de emergência (VE) germinação concentrada no tempo (CUG alto) Somatório de 10 (T) %.dia velocidade germinabilidades forem iguais Coeficiente de uniformidade de h-2 ou dia-2 variabilidade tempos médios forem iguais germinação (CUG) em torno do tempo Índice de sincronização ( E ) bits sincronia qualquer situação R. Bras.Fisiol.Veg. 12(Edição Especial):205-237, 2000 236 Santana e Ranal REFERÊNCIAS BANZATTO, D.A. & KRONKA, S.N. Experimentação agrícola 2a ed. Jaboticabal, FUNEP, 1992. 247p. BEWLEY, J.D. & BLACK, M. Seeds: physiology of development and germination. 2nd. ed. New York, Plenum Press, 1994. 445p. BOBROWIEC, P.E. & RANAL, M.A. Effect of ingestion by fruit-eating bats on seed germination of Ficus enormis (Mart. ex Miq.) Miq. (Moraceae) in the Brazilian Cerrado. In: International Symposium-Workshop on Frugivores and Seed Dispersal, Biodiversity and Conservational Perspectives, 3, São Pedro - SP, Brasil, 2000. Abstracts. P.144. DURAN, J.M. & TORTOSA, M.E. The effect of mechanical and chemical scarification on germination of charlock (Sinapis arvensis L.) seeds. Seed Science & Technology, 13:155163, 1985. EDMOND, J.B. & DRAPALA, W.J. The effects of temperature, sand and soil, and acetone on germination of okra seed. Proceedings of the American Society for Horticultural Science, 71:428-434, 1958. EDWARDS, T.I. Temperature relations of seed germination. The Quaterly Review of Biology, 7:428-443, 1932. FERREIRA, W.R. & RANAL, M.A. Germinação de sementes e crescimento de plântulas de Brassica chinensis L. var. parachinensis (Bailey) Sinskaja (couve-da-malásia). Pesquisa Agropecuária Brasileira, 34:353361, 1999. GEORGE, D. W. Influence of germination temperature on the expression of post-harvest dormancy in wheat. Crop Science Abs.:15, 1961. GOODCHILD, N.A. & WALKER, M.G. A method of measuring seed germination in physiological studies. Annals of Botany, 35:615-621, 1971. HEYDECKER, W. Glossary of terms. In: HEYDECKER, W. (Ed.) Seed ecology. London, Butterworths, 1973. p.553-557. HILHORST. H.W.M. & KARSSEN, C.M. Dual effect of light on the gibberellin- and nitratestimulated seed germination of Sisymbrium officinale and Arabidopsis thaliana. Plant Physiology, 86:591-597, 1988. JANSSEN, J.G.M. A method of recording germination curves. Annals of Botany, 37:705-708, 1973. KOTOWSKI, F. Temperature relations to germination of vegetable seed. Proceedings of the American Society for Horticultural Science, 23: 176-184, 1926. LABOURIAU, L.G. On the physiology of seed germination in Vicia graminea Sm. I. Anais da Academia Brasileira de Ciências, 42:235262, 1970. LABOURIAU, L.G. A germinação das sementes. Série de Biologia, Monografia 24. Organização dos Estados Americanos. Programa Regional de Desenvolvimento Científico e Tecnológico, 1983a. 174p. LABOURIAU, L.G. Uma nova linha de pesquisa na fisiologia da germinação das sementes. Conferência realizada no Simpósio sobre Reprodução de Plantas. In: Congresso Nacional de Botânica, XXXIV, Porto Alegre, 1983b. Resumos. p.11-50. R. Bras.Fisiol.Veg. 12(Edição Especial):205-237, 2000 Análise Estatística na Germinação. LABOURIAU, L.G. & AGUDO, M. On the physiology of seed germination in Salvia hispanica L. II. Light-Temperature interactions: preliminary results. Anais da Academia Brasileira de Ciências, 59:57-69, 1987a. LABOURIAU, L.G. & AGUDO, M. On the physiology of seed germination in Salvia hispanica L. I. Temperature effects. Anais da Academia Brasileira de Ciências, 59:37-56, 1987b. LABOURIAU, L.G. & OSBORN, J.H. Temperature dependence of the germination of tomato seeds. Journal of Thermobiological Biology, 9:285-294, 1984. LABOURIAU, L.G. & PACHECO, A.A. On the frequency of isothermal germination in seeds of Dolichos biflorus L. Plant & Cell Physiology, 19:507-512, 1978. 237 MAGUIRE, J.D. Speed of germination-aid in selection and evaluation for seedling emergence and vigor. Crop Science, 2:176177, 1962. NICHOLS, M.A. & HEYDECKER, W. Two approaches to the study of germination data. Proc. Intern. Seed Testing Association, 33:531-540, 1968. NOBS, M.A. & HAGAR, W.G. Analysis of germination and flowering rates of dimorphic seed from Atriplex hortensis. Carnegie Inst. Yearbook 1973. Ann. Rep. Dept. Pant Biology, 1974. p.859-864. RICHTER, D.D. & SWITZER, G.L. A technique for determining quantitative expressions of dormancy in seeds. Annals of Botany, 50:459463, 1982. TIMSON, J. New method of recording germination data. Nature, 207:216-217, 1965. LABOURIAU, L.G. & PACHECO, A.A. Isothermal germination rates in seeds of Dolichos biflorus L. Boletín de la Sociedad Venezolana de Ciencias Naturales, 34:73-112, 1979. VIEIRA, S. Introdução à bioestatística. 4a ed. Rio de Janeiro, Editora Campus Ltda., 1986. 294p. LABOURIAU, L.G. & VALADARES, M.E.B. On the germination of seeds of Calotropis procera (Ait.) Ait. f. Anais da Academia Brasileira de Ciências, 48:263-284, 1976. ZAYAT, A.G. Termobiologia da germinação de sementes de Sesbania virgata (Fabaceae). Lavras, Universidade Federal de Lavras, 1996. 68p. Dissertação de Mestrado. R. Bras.Fisiol.Veg. 12(Edição Especial):205-237, 2000