Análise de resíduos e transformação de dados em variáveis de tomateiro Diogo Vanderlei Schwertner1 Rélia Rodrigues Brunes1 Fernando Machado Haesbaert1 Daniel Santos1 Denison Esequiel Schabarum1 Alessandro Dal’Col Lúcio1 1 Introdução Devido a importância econômica e agronômica do tomateiro (Solanum lycopersicum L.), um grande número de experimentos é realizado anualmente com a cultura. Nesses experimentos a análise de resíduos deve ser utilizada para testar o atendimento as pressuposições do modelo matemático [10]. A análise dos resultados experimentais é de boa qualidade quando as pressuposições de aditividade dos efeitos do modelo, homogeneidade de variâncias, normalidade e aleatoriedade dos erros são satisfeitas. Quando tais pressuposições não são atendidas, a confiabilidade das análises paramétricas fica comprometida, pois ocorrem alterações nas probabilidades de ocorrência dos erros tipo I e tipo II, podendo levar a falsas conclusões a respeito dos efeitos de tratamento [10, 6]. A análise de resíduos deve ser aplicada anteriormente a análise de variância dos dados, utilizando o teste de não aditividade de Tukey para verificar a aditividade dos efeitos [9], o teste de Lilliefors [8], de Bartlett [9] e de Aleatoriedade [8] para verificar, respectivamente, a normalidade, a homogeneidade e a aleatoriedade dos erros. Quando ocorrem violações as pressuposições, dois caminhos são possíveis: análise não paramétrica, ou, transformação dos dados, de maneira que passem a atender as pressuposições do modelo [10]. Trabalhos realizados com abobrinha italiana [1], brócolis e pimentão [3, 4] investigaram a ocorrência de violação aos pressupostos do modelo matemático e a necessidade de transformações de dados. Os resultados demonstraram que ocorrem violações as pressuposições de normalidade e homogeneidade dos erros, bem como, dificuldades em obter transformações eficientes dos dados, sendo necessárias transformações diferentes para cada variável, cultura e época de cultivo. Não foram encontradas informações a respeito do atendimento as pressuposições de aditividade dos efeitos e aleatoriedade dos erros em 1 Departamento de Fitotecnia, Centro de Ciências Rurais (CCR), Universidade Federal de Santa Maria (UFSM), CEP 97105-900, Santa Maria, RS, Brasil. E-mail: [email protected] hortaliças, bem como, estudos com tomate visando verificar o atendimento as pressuposições e transformação de dados visando atende-las. O objetivo desse trabalho foi verificar o atendimento às pressuposições do modelo matemático e, identificar transformações de dados para variáveis produtivas de tomateiro em colheitas individuais e agrupadas. 2 Material e Métodos Foi conduzido um experimento com a cultura do tomate tipo salada, híbrido Grandeur na primavera-verão do ano de 2010 em túnel alto no Departamento de Fitotecnia da Universidade Federal de Santa Maria (UFSM), Santa Maria, RS. O túnel possui 20 m de comprimento, 4 m de largura, 3 m de pé direito, e orientação Norte-Sul, coberto com filme de polietileno de baixa densidade (PEBD) de espessura de 100 micras. As mudas foram dispostas em três linhas. Utilizou-se espaçamento de 0,8 m entre plantas e 1,2 m entre linhas, num total de 24 plantas por linha de cultivo. A adubação foi realizada conforme resultado da análise de solo [7] e os demais manejos seguiram as indicações para a cultura do tomateiro [3]. A parcela foi constituída de duas plantas na direção da linha de cultivo. Foi utilizado o delineamento blocos ao acaso, com três repetições e 12 tratamentos. Foram realizadas 10 colheitas de frutos (de 11/11/2010 a 27/01/2011). Em cada colheita avaliou-se: peso de frutos por planta em balança digital com precisão de 1 g; número de frutos por planta; comprimento e largura média de frutos, mensurados com paquímetro com precisão de 1 mm. A análise de resíduos foi utilizada para testar o atendimento às pressuposições do modelo matemático em cada data de colheita e em colheitas agrupadas. Para isso, as colheitas foram agrupadas por seus múltiplos: agrupamento duas em duas (1ª+2ª; 3ª+4ª; ...; 9ª+10ª), agrupamento cinco em cinco (1ª+2ª+3ª+4ª+5ª; 6ª+7ª+8ª+9ª+10ª) e agrupamento total (1ª+2ª+3ª; ...; 8ª+9ª+10ª). O erro experimental foi obtido pelo modelo matemático do delineamento blocos ao acaso: yij = m + ti + bj + eij, com i = 12 tratamentos e, j = 3 repetições, onde: m é uma constante associada a todas as observações; ti é o efeito do tratamento; bj é o efeito do bloco; eij é o erro experimental associado à observação yij [1]. A análise de resíduos foi realizada utilizando os testes de não aditividade de Tukey [9], Lilliefors [8], Bartlett [9] e de Aleatoriedade [8]. Nos casos de violação dos pressupostos do modelo matemático os dados foram transformados e novamente submetidos à análise de resíduos. Foram testadas as transformações: raiz quadrada (Yij)0,5 [10], raiz quarta (Yij)0,25 [1] e suas inversas: (Yij)-0,5 e (Yij)-0,25 [3, 4]; inversa (Yij)-1 [6]. Nestas transformações, quando havia no banco de dados valores nulos adicionou-se uma constante (c=0,5) a variável [10]. Foi também testada à transformação logarítmica (log10 (Yij)) e sua inversa (log10 (Yij))-1, adicionando-se a constante (c=1) para valores nulos [3, 10]. Todos os testes foram aplicados em nível de 5% de probabilidade de erro, utilizando planilha eletrônica em Office Excel® elaborada por [6]. 3 Resultados e Discussões Houve 100% de atendimento ao pressuposto da aditividade dos efeitos do modelo para todas as variáveis analisadas em colheitas individuais e agrupadas (dados não apresentados). Alta porcentagem de atendimento dessa pressuposição (91,25%) também foi obtida por [5] em ensaios de competição de cultivares de milho no RS. Foram identificadas violações as pressuposições de normalidade, homogeneidade e aleatoriedade dos erros (Tabela 1). A normalidade foi violada em colheitas individuais nas variáveis comprimento (COM) e largura (LAR) de frutos e no agrupamento de duas colheitas, na variável LAR (Tabela 1). A partir do agrupamento da produção em duas metades iguais (5 em 5) obteve-se 100% de atendimento a essa pressuposição. Maiores porcentagens de violação a homogeneidade de variâncias foram verificadas para uma mesma variável e tipo de colheita em relação a normalidade dos erros (Tabela 1), não sendo essa a causa da falta de homogeneidade dos erros conforme sugerido por [6]. Somente com o agrupamento de todas as colheitas realizadas (total) foi possível obter 100% de homogeneidade dos erros para todas as variáveis analisadas. Praticamente não houve atendimento a pressuposição da aleatoriedade dos erros independentemente do tipo de colheita e da variável observada (Tabela 1). Esse não era um resultado esperado, pois em princípio, a aleatoriedade é assegurada pela casualização dos tratamentos na área experimental [10, 6]. Possivelmente diferenças na fertilidade do solo e na distribuição da água de irrigação entre e dentro das linhas de cultivo sejam responsáveis pela não aleatoriedade dos erros. Apenas foi possível identificar transformação de dados eficiente em contornar a falta de homogeneidade de variâncias em colheitas individuais (Figura 1). A transformação logarítmica, raiz quadrada e inversa da raiz quarta foram eficientes nessa situação, porém mesmo assim, em porcentagem igual ou inferior a 50% dos casos de violação das variáveis estudadas. Esse resultado concorda com [1, 3 e 4], que também verificaram grande dificuldade em identificar transformações eficientes em superar a falta de homogeneidade dos erros. Tabela 1. Porcentagem de atendimento aos pressupostos do modelo matemático das variáveis peso (g planta-1), número de frutos (NF), comprimento (COM, mm) e largura de frutos (LAR, mm) de tomate. Santa Maria, UFSM, 2012. Tipo de Colheita Individuais Agrupadas 2 em 2 Agrupadas 5 em 5 Total Individuais Agrupadas 2 em 2 Agrupadas 5 em 5 Total Individuais Agrupadas 2 em 2 Agrupadas 5 em 5 Total PESO Normalidade 100% 100% 100% 100% Homogeneidade 80% 80% 100% 100% Aleatoriedade 10% 0% 0% 0% Variáveis NF COM LAR 100% 100% 100% 100% 90% 100% 100% 100% 90% 80% 100% 100% 70% 100% 50% 100% 50% 40% 100% 100% 40% 80% 100% 100% 0% 0% 0% 0% 10% 0% 0% 0% 20% 20% 0% 0% Log (Y+1)= transformação logarítmica; (Y+0,5) 0,5= raiz quadrada; Y-0,25= inversa da raiz quarta; Sem T= sem transformação eficiente. Figura 1. Eficiência percentual da transformação de dados em provocar o atendimento das variáveis peso, número (NF), comprimento (COM) e largura (LAR) de frutos em colheitas individuais a pressuposição de homogeneidade de variâncias. Santa Maria, UFSM, 2012. Não houve transformação eficiente para contornar a falta de normalidade e aleatoriedade dos erros. Esse resultado concorda com [3], que mesmo após a transformação Box-Cox em dados de brócolis não obteve a normalidade dos erros. Conforme [6], não há solução aparente para a falta de aleatoriedade dos erros, uso de testes não paramétricos ou transformação de dados. 4 Conclusões Os dados das variáveis de tomateiro apresentam atendimento ao pressuposto da aditividade dos efeitos. Ocorrem violações das pressuposições de normalidade, homogeneidade e aleatoriedade dos erros nas variáveis de tomateiro. As transformações raiz quadrada, logarítmica e inversa da raiz quarta são eficientes para superar a heterogeneidade de variâncias das variáveis de tomateiro. 5 Bibliografia [1] COUTO, M. R. M. et al. Transformação de dados em experimentos com abobrinha italiana em ambiente protegido. Ciência Rural. Santa Maria. v. 39, n. 6, p. 1701-1707, 2009. [2] FILGUEIRA, F. A. R. 2008. Novo manual de Olericultura: Agrotecnologia moderna na produção e comercialização de hortaliças. Viçosa: UFV. 421p. [3] LÚCIO, A. D. et al. Excesso de zeros nas variáveis observadas: estudo de caso em experimento com brócolis. Bragantia. Campinas. v. 69, n.4 , p. 1035-1046, 2010. [4] LÚCIO, A. D. et al. Transformação box-cox em experimentos com pimentão em ambiente protegido. Horticultura Brasileira. Brasília. v. 29, p. 38-42, 2011. [5] MARQUES, D. G. et al. Qualidade dos ensaios de competição de cultivares de milho no estado do rio grande do sul. Ciência Rural. Santa Maria. v. 30, n. 3, p. 381-385, 2000. [6] MARTIN, T. N.; STORCK, L. Análise das pressuposições do modelo matemático em experimentos agrícolas no delineamento blocos ao acaso. In: MARTIN, T. N.; ZIECH, M. F. (Org.). Sistemas de Produção Agropecuária. Curitiba: UTFPR, 2008. cap. 11, p. 177-196. [7] SOCIEDADE BRASILEIRA DE CIÊNCIA DO SOLO. Comissão de química e fertilidade do solo. 2004. Manual de adubação e de calagem para os estados do Rio Grande do Sul e de Santa Catarina. Porto Alegre: Núcleo Regional Sul - Sociedade Brasileira de Ciência do Solo. 394p. [8] SPRENT P; SMEETON NC. 2007. Applied nonparametric statistical methods. Boca Raton: Chapman & Hall. 530p. [9] STEEL, R. G. D.; TORRIE, J. H.; DICKEY, D. A. Principles and procedures of statistics: a biometrical approach. New York: McGraw-Hill, 1997. 666 p. [10] STORCK, L. et al. Experimentação vegetal. Santa Maria: UFSM, 2011. 200 p.