Análise de resíduos e transformação de dados em variáveis de tomateiro
Diogo Vanderlei Schwertner1
Rélia Rodrigues Brunes1
Fernando Machado Haesbaert1
Daniel Santos1
Denison Esequiel Schabarum1
Alessandro Dal’Col Lúcio1
1 Introdução
Devido a importância econômica e agronômica do tomateiro (Solanum lycopersicum
L.), um grande número de experimentos é realizado anualmente com a cultura. Nesses
experimentos a análise de resíduos deve ser utilizada para testar o atendimento as
pressuposições do modelo matemático [10]. A análise dos resultados experimentais é de boa
qualidade quando as pressuposições de aditividade dos efeitos do modelo, homogeneidade de
variâncias, normalidade e aleatoriedade dos erros são satisfeitas. Quando tais pressuposições
não são atendidas, a confiabilidade das análises paramétricas fica comprometida, pois
ocorrem alterações nas probabilidades de ocorrência dos erros tipo I e tipo II, podendo levar a
falsas conclusões a respeito dos efeitos de tratamento [10, 6].
A análise de resíduos deve ser aplicada anteriormente a análise de variância dos dados,
utilizando o teste de não aditividade de Tukey para verificar a aditividade dos efeitos [9], o
teste de Lilliefors [8], de Bartlett [9] e de Aleatoriedade [8] para verificar, respectivamente, a
normalidade, a homogeneidade e a aleatoriedade dos erros. Quando ocorrem violações as
pressuposições, dois caminhos são possíveis: análise não paramétrica, ou, transformação dos
dados, de maneira que passem a atender as pressuposições do modelo [10].
Trabalhos realizados com abobrinha italiana [1], brócolis e pimentão [3, 4]
investigaram a ocorrência de violação aos pressupostos do modelo matemático e a
necessidade de transformações de dados. Os resultados demonstraram que ocorrem violações
as pressuposições de normalidade e homogeneidade dos erros, bem como, dificuldades em
obter transformações eficientes dos dados, sendo necessárias transformações diferentes para
cada variável, cultura e época de cultivo. Não foram encontradas informações a respeito do
atendimento as pressuposições de aditividade dos efeitos e aleatoriedade dos erros em
1
Departamento de Fitotecnia, Centro de Ciências Rurais (CCR), Universidade Federal de Santa Maria (UFSM), CEP 97105-900, Santa
Maria, RS, Brasil. E-mail: [email protected]
hortaliças, bem como, estudos com tomate visando verificar o atendimento as pressuposições
e transformação de dados visando atende-las.
O objetivo desse trabalho foi verificar o atendimento às pressuposições do modelo
matemático e, identificar transformações de dados para variáveis produtivas de tomateiro em
colheitas individuais e agrupadas.
2 Material e Métodos
Foi conduzido um experimento com a cultura do tomate tipo salada, híbrido Grandeur
na primavera-verão do ano de 2010 em túnel alto no Departamento de Fitotecnia da
Universidade Federal de Santa Maria (UFSM), Santa Maria, RS. O túnel possui 20 m de
comprimento, 4 m de largura, 3 m de pé direito, e orientação Norte-Sul, coberto com filme de
polietileno de baixa densidade (PEBD) de espessura de 100 micras.
As mudas foram dispostas em três linhas. Utilizou-se espaçamento de 0,8 m entre
plantas e 1,2 m entre linhas, num total de 24 plantas por linha de cultivo. A adubação foi
realizada conforme resultado da análise de solo [7] e os demais manejos seguiram as
indicações para a cultura do tomateiro [3].
A parcela foi constituída de duas plantas na direção da linha de cultivo. Foi utilizado o
delineamento blocos ao acaso, com três repetições e 12 tratamentos. Foram realizadas 10
colheitas de frutos (de 11/11/2010 a 27/01/2011). Em cada colheita avaliou-se: peso de frutos
por planta em balança digital com precisão de 1 g; número de frutos por planta; comprimento
e largura média de frutos, mensurados com paquímetro com precisão de 1 mm.
A análise de resíduos foi utilizada para testar o atendimento às pressuposições do
modelo matemático em cada data de colheita e em colheitas agrupadas. Para isso, as colheitas
foram agrupadas por seus múltiplos: agrupamento duas em duas (1ª+2ª; 3ª+4ª; ...; 9ª+10ª),
agrupamento cinco em cinco (1ª+2ª+3ª+4ª+5ª; 6ª+7ª+8ª+9ª+10ª) e agrupamento total
(1ª+2ª+3ª; ...; 8ª+9ª+10ª).
O erro experimental foi obtido pelo modelo matemático do delineamento blocos ao
acaso: yij = m + ti + bj + eij, com i = 12 tratamentos e, j = 3 repetições, onde: m é uma
constante associada a todas as observações; ti é o efeito do tratamento; bj é o efeito do bloco;
eij é o erro experimental associado à observação yij [1]. A análise de resíduos foi realizada
utilizando os testes de não aditividade de Tukey [9], Lilliefors [8], Bartlett [9] e de
Aleatoriedade [8].
Nos casos de violação dos pressupostos do modelo matemático os dados foram
transformados e novamente submetidos à análise de resíduos. Foram testadas as
transformações: raiz quadrada (Yij)0,5 [10], raiz quarta (Yij)0,25 [1] e suas inversas: (Yij)-0,5 e
(Yij)-0,25 [3, 4]; inversa (Yij)-1 [6]. Nestas transformações, quando havia no banco de dados
valores nulos adicionou-se uma constante (c=0,5) a variável [10]. Foi também testada à
transformação logarítmica (log10 (Yij)) e sua inversa (log10 (Yij))-1, adicionando-se a constante
(c=1) para valores nulos [3, 10]. Todos os testes foram aplicados em nível de 5% de
probabilidade de erro, utilizando planilha eletrônica em Office Excel® elaborada por [6].
3 Resultados e Discussões
Houve 100% de atendimento ao pressuposto da aditividade dos efeitos do modelo para
todas as variáveis analisadas em colheitas individuais e agrupadas (dados não apresentados).
Alta porcentagem de atendimento dessa pressuposição (91,25%) também foi obtida por [5]
em ensaios de competição de cultivares de milho no RS.
Foram identificadas violações as pressuposições de normalidade, homogeneidade e
aleatoriedade dos erros (Tabela 1). A normalidade foi violada em colheitas individuais nas
variáveis comprimento (COM) e largura (LAR) de frutos e no agrupamento de duas colheitas,
na variável LAR (Tabela 1). A partir do agrupamento da produção em duas metades iguais (5
em 5) obteve-se 100% de atendimento a essa pressuposição.
Maiores porcentagens de violação a homogeneidade de variâncias foram verificadas
para uma mesma variável e tipo de colheita em relação a normalidade dos erros (Tabela 1),
não sendo essa a causa da falta de homogeneidade dos erros conforme sugerido por [6].
Somente com o agrupamento de todas as colheitas realizadas (total) foi possível obter 100%
de homogeneidade dos erros para todas as variáveis analisadas.
Praticamente não houve atendimento a pressuposição da aleatoriedade dos erros
independentemente do tipo de colheita e da variável observada (Tabela 1). Esse não era um
resultado esperado, pois em princípio, a aleatoriedade é assegurada pela casualização dos
tratamentos na área experimental [10, 6]. Possivelmente diferenças na fertilidade do solo e na
distribuição da água de irrigação entre e dentro das linhas de cultivo sejam responsáveis pela
não aleatoriedade dos erros.
Apenas foi possível identificar transformação de dados eficiente em contornar a falta
de homogeneidade de variâncias em colheitas individuais (Figura 1). A transformação
logarítmica, raiz quadrada e inversa da raiz quarta foram eficientes nessa situação, porém
mesmo assim, em porcentagem igual ou inferior a 50% dos casos de violação das variáveis
estudadas. Esse resultado concorda com [1, 3 e 4], que também verificaram grande
dificuldade em identificar transformações eficientes em superar a falta de homogeneidade dos
erros.
Tabela 1. Porcentagem de atendimento aos pressupostos do modelo matemático das variáveis
peso (g planta-1), número de frutos (NF), comprimento (COM, mm) e largura de frutos (LAR,
mm) de tomate. Santa Maria, UFSM, 2012.
Tipo de
Colheita
Individuais
Agrupadas 2 em 2
Agrupadas 5 em 5
Total
Individuais
Agrupadas 2 em 2
Agrupadas 5 em 5
Total
Individuais
Agrupadas 2 em 2
Agrupadas 5 em 5
Total
PESO
Normalidade
100%
100%
100%
100%
Homogeneidade
80%
80%
100%
100%
Aleatoriedade
10%
0%
0%
0%
Variáveis
NF
COM
LAR
100%
100%
100%
100%
90%
100%
100%
100%
90%
80%
100%
100%
70%
100%
50%
100%
50%
40%
100%
100%
40%
80%
100%
100%
0%
0%
0%
0%
10%
0%
0%
0%
20%
20%
0%
0%
Log (Y+1)= transformação logarítmica; (Y+0,5) 0,5= raiz quadrada; Y-0,25= inversa da raiz quarta; Sem T= sem
transformação eficiente.
Figura 1. Eficiência percentual da transformação de dados em provocar o atendimento das
variáveis peso, número (NF), comprimento (COM) e largura (LAR) de frutos em colheitas
individuais a pressuposição de homogeneidade de variâncias. Santa Maria, UFSM, 2012.
Não houve transformação eficiente para contornar a falta de normalidade e
aleatoriedade dos erros. Esse resultado concorda com [3], que mesmo após a transformação
Box-Cox em dados de brócolis não obteve a normalidade dos erros. Conforme [6], não há
solução aparente para a falta de aleatoriedade dos erros, uso de testes não paramétricos ou
transformação de dados.
4 Conclusões
Os dados das variáveis de tomateiro apresentam atendimento ao pressuposto da
aditividade
dos
efeitos.
Ocorrem
violações
das
pressuposições
de
normalidade,
homogeneidade e aleatoriedade dos erros nas variáveis de tomateiro. As transformações raiz
quadrada, logarítmica e inversa da raiz quarta são eficientes para superar a heterogeneidade de
variâncias das variáveis de tomateiro.
5 Bibliografia
[1] COUTO, M. R. M. et al. Transformação de dados em experimentos com abobrinha
italiana em ambiente protegido. Ciência Rural. Santa Maria. v. 39, n. 6, p. 1701-1707, 2009.
[2] FILGUEIRA, F. A. R. 2008. Novo manual de Olericultura: Agrotecnologia moderna na
produção e comercialização de hortaliças. Viçosa: UFV. 421p.
[3] LÚCIO, A. D. et al. Excesso de zeros nas variáveis observadas: estudo de caso em
experimento com brócolis. Bragantia. Campinas. v. 69, n.4 , p. 1035-1046, 2010.
[4] LÚCIO, A. D. et al. Transformação box-cox em experimentos com pimentão em ambiente
protegido. Horticultura Brasileira. Brasília. v. 29, p. 38-42, 2011.
[5] MARQUES, D. G. et al. Qualidade dos ensaios de competição de cultivares de milho no
estado do rio grande do sul. Ciência Rural. Santa Maria. v. 30, n. 3, p. 381-385, 2000.
[6] MARTIN, T. N.; STORCK, L. Análise das pressuposições do modelo matemático em
experimentos agrícolas no delineamento blocos ao acaso. In: MARTIN, T. N.; ZIECH, M. F.
(Org.). Sistemas de Produção Agropecuária. Curitiba: UTFPR, 2008. cap. 11, p. 177-196.
[7] SOCIEDADE BRASILEIRA DE CIÊNCIA DO SOLO. Comissão de química e
fertilidade do solo. 2004. Manual de adubação e de calagem para os estados do Rio
Grande do Sul e de Santa Catarina. Porto Alegre: Núcleo Regional Sul - Sociedade
Brasileira de Ciência do Solo. 394p.
[8] SPRENT P; SMEETON NC. 2007. Applied nonparametric statistical methods. Boca
Raton: Chapman & Hall. 530p.
[9] STEEL, R. G. D.; TORRIE, J. H.; DICKEY, D. A. Principles and procedures of
statistics: a biometrical approach. New York: McGraw-Hill, 1997. 666 p.
[10] STORCK, L. et al. Experimentação vegetal. Santa Maria: UFSM, 2011. 200 p.
Download

Análise de resíduos e transformação de dados em variáveis