CENTRO DE CIÊNCIAS EXATAS DEPARTAMENTO DE ESTATÍSTICA Uso de Geoestatística no Estudo Espacial de Dados de Capacidade de Troca de Cátions. RUBSON NATAL RIBEIRO SIBALDELLI Londrina - PR 2012 UNIVERSIDADE ESTADUAL DE LONDRINA CENTRO DE CIÊNCIAS EXATAS DEPARTAMENTO DE ESTATÍSTICA Uso de Geoestatística no Estudo Espacial de Dados de Capacidade de Troca de Cátions. Monografia apresentada como exigência parcial para a obtenção do título de Especialista em Estatística com Ênfase em Estatística Experimental, à comissão julgadora do Curso de Pós-Graduação em Estatística, da Universidade Estadual de Londrina. Orientadora: Dra. Maria Cristina Neves de Oliveira. Aluno: Rubson Natal Ribeiro Sibaldelli. Londrina - PR 2012 RUBSON NATAL RIBEIRO SIBALDELLI Uso de Geoestatística no Estudo Espacial de Dados de Capacidade de Troca de Cátions. Monografia apresentada como exigência parcial para a obtenção do título de Especialista em Estatística com Ênfase em Estatística Experimental, à comissão julgadora do Curso de Pós-Graduação em Estatística, da Universidade Estadual de Londrina. ____________________________________ Profa.Dra. Elizabeth Strapasson - UEL Coordenadora do Curso de Pós-Graduação em Especialização em Estatística com Ênfase em Estatística Experimental COMISSÃO EXAMINADORA ____________________________________ Prof. Dr. Silvano Cesar da Costa Universidade Estadual de Londrina ____________________________________ Profa. Dra. Jacinta Ludovico Zamboti Universidade Estadual de Londrina Orientadora: ____________________________________ Dra. Maria Cristina Neves de Oliveira Embrapa Soja Londrina, 30 de março de 2012. A Deus, com Ele tudo é possível, Ao Papai e a Mamãe, sempre confiáveis e presentes, A Cris, Gabi e Gigi, sempre minhas intercessoras, Ronaldo e July, irmãozinhos queridos, DEDICO. AGRADECIMENTO Agradeço a Deus, Ele sempre está certo, sempre são d’Ele as melhores ideias, e a Ele sempre toda a Glória, Honra, Autoridade e Poder. Agradeço a minha orientadora – Dra. Maria Cristina Neves de Oliveira, pela confiança, pela dedicação em alegria, pela presença, pela maneira sempre cortês de dizer o que devo fazer, pelo desprendimento em dedicar seu tempo a mim. Ao Sr. Olindo Sibaldelli, meu querido Papai, a Sra. Laudicea Ribeiro Sibaldelli, minha querida Mamãe, obrigado pelas orações e o sempre pronto desprendimento em me ajudar, sendo constantemente meu porto seguro. A Cristina Seixas Sibaldelli, minha Esposa, a Gabriela Seixas Sibaldelli e a Giovana Seixas Sibaldelli, minhas filhinhas, pela paciência em me suportar, por permitirem a tranquilidade necessária para os meus estudos. Ao Ronaldo Ribeiro Sibaldelli e a Julimary Ribeiro Sibaldelli, pelo sempre presente incentivo. Aos colegas da Embrapa Solos pela cessão dos dados presentes neste trabalho nas pessoas de Dr. Enio Fraga da Silva, Dr. José Ronaldo de Macedo, Dra. Helga Hissa Manzatto e Dr. Cláudio Luiz Capeche. Aos colegas César de Castro e José Renato Bouças Farias pelo incentivo, pela palavra de ânimo, por sempre tentarem me levar ao próximo degrau. Aos colegas da Embrapa Soja por suportarem minhas chatices, e ainda assim quererem me ajudar. Aos colegas e professores da UEL, turma de Especialização em Estatística – 2011, pela amizade, pelo estudo, incentivos e alegrias. Aos irmãos e amigos da Igreja Cristã Restaurando Vidas pela constante intercessão, obrigado pelas orações. A todos que de forma direta ou indireta contribuíram para a realização deste desafio em minha existência, agradeço. E não sede conformados com este mundo, mas sede transformados pela renovação do vosso entendimento, para que experimenteis qual seja a boa, agradável, e perfeita vontade de Deus. Romanos 12:2 SIBALDELLI, Rubson Natal Ribeiro. Uso de Geoestatística no Estudo Espacial de Dados de Capacidade de Troca de Cátions. 2012. 73p. Monografia – Universidade Estadual de Londrina, Londrina-PR, 2012. RESUMO No Brasil, até a década de 70, os atributos físicos e químicos dos solos eram avaliados em delineamentos experimentais como dados independentes. Após anos de uso deste método descobriu-se que existe uma dependência espaço-temporal natural nos solos, assim, o uso de ferramentas que incluem a posição geográfica das amostras como a geoestatística, tornou-se essencial. No presente estudo, dados de CTC (capacidade de troca de cátions - cmolc dm-3), a qual está relacionada com a disponibilização de nutrientes para as plantas, foram analisados usando ferramentas como semivariograma, o método de interpolação ordinária - krigagem, a validação por Jack-Knifing e os mapas de isolinhas e superfícies tridimensionais. Tais dados foram disponibilizados por pesquisadores da Empresa de Pesquisa Agropecuária do Estado do Rio de Janeiro – Pesagro e da Embrapa Solos e correspondem à amostragens na camada de 0-20 cm de solo da área experimental da Fazenda Angra da Estação Experimental de Campos de Goytacazes. A área onde foi realizado o levantamento encontra-se ao Norte do estado do Rio de Janeiro, à margem esquerda do Rio Paraíba do Sul, com as coordenadas geográficas 21°44’47’’S e 41°18’24’’O. Devido às enchentes do Rio Paraíba do Sul (à esquerda) e das lagoas dos Prazeres e Taquaruçu (à direita) houve deposição de sedimentos na área, o que contribuiu para a grande variação nas propriedades avaliadas no solo. Primeiramente, os dados foram submetidos à vários métodos, como testes de aderência, estatísticas descritivas e gráficas para indicação dos outliers. Verificou-se que a carta de controle, o Box-plot e o teste de normalidade, foram eficientes na indicação dos outliers os quais após retirados tornaram a distribuição dos dados aproximadamente normal. Procedeu-se então a análise dos dados por meio dos métodos geoestatísticos anteriormente citados. Foi retirada a tendência linear e quadrática da CTC permitindo o ajuste do semivariograma ao modelo teórico com dependência espacial bem definida. O modelo selecionado foi o exponencial, com nugget = 0,89 e alcance de 242 m. A krigagem suavizou a região pesquisada detectando à leste valores baixos para a CTC face as várias enchentes das lagoas. A lixiviação causada pelo alagamento e posterior erosão devido ao escorrimento da água, junto com carregamento de solo rico em nutrientes, promoveu esta aglutinação. Conclui-se que: 1) a análise exploratória permite detectar outliers, 2) a CTC apresenta dependência espacial, 3) o melhor modelo foi o exponencial e 4) os mapas de contorno e de superfície indicam regiões com maiores e menores valores da CTC. Portanto o presente estudo forneceu importantes informações sobre o histórico da área bem como identificou os diferentes valores de CTC possibilitando planejar um melhor uso área. Sugere-se nos próximos estudos englobar no método geoestatístico os nutrientes presentes na formação da CTC. Palavras-chave: dependência espacial, amostras georreferenciadas, krigagem ordinária, variabilidade, CTC. SIBALDELLI, Rubson Natal Ribeiro. Uso de Geoestatística no Estudo Espacial de Dados de Capacidade de Troca de Cátions. 2012. 73p. Monografia – Universidade Estadual de Londrina, Londrina-PR, 2012. ABSTRACT In Brazil, until the 70's, the physical and chemical attributes of soils were evaluated in experimental designs as independent data. After using this method for several years it was found that there is space-time dependence natural in the soils, therefore, the use of tools that comprises the geographical position of the samples, such as geostatistics, became essential. In the present study, the CTC (cation exchange capacity - cmolc dm-3) that is related with the availability of nutrients to the plants, were analyzed using tools such as semivariogram, the ordinary interpolation method -kriging, the validation by Jack-Knifing and contour and three-dimensional surface maps. Such data was made available by researchers of the Agricultural Research Enterprise of the State of Rio de Janeiro - Pesagro and Embrapa Soils and corresponds of samplings in the 0-20cm layer of soil of the experimental area of the Angra farm at the Experimental Station of Campos Goytacazes. The area sampled is located in the North of the Rio de Janeiro state, on the left bank of the Paraiba do Sul river having the geographical coordinates of 21 ° 44'47'' S and 41 ° 18'24'' O. Due to flooding of the Paraiba do Sul river (on the left side) and of the lakes of Pleasures and Taquaruçu (on the right side), there was deposition of sediments, which contributed to the large variation in the measured properties of the soil. Initially the data was analyzed through several methods such as compliance, descriptive statistics and graphics to indicate outliers. It was verified that the control chart, the Box-plot and the normality test, were effective in the indication of outliers. After taking out the outliers the data distribution became approximately normal. Analysis of the data using the geostatistical methods initially mentioned was carried out. The linear and quadratic tendency of the CTC was removed allowing the adjustment of the semivariogram to the theoretical model with well defined spatial dependence. The selected model was the exponential with nugget = 0.89 and range of 242 m. The Kriging softened the surveyed area detecting at east low values of CTC due to the flooding of the lakes. The leaching caused by the flooding and subsequent erosion due to the water runoff together with carrying of soil rich in nutrients, promoted this agglutination. We conclude that: 1) exploratory analysis allows the detection of outliers, 2) the CTC has spatial dependence, 3) the best model was the exponential and 4) the contour and surface maps indicate regions with higher and lower values of CTC. Therefore, the present study gave important information about the history of the area and identified different values of CTC possibilitating the planning of a better use of the area. It is suggested that further studies are carried out including in the geostatitical methods the nutrients forming the CTC. Key words: spatial dependence, georeferenced sample, ordinary kriging, variability, CTC. LISTA DE ILUSTRAÇÕES Figura 1 – Mapa do Estado do Rio de Janeiro, com o município de Campos dos Goytacazes em destaque .......................................................................................... 25 Figura 2 – Mapa de amostragem em malha regular, com 273 amostras (a), 254 e 250 amostras (b,c), na presença de outliers, e 240 amostras (d) sem a presença de outliers para a variável CTC (cmolc dm-3), na camada de 0-20 cm do solo ............... 26 Figura 3 – Mapa de distribuição amostral, em malha regular, com 240 amostras, sem a presença de outliers para a variável CTC (cmolc dm-3), na camada de 0-20 cm do solo ....................................................................................................................... 27 Figura 4 – Mapa de distribuição amostral distribuído por quartis, em malha regular, com 240 amostras, sem a presença de outliers para a variável CTC (cmolc dm-3), na camada de 0-20 cm do solo. ..................................................................................... 30 Figura 5 – Esquema representando a estrutura de um semivariograma teórico, adaptado de Rosa Neto (2009). ................................................................................ 32 Figura 6 – Box-Plot para a variável CTC (cmolc dm-3), na camada de 0-20 cm do solo, com 273, 254, 250 e 240 amostras ........................................................ 39 Figura 7 – Gráficos de controle, com intervalo de 3σ , para a variável CTC (cmolc dm3 ), na camada de 0-20 cm do solo, com a) 273, b) 254 c) 250 amostras na presença de outliers e d) 240 amostras sem outliers ................................................................ 41 Figura 8 – Distribuição de frequência sob a Curva Normal para a variável CTC (cmolc dm-3), na camada 0-20 cm do solo, com outliers, com 273 amostras (a), com 254 amostras (b) e, com 250 amostras (c) e sem outliers com 240 amostras (d). .... 42 Figura 9 – Gráfico de correlação para a posição geográfica Norte (a,c) e Leste (b,d), para a variável CTC (cmolc dm-3), na camada de 0-20 cm do solo, com 273 e 254 amostras.................................................................................................................... 43 Figura 10 – Gráfico de correlação para a posição geográfica Norte (a,c) e Leste (b,d), para a variável CTC (cmolc dm-3), na camada de 0-20 cm do solo, com 250 e 240 amostras............................................................................................................. 43 Figura 11 – Semivariâncias com Step de 40 metros, para a variável CTC (cmolc dm3 ), na camada 0-20 cm do solo, sem retirada de tendência. ..................................... 45 Figura 12 – Semivariâncias com Step de 56 metros, para a variável CTC (cmolc dm3 ), na camada 0-20 cm do solo, sem retirada de tendência. ..................................... 45 Figura 13 – Semivariograma experimental ajustado ao Modelo Exponencial, para a variável CTC (cmolc dm-3), com Step de 56 metros. .................................................. 46 Figura 14 – Semivariograma experimental ajustado ao Modelo Gaussiano, para a variável CTC (cmolc dm-3), com Step de 56 metros. .................................................. 48 Figura 15 – Semivariograma experimental ajustado ao Modelo Esférico, para a variável CTC (cmolc dm-3), com Step de 56 metros. .................................................. 48 Figura 16 – Gráficos com a validação para os Modelos estudados, com as variáveis: Correlação Linear (a), Correlação Angular (b), Coeficiente de Correlação (c), Moderada dos Erros (d), Variâncias (e), Índice Jack-Knifing-IJK (f) e RMSE (g) ...... 51 Figura 17 – Mapa da área amostral, antes da Krigagem (a) e após a Krigagem (b), considerando o modelo exponencial, usando sete vizinhos, para a variável CTC (cmolc dm-3), na camada de 0-20 cm do solo ............................................................ 52 Figura 18 – Mapa de superfície tridimensional da área amostral, antes da Krigagem (a) e após a Krigagem (b), considerando o modelo exponencial, usando sete vizinhos, para a variável CTC (cmolc dm-3), na camada de 0-20 cm do solo ............. 53 Figura 19 – Mapa de superfície tridimensional da área amostral escalonado, após a Krigagem, considerando o modelo exponencial, usando sete vizinhos, para a variável CTC (cmolc dm-3), na camada de 0-20 cm do solo. ...................................... 54 LISTA DE TABELAS Tabela 1 – Resultados das estatísticas descritivas para a variável CTC (cmolc dm-3), 0-20cm do solo com e sem outliers. .......................................................................... 38 Tabela 2 – Resultados dos testes de aderência para a variável CTC (cmolc dm-3), 020cm do solo com e sem outliers .............................................................................. 39 Tabela 3 – Estimativas dos parâmetros dos semivariogramas: exponencial, gaussiano e esférico com passo de 56 metros, Índice de Dependência Espacial e Razão de Aleatoriedade ............................................................................................ 44 Tabela 4 – Resultados de análise de regressão para a retirada de tendência linear, para a variável CTC (cmolc dm-3), 0-20cm do solo .................................................... 46 Tabela 5 – Resultados de análise de regressão para a retirada de tendência quadrática, para a variável CTC (cmolc dm-3), 0-20cm do solo.................................. 46 SUMÁRIO 1 INTRODUÇÃO ....................................................................................................... 12 2 REVISÃO DE LITERATURA ................................................................................. 14 3 GEOESTATÍSTICA ................................................................................................ 16 3.1 EXEMPLOS DE DADOS AGRONÔMICOS COM DEPENDÊNCIA ESPACIAL ......................... 17 3.2 VARIÁVEIS REGIONALIZADAS ................................................................................... 17 3.3 SEMIVARIOGRAMA .................................................................................................. 18 3.3.1 Modelos Teóricos de Semivariograma ............................................................. 19 3.3.1.1 Modelo esférico ............................................................................................ 19 3.3.1.2 Modelo exponencial ...................................................................................... 19 3.3.1.3 Modelo gaussiano ........................................................................................ 20 3.3.1.4 Modelo linear ................................................................................................. 20 3.4 COVARIÂNCIA ........................................................................................................ 20 3.5 CORRELOGRAMA.................................................................................................... 21 3.6 KRIGAGEM ................. ........................................................................................... 22 4 MATERIAIS E MÉTODOS ..................................................................................... 24 4.1 CAPACIDADE DE TROCA DE CÁTIONS – CTC ............................................................ 24 4.2 LOCAL EXPERIMENTAL E AMOSTRAGEM DO SOLO ..................................................... 24 4.3 ANÁLISE EXPLORATÓRIA DESCRITIVA E GRÁFICA ..................................................... 27 4.3.1 Cartas de Controle ........................................................................................... 28 4.3.2 Retirando Tendências ...................................................................................... 29 4.3.2.1 Tendências linear e quadrática ..................................................................... 30 4.3.3 Semivariogramas ............................................................................................ 31 4.3.3.1 Parâmetros do semivariograma .................................................................... 32 4.3.3.2 Razão de aleatoriedade e índice de dependência espacial .......................... 33 4.3.4 Método da Validação por Jack-Knifing ............................................................. 34 4.4 SOFTWARES UTILIZADOS ........................................................................................ 36 5 RESULTADOS E DISCUSSÃO ............................................................................. 37 5.1 ANÁLISE ESTATÍSTICA ............................................................................................ 37 5.1.1 Análise Descritica e Exploratória Espacial ....................................................... 37 5.1.1.1 Box-plot ......................................................................................................... 38 5.1.1.2 Testes de aderência ...................................................................................... 39 5.1.1.3 Cartas de controle ......................................................................................... 40 5.1.1.4 Histogramas .................................................................................................. 41 5.1.1.5 Testes de correlação espacial ....................................................................... 42 5.2 ANÁLISE GEOESTATÍSTICA ...................................................................................... 44 5.2.1 Semivariogramas ............................................................................................. 45 5.2.1.1 Retirando tendências..................................................................................... 45 5.2.1.2 Semivariograma exponencial ........................................................................ 46 5.2.1.3 Semivariograma gaussiano ........................................................................... 47 5.2.1.4 Semivariograma esférico ............................................................................... 48 5.2.2 Técnica deValidação de Jack-Knifing ............................................................... 49 5.2.3 Krigagem ......................................................................................................... 52 6 CONCLUSÃO ........................................................................................................ 55 7 REFERÊNCIAS ...................................................................................................... 56 APÊNDICES ............................................................................................................. 63 APÊNDICE A – PLANTA TOPOGRÁFICA PLANIALTIMÉTRICA NA ESCALA 1:1000 ORIGINAL PARA A PESQUISA REALIZADA....................................................................................... 64 APÊNDICE B – DADOS ORIGINAIS DEPOIS DE RETIRADOS OS OUTLIERS MENORES QUE 8,7 E MAIORES QUE 17,32 TOTALIZANDO 240 AMOSTRAS ....................................................... 65 APÊNDICE C – PLANILHA EM EXCEL COM CÁLCULOS DOS AJUSTES AOS MODELOS PARA SEMIVARIOGRAMAS ...................................................................................................... 70 APÊNDICE D – PLANILHA EM EXCEL COM VALORES CALCULADOS PARA VALIDAÇÃO, PARA OS MODELOS EXPONENCIAL, GAUSSIANO E ESFÉRICO, UTILIZANDO JACK-KNIFING................... 71 12 1 INTRODUÇÃO Um dos fatores mais discutidos na pesquisa agronômica é a variabilidade experimental, e uma das áreas da ciência onde este problema ocorre com frequência é a Ciência do Solo. O primeiro ponto é a desuniformidade no solo que ocorre principalmente devido ao desequilíbrio dos macro e micronutrientes. O segundo é como amostrar, detectar, avaliar e analisar esta variabilidade. O terceiro e último ponto é como analisar estatísticamente os resultados de pesquisa oriundos dos solos brasileiros. Esta preocupação com a variabilidade experimental sob a visão estatística ocorreu com Fisher (1935), quando sugeria que os experimentos de campo sob o delineamento de blocos ao acaso fossem aleatorizados os tratamentos e repetidos na área experimental. Essa metodologia foi questionada, por alguns autores e recomendada por outros com algumas modificações, pois não se obtinham resultados satisfatórios dos efeitos dos tratamentos estudados devido a variabilidade experimental e a ausência da posição geográfica das amostras (Vieira et al., 1981; Grondona & Cressie,1991). Após algumas décadas surgiu uma nova metodologia para análise de dados que apresentavam aspectos aleatórios e espaciais, avaliando a dependência espacial denominada de Geoestatística. Esse método é fundamentado na teoria das variáveis regionalizadas (VR), em que as amostras coletadas da variável em estudo são georreferenciadas (Matheron, 1963). Cabe aqui apresentar algumas definições que diferenciam a estatística de Ronald Fisher e a Geoestatística. A Estatística é o ramo da Matemática onde se trata da coleta, análise, interpretação e apresentação de um grupo de dados numéricos, sendo a Geoestatística um ramo da Estatística onde se estuda variáveis regionalizadas (VR), discutida por Matheron (1963). Inicialmente a Geoestatística foi utilizada nas pesquisas na Geologia e Mineração, na década de 1950, na África, com dados de concentração de ouro, do engenheiro de minas Daniel G. Krige e do estatístico H. S. Sichel. No estudo da variabilidade de um solo, além da caracterização do mesmo, podemos também indicar o número e distribuição das amostras a serem realizadas, permitindo mais detalhamento da área e dos seus resultados, conforme 13 Ortiz (2002). A Geoestatística também nos fornece técnicas para confecção de mapas com variáveis georreferenciadas, através do método de interpolação denominado de krigagem. Quanto ao desenvolvimento temporal da Geoestatística, temos que no período até 1968 ela foi empregada para estimar reservas naturais, entre 1968 e 1970 foi desenvolvida a Teoria da Krigagem Universal, em 1972 Matheron formalizou seu uso aplicando a Meteorologia, entre 1972 e 1973 surgiram os princípios da Análise Convexa, com a finalidade de maximizar as reservas recuperáveis de jazidas subterrâneas e em 1974, nasce a teoria das funções de recuperação para reservas, conforme Rosa Neto (2009). Após a análise inicial dos dados, devemos extrair da aparente desordem dos mesmos, mostrados nos mapas da Figura 2, uma imagem de variabilidade dos mesmos. Com uma medida de correlação entre os valores tomados em dois pontos específicos do espaço, por meio do Semivariograma, e após esta análise, interpolar os valores das amostras pelo método da Krigagem ordinária, com expressão deste resultado em forma de mapa de contornos ou de superfície. Esse método viabiliza a predição e os erros padrões da predição para os pontos não amostrados, e não requer o prévio conhecimento da média e será aplicado para avaliar a estrutura da dependência espacial na variável CTC (cmolc dm-3) obtida em solos hidromórficos. Os objetivos principais deste trabalho foram: a) Utilizar a análise exploratória por meio das estatísticas descritivas básicas, gráficos de box-plot, carta de controle, histograma de frequências, na avaliação do padrão espacial dos dados e na presença de valores discrepantes; b) Identificar por meio dos semivariogramas experimentais e ajustados a modelos se os dados de CTC apresentam dependência espacial; c) Aplicar o método da krigagem ordinária para interpolar pontos entre os valores amostrados; d) Selecionar entre os modelos exponencial, esférico e gaussiano aquele que melhor representa a continuidade espacial nos dados da CTC; e) Realizar análise de correlação espacial no sentido Leste e Norte e, f) Realizar mapas de contorno e superfície antes e após a krigagem. 14 2 REVISÃO DE LITERATURA Na década de 1980 no Brasil foram iniciados estudos de dados com dependência espacial e, assim o aparecimento de resultados de pesquisas em diferentes áreas da ciência com o uso do método geoestatístico, com dados georreferenciados e, em ciência do solo este estudo vem se destacando na nutrição e fertilidade do solo e no manejo da cultura. Um dos primeiros trabalhos realizados no Brasil utilizando-se a metodologia com estudo geoestatístico foi o estudo da variabilidade de medidas de taxa de infiltração de água no solo (Vieira et al., 1981). A Geoestatística é usada na Agricultura de Precisão, o que se convencionou chamar o gerenciamento do processo de produção em função da variabilidade. Vários cientistas de solos preocupados com a variação espacial e temporal dos solos, porém sem os avanços na teoria da estatística espacial não haviam conseguido explorar a potencialidade desta no trabalho com os dados quantitativos para facilitar a compreensão desta variabilidade do solo. Grande parte dos erros ao se adubar se dá pelos erros de amostragem do solo, daí a grande importância de se definir corretamente o plano amostral, onde possibilita o uso da Geoestatística, conforme Carvalho et al. (2002). Com o uso das análises estatísticas convencionais propostas na década de 50, nem sempre é possível descrever a variabilidade espacial, pois não se leva em conta a posição geográfica das amostras no campo. Necessita-se então de ferramentas que considerem a localização espacial destas amostras. Conforme Gonçalves et al. (1999) os métodos geoestatísticos vem de encontro justamente a isso, pois possibilitam não apenas modelar a estrutura de dependência espacial, mas também a confeçção de mapas da propriedade estudada na área em questão pela interpolação da krigagem, e avaliar e descrever a correlação espacial que existem entre as propriedades do solo estudado. A variabilidade espacial foi estudada também em relação a micronutrientes no solo (Boro (B), Cobre (Cu), Manganês (Mn) e Zinco (Zn)), em 15 uma área sob pivô central no sul do Mato Grosso por Couto et al. (1999), mostrando que a interpolação por krigagem permite estimar efeitos espaciais impostos pelas práticas de manejo, viabilizando uma aplicação diferencial de corretivos, com uma otimização do uso dos mesmos. Na agricultura foi sugerido por Farias (1999) o uso do método geoestatístico associado aos conhecimentos biológicos e agronômicos para auxiliar no controle de pragas, em especial aos nematóides em algodoeiros, sugere também o uso no programa de agricultura de precisão. 16 3 GEOESTATÍSTICA Após a experiência que houve na África do Sul, protagonizada por Daniel G. Krige e do estatístico H. S. Sichel, o matemático probabilístico Matheron (1963) deu prosseguimento destas pesquisas, formalizando as observações anteriores com uma linguagem rigorosa, intitulando de teoria das variáveis regionalizadas (VR), que também recebeu o nome de geoestatística por ter sido a sua aplicação, inicialmente, direcionada a situações em Geologia e Mineração. A variável aleatória é modelada em geoestatística por (Santana, 2008): Z(s)=T(s)+ W(s)+e(s), onde se admite que a variação de uma variável pode ser expressa pela soma de três componentes: T(s) - Associado a um valor médio constante ou a uma tendência constante; W(s) - Componente aleatório espacialmente correlacionado; e(s) - Ruído aleatório ou erro residual Tem-se que T(s) é uma função determinística que descreve a componente estrutural de Z em s, W(s) é um termo estocástico, que varia localmente e depende espacialmente de T(s) e por fim e(s) é um ruído aleatório não correlacionado, normalmente distribuído, com média zero e variância σ2 N ≅ (0, σ 2 ) . Na prática, não é possível conhecer as funções de distribuição de Z(s) em detalhe, por esse motivo, utilizam-se alguns pressupostos sobre o comportamento das funções. Normalmente, assume-se que as variáveis são descritas por funções conhecidas, do tipo gaussiano e lognormal, distribuições essas consideradas como limite de todas as funções de distribuições contínuas, conforme Santana (2008). Não é possível obter repetições das amostras nos pontos amostrados a partir de métodos extrativos. Assim, não é possível obter a função distribuição no ponto e nem os momentos das variáveis Z(s). 17 Uma forma de solucionar este problema é utilizar os dados de todo o campo para estimar a função de distribuição das variáveis aleatórias, isto é, assumir que o comportamento da função de distribuição local é idêntico ao da função de distribuição global. Essa abordagem nada mais é do que a aplicação da hipótese de estacionariedade. 3.1 EXEMPLOS DE DADOS AGRONÔMICOS COM DEPENDÊNCIA ESPACIAL Nas últimas décadas os resultados de pesquisa, que incluem a dependência espacial têm sido observados em diferentes áreas da ciência. Existe a afirmação que na coleta de dados de uma determinada variável é importante considerar a posição espacial da amostra, seja em uma malha regular ou irregular. No Brasil um dos primeiros trabalhos utilizando geoestatística com dados georreferenciados foi feito por Vieira et al. (1981). Na agricultura existem vários fatores que limitam a obtenção de produções ótimas, um destes fatores é a carência nutricional, outros são as diferentes pragas e doenças que atacam as diferentes culturas (Oliveira, 2003). Uma das pragas que vitimou as lavouras no campo foram os nematóides. Este parasita foi estudado por Farias (1999), na cultura do algodoeiro. O autor utilizou a geoestatística para o conhecimento da distribuição espacial e o monitoramento dos nematóides, permitindo ao pesquisador utilizar a rotação de culturas na redução populacional de nematóides. O pesquisador utilizou uma malha regular para a amostragem de nematóides. 3.2 VARIÁVEIS REGIONALIZADAS A teoria da variável regionalizada (VR) desenvolvida por Matheron (1971) vem sendo aplicada em várias áreas de pesquisa quando as variáveis apresentam dependência espacial. Podemos citar dentre estas áreas: nematologia, entomologia, fertilidade dos solos e agrometeorologia. 18 Uma das características qualitativas da VR é a ligada a sua localização. Onde esta variável assume valores importantes conforme seu campo geométrico, então a escolha do espaço geométrico não é arbitrário e deve ser definido de forma a atender às condições de homogeneidade, o que é difícil na prática. Outra característica importante é a continuidade espacial, onde a VR se manifesta pela tendência de que dois pontos próximos amostrados apresentarem valores mais próximos, quanto mais perto eles estiverem. 3.3 SEMIVARIOGRAMA O semivariograma é uma função matemática definida para apresentar o nível de dependência entre duas variáveis aleatórias regionalizadas locais e, para exemplificar, pode ser o grau de continuidade das propriedades da fertilidade do solo. Elé é usado para modelar dois valores correlacionados no espaço ou no tempo e é pré-requisito para a krigagem. Essa modelagem do semivariograma pode ser ajustada em diferentes estruturas de correlação espacial (Oliveira, 2003). O semivariograma, pode ser definido matematicamente como: 1 γˆ (h) = 2N(h ) 2 N( h ) ∑ [Z(x α ) − Z( x α + h) ] α =1 em que, N(h) é o número de pares de valores medidos Z(xi), Z(xi+h), separados por um vetor h. Resume as nuvens de pontos (z(x), z(x+h)) pela média do quadrado das diferenças entre z(x) e z(x+h), para vários valores de h. 19 3.3.1 Modelos Teóricos de Semivariograma O método de ajuste de semivariogramas teóricos a semivariogramas experimentais é denominado de método das aproximações sucessivas, pois o processo de ajuste finaliza quando as discrepâncias entre os valores experimentais e teóricos forem mínimas, conforme Oliveira (2003). O semivariograma é uma ferramenta que permite descrever quantitativamente, a variação no espaço de um fenômeno regionalizado. É uma ferramenta que possibilita o estudo da dependência espacial entre amostras em um campo experimental e define parâmetros necessários para se realizar a krigagem. Existem tipos diferentes de modelos de semivariogramas, citaremos aqui o modelo esférico, o modelo exponencial e o modelo gaussiano, todos com patarmar, e o modelo linear (sem patamar). Os modelos com patamar têm como parâmetros: o efeito pepita, a variância espacial e o alcance. 3.3.1.1 Modelo esférico O modelo esférico ou modelo de Matheron, apresenta um crescimento rápido na origem, alcança um patamar a uma distância h finita e é representado por: C ( 0 ) + C γ (h) = C ( 0 ) + C [ 3 h 2 a − 1 2 ( ha )3 ], h ≤ a ,h > a em que, C(0) é o efeito pepita, C é o patamar e a é o alcance. 3.3.1.2 Modelo exponencial O modelo exponencial ou modelo de Formery, apresenta um comportamento linear na origem, alcança seu patamar somente assintoticamente e 20 é representado por: [ ] C (0) + C 1 − e− a , h ≤ a γ (h) = C (0) + C ,h>a h Como a curva do gráfico tende assintoticamente ao patamar, o alcance tem significado estritamente analítico. 3.3.1.3 Modelo gaussiano O modelo de Gauss ou Parabólico tem comportamento parabólico na vizinhança da origem e reflete uma grande continuidade da variável estudada e por ser representado por: C (0) + C 1 − e − ( ah )2 , h ≤ a γ (h) = C (0) + C ,h > a Semelhante ao modelo exponencial o alcance, no modelo parabólico, tem significado puramente analítico. 3.3.1.4 Modelo linear No modelo linear não admite-se patamar e pode ser representado por: γ (h) = C (0) + phα . Tem-se que p é a inclinação da reta que representa o semivariograma, sendo utilizados valores de 0 < α < 2, com variância, a priori, infinita. 3.4 COVARIÂNCIA 21 O estimador de covariância é definido como a média dos produtos z(x) z(x+h) 1 N ( h) ∑ [Z ( xα )Z ( xα + h)] N (h) α =1 C ' (h) = é um estimador de covariância não centrada ou ainda o estimador de covariância centrado: C (h) = 1 N ( h) ∑ [Z ( xα )Z ( xα + h)] − m( xα )m( xα + h) N (h) α =1 em que, m( xα ) = 1 N ( h) ∑ Z ( xα ) e N (h) α =1 m( xα + h) = 1 N ( h) ∑ Z ( xα + h) N (h) α =1 são médias aritméticas de todos os pontos localizados em xa e xa+b, , α = 1,..., N(h). 3.5 CORRELOGRAMA O correlograma é definido da seguinte maneira: C (h) ρ (h) = 2 σ ( xα )σ 2 ( xα + h) onde temos que é a forma normalizada da covariância, em que: σ 2 ( xα ) = 1 N ( h) [Z ( xα ) − Z ( xα + h)]2 e ∑ N (h) α =1 σ 2 ( xα + h) = Quando 1 N ( h) 2 ∑ [Z ( xα + h) − m( xα + h)] N (h) α =1 admitimos as hipóteses de estacionariedade dos acréscimos h, a média do quadrado dos desvios e a média dos produtos são estimadores dos segundos momentos, confome Santana (2008). O semivariograma é então expresso por: 1 2 { γ (h) = E [Z ( x) − Z ( x + h)]2 } 22 e a covariância centrada por: C (h) = E [Z ( x) Z ( xα + h)] − E [Z ( x)]E [Z ( x + h)] Para funções aleatórias temos: { C (h) = E Z ( x) Z ( x + h) − E [Z ( x)] 2 } C (h) = E{Z ( x) Z ( x + h)}− m 2 Desenvolvendo os quadrados da função semivariograma, então: γ (h) = 1 2 2 E [Z ( x)] + E[Z ( x + h)] − 2 E [Z ( x) Z ( x + h)] 2 { } Com a admissão de hipótese de estacionariedade do primeiro momento, tem-se: γ (h) = E [Z ( x)]2 − E[Z ( x) Z ( x + h)]. Subtraindo-se m2 nos dois termos, então: γ (h) = E [Z ( x)]2 − m 2 − [E [Z ( x) Z ( x + h)] − m 2 ], então chega-se a relação entre variograma e a covariância: γ (h) = C (0) − C (h) . O correlograma fica: ρ (h) = C (h) C (0) . O semivariograma aumenta à medida que h cresce até uma determida amplitude indicando a falta de correlação entre pares de pontos separados de h, enquanto que a covariância decresce. 3.6 KRIGAGEM No estudo geoestatístico, se deseja o conhecimento de um determinado atributo em estudo fora da região amostrada. A estimação é obtida através de um estimador linear geoestatístico, denominado de krigagem, sendo uma combinação linear de valores amostrados e pesos atribuídos a cada vizinho (Oliveira, 2003). Esta predição pressupõe ausência de erros de medidas e semivariogramas corretos. Sendo que considera-se um peso maior aos valores observados na vizinhança e cada vez que os vizinhos se afastam, um peso menor, nulo ou até negativo. Pode ser obtido através de: 23 n Zˆ ( x0 ) = ∑ λi z ( xi ) , i =1 onde Zˆ ( x0 ) é o preditor para um ponto x0 , n é o número de vizinhos utilizados, λi é o peso atribuído a cada vizinho e z ( xi ) é o valor observado em cada vizinho. Deve-se ter n ∑λ i = 1 , para garantir uma estimativa não viesada. i =1 O método de determinação da vizinhança na estimativa da krigagem é uma mescla entre os métodos da distância constante e dos vizinhos constantes (Vieira, 1996). Este preditor foi utilizado inicialmente por Matheron (1963) e seu nome foi dado em homenagem aos trabalhos de dependência espacial na mineração, realizados por Daniel G. Krige. 24 4 MATERIAIS E MÉTODOS 4.1 CAPACIDADE DE TROCA DE CÁTIONS – CTC A CTC é a quantidade de cátions que um solo é capaz de reter por unidade de peso ou volume. Para fins de química e classificação de solos, os resultados são expressos por peso de solo. Para fertilidade, são comuns ambas as maneiras, devendo-se dar preferência à expressão por volume, conforme Raij (1939). A disponibilidade de nutrientes para as plantas em um determinado solo é permitida através da propriedade de troca de cátions, por esta razão este é um dos mais importantes atributos dos solos. Em grande parte dos solos brasileiros exige-se a aplicação de calcário, conforme Quaggio (2000), desta forma, é essencial a quantificação dos nutrientes presentes nos solos para a determinação da quantidade e tipo de calcário a ser utilizado. Nos vários métodos de cálculo para a calagem sempre é avaliado o histórico dos nutrientes dos solos e a CTC é de grande importância neste processo, pois para sua determinação é necessário analisar o solo e determinar as quantidades de K+, Na+, Ca2+, Mg2+, Al3+ e H+. A CTC do solo é definida como sendo a soma total dos cátions que o solo pode reter na superfície coloidal prontamente disponível à assimilação pelas plantas. Estes cátions adsorvidos são removidos por soluções salinas de amônio, cálcio, bário e soluções de ácidos diluídas e posteriormente determinados por métodos volumétricos, de emissão ou absorção atômica, conforme Embrapa-CNPS (1997). 4.2 LOCAL EXPERIMENTAL E AMOSTRAGEM DO SOLO Os dados utilizados neste trabalho foram coletados no levantamento detalhado de solos da Estação Experimental de Campos de 25 Goytacazes, Fazenda Angra (Capeche et al., 1977), por pesquisadores da Empresa de Pesquisa Agropecuária do Estado do Rio de Janeiro – Pesagro e da Embrapa Solos. O solo teve suas características morfológicas, físicas e químicas apresentadas em Oliveira (2003). A variável resposta a ser utilizada será a Capacidade de Troca de Cátions – CTC (cmolc dm-3), na camada de 0-20 cm. A área onde foi realizado o levantamento encontra-se ao Norte do estado do Rio de Janeiro, à margem esquerda do Rio Paraíba do Sul, no município de Campos dos Goytacazes (Figura 1), com as coordenadas geográficas 21°44’47’’S e 41°18’24’’ O. Devido às enchentes do Rio Paraíba do Sul, à esquerda da fazenda e à direita pelas enchentes das Lagoas dos Prazeres e Taquaruçu, houve a deposição de sedimentos, que contribuiu para a grande variação nas propriedades avaliadas no solo associadas às adubações realizadas na área experimental (Oliveira, 2003). Este levantamento faz parte do Projeto “Planejamento de uso das terras da Estação Experimental de Campos/PESAGRO-RIO, e subsídios ao manejo de irrigação”. O principal objetivo deste levantamento foi o planejamento adequado deste novo uso para esta área, bem como também coletar e analisar amostras para a formação de um banco de dados, tendo a representação do histórico de nutrientes (macro e micronutrientes) de uma área com monocultivo de cana-de-açúcar por cem (100) anos. Desta forma os pesquisadores poderão definir de uma maneira mais clara e objetiva o uso para esta área. Figura 1: Mapa do Estado do Rio de Janeiro, com o município de Campos dos Goytacazes em destaque. 26 Neste trabalho foi analisado e considerado apenas a variável CTC (cmolc dm-3). A amostragem do solo foi realizada com trado holandês, em uma malha regular, distando 900 metros para cada coordenada geográfica: norte e leste. Esta malha foi idealizada com espaçamento de 50 metros, totalizando 273 amostras (Figura 2-a), foram consideradas 254 amostras em um primeiro momento (Figura 2b), em um segundo momento considerou-se 250 amostras (Figura 2-c) e após algumas análises reduziu-se este número a 240 amostras (Figura 2-d). As amostras de solo coletadas de forma regionalizadas possibilitaram a análise espacial da direção da variabilidade da variável CTC, permitindo mapear esta variabilidade. A área considerada neste estudo foi cultivada por cem anos com a cultura da cana-de-açúcar e este processo de monocultura foi interrompido e está sendo substituído por cultivo de culturas anuais. 6000 6000 A 5800 5600 5600 5400 5400 LESTE LESTE 5800 5200 5200 5000 5000 4800 4800 4600 4800 5000 5200 5400 5600 5800 6000 B 4600 4800 6200 5000 5200 NORTE C 5600 6000 6200 D 5400 5400 LESTE LESTE 5800 5800 5600 5200 5200 5000 5000 4800 4800 4600 4800 5600 NORTE 6000 5800 5400 5000 5200 5400 5600 NORTE 5800 6000 6200 4600 4800 5000 5200 5400 5600 5800 6000 6200 NORTE Figura 2: Mapa de amostragem em malha regular, com 273 amostras (a), 254 e 250 amostras (b,c), na presença de outliers, e 240 amostras (d) sem a presença de outliers para a variável CTC (cmolc dm-3), na camada de 0-20 cm do solo. Os valores da CTC (cmolc dm-3), com sua distribuição pela área, 27 são mostrados na Figura 3, com um escalonamento de 20% para cada série de dados. 5700 5600 5500 5400 LESTE 5300 5200 5100 5000 4900 4800 5000 5100 5200 5300 5400 5500 5600 5700 5800 5900 6000 NORTE 8.72 to 11.62 11.62 to 12.80 12.80 to 13.43 13.43 to 14.61 14.61 to 17.32 Figura 3: Mapa de distribuição amostral, em malha regular, com 240 amostras, sem a presença de outliers para a variável CTC (cmolc dm-3), na camada de 0-20 cm do solo. 4.3 Análise Exploratória Descritiva e Gráfica O conhecimento detalhado de um banco de dados de pesquisa é uma das fases mais importantes em todas as áreas da ciência. Sejam dados provenientes de uma pesquisa básica, de um levantamento amostral, de um delineamento experimental clássico ou de delineamento sistematizado 28 (georreferenciado). Nesta fase é imprescindível conhecer entre os métodos exploratórios aquele que dará informações com precisão sobre um conjunto de dados para que o fenômeno em estudo não tenha uma resposta equivocada. A análise exploratória utiliza-se de métodos gráficos e quantitativos que permite verificar se as hipóteses planejadas no experimento são válidas. Dentre os procedimentos utilizados para elaborar um diagnóstico exploratório existem as medidas de posição em que são calculadas a média, mediana, moda e as medidas de dispersão como a variância, desvio padrão, erro padrão, amplitude e coeficiente de variação. Além destas estatísticas podem ainda serem utilizados os coeficientes de assimetria e curtose e análise de regressão como métodos exploratórios. Os diferentes tipos de gráficos lineares, tridimensionais, o box-plot, as cartas de controle, gráfico de ramos e folhas, histograma de frequências e scatterplot dos resíduos podem também avaliar a presença de dados discrepantes também chamados de outliers. Muitas são as literaturas onde é mencionada a necessidade de utilizar antes de análise estatística confirmatória a aplicação da análise exploratória (Hoaglin et al., 1992; Oliveira et al., 1998) 4.3.1 Cartas de Controle As cartas de controle são gráficos utilizados com frequência na indústria para avaliar o controle de qualidade na produção de peças. Permite obter resultados com um pouco mais de rigor estatístico podendo utilizar seus limites de controle no intervalo de 3σ , em que σ é o desvio padrão populacional do conjunto de dados. Esses gráficos possuem três linhas paralelas, a central que representa o valor médio da característica da qualidade, a superior que representa o limite superior do controle (LSC) e a inferior, que representa o limite inferior de controle (LIC). Os pontos representam as amostras tomadas em momentos diferentes, conforme (Vieira, 1999; Oliveira et al., 2008). 29 4.3.2 Retirando Tendências Várias são as etapas para identificar se realmente um banco de dados apresenta no semivariograma uma estrutura de dependência espacial (Figura 4) e, se além deste fato, a mesma é bem definida com patamar estável e sem tendência de qualquer grau. Pesquisadores da Ciência do Solo conscientes que os dados referentes aos nutrientes do solo não são independentes utilizam-se de vários tipos de gráficos e métodos estatísticos para verificar as tendências (Vieira et al., 2002; Carvalho et al. 2002; Vidal Vasquez et al., 2009). Uma das formas é elaborar gráficos pós-plot no qual é possível verificar as diferentes classes com mesmo símbolos indicando subregiões para alguma direção (Ortiz, 2002). De acordo com a autora não devem ter padrões no gráfico. Os valores da CTC (cmolc dm-3), com sua distribuição pela área por quartis, são mostrados na Figura 4. Os métodos de regressão linear e quadrático ou de maior grau permitem, por meio dos coeficientes de determinação, avaliar (Vidal Vasquez et al., 2009) se existem tendências. 30 5700 5600 5500 5400 LESTE 5300 5200 5100 5000 4900 4800 5000 5100 5200 5300 5400 5500 5600 5700 5800 5900 6000 NORTE QUARTIS 8.7214 to 11.9421 11.9421 to 13.0823 13.0823 to 14.1463 14.1463 to 17.3200 Figura 4: Mapa de distribuição amostral distribuído por quartis, em malha regular, com 240 amostras, sem a presença de outliers para a variável CTC (cmolc dm-3), na camada de 0-20 cm do solo. 4.3.2.1 Tendências linear e quadrática A existência de violação da hipótese intrínseca (patamar definido) representa um campo em que o valor médio depende da posição espacial (Vieira et al., 2010). O autor afirma de uma superfície que a forma mais simples de remover a tendência tridimensional é pelo método dos quadrados mínimos e subtraindo os valores a partir do modelo original. Seguem abaixo as formas linear e quadráticas apresentadas pelo autor e que serão utilizadas neste trabalho. 31 a) Tendência Linear Z * ( x, y ) = A 0 + A 1 X + A 2 Y em que, Z * ( x, y) é a superfície de tendência estimada; X e Y são as coordenadas de posição; A 0 , A 1 e A 2 são os parâmetros de regressão determinado pelo método dos quadrados mínimos. b) Tendência Quadrática Z * ( x, y ) = A 0 + A 1 X + A 2 Y + A 3 X 2 + A 4 XY + A 5 Y 2 em que, Z * (x, y) é a superfície de tendência estimada; X e Y são as coordenadas de posição; A 0 , A1 , A 2 , A 3 , A 4 e A 5 são os parâmetros de regressão determinado pelo método dos quadrados mínimos . 4.3.3 Semivariogramas Após a retirada de tendência, uma das ferramentas que permite identificar se um conjunto de dados apresenta dependência espacial é o semivariograma e a função de semivariância proposta por Journel & Huijbregts (1978) é a esperança matemática da variável aleatória [(Z(x + h) − Z(x)] , representada pela expressão abaixo: γ ( x, h) = { 1 E [(Z( x + h) − Z( x) ]2 2 } E as estimativas dos parâmetros são obtidas na seguinte expressão: 1 γˆ (h) = 2N(h ) 2 N( h ) ∑ [Z(x α ) − Z( x α + h) ] α =1 A análise da dependência espacial é baseada na suposição que medidas separadas por distâncias pequenas são mais semelhantes umas às 32 outras, que aquelas separadas por distâncias maiores e a representação desta dependência encontra-se na Figura 5 (Bolfe et al., 2007). γ(h) Dispersão C Nugget (Pepita) C0 GEO ESTATÍSTICA C + C0 Sill (Patamar) 0 Figura 5: a Range (Alcance) h Esquema representando a estrutura de um semivariograma teórico, adaptado de Rosa Neto (2009). O estudo da dependência espacial obtida pela análise da função de covariância espacial (semivariograma) não constitui o objetivo final da análise espacial. Na realidade é necessário estimar os valores das variáveis em locais não amostrados visando o conhecimento da distribuição espacial de certa variável em estudo. Desta forma, a análise da estrutura espacial deve ser vista como um passo fundamental, mas não final que, precede as técnicas de estimação (interpolação), de qualquer valor em qualquer posição da área em estudo, sem tendência e com variância mínima. Os métodos de Krigagem são métodos de interpolação que procuram minimizar o erro de estimação e este erro é nulo. 4.3.3.1 Parâmetros do Semivariograma Na Figura 5 pode-se avaliar cada um dos parâmetros do semivariograma. O Nugget ou efeito Pepita (C0) é a variabilidade não explicada, então conclui-se que quanto menor seu valor, melhor o modelo correspondente. O alcance é de fundamental importância para a interpretação dos semivariogramas. Ele indica a distância até onde os pontos amostrais estão correlacionados entre si. Com o conhecimento do alcance da dependência espacial, define-se o raio de amostragem, e, para garantir em uma amostragem futura nas mesmas condições 33 do experimento. Esse parâmetro indica a zona de influência de uma amostra, ou seja, a distância máxima até onde uma amostra (ou seu valor) possui relação de dependência espacial com seu próximo (Silva et al., 2001), depende do tamanho da área amostrada e da escala de observação realizada, sendo maior quanto maior for o intervalo entre as medidas (Vieira et al., 1983; Souza et al., 1997; Vieira, 1997; Bolfe et al., 2007). O último autor enfatiza que quanto maior for a diferença entre o Nugget e o patamar (Sill) do semivariograma, maior será a continuidade do fenômeno e menor a variância da estimativa, ou seja, maior a confiabilidade que se pode ter na estimativa gerada (Figura 5). 4.3.3.2 Razão de Aleatoriedade e Indice de Dependência Espacial Avalia-se a força da dependência espacial através da Razão de Aleatoriedade (RA): . A aleatoriedade pode ser classificada como Forte, Moderada ou Fraca, segundo Cambardella et al. (1994), citado por Miritz et al. (2009). Em uma Aleatoriedade Baixa o Nugget situa-se abaixo ou igual a 25% da proporção, enquanto que na Média, maior que 25% e menor ou igual 75%, já em uma Aleatoriedade Alta, tem-se RA maior que 75%. Assim como avalia-se a aleatoriedade pela RA, avalia-se o Índice de Dependência Espacial (IDE), pela expressão abaixo: 34 4.3.4 Método da Validação por Jack-Knifing A técnica de Jack-knifing é um método de validação que verifica se um modelo de semivariograma descreve adequadamente a dependência espacial (Vieira et al., 2010). A seleção do melhor modelo, que define a dependência espacial, não se resume apenas em ter um modelo com menor valor de nugget, deve estar associado aos parâmetros obtidos com à aplicação do método de jack-knifing que medirá a qualidade de ajuste (Carvalho et al., 2002). De acordo com Vieira, et al. (2010), com o valor mensurado e outro obtido pelo método da krigagem, considerando uma série de tamanhos de vizinhos são gerados valores estimados e variâncias estimadas. O autor utilizou seis parâmetros diferentes para usar como critério para julgar a performance do modelo do semivariograma os quais também serão avaliados neste trabalho. Considerando as N medidas Z( x i ) e as N medidas estimadas pelo procedimento de Jack-knifing Z * ( x i ) realiza-se a regressão linear 1 a 1 e a forma descrita será: a) Análise de Regressão Z * ( x i ) = a + b Z( x i ) em que, a é o intercepto, b é o coeficiente angular R2 é o coeficiente de determinação entre Z * ( x i ) e Z( x i ) As estimativas dos parâmetros da regressão linear entre dados pareados, os coeficientes linear e angular estimados devem ser iguais a (a=0, b=1) respectivamente e o valor do coeficiente de determinação igual a um (r2=1) (Vieira et al., 2010). b) Erro Reduzido 35 Outro parâmetro do Jack-Knifing considerando os valores estimados pela krigagem [ Z * ( x i ) ] pode-se obter também a estimativa da variância σ k2 ( x i ) que corresponde a incerteza do processo de estimação. Desta forma pode-se definir o Erro Médio como: RE ( XI ) = [z * ( XI ) - z ( XI ) ] σk (x i ) A divisão pela raiz quadrada da estimativa da variância produz o Erro Reduzido RE ( XI ) , para ser adimensional que é uma situação conveniente para comparação entre diferentes variáveis. O erro médio absoluto e o erro reduzido devem ser zero e a variância do erro absoluto seja mínima e a variância do erro reduzido igual um. Com estas estimativas é possível construir mapas de isolinhas ou tridimensionais para detectar e interpretar a variabilidade espacial (Carvalho et al., 2002; Vieira et al., 2010). O pré-requisito da condição não viesada da estimativa da krigagem e da variância mínima são dadas pelas seguintes expressões: R E = E{RE ( xi) } = { E(Z *( Xi) - Z(xi)) VAR (R E ) = E{RE ( xi) } = { σ k ( xi) }=0 E(Z *( Xi) - Z(xi)) σ k ( X 0) }2 = 1 Conforme Vieira et al. (2010) estas propriedades são muito valiosas como ferramentas de validação dos procedimentos geoestatísticos. O ideal como ponto de referência é que estas propriedades sejam fixadas em 0 (zero) e 1 (um). c) Raiz Quadrada da Soma de Quadrado do Erro Um novo parâmetro do Jack-Knifing é de extrema importância nesta validação e pode ser escrita conforme a expressão abaixo: RMSE = 1 N ∑ [Z * (xi) − Z (xi) ] 2 36 Conforme o autor existe desvantagem neste tipo de erro porque não tem padrão para ser comparado. Portanto, os melhores resultados da técnica de Jack-knifing seriam obtidos quando o RMSE é mínimo (Vieira et al., 2010). 4.4 SOFTWARES UTILIZADOS Para a execução deste trabalho foram utilizados para a análise gráfica e estatística os seguintes programas: Statsoft, inc. (2004), Statistica (Data Analysis Software System), version 7. www.statsoft.com ; Surfer version 9.9.785 – mar 26.2010, surface mapping system, www.goldensoftware.com ; GEOEST – Software para cálculos de geoestatística, Sidney Rosa Vieira, IAC, Campinas, SP. 37 5 RESULTADOS E DISCUSSÃO 5.1 ANÁLISE ESTATÍSTICA Anterior a qualquer método estatístico ou geoestatístico é essencial que se conheça a distribuição espacial e a variabilidade dos dados. É por meio da análise exploratória descritiva e gráfica que vem de encontro a esta necessidade, nos auxiliando grandemente nestes estudos (Oliveira et al., 1998). 5.1.1 Análise Descritiva e Exploratória Espacial As estatísticas descritivas para variável CTC (cmolc dm-3), na presença e ausência de outliers, indicaram valores para a média e mediana bem próximos com leve assimetria e curtose aproximando-se de zero. Foram utilizados os valores do conjunto de dados com 240 amostras após a retirada de outliers (Tabela 1). Houve redução na variância após este procedimento e em consequência redução no coeficiente de variação. Esse primeiro passo da análise exploratória permitirá a obtenção de estimativas com confiabilidade para a sequência deste estudo. Vários autores vão além destas estatísticas da Tabela 1 salientando que outros métodos estatisticos como os testes de normalidade, os gráficos tridimensionais, os gráficos h-scatterplot nos eixos x e y, os de box-plot, auxiliam na tomada de decisão sugerindo também, o uso de técnicas robustas para avaliar os dados. Afirmam que a presença de dados discrepantes podem mascarar os resultados de pesquisa. Alertam também que os outliers podem ser o objetivo principal da pesquisa (Bustos, 1988; Hoaglin et al., 1992; Libardi et al., 1996). Foram utilizados os gráficos de Box-Plot e as Cartas de Controle (Oliveira et al., 2008), para visualizar a presença ou ausência de outliers em vários passos nos próximos itens. Além destes gráficos também foram aplicados os testes de 38 normalidade de Kolmogorov-Smirnov (Campos, 1983) e Shapiro & Wilk (1965). Tabela 1: Resultados das estatísticas descritivas para a variável CTC (cmolc dm-3), 0-20cm do solo com e sem outliers. Com Outliers Com Outliers Com Outliers Sem Outliers Estatísticas Nº Observações 273 254 250 240 Média 12,86 12,98 13,02 13,10 Mediana 12,57 13,06 13,07 13,08 Mínimo 5,55 7,88 8,24 8,72 Máximo 21,30 17,82 17,64 17,32 Amplitude Total 15,75 9,94 9,40 8,60 Variância 6,64 4,19 3,85 3,14 Coeficiente de Assimetria -0,24 -0,14 -0,09 0,06 Coeficiente de Curtose 0,81 0,10 0,03 -0,13 Desvio Padrão 2,58 2,05 1,96 1,77 Coeficiente de Variação (%) 20,06 15,79 15,05 13,51 5.1.1.1 Box-plot A presença de outliers nos dados remetem a resultados indesejáveis e, além disso, não atendem as pressuposições da análise de variância, conforme Sibaldelli et al. (2005). Na Figura 6, observou-se um grande número de outliers, e foram retirados 19 amostras e após nova análise, decidiu-se pela retirada de mais quatro amostras, estabelecendo-se com um conjunto de dados formado por 250 amostras, sem a presença de outliers pela análise do box-plot. A maioria das amostras retiradas estavam localizadas na região, em que na época das enchentes, ficava alagada lixiviando nutrientes importantes do solo (Figura 2 a, b, c e d). Embora no box-plot com 250 amostras não indicasse mais a presença de outliers (Figura 6), pelo teste de normalidade de Shapiro & Wilk (1965) e pelas cartas de controle (Oliveira et al., 2008) os resultados apresentam-se mais contundentes indicando a ausência de normalidade devido a presença de outliers, portanto, houve a necessidade de retirar mais dez pontos totalizando desta forma, 240 pontos (Figuras 2 d e Figura 6). 39 22 20 18 16 14 12 10 8 CTC_240 CTC_250 CTC_273 4 CTC_254 6 273 254 250 240 Média 25%-75% Espaço Sem Outliers= Amostras= 7,8814 - 17,8217; Amostras= 8,2391 - 17,6419; Amostras= 8,2391 - 17,6419; Amostras= 8,7214 - 17,3198. Outliers Extremes Figura 6: Box-Plot para a variável CTC (cmolc dm-3), na camada de 0-20 cm do solo, com 273, 254, 250 e 240 amostras. 5.1.1.2 Testes de aderência Os testes de aderência foram realizados para os quatro conjuntos de dados, sendo que a hipótese nula de normalidade para o teste de KolmogorovSmirnov (Campos, 1983) para todos os tamanhos de amostras para a variável CTC (cmolc dm-3) foi aceita, ao contrário do teste de Shapiro & Wilk (1965), que só apresentou normalidade dos dados com a amostra com 240 pontos (Tabela 2). Tabela 2: Resultados dos testes de aderência para a variável CTC (cmolc dm-3), 020cm do solo com e sem outliers. Métodos Com Outliers Com Outlier Sem Outliers Sem Outliers 273 amostras 254 amostras 250 amostras 240 amostras VT Prob VT Prob VT Prob VT Prob KS d=0,0704 p<0,15000 d=0,0552 p>.20 d=0,0504 p>.20 d=0,0507 n.s. SW W=0,9782 p=0,00035 W=0,9868 p=0,0192 W=0,9883 p=0,040 W=0,9916 p=0,187 KS= Kolmogorov-Smirnov; SW= Shapiro&Wilk; VT= Valor do Teste; Prob= Probabilidade 40 No conjunto de dados com 240 amostras os resultados dos testes de normalidade de Kolmogorov-Smirnov (Campos, 1983) e de Shapiro-Wilk (1965) a normalidade dos dados foi assegurada. Alguns autores afirmam que, embora a normalidade dos dados não seja exigência do método geoestatístico possibilitando distribuições de frequências com ausência de caudas pesadas ou alongadas, os coeficientes de assimetria devem se aproximar de zero e semivariogramas com patamares bem definidos como da Figura 4 (Hoaglin et al., 1992; Cressie, 1991; Carvalho & Vieira, 2001). 5.1.1.3 Cartas de controle Os Gráficos de Controle obtidos para os quatro tamanhos de amostras estão apresentados nas Figuras 7 a, b, c e d e indicou a presença de outliers nas primeiras amostras e sem a presença de outliers no agrupamento com 240 amostras. Nas cartas de controle foram utilizados como limites superiores e inferiores, o valor de 3σ , acima e abaixo do valor médio (Figura 7). Nota-se um rigor maior nos gráficos de controle do que nas análises com o Box-Plot. O uso dos gráficos de controle e do Box-Plot, reforça a necessidade de análise cuidadosa dos dados durante o processo da análise descritiva e análise exploratória espacial (Oliveira et al., 1998). Embora no Box-Plot indique que pode-se usar um agrupamento com 250 amostras, optou-se pelos resultados das cartas de controle e os testes de normalidade, definindo o agrupamento de dados a ser utilizado nas análises geoestatísticas com 240 amostras. Este conjunto possui valores de assimetria e curtose melhores que os demais conjuntos (Tabela 1). 41 22 20 22 Média = 12,858 Sigma = 1,7594 A 18,136 18 16 10 12,982 12 10 8 7,5794 6 8,4859 8 6 4 50 100 150 200 4 250 50 100 150 200 250 22 C Média = 13,023 Sigma = 1,4557 Média = 13,101 Sigma = 1,5558 20 D 18 17,390 16 18 17,768 16 14 13,023 12 10 14 13,101 12 10 8,6561 8 6 4 17,477 14 12,858 12 20 18 16 14 22 Média = 12,982 Sigma = 1,4986 B 20 8,4340 8 6 50 100 150 200 250 4 50 100 150 200 Figura 7: Gráficos de controle, com intervalo de 3σ , para a variável CTC (cmolc dm3 ), na camada de 0-20 cm do solo, com a) 273, b) 254 c) 250 amostras na presença de outliers e d) 240 amostras sem outliers. 5.1.1.4 Histogramas Os histogramas sob a curva normal para a variável CTC (cmolc dm3 ), com e sem outliers para os quatro tamanhos de amostra indicaram a presença de assimetria e curtose. Retirando os outliers, foram obtidos diferentes ajustes (Figura 8). 42 140 70 A B 120 60 100 50 80 40 60 30 40 20 20 10 0 2 4 6 8 10 12 14 16 18 20 22 140 0 6 8 9 10 11 12 13 14 15 16 17 18 19 17 18 19 70 C 120 60 100 50 80 40 60 30 40 20 20 10 0 7 6 8 10 12 14 16 18 0 D 7 8 9 10 11 12 13 14 15 16 Figura 8: Distribuição de frequência sob a Curva Normal para a variável CTC (cmolc dm-3), na camada 0-20 cm do solo, com outliers, com 273 amostras (a), com 254 amostras (b) e, com 250 amostras (c) e sem outliers com 240 amostras (d). 5.1.1.5 Testes de correlação espacial As análises descritivas até o presente momento, fornecem informações do comportamento da dispersão dos dados da CTC, porém não levam em conta sua posição geográfica. Nas Figuras 9 e 10, foram obtidas baixa tendência linear negativa em relação a direção Norte e uma baixa tendência positiva em relação a direção Leste, para todos os conjuntos de dados, tanto com outliers com 273, 254, 250 amostras, bem como sem outliers, no agrupamento com 240 amostras. Os valores da correlação linear indicam que cada vez que retiramos os outliers do conjunto de dados a inclinação da reta aumenta, tanto para valores negativos em relação a direção norte, como para valores positivos em relação a direção leste. Com 273 amostras e na direção norte, o valor de r = -0,1185 enquanto que no conjunto com 240 amostras o valor de r = -0,2972. Já em relação a direção leste, no conjunto com 273 amostras o valor de r = 0,0646, enquanto para 43 o conjunto com 240 amostras o valor de r = 0,1087 (Figuras 9 e 10). 220 22 A r = - 0,1181 200 273 amostras r = 0,0646 273 amostras 18 16 -3 -3 CTC (cmolc dm ) 160 CTC (cmolc dm ) B 20 180 140 120 100 14 12 10 80 8 60 6 40 4800 5000 5200 5400 5600 5800 6000 4 4600 6200 4800 5000 20 5400 5600 5800 6000 5800 6000 20 C r = - 0,2137 D 254 amostras 18 16 16 r = 0,0682 254 amostras -3 CTC (cmolc dm ) 18 -3 CTC (cmolc dm ) 5200 Leste Nor te 14 12 14 12 10 10 8 8 6 4800 5000 5200 5400 5600 5800 6000 6 4600 6200 4800 5000 Norte 5200 5400 5600 Leste Figura 9: Gráfico de correlação para a posição geográfica Norte (a,c) e Leste (b,d), para a variável CTC (cmolc dm-3), na camada de 0-20 cm do solo, com 273 e 254 amostras. 20 20 r = - 0,2363 250 amostras B 18 18 16 16 CTC (cmolc dm-3) CTC (cmolc dm-3) A 14 12 12 10 8 8 5000 5200 5400 5600 5800 6000 6 4600 6200 4800 5000 Norte 18 C r = -0,2972 5400 5600 5800 6000 18 240 amostras 17 16 16 15 15 14 13 12 11 D r = 0,1087 240 amostras 14 13 12 11 10 10 9 9 8 4800 5200 Leste CTC (cmolc dm-3) -3 CTC (cmolc dm ) 17 250 amostras 14 10 6 4800 r = 0,1004 5000 5200 5400 5600 Norte 5800 6000 6200 8 4600 4800 5000 5200 5400 5600 5800 Leste Figura 10: Gráfico de correlação para a posição geográfica Norte (a,c) e Leste (b,d), para a variável CTC (cmolc dm-3), na camada de 0-20 cm do solo, com 250 e 240 amostras. 44 5.2 ANÁLISE GEOESTATÍSTICA Considerando os resultados apresentados nas Figuras 9 e 10 observou-se uma leve correlação espacial entre a variável estudada (CTC cmolc dm-3) e as direções norte e leste, desta forma, foi necessário confirmar por uma ferramenta geoestatística a existência ou não de um padrão espacial para esta variável. As estimativas dos parâmetros dos semivariogramas exponencial, gaussiano e esférico, como o Nugget (Efeito Pepita), o Sill (Patamar) e o Range (Alcance) são encontrados na Tabela 3 e Figuras 13, 14 e 15. Os três modelos de semivariogramas ajustados aos dados da CTC apresentaram dependência espacial bem definida. O menor valor de nugget foi obtido com o modelo exponencial (0,89) e também o maior índice de dependência espacial. Comparando os valores do patamar dos três modelos foi identificado que o maior patamar foi obtido para o modelo exponencial. Existem autores que na seleção de modelos de semivariogramas preconizam que o melhor modelo é aquele que tem menor variância nugget (Tabela 3) mas, existem opiniões divergentes de que se deva selecionar modelos com variância mínima, resíduos nulos, correlação próxima de r =1 (Vieira et al., 1983; Ortiz, 2002), entre outras estatísticas obtidas pelo método de Jack-Knifing. Bolfe et al., (2007), enfatiza que quanto maior for a diferença entre o Nugget e o Patamar (Sill), maior será a continuidade do fenômeno e menor a variância da estimativa, ou seja, maior a confiabilidade que se pode ter na estimativa gerada. Tabela 3. Estimativas dos parâmetros dos semivariogramas: exponencial, gaussiano e esférico com passo de 56 metros, Índice de Dependência Espacial e Razão de Aleatoriedade. Nugget Sill Exponencial 0,89 1,87 2,76 242 68% 32% 96% Moderada Gaussiano 1,61 1,13 2,74 213 41% 59% 98% Moderada Esférico 1,36 1,37 2,73 244 50% 50% 98% Moderada Nugget+Sill Range IDE RA R2 Modelo 2 Dependência IDE= Índice de Dependência Espacial; RA= Razão de Aleatoriedade; R = Ajuste do modelo. 45 5.2.1 Semivariogramas 5.2.1.1 Retirando tendências Após a determinação da semivariância em conjunto com a definição do tamanho do passo a ser dado (Step), observou-se que os dados apresentam tendência, não apresentando um patamar estável, então deve-se retirar essa tendência, tanto para Step com tamanho de 40 metros (Figura 11) e de 56 metros (Figura 12). Semivariâncias 3,50 3,00 2,50 2,00 1,50 1,00 0,50 0,00 0 100 200 300 400 Distâncias (m) 500 600 Figura 11: Semivariâncias com Step de 40 metros, para a variável CTC (cmolc dm3 ), na camada 0-20 cm do solo, sem retirada de tendência. Semivariâncias 3,50 3,00 2,50 2,00 1,50 1,00 0,50 0,00 0 100 200 300 400 Distâncias (m) 500 600 Figura 12: Semivariâncias com Step de 56 metros, para a variável CTC (cmolc dm3 ), na camada 0-20 cm do solo, sem retirada de tendência. 46 Ao estabelecer que é necessária a retirada de tendência, o próximo passo é efetuar a sua retirada através da análise de regressão linear e quadrática. Tabela 4: Resultados de análise de regressão para a retirada de tendência linear, para a variável CTC (cmolc dm-3), 0-20cm do solo. Fonte de Graus de Soma dos Variação Liberdade Quadrados Regressão 2 73,77 Desvio 237 675,9 Total 239 749,7 Coeficiente de Determinação do Ajuste = 9,84% Coeficiente de Correlação = 31,37% Quadrado Médio 337,9 2,852 Teste F 118,5 Estabeleceu-se o Step de 56 metros e foi retirada a tendência linear, apresentando um coeficiente de determinação do ajuste de 9,84% (Tabela 4), enquanto que a retirada de tendência quadrática apresentou o coeficiente de determinação do ajuste com 15,46% (Tabela 5). Escolheu-se então o de maior coeficiente de determinação do ajuste para a sequência do trabalho, neste caso, foi escolhido a retirada de tendência quadrática. Tabela 5: Resultados de análise de regressão para a retirada de tendência quadrática, para a variável CTC (cmolc dm-3), 0-20cm do solo. Fonte de Graus de Soma dos Variação Liberdade Quadrados Regressão 5 115,9 Desvio 234 633,7 Total 239 749,7 Coeficiente de Determinação do Ajuste = 15,46% Coeficiente de Correlação = 39,32% Quadrado Médio 126,7 2,708 Teste F 46,8 5.2.1.2 Semivariograma Exponencial A análise dos semivariogramas foi realizada utilizando-se Step (distância teórica entre amostras) de 56 metros, conforme Figuras 13, 14 e 15. Após retirada a tendência quadrática. 47 Obteve-se com o modelo exponencial (Figura 13) maior diferença entre o nugget e o patamar (0,98). Conforme Carvalho et al. (2002) e Bolfe et al. (2007) quanto maior for essa diferença maior será a continuidade do fenômeno e menor a variância da estimativa, ou seja, maior a confiabilidade que se pode ter na estimativa gerada. As estimativas dos parâmetros do Semivariograma Exponencial foram: Nugget com valor 0,89, Sill ou patamar com valor 1,87 e Range ou alcance com valor de 242 metros. Distância superior ao alcance apresenta distribuição aleatória e, portanto não são correlacionadas (Vieira, 2000). 3 ,0 2 ,5 s a i 2 ,0 c n â ir a1 ,5 v i m1 ,0 e S 0 ,5 E X P O N E N C IA L (0 ,8 9 ; 1 ,8 7 ; 2 4 2 ) E X P E R IM E N T A L 0 ,0 0 100 200 300 400 D is tâ n c ia s (m ) 500 600 Figura 13: Semivariograma experimental ajustado ao Modelo Exponencial, para a variável CTC (cmolc dm-3), com Step de 56 metros. 5.2.1.2 Semivariograma Gaussiano Com o modelo gaussiano a diferença entre nugget e patamar foi de 0,48, apresentando as seguintes estimativas dos parâmetros: Nugget com valor 1,61, Sill com valor 1,13 e um Range com valor de 213 metros (Figura 14). 48 3 ,0 2 ,5 s a i 2 ,0 c n iâ r 1 ,5 a iv m1 ,0 e S 0 ,5 G A U S S IA N O (1 ,6 1 ; 1 ,1 3 ; 2 1 3 ) E X P E R IM E N T A L 0 ,0 0 100 200 300 400 D is tâ n c ia s (m ) 500 600 Figura 14: Semivariograma experimental ajustado ao Modelo Gaussiano, para a variável CTC (cmolc dm-3), com Step de 56 metros. 5.2.1.3 Semivariograma Esférico A diferença entre o patamar e o nugget com o modelo esférico (Figura 15, Tabela 3) foi de 0,01. Ainda nesta tabela, pode-se avaliar que a dependência espacial foi moderada para os três modelos e que a dependência espacial foi bem definida. As estimativas dos parâmetros foram: Nugget com valor 1,36, Sill com valor 1,37 e um Range com valor de 244 metros (Figura 15). 3 ,0 2 ,5 s a i 2 ,0 c n iâ r 1 ,5 a iv m1 ,0 e S 0 ,5 E S F É R IC O (1 ,3 6 ; 1 ,3 7 ; 2 4 4 ) E X P E R IM E N T A L 0 ,0 0 Figura 15: 100 200 300 400 D is tâ n c ia s (m ) 500 600 Semivariograma experimental ajustado ao Modelo Esférico, para a variável CTC (cmolc dm-3), com Step de 56 metros. 49 Se considerarmos a variância espacial mínima como critério de seleção, o modelo exponencial é o que melhor ajustou aos dados de CTC, pois tem-se assim, o menor valor da variância não explicada ou não detectada, a menor Razão de Aleatoriedade e o maior Índice de Dependência Espacial (Tabela 3). Esses mesmos critérios foram utilizados nos trabalhos realizados com as variáveis Cálcio, Silte e Argila, pertencentes a este mesmo banco de dados, por Oliveira (2003) no caso do Cálcio, Santana (2008) e Santos (2011) e, no caso do Silte, e para a variável Argila por Rosa Neto (2009) e Shing (2011), respectivamente. No modelo exponencial, tem-se a indicação de que a distância máxima de dependência espacial, ou seja, a distância máxima em que os dados da CTC são correlacionados entre si é 242m (alcance). De acordo com McBratney & Webster (1983) e Souza et al. (1997), citados por Carvalho et al. (2002), no estudo da continuidade espacial de nutrientes do solo, o objetivo principal do uso dos semivariogramas é a determinação do número ideal de amostras. Afirma ainda que, conhecendo-se o alcance da dependência espacial, define-se o raio de amostragem e, para garantir em uma amostragem futura nas mesmas condições do experimento considerado pelo autor. 5.2.2 Técnica de Validação de Jack-Knifing A validação é usada para a confirmação da decisão do modelo a ser ajustado, pois a krigagem está muito ligada ao modelo do semivariograma escolhido, sendo então de suma importância a escolha do modelo matemático correto. Em relação a técnica de validação de Jack-Knifing, os valores considerados ideais são: • Coeficiente Linear: valor de a = 0; • Coeficiente Angular: valor de b = 1; • Coeficiente de Correlação: valor de r2 = 1; 50 • Média dos Erros = 0; • Variância = 1; • Índice IJK= Índice Jack-Knifing = 0 (porém deve-se considerar valores anteriores); • RMSE= Raiz Quadrada do Erro Médio: valor ideal = valor mínimo. A Figura 16 apresenta os gráficos referentes aos parâmetros acima, sendo que em relação ao coeficiente linear (Figura 16-a), os três modelos ficam próximos do ideal (valor zero) com o modelo exponencial diferindo dos outros por volta de 0,005 próximos dos dez vizinhos, já o coeficiente angular (Figura 16-b) até por volta de quinze vizinhos mostra uma proximidade muito grande dos três modelos. O coeficiente de correlação (Figura 16-c) coloca os três modelos muito próximos, sendo que com dez vizinhos eles estão praticamente juntos. Em relação a média dos erros (Figura 16-d) os modelos com aproximadamente 10 vizinhos apresentam diferença entre eles menores de 0,005. Já em relação as variâncias (Figura 16-e), os três modelos se aproximam do valor ideal (valor um), com diferenças entre eles na casa de 0,02 na região com 10 vizinhos, com uma leve vantagem dos modelos esférico e gaussiano. O índice jack-knifing (Figura 16-f) coloca o modelo exponencial em vantagem com número de vizinhos menores que 20, sendo este um bom parâmetro para a definição do modelo a ser usado nas próximas etapas, visto que os parâmetros anteriores não negam esta afirmação. Por fim a RMSE (Figura 16-g) mostra uma leve vantagem dos modelos esférico e gaussiano em relação ao exponencial, porém na região com dez vizinhos a diferença aproxima-se de 0,02. Com a realização da validação e mantendo-se os critérios avaliados nas etapas anteriores, podemos reafirmar a escolha do modelo Exponencial (Figura 13), confirmada pela avaliação do índice jack-knifing. 51 A B C D E F G Figura 16: Gráficos com a validação para os Modelos estudados, com as variáveis: Correlação Linear (a), Correlação Angular (b), Coeficiente de Correlação (c), Moderada dos Erros (d), Variâncias (e), Índice Jack-Knifing-IJK (f) e RMSE (g). 52 5.2.3 Krigagem A krigagem é uma técnica com objetivo de estimar valores de variáveis para locais onde as mesmas não foram medidas ou perdidas, a partir de valores adjacentes interdependentes. Visto a dependência espacial definida pelo semivariograma, então executa-se a krigagem. Após a observação de dependência espacial moderada ou forte, neste caso moderada (Tabela 3), é caracterizada a necessidade de uso de ferramenta que a expresse, tal como a krigagem, a fim de delimitar possíveis zonas de manejo diferenciado para o solo estudado. Foi realizada a krigagem ordinária levando em consideração sete vizinhos para cada ponto calculado e é mostrada na Figura 17-b, onde observa-se que os valores mais a Leste, são influenciados pelo alagamento provocado pelas lagoas, conforme pode ser visto no Apêndice A. 5700 5700 5600 5500 5500 5400 5400 5300 5300 LESTE LESTE 5600 A 5200 5200 5100 5100 5000 5000 4900 4900 4800 4800 5000 5100 5200 5300 5400 5500 5600 5700 5800 5900 6000 NORTE B 5000 5100 5200 5300 5400 5500 5600 5700 5800 5900 6000 NORTE Figura 17: Mapa da área amostral, antes da Krigagem (a) e após a Krigagem (b), considerando o modelo exponencial, usando sete vizinhos, para a variável CTC (cmolc dm-3), na camada de 0-20 cm do solo. Nota-se que após a Krigagem (Figura 17-b) existe uma suavização das camadas da CTC (cmolc dm-3). 53 Os mapas de superfície tridimensional (Figuras 18-b e 19), realizados com os valores da Krigagem, mostram que existe na região por volta da coordenada 5300 - Leste com uma concentração dos menores valores de CTC (cmolc dm-3). A B Figura 18: Mapa de superfície tridimensional da área amostral, antes da Krigagem (a) e após a Krigagem (b), considerando o modelo exponencial, usando sete vizinhos, para a variável CTC (cmolc dm-3), na camada de 0-20 cm do solo. 54 Na análise dos dados de CTC (cmolc dm-3) através dos mapas das Figuras 18-b e 19 é mostrado um indicativo que o alagamento provocado pelas lagoas (vide Apêndice A), promoveu uma perda de nutrientes na sua área de influência, com uma aglutinação dos valores de CTC (cmolc dm-3) menores. Pode-se inferir que a lixiviação através do alagamento e a posterior erosão no momento da saída da água, com o carreamento de solo rico em nutrientes desta região, promoveu esta aglutinação. Figura 19: Mapa de superfície tridimensional da área amostral escalonado, após a Krigagem, considerando o modelo exponencial, usando sete vizinhos, para a variável CTC (cmolc dm-3), na camada de 0-20 cm do solo. 55 6 CONCLUSÃO Considerando-se as condições deste trabalho conclui-se que: - a análise exploratória é eficiente para detectar valores discrepantes (outliers); - é possível identificar dependência espacial nos dados da CTC (cmolc dm-3) na camada do solo a 0-20 cm; - o método de validação de Jack-Knifing é eficiente na seleção do melhor modelo; - com o método geoestatístico, em trabalhos futuros, é possível reduzir o número de amostras para avaliar a necessidade da aplicação de nutrientes; - o modelo que melhor ajusta aos dados é o exponencial; - com a krigagem é possível visualizar a distribuição da CTC (cmolc dm-3) pela área estudada. Sugere-se nos próximos estudos englobar no método geoestatístico os demais nutrientes presentes na formação da CTC. 56 7 REFERÊNCIAS 57 BOLFE, E. L.; GOMES, J. B. V.; FONTES, H. R. Variabilidade espacial de atributos do solo como subsídio para produção integrada de frutas em perímetro irrigado no nordeste do Brasil. Anais XIII Simpósio Brasileiro de Sensoriamento Remoto, Florianópolis, SC, INPE. p. 67-74, abril 2007. BUSTOS, O. Outliers e robustez. Revista Brasileira de Estatística, 49, p. 7-30. 1988. CAMBARDELLA, C. A.; MOORMAN, T. B.; NOVAK, J. M.; PARKIN, T. B.; KARLEN, D. L.; TURCO, R. F.; KONOPKA, A. E. Field-scale variability of soil properties in Central Iowa Soils. Soils Sci. Am. J., 58, p. 1501-1511, 1994. CAMPOS, H. Estatística experimental não-paramétrica. 4. ed. FEALQ, Piracicaba, S.P., 1983. CAPECHE, C.L.; MACEDO, J.R.; MANZATTO, H.R.H.; SILVA, E.F. Caracterização pedológica da fazenda Angra - PESAGRO/RIO - Estação experimental de Campos (RJ). (compact disc). In: CONGRESSO BRASILEIRO DE CIÊNCIA DO SOLO. 26, Informação, globalização, uso do solo; Rio de Janeiro, 1997. Rio de Janeiro: Embrapa/SBCS, 1997. CARVALHO, J. R. P. de, VIEIRA, S.R. Avaliação e comparação de estimadores de krigagem para variáveis agronômicas – Uma proposta. Série Documentos. 2001. ISSN 1677-9274. CARVALHO, J. R. P. de, SILVEIRA, P. M. da, VIEIRA, S.R. Geoestatistica na determinação da variabilidade espacial de características químicas do solo sob diferentes preparos. Pesquisa Agropecuária Brasileira, PAB. Brasília, DF, v.37, n.8, p.1151-1159, agosto 2002. COUTO, E. G.; KLAMT, E. Variabilidade espacial de micronutrientes em solo sob pivô central no sul do estado de Mato Grosso. Pesquisa Agropecuária Brasileira, PAB. Brasília, DF, v.34, n.12, p.2321-2329, dezembro 1999. CRESSIE, N. Statistics for spatial data. New York: John Wiley, 900p. 1991. 58 EMBRAPA. Centro Nacional de Pesquisa se Solos. Manual de métodos de análises de solo. Centro Nacional de Pesquisa de Solos. 2. ed. rev. atual Rio de Janeiro, RJ, 1997. 212p. (EMBRAPA-CNPS. Documentos: 1). FARIAS, P. R. S. Distribuição espacial do nematóide reniforme com o uso da geoestatística, em um solo com rotação de culturas. Jaboticabal, SP. 1999. Tese de Doutorado – Faculdade de Ciências Agronômicas, Universidade Estadual Paulista “Júlio de Mesquita Filho”. 1999. 109p. FISCHER, R. A. The design of experiments. Edinburgh: Oliver and Boyd. 252p. 1935. GONÇALVES, A. C. A.; FOLEGATTI, M. V.; VIEIRA, S. R. Padrões de amostragem e intensidade de krigagem na caracterização do armazenamento de água no solo, em área irrigada por pivô central. Revista Brasileira de Ciência do Solo, v. 23, n.3, p.1485-1495,1999. GRONDONA, M. O.; CRESSIE, N. Using spatial considerations in the analysis of experiments.Technometrics, v. 33, n.4, p.381-391, 1991. HOAGLIN, D.C., MOSTELLER, F., TUKEY,J.W. Análise exploratória de dados. Técnicas robustas. Edições Salamandra. Lisboa. 446p. 1992. JOURNEL, A. G.; HUIJBREGTS, C. J. Mining geostatistics. Centre de Geoestatisque Fontainebleau, France, New York: Centre de Geoestatistique, Academic Press. 600p. 1978. LIBARDE, P. L.; MANFRON, P. A.; MORAES, S. O.; TUON, R. L. Variabilidade da umidade gravimétrica de um solo hidromórfico. Revista Brasileira de Ciência do Solo. v.20, n.2, p.1-12, 1996. McBRATNEY, A. B. & WEBSTER, R. How many observations are needed for regional estimation of soil properties? Soil Science. Baltimore, v.135, n.3, p. 177183. 1983. 59 MATHERON, G. Principles of Geostatistics. Economic Geology, v.58, p. 12461266. 1963. MATHERON, G. The theory of regionalized variables and its applications. Les cahiers du CMM, n.5, 211p., 1971. MIRITZ, G. K.; VIEGAS, L. S.; AQUINO, L. S.; BARTELS, G. K.; TIMM, L. C.; PARFITT, J. M. B.; NEBEL, A. L. C.; PAULETTO, E. A. Variabilidade Espacial da Umidade Volumétrica do Solo no Ponto de Murcha Permanente Utilizando a Técnica de Co-Krigagem. XVIII CIC/ XI ENPOS / I Mostra Científica, Pelotas, RS. UFPel, 2009. OLIVEIRA, M. C. N. de. Métodos de estimação de parâmetros em modelos geoestatísticos com diferentes estruturas de covariâncias: uma aplicação ao teor de cálcio no solo. Piracicaba, SP. Tese de Doutorado – Escola Superior de Agricultura “Luiz de Queiroz”, Universidade de São Paulo. 2003.140p OLIVEIRA, M. C. N. de; CORRÊA-FERREIRA, B. S. Diagnóstico Exploratório na Análise de Dados Entomológicos: Efeito do Diflubenzurom no Consumo Alimentar de Anticarsia gemmatalis (Hubner). Anais da Sociedade Entomológica Brasileira. v. 27, n. 4. p. 627-637, dezembro 1998. OLIVEIRA, M. C. N. de , SOBOTTKA, R.P., CAMPO, R.J. Critérios para detectar outliers em pesquisas de inoculação de soja. In: SIMPÓSIO NACIONAL DE PROBABILIDADE E ESTATÍSTICA, 18., 2008, SP. [Anais]. [São Pedro]; Associação Brasileira de Estatística, 2008. CD-ROM. ORTIZ, G. da C. Aplicação de métodos geoestatísticos para identificar a magnitude e a estrutura da variabilidade espacial de variáveis físicas do solo. Dissertação (Mestrado) – Escola Superior de Agricultura “Luiz de Queiroz", Piracicaba, SP. 2002. 75p. QUAGGIO, J. A. Acidez e calagem em solos tropicais. 1ª Edição. Campinas, SP. Instituto Agronômico, 2000, 111p. 60 RAIJ, B. V. Fertilidade do solo e adubação. Edição Ceres, Piracicaba, SP. Associação Brasileira para Pesquisa da Potassa e do Fosfato, 1939, 343p. ROSA NETO, E. A. Uso de Geoestatística no estudo espacial de dados e propriedades físicas em solos hidromórficos. Monografia – Universidade Estadual de Londrina – Londrina, PR. 2009. 30p. SANTANA, T. F. Aplicação de Método Geoestatístico a Dados de Pesquisa Utilizando o Software geoEas e variowin. Monografia – Universidade Estadual de Londrina – Londrina, PR. 2008. 49p. SANTOS, M. R. G.; OLIVEIRA, M. C. N. de. Aplicação da geoestatística a dados de teor de silte em solo hidromórfico. Resumos expandidos da VI Jornada Acadêmica da Embrapa Soja, 6. 2011, Londrina, PR. Embrapa Soja. p.68-71. 2011. SHAPIRO, S. S. & WILK, M. B. An analysis of variance test for normality. Biometrika. 52. p. 591-611. 1965. SHING, L. R.; OLIVEIRA, M. C. N. de. Uso da geoestatística na determinação da variabilidade espacial do teor de argila no solo. Resumos expandidos da VI Jornada Acadêmica da Embrapa Soja, 6. 2011, Londrina, PR. Embrapa Soja. p.79-82. 2011. SIBALDELLI, R. N. R.; OLIVEIRA, M. C. N. de. A importância em detectar dados discrepantes em resultados de pesquisas com inoculantes da soja. In. SEAGRO 2005. 11º Simpósio de Estatística Aplicada à Experimentação Agronômica. Londrina, PR. Programa e Resumos. Universidade Estadual de Londrina, 2005, 212p. SILVA, P. C. M. da; CHAVES, L. H. G. Avaliação e variabilidade espacial de fósforo, potássio e matéria orgânica em Alissolos. Revista Brasileira de Engenharia Agrícola e Ambiental, Campina Grande, PB. v.5, n.3, p. 431-436, DEAg/UFPB, 2001. 61 SOUZA, L. S.; COGO, N. P.; VIEIRA, S. R. Variabilidade de propriedades físicas e químicas do solo em pomar cítrico. Revista Brasileira de Ciência do Solo. Campinas, SP, v.21, n.3, p.1-10, 1997. VIDAL VASQUES. E.; VIEIRA, S. R.; DE MARIA, I. C.; GONZÁLES, A. P. Geostatistical Analysis of Microrelief of na Oxisol as a Function of Tillage and Cumulative Rainfall. Sci Agric., Piracicaba, SP. v.66, n. 2, p.225-232, March/April 2009. VIEIRA, S. Estatística para a Qualidade – Como Avaliar com Precisão a Qualidade em Produtos e Serviços. Rio de Janeiro, RJ. 1999, Editora Campus, 1999, 198p. VIEIRA, S. R. Geoestatística. Curso de extensão universitária. Botucatu, SP. UNESP, 1996, 71p. VIEIRA, S. R. Geoestatística em estudos de variabilidade espacial do solo. In: Tópicos em Ciência do Solo. Viçosa: SBCS, 2000. VIEIRA, S. R. Variablidade espacial de argila, silte e atributos químicos em uma parcela experimental de um latossolo roxo de Campina (SP). Campinas, SP, v.56, n.1, Campinas, 1997. VIEIRA, S. R.; CARVALHO, J. R. P. de; GONZÁLES, A. P. Jack Knifing for Semivariogram Validation. Bragantia, Campinas, SP. v.69, Suplemento, p. 97105. Campinas, 2010. VIEIRA, S. R.; MILLETE, J.; TOPP, G. C.; REYNOLDS, W. D. Handbook for geostatistical analysis of variability in soil and climate data. Tópicos em Ciência do Solo, 2, p. 1-45, Viçosa, MG. 2002. VIEIRA, S. R.; NIELSEN, D. R.; BIGGAR, J. W. Spatial variability of fieldmensured infiltration rate. Soil of American Journal v.45, n.3, p.1040-1048. 1981. VIEIRA, S.R.; HATFIELD, J.L.; NIELSEN, D.R.; BIGGAR, J.W. Geostatistical theory and application to variability of some agronomical properties. Hilgardia, v.51, 62 n.3, p.1-75, 1983. 63 APÊNDICES 64 APÊNDICE A - PLANTA TOPOGRÁFICA PLANIALTIMÉTRICA NA ESCALA 1:1000 ORIGINAL PARA A PESQUISA REALIZADA. 65 APÊNDICE B - DADOS ORIGINAIS APÓS RETIRADOS OS OUTLIERS MENORES QUE MAIORES QUE 17,32 TOTALIZANDO 240 AMOSTRAS. Grid a1 a10 a11 a12 a13 a15 a2 a3 a4 a5 a6 a7 a8 a9 b1 b10 b11 b12 b13 b14 b2 b3 b4 b5 b6 b7 b8 b9 c1 c10 c11 c12 c13 c14 c3 c4 c5 c6 c7 c8 c9 d1 d10 d11 d12 d13 d14 d2 d3 d5 d6 d7 d8 Norte 5710 5873 5890 5907 5925 5961 5727 5745 5764 5781 5799 5817 5837 5854 5681 5843 5864 5881 5899 5918 5698 5716 5734 5751 5769 5790 5808 5825 5634 5797 5818 5836 5853 5871 5670 5688 5705 5723 5744 5761 5780 5589 5750 5770 5788 5806 5825 5606 5623 5659 5677 5698 5715 Leste 4829 5254 5300 5347 5394 5487 4875 4922 4969 5015 5062 5109 5161 5208 4891 5319 5371 5419 5464 5511 4937 4984 5031 5078 5125 5178 5225 5271 4908 5336 5390 5436 5483 5529 5001 5049 5095 5142 5196 5242 5289 4925 5354 5407 5453 5500 5545 4972 5019 5112 5159 5214 5260 CTC 10,6012263 12,1810479 9,76767001 11,4114827 13,003456 8,72140468 13,1111483 11,457748 11,4391304 12,4449275 13,2897436 12,86 12,1596433 10,7624303 11,9214047 12,0493868 11,9931996 11,6807135 11,5285396 10,2121516 12,3894091 15,7695652 13,122408 12,9105909 12,9817168 12,8512821 13,4810479 14,2490524 13,6890747 12,2015608 12,157748 10,9316611 10,7984392 10,5698997 14,6372352 15,2916388 13,8192865 12,9372352 12,8003344 13,4304348 12,3726867 11,6301003 10,357748 10,5474916 12,0198439 9,00033445 10,6779264 14,2502787 16,0608696 17,3198439 17,0295429 13,203456 12,9198439 8,7 E 66 d9 e1 e10 e11 e12 e13 e14 e2 e3 e4 e5 e6 e7 e8 e9 f1 f10 f11 f12 f13 f14 f2 f3 f4 f5 f6 f7 f8 f9 g1 g10 g11 g12 g13 g2 g3 g4 g5 g6 g7 g8 g9 h1 h10 h11 h12 h13 h14 h2 h3 h4 h5 h6 h7 h8 h9 i1 i10 5733 5541 5704 5724 5742 5765 5784 5559 5576 5595 5613 5631 5651 5668 5686 5495 5658 5677 5695 5713 5731 5512 5530 5547 5565 5582 5604 5622 5639 5448 5611 5631 5647 5666 5466 5484 5501 5518 5536 5557 5575 5593 5402 5565 5584 5602 5620 5638 5420 5437 5455 5473 5491 5511 5529 5547 5355 5519 5307 4943 5371 5423 5470 5513 5561 4989 5036 5083 5129 5176 5230 5277 5325 4961 5389 5440 5487 5533 5580 5006 5054 5100 5147 5193 5248 5295 5341 4980 5406 5458 5505 5552 5026 5073 5117 5164 5211 5266 5314 5360 4997 5425 5475 5522 5568 5615 5044 5090 5136 5183 5231 5284 5330 5377 5016 5441 12,5083612 11,228874 10,8114827 13,0521739 9,71984392 13,8410256 13,4220736 12,7121516 14,8121516 13,8512821 13,3885173 13,0726867 13,3909699 13,9090301 12,5003344 11,7996656 12,780825 10,6881828 13,4292085 15,1627648 14,0599777 12,8307692 13,8214047 13,3111483 13,6316611 13,0916388 13,4627648 12,9624303 10,171126 11,7493868 10,7605351 13,3987737 13,771126 15,442252 13,2372352 13,4897436 12,8981048 14,5105909 15,33 15,0419175 11,2931996 13,3205128 12,8316611 14,7018952 15,9307692 17,0627648 11,4897436 16,6121516 12,6605351 12,657748 15,1779264 15,3 14,3506132 14,6798216 13,0916388 11,7714604 13,4624303 13,8419175 67 i11 i13 i14 i2 i3 i4 i5 i6 i7 i8 i9 j1 j10 j11 j14 j15 j2 j3 j4 j5 j6 j7 j8 j9 l1 l12 l13 l14 l15 l2 l3 l4 l5 l6 l7 l8 l9 m1 m12 m2 m3 m4 m5 m6 m7 m8.1 m8.2 m9 n1 n11 n12 n13 n14 n15 n2 n3 n4 n5 5538 5572 5590 5373 5391 5409 5427 5445 5466 5484 5501 5289 5455 5473 5527 5546 5308 5325 5344 5362 5379 5398 5419 5437 5243 5448 5466 5485 5503 5261 5279 5297 5316 5334 5351 5374 5392 5179 5400 5197 5215 5233 5251 5270 5288 5307 5327 5346 5131 5333 5355 5372 5390 5415 5150 5169 5186 5204 5494 5585 5633 5061 5108 5155 5201 5247 5302 5348 5395 4984 5411 5459 5603 5650 5030 5077 5125 5170 5219 5266 5320 5365 5002 5529 5575 5620 5666 5048 5095 5141 5188 5235 5281 5337 5383 4973 5546 5020 5068 5113 5160 5207 5254 5302 5354 5400 4990 5510 5564 5610 5656 5701 5037 5084 5131 5177 9,82207358 14,1881828 14,1403567 14,7779264 14,1372352 13,7003344 13,4897436 13,5695652 13,7391304 14,8086957 12,471126 12,7086957 11,9627648 12,2114827 16,2304348 16,0391304 13,2201784 14,0118172 13,9829431 13,9186176 12,7186176 13,7791527 14,9474916 13,6707915 12,8186176 9,76243032 14,6114827 16,790078 14,7372352 13,3090301 12,8810479 13,557748 13,23233 12,8490524 13,538796 15,4316611 12,7316611 13,2198439 16,1319955 12,3090301 13,0295429 13,3599777 13,0730212 13,3593088 12,5698997 11,4102564 13,2292085 9,85217391 12,7707915 11,557748 16,3794872 13,8624303 15,4909699 17,0605351 13,0391304 15,4304348 15,2198439 14,9391304 68 n6 n7 n8.1 n8.2 o1 o10 o11 o12 o13 o14 o2 o3 o4 o5 o6 o7 o8.1 o9.1 p1 p10 p11 p12 p13 p2 p3 p4 p5 p6 p7 p8.2 p9.2 q1 q10.2 q11 q13 q14 q2 q3 q4 q5 q6 q8.1 q9.2 r10 r11 r12 r8 r9 s1 s10 s11 s12 s13 s2 s3 s4 s5 s6 5222 5240 5258 5283 5067 5269 5287 5307 5325 5343 5086 5103 5121 5140 5157 5176 5194 5213 5021 5222 5241 5260 5279 5039 5057 5075 5093 5112 5129 5186 5204 4957 5175 5193 5231 5249 4975 4993 5011 5029 5047 5083 5157 5128 5146 5165 5093 5110 5760 5959 5977 5995 6013 5778 5795 5831 5867 5889 5225 5270 5317 5380 4961 5480 5528 5580 5626 5673 5008 5054 5101 5147 5195 5241 5287 5333 4978 5498 5545 5597 5645 5026 5071 5118 5165 5212 5259 5404 5451 4951 5516 5563 5660 5706 4997 5044 5090 5136 5183 5277 5469 5534 5581 5629 5440 5487 4807 5331 5378 5423 5471 4855 4900 5044 5092 5144 11,3425864 13,9493868 14,6881828 10,7813824 12,5904125 11,7817168 12,4885173 9,08940914 15,2301003 16,7403567 13,5981048 14,2391304 15,6018952 15,7931996 12,0018952 13,6599777 11,9897436 9,66833891 12,2509476 14,3474916 11,1208473 16,0090301 13,4692308 13,4813824 14,1807135 14,3909699 11,6208473 12,4102564 12,1003344 12,957748 13,46 11,3608696 17 16,6292085 11,2593088 9,87146042 14,1521739 15,5192865 13,8502787 15,1512821 14,1913043 8,73199554 14,5779264 15,68 15,3273133 10,6897436 15,9599777 16,8931996 12,46767 12,671126 12,1497213 12,0186176 11,5121516 10,9996656 11,3984392 11,7502787 13,4307692 12,9002564 69 s7 s8 s9 t1 t2 t3 t4 t5 t6 t7 u1 u2 u3 5907 5925 5943 5789 5805 5823 5841 5897 5912 5935 5833 5852 5868 5191 5237 5284 4742 4789 4836 4881 5026 5071 5123 4724 4769 4817 13,061204 13,3680045 11,603456 12,9596433 11,7512821 11,3090301 11,8593088 13,0931996 11,5810479 9,5090301 10,8782609 11,6801561 10,3726867 70 APÊNDICE C – PLANILHA EM EXCEL COM CÁLCULOS DOS AJUSTES AOS MODELOS PARA SEMIVARIOGRAMAS. SEMIVARIOGRAM FOR :rubc_t_c.rt2 c0 0,893737092 c0 1,60848 c0 1,360256115 c1 1,867124529 c1 1,128555 c1 1,372237377 MAX DISTANCE = 560 a 241,6104258 a 213,4841 a 243,5491756 STEP = 56 r2 0,95668848 r2 0,98425 r2 0,983240059 3,137 0,485 2,703 rmse 0,005984822 rmse 0,003876 rmse 0,00387151 PAIRS DISTANCE C_T_C C_Est C_Res EXPONENCIAL SQR SQT SQDP GAUSSIANO SQR SQT SQDP ESFÉRICO SQR SQT SQDP 0 0,893737092 1,608479523 1,360256115 1 388 50 1,818 9,41E-03 1,813 1,75729 0,003103623 0,52882 5,97E-05 1,779720878 0,001107 0,52882 2,13203E-05 1,776894401 0,001303614 0,52882 2,50956E-05 2 1161 93,56 2,073 3,03E-02 2,034 2,17654 0,020317909 0,256238 0,00117 2,102750566 0,004727 0,256238 0,000272271 2,112082092 0,006096813 0,256238 0,000351198 3 1631 145,5 2,518 7,27E-02 2,492 2,45427 0,001423804 0,002323 0,000115 2,456929896 0,00123 0,002323 9,9528E-05 2,44365491 0,002337248 0,002323 0,000189137 4 2023 201,4 2,752 0,1269 2,674 2,60771 0,004394497 0,017902 0,000441 2,658878831 0,000229 0,017902 2,29501E-05 2,674400957 1,60767E-07 0,017902 1,61365E-08 5 2186 254 2,922 0,1892 2,77 2,68116 0,007892935 0,052808 0,000856 2,720884631 0,002412 0,052808 0,000261639 2,732493493 0,001406738 0,052808 0,000152574 6 2574 308,6 2,926 0,259 2,718 2,72040 5,75754E-06 0,031613 7,35E-07 2,734896758 0,000286 0,031613 3,64613E-05 2,732493493 0,000210061 0,031613 2,6827E-05 7 2443 362,8 2,952 0,3337 2,673 2,74022 0,004518326 0,017636 0,000548 2,736840015 0,004076 0,017636 0,000494 2,732493493 0,003539476 0,017636 0,000429022 8 2730 417,4 3,173 0,4257 2,78 2,75038 0,000877225 0,057504 0,000119 2,737023082 0,001847 0,057504 0,000250179 2,732493493 0,002256868 0,057504 0,000305693 9 2609 475 3,145 0,51 2,722 2,75574 0,001138125 0,033051 0,000147 2,737034484 0,000226 0,033051 2,92596E-05 2,732493493 0,000110113 0,033051 1,42538E-05 10 2410 530,9 3,188 0,6102 2,726 2,75830 0,001043373 0,034522 0,000125 2,737034874 0,000122 0,034522 1,45603E-05 2,732493493 4,21654E-05 0,034522 5,04186E-06 55 20155 2,5402 0,044715575 1,032418 0,003582 0,016261 1,032418 0,001502168 0,017303258 1,032418 0,001498859 71 APÊNDICE D – PLANILHA EM EXCEL COM VALORES CALCULADOS PARA VALIDAÇÃO, PARA OS MODELOS EXPONENCIAL, GAUSSIANO E ESFÉRICO, UTILIZANDO JACK-KNIFING. JACKNIFFING RESULTS FOR rubc_t_c.rt2 Modelo Exponencial VARIABLE :C_Res REGRESSION REDUCED NEIG INTERCEPT SLOPE 4 .4316E-01 .2413 8 .1642E-01 .2466 12 .8910E-02 .2335 16 .1087E-01 .2199 20 .1104E-01 .2147 32 .5385E-02 .2131 40 .4862E-02 .2126 CORR_COEF. MEAN VARIANCE IJK RMSE .3914 .2575E-01 1.164 -1.178 1.555 .4634 .7942E-02 1.068 -1.214 1.458 .4610 .2956E-02 1.070 -1.233 1.458 .4442 .4505E-02 1.090 -1.241 1.472 .4360 .4655E-02 1.101 -1.244 1.479 .4392 .8942E-03 1.098 -1.249 1.476 .4418 .5401E-03 1.095 -1.250 1.473 JACKNIFFING FOR RESULTS rubc_t_c.rt2 Modelo Gaussiano VARIABLE :C_Res REGRESSION REDUCED NEIG INTERCEPT SLOPE 4 .4413E-01 .2438 8 .1243E-01 .2446 12 .4274E-02 .2302 16 .4934E-02 .2218 20 .4199E-02 .2205 32 .2818E-02 .2284 40 .4134E-02 .2295 CORR_COEF. MEAN VARIANCE IJK RMSE .3947 .2732E-01 1.130 -1.204 1.552 .4773 .5651E-02 1.047 -1.226 1.443 .4786 .9798E-04 1.050 -1.241 1.440 .4681 .7025E-03 1.063 -1.246 1.450 .4632 .1984E-03 1.071 -1.246 1.454 .4715 -.3933E-03 1.065 -1.236 1.447 .4737 .5572E-03 1.064 -1.233 1.445 JACKNIFFING FOR RESULTS VARIABLE :C_Res REGRESSION REDUCED NEIG INTERCEPT SLOPE 4 .4413E-01 .2426 8 .1227E-01 .2438 12 .4178E-02 .2282 16 .6466E-02 .2184 20 .5130E-02 .2169 32 .2514E-02 .2243 40 .3402E-02 .2278 rubc_t_c.rt2 Modelo MAX_DIST 72.00 112.0 162.0 212.0 252.0 322.0 362.0 MAX_DIST 72.00 112.0 162.0 212.0 252.0 322.0 362.0 Esférico CORR_COEF. MEAN VARIANCE IJK RMSE .3932 .2713E-01 1.135 -1.202 1.553 .4734 .5562E-02 1.048 -1.229 1.447 .4753 .4931E-04 1.050 -1.246 1.443 .4641 .1795E-02 1.065 -1.250 1.453 .4608 .8635E-03 1.070 -1.251 1.456 .4680 -.6136E-03 1.065 -1.243 1.450 .4719 .3107E-06 1.063 -1.237 1.447 MAX_DIST 72.00 112.0 162.0 212.0 252.0 322.0 362.0