CENTRO DE CIÊNCIAS EXATAS
DEPARTAMENTO DE ESTATÍSTICA
Uso de Geoestatística no Estudo Espacial de Dados de Capacidade de
Troca de Cátions.
RUBSON NATAL RIBEIRO SIBALDELLI
Londrina - PR
2012
UNIVERSIDADE ESTADUAL DE LONDRINA
CENTRO DE CIÊNCIAS EXATAS
DEPARTAMENTO DE ESTATÍSTICA
Uso de Geoestatística no Estudo Espacial de Dados de Capacidade de
Troca de Cátions.
Monografia apresentada como exigência
parcial para a obtenção do título de
Especialista em Estatística com Ênfase em
Estatística
Experimental,
à
comissão
julgadora do Curso de Pós-Graduação em
Estatística, da Universidade Estadual de
Londrina.
Orientadora: Dra. Maria Cristina Neves de Oliveira.
Aluno: Rubson Natal Ribeiro Sibaldelli.
Londrina - PR
2012
RUBSON NATAL RIBEIRO SIBALDELLI
Uso de Geoestatística no Estudo Espacial de Dados de Capacidade de
Troca de Cátions.
Monografia apresentada como exigência
parcial para a obtenção do título de
Especialista em Estatística com Ênfase em
Estatística
Experimental,
à
comissão
julgadora do Curso de Pós-Graduação em
Estatística, da Universidade Estadual de
Londrina.
____________________________________
Profa.Dra. Elizabeth Strapasson - UEL
Coordenadora do Curso de Pós-Graduação
em Especialização em Estatística com
Ênfase em Estatística Experimental
COMISSÃO EXAMINADORA
____________________________________
Prof. Dr. Silvano Cesar da Costa
Universidade Estadual de Londrina
____________________________________
Profa. Dra. Jacinta Ludovico Zamboti
Universidade Estadual de Londrina
Orientadora:
____________________________________
Dra. Maria Cristina Neves de Oliveira
Embrapa Soja
Londrina, 30 de março de 2012.
A Deus, com Ele tudo é possível,
Ao Papai e a Mamãe, sempre confiáveis e presentes,
A Cris, Gabi e Gigi, sempre minhas intercessoras,
Ronaldo e July, irmãozinhos queridos,
DEDICO.
AGRADECIMENTO
Agradeço a Deus, Ele sempre está certo, sempre são d’Ele as
melhores ideias, e a Ele sempre toda a Glória, Honra, Autoridade e Poder.
Agradeço a minha orientadora – Dra. Maria Cristina Neves de
Oliveira, pela confiança, pela dedicação em alegria, pela presença, pela maneira
sempre cortês de dizer o que devo fazer, pelo desprendimento em dedicar seu
tempo a mim.
Ao Sr. Olindo Sibaldelli, meu querido Papai, a Sra. Laudicea Ribeiro
Sibaldelli, minha querida Mamãe, obrigado pelas orações e o sempre pronto
desprendimento em me ajudar, sendo constantemente meu porto seguro.
A Cristina Seixas Sibaldelli, minha Esposa, a Gabriela Seixas
Sibaldelli e a Giovana Seixas Sibaldelli, minhas filhinhas, pela paciência em me
suportar, por permitirem a tranquilidade necessária para os meus estudos.
Ao Ronaldo Ribeiro Sibaldelli e a Julimary Ribeiro Sibaldelli, pelo
sempre presente incentivo.
Aos colegas da Embrapa Solos pela cessão dos dados presentes
neste trabalho nas pessoas de Dr. Enio Fraga da Silva, Dr. José Ronaldo de
Macedo, Dra. Helga Hissa Manzatto e Dr. Cláudio Luiz Capeche.
Aos colegas César de Castro e José Renato Bouças Farias pelo
incentivo, pela palavra de ânimo, por sempre tentarem me levar ao próximo degrau.
Aos colegas da Embrapa Soja por suportarem minhas chatices, e
ainda assim quererem me ajudar.
Aos colegas e professores da UEL, turma de Especialização em
Estatística – 2011, pela amizade, pelo estudo, incentivos e alegrias.
Aos irmãos e amigos da Igreja Cristã Restaurando Vidas pela
constante intercessão, obrigado pelas orações.
A todos que de forma direta ou indireta contribuíram para a
realização deste desafio em minha existência, agradeço.
E não sede conformados com este
mundo, mas sede transformados pela
renovação do vosso entendimento, para
que experimenteis qual seja a boa,
agradável, e perfeita vontade de Deus.
Romanos 12:2
SIBALDELLI, Rubson Natal Ribeiro. Uso de Geoestatística no Estudo Espacial de
Dados de Capacidade de Troca de Cátions. 2012. 73p.
Monografia – Universidade Estadual de Londrina, Londrina-PR, 2012.
RESUMO
No Brasil, até a década de 70, os atributos físicos e químicos dos solos eram
avaliados em delineamentos experimentais como dados independentes. Após anos
de uso deste método descobriu-se que existe uma dependência espaço-temporal
natural nos solos, assim, o uso de ferramentas que incluem a posição geográfica das
amostras como a geoestatística, tornou-se essencial. No presente estudo, dados de
CTC (capacidade de troca de cátions - cmolc dm-3), a qual está relacionada com a
disponibilização de nutrientes para as plantas, foram analisados usando ferramentas
como semivariograma, o método de interpolação ordinária - krigagem, a validação
por Jack-Knifing e os mapas de isolinhas e superfícies tridimensionais. Tais dados
foram disponibilizados por pesquisadores da Empresa de Pesquisa Agropecuária do
Estado do Rio de Janeiro – Pesagro e da Embrapa Solos e correspondem à
amostragens na camada de 0-20 cm de solo da área experimental da Fazenda
Angra da Estação Experimental de Campos de Goytacazes. A área onde foi
realizado o levantamento encontra-se ao Norte do estado do Rio de Janeiro, à
margem esquerda do Rio Paraíba do Sul, com as coordenadas geográficas
21°44’47’’S e 41°18’24’’O. Devido às enchentes do Rio Paraíba do Sul (à esquerda)
e das lagoas dos Prazeres e Taquaruçu (à direita) houve deposição de sedimentos
na área, o que contribuiu para a grande variação nas propriedades avaliadas no
solo. Primeiramente, os dados foram submetidos à vários métodos, como testes de
aderência, estatísticas descritivas e gráficas para indicação dos outliers. Verificou-se
que a carta de controle, o Box-plot e o teste de normalidade, foram eficientes na
indicação dos outliers os quais após retirados tornaram a distribuição dos dados
aproximadamente normal. Procedeu-se então a análise dos dados por meio dos
métodos geoestatísticos anteriormente citados. Foi retirada a tendência linear e
quadrática da CTC permitindo o ajuste do semivariograma ao modelo teórico com
dependência espacial bem definida. O modelo selecionado foi o exponencial, com
nugget = 0,89 e alcance de 242 m. A krigagem suavizou a região pesquisada
detectando à leste valores baixos para a CTC face as várias enchentes das lagoas.
A lixiviação causada pelo alagamento e posterior erosão devido ao escorrimento da
água, junto com carregamento de solo rico em nutrientes, promoveu esta
aglutinação. Conclui-se que: 1) a análise exploratória permite detectar outliers, 2) a
CTC apresenta dependência espacial, 3) o melhor modelo foi o exponencial e 4) os
mapas de contorno e de superfície indicam regiões com maiores e menores valores
da CTC. Portanto o presente estudo forneceu importantes informações sobre o
histórico da área bem como identificou os diferentes valores de CTC possibilitando
planejar um melhor uso área. Sugere-se nos próximos estudos englobar no método
geoestatístico os nutrientes presentes na formação da CTC.
Palavras-chave: dependência espacial, amostras georreferenciadas, krigagem
ordinária, variabilidade, CTC.
SIBALDELLI, Rubson Natal Ribeiro. Uso de Geoestatística no Estudo Espacial de
Dados de Capacidade de Troca de Cátions. 2012. 73p.
Monografia – Universidade Estadual de Londrina, Londrina-PR, 2012.
ABSTRACT
In Brazil, until the 70's, the physical and chemical attributes of soils were evaluated in
experimental designs as independent data. After using this method for several years
it was found that there is space-time dependence natural in the soils, therefore, the
use of tools that comprises the geographical position of the samples, such as
geostatistics, became essential. In the present study, the CTC (cation exchange
capacity - cmolc dm-3) that is related with the availability of nutrients to the plants,
were analyzed using tools such as semivariogram, the ordinary interpolation method
-kriging, the validation by Jack-Knifing and contour and three-dimensional surface
maps. Such data was made available by researchers of the Agricultural Research
Enterprise of the State of Rio de Janeiro - Pesagro and Embrapa Soils and
corresponds of samplings in the 0-20cm layer of soil of the experimental area of the
Angra farm at the Experimental Station of Campos Goytacazes. The area sampled is
located in the North of the Rio de Janeiro state, on the left bank of the Paraiba do Sul
river having the geographical coordinates of 21 ° 44'47'' S and 41 ° 18'24'' O. Due to
flooding of the Paraiba do Sul river (on the left side) and of the lakes of Pleasures
and Taquaruçu (on the right side), there was deposition of sediments, which
contributed to the large variation in the measured properties of the soil. Initially the
data was analyzed through several methods such as compliance, descriptive
statistics and graphics to indicate outliers. It was verified that the control chart, the
Box-plot and the normality test, were effective in the indication of outliers. After taking
out the outliers the data distribution became approximately normal. Analysis of the
data using the geostatistical methods initially mentioned was carried out. The linear
and quadratic tendency of the CTC was removed allowing the adjustment of the
semivariogram to the theoretical model with well defined spatial dependence. The
selected model was the exponential with nugget = 0.89 and range of 242 m. The
Kriging softened the surveyed area detecting at east low values of CTC due to the
flooding of the lakes. The leaching caused by the flooding and subsequent erosion
due to the water runoff together with carrying of soil rich in nutrients, promoted this
agglutination. We conclude that: 1) exploratory analysis allows the detection of
outliers, 2) the CTC has spatial dependence, 3) the best model was the exponential
and 4) the contour and surface maps indicate regions with higher and lower values of
CTC. Therefore, the present study gave important information about the history of the
area and identified different values of CTC possibilitating the planning of a better use
of the area. It is suggested that further studies are carried out including in the
geostatitical methods the nutrients forming the CTC.
Key words: spatial dependence, georeferenced sample, ordinary kriging, variability,
CTC.
LISTA DE ILUSTRAÇÕES
Figura 1 – Mapa do Estado do Rio de Janeiro, com o município de Campos dos
Goytacazes em destaque .......................................................................................... 25
Figura 2 – Mapa de amostragem em malha regular, com 273 amostras (a), 254 e
250 amostras (b,c), na presença de outliers, e 240 amostras (d) sem a presença de
outliers para a variável CTC (cmolc dm-3), na camada de 0-20 cm do solo ............... 26
Figura 3 – Mapa de distribuição amostral, em malha regular, com 240 amostras,
sem a presença de outliers para a variável CTC (cmolc dm-3), na camada de 0-20 cm
do solo ....................................................................................................................... 27
Figura 4 – Mapa de distribuição amostral distribuído por quartis, em malha regular,
com 240 amostras, sem a presença de outliers para a variável CTC (cmolc dm-3), na
camada de 0-20 cm do solo. ..................................................................................... 30
Figura 5 – Esquema representando a estrutura de um semivariograma teórico,
adaptado de Rosa Neto (2009). ................................................................................ 32
Figura 6 – Box-Plot para a variável CTC (cmolc dm-3), na camada de 0-20
cm do solo, com 273, 254, 250 e 240 amostras ........................................................ 39
Figura 7 – Gráficos de controle, com intervalo de 3σ , para a variável CTC (cmolc dm3
), na camada de 0-20 cm do solo, com a) 273, b) 254 c) 250 amostras na presença
de outliers e d) 240 amostras sem outliers ................................................................ 41
Figura 8 – Distribuição de frequência sob a Curva Normal para a variável CTC
(cmolc dm-3), na camada 0-20 cm do solo, com outliers, com 273 amostras (a), com
254 amostras (b) e, com 250 amostras (c) e sem outliers com 240 amostras (d). .... 42
Figura 9 – Gráfico de correlação para a posição geográfica Norte (a,c) e Leste (b,d),
para a variável CTC (cmolc dm-3), na camada de 0-20 cm do solo, com 273 e 254
amostras.................................................................................................................... 43
Figura 10 – Gráfico de correlação para a posição geográfica Norte (a,c) e Leste
(b,d), para a variável CTC (cmolc dm-3), na camada de 0-20 cm do solo, com 250 e
240 amostras............................................................................................................. 43
Figura 11 – Semivariâncias com Step de 40 metros, para a variável CTC (cmolc dm3
), na camada 0-20 cm do solo, sem retirada de tendência. ..................................... 45
Figura 12 – Semivariâncias com Step de 56 metros, para a variável CTC (cmolc dm3
), na camada 0-20 cm do solo, sem retirada de tendência. ..................................... 45
Figura 13 – Semivariograma experimental ajustado ao Modelo Exponencial, para a
variável CTC (cmolc dm-3), com Step de 56 metros. .................................................. 46
Figura 14 – Semivariograma experimental ajustado ao Modelo Gaussiano, para a
variável CTC (cmolc dm-3), com Step de 56 metros. .................................................. 48
Figura 15 – Semivariograma experimental ajustado ao Modelo Esférico, para a
variável CTC (cmolc dm-3), com Step de 56 metros. .................................................. 48
Figura 16 – Gráficos com a validação para os Modelos estudados, com as variáveis:
Correlação Linear (a), Correlação Angular (b), Coeficiente de Correlação (c),
Moderada dos Erros (d), Variâncias (e), Índice Jack-Knifing-IJK (f) e RMSE (g) ...... 51
Figura 17 – Mapa da área amostral, antes da Krigagem (a) e após a Krigagem (b),
considerando o modelo exponencial, usando sete vizinhos, para a variável CTC
(cmolc dm-3), na camada de 0-20 cm do solo ............................................................ 52
Figura 18 – Mapa de superfície tridimensional da área amostral, antes da Krigagem
(a) e após a Krigagem (b), considerando o modelo exponencial, usando sete
vizinhos, para a variável CTC (cmolc dm-3), na camada de 0-20 cm do solo ............. 53
Figura 19 – Mapa de superfície tridimensional da área amostral escalonado, após a
Krigagem, considerando o modelo exponencial, usando sete vizinhos, para a
variável CTC (cmolc dm-3), na camada de 0-20 cm do solo. ...................................... 54
LISTA DE TABELAS
Tabela 1 – Resultados das estatísticas descritivas para a variável CTC (cmolc dm-3),
0-20cm do solo com e sem outliers. .......................................................................... 38
Tabela 2 – Resultados dos testes de aderência para a variável CTC (cmolc dm-3), 020cm do solo com e sem outliers .............................................................................. 39
Tabela 3 – Estimativas dos parâmetros dos semivariogramas: exponencial,
gaussiano e esférico com passo de 56 metros, Índice de Dependência Espacial e
Razão de Aleatoriedade ............................................................................................ 44
Tabela 4 – Resultados de análise de regressão para a retirada de tendência linear,
para a variável CTC (cmolc dm-3), 0-20cm do solo .................................................... 46
Tabela 5 – Resultados de análise de regressão para a retirada de tendência
quadrática, para a variável CTC (cmolc dm-3), 0-20cm do solo.................................. 46
SUMÁRIO
1 INTRODUÇÃO ....................................................................................................... 12
2 REVISÃO DE LITERATURA ................................................................................. 14
3 GEOESTATÍSTICA ................................................................................................ 16
3.1 EXEMPLOS DE DADOS AGRONÔMICOS COM DEPENDÊNCIA ESPACIAL ......................... 17
3.2 VARIÁVEIS REGIONALIZADAS ................................................................................... 17
3.3 SEMIVARIOGRAMA .................................................................................................. 18
3.3.1 Modelos Teóricos de Semivariograma ............................................................. 19
3.3.1.1 Modelo esférico ............................................................................................ 19
3.3.1.2 Modelo exponencial ...................................................................................... 19
3.3.1.3 Modelo gaussiano ........................................................................................ 20
3.3.1.4 Modelo linear ................................................................................................. 20
3.4 COVARIÂNCIA ........................................................................................................ 20
3.5 CORRELOGRAMA.................................................................................................... 21
3.6 KRIGAGEM ................. ........................................................................................... 22
4 MATERIAIS E MÉTODOS ..................................................................................... 24
4.1 CAPACIDADE DE TROCA DE CÁTIONS – CTC ............................................................ 24
4.2 LOCAL EXPERIMENTAL E AMOSTRAGEM DO SOLO ..................................................... 24
4.3 ANÁLISE EXPLORATÓRIA DESCRITIVA E GRÁFICA ..................................................... 27
4.3.1 Cartas de Controle ........................................................................................... 28
4.3.2 Retirando Tendências ...................................................................................... 29
4.3.2.1 Tendências linear e quadrática ..................................................................... 30
4.3.3 Semivariogramas ............................................................................................ 31
4.3.3.1 Parâmetros do semivariograma .................................................................... 32
4.3.3.2 Razão de aleatoriedade e índice de dependência espacial .......................... 33
4.3.4 Método da Validação por Jack-Knifing ............................................................. 34
4.4 SOFTWARES UTILIZADOS ........................................................................................ 36
5 RESULTADOS E DISCUSSÃO ............................................................................. 37
5.1 ANÁLISE ESTATÍSTICA ............................................................................................ 37
5.1.1 Análise Descritica e Exploratória Espacial ....................................................... 37
5.1.1.1 Box-plot ......................................................................................................... 38
5.1.1.2 Testes de aderência ...................................................................................... 39
5.1.1.3 Cartas de controle ......................................................................................... 40
5.1.1.4 Histogramas .................................................................................................. 41
5.1.1.5 Testes de correlação espacial ....................................................................... 42
5.2 ANÁLISE GEOESTATÍSTICA ...................................................................................... 44
5.2.1 Semivariogramas ............................................................................................. 45
5.2.1.1 Retirando tendências..................................................................................... 45
5.2.1.2 Semivariograma exponencial ........................................................................ 46
5.2.1.3 Semivariograma gaussiano ........................................................................... 47
5.2.1.4 Semivariograma esférico ............................................................................... 48
5.2.2 Técnica deValidação de Jack-Knifing ............................................................... 49
5.2.3 Krigagem ......................................................................................................... 52
6 CONCLUSÃO ........................................................................................................ 55
7 REFERÊNCIAS ...................................................................................................... 56
APÊNDICES ............................................................................................................. 63
APÊNDICE A – PLANTA TOPOGRÁFICA PLANIALTIMÉTRICA NA ESCALA 1:1000 ORIGINAL
PARA A PESQUISA REALIZADA....................................................................................... 64
APÊNDICE B – DADOS ORIGINAIS DEPOIS DE RETIRADOS OS OUTLIERS MENORES QUE 8,7 E
MAIORES QUE 17,32 TOTALIZANDO 240 AMOSTRAS ....................................................... 65
APÊNDICE C – PLANILHA EM EXCEL COM CÁLCULOS DOS AJUSTES AOS MODELOS PARA
SEMIVARIOGRAMAS ...................................................................................................... 70
APÊNDICE D – PLANILHA EM EXCEL COM VALORES CALCULADOS PARA VALIDAÇÃO, PARA OS
MODELOS EXPONENCIAL, GAUSSIANO E ESFÉRICO, UTILIZANDO JACK-KNIFING................... 71
12
1 INTRODUÇÃO
Um dos fatores mais discutidos na pesquisa agronômica é a
variabilidade experimental, e uma das áreas da ciência onde este problema ocorre
com frequência é a Ciência do Solo. O primeiro ponto é a desuniformidade no solo
que ocorre principalmente devido ao desequilíbrio dos macro e micronutrientes. O
segundo é como amostrar, detectar, avaliar e analisar esta variabilidade. O terceiro
e último ponto é como analisar estatísticamente os resultados de pesquisa oriundos
dos solos brasileiros.
Esta preocupação com a variabilidade experimental sob a visão
estatística ocorreu com Fisher (1935), quando sugeria que os experimentos de
campo sob o delineamento de blocos ao acaso fossem aleatorizados os
tratamentos e repetidos na área experimental. Essa metodologia foi questionada,
por alguns autores e recomendada por outros com algumas modificações, pois não
se obtinham resultados satisfatórios dos efeitos dos tratamentos estudados devido
a variabilidade experimental e a ausência da posição geográfica das amostras
(Vieira et al., 1981; Grondona & Cressie,1991).
Após algumas décadas surgiu uma nova metodologia para análise de
dados que apresentavam aspectos aleatórios e espaciais, avaliando a dependência
espacial denominada de Geoestatística. Esse método é fundamentado na teoria
das variáveis regionalizadas (VR), em que as amostras coletadas da variável em
estudo são georreferenciadas (Matheron, 1963).
Cabe aqui apresentar algumas definições que diferenciam a
estatística de Ronald Fisher e a Geoestatística. A Estatística é o ramo da
Matemática onde se trata da coleta, análise, interpretação e apresentação de um
grupo de dados numéricos, sendo a Geoestatística um ramo da Estatística onde se
estuda variáveis regionalizadas (VR), discutida por Matheron (1963). Inicialmente a
Geoestatística foi utilizada nas pesquisas na Geologia e Mineração, na década de
1950, na África, com dados de concentração de ouro, do engenheiro de minas
Daniel G. Krige e do estatístico H. S. Sichel.
No estudo da variabilidade de um solo, além da caracterização do
mesmo, podemos também indicar o número e distribuição das amostras a serem
realizadas, permitindo mais detalhamento da área e dos seus resultados, conforme
13
Ortiz (2002).
A Geoestatística também nos fornece técnicas para confecção de
mapas com variáveis georreferenciadas, através do método de interpolação
denominado de krigagem.
Quanto ao desenvolvimento temporal da Geoestatística, temos que
no período até 1968 ela foi empregada para estimar reservas naturais, entre 1968 e
1970 foi desenvolvida a Teoria da Krigagem Universal, em 1972 Matheron
formalizou seu uso aplicando a Meteorologia, entre 1972 e 1973 surgiram os
princípios da Análise Convexa, com a finalidade de maximizar as reservas
recuperáveis de jazidas subterrâneas e em 1974, nasce a teoria das funções de
recuperação para reservas, conforme Rosa Neto (2009).
Após a análise inicial dos dados, devemos extrair da aparente
desordem dos mesmos, mostrados nos mapas da Figura 2, uma imagem de
variabilidade dos mesmos. Com uma medida de correlação entre os valores
tomados em dois pontos específicos do espaço, por meio do Semivariograma, e
após esta análise, interpolar os valores das amostras pelo método da Krigagem
ordinária, com expressão deste resultado em forma de mapa de contornos ou de
superfície. Esse método viabiliza a predição e os erros padrões da predição para os
pontos não amostrados, e não requer o prévio conhecimento da média e será
aplicado para avaliar a estrutura da dependência espacial na variável CTC (cmolc
dm-3) obtida em solos hidromórficos.
Os objetivos principais deste trabalho foram:
a) Utilizar a análise exploratória por meio das estatísticas descritivas básicas,
gráficos de box-plot, carta de controle, histograma de frequências, na
avaliação do padrão espacial dos dados e na presença de valores
discrepantes;
b) Identificar por meio dos semivariogramas experimentais e ajustados a
modelos se os dados de CTC apresentam dependência espacial;
c) Aplicar o método da krigagem ordinária para interpolar pontos entre os
valores amostrados;
d) Selecionar entre os modelos exponencial, esférico e gaussiano aquele que
melhor representa a continuidade espacial nos dados da CTC;
e) Realizar análise de correlação espacial no sentido Leste e Norte e,
f) Realizar mapas de contorno e superfície antes e após a krigagem.
14
2 REVISÃO DE LITERATURA
Na década de 1980 no Brasil foram iniciados estudos de dados com
dependência espacial e, assim o aparecimento de resultados de pesquisas em
diferentes áreas da ciência com o uso do método geoestatístico, com dados
georreferenciados
e, em ciência do solo este estudo vem se destacando na
nutrição e fertilidade do solo e no manejo da cultura.
Um dos primeiros trabalhos realizados no Brasil utilizando-se a
metodologia com estudo geoestatístico foi o estudo da variabilidade de medidas de
taxa de infiltração de água no solo (Vieira et al., 1981).
A Geoestatística é usada na Agricultura de Precisão, o que se
convencionou chamar o gerenciamento do processo de produção em função da
variabilidade. Vários cientistas de solos preocupados com a variação espacial e
temporal dos solos, porém sem os avanços na teoria da estatística espacial não
haviam conseguido explorar a potencialidade desta no trabalho com os dados
quantitativos para facilitar a compreensão desta variabilidade do solo. Grande parte
dos erros ao se adubar se dá pelos erros de amostragem do solo, daí a grande
importância de se definir corretamente o plano amostral, onde possibilita o uso da
Geoestatística, conforme Carvalho et al. (2002).
Com o uso das análises estatísticas convencionais propostas na
década de 50, nem sempre é possível descrever a variabilidade espacial, pois não
se leva em conta a posição geográfica das amostras no campo. Necessita-se então
de ferramentas que considerem a localização espacial destas amostras. Conforme
Gonçalves et al. (1999) os métodos geoestatísticos vem de encontro justamente a
isso, pois possibilitam não apenas modelar a estrutura de dependência espacial,
mas também a confeçção de mapas da propriedade estudada na área em questão
pela interpolação da krigagem, e avaliar e descrever a correlação espacial que
existem entre as propriedades do solo estudado.
A variabilidade espacial foi estudada também em relação a
micronutrientes no solo (Boro (B), Cobre (Cu), Manganês (Mn) e Zinco (Zn)), em
15
uma área sob pivô central no sul do Mato Grosso por Couto et al. (1999), mostrando
que a interpolação por krigagem permite estimar efeitos espaciais impostos pelas
práticas de manejo, viabilizando uma aplicação diferencial de corretivos, com uma
otimização do uso dos mesmos.
Na agricultura foi sugerido por Farias (1999) o uso do método
geoestatístico associado aos conhecimentos biológicos e agronômicos para auxiliar
no controle de pragas, em especial aos nematóides em algodoeiros, sugere
também o uso no programa de agricultura de precisão.
16
3 GEOESTATÍSTICA
Após a experiência que houve na África do Sul, protagonizada por
Daniel G. Krige e do estatístico H. S. Sichel, o matemático probabilístico Matheron
(1963) deu prosseguimento destas pesquisas, formalizando as observações
anteriores com uma linguagem rigorosa, intitulando de teoria das variáveis
regionalizadas (VR), que também recebeu o nome de geoestatística por ter sido a
sua aplicação, inicialmente, direcionada a situações em Geologia e Mineração.
A variável aleatória é modelada em geoestatística por (Santana,
2008):
Z(s)=T(s)+ W(s)+e(s),
onde se admite que a variação de uma variável pode ser expressa pela soma de
três componentes:
T(s) - Associado a um valor médio constante ou a uma tendência constante;
W(s) - Componente aleatório espacialmente correlacionado;
e(s) - Ruído aleatório ou erro residual
Tem-se que T(s) é uma função determinística que descreve a
componente estrutural de Z em s, W(s) é um termo estocástico, que varia
localmente e depende espacialmente de T(s) e por fim e(s) é um ruído aleatório não
correlacionado, normalmente distribuído, com média zero e variância σ2 N ≅ (0, σ 2 ) .
Na prática, não é possível conhecer as funções de distribuição de
Z(s) em detalhe, por esse motivo, utilizam-se alguns pressupostos sobre o
comportamento das funções. Normalmente, assume-se que as variáveis são
descritas por funções conhecidas, do tipo gaussiano e lognormal, distribuições
essas consideradas como limite de todas as funções de distribuições contínuas,
conforme Santana (2008).
Não é possível obter repetições das amostras nos pontos
amostrados a partir de métodos extrativos. Assim, não é possível obter a função
distribuição no ponto e nem os momentos das variáveis Z(s).
17
Uma forma de solucionar este problema é utilizar os dados de todo
o campo para estimar a função de distribuição das variáveis aleatórias, isto é,
assumir que o comportamento da função de distribuição local é idêntico ao da
função de distribuição global. Essa abordagem nada mais é do que a aplicação da
hipótese de estacionariedade.
3.1 EXEMPLOS DE DADOS AGRONÔMICOS COM DEPENDÊNCIA ESPACIAL
Nas últimas décadas os resultados de pesquisa, que incluem a
dependência espacial têm sido observados em diferentes áreas da ciência.
Existe a afirmação que na coleta de dados de uma determinada
variável é importante considerar a posição espacial da amostra, seja em uma malha
regular ou irregular. No Brasil um dos primeiros trabalhos utilizando geoestatística
com dados georreferenciados foi feito por Vieira et al. (1981).
Na agricultura existem vários fatores que limitam a obtenção de
produções ótimas, um destes fatores é a carência nutricional, outros são as
diferentes pragas e doenças que atacam as diferentes culturas (Oliveira, 2003).
Uma das pragas que vitimou as lavouras no campo foram os
nematóides. Este parasita foi estudado por Farias (1999), na cultura do algodoeiro.
O autor utilizou a geoestatística para o conhecimento da distribuição espacial e o
monitoramento dos nematóides, permitindo ao pesquisador utilizar a rotação de
culturas na redução populacional de nematóides. O pesquisador utilizou uma malha
regular para a amostragem de nematóides.
3.2 VARIÁVEIS REGIONALIZADAS
A teoria da variável regionalizada (VR) desenvolvida por Matheron
(1971) vem sendo aplicada em várias áreas de pesquisa quando as variáveis
apresentam dependência espacial. Podemos citar dentre estas áreas: nematologia,
entomologia, fertilidade dos solos e agrometeorologia.
18
Uma das características qualitativas da VR é a ligada a sua
localização. Onde esta variável assume valores importantes conforme seu campo
geométrico, então a escolha do espaço geométrico não é arbitrário e deve ser
definido de forma a atender às condições de homogeneidade, o que é difícil na
prática.
Outra característica importante é a continuidade espacial, onde a
VR se manifesta pela tendência de que dois pontos próximos amostrados
apresentarem valores mais próximos, quanto mais perto eles estiverem.
3.3 SEMIVARIOGRAMA
O semivariograma é uma função matemática definida para
apresentar o nível de dependência entre duas variáveis aleatórias regionalizadas
locais e, para exemplificar, pode ser o grau de continuidade das propriedades da
fertilidade do solo. Elé é usado para modelar dois valores correlacionados no
espaço ou no tempo e é pré-requisito para a krigagem. Essa modelagem do
semivariograma pode ser ajustada em diferentes estruturas de correlação espacial
(Oliveira, 2003).
O semivariograma, pode ser definido matematicamente como:
1
γˆ (h) =
2N(h )
2
N( h )
∑ [Z(x
α ) − Z( x α
+ h) ]
α =1
em que,
N(h) é o número de pares de valores medidos Z(xi), Z(xi+h), separados por um
vetor h.
Resume as nuvens de pontos (z(x), z(x+h)) pela média do quadrado
das diferenças entre z(x) e z(x+h), para vários valores de h.
19
3.3.1 Modelos Teóricos de Semivariograma
O
método
de
ajuste
de
semivariogramas
teóricos
a
semivariogramas experimentais é denominado de método das aproximações
sucessivas, pois o processo de ajuste finaliza quando as discrepâncias entre os
valores experimentais e teóricos forem mínimas, conforme Oliveira (2003).
O semivariograma é uma ferramenta que permite descrever
quantitativamente, a variação no espaço de um fenômeno regionalizado. É uma
ferramenta que possibilita o estudo da dependência espacial entre amostras em um
campo experimental e define parâmetros necessários para se realizar a krigagem.
Existem tipos diferentes de modelos de semivariogramas, citaremos
aqui o modelo esférico, o modelo exponencial e o modelo gaussiano, todos com
patarmar, e o modelo linear (sem patamar). Os modelos com patamar têm como
parâmetros: o efeito pepita, a variância espacial e o alcance.
3.3.1.1 Modelo esférico
O modelo esférico ou modelo de Matheron, apresenta um
crescimento rápido na origem, alcança um patamar a uma distância h finita e é
representado por:
C ( 0 ) + C
γ (h) = 
C ( 0 ) + C
[
3 h
2 a
−
1
2
( ha )3 ], h ≤ a
,h > a
em que, C(0) é o efeito pepita, C é o patamar e a é o alcance.
3.3.1.2 Modelo exponencial
O modelo exponencial ou modelo de Formery, apresenta um
comportamento linear na origem, alcança seu patamar somente assintoticamente e
20
é representado por:
[
]
C (0) + C 1 − e− a , h ≤ a
γ (h) = 
C (0) + C
,h>a
h
Como a curva do gráfico tende assintoticamente ao patamar, o
alcance tem significado estritamente analítico.
3.3.1.3 Modelo gaussiano
O modelo de Gauss ou Parabólico tem comportamento parabólico
na vizinhança da origem e reflete uma grande continuidade da variável estudada e
por ser representado por:
C (0) + C 1 − e − ( ah )2  , h ≤ a



γ (h) = 
C (0) + C
,h > a
Semelhante ao modelo exponencial o alcance, no modelo
parabólico, tem significado puramente analítico.
3.3.1.4 Modelo linear
No modelo linear não admite-se patamar e pode ser representado
por: γ (h) = C (0) + phα .
Tem-se que p é a inclinação da reta que representa o
semivariograma, sendo utilizados valores de 0 < α < 2, com variância, a priori,
infinita.
3.4 COVARIÂNCIA
21
O estimador de covariância é definido como a média dos produtos
z(x) z(x+h)
1 N ( h)
∑ [Z ( xα )Z ( xα + h)]
N (h) α =1
C ' (h) =
é um estimador de covariância não centrada ou ainda o estimador de covariância
centrado:
C (h) =
1 N ( h)
∑ [Z ( xα )Z ( xα + h)] − m( xα )m( xα + h)
N (h) α =1
em que,
m( xα ) =
1 N ( h)
∑ Z ( xα ) e
N (h) α =1
m( xα + h) =
1 N ( h)
∑ Z ( xα + h)
N (h) α =1
são médias aritméticas de todos os pontos localizados em xa e xa+b, , α = 1,..., N(h).
3.5 CORRELOGRAMA
O correlograma é definido da seguinte maneira:
C (h)
ρ (h) =
2
σ ( xα )σ 2 ( xα + h)
onde temos que é a forma normalizada da covariância, em que:
σ 2 ( xα ) =
1 N ( h)
[Z ( xα ) − Z ( xα + h)]2 e
∑
N (h) α =1
σ 2 ( xα + h) =
Quando
1 N ( h)
2
∑ [Z ( xα + h) − m( xα + h)]
N (h) α =1
admitimos
as
hipóteses
de
estacionariedade
dos
acréscimos h, a média do quadrado dos desvios e a média dos produtos são
estimadores dos segundos momentos, confome Santana (2008).
O semivariograma é então expresso por:
1
2
{
γ (h) = E [Z ( x) − Z ( x + h)]2
}
22
e a covariância centrada por:
C (h) = E [Z ( x) Z ( xα + h)] − E [Z ( x)]E [Z ( x + h)]
Para funções aleatórias temos:
{
C (h) = E Z ( x) Z ( x + h) − E [Z ( x)]
2
}
C (h) = E{Z ( x) Z ( x + h)}− m 2
Desenvolvendo os quadrados da função semivariograma, então:
γ (h) =
1
2
2
E [Z ( x)] + E[Z ( x + h)] − 2 E [Z ( x) Z ( x + h)]
2
{
}
Com a admissão de hipótese de estacionariedade do primeiro
momento, tem-se:
γ (h) = E [Z ( x)]2 − E[Z ( x) Z ( x + h)].
Subtraindo-se m2 nos dois termos, então:
γ (h) = E [Z ( x)]2 − m 2 − [E [Z ( x) Z ( x + h)] − m 2 ],
então chega-se a relação entre variograma e a covariância:
γ (h) = C (0) − C (h) .
O correlograma fica: ρ (h) = C (h) C (0) .
O semivariograma aumenta à medida que h cresce até uma
determida amplitude indicando a falta de correlação entre pares de pontos
separados de h, enquanto que a covariância decresce.
3.6 KRIGAGEM
No estudo geoestatístico, se deseja o conhecimento de um
determinado atributo em estudo fora da região amostrada. A estimação é obtida
através de um estimador linear geoestatístico, denominado de krigagem, sendo
uma combinação linear de valores amostrados e pesos atribuídos a cada vizinho
(Oliveira, 2003). Esta predição pressupõe ausência de erros de medidas e
semivariogramas corretos. Sendo que considera-se um peso maior aos valores
observados na vizinhança e cada vez que os vizinhos se afastam, um peso menor,
nulo ou até negativo.
Pode ser obtido através de:
23
n
Zˆ ( x0 ) = ∑ λi z ( xi ) ,
i =1
onde
Zˆ ( x0 ) é o preditor para um ponto x0 , n é o número de
vizinhos utilizados, λi é o peso atribuído a cada vizinho e z ( xi ) é o valor observado
em cada vizinho. Deve-se ter
n
∑λ
i
= 1 , para garantir uma estimativa não viesada.
i =1
O método de determinação da vizinhança na estimativa da
krigagem é uma mescla entre os métodos da distância constante e dos vizinhos
constantes (Vieira, 1996).
Este preditor foi utilizado inicialmente por Matheron (1963) e seu
nome foi dado em homenagem aos trabalhos de dependência espacial na
mineração, realizados por Daniel G. Krige.
24
4 MATERIAIS E MÉTODOS
4.1 CAPACIDADE DE TROCA DE CÁTIONS – CTC
A CTC é a quantidade de cátions que um solo é capaz de reter por
unidade de peso ou volume. Para fins de química e classificação de solos, os
resultados são expressos por peso de solo. Para fertilidade, são comuns ambas as
maneiras, devendo-se dar preferência à expressão por volume, conforme Raij
(1939).
A disponibilidade de nutrientes para as plantas em um determinado
solo é permitida através da propriedade de troca de cátions, por esta razão este é
um dos mais importantes atributos dos solos.
Em grande parte dos solos brasileiros exige-se a aplicação de
calcário, conforme Quaggio (2000), desta forma, é essencial a quantificação dos
nutrientes presentes nos solos para a determinação da quantidade e tipo de
calcário a ser utilizado. Nos vários métodos de cálculo para a calagem sempre é
avaliado o histórico dos nutrientes dos solos e a CTC é de grande importância neste
processo, pois para sua determinação é necessário analisar o solo e determinar as
quantidades de K+, Na+, Ca2+, Mg2+, Al3+ e H+.
A CTC do solo é definida como sendo a soma total dos cátions que
o solo pode reter na superfície coloidal prontamente disponível à assimilação pelas
plantas. Estes cátions adsorvidos são removidos por soluções salinas de amônio,
cálcio, bário e soluções de ácidos diluídas e posteriormente determinados por
métodos volumétricos, de emissão ou absorção atômica, conforme Embrapa-CNPS
(1997).
4.2 LOCAL EXPERIMENTAL E AMOSTRAGEM DO SOLO
Os
dados
utilizados
neste
trabalho
foram
coletados
no
levantamento detalhado de solos da Estação Experimental de Campos de
25
Goytacazes, Fazenda Angra (Capeche et al., 1977), por pesquisadores da Empresa
de Pesquisa Agropecuária do Estado do Rio de Janeiro – Pesagro e da Embrapa
Solos. O solo teve suas características morfológicas, físicas e químicas
apresentadas em Oliveira (2003). A variável resposta a ser utilizada será a
Capacidade de Troca de Cátions – CTC (cmolc dm-3), na camada de 0-20 cm.
A área onde foi realizado o levantamento encontra-se ao Norte do
estado do Rio de Janeiro, à margem esquerda do Rio Paraíba do Sul, no município
de Campos dos Goytacazes (Figura 1), com as coordenadas geográficas
21°44’47’’S e 41°18’24’’ O.
Devido às enchentes do Rio Paraíba do Sul, à esquerda da fazenda
e à direita pelas enchentes das Lagoas dos Prazeres e Taquaruçu, houve a
deposição de sedimentos, que contribuiu para a grande variação nas propriedades
avaliadas no solo associadas às adubações realizadas na área experimental
(Oliveira, 2003).
Este levantamento faz parte do Projeto “Planejamento de uso das
terras da Estação Experimental de Campos/PESAGRO-RIO, e subsídios ao manejo
de irrigação”.
O principal objetivo deste levantamento foi o planejamento
adequado deste novo uso para esta área, bem como também coletar e analisar
amostras para
a formação de um banco de dados, tendo a representação do
histórico de nutrientes (macro e micronutrientes) de uma área com monocultivo de
cana-de-açúcar por cem (100) anos. Desta forma os pesquisadores poderão definir
de uma maneira mais clara e objetiva o uso para esta área.
Figura 1: Mapa do Estado do Rio de Janeiro, com o município de Campos dos
Goytacazes em destaque.
26
Neste trabalho foi analisado e considerado apenas a variável CTC
(cmolc dm-3).
A amostragem do solo foi realizada com trado holandês, em uma
malha regular, distando 900 metros para cada coordenada geográfica: norte e leste.
Esta malha foi idealizada com espaçamento de 50 metros, totalizando 273 amostras
(Figura 2-a), foram consideradas 254 amostras em um primeiro momento (Figura 2b), em um segundo momento considerou-se 250 amostras (Figura 2-c) e após
algumas análises reduziu-se este número a 240 amostras (Figura 2-d).
As
amostras
de
solo
coletadas
de
forma
regionalizadas
possibilitaram a análise espacial da direção da variabilidade da variável CTC,
permitindo mapear esta variabilidade.
A área considerada neste estudo foi cultivada por cem anos com a
cultura da cana-de-açúcar e este processo de monocultura foi interrompido e está
sendo substituído por cultivo de culturas anuais.
6000
6000
A
5800
5600
5600
5400
5400
LESTE
LESTE
5800
5200
5200
5000
5000
4800
4800
4600
4800
5000
5200
5400
5600
5800
6000
B
4600
4800
6200
5000
5200
NORTE
C
5600
6000
6200
D
5400
5400
LESTE
LESTE
5800
5800
5600
5200
5200
5000
5000
4800
4800
4600
4800
5600
NORTE
6000
5800
5400
5000
5200
5400
5600
NORTE
5800
6000
6200
4600
4800
5000
5200
5400
5600
5800
6000
6200
NORTE
Figura 2: Mapa de amostragem em malha regular, com 273 amostras (a), 254 e
250 amostras (b,c), na presença de outliers, e 240 amostras (d) sem a presença de
outliers para a variável CTC (cmolc dm-3), na camada de 0-20 cm do solo.
Os valores da CTC (cmolc dm-3), com sua distribuição pela área,
27
são mostrados na Figura 3, com um escalonamento de 20% para cada série de
dados.
5700
5600
5500
5400
LESTE
5300
5200
5100
5000
4900
4800
5000 5100 5200 5300 5400 5500 5600 5700 5800 5900 6000
NORTE
8.72 to 11.62
11.62 to 12.80
12.80 to 13.43
13.43 to 14.61
14.61 to 17.32
Figura 3: Mapa de distribuição amostral, em malha regular, com 240 amostras,
sem a presença de outliers para a variável CTC (cmolc dm-3), na camada de 0-20
cm do solo.
4.3 Análise Exploratória Descritiva e Gráfica
O conhecimento detalhado de um banco de dados de pesquisa é
uma das fases mais importantes em todas as áreas da ciência. Sejam dados
provenientes de uma pesquisa básica, de um levantamento amostral, de um
delineamento
experimental
clássico
ou
de
delineamento
sistematizado
28
(georreferenciado). Nesta fase é imprescindível conhecer entre os métodos
exploratórios aquele que dará informações com precisão sobre um conjunto de
dados para que o fenômeno em estudo não tenha uma resposta equivocada.
A análise exploratória utiliza-se de métodos gráficos e quantitativos
que permite verificar se as hipóteses planejadas no experimento são válidas.
Dentre os procedimentos utilizados para elaborar um diagnóstico
exploratório existem as medidas de posição em que são calculadas a média,
mediana, moda e as medidas de dispersão como a variância, desvio padrão, erro
padrão, amplitude e coeficiente de variação. Além destas estatísticas podem ainda
serem utilizados os coeficientes de assimetria e curtose e análise de regressão
como
métodos
exploratórios.
Os
diferentes
tipos
de
gráficos
lineares,
tridimensionais, o box-plot, as cartas de controle, gráfico de ramos e folhas,
histograma de frequências e scatterplot dos resíduos podem também avaliar a
presença de dados discrepantes também chamados de outliers. Muitas são as
literaturas onde é mencionada a necessidade de utilizar antes de análise estatística
confirmatória a aplicação da análise exploratória (Hoaglin et al., 1992; Oliveira et al.,
1998)
4.3.1 Cartas de Controle
As cartas de controle são gráficos utilizados com frequência na
indústria para avaliar o controle de qualidade na produção de peças. Permite obter
resultados com um pouco mais de rigor estatístico podendo utilizar seus limites de
controle no intervalo de 3σ , em que σ é o desvio padrão populacional do conjunto
de dados. Esses gráficos possuem três linhas paralelas, a central que representa o
valor médio da característica da qualidade, a superior que representa o limite
superior do controle (LSC) e a inferior, que representa o limite inferior de controle
(LIC). Os pontos representam as amostras tomadas em momentos diferentes,
conforme (Vieira, 1999; Oliveira et al., 2008).
29
4.3.2 Retirando Tendências
Várias são as etapas para identificar se realmente um banco de
dados apresenta no semivariograma uma estrutura de dependência espacial
(Figura 4) e, se além deste fato, a mesma é bem definida com patamar estável e
sem tendência de qualquer grau.
Pesquisadores da Ciência do Solo conscientes que os dados
referentes aos nutrientes do solo não são independentes utilizam-se de vários tipos
de gráficos e métodos estatísticos para verificar as tendências (Vieira et al., 2002;
Carvalho et al. 2002; Vidal Vasquez et al., 2009).
Uma das formas é elaborar gráficos pós-plot no qual é possível
verificar as diferentes classes com mesmo símbolos indicando subregiões para
alguma direção (Ortiz, 2002). De acordo com a autora não devem ter padrões no
gráfico. Os valores da CTC (cmolc dm-3), com sua distribuição pela área por quartis,
são mostrados na Figura 4.
Os métodos de regressão linear e quadrático ou de maior grau
permitem, por meio dos coeficientes de determinação, avaliar (Vidal Vasquez et al.,
2009) se existem tendências.
30
5700
5600
5500
5400
LESTE
5300
5200
5100
5000
4900
4800
5000 5100 5200 5300 5400 5500 5600 5700 5800 5900 6000
NORTE
QUARTIS
8.7214 to 11.9421
11.9421 to 13.0823
13.0823 to 14.1463
14.1463 to 17.3200
Figura 4: Mapa de distribuição amostral distribuído por quartis, em malha regular,
com 240 amostras, sem a presença de outliers para a variável CTC (cmolc dm-3), na
camada de 0-20 cm do solo.
4.3.2.1
Tendências linear e quadrática
A existência de violação da hipótese intrínseca (patamar definido)
representa um campo em que o valor médio depende da posição espacial (Vieira et
al., 2010). O autor afirma de uma superfície que a forma mais simples de remover
a tendência tridimensional é pelo método dos quadrados mínimos e subtraindo os
valores a partir do modelo original.
Seguem abaixo as formas linear e quadráticas apresentadas pelo
autor e que serão utilizadas neste trabalho.
31
a) Tendência Linear
Z * ( x, y ) = A 0 + A 1 X + A 2 Y
em que,
Z * ( x, y) é a superfície de tendência estimada;
X e Y são as coordenadas de posição;
A 0 , A 1 e A 2 são os parâmetros de regressão determinado pelo método dos
quadrados mínimos.
b) Tendência Quadrática
Z * ( x, y ) = A 0 + A 1 X + A 2 Y + A 3 X 2 + A 4 XY + A 5 Y 2
em que, Z * (x, y) é a superfície de tendência estimada;
X e Y são as coordenadas de posição;
A 0 , A1 , A 2 , A 3 , A 4 e A 5
são os parâmetros de regressão determinado pelo método
dos quadrados mínimos .
4.3.3 Semivariogramas
Após a retirada de tendência, uma das ferramentas que permite
identificar se um conjunto de dados apresenta dependência espacial é o
semivariograma e a função de semivariância proposta por Journel & Huijbregts
(1978) é a esperança matemática da variável aleatória [(Z(x + h) − Z(x)] , representada
pela expressão abaixo:
γ ( x, h) =
{
1
E [(Z( x + h) − Z( x) ]2
2
}
E as estimativas dos parâmetros são obtidas na seguinte
expressão:
1
γˆ (h) =
2N(h )
2
N( h )
∑ [Z(x
α ) − Z( x α
+ h) ]
α =1
A análise da dependência espacial é baseada na suposição que
medidas separadas por distâncias pequenas são mais semelhantes umas às
32
outras, que aquelas separadas por distâncias maiores e a representação desta
dependência encontra-se na Figura 5 (Bolfe et al., 2007).
γ(h)
Dispersão
C
Nugget
(Pepita)
C0
GEO ESTATÍSTICA
C + C0
Sill
(Patamar)
0
Figura 5:
a
Range (Alcance)
h
Esquema representando a estrutura de um semivariograma teórico,
adaptado de Rosa Neto (2009).
O estudo da dependência espacial obtida pela análise da função de
covariância espacial (semivariograma) não constitui o objetivo final da análise
espacial. Na realidade é necessário estimar os valores das variáveis em locais não
amostrados visando o conhecimento da distribuição espacial de certa variável em
estudo. Desta forma, a análise da estrutura espacial deve ser vista como um passo
fundamental, mas não final que, precede as técnicas de estimação (interpolação),
de qualquer valor em qualquer posição da área em estudo, sem tendência e com
variância mínima. Os métodos de Krigagem são métodos de interpolação que
procuram minimizar o erro de estimação e este erro é nulo.
4.3.3.1
Parâmetros do Semivariograma
Na Figura 5 pode-se avaliar cada um dos parâmetros do
semivariograma. O Nugget ou efeito Pepita (C0) é a variabilidade não explicada,
então conclui-se que quanto menor seu valor, melhor o modelo correspondente. O
alcance é de fundamental importância para a interpretação dos semivariogramas.
Ele indica a distância até onde os pontos amostrais estão correlacionados entre si.
Com o conhecimento do alcance da dependência espacial, define-se o raio de
amostragem, e, para garantir em uma amostragem futura nas mesmas condições
33
do experimento. Esse parâmetro indica a zona de influência de uma amostra, ou
seja, a distância máxima até onde uma amostra (ou seu valor) possui relação de
dependência espacial com seu próximo (Silva et al., 2001), depende do tamanho da
área amostrada e da escala de observação realizada, sendo maior quanto maior for
o intervalo entre as medidas (Vieira et al., 1983; Souza et al., 1997; Vieira, 1997;
Bolfe et al., 2007). O último autor enfatiza que quanto maior for a diferença entre o
Nugget e o patamar (Sill) do semivariograma, maior será a continuidade do
fenômeno e menor a variância da estimativa, ou seja, maior a confiabilidade que se
pode ter na estimativa gerada (Figura 5).
4.3.3.2 Razão de Aleatoriedade e Indice de Dependência Espacial
Avalia-se a força da dependência espacial através da Razão de
Aleatoriedade (RA):
.
A aleatoriedade pode ser classificada como Forte, Moderada ou
Fraca, segundo Cambardella et al. (1994), citado por Miritz et al. (2009). Em uma
Aleatoriedade Baixa o Nugget situa-se abaixo ou igual a 25% da proporção,
enquanto que na Média, maior que 25% e menor ou igual 75%, já em uma
Aleatoriedade Alta, tem-se RA maior que 75%.
Assim como avalia-se a aleatoriedade pela RA, avalia-se o Índice
de Dependência Espacial (IDE), pela expressão abaixo:
34
4.3.4 Método da Validação por Jack-Knifing
A técnica de Jack-knifing é um método de validação que verifica se
um modelo de semivariograma descreve adequadamente a dependência espacial
(Vieira et al., 2010).
A seleção do melhor modelo, que define a dependência espacial, não
se resume apenas em ter um modelo com menor valor de nugget, deve estar
associado aos parâmetros obtidos com à aplicação do método de jack-knifing que
medirá a qualidade de ajuste (Carvalho et al., 2002).
De acordo com Vieira, et al. (2010), com o valor mensurado e outro
obtido pelo método da krigagem, considerando uma série de tamanhos de vizinhos
são gerados valores estimados e variâncias estimadas. O autor utilizou seis
parâmetros diferentes para usar como critério para julgar a performance do modelo
do semivariograma os quais também serão avaliados neste trabalho.
Considerando as N medidas Z( x i ) e as N medidas estimadas pelo
procedimento de Jack-knifing Z * ( x i ) realiza-se a regressão linear 1 a 1 e a forma
descrita será:
a) Análise de Regressão
Z * ( x i ) = a + b Z( x i )
em que,
a é o intercepto,
b é o coeficiente angular
R2
é o coeficiente de determinação entre Z * ( x i ) e Z( x i )
As estimativas dos parâmetros da regressão linear entre dados pareados, os
coeficientes linear e angular estimados devem ser iguais a (a=0, b=1)
respectivamente e o valor do coeficiente de determinação igual a um (r2=1) (Vieira
et al., 2010).
b) Erro Reduzido
35
Outro parâmetro do Jack-Knifing considerando os valores estimados
pela krigagem [ Z * ( x i ) ] pode-se obter também a estimativa da variância σ k2 ( x i ) que
corresponde a incerteza do processo de estimação. Desta forma pode-se definir o
Erro Médio como:
RE ( XI ) =
[z
*
( XI ) -
z ( XI )
]
σk (x i )
A divisão pela raiz quadrada da estimativa da variância produz o Erro
Reduzido RE ( XI ) , para ser adimensional que é uma situação conveniente para
comparação entre diferentes variáveis.
O erro médio absoluto e o erro reduzido devem ser zero e a variância
do erro absoluto seja mínima e a variância do erro reduzido igual um. Com estas
estimativas é possível construir mapas de isolinhas ou tridimensionais para detectar
e interpretar a variabilidade espacial (Carvalho et al., 2002; Vieira et al., 2010).
O pré-requisito da condição não viesada da estimativa da krigagem e
da variância mínima são dadas pelas seguintes expressões:
R E = E{RE ( xi) } = {
E(Z *( Xi) - Z(xi))
VAR (R E ) = E{RE ( xi) } = {
σ k ( xi)
}=0
E(Z *( Xi) - Z(xi))
σ k ( X 0)
}2 = 1
Conforme Vieira et al. (2010) estas propriedades são
muito valiosas como ferramentas de validação dos procedimentos geoestatísticos.
O ideal como ponto de referência é que estas propriedades sejam fixadas em 0
(zero) e 1 (um).
c) Raiz Quadrada da Soma de Quadrado do Erro
Um novo parâmetro do Jack-Knifing é de extrema
importância nesta validação e pode ser escrita conforme a expressão abaixo:
RMSE =
1
N
∑ [Z
*
(xi)
− Z (xi) ] 2
36
Conforme o autor existe desvantagem neste tipo de erro porque não
tem padrão para ser comparado. Portanto, os melhores resultados da técnica de
Jack-knifing seriam obtidos quando o RMSE é mínimo (Vieira et al., 2010).
4.4 SOFTWARES UTILIZADOS
Para a execução deste trabalho foram utilizados para a análise
gráfica e estatística os seguintes programas: Statsoft, inc. (2004), Statistica (Data
Analysis Software System), version 7. www.statsoft.com ; Surfer version 9.9.785 –
mar 26.2010, surface mapping system, www.goldensoftware.com ; GEOEST –
Software para cálculos de geoestatística, Sidney Rosa Vieira, IAC, Campinas, SP.
37
5 RESULTADOS E DISCUSSÃO
5.1 ANÁLISE ESTATÍSTICA
Anterior a qualquer método estatístico ou geoestatístico é
essencial que se conheça a distribuição espacial e a variabilidade dos dados. É por
meio da análise exploratória descritiva e gráfica que vem de encontro a esta
necessidade, nos auxiliando grandemente nestes estudos (Oliveira et al., 1998).
5.1.1 Análise Descritiva e Exploratória Espacial
As estatísticas descritivas para variável CTC (cmolc dm-3), na
presença e ausência de outliers, indicaram valores para a média e mediana bem
próximos com leve assimetria e curtose aproximando-se de zero. Foram utilizados
os valores do conjunto de dados com 240 amostras após a retirada de outliers
(Tabela 1). Houve redução na variância após este procedimento e em
consequência redução no coeficiente de variação. Esse primeiro passo da análise
exploratória permitirá a obtenção de estimativas com confiabilidade para a
sequência deste estudo.
Vários autores vão além destas estatísticas da Tabela 1 salientando
que outros métodos estatisticos como os testes de normalidade, os gráficos
tridimensionais, os gráficos h-scatterplot nos eixos x e y, os de box-plot, auxiliam na
tomada de decisão sugerindo também, o uso de técnicas robustas para avaliar os
dados. Afirmam que a presença de dados discrepantes podem mascarar os
resultados de pesquisa. Alertam também que os outliers podem ser o objetivo
principal da pesquisa (Bustos, 1988; Hoaglin et al., 1992; Libardi et al., 1996).
Foram utilizados os gráficos de Box-Plot e as Cartas de Controle (Oliveira et al.,
2008), para visualizar a presença ou ausência de outliers em vários passos nos
próximos itens. Além destes gráficos também foram aplicados os testes de
38
normalidade de Kolmogorov-Smirnov (Campos, 1983) e Shapiro & Wilk (1965).
Tabela 1: Resultados das estatísticas descritivas para a variável CTC (cmolc dm-3),
0-20cm do solo com e sem outliers.
Com Outliers Com Outliers Com Outliers Sem Outliers
Estatísticas
Nº Observações
273
254
250
240
Média
12,86
12,98
13,02
13,10
Mediana
12,57
13,06
13,07
13,08
Mínimo
5,55
7,88
8,24
8,72
Máximo
21,30
17,82
17,64
17,32
Amplitude Total
15,75
9,94
9,40
8,60
Variância
6,64
4,19
3,85
3,14
Coeficiente de Assimetria
-0,24
-0,14
-0,09
0,06
Coeficiente de Curtose
0,81
0,10
0,03
-0,13
Desvio Padrão
2,58
2,05
1,96
1,77
Coeficiente de Variação (%)
20,06
15,79
15,05
13,51
5.1.1.1 Box-plot
A presença de outliers nos dados remetem a resultados
indesejáveis e, além disso, não atendem as pressuposições da análise de variância,
conforme Sibaldelli et al. (2005). Na Figura 6, observou-se um grande número de
outliers, e foram retirados 19 amostras e após nova análise, decidiu-se pela retirada
de mais quatro amostras, estabelecendo-se com um conjunto de dados formado por
250 amostras, sem a presença de outliers pela análise do box-plot. A maioria das
amostras retiradas estavam localizadas na região, em que na época das enchentes,
ficava alagada lixiviando nutrientes importantes do solo (Figura 2 a, b, c e d).
Embora no box-plot com 250 amostras não indicasse mais a
presença de outliers (Figura 6), pelo teste de normalidade de Shapiro & Wilk (1965)
e pelas cartas de controle (Oliveira et al., 2008) os resultados apresentam-se mais
contundentes indicando a ausência de normalidade devido a presença de outliers,
portanto, houve a necessidade de retirar mais dez pontos totalizando desta forma,
240 pontos (Figuras 2 d e Figura 6).
39
22
20
18
16
14
12
10
8
CTC_240
CTC_250
CTC_273
4
CTC_254
6
273
254
250
240
Média
25%-75%
Espaço Sem Outliers=
Amostras= 7,8814 - 17,8217;
Amostras= 8,2391 - 17,6419;
Amostras= 8,2391 - 17,6419;
Amostras= 8,7214 - 17,3198.
Outliers
Extremes
Figura 6: Box-Plot para a variável CTC (cmolc dm-3), na camada de 0-20
cm do solo, com 273, 254, 250 e 240 amostras.
5.1.1.2 Testes de aderência
Os testes de aderência foram realizados para os quatro conjuntos
de dados, sendo que a hipótese nula de normalidade para o teste de KolmogorovSmirnov (Campos, 1983) para todos os tamanhos de amostras para a variável CTC
(cmolc dm-3) foi aceita, ao contrário do teste de Shapiro & Wilk (1965), que só
apresentou normalidade dos dados com a amostra com 240 pontos (Tabela 2).
Tabela 2: Resultados dos testes de aderência para a variável CTC (cmolc dm-3), 020cm do solo com e sem outliers.
Métodos
Com Outliers
Com Outlier
Sem Outliers
Sem Outliers
273 amostras
254 amostras
250 amostras
240 amostras
VT
Prob
VT
Prob
VT
Prob
VT
Prob
KS
d=0,0704
p<0,15000
d=0,0552
p>.20
d=0,0504
p>.20
d=0,0507
n.s.
SW
W=0,9782
p=0,00035
W=0,9868
p=0,0192
W=0,9883
p=0,040
W=0,9916
p=0,187
KS= Kolmogorov-Smirnov; SW= Shapiro&Wilk; VT= Valor do Teste; Prob= Probabilidade
40
No conjunto de dados com 240 amostras os resultados dos testes
de normalidade de Kolmogorov-Smirnov (Campos, 1983) e de Shapiro-Wilk (1965)
a normalidade dos dados foi assegurada. Alguns autores afirmam que, embora a
normalidade dos dados não seja exigência do método geoestatístico possibilitando
distribuições de frequências com ausência de caudas pesadas ou alongadas, os
coeficientes de assimetria devem se aproximar de zero e semivariogramas com
patamares bem definidos como da Figura 4 (Hoaglin et al., 1992; Cressie, 1991;
Carvalho & Vieira, 2001).
5.1.1.3 Cartas de controle
Os Gráficos de Controle obtidos para os quatro tamanhos de
amostras estão apresentados nas Figuras 7 a, b, c e d e indicou a presença de
outliers nas primeiras amostras e sem a presença de outliers no agrupamento com
240 amostras.
Nas cartas de controle foram utilizados como limites superiores e
inferiores, o valor de 3σ , acima e abaixo do valor médio (Figura 7). Nota-se um rigor
maior nos gráficos de controle do que nas análises com o Box-Plot. O uso dos
gráficos de controle e do Box-Plot, reforça a necessidade de análise cuidadosa dos
dados durante o processo da análise descritiva e análise exploratória espacial
(Oliveira et al., 1998). Embora no Box-Plot indique que pode-se usar um
agrupamento com 250 amostras, optou-se pelos resultados das cartas de controle
e os testes de normalidade, definindo o agrupamento de dados a ser utilizado nas
análises geoestatísticas com 240 amostras. Este conjunto possui valores de
assimetria e curtose melhores que os demais conjuntos (Tabela 1).
41
22
20
22
Média = 12,858
Sigma = 1,7594
A
18,136
18
16
10
12,982
12
10
8
7,5794
6
8,4859
8
6
4
50
100
150
200
4
250
50
100
150
200
250
22
C
Média = 13,023
Sigma = 1,4557
Média = 13,101
Sigma = 1,5558
20 D
18
17,390
16
18
17,768
16
14
13,023
12
10
14
13,101
12
10
8,6561
8
6
4
17,477
14
12,858
12
20
18
16
14
22
Média = 12,982
Sigma = 1,4986
B
20
8,4340
8
6
50
100
150
200
250
4
50
100
150
200
Figura 7: Gráficos de controle, com intervalo de 3σ , para a variável CTC (cmolc dm3
), na camada de 0-20 cm do solo, com a) 273, b) 254 c) 250 amostras na presença
de outliers e d) 240 amostras sem outliers.
5.1.1.4 Histogramas
Os histogramas sob a curva normal para a variável CTC (cmolc dm3
), com e sem outliers para os quatro tamanhos de amostra indicaram a presença
de assimetria e curtose. Retirando os outliers, foram obtidos diferentes ajustes
(Figura 8).
42
140
70
A
B
120
60
100
50
80
40
60
30
40
20
20
10
0
2
4
6
8
10
12
14
16
18
20
22
140
0
6
8
9
10
11
12
13
14
15
16
17
18
19
17
18
19
70
C
120
60
100
50
80
40
60
30
40
20
20
10
0
7
6
8
10
12
14
16
18
0
D
7
8
9
10
11
12
13
14
15
16
Figura 8: Distribuição de frequência sob a Curva Normal para a variável CTC
(cmolc dm-3), na camada 0-20 cm do solo, com outliers, com 273 amostras (a), com
254 amostras (b) e, com 250 amostras (c) e sem outliers com 240 amostras (d).
5.1.1.5 Testes de correlação espacial
As análises descritivas até o presente momento, fornecem
informações do comportamento da dispersão dos dados da CTC, porém não levam
em conta sua posição geográfica. Nas Figuras 9 e 10, foram obtidas baixa
tendência linear negativa em relação a direção Norte e uma baixa tendência
positiva em relação a direção Leste, para todos os conjuntos de dados, tanto com
outliers com 273, 254, 250 amostras, bem como sem outliers, no agrupamento com
240 amostras.
Os valores da correlação linear indicam que cada vez que retiramos
os outliers do conjunto de dados a inclinação da reta aumenta, tanto para valores
negativos em relação a direção norte, como para valores positivos em relação a
direção leste. Com 273 amostras e na direção norte, o valor de r = -0,1185
enquanto que no conjunto com 240 amostras o valor de r = -0,2972. Já em relação
a direção leste, no conjunto com 273 amostras o valor de r = 0,0646, enquanto para
43
o conjunto com 240 amostras o valor de r = 0,1087 (Figuras 9 e 10).
220
22
A
r = - 0,1181
200
273 amostras
r = 0,0646
273 amostras
18
16
-3
-3
CTC (cmolc dm )
160
CTC (cmolc dm )
B
20
180
140
120
100
14
12
10
80
8
60
6
40
4800
5000
5200
5400
5600
5800
6000
4
4600
6200
4800
5000
20
5400
5600
5800
6000
5800
6000
20
C
r = - 0,2137
D
254 amostras
18
16
16
r = 0,0682
254 amostras
-3
CTC (cmolc dm )
18
-3
CTC (cmolc dm )
5200
Leste
Nor te
14
12
14
12
10
10
8
8
6
4800
5000
5200
5400
5600
5800
6000
6
4600
6200
4800
5000
Norte
5200
5400
5600
Leste
Figura 9: Gráfico de correlação para a posição geográfica Norte (a,c) e Leste (b,d),
para a variável CTC (cmolc dm-3), na camada de 0-20 cm do solo, com 273 e 254
amostras.
20
20
r = - 0,2363
250 amostras
B
18
18
16
16
CTC (cmolc dm-3)
CTC (cmolc dm-3)
A
14
12
12
10
8
8
5000
5200
5400
5600
5800
6000
6
4600
6200
4800
5000
Norte
18
C
r = -0,2972
5400
5600
5800
6000
18
240 amostras
17
16
16
15
15
14
13
12
11
D
r = 0,1087
240 amostras
14
13
12
11
10
10
9
9
8
4800
5200
Leste
CTC (cmolc dm-3)
-3
CTC (cmolc dm )
17
250 amostras
14
10
6
4800
r = 0,1004
5000
5200
5400
5600
Norte
5800
6000
6200
8
4600
4800
5000
5200
5400
5600
5800
Leste
Figura 10: Gráfico de correlação para a posição geográfica Norte (a,c) e Leste
(b,d), para a variável CTC (cmolc dm-3), na camada de 0-20 cm do solo, com 250 e
240 amostras.
44
5.2 ANÁLISE GEOESTATÍSTICA
Considerando os resultados apresentados nas Figuras 9 e 10
observou-se uma leve correlação espacial entre a variável estudada (CTC cmolc
dm-3) e as direções norte e leste, desta forma, foi necessário confirmar por uma
ferramenta geoestatística a existência ou não de um padrão espacial para esta
variável.
As estimativas dos parâmetros dos semivariogramas exponencial,
gaussiano e esférico, como o Nugget (Efeito Pepita), o Sill (Patamar) e o Range
(Alcance) são encontrados na Tabela 3 e Figuras 13, 14 e 15.
Os três modelos de semivariogramas ajustados aos dados da CTC
apresentaram dependência espacial bem definida. O menor valor de nugget foi
obtido com o modelo exponencial (0,89) e também o maior índice de dependência
espacial. Comparando os valores do patamar dos três modelos foi identificado que
o maior patamar foi obtido para o modelo exponencial. Existem autores que na
seleção de modelos de semivariogramas preconizam que o melhor modelo é aquele
que tem menor variância nugget (Tabela 3) mas, existem opiniões divergentes de
que se deva selecionar modelos com variância mínima, resíduos nulos, correlação
próxima de r =1 (Vieira et al., 1983; Ortiz, 2002), entre outras estatísticas obtidas
pelo método de Jack-Knifing.
Bolfe et al., (2007), enfatiza que quanto maior for a diferença entre
o Nugget e o Patamar (Sill), maior será a continuidade do fenômeno e menor a
variância da estimativa, ou seja, maior a confiabilidade que se pode ter na
estimativa gerada.
Tabela 3. Estimativas dos parâmetros dos semivariogramas: exponencial,
gaussiano e esférico com passo de 56 metros, Índice de Dependência Espacial e
Razão de Aleatoriedade.
Nugget
Sill
Exponencial
0,89
1,87
2,76
242
68% 32% 96%
Moderada
Gaussiano
1,61
1,13
2,74
213
41% 59% 98%
Moderada
Esférico
1,36
1,37
2,73
244
50% 50% 98%
Moderada
Nugget+Sill Range
IDE
RA
R2
Modelo
2
Dependência
IDE= Índice de Dependência Espacial; RA= Razão de Aleatoriedade; R = Ajuste do modelo.
45
5.2.1 Semivariogramas
5.2.1.1 Retirando tendências
Após a determinação da semivariância em conjunto com a definição
do tamanho do passo a ser dado (Step), observou-se que os dados apresentam
tendência, não apresentando um patamar estável, então deve-se retirar essa
tendência, tanto para Step com tamanho de 40 metros (Figura 11) e de 56 metros
(Figura 12).
Semivariâncias
3,50
3,00
2,50
2,00
1,50
1,00
0,50
0,00
0
100
200
300
400
Distâncias (m)
500
600
Figura 11: Semivariâncias com Step de 40 metros, para a variável CTC (cmolc dm3
), na camada 0-20 cm do solo, sem retirada de tendência.
Semivariâncias
3,50
3,00
2,50
2,00
1,50
1,00
0,50
0,00
0
100
200
300
400
Distâncias (m)
500
600
Figura 12: Semivariâncias com Step de 56 metros, para a variável CTC (cmolc dm3
), na camada 0-20 cm do solo, sem retirada de tendência.
46
Ao estabelecer que é necessária a retirada de tendência, o próximo
passo é efetuar a sua retirada através da análise de regressão linear e quadrática.
Tabela 4: Resultados de análise de regressão para a retirada de tendência linear,
para a variável CTC (cmolc dm-3), 0-20cm do solo.
Fonte de
Graus de
Soma dos
Variação
Liberdade
Quadrados
Regressão
2
73,77
Desvio
237
675,9
Total
239
749,7
Coeficiente de Determinação do Ajuste = 9,84%
Coeficiente de Correlação = 31,37%
Quadrado
Médio
337,9
2,852
Teste F
118,5
Estabeleceu-se o Step de 56 metros e foi retirada a tendência
linear, apresentando um coeficiente de determinação do ajuste de 9,84% (Tabela
4), enquanto que a retirada de tendência quadrática apresentou o coeficiente de
determinação do ajuste com 15,46% (Tabela 5). Escolheu-se então o de maior
coeficiente de determinação do ajuste para a sequência do trabalho, neste caso, foi
escolhido a retirada de tendência quadrática.
Tabela 5: Resultados de análise de regressão para a retirada de tendência
quadrática, para a variável CTC (cmolc dm-3), 0-20cm do solo.
Fonte de
Graus de
Soma dos
Variação
Liberdade
Quadrados
Regressão
5
115,9
Desvio
234
633,7
Total
239
749,7
Coeficiente de Determinação do Ajuste = 15,46%
Coeficiente de Correlação = 39,32%
Quadrado
Médio
126,7
2,708
Teste F
46,8
5.2.1.2 Semivariograma Exponencial
A análise dos semivariogramas foi realizada utilizando-se Step
(distância teórica entre amostras) de 56 metros, conforme Figuras 13, 14 e 15. Após
retirada a tendência quadrática.
47
Obteve-se com o modelo exponencial (Figura 13) maior diferença
entre o nugget e o patamar (0,98). Conforme Carvalho et al. (2002) e Bolfe et al.
(2007) quanto maior for essa diferença maior será a continuidade do fenômeno e
menor a variância da estimativa, ou seja, maior a confiabilidade que se pode ter na
estimativa gerada. As estimativas dos parâmetros do Semivariograma Exponencial
foram: Nugget com valor 0,89, Sill ou patamar com valor 1,87 e Range ou alcance
com valor de 242 metros. Distância superior ao alcance apresenta distribuição
aleatória e, portanto não são correlacionadas (Vieira, 2000).
3 ,0
2 ,5
s
a
i 2 ,0
c
n
â
ir
a1 ,5
v
i
m1 ,0
e
S
0 ,5
E X P O N E N C IA L (0 ,8 9 ; 1 ,8 7 ; 2 4 2 )
E X P E R IM E N T A L
0 ,0
0
100
200
300
400
D is tâ n c ia s (m )
500
600
Figura 13: Semivariograma experimental ajustado ao Modelo Exponencial, para a
variável CTC (cmolc dm-3), com Step de 56 metros.
5.2.1.2 Semivariograma Gaussiano
Com o modelo gaussiano a diferença entre nugget e patamar
foi de 0,48, apresentando as seguintes estimativas dos parâmetros: Nugget com
valor 1,61, Sill com valor 1,13 e um Range com valor de 213 metros (Figura 14).
48
3 ,0
2 ,5
s
a
i 2 ,0
c
n
iâ
r 1 ,5
a
iv
m1 ,0
e
S
0 ,5
G A U S S IA N O (1 ,6 1 ; 1 ,1 3 ; 2 1 3 )
E X P E R IM E N T A L
0 ,0
0
100
200
300
400
D is tâ n c ia s (m )
500
600
Figura 14: Semivariograma experimental ajustado ao Modelo Gaussiano, para a
variável CTC (cmolc dm-3), com Step de 56 metros.
5.2.1.3 Semivariograma Esférico
A diferença entre o patamar e o nugget com o modelo esférico
(Figura 15, Tabela 3) foi de 0,01. Ainda nesta tabela, pode-se avaliar que a
dependência espacial foi moderada para os três modelos e que a dependência
espacial foi bem definida. As estimativas dos parâmetros foram: Nugget com valor
1,36, Sill com valor 1,37 e um Range com valor de 244 metros (Figura 15).
3 ,0
2 ,5
s
a
i 2 ,0
c
n
iâ
r 1 ,5
a
iv
m1 ,0
e
S
0 ,5
E S F É R IC O (1 ,3 6 ; 1 ,3 7 ; 2 4 4 )
E X P E R IM E N T A L
0 ,0
0
Figura 15:
100
200
300
400
D is tâ n c ia s (m )
500
600
Semivariograma experimental ajustado ao Modelo Esférico, para a
variável CTC (cmolc dm-3), com Step de 56 metros.
49
Se considerarmos a variância espacial mínima como critério de
seleção, o modelo exponencial é o que melhor ajustou aos dados de CTC, pois
tem-se assim, o menor valor da variância não explicada ou não detectada, a menor
Razão de Aleatoriedade e o maior Índice de Dependência Espacial (Tabela 3).
Esses mesmos critérios foram utilizados nos trabalhos realizados com as variáveis
Cálcio, Silte e Argila, pertencentes a este mesmo banco de dados, por Oliveira
(2003) no caso do Cálcio, Santana (2008) e Santos (2011) e, no caso do Silte, e
para a variável Argila por Rosa Neto (2009) e Shing (2011), respectivamente.
No modelo exponencial, tem-se a indicação de que a distância
máxima de dependência espacial, ou seja, a distância máxima em que os dados da
CTC são correlacionados entre si é 242m (alcance). De acordo com McBratney &
Webster (1983) e Souza et al. (1997), citados por Carvalho et al. (2002), no estudo
da continuidade espacial de nutrientes do solo, o objetivo principal do uso dos
semivariogramas é a determinação do número ideal de amostras. Afirma ainda que,
conhecendo-se o alcance da dependência espacial, define-se o raio de
amostragem e, para garantir em uma amostragem futura nas mesmas condições do
experimento considerado pelo autor.
5.2.2 Técnica de Validação de Jack-Knifing
A validação é usada para a confirmação da decisão do modelo a
ser ajustado, pois a krigagem está muito ligada ao modelo do semivariograma
escolhido, sendo então de suma importância a escolha do modelo matemático
correto.
Em relação a técnica de validação de Jack-Knifing, os valores
considerados ideais são:
• Coeficiente Linear: valor de a = 0;
• Coeficiente Angular: valor de b = 1;
• Coeficiente de Correlação: valor de r2 = 1;
50
• Média dos Erros = 0;
• Variância = 1;
• Índice IJK= Índice Jack-Knifing = 0 (porém deve-se considerar
valores anteriores);
• RMSE= Raiz Quadrada do Erro Médio: valor ideal = valor
mínimo.
A Figura 16 apresenta os gráficos referentes aos parâmetros acima,
sendo que em relação ao coeficiente linear (Figura 16-a), os três modelos ficam
próximos do ideal (valor zero) com o modelo exponencial diferindo dos outros por
volta de 0,005 próximos dos dez vizinhos, já o coeficiente angular (Figura 16-b) até
por volta de quinze vizinhos mostra uma proximidade muito grande dos três
modelos.
O coeficiente de correlação (Figura 16-c) coloca os três modelos
muito próximos, sendo que com dez vizinhos eles estão praticamente juntos. Em
relação a média dos erros (Figura 16-d) os modelos com aproximadamente 10
vizinhos apresentam diferença entre eles menores de 0,005.
Já em relação as variâncias (Figura 16-e), os três modelos se
aproximam do valor ideal (valor um), com diferenças entre eles na casa de 0,02 na
região com 10 vizinhos, com uma leve vantagem dos modelos esférico e gaussiano.
O índice jack-knifing (Figura 16-f) coloca o modelo exponencial em
vantagem com número de vizinhos menores que 20, sendo este um bom parâmetro
para a definição do modelo a ser usado nas próximas etapas, visto que os
parâmetros anteriores não negam esta afirmação.
Por fim a RMSE (Figura 16-g) mostra uma leve vantagem dos
modelos esférico e gaussiano em relação ao exponencial, porém na região com dez
vizinhos a diferença aproxima-se de 0,02.
Com a realização da validação e mantendo-se os critérios avaliados
nas etapas anteriores, podemos reafirmar a escolha do modelo Exponencial (Figura
13), confirmada pela avaliação do índice jack-knifing.
51
A
B
C
D
E
F
G
Figura 16: Gráficos com a validação para os Modelos estudados, com as variáveis:
Correlação Linear (a), Correlação Angular (b), Coeficiente de Correlação (c),
Moderada dos Erros (d), Variâncias (e), Índice Jack-Knifing-IJK (f) e RMSE (g).
52
5.2.3 Krigagem
A krigagem é uma técnica com objetivo de estimar valores de
variáveis para locais onde as mesmas não foram medidas ou perdidas, a partir de
valores adjacentes interdependentes.
Visto a dependência espacial definida pelo semivariograma, então
executa-se a krigagem. Após a observação de dependência espacial moderada ou
forte, neste caso moderada (Tabela 3), é caracterizada a necessidade de uso de
ferramenta que a expresse, tal como a krigagem, a fim de delimitar possíveis zonas
de manejo diferenciado para o solo estudado.
Foi realizada a krigagem ordinária levando em consideração sete
vizinhos para cada ponto calculado e é mostrada na Figura 17-b, onde observa-se
que os valores mais a Leste, são influenciados pelo alagamento provocado pelas
lagoas, conforme pode ser visto no Apêndice A.
5700
5700
5600
5500
5500
5400
5400
5300
5300
LESTE
LESTE
5600
A
5200
5200
5100
5100
5000
5000
4900
4900
4800
4800
5000 5100 5200 5300 5400 5500 5600 5700 5800 5900 6000
NORTE
B
5000 5100 5200 5300 5400 5500 5600 5700 5800 5900 6000
NORTE
Figura 17: Mapa da área amostral, antes da Krigagem (a) e após a Krigagem (b),
considerando o modelo exponencial, usando sete vizinhos, para a variável CTC
(cmolc dm-3), na camada de 0-20 cm do solo.
Nota-se que após a Krigagem (Figura 17-b) existe uma suavização
das camadas da CTC (cmolc dm-3).
53
Os mapas de superfície tridimensional (Figuras 18-b e 19),
realizados com os valores da Krigagem, mostram que existe na região por volta da
coordenada 5300 - Leste com uma concentração dos menores valores de CTC
(cmolc dm-3).
A
B
Figura 18: Mapa de superfície tridimensional da área amostral, antes da Krigagem
(a) e após a Krigagem (b), considerando o modelo exponencial, usando sete
vizinhos, para a variável CTC (cmolc dm-3), na camada de 0-20 cm do solo.
54
Na análise dos dados de CTC (cmolc dm-3) através dos mapas das
Figuras 18-b e 19 é mostrado um indicativo que o alagamento provocado pelas
lagoas (vide Apêndice A), promoveu uma perda de nutrientes na sua área de
influência, com uma aglutinação dos valores de CTC (cmolc dm-3) menores. Pode-se
inferir que a lixiviação através do alagamento e a posterior erosão no momento da
saída da água, com o carreamento de solo rico em nutrientes desta região,
promoveu esta aglutinação.
Figura 19: Mapa de superfície tridimensional da área amostral escalonado, após a
Krigagem, considerando o modelo exponencial, usando sete vizinhos, para a
variável CTC (cmolc dm-3), na camada de 0-20 cm do solo.
55
6 CONCLUSÃO
Considerando-se as condições deste trabalho conclui-se que:
- a análise exploratória é eficiente para detectar valores discrepantes (outliers);
- é possível identificar dependência espacial nos dados da CTC (cmolc dm-3) na
camada do solo a 0-20 cm;
- o método de validação de Jack-Knifing é eficiente na seleção do melhor modelo;
- com o método geoestatístico, em trabalhos futuros, é possível reduzir o número de
amostras para avaliar a necessidade da aplicação de nutrientes;
- o modelo que melhor ajusta aos dados é o exponencial;
- com a krigagem é possível visualizar a distribuição da CTC (cmolc dm-3) pela área
estudada.
Sugere-se nos próximos estudos englobar no método geoestatístico
os demais nutrientes presentes na formação da CTC.
56
7 REFERÊNCIAS
57
BOLFE, E. L.; GOMES, J. B. V.; FONTES, H. R. Variabilidade espacial de atributos
do solo como subsídio para produção integrada de frutas em perímetro irrigado no
nordeste do Brasil. Anais XIII Simpósio Brasileiro de Sensoriamento Remoto,
Florianópolis, SC, INPE. p. 67-74, abril 2007.
BUSTOS, O. Outliers e robustez. Revista Brasileira de Estatística, 49, p. 7-30.
1988.
CAMBARDELLA, C. A.; MOORMAN, T. B.; NOVAK, J. M.; PARKIN, T. B.; KARLEN,
D. L.; TURCO, R. F.; KONOPKA, A. E. Field-scale variability of soil properties
in Central Iowa Soils. Soils Sci. Am. J., 58, p. 1501-1511, 1994.
CAMPOS, H. Estatística experimental não-paramétrica. 4. ed. FEALQ,
Piracicaba, S.P., 1983.
CAPECHE, C.L.; MACEDO, J.R.; MANZATTO, H.R.H.; SILVA, E.F. Caracterização
pedológica da fazenda Angra - PESAGRO/RIO - Estação experimental de
Campos (RJ). (compact disc). In: CONGRESSO BRASILEIRO DE CIÊNCIA DO
SOLO. 26, Informação, globalização, uso do solo; Rio de Janeiro, 1997. Rio
de Janeiro: Embrapa/SBCS, 1997.
CARVALHO, J. R. P. de, VIEIRA, S.R. Avaliação e comparação de estimadores
de
krigagem
para
variáveis
agronômicas
–
Uma
proposta.
Série
Documentos. 2001. ISSN 1677-9274.
CARVALHO, J. R. P. de, SILVEIRA, P. M. da, VIEIRA, S.R. Geoestatistica na
determinação da variabilidade espacial de características químicas do solo sob
diferentes preparos. Pesquisa Agropecuária Brasileira, PAB. Brasília, DF,
v.37, n.8, p.1151-1159, agosto 2002.
COUTO, E. G.; KLAMT, E. Variabilidade espacial de micronutrientes em solo sob
pivô central no sul do estado de Mato Grosso. Pesquisa Agropecuária
Brasileira, PAB. Brasília, DF, v.34, n.12, p.2321-2329, dezembro 1999.
CRESSIE, N. Statistics for spatial data. New York: John Wiley, 900p. 1991.
58
EMBRAPA. Centro Nacional de Pesquisa se Solos. Manual de métodos de análises
de solo. Centro Nacional de Pesquisa de Solos. 2. ed. rev. atual Rio de
Janeiro, RJ, 1997. 212p. (EMBRAPA-CNPS. Documentos: 1).
FARIAS, P. R. S. Distribuição espacial do nematóide reniforme com o uso da
geoestatística, em um solo com rotação de culturas. Jaboticabal, SP. 1999.
Tese de Doutorado – Faculdade de Ciências Agronômicas, Universidade
Estadual Paulista “Júlio de Mesquita Filho”. 1999. 109p.
FISCHER, R. A. The design of experiments. Edinburgh: Oliver and Boyd. 252p.
1935.
GONÇALVES, A. C. A.; FOLEGATTI, M. V.; VIEIRA, S. R. Padrões de amostragem
e intensidade de krigagem na caracterização do armazenamento de água no
solo, em área irrigada por pivô central. Revista Brasileira de Ciência do Solo,
v. 23, n.3, p.1485-1495,1999.
GRONDONA, M. O.; CRESSIE, N. Using spatial considerations in the analysis
of experiments.Technometrics, v. 33, n.4, p.381-391, 1991.
HOAGLIN, D.C., MOSTELLER, F., TUKEY,J.W. Análise exploratória de dados.
Técnicas robustas. Edições Salamandra. Lisboa. 446p. 1992.
JOURNEL, A. G.; HUIJBREGTS, C. J. Mining geostatistics. Centre de
Geoestatisque Fontainebleau, France, New York: Centre de Geoestatistique,
Academic Press. 600p. 1978.
LIBARDE, P. L.; MANFRON, P. A.; MORAES, S. O.; TUON, R. L. Variabilidade da
umidade gravimétrica de um solo hidromórfico. Revista Brasileira de Ciência
do Solo. v.20, n.2, p.1-12, 1996.
McBRATNEY, A. B. & WEBSTER, R. How many observations are needed for
regional estimation of soil properties? Soil Science. Baltimore, v.135, n.3, p. 177183. 1983.
59
MATHERON, G. Principles of Geostatistics. Economic Geology, v.58, p. 12461266. 1963.
MATHERON, G. The theory of regionalized variables and its applications. Les
cahiers du CMM, n.5, 211p., 1971.
MIRITZ, G. K.; VIEGAS, L. S.; AQUINO, L. S.; BARTELS, G. K.; TIMM, L. C.;
PARFITT, J. M. B.; NEBEL, A. L. C.; PAULETTO, E. A. Variabilidade Espacial
da Umidade Volumétrica do Solo no Ponto de Murcha Permanente
Utilizando a Técnica de Co-Krigagem. XVIII CIC/ XI ENPOS / I Mostra
Científica, Pelotas, RS. UFPel, 2009.
OLIVEIRA, M. C. N. de. Métodos de estimação de parâmetros em modelos
geoestatísticos com diferentes estruturas de covariâncias: uma aplicação
ao teor de cálcio no solo. Piracicaba, SP. Tese de Doutorado – Escola Superior
de Agricultura “Luiz de Queiroz”, Universidade de São Paulo. 2003.140p
OLIVEIRA, M. C. N. de; CORRÊA-FERREIRA, B. S. Diagnóstico Exploratório na
Análise de Dados Entomológicos: Efeito do Diflubenzurom no Consumo
Alimentar
de
Anticarsia
gemmatalis
(Hubner).
Anais
da
Sociedade
Entomológica Brasileira. v. 27, n. 4. p. 627-637, dezembro 1998.
OLIVEIRA, M. C. N. de , SOBOTTKA, R.P., CAMPO, R.J. Critérios para detectar
outliers em pesquisas de inoculação de soja. In: SIMPÓSIO NACIONAL DE
PROBABILIDADE E ESTATÍSTICA, 18., 2008, SP. [Anais]. [São Pedro];
Associação Brasileira de Estatística, 2008. CD-ROM.
ORTIZ, G. da C. Aplicação de métodos geoestatísticos para identificar a
magnitude e a estrutura da variabilidade espacial de variáveis físicas do
solo. Dissertação (Mestrado) – Escola Superior de Agricultura “Luiz de Queiroz",
Piracicaba, SP. 2002. 75p.
QUAGGIO, J. A. Acidez e calagem em solos tropicais. 1ª Edição. Campinas, SP.
Instituto Agronômico, 2000, 111p.
60
RAIJ, B. V. Fertilidade do solo e adubação. Edição Ceres, Piracicaba, SP.
Associação Brasileira para Pesquisa da Potassa e do Fosfato, 1939, 343p.
ROSA NETO, E. A. Uso de Geoestatística no estudo espacial de dados e
propriedades físicas em solos hidromórficos. Monografia – Universidade
Estadual de Londrina – Londrina, PR. 2009. 30p.
SANTANA, T. F. Aplicação de Método Geoestatístico a Dados de Pesquisa
Utilizando o Software geoEas e variowin. Monografia – Universidade Estadual
de Londrina – Londrina, PR. 2008. 49p.
SANTOS, M. R. G.; OLIVEIRA, M. C. N. de. Aplicação da geoestatística a dados de
teor de silte em solo hidromórfico. Resumos expandidos da VI Jornada
Acadêmica da Embrapa Soja, 6. 2011, Londrina, PR. Embrapa Soja. p.68-71.
2011.
SHAPIRO, S. S. & WILK, M. B. An analysis of variance test for normality.
Biometrika. 52. p. 591-611. 1965.
SHING, L. R.; OLIVEIRA, M. C. N. de. Uso da geoestatística na determinação da
variabilidade espacial do teor de argila no solo. Resumos expandidos da VI
Jornada Acadêmica da Embrapa Soja, 6. 2011, Londrina, PR. Embrapa Soja.
p.79-82. 2011.
SIBALDELLI, R. N. R.; OLIVEIRA, M. C. N. de. A importância em detectar dados
discrepantes em resultados de pesquisas com inoculantes da soja. In. SEAGRO
2005. 11º Simpósio de Estatística Aplicada à Experimentação Agronômica.
Londrina, PR. Programa e Resumos. Universidade Estadual de Londrina, 2005,
212p.
SILVA, P. C. M. da; CHAVES, L. H. G. Avaliação e variabilidade espacial de
fósforo, potássio e matéria orgânica em Alissolos. Revista Brasileira de
Engenharia Agrícola e Ambiental, Campina Grande, PB. v.5, n.3, p. 431-436,
DEAg/UFPB, 2001.
61
SOUZA, L. S.; COGO, N. P.; VIEIRA, S. R. Variabilidade de propriedades físicas e
químicas do solo em pomar cítrico. Revista Brasileira de Ciência do Solo.
Campinas, SP, v.21, n.3, p.1-10, 1997.
VIDAL VASQUES. E.; VIEIRA, S. R.; DE MARIA, I. C.; GONZÁLES, A. P.
Geostatistical Analysis of Microrelief of na Oxisol as a Function of Tillage
and Cumulative Rainfall. Sci Agric., Piracicaba, SP. v.66, n. 2, p.225-232,
March/April 2009.
VIEIRA, S. Estatística para a Qualidade – Como Avaliar com Precisão a
Qualidade em Produtos e Serviços. Rio de Janeiro, RJ. 1999, Editora Campus,
1999, 198p.
VIEIRA, S. R. Geoestatística. Curso de extensão universitária. Botucatu, SP.
UNESP, 1996, 71p.
VIEIRA, S. R. Geoestatística em estudos de variabilidade espacial do solo. In:
Tópicos em Ciência do Solo. Viçosa: SBCS, 2000.
VIEIRA, S. R. Variablidade espacial de argila, silte e atributos químicos em
uma parcela experimental de um latossolo roxo de Campina (SP). Campinas,
SP, v.56, n.1, Campinas, 1997.
VIEIRA, S. R.; CARVALHO, J. R. P. de; GONZÁLES, A. P. Jack Knifing for
Semivariogram Validation. Bragantia, Campinas, SP. v.69, Suplemento, p. 97105. Campinas, 2010.
VIEIRA, S. R.; MILLETE, J.; TOPP, G. C.; REYNOLDS, W. D. Handbook for
geostatistical analysis of variability in soil and climate data. Tópicos em
Ciência do Solo, 2, p. 1-45, Viçosa, MG. 2002.
VIEIRA, S. R.; NIELSEN, D. R.; BIGGAR, J. W. Spatial variability of fieldmensured infiltration rate. Soil of American Journal v.45, n.3, p.1040-1048.
1981.
VIEIRA, S.R.; HATFIELD, J.L.; NIELSEN, D.R.; BIGGAR, J.W. Geostatistical theory
and application to variability of some agronomical properties. Hilgardia, v.51,
62
n.3, p.1-75, 1983.
63
APÊNDICES
64
APÊNDICE A - PLANTA TOPOGRÁFICA PLANIALTIMÉTRICA NA ESCALA 1:1000 ORIGINAL PARA
A PESQUISA REALIZADA.
65
APÊNDICE B - DADOS ORIGINAIS APÓS RETIRADOS OS OUTLIERS MENORES QUE
MAIORES QUE 17,32 TOTALIZANDO 240 AMOSTRAS.
Grid
a1
a10
a11
a12
a13
a15
a2
a3
a4
a5
a6
a7
a8
a9
b1
b10
b11
b12
b13
b14
b2
b3
b4
b5
b6
b7
b8
b9
c1
c10
c11
c12
c13
c14
c3
c4
c5
c6
c7
c8
c9
d1
d10
d11
d12
d13
d14
d2
d3
d5
d6
d7
d8
Norte
5710
5873
5890
5907
5925
5961
5727
5745
5764
5781
5799
5817
5837
5854
5681
5843
5864
5881
5899
5918
5698
5716
5734
5751
5769
5790
5808
5825
5634
5797
5818
5836
5853
5871
5670
5688
5705
5723
5744
5761
5780
5589
5750
5770
5788
5806
5825
5606
5623
5659
5677
5698
5715
Leste
4829
5254
5300
5347
5394
5487
4875
4922
4969
5015
5062
5109
5161
5208
4891
5319
5371
5419
5464
5511
4937
4984
5031
5078
5125
5178
5225
5271
4908
5336
5390
5436
5483
5529
5001
5049
5095
5142
5196
5242
5289
4925
5354
5407
5453
5500
5545
4972
5019
5112
5159
5214
5260
CTC
10,6012263
12,1810479
9,76767001
11,4114827
13,003456
8,72140468
13,1111483
11,457748
11,4391304
12,4449275
13,2897436
12,86
12,1596433
10,7624303
11,9214047
12,0493868
11,9931996
11,6807135
11,5285396
10,2121516
12,3894091
15,7695652
13,122408
12,9105909
12,9817168
12,8512821
13,4810479
14,2490524
13,6890747
12,2015608
12,157748
10,9316611
10,7984392
10,5698997
14,6372352
15,2916388
13,8192865
12,9372352
12,8003344
13,4304348
12,3726867
11,6301003
10,357748
10,5474916
12,0198439
9,00033445
10,6779264
14,2502787
16,0608696
17,3198439
17,0295429
13,203456
12,9198439
8,7
E
66
d9
e1
e10
e11
e12
e13
e14
e2
e3
e4
e5
e6
e7
e8
e9
f1
f10
f11
f12
f13
f14
f2
f3
f4
f5
f6
f7
f8
f9
g1
g10
g11
g12
g13
g2
g3
g4
g5
g6
g7
g8
g9
h1
h10
h11
h12
h13
h14
h2
h3
h4
h5
h6
h7
h8
h9
i1
i10
5733
5541
5704
5724
5742
5765
5784
5559
5576
5595
5613
5631
5651
5668
5686
5495
5658
5677
5695
5713
5731
5512
5530
5547
5565
5582
5604
5622
5639
5448
5611
5631
5647
5666
5466
5484
5501
5518
5536
5557
5575
5593
5402
5565
5584
5602
5620
5638
5420
5437
5455
5473
5491
5511
5529
5547
5355
5519
5307
4943
5371
5423
5470
5513
5561
4989
5036
5083
5129
5176
5230
5277
5325
4961
5389
5440
5487
5533
5580
5006
5054
5100
5147
5193
5248
5295
5341
4980
5406
5458
5505
5552
5026
5073
5117
5164
5211
5266
5314
5360
4997
5425
5475
5522
5568
5615
5044
5090
5136
5183
5231
5284
5330
5377
5016
5441
12,5083612
11,228874
10,8114827
13,0521739
9,71984392
13,8410256
13,4220736
12,7121516
14,8121516
13,8512821
13,3885173
13,0726867
13,3909699
13,9090301
12,5003344
11,7996656
12,780825
10,6881828
13,4292085
15,1627648
14,0599777
12,8307692
13,8214047
13,3111483
13,6316611
13,0916388
13,4627648
12,9624303
10,171126
11,7493868
10,7605351
13,3987737
13,771126
15,442252
13,2372352
13,4897436
12,8981048
14,5105909
15,33
15,0419175
11,2931996
13,3205128
12,8316611
14,7018952
15,9307692
17,0627648
11,4897436
16,6121516
12,6605351
12,657748
15,1779264
15,3
14,3506132
14,6798216
13,0916388
11,7714604
13,4624303
13,8419175
67
i11
i13
i14
i2
i3
i4
i5
i6
i7
i8
i9
j1
j10
j11
j14
j15
j2
j3
j4
j5
j6
j7
j8
j9
l1
l12
l13
l14
l15
l2
l3
l4
l5
l6
l7
l8
l9
m1
m12
m2
m3
m4
m5
m6
m7
m8.1
m8.2
m9
n1
n11
n12
n13
n14
n15
n2
n3
n4
n5
5538
5572
5590
5373
5391
5409
5427
5445
5466
5484
5501
5289
5455
5473
5527
5546
5308
5325
5344
5362
5379
5398
5419
5437
5243
5448
5466
5485
5503
5261
5279
5297
5316
5334
5351
5374
5392
5179
5400
5197
5215
5233
5251
5270
5288
5307
5327
5346
5131
5333
5355
5372
5390
5415
5150
5169
5186
5204
5494
5585
5633
5061
5108
5155
5201
5247
5302
5348
5395
4984
5411
5459
5603
5650
5030
5077
5125
5170
5219
5266
5320
5365
5002
5529
5575
5620
5666
5048
5095
5141
5188
5235
5281
5337
5383
4973
5546
5020
5068
5113
5160
5207
5254
5302
5354
5400
4990
5510
5564
5610
5656
5701
5037
5084
5131
5177
9,82207358
14,1881828
14,1403567
14,7779264
14,1372352
13,7003344
13,4897436
13,5695652
13,7391304
14,8086957
12,471126
12,7086957
11,9627648
12,2114827
16,2304348
16,0391304
13,2201784
14,0118172
13,9829431
13,9186176
12,7186176
13,7791527
14,9474916
13,6707915
12,8186176
9,76243032
14,6114827
16,790078
14,7372352
13,3090301
12,8810479
13,557748
13,23233
12,8490524
13,538796
15,4316611
12,7316611
13,2198439
16,1319955
12,3090301
13,0295429
13,3599777
13,0730212
13,3593088
12,5698997
11,4102564
13,2292085
9,85217391
12,7707915
11,557748
16,3794872
13,8624303
15,4909699
17,0605351
13,0391304
15,4304348
15,2198439
14,9391304
68
n6
n7
n8.1
n8.2
o1
o10
o11
o12
o13
o14
o2
o3
o4
o5
o6
o7
o8.1
o9.1
p1
p10
p11
p12
p13
p2
p3
p4
p5
p6
p7
p8.2
p9.2
q1
q10.2
q11
q13
q14
q2
q3
q4
q5
q6
q8.1
q9.2
r10
r11
r12
r8
r9
s1
s10
s11
s12
s13
s2
s3
s4
s5
s6
5222
5240
5258
5283
5067
5269
5287
5307
5325
5343
5086
5103
5121
5140
5157
5176
5194
5213
5021
5222
5241
5260
5279
5039
5057
5075
5093
5112
5129
5186
5204
4957
5175
5193
5231
5249
4975
4993
5011
5029
5047
5083
5157
5128
5146
5165
5093
5110
5760
5959
5977
5995
6013
5778
5795
5831
5867
5889
5225
5270
5317
5380
4961
5480
5528
5580
5626
5673
5008
5054
5101
5147
5195
5241
5287
5333
4978
5498
5545
5597
5645
5026
5071
5118
5165
5212
5259
5404
5451
4951
5516
5563
5660
5706
4997
5044
5090
5136
5183
5277
5469
5534
5581
5629
5440
5487
4807
5331
5378
5423
5471
4855
4900
5044
5092
5144
11,3425864
13,9493868
14,6881828
10,7813824
12,5904125
11,7817168
12,4885173
9,08940914
15,2301003
16,7403567
13,5981048
14,2391304
15,6018952
15,7931996
12,0018952
13,6599777
11,9897436
9,66833891
12,2509476
14,3474916
11,1208473
16,0090301
13,4692308
13,4813824
14,1807135
14,3909699
11,6208473
12,4102564
12,1003344
12,957748
13,46
11,3608696
17
16,6292085
11,2593088
9,87146042
14,1521739
15,5192865
13,8502787
15,1512821
14,1913043
8,73199554
14,5779264
15,68
15,3273133
10,6897436
15,9599777
16,8931996
12,46767
12,671126
12,1497213
12,0186176
11,5121516
10,9996656
11,3984392
11,7502787
13,4307692
12,9002564
69
s7
s8
s9
t1
t2
t3
t4
t5
t6
t7
u1
u2
u3
5907
5925
5943
5789
5805
5823
5841
5897
5912
5935
5833
5852
5868
5191
5237
5284
4742
4789
4836
4881
5026
5071
5123
4724
4769
4817
13,061204
13,3680045
11,603456
12,9596433
11,7512821
11,3090301
11,8593088
13,0931996
11,5810479
9,5090301
10,8782609
11,6801561
10,3726867
70
APÊNDICE C – PLANILHA EM EXCEL COM CÁLCULOS DOS AJUSTES AOS MODELOS PARA SEMIVARIOGRAMAS.
SEMIVARIOGRAM
FOR
:rubc_t_c.rt2
c0
0,893737092
c0
1,60848
c0
1,360256115
c1
1,867124529
c1
1,128555
c1
1,372237377
MAX
DISTANCE =
560
a
241,6104258
a
213,4841
a
243,5491756
STEP
=
56
r2
0,95668848
r2
0,98425
r2
0,983240059
3,137 0,485 2,703
rmse
0,005984822
rmse
0,003876
rmse
0,00387151
PAIRS DISTANCE C_T_C C_Est C_Res EXPONENCIAL SQR
SQT
SQDP GAUSSIANO SQR
SQT
SQDP
ESFÉRICO SQR
SQT
SQDP
0
0,893737092
1,608479523
1,360256115
1
388
50 1,818 9,41E-03 1,813
1,75729 0,003103623 0,52882 5,97E-05 1,779720878 0,001107 0,52882 2,13203E-05 1,776894401 0,001303614 0,52882 2,50956E-05
2 1161 93,56 2,073 3,03E-02 2,034
2,17654 0,020317909 0,256238 0,00117 2,102750566 0,004727 0,256238 0,000272271 2,112082092 0,006096813 0,256238 0,000351198
3 1631 145,5 2,518 7,27E-02 2,492
2,45427 0,001423804 0,002323 0,000115 2,456929896 0,00123 0,002323 9,9528E-05 2,44365491 0,002337248 0,002323 0,000189137
4 2023 201,4 2,752 0,1269 2,674
2,60771 0,004394497 0,017902 0,000441 2,658878831 0,000229 0,017902 2,29501E-05 2,674400957 1,60767E-07 0,017902 1,61365E-08
5 2186
254 2,922 0,1892
2,77
2,68116 0,007892935 0,052808 0,000856 2,720884631 0,002412 0,052808 0,000261639 2,732493493 0,001406738 0,052808 0,000152574
6 2574 308,6 2,926 0,259 2,718
2,72040 5,75754E-06 0,031613 7,35E-07 2,734896758 0,000286 0,031613 3,64613E-05 2,732493493 0,000210061 0,031613 2,6827E-05
7 2443 362,8 2,952 0,3337 2,673
2,74022 0,004518326 0,017636 0,000548 2,736840015 0,004076 0,017636 0,000494 2,732493493 0,003539476 0,017636 0,000429022
8 2730 417,4 3,173 0,4257
2,78
2,75038 0,000877225 0,057504 0,000119 2,737023082 0,001847 0,057504 0,000250179 2,732493493 0,002256868 0,057504 0,000305693
9 2609
475 3,145
0,51 2,722
2,75574 0,001138125 0,033051 0,000147 2,737034484 0,000226 0,033051 2,92596E-05 2,732493493 0,000110113 0,033051 1,42538E-05
10 2410 530,9 3,188 0,6102 2,726
2,75830 0,001043373 0,034522 0,000125 2,737034874 0,000122 0,034522 1,45603E-05 2,732493493 4,21654E-05 0,034522 5,04186E-06
55 20155
2,5402
0,044715575 1,032418 0,003582
0,016261 1,032418 0,001502168
0,017303258 1,032418 0,001498859
71
APÊNDICE D – PLANILHA EM EXCEL COM VALORES CALCULADOS PARA VALIDAÇÃO, PARA OS
MODELOS EXPONENCIAL, GAUSSIANO E ESFÉRICO, UTILIZANDO JACK-KNIFING.
JACKNIFFING
RESULTS
FOR
rubc_t_c.rt2
Modelo
Exponencial
VARIABLE :C_Res
REGRESSION
REDUCED
NEIG
INTERCEPT SLOPE
4 .4316E-01 .2413
8 .1642E-01 .2466
12 .8910E-02 .2335
16 .1087E-01 .2199
20 .1104E-01 .2147
32 .5385E-02 .2131
40 .4862E-02 .2126
CORR_COEF.
MEAN
VARIANCE IJK
RMSE
.3914
.2575E-01
1.164
-1.178
1.555
.4634
.7942E-02
1.068
-1.214
1.458
.4610
.2956E-02
1.070
-1.233
1.458
.4442
.4505E-02
1.090
-1.241
1.472
.4360
.4655E-02
1.101
-1.244
1.479
.4392
.8942E-03
1.098
-1.249
1.476
.4418
.5401E-03
1.095
-1.250
1.473
JACKNIFFING
FOR
RESULTS
rubc_t_c.rt2
Modelo
Gaussiano
VARIABLE :C_Res
REGRESSION
REDUCED
NEIG
INTERCEPT SLOPE
4 .4413E-01 .2438
8 .1243E-01 .2446
12 .4274E-02 .2302
16 .4934E-02 .2218
20 .4199E-02 .2205
32 .2818E-02 .2284
40 .4134E-02 .2295
CORR_COEF.
MEAN
VARIANCE IJK
RMSE
.3947
.2732E-01
1.130
-1.204
1.552
.4773
.5651E-02
1.047
-1.226
1.443
.4786
.9798E-04
1.050
-1.241
1.440
.4681
.7025E-03
1.063
-1.246
1.450
.4632
.1984E-03
1.071
-1.246
1.454
.4715
-.3933E-03
1.065
-1.236
1.447
.4737
.5572E-03
1.064
-1.233
1.445
JACKNIFFING
FOR
RESULTS
VARIABLE :C_Res
REGRESSION
REDUCED
NEIG
INTERCEPT SLOPE
4 .4413E-01 .2426
8 .1227E-01 .2438
12 .4178E-02 .2282
16 .6466E-02 .2184
20 .5130E-02 .2169
32 .2514E-02 .2243
40 .3402E-02 .2278
rubc_t_c.rt2
Modelo
MAX_DIST
72.00
112.0
162.0
212.0
252.0
322.0
362.0
MAX_DIST
72.00
112.0
162.0
212.0
252.0
322.0
362.0
Esférico
CORR_COEF.
MEAN
VARIANCE IJK
RMSE
.3932
.2713E-01
1.135
-1.202
1.553
.4734
.5562E-02
1.048
-1.229
1.447
.4753
.4931E-04
1.050
-1.246
1.443
.4641
.1795E-02
1.065
-1.250
1.453
.4608
.8635E-03
1.070
-1.251
1.456
.4680
-.6136E-03
1.065
-1.243
1.450
.4719
.3107E-06
1.063
-1.237
1.447
MAX_DIST
72.00
112.0
162.0
212.0
252.0
322.0
362.0
Download

CENTRO DE CIÊNCIAS EXATAS - Ainfo