MINI-CURSO
GEOESTATÍSTICA APLICADA
AO ESTUDO DE SOLOS
Prof. Eduardo Rodrigues Viana de Lima
Departamento de Geociências
Universidade Federal da Paraíba
1
INTRODUÇÃO
A geoestatística distingue-se da estatística clássica pelo fato de considerar
que os valores de uma variável estão de alguma forma relacionados à
sua distribuição espacial, ou seja, observações tomadas a curtas
distâncias devem ser mais semelhantes do que aquelas tomadas a
distâncias maiores, e por levar em consideração o comportamento
espacial das variáveis apresenta grande potencial de aplicação nas
geociências/ciências ambientais.
2
A Geoestatística não faz todo o tratamento de dados de forma integrada:
é preciso parar no fim de cada etapa e selecionar, interpretar; também
não cria dados: apenas trata a informação disponível.
A Geoestatística utiliza os dados duas vezes, primeiramente para estimar a
autocorrelação espacial e depois para estimar a variável em locais não
amostrados . Como todas as técnicas estatísticas, a Geoestatística baseiase em um conceito probabilístico. Para uma aplicação segura da
Geoestatística, é necessário um conhecimento prévio dos conceitos de
Estatística, sendo importante que se proceda a um estudo estatístico
elementar dos dados, com a finalidade de testar se as condições exigidas
para aplicar o formalismo próprio da Geoestatística estão satisfeitas.
3
As técnicas geoestatísticas podem ser usadas para descrever e modelizar
padrões espaciais (variografia), para predizer valores em locais não
amostrados (krigagem), para obter a incerteza associada a um valor
estimado em locais não amostrados (variância de krigagem) e para
otimizar malhas de amostragem.
No caso específico de utilização da Geoestatística com a finalidade de
apoio à otimização de malhas de amostragem, é oportuno salientar que o
erro cometido ao fazer uma avaliação com malhas de amostragem
diminui com o detalhamento da malha, mas esse crescimento não é
linear, conforme mostra a figura 1.
4
Figura 1 – Relação entre malha de amostragem e erro de avaliação.
5
Os métodos de estimação linear comumente utilizados fazem mais sentido
quando a distribuição dos resíduos é aproximadamente normal.
Sendo a média dos resíduos igual a zero e minimizando o desvio-padrão
dos erros (feito pelos métodos de estimação linear), as predições obtêm
um bom resultado. Assume-se que os erros de estimação sejam
normalmente distribuídos.
Quando o valor esperado para um erro de estimação é zero, diz-se que o
estimador é não-enviesado.
6
As vantagens reconhecidas da Geoestatística sobre outras técnicas
convencionais de predição são:
-o estudo da variabilidade espacial (a análise de um semivariograma é a
única técnica disponível para medir a variabilidade espacial de uma
variável regionalizada);
- a suavização (a estimação geoestatística suaviza ou faz a regressão de
valores preditos);
-o desagrupamento (ou efeito de anular as concentrações localizadas de
observações);
- a determinação da anisotropia (os comportamentos da variabilidade nas
diferentes direções são considerados);
7
- a precisão (a krigagem fornece valores precisos sobre as áreas ou pontos
a serem avaliados);
- e a incerteza (estimativas obtidas por meio da krigagem associam a
margem de erro que acompanha a estimativa).
Tratando-se de um modelo probabilístico, a geoestatística explora a
aparente aleatoriedade dos dados, para avaliar as medidas de correlação
espacial
dos
mesmos,
considerando
uma
determinada
vizinhança
(Huijbregts, 1975).
8
Assim, a variável que apresenta uma distribuição no espaço com certo grau
de correlação espacial pode ser considerada regionalizada.
Diversas variáveis relativas ao meio físico assumem as características de
regionalizadas. O comportamento que assume essas variáveis está
fundamentado em modelos probabilísticos e em função disso define a
chamada teoria das variáveis regionalizadas (Matheron, 1962) apud Sturaro
(1994), as quais são consideradas como a realização única de uma
determinada função aleatória (Matheron, 1962) apud Sturaro (1994).
A teoria das variáveis regionalizadas tem como objetivo básico avaliar as
características estruturais dessas variáveis e efetuar estimativas.
9
Modelos utilizados na análise geoestatística
Para conhecer as características da variável regionalizada, a mesma deve
ser expressa através de uma função aleatória, seguindo alguma lei de
distribuição de probabilidades e sendo caracterizada pelos parâmetros da
distribuição.
Uma variável regionalizada z(x) pode ser considerada como uma variável
aleatória, no sentido de que os valores das medições feitas podem variar
consideravelmente entre si, e assume um caráter estruturado dentro de
uma determinada área, segundo uma certa lei no espaço, considerando
que os valores das observações não são completamente independentes
da sua localização geográfica. Assim, a variável regionalizada pode ser
considerada como uma realização única de uma variável aleatória Z para
uma localização dentro dessa área.
Se a variável regionalizada z(x) for
considerada para todos os locais da referida área, torna-se uma dentre um
conjunto infinito de variáveis aleatórias Z(x) para todos os locais da área
(Souza, 1992).
10
Considerando que a amostragem singular não permite que se conheça a
função densidade de probabilidades de uma variável regionalizada, a
geoestatística linear utiliza-se de momentos da função casual, para fazer
inferências sobre essa função de densidade de probabilidades (Journel e
Huijbregts, 1978 apud Sturaro, 1988). Os momentos são os seguintes:
Estacionaridade de 1ª ordem
E {x(i) - x (i+h)}= m(h)
Onde: m(h) representa a tendência.
x(i)e x(i+h)são dois valores de uma mesma variável regionalizada obtidos nos
pontos i e i+h, separados entre si por uma distância h.
A diferença entre esses dois valores é outra variável casual [x(i) - x(i+h)].
11
Estacionaridade de 2ª ordem
E {(x(i) - x(i+h) - m(h)} = 2y(h)
onde: m(h) representa a tendência e y(h) representa a semivariância.
O grau de relação entre pontos numa certa direção pode ser expresso pela
covariância, e embora a covariância exista entre todas as distâncias
possíveis ao longo de h, pode ser estipulado que somente serão
considerados valores entre pontos regularmente espaçados por múltiplos de
h.
A covariância entre valores encontrados nessas distâncias separadas por h
ao longo de h é: K(h)=K(h)=1/nx(i)x(i+h).
Onde: K=covariância e n=número de pares de valores comparados.
Isso significa que a covariância é igual à média dos produtos dos valores x(i)
encontrados nos pontos i pelos valores x(i+h) encontrados nos pontos i+h,
distantes a um intervalo h, e n representa o número de pares de valores
comparados.
Se h=0, K(h) passa a representar a variância K(0)=1/n x(i)x(i+0).
Desse modo, pode-se computar uma função denominada semivariância,
definida como metade da variância das diferenças y(h)=[x(i+h)-x(i)]/2. 12
A função aleatória pode ser estacionária (apresenta o comportamento
espacial da variável invariante sob translação), ou seja, em qualquer
direção assume-se que seja constante o valor médio esperado (Sturaro,
1994), e para tanto assumem-se hipóteses de estacionaridade para o
processo,
considerando
que
a
variável
deve
ser
estatisticamente
homogênea e isotrópica, permitindo que se façam inferências estatísticas
(Vieira et alii, 1983).
Uma vez que, na prática, é difícil verificar a ocorrência da hipótese básica,
trabalha-se ainda com as hipóteses de segunda-ordem e a intrínseca
conforme Vieira et alii, (1983) e Pannatier (1996).
13
O vetor h apresentando-se infinitamente pequeno faz com que a variância
e a covariância se tornem muito próximas. Como consequência, espera-se
que ambas sejam aproximadamente iguais para pequenos valores de h.
Para h maiores, a covariância diminuirá enquanto a variância aumentará,
porque ocorrerá progressivamente maior independência entre os pontos a
distâncias cada vez maiores.
A semivariância distribui-se assim de 0, quando h=0, até um valor igual à
variância das observações para um alto valor de h.
Essas relações são mostradas quando a função y(h) é colocada em gráfico
contra h para originar o semivariograma.
14
Ocorrendo estacionaridade de segunda-ordem, a covariância e o
semivariograma são recursos disponíveis também para caracterizar a
autocorrelação entre duas variáveis z(x) e z(x+h), separadas por um vetor h.
Diante da existência de covariância, trabalha-se com uma variância finita,
expressa como Varz(x )  c(0) .
Entretanto, diversos fenômenos naturais apresentam capacidade infinita de
dispersão, não possuindo covariância e portanto com inexistência de
variância finita. Nesses casos, assume-se uma forma mais fraca de
estacionaridade
chamada
hipótese
intrínseca,
na
qual
apenas
semivariograma serve como instrumento de análise da estacionaridade.
15
o
Assim sendo, a função aleatória z(x) é tida como sendo intrínseca se:
- a esperança matemática
Ez (x ) existe e não depende da posição x:
Ez ( x )  m
- para todo vetor de separaço h o incremento z(x  h)  z(x) tem variância finita
que não depende de x:


1
1
2
Var z ( x  h )  z ( x )  E  z ( x  h )  z ( x )   ( h )
2
2
Embora haja possibilidade de avaliar o grau de dependência espacial de
uma variável por meio do coeficiente de correlação e da covariância, o
momento de inércia denominado de semivariograma é amplamente
utilizado, pelo fato do mesmo ter condições de modelar fenômenos naturais
de elevada dispersão espacial.
16
A função semivariograma pode ser considerada como o momento de
inércia em torno da diagonal do diagrama de dispersão espacial, conforme
mostra a figura 2 (Pannatier, 1996):
Figura 2 - Diagrama de dispersão de uma variável V(x).
Fonte: Pannatier, 1996.
17
Enquanto o momento de inércia constitui a metade da média das
diferenças quadráticas entre as coordenadas de cada par de pontos, o
semivariograma por sua vez, é calculado para uma mesma variável a
diferentes intervalos de distância e em diferentes direções, com o intuito
de verificar a continuidade espacial da variável.
18
Matematicamente a função semivariograma é expressa da seguinte forma:

1 n
 ( h )   V( x )  V( x  h )
2n i 1

2
onde:
 ( h) 

1 n
 V(x )  V( x h)
2n i1
 é o semivariograma;
2
n é o número de pares da variável considerados em uma determinada
direção;
V( x ) eV( x  h ) é a mesma variável em dois pontos diferentes, separados
por uma distância pré-estabelecida e constante a uma certa direção;
½ corresponde à metade da média das diferenças quadráticas e que
representa a distância perpendicular dos pontos em relação à linha
de 45 graus do diagrama de dispersão espacial (Fig. 2);
h é o intervalo de distância pré-estabelecida.
19
Graficamente a função semivariograma é expressa conforme mostra a
figura 3, e cujas características são apresentadas em seguida:
Figura 3 - Esquema básico de uma função semivariograma.
20
- Amplitude variográfica (a) ou alcance: Distância na qual a máxima
variabilidade é atingida e que corresponde ao aumento da distância entre
as amostras;
- Patamar (c) ou sill: Representa o nível de variabilidade onde o
semivariograma se estabiliza. Corresponde a diferença entre o ponto de
maior correlação ou a origem do semivariograma e o ponto que
teoricamente representa a variância populacional e a variabilidade se
estabiliza;
- Efeito pepita (co): Descontinuidade na origem do semivariograma,
correspondendo à diferença entre as amostras de maior proximidade e
gerada por microrregionalizações, erros de amostragens ou erros de
medidas.
21
Amostras separadas por distâncias menores do que a amplitude variográfica
são espacialmente correlacionadas, por outro lado aquelas separadas por
distâncias maiores não são, considerando que o valor do semivariograma
sendo igual à variância dos dados, a variação é aleatória.
Garcia (1988) considera que uma relação entre os parâmetros “co” e “c”
expressa o grau de aleatoriedade do fenômeno regionalizado, e pode ser
avaliada por “E”, que representa o efeito de pepita relativo. Esta
componente aleatória pode ser classificada da seguinte forma:
E < 0,15
componente aleatória pequena
0,15 < E < 0,30
E > 0,30
componente aleatória significativa
componente aleatória muito significativa
22
Segundo Matheron (1963) apud Sturaro (1988), em geral, o semivariograma
é uma função de incremento com a distância “h”, visto que, quanto mais
afastadas forem as amostras, mais seus valores em média deverão ser
diferentes. Esta característica reflete bem a noção de zona de influência de
uma amostra.
Nesse
aspecto
é
que
o
semivariograma
experimental
deve
ser
considerado, no máximo, para a metade da distância total de
amostragem no campo, isto quando o número de pares de dados seja
maior do que 30 (Journel & Huijbrgts, 1991).
23
A noção de zona de influência de uma amostra está relacionada com a
existência de regionalizações. Os semivariogramas exercem sua função no
modelamento espacial de diversos fenômenos, quando da detecção da
continuidade
espacial
ou
regionalização
de
uma
variável,
e
consequentemente de possíveis ocorrências de anisotropias.
Para avaliar o comportamento da variabilidade espacial de uma variável,
os semivariogramas são elaborados experimentalmente e submetidos à
análise de suas características estruturais. A figura 4 ilustra as propriedades
estruturais do semivariograma (Huijbregts, 1975): suporte, zona de influência,
estruturas
superpostas,
anisotropia,
continuidade
espacial
ou
comportamento da variável próxima a origem, corregionalização.
24
Figura 4 - Propriedades estruturais do semivariograma. (Huijbregts, 1975)
25
Suporte: As variações de uma variável regionalizada ocorrem em um certo
domínio do espaço ou domínio geométrico. A variável regionalizada é
definida em um determinado suporte geométrico, cujas amostras no
espaço tenham volume, forma e orientação. Se o suporte é alterado, uma
nova variável regionalizada é definida, relacionada ao suporte inicial, mas
com características diferentes e um semivariograma diferente.
Zona de influência: O semivariograma é uma função de incremento da
distância orientada “h”. Quanto mais essa distância entre as amostras
aumenta, menos correlacionadas essas amostras ficam, ou seja, há um
aumento da variância, até que ocorre uma total independência entre as
mesmas. A zona de influência de uma variável regionalizada corresponde à
distância chamada de range (a), a partir da qual a variância torna-se
constante, e cuja medida é a amplitude variográfica.
26
Estruturas superpostas: Fenômenos de transição são caracterizados nos
semivariogramas pelo range e pelo “sill”. Essas características podem refletir
a existência de superposição de regionalização em diferentes escalas.
Anisotropia: Considerando que a distância expressa no semivariograma é
um vetor, este deve ser calculado para diferentes direções. Assim, quando
o semivariograma apresenta configurações similares para todas a direções
medidas, diz-se que o fenômeno é isotrópico. Quando isso não ocorre,
pode ser que haja anisotropia de duas formas distintas. Num dos casos, o
semivariograma apresenta a mesma forma, mas com amplitudes diferentes,
o que representa anisotropia geométrica. No outro caso o semivariograma
apresenta-se bem diferente para direções diferentes, representando uma
anisotropia zonal.
27
Continuidade espacial ou comportamento da variável próxima a origem:
O comportamento da curva do semivariograma em pequenas distâncias, ou
seja, próxima a origem, reflete a continuidade da regionalização.
Teoricamente, o semivariograma deveria ser nulo na origem, entretanto, isto
geralmente não ocorre e o que passa a existir é uma descontinuidade
denominada de efeito de pepita devido a problemas referentes a existência
de microrregionalizações ou erro de amostragem.
Independentemente da ocorrência ou não do efeito de pepita, o
comportamento parabólico da curva a partir do seu ponto inicial, reflete
uma boa continuidade espacial, enquanto que a forma linear reflete uma
continuidade moderada.
28
Corregionalização:
Esta característica é obtida no caso de duas variáveis regionalizadas serem
analisadas em um mesmo suporte geométrico e também no mesmo
semivariograma.
O
semivariograma
cruzado
exibe
a
existência
de
corregionalização ou correlação regionalizada entre as duas variáveis.
29
Segundo Landim (1993), para a utilidade do semivariograma as seguintes
suposições básicas são requeridas:
a) As diferenças entre pares de valores de amostras são determinadas
apenas pela orientação espacial relativa dessas amostras;
b) O interesse é enfocado apenas na média e na variância das diferenças,
significando que esses dois parâmetros dependem unicamente da
orientação (hipótese intrínseca);
c) Por conveniência assume-se que os valores da área de interesse não
apresentam tendência que possa afetar os resultados e assim a
preocupação será apenas com a variância das diferenças entre valores
das amostras.
30
Cálculo do semivariograma a partir de amostras regularmente espaçadas
No cálculo de amostras regularmente espaçadas, o procedimento e
efetuado geralmente para as direções de 0º, 45º, 90º, 135º, 180º, 225º, 270º,
315º e 360º, considerando todos os intervalos de distância possíveis numa
determinada direção.
Ou seja, tomando-se como ponto de partida a distância entre amostras de
10 m, qualquer par de amostras, naquela direção selecionada, que tenha
essa distância, será considerada. O mesmo procedimento é efetuado para
outras distâncias, tais como 20 m, 30 m, 40 m e assim por diante, até que
algum ponto de parada seja alcançado, conforme exemplifica a figura 5
(Camargo, 1998).
31
Figura 5 – Amostras regularmente espaçadas usadas para cálculo do
Semivariograma (Camargo, 1998).
32
Cálculo do semivariograma a partir de amostras irregularmente espaçadas
Considerando o arranjo das amostras, conforme mostra a figura 6, para
determinação do semivariograma, é necessário introduzir limites de
tolerância para direção e distância (Camargo, 1998).
Figura 6 - Parâmetros para o cálculo do semivariograma a partir de amostras 33
irregularmente espaçadas (Fonte: Deutsch e Journel, 1992 apud Camargo, 1998).
Define-se o Lag e uma certa tolerância, que representam o campo de
abrangência das medidas. O Lag e sua tolerância correspondem a um
intervalo de distância no qual serão medidas todos os pares de amostras
existentes.
Define-se também a direção de medida com uma certa tolerância, na qual
será efetuado o conjunto de medidas. À título de exemplo, se o Lag definido
for de 300 m, e a direção de 900 com tolerância de 300, qualquer par de
amostras cuja distância esteja compreendida entre 250 m e 350 m e 600 e
1200, será considerado no cálculo do semivariograma para aquele Lag
utilizado. O cálculo se repete para diferentes valores de Lag e de direção.
34
Modelos variográficos
De posse da função que exprime o comportamento da variabilidade
espacial do fenômeno, pode-se conduzir análise que expresse aquele
comportamento através de modelos de duas dimensões, ou seja, através
de mapas.
Para tanto, é necessário que sejam ajustados modelos matemáticos, ou
funções teóricas, à função semivariograma, no intuito de que sejam
determinados os valores nos locais não amostrados e a partir de então
definidas curvas de isovalores ou blocos com valores médios.
Segundo Sturaro (1988), embora possa existir uma grande quantidade de
funções que se ajustem aos semivariogramas experimentais gerados, na
prática, apenas alguns modelos, fundamentados nas teorias das variáveis
regionalizadas, tem se ajustado em casos práticos aplicados.
35
Essas funções teóricas devem atender, segundo Sturaro (1994), à condição
de serem “positiva definida”, ou seja, o sistema estruturado a partir dessas
funções, para efetuar estimativas, deve possuir uma solução única e estável
para o sistema de equações.
Os modelos considerados básicos, simples e isotrópicos (Isaaks e Srivastava,
1989), podem ser classificados em dois grupos, segundo uma característica
que os diferencia marcantemente: um grupo de semivariogramas com a
presença de patamar e outro que não possui patamar.
36
Modelos com patamar ou modelos de transição
Neste grupo de modelos a característica marcante diz respeito a um limite
alcançado pelo aumento da função semivariograma, que ocorre à
medida que aumenta a distância entre os pontos amostrais. Alcançado
um determinado patamar (“sill”), que corresponde teoricamente à
variância da população, a função se estabiliza.
As variações dos modelos com patamar estão relacionadas basicamente
com o comportamento espacial das amostras em relação à distância, até
que a função atinja o patamar. Este intervalo de distância é conhecido
como amplitude variográfica ou “range” e define o raio de influência da
variável. Segundo Vieira et alii (1983), a amplitude variográfica é um
importante parâmetro, considerando que as amostras separadas por
distâncias menores que o “range” são correlacionadas com as demais,
enquanto as amostras separadas por distâncias maiores que o range não
são correlacionadas.
37
Figura 6 - Modelos variográficos com patamar.
38
Modelo esférico
O mais facilmente encontrado nas aplicações da geoestatística,
apresenta como característica o fato de que a tangente na
origem da curva, atinge o patamar a uma distância
correspondente a 2/3 da amplitude (a).
39
Modelo exponencial
Outro modelo de transição comumente encontrado, tem como
característica o fato de que o “range” é atingido quando o valor do
semivariograma alcança apenas assintoticamente, 95% do valor do
patamar. De outra forma, a tangente na origem atinge o patamar a uma
40
distância correspondente a 1/5 do “range”.
Modelo gaussiano
Este modelo tem bastante semelhança com o exponencial,
principalmente no que se refere a forma como atinge o patamar e
larga amplitude variográfica. Difere daquele quanto a seu
comportamento parabólico na origem.
41
Modelo aleatório
Este modelo, também denominado de efeito pepita puro, é característico de
fenômenos de elevada aleatoriedade, considerando que há uma acentuada
descontinuidade na origem do semivariograma. (Isaaks e Srivastava, 1989). Ocorre
uma diferença significativa de valor entre pontos próximos, representando que
pode haver uma provável regionalização inferior à escala de trabalho da malha
de amostragem e/ou variações espúrias associadas com a coleta e medição das
amostras (Sturaro, 1988). Segundo Landim (1993) este modelo representa o extremo
42
de uma situação de aleatoriedade, onde não ocorre covariância entre os valores
e, portanto, a análise variográfica não se aplica.
Modelos sem patamar
Constituem os modelos que apresentam um aumento constante da
variabilidade à medida em que a distância é incrementada (Sturaro, 1994),
ou seja, apresentam uma variância infinita e não ocorre uma função de
covariância (Landim, 1993). Satisfazem apenas a hipótese intrínseca e não
são considerados modelos de transição.
43
Modelos lineares generalizados
44
Modelo logarítmico
45
Métodos geoestatísticos de estimação
Após a análise variográfica, e verificada a possibilidade de estimação por
técnicas geoestatísticas, pode-se proceder a uma estimação de valores em
locais não amostrados. Constitui-se essa, numa tarefa importantíssima dos
estudos ambientais, principalmente no que diz respeito a espacialização e
representação cartográfica de diversos fenômenos de interesse.
A krigagem constitui-se em um método de estimação por médias móveis e
tem como característica particular, que o diferencia e o torna superior aos
demais métodos de estimação, o fato de permitir o cálculo do erro
associado às estimativas, chamado de variância de estimação.
46
O método de estimação da krigagem foi inicialmente concebido sob a
hipótese de que a variável regionalizada resultava de um processo
estocástico estacionário de 2ª ordem, denominada de krigagem simples e
krigagem ordinária. Considerando a exigência da estacionaridade, esses
tipos de krigagem não resolviam todos os problemas.
A krigagem ordinária é considerada segundo Sturaro (1988) como o melhor
estimador linear sem viés, em função das seguintes características:
Linear - As estimativas são feitas através de uma combinação linear dos
dados;
Sem viés - O método objetiva que o erro residual médio seja igual a zero;
Melhor estimador - O método objetiva minimizar a variância dos erros.
47
Considerando a dificuldade em conhecer os valores reais dos pontos
estimados que possibilite avaliar o erro e a variância verdadeiros, a krigagem
ordinária baseia-se em um modelo probabilístico, no qual o erro residual
médio, assim como a variância dos erros podem ser estimados.
No sentido de contornar a limitação da exigência de estacionaridade, surge
um novo tipo de krigagem, denominado de universal. Nessa situação as
variáveis regionalizadas são consideradas, segundo Yamamoto (1988), não
estacionárias, ou seja, representadas pela soma de uma componente de
deriva e outra devido às flutuações locais.
A componente aleatória, igual a diferença entre a variável regionalizada e
a componente de deriva, apresenta-se estacionária e, portanto, factível
para determinação das covariâncias ou semi-variâncias.
48
Segundo Landim (1994) a krigagem pode ser usada para:
a) Previsão do valor pontual de uma variável regionalizada em um
determinado local dentro do campo geométrico; é um procedimento de
interpolação exato que leva em consideração todos os valores observados,
o qual pode ser a base para cartografia automática por computador
quando se dispõe de valores de uma variável regionalizada dispostos por
uma determinada área.
b) Cálculo médio de uma variável regionalizada para um volume maior que
o suporte geométrico, como por exemplo, no cálculo do teor médio de uma
jazida a partir de informações obtidas de testemunhos de sondagens.
c) Estimação do drift, de modo similar à análise de superfícies de tendência.
49
Krigagem ordinária
A krigagem ordinária é um procedimento de estimação linear para uma
variável regionalizada que satisfaz a hipótese intrínseca e procura
minimizar, sem viés, o erro de estimação, ou seja, objetiva que o erro
residual médio seja igual a zero. Na realidade, a minimização do erro de
estimação constitui um dos principais objetivos no processo de estimação,
uma vez que, possibilita auferir a sua qualidade.
Além disso, a krigagem ordinária ainda tem como característica ser o
melhor estimador, pelo fato de minimizar a variância dos erros.
Considerando que é difícil quantificar o erro e a variância para os pontos
estimados, haja vista o desconhecimento dos valores reais, a krigagem
ordinária faz uso do modelo de função aleatória, de base probabilística,
que permite atribuir pesos às amostras usadas nas estimativas.
50
Krigagem universal
Nem
sempre
o
comportamento
espacial
de
uma
variável
tem
a
característica estacionária, ou seja, que a média seja constante. Isto não
ocorrendo, a variável apresenta uma deriva regional (tendência ou drift),
que consiste no valor médio ou esperado dentro de uma certa vizinhança e
que varia sistematicamente.
A krigagem universal é utilizada se ocorrer um trend nos dados, com a média
não sendo mais constante e o semivariograma ou a covariância dos dados
originais não sendo mais apropriados para modelizar a estrutura de
correlação espacial. O que se necessita é de um semivariograma dos
resíduos e um modelo para descrever a forma do trend.
A krigagem, nesse caso, é executada sobre os resíduos. Em outras palavras,
se a VR for não-estacionária, trabalha-se sobre a estacionaridade residual.51
Krigagem por indicação
Este tipo de modelagem computacional se caracteriza por utilizar os
procedimentos não lineares da geoestatística, a krigagem por indicação e
a simulação estocástica por indicação, para modelar a variabilidade dos
atributos espaciais. Estes procedimentos possibilitam a inferência de uma
aproximação discretizada do modelo de distribuição de probabilidade do
atributo que é, então, utilizada para modelagem da incerteza sobre seus
valores. Assim, tem-se uma modelagem espacial não paramétrica que
pode, portanto, ser usada sem restrições ao tipo de distribuição do atributo.
Os modelos de incerteza são obtidos diretamente da distribuição,
independem de um estimador escolhido e estão relacionados ao
comportamento de variabilidade do atributo.
52
Outra vantagem importante destes procedimentos é a possibilidade de se
modelar dados temáticos, além dos dados de natureza numérica. Assim,
pode-se
trabalhar
com
propagação
de
incertezas
para
modelos
computacionais que envolvam atributos numéricos e temáticos.
Os estimadores de krigagem são considerados estimadores lineares por
estimarem um valor, em uma posição espacial não observada, segundo
uma combinação linear dos valores de um subconjunto amostral local.
Além dos problemas com a estimativa de incerteza, estes estimadores são
usados apenas para inferir valores de variáveis de natureza numérica. A
krigagem linear não pode ser usada para inferir valores entre classes ainda
que exista ordenação entre elas.
53
Um estimador de krigagem não linear é um estimador de krigagem linear
aplicado sobre um conjunto amostral cujos valores do atributo foram
modificados segundo uma transformação não linear, por exemplo, uma
transformação gaussiana, uma transformação lognormal ou outra (Deutsch
e Journel 1998).
O procedimento de krigagem por indicação requer uma transformação
não linear, chamada de codificação por indicação, que transforma cada
valor do conjunto amostral Z(uα) em valores por indicação.
54
O estimador de krigagem por indicação possibilita inferências para dados
numéricos e para dados temáticos e, também, estimativas de incertezas
associadas a estes atributos. Esta técnica tem como principal vantagem ser
não paramétrica, ou seja, nenhum tipo de distribuição para a VA é
considerado a priori. Ela possibilita a estimativa da função de distribuição
da VA que, por sua vez, permite a determinação de incertezas e a
inferência
de
amostradas.
valores
Além
do
disso,
atributo,
em
diferentemente
localizações
da
espaciais
krigagem
linear,
não
este
procedimento consegue modelar atributos com alta variabilidade espacial,
sem a necessidade de se ignorar os dados amostrados cujos valores estão
muito distantes de uma tendência (Journel 1983).
55
Vantagens e desvantagens da krigagem por indicação
Pode-se ressaltar as seguintes vantagens, específicas do procedimento de
krigagem por indicação:
• a krigagem por indicação é não paramétrica. Não considera nenhum tipo
de distribuição de probabilidade a priori para a variável aleatória. Ao invés
disso, ela possibilita a construção de uma aproximação discretizada da
função de disribuição de Z(u). Os valores de probabilidades discretizados
podem ser usados diretamente para se estimar valores característicos da
distribuição, tais como: quantis, valor esperado e variância. Portanto não se
restringe a modelagem de atributos com distribuições simétricas como, por
exemplo, a gaussiana;
56
• a krigagem por indicação fornece uma metodologia única para
espacialização, com estimativa de incertezas, para atributos espaciais de
natureza temática e numérica;
• diferentemente da krigagem linear, que estima a variância do erro de
estimação em função do estimador e da distribuição geométrica das
amostras, a krigagem por indicação possibilita a estimativa de incertezas,
utilizando a função de distribuição acumulada condicionada da VA que
representa o atributo, independentemente do estimador;
• a krigagem por indicação pode ser usada para modelar atributos com
alta variabilidade espacial sem a necessidade de se filtrar amostras cujos
valores estão muito distantes de uma tendência (“outliers”);
57
• a krigagem por indicação permite melhorar a qualidade de estimação
com o uso de amostras indiretas, retiradas de fontes auxiliares, em conjunto
com o conjunto amostral do atributo, amostras diretas.
Além das vantagens expostas, os procedimentos de krigagem por indicação
apresentam
algumas
desvantagens.
Este
procedimento
requer,
do
especialista, um alto grau de interatividade para se definir a quantidade e
os valores de corte a serem utilizados. Também, exige que seja definido um
semivariograma para cada valor de corte considerado. Além disso, a
aproximação da funçaõ de distribuição apresenta alguns problemas,
conhecidos como desvios de relação de ordem, que devem ser corrigidos
automaticamente pelo procedimento.
58
Cokrigagem
A cokrigagem é similar à krigagem e permite estimar uma variável a partir
das informações que se tem sobre ela própria e também a partir das
informações disponíveis sobre outras variáveis que tenham correlação
espacial com ela.
A cokrigagem busca melhorar a estimação de uma variável pela utilização
de informações relativas também a outras variáveis com as quais ela está
correlacionada.
A cokrigagem deve ser utilizada quando a variável estudada for
subconhecida em relação às outras de cujos dados se socorre, ou seja,
quando a sua informação for insuficiente e quando a correlação espacial
entre ela e as demais for forte; e deve ser evitada quando o número de
observações em que tivermos dados da variável estudada e das outras a
ela correlacionados for pequeno.
59
“Jack-knifing”ou Validação cruzada
Os resultados obtidos com a krigagem envolvem um erro de estimação,
que representa a diferença entre o valor medido Z(xi) e o valor estimado
Z*(xi), para um mesmo local xi, que é obtido a partir do modelo variográfico
experimental utilizado.
De posse de ambos valores (medido e estimado) para um mesmo local
pode-se calcular um conjunto de n erros de estimação, E(xi) = [Z*(xi) – Z(xi)],
ou n erros reduzidos, R(xi) = [Z*(xi) – Z(xi)]/E(xi), onde E(xi) é o desvio
padrão da estimação. Há uma preferência pelo uso dos erros reduzidos
porque são adimensionais, e portanto, independentes das unidades das
variáveis sob análise, que podem ser diferentes
60
A técnica de Jack-knifing tem, exatamente, por objetivo, calcular os erros
de estimação e avaliar a qualidade do método de estimação.
Os valores estimados Z*(xi) e a variância de estimação 2E(xi) são
calculados para cada posição xi, onde existe um valor medido Z(xi), a partir
de então os erros podem ser calculados.
A qualidade do método de estimação pode ser avaliada através de duas
condições, no caso específico dos erros reduzidos (Souza, 1992):
- a média dos erros reduzidos (mE) deve ser igual a 0 (zero); e
- a variância dos erros reduzidos (2E) deve ser igual a 1.
61
Numa avaliação quantitativa, a melhor qualidade de estimação seria
alcançada quando o valor da média dos erros se aproximasse de 0 (zero) e
a variância dos erros se aproximasse de 1.
A técnica de Jack-knifing apresenta diversas vantagens, pois pode ser
utilizada para avaliar a qualidade do método de estimação, pode também
ser utilizada para definir o melhor número de vizinhos mais próximos a um
determinado ponto para estimação de um valor e ainda pode ser utilizada
para avaliar se o modelo variográfico experimental utilizado é o que melhor
se ajusta aos dados (Souza, 1992).
62
De modo resumido, a validação cruzada processa-se da seguinte forma:
a)é extraído,do conjunto original de dados, o valor correspondente a um
determinado ponto mostrado (Zi);
b) utilizando os dados remanescentes do conjunto de dados, estima-se o valor
desse ponto cujo valor foi retirado do conjunto, obtendo-se o valor Z*i,o*,
designando que o dado é estimado;
c) obtém-se o erro cometido nessa estimação, que vale (Zi - Z*i), e compara-se
esse valor com (Zi - Z*i)/σi;
d) repetem-se os procedimentos descritos nos itens a,b e c para todas as
observações disponíveis no conjunto de dados e procura-se observar se são
verificadas duas propriedades para o conjunto final obtido: a de que o valor
médio dos valores (Zi - Z*i) seja aproximadamente zero e a de que o valor
63
médio de [(Zi - Z*i)/σi]2 seja aproximadamente à unidade.
Além da disponibilidade de uma técnica como a de Jack-knifing para
avaliar a qualidade de estimação do método de interpolação, os métodos
geoestatísticos apresentam algumas outras vantagens em relação a outros
métodos de estimação, as quais podem ser vistas em seguida (Camargo,
1998):
Métodos geoestatísticos
Métodos convencionais

Os pesos são determinados a partir de um 
análise de correlação espacial baseada no
semivariograma.

Área de influência na
indicada pelo alcance.

Modela anisotropia, isto é, detecta as 
direções de maior e menor continuidade
espacial do fenômeno.
Anisotropia é ignorada.

Trata redundância (“clusters”), isto é, atribui 
pesos adequados para agrupamentos de
amostras.
Redundância é ignorada. Neste caso,
podem
ocorrer
superestimação
ou
subestimação de valores.
interpolação
é 
Os pesos são determinados meramente em
função da distância.
Raio de busca é arbitrário.
64
Utilização do Programa SPRING para modelagem
geoestatística de variáveis de solos
Sequência de Procedimentos Geoestatísticos
Serão apresentados os passos necessários para manipulação do módulo de
geoestatística do SPRING. A figura abaixo mostra a sequência a ser
executada para gerar modelos numéricos a partir da modelagem
geoestatística.
O Módulo de Procedimentos Geoestatísticos tem como objetivo a análise
em duas dimensões, 2D, para dados espacialmente distribuídos, no que diz
respeito a interpolação de superfícies geradas a partir de amostras
georreferenciadas. Portanto, a entrada de dados neste módulo é através
de um Plano de Informação (PI) do modelo numérico com amostras do tipo
pontos cotados, sendo que este PI pode ser criado através da importação
de outros formatos, editado ou mesmo convertido pela ferramenta de
geração de pontos amostrais.
A saída da modelagem por geoestatística produz um outro PI, também do
modelo numérico, porém com a representação de uma grade retangular,
com resolução definida pelo usuário. Posteriormente este PI pode ser
convertido para imagens ou outro produto qualquer.
65
66
Análise Exploratória – Geoestatística
Este módulo tem por finalidade proceder à análise exploratória dos dados
através de estatísticas univariadas e bivariadas. As estatísticas univariadas
fornecem um meio de organizar e sintetizar um conjunto de valores, que se
realiza principalmente através do histograma. Características importantes
do histograma são organizadas em três grupos (Costa Neto, 1977):
Medidas de localização: média, valor mínimo, quartil inferior, mediana,
quartil superior e valor máximo;
Medidas de dispersão: variância e desvio padrão;
Medidas de forma: coeficiente de assimetria, coeficiente de curtose e
coeficiente de variação.
As estatísticas bivariadas fornecem meios de descrever o relacionamento
entre duas variáveis, isto é, entre dois conjuntos de dados ou de duas
distribuições. Esta relação pode ser visualizada através do diagrama de
dispersão (ScatterPlot). O grau da relação linear entre as variáveis pode
ser medido através do coeficiente de correlação.
67
Geração de Semivariograma - Análise Unidirecional
Na geoestatística, a análise do semivariograma é uma etapa importante,
pois o modelo de semivariograma escolhido é a interpretação da estrutura
de correlação espacial a ser utilizada nos procedimentos inferenciais da
krigagem. A análise completa do semivariograma compreende os
seguintes passos:
- levantamento do semivariograma experimental;
- ajuste a uma família de modelos de semivariogramas;
- validação do modelo a ser utilizado nos procedimentos da krigagem.
Análise Unidirecional
A opção Unidirecional engloba dois tipos de estatísticas: Univariada e
Bivariada.
As estatísticas Univariadas disponíveis são: Semivariograma, Covariância,
Correlograma, Semivariograma Relativo Geral, Semivariograma Relativo
Emparelhado,
Semivariograma
de
Logaritmos,
Semimadograma,
Semivariograma Indicador Contínuo e Semivariograma Indicador
Categórico.
68
A opção Bivariada corresponde ao Semivariograma Cruzado.
A janela "Geração de Semivariograma" apresenta alguns campos
preenchidos como:
- Parâmetros do Lag (No. de Lag, Incremento e Tolerância);
- Parâmetros de Direções (Diri , Toli e Bwi , onde i=1,2,3 e 4) que são
inicializados com valores default.
Porém, em muitos casos, dependendo da geometria de amostragem, fazse necessário rever os valores desses parâmetros de forma a melhorar o
semivariograma experimental.
69
70
CÁLCULO DO SEMIVARIOGRAMA A PARTIR DE
AMOSTRAS REGULARMENTE ESPAÇADAS
71
CÁLCULO DO SEMIVARIOGRAMA A PARTIR DE
AMOSTRAS IRREGULARMENTE ESPAÇADAS
72
73
Algumas observações importantes, de ordem prática, com relação ao
semivariograma unidirecional são:
- tolerância angular suficientemente grande;
- direção do vetor “h” não é considerada;
- serve para definir melhor os parâmetros de distância;
- se um semivariograma unidirecional não apresenta uma estrutura
definida, não se deve esperar algo melhor dos semivariogramas
direcionais.
74
Geração de Semivariograma - Análise de Superfície
Se a Amostragem é do tipo Regular, os Parâmetros da Amostragem
Regular: No. Coluna, No. Linha, Res.X e Res.Y são informativos, ativados e
preenchidos,
automaticamente,
com
os
respectivos
valores
da
amostragem regular dos dados. Por outro lado, se a Amostragem é do
tipo Irregular esses campos são desativados.
Seguindo, os campos referentes aos Parâmetros do Mapa de Superfície:
No. LagX, No. LagY, No. Pares, Tol.LagX e Tol.LagY, são preenchidos com
valores "Default" e influenciam diretamente sobre o resultado final.
Os parâmetros No.LagX e No. LagY definem a dimensão da Superfície de
Semivariograma a ser gerada.
75
76
- A faixa de variação de valores, válidos, para os parâmetros No.LagX e
No.LagY é: 0 < valor < 100. Para No. LagX=50 e No. LagY=50, significa que
estaremos definindo uma Superfície de Semivariograma de tamanho 100
colunas por 100 linhas.
- É importante salientar que LagX e LagY estão associados às dimensões
métricas da área de estudo. Por exemplo, para uma área de estudo de
7Km de largura (longitude) por 10Km de altura (latitude) se o No. LagX=50 e
o No. LagY=50; significa que o primeiro Lag na direção X(+) ou X(-)
corresponde a 70 metros (7km / (2*No.LagX)), e o primeiro Lag na direção
Y(+) ou Y(-) corresponde a 100 metros (10km / (2* No.LagY)). O segundo
Lag na direção X(+) ou X(-) corresponde a 140 metros, e o segundo Lag na
direção Y(+) ou Y(-) corresponde a 200 metros, assim por diante, o vigésimo
primeiro Lag na direção X(+) ou X(-) corresponde a 1470 metros (70*21),
etc.
- parâmetro No. Pares estabelece o número mínimo de pares de amostras
desejável por Lag. Em outras palavras, isto significa que uma célula
qualquer só será estimada se o número de pares de amostras, que
satisfazem as condições de cálculo, for maior ou igual ao parâmetro No.
Pares especificado.
77
- Os parâmetros Tol. LagX e Tol. LagY são as tolerâncias estabelecidas nas
direções X (Leste) e Y (Norte) respectivamente. A Figura anterior ilustra um
exemplo. Note que o módulo do vetor h não possui um valor único, mas sim
uma faixa de valores que consequentemente são dependes das
tolerâncias especificadas. Isto flexibiliza o cálculo, de cada uma das células
que irão compor a superfície de semivariograma.
78
Na tela gráfica anterior, é possível detectar visualmente os eixos de
anisotropia. Associado aos eixos de maior e menor continuidade é possível
verificar as respectivas direções (Ângulos) e Alcances. Para isto, basta
posicionar o cursor sobre a tela gráfica, pressionar o botão esquerdo do
"mouse" e arrastá-lo. Os valores de Ângulo e Alcance são impressos no
rodapé da interface.
79
Modelagem ou Ajuste de Semivariograma
Descreve-se o módulo de ajuste de semivariograma experimental, através
de dois modos: Automático ou Visual.
- O modo automático utiliza o algoritmo de Olea et al. (1996), o qual
baseia-se no método dos mínimos quadrados. Este algoritmo fornece
também uma medida quantitativa, denominada informação de Akaike
(Akaike, 1974), que reporta para qual modelo o ajuste é mais preciso.
- O modo visual é recomendado a especialistas que possuem afinidade e
conhecimento do fenômeno em estudo. Neste modo, todos os parâmetros
são definidos por inspeção.
Além dos procedimentos de ajuste, Automático ou Visual, este módulo
define o modelo teórico de semivariograma a ser utilizado pelos módulos
de Validação e krigagem.
O ajuste ou a modelagem do semivariograma experimental se inicia após
a Geração de Semivariograma.
80
A tela de "Relatório de Dados" apresenta um conjunto de informações, tais
como: o tipo de modelo teórico escolhido, os valores de Efeito Pepita,
Contribuição e Alcance que são parâmetros que compõem o modelo.
É expresso também o valor de Akaike, que é um indicador do ajuste
realizado; pois quanto menor seu valor melhor o ajuste. Então, os
parâmetros Efeito Pepita, Contribuição e Alcance são sempre tomados
com relação ao menor valor de Akaike.
81
Validação do Modelo
Como visto anteriormente, a análise do semivariograma compreende o
levantamento do semivariograma experimental e posteriormente o ajuste a
uma família de modelos teóricos.
Em toda esta seqüência, existe sempre um certo grau de incerteza sobre os
parâmetros ajustados aos modelos. Esta incerteza é o erro da estimativa, o
qual pode ser obtido através do procedimento chamado validação do
modelo.
Resumidamente, o processo de validação envolve a re-estimação dos
valores conhecidos através dos parâmetros ajustados ao modelo do
semivariograma.
Antes de executar a krigagem, é recomendável verificar os resultados da
validação. Problemas óbvios podem ser identificados com os parâmetros
de entrada (por exemplo, a especificação do semivariograma) ou com os
dados (por exemplo, valores aberrantes, ou "outliers").
82
O módulo de validação desenvolvido no Spring fornece as seguintes
saídas:
- Diagrama espacial do erro;
- Histograma do erro;
- Estatísticas do erro;
- Diagrama dos valores Observados x Estimados;
- Resultados Numéricos.
83
Resultados
Por exemplo,
pressionando-se a
opção Diagrama
Espacial do Erro,
ocorre a abertura da
janela gráfica na
Figura.
- Os símbolos tipo cruz
na figura acima indicam
a localização geográfica
das amostragem e a
magnitude do erro (para
os símbolos pequenos o
erro é menor e viceversa).
84
Krigagem
Esta janela descreve a etapa de krigagem, com a qual se objetiva obter
uma grade regular de valores a partir dos dados (pontos) amostrados.
O módulo de Krigagem implementado no SPRING engloba krigagem
simples, krigagem ordinária e krigagem com vários modelos de tendência
em duas dimensões (2D) ou três dimensões (3D).
Os campos Res.X e Res.Y referem-se às resoluções em X e Y da grade de saída.
Estes campos podem ser alterados desde que os novos valores não proporcionem
uma grade de saída com número de coluna e ou de linha maior que 1000. Em
outras palavras, o módulo de Krigagem gera grades regulares com tamanho
máximo de 1000 colunas por 1000 linhas.
85
A Figura resume os parâmetros da grade de saída gerada pelo módulo de
krigagem.
86
Produtos gerados com a krigagem
- GKrV: refere-se à grade de valores estimados obtida da interpolação de
krigagem, a partir de um modelo anisotrópico que supostamente representa
a verdadeira continuidade espacial do fenômeno em estudo. Da análise
geoestatística realizada, supõe-se que o fenômeno apresenta maior
continuidade na direção Norte (0º) e menor na direção Leste (90º).
- GKrVe: refere-se à grade da variância de krigagem, associada a GKrV.
- GKrI: refere-se a Grade de valores estimados obtida da interpolação de
krigagem a partir de um modelo isotrópico. Neste caso, admite-se que a
continuidade espacial do fenômeno é a mesma em qualquer direção.
- GKrIe: refere-se à grade da variância de krigagem, associada a GKrI.
- GKrA : refere-se à grade de valores estimados obtida da interpolação de
krigagem, a partir de um modelo anisotrópico que utiliza direções
intermediárias (10º e 100º) às direções de máxima e mínima continuidade.
- GKrAe: refere-se à grade da variância de krigagem, associada a GKrA.
87
RESULTADOS DA KRIGAGEM
Como ponto de partida, é interessante verificar a continuidade espacial do
fenômeno em estudo (teor de argila). Para realizar tal análise, é necessário
transformar as grades de valores estimados e as correspondentes grades de
erros em imagens.
88
89
Através das imagens apresentadas na parte superior pode-se constatar
algumas características comuns:
- essas imagens revelam que, nas regiões Norte e Nordeste, o teor de argila
é relativamente baixo;
- na região Central, observa-se mudanças graduais do teor de argila, indo
de valores moderados a altos, e
- nas regiões Sul e Sudoeste aproximadamente moderado.
De maneira análoga, as figuras da parte inferior mostram que o erro da
estimativa aumenta à medida em que se afasta dos pontos de
observações. É possível também identificar, nestas imagens, regiões onde a
amostragem pode ser melhorada.
90
Um outro aspecto a ser observado nas Figuras da parte superior, e talvez o
mais importante, é o efeito da anisotropia:
· Observa-se, na primeira imagem, a qual supostamente representa a
verdadeira continuidade espacial, que as mudanças graduais do teor de
argila são visivelmente diferentes das demais, principalmente na região
central.
· A segunda imagem mostra que a continuidade espacial do teor de argila
se propaga uniformemente em todas as direções. Neste caso a anisotropia
é
mascarada
e,
portanto,
o
resultado
não
revela
a
verdadeira
continuidade espacial da variável em estudo.
· Por outro lado, a terceira imagem apresenta um caso intermediário à da
suposta continuidade espacial verdadeira. Este caso também não revela a
verdadeira variabilidade espacial, apenas mostra que o teor de argila se
propaga mais intensamente na direção 10º e menos intensamente na
direção ortogonal (100º).
91
APLICAÇÕES DA GEOESTATÍSTICA NO ESTUDO DE SOLOS
O solo, em função de suas características físicas e químicas, é elemento
natural
que
geoestatística,
vem
sendo
intensamente
demonstrando
resultados
estudado
que
com
a
comprovam
técnica
a
sua
heterogeneidade no tocante a diversas de suas propriedades.
Assim sendo, com base nos diversos estudos que vem sendo realizados,
atesta-se
a
necessidade
dessa
técnica
como
forma
de
avaliar
estatisticamente a variabilidade espacial de diferentes propriedades em
áreas que aparentemente pareçam homogêneas. Essa homogeneidade
está muitas vezes associada às unidades de solo, delimitadas via de regra
pela posição na paisagem.
92
Reichardt et al. (1986) salientam que grande parte de avaliações feitas nos
solos, são feitas considerando-os como homogêneo no plano horizontal X, Y,
mas variando apenas em propriedade, de acordo com a ocorrência dos
horizontes
com
suas
propriedades
distintas.
Entretanto,
devido
a
necessidade do aumento das exigências de produtividade, modelos
simples tem sido insuficientes e a necessidade de considerar a variabilidade
nas três direções X, Y, e Z, têm-se mostrado cada vez mais presente, em
todas as áreas da ciência do solo: física, química, fertilidade e
conservação.
Na área de conservação do solo a estimação da erodibilidade dos solos,
obtida de forma indireta é de grande importância. Para isso, leva-se em
consideração propriedades do solo que podem ser aferidas através de
amostras de campo, e assim sendo há a possibilidade de avaliar a sua
variabilidade espacial.
93
Reichardt et al. (1986) comentam que o solo e as distribuições das
diferentes partes das plantas, dentro e fora do solo, são fundamentalmente
heterogêneos. Em função disso, medidas de parâmetros de solo e planta,
muitas vezes apresentam irregularidades que podem ou não estar
distribuídas ao acaso em relação à sua distribuição espacial no campo. O
autor comenta ainda que com as técnicas geoestatísticas ou espaciais,
informações adicionais sobre a estatística clássica podem ser obtidas, uma
vez consideradas as posições relativas de cada medida. No caso de
delineamentos experimentais em solos, a avaliação da variabilidade
espacial pode ser considerada como positiva, sob um novo enfoque de
estudo, que não se prende aos resultados obtidos com a estatística clássica
ou casual, a qual não considera a posição dos pontos amostrados no
espaço.
94
Uso da geoestatística na experimentação de campo em solos
Warnick e Nielsen (1980) avaliaram a variabilidade de solos, bem como os
aspectos relativos à amostragem, autocorrelação e análise espacial.
Gurovitch e Stern (1983) e Sisson e Wierenga (1981) avaliaram a variabilidade
espacial do processo de infiltração de água em solos.
Silva et al. (1989) estudaram a variabilidade espacial da resistência à
penetração, em um latossolo vermelho-escuro, determinada com um
penetrômetro. O trabalho objetivava detectar a profundidade e a espessura
de uma camada com resistência à penetração superior a 17,57 kg/cm2.
Utilizando métodos geoestatísticos, os autores avaliaram que havia uma
grande variabilidade da área quanto aos parâmetros estudados.
95
Vauclin (1982) e Morkoc et al. (1985) estudaram a variabilidade espacial da
temperatura da superfície do solo e a relação com outras propriedades.
Reichardt et al. (1984) revelam como a variabilidade espacial da umidade
do solo pode ser utilizada para estudar a influência sobre outras
propriedades do solo.
Reichardt et al. (1986) estudaram a variabilidade espacial do pH em água
em um latossolo vermelho-escuro orto, comparando os dados com uma
avaliação feita pela estatística clássica. Chegaram a conclusão de que a
geoestatística pode fornecer subsídios para um melhor esquema de
amostragem.
96
Vieira et al. (1981) utilizaram 1280 medidas de campo relativas a infiltração,
para avaliar a variabilidade espacial do fenômeno, bem como avaliar o
número de amostras necessárias para reproduzir as medidas de infiltração
na área sob estudo. Os resultados obtidos indicaram que 128 amostras
seriam suficientes para representar a informação obtida com as 1280
amostras iniciais.
Vieira et al. (1982) avaliaram a variabilidade espacial da retenção de água,
densidade e granulometria em três solos do estado de São Paulo. Os
resultados mostraram que a escala de variação muda bastante de solo
para
solo.
A
análise
geoestatística
permitiu
também
estabelecer
espaçamento entre amostras para os solos estudados, para permitir
estimativas a espaços menores sem tendência e com variância mínima.
97
Vieira et al. (1983) procuraram mostrar as diferentes áreas agronômicas nas
quais podem ser utilizadas as técnicas geoestatísticas, objetivando o estudo
da variabilidade espacial.
Uma primeira área agronômica diz respeito ao levantamento de solos, que
foi estudada por Grossman. Este autor trabalhou com as variáveis
profundidade do solo para um valor estimado de 40% de areia e a
percentagem de areia, utilizando uma grade de amostragem irregular.
Para a primeira variável foi possível ajustar um modelo esférico ao
semivariograma, enquanto a segunda variável apresentou variância não
finita. O autor avalia que essas variáveis tem uma forte estrutura esférica
com ranges de aproximadamente 300 pés. O semivariograma cruzado das
duas variáveis tem uma estrutura linear com range de 600 pés e a
correlação entre ambas não foi alta.
98
Outro tipo de estudo foi realizado por Waynick, que trabalhou com
nitrificação do solo e tomou amostras de solo em duas profundidades, em
esquema radial. As variáveis consideradas foram o nitrato residual, amostras
com inexistência de nitrogênio, outras com 0,2 g de sulfato de amônia e
outras ainda com 1g de sangue submetido ao ressecamento. Apenas as
amostras coletadas em subsuperfície com nitrato residual e sangue,
apresentaram
semivariogramas
com
modelo
esférico.
No
geral
os
semivariogramas experimentais e os semivariogramas cruzados não foram
bem definidos , talvez devido ao esquema de amostragem.
99
Em outro estudo, Waynick e Sharp analisaram com o conteúdo de carbono
e nitrogênio para duas áreas (Davis e Oakley) que apresentavam muita
semelhança pedológica e estavam desprovidas de vegetação. As amostras
foram coletadas em esquema de grade e apresentaram semivariogramas
muito diferentes, embora com estruturas bem definidas, exceto para o
carbono em Davis. Em Oakley, os semivariogramas experimentais e os
semivariogramas
cruzados para carbono e
nitrogênio
apresentaram
estruturas muito similares. Para a área de Davis o semivariograma cruzado
para nitrogênio e carbono apresentou estrutura bem definida, embora o
semivariograma para carbono tenha apresentado efeito pepita puro.
100
Vauclin et al. (1983) procuraram avaliar o uso da cokrigagem como forma
de conhecer a variabilidade espacial de uma variável que apresenta
dificuldade de amostragem, considerando sua correlação espacial com
outra variável melhor amostrada. Obtiveram de uma área de 40 x 70 m,
amostras em um esquema de grade com nós distantes uns dos outros 10 m,
no intervalo de profundidade de 20 a 40 cm. As variáveis amostradas foram
areia, silte, argila, conteúdo gravimétrico de água retido a 1/3 bar (pF25) e
o conteúdo avaliável de água (AWC). Os resultados demonstraram que os
semivariogramas de todas as variáveis apresentaram efeito pepita. Para
argila e areia o modelo variográfico encontrado foi o esférico, enquanto
para as demais variáveis foi o linear. Para determinação dos valores de
pF25 e AWC em pontos intermediários da grade amostral (5 m), foi
encontrada correlação com o conteúdo de areia nos pontos da grade
original, e utilizou-se a técnica da cokrigagem com eficiência, para
estimação dos valores de AWC nos pontos não amostrados.
101
Souza (1992) avaliou a variabilidade espacial de fósforo, potássio, matéria
orgânica, argila, densidade e umidade do solo em diferentes sistemas de
manejo, profundidades e tipos de solo de duas localidades no Rio Grande
do Sul (Eldorado do Sul e Passo Fundo). Utilizou malhas de amostragem de
1m x 1m em um dos locais e de 10m x 10 m em outro. Os resultados obtidos
demonstraram que houve, na grande maioria dos casos, correlação
espacial para as propriedades do solo nos sistemas de manejo que foram
avaliados. Com base nesses resultados, verificou-se que não houve
alteração significativa no solo em função dos efeitos continuados da ação
antrópica
que
pudessem
suplantar
a
variabilidade
subjacente
e
espacialmente estruturada do solo ao natural, levando a uma distribuição
aleatória. Essa hipótese havia sido levantada, porém não foi confirmada.
102
Martinez e Zinck (1994) estudaram a variabilidade espacial dos efeitos do
desmatamento de floresta úmida e do manejo de pastagens em
ambiente
da
propriedades
amazônia
físicas
do
colombiana
solo
e
mais
sobre
a
deterioração
especificamente
das
sobre
a
compactação do solo em duas profundidades, 0-5 cm e 5-10 cm.
Utilizaram como principais variáveis a resistência a penetração e a
densidade aparente em áreas sob condições físicas semelhantes. No que
diz respeito à resistência a penetração, verificaram que em ambiente de
floresta, na camada superficial de solo o modelo variográfico adotado foi
o linear, sem que houvesse uma boa estruturação espacial. No caso da
camada inferior de solo, o modelo ajustado foi o esférico, e houve o claro
reconhecimento de um padrão espacial. Sob pastagem os modelos
ajustados para ambas as camadas foram o esférico e o exponencial,
respectivamente, com baixa dependência espacial e elevado efeito
pepita.
103
Vieira et al. (1988) procuraram quantificar propriedades físicas do solo
necessárias ao planejamento da microbacia hidrográfica do córrego São
Joaquim, em Pirassununga (SP), e caracterizar sua variabilidade espacial,
com vistas ao estabelecimento de método para uso em outras áreas.
Utilizaram as variáveis argila, silte, areia fina, areia grossa, densidade do solo
a 10 cm, densidade do solo a 20 cm e infiltração inicial e final. Os autores
chegaram a, entre outras conclusões, que a densidade de amostragem
utilizada de 150 m, poderia ser estendida para 200 m; a geoestatística como
ferramenta para caracterizar a variabilidade espacial dos parâmetros
utilizados foi útil no sentido de que foi possível perceber as relações entre as
variáveis; e que o método adotado pode servir de guia para outros locais.
104
De Maria et al. (1992) estudando a mesma microbacia hidrográfica
mencionada anteriormente, procuraram avaliar como a fertilidade do solo
se distribui na área e que fatores estão a ela relacionados. Para tanto
utilizaram esquema de amostragem semelhante a situação anterior dos
parâmetros físicos, com pontos regularmente espaçados de 150 m. Os
parâmetros utilizados foram: fósforo, matéria orgânica, pHCaCl2, potássio,
cálcio, magnésio, H+Al, soma de bases, CTC e saturação de bases. Os
autores chegaram a conclusão de que o método utilizado permitiu
conhecer a variação dos parâmetros de fertilidade do solo para uma
avaliação inicial.
105
Trabalhando com técnicas geoestatísticas em grandes áreas, Yost et al.
(1982) procuraram determinar a estrutura da dependência espacial de
propriedades químicas do solo em grandes distâncias e examinar e
interpretar semivariogramas de propriedades químicas do solo. A área
estudada foi na Ilha do Havaí, onde em 80 áreas amostrais foram feitos
transectos com intervalo amostral da ordem de 1 a 2 km e as amostras
foram coletadas na profundidade de 0-15 cm e 30-45 cm. Os resultados
obtidos demonstraram que maior há maior estruturação espacial a
grandes distâncias dos dados coletados em superfície do que no subsolo.
Isto demonstra que as propriedades químicas do subsolo tem zonas de
influência que devem ser caracterizadas pelos processos de formação do
solo e que na superfície as chuvas tem imposto um elevado grau de
uniformidade, ou seja, um fator resultante dos agentes externos.
106
Reynolds et al. (1994) estudaram a bacia hidrográfica do rio Grande, sul
de Ontário, Canadá, com o intuito de verificar a variabilidade espacial e
temporal da capacidade dos solos quanto ao potencial de poluição dos
recursos hídricos subsuperficiais, por produtos agroquímicos (pesticidas). As
técnicas geoestatísticas foram utilizadas para extrapolar os resultados
pontuais obtidos de modelos de simulação de transporte de solutos, para
áreas relativamente grandes, em conjunto com o uso de sistema de
informações geográficas, para permitir a combinação dos mapas de
isovalores gerados pela krigagem com outros mapas de atributos do solo,
práticas agrícolas, práticas de manejo da terra, etc. Utilizando 119 pontos
amostrais em uma área maior do que a bacia hidrográfica estudada, os
autores obtiveram semivariogramas que demonstraram estruturação
espacial, com sill e efeito pepita bem definidos. Conforme os resultados
obtidos com os semivariogramas, os autores comentam que as estimativas
da krigagem tendem a ter boa precisão. Assim sendo, pelos resultados
preliminares obtidos, as perspectivas do trabalho são muito boas.
107
108
Simulação condicionada
Por meio da estimação, persegue-se uma estimativa que represente o mais
fielmente possível o valor verdadeiro de uma variável em um determinado
ponto, sendo a krigagem um desses estimadores.
Prioriza-se a estimação não-enviesada e a minimização da variância de
estimação.
Procura-se obter a melhor representação dos valores reais e, por meio da
simulação, objetiva-se o conhecimento das dispersões.
Enquanto as técnicas de interpolação apresentam como resultado uma
suavização da realidade, as simulações buscam manter a variabilidade
espacial do fenômeno real.
109
Comparação entre Simulação Condicionada e Krigagem
O estimador de krigagem possibilita a construção de funções de distribuição
de probabilidade, paramétricas ou não, para um atributo em estudo. A
distribuição de probabilidade, definida em cada posição de uma região
estacionária de interesse, é usada para se inferir, em cada posição, um valor
único do atributo e uma incerteza associada ao atributo.
Dessa forma, a krigagem, usada como um estimador, cria um único campo
aleatório cujos valores compõem uma superfície suavizada. A variabilidade
do estimador no espaço é uma versão suavizada da verdadeira
variabilidade e não reflete exatamente as flutuações reais (Huijbregts 1973).
Esta superfície tem variância menor do que o conjunto amostral, pois o valor
estimado para cada variável aleatória é obtido a partir da hipótese de
mínima variância do erro de estimação.
110
Resumidamente, as diferenças atribuídas aos procedimentos de krigagem e
simulação estocástica (Deutsch e Journel 1998 e Englund 1993) são:
1)A krigagem é um interpolador que gera um único campo aleatório
segundo os critérios de mínima variância e não tendenciosidade do
estimador. Portanto, o campo interpolado tem menor grau de variabilidade
do que as amostras e reproduz apenas a média das amostras. A simulação,
por sua vez, cria vários campos aleatórios que reproduzem características
globais e estatísticas, de ordem maior que 1, das amostras. Por exemplo, o
histograma das amostras é reproduzido pelos valores simulados.
2) A krigagem fornece um conjunto de representações locais onde a
acurácia local prevalece. A simulação fornece representações globais
alternativas, onde prevalece a representação de padrões de continuidade
espacial, que permite estimativas de acurácia global quando várias
localizações são consideradas conjuntamente.
111
3) O procedimento de krigagem é menos custoso computacionalmente do
que a simulação. Para se reproduzir, com um alto grau de acurácia,
momentos estatísticos de ordem maior que 1, são necessárias de 500 a
dezenas de milhares de campos simulados.
Apesar das diferenças, podem-se destacar pelo menos 3 semelhanças entre
os procedimentos de krigagem e de simulação estocástica:
1)São procedimentos geoestatísticos que utilizam um modelo de variografia,
definido sobre o conjunto amostral, para estabelecer o comportamento de
variabilidade do atributo numa região de interesse.
2) São procedimentos que honram o conjunto amostral original, ou seja, os
valores atribuídos às amostras não são modificados.
3) Possibilitam estimativas de estatísticas e incertezas sobre o atributo em
estudo.
112
Download

geoestat