MINI-CURSO GEOESTATÍSTICA APLICADA AO ESTUDO DE SOLOS Prof. Eduardo Rodrigues Viana de Lima Departamento de Geociências Universidade Federal da Paraíba 1 INTRODUÇÃO A geoestatística distingue-se da estatística clássica pelo fato de considerar que os valores de uma variável estão de alguma forma relacionados à sua distribuição espacial, ou seja, observações tomadas a curtas distâncias devem ser mais semelhantes do que aquelas tomadas a distâncias maiores, e por levar em consideração o comportamento espacial das variáveis apresenta grande potencial de aplicação nas geociências/ciências ambientais. 2 A Geoestatística não faz todo o tratamento de dados de forma integrada: é preciso parar no fim de cada etapa e selecionar, interpretar; também não cria dados: apenas trata a informação disponível. A Geoestatística utiliza os dados duas vezes, primeiramente para estimar a autocorrelação espacial e depois para estimar a variável em locais não amostrados . Como todas as técnicas estatísticas, a Geoestatística baseiase em um conceito probabilístico. Para uma aplicação segura da Geoestatística, é necessário um conhecimento prévio dos conceitos de Estatística, sendo importante que se proceda a um estudo estatístico elementar dos dados, com a finalidade de testar se as condições exigidas para aplicar o formalismo próprio da Geoestatística estão satisfeitas. 3 As técnicas geoestatísticas podem ser usadas para descrever e modelizar padrões espaciais (variografia), para predizer valores em locais não amostrados (krigagem), para obter a incerteza associada a um valor estimado em locais não amostrados (variância de krigagem) e para otimizar malhas de amostragem. No caso específico de utilização da Geoestatística com a finalidade de apoio à otimização de malhas de amostragem, é oportuno salientar que o erro cometido ao fazer uma avaliação com malhas de amostragem diminui com o detalhamento da malha, mas esse crescimento não é linear, conforme mostra a figura 1. 4 Figura 1 – Relação entre malha de amostragem e erro de avaliação. 5 Os métodos de estimação linear comumente utilizados fazem mais sentido quando a distribuição dos resíduos é aproximadamente normal. Sendo a média dos resíduos igual a zero e minimizando o desvio-padrão dos erros (feito pelos métodos de estimação linear), as predições obtêm um bom resultado. Assume-se que os erros de estimação sejam normalmente distribuídos. Quando o valor esperado para um erro de estimação é zero, diz-se que o estimador é não-enviesado. 6 As vantagens reconhecidas da Geoestatística sobre outras técnicas convencionais de predição são: -o estudo da variabilidade espacial (a análise de um semivariograma é a única técnica disponível para medir a variabilidade espacial de uma variável regionalizada); - a suavização (a estimação geoestatística suaviza ou faz a regressão de valores preditos); -o desagrupamento (ou efeito de anular as concentrações localizadas de observações); - a determinação da anisotropia (os comportamentos da variabilidade nas diferentes direções são considerados); 7 - a precisão (a krigagem fornece valores precisos sobre as áreas ou pontos a serem avaliados); - e a incerteza (estimativas obtidas por meio da krigagem associam a margem de erro que acompanha a estimativa). Tratando-se de um modelo probabilístico, a geoestatística explora a aparente aleatoriedade dos dados, para avaliar as medidas de correlação espacial dos mesmos, considerando uma determinada vizinhança (Huijbregts, 1975). 8 Assim, a variável que apresenta uma distribuição no espaço com certo grau de correlação espacial pode ser considerada regionalizada. Diversas variáveis relativas ao meio físico assumem as características de regionalizadas. O comportamento que assume essas variáveis está fundamentado em modelos probabilísticos e em função disso define a chamada teoria das variáveis regionalizadas (Matheron, 1962) apud Sturaro (1994), as quais são consideradas como a realização única de uma determinada função aleatória (Matheron, 1962) apud Sturaro (1994). A teoria das variáveis regionalizadas tem como objetivo básico avaliar as características estruturais dessas variáveis e efetuar estimativas. 9 Modelos utilizados na análise geoestatística Para conhecer as características da variável regionalizada, a mesma deve ser expressa através de uma função aleatória, seguindo alguma lei de distribuição de probabilidades e sendo caracterizada pelos parâmetros da distribuição. Uma variável regionalizada z(x) pode ser considerada como uma variável aleatória, no sentido de que os valores das medições feitas podem variar consideravelmente entre si, e assume um caráter estruturado dentro de uma determinada área, segundo uma certa lei no espaço, considerando que os valores das observações não são completamente independentes da sua localização geográfica. Assim, a variável regionalizada pode ser considerada como uma realização única de uma variável aleatória Z para uma localização dentro dessa área. Se a variável regionalizada z(x) for considerada para todos os locais da referida área, torna-se uma dentre um conjunto infinito de variáveis aleatórias Z(x) para todos os locais da área (Souza, 1992). 10 Considerando que a amostragem singular não permite que se conheça a função densidade de probabilidades de uma variável regionalizada, a geoestatística linear utiliza-se de momentos da função casual, para fazer inferências sobre essa função de densidade de probabilidades (Journel e Huijbregts, 1978 apud Sturaro, 1988). Os momentos são os seguintes: Estacionaridade de 1ª ordem E {x(i) - x (i+h)}= m(h) Onde: m(h) representa a tendência. x(i)e x(i+h)são dois valores de uma mesma variável regionalizada obtidos nos pontos i e i+h, separados entre si por uma distância h. A diferença entre esses dois valores é outra variável casual [x(i) - x(i+h)]. 11 Estacionaridade de 2ª ordem E {(x(i) - x(i+h) - m(h)} = 2y(h) onde: m(h) representa a tendência e y(h) representa a semivariância. O grau de relação entre pontos numa certa direção pode ser expresso pela covariância, e embora a covariância exista entre todas as distâncias possíveis ao longo de h, pode ser estipulado que somente serão considerados valores entre pontos regularmente espaçados por múltiplos de h. A covariância entre valores encontrados nessas distâncias separadas por h ao longo de h é: K(h)=K(h)=1/nx(i)x(i+h). Onde: K=covariância e n=número de pares de valores comparados. Isso significa que a covariância é igual à média dos produtos dos valores x(i) encontrados nos pontos i pelos valores x(i+h) encontrados nos pontos i+h, distantes a um intervalo h, e n representa o número de pares de valores comparados. Se h=0, K(h) passa a representar a variância K(0)=1/n x(i)x(i+0). Desse modo, pode-se computar uma função denominada semivariância, definida como metade da variância das diferenças y(h)=[x(i+h)-x(i)]/2. 12 A função aleatória pode ser estacionária (apresenta o comportamento espacial da variável invariante sob translação), ou seja, em qualquer direção assume-se que seja constante o valor médio esperado (Sturaro, 1994), e para tanto assumem-se hipóteses de estacionaridade para o processo, considerando que a variável deve ser estatisticamente homogênea e isotrópica, permitindo que se façam inferências estatísticas (Vieira et alii, 1983). Uma vez que, na prática, é difícil verificar a ocorrência da hipótese básica, trabalha-se ainda com as hipóteses de segunda-ordem e a intrínseca conforme Vieira et alii, (1983) e Pannatier (1996). 13 O vetor h apresentando-se infinitamente pequeno faz com que a variância e a covariância se tornem muito próximas. Como consequência, espera-se que ambas sejam aproximadamente iguais para pequenos valores de h. Para h maiores, a covariância diminuirá enquanto a variância aumentará, porque ocorrerá progressivamente maior independência entre os pontos a distâncias cada vez maiores. A semivariância distribui-se assim de 0, quando h=0, até um valor igual à variância das observações para um alto valor de h. Essas relações são mostradas quando a função y(h) é colocada em gráfico contra h para originar o semivariograma. 14 Ocorrendo estacionaridade de segunda-ordem, a covariância e o semivariograma são recursos disponíveis também para caracterizar a autocorrelação entre duas variáveis z(x) e z(x+h), separadas por um vetor h. Diante da existência de covariância, trabalha-se com uma variância finita, expressa como Varz(x ) c(0) . Entretanto, diversos fenômenos naturais apresentam capacidade infinita de dispersão, não possuindo covariância e portanto com inexistência de variância finita. Nesses casos, assume-se uma forma mais fraca de estacionaridade chamada hipótese intrínseca, na qual apenas semivariograma serve como instrumento de análise da estacionaridade. 15 o Assim sendo, a função aleatória z(x) é tida como sendo intrínseca se: - a esperança matemática Ez (x ) existe e não depende da posição x: Ez ( x ) m - para todo vetor de separaço h o incremento z(x h) z(x) tem variância finita que não depende de x: 1 1 2 Var z ( x h ) z ( x ) E z ( x h ) z ( x ) ( h ) 2 2 Embora haja possibilidade de avaliar o grau de dependência espacial de uma variável por meio do coeficiente de correlação e da covariância, o momento de inércia denominado de semivariograma é amplamente utilizado, pelo fato do mesmo ter condições de modelar fenômenos naturais de elevada dispersão espacial. 16 A função semivariograma pode ser considerada como o momento de inércia em torno da diagonal do diagrama de dispersão espacial, conforme mostra a figura 2 (Pannatier, 1996): Figura 2 - Diagrama de dispersão de uma variável V(x). Fonte: Pannatier, 1996. 17 Enquanto o momento de inércia constitui a metade da média das diferenças quadráticas entre as coordenadas de cada par de pontos, o semivariograma por sua vez, é calculado para uma mesma variável a diferentes intervalos de distância e em diferentes direções, com o intuito de verificar a continuidade espacial da variável. 18 Matematicamente a função semivariograma é expressa da seguinte forma: 1 n ( h ) V( x ) V( x h ) 2n i 1 2 onde: ( h) 1 n V(x ) V( x h) 2n i1 é o semivariograma; 2 n é o número de pares da variável considerados em uma determinada direção; V( x ) eV( x h ) é a mesma variável em dois pontos diferentes, separados por uma distância pré-estabelecida e constante a uma certa direção; ½ corresponde à metade da média das diferenças quadráticas e que representa a distância perpendicular dos pontos em relação à linha de 45 graus do diagrama de dispersão espacial (Fig. 2); h é o intervalo de distância pré-estabelecida. 19 Graficamente a função semivariograma é expressa conforme mostra a figura 3, e cujas características são apresentadas em seguida: Figura 3 - Esquema básico de uma função semivariograma. 20 - Amplitude variográfica (a) ou alcance: Distância na qual a máxima variabilidade é atingida e que corresponde ao aumento da distância entre as amostras; - Patamar (c) ou sill: Representa o nível de variabilidade onde o semivariograma se estabiliza. Corresponde a diferença entre o ponto de maior correlação ou a origem do semivariograma e o ponto que teoricamente representa a variância populacional e a variabilidade se estabiliza; - Efeito pepita (co): Descontinuidade na origem do semivariograma, correspondendo à diferença entre as amostras de maior proximidade e gerada por microrregionalizações, erros de amostragens ou erros de medidas. 21 Amostras separadas por distâncias menores do que a amplitude variográfica são espacialmente correlacionadas, por outro lado aquelas separadas por distâncias maiores não são, considerando que o valor do semivariograma sendo igual à variância dos dados, a variação é aleatória. Garcia (1988) considera que uma relação entre os parâmetros “co” e “c” expressa o grau de aleatoriedade do fenômeno regionalizado, e pode ser avaliada por “E”, que representa o efeito de pepita relativo. Esta componente aleatória pode ser classificada da seguinte forma: E < 0,15 componente aleatória pequena 0,15 < E < 0,30 E > 0,30 componente aleatória significativa componente aleatória muito significativa 22 Segundo Matheron (1963) apud Sturaro (1988), em geral, o semivariograma é uma função de incremento com a distância “h”, visto que, quanto mais afastadas forem as amostras, mais seus valores em média deverão ser diferentes. Esta característica reflete bem a noção de zona de influência de uma amostra. Nesse aspecto é que o semivariograma experimental deve ser considerado, no máximo, para a metade da distância total de amostragem no campo, isto quando o número de pares de dados seja maior do que 30 (Journel & Huijbrgts, 1991). 23 A noção de zona de influência de uma amostra está relacionada com a existência de regionalizações. Os semivariogramas exercem sua função no modelamento espacial de diversos fenômenos, quando da detecção da continuidade espacial ou regionalização de uma variável, e consequentemente de possíveis ocorrências de anisotropias. Para avaliar o comportamento da variabilidade espacial de uma variável, os semivariogramas são elaborados experimentalmente e submetidos à análise de suas características estruturais. A figura 4 ilustra as propriedades estruturais do semivariograma (Huijbregts, 1975): suporte, zona de influência, estruturas superpostas, anisotropia, continuidade espacial ou comportamento da variável próxima a origem, corregionalização. 24 Figura 4 - Propriedades estruturais do semivariograma. (Huijbregts, 1975) 25 Suporte: As variações de uma variável regionalizada ocorrem em um certo domínio do espaço ou domínio geométrico. A variável regionalizada é definida em um determinado suporte geométrico, cujas amostras no espaço tenham volume, forma e orientação. Se o suporte é alterado, uma nova variável regionalizada é definida, relacionada ao suporte inicial, mas com características diferentes e um semivariograma diferente. Zona de influência: O semivariograma é uma função de incremento da distância orientada “h”. Quanto mais essa distância entre as amostras aumenta, menos correlacionadas essas amostras ficam, ou seja, há um aumento da variância, até que ocorre uma total independência entre as mesmas. A zona de influência de uma variável regionalizada corresponde à distância chamada de range (a), a partir da qual a variância torna-se constante, e cuja medida é a amplitude variográfica. 26 Estruturas superpostas: Fenômenos de transição são caracterizados nos semivariogramas pelo range e pelo “sill”. Essas características podem refletir a existência de superposição de regionalização em diferentes escalas. Anisotropia: Considerando que a distância expressa no semivariograma é um vetor, este deve ser calculado para diferentes direções. Assim, quando o semivariograma apresenta configurações similares para todas a direções medidas, diz-se que o fenômeno é isotrópico. Quando isso não ocorre, pode ser que haja anisotropia de duas formas distintas. Num dos casos, o semivariograma apresenta a mesma forma, mas com amplitudes diferentes, o que representa anisotropia geométrica. No outro caso o semivariograma apresenta-se bem diferente para direções diferentes, representando uma anisotropia zonal. 27 Continuidade espacial ou comportamento da variável próxima a origem: O comportamento da curva do semivariograma em pequenas distâncias, ou seja, próxima a origem, reflete a continuidade da regionalização. Teoricamente, o semivariograma deveria ser nulo na origem, entretanto, isto geralmente não ocorre e o que passa a existir é uma descontinuidade denominada de efeito de pepita devido a problemas referentes a existência de microrregionalizações ou erro de amostragem. Independentemente da ocorrência ou não do efeito de pepita, o comportamento parabólico da curva a partir do seu ponto inicial, reflete uma boa continuidade espacial, enquanto que a forma linear reflete uma continuidade moderada. 28 Corregionalização: Esta característica é obtida no caso de duas variáveis regionalizadas serem analisadas em um mesmo suporte geométrico e também no mesmo semivariograma. O semivariograma cruzado exibe a existência de corregionalização ou correlação regionalizada entre as duas variáveis. 29 Segundo Landim (1993), para a utilidade do semivariograma as seguintes suposições básicas são requeridas: a) As diferenças entre pares de valores de amostras são determinadas apenas pela orientação espacial relativa dessas amostras; b) O interesse é enfocado apenas na média e na variância das diferenças, significando que esses dois parâmetros dependem unicamente da orientação (hipótese intrínseca); c) Por conveniência assume-se que os valores da área de interesse não apresentam tendência que possa afetar os resultados e assim a preocupação será apenas com a variância das diferenças entre valores das amostras. 30 Cálculo do semivariograma a partir de amostras regularmente espaçadas No cálculo de amostras regularmente espaçadas, o procedimento e efetuado geralmente para as direções de 0º, 45º, 90º, 135º, 180º, 225º, 270º, 315º e 360º, considerando todos os intervalos de distância possíveis numa determinada direção. Ou seja, tomando-se como ponto de partida a distância entre amostras de 10 m, qualquer par de amostras, naquela direção selecionada, que tenha essa distância, será considerada. O mesmo procedimento é efetuado para outras distâncias, tais como 20 m, 30 m, 40 m e assim por diante, até que algum ponto de parada seja alcançado, conforme exemplifica a figura 5 (Camargo, 1998). 31 Figura 5 – Amostras regularmente espaçadas usadas para cálculo do Semivariograma (Camargo, 1998). 32 Cálculo do semivariograma a partir de amostras irregularmente espaçadas Considerando o arranjo das amostras, conforme mostra a figura 6, para determinação do semivariograma, é necessário introduzir limites de tolerância para direção e distância (Camargo, 1998). Figura 6 - Parâmetros para o cálculo do semivariograma a partir de amostras 33 irregularmente espaçadas (Fonte: Deutsch e Journel, 1992 apud Camargo, 1998). Define-se o Lag e uma certa tolerância, que representam o campo de abrangência das medidas. O Lag e sua tolerância correspondem a um intervalo de distância no qual serão medidas todos os pares de amostras existentes. Define-se também a direção de medida com uma certa tolerância, na qual será efetuado o conjunto de medidas. À título de exemplo, se o Lag definido for de 300 m, e a direção de 900 com tolerância de 300, qualquer par de amostras cuja distância esteja compreendida entre 250 m e 350 m e 600 e 1200, será considerado no cálculo do semivariograma para aquele Lag utilizado. O cálculo se repete para diferentes valores de Lag e de direção. 34 Modelos variográficos De posse da função que exprime o comportamento da variabilidade espacial do fenômeno, pode-se conduzir análise que expresse aquele comportamento através de modelos de duas dimensões, ou seja, através de mapas. Para tanto, é necessário que sejam ajustados modelos matemáticos, ou funções teóricas, à função semivariograma, no intuito de que sejam determinados os valores nos locais não amostrados e a partir de então definidas curvas de isovalores ou blocos com valores médios. Segundo Sturaro (1988), embora possa existir uma grande quantidade de funções que se ajustem aos semivariogramas experimentais gerados, na prática, apenas alguns modelos, fundamentados nas teorias das variáveis regionalizadas, tem se ajustado em casos práticos aplicados. 35 Essas funções teóricas devem atender, segundo Sturaro (1994), à condição de serem “positiva definida”, ou seja, o sistema estruturado a partir dessas funções, para efetuar estimativas, deve possuir uma solução única e estável para o sistema de equações. Os modelos considerados básicos, simples e isotrópicos (Isaaks e Srivastava, 1989), podem ser classificados em dois grupos, segundo uma característica que os diferencia marcantemente: um grupo de semivariogramas com a presença de patamar e outro que não possui patamar. 36 Modelos com patamar ou modelos de transição Neste grupo de modelos a característica marcante diz respeito a um limite alcançado pelo aumento da função semivariograma, que ocorre à medida que aumenta a distância entre os pontos amostrais. Alcançado um determinado patamar (“sill”), que corresponde teoricamente à variância da população, a função se estabiliza. As variações dos modelos com patamar estão relacionadas basicamente com o comportamento espacial das amostras em relação à distância, até que a função atinja o patamar. Este intervalo de distância é conhecido como amplitude variográfica ou “range” e define o raio de influência da variável. Segundo Vieira et alii (1983), a amplitude variográfica é um importante parâmetro, considerando que as amostras separadas por distâncias menores que o “range” são correlacionadas com as demais, enquanto as amostras separadas por distâncias maiores que o range não são correlacionadas. 37 Figura 6 - Modelos variográficos com patamar. 38 Modelo esférico O mais facilmente encontrado nas aplicações da geoestatística, apresenta como característica o fato de que a tangente na origem da curva, atinge o patamar a uma distância correspondente a 2/3 da amplitude (a). 39 Modelo exponencial Outro modelo de transição comumente encontrado, tem como característica o fato de que o “range” é atingido quando o valor do semivariograma alcança apenas assintoticamente, 95% do valor do patamar. De outra forma, a tangente na origem atinge o patamar a uma 40 distância correspondente a 1/5 do “range”. Modelo gaussiano Este modelo tem bastante semelhança com o exponencial, principalmente no que se refere a forma como atinge o patamar e larga amplitude variográfica. Difere daquele quanto a seu comportamento parabólico na origem. 41 Modelo aleatório Este modelo, também denominado de efeito pepita puro, é característico de fenômenos de elevada aleatoriedade, considerando que há uma acentuada descontinuidade na origem do semivariograma. (Isaaks e Srivastava, 1989). Ocorre uma diferença significativa de valor entre pontos próximos, representando que pode haver uma provável regionalização inferior à escala de trabalho da malha de amostragem e/ou variações espúrias associadas com a coleta e medição das amostras (Sturaro, 1988). Segundo Landim (1993) este modelo representa o extremo 42 de uma situação de aleatoriedade, onde não ocorre covariância entre os valores e, portanto, a análise variográfica não se aplica. Modelos sem patamar Constituem os modelos que apresentam um aumento constante da variabilidade à medida em que a distância é incrementada (Sturaro, 1994), ou seja, apresentam uma variância infinita e não ocorre uma função de covariância (Landim, 1993). Satisfazem apenas a hipótese intrínseca e não são considerados modelos de transição. 43 Modelos lineares generalizados 44 Modelo logarítmico 45 Métodos geoestatísticos de estimação Após a análise variográfica, e verificada a possibilidade de estimação por técnicas geoestatísticas, pode-se proceder a uma estimação de valores em locais não amostrados. Constitui-se essa, numa tarefa importantíssima dos estudos ambientais, principalmente no que diz respeito a espacialização e representação cartográfica de diversos fenômenos de interesse. A krigagem constitui-se em um método de estimação por médias móveis e tem como característica particular, que o diferencia e o torna superior aos demais métodos de estimação, o fato de permitir o cálculo do erro associado às estimativas, chamado de variância de estimação. 46 O método de estimação da krigagem foi inicialmente concebido sob a hipótese de que a variável regionalizada resultava de um processo estocástico estacionário de 2ª ordem, denominada de krigagem simples e krigagem ordinária. Considerando a exigência da estacionaridade, esses tipos de krigagem não resolviam todos os problemas. A krigagem ordinária é considerada segundo Sturaro (1988) como o melhor estimador linear sem viés, em função das seguintes características: Linear - As estimativas são feitas através de uma combinação linear dos dados; Sem viés - O método objetiva que o erro residual médio seja igual a zero; Melhor estimador - O método objetiva minimizar a variância dos erros. 47 Considerando a dificuldade em conhecer os valores reais dos pontos estimados que possibilite avaliar o erro e a variância verdadeiros, a krigagem ordinária baseia-se em um modelo probabilístico, no qual o erro residual médio, assim como a variância dos erros podem ser estimados. No sentido de contornar a limitação da exigência de estacionaridade, surge um novo tipo de krigagem, denominado de universal. Nessa situação as variáveis regionalizadas são consideradas, segundo Yamamoto (1988), não estacionárias, ou seja, representadas pela soma de uma componente de deriva e outra devido às flutuações locais. A componente aleatória, igual a diferença entre a variável regionalizada e a componente de deriva, apresenta-se estacionária e, portanto, factível para determinação das covariâncias ou semi-variâncias. 48 Segundo Landim (1994) a krigagem pode ser usada para: a) Previsão do valor pontual de uma variável regionalizada em um determinado local dentro do campo geométrico; é um procedimento de interpolação exato que leva em consideração todos os valores observados, o qual pode ser a base para cartografia automática por computador quando se dispõe de valores de uma variável regionalizada dispostos por uma determinada área. b) Cálculo médio de uma variável regionalizada para um volume maior que o suporte geométrico, como por exemplo, no cálculo do teor médio de uma jazida a partir de informações obtidas de testemunhos de sondagens. c) Estimação do drift, de modo similar à análise de superfícies de tendência. 49 Krigagem ordinária A krigagem ordinária é um procedimento de estimação linear para uma variável regionalizada que satisfaz a hipótese intrínseca e procura minimizar, sem viés, o erro de estimação, ou seja, objetiva que o erro residual médio seja igual a zero. Na realidade, a minimização do erro de estimação constitui um dos principais objetivos no processo de estimação, uma vez que, possibilita auferir a sua qualidade. Além disso, a krigagem ordinária ainda tem como característica ser o melhor estimador, pelo fato de minimizar a variância dos erros. Considerando que é difícil quantificar o erro e a variância para os pontos estimados, haja vista o desconhecimento dos valores reais, a krigagem ordinária faz uso do modelo de função aleatória, de base probabilística, que permite atribuir pesos às amostras usadas nas estimativas. 50 Krigagem universal Nem sempre o comportamento espacial de uma variável tem a característica estacionária, ou seja, que a média seja constante. Isto não ocorrendo, a variável apresenta uma deriva regional (tendência ou drift), que consiste no valor médio ou esperado dentro de uma certa vizinhança e que varia sistematicamente. A krigagem universal é utilizada se ocorrer um trend nos dados, com a média não sendo mais constante e o semivariograma ou a covariância dos dados originais não sendo mais apropriados para modelizar a estrutura de correlação espacial. O que se necessita é de um semivariograma dos resíduos e um modelo para descrever a forma do trend. A krigagem, nesse caso, é executada sobre os resíduos. Em outras palavras, se a VR for não-estacionária, trabalha-se sobre a estacionaridade residual.51 Krigagem por indicação Este tipo de modelagem computacional se caracteriza por utilizar os procedimentos não lineares da geoestatística, a krigagem por indicação e a simulação estocástica por indicação, para modelar a variabilidade dos atributos espaciais. Estes procedimentos possibilitam a inferência de uma aproximação discretizada do modelo de distribuição de probabilidade do atributo que é, então, utilizada para modelagem da incerteza sobre seus valores. Assim, tem-se uma modelagem espacial não paramétrica que pode, portanto, ser usada sem restrições ao tipo de distribuição do atributo. Os modelos de incerteza são obtidos diretamente da distribuição, independem de um estimador escolhido e estão relacionados ao comportamento de variabilidade do atributo. 52 Outra vantagem importante destes procedimentos é a possibilidade de se modelar dados temáticos, além dos dados de natureza numérica. Assim, pode-se trabalhar com propagação de incertezas para modelos computacionais que envolvam atributos numéricos e temáticos. Os estimadores de krigagem são considerados estimadores lineares por estimarem um valor, em uma posição espacial não observada, segundo uma combinação linear dos valores de um subconjunto amostral local. Além dos problemas com a estimativa de incerteza, estes estimadores são usados apenas para inferir valores de variáveis de natureza numérica. A krigagem linear não pode ser usada para inferir valores entre classes ainda que exista ordenação entre elas. 53 Um estimador de krigagem não linear é um estimador de krigagem linear aplicado sobre um conjunto amostral cujos valores do atributo foram modificados segundo uma transformação não linear, por exemplo, uma transformação gaussiana, uma transformação lognormal ou outra (Deutsch e Journel 1998). O procedimento de krigagem por indicação requer uma transformação não linear, chamada de codificação por indicação, que transforma cada valor do conjunto amostral Z(uα) em valores por indicação. 54 O estimador de krigagem por indicação possibilita inferências para dados numéricos e para dados temáticos e, também, estimativas de incertezas associadas a estes atributos. Esta técnica tem como principal vantagem ser não paramétrica, ou seja, nenhum tipo de distribuição para a VA é considerado a priori. Ela possibilita a estimativa da função de distribuição da VA que, por sua vez, permite a determinação de incertezas e a inferência de amostradas. valores Além do disso, atributo, em diferentemente localizações da espaciais krigagem linear, não este procedimento consegue modelar atributos com alta variabilidade espacial, sem a necessidade de se ignorar os dados amostrados cujos valores estão muito distantes de uma tendência (Journel 1983). 55 Vantagens e desvantagens da krigagem por indicação Pode-se ressaltar as seguintes vantagens, específicas do procedimento de krigagem por indicação: • a krigagem por indicação é não paramétrica. Não considera nenhum tipo de distribuição de probabilidade a priori para a variável aleatória. Ao invés disso, ela possibilita a construção de uma aproximação discretizada da função de disribuição de Z(u). Os valores de probabilidades discretizados podem ser usados diretamente para se estimar valores característicos da distribuição, tais como: quantis, valor esperado e variância. Portanto não se restringe a modelagem de atributos com distribuições simétricas como, por exemplo, a gaussiana; 56 • a krigagem por indicação fornece uma metodologia única para espacialização, com estimativa de incertezas, para atributos espaciais de natureza temática e numérica; • diferentemente da krigagem linear, que estima a variância do erro de estimação em função do estimador e da distribuição geométrica das amostras, a krigagem por indicação possibilita a estimativa de incertezas, utilizando a função de distribuição acumulada condicionada da VA que representa o atributo, independentemente do estimador; • a krigagem por indicação pode ser usada para modelar atributos com alta variabilidade espacial sem a necessidade de se filtrar amostras cujos valores estão muito distantes de uma tendência (“outliers”); 57 • a krigagem por indicação permite melhorar a qualidade de estimação com o uso de amostras indiretas, retiradas de fontes auxiliares, em conjunto com o conjunto amostral do atributo, amostras diretas. Além das vantagens expostas, os procedimentos de krigagem por indicação apresentam algumas desvantagens. Este procedimento requer, do especialista, um alto grau de interatividade para se definir a quantidade e os valores de corte a serem utilizados. Também, exige que seja definido um semivariograma para cada valor de corte considerado. Além disso, a aproximação da funçaõ de distribuição apresenta alguns problemas, conhecidos como desvios de relação de ordem, que devem ser corrigidos automaticamente pelo procedimento. 58 Cokrigagem A cokrigagem é similar à krigagem e permite estimar uma variável a partir das informações que se tem sobre ela própria e também a partir das informações disponíveis sobre outras variáveis que tenham correlação espacial com ela. A cokrigagem busca melhorar a estimação de uma variável pela utilização de informações relativas também a outras variáveis com as quais ela está correlacionada. A cokrigagem deve ser utilizada quando a variável estudada for subconhecida em relação às outras de cujos dados se socorre, ou seja, quando a sua informação for insuficiente e quando a correlação espacial entre ela e as demais for forte; e deve ser evitada quando o número de observações em que tivermos dados da variável estudada e das outras a ela correlacionados for pequeno. 59 “Jack-knifing”ou Validação cruzada Os resultados obtidos com a krigagem envolvem um erro de estimação, que representa a diferença entre o valor medido Z(xi) e o valor estimado Z*(xi), para um mesmo local xi, que é obtido a partir do modelo variográfico experimental utilizado. De posse de ambos valores (medido e estimado) para um mesmo local pode-se calcular um conjunto de n erros de estimação, E(xi) = [Z*(xi) – Z(xi)], ou n erros reduzidos, R(xi) = [Z*(xi) – Z(xi)]/E(xi), onde E(xi) é o desvio padrão da estimação. Há uma preferência pelo uso dos erros reduzidos porque são adimensionais, e portanto, independentes das unidades das variáveis sob análise, que podem ser diferentes 60 A técnica de Jack-knifing tem, exatamente, por objetivo, calcular os erros de estimação e avaliar a qualidade do método de estimação. Os valores estimados Z*(xi) e a variância de estimação 2E(xi) são calculados para cada posição xi, onde existe um valor medido Z(xi), a partir de então os erros podem ser calculados. A qualidade do método de estimação pode ser avaliada através de duas condições, no caso específico dos erros reduzidos (Souza, 1992): - a média dos erros reduzidos (mE) deve ser igual a 0 (zero); e - a variância dos erros reduzidos (2E) deve ser igual a 1. 61 Numa avaliação quantitativa, a melhor qualidade de estimação seria alcançada quando o valor da média dos erros se aproximasse de 0 (zero) e a variância dos erros se aproximasse de 1. A técnica de Jack-knifing apresenta diversas vantagens, pois pode ser utilizada para avaliar a qualidade do método de estimação, pode também ser utilizada para definir o melhor número de vizinhos mais próximos a um determinado ponto para estimação de um valor e ainda pode ser utilizada para avaliar se o modelo variográfico experimental utilizado é o que melhor se ajusta aos dados (Souza, 1992). 62 De modo resumido, a validação cruzada processa-se da seguinte forma: a)é extraído,do conjunto original de dados, o valor correspondente a um determinado ponto mostrado (Zi); b) utilizando os dados remanescentes do conjunto de dados, estima-se o valor desse ponto cujo valor foi retirado do conjunto, obtendo-se o valor Z*i,o*, designando que o dado é estimado; c) obtém-se o erro cometido nessa estimação, que vale (Zi - Z*i), e compara-se esse valor com (Zi - Z*i)/σi; d) repetem-se os procedimentos descritos nos itens a,b e c para todas as observações disponíveis no conjunto de dados e procura-se observar se são verificadas duas propriedades para o conjunto final obtido: a de que o valor médio dos valores (Zi - Z*i) seja aproximadamente zero e a de que o valor 63 médio de [(Zi - Z*i)/σi]2 seja aproximadamente à unidade. Além da disponibilidade de uma técnica como a de Jack-knifing para avaliar a qualidade de estimação do método de interpolação, os métodos geoestatísticos apresentam algumas outras vantagens em relação a outros métodos de estimação, as quais podem ser vistas em seguida (Camargo, 1998): Métodos geoestatísticos Métodos convencionais Os pesos são determinados a partir de um análise de correlação espacial baseada no semivariograma. Área de influência na indicada pelo alcance. Modela anisotropia, isto é, detecta as direções de maior e menor continuidade espacial do fenômeno. Anisotropia é ignorada. Trata redundância (“clusters”), isto é, atribui pesos adequados para agrupamentos de amostras. Redundância é ignorada. Neste caso, podem ocorrer superestimação ou subestimação de valores. interpolação é Os pesos são determinados meramente em função da distância. Raio de busca é arbitrário. 64 Utilização do Programa SPRING para modelagem geoestatística de variáveis de solos Sequência de Procedimentos Geoestatísticos Serão apresentados os passos necessários para manipulação do módulo de geoestatística do SPRING. A figura abaixo mostra a sequência a ser executada para gerar modelos numéricos a partir da modelagem geoestatística. O Módulo de Procedimentos Geoestatísticos tem como objetivo a análise em duas dimensões, 2D, para dados espacialmente distribuídos, no que diz respeito a interpolação de superfícies geradas a partir de amostras georreferenciadas. Portanto, a entrada de dados neste módulo é através de um Plano de Informação (PI) do modelo numérico com amostras do tipo pontos cotados, sendo que este PI pode ser criado através da importação de outros formatos, editado ou mesmo convertido pela ferramenta de geração de pontos amostrais. A saída da modelagem por geoestatística produz um outro PI, também do modelo numérico, porém com a representação de uma grade retangular, com resolução definida pelo usuário. Posteriormente este PI pode ser convertido para imagens ou outro produto qualquer. 65 66 Análise Exploratória – Geoestatística Este módulo tem por finalidade proceder à análise exploratória dos dados através de estatísticas univariadas e bivariadas. As estatísticas univariadas fornecem um meio de organizar e sintetizar um conjunto de valores, que se realiza principalmente através do histograma. Características importantes do histograma são organizadas em três grupos (Costa Neto, 1977): Medidas de localização: média, valor mínimo, quartil inferior, mediana, quartil superior e valor máximo; Medidas de dispersão: variância e desvio padrão; Medidas de forma: coeficiente de assimetria, coeficiente de curtose e coeficiente de variação. As estatísticas bivariadas fornecem meios de descrever o relacionamento entre duas variáveis, isto é, entre dois conjuntos de dados ou de duas distribuições. Esta relação pode ser visualizada através do diagrama de dispersão (ScatterPlot). O grau da relação linear entre as variáveis pode ser medido através do coeficiente de correlação. 67 Geração de Semivariograma - Análise Unidirecional Na geoestatística, a análise do semivariograma é uma etapa importante, pois o modelo de semivariograma escolhido é a interpretação da estrutura de correlação espacial a ser utilizada nos procedimentos inferenciais da krigagem. A análise completa do semivariograma compreende os seguintes passos: - levantamento do semivariograma experimental; - ajuste a uma família de modelos de semivariogramas; - validação do modelo a ser utilizado nos procedimentos da krigagem. Análise Unidirecional A opção Unidirecional engloba dois tipos de estatísticas: Univariada e Bivariada. As estatísticas Univariadas disponíveis são: Semivariograma, Covariância, Correlograma, Semivariograma Relativo Geral, Semivariograma Relativo Emparelhado, Semivariograma de Logaritmos, Semimadograma, Semivariograma Indicador Contínuo e Semivariograma Indicador Categórico. 68 A opção Bivariada corresponde ao Semivariograma Cruzado. A janela "Geração de Semivariograma" apresenta alguns campos preenchidos como: - Parâmetros do Lag (No. de Lag, Incremento e Tolerância); - Parâmetros de Direções (Diri , Toli e Bwi , onde i=1,2,3 e 4) que são inicializados com valores default. Porém, em muitos casos, dependendo da geometria de amostragem, fazse necessário rever os valores desses parâmetros de forma a melhorar o semivariograma experimental. 69 70 CÁLCULO DO SEMIVARIOGRAMA A PARTIR DE AMOSTRAS REGULARMENTE ESPAÇADAS 71 CÁLCULO DO SEMIVARIOGRAMA A PARTIR DE AMOSTRAS IRREGULARMENTE ESPAÇADAS 72 73 Algumas observações importantes, de ordem prática, com relação ao semivariograma unidirecional são: - tolerância angular suficientemente grande; - direção do vetor “h” não é considerada; - serve para definir melhor os parâmetros de distância; - se um semivariograma unidirecional não apresenta uma estrutura definida, não se deve esperar algo melhor dos semivariogramas direcionais. 74 Geração de Semivariograma - Análise de Superfície Se a Amostragem é do tipo Regular, os Parâmetros da Amostragem Regular: No. Coluna, No. Linha, Res.X e Res.Y são informativos, ativados e preenchidos, automaticamente, com os respectivos valores da amostragem regular dos dados. Por outro lado, se a Amostragem é do tipo Irregular esses campos são desativados. Seguindo, os campos referentes aos Parâmetros do Mapa de Superfície: No. LagX, No. LagY, No. Pares, Tol.LagX e Tol.LagY, são preenchidos com valores "Default" e influenciam diretamente sobre o resultado final. Os parâmetros No.LagX e No. LagY definem a dimensão da Superfície de Semivariograma a ser gerada. 75 76 - A faixa de variação de valores, válidos, para os parâmetros No.LagX e No.LagY é: 0 < valor < 100. Para No. LagX=50 e No. LagY=50, significa que estaremos definindo uma Superfície de Semivariograma de tamanho 100 colunas por 100 linhas. - É importante salientar que LagX e LagY estão associados às dimensões métricas da área de estudo. Por exemplo, para uma área de estudo de 7Km de largura (longitude) por 10Km de altura (latitude) se o No. LagX=50 e o No. LagY=50; significa que o primeiro Lag na direção X(+) ou X(-) corresponde a 70 metros (7km / (2*No.LagX)), e o primeiro Lag na direção Y(+) ou Y(-) corresponde a 100 metros (10km / (2* No.LagY)). O segundo Lag na direção X(+) ou X(-) corresponde a 140 metros, e o segundo Lag na direção Y(+) ou Y(-) corresponde a 200 metros, assim por diante, o vigésimo primeiro Lag na direção X(+) ou X(-) corresponde a 1470 metros (70*21), etc. - parâmetro No. Pares estabelece o número mínimo de pares de amostras desejável por Lag. Em outras palavras, isto significa que uma célula qualquer só será estimada se o número de pares de amostras, que satisfazem as condições de cálculo, for maior ou igual ao parâmetro No. Pares especificado. 77 - Os parâmetros Tol. LagX e Tol. LagY são as tolerâncias estabelecidas nas direções X (Leste) e Y (Norte) respectivamente. A Figura anterior ilustra um exemplo. Note que o módulo do vetor h não possui um valor único, mas sim uma faixa de valores que consequentemente são dependes das tolerâncias especificadas. Isto flexibiliza o cálculo, de cada uma das células que irão compor a superfície de semivariograma. 78 Na tela gráfica anterior, é possível detectar visualmente os eixos de anisotropia. Associado aos eixos de maior e menor continuidade é possível verificar as respectivas direções (Ângulos) e Alcances. Para isto, basta posicionar o cursor sobre a tela gráfica, pressionar o botão esquerdo do "mouse" e arrastá-lo. Os valores de Ângulo e Alcance são impressos no rodapé da interface. 79 Modelagem ou Ajuste de Semivariograma Descreve-se o módulo de ajuste de semivariograma experimental, através de dois modos: Automático ou Visual. - O modo automático utiliza o algoritmo de Olea et al. (1996), o qual baseia-se no método dos mínimos quadrados. Este algoritmo fornece também uma medida quantitativa, denominada informação de Akaike (Akaike, 1974), que reporta para qual modelo o ajuste é mais preciso. - O modo visual é recomendado a especialistas que possuem afinidade e conhecimento do fenômeno em estudo. Neste modo, todos os parâmetros são definidos por inspeção. Além dos procedimentos de ajuste, Automático ou Visual, este módulo define o modelo teórico de semivariograma a ser utilizado pelos módulos de Validação e krigagem. O ajuste ou a modelagem do semivariograma experimental se inicia após a Geração de Semivariograma. 80 A tela de "Relatório de Dados" apresenta um conjunto de informações, tais como: o tipo de modelo teórico escolhido, os valores de Efeito Pepita, Contribuição e Alcance que são parâmetros que compõem o modelo. É expresso também o valor de Akaike, que é um indicador do ajuste realizado; pois quanto menor seu valor melhor o ajuste. Então, os parâmetros Efeito Pepita, Contribuição e Alcance são sempre tomados com relação ao menor valor de Akaike. 81 Validação do Modelo Como visto anteriormente, a análise do semivariograma compreende o levantamento do semivariograma experimental e posteriormente o ajuste a uma família de modelos teóricos. Em toda esta seqüência, existe sempre um certo grau de incerteza sobre os parâmetros ajustados aos modelos. Esta incerteza é o erro da estimativa, o qual pode ser obtido através do procedimento chamado validação do modelo. Resumidamente, o processo de validação envolve a re-estimação dos valores conhecidos através dos parâmetros ajustados ao modelo do semivariograma. Antes de executar a krigagem, é recomendável verificar os resultados da validação. Problemas óbvios podem ser identificados com os parâmetros de entrada (por exemplo, a especificação do semivariograma) ou com os dados (por exemplo, valores aberrantes, ou "outliers"). 82 O módulo de validação desenvolvido no Spring fornece as seguintes saídas: - Diagrama espacial do erro; - Histograma do erro; - Estatísticas do erro; - Diagrama dos valores Observados x Estimados; - Resultados Numéricos. 83 Resultados Por exemplo, pressionando-se a opção Diagrama Espacial do Erro, ocorre a abertura da janela gráfica na Figura. - Os símbolos tipo cruz na figura acima indicam a localização geográfica das amostragem e a magnitude do erro (para os símbolos pequenos o erro é menor e viceversa). 84 Krigagem Esta janela descreve a etapa de krigagem, com a qual se objetiva obter uma grade regular de valores a partir dos dados (pontos) amostrados. O módulo de Krigagem implementado no SPRING engloba krigagem simples, krigagem ordinária e krigagem com vários modelos de tendência em duas dimensões (2D) ou três dimensões (3D). Os campos Res.X e Res.Y referem-se às resoluções em X e Y da grade de saída. Estes campos podem ser alterados desde que os novos valores não proporcionem uma grade de saída com número de coluna e ou de linha maior que 1000. Em outras palavras, o módulo de Krigagem gera grades regulares com tamanho máximo de 1000 colunas por 1000 linhas. 85 A Figura resume os parâmetros da grade de saída gerada pelo módulo de krigagem. 86 Produtos gerados com a krigagem - GKrV: refere-se à grade de valores estimados obtida da interpolação de krigagem, a partir de um modelo anisotrópico que supostamente representa a verdadeira continuidade espacial do fenômeno em estudo. Da análise geoestatística realizada, supõe-se que o fenômeno apresenta maior continuidade na direção Norte (0º) e menor na direção Leste (90º). - GKrVe: refere-se à grade da variância de krigagem, associada a GKrV. - GKrI: refere-se a Grade de valores estimados obtida da interpolação de krigagem a partir de um modelo isotrópico. Neste caso, admite-se que a continuidade espacial do fenômeno é a mesma em qualquer direção. - GKrIe: refere-se à grade da variância de krigagem, associada a GKrI. - GKrA : refere-se à grade de valores estimados obtida da interpolação de krigagem, a partir de um modelo anisotrópico que utiliza direções intermediárias (10º e 100º) às direções de máxima e mínima continuidade. - GKrAe: refere-se à grade da variância de krigagem, associada a GKrA. 87 RESULTADOS DA KRIGAGEM Como ponto de partida, é interessante verificar a continuidade espacial do fenômeno em estudo (teor de argila). Para realizar tal análise, é necessário transformar as grades de valores estimados e as correspondentes grades de erros em imagens. 88 89 Através das imagens apresentadas na parte superior pode-se constatar algumas características comuns: - essas imagens revelam que, nas regiões Norte e Nordeste, o teor de argila é relativamente baixo; - na região Central, observa-se mudanças graduais do teor de argila, indo de valores moderados a altos, e - nas regiões Sul e Sudoeste aproximadamente moderado. De maneira análoga, as figuras da parte inferior mostram que o erro da estimativa aumenta à medida em que se afasta dos pontos de observações. É possível também identificar, nestas imagens, regiões onde a amostragem pode ser melhorada. 90 Um outro aspecto a ser observado nas Figuras da parte superior, e talvez o mais importante, é o efeito da anisotropia: · Observa-se, na primeira imagem, a qual supostamente representa a verdadeira continuidade espacial, que as mudanças graduais do teor de argila são visivelmente diferentes das demais, principalmente na região central. · A segunda imagem mostra que a continuidade espacial do teor de argila se propaga uniformemente em todas as direções. Neste caso a anisotropia é mascarada e, portanto, o resultado não revela a verdadeira continuidade espacial da variável em estudo. · Por outro lado, a terceira imagem apresenta um caso intermediário à da suposta continuidade espacial verdadeira. Este caso também não revela a verdadeira variabilidade espacial, apenas mostra que o teor de argila se propaga mais intensamente na direção 10º e menos intensamente na direção ortogonal (100º). 91 APLICAÇÕES DA GEOESTATÍSTICA NO ESTUDO DE SOLOS O solo, em função de suas características físicas e químicas, é elemento natural que geoestatística, vem sendo intensamente demonstrando resultados estudado que com a comprovam técnica a sua heterogeneidade no tocante a diversas de suas propriedades. Assim sendo, com base nos diversos estudos que vem sendo realizados, atesta-se a necessidade dessa técnica como forma de avaliar estatisticamente a variabilidade espacial de diferentes propriedades em áreas que aparentemente pareçam homogêneas. Essa homogeneidade está muitas vezes associada às unidades de solo, delimitadas via de regra pela posição na paisagem. 92 Reichardt et al. (1986) salientam que grande parte de avaliações feitas nos solos, são feitas considerando-os como homogêneo no plano horizontal X, Y, mas variando apenas em propriedade, de acordo com a ocorrência dos horizontes com suas propriedades distintas. Entretanto, devido a necessidade do aumento das exigências de produtividade, modelos simples tem sido insuficientes e a necessidade de considerar a variabilidade nas três direções X, Y, e Z, têm-se mostrado cada vez mais presente, em todas as áreas da ciência do solo: física, química, fertilidade e conservação. Na área de conservação do solo a estimação da erodibilidade dos solos, obtida de forma indireta é de grande importância. Para isso, leva-se em consideração propriedades do solo que podem ser aferidas através de amostras de campo, e assim sendo há a possibilidade de avaliar a sua variabilidade espacial. 93 Reichardt et al. (1986) comentam que o solo e as distribuições das diferentes partes das plantas, dentro e fora do solo, são fundamentalmente heterogêneos. Em função disso, medidas de parâmetros de solo e planta, muitas vezes apresentam irregularidades que podem ou não estar distribuídas ao acaso em relação à sua distribuição espacial no campo. O autor comenta ainda que com as técnicas geoestatísticas ou espaciais, informações adicionais sobre a estatística clássica podem ser obtidas, uma vez consideradas as posições relativas de cada medida. No caso de delineamentos experimentais em solos, a avaliação da variabilidade espacial pode ser considerada como positiva, sob um novo enfoque de estudo, que não se prende aos resultados obtidos com a estatística clássica ou casual, a qual não considera a posição dos pontos amostrados no espaço. 94 Uso da geoestatística na experimentação de campo em solos Warnick e Nielsen (1980) avaliaram a variabilidade de solos, bem como os aspectos relativos à amostragem, autocorrelação e análise espacial. Gurovitch e Stern (1983) e Sisson e Wierenga (1981) avaliaram a variabilidade espacial do processo de infiltração de água em solos. Silva et al. (1989) estudaram a variabilidade espacial da resistência à penetração, em um latossolo vermelho-escuro, determinada com um penetrômetro. O trabalho objetivava detectar a profundidade e a espessura de uma camada com resistência à penetração superior a 17,57 kg/cm2. Utilizando métodos geoestatísticos, os autores avaliaram que havia uma grande variabilidade da área quanto aos parâmetros estudados. 95 Vauclin (1982) e Morkoc et al. (1985) estudaram a variabilidade espacial da temperatura da superfície do solo e a relação com outras propriedades. Reichardt et al. (1984) revelam como a variabilidade espacial da umidade do solo pode ser utilizada para estudar a influência sobre outras propriedades do solo. Reichardt et al. (1986) estudaram a variabilidade espacial do pH em água em um latossolo vermelho-escuro orto, comparando os dados com uma avaliação feita pela estatística clássica. Chegaram a conclusão de que a geoestatística pode fornecer subsídios para um melhor esquema de amostragem. 96 Vieira et al. (1981) utilizaram 1280 medidas de campo relativas a infiltração, para avaliar a variabilidade espacial do fenômeno, bem como avaliar o número de amostras necessárias para reproduzir as medidas de infiltração na área sob estudo. Os resultados obtidos indicaram que 128 amostras seriam suficientes para representar a informação obtida com as 1280 amostras iniciais. Vieira et al. (1982) avaliaram a variabilidade espacial da retenção de água, densidade e granulometria em três solos do estado de São Paulo. Os resultados mostraram que a escala de variação muda bastante de solo para solo. A análise geoestatística permitiu também estabelecer espaçamento entre amostras para os solos estudados, para permitir estimativas a espaços menores sem tendência e com variância mínima. 97 Vieira et al. (1983) procuraram mostrar as diferentes áreas agronômicas nas quais podem ser utilizadas as técnicas geoestatísticas, objetivando o estudo da variabilidade espacial. Uma primeira área agronômica diz respeito ao levantamento de solos, que foi estudada por Grossman. Este autor trabalhou com as variáveis profundidade do solo para um valor estimado de 40% de areia e a percentagem de areia, utilizando uma grade de amostragem irregular. Para a primeira variável foi possível ajustar um modelo esférico ao semivariograma, enquanto a segunda variável apresentou variância não finita. O autor avalia que essas variáveis tem uma forte estrutura esférica com ranges de aproximadamente 300 pés. O semivariograma cruzado das duas variáveis tem uma estrutura linear com range de 600 pés e a correlação entre ambas não foi alta. 98 Outro tipo de estudo foi realizado por Waynick, que trabalhou com nitrificação do solo e tomou amostras de solo em duas profundidades, em esquema radial. As variáveis consideradas foram o nitrato residual, amostras com inexistência de nitrogênio, outras com 0,2 g de sulfato de amônia e outras ainda com 1g de sangue submetido ao ressecamento. Apenas as amostras coletadas em subsuperfície com nitrato residual e sangue, apresentaram semivariogramas com modelo esférico. No geral os semivariogramas experimentais e os semivariogramas cruzados não foram bem definidos , talvez devido ao esquema de amostragem. 99 Em outro estudo, Waynick e Sharp analisaram com o conteúdo de carbono e nitrogênio para duas áreas (Davis e Oakley) que apresentavam muita semelhança pedológica e estavam desprovidas de vegetação. As amostras foram coletadas em esquema de grade e apresentaram semivariogramas muito diferentes, embora com estruturas bem definidas, exceto para o carbono em Davis. Em Oakley, os semivariogramas experimentais e os semivariogramas cruzados para carbono e nitrogênio apresentaram estruturas muito similares. Para a área de Davis o semivariograma cruzado para nitrogênio e carbono apresentou estrutura bem definida, embora o semivariograma para carbono tenha apresentado efeito pepita puro. 100 Vauclin et al. (1983) procuraram avaliar o uso da cokrigagem como forma de conhecer a variabilidade espacial de uma variável que apresenta dificuldade de amostragem, considerando sua correlação espacial com outra variável melhor amostrada. Obtiveram de uma área de 40 x 70 m, amostras em um esquema de grade com nós distantes uns dos outros 10 m, no intervalo de profundidade de 20 a 40 cm. As variáveis amostradas foram areia, silte, argila, conteúdo gravimétrico de água retido a 1/3 bar (pF25) e o conteúdo avaliável de água (AWC). Os resultados demonstraram que os semivariogramas de todas as variáveis apresentaram efeito pepita. Para argila e areia o modelo variográfico encontrado foi o esférico, enquanto para as demais variáveis foi o linear. Para determinação dos valores de pF25 e AWC em pontos intermediários da grade amostral (5 m), foi encontrada correlação com o conteúdo de areia nos pontos da grade original, e utilizou-se a técnica da cokrigagem com eficiência, para estimação dos valores de AWC nos pontos não amostrados. 101 Souza (1992) avaliou a variabilidade espacial de fósforo, potássio, matéria orgânica, argila, densidade e umidade do solo em diferentes sistemas de manejo, profundidades e tipos de solo de duas localidades no Rio Grande do Sul (Eldorado do Sul e Passo Fundo). Utilizou malhas de amostragem de 1m x 1m em um dos locais e de 10m x 10 m em outro. Os resultados obtidos demonstraram que houve, na grande maioria dos casos, correlação espacial para as propriedades do solo nos sistemas de manejo que foram avaliados. Com base nesses resultados, verificou-se que não houve alteração significativa no solo em função dos efeitos continuados da ação antrópica que pudessem suplantar a variabilidade subjacente e espacialmente estruturada do solo ao natural, levando a uma distribuição aleatória. Essa hipótese havia sido levantada, porém não foi confirmada. 102 Martinez e Zinck (1994) estudaram a variabilidade espacial dos efeitos do desmatamento de floresta úmida e do manejo de pastagens em ambiente da propriedades amazônia físicas do colombiana solo e mais sobre a deterioração especificamente das sobre a compactação do solo em duas profundidades, 0-5 cm e 5-10 cm. Utilizaram como principais variáveis a resistência a penetração e a densidade aparente em áreas sob condições físicas semelhantes. No que diz respeito à resistência a penetração, verificaram que em ambiente de floresta, na camada superficial de solo o modelo variográfico adotado foi o linear, sem que houvesse uma boa estruturação espacial. No caso da camada inferior de solo, o modelo ajustado foi o esférico, e houve o claro reconhecimento de um padrão espacial. Sob pastagem os modelos ajustados para ambas as camadas foram o esférico e o exponencial, respectivamente, com baixa dependência espacial e elevado efeito pepita. 103 Vieira et al. (1988) procuraram quantificar propriedades físicas do solo necessárias ao planejamento da microbacia hidrográfica do córrego São Joaquim, em Pirassununga (SP), e caracterizar sua variabilidade espacial, com vistas ao estabelecimento de método para uso em outras áreas. Utilizaram as variáveis argila, silte, areia fina, areia grossa, densidade do solo a 10 cm, densidade do solo a 20 cm e infiltração inicial e final. Os autores chegaram a, entre outras conclusões, que a densidade de amostragem utilizada de 150 m, poderia ser estendida para 200 m; a geoestatística como ferramenta para caracterizar a variabilidade espacial dos parâmetros utilizados foi útil no sentido de que foi possível perceber as relações entre as variáveis; e que o método adotado pode servir de guia para outros locais. 104 De Maria et al. (1992) estudando a mesma microbacia hidrográfica mencionada anteriormente, procuraram avaliar como a fertilidade do solo se distribui na área e que fatores estão a ela relacionados. Para tanto utilizaram esquema de amostragem semelhante a situação anterior dos parâmetros físicos, com pontos regularmente espaçados de 150 m. Os parâmetros utilizados foram: fósforo, matéria orgânica, pHCaCl2, potássio, cálcio, magnésio, H+Al, soma de bases, CTC e saturação de bases. Os autores chegaram a conclusão de que o método utilizado permitiu conhecer a variação dos parâmetros de fertilidade do solo para uma avaliação inicial. 105 Trabalhando com técnicas geoestatísticas em grandes áreas, Yost et al. (1982) procuraram determinar a estrutura da dependência espacial de propriedades químicas do solo em grandes distâncias e examinar e interpretar semivariogramas de propriedades químicas do solo. A área estudada foi na Ilha do Havaí, onde em 80 áreas amostrais foram feitos transectos com intervalo amostral da ordem de 1 a 2 km e as amostras foram coletadas na profundidade de 0-15 cm e 30-45 cm. Os resultados obtidos demonstraram que maior há maior estruturação espacial a grandes distâncias dos dados coletados em superfície do que no subsolo. Isto demonstra que as propriedades químicas do subsolo tem zonas de influência que devem ser caracterizadas pelos processos de formação do solo e que na superfície as chuvas tem imposto um elevado grau de uniformidade, ou seja, um fator resultante dos agentes externos. 106 Reynolds et al. (1994) estudaram a bacia hidrográfica do rio Grande, sul de Ontário, Canadá, com o intuito de verificar a variabilidade espacial e temporal da capacidade dos solos quanto ao potencial de poluição dos recursos hídricos subsuperficiais, por produtos agroquímicos (pesticidas). As técnicas geoestatísticas foram utilizadas para extrapolar os resultados pontuais obtidos de modelos de simulação de transporte de solutos, para áreas relativamente grandes, em conjunto com o uso de sistema de informações geográficas, para permitir a combinação dos mapas de isovalores gerados pela krigagem com outros mapas de atributos do solo, práticas agrícolas, práticas de manejo da terra, etc. Utilizando 119 pontos amostrais em uma área maior do que a bacia hidrográfica estudada, os autores obtiveram semivariogramas que demonstraram estruturação espacial, com sill e efeito pepita bem definidos. Conforme os resultados obtidos com os semivariogramas, os autores comentam que as estimativas da krigagem tendem a ter boa precisão. Assim sendo, pelos resultados preliminares obtidos, as perspectivas do trabalho são muito boas. 107 108 Simulação condicionada Por meio da estimação, persegue-se uma estimativa que represente o mais fielmente possível o valor verdadeiro de uma variável em um determinado ponto, sendo a krigagem um desses estimadores. Prioriza-se a estimação não-enviesada e a minimização da variância de estimação. Procura-se obter a melhor representação dos valores reais e, por meio da simulação, objetiva-se o conhecimento das dispersões. Enquanto as técnicas de interpolação apresentam como resultado uma suavização da realidade, as simulações buscam manter a variabilidade espacial do fenômeno real. 109 Comparação entre Simulação Condicionada e Krigagem O estimador de krigagem possibilita a construção de funções de distribuição de probabilidade, paramétricas ou não, para um atributo em estudo. A distribuição de probabilidade, definida em cada posição de uma região estacionária de interesse, é usada para se inferir, em cada posição, um valor único do atributo e uma incerteza associada ao atributo. Dessa forma, a krigagem, usada como um estimador, cria um único campo aleatório cujos valores compõem uma superfície suavizada. A variabilidade do estimador no espaço é uma versão suavizada da verdadeira variabilidade e não reflete exatamente as flutuações reais (Huijbregts 1973). Esta superfície tem variância menor do que o conjunto amostral, pois o valor estimado para cada variável aleatória é obtido a partir da hipótese de mínima variância do erro de estimação. 110 Resumidamente, as diferenças atribuídas aos procedimentos de krigagem e simulação estocástica (Deutsch e Journel 1998 e Englund 1993) são: 1)A krigagem é um interpolador que gera um único campo aleatório segundo os critérios de mínima variância e não tendenciosidade do estimador. Portanto, o campo interpolado tem menor grau de variabilidade do que as amostras e reproduz apenas a média das amostras. A simulação, por sua vez, cria vários campos aleatórios que reproduzem características globais e estatísticas, de ordem maior que 1, das amostras. Por exemplo, o histograma das amostras é reproduzido pelos valores simulados. 2) A krigagem fornece um conjunto de representações locais onde a acurácia local prevalece. A simulação fornece representações globais alternativas, onde prevalece a representação de padrões de continuidade espacial, que permite estimativas de acurácia global quando várias localizações são consideradas conjuntamente. 111 3) O procedimento de krigagem é menos custoso computacionalmente do que a simulação. Para se reproduzir, com um alto grau de acurácia, momentos estatísticos de ordem maior que 1, são necessárias de 500 a dezenas de milhares de campos simulados. Apesar das diferenças, podem-se destacar pelo menos 3 semelhanças entre os procedimentos de krigagem e de simulação estocástica: 1)São procedimentos geoestatísticos que utilizam um modelo de variografia, definido sobre o conjunto amostral, para estabelecer o comportamento de variabilidade do atributo numa região de interesse. 2) São procedimentos que honram o conjunto amostral original, ou seja, os valores atribuídos às amostras não são modificados. 3) Possibilitam estimativas de estatísticas e incertezas sobre o atributo em estudo. 112