Programa de Ciência e Tecnologia para Gestão de Ecosistemas Ação "Métodos, modelos e geoinformação para a gestão ambiental” Técnicas de Suporte a Decisão para Modelagem Geográfica por Álgebra de Mapas Fábio Roque Moreira Gilberto Câmara Raimundo Almeida Filho Relatório Técnico Maio – 2001 RESUMO Este trabalho apresenta diversas tecnicas de suporte a decisão, envolvendo dados de natureza geográfica. São abordadas as técnicas de análise hierárquica, modelos bayesianos, lógica nebulosa, e redes neurais artificiais. Como estudo de caso, comparamos o desempenho de 8 métodos de análise multi-critério de dados geológicos e radiométricos na predição de áreas potenciais à ocorrência de minerais radiativos no planalto de Poços de Caldas. As metodologias empregadas Booleana, Média Ponderada, Fuzzy (MínimoMáximo, Média, Ponderado e Gama), Bayes, Redes Neurais Artificiais, segundo um modelo prospectivo empírico, definiram cenários com diferentes níveis de prioridades. O método Booleano gerou dados binários em formato temático, indicando áreas com potencialidade favorável e não-favorável. Os demais métodos produziram dados em formato numérico, posteriormente fatiados em 4 classes com diferentes graus de potencialidades (alta, média, baixa e nula). Nas avaliações dos cenários foram utilizados 48 ocorrências minerais que foram sobrepostas para inspeção visual e cruzadas (tabulação cruzada) para o cálculo das probabilidades condicionais, utilizadas no cálculo do grau de confiança. Os cenários gerados indicaram desempenhos diferentes nas avaliações. O cenário gerado pelo método Fuzzy Ponderado apresentou o melhor desempenho dentre todos os cenários avaliados, seguido pela inferência por Rede Neurais e pela Média Ponderada. Os métodos Booleano e Fuzzy Gama mostraram-se limitados e inadequados para estudos semelhantes. Os demais métodos apresentaram desempenhos medianos. CAPÍTULO 1 INTRODUÇÃO 1.1 – CONSIDERAÇÕES INICIAIS As atividades de pesquisa mineral nos dias atuais demandam a integração de uma grande quantidade de dados, para a construção de modelos prospectivos que sirvam de guias para tomadores de decisão. Essa estratégia de prospecção mineral decorre de uma maior dificuldade na descoberta de novos depósitos minerais e da maior eficiência dos sistemas computacionais (SIG’s) que permitem a manipulação de dados de diversas fontes, de maneira mais rápida, através de diversas técnicas matemáticas. Os aplicativos dos SIG’s são eficazes ferramentas em exploração mineral quando combinados com apropriadas análises estatísticas e adequados modelos matemáticos (Turner e Sjoekri, 1999). As técnicas de geoprocessamento permitem a implementação de modelos matemáticos, heurísticos e probabilísticos como ferramental para a construção de modelos prospectivos que servirão de guias no mapeamento da potencialidade à ocorrência mineral de determinada área. Como os princípios físicos e químicos que governam a formação de depósitos minerais são na maioria dos casos muito complexos para uma previsão direta segundo teorias expressas matematicamente, a busca de sítios favoráveis deve basear-se principalmente em relações empíricas, com a ajuda descritiva do “modelo de depósito”. (BonhamCarter, 1994). Esses modelos consistem em um número de depósitos conhecidos, considerados como sendo similares o suficiente em termos de suas características, para serem tratados como um “modelo descritivo” que pode guiar a pesquisa para novos depósitos do mesmo tipo. A descrição de um modelo de depósito inclui a avaliação dos processos físicos e químicos que controlam a sua formação. Na aplicação de sistemas de informação geográfica (SIG’s) para o mapeamento de potencialidade à ocorrência mineral, os modelos de depósitos exercem papel importante tanto na seleção e derivação dos dados que serão considerados como evidências, como na definição dos pesos que irão ponderar as evidências. A definição dos pesos pode ser efetuada de duas maneiras. Na primeira eles são estimados por critérios estatísticos, sendo utilizadas as relações espaciais entre os mapas de previsão (evidências) e as verdades de campo (depósitos ou ocorrências minerais conhecidos), ou mesmo zonas de anomalias geoquímicas, geofísicas, etc. Na segunda maneira, os pesos são estimados segundo a experiência de um especialista. Estes dois tipos de abordagem são também conhecidos como modelos “data-driven” e “knowledgedriven” respectivamente (Reddy, et al. 1992; Bonham-Carter, 1994; Pendock e Nedelijkovic, 1996) . No modelo “data-driven” os vários mapas de entrada são combinados através de diferentes técnicas, tais como, regressões logísticas, ponderação de evidências (probabilidade bayesiana), ou redes neurais. Os modelos de “knowledgedriven” incluem o uso da lógica booleana, média ponderada, lógica fuzzy, e teoria da crença de Dempster-Shafer. (Bonham-Carter, 1994). Outro aspecto a ser considerado durante as análises espaciais desenvolvidas em SIG’s para a geração de mapas de potencialidade é a qualidade dos produtos gerados. Burrough e McDonnell (1998) relatam que a qualidade dos mapas gerados em SIG’s é avaliada, na maioria dos casos, apenas pelo aspecto visual do produto final. Entretanto, controles de qualidades baseados apenas em aspectos visuais são insuficientes se a informação presente está errada ou foi violada por erros durante o processamento. Incertezas e erros são intrínsecos aos dados espaciais e necessitam ser identificados de modo apropriado e não ignorados ou mascarados por efeitos de visualização gráfica. Para a avaliação dos produtos gerados através de manipulações espaciais em SIG’s, técnicas de aferição baseadas em métodos estatísticos, tais como o coeficiente de Kappa e a probabilidade condicional, demostram ser úteis pois passam uma idéia quantitativa dos dados, em vez de se fazer apenas uma avaliação qualitativa, o que na maioria dos casos é um processo subjetivo. 1.2 - OBJETIVO Considerando as premissas acima, o presente trabalho foi idealizado tendo dois objetivos principais: • Utilizar metodologias de inferência espacial para pesquisa mineral através de análises multi-critérios de dados geológicos e geofísicos. A avaliação multi-critério visou a seleção de áreas com maior potencial à ocorrência de minerais radioativos no complexo alcalino de Poços de Caldas. • Análise qualitativa e quantitativa dos mapas temáticos de potencialidade gerados pela avaliação multi-critério. Na análise quantitativa foram utilizadas as ocorrências minerais conhecidas, que foram cruzadas com as diferentes classes de potencialidades dos cenários, para o cálculo da probabilidade condicional. Com as probabilidades a priore e posteriore foi calculado o grau de confiança de cada classe de prioridade dos diferentes cenários. A Figura 1.1 apresenta o fluxograma da metodologia adotada no presente estudo. Na caixa pontilhada, multi-critério, estão apresentadas as operações desenvolvidas para a geração dos 8 cenários de potencialidade. A caixa pontilhada, avaliação quantitativa e qualitativa, demostra as operações envolvidas na aferição dos cenários, onde, dependendo do resultado, o tomador de decisão mineral. pode avançar ou não com a pesquisa Sendo assim a proposta central do trabalho foi metodológica, ou seja, objetivou-se utilizar diferentes técnicas de inferência espacial na geração de cenários, os quais acredita-se, devem indicar as áreas mais favoráveis à ocorrência de minerais radioativos. Como os cenários são parecidos visualmente, mas não idênticos, uma avaliação quantitativa dos resultados, aliada à avaliação qualitativa, é de suma importância. Para a avaliação quantitativa utilizou-se a probabilidade a posteriore, que fornece um parâmetro numérico estabelecendo um grau de confiança. Fig. 1.1 – Fluxograma da metodologia proposta para o trabalho. CAPÍTULO 2 FUNDAMENTAÇÃO TEÓRICA: TÉCNICAS DE INFERÊNCIA ESPACIAL A integração de dados geológicos multi-fontes na pesquisa mineral é tarefa moldada para sistemas de informações geográficas. A tarefa de integração de dados em um SIG pode ser dividida em cinco etapas: construção do banco de dados; extração das evidências relevantes à previsão de depósitos minerais; construção de modelos de potencialidade mineral; visualização do dados de saída; e interpretação dos resultados (Bonham-Carter, 1990). Na maioria dos projetos desenvolvidos em SIG com tal objetivo, a principal proposta é a combinação de dados espaciais, com o objetivo de descrever e analisar interações, de modo a fazer previsões através de modelos prospectivos empíricos, fornecendo apoio para a definição de sítios com maiores chances de encerrar depósitos minerais. A combinação desses dados multi-fontes permite reduzir a ambigüidade de interpretações que normalmente pode ocorrer na análise individual desse dados (Pendock e Nedelijkovic, 1996). O uso da tecnologia de SIG’s na seleção de sítios potenciais envolve a análise de parâmetros que satisfaçam a um conjunto de critérios. Neste trabalho foram utilizados 8 métodos de inferência espacial para a integração dos dados (evidências): Booleano, Média Ponderada, Fuzzy (Mínimo-Máximo, Média, Ponderado, Gama), Bayes e Redes Neurais Artificiais. Para tal foi adotado um modelo prospectivo visando a definição de áreas potenciais à ocorrência de depósitos minerais radioativos no planalto de Poços de Caldas. Os métodos geram como resultado planos de informação com diferentes representações. O método Booleano gera dados com representação temática, sendo a potencialidade expressa espacialmente em forma de polígonos que representam classes (favorável e não favorável). Os demais métodos produzem dados com representação numérica, sendo a potencialidade expressa de forma numérica. 2.1 MÉTODO BOOLEANO O modelamento segundo operadores de lógica booleana em SIG’s é análogo à sobreposição de mapas em formato analógico em uma mesa de luz (“overlay”), método tradicionalmente utilizado em estudos geológicos. Essa semelhança, aliada à simplicidade operacional, fizeram com que o modelamento booleano fosse e venha sendo bastante empregado em diferentes estudos ambientais desenvolvidos em SIG’s. Os trabalhos de Harris (1989), Almeida Filho (1995), Lihao et al. (1997) são bons exemplos de estudos geológicos que adotaram essa metodologia. O Modelo Booleano envolve a combinação lógica de mapas binários através de operadores condicionais. Cada mapa utilizado pode ser entendido como um plano de informação (evidência). Os vários planos de informação são combinados segundo uma seqüência lógica para dar suporte a uma hipótese ou proposição definida. Diferentes operações são testadas, para determinar se as evidências satisfazem ou não às regras definidas pela hipótese. Para a aplicação da metodologia booleana é necessário que os planos de informação (evidências) representem apenas duas classes, ou seja, que apresentem um padrão binário. Em planos de informação com representação temática a generalização é obtida através de uma reclassificação das diferentes classes para “favorável” e “não-favorável”. Para planos de informação com representação numérica a divisão em duas classes é obtida através da definição de limiares de corte (Lc), que agruparão diferentes valores numéricos. Esse fatiamento pode ser melhor entendido através da função de pertinência (Fp) exemplificada na Figura 2.1. Onde função de pertinência, é uma função que, dado o valor x, ela determina se o elemento avaliado pertence ou não a um determinado conjunto em análise. No gráfico da Figura 2.2 o eixo x expressa a variação dos valores do atributo e o eixo y os valores de saída definidos pela função de pertinência (Fp). Os pontos La e Lb correspondem aos limiares de corte do conjunto. Pela figura fica claro que o resultado é expresso de forma binária, “0” (hipótese não satisfeita) e “1” (hipótese satisfeita), não sendo possível a condição talvez. Fig. 2.1 – Função de pertinência de conjuntos booleanos. Para a integração de planos de informação binários, a álgebra Booleana utiliza os ponderadores lógicos “E”, “OU”, “Exclusivo OU (XOR)” e “NÃO”, que determinam se uma hipótese satisfaz ou não a uma particular condição. Para melhor entendimento, imagine cada atributo como um conjunto (Figura 2.2). O operador “E” retorna a interseção entre dois ou mais conjuntos, ou seja, as entidades que pertencem aos conjuntos A e B. O operador “OU” retorna a união dos conjuntos, cujas entidades que pertencem tanto ao conjunto A como ao B. O “XOR” recupera as entidades pertencem a um conjunto e ao outro, mas não aos dois conjuntamente. E o “NÃO” é o operador da diferença, identificando as entidades que pertencem ao conjunto A mas não ao B. Embora esse método seja prático, normalmente não é o mais adequado, pois o ideal é que evidências que apresentem importâncias relativas desiguais recebam pesos diferentes, o que não ocorre no modelamento booleano que as trata como iguais. Para esses casos a técnica da Média Ponderada pode ser uma abordagem interessante. Outro problema com este tipo de modelamento é que assume-se que todas as entidades e seus atributos podem ser descritos e medidos exatamente. Porém, por razões de variação espacial, incerteza e limitações de medida, esta suposição não é realística (Burrough e Heuvelink, 1992). Fig. 2.2 – Diagrama de Venn mostrando os resultados da aplicação de operadores de lógica booleana para dois ou mais conjuntos. FONTE: Burrough e McDonnell (1998). 2.2 MÉDIA PONDERADA Eastman et al. (1995) citam a Média Ponderada como a técnica mais utilizada em projetos que envolvem análise espacial. Os trabalhos Harris (1989), Eastman et al. (1995), Silva (1994) e Almeida Filho (1995) são bons exemplos de estudos de inferência espacial baseados nessa técnica. Neste método, cada mapa de entrada será utilizado como uma evidência que receberá um peso relativo à sua importância para a hipótese sob consideração. Cada plano de informação receberá pesos diferentes, bem como as respectivas classes desses planos de informação. O resultado será um mapa com áreas que expressam um grau de importância relativa através de valores numéricos de saída. O primeiro passo para a aplicação do método é a ponderação das classes de cada plano de informação, segundo pesos definidos empiricamente. Isto feito, os planos de informação são então somados através de uma soma ponderada, onde cada plano de informação recebe pesos segundo sua importância relativa. A função matemática é expressa por: n r= ∑ wij ∗ y i =1 n ∑y i =1 j (2.1) j onde wij é o peso da classe "i" do plano de informação "j" , e yj o peso do plano de informação "j". O método de Média Ponderada permite uma maior flexibilidade na combinação de mapas do que o método Booleano. O mapa ponderado pode ser ajustado para refletir o julgamento de um especialista, segundo os pesos de importância definidos para cada critério. A maior desvantagem deste método, entretanto, recai provavelmente no caráter linear de adição das evidências (Bonham-Carter, 1994). 2.3 MÉTODO FUZZY A técnica fuzzy tem sido extensamente utilizada em trabalhos de inferência espacial desenvolvidos em SIG’s (Burrough, 1989; Burrough e Heuvelink,1992; Banai, 1993; Altman,1994). As vantagens do modelamento fuzzy são inúmeras quando comparadas aos modelamentos convencionais que forçam os especialistas à definir regras dicotômicas rígidas com contatos normalmente artificiais que diminuem a habilidade de articular eficientemente soluções para problemas complexos, tão comum em processos naturais. Serão abordados aqui os principais conceitos envolvidos na técnica de inferência fuzzy, como lógica fuzzy, conjuntos fuzzy ou função fuzzy, variáveis lingüísticas e operadores fuzzy. Discute-se também: a técnica de representação da importação semântica (IS), para contatos de polígonos; as vantagens do modelamento Fuzzy sobre o Booleano; e as diferenças entre os conceitos probabilidade e possibilidade. 2.3.1 Inferência Fuzzy: Fuzzy: principais conceitos A introdução dos conjuntos fuzzy para lidar com conceitos inexatos foi primeiramente proposta por Zadeh (1965). A concepção da lógica fuzzy surgiu da preocupação de Zadeh com a rápida diminuição da qualidade da informação fornecida por modelos matemáticos tradicionais, conforme aumenta a complexidade do sistema. Muito da complexidade, ele descobriu, advém do modo no qual as variáveis do sistema são representadas e manipuladas. Desde que essas variáveis podem apenas representar o estado do fenômeno como ou existindo ou não existindo, a matemática necessária para avaliar operações em vários “contatos” torna-se muito complexa. Para muitos pesquisadores (Zadeh, 1972; Cox, 1994; Fang, 1997) um benefício significante dos modelamentos baseados em lógica fuzzy é a habilidade de codificação do conhecimento, numa forma que se aproxima muito ao modo como os especialistas pensam em processos de decisão. Os sistemas de inferências baseados em lógica fuzzy possibilitam, assim, a captura do conhecimento próximo ao “modelo cognitivo” utilizado pelos especialistas na análise de problemas. Isto significa que o processo de aquisição do conhecimento é mais fácil, mais confiável e menos sujeito a erros não identificados. Nessa visão de modelamento de sistemas complexos, os mecanismos subentendidos são representados de modo lingüístico, através de variáveis lingüísticas, ao invés de matematicamente. Isto permite lidar de modo melhor com dados imprecisos, incompletos, ambíguos, e/ou vagos, tão comuns em sistemas geológicos. A idéia da variável lingüística é considerada por Cox (1994) como o cerne da técnica do modelamento fuzzy. Basicamente uma variável lingüística corresponde ao nome de um conjunto fuzzy. Sendo os conjuntos fuzzy, na prática, funções que indicam o grau de relacionamento de um valor de entrada (atributo) para com um conjunto fuzzy. Outra boa definição é dada por Fang (1997) que define um conjunto fuzzy como um conjunto de pares de valores (Tabela 2.1). O primeiro valor (lingüístico) é o membro do conjunto; por exemplo, Carlos. O segundo valor (numérico) é o grau de relação do membro para com o conjunto. Por exemplo, Carlos tem um grau de relação de 0.9 com o conjunto fuzzy atletas. Neste exemplo a variável lingüística é o “conjunto atleta”. TABELA 2.1 – CONJUNTO FUZZY ATLETAS Objeto João Aline Carlos Grau de relacionamento 0.1 0.7 0.9 O conjunto fuzzy é uma forma de caracterização de classes, que por várias razões não têm ou não podem definir limites rígidos (contatos) entre classes. Essas classes, definidas de maneira inexata, são chamadas de conjunto fuzzy. A utilização de um conjunto fuzzy é indicada sempre que se tiver que lidar com ambigüidade, abstração e ambivalência em modelos matemáticos ou conceituais de fenômenos empíricos (Burrough e McDonnell, 1998). Matematicamente um conjunto fuzzy é definido como segue: se Z denota um espaço de objetos, então o conjunto fuzzy A em Z é o conjunto expresso pelo par ordenado: A = (z, MFA (z)) para todo z ∈ Z, onde a função MFA(z) é conhecida como uma “graduação” mapeável do membro z em A. Normalmente MFA(z) é um número que varia de “0” a “1”, com o “1” representando o membro que se encaixa completamente ao conjunto e o “0” como o membro que não pertence ao conjunto. A graduação que mapeia os membros de um conjunto A reflete o tipo de ordenação que não são baseadas em probabilidade, mas sim numa aceitação de possibilidade. O valor da função MFA(z) de um objeto z em A pode ser interpretado como um grau de compatibilidade de um predicado associado ao conjunto A e ao objeto z. Ou seja, MFA(z) avalia o quanto z pode ser pertencente ao conjunto A (Burrough e McDonnell, 1998). A função fuzzy deve assegurar que o valor do membro no centro do conjunto é “1”, e que este decai de maneira lógica através da fronteira fuzzy (zona de transição) para as regiões fora do conjunto onde o valor deve ser “0”. O ponto onde o valor do membro é igual a 0,5 é denominado de “ponto de cruzamento” e ele deve coincidir com os contatos rígidos dos modelos Booleanos. A função deve ser definida de tal modo que esta condição seja respeitada. As funções mais comuns utilizadas para determinar valores de membros fuzzy são funções lineares e quadráticas (Burrough e McDonnell, 1998). A função linear fuzzy é definida por dois segmentos de reta inclinados que se encontram em um ponto central de valor MFA(z) = 1. Nas bordas o valor é MFA(z) = 0,5 e a inclinação das retas define a zona de transição fuzzy. A Figura 2.3a ilustra graficamente o conjunto fuzzy definido por duas funções lineares. Como comparação, a Figura 2.3b representa o mesmo conjunto, de valor pontual m, porém definido de modo rígido (booleano). O conjunto fuzzy definido pela função linear é expresso por (Equação 2.2): MFA ( Z ) = 0 MFA ( Z ) = (1 / α )( z − p) MFA ( Z ) = 1 MFA ( Z ) = (−1 / β )( z − r ) se z < p se p ≤ z < q se z = q se q < z ≤ r MFA ( Z ) = 0 se z > r onde α = q − p e β = r − q (2.2) Fig. 2.3 – Representação de números fuzzy e booleanos. Os gráficos b) e d) representam conjuntos booleanos, pontuais ou lineares e poligonais respectivamente. Eles apresentam valores rígidos (m) e (n-m), com um único grau de relacionamento de valor 1. Os gráficos a) e c) apresentam os conjuntos fuzzy equivalentes aos booleanos b) e d) respectivamente. No gráfico a) o grau de relacionamento é 1 no ponto q, decaindo para 0 nos pontos p e r. No gráfico c) os valores d1 e d2 correspondem à largura da zona de transição e os números b1 e b2 os pontos de cruzamento. FONTE: adaptado Fang (1997). A função quadrática é expressa por (Figura 2.4): MFAF ( z ) = 1 (1 + a(z − c) 2 ) 0≤ z≤R (2.3) onde o valor de "a " indica o "ponto de cruzamento", no qual a evidência tem 50% de importância e o valor “c” é o ponto central ideal do conjunto. A faixa abrangida pelo ponto inicial até o "ponto de cruzamento" indica a faixa onde as evidências têm alta influência. Nos pontos fora desta faixa a importância decai abruptamente, segundo a curva quadrática. A Figura 2.3c exemplifica um conjunto fuzzy definido por duas funções quadráticas. Na Figura 2.3d está representado o conjunto equivalente, definido por método Booleano. O conjunto fuzzy é expresso por: MF F ( z ) = 1 z − b1 − d1 1 + d1 2 se z < b1 + d1 MF F ( z ) = 1 se b1 + d 1 ≤ z ≤ b2 − d 2 MF F ( z ) = 1 z − b2 + d 2 1 + d2 2 se z > b2 − d 2 (2.4a) (2.4b) (2.4c) Fig. 2.4 – Exemplo de curva quadrática de representação dos elementos z em MFA Os membros fuzzy definidos pelos conjuntos fuzzy são então combinados segundo análises multi-critérios, definidas através de uma seqüência lógica realizada pelos operadores fuzzy (Mínimo, Máximo, Média, Ponderado (Técnica AHP) e Gama). 2.3.2 Operadores Fuzzy Fuzzy Mínimo Esse operador assemelha-se a operação Booleana “E” (interseção), e é expresso por: µ=Min (µa,µb, µc, . . .), onde µa eqüivale ao valor do membro fuzzy para um particular ponto (“pixel”) do plano de informação A; os valores µb e µc correspondem, respectivamente, aos membros dos planos B e C no mesmo ponto. O que este operador define como resultado, é que um ponto do plano de informação resultante terá como valor de saída o menor valor dos membros fuzzy de entrada. Se tomarmos como exemplo os valores µa = 0,30; µb = 0,17; µc = 0,98, o valor adotado para o “pixel” do plano de informação final será µfinal = 0,17. Fica claro entender que o resultado obtido é o mais restritivo possível com os valores dos membros fuzzy, de modo que este operador é indicado para situações altamente restritivas (“pessimista”), onde duas ou mais evidências são estritamente necessárias para satisfazer uma hipótese. Fuzzy Máximo O operador fuzzy Máximo assemelha-se à operação Booleana “OU” (união), sendo as evidências combinadas segundo a função µ = Max (µa, µb, µc, ...), onde os valores de µa, µb e µc correspondem aos valores dos membros fuzzy das evidências. Nessa operação o valor de saída para um dado ponto será o maior valor de entrada dos planos de informação. No exemplo acima o valor resultante seria µfinal = 0,98. O operador fuzzy Máximo é o mais otimista dentre operadores fuzzy, sendo indicado para situações onde a existência de apenas uma evidência é suficiente para indicar regiões potenciais à ocorrência de determinada evidência. Fuzzy Média O fuzzy Média admite um risco médio com compensação plena entre todos os membros fuzzy de entrada. O peso de importância é distribuído uniformemente para todas as evidências, o que indica que os membros fuzzy de entrada não apresentam uma importância hierárquica entre eles. A função matemática que define este operador é expressa por: n µ = média = ∑ i =1 µi n (2.5) Fuzzy Ponderado No fuzzy ponderado os pesos de cada membro fuzzy de entrada (evidência) podem ser definidos empiricamente de modo heurístico ou por processos estatísticos. A avaliação do peso depende da análise da importância da evidência em relação a um depósito mineral, por exemplo. Essa ponderação resulta em um escalonamento das evidências segundo um grau de importância relativa entre elas. Isto permite uma ordenação das evidências por importância na formulação do modelo prospectivo. Embora exista uma variedade de técnicas para a definição dos pesos Eastman et al. (1995) descrevem a técnica do Processo Analítico Hierárquico (Analytical Hierarchy Process - AHP), desenvolvida por Saaty (1992), como sendo a mais promissora no contexto do processo de tomada de decisão. O primeiro passo para a aplicação dessa técnica é a elaboração de uma relação de importância relativa entre as evidências. Essa relação é utilizada como dado de entrada em uma matriz de comparação par a par, onde são calculados os autovalores e autovetores da matriz. Os pesos de cada membro fuzzy, eqüivalem, então, aos autovetores da matriz de comparação par a par. No capítulo 2.6 de suporte a decisão a técnica do Processo Analítico Hierárquico é abordada com maior detalhe. Fuzzy Gama Este operador é definido por dois termos, um produto algébrico fuzzy e uma soma algébrica fuzzy, expresso pela função: µ = (soma algébrica fuzzy)γ x (produto algébrico fuzzy)1-γ (2.6) O produto algébrico fuzzy é expresso pela função: µ = n ∏ i =1 µi (2.7) onde µi representa o valor do membro fuzzy para um plano de informação “i”. O operador executa a multiplicação dos membros dos diferentes planos de informação (i= 1,2,3,...), sendo que o valor de saída de um dado ponto é sempre menor ou igual ao valor do menor membro fuzzy. Isto ocorre devido a multiplicação de valores iguais ou menores que 1. A soma algébrica fuzzy é definida pela função: n µ = 1 − ∏ (1 − µ i ) (2.8) i =1 onde o termo µi representa o valor dos membros fuzzy para um plano de informação “i”. O operador executa a multiplicação do termo (1 - µi). Na soma algébrica o resultado é sempre maior ou igual ao valor de entrada do maior membro fuzzy (µi). No operador gama pode-se variar a importância de cada termo (soma algébrica e produto algébrico fuzzy). A importância de cada termo no operador gama é definida atribuindo-se valores entre (0,1) para o expoente “γ”. Esta distribuição de importância é melhor entendida através da Figura 2.5. Na Figura 2.6 pode-se observar que quando o γ=0, o resultado dependerá apenas do termo “produto algébrico fuzzy”, e quando γ=1, o resultado dependerá apenas do termo “soma algébrica fuzzy”. Os valores de gama entre 0<γ>0,35 apresentam um caráter “diminutivo”, ou seja, sempre menores ou iguais ao menor membro fuzzy de entrada (µi). Na outra extremidade do gráfico os valores gama entre 0,8<γ>1,0 têm um caráter “aumentativo” onde o valor de saída será igual ou maior que o valor do maior membro fuzzy de entrada (µi). Por fim, para os valores de gama entre 0,35<γ>0,8, os µi não apresentam nem um caráter “aumentativo” nem “diminutivo”; os valores dos µi de saída cairão sempre entre o menor e o maior valor dos µi de entrada (Bonham-Carter, 1994). Fig. 2.5 – Distribuição da função Fuzzy Gama. FONTE: Adaptada de Bonham-Carter (1994). 2.3.3 Probabilidade versus Possibilidade A probabilidade representa uma tentativa de explicar como um evento ocorre em um espaço aleatório. O primeiro princípio que fundamenta a probabilidade é o seu caráter aleatório, o que pressupõe a habilidade em medir e ordenar o espaço randômico. Por outro lado, possibilidade é o cálculo da compatibilidade, ou seja, enquanto a probabilidade é baseada na freqüência da distribuição aleatória de uma população, a lógica fuzzy descreve propriedades que têm valores, que variam continuamente, através da associação de partições desses valores com identidades semânticas. Esses valores associados à identidade semântica indicam nossa percepção da possibilidade de aceitação, julgamento ou crença de que um membro pertença a um conjunto. Muito do poder de descrição da lógica fuzzy advém do fato de ser permitido a sobreposição dessas partições semânticas. Essa sobreposição corresponde à transição de um estado para o próximo, a qual surge da ocorrência natural da ambigüidade associada com o estado intermediário da transição semântica (Cox, 1994). A declaração a seguir é uma boa maneira de ilustrar a diferença entre possibilidade e probabilidade: Existe uma chance de 50% que ocorra uma chuva fina amanhã. Caso se espere até amanhã, saber-se-á se a chuva ocorrerá ou não. A incerteza probabilística está resolvida, entretanto a incerteza fuzzy permanece. Ainda existe alguma ambigüidade sobre se a chuva é uma garoa, chuva fina, moderada ou pesada. 2.3.4 Inferência booleana versus Inferência fuzzy A visão dicotômica (booleana) de modelamento é assumida pela corrente maioria dos sistemas de informação geográfica que consideram que fenômenos naturais podem ser modelados por objetos discretos, tais como pontos, linhas e polígonos ou pixels os quais têm atributos exatos. Essa representação espacial de dados imprecisos para dados rígidos introduz erros desnecessários em estágio muito inicial do processo de inferência espacial (Altman, 1994). Burrough e Heuvelink (1992) demostram como as incertezas nos valores dos atributos dos mapas causam erros nos resultados das inferências espaciais efetuadas segundo modelamentos booleanos e fuzzy. Os resultados obtidos por esses autores sugerem que os métodos Booleanos estão muito mais sujeitos à propagação de erros em modelamentos do que os equivalentes fuzzy, e que a utilização da técnica fuzzy pode reduzir drasticamente a propagação de erros através de modelos lógicos, fornecendo cenários mais confiáveis. Como exemplificação dos problemas enfrentados por um modelamento booleano, considere-se o modelo de lógica simples para classificação de solo para risco de erosão, proposto por Heuvelink e Burrough (1993). O modelo utiliza polígonos ou pixels para a representação das evidências e considera a seguinte proposição: CASO Inclinação > 10% E Textura do solo = areia E Cobertura vegetal < 25% ENTÂO perigo de erosão é severo Neste proposição a interseção dos três conjuntos (inclinação > 10% ∩ textura de solo = areia ∩ cobertura vegetal < 25%) fornece o resultado requerido. Cada polígono ou pixel representa uma localidade que é testada em seus valores de atributo e qualquer objeto que não case todas as três condições será descartado. O modelo proposto é deficiente porque assume que a relação entre inclinação, textura de solo e cobertura vegetal pode descrever através de uma simples expressão booleana o risco de erosão. Na realidade, esta relação é muito mais complexa, dado que o risco de erosão continua sendo sério quando o local tem uma inclinação pouco abaixo de 10% ou a cobertura vegetal é apenas um pouco acima de 25%. Porém, segundo a definição das classes propostas, inclinações menores que 10% são sempre seguras, um resultado que a maioria dos cientistas não concordariam. Neste caso seria muito mais intuitivo e satisfatório substituir o modelo booleano por um modelo no qual o risco de erosão aumentaria continuamente com a inclinação. O segundo problema com o modelo lógico descrito é que esse assume que os atributos podem ser descritos em medidas exatas. Porém, muitos atributos não podem ser gravados de modo exato, devido a erros de medida e variações espaciais (Burrogh,1986; Goodchild, 1989). Conseqüentemente, quando dados incertos são utilizados em modelos lógicos ou quantitativos, são esperados que os resultados também contenham erros. De modo a entender como erros em dados podem afetar o resultado tanto em classificações booleanas e contínuas, Heuvelink e Burrough (1993) substituem o atributo determinístico z, por uma variável Z. Isto por que quando existe incerteza sobre valores de atributo não se pode representar com certeza este com um único valor determinístico. O melhor seria representar este atributo como uma distribuição de valores, tendo cada valor uma certa probabilidade de ocorrência, sendo então uma variável aleatória. Heuvelink e Burrough (1993) denotam o desvio padrão como σz o qual é utilizado como medida de erro. A Figura 2.6 apresenta algumas situações possíveis que podem aparecer quando uma observação é para ser feita nas classes de fronteira de um atributo Z definido por b1 e b2. A Figura 2.6 (a) demostra o caso booleano onde não existe erro, então σz=0. O atributo z tem um efeito determinístico de modo que a observação individual ou cai totalmente dentro do limite da classe (barra direita) ou fora (barra esquerda). Os valores correspondentes da função membro são 1 ou 0 respectivamente. Como σ z é zero, o valor dos membros da função são também livres de erros. A Figura 2.6 (b) demostra a mesma situação onde a observação individual é classificada por uma função membro fuzzy. A observação na barra direita está no centro da classe MF(z) = 1. A observação na barra esquerda está fora do centro e das fronteiras booleanas, o que retorna um MF(z) <0.5. Agora considere a situação em que σ z não é zero. Na Figura 2.6 (c) a função de probabilidade de densidade pz de Z tem a forma característica de uma normal e coincide com o limite da classe booleana. A probabilidade de que Z caia fora do limite da classe é demasiadamente pequena, de modo que para todos os objetivos práticos MF(z) = 1. A mesma situação ocorre com a função de membros contínuos quando pz cai dentro do núcleo da classe (Figura 2.6 (d)). Claramente os mesmos resultados ocorrem quando pz cai bem fora dos limites da classe. Fig. 2.6 – Exemplificação da distribuição de erro através de classificação booleana e fuzzy para um atributo Z. FONTE: Adaptado Burrough e Heuvelink (1992) O resultado é menos claro quando pz cruza o limite da classe booleana ou a zona de transição da classe fuzzy. As Figuras 2.6 (e) e (f) mostram a situação quando a média de Z iguala b1. No caso booleano (Figura 2.6(e)) a distribuição de MF(z) torna-se uma distribuição discreta com dois possíveis valores, 0 e 1. Nesse caso as chances são iguais para que Z caia dentro ou fora do limite da classe, de modo que a probabilidade de obter cada valor é 0.5. No caso fuzzy ilustrado na Figura 2.6 (f) a média de Z iguala b1, apresentando uma distribuição continua do mesmo modo que Z. A média da MF(z) é ao redor de 0.5 e devido a função membro variar acentuadamente em b1, o desvio padrão de MF(z) é muito maior do que para Z, embora este permaneça substancialmente menor do que o desvio padrão booleano, Figura 2.6 (e). Heuvelink e Burrough (1993) demonstram assim que o desvio padrão obtido a partir de uma simulação Monte Carlo, em uma superfície simulada, é consideravelmente grande, especialmente para o modelo Booleano. Nesse modelo existem grandes áreas onde o desvio padrão é perto da metade que corresponde ao máximo teórico. Os desvios padrão são maiores nas localizações onde os valores de atributo estão próximos dos limites da classe booleana ou dentro da zona de transição contínua. Pixels que estão claramente dentro ou fora das classes são selecionados ou rejeitados com um baixo nível de incerteza. O exemplo acima demostra de modo claro que classes booleanas utilizadas em modelamento lógico desenvolvido em SIG´s podem gerar resultados insatisfatórios, porque muitos problemas ambientais não podem ser modelados realisticamente com regras rígidas. A classificação por membros fuzzy pode fornecer então uma solução para esse problema pois relaxa os valores dos membros das classes, permitido definir funções de membros flexíveis que casem com experiências práticas. 2.3.5 Abordagem de Importação Semântica IS (Semantic (Semantic Import Approach) Approach) para Contato de Polígonos Intérpretes utilizam feições observáveis, tais como mudança de cores, padrão de textura, quebra de encosta, para inferir contatos durante a elaboração de mapas temáticos. Cartograficamente esses contatos são definidos por linhas que podem representar uma limitação na representação espacial das evidências necessárias em um modelamento desenvolvido em SIG. Essa imposição cartográfica simples e eficiente suprime a informação sobre a natureza da mudança espacial e tem criado a idéia em usuários de mapas temáticos, que solos, vegetação, ou contatos geológicos são sempre abruptamente definidos (precisos), e que as unidades são sempre homogêneas, livres de erros de classificação ou posicionamento. Entretanto, sabe-se que variações em solo, vegetação, ou litologia podem ocorrer abruptamente ou gradualmente. Um dique intrusivo pode formar contatos geológicos abruptos em uma escala centimétrica, porém variações em textura que expressam variações litológicas podem ocorrer sobre centenas de metros ou quilômetros. E mais, as classes (atributos) delimitadas pelos polígonos podem apresentar ambigüidades ou incertezas que normalmente são mais acentuadas numa zona próxima ao contato (zona de transição). O problema de imprecisão dos contatos corresponde à discrepância existente entre as condições do mundo real e as informações apresentadas pelo traçado dos contatos em um mapa. Esse problema tem dois aspectos; imprecisão natural e localização (contato inferido) (Wang e Brent Hall, 1996). A utilização da lógica fuzzy na representação dos contatos dos polígonos possibilita a fácil incorporação da informação sobre a natureza dos contatos, bem como da incerteza associada a classificação e ao posicionamento. Burrough e McDonell (1998) propõem duas técnicas distintas para a representação da informação semântica de contatos fuzzy, a “abordagem por unidades de mapa” (map unit approach) e o a “abordagem por contato individual” (individual boundary approach) A abordagem por unidades de mapa possibilita uma representação única para os contatos das unidades ou polígonos. Ou seja, essa técnica assume que o polígono apresenta um único tipo de contato ao longo do seu perímetro. As informações sobre o tipo de contato podem ser convertidas nos parâmetros necessários para a definição da função membro fuzzy, segundo as Equações 2.4, as quais são aplicadas sobre o plano de informação que contém a grade de distância isotopricamente distribuída ao longo dos contatos do polígono. A localização do contato originalmente desenhado coincide com o ponto de cruzamento MF = 0.5 e os pontos ao centro dos contatos originais apresentam valores de membro iguais a 1. Os pontos dentro, mas próximos ao contato recebem valores membro entre 1 e 0.5, e aqueles do lado de fora do contato recebem valores de membro menores que 0.5, conforme o distanciamento do contato. A Figura 2.7 mostra o resultado do contato fuzzy fatiado da classe A, onde observa-se a graduação da classe A de cor amarela ao longo dos contatos para a classe A , de cor verde (negativo de A). Fig. 2.7 – Ilustração da representação de informação semântica para contatos. A fatia maior amarela representam os membros totalmente contidos na classe A. As fatias menores indicam a graduação dos demais membros até a fatia maior verde que representa os membros fora da classe A (A ), conforme ilustra a escala vermelha (0.01.0). O procedimento pode ser repetido para todas as unidades de um mapa, variando-se na definição da largura do contato, conforme as características de cada classe. Na Figura 2.8 o gráfico ilustra a aplicação das funções de membro fuzzy sobre um contato inferido entre dois tipos de rochas. A abordagem do contato individual assume que uma classe pode apresentar diferentes distribuições espaciais ao longo dos seus contatos. Ou seja, contatos podem ser abruptos em algumas partes e difuso em outras. Por exemplo, um terraço elevado de rio pode ter borda difusa no lado superior e borda abrupta no lado inferior, onde o rio cortou seu caminho. Nesse caso, aplicam-se duas funções membro fuzzy, cada uma representando os diferentes comportamentos do contato. . Fig. 2.8 – Exemplificação do mapeamento de um contato inferido rígido para um contato fuzzy. 2.4 – MÉTODO DE BAYES A metodologia bayesiana consiste em determinar a probabilidade de ocorrer um evento, dado uma certa condição. Em termos prospectivos pode-se pensar na definição da probabilidade de um depósito ocorrer, condicionada pela ocorrência de uma certa evidência (exemplo: litologia favorável). O método bayesiano apresenta uma abordagem probabilística para o problema, onde o principal conceito do método é a idéia da probabilidade a priore P(D) e da probabilidade a posteriore P( D | B) (Bonham-Carter, 1994). P( D) − probabilid ade a priore P( D | B) = P( D ) ∗ P ( B | D) − probabilid ade a posteriore P( B) (2.9) (2.10) Como introdução ao conceito da probabilidade a priore e posteriore, considere o seguinte exemplo definido por Bonham-Carter (1994). Um indivíduo deseja estimar a probabilidade de que ocorra chuva no dia seguinte, sabendo-se que na média chove 80 dias por ano na região. Com essa informação, seria razoável considerar que a probabilidade a priore de que vai chover no próximo dia é de 80/365. Essa probabilidade inicial pode ser refinada através da agregação de outras fontes de dados, como por exemplo a estação do ano (verão, inverno, primavera e outono). Com a consideração dessa nova informação o resultado obtido seria a probabilidade de chuva, dado a estação do ano vigente. Esta nova informação funciona como um fator multiplicativo e representa uma melhora na precisão da informação inicial (probabilidade a priore). Outras fontes de dados podem ser utilizadas em conjunto sendo necessário apenas a sua multiplicação à probabilidade a priore. P( chuva | estação do ano) = P (chuva) ∗ Componenteestação do ano P( chuva) − probabilid ade a priore P( chuva | estação do ano) − probabilid ade a posteriore Em estudos voltados à pesquisa mineral a probabilidade a priore seria a probabilidade da ocorrência mineral considerando-se a área total investigada. A probabilidade a posteriore seria um refinamento do conhecimento (probabilidade a priore), onde através de uma ou mais evidências, que possuem uma relação direta com a mineralização, calcula-se o aumento das chances de sucesso no encontro de um novo depósito mineral. Ou seja, dado que se está pesquisando sobre uma evidência favorável, determina-se quanto esta condição aumenta as chances da descoberta de um novo depósito mineral. A probabilidade a priore para a ocorrência de um dado fenômeno pode ser estimada por modelos simples de distribuição espacial aleatória ou por análises estatísticas multivariadas (Agterberg, 1989). Os dados para o cálculo da probabilidade a posteriore podem ser obtidos através da tabulação cruzada, entre o plano de informação com os depósitos e os planos de informação com as evidências. Para isso é necessário que os planos de informação das evidências sejam antes transformados em mapas binários, subdivididos em classe favorável e não favorável. A definição dos limiares de corte pode ser baseada tanto no julgamento subjetivo do especialista como por técnicas estatísticas baseadas em medição de correlação espacial, tal como o parâmetro Contraste (Cw). Com os mapas binários gerados, faz-se a tabulação cruzada das evidências com os depósitos (verdades de campo), obtendo-se uma matriz onde cada célula corresponde à interseção das classes das evidências com as ocorrências minerais. Esses valores são utilizados nas formulações para a obtenção das probabilidades a posteriore. Para um melhor entendimento considere o exemplo definido por Bonham-Carter (1994). Uma área de interesse mineral que totaliza 10.000 Km2 e que contem 200 ocorrências já conhecidas de 1 Km2 cada. Para efeito de análise, esta área é subdividida em partes iguais de 1 Km2 totalizando assim 10.000 unidades. Utilizando a notação N ( ) para representar a contagem das unidades, tem-se N (T ) = 10.000 unidades para a área total e N ( D) = 200 unidades para os depósitos. Até o presente momento a probabilidade de achar-se um depósito a partir de uma escolha aleatória de uma das unidades é obtida por N ( D) / N (T ) , ou 200 / 10.000 = 0,02 , o que representa a probabilidade a priore P(D) de se achar um depósito. No caso da existência de informações adicionais sobre a área, como por exemplo, um mapa de anomalias radiométricas onde 180 das 200 ocorrências conhecidas ocorrem associadas às anomalias (Figura 2.9a), a probabilidade de encontrar-se um depósito será muito maior do que 0,02 caso a pesquisa seja procedida na área delimitada pelo padrão anômalo (evidência). A área do padrão anômalo é de 3.600 Km2. De modo inverso a probabilidade será reduzida caso a evidência não esteja presente. A potencialidade de encontrar um depósito dado a presença da evidência “B” pode então ser expressa pela probabilidade condicional: P( D | B) = P ( D ∩ B) P( B ) (2.11) Fig. 2.9 – Tabela de tabulação cruzada e formulações bayesianas para o caso hipotético de uma área prospectável de 10.000 Km2, onde ocorrem 200 ocorrências minerais, sendo 180 delas condicionadas a anomalia radiométricas com 3600 Km2 de área. O primeiro membro da equação é a probabilidade condicional do depósito dada a evidência P( D | B) . No segundo membro o numerador P( D ∩ B) eqüivale à área de interseção dos depósitos e da evidência, ou P( D ∩ B) = N ( D ∩ B) / N (T ) . O denominador P(B) de modo semelhante eqüivale a N ( B) / N (T ) . Pela substituição direta no segundo membro da Equação 2.11 obtém-se: P( D | B) = N (D ∩ B ) N ( B) ( 2.12) Na Figura 2.9b o diagrama de Venn ilustra a situação de sobreposição entre os planos binários dos depósitos e da evidência com a área de interseção demarcada em vermelho. Os resultados esperados da tabulação cruzada entre os dois planos de informação encontram-se na matriz da Figura 2.9c, com os depósitos representados nas linhas e a evidência na coluna. As formulações das probabilidades condicionais com os respectivos resultados encontram-se na Figura 2.9d. A partir do exemplo, fica claro que a probabilidade condicional dada a evidência é maior que a probabilidade a priore considerando-se a área total. No caso 180 / 3.600 = 0,05 , o que é 2,5 vezes maior do que a probabilidade a priore P( D) = 0,02 . Pode-se concluir assim que utilizando-se essa evidência, a chance de sucesso em uma possível campanha prospectiva é aumentada e a área de pesquisa reduzida de 10.000Km2 para 3.600Km2. Entretanto, até o momento as formulações apresentadas não demostram a possibilidade da representação da probabilidade condicional em termos da probabilidade a priore mais um fator multiplicativo (Equação 2.10). A equação é obtida a partir do desenvolvimento da formulação proposta a seguir. Primeiramente a probabilidade a posteriore do padrão anômalo dado que se está em um depósito é: P( B | D ) = P ( B ∩ D) P( D ) (2.13) Pela teoria da probabilidade sabe-se que P( B ∩ D) e P( D ∩ B) são iguais. Então, combinando-se as Equações 2.11 e 2.13 obtém-se: P( D | B) = P( D ) ∗ P ( B | D) P ( B) (2.14) No exemplo observa-se que P( B | D) / P ( B) = 0,9 / 0,36 = 2,5 , que corresponde ao fator multiplicativo da probabilidade a priore P( D) = 0,02 . Pela Equação 2.14 P( D | B) = 0,02 ∗ 2,5 = 0,05 , o que eqüivale ao mesmo resultado obtido pela Equação 2.11. Bonham-Carter (1994) propõe ainda outro tipo de formulação, expressa pelo cálculo da chance a priore O(D) e da chance a posteriore O( D | B) . Esta formulação permite a integração de diferentes evidências como fatores explicativos para a ocorrência mineral através de uma soma condicional de parâmetros. Esta soma condicional facilita a soma dos planos de informação em um SIG. A chance a priore é expressa por: P( D ) (1 − P( D)) onde P(D) é probabilidade a priore. O( D) = (2.15) A chance a posteriore é obtida a partir do desenvolvimento da probabilidade a posteriore, apresentado abaixo: P ( D | B) = P ( D) ∗ P ( B | D) (2.16) P( B ) P( D | B) = P( D ) ∗ P( B | D ) P( B) (2.17) Dividindo-se os dois termos da Equação 2.16 por P( D | B) vem: P ( D | B ) P ( D) ∗ P ( B | D ) = P ( D | B) P( D | B ) ∗ P( B) (2.18) Substituindo o P( D | B) do segundo termo pela Equação 2.17 vem: O( D | B ) O(D) 1 P ( D | B ) P (D ) ∗ P ( B | D) ∗ P (B ) = P ( D | B ) P( D ) ∗ P ( B | D ) ∗ P ( B) O( D | B) = O( D) ∗ P( B | D ) P (B | D ) (2.19) Razão de Suficiência (LS) (2.20) De modo semelhante obtêm-se a chance da ocorrência, dado a ausência da evidência. O( D | B ) = O (D ) ∗ P (B | D) P (B | D ) Razão de Necessidade (L N) (2.21) Extraindo-se o logaritmo natural das Equações (2.20) e (2.21) acima obtêm-se: Ln[ O( D | B)] = Ln[O( D)] + ω + (2.22) Ln[O( D | B )] = Ln[ O( D )] + ω − (2.23) As razões de suficiência (LS) ou de necessidade (LN) são computadas dependendo da presença ou ausência da evidência para um dado ponto. A condição de suficiência de uma evidência (B) é satisfeita quando a probabilidade de existência do depósito (D) é maximizada ( P( B | D) = máximo ). A condição de necessidade da evidência é satisfeita quando a probabilidade de não ocorrência do depósito é maximizada com a não existência da evidência ( P( D | B ) = máximo ) (Rostirolla, 1997). No caso do padrão não apresentar nenhuma correlação com o depósito LS=LN=1. Bonham-Carter (1994) demostra ainda que para um número maior de evidências, estas seriam integradas através da formulação que computaria a chance a priore, adicionada ao somatório dos logaritmos naturais das razões de suficiência e/ ou necessidade. Sendo necessário porém que as evidências consideradas apresentem uma independência condicional (Agterberg, 1989). A obrigatoriedade de assumir a independência condicional na combinação de evidências múltiplas decorre do fato dos ponderadores serem calculados independentemente para cada evidência, sendo depois combinados em uma única equação. Essa imposição matemática possibilita uma simplificação na formulação e quando bem empregada fornece uma boa idéia da contribuição individual de cada evidência. A probabilidade de um depósito dado duas evidências é expressa por: P( D | B1 ∩ B2 ) = P( D ∩ B1 ∩ B2 ) P( B1 ∩ B2 ) (2.24) P( D | B1 ∩ B2 ) = P( B1 ∩ B2 | D) ∗ P( D) P( B1 ∩ B2 ) (2.25) P( D | B1 ∩ B2 ) = P( B1 ∩ B2 | D) ∗ P( D) P( B1 ∩ B2 | D) ∗ P( D) + P( B1 ∩ B2 | D ) ∗ P( D ) (2.26) Esta é a regra Bayesiana. Perceba-se que existem apenas duas hipóteses exclusivas, D e D , com P( D) + P( D ) = 1 (Bonham-Carter, 1994). Os efeitos de interseção entre as duas evidências B1 e B2 podem ser ignorados quando a independência condicional entre as evidências for respeitada. Isto possibilita uma simplificação ao permitir uma avaliação individual dos efeitos de cada plano de informação binário, além de permitir a combinação dos fatores através de uma multiplicação direta. A independência condicional pode ser expressa por: P( B1 ∩ B2 | D) = P ( B1 | D) ∗ P( B2 | D) A Equação 2.27 permite a Equação 2.26 ser simplificada para: (2.27) P( D | B1 ∩ B2 ) = P ( D) ∗ P( B1 | D) P ( B2 | D) ∗ P( B1 ) P ( B2 ) (2.28) A Equação 2.28 possibilita, então, a multiplicação separada dos fatores de contribuição de cada evidência. A formulação da probabilidade condicional de duas evidências é expressa em chance por: O( D | B1 ∩ B2 ) = O( D) ∗ LS 1 ∗ LS 2 (2.29) Extraindo-se o logaritmo natural da Equação 2.29 obtém-se: Ln [ O ( D | B 1 ∩ B 2 )] = Ln [ O ( D )] + ω 1+ + ω 2+ (2.30) A Equação 2.30 apresenta apenas uma das combinações possíveis considerando apenas duas evidências. Na realidade são possíveis 4 combinações diferentes dos “ω ” ( (ω1+ + ω 2+ ) ou (ω 1+ + ω 2− ) ou (ω 1− + ω 2+ ) ou (ω1− + ω 2− ) ), as quais resultarão num total de quatro equações semelhantes a Equação 2.30, com as respectivas combinações possíveis de ω . No caso da existência de n evidências serão possíveis 2 n combinações diferentes. Esta soma dos ω + ou ω − pode ser efetuada, para todos os pontos em análise, a partir de uma operação condicional, controlada espacialmente pela presença ou ausência da classe favorável de cada evidência (Equação 2.31). Ou seja, caso o primeiro ponto do plano de informação apresente a evidência “i” é computado na soma o valor do ω + , caso contrário ω − . O mesmo é efetuado para as demais evidências, até que todas tenham sido computadas para o mesmo ponto. O valor final no ponto (chance a posteriore - O( D | B1 ∩ B2 K Bn ) ) é o resultado da somatória condicional dos ω + e ω − somado a chance a priore O(D) . Este procedimento é repetido para todos os pontos da grade de modo a completar a grade numérica do plano de informação (MNT). n O( D | B1 ∩ B2 K Bn ) = Ln[ O( D)] + ∑ (( µ i = favorável) ? ω i+ : ω i− ) (2.31) i =1 Com o plano de informação da chance a posteriore gerado é aplicado uma expressão matemática para a geração do plano de informação com os valores de probabilidade a posteriore. P( D | B) = O ( D | B) 1 + O ( D | B) (2.32) O resultado final é uma grade regular com valores de "z" indicando a probabilidade a posteriore da ocorrência mineral. Essa grade pode ser fatiada em faixas que expressarão o grau de probabilidade à ocorrência de novos depósitos. 2.4.1 - Independência Condicional Quando dois ou mais mapas são combinados através de inferência bayesiana uma das premissas assumidas é a existente da independência condicional (IC) entre eles. Entretanto, na prática, provavelmente a IC é sempre violada em algum grau, sendo necessária a utilização de testes estatísticos para mostrar a magnitude do problema e apontar os mapas que estão causando os maiores problemas. Esses mapas podem então ser rejeitados na análise ou modificados para minimizarem o problema Dados espaciais normalmente não satisfazem a suposição de modelos estatísticos clássicos, particularmente com referência a independência das amostras. Suponha que dois mapas binários estão para ser comparados em uma série de pontos (localizações) selecionados aleatoriamente. Caso a distância média entre a localização das amostras dos dois mapas seja grande, a suposição de independência entre amostras é aceitável. Por outro lado com o aumento do número das amostras, a separação entre pontos irá diminuir, não podendo mais as amostras serem consideradas independentes em um sentido estatístico. Em geral quanto maior for o número de amostras para uma base espacial, mais próximo elas estarão e maior será sua autocorrelação espacial, o que significa que elas não são independentes. Estatisticamente a existência de independência entre dois padrões B1 e B2, pode ser expressa por: P( B1 | B2 ) = P( B1 ) e P( B2 | B1 ) = P( B2 ) . Essa formulação indica a probabilidade de B1 estar presente independe de B2 e vice-versa. Por outro lado, a formulação da independência condicional entre dois mapas de padrões binários, com respeito a um conjunto de depósitos, é expressa por: P( B1 ∩ B2 | D) = P ( B1 | D).P( B2 | D) (2.33) o que eqüivale a: N ( B1 ∩ B2 ∩ D) = N ( B1 ∩ D).N ( B2 ∩ D) N ( D) (2.34) O lado esquerdo da equação eqüivale ao número de depósitos nas regiões onde ocorrem ambos os padrões B1 e B2. O lado direito define o número de depósitos esperados nas zonas de sobreposição, que deve igualar o número de depósitos sobre B1, multiplicado pelo número sobre B2, dividido pelo número de depósitos, caso os dois padrões sejam independentes (Figura 2.10). Para caracterizar o grau de associação entre classes de mapas, Bonham-Carter (1994) sugere a utilização da estatística Qui-quadrado (χ2). No método estatístico χ2, a tabela da tabulação cruzada é utilizada como uma tabela de contingência. Como exemplo, imagine-se uma tabela de tabulação cruzada T entre dois mapas A e B (Tabela 2.2), com elementos Ti, j (classes sobrepostas). Onde existem i = 1,2,..., n classes do mapa B (linha da tabela) e j = 1, 2,..., m classes do mapa A (coluna da tabela). As margens da tabela Τ são definidas como Τi. para a soma das i linhas, e Τ.j para a soma das j colunas. Se os dois mapas são independentes um do outro, sem correlação entre eles, então a área esperada em cada categoria de sobreposição é dada pelo produto dos totais das margens dividido pelo total absoluto. Fig. 2.10 – Diagrama de Venn ilustrando o conceito de independência condicional. O círculo maior é o conjunto dos depósitos. Dentro deste círculo, os parâmetros B1 e B2 apresentam independência condicional em relação aos depósitos caso a área ( B1 ∩ D ) multiplicada pela área ( B2 ∩ D ) seja igual a área ( B1 ∩ B2 ∩ D /( D). FONTE: Bonham-Carter (1994). TABELA 2.2 – MATRIZ DE CONTINGÊNCIA ENTRE DOIS PLANOS DE INFORMAÇÃO, A E B B B totais A T11 T21 T.1 A T12 T22 T.2 totais T1 . T2 . T.. Então a área esperada Ti*,j para a i linha e a j coluna é: Ti *, j = Ti . T. j (2.35) T .. O resultado dessa operação é utilizado na estatística χ2 que é expressa pela formulação abaixo: n m χ 2 = ∑∑ (Ti , j − Ti *,j ) 2 i =1 j =1 Ti *, j (2.36) onde o Ti *, j é o valor esperado da sobreposição entre as classes e Ti , j o valor observado. Como χ2 é fortemente dependente da unidade de medida, sendo proporcional ao tamanho da unidade (ex. mudanças em medidas de metros quadrados para centímetros quadrados representam um fator de aumento de 10.000, que reflete-se também na magnitude do χ2) Bonham-Carter (1994) propõe a utilização do coeficiente de contingência (Equação 2.37), que é independente da unidade de medida e varia de 0 a 1. O valor “0” indica que os mapas não são correlacionados e os valores próximos a “1” que eles são correlacionados. C= χ2 T⋅ ⋅ + χ 2 (2.37) 2.4.2 - Reclassificação Binária - Contraste O processo de conversão de mapas multi-classes para uma forma binária pode tanto ser efetuado subjetivamente, usando-se o julgamento geológico, como pode ser efetuado estatisticamente, determinando-se o limiar de corte que maximiza a associação espacial entre o mapa com a evidência, resultante da reclassificação binária, e o mapa com as verdades de campo (ocorrências minerais). Como ferramenta estatística para a definição do limiar de corte que maximiza a correlação espacial Bonham-Carter (1994) propõe como um dos parâmetros possíveis a utilização do Contraste (Cw). Para ilustrar o processo de obtenção do limiar de corte, considere um plano de informação com lineamentos. Na Figura 2.11 tem-se uma ampliação dos lineamentos com fatias (“buffers”) e ocorrências minerais sobrepostas. Sem a necessidade de análise estatística, apenas com análise visual, fica claro que os pontos de ocorrência caem próximos aos lineamentos. Fato este que corrobora com a premissa de que ocorrências minerais estão associadas geneticamente a lineamentos. Fig. 2.11 – Corredores ao longo de lineamentos, com ocorrências minerais sobrepostas. O objetivo nesta análise é determinar o mapa binário que indique a melhor correlação entre lineamentos e ocorrências conhecidas. A escolha de uma distância pequena define uma classe com área reduzida, que não englobará muitas das ocorrências. No caso oposto, uma distância muito grande define uma classe favorável muito ampla, diminuindo a efetividade da evidência em prever as áreas alvos. O plano de informação do exemplo apresenta 28 fatias com espaçamento de 25m cada, num total de 700m. De modo a evitar esses dois extremos, procede-se o cálculo de ponderadores (Contraste) para cada fatia. As formulações propostas para o cálculo do Contraste são: CW = Ln[O( B | A)] − Ln[O( B | A )] (2.38) CW = W + − W − (2.39) , ou Contraste Contraste entre os lineamentos e as ocorrências minerais 2.0 1.5 1.0 0.5 0.0 -0.5 0 50 100 150 200 250 300 350 400 450 500 550 600 650 700 Distância (m) -1.0 -1.5 Fig. 2.12 – Valores de contraste acumulados das fatias ao longo dos lineamentos indicando um ponto “ótimo” de corte em 250m. A computação do contraste para cada fatia gera valores individuais que podem oscilar muito, conforme a quantidade de ocorrências. Este aspecto pode gerar um gráfico com uma curva muito ruidosa, devido à grande variação nos valores de contraste, o que dificulta a definição de um ponto de corte confiável. Este problema pode ser contornado com o cálculo do contraste acumulado, conforme demostrado na Tabela 2.3 e na Figura 2.12. O gráfico apresenta um pico claro na distância de 250m que é o ponto de corte que fornece o padrão binário que melhor prediz as ocorrências minerais conhecidas. De qualquer modo é bom indicar que nem sempre está técnica fornece um ponto de máximo claro para corte. Em tais situações os limiares são definidos segundo o julgamento subjetivo do geólogo. TABELA 2.3 – VALORES UNITÁRIOS E ACUMULADOS DE CONTRASTE DAS FATIAS AO LONGO DOS LINEAMENTOS, INDICANDO O LIMIAR DE CORTE DE 250 M COMO AQUELE QUE MAXIMIZA A CORRELAÇÃO ESPACIAL DOS LINEAMENTOS COM AS OCORRÊNCIAS MINERAIS Fatia 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 Distância 25 50 75 100 125 150 175 200 225 250 275 300 325 350 375 400 425 450 475 500 525 550 575 600 625 650 675 700 Contraste 0.20708 0.19165 0.25186 0.24800 0.19165 0.13637 0.10533 0.10695 -0.01381 0.05937 -0.00553 -0.02101 -0.00716 -0.03870 -0.06596 -0.11612 -0.25675 -0.21505 -0.19254 -0.26399 -0.44979 -0.31204 -0.22130 -0.17127 -0.32883 0.00539 0.07632 0.19028 Contraste acumulado 0.2071 0.3987 0.6506 0.8986 1.0902 1.2266 1.3319 1.4389 1.4251 1.4844 1.4789 1.4579 1.4507 1.4120 1.3461 1.2300 0.9732 0.7582 0.5656 0.3016 -0.1482 -0.4602 -0.6815 -0.8528 -1.1816 -1.1762 -1.0999 -0.9096 2.5 – REDES NEURAIS ARTIFICIAIS Redes Neurais Artificiais são técnicas computacionais que apresentam um modelo matemático inspirado na estrutura neural de organismos inteligentes que adquirem conhecimento através da experiência (Carvalho,1999). O processamento em redes neurais ocorre na sua maioria de modo paralelo, diferentemente da computação convencional, que apresenta processamento seqüencial. Uma rede neural artificial é composta por vários elementos de processamento (EP’s). Esses elementos geralmente são conectados por canais de comunicação associados a determinados pesos. Os pesos são coeficientes adaptativos da rede que determinam a intensidade dos sinais de entrada, ou seja são medidas de força de conexão (Nelson e Illingworth, 1991). Os elementos fazem operações apenas sobre dados locais, que são as entradas recebidas pelas suas conexões. O comportamento “inteligente” de uma Rede Neural Artificial vem das interações entre os EP’s da rede. As arquiteturas neurais são na maioria das vezes organizadas em camadas, com EP’s que podem estar conectados aos EP’s da camada posterior (Figura 2.13). Usualmente as camadas são classificadas em três grupos: Camada de Entrada: Entrada onde os sinais (padrões) são apresentados à rede; Camadas Intermediárias ou Escondidas: Escondidas onde é efetuada a maior parte do processamento, através das conexões ponderadas; Camada de Saída: Saída onde o resultado final é apresentado. Fig. 2.13 – Organização em camadas de uma rede neural. FONTE: Carvalho (1999). A operação de um EP pode ser entendida da seguinte maneira: sinais são apresentados à entrada; cada sinal é multiplicado por um peso, que indica a sua influência na saída da unidade; é efetuada a soma ponderada dos sinais que produz um nível de atividade; se este nível de atividade exceder a um certo limite (bias) a unidade produz uma determinada resposta de saída. Fig. 2.14 – Elemento de processamento – função de soma. FONTE: Adaptado Nelson e Illingworth (1991) Matematicamente pode-se pensar nas entradas e nos pesos como vetores (i1 , i 2 , ..., i n ) e ( wi , w2 ,..., wn ) . É efetuada a multiplicação de cada componente i n pelo correspondente wn , e, posteriormente, a soma de todos os produtos (Figura 2.14). No resultado é aplicada uma função de transferência (função de ativação), geralmente não-linear (Figura 2.15). As funções lineares na prática mostram-se pouco eficientes pois fornecem simplesmente saídas proporcionais às entradas. As funções mais utilizadas são as Hard limiter, Ramping function e sigmóide, sendo estas as mais utilizadas, devido ao seu caráter contínuo (Nelson e Illingworth, 1991). A maioria dos modelos de redes neurais possui alguma regra de treinamento, onde os pesos de suas conexões são ajustados de acordo com os padrões apresentados (sinais). Em outras palavras, elas aprendem através de exemplos. Os sinais podem ser positivos (excitadores) ou negativos (inibidores). Uma entrada positiva promove o disparo de um EP, enquanto a negativa tende à manter o EP inerte. Fig. 2.15 – Exemplos de funções de transferência. FONTE: Adaptado de Nelson e Illingworth (1989). A propriedade mais importante das redes neurais é a habilidade de “aprender” e, com isso, melhorar o seu desempenho. Isso é feito através de um processo interativo de ajustes aplicado a seus pesos, o treinamento. O aprendizado é efetuado através de algoritmo de aprendizado que é um conjunto de regras bem definidas para a solução de um determinado problema. Existem muitos tipos de algoritmos de aprendizado específicos para determinados modelos de redes neurais. O aprendizado ocorre quando a rede neural atinge uma solução generalizada para uma classe de problemas. As formas de aprendizado podem ser subdivididas em: supervisionadas; não supervisionadas; e por reforço. No aprendizado supervisionado são apresentadas à rede um conjunto de padrões de entrada e seus correspondentes padrões de saída. Durante os processos sucessivos, a rede realiza um ajustamento dos pesos das conexões entre os elementos de processamento, segundo alguma lei de aprendizado (algoritmo), até que o erro entre os padrões de entrada e saída esteja abaixo de um valor mínimo desejado (Figura 2.16). Dentre os algoritmos de aprendizado supervisionado os mais utilizados são Perceptron, Adeline e Madaline, Backpropagation (Hetch-Nielsen, 1989). O aprendizado por reforço é similar ao supervisionado com a diferença que um crítico externo avalia a resposta fornecida pela rede (Carvalho, 1999). No aprendizado não-supervisionado a rede analisa os conjuntos de entradas apresentadas e determina algumas das propriedades dos conjuntos de dados e aprende a refletir sobre suas propriedades de saída. Os métodos de aprendizado mais utilizados são Mapa Auto-Organizável de Kohonen, Redes de Hopfield e Memória Associativa Bidirecional (Hecht-Nielsen,1989). Fig. 2.16 – Exemplificação do processo de aprendizado. FONTE: Carvalho (1999). O primeiro passo do processo de desenvolvimento de redes neurais artificiais são a coleta de dados relativos ao problema e a sua separação em um conjunto de treinamento e um conjunto de teste. Os dados de treinamento serão utilizados para o treinamento da rede e dados de teste serão utilizados para verificar sua performance sob condições reais de utilização. O segundo passo é a definição da configuração da rede, que pode ser dividido em três etapas: - seleção do paradigma neural apropriado à aplicação; - determinação da topologia da rede a ser utilizada (número de camadas, número de unidades em cada camada, etc.); - determinação de parâmetros do algoritmo de treinamento e funções de ativação (Carvalho, 1999). O terceiro passo é o treinamento da rede. Nesta fase, seguindo o algoritmo de treinamento escolhido, serão ajustados os pesos das conexões. Normalmente, os valores iniciais dos pesos da rede são números aleatórios uniformemente distribuídos em um intervalo definido. O quarto passo é o teste da rede. Durante esta fase o conjunto de teste é utilizado para determinar a performance da rede com dados que não foram previamente utilizados. O desempenho da rede, nesta fase, é uma boa indicação de sua performance real (Carvalho,1999). Finalmente, com a rede treinada e avaliada, ela pode ser integrada a um sistema do ambiente operacional da aplicação. 2.6 SUPORTE À DECISÃO Qual o grande desafio da produção de novas informações em um SIG? A capacidade de comparar e avaliar as diferentes possibilidades de geração de novos mapas. Como o SIG oferece uma grande quantidade de funções de Álgebra de Mapas, nem sempre é facil escolher qual a forma de combinação de dados mais adequada para nossos propósitos. Neste contexto, é muito útil dispor de ferramentas de suporte à decisão, que nos ajudam a organizar e estabelecer um modelo racional de combinação de dados. Uma das técnicas mais úteis é o processo analítico hierárquico - Analytical Hierarchy Process (AHP), desenvolvida por Saaty (1992), considerada como sendo a mais promissora no contexto do processo de tomada de decisão. Suporte à Decisão - Conceitos Básicos Decidir é escolher entre alternativas. Com base nesta visão, podemos encarar o processo de manipulação de dados num sistema de informação geográfica como uma forma de produzir diferentes hipóteses sobre o tema de estudo. O conceito fundamental dos vários modelos de tomada de decisão é o de racionalidade. De acordo com este princípio, indivíduos e organizações seguem um comportamento de escolha entre alternativas, baseado em critérios objetivos de julgamento, cujo fundamento será satisfazer um nível pre-estabelecido de aspirações. O modelo racional de tomada de decisão preconiza quatro passos que devem ser seguidos para uma escolha apropriada: • Definição do problema: formular o problema como uma necessidade de chegar a um novo estado. • Busca de alternativas: estabelecer as diferentes alternativas (aqui consideradas como as diferentes possíveis soluções do problema) e determinar um critério de avaliação. • Avaliação de alternativas: cada alternativa de resposta é avaliada. • Seleção de alternativas: as possíveis soluções são ordenadas, selecionando-se a mais desejável ou agurpando-se as melhores para uma avaliação posterior. A Técnica AHP - Processo Analítico Hierárquico Quando temos diferentes fatores que contribuem para a nossa decisão, como fazer para determinar a contribuição relativa de cada um? Para abordar este problema, Thomas Saaty propõs, em 1978, o técnica AHP (processo analítico hierárquico). Trata-se de uma teoria com base matemática que permite organizar e avaliar a importância relativa entre critérios e medir a consistência dos julgamentos. Requer a estruturação de um modelo hierárquico, o qual geralmente é composto por meta, critérios, sub-critérios e alternativas; e um processo de comparação pareada, por importância relativa, preferências ou probabilidade, entre dois critérios, com relação ao critério no nível superior. Com base na comparação, a AHP pondera todos os sub-critérios e critérios e calcula um valor de razão de consistência entre [0, 1], com 0 indicando a completa consistência do processo de julgamento. O primeiro passo para a aplicação dessa técnica é a elaboração de uma relação de importância relativa entre as evidências. Neste procedimento, os diferentes fatores que influenciam a tomada de decisão são comparados dois-a-dois, e um critério de importância relativa é atribuído ao relacionamento entre estes fatores, conforme uma escala pré-definida (veja tabela). A lógica da comparação par a par sugere obter uma medida relativa do mérito, em situações nas quais exista alguma incerteza sobre o critério de determinação de padrões desejados em processos de inferência espacial. A lógica da comparação par a par é uma análise decomposta, por comparação dois a dois dos elementos, que finaliza com uma síntese de recomposição, pela agregação dos valores membro dos elementos, em um método de avaliação unificado (Banai, 1993). TABELA 2.4 – ESCALA AHP DE COMPARAÇÃO PAR A PAR Intensidade de importância 1 3 5 7 9 2,4,6,8 Definição e explicação Importância igual – os dois fatores contribuem igualmente para o objetivo Importância moderada – um fator é ligeiramente mais importante que o outro Importância essencial – um fator é claramente mais importante o outro Importância demostrada – um fator é fortemente favorecido e sua maior relevância foi demostrada na prática Importância extrema – a evidência que diferencia os fatores é da maior ordem possível Valores intermediários entre julgamento - possibilidade de compromissos adicionais A lógica da comparação par a par de n elementos é desenvolvida em uma matriz A = ( a ij ). Os coeficientes desta matriz indicam uma estimativa da magnitude dos elementos x i , indicado pelos wi , em relação a uma dada propriedade P. Deste modo, uma matriz de razões é formada com os coeficientes a ij = wi w j . A matriz A é recíproca (a ji = (1 aij )) , e todas as entradas da diagonal são unitárias a ii = 1 . W1 W1 W1 W2 W W W W 2 2 A= 2 1 M M W n W1 W n W2 L W1 Wn L W 2 Wn L M L W n Wn (2.40) As magnitudes wi (i = 1,K , n) são assumidas como conhecidas (i.e., µ s ( xi ) = wi ). Entretanto, caso estas não sejam conhecidas é possível recuperar seu vetor (coluna): [w1, w2, …, wn] através da solução da equação característica (A multiplicação de A por w é definida como proporcional ao w com o fator escalar n): A.w = n.w (2.41) Como a matriz A apresenta rank unitário (na matriz A apenas uma das linhas é independente, as demais são constantes múltiplas da primeira linha), todos os valores característicos (autovalores) λi (i=1,…n) são zero, exceto um λi , o qual Saaty (1978) denomina como λ max ≠ λi = 0 . Substituindo-se n por λ max na Equação (2.41) obtém-se: A.w = λ max .w (2.42) O primeiro passo para a solução da equação característica é o cálculo do autovalor λ max . O desenvolvimento abaixo demostra as operações necessárias para o isolamento do termo da equação do qual o determinante é igualado à zero. Isto é possível uma vez que é assumido um w ≠ 0. A.w = λ max .w (2.43) [ A − I .λmax ] .w = 0 (2.44) det [ A − I .λ max ] = 0 w≠0 (2.45) O próximo passo é a substituição do autovalor, λ max , na formula 2.44. O vetor característico (autovetor) w é obtido através da solução das equações resultantes da equação 2.44, onde o resultado único é definido através da normalização de w (cada posição de wi deve ser dividida pelo somatório de ∑ wi , para i=1,…,n). A escala é limitada entre [0,1] e é recuperada da matriz das razões, A . Deste modo, a grade de relacionamento dos elementos x i de um conjunto S em um espaço de propriedade M=[0,…,1] é definido por wi : 0 ≤ µ s ( x i ) = wi ≤ 1 (Banai, 1993). A técnica AHP é uma ferramenta de análise multi-critério que permite algumas melhorias em aplicações desenvolvidas em SIG. Algumas das principais propriedades que caracterizam a metodologia serão abordadas resumidamente a seguir: Cálculo da consistência Quando o vetor dos pesos, w , não é conhecido, pode-se estimá-lo através da matriz de comparação dois a dois, A , sendo os coeficientes da matriz estimativas dos pesos relativos. Considerando as estimativas dos atuais, A , w , e n por A ’, w ’, e λmax , respectivamente, a equação característica resultante é expressa por: A'.w' = λ max .w' (2.46) Nos casos onde w é conhecido, a condição de consistência a ij . a jk = aik é válida para a matriz A . Entretanto esta condição de consistência pode não ser válida em situações onde a matriz foi estimada, A ’; i.e., a ij' . a 'jk ≠ aik' . Uma pequena perturbação nos valores dos coeficientes de A implica num pequeno desvio dos valores característicos (autovalores), o que geralmente resulta num λmax >n. Uma boa estimativa dos coeficiente de A ’ implica num λmax mais próximo de n o que resultaria numa solução onde o w ’ é o mais próximo de w . Este desvio de consistência é medido pelo índice de consistência, CI: CI = (λ max − n) ( n − 1) (2.47) O índice CI é comparado com sua média, RI (Índice de Consistência Randômica), a qual é derivada a partir de uma amostra de 500 matrizes recíprocas geradas de forma randômica e que apresenta as mesmas dimensões de A . O índice de consistência randômico, RI, utiliza uma escala de 9 pontos mais os valores recíprocos 1/9, 1/8, …,1 (Tabela 2.4), e é dado pelo tamanho da matriz (ou o número de fatores, n, na matriz de comparação) (Banai, 1993): N RI 1 0.00 2 0.00 3 0.58 4 0.90 5 1.12 6 1.24 7 1.32 8 1.41 9 1.45 10 1.49 A comparação dos dois valores via um índice CR=CI/RI indica que a razão estimada pela matriz A ’ é a mais próxima de ser logicamente consistente, ou de modo contrário, a mais próxima de ser aleatória. Saaty (1980) sugere um limite de CR igual a 10% como uma medida de boa consistência. A melhoria da consistência em situações onde o índice CR excede 0.10 envolve a revisão das razões estimadas na matriz A ’. 2.7 MÉTODOS DE AFERIÇÃO DE QUALIDADE Para a avaliação dos mapas de potencialidade gerados através das análises multicritérios, pretende-se utilizar a probabilidade condicional. O objetivo é avaliar o caráter explicativo dos mapas com as verdades de campo (ocorrências minerais) utilizando a idéia da probabilidade a posteriore. O que se espera nessa análise é uma alta correlação das ocorrências com as faixas dos mapas de potencialidade definidos como de alto potencial. Para um melhor entendimento imagine-se um mapa de potencialidade com diferentes faixas de potencialidades. Na prática o que se espera é uma alta correlação das faixas definidas como de alto potencial com as verdades de campo (ocorrências minerais) e uma baixa correlação com as de baixo potencial. O cruzamento desses mapas com as verdades de campo fornecerá parâmetros que, substituídos na formulação do grau de confiança (equação 2.48), permitirão avaliar o caráter explicativo de cada faixa relativa às verdades de campo. Na prática o que se obtém são valores que expressam numericamente o quanto se aumenta em número de vezes (grau de confiança) o encontro de novos depósitos a partir do momento que se está pesquisando em regiões definidas como de alto potencial. O grau de confiança é expresso pela razão da probabilidade a posteriori pela probabilidade a priore. Grau de confiança = onde: p ( depósito | fatia) p (d ) (2.48) p ( depósito | fatia) é a probabilidade a posteriore do depósito ocorrer dado uma certa classe de prioridade; p (d ) é a probabilidade a priore do depósito ocorrer considerando a área total de estudo. CAPÍTULO 3 MATERIAIS As inferências espaciais basearam-se na aplicação de um modelo de prospecção aplicado em um banco de dados espaciais, através de técnicas de geoprocessamento. O banco de dados foi manipulado no SPRING (Sistema de Processamento de Informações Georreferenciadas), sistema de informação geográfica (SIG) baseado num modelo de dados orientado a objeto, do qual são derivados sua interface de menus e sua linguagem espacial LEGAL. Todos os modelamentos desenvolvidos neste trabalho (com exceção do modelo segundo teoria de redes neurais) foram desenvolvidos no SPRING. O modelamento por Redes Neurais utilizou, além do SPRING, o programa de simulação de Redes Neurais Artificiais SNNS (Stuttgart Neural Network Simulator), para execução do processamento do banco de dados. Neste capítulo pretende-se descrever a área de estudo, o Complexo Alcalino de Poços de Caldas, o banco de dados espaciais utilizado, bem como apresentar algumas das definições dos sistemas utilizados: SPRING, linguagem de álgebra de mapas LEGAL e o simulador SNNS. 3.1 ÁREA DE ESTUDO O maciço Alcalino de Poços de Caldas foi usado como área-teste para a aplicação das metodologias de integração e análise espacial dos dados. Essa escolha foi motivada pela disponibilidade de uma base de dados em formato digital, adequada a estudos metodológicos de análise espacial. Pesquisas para minerais radioativos no complexo alcalino de Poços de Caldas tiveram início em 1952, com os trabalhos executados pelo Conselho Nacional de Pesquisa (Tolbert, 1966). Esse interesse gerou uma boa base de dados de campo e estudos (Ellert, 1959; Tolbert, 1966; Oliveira, 1974; Almeida e Paradella, 1977; Ulbrich, 1984; Fraenkel et al., 1985; Almeida Filho,1995). A seguir será apresentado um resumo sobre as características geológicas gerais do maciço de Poços de Caldas e do banco de dados disponível. 3.1.1 Características Gerais O platô de Poços de Caldas localiza-se na divisa dos estados de Minas Gerais e São Paulo, a aproximadamente 300Km da cidade de São Paulo (Figura 3.1). O maciço, de formato aproximado circular, possui uma área aproximada de 750Km2, com diâmetro de cerca de 35Km. A altitude média do platô gira em torno de 1300m, bordejado por diques anelares de 1500 a 1650m de altitude. Ba BRASIL Mg Es Sp Rj Fig. 3.1 – Localização da área de estudo. A cidade de Poços de Caldas, com aproximadamente 110.000 habitantes, no limite norte da cratera, é um importante centro hidrotermomineral do Brasil, também com importantes atividades de mineração de bauxita e argila. 3.1.2 Geologia O maciço de natureza intrusiva tem como rochas mais abundantes nefelinas-sienitos (tinguaítos, fonólitos, foiaítos) de idade Mesozóica-Cenozóica. O embasamento cristalino apresenta rochas Arqueanas, constituídas na maioria por gnaisses, migmatitos e granulitos, conforme mapa litológico da Figura 3.2. Os diversos tipos litológicos de origem alcalina podem ser subdivididos em três grupos principais: - brechas, tufos e aglomerados; - rochas efusivas e hipabissais; e – rochas plutônicas (Fraenkel et al., 1985). Brechas, tufos e aglomerados correspondem ao material vulcânico aflorante na porção noroeste do maciço. As rochas efusivas e hipabissais são representadas por fonólitos e tinguaítos respectivamente. As rochas plutônicas são constituídas por foiaítos e por lujaritos, ocorrendo também chibinitos em menor proporção. Outro aspecto litológico importante é a existência de uma “rocha potássica”, resultante da alteração por processos hidrotermais e de intemperismo do tinguaíto (Fraenkel et al., 1985), a qual constitui importante controle das mineralizações uraníferas no maciço. Aspectos estruturais O complexo alcalino apresenta dois grandes sistemas de falhamentos, com direções predominantes em N60W e N40E, estando o primeiro relacionado com a tectônica regional e o segundo com o processo formador da caldeira (Fraenkel et al., 1985). Almeida Filho e Paradella (1977), através da interpretação de imagens Landsat, identificaram existência de 7 estruturas circulares no interior da caldeira de Poços de Caldas, possivelmente associadas à presença de cones vulcânicos (Figura 3.3). A presença de várias ocorrências minerais radioativas ao longo das bordas dessas estruturas, levou aqueles autores a considerarem que estas feições constituíram controle estrutural dessas mineralizações. Evolução do maciço O complexo alcalino teve as primeiras manifestações no Cretáceo Superior (87m.a.) e evoluiu através de fases sucessivas até ano 60 m.a.. Estudos realizados por Ellert (1959) reconhecem 6 fases na formação do complexo alcalino: 1) soerguimento do embasamento; 2) atividades vulcânicas; 3) formação de caldeiras; 4) atividade magmática alcalina; 5) formação dos diques anelares; 6) intrusões de foiaítos, chibinitos e lujaritos. Mineralizações As mineralizações radioativas do maciço alcalino podem ser agrupadas em três associações: urânio-zircônio, tório-terras raras e urânio-molibdênio (Tolbert, 1966; Fraenkel et al.,1985) Os indícios e mineralizações conhecidos no maciço estão indicados no mapa da Figura 3.4. As associações urânio-zircônio constituem as mineralizações mais comuns, ocorrendo como depósitos aluviais, eluviais e como veios e lentes. As associações tório-terras raras representam o segundo tipo de mineralizações radioativas do maciço sendo o depósito de Morro de Ferro o mais significativo (Tolbert,1966). As mineralizações urâniomolibdênio estão associadas à superposição de eventos tectônicos, hidrotermais e meteóricos, ocorrendo como faixas ou como corpos lenticulares, encaixadas em foiaítos e tinguaítos hidrotermalizados. Fig. 3.2 – Mapa litológico do maciço de Poços de Caldas.FONTE: Nuclebrás (1975a). Fig. 3.3 – Mapa de lineamentos estruturais e estruturas circulares do maciço de Poços de Caldas. FONTE: Adaptado de Almeida Filho (1995). Fig. 3.4 – Ocorrências de minerais radioativos no planalto de Poços de Caldas. FONTE: Nuclebrás (1975b). 3.1.3 Modelo Prospectivo Para a representação espacial e análise das informações relevantes sobre um alvo a ser pesquisado, Rostirolla (1997) propõe a definição das seguintes atividades: - mapear a área e construir o banco de dados georreferenciado; - estudar os depósitos conhecidos para a elaboração do modelo de depósito; - montar o modelo genético e caracterizar as variáveis diagnósticas (evidências); - definir os ponderadores para cada variável diagnóstica; - integrar os mapas ponderados; - construir os mapas de potencialidade; e – analisar os resultados e a eficiência do sistema de avaliação. De acordo com as etapas propostas pelo autor acima, a etapa fundamental consiste na definição do modelo prospectivo a ser adotado para a área de estudo. O poder explicativo do modelo proposto depende fundamentalmente do conhecimento geológico prévio da área de estudo, que permitirá a seleção dos critérios diagnósticos mais importantes para a “alimentação” do modelo. No caso particular da área de estudo, os critérios diagnósticos (evidências) mais importantes a ser considerados são características geológicas da área (litologia, estruturas e presença de anomalias radioativas). Tais parâmetros podem definir isolada ou conjuntamente, sítios potenciais à ocorrência dos minerais de interesse. Almeida Filho (1995) relata a dificuldade da elaboração de um modelo prospectivo para o maciço de Poços de Caldas, devido à alta complexidade dos fenômenos envolvidos no processo formador do complexo alcalino e das mineralizações associadas. O processo envolve aspectos tectônicos, estruturais, litológicos e intempéricos, com particularidades de região para região. Entretanto, aquele autor identifica algumas características comuns às ocorrências minerais no maciço alcalino, as quais foram preliminarmente assumidas como critérios diagnósticos à pesquisa de minerais radioativos: litologias favoráveis : presença de controles litológicos representados por rochas potássicas, lujaritos/chibinitos, material vulcânico, e corpos intrusivos de foiaítos; falhamentos/fraturamentos : presença de falhas e fraturas, condicionando o alojamento de veios e lentes mineralizados; estruturas circulares : presença de cones vulcânicos no interior da cratera, condicionando a ocorrência de mineralizações radioativas em suas bordas; gama-radiometria: gama-radiometria presença de valores anômalos de radioatividade total, indicativa da presença de minerais radioativos. Desse modo, o modelo prospectivo para a definição de áreas potenciais à ocorrências de minerais radioativos baseia-se em três pontos: dados gama-radioativos, litologias favoráveis e feições estruturais. 3.2 BANCO DE DADOS ESPACIAIS As informações relevantes ao processo de inferência espacial foram extraídas do banco de dados digitais geocodificados (BDDG) construído por Almeida Filho (1995) no ambiente dos sistemas SITIM (Sistema de Tratamento de Imagens) e SGI (Sistema de Georreferenciado de Informação), desenvolvidos pelo INPE . Os planos de informação de interesse foram migrados para o ambiente SPRING, onde foram realizadas todas as edições e processamentos necessários para a execução das análises multi-critério com vistas a definir cenários potenciais à ocorrência de minerais radioativos. Os dados utilizados estão apresentados na Tabela 3.1, onde estão explicitados os formatos e respectivos atributos. TABELA 3.1 – TIPOS, FORMATOS E ATRIBUTOS DOS DADOS Dados Formatos Atributos Cidade, principais drenagens Vetorial Infra-estrutura Mapa Litológico Vetorial e matricial Informações litológicas Contatos litológicos Vetorial e matricial Zonas de contatos Gama-radiometria Vetorial e matricial Radioatividade (contagem total) Feições estruturais Vetorial Falhas/fraturas e estr. circulares Ocorrências minerais Vetorial Verdade de campo Adaptada de Almeida Filho (1995). As principais características dos planos de informação são descritas a seguir: Dados planimétricos – indicação da cidade de Poços de Caldas, principais drenagens e barragens. Essas entidades foram digitalizadas a partir das folhas descritas anteriormente. Dados litológicos – As unidades litológicas foram digitalizadas a partir do mapa geológico do maciço alcalino (Nuclebrás, 1975a) (Figura 3.2). Dados gama radiométricos – os dados radiométricos foram coletados pela Comissão Nacional de Energia Nuclear – CNEN, através de aerolevantamento com helicóptero e caminhamentos. Nos levantamentos com helicóptero os dados foram coletados em malhas de 250x250m, enquanto os dados coletados no terreno o foram em malha de 75x250m. Estes dados de radiatividade total encontravam-se integrados no “mapa radiométrico do planalto de Poços de Caldas” (NUCLEBRAS,1975c), subdivididos em 5 classes de intensidade radioativa, em relação a um background regional de 40 unidades (background -1,3; 1,3-1,8; 1,8-2,5; 2,5-3,5; 3,5 - background)(Figura 3.4). Dados estruturais – Os dados estruturais foram obtidos através da interpretação de imagens multiespectrais (MSS) realizada por Almeida Filho (1995). Eles foram subdivididos pelo autor em feições lineares e feições circulares. As estruturas circulares identificadas correspondem a sete feições no maciço alcalino, interpretadas como associadas a edifícios vulcânicos no interior da cratera (Almeida Filho e Paradella, 1977). Fig. 3.5 – Mapa de intensidade radioativa total do planalto de Poços de Caldas. FONTE: Nuclebrás (1975c). 3.3 SUPORTE COMPUTACIONAL UTILIZADO Dois sistemas foram usados no presente estudo: SPRING e SNNS. O SPRING é um SIG de 2o geração, desenvolvido pelo Instituto Nacional de Pesquisas Espaciais – INPE. No seu modelo conceitual um banco de dados corresponde fisicamente a um diretório onde são armazenados suas definições de categoria e classe e os projetos pertencentes ao banco. Os projetos são armazenados em subdiretórios juntamente com seus arquivos de dados (pontos, linhas, imagens orbitais e aéreas, imagens temáticas, textos, grades e objetos). O dados espaciais devem ser representados no esquema conceitual do SPRING como geo-campos ou geo-objetos. O geo-campo representa a distribuição espacial de variáveis que possuem valores em todos os pontos pertencentes a uma região geográfica, podendo ser especializado em modelos: temático, numérico e imagem. O geo-objeto representa um elemento único que possui atributos não espaciais e está associado a múltiplas localizações geográficas. O SPRING provê um ambiente de trabalho amigável e poderoso, através da combinação de menus e janelas com uma linguagem espacial denominada LEGAL – Linguagem Espacial para Geoprocessamento Algébrico (Câmara, 1996). É facilmente programável pelo usuário, possibilitando a realização de análises espaciais através de álgebra de mapas. A análise espacial utiliza atributos espaciais e não espaciais das entidades gráficas armazenadas na base de dados espaciais, para fazer análises e simulações sobre fenômenos do mundo real. A estrutura de um programa em LEGAL é composta de três partes: declaração, instanciação e operação. Na “declaração” são definidos os dados, onde cada plano de informação (PI) a ser manipulado é associado a uma variável de determinada categoria definida no esquema conceitual. A “instanciação” consiste nas manipulações de banco de dados, onde PI’s são recuperados ou criados dependendo dessas manipulações. Na “operação” são realizadas as operações de álgebra de mapas (transformação, booleana, matemática, classificação contínua, vizinhança, reclassificação por atributos). No Anexo I estão apresentados os programas em LEGAL construídos para execução dos procedimentos necessários para a aplicação das diferentes técnicas de inferência espacial, usadas neste estudo. O outro pacote utilizado, o SNNS, é um programa de simulação de redes neurais artificiais, desenvolvido pelo Institute for Parallel and Distributed High Performance Systems - IPVR da Universidade de Stuttgart. O simulador é composto por 4 componentes principais: simulador central, interface de usuário gráfica, interface de execução em grupo e compilador de rede SNN2C. Uma de suas características mais importantes é a interface gráfica que permite que usuários inexperientes possam aprender e desenvolver modelos conexionistas com o auxílio do simulador, de modo que o desenvolvimento de redes neurais complexas seja fácil e rápido (Zell et al., 1999). CAPÍTULO 4 MODELAGEM DOS DADOS: RESULTADOS E DISCUSSÕES Foram utilizados vários métodos de inferência espacial para a integração dos dados (evidências) relevantes para o modelo prospectivo adotado para o maciço alcalino de Poços Caldas. Os métodos geraram diferentes planos de informação (geocampos) com representação Temática ou Numérico - MNT (Modelo Numérico de Terreno). Na representação Temática (booleano), a favorabilidade para ocorrências minerais radioativas é expressa espacialmente através de polígonos ou “pixels”. Na representação Numérica têm-se campos contínuos em forma de grade regular, que expressam pontualmente o grau de favorabilidade. Os resultados em formato numérico foram fatiados em quatro classes (nula, baixa, média e alta), arbitrariamente definidas, que exprimem níveis diferentes de potencialidade à ocorrência mineral. Os fatiamentos foram efetuados com o objetivo de definir classes com áreas o mais próximas possíveis em tamanho. O desejo dessa similaridade entre classes advém do sentimento de que as comparações entre cenários seriam mais lógicas. Os mapas com representação Temática, gerados através dos 8 modelamentos (Booleano, Média Ponderada, Fuzzy Mínimo-Máximo, Fuzzy Média, Fuzzy Gama, Fuzzy Ponderado (AHP), Bayesiano, e Redes Neurais), foram avaliados qualitativamente e quantitativamente. Nas análises qualitativas foram observadas as coincidências das ocorrências minerais com as classes de favorabilidade de cada cenário. A observação foi executada sobrepondo-se a cada mapa de favorabilidade as ocorrências minerais, definidas por uma circunferência com 0,2 Km2 de área. Em casos onde existiu a interseção de mais de uma classe por ocorrência mineral foi assumido a classe de maior potencialidade como a classe coincidente. Para a realização das análises quantitativas foi utilizada a probalidade condicional para a avaliação de cada fatia dos cenários gerados. O objetivo foi avaliar o caráter explicativo de cada faixa (nula, baixa, média e alta) em relação às ocorrências minerais radioativas. Ou seja, desejou-se aferir em quanto seria aumentada a chance de ocorrência (grau de confiança) de um depósito mineral nas classes definidas no mapa de favorabilidade. Para a definição dos graus de confiança, o primeiro passo foi a tabulação cruzada do PI das ocorrências minerais com cada um dos diferentes PI’s que continham os cenários gerados. O cruzamento gerou 8 matrizes de confusão (2x4) que foram editadas. Cada matriz gerou outras 4 matrizes (2x2), de onde foram extraídos os valores para o cálculo da probabilidade a priore e a posteriore, necessárias para o cálculo do grau de confiança ( grau de confiança = P( D | B) P( D) ). As matrizes binárias de confusão de cada classe dos diferentes cenários encontram-se na Tabelas II.1 (Anexo II). O cálculo do grau de confiança foi obtido para todas as classes (fatias) dos mapas de favorabilidade gerados e os resultados estão apresentados em tabelas individualizadas para cada modelamento (Tabelas 4.2, 4.3, 4.6, 4.7, 4.9, 4.10, 4.20, 4.21). A análise dessas tabelas permitiu a obtenção de algumas conclusões com relação à qualidade dos mapas de favorabilidade gerados. Os comentários com relação às avaliações qualitativas e quantitativas foram realizados individualmente, modelo por modelo, apontando-se os pontos positivos e falhos de cada modelamento. De modo geral, todos os mapas de favorabilidade apresentaram fatias com um comportamento coerente em relação à distribuição do grau de confiança. Ou seja, os valores de grau de confiança variaram de modo crescente, com valores menores sendo obtidos em classes definidas como de potencial nulo e maiores para classes de alto potencial. Isso atesta a eficiência desse parâmetro estatístico na aferição dos resultados, assim como dos modelamentos prospectivos executados. 4.1 INFERÊNCIA BOOLENA O modelo Booleano envolveu a combinação lógica de mapas binários, através de operadores condicionais. O primeiro passo para a aplicação do método foi a reclassificação dos planos de informação para um padrão binário. Os PI’s “Litologia” e “Intensidade Radioativa” foram reagrupados cada um para apenas duas classes: favorável e não-favorável. A Figura 4.1 mostra a generalização aplicada ao plano de informação litológico, onde as unidades (classes) Rocha Potássica, Foiaíto, Lujaritos/Chibinitos e Material Vulcânico foram agrupadas como favoráveis e as demais, Fonólito, Tinguaíto, Embasamento e Arenito como não-favoráveis (Programa I.1 Anexo I). O mesmo procedimento foi aplicado ao PI Intensidade Radioativa. Unidades com valores acima de 1,8 vez o background regional foram consideradas como favoráveis e abaixo como não-favoráveis. Esse limiar de corte foi definido empiricamente por Almeida Filho (1995), que tomou como base o valor mínimo encontrado no depósito de Campo São Agostinho. O resultado encontra-se na Figura 4.2. O programa, em linguagem LEGAL, para esse procedimento encontra-se no Anexo I, Programa I.2. Fig. 4.1 – Exemplificação de generalização de mapa temático para padrão binário. No caso dos lineamentos e estruturas circulares, foi construído primeiramente um mapa de distâncias isotropicamente distribuído ao longo dos lineamentos e estruturas circulares, segundo uma grade regular numérica. Estes planos foram, então, fatiados segundo um limiar de corte definido empiricamente por Almeida Filho (1995). Para os lineamentos o limiar definido como área favorável foi de 250m e para as estruturas circulares de 350m (Figura 4.3). Como os contatos das unidades litológicas são inferidos na sua maioria, foi criado um buffer de 100m ao longo dos mesmos, de modo a minimizar erros relativos ao posicionamento. O procedimento de construção do plano de informação binário foi o mesmo adotado para os lineamentos e estruturas circulares. Com os planos de informação ajustados para um padrão binário, o próximo passo foi a integração destas evidências, segundo os operadores de lógica booleana, determinando os locais onde as evidências satisfaziam ou não às regras definidas pelo modelo. As operações efetuadas de modo seqüencial foram eqüivalentes às realizadas por Almeida Filho (1995), onde os operadores utilizados foram “E E ” (∩ - interseção) e “OU OU” (∪ - união). Primeiramente as evidências foram agrupadas com o operador “OU” em três grupos principais à saber: Grupo A - litologia OU contatos litológicos; Grupo B - estruturas circulares OU lineamentos; Grupo C - intensidade gama-radiométrica. Fig. 4.2 - Tabela e plano de informação de intensidade radioativa reclassificado. Fig. 4.3 – Planos de informação binários, lineamentos e estruturas circulares, com a classe favorável em verde e a não-favorável em cinza. O resultado deste agrupamento são planos de informação que retornam a união das áreas favoráveis de cada evidência. Com os grupos formados aplicou-se o operador "E E ", para definir as áreas potencialmente favoráveis. O PI final apresenta como áreas potencialmente favoráveis apenas aquelas onde houve coincidência das classes favoráveis das evidências agrupadas. A formulação está expressa abaixo e o programa LEGAL encontra-se no Anexo I (Programa I.3). Grupo A = (litologia) ∪ (contato litológico) Grupo B= (estruturas circulares) ∪ (lineamentos) Grupo C=(intensidade de radiometria gama) R = (Grupo A) ∩ (GrupoB ) ∩ (GrupoC ) No modelamento Booleano, um dos problemas encontrados é a rigidez do resultado final, que não permite uma nova redistribuição dos dados em um número maior de classes. O cenário, em termos de distribuição de valores, foi o que apresentou o pior resultado, visto que os pixels apresentam apenas dois valores, 0 ou 1 (não-favorável e favorável) (Figura 4.4). Esta característica da técnica dificultou a comparação entre os outros modelos e pesou contra o modelamento, pois não permitiu variação nos limiares de tomada de decisão. Frequência Distribuição dos pixels segundo as classes "favorável' e "não-favorável" 2000000 1600000 1200000 800000 400000 0 1 favorável não-favorável Fig. 4.4 – Distribuição acumulada dos pixels do cenário de potencialidade gerado pelo modelo Booleano. A classe “favorável” encerrou 24 das 48 ocorrências minerais em uma área de 32,4 Km2, ou 4,45% do maciço alcalino (Figura 4.5). O grau de confiança indica um aumento de 5,78 vezes na probabilidade a priore de descobertas de depósitos minerais, caso pesquisas sejam realizadas nessas áreas. Dentre os principais depósitos, a classe mapeou o Campo Agostinho e Morro do Ferro. A mina Usamu Utsumi foi encerrada pela classe “nãofavorável”, que compreende uma área de 694,94 Km2 (95,55% do maciço) e obteve 0,78 de grau de confiança (Tabela 4.1). TABELA 4.1– SUMÁRIO DOS RESULTADOS DO MÉTODO BOOLEANO Fatia 22 Área (Km ) Área (%) Prob. Posteriore Grau de confiança U-Zr U-Mo Th-Tr Favorável Não favorável 32.4 694.94 4.45 95.55 0.0722 0.0097 5.78 0.78 (1.28) 14 21 9 2 1 1 Total 727.34 100.00 Prob. priore 0.0125 35 11 2 Fig. 4.5 – Mapa de favorabilidade à ocorrência de minerais radioativos, obtido segundo o método Booleano. 4.2 MÉTODO MÉDIA PONDERADA Neste método, cada plano de informação e suas respectivas classes são ponderados de acordo com a importância relativa para a hipótese considerada no modelo prospectivo adotado. A definição dos pesos é a etapa mais crítica desta técnica, pois os pesos atribuídos às evidências precisam indicar a importância relativa das mesmas para o modelo. A integração das evidências é realizada através de uma soma ponderada, procurando refletir a importância relativa dos fenômenos geológicos envolvidos. Para a aplicação da técnica, o primeiro passo foi a definição dos pesos que iriam ponderar tanto os PI’s como suas respectivas classes. Os pesos adotados foram os mesmos definidos de modo heurístico por Almeida filho (1995), segundo sua experiência pessoal na região: Gama-radiometria: peso do plano de informação ⇒ y1= 80; peso das classes: background –1.3 ⇒ w11 = 0; 1.3 - 1.8 ⇒ w12 = 10; 1.8 - 2.5 ⇒ w13 = 60; 2.5 - 3.5 ⇒ w14 = 70; > 3.5 ⇒ w15 = 80; Dados litológicos: peso do plano de informação ⇒ y2 = 60; peso das classes: rochas potássicas ⇒ w21 = 60; lujaritos/chibinitos ⇒ w22 = 60; foiaítos ⇒ w23 = 30; material vulcânico ⇒ w24 = 20; tinguaítos ⇒ w25 = 0; fonólitos ⇒ w26 = 0; arenitos ⇒ w27 = 0; embasamento ⇒ w28 = 0; Dados estruturais: peso do plano de informação⇒ y3 = 20; peso das classes: "buffer" das estruturas circulares e lineamentos ⇒ w31 = 20. A atribuição dos pesos foi feita através de programas de ponderação em linguagem LEGAL (Anexo I - Programas I.4, I.5 e I.6). No caso dos lineamentos e estruturas circulares adotou-se buffers de 250m e de 350m, respectivamente. As classes foram integradas através do operador lógico (OU), gerando-se um único PI representando a soma dos buffers dos lineamentos e estruturas circulares. Os dados resultantes em formato numérico, foram integrados através de uma soma ponderada, implementada através de um programa em LEGAL (Anexo I - Programa I.7). O plano de informação resultante apresenta valores numéricos que variam de 0 a 65, espacializados em uma grade regular. Para exemplificação do processamento, considere um ponto qualquer da grade que apresente: classe de anomalia gamaradiométrica de 2.5-3.5, unidade litologia foiaíto e que encontra-se dentro dos buffers dos lineamentos e/ou estruturas circulares. O valor de saída é: r = ((ω 14 ∗ y1 ) + (ω 23 ∗ y 2 ) + (ω 31 ∗ y 3 )) /( y1 + y 2 + y 3 ) r = (( 70 ∗ 80) + (30 ∗ 60) + ( 20 ∗ 20)) /( 80 + 60 + 20) = 48,75 Pontos com valores iguais a "0" indicam áreas de potencial nulo, enquanto pontos com valores iguais a "65" são áreas de máximo potencial. Para uma melhor visualização, o plano de informação resultante foi subdividido arbitrariamente em 4 fatias de favorabilidade (0-29.9 ⇒ Nula; 29.9-52.0 ⇒ baixa; 52.0-55.3 ⇒ média; 55.3-65.0 ⇒ alta). Dentre as técnicas utilizadas, a Média Ponderada mostrou-se uma das mais eficazes. As diferentes faixas de potencialidade mostraram coerência na distribuição relativa dos valores dos graus de confiança, que apresentaram um padrão decrescente da classe “alto” potencial para a de potencial nulo. O ponto negativo deste modelamento foi a distribuição não uniforme dos valores de saída, apresentando agrupamentos que podem ser visualizados no gráfico da Figura 4.6 pelos patamares da distribuição acumulada dos valores. Esta má distribuição dos valores, na prática, impediu maior flexibilidade no fatiamento. Frequência acumulada Distribuição acumulada dos pixels sobreposta pelas classes de potencialidade 1600000 1200000 Distribuição acumulada dos pixels 800000 Nulo Médio 400000 Baixo 0 0 10 20 30 40 50 Alto 60 70 Valores dos pixels Fig. 4.6 – Distribuição acumulada dos pixels do cenário de potencialidade gerado pelo modelo Média Ponderada. O grau de confiança da classe “nula” indica possibilidade de sucesso 2,27 vezes menor em relação a todo o complexo alcalino. Ou seja, a probabilidade do encontro de depósitos considerando-se a área total é maior do que se considerarmos apenas essa classe. Ela cobre uma área de 628,36 Km2 (86,39% da superfície total do maciço alcalino), contendo 8 mineralizações conhecidas. As demais classes (baixo, médio e alto potencial) compreendem uma área de 98,98 Km2, que eqüivalem a 13,61% do complexo alcalino e encerraram 40 das 48, ou 83,33%, mineralizações conhecidas (Figura 4.7). As classes “médio” e “alto” potencial encerram 24 mineralizações, sendo 10 das 11 mineralizações de U-Mo e as duas de Th-Tr, totalizando 30,64 Km2 (apenas 4,27% do total do maciço alcalino). Os valores de grau de confiança das faixas “médio” e “alto” foram 4,97 e 12,60, respectivamente, sendo o valor da classe “alto” o segundo melhor valor obtido dentre todos os modelamentos prospectivos executados. Embora essa classe compreenda uma área de apenas 6,48Km2 (menos de 1% do maciço), ela encerrou as principais mineralizações conhecidas, como a Mina Usamu Utsumi e os depósitos de campo Agostinho e Morro do Ferro, atestando a confiabilidade do modelo prospectivo (Tabela 4.2). TABELA 4.2 –SUMÁRIO DOS RESULTADOS DO MODELO MÉDIA PONDERADA Fatia Área (Km2) Área (%) Prob. Posteriore Grau de confiança UZr UMo ThTr alta (65.0-55,3) 6.48 0.89 0.1574 12.60 7 4 1 média (55.3-52.0) 24.16 3.32 0.0621 4.97 6 5 1 baixa (52.0-29.9) 68.34 9.40 0.0457 3.65 15 1 0 628.36 86.39 0.0055 0.44 (2.27) 7 1 0 727.33 100.00 Prob. priore 0.0125 35 11 2 nula (29.9-0.0) Total Fig. 4.7 – Mapa de favorabilidade à ocorrência de minerais radioativos, obtido segundo o método Média Ponderada. 4.3 – MÉTODO FUZZY Para a aplicação da metodologia fuzzy torna-se necessário que todas as evidências (planos de informação) estejam no formato numérico MNT. Assim, os mapas temáticos foram ponderados para valores que variam entre 0 e 1 (membros fuzzy). A definição dos pesos, semelhantemente ao método Média Ponderada, é uma das mais difíceis etapas, pois as evidências devem ser hierarquizadas através dos membros fuzzy. Essa graduação deve expressar, de um modo semelhante ao modelo cognitivo humano, o grau de aceitação da evidência com o modelo prospectivo proposto. Para o mapa de intensidade gama-radiometria, os membros fuzzy foram definidos através da aplicação de uma função linear sobre os pesos definidos por Almeida Filho (1995). O objetivo da função foi reescalonar os ponderadores das classes de anomalia gama-radiométrica para valores entre 0 e 1. A Tabela 4.3 apresenta os pesos do método Média Ponderada e os valores de membro fuzzy obtidos a partir da equação linear ( f ( x ) = 0,0125 ∗ x ). Com os valores dos membros fuzzy definidos, o próximo passo foi a atribuição destes valores para o plano de informação através de um programa de ponderação executado através da linguagem LEGAL (Anexo I - Programa I.8). No caso das unidades litológicas, a atribuição dos membros fuzzy foi um pouco mais complexa. Como a maioria dos contatos são inferidos, objetivou-se, além de atribuir os membros fuzzy para as unidades litológicas, expressar também a informação semântica dos diferentes contatos (inferido e definido). Sendo assim, foram necessários vários processamentos para construção de um PI litológico que expressasse também a informação do tipo de contato. A primeira etapa foi a construção de um PI em formato temático com polígonos que serviriam de máscara para os contatos inferidos. Estes contatos correspondem àqueles mapeados pelos buffers de 100m por Almeida Filho (1995). A seguir foi editado o plano de informação litológico onde as unidades foram individualizas em PI’s binários, de modo que em cada PI estivesse apenas uma unidade litológica, confrontada com as demais, representadas por um único polígono. Ou seja, se o desejo for confrontar a rocha potássica com as demais unidades litológicas, os contatos das outras unidades deveriam ser eliminados de modo que fique apenas os contatos da rocha potássica. Em teoria de conjuntos seria o conjunto A confrontado com o não-A (A = T − A ). No caso, essa edição foi necessária apenas para as 4 unidades (rocha potássica, lujarito/chibinito, foiaíto e material vulcânico) consideradas como favoráveis, ou com grau de aceitação maior que 0. TABELA 4.3 – VALORES DOS MEMBROS FUZZY DO PLANO DE INFORMAÇÃO GAMA-RADIOMETRIA Gama-radiometria ⇒ ƒ(x) = 0,0125.x Classes Média Ponderada Membros fuzzy background 0 0 1,3 - 1,8 10 0,125 1,8 - 2,5 60 0,750 2,5 - 3,5 70 0,875 > 3,5 80 1 Tomando como ponto de partida os contatos das unidades favoráveis (evidências), foram construídos 4 mapas de distâncias isotropicamente distribuídos em grades regulares (superfícies contínuas). A penúltima etapa foi a construção dos 4 planos de informação que conteriam os valores de membros fuzzy das unidades litológicas, considerando também a informação semântica dos tipos de contato (inferido e definido). Os PI’s foram obtidos a partir de processamentos realizados através de programas em LEGAL (Anexo I - Programas I.9, I.10, I.11, I.12). Os programas realizaram diferentes funções condicionadas por restrições espaciais. As operações foram realizadas pontualmente onde em cada ponto da grade, foi verificado o condicionante espacial e aplicada a respectiva função. A seqüência de operações a seguir exemplifica o programa executado para a rocha potássica: MFR . potássica = 0 Se (Classe.Máscara = contato definido E Classe.PI binário = NãoR.potássica); MFR . potássica = 1 Se (Classe.Máscara = contato definido E Classe.PI binário = R.potássica); MFR . potássica = (0.005 ∗ dist ) + 0.5 Se (Classe.Máscara = contato inferido E Classe.PI binário = R.potássica E distância < 100); MFR . potássica = (−0.005 ∗ dist ) + 0.5 Se (Classe.Máscara = contato inferido E Classe.PI binário = Não-R.potássica E distância < 100). A primeira e a segunda condições das operações têm como objetivo retornar valores de membro fuzzy que exprimam o grau de possibilidade da existência da rocha potássica, considerando corpos definidos por contatos rígidos. A terceira e a quarta condição definem os membros fuzzy dos corpos de rocha potássica que são definidos por contatos inferidos. Para expressar a incerteza quanto à possível localização do contato inferido, foi considerada uma zona de transição onde foi aplicada a função membro fuzzy linear. Esta graduou os membros de modo decrescente conforme a distância da unidade litológica. A zona de transição delimita a região onde os membros fuzzy expressam no espaço a possibilidade da localização do contato. A Figura 4.8 ilustra o resultado do procedimento aplicado à rocha potássica e ao material vulcânico. Na figura estão representados os membros fuzzy como grade regular sobreposta a unidades litológicas separadas por contato rígido. As linhas pontilhadas demarcam uma zona de transição de 200m em relação a esse contato. As funções membro fuzzy que graduam os elementos encontram-se no topo da figura. Fig. 4.8 – Representação dos membros fuzzy da rocha potássica (azul) e material vulcânico (cinza) em grade regular numérica. A grade sobrepõe as unidades definidas inicialmente pelo contato rígido. No topo dos dois planos encontram-se as funções lineares que mapearam os respectivos membros. O procedimento foi aplicado também para as demais unidades litológicas favoráveis. Os PI’s litológicos fuzzy com a informação semântica dos contatos foram finalmente integrados através de soma ponderada. Os pesos foram obtidos através da aplicação de uma função linear sobre os pesos definidos por Almeida Filho (1995). A Tabela 4.4 apresenta os pesos e os valores de membro fuzzy obtidos a partir da equação linear ( f ( x ) = 0,0167 ∗ x ). Como o peso das unidades não-favoráveis é 0, o procedimento de representação dos membros fuzzy foi aplicado apenas para as unidades litológicas favoráveis. A soma ponderada foi executada a partir do Programa I.13 (Anexo I) e a expressão seguinte ilustra a operação: MFlitológia = R. potássica + ( Lujarito, chibinito) + ( 0.5 ∗ Foiaíto) + (0.33 ∗ Mat . vulcânico) Os procedimentos para atribuição dos membros fuzzy das estruturas circulares e lineamentos foram semelhantes. Para a definição dos membros fuzzy foi necessário a criação de dois mapas de distâncias, um para cada evidência estrutural. As funções quadráticas para espacializar os valores dos membros fuzzy foram aplicadas sobre as grades de distâncias através dos Programas I.14 e I.15 (Anexo I), considerando zonas de transição de 700m e 500m de largura, respectivamente. As funções espacializam os membros de uma forma gradual decrescente, conforme a distância das feições estruturais. A Figura 4.9 demostra a função membro fuzzy para os lineamentos. Essa função é semelhante à que mapeou os membros fuzzy das estruturas circulares, sendo diferente apenas os parâmetros de ponto de cruzamento e zona de transição. TABELA 4.4 – VALORES DOS MEMBROS FUZZY DO PLANO DE INFORMAÇÃO LITOLÓGICA Litologia ⇒ ƒ(x) = 0,0167.x Classe Média Ponderada (x) Membro fuzzy (f(x)) Rochas potássicas 60 1 Lujaritos /chibinitos 60 1 Foiaítos 30 0.5 Mat. Vulcânico 20 0,333 Tinguaíto 0 0 Fonólitos 0 0 Embasamento 0 0 Arenito 0 0 O processo de espacialização dos membros fuzzy que representariam os contatos geológicos foi semelhante ao executado para as estruturas circulares e lineamentos. Como a informação da incerteza na localização dos contatos já foi considerada na construção do PI litológico fuzzy, considerou-se apenas a importância os contatos dos corpos intrusivos de foiaíto. Novamente a função quadrática fuzzy aplicada (Programa I.16 – Anexo I), modela a importância desses contatos à medida que se distancia dos mesmos. Fig. 4.9 – Curva quadrática de espacialização dos membros fuzzy dos lineamentos. Finalmente os PI’s fuzzy foram integrados, segundo análises multi-critério definidas através de operadores fuzzy (Mínimo-Máximo, Média, Ponderado (Técnica AHP) e Gama), gerando diferentes cenários de potencialidade à ocorrência mineral radioativa. Os procedimentos adotados estão relatados a seguir: 4.3.1 Fuzzy Mínimo-Máximo Nessa análise multi-critério foram utilizados dois operadores, mínimo e máximo, combinados numa seqüência lógica semelhante à adotada no método Booleano. O primeiro passo foi a integração em três grupos principais das evidências fuzzy através do operador fuzzy máximo, à saber: • • • Grupo A - Litologia com os contatos dos corpos intrusivos de foiaíto; Grupo B - Lineamentos com as Estruturas Circulares; Grupo C - Intensidade Gama-radiométrica. Nessa primeira integração, o operador fuzzy máximo compara os valores numéricos dos membros fuzzy, retornando como valor de saída o maior valor dentre as evidências fuzzy. Posteriormente esses três grupos foram integrados através do operador fuzzy mínimo que de modo contrário retornou os menores valores da comparação entre os membros fuzzy. A formulação abaixo exemplifica as operações que foram realizadas no Programa I.17 (Anexo I). MFmin - max = Min(Max(MFlitologia , MFcontato ), Max ( MFestrut. circular , MFlineamento s ), MFgama ) O mapa de favorabilidade resultante deste modelamento (Figura 4.11) apresentou alguns problemas, embora tenha obtido uma boa coincidência da classe “alto” potencial com as ocorrências minerais. O primeiro problema foi a distribuição não uniforme dos valores numéricos, o que dificultou o fatiamento. A distribuição dos valores apresentou picos que indicam pontos com maior concentração de valores. A Figura 4.10 apresenta a distribuição acumulada dos membros fuzzy onde é possível identificar degraus que ilustram de modo mais claro esse problema. Na prática, a distribuição não uniforme impediu que as classes de potencialidade pudessem ser definidas com áreas semelhantes às dos demais cenários. Outro problema foi a distribuição não coerente dos valores de grau de confiança, onde a faixa “alto potencial” (5,44) obteve um valor menor do que a faixa “médio potencial” (5,87), quando o esperado seria o inverso (Tabela 4.5). A classe nula, com uma área de 575,9 Km2 (79,18% do maciço alcalino), obteve uma coincidência de 8 ocorrências minerais, sendo uma delas a importante Mina Usamu Utsumi. Embora o número de coincidências tenha sido baixo, o fato de um importante depósito ter sido mapeado por esta classe depõe contra o método. O grau de confiança obtido indica que uma pesquisa mineral dirigida às áreas definidas como de potencialidade nula teria chance de sucesso 1,85 vezes menor do que pesquisas que considerassem todo o complexo alcalino. Frequência acumulada Distribuição acumulada dos pixels sobreposta pelas classes de potencialidade 1600000 1200000 Distribuição acumulada dos pixels Nulo 800000 Baixo Médio 400000 0.0 0.1 0.2 0.3 0.4 0.5 0.6 Alto 0.7 0.8 0.9 1.0 Valores dos pixels Fig. 4.10 – Distribuição acumulada dos pixels do cenário de potencialidade gerado pelo modelo Fuzzy Mínimo-Máximo. As demais classes de potencialidade (baixo, médio e alto) compreendem uma área de 151,44 Km2 (20,82% da área total do maciço alcalino) e encerraram 40 das 48 mineralizações conhecidas. Embora a classe “alto” potencial tenha indicado uma coincidência com 18 mineralizações, seu grau de confiança (5,44) foi menor que as classes de mesmo potencial dos outros cenários. Dentre os principais depósitos, a classe “alto potencial” mapeou o Campo Agostinho e Morro do Ferro. TABELA 4.5 – SUMÁRIO DOS RESULTADOS DO MÉTODO FUZZY MÍNIMO-MÁXIMO Fatia Área (Km2) Área (%) Prob. Posteriore Grau de confiança UZr UMo ThTr alta (1.00-0.75) 12.94 1.78 0.0680 5.44 8 9 1 média 0.37) (0.75- 24.42 3.36 0.0733 5.87 10 0 0 baixa 0.12) (0.37- 114.08 15.68 0.0222 1.77 10 1 1 nula 0.00) (0.12- 575.9 79.18 0.0068 0.54 (1.85) 7 1 0 727.33 100.00 Prob. priore 0.0125 35 11 2 Total Fig. 4.11 – Mapa de favorabilidade à ocorrência de minerais radioativos, obtido segundo o método Fuzzy Mínimo-Máximo. 4.3.2 Fuzzy Média O operador fuzzy média define uma soma aritmética onde os pesos de importância são distribuídos uniformemente para todas os membros fuzzy de entrada. Este operador admite uma igualdade nas relações entre as evidências. A função matemática que o define é apresentada a seguir e o programa em Legal encontra-se no Anexo I, (Programa I.18) MFmédia = MFlito log ia + MFgama + MFlineamentos + MFestrut , circular + MFcontato 5 Num contexto geral, esse modelamento apresentou resultados coerentes. Os membros fuzzy apresentaram distribuição contínua, sem valores concentrados que pudessem dificultar o fatiamento (Figura 4.12). As classes de potencialidade apresentaram distribuição coerente dos valores de grau de confiança, sendo de 7,52 o valor obtido pela classe “alto potencial”. (Tabela 4.6). Frequênica acumulada As classes “alto” e “médio” potenciais encerram 26 ocorrências minerais em 30,93 Km2, ou 4,25%, do complexo alcalino, incluindo os importantes depósitos de Morro do Ferro e Campo Agostinho (Figura 4.13). O número de ocorrências salta para 36 quando são consideradas as classes “alto”, “médio” e “baixo” potenciais juntas, o que corresponde a uma área de 98,74 Km2 (13,57% do maciço alcalino). Distribuição acumulada dos pixels sobreposta pelas classes de potencialidade 1600000 Distribuição acumulada dos pixels 1200000 800000 Nulo 400000 Baixo Médio Alto 0 0 20 40 60 80 100 Valores dos pixels Fig. 4.12 – Distribuição acumulada dos pixels do cenário de potencialidade gerado pelo modelo Fuzzy Médio. A classe “nulo potencial” obteve coincidência com 12 ocorrências minerais. Esta alta coincidência com ocorrências minerais, numa classe de potencial nulo, depõe contra o modelo, pois o esperado seria o inverso. Seu grau de confiança indica uma piora da chance do encontro de depósitos minerais de 1,54 vezes em relação ao maciço todo. TABELA 4.6 – SUMÁRIO DOS RESULTADOS DO MÉTODO FUZZY MÉDIA Fatia Área (Km2) Área (%) Prob. Posteriore Grau de confiança UZr UMo ThTr 6.39 0.88 0.0939 7.52 4 4 1 média (0.64-0.50) 24.54 3.37 0.0579 4.64 12 5 0 baixa (0.-0.38) 67.81 9.32 0.0385 3.08 8 1 1 nula (0.38-0.00) 628.59 86.42 0.0071 0.57 (1.54) 11 1 0 Prob. priore 0.0125 35 11 2 alta (0.90-0.64) Total 727.33 100.00 Fig. 4.13 – Mapa de favorabilidade à ocorrência de minerais radioativos, obtido segundo o método Fuzzy Média. 4.3.3 Fuz Fuzzy Ponderado Nesta inferência fuzzy as evidências foram combinadas através de uma soma ponderada, com os pesos de cada evidência sendo definidos empiricamente, segundo a técnica de tomada de decisão AHP (Saaty, 1992). Esta técnica permite a definição de pesos que expressam de modo hierárquico os membros fuzzy, através de comparação feita dois a dois entre as evidências. A primeira etapa para a definição dos pesos foi a elaboração de uma relação de importância relativa entre as evidências, definida par a par . Essa relação entre as evidências pretende capturar o conhecimento do especialista que deve indicar o grau de importância relativo entre evidências comparadas. O modulo de análise espacial do SPRING (Suporte à decisão AHP) permite a graduação em 9 níveis (igual, um pouco melhor, algo melhor, moderadamente melhor, melhor, bem melhor, muito melhor, criticamente melhor e absolutamente melhor) os quais foram utilizados como dados de entrada da matriz de comparação par a par. As relações consideradas encontram-se abaixo e a matriz na Tabela 4.7: Gama algo melhor que Litologia (3 : 1) Gama melhor que Estruturas circulares (5 : 1) Gama muito melhor que Lineamentos (7 : 1) Gama muito melhor que Contatos geológicos (7 : 1) Litologia algo melhor que Estruturas circulares (3 : 1) Litologia melhor que Lineamentos (5 : 1) Litologia melhor que Contato geológico (5 : 1) Estruturas circulares algo melhor que Lineamentos (3 : 1) Estruturas circulares algo melhor que Contatos geológicos (3 : 1) Lineamentos igual Contatos geológicos (1 : 1) TABELA 4.7 – MATRIZ DE COMPARAÇÃO PAR A PAR Gama-radiometria Litologia Estr. circular Lineamentos Cont. geológico Gama-radiometria 1 1/3 1/5 1/7 1/7 Litologia Estr. circular Lineamentos Cont. geológico 1 1/3 1/5 1/5 1 1/3 1/3 1 1 1 O módulo calcula os autovetores da matriz, os quais correspondem aos ponderadores das evidências e a razão de consistência, que é um parâmetro que indica a coerência na estipulação das relações. A razão de consistência obtida foi de 0.03, que indica uma boa concordância das comparações. Os pesos obtidos de cada membro fuzzy foram: gama-radiometria = 0,514; litologia = 0,258; estruturas circulares = 0,1223; lineamentos = 0,0529; contatos litológicos = 0,0529; As evidências foram então combinadas através de uma soma ponderada executada pelo Programa em LEGAL I.19 (Anexo I). A formulação foi expressa por: MF ponderado = (MF gama ∗ 0,514) + ( MFlito log ia ∗ 0,258) + ( MFestrut,circular ∗ 0,1223 ) + ( MFlineamentos ∗ 0, 0529) + (MF contato ∗ 0,0529 ) Em comparação aos demais o modelamento Fuzzy Ponderado foi o que apresentou os melhores resultados. A distribuição dos valores dos membros fuzzy foi a mais uniforme, não apresentando concentrações em pontos que pudessem dificultar o fatiamento dos valores (Figura 4.14). Os valores de grau de confiança apresentaram distribuição relativa coerente entre as classes, variando de modo crescente da classe “nulo potencial” (0.45) para a classe “alto potencial” (12,90) (Tabela 4.8). A classe “alto potencial” obteve o maior valor de grau de confiança dentre todas as classes de alto potencial dos demais modelamentos e uma coincidência com 12 ocorrências minerais, incluindo entre estas os importantes depósitos do Morro do Ferro e Campo Agostinho e a Mina Usamu Utsumi (Figura 4.15). Frequência acumulada A classe “médio potencial” apresentou grau de confiança de 5,70 e em conjunto com a classe “alto potencial” encerraram 27 ocorrências minerais, sendo 10 das 11 mineralizações de U-Mo e as duas mineralizações conhecidas de Th-Tr, numa área conjunta de 30,43 Km2 (4,18% do maciço alcalino). Distribuição acumulada dos pixels sobreposta pelas classes de potencialidade 1600000 1200000 Distribuição acumulada dos pixels 800000 Nulo 400000 Baixo Médio Alto 0 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 Valores dos pixels Fig. 4.14 – Distribuição acumulada dos pixels do cenário de potencialidade gerado pelo modelo Fuzzy Ponderado. TABELA 4.8 PONDERADO Fatia alta (0.95-0.77) média (0.77-0.65) baixa (0.65-0.37) nula (0.37-0.00) Total – SUMÁRIO DOS RESULTADOS DO MÉTODO FUZZY 22 Área (Km ) Área (%) Prob. Posteriore Grau de confiança U-Zr U-Mo Th-Tr 6.14 24.29 67.91 629.0 0.84 3.34 9.34 86.48 0.1612 0.0712 0.0423 0.0056 12.90 5.70 3.38 0.45 (2.22) 6 9 11 9 5 5 0 1 1 1 0 0 727.33 100.00 Prob. priore 0.0125 35 11 2 A classe “nulo potencial” compreendeu uma área de 629,0 Km2 (86,48% do complexo alcalino) e encerrou 10 das 48 ocorrências minerais. O valor de grau de confiança (0,45) indica que essas áreas apresentam uma diminuição de 2,22 vezes na probabilidade a priore do encontro de ocorrências minerais. Fig. 4.15 – Mapa de favorabilidade à ocorrência de minerais radioativos, obtido segundo o método Fuzzy Ponderado (AHP). 4.3.4 Fuzzy Gama Nessa inferência as evidências foram combinadas através de um operador fuzzy definido por dois termos (controlados pelo parâmetro γ (gama). A escolha do γ determina o caráter de decisão produto algébrico fuzzy, Equação 2.7 e a soma algébrica fuzzy, Equação 2.8), do especialista que pode variar de “pessimista”, com γ abaixo de 0,35 e “otimista”, com γ acima de 0,85. O valor γ adotado de 0.85 faz com que o termo “soma algébrica” seja mais importante que o “produto Pag. 32) observa-se que o valor γ encontra-se na região esquerda, o que garante algébrico”, na computação do resultado final. Pelo gráfico da Figura 2.5 (que o valor de saída será sempre maior ou igual ao maior valor de entrada das evidências. O Programa I.20 (Anexo I) realizou as operações que estão ilustradas abaixo: MFsoma a lg ébrica = 1 − ((1 − MFgama ) ∗ (1 − MFlito ) ∗ (1 − MFest.circular ) ∗ (1 − MFlineam. ) ∗ (1 − MFcont. geol. )) MFprodutoa lg ébrico = MFgama ∗ MFlito ∗ MFest.circular ∗ MFlineam. ∗ MFcont. geol. MFgama = ( MFsoma a lg ébrica ) 0 .85 ∗ ( MF produtoa lg ébrico ) (1− 0. 85) O desempenho do modelo Fuzzy Gama foi parecido ao obtido pelo Fuzzy Média, com exceção ao padrão de distribuição dos membros fuzzy. A distribuição dos membros fuzzy de potencialidade à ocorrência de minerais radioativos deste modelo apresentou grande concentração em valores baixos, onde 86,55% dos membros fuzzy incidiram abaixo de 0,04. Essa concentração dificultou o fatiamento e gerou classes de potencialidade com amplitudes muito variadas. Enquanto a classe “alto potencial” precisou de uma amplitude de 0,41 (de 0,92 até 0,51) para compor uma área de 6,48 Km2, a classe de potencial nulo precisou apenas de 0.04 de amplitude para compor uma área de 629,52 Km2. Essa distorção fica mais clara no gráfico da Figura 4.16, onde os valores de membro fuzzy são plotados com distribuição acumulada. Frequência acumulada Distribuição acumulada dos pixels sopreposta pelas classes de potencialidade 1600000 Distribuição acumulada dos pixels 1200000 N u l 800000 o Baixo Médio Alto 400000 0 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 Valores dos pixels Fig. 4.16 – Distribuição acumulada dos pixels do cenário de potencialidade gerado pelo modelo Fuzzy gama. A classe “alto potencial” obteve a menor coincidência com as ocorrências minerais conhecidas (apenas 8), dentre as classes de mesma potencialidade dos demais modelamentos (Figura 4.17). Os valores de grau de confiança das classes de potencialidade foram próximos aos obtidos pelo modelamento Fuzzy média (Tabela 4.9), onde as classes “alto”, “médio” e “baixo” potencial encerram 34 ocorrências minerais em áreas que totalizaram 97,81 Km2. Dentre os principais depósitos, a classe “alto” potencial mapeou apenas o Morro do Ferro, sendo o depósito Campo Agostinho e a Mina Usamu Utsumi mapeados pelas classes “baixo” e “nulo” potencial respectivamente. TABELA 4.9 – SUMÁRIO DOS RESULTADOS DO MÉTODO FUZZY GAMA Fatia alta (0.92-0.51) média (0.51-0.17) baixa (0.17-0.04) nula (0.04-0.0) Total 22 Área (Km ) Área (%) Prob. Posteriore Grau de confiança U-Zr U-Mo Th-Tr 6.48 22.58 68.75 629.52 0.89 3.10 9.45 86.55 0.0864 0.0540 0.0374 0.0075 6.92 4.33 2.99 0.60 (1.67) 6 5 11 13 1 4 5 1 1 0 1 0 727.33 100.00 Prob. priore 0.0125 35 11 2 A classe “nulo potencial” encerrou 15 ocorrências minerais, o maior número dentre as demais classes de mesma prioridade. O grau de confiança indicou uma diminuição de 1,67 em relação a probabilidade a priore, que considera todo o maciço. Fig. 4.17 – Mapa de favorabilidade à ocorrência de minerais radioativos, obtido segundo o método Fuzzy Gama. 4.4 MÉTODO DE BAYES Na inferência bayesiana o objetivo foi utilizar as 48 ocorrências minerais, as quais possibilitaram o cálculo de parâmetros estatísticos que serviram de ponderadores das evidências consideradas no modelamento. Para assegurar a correta execução do modelo foram necessárias diferentes etapas de edição dos PI’s, bem como o cálculo de parâmetros estatísticos que garantissem matematicamente o modelamento. No modelo bayesiano as evidências devem estar em padrão binário (favorável, nãofavorável), antes de serem calculados os ponderadores. Sendo assim, o primeiro passo foi um estudo de Contraste (Cw) das evidências com as ocorrências minerais, o qual possibilitou determinar o limiar de corte que maximizaria a associação espacial entre os PI’s resultantes da reclassificação binária e o PI com as verdades de campo (ocorrências minerais). Para os planos de informação, litologia e intensidade gama-radiometria, foi adotada a mesma reclassificação definida por Almeida Filho (1995), que considerou as unidades litológicas, rocha potássica, lujarito/chibinito, material vulcânico e corpos intrusivos de foiaíto, e as classes radiométricas com anomalia acima de 1.8 vezes o background como favoráveis. Entretanto, os estudos de Contraste da litologia e do mapa de intensidade gama-radiometria foram realizados apenas com o intuito de testar a correlação das evidências com as ocorrências minerais. O primeiro passo para o cálculo do contraste da litologia foi a tabulação cruzada entre o PI ocorrências minerais e o PI litológico. Como a tabulação cruzada gera uma matriz de confusão onde cada célula da matriz indica a interseção (sobreposição) das classes dos PI’s (ex. N{fonólito ∩ depósito} = 0,73Km2), e como estas interseções devem estar expressas por unidade de área ou número de elementos (pixel), foi necessário definir uma área para cada ocorrência mineral. Como não existia informação quanto à área de cada ocorrência mineral, foi assumida uma área circular padrão de 0,2 Km2, construída a partir do fatiamento de um mapa de distância adotado-se um raio de r = 252,31 m à partir de cada ocorrência mineral. A matriz de confusão gerada foi posteriormente editada em planilha de modo que o cálculo do contraste fosse efetuado sempre em um padrão binário, ou seja, a classe estudada era sempre comparada com as demais agrupadas (ex. fonólito versus nãofonólito) (Tabela 4.10 em amarelo). TABELA 4.10 – MATRIZES DE CONFUSÃO ENTRE AS OCORRÊNCIAS E AS UNIDADES LITOLÓGICAS AJUSTADAS PARA UM PADRÃO BINÁRIO COM A CLASSE FONÓLITO EM DESTAQUE depósitos não-depósitos total depósitos não-depósitos total depósitos não-depósitos total depósitos não-depósitos total fonólitos 0.73 86.72 87.45 r.potássica 3.65 70.34 73.99 foiaíto 1.46 212.25 213.71 lujarito/chibinito 0.21 10.14 10.35 não-fonólito 8.35 631.09 639.44 não-rocha potássica 5.43 647.47 652.9 não-foiaíto 7.62 505.56 513.18 não-lujarito/chibinito 8.87 707.67 716.54 total 9.08 717.81 726.89 total 9.08 717.81 726.89 total 9.08 717.81 726.89 total 9.08 717.81 726.89 depósitos não-depósitos total depósitos não-depósitos total depósitos não-depósitos total tinguaíto 2.84 325.97 328.81 mat.vulcânico 0.19 10.95 11.14 arenitos 0 1.44 1.44 não-tinguaíto 6.24 391.84 398.08 não-mat.vulcânico 8.89 706.86 715.75 não-arenitos 9.08 716.37 725.45 As matrizes de confusão, em padrão binário, forneceram os parâmetros para o cálculo das razões de suficiência (LS) e necessidade (LN), as quais foram utilizadas no cálculo do contraste de cada classe litológica (Tabela 4.11). As formulações a seguir ilustram o cálculo do contraste do fonólito: N ( D ∩ fonólito) 0,73 9,08 N ( D) LS = = = 0,6655 N ( D ∩ fonólito) 86,72 N (D ) 717,81 N ( D ∩ fonólito) 8,35 9,08 N ( D) LN = = = 1,0460 N ( D ∩ fonólito) 631,09 N (D ) 717,81 CWfonólito = Ln( LS ) − Ln( LN ) = −0,4522 TABELA 4.11 – VALORES DE RAZÃO DE SUFICIÊNCIA (LS), RAZÃO DE NECESSIDADE (LN) E CONTRASTE DE CADA UNIDADE LITOLÓGICA Fonólitos R.potássica Foiaítos Lujaritos/chibinitos Tinguaítos Mat.vulcânico Arenitos LS 0.6655 4.1022 0.5438 1.6372 0.6888 1.3717 0.0000 LN contraste 1.0460 -0.4522 0.6630 1.8225 1.1915 -0.7844 0.9909 0.5022 1.2589 -0.6031 0.9942 0.3218 1.0020 0.0000 . total 9.08 717.81 726.89 total 9.08 717.81 726.89 total 9.08 717.81 726.89 O mesmo procedimento foi executado para as demais unidades litológicas e para as classes do PI de Intensidade Gama-radiométrica. As matrizes de confusão binárias do mapa de anomalia gama-radiométrica encontram-se na Tabela 4.12 e os resultados do contraste encontram-se na Tabela 4.13. Os procedimentos para o cálculo do contraste das estruturas circulares, lineamentos e contatos dos corpos intrusivos de foiaíto foram idênticos. O objetivo era definir a zona (buffer) que apresentasse a melhor associação espacial com as verdades de campo. Inicialmente foram construídos três mapas de distância que tomaram como ponto de partida os arcos das estruturas circulares, lineamentos e corpos intrusivos de foiaíto. Esses PI’s foram fatiados em 28 classes (fatias) de 25m cada e então cruzados com as ocorrências minerais, para a geração das matrizes de confusão. Estas foram reagrupadas para um padrão binário, onde cada fatia foi comparada com as demais ( A = T − A) . As matrizes de confusão binárias forneceram os parâmetros para o cálculo dos contrastes, conforme exemplificado anteriormente com a unidade litológica fonólito. TABELA 4. 12 – MATRIZES DE CONFUSÃO ENTRE AS OCORRÊNCIAS E AS CLASSES DE ANOMALIA RADIOMETRIA AJUSTADAS PARA UM PADRÃO BINÁRIO background não-background depósito 1.11 7.97 não depósito 410.48 307.77 total 411.59 315.74 1.3 não (1.3-1.8) depósito 2.94 6.14 não depósito 233.62 484.63 total 236.56 490.77 1.8 não (1.8-2.5) depósito 3.13 5.95 não depósito 59.52 658.73 total 62.65 664.68 total 9.08 718.25 727.33 total 9.08 718.25 727.33 total 9.08 718.25 727.33 2.5 não (2.5-3.5) total depósito 1.12 7.96 9.08 não depósito 11.17 707.08 718.25 total 12.29 715.04 727.33 3.5 não (>3.5) total depósito 0.78 8.3 9.08 não depósito 3.46 714.79 718.25 total 4.24 723.09 727.33 TABELA 4.13 – VALORES DE RAZÃO DE SUFICIÊNCIA (LS), RAZÃO DE NECESSIDADE (LN) E CONTRASTE DE CADA CLASSE DE ANOMALIA GAMA-RADIOMETRIA background 1.3 - 1.8 1.8 - 2.5 2.5 - 3.5 > 3.5 LS 0.2139 0.9955 4.1598 7.9315 17.8323 LN contraste 2.0484 -2.2593 1.0022 -0.0067 0.7145 1.7616 0.8905 2.1868 0.9185 2.9660 Para a definição do limiar de corte, os valores de contraste foram plotados em um gráfico cumulativo. Nas Figuras 4.18, 4.19 e 4.20 encontram-se os gráficos dos contrastes acumulados para as estruturas circulares, lineamentos e contatos dos corpos intrusivos de foiaíto, respectivamente. Contraste Pela análise dos gráficos de contraste acumulado foram escolhidos os pontos de máximo valor acumulado como limiares de corte. Os valores de corte foram 625m para as estruturas circulares, 250m para os lineamentos e 500m para os contatos dos foiaítos. Os PI’s binários foram obtidos através do fatiamento dos respectivos mapas de distância nos pontos definidos pelos gráficos de contraste acumulados. Contraste entre as estruturas circulares e as ocorrências minerias 24 22 20 18 16 14 12 10 8 6 4 2 0 0 50 100 150 200 250 300 350 400 450 500 550 600 650 700 Distância (m) Fig. 4.18 – Valores de contraste acumulados das fatias ao longo das estruturas circulares, indicando o valor máximo acumulado usado como limiar de corte. Contraste Contraste entre os lineamentos e as ocorrências minerais 2.0 1.5 1.0 0.5 0.0 0 -0.5 50 100 150 200 250 300 350 400 450 500 550 600 650 700 Distância (m) -1.0 -1.5 Fig. 4.19 – Valores de contraste acumulados das fatias ao longo dos lineamentos, indicando o valor máximo acumulado usado como limiar de corte. Contraste Contraste entre os contatos dos corpos intrusivos de foiaíto e as ocorrências minerais 12.50 10.00 7.50 5.00 2.50 0.00 0 100 200 300 400 500 600 700 Distância (m) Fig. 4.20 – Valores de contraste acumulados das fatias ao longo dos contatos dos corpos intrusivos de foiaíto, indicando o valor máximo acumulado usado como limiar de corte. Para a integração final dos planos de informação binários é necessário que a independencia condiconal entre as evidências não seja violada num grau elevado. Sendo assim, testes foram realizados com as evidências, medindo-se o grau de independência entre elas. Todas as evidências binárias foram comparadas em pares, sendo utilizado como parâmetro de medida o índice Qui-quadrado, χ2, e o Coeficiente de Contingência, C. O objetivo foi testar o grau de associação entre classes de cada PI binário. Os procedimentos foram os mesmos para todas as análises dos pares de evidências, sendo as etapas envolvidas nos testes ilustradas aqui pelo teste entre o PI Intensidade Gamaradiometria e o PI Litologia. Primeiramente foi executada uma tabulação cruzada entre as duas evidências, a qual gerou uma matriz de confusão, também conhecida como tabela de contingência, de onde foram extraídos os parâmetros necessários para o cálculo do χ2. Na Tabela 4.14, os valores em preto representam as interseções entre as classes do PI gama-radiometria binário com o PI litologia binário. Os números em vermelho representam os valores esperados para as categorias de sobreposição, caso os PI’s gama-radiometria e litologia fossem independentes. Os valores foram obtidos pelo produto dos totais das margens dividido pelo total absoluto, conforme demostrado nas formulações abaixo: ( 79.18 ∗ 309,33) = 33.66 T .. 727.33 T1 .T. 2 (79.18 ∗ 418.10) = = = 45.52 T .. 727.33 T(*gama x lito log ia )1 ,1 = T(*gama x lito log ia ) 1, 2 T1 .T. 1 = T(*gama x lito log ia ) 2 ,1 = T2 .T.1 T(*gama x lito log ia ) 2 , 2 = T2 .T. 2 T .. T .. = (648.15 ∗ 309.33) = 275.56 727.33 = (648.15 ∗ 418.10) = 372.58 727.33 TABELA 4.14 – TABELA DE CONTIGÊNCIA ENTRE OS PI’S DE INTENSIDADE GAMA-RADIOMETRIA E LITOLOGIA. OS VALORES EM VERMELHO INDICA VALORES ESPERADOS DE INTERSEÇÃO (Ti *, j ) NO CASO DE INDEPENDÊNCIA CONDICIONAL ENTRE OS PI’S Litologia favorável gama favorável não-favorável totais Não-favorável Totais 52.27 (33.66) 26.91 (45.52) 79.18 256.96 (275.56) 391.19 (372.58) 648.15 309.23 418.1 727.33 Os valores da interseção entre as classes (gama x litologia), mais o resultado das operações acima foram utilizados na estatística χ2 e no cálculo do coeficiente de contingência, conforme demostrado pelas formulações a seguir: χ 2 2 gama x lito log ia 2 = ∑∑ i =1 j =1 (Ti , j − Ti *,j ) 2 Ti *, j (T1,1 − T1∗,1 ) 2 (T1, 2 − T1∗, 2 ) 2 (T2 ,1 − T2∗,1 ) 2 (T2 , 2 − T2∗, 2 ) 2 = = + + + ∗ ∗ ∗ ∗ T T T T 1,1 1, 2 2 ,1 2, 2 (52,27 − 33,66) 2 ( 26,91 − 45,52) 2 ( 256,96 − 257,56) 2 (391,19 − 372,58) 2 = + + + 33,66 45,52 257,56 372,58 C gama x lito log ia = = 20,07 χ2 20,07 = = 0,164 2 727,33 + 20,07 T⋅ ⋅ + χ Como mencionado anteriormente, as operações foram repetidas para as demais evidências, num total de 10 comparações, considerando-se 5 evidências (gamaradiometria, litologia, estruturas circulares, lineamentos e contatos geológicos). As tabelas de contingência dos cruzamentos encontram-se na Tabela II.2 (Anexo II) e os resultados de χ2 e Coeficiente de Contingência encontram-se na Tabela 4.15. TABELA 4.15 – VALORES DE χ 2 E C DAS EVIDÊNCIAS OBTIDOS POR COMPARAÇÃO PAR A PAR PI x PI Gama-radiometria x litologia Gama-radiometria x estruturas circulares Gama-radiometria x lineamentos Gama-radiometria x contatos geológicos Litologia x estruturas circulares Litologia x lineamentos Litologia x contatos geológicos Estruturas circulares x lineamentos Estruturas circulares x contato geológico Lineamentos x contatos geológicos χ22 20.075 4.880 0.607 13.109 5.202 3.248 19.283 2.575 16.134 1.776 C 0.164 0.082 0.029 0.133 0.084 0.067 0.161 0.059 0.147 0.049 Os resultados dos coeficientes de contingência demostraram que as evidências violaram o princípio da independência condicional em grau aceitável (valores próximos à 0), não sendo necessário nenhum ajuste das evidências. Para a integração final o primeiro passo foi o cálculo da chance a priore ( O(D) ) das ocorrências minerais, que foi obtida a partir probabilidade a priore ( P(D) ) conforme formulação: P( D ) = N ( D) 9.08 = = 0,01248 N (T ) 727.3 O( D) = P( D ) 0,01248 = = 0,01264 (1 − P( D)) (1 − 0,01248) A próxima etapa foi o cálculo das razões de suficiência (LS) e necessidade (LN). Novamente foi necessário fazer uma tabulação cruzada, porém desta vez, o cruzamento envolveu as 5 evidências binárias construídas com as ocorrências minerais. As matrizes de confusão (Anexo II - Tabelas II.3) forneceram os valores para o cálculo das LS e LN (Tabela 4.16), dos quais foram extraídos os logaritmos naturais, W+ e W – respectivamente. Os W + e W – foram, então, somados ao logaritmo natural da chance a priore segundo uma soma condicional controlada pela presença ou não das evidências. TABELA 4.16 – VALORES DE LS E LN E W+ E W– DAS EVIDÊNCIAS BINÁRIAS Evidências binárias Gama-radiometria Litologia Estruturas circulares LS 5.394 1.435 2.416 LN 0.494 0.681 0.646 W + = Log (LS ) 1.685 0.361 0.882 Lineamentos Contatos foiaíto 1.162 1.895 0.902 0.226 0.150 0.639 W − = Log (LN ) -0.704 -0.384 -0.437 -0.103 -1.488 Como exemplificação do processo, considere um ponto da grade numérica, que encontra-se dentro dos padrões favoráveis anomalia gama-radiométrica e litologia e fora dos padrões favoráveis estruturas circulares, lineamentos e contatos dos foiaítos. A presença ou ausência das evidências serviram de condicionantes espaciais na soma condicional dos W + e W –, efetuada pelo Programa I.21 (Anexo I). A formulação abaixo demostra a operação realizada: ( ( )) Ln O D | gama ∩ lito log ia ∩ est .circular ∩ lineamento ∩ cont . foiaíto = + + − − − = Ln(O( D) ) + (W gama + W lito log ia + W est .circular + Wlineamento + Wcont . foiaíto ) = = −4,3708 + 1,6852 + 1, 2540 + (−0,4020) + (−0,1034) + ( −0,1876) = −2,1246 A última etapa do processo foi o cálculo da probabilidade a posteriore que foi obtida a partir da chance a posteriore, conforme as formulações abaixo: O( D | B ) = e Ln (O ( D| B ) ) ( ( )) Ln O D | gama ∩ litologia ∩ est .circular ∩ lineamento ∩ cont . foiaíto = −2,1246 ( ) O(D | gama ∩ litologia ∩ est .circular ∩ lineamento ∩ cont . foiaíto) = 0,1195 O D | gama ∩ litolog ia ∩ est .circular ∩ lineamento ∩ cont . foiaíto = e −2,1246 P (D | gama ∩ lito log ia ∩ est.circular ∩ lineamento ∩ cont . foiaíto ) = ( ) O D | gama ∩ lito log ia ∩ est.circular ∩ lineamento ∩ cont . foiaíto 1 + O D | gama ∩ lito log ia ∩ est.circular ∩ lineamento ∩ cont . foiaíto ( ( ) ) P D | gama ∩ litolog ia ∩ est.circular ∩ lineamento ∩ cont . foiaíto = ( 0,1195 1 + 0,1195 ) P D | gama ∩ litolog ia ∩ est .circular ∩ lineamento ∩ cont. foiaíto = 0,1067 O cenário resultante do modelamento bayesiano apresentou alguns aspectos positivos e outros negativos quando comparados aos demais. Um dos aspectos negativos foi que os valores de probabilidade a posteriore não apresentaram uma distribuição contínua, com pontos de concentrações que dificultaram a divisão das classes em áreas semelhantes às mesmas classes dos demais cenários (Figura 4.21). O outro aspecto foi a distribuição pouco coerente dos graus de confiança. O valor obtido para a classe “alto potencial” (6,69) foi menor que o da classe “médio potencial (8,39), quando o esperado seria o contrário. A classe “alto potencial” encerrou 9 ocorrências minerais, numa área de 5,98 Km2 (0,82% do maciço alcalino) (Tabela 4.17). O depósito do Morro do Ferro foi mapeado por esta classe (Figura 4.22), que obteve um de grau de confiança de 6,64. Frequência acumulada A classe “médio potencial” obteve 18 coincidências com ocorrências minerais conhecidas. A análise em conjunto das duas classes “alto” e “médio potencial” indicou que estas encerram 27 ocorrências minerais, em área de 27,54Km2, (3,78% do complexo alcalino). Distribuição acumulada dos pixels sobreposta pelas classes de potencialidade 2000000 1600000 1200000 Distribuição acumulada dos pixels 800000 Nulo 400000 Baixo Médio Alto 0 0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 Valores dos pixels em probabilidade Fig. 4.21 – Distribuição acumulada dos pixels do cenário de potencialidade gerado pelo modelo Bayes. TABELA 4.17 – SUMÁRIO DOS RESULTADOS DO MÉTODO DE BAYES Fatia 22 Área (Km ) Área (%) Prob. Posteriore Grau de confiança U-Zr U-Mo Th-Tr alta (0.344-0.341) média(0.341-0.12) baixa (0.12-0.034) nula (0.034-0.0) 5.98 21.56 64.61 635.18 0.82 2.96 8.88 87.33 0.0836 0.1048 0.0393 0.0060 6.69 8.39 3.15 0.48 (2.08) 6 12 8 9 2 6 2 1 1 0 1 0 Total 727.33 100.00 Prob. priore 0.0125 35 11 2 A classe “nulo potencial”, com 635,18 Km2 de área (87,33% do maciço), apresentou uma probabilidade de descoberta de depósitos 2,08 vezes menor em relação a probabilidade a priore e encerrou 10 das 48 ocorrências minerais conhecidas. Fig. 4.22 – Mapa de favorabilidade à ocorrência de minerais radioativos, obtido segundo o método Bayesiano. 4.5 INFERÊNCIA POR REDES NEURAIS Para a realização da análise espacial por redes neurais foram utilizados os planos de informação, litologia fuzzy, anomalia radiométrica fuzzy, lineamentos fuzzy e estruturas circulares fuzzy, gerados para a inferência espacial fuzzy. O intuito foi definir uma rede neural artificial que processasse os dados pontuais dos planos de informação (evidências), utilizando o resultado (membros fuzzy) da inferência fuzzy ponderada como padrão de saída (padrão desejado para onde os dados de entrada fossem mapeados). A realização da inferência espacial por redes neurais demandou a execução de diferentes etapas operacionais, bem como a definição de diversos parâmetros e funções, que estabeleceram o comportamento da rede no processamento dos dados de entrada. De todas as etapas, as mais complicadas talvez tenham sido as que envolveram a definição da arquitetura da rede (números de elementos de processamento (EP), tipo de conexão e número de camadas); o modelo de ativação; o algoritmo de aprendizado e seus respectivos parâmetros. A primeira etapa para a realização da inferência espacial foi o ajuste dos planos de informação para um formato no qual o programa de simulação de rede neural entendesse. A conversão de formato foi realizada através da função de exportação para SNNS do pacote SPRING. Com os dados convertidos, o próximo passo foi a separação dos dados em dois conjuntos: treinamento e testes. O primeiro foi utilizado para o treinamento da rede, enquanto os dados de teste foram utilizados para verificar sua performance sob condições reais de utilização. A escolha dos conjuntos foi arbitrária, onde cada conjunto de dados definido por uma quadrícula foi escolhido baseado na diversidade da informação das evidências (Figura 4.23). A próxima etapa consistiu da definição da rede neural propriamente dita. Sendo assim, foram definidos: o paradigma neural, a arquitetura da rede, as funções de ativação e aprendizado e o modo de atualização das ativações. Embora existam metodologias ("dicas") na condução destas tarefas, as escolhas foram feitas de forma empírica. Vale ressaltar que a definição da configuração de qualquer rede neural é ainda considerada uma arte que requer certa experiência dos projetistas (Carvalho, 1999). Fig. 4.23 – Definição dos conjuntos de dados de treinamento e teste da rede sobre o mapa Litológico. A rede neural artificial escolhida foi a supervisionada, com fluxo da informação num sentido unidirecional, ascendente (bottom-up), denominada na literatura como feedforward. A direção da conexão mostra a direção de transferência da ativação. O EP a partir da qual a conexão se inicia é chamado de fonte, enquanto o EP, onde a conexão termina, é chamado de alvo. Cada conexão tem um peso que lhe é atribuído. O efeito da saída de uma unidade, na sua sucessora, é definido por este valor. No caso do peso ser negativo, a conexão será inibidora, resultando na diminuição da atividade da unidade alvo. No caso inverso, positivo, este tem uma excitação, resultando no aumento da atividade. A arquitetura da rede foi definida com 17 elementos de processamento divididos em 4 camadas: uma de entrada, duas intermediárias, e uma de saída (Figura 4.24). A camada de entrada contendo quatro EP’s foi responsável pelo recebimento dos sinais de entrada, que correspondem aos planos de informação (litologia fuzzy, anomalia radiométrica fuzzy, lineamentos fuzzy e estruturas circulares fuzzy). Ou seja, os EP11, EP12, EP13, EP14 podem ser entendidos como vetores, wi j , onde cada localização das grades numéricas serviu de sinal de entrada processado pela rede neural artificial. A segunda e terceira camadas contendo seis EP’s cada, corresponderam às camadas intermediárias, responsáveis por parte do processamento dos sinais de ativação; é onde, através de seus elementos e suas conexões, parte da informação é aprendida e armazenada. A última, denominada de camada de saída, com um único EP, indica o grau de favorabilidade à ocorrência de minerais radioativos. Fig. 4.24 – Arquitetura da rede neural artificial utilizada. Os EP’s foram conectados em sentido ascendente, da entrada para a saída, num total de 66 conexões. As conexões, que formam a memória distribuída do classificador, ocorreram dos EP’s de uma camada com os EP’s da camada subsequente. Ou seja, os elementos EP11, EP12, EP13, EP14 foram conectados aos elementos EP21, EP22, EP23, EP24 num total de 24 conexões, que por sua vez foram conectados aos EP31, EP32, EP33, EP34, num total de 36 conexões, e finalmente estes foram conectados ao EP41 (4 conexões). Com o paradigma e a topologia da rede neural definidos, o próximo passo foi a definição da função de ativação, a qual controlaria o comportamento dos sinais na etapa forward de processamento. A fase forward pode ser resumida da seguinte maneira: • Sinais são apresentados à entrada; • Cada sinal é multiplicado por um peso que indica a sua influência na saída do EP; • Um nível de atividade é produzindo com a soma dos sinais ponderados; • Se este nível de atividade exceder a um certo limite, a unidade produz uma determinada resposta de saída. Assim, uma nova atividade (ativação) em um EP é computada, considerando-se a antiga ativação do EP, seu limiar de corte (bias) e as saídas dos EP’s antecessores, multiplicadas pelos respectivos pesos das suas conexões com o EP corrente. A formulação pode ser expressa de modo geral como segue: a j (t + 1) = f act ( net j (t ), a j (t ),θ j ) (4.1) onde: a j (t ) - ativação do elemento j no passo t; net j (t ) - entrada da rede no elemento j no passo t; θ j - limiar de corte (bias) do elemento j. As entradas da rede net j (t ) foram computadas conforme formulação a seguir: net j (t ) = ∑ wij oi (t ) (4.2) i onde: wi j - peso da conexão do elemento i com o elemento j; oi (t ) - saída do elemento i no passo t. No presente modelamento foi utilizada a função default act_logistic do simulador SNNS, a qual calcula a entrada da rede através da soma ponderada de todas as ativações. O resultado foi posteriormente compactado com uma função logística, ou de transferência, f act ( x ) = 1 (1 + e − x ) . A função faz com que o valor de uma nova ativação em um passo (t+1) recaia dentro da amplitude [0,1]. A formulação, mais detalhada, da função de ativação logística encontra-se a seguir: a j (t + 1) = 1 w o ( t ) −θ j ) 1 + e ∑ i ij i −( (4.3) onde: a j (t ) - ativação do elemento j no passo t oi (t ) - saída do elemento i no passo t; j - índice para alguns dos elementos da rede; i - índice do elemento antecessor ao elemento j; wi j - peso da conexão do elemento i com o elemento j; θ j - limiar de corte (bias) do elemento j. Sobre cada nova atividade foi aplicado uma função de saída, que possibilitou o processamento da ativação de todos os EP’s, gerando, assim, os sinais de saída. A função de saída utilizada foi a identidade definida por: o j (t ) = a j ( t ) (4.4) onde: a j (t ) - ativação do elemento j no passo t; o j (t ) - saída do elemento j no passo t; j – índice para todos os elementos de uma rede. Para efetuar o cálculo do novo valor de ativação de um EP no passo (t +1), o simulador SNNS, operando seqüencialmente, tem que visitar todos os EP’s. Esta ordem foi definida no Módulo de Atualização do SNNS, o qual contem cinco modelos de atualização. O modelo definido foi o Topológico, no qual o processador central (Kernell) organiza as visitações aos EP’s pela sua topologia. Essa ordem corresponde à propagação natural de atividade da rede, da entrada para a saída. Com a fase forward definida, a próxima fase foi a definição do algoritmo de aprendizado, responsável pelo ajuste dos pesos das conexões, para obter o comportamento desejado do sistema. O algoritmo é responsável pela fase de propagação backward de simulação da rede neural. O procedimento de simulação total de uma rede neural artificial pode ser resumido como segue: Um padrão de entrada é apresentado para a rede. A entrada é então propagada à frente (forward) até a ativação atingir a camada de saída. Isto constitui a chamada fase de propagação forward (forward propagation phase). A saída é então comparada com o padrão de saída desejado. O erro, diferença δ j (delta) entre a saída o j e a padrão de saída desejado t j de um EP alvo de saída j é então utilizado juntamente com a saída oi do EP fonte i para computar as mudanças necessárias da conexão wij (Equação 4.5). Para computar os deltas dos EP’s internos (camadas escondidas), para os quais não estão disponíveis os padrões de saída, são utilizados os deltas das camadas posteriores, que já foram computados. Deste modo, os erros (deltas) são retropropagados (fase denominada backward propagation). A regra backpropagation de atualização do peso, também chamada de “regra delta”, é escrita como segue: ∆wij = η δ j oi (4.5) f j' ( net j )( t j − o j ) caso o EP j seja um EP de saída δj = ' f j ( net j )∑ k δ k w jk caso o EP j seja um EP escondido onde: η - fator de treinamento eta (uma constante); δ j - erro (diferença entre a saída real e a entrada de treinamento) da unidade j; t j - padrão de saída do EP j; oi - saída do EP antecessor i; i - índice de um antecessor de um EP j corrente com conexão wij de i para j; j - índice de um EP corrente; k - índice de um sucessor ao EP corrente j com conexão wjk de j para k. Na presente simulação artificial foi utilizado o algoritmo de aprendizado RPROP (R R elisient Backprop propagation), que é uma variação do algoritmo Backpropagation. O RPROP é um esquema de aprendizado supervisionado em grupo (batch), o que significa que a atualização dos pesos e as adaptações são executadas depois que o gradiente de todos os padrões for computado. A função RPROP conta com um termo de decaimento do peso, α, com o qual pode-se reduzir tanto o erro da saída como a dimensão do peso, o que resulta numa melhora da generalização (aprendizado). A função erro é expressa por: E = ∑ (t i − oi ) + 10 −α ∑ wi2j (4.6) O princípio básico da função RPROP é eliminar a influência destrutiva do tamanho da derivada parcial do peso de um determinado ciclo. Como conseqüência, apenas o sinal da derivação é considerado para indicar a “direção” da atualização do peso. O tamanho da mudança do peso é determinado exclusivamente por um peso específico, também chamado, “valor de atualização” ∆(it )j : ∆wi(tj) (t ) (t ) ∂E >0 − ∆ i j , se ∂wi j (t ) ∂ E (t ) = + ∆ i j , se >0 ∂wi j 0 , outros casos (4.7) ∂E ( t ) denota a informação dos gradientes somados considerando-se todos os ∂wi j padrões de um conjunto (batch learning). onde O segundo passo do aprendizado RPROP é determinar o novo valor de atualização ∆ i j (t ) . Isto é baseado em um processo adaptativo de sinal dependente. ∆(it )j + ( t −1) , se ç ∗ ∆ i j = ç − ∗ ∆(it −j 1) , se ∆(it −j 1 ) ( t −1) ∂E ∂E ∗ ∂wi j ∂wi j ( t −1) ∂E ∂E ∗ ∂wi j ∂wi j , outros casos (t ) >0 (t ) <0 (4.8) onde 0 < ç − < 1 < ç + A regra adaptativa funciona do seguinte modo: toda vez que a derivada parcial do peso correspondente wi j muda seu sinal, o que indica que a última atualização foi muito grande e o algoritmo pulou sobre um mínimo local, o valor de atualização ∆ i j (t ) é decrescido pelo fator η − . No caso da derivada manter seu sinal, o valor de atualização é levemente aumentado de modo à acelerar convergências em regiões aproximadamente planas. Os valores dos fatores de aumento e diminuição são: η − = 0.5 ; η + = 1.2 . Parâmetros O algoritmo RPROP assume três parâmetros: o valor de atualização inicial ∆ 0 , um limite máximo de atualização, ∆ max , e o expoente de decaimento do peso α, os quais devem ser fixados nos campos da função de aprendizado definidos no painel de controle. A função de cada parâmetro e os respectivos valores adotados estão descritos a seguir: O valor inicial, ∆ 0 , adotado foi 0.2. O segundo parâmetro, ∆ max , pretende prevenir o peso de tornar-se muito grande em um único passo, o valor adotado foi 50.0. O último parâmetro, termo de decaimento (α), visa diminuir o valor do peso, o que resultaria numa melhor generalização. Seu valor foi 4.0. Com os dados subdivididos (conjuntos de treinamento e teste), e a rede devidamente configurada (arquitetura, paradigma da rede, funções de ativação e aprendizado) deu-se início à fase de treinamento da rede neural. Esta corresponde à fase de ajuste dos pesos, treinando a rede a convergir os sinais de entrada para o padrão de saída desejado. Os dados de treinamento foram apresentados à rede utilizando-se diferentes números de passos. Ao término de cada processo de treinamento foram apresentados à rede os dados de teste para aferir seu poder de generalização. O objetivo foi determinar o ponto de erro mínimo do conjunto de teste. Neste ponto a rede generaliza melhor, evitando assim o overtraining. Esse pode diminuir a performance de generalização, apesar do erro dos dados de treinamento continuarem ficando menores. O número de passos que forneceu a melhor performance foi 800. Finalmente, com a rede treinada e testada, a última etapa foi a apresentação dos dados completos. O resultado foi salvo e convertido novamente para o formato SPRING. No ambiente SPRING foi efetuado o fatiamento dos dados em 4 classes diferentes de potencialidade à ocorrência de minerais radioativos. O cenário de favorabilidade gerado pela inferência por Redes Neurais Artificiais apresentou resultados próximos àqueles obtidos pela técnica Fuzzy Ponderado. As diferentes faixas de potencialidade apresentaram coerência na distribuição relativa dos valores dos graus de confiança, que apresentaram um padrão decrescente da classe “alto potencial” para a de potencial nulo. A distribuição dos valores numéricos foi uniforme não apresentando agrupamentos que pudessem representar problemas no fatiamento (Figura 4.25). A classe “alto potencial”, com uma área de 6,65 Km2 (menos de 1% do maciço alcalino), obteve o terceiro maior valor de grau de confiança (12,51) dentre todas as classes de alto potencial dos demais modelamentos e uma coincidência com 14 ocorrências minerais, incluindo entre elas os depósitos do Morro do Ferro e Campo Agostinho e a Mina Usamu Utsumi (Tabela 4.18).As classes “médio” e “alto” potencial encerram juntas 25 mineralizações, sendo 9 das 11 mineralizações de U-Mo e as duas de Th-Tr em áreas que totalizam 28,52 Km2, ou 3,92% do total do maciço alcalino (Figura 4.26). As classes baixo, médio e alto potencial, juntas compreenderam uma área de 96,04 Km2, o que eqüivale a 13,2% do complexo alcalino e obtiveram uma coincidência com 38 dos 48 indícios e mineralizações conhecidos. O grau de confiança da classe “nula” indica que pesquisas realizadas nessas áreas apresentariam uma possibilidade de sucesso 2,22 vezes menor do que considerando todo o complexo alcalino. A classe “nula” compreendeu uma área de 631,29 Km2 , a qual encerrou 10 dos indícios e mineralizações conhecidos. Distribuição acumulada dos pixels sobreposta pelas classes de potencialidade Frequência acumulada 1600000 1200000 Distribuição acumulada dos pixels 800000 Nulo 400000 Baixo Médio Alto 0 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 Valores dos pixels Fig. 4.25 – Distribuição acumulada dos pixels do cenário de potencialidade gerado pelo modelo Redes Neurais Artificiais. TABELA 4.18 – SUMÁRIO DOS RESULTADOS DO MÉTODO REDES NEURAIS ARTIFICIAIS Fatia Área (Km2) Área (%) Prob. Posteriore Grau de confiança UZr UMo ThTr alta (0.95-0.76) 6.65 0.91 0.1564 12.51 7 6 1 média (0.76-0.65) 21.87 3.01 0.0681 5.45 7 3 1 baixa (0.65-0.37) 67.52 9.28 0.0444 3.56 12 1 0 631.29 86.80 0.0056 0.45 (2.22) 9 1 0 727.33 100.00 Prob. priore 0.0125 35 11 2 nula (0.37-0.0) Total Fig. 4.26 – Mapa de favorabilidade à ocorrência de minerais radioativos, obtido segundo inferência por Redes Neurais Artificiais. CAPÍTULO 5 CONCLUSÕES E DISCUSSÕES Técnicas de análise e integração multi-critérios de dados espaciais aplicadas no complexo alcalino de Poços de Caldas mostraram ser ferramentas poderosas em modelamentos aplicados em pesquisa mineral, na predição das áreas favoráveis à ocorrência de depósitos minerais. Todavia, o sucesso de tal abordagem depende diretamente do grau de conhecimento disponível sobre a geologia da região de estudo, o qual permitirá a definição de parâmetros e relações necessários à definição do modelo prospectivo a ser adotado. A concepção do modelo prospectivo normalmente é a etapa mais difícil do trabalho, onde a definição das evidências e a importância relativa entre elas será de suma importância para a boa eficiência do modelo adotado. Assim, a elaboração do modelo é fortemente depende do conhecimento que o especialista tem da geologia da área de estudo, incluindo “modelos de depósitos”, além do domínio das técnicas mais adequadas para a integração dos dados. A utilização da probabilidade condicional (Grau de Confiança) na avaliação quantitativa dos cenários mostrou-se bastante interessante pois permitiu medir o poder explicativo dos cenários de favorabilidade às ocorrências minerais. A utilização desse parâmetro em conjunto com a inspeção visual proporcionou julgamentos mais “precisos”. A Tabela 5.1 apresenta um resumo sobre o desempenho dos 8 modelos de análise multicritério usados no presente estudo. Ela indica a soma das áreas (Km2 e porcentagem (%)) e ocorrências minerais radioativas incidentes, nas classes “alto” e “médio” potencial, além do grau de confiança da classe “alto” potencial e o padrão de saída dos dados. O modelamento Booleano é de fácil implementação, sendo indicado para trabalhos de inferência com dados simplificados em formato temático. Entretanto, a generalização dos dados num estágio inicial da inferência resultou em desempenho regular, sendo o cenário de potencialidade gerado o segundo pior dentre todos, em termos dos aspectos analisados. A rigidez do produto final foi outra característica não favorável, não permitindo variações na graduação dos níveis de prioridade, que em processos de tomada de decisão pode implicar em erros de julgamento. Embora seu desempenho tenha sido moderado, a classe “favorável” encerrou 24 das 48 ocorrências minerais, a mesma quantidade obtida pelas áreas das classes “”alto” e “médio” potencial do modelo Média Ponderada. TABELA 5.1 – SUMÁRIO DO DESEMPENHO DE CADA MODELO Área Métodos Classe Grau de confiança (Classe “alta”) Ocorrências Minerais (48 no total) Padrão de saída dos dados Km 22 % Favorável 32.40 4.45 5.78 24 ruim Média Ponderada Alta + Média 30.64 4.21 12.60 24 regular Fuzzy Mín-Máximo Alta + Média 37.36 5.14 5.44 28 regular Fuzzy Média Alta + Média 30.93 4.25 7.52 26 bom Fuzzy Ponderado Alta + Média 30.43 4.18 12.90 27 bom Fuzzy Gama Alta + Média 29.06 3.99 6.92 17 ruim Bayes Alta + Média 27.54 3.78 6.69 27 regular Redes Neurais Alta + Média 28,52 3.92 12.51 25 bom Booleano Os resultados do modelamento baseado em Média Ponderada possibilitaram uma maior flexibilidade na manipulação dos dados em relação ao método Booleano, o que implicou numa melhora no processo de inferência. A ponderação dos dados temáticos permitiu uma graduação da importância relativa das evidências, num acréscimo de informação e, consequentemente, numa melhora no modelamento dos dados. Todavia, o caráter discreto dos valores não foi totalmente eliminado, o que impossibilitou a melhora da mobilidade nos níveis de tomada de decisão (fatiamento). O desempenho do cenário gerado foi muito bom, o grau de confiança (12,60) foi o segundo melhor entre as classe “alto” potencial dos demais cenários. Esse cenário e o do Fuzzy Ponderado foram os únicos, onde os três principais depósitos. (Mina Usamu Utsumi; Campo Agostinho; e Morro do Ferro) foram mapeados pela classe “alto” potencial. A teoria da lógica Fuzzy foi a que permitiu o maior refinamento no modelamento dos dados, permitindo a representação da variação espacial dos atributos em superfícies contínuas. Entretanto, essas características nem sempre levaram a resultados mais adequados. As funções membros fuzzy possibilitaram a incorporação do conhecimento de forma bastante realista, resultando em cenários mais coerentes e menos sujeitos a erros. A abordagem da importação semântica (IS) permitiu a incorporação sobre a natureza imprecisa de contatos litológicos, o que representou uma melhoria na natureza da informação. Outra vantagem da modelagem fuzzy é a maior quantidade de operadores o que representa maior flexibilidade na combinação das evidências. Os modelos Fuzzy Mínimo-Máximo e Fuzzy Média geraram cenários com desempenhos razoáveis em comparações aos demais. O principal problema nos dois modelos foi os baixos valores de grau de confiança. O moderado desempenho destes modelos está associado diretamente à simplicidade dos operadores, que não permitem a graduação das evidências. O modelo Fuzzy Mínimo-Máximo apresentou problemas também no padrão de saída dos dados, com pontos de concentração que dificultaram o fatiamento. O resultado positivo foi a alta incidência de minerais na classe “alto” potencial, 18 no total. Caso considere-se as classes “alto” e “médio” potencial, o número salta para 28, também a maior incidência entre os demais cenários. Os cenários dos modelos Fuzzy Médio, Fuzzy Ponderado e Redes Neurais apresentaram os padrões mais uniformes de distribuição dos valores de saída. Isto permitiu maior flexibilidade nos limiares de corte das classes de potencialidade (tomada de decisão). O modelo Fuzzy Ponderado foi o que obteve o melhor desempenho nos critérios analisados. A classe “alto” potencial obteve o maior grau de confiança (12,90) e em conjunto com a classe “médio” potencial, encerrou 27 ocorrências minerais, a segunda maior coincidência entre os demais cenários. O responsável direto pelo seu sucesso, além da lógica Fuzzy, foi a técnica AHP que permitiu, de modo eficaz, a hierarquização das evidências. O cenário gerado pelo modelo Fuzzy Gama foi o que apresentou desempenho menos expressivo dentre todos os modelamentos. A classe “alto” e “médio” potencial encerraram o menor número de ocorrências minerais, 17 no total. E o padrão de saída dos dados foi um dos menos uniformes, apresentando alta concentração em valores baixos. Talvez o principal responsável pelo baixo desempenho, tenha sido o segundo membro do operador (produto algébrico fuzzy), visto que o produto de valores menores que “1” tende a diminuir consideravelmente os valores numéricos. Optou-se por um alto valor do expoente gama (γ =0.85), numa tentativa de minimizar a influência do produto algébrico fuzzy, todavia aparentemente, não houve efeito prático. Embora nem todos os cenários dos modelamentos Fuzzy tenham tido desempenho satisfatório, pelas características discutidas acima, na média, pode-se afirmar que o teoria da lógica Fuzzy é altamente indicada para estudos de fenômenos naturais. O método Bayesiano constituiu uma abordagem muito interessante ao processo de inferência espacial. A possibilidade do emprego de parâmetros estatísticos, na definição dos ponderadores, é altamente indicada para situações onde torna-se difícil hierarquizar as evidências. Nesses casos o modelo pode servir de guia na definição dos pesos. O estudo do Contraste, para definição do limiar de corte das evidências, também foi bastante interessante pois possibilitou correlacionar mais precisamente as evidências com as verdades de campo. Isso fica claro quando comparamos seus resultados com os do modelo Booleano. Uma área menor ( Áreabayes = 27,54 Km 2 ) encerrou 27 ocorrências contra 24 do modelo Booleano numa área maior ( Áreabooleano = 32,4 Km 2 ). O ponto de destaque desse cenário foi a classe “médio” potencial, que obteve o melhor grau de confiança (8,39) em comparação com as demais classes de mesma potencialidade. As classes “alto” e “médio potencial” encerraram 27 ocorrências minerais, a segunda melhor incidência entre os demais cenários. Apesar dessas características, o cenário gerado pelo método Bayesiano apresentou desempenho geral mediano, comparado aos demais. Isso pode estar ligado ao “corte” rígido das evidências na etapa inicial do processo de inferência. Os cortes significaram simplificação dos dados e consequentemente redução de informação. Outra característica desse modelamento é a necessidade da existência de verdades de campo (ocorrências minerais) para a realização da tabulação cruzada com as evidências, possibilitando o cálculo de parâmetros de ponderação. A aplicação das técnicas de Redes Neurais mostrou-se eficiente. O cenário gerado apresentou o segundo melhor desempenho geral, perdendo apenas para o Fuzzy Ponderado. A classe “alto” potencial encerrou o segundo maior número de ocorrências minerais (14) e obteve o terceiro maior grau de confiança (12,51). Paradoxalmente, o ponto negativo do modelo é também uma de suas maiores vantagens, a grande quantidade de parâmetros e variáveis que podem ser utilizados, os quais, se não manejados adequadamente, podem alterar consideravelmente o desempenho do modelo. Entretanto, ao mesmo tempo em que isto resulta em dificuldades, permite também simulações muito mais próximas da realidade. Como sugestão para melhoria em futuros trabalhos de inferência espacial, sugere-se o incremento de mapas de incerteza, os quais poderiam indicar áreas problemáticas nos cenários. Essas regiões poderiam ser eliminadas, ou melhor investigadas em campo para a melhoria do modelo. Adicionalmente, é recomendável o estudo mais aprofundado de técnicas de fatiamento (migração do ambiente numérico para o ambiente rígido), na tentativa de definir classes temáticas mais coerentes em relação ao agrupamento dos valores numéricos de saída. E, finalmente, um estudo mais aprofundado de outras arquiteturas e paradigmas de aprendizado para redes neurais artificiais, como por exemplo, o aprendizado não-supervisionado, que elimina a necessidade de um padrão de saída para o aprendizado da rede. REFERÊNCIAS BIBLIOGRÁFIAS Agterberg, F.P. Systematic approach to dealing with uncertainty of geoscience information in mineral exploration. In: Symposium on “Applications of Computers and Operations Research in the Mineral Industry”, 21.. Colorado, USA, 1989. Proceedings . Colorado: Society of Mining Engineers. Chapter 18. 165-178p. Almeida Filho, R. Integração, manipulação e análise espacial de dados na pesquisa mineral através de modelos empíricos de prospecção: Um exemplo no planalto de Poços de Caldas. Revista Brasileira de Geofísica, Geofísica v. 13, n.2, p.127-142, 1995. Almeida Filho, R.; Paradella, W.R. Estudo do maciço alcalino de Poços de Caldas através de imagens Landsat com ênfase em mineralizações radioativas. radioativas São José dos Campos: INPE,1977. 130p. (INPE-111-TPT/060). Altman, D. Fuzzy set theoretic approaches for handling imprecision in spatial analysis. International Journal of Geographical Information Systems . v. 8, n. 3, p.271-289, 1994. Banai, R. Fuzziness in geographical information system: contributions from analytic hierarchy process. International Journal of Geographical Information Systems, Systems v. 7, n. 4, p. 315-329, 1993. Bonham-Carter, G. F.. Mapping mineral potential with a geographic information system. system Geological Survey of Canada, Ontario, Canada. 121-130p. 1990. Bonham-Carter, G. F. Geographic information systems for geoscientists, modeling with GIS . Ontario: Pergamon, 1994. 398p.. Burrough, P. A. Principles of geographical information systems for land resources assessment. assessment Oxford: Clarendon Press, 1986. Burrough, P. A. Fuzzy mathematical methods for soil survey and land evaluation. Journal of Soil Science, Science v. 40, p. 477-492. 1989. Burrough, P. A. Development of intelligent geographical information systems. International Journal of Geographical Information Systems , v. 6, n. 1, p. 1-11, 1992. Burrough, P. A.; Heuvelink, G. B. M. The sensitivity of boolean and continuous (Fuzzy) logical modelling to uncertain data. In European Conference and Exhibition on Geographical Information Systems Munich, 3. (EGIS'92). Munich, Germany, 1992. Proceedings : Munich, Germany: EGIS'92. p. 1032-1041. Burrough, P. A.; McDonnell, R. A. Principles of geographical information systems . Oxford: Oxford University Press, 1998. 333p. Câmara, G. Modelos, linguagens e arquiteturas para banco de dados geográficos . São José dos Campos. Dissertação (Doutorado em Computação) Instituto Nacional de Pesquisas Espaciais, 1996. Câmara, G.; Davis, C.; Monteiro, A. M. V.; Paiva, J. A.; D’Alge, J. C. L. Geoprocessamento: Teoria e Aplicações. [online]. <http://www.dpi.inpe.br/gilberto/livro>. Dez. 2000. Carvalho, A. P. L. F. Redes neurais artificiais . <http://www.icmsc.sc.usp.br/~andre/neural1.html>. Abril. 1999. [online]. Cowen, D. J. GIS versus CAD DBMS: What are the differences? Photogrammetric Engineering and Remote Sensing, Sensing v. 54, p.1551-1554, 1988. Cox, E. The fuzzy systems: systems handbook a practitioner's guide to building, using, and maintaining fuzzy systems. London: Academic Press, 1994. 625p. Eastman, J. R.; Jin, W.; Kyem, P.A.K.; Toledano, J. Raster procedures for multicriteria/multi-objective decisions. Photogrammetric Engineering and Remote Sensing, Sensing v.61, n.5, May, 1995, p. 539-547. Ellert, R. Contribuição à geologia do maciço alcalino de Poços de Caldas. Boletim da Faculdade de Filosofia, Ciências e Letras da Universidade de São Paulo. Geologia. Geologia v. 18, p.5-63, 1959. Empresas Nucleares Brasileiras (Nuclebrás) Poços de Caldas: Caldas mapa geológico do planalto de Poços de Caldas. 1975a. Inédito. Empresas Nucleares Brasileiras (Nuclebrás) Poços de Caldas: Caldas ocorrências de minerais radioativos do planalto de Poços de Caldas. 1975b. Inédito. Empresas Nucleares Brasileiras (Nuclebrás) Poços de Caldas: Caldas mapa radiométrico do planalto de Poços de Caldas. 1975c. Inédito. Fang, J. H. Fuzzy logic & geology. Geotimes: Geotimes News and Trends in the Geoscience, v. 42, n. 10, p. 23-26, 1997. Fraenkel, M. O.; Santos, R. C., Lourenço, F. E. V. L.; Muniz, W. S. Jazida de urânio no planalto de Poços de Caldas, Minas Gerais. In: DNPM. DNPM Principais depósitos minerais do Brasil, Brasil 1985. vol.1, cap.5, p. 89-103. Goodchild, M; F. Modeling error in objects and fields. In Goodchild, M. F. e Gopal, S. ed. The Accuracy of Spatial Databases. Databases London: Taylor & Francis, 1989. p. 107-113. Harris, J. Data integration for gold exploration in eastern Nova Scotia using a GIS. In: Thematic Conference on Remote Sensing for Exploration Geology, 7., Calgary, Canada, 1989. Anais . Canada: 1989, p. 233-248. Hecht-Nielsen, R. Neurocomputing. Neurocomputing San Diego: HNC, Inc.; University of California. 1989. 433p. Heuvelink, G. B. M.; Burrough, P.A. Error propagation in cartographic modelling using Boolean logic and continuos classification. International Journal of Geographical Information Systems , v. 7, n. 3, p. 231-246, 1993. Lihao, S.; Xincai, W.; Shunping, Z. Application of GIS in petroleum exploration. In: Twelfth International Conference and Workshops on Applied geologic Remote Sensing, 12., Denver, Colorado, november, 1997. Anais . Colorado: 1997, p. 121-125. Nelson, M.M.; Illingworth, W.T. A practical guide to neural nets . Massachusetts: Library of Congress Cataloging in Publication Data, 1990. 344p.. Oliveira, A. G. Mineralização de urânio e molibdênio no planalto de Poços de Caldas, MG. In: Congresso Brasileiro de Geologia, 28., Porto Alegre, 1974. Anais . Porto Alegre, 1974, v.17, p.185-190. Parker, H. D. The unique qualities of a geographic information system: a commentary. Photogrammetric Engineering and Remote Sensing, Sensing v.54, p. 1547-1549, 1988. Pendock, N.; Nedeljkovic, V. Integrating geophysical data sets using probabilistics methods. In: Thematic Conference and Workshop on Applied Geologic Remote Sensing, 11., Las Vegas, 1996. Proceedings . Nevada: 1996, v.2, p.621-628. Reddy, R.K.T.; Bonham-Carter, G.F.; Galley, A.G.. Developing a geographic expert system for regional mapping of volcanogenic massive sulfide (VMS) deposit potential. potential Ontario: Geological Survey of Canada, 1992. p.112-124. Rostirolla, P. S. Alguns aspectos da avaliação de favorabilidade em geologia exploratória. Revista Brasileira de Geociências, Geociências v. 27, n. 4, p. 327-338, 1997. Rostirolla, P. S. Avaliação de favorabilidade em exploração: um enfoque metodológico. metodológico Rio Claro. 164p. Dissertação (Doutorado em Geologia Regional) - UNESP, 1996. Saaty, T. L. Exploring the interface between hierarchies, multiple objectives and fuzzy sets. Fuzzy Sets and Systems , v.1, p. 57-58, 1978. Saaty, T. L. The analytic hierarchy process. process New York: McGraw-Hill, 1980. Saaty, T. L. Multicriteria decision making – the analytical hierarchy process, Pittsburgh: RWS Publications, 1992. Silva, A. B. A GIS approach for land use assessment a brazilian case study. In: Thematic Conference on Geology Remote Sensing. 10.. San Antonio, Texas, 1994. Anais: San Antonio: 1994. v. 2, p. 296-303. Smith, T. R.; Menon, S.; Starr, J. L.; Estes, J. E. Requirements and principles for the implementation and construction of large-scale geographical information systems. International Journal of Geographical Information Systems , v. 1 p. 13-31, 1987. Tolbert, J. The uraniferous zirconium deposits of the Poços de Caldas plateau, Brazil. U.S. Geological Survey Bulletin , 1185 – C, 28p, 1966. Turner, A. K.; Sjoekri, A. An integrated exploration methodology based on GIS and statistical analyses. In: International Conference on Applied Geologic Remote Sensing, 13., Vancouver, CA, 1999. Proceedings . Canada: British Columbia, 1999. v.1, p.247-254. Ulbrich, H. H. G. J. A petrografia, a estrutura e o quimismo de nefelina sienito do maciço alcalino de Poços de Caldas, MG. MG São Paulo - SP. 446p. Dissertação (Livre Docência) – Universidade de São Paulo - USP, 1984. Wang, F.; Brent Hall, G. Fuzzy representation of geographical boundaries in GIS. International Journal of Geographical Information Systems , v. 10, n. 5, p. 573-590, 1996. Zadeh, L. A. Fuzzy sets. Information and control, control v.8, p. 338-353, 1965. Zadeh, L. A. A fuzzy-set theoretic interpretation of linguistic hedges.. Journal of Cybernetics, Cybernetics v. 2, n. 3, p. 4-34, 1972. Zell, A.; Mamier, G.; Vogt, M.; Mache, N.; Hübner, R.; Döring, S.. Stuttgart neural net simulator - user manual. manual Version 4.1. Stuttgart: IPVR: University of Stuttgart. 1991. APÊNDICE I – PROGRAMAS EM LEGAL Programa I.1 – Programa de reclassificação das unidades litológicas em classes favorável e não-favorável. {//declaração Tematico lito, favo ("Litologia"); Tabela tabfav (Reclassificacao); //tabela tabfav = Novo (CategoriaIni = "Litologia" , CategoriaFim = "Litologia", "embasamento" : "nao-favoravel", "arenitos" : "nao-favoravel", "fonolitos" : "nao-favoravel", "tinguaitos" : "nao-favoravel", "foiaitos" : "favoravel", "R_potassicas" : "favoravel", "lujaritos/chibin" : "favoravel", "mat.vulcanico" : "favoravel" ); //instanciação lito = Recupere (Nome = "Litologia"); favo = Novo (Nome = "Litologia favorável: contrast", ResX = 25, ResY = 25, Escala = 50000); //operação favo = Reclassifique (lito, tabfav); } Programa I.2 - Programa de reclassificação das unidades de intensidade radioativa em classes favorável e não-favorável. {//declaração Tematico favo , gama ("Gama"); Tabela tabfav (Reclassificacao); //tabela tabfav = Novo (CategoriaIni = "Gama" , CategoriaFim = "Gama", "background < 1.3" : "nao-favoravel", "1.3 <x< 1.8" : "nao-favoravel",, "1.8 <x< 2.5" : "favoravel", "2.5 <x< 3.5" : "favoravel", "x>3.5" : "favoravel"); //instanciação gama = Recupere (Nome = "Gama"); favo = Novo (Nome = "Gama favorável", ResX = 25, ResY = 25, Escala = 50000); //operação favo = Reclassifique (gama, tabfav); } Programa I.3 – Programa de integração das evidências através de operadores lógicos booleanos {//declaração Tematico lito ("Litologia"), cont ("Contato-geológico"), circ ("Estruturas-Circulares"), line ("Lineamentos"), gama ("Gama"), boo ("Integração - Resultados"); //Instanciação lito = Recupere (Nome = "Litologia-favorável"); cont = Recupere (Nome = "Buffer: 100m"); circ = Recupere (Nome = "Buffer: 350m"); line = Recupere (Nome = "Buffer: 250m"); gama = Recupere (Nome = "Gama-favorável"); boo = Novo (Nome = "Booleano", ResX = 25, ResY = 25, Escala = 50000); //Operação boo = (((lito.Classe == "favoravel" || cont.Classe == "favoravel") && (circ.Classe == "favoravel" || line.Classe == "favoravel") && gama.Classe == "favoravel") ? Classe ("favoravel") : Classe("nao-favoravel")); } Programa I.4 – Programa para ponderação das classes litológicas {//declaração Tematico lito ("Litologia"); Numerico pond ("Média Ponderada"); Tabela tablito (Ponderacao); //tabela tablito = Novo (CategoriaIni = "Litologia", "arenitos" , "embasamento", "fonolitos", "tinguaitos" : 0, "mat.vulcanico" : 20, "foiaitos" : 30, "R_potassicas", "lujaritos/chibin" : 60); //instanciação lito = Recupere (Nome = "Litologia"); pond = Novo (Nome = "Litologia ponderada", Escala =50000, Min = 0, Max = 100); //operação pond = Pondere (lito , tablito); } ResX = 25 , ResY = 25 , Programa I.5 – Programa para ponderação das classes de intensidade gamaradiométrica {//declaração Tematico gama ("Gama"); Numerico numg ("Média Ponderada "); Tabela tabgama (Ponderacao); //tabela tabgama = Novo (CategoriaIni = "Gama", "background" : 0.0, "1.3-1.8" : 10, "1.8-2.5" : 60, "2.5-3.5" : 70, ">3.5" : 80); gama = Recupere (Nome = "Gama"); numg = Novo (Nome = "Gama ponderado", ResX = 25 , ResY = 25 , = 50000, Min = 0, Max = 100); Escala //operação numg = Pondere (gama , tabgama); } Programa I.6 – Programa para união e ponderação dos “buffers” dos lineamentos e estruturas circulares. {//declaração Tematico line, line-circ ("Lineamentos"), Circulares"); Numerico line-circ-pond, ("Média Ponderada"); Tabela tabline-circ (Ponderacao); circ ("Estruturas- //instanciação line = Recupere (Nome = "Buffer: 250m"); circ = Recupere (Nome = "Buffer: 350m"); line-circ = Novo (Nome = "Lineam-estr.circular", ResX = 25,ResY = 25 ,Escala =50000); line-circ-pond = Novo (Nome = "Lineam-estr.circular ponderada", ResX = 25,ResY = 25 ,Escala =50000, Min = 0, Max =100); //tabelas tabline-circ = Novo (CategoriaIni = "Lineamentos ", "nao-favoravel" : 0, "favoravel" : 20); //operação line-circ = ((line.Classe == "favoravel" || circ.Classe "favoravel") ? Classe ("favoravel") : Classe ("nao-favoravel")); line-circ-pond = Pondere (line-circ , tabline); } == Programa I.7 – Programa de integração dos planos de informação ponderados através de uma soma ponderada. {//declaração Numerico lito, gama, line-circ, result ("Média Ponderada"); //instanciação lito = Recupere (Nome = "Litologia ponderada"); gama = Recupere (Nome = "Gama ponderada"); line-circ = Recupere (Nome = "Lineam-estr.circular ponderada"); result = Novo (Nome = "Integração-M.ponderada", ResX = 25 , ResY = 25 , Escala = 50000, Min = 0, Max = 100); //operação result =((gama*80) + (lito*60) + (line-circ*20))/160; } Programa I.8 – Programa de ponderação das classes de anomalia gamaradiometria para obtenção dos membros fuzzy . {//declaração Tematico gama ("Gama"); Numerico numg ("numfuzzy"); Tabela tabgama (Ponderacao); //tabela tabgama = Novo (CategoriaIni = "Gama", "background" : 0.0, "1.3-1.8" : 0.125, "1.8-2.5" : 0.750, "2.5-3.5" : 0.875, "> 3.5" : 1.000); //instanciação gama = Recupere (Nome = "Gama"); numg = Novo (Nome = "Gama-fuzzy", ResX = 25 , ResY = 25 , 50000, Min = 0, Max = 1); //operação numg = Pondere (gama , tabgama); } Escala = Programa I.9 – Programa para construção dos membros fuzzy da rocha potássica {// programa para espacialização continua e rígida do contato da R. potássica // declaração Tematico masC ("Contato-geológico"), lito ("Litologia") ; Numerico dist ("Mapa de distância") , result ("numfuzzy"); // instanciação masC = Recupere (Nome = "Máscara:corpos pequenos"); lito = Recupere (Nome = "Litologia-R.potássica"); dist = Recupere (Nome = "contato-R.potássica"); result = Novo (Nome = "R-potássica: fuzzy", ResX = 25, Escala = 50000 , Min = 0 , Max = 1); ResY = 25, // operação result = ((masC.Classe == "favoravel" && lito.Classe == "R_potassicas") ? Digital (1) : (masC.Classe == "favoravel" && lito.Classe == "naofavoravel") ? Digital (0) : (lito.Classe == "R_potassicas" && dist >= 100) ? Digital (1) : (dist <100 && lito.Classe == "R_potassicas") ? (dist*0.005)+0.5 : (dist < 100 && lito.Classe == "nao-favoravel") ? (dist* -0.005)+0.5 : Digital (0)); } Programa I.10 – Programa para construção dos membros fuzzy do Lujarito/chibinito {// programa para espacialização continua e rígido do contato lujarito/chibinito // declaração Tematico masC ("Contato-geológico"), lito ("Litologia") ; Numerico dist ("Mapa de distância") , result ("numfuzzy"); // instanciação masC = Recupere (Nome = "Máscara:corpos pequenos"); lito = Recupere (Nome = "Litologia - lujarito/chibinito"); dist = Recupere (Nome = "Cont.geológico - lujarito/chibin"); result = Novo (Nome = "Lujarito/chibinito: fuzzy1", ResX = 25 , = 25 , Escala = 50000 , Min = 0 , Max = 1); do ResY // operação result = ((masC.Classe == "favoravel" && lito.Classe == "lujaritos/chibin") ? Digital (1) : (masC.Classe == "favoravel" && lito.Classe == "naofavoravel") ? Digital (0) : (lito.Classe == "lujaritos/chibin" && dist >= 100) ? Digital (1) : (dist < 100 && lito.Classe == "lujaritos/chibin") ? (dist*0.005)+0.5 : (dist < 100 && lito.Classe == "nao-favoravel") ? (dist* -0.005)+0.5 : Digital (0)); } Programa I.11 – Programa para construção dos membros fuzzy do foiaíto {// programa para espacialização continua e rígida dos contatos do foiaíto // declaração Tematico masC ("Contato-geológico"), lito ("Litologia") ; Numerico dist ("Mapa de distância") , result ("numfuzzy"); // instanciação masC = Recupere (Nome = "Máscara:corpos pequenos"); lito = Recupere (Nome = "Litologia-Foiaíto"); dist = Recupere (Nome = "Contato - Foiaíto"); result = Novo (Nome = "Foiaíto-fuzzy", ResX = 25 Escala = 50000 , Min = 0 , Max = 1); , ResY = 25 , // operação result = ((masC.Classe == "favoravel" && lito.Classe == "foiaitos") ? Digital (1) : (masC.Classe == "favoravel" && lito.Classe == "nao-favoravel") ? Digital (0) : (lito.Classe == "foiaitos" && dist >= 100) ? Digital (1) : (dist < 100 && lito.Classe == "foiaitos") ? (dist*0.005)+0.5 : (dist < 100 && lito.Classe == "nao-favoravel") ? (dist* -0.005)+0.5 : Digital (0)); } Programa I.12 – Programa para construção dos membros fuzzy do material vulcânico {// programa para tinguaíto // declaração Tematico Numerico masC dist espacialização continua e rígido do contato do ("Contato-geológico"), lito ("Litologia") ; ("Mapa de distância") , result ("numfuzzy"); // instanciação masC = Recupere (Nome = "Máscara:corpos pequenos"); lito = Recupere (Nome = "Litologia- Mat. Vulcânico"); dist = Recupere (Nome = "Contato - Mat. vulcânico"); result = Novo (Nome = "Mat. Vulcânico: fuzzy", ResX = 25 , , Escala = 50000 , Min = 0 , Max = 1); ResY = 25 // operação result = ((masC.Classe == "favoravel" && lito.Classe == "mat.vulcanico") ? Digital (1) : (masC.Classe == "favoravel" && lito.Classe == "nao-favoravel") ? Digital (0) : (lito.Classe == "mat.vulcanico" && dist >= 100) ? Digital (1) : (dist < 100 && lito.Classe == "mat.vulcanico") ? (dist*0.005)+0.5 : (dist < 100 && lito.Classe == "nao-favoravel") ? (dist* -0.005)+0.5 : Digital (0)); } Programa I.13 – Programa para integração dos PI das unidades litológicas fuzzy através de uma soma ponderada. {// programa para integração das litologias fuzzy // declaração Numerico foia , luja , matvul, pota, result ("numfuzzy"); // instanciação foia = Recupere (Nome = "Foiaíto: fuzzy"); matvul = Recupere (Nome = "Mat. Vulcânico: fuzzy"); pota = Recupere (Nome = "R-potássica: fuzzy"); luja = Recupere (Nome = "Lujarito/chibinito: fuzzy"); result = Novo (Nome = "Litologia-fuzzy", ResX = 25 , Escala = 50000 , Min = 0 , Max =2); ResY = 25 , // Operação result = (matvul*0.3333) + (foia*0.5) + pota + luja ; Programa I.14 – Programa de mapeamento dos membros fuzzy das estruturas circulares. { //Considerando um ponto cruzamento de350m //declaração Numerico est ("Mapa de distância") , fuzzy ("Evidências Fuzzy"); //instanciação est = Recupere (Nome = "Estrutura circular"); fuzzy = Novo (Nome = "Estr.circular-fuzzy-pc-350m" , ResX = 25, ResY = 25, Escala = 50000, Min = 0, Max = 1); //operação fuzzy = ( est <= 700 ? 1 /( 1 +((1/122500)*(est^2) ) ) : Digital (0)); } Programa I.15 – Programa de mapeamento dos membros fuzzy dos lineamentos {//Considerando um buffer de interesse de 250m //declaração Numerico line ("Mapa de distância") , fuzzy ("numfuzzy"); //instanciação line = Recupere (Nome = "Lineamentos"); fuzzy = Novo (Nome = "Lineamentos-fuzzy" Escala = 50000, Min = 0, Max = 1); , ResX = 25, ResY = 25, //operação fuzzy = ( line <= 250 ? 1 /( 1 +(0.000064*(line^2) ) ) : Digital (0)); } Programa I.16 – Programa de mapeamento dos membros fuzzy dos contatos dos corpos do foiaíto. {//Considerando um buffer de interesse de 100m //declaração Numerico cont ("Mapa de distância") , fuzzy ("numfuzzy"); //instanciação cont = Recupere (Nome = "Contato - Foiaíto"); fuzzy = Novo (Nome = "Contato-foiaíto-fuzzy" , ResX = 25, ResY = 25, Escala = 50000, Min = 0, Max = 1); //operação fuzzy = ( cont <= 100 ? 1 /( 1 +(0.0004*(cont^2) ) ) : Digital (0)); } Programa I.17 – Programa de integração dos PI fuzzy (evidências) segundo operadores fuzzy mínimo-máximo. {//declaração Numerico gama, lito, circ, cont, line, maxi1, maxi2 ("numfuzzy"); Numerico minfu ("Fuzzy-resultados"); //instanciação gama = Recupere (Nome line = Recupere (Nome cont = Recupere (Nome lito = Recupere (Nome circ = Recupere (Nome minfu = Novo (Nome Escala = 50000, Min= 0, Max = 1 ); = Novo (Nome = "f11", Min= 0, Max = 1 ); maxi2 = Novo (Nome = Min= 0, Max = 1 ); = = = = = = "Gama-fuzzy"); "Lineamentos-fuzzy"); "Contato-foiaíto-fuzzy"); "Litologia-fuzzy"); " Estr-circular-500-300-fuzzy"); "Fuzzy:min-max", ResX = 250, ResX = 25, ResY = 25, "f12", ResX = 25, //operação maxi1 = max (lito, cont); maxi2 = max (circ, line); minfu = min (gama, min (maxi1 , maxi2)); } ResY = 250, Escala = 50000, ResY = 25, Escala = 50000, Programa I.18 – Programa de integração dos PI fuzzy (evidências) segundo operador fuzzy média. {//declaração Numerico gama, lito, circ, cont, line ("numfuzzy"); Numerico minfu ("Fuzzy-resultados"); //instanciação gama = Recupere (Nome line = Recupere (Nome cont = Recupere (Nome lito = Recupere (Nome circ = Recupere (Nome minfu = Novo (Nome = 50000, Min= 0, Max = 1 ); = "Gama-fuzzy"); = "Lineamentos-fuzzy"); = "Contato-foiaíto-fuzzy"); = "Litologia-fuzzy"); = " Estr-circular-500-300-fuzzy"); "Fuzzy-media", ResX = 25, ResY = 25, Escala = //operação minfu = (gama +lito +circ + cont + line)/5; } Programa I.19 – Programa de integração dos PI fuzzy (evidências) segundo operador fuzzy ponderado. {//declaração Numerico gama, lito, circ, cont, line ("numfuzzy"); Numerico minfu ("Fuzzy-resultados"); //instanciação gama = Recupere (Nome line = Recupere (Nome cont = Recupere (Nome lito = Recupere (Nome circ = Recupere (Nome minfu = Novo (Nome Escala = 50000, Min= 0, Max = 1 ); = = = = = = "Gama-fuzzy"); "Lineamentos-fuzzy"); "Contato-foiaíto-fuzzy"); "Litologia-fuzzy"); " Estr-circular-500-300-fuzzy"); "Fuzzy-ponderado", ResX = 25, ResY = 25, //operação minfu = (gama*0.514) +(lito*0.258) +(circ*0.1223) + (cont*0.0529) + (line*0.0529); } Programa I.20 – Programa de integração dos PI fuzzy (evidências) segundo operador fuzzy gama. {//declaração Numerico gama, lito, circ, cont, line, sum, pro ("numfuzzy"); Numerico result ("Fuzzy-resultados"); //instanciação gama = Recupere (Nome = "Gama-fuzzy"); line = Recupere (Nome = "Lineamentos-fuzzy"); cont = Recupere (Nome = "Contato-foiaíto-fuzzy"); lito = Recupere (Nome = "Litologia-fuzzy"); circ = Recupere (Nome = " Estr-circular-500-300-fuzzy"); sum = Novo (Nome = "sumfuzzy", ResX = 25, ResY = 25, Escala = 50000, Min = 0, Max = 1); pro = Novo (Nome = "profuzzy", ResX = 25, ResY = 25, Escala = 50000, Min = 0, Max =1 ); result = Novo (Nome = "Fuzzy-Gama (0.85)", ResX = 25, ResY = 25, Escala = 50000, Min = 0, Max = 1); //operação //soma algébrica fuzzy sum = 1-((1-lito)*(1-gama)*(1-circ)*(1-line)*(1-cont)); //produto algébrico fuzzy pro = lito*gama*circ*line*cont; //valor do gama g = 0.85; //operador gama result = (sum^g)*(pro^(1-g)); } Programa I.21 – Programa para cálculo da chance a posteriore {//declaração Tematico gama ("Gama"), line ("Lineamentos"), cont ("Contatogeológico"),circ ("Estruturas-Circulares"), lito ("Litologia"); Numerico logO , prob ("Bayes"); //atribuição dos valores dos W+ e WWpri = -4.36964279; WposGama = 1.685188964; WnegGama = -0.704475879; WposLine = 0.149913968; WnegLine = -0.103384395; WposCont = 0.798634581; WnegCont = -0.187620352; WposCirc =0.898897373; WnegCirc = -0.401959283; WposLito = 1.253996113; WnegLito = -0.454511882; //Instanciação gama = Recupere (Nome = "Gama-favorável"); line = Recupere (Nome = "Buffer-250m"); cont = Recupere (Nome = "Buffer: 500m"); circ = Recupere (Nome = "Buffer: int-500m-ext-300m"); lito = Recupere (Nome = "Lito-favorável"); logO = Novo (Nome = "LN(o(d|p))", ResX = 25, ResY =25, 50000, Min= -10, Max = 1); prob = Novo (Nome = "prob-datadriven", ResX = 25, ResY =25, 50000, Min= 0, Max = 1); Escala = Escala = //operação logO = Wpri + (( line.Classe == "favoravel") ? Digital ( WposLine) : Digital(WnegLine))+ (( gama.Classe == "favoravel") ? Digital ( WposGama) : Digital ( WnegGama)) + (( cont.Classe == "favoravel") ? Digital ( WposCont) : Digital (WnegCont))+ (( circ.Classe == "favoravel") ? Digital ( WposCirc) : Digital (WnegCirc))+ (( lito.Classe == "favoravel") ? Digital ( WposLito) : Digital (WnegLito)); prob = exp (logO) /( 1 + exp (logO)); } APÊNDICE II – TABELAS TABELA II.1 – MATRIZES DE CONFUSÃO DOS CENÁRIOS DE FAVORABILIDADE COM AS OCORRÊNCIAS MINERAIS. Booleano favorável não-favorável total não-depósito 30.1 688.2 718.3 depósito 2.3 6.8 9.1 total 32.4 694.9 727.3 não-favorável favorável total 688.2 30.1 718.3 6.8 2.3 9.1 694.9 32.4 727.3 médio não-médio total não-depósito 22.7 695.6 718.3 depósito 1.5 7.6 9.1 total 24.2 703.2 727.3 alto não-alto total não-depósito 5.5 712.8 718.3 depósito 1.0 8.1 9.1 total 6.5 720.9 727.3 médio não-médio total não-depósito 22.6 695.6 718.3 depósito 1.8 7.3 9.1 total 24.4 702.9 727.3 alto não-alto total não-depósito 12.1 706.2 718.3 depósito 0.9 8.2 9.1 não-depósito depósito total Média Ponderada nulo não-nulo total 624.9 93.3 718.3 3.5 5.6 9.1 628.4 99.0 727.3 baixo não-baixo total não-depósito 65.2 653.0 718.3 depósito 3.1 6.0 9.1 total 68.3 659.0 727.3 não-depósito depósito total Fuzzy Mínimo-Máximo não-depósito depósito total não-depósito depósito nulo não-nulo total 572.0 146.2 718.3 3.9 5.2 9.1 575.9 151.4 727.3 baixo não-baixo total 111.6 606.7 718.3 2.5 6.6 9.1 total 114.1 613.3 727.3 total 12.9 714.4 727.3 médio não-médio total não-depósito 23.1 695.1 718.3 depósito 1.4 7.7 9.1 total 24.5 702.8 727.3 alto não-alto total não-depósito 5.8 712.5 718.3 depósito 0.6 8.5 9.1 total 6.4 720.9 727.3 médio não-médio total não-depósito 22.6 695.7 718.3 depósito 1.7 7.4 9.1 total 24.3 703.1 727.3 alto não-alto total não-depósito 5.2 713.1 718.3 depósito 1.0 8.1 9.1 total 6.1 721.2 727.3 médio não-médio total não-depósito 21.4 696.9 718.3 depósito 1.2 7.9 9.1 total 22.6 704.8 727.3 alto não-alto total Fuzzy Média nulo não-nulo total 624.1 94.1 718.3 4.5 4.6 9.1 628.6 98.7 727.3 baixo não-baixo total não-depósito 65.2 653.1 718.3 depósito 2.6 6.5 9.1 total 67.8 659.5 727.3 não-depósito depósito total Fuzzy Ponderado nulo não-nulo total 625.5 92.7 718.3 3.5 5.6 9.1 629.0 98.3 727.3 baixo não-baixo total não-depósito 65.0 653.2 718.3 depósito 2.9 6.2 9.1 total 67.9 659.4 727.3 não-depósito depósito total Fuzzy Gama não-depósito depósito total nulo não-nulo total 624.8 93.5 718.3 4.7 4.4 9.1 629.5 97.8 727.3 baixo não-baixo total não-depósito 66.2 652.1 718.3 depósito 2.6 6.5 9.1 total 68.8 658.6 727.3 não-depósito 5.9 712.3 718.3 depósito 0.6 8.5 9.1 total 6.5 720.9 727.3 médio não-médio total não-depósito 19.3 698.9 718.2 depósito 2.3 6.8 9.1 total 21.6 705.8 727.3 alto não-alto total não-depósito 5.5 712.8 718.2 depósito 0.5 8.6 9.1 total 6.0 721.4 727.3 médio não-médio total não-depósito 20.4 697.9 718.2 depósito 1.5 7.6 9.1 total 21.9 705.5 727.3 alto não-alto total não-depósito 5.6 712.6 718.2 depósito 1.0 8.1 9.1 total 6.7 720.7 727.3 Bayes nulo não-nulo total 631.4 86.9 718.2 3.8 5.3 9.1 635.2 92.2 727.3 baixo não-baixo total não-depósito 62.1 656.2 718.2 depósito 2.5 6.6 9.1 total 64.6 662.7 727.3 não-depósito depósito total Rede Neural Artificial nulo não-nulo total 627.7 90.5 718.2 3.6 5.5 9.1 631.3 96.0 727.3 baixo não-baixo total não-depósito 64.5 653.7 718.2 depósito 3.0 6.1 9.1 total 67.5 659.8 727.3 não-depósito depósito total TABELA – II.2 – TABELA DE CONTIGÊNCIA DAS EVIDÊNCIAS CRUZADAS DOIS A DOIS. favorável não-favorável totais favorável 52.27 (33.66) 26.91 (45.52) 79.18 não-favorável 256.96 (275.56) 391.19 (372.58) 648.15 totais 309.23 418.1 727.33 favorável não-favorável totais 23.6 (16.13) 55.58 (63.05) 79.18 124.54 (132.01) 523.61 (516.14) 648.15 148.14 579.19 727.33 favorável não-favorável totais favorável 33.15 (29.97) 46.03 (49.20) 79.18 não-favorável 242.21 (245.38) 405.94 (402.77) 648.15 totais 275.36 451.97 727.33 favorável não-favorável totais favorável 52.33 (37.15) 26.86 (42.04) 79.19 não-favorável 288.9 (304.08) 359.26 (344.08) 648.16 totais 341.23 386.12 727.35 favorável não-favorável totais favorável 75.23 (62.98) 234.0 (246.25) 309.23 não-favorável 72.91 (85.16) 345.19 (332.94) 418.1 totais 148.14 579.19 727.33 lit gama Litologia lineamentos não-favorável totais Estrutura Circular gama favorável não-favorável totais gama lineamentos gama contato geológico a gi o ol litologia Estrutura circular favorável favorável 128.73 (117.08) 180.5 (192.15) 309.23 não-favorável 146.64 (158.29) 271.46 (259.81) 418.11 totais 275.37 451.96 727.33 favorável não-favorável totais favorável 174.29 (145.07) 134.94 (164.16) 309.23 não-favorável 166.93 (196.15) 251.17 (221.95) 418.11 totais 341.22 386.11 727.33 favorável não-favorável totais 64.54 (56.09) 83.6 (92.05) 148.14 210.83 (219.28) 368.36 (359.91) 579.19 275.37 451.96 727.33 estruturas circulares litologia contatos geológicos Lineamentos favorável não-favorável totais TABELA – II.2 – TABELA DE CONTIGÊNCIA DAS EVIDÊNCIAS estruturas circulares CRUZADAS DOIS A DOIS (continuação). Contato geológico favorável não-favorável totais 91.27 (69.50) 56.87 (78.64) 148.14 249.95 (271.95) 329.24 (307.47) 579.19 341.22 386.11 727.33 favorável não-favorável totais favorável 137.89 (129.19) 137.48 (146.18) 275.37 não-favorável 203.34 (212.04) 248.63 (239.93) 451.97 totais 341.23 386.11 727.34 favorável não-favorável totais lineamentos contatos geológicos TABELA II.3 – MATRIZES DE CONFUSÃO DAS EVIDÊNCIAS BINÁRIAS UTILIZADAS NO MODELAMENTO BAYESIANO. gama-radiometria favorável não-favorável total depósito 5.06 4.03 9.09 não depósito 74.13 644.12 718.25 total 79.19 648.15 727.34 Litologia favorável não-favorável total depósito 5.51 3.57 9.08 não depósito 303.72 414.53 718.25 total 309.23 418.1 727.33 Estrutura circular favorável não-favorável total depósito 4.39 4.69 9.08 não depósito 143.75 574.50 718.25 total 148.14 579.19 727.33 Lineamento favorável não-favorável total depósito 3.99 5.10 9.09 não depósito 271.38 446.87 718.25 total 275.37 451.97 727.34 Contato geológico favorável não-favorável total depósito 7.99 1.10 9.09 não depósito 333.24 385.01 718.25 total 341.23 386.11 727.34