Inferências Geográfica: Classificação contínua Processo Analítico Hierárquico Inferência Bayesiana Análise Multi-Critério Classificação Inferência continua (Fuzzy Logic) Bayesiana Suporte a decisão Técnica AHP (Processo Analítico Hierárquico) Classificação contínua (Fuzzy Logic) Lógica convencional Paradoxo insolúvel Eu sempre minto. Áreas com declividade de 9,9% serão classificadas diferentemente de áreas com inclinação de 10,1%, não importando as demais condições baixa baixa média Muito baixa 1 4 0 Alta abaixo média 1 5 0 Alto Acima média 1 7 0 Muito alta 1 9 0 2 1 0 Lógica Fuzzy Fuzzy Logic” é uma extensão da lógica Booleana, que tem sido estendida para manipular o conceito de “verdade parcial”, isto é, valores compreendidos entre “completamente verdadeiro” e “completamente falso”. F(z) 1 0 Verdade F Falso z Lógica Boleana V Verdade 1 0 F Falso z Lógica Fuzzy V Conjuntos Fuzzy: exemplo Exemplo: Altura de Pessoas S um conjunto fuzzy ALTO, que responderá a pergunta: " a que grau uma pessoa “z” é alta? Z : S = (z, f(z)) especialistas f(z) 0, se z 1.5 f ( z ) = ( z - 1.5) /0.6 se 1.5 < z < 2.1 1, se z 2.1 Exemplo: ”João é ALTO" = 0.38 ALTO 1 0.5 0 BAIXO 1.5 2.1 z Conjuntos Fuzzy: exemplo Outro exemplo - Declividade Declividade f(z) = 0 se z 1 f(z) = 1/[1+ (z -)2] se < z < 0.8 f(z) = 1 0.6 se z 0.4 f(z) = 0 0.2 f(z) = 1/[1+ 0.025(z -40)2] se < z < 40 0 f(z) = 1, Mínimo () se z 0.025 Máximo () se z 40 Mapeamento para fuzzy Na prática: Realizar mapeamento para espaço [0,1] determinação de valores limites (mínimo e máximo) estabelecer função de mapeamento: linear, quadrática, sigmóide Análise Multi-Critério f(z) Campo de Amostras Grade de valores [0,1] Superfície contínua Operadores Fuzzy : E c = MIN (a, b, c, ......) A, B, C, .. são os valores de pertinência nos mapas c = A E A A B 0,75 0,60 0,30 0,50 0,65 0,40 0,50 0,60 0,30 0,70 0,55 0,00 0,75 0,55 0,20 0,70 0,55 0,00 0,65 0,40 1,00 0,60 0,40 0,00 0,60 0,40 0,00 Saída controlada pelo menor valor de pertinência fuzzy ocorrendo em cada localização. Operador apropriado quando todas as evidências devem estar presentes para a hipótese ser verdadeira. Operadores Fuzzy : OU c = Max (a, b, c, ......) A, B, C, .. são os valores de pertinência nos mapas c = A OU A A B 0,75 0,60 0,30 0,50 0,65 0,40 0,75 0,65 0,40 0,70 0,55 0,00 0,75 0,55 0,20 0,75 0,55 0,20 0,65 0,40 1,00 0,60 0,40 0,00 0,65 0,40 1,00 Saída controlada pelo maior valor de pertinência fuzzy ocorrendo em cada localização. Operadores Fuzzy: Produto algébrico c = n i 1= i onde i é a função de pertinência para o i-ésimo mapa O valor dessa função combinada tende a ser muito pequeno, produto de valores entre 0 e 1. A saída é sempre menor que a menor contribuição. A B c 0,75 0,60 0,30 0,50 0,65 0,40 0,37 0,39 0,12 0,70 0,55 0,00 0,75 0,55 0,20 0,52 0,30 0,00 0,65 0,40 1,00 0,60 0,40 0,00 0,39 0,16 0,00 Operadores Fuzzy: Soma algébrica n c = 1- (1-i) 1= i Nessa operação o resultado é sempre maior, ou igual, a maior contribuição do valor de pertinência fuzzy. Duas evidências pesam mais do que cada 1 - A uma individualmente. Por exemplo, a soma algébrica fuzzy de (0,75 e 0,50) é 1 – ( 1-0,75)*(1- 0,50), que é igual a 0,875 . 2 1 - A (1 - i) c 0,25 0,40 0,70 1 - B 0,50 0,35 0,60 0,12 0,42 0,87 0,86 0,58 0,30 0,45 1,00 0,25 0,45 0,80 0,07 0,20 0,80 0,92 0,79 0,80 0,35 0,60 0,00 0,40 0,60 1,00 0,14 0,86 0,84 1,00 1= i 0,14 0,36 0,00 Classificação Inferência continua (Fuzzy Logic) Bayesiana Suporte a decisão Técnica AHP (Processo Analítico Hierárquico) Abordagem Bayesiana Principal conceito: Probabilidade a priori e a posteriori Ocorrência de chuva no dia seguinte dado que a média 80 dias de chuva por ano no local. probabilidade a priori : P(chuva) = 80/365 Refinamento: dada uma certa época do ano a posteriori : Fator época do ano (Fépoca do ano) P(chuva | época do ano) = P(chuva) * (Fépoca do ano) Outras evidências: choveu ontem, choveu hoje P(chuva|evidência) = P(chuva) * (Fépoca do ano) * Fdia anterior * Fdia hoje 1 2 1 pode ser tratado com a priori em relação a 2 Abordagem Bayesiana - Exemplos Ex. 1 – prospecção mineral Anomalia geoquímica de zinco > 250 ppm Prob. A priori > 250 ppm Fatores (a posteriori) Mapa geológico rocha A e B favorável rocha C e D desfavorável Intensidade de assinatura geofísica Tipo de vegetação Baseado em conhecimento (Especialista pondera as evidências) Baseado em dados (dados históricos suficientes) Ex. 2 – diagnostico médico Combinação de sintomas clínicos Ex. 2 – Distribuição espacial de epicentros sísmicos. Combinação Técnica Bayesiana – Exemplo de aplicação 1- Considere o problema de se encontrar depósitos de um determinado mineral em uma região que possui uma área de 10.000 km2, e que já tenham sido identificados 200 depósitos nesta região. 2- A area foi dividida em celulas de 1 km2 e ocorre somente 1 deposito em cada celula. Notação N{} = contagem de unidades N{R} = 10.000 unidades de área N{D} = 200 depósitos conhecidos com área de 1 km2. Densidade de depositos R N{D}/N{R} = 200/10000=0.02 probabilidade a priori P{D} = N{D}/N{R} = 0.02 A Técnica Bayesiana – Exemplo de aplicação Nova evidencia: Observou-se em mapa de anomalia magnética da região, que 180 dos 200 depósitos conhecidos ocorreram dentro da área de anomalia. P{D / A} > 0.02 P{D / A} < 0.02 Dado esta evidência, a probabilidade pode ser expressa por: R A R AD AD A DA RA D Anomalia (A) = 3600 Celulas Técnica Bayesiana P{D / A} é a probabilidade condicional de um deposito ‘D’ dado que a célula está dentro da área de anomalia ‘A’. P{D∩A} = N{D∩A} / N{R} é a proporção da área total onde ocorre simultaneamente R A deposito e anomalia. AD P{A} = N{A} / N{R} AD DA RA D Técnica Bayesiana R A AD AD DA P{D / A} = 180 / 3600 = 0,05 P{D} = 0.02 D RA P{D / A} = 2,5 vezes maior que P{D} Usando-se esta evidência, a exploração de novos depósitos do mesmo tipo, será muito mais eficiente e com uma área de pesquisa reduzida de 10.000 km2 para 3.600 km2 . Anomalia (A) Não Anomalia (A) Depósito (D) N{D∩A} (180) N{D∩A} (20) D (200) Não Depósito (D) N{D∩A} (3420) N{D∩A} (6380) D (9800) N{A} (3600) N{A} (6400) N{R} (10000) Técnica Bayesiana P (posteriori) = P(priori) * (Fevidência) Pode-se expressar P{ D / A} em termos da P(priori) mais fator multiplicativo. Qual a probabilidade de uma célula estar na região de anomalia ‘A’, dado que esta célula contém um deposito? P{A / D} = 180/200=0.9 Dado que: P{A∩D} = P{D∩A} Probabilidade a posteriori de um depósito, dado que a célula esta na área de anomalia P(priori) * (Fatorevidência) Técnica Bayesiana P{A / D} = 180/200=0.9 P{A} = N{A} / N{R} = 3600 / 10000 = 0,36 0,9/0,36 = 2,5 fator multiplicativo A presença de anomalia magnética, faz com que a probabilidade de deposito seja 2.5 vezes maior do que a probabilidade a priori. P{D / A} = 0,02 * 2,5 = 0,05 Técnica Bayesiana Probabilidade a posteriori da ocorrência de um deposito, dada a ausência da anomalia. P{A / D} = 20/200=0.1 P{A} = (10000-3600)/10000=0.64 = 0,1/0,64 = 0,15625 A probabilidade a posteriori da ocorrência de depósitos em posições onde não há anomalia magnética é 0.15625 vezes menor do que a probabilidade a priori. P{D / A} = 0.2*0.15625 = 0.003125 Baseado em uma única fonte de evidência, podemos reduzir a área de pesquisa de 10.000 km2 para 3600 km2, porque a chance de se encontrar depósito onde não há anomalia é significativamente menor do que onde há anomalia. Análise Multi-Critério Classificação Inferência continua (Fuzzy Logic) Bayesiana Suporte a decisão Técnica AHP (Processo Analítico Hierárquico) Suporte à Decisão - Conceitos Básicos Decidir é escolher entre alternativas. Podemos encarar o processo de manipulação de dados num sistema de informação geográfica como uma forma de produzir diferentes hipóteses sobre o tema de estudo. O conceito fundamental dos vários modelos de tomada de decisão é o de racionalidade. Onde indivíduos e organizações seguem um comportamento de escolha entre alternativas, baseado em critérios objetivos de julgamento, afim de satisfazer um nível pré-estabelecido de aspirações. Suporte à Decisão - Conceitos Básicos Um modelo racional de tomada de decisão preconiza quatro passos: Definição do problema: formular o problema como uma Busca de alternativas: estabelecer as diferentes Avaliação de alternativas: cada alternativa de resposta Seleção de alternativas: as possíveis soluções são necessidade de chegar a um novo estado. alternativas (aqui consideradas como as diferentes possíveis soluções do problema) e determinar um critério de avaliação. é avaliada. ordenadas, selecionando-se a mais desejável ou agrupando-se as melhores para uma avaliação posterior. A Técnica AHP - Processo Analítico Hierárquico Quando temos diferentes fatores que contribuem para a nossa decisão, como fazer para determinar a contribuição relativa de cada um ? Thomas Saaty (1978) propôs, uma técnica de escolha baseada na lógica da comparação pareada, denominada Técnica AHP. Livro: Multicriteria Decision Making – The Analytical Hierarchy process Pittsburg, RWS Publications , 1992 Neste procedimento, os diferentes fatores que influenciam a tomada de decisão são comparados dois-a-dois, e um critério de importância relativa é atribuído ao relacionamento entre estes fatores, conforme uma escala pré-definida. A Técnica AHP - Processo Analítico Hierárquico Escala de Valores AHP para Comparação Pareada 2,4,6,8 Valores intermediários entre julgamentos - possibilidade de compromissos adicionais. AHP- Exemplo: Decidir sobre a compra de um SIG Fatores importantes: hardware, software, serviço de vendas Matriz de Comparação Par-a-Par - Fator Hardware Passo 1Importância relativa dos fatores entre sistemas. Critérios objetivos Hardware Sistema 1 Sistema 2 Sistema 3 Sistema 1 1 4 8 Sistema 2 1/4 1 6 Sistema 3 1/8 1/6 1 A matriz apresentada reflete o fato que o Sistema 1 é moderadamente / essencialmente preferido em relação ao Sistema 2, e têm uma importância demonstrada / extrema com relação ao Sistema 3. Sistema 1 Sistema 1 = 1 Sistema 2 Sistema 1 = 1/4 Sistema 3 Sistema 1 = 1/8 Sistema 2 Sistema 3 = 6 Sistema 3 Sistema 2 = 1/6 Matriz de Comparação Par-a-Par - Fator Hardware Passo 2- Normalizar colunas Hardware Sistema 1 Sistema 2 Sistema 3 Sistema 1 1 4 8 Sistema 2 1/4 1 6 Sistema 3 1/8 1/6 1 Total 1,375 5,167 15 Hardware Sistema 1 0,727 0,774 0,533 Sistema 2 0,182 0,194 0,400 Sistema 3 0,091 0,032 0,067 Matriz de Comparação Par-a-Par - Fatores Passo 3- Média de cada linha normalizada representa as prioridades para as três opções alternativas, em relação ao fator Hardware (pesos do fator hardware de cada sistema Hardware Cálculo da média Vetor de Média Sistema 1 (0,727+ 0,774+0,533)/3 = 0,678 Sistema 2 (0,182+0,194+0,400)/3 = 0,259 Sistema 3 (0,091+0,032+ 0,067)/3 = 0,063 Matriz de avaliação dos três fatores Fator Sistema 1 Sistema 2 Sistema 3 hardware 0,678 0,259 0,063 Software 0,077 0,186 0,737 Serviço de ven. 0,653 0,251 0,096 Matriz de Comparação de Fatores Passo 4- Importância relativa entre os fatores. Fator Hardware Software Serviço Vendas hardware 1 1/8 1/5 Software 8 1 6 Serviço de ven. 5 1/6 1 Total 14 1,292 7,20 Fator Matriz normalizada hardware 0,072 0,097 0,028 Software 0,571 0,774 0,833 Serviço vendas. 0,357 0,129 0,139 Matriz de Comparação de Fatores Passo 5- Pesos dos fatores. Fator Cálculo da pesos Vetor de Média hardware (0,072 + 0,097 + 0,028)/3 = 0,066 Software (0,57 + 0,774 + 0,833)/3 = 0,726 Serviço vendas. (0,357 + 0,129 + 0,139)/3 = 0,208 Fator Sistema 1 Matriz normalizada (0,066*0,678 + 0,726*0,077 + 0,208*0,653)= 0,236 Sistema 2 (0,066*0,259 + 0,726*0,186 + 0,208*0,251)= 0,204 Sistema 3 (0,066*0,063 + 0,726*0,737 + 0,208*0,096)= 0,559 O sistema de maior peso, considerando os fatores utilizados, é o sistema 3. Então o mais adequado para aquisição Consistência da seleção realizada Para aceitar o resultado deste processo, é necessário conhecer se há consistência na comparação pareada realizada. Neste caso o parâmetro para avaliar isto é denominado Razão de consistência (RC) A razão de consistência (RC) que é a tolerância permitida, é estimada pela expressão: RC = IC/IR Onde IC é o índice de consistência e IR é o índice tabelado. IC IC = ( -n) / (n-1) onde n é o numero de fatores = valor médio do vetor de consistência Consistência da seleção realizada Estimando IC Passo 1: Considere que os critérios atribuídos ao fator Hardware (tabela abaixo) foi justo Hardware Sistema 1 Sistema 2 Sistema 3 Sistema 1 1 4 8 Sistema 2 1/4 1 6 Sistema 3 1/8 1/6 1 Hardware Vetor de Média Sistema 1 0,678 Sistema 2 0,259 Sistema 3 0,063 = valor médio do vetor de consistência Passo 2: Calcula-se o vetor soma ponderada 1,000 4,000 8,000 0,250 1,000 6,000 0,125 0,167 1,000 * 0,678 0,259 0,063 = 1,000*0,678 + 4,000*0,259 + 8,000*0,063 = 2,218 0,250*0,678 + 1,000*0,259 + 6,000*0,063 = 0,807 0,125*0,678 + 0,167*0,259 + 1,000*0,063 = 0,191 Passo 3 : Calcula-se o vetor de consistência Vetor de consistência = 2,218/0,678 0,807/0,259 0,191/0,063 3,271 = 3,116 3,032 Passo 4 : Calcula-se o valor médio do vetor de consistência = (3,0271 + 3,116 + 3,032)/3 = 3,140 Razão de consistência A razão de consistência (RC) que é a tolerância permitida, é estimada pela expressão: RC = IC/IR Onde IC é o índice de consistência e IR é o índice aleatório conforme tabela abaixo. IC = ( -n) / (n-1) onde n é o numero de fatores IC = (3,140 –3) / (3-1) = 0,070 n IR 2 0,00 3 0,58 4 0,90 5 1,12 6 1,24 7 1,32 8 1,41 RC = IC/IR = 0,070/0,58 = 0,12 Segundo o método desenvolvido por TS, o valor de RC deve ser menor que 0,10 para que a decisão seja consistente Processo AHP Passo 1: Passo 2: Comparar os critérios dois-a-dois Verificar a consistência dos dados Compara a matriz de pesos com uma matriz aleatória Consistente se a probabilidade da matriz ser aleatória é menor que 10% Passo 3: Produzir os pesos (soma = 1.0) Fazer uma inferência por média ponderada A Técnica AHP - Processo Analítico Hierárquico Interface