Inferências Geográfica:
Classificação contínua
Processo Analítico Hierárquico
Inferência Bayesiana
Análise Multi-Critério
Classificação
Inferência
continua (Fuzzy Logic)
Bayesiana
Suporte
a decisão
Técnica AHP (Processo Analítico
Hierárquico)
Classificação contínua (Fuzzy Logic)
Lógica convencional
Paradoxo insolúvel
Eu sempre minto.
Áreas com declividade de 9,9% serão classificadas
diferentemente de áreas com inclinação de 10,1%,
não importando as demais condições
baixa
baixa
média
Muito
baixa
1
4
0
Alta
abaixo
média
1
5
0
Alto
Acima
média
1
7
0
Muito
alta
1
9
0
2
1
0
Lógica Fuzzy
Fuzzy Logic” é uma extensão da lógica Booleana, que
tem sido estendida para manipular o conceito de
“verdade parcial”, isto é, valores compreendidos
entre “completamente verdadeiro” e “completamente
falso”.
F(z)
1
0
Verdade
F
Falso
z
Lógica Boleana
V
Verdade
1
0
F
Falso
z
Lógica Fuzzy
V
Conjuntos Fuzzy: exemplo
Exemplo: Altura de Pessoas
S um conjunto fuzzy ALTO, que responderá a pergunta:
" a que grau uma pessoa “z” é alta?
Z : S = (z, f(z)) especialistas
f(z)
0,
se z 1.5
f ( z ) = ( z - 1.5) /0.6 se 1.5 < z < 2.1
1,
se z 2.1
Exemplo: ”João é ALTO" = 0.38
ALTO
1
0.5
0
BAIXO
1.5
2.1
z
Conjuntos Fuzzy: exemplo
Outro exemplo - Declividade
Declividade
f(z) = 0
se z
1
f(z) = 1/[1+ (z -)2] se < z <
0.8
f(z) = 1
0.6
se z
0.4
f(z) = 0
0.2
f(z) = 1/[1+ 0.025(z -40)2] se < z < 40
0
f(z) = 1,
Mínimo ()
se z 0.025
Máximo ()
se z 40
Mapeamento para fuzzy
Na prática:
Realizar mapeamento para espaço [0,1]
determinação de valores limites (mínimo e máximo)
estabelecer função de mapeamento: linear, quadrática, sigmóide
Análise Multi-Critério
f(z)
Campo de
Amostras
Grade de
valores
[0,1]
Superfície
contínua
Operadores Fuzzy : E
c = MIN (a, b, c, ......)
A, B, C, .. são os valores de pertinência nos mapas
c = A E A
A
B
0,75 0,60 0,30
0,50 0,65 0,40
0,50 0,60 0,30
0,70 0,55 0,00
0,75 0,55 0,20
0,70 0,55 0,00
0,65 0,40 1,00
0,60 0,40 0,00
0,60 0,40 0,00
Saída controlada pelo menor valor de pertinência fuzzy
ocorrendo em cada localização.
Operador apropriado quando todas as evidências devem estar
presentes para a hipótese ser verdadeira.
Operadores Fuzzy : OU
c = Max (a, b, c, ......)
A, B, C, .. são os valores de pertinência nos mapas
c = A OU A
A
B
0,75 0,60 0,30
0,50 0,65 0,40
0,75 0,65 0,40
0,70 0,55 0,00
0,75 0,55 0,20
0,75 0,55 0,20
0,65 0,40 1,00
0,60 0,40 0,00
0,65 0,40 1,00
Saída controlada pelo maior valor de pertinência fuzzy
ocorrendo em cada localização.
Operadores Fuzzy: Produto algébrico
c =
n
i
1= i
onde i é a função de pertinência para o i-ésimo mapa
O valor dessa função combinada
tende a ser muito pequeno, produto de
valores entre 0 e 1. A saída é sempre menor que a menor contribuição.
A
B
c
0,75 0,60 0,30
0,50 0,65 0,40
0,37 0,39 0,12
0,70 0,55 0,00
0,75 0,55 0,20
0,52 0,30 0,00
0,65 0,40 1,00
0,60 0,40 0,00
0,39 0,16
0,00
Operadores Fuzzy: Soma algébrica
n
c = 1- (1-i)
1= i
Nessa operação o resultado é sempre maior, ou igual, a maior contribuição
do valor de pertinência fuzzy. Duas evidências pesam mais do que cada
1 - A
uma individualmente. Por exemplo, a soma algébrica fuzzy de (0,75 e 0,50)
é 1 – ( 1-0,75)*(1- 0,50), que é igual a 0,875 .
2
1 - A
(1 - i)
c
0,25 0,40 0,70
1 - B
0,50 0,35 0,60
0,12
0,42
0,87 0,86 0,58
0,30 0,45 1,00
0,25 0,45 0,80
0,07 0,20 0,80
0,92 0,79 0,80
0,35 0,60 0,00
0,40 0,60 1,00
0,14
0,86 0,84 1,00
1= i
0,14
0,36 0,00
Classificação
Inferência
continua (Fuzzy Logic)
Bayesiana
Suporte
a decisão
Técnica AHP (Processo Analítico
Hierárquico)
Abordagem Bayesiana
Principal conceito: Probabilidade a priori e a posteriori
Ocorrência de chuva no dia seguinte dado que a média 80 dias de chuva
por ano no local.
probabilidade a priori : P(chuva) = 80/365
Refinamento: dada uma certa época do ano
a posteriori : Fator época do ano (Fépoca do ano)
P(chuva | época do ano) = P(chuva) * (Fépoca do ano)
Outras evidências: choveu ontem, choveu hoje
P(chuva|evidência) = P(chuva) * (Fépoca do ano) * Fdia anterior * Fdia hoje
1
2
1 pode ser tratado com a priori em relação a 2
Abordagem Bayesiana - Exemplos
Ex. 1 – prospecção mineral
Anomalia geoquímica de zinco > 250 ppm
Prob. A priori > 250 ppm
Fatores (a posteriori)
Mapa geológico
rocha A e B favorável
rocha C e D desfavorável
Intensidade de assinatura geofísica
Tipo de vegetação
Baseado em conhecimento (Especialista pondera as evidências)
Baseado em dados
(dados históricos suficientes)
Ex. 2 – diagnostico médico
Combinação de sintomas clínicos
Ex. 2 – Distribuição espacial de epicentros sísmicos.
Combinação
Técnica Bayesiana – Exemplo de aplicação
1- Considere o problema de se encontrar depósitos de um determinado
mineral em uma região que possui uma área de 10.000 km2, e que já
tenham sido identificados 200 depósitos nesta região.
2- A area foi dividida em celulas de 1 km2 e ocorre somente 1 deposito
em cada celula.
Notação N{} = contagem de unidades
N{R} = 10.000 unidades de área
N{D} = 200 depósitos conhecidos
com área de 1 km2.
Densidade de depositos
R
N{D}/N{R} = 200/10000=0.02
probabilidade a priori
P{D} = N{D}/N{R} = 0.02
A
Técnica Bayesiana – Exemplo de aplicação
Nova evidencia:
Observou-se em mapa de anomalia magnética da região, que 180
dos 200 depósitos conhecidos ocorreram dentro da área de anomalia.
P{D / A} > 0.02
P{D / A} < 0.02
Dado esta evidência, a probabilidade
pode ser expressa por:
R
A
R
AD
AD
A
DA
RA
D
Anomalia (A) = 3600 Celulas
Técnica Bayesiana
P{D / A}
é a probabilidade condicional de um deposito ‘D’ dado que a
célula está dentro da área de anomalia ‘A’.
P{D∩A} = N{D∩A} / N{R}
é a proporção da área total
onde ocorre simultaneamente
R
A
deposito e anomalia.
AD
P{A} = N{A} / N{R}
AD
DA
RA
D
Técnica Bayesiana
R
A
AD
AD
DA
P{D / A} = 180 / 3600 = 0,05
P{D} = 0.02
D
RA
P{D / A} = 2,5 vezes maior que P{D}
Usando-se esta evidência, a exploração de novos depósitos do mesmo
tipo, será muito mais eficiente e com uma área de pesquisa reduzida de
10.000 km2 para 3.600 km2 .
Anomalia (A)
Não Anomalia (A)
Depósito (D)
N{D∩A} (180)
N{D∩A} (20)
D (200)
Não Depósito (D)
N{D∩A} (3420)
N{D∩A} (6380)
D (9800)
N{A} (3600)
N{A} (6400)
N{R} (10000)
Técnica Bayesiana
P (posteriori) = P(priori) * (Fevidência)
Pode-se expressar P{ D / A} em termos da P(priori) mais fator multiplicativo.
Qual a probabilidade de uma célula estar na região de anomalia ‘A’,
dado que esta célula contém um deposito?
P{A / D} = 180/200=0.9
Dado que: P{A∩D} = P{D∩A}
Probabilidade a posteriori de
um depósito, dado que a célula
esta na área de anomalia
P(priori) * (Fatorevidência)
Técnica Bayesiana
P{A / D} = 180/200=0.9
P{A} = N{A} / N{R} = 3600 / 10000 = 0,36
0,9/0,36 = 2,5 fator multiplicativo
A presença de anomalia magnética, faz com que a probabilidade
de deposito seja 2.5 vezes maior do que a probabilidade a priori.
P{D / A} = 0,02 * 2,5 = 0,05
Técnica Bayesiana
Probabilidade a posteriori da ocorrência de um deposito, dada
a ausência da anomalia.
P{A / D} = 20/200=0.1
P{A} = (10000-3600)/10000=0.64
= 0,1/0,64 = 0,15625
A probabilidade a posteriori da
ocorrência de depósitos em
posições onde não há anomalia
magnética é 0.15625 vezes
menor do que a probabilidade a
priori.
P{D / A} = 0.2*0.15625 = 0.003125
Baseado em uma única fonte de evidência, podemos reduzir a área de
pesquisa de 10.000 km2 para 3600 km2, porque a chance de se
encontrar depósito onde não há anomalia é significativamente menor do
que onde há anomalia.
Análise Multi-Critério
Classificação
Inferência
continua (Fuzzy Logic)
Bayesiana
Suporte
a decisão
Técnica AHP (Processo Analítico
Hierárquico)
Suporte à Decisão - Conceitos Básicos
Decidir é escolher entre alternativas.
Podemos encarar o processo de manipulação de dados
num sistema de informação geográfica como uma forma
de produzir diferentes hipóteses sobre o tema de
estudo.
O conceito fundamental dos vários modelos de tomada
de decisão é o de racionalidade.
Onde indivíduos e organizações seguem um
comportamento de escolha entre alternativas, baseado
em critérios objetivos de julgamento, afim de
satisfazer um nível pré-estabelecido de aspirações.
Suporte à Decisão - Conceitos Básicos
Um modelo racional de tomada de decisão preconiza quatro
passos:
Definição do problema: formular o problema como uma
Busca de alternativas: estabelecer as diferentes
Avaliação de alternativas: cada alternativa de resposta
Seleção de alternativas: as possíveis soluções são
necessidade de chegar a um novo estado.
alternativas (aqui consideradas como as diferentes
possíveis soluções do problema) e determinar um
critério de avaliação.
é avaliada.
ordenadas, selecionando-se a mais desejável ou
agrupando-se as melhores para uma avaliação posterior.
A Técnica AHP - Processo Analítico Hierárquico
Quando temos diferentes fatores que contribuem para a nossa
decisão, como fazer para determinar a contribuição relativa de
cada um ?
Thomas Saaty (1978) propôs, uma técnica de escolha baseada na
lógica da comparação pareada, denominada Técnica AHP.
Livro: Multicriteria Decision Making – The Analytical Hierarchy
process Pittsburg, RWS Publications , 1992
Neste procedimento, os diferentes fatores que influenciam a
tomada de decisão são comparados dois-a-dois, e um critério de
importância relativa é atribuído ao relacionamento entre estes
fatores, conforme uma escala pré-definida.
A Técnica AHP - Processo Analítico Hierárquico
Escala de Valores AHP para Comparação Pareada
2,4,6,8 Valores intermediários entre julgamentos - possibilidade
de compromissos adicionais.
AHP- Exemplo: Decidir sobre a compra de um SIG
Fatores importantes:
hardware, software, serviço de vendas
Matriz de Comparação Par-a-Par - Fator Hardware
Passo 1Importância relativa dos fatores entre sistemas.
Critérios objetivos
Hardware
Sistema 1
Sistema 2
Sistema 3
Sistema 1
1
4
8
Sistema 2
1/4
1
6
Sistema 3
1/8
1/6
1
A matriz apresentada reflete o fato que o Sistema 1 é
moderadamente / essencialmente preferido em relação ao
Sistema 2, e têm uma importância demonstrada / extrema
com relação ao Sistema 3.
Sistema 1 Sistema 1 = 1
Sistema 2 Sistema 1 = 1/4
Sistema 3 Sistema 1 = 1/8
Sistema 2 Sistema 3 = 6
Sistema 3 Sistema 2 = 1/6
Matriz de Comparação Par-a-Par - Fator Hardware
Passo 2-
Normalizar colunas
Hardware
Sistema 1
Sistema 2
Sistema 3
Sistema 1
1
4
8
Sistema 2
1/4
1
6
Sistema 3
1/8
1/6
1
Total
1,375
5,167
15
Hardware
Sistema 1
0,727
0,774
0,533
Sistema 2
0,182
0,194
0,400
Sistema 3
0,091
0,032
0,067
Matriz de Comparação Par-a-Par - Fatores
Passo 3- Média de cada linha normalizada
representa as prioridades para as três opções alternativas, em
relação ao fator Hardware (pesos do fator hardware de cada sistema
Hardware
Cálculo da média
Vetor de Média
Sistema 1
(0,727+ 0,774+0,533)/3 =
0,678
Sistema 2
(0,182+0,194+0,400)/3 =
0,259
Sistema 3
(0,091+0,032+ 0,067)/3 =
0,063
Matriz de avaliação dos três fatores
Fator
Sistema 1
Sistema 2
Sistema 3
hardware
0,678
0,259
0,063
Software
0,077
0,186
0,737
Serviço de ven.
0,653
0,251
0,096
Matriz de Comparação de Fatores
Passo 4-
Importância relativa entre os fatores.
Fator
Hardware
Software
Serviço Vendas
hardware
1
1/8
1/5
Software
8
1
6
Serviço de ven.
5
1/6
1
Total
14
1,292
7,20
Fator
Matriz normalizada
hardware
0,072
0,097
0,028
Software
0,571
0,774
0,833
Serviço vendas.
0,357
0,129
0,139
Matriz de Comparação de Fatores
Passo 5-
Pesos dos fatores.
Fator
Cálculo da pesos
Vetor de Média
hardware
(0,072 + 0,097 + 0,028)/3 =
0,066
Software
(0,57 + 0,774 + 0,833)/3 =
0,726
Serviço vendas.
(0,357 + 0,129 + 0,139)/3 =
0,208
Fator
Sistema 1
Matriz normalizada
(0,066*0,678 + 0,726*0,077 + 0,208*0,653)=
0,236
Sistema 2
(0,066*0,259 + 0,726*0,186 + 0,208*0,251)=
0,204
Sistema 3
(0,066*0,063 + 0,726*0,737 + 0,208*0,096)=
0,559
O sistema de maior peso, considerando os fatores utilizados, é o
sistema 3. Então o mais adequado para aquisição
Consistência da seleção realizada
Para aceitar o resultado deste processo, é necessário conhecer
se há consistência na comparação pareada realizada. Neste caso o
parâmetro para avaliar isto é denominado Razão de consistência
(RC)
A razão de consistência (RC) que é a tolerância permitida, é
estimada pela expressão: RC = IC/IR
Onde IC é o índice de consistência e IR é o índice tabelado.
IC
IC = ( -n) / (n-1) onde n é o numero de fatores
= valor médio do vetor de consistência
Consistência da seleção realizada
Estimando IC
Passo 1: Considere que os critérios atribuídos ao fator
Hardware (tabela abaixo) foi justo
Hardware
Sistema 1
Sistema 2
Sistema 3
Sistema 1
1
4
8
Sistema 2
1/4
1
6
Sistema 3
1/8
1/6
1
Hardware
Vetor de Média
Sistema 1
0,678
Sistema 2
0,259
Sistema 3
0,063
= valor médio do vetor de consistência
Passo 2: Calcula-se o vetor soma ponderada
1,000 4,000 8,000
0,250 1,000 6,000
0,125 0,167 1,000
*
0,678
0,259
0,063
=
1,000*0,678 + 4,000*0,259 + 8,000*0,063 =
2,218
0,250*0,678 + 1,000*0,259 + 6,000*0,063 =
0,807
0,125*0,678 + 0,167*0,259 + 1,000*0,063 =
0,191
Passo 3 : Calcula-se o vetor de consistência
Vetor de consistência =
2,218/0,678
0,807/0,259
0,191/0,063
3,271
= 3,116
3,032
Passo 4 : Calcula-se o valor médio do vetor de consistência
=
(3,0271 + 3,116 + 3,032)/3 = 3,140
Razão de consistência
A razão de consistência (RC) que é a tolerância permitida, é
estimada pela expressão: RC = IC/IR
Onde IC é o índice de consistência e IR é o índice aleatório
conforme tabela abaixo.
IC = ( -n) / (n-1) onde n é o numero de fatores
IC = (3,140 –3) / (3-1) = 0,070
n
IR
2
0,00
3
0,58
4
0,90
5
1,12
6
1,24
7
1,32
8
1,41
RC = IC/IR = 0,070/0,58 = 0,12
Segundo o método desenvolvido por TS, o valor
de RC deve ser menor que 0,10 para que a
decisão seja consistente
Processo AHP
Passo 1:
Passo 2:
Comparar os critérios dois-a-dois
Verificar a consistência dos dados
Compara a matriz de pesos com uma matriz aleatória
Consistente se a probabilidade da matriz ser aleatória é menor
que 10%
Passo 3:
Produzir os pesos (soma = 1.0)
Fazer uma inferência por média ponderada
A Técnica AHP - Processo Analítico
Hierárquico
Interface