Fusão e Tratamento de Ambiguidades em
Conhecimento Descoberto e Adquirido
Paulo Oliveira
FEUP, 17 de Dezembro de 2002
Nota Introdutória
FEUP, 17 de Dezembro de 2002
2
Organização
Enquadramento
Objectivos
Fusão de conhecimento
Arquitectura proposta
Estudo de caso
Conclusões
Trabalho futuro
FEUP, 17 de Dezembro de 2002
3
Enquadramento
Sistemas Periciais (SP)
Características
Detêm e usam conhecimento de peritos
Solucionam problemas de forma idêntica à efectuada pelos
peritos
Vasta divulgação, popularidade e sucesso comercial
Aplicados com sucesso em diversos domínios (produção,
medicina e engenharia)
Limitações
Conhecimento que se encontra na base de conhecimento
Obrigam à realização de operações de manutenção
FEUP, 17 de Dezembro de 2002
4
Enquadramento (II)
Descoberta de Conhecimento em Bases de Dados
(DCBD)
Objectivo
Utilização crescente
Extrair o conhecimento que se encontra implícito nos dados
Disseminação a diversos domínios (seguros, medicina,
telecomunicações, etc.)
Fonte de novo conhecimento
Integrado na Base de Conhecimento (BC) de um SP com o intuito
de superar as limitações mencionadas anteriormente
FEUP, 17 de Dezembro de 2002
5
Objectivos
Conceber uma arquitectura que permita efectuar a fusão do
conhecimento originário de DCBD com o conhecimento que
se encontre na BC de um Sistema Baseado em Regras
(SBR)
Requisito: obter uma nova BC consistente
Implementar um sistema de fusão de conhecimento
Aplicar o sistema desenvolvido a um caso, com o intuito de
demonstrar a sua validade
FEUP, 17 de Dezembro de 2002
6
Fusão de Conhecimento
Objectivo
“Formar uma única perspectiva ou ponto de vista, no fundo,
uma síntese ou um consenso.” [Cholvy e Hunter, 1997]
Caracterização do Problema
Importante
Reúne o conhecimento disperso
Permite a dedução de conhecimento adicional (implícito)
Não trivial
Existência de perspectivas conflituosas (inconsistências)
FEUP, 17 de Dezembro de 2002
7
Fusão de Bases de Conhecimento
Credibilidade
diferente às BC
Forçam a consistência
da BC resultante
Igual credibilidade
às BC
Aproximações
Revisão de
conhecimento
Actualização de
conhecimento
Arbitragem de
BC
Combinação de
BC
Lógicas multi-valor
Suportam a presença
de inconsistências na
BC resultante
Argumentação
Amalgamar BC
FEUP, 17 de Dezembro de 2002
8
Arquitectura do FUNDARE
BC SBR
BC SDCBD
Converter
BC
Dicionário
Editar
BC
Utilizador
(Perito / Eng.º
Conhecimento)
Ferramenta de
Verificação
(VERITAS)
Reunir
BC
Criar BC
Consistente
Conhecimento
eliminado
FEUP, 17 de Dezembro de 2002
9
Converter BC
Garantir a independência
sintáctica da arquitectura
Colocar as regras (SBR e
SDCBD) nas suas
respectivas formas
canónicas
Converter a BC resultante da
fusão na sintaxe utilizada na
BC do SBR
Homogeneizar a
heterogeneidade semântica
FEUP, 17 de Dezembro de 2002
BC SBR
BC SDCBD
Regras SBR (sintaxe x)
Regras (sintaxe x)
Regras SDCBD (sintaxe y)
Converter
BC
Significado
termo
Regras SBR
(forma canónica)
Dicionário
Regras
consistentes
Regras SDCBD
(forma canónica)
Editar
BC
Criar BC
Consistente
10
Editar BC
Permitir realizar operações
de edição sobre as BC
Consultas
Alterações
Eliminações
Utilizador
Converter
BC
Alterações
regras
Regras
Regras SBR
(forma canónica)
Editar
BC
Regras SDCBD
(forma canónica)
Regras SDCBD
alteradas
Regras SBR
alteradas
Reunir
BC
FEUP, 17 de Dezembro de 2002
11
Reunir BC
Agregar todo o conhecimento
existente numa única BC
Colocar o conhecimento no
formato de representação
requerido pela ferramenta de
verificação (VERITAS)
Editar
BC
Regras SBR
alteradas
Regras SDCBD
alteradas
Reunir
BC
Regras
reunidas
Criar BC
Consistente
FEUP, 17 de Dezembro de 2002
Regras
reunidas
VERITAS
12
Ferramenta de Verificação (VERITAS)
Objectivo
Modo de funcionamento
Detectar todas as anomalias que
possam existir na BC reunida,
recorrendo a técnicas de
verificação baseadas em métodos
formais (módulo externo)
Desenvolve todas as cadeias de
inferência (expansões) plausíveis
Anomalias tratadas
Circularidades indirectas
Ambivalências
Inconsistências
FEUP, 17 de Dezembro de 2002
Reunir
BC
Regras
reunidas
VERITAS
Anomalias
detectadas
Expansões
geradas
Criar BC
Consistente
13
Criar BC Consistente
Identificar todas as
soluções que permitem a
obtenção de Subconjuntos
Máximos Consistentes
(SMC) de regras
Solução
eliminação
Utilizador
Soluções
possíveis
eliminação
Factos
possíveis
PreferênciasRestrições
Classificação
anomalias-erros
Auxiliar o utilizador a
seleccionar um SMC
FEUP, 17 de Dezembro de 2002
Anomalias
detectadas
Criar BC
Consistente
Regras
reunidas
Reunir
BC
VERITAS
Expansões
geradas
Regras
Eliminadas
Regras
Consistentes
Converter
BC
R.Eliminadas
14
Criação da BC Consistente (II)
Identificação Expansões Finais
Classificação Anomalias-Erros
Separação Expansões Geradas
Definição Restrições
Geração Soluções Possíveis (Tuplos)
Definição Factos Possíveis
Aplicação Método Ordenação Tuplos
Selecção SMC Regras
FEUP, 17 de Dezembro de 2002
15
Identificação das Expansões Finais
Identificação das expansões
que não são susceptíveis de
qualquer desenvolvimento
adicional
Identificação Expansões Finais
Classificação Anomalias-Erros
Separação Expansões Geradas
Definição Restrições
expFBas( 1, `H1`, [`F1`], [`D-r1-L1`] ).
Geração Soluções Possíveis (Tuplos)
expFBas( 2, `H2`, [`F1`], [`D-r1-L1`,`D-r2-L1`] ).
Definição Factos Possíveis
expFBas( 3, `C1`, [`F1`], [`D-r1-L1`,`D-r2-L1`,`D-r3-L1`] ).
Método Ordenação Tuplos ).
expFBas( 4, `C2`, Aplicação
[`F1`], [`D-r1-L1`,`D-r2-L1`,`P-r8-L1`]
Selecção SMC Regras
FEUP, 17 de Dezembro de 2002
16
Classificação Anomalias - Erros
Anomalia = sintoma de um
possível erro
Identificação Expansões Finais
Classificação Anomalias-Erros
Classificação como erro
depende do utilizador
Separação Expansões Geradas
Definição Restrições
Anomalias
Erros
Na criação da BC
consistente, apenas se
consideram os erros
Geração Soluções Possíveis (Tuplos)
Definição Factos Possíveis
Aplicação Método Ordenação Tuplos
Selecção SMC Regras
FEUP, 17 de Dezembro de 2002
17
Separação das Expansões Geradas
Separar as expansões finais
geradas em:
Expansões afectadas por
erros
Expansões não afectadas por
erros
Identificação Expansões Finais
Classificação
ExpansõesAnomalias-Erros
finais
geradas
Expansões Separação
afectadas Expansões
Expansões
não
Geradas
por erros
afectadas por erros
Definição Restrições
Geração Soluções Possíveis (Tuplos)
Definição Factos Possíveis
Aplicação Método Ordenação Tuplos
Selecção SMC Regras
FEUP, 17 de Dezembro de 2002
18
Geração das Soluções Possíveis (Tuplos)
Determinar todas as combinações
possíveis de eliminação de regras
entre as expansões com erros
Identificação Expansões Finais
Expansões Afectadas por Erros
Classificação Anomalias-Erros
P-r1-L2; P-r4-L1; D-r5-L1
D-r1-L1; P-r8-L1
Separação Expansões Geradas
As restantes regras formam um
SMC
Subconjunto – Não inclui as
regras que constam do tuplo
Máximo – Basta a inclusão de
uma das regras do tuplo para que
a BC volte a ter erros
Consistente – Não é possível
detectar os erros anteriormente
identificados
FEUP, 17 de Dezembro de 2002
Tuplos
Definição Restrições
{P-r1-L2; D-r1-L1}
{P-r1-L2; P-r8-L1}
Geração Soluções Possíveis (Tuplos)
{P-r4-L1; D-r1-L1}
{P-r4-L1;
P-r8-L1}
Definição
Factos
Possíveis
{D-r5-L1; D-r1-L1}
Aplicação {D-r5-L1;
Método Ordenação
P-r8-L1} Tuplos
Selecção SMC Regras
19
Definição de Restrições
Objectivo
Tipos
Condicionar o processo de
geração dos tuplos
Regra não eliminável
Regra de eliminação obrigatória
Inexistência de factores de
certeza
Classificação Anomalias-Erros
Separação Expansões Geradas
Forma de definição
Identificação Expansões Finais
regra a regra
Existência de factores de
certeza
regra a regra
via filtro
FEUP, 17 de Dezembro de 2002
Definição Restrições
Geração Soluções Possíveis (Tuplos)
Definição Factos Possíveis
Aplicação Método Ordenação Tuplos
Selecção SMC Regras
20
Definição de Factos Possíveis
Informação sobre os factos
susceptíveis de serem
fornecidos
Irrelevante na verificação
formal de conhecimento
Informação importante sobre
as expansões não afectadas
por erros
FEUP, 17 de Dezembro de 2002
Identificação Expansões Finais
Classificação Anomalias-Erros
Exemplo:
r1: a Separação
b
Expansões Geradas
r2: b c
r3: c d
Definição Restrições
Expansão gerada pelo VERITAS: r1; r2; r3
Mas,Geração
se b Soluções
for um facto
possível
de ser
Possíveis
(Tuplos)
fornecido, também se pode estabelecer a
seguinte sub-expansão da anterior: r2; r3.
Definição Factos Possíveis
Isto significa que a expansão gerada, no fundo,
representa duas expansões susceptíveis de se
Aplicação Método
Ordenação
Tuplos
estabelecerem
a partir da
BC.
Selecção SMC Regras
21
Métodos de Ordenação dos Tuplos
Hierarquizar os diferentes
tuplos em função da perda de
conhecimento que implicam
Identificação Expansões Finais
Classificação Anomalias-Erros
Separação Expansões Geradas
Auxiliar o utilizador a
seleccionar o tuplo a adoptar
como solução
Definição Restrições
Métodos Ordenação
Geração
Soluções Possíveis (Tuplos)
dos Tuplos
Definição Factos Possíveis
Expansões sem
Erros Afectadas
Alternativas Obtenção
Aplicação Método
Ordenação
Tuplos
Mesmos
Consequentes
Selecção SMC Regras
Inexistência FC
nas Regras
FEUP, 17 de Dezembro de 2002
Existência FC
nas Regras
Inexistência FC
nas Regras
Existência FC
nas Regras
22
Expansões sem Erros Afectadas
(inexistência de FC nas regras)
1.
Para cada tuplo, determinar o
número de expansões sem
erros afectadas
Tuplo: {P-r1-L2; P-r8-L1}
Métodos Ordenação
Tuplos por erros
Expansões não dos
afectadas
P-r1-L1; P-r4-L1; P-r5-L1; P-r7-L1; D-r3-L1
P-r1-L1; P-r4-L1; P-r5-L1; P-r7-L1; P-r8-L1
2.
3.
Ordenar os tuplos por ordem
crescente
Reordenar os tuplos (em
situação de igualdade) por
ordem crescente do n.º de
regras que os compõem
FEUP, 17 de Dezembro de 2002
P-r1-L2;
P-r4-L1;
P-r7-L1; P-r8-L1
Expansões
sem P-r5-L1; Alternativas
Obtenção
Erros Afectadas
D-r1-L1;
D-r2-L1; D-r3-L1 Mesmos Consequentes
D-r1-L2; D-r2-L1; D-r3-L1
D-r1-L2; D-r2-L1; P-r8-L1
P-r2-L1;
P-r7-L2;
Inexist.
FC P-r3-L1;
Exist. P-r6-L1;
FC
Inexist.
FCD-r3-L1
Exist. FC
Regras
Regras
Regras
Regras
P-r2-L1; P-r3-L1; P-r6-L1; P-r7-L2; P-r8-L1
P-r6-L2; P-r7-L2; D-r3-L1
P-r6-L2; P-r7-L2; P-r8-L1
N.º de Expansões Afectadas: 5
23
Expansões sem Erros Afectadas
(existência de FC nas regras)
1.
Para cada tuplo, determinar:
O número de expansões sem
erros afectadas
A certeza média com que se
obtêm conclusões
2.
Utilização do mecanismo de
propagação dos FC
Possibilidade de suavizar a
média à custa do desvio
padrão
Ordenar os tuplos por ordem
crescente das expansões sem
erros afectadas
Métodos Ordenação
dos Tuplos
Expansões sem
Erros Afectadas
Inexist. FC
Regras
Exist. FC
Regras
Alternativas Obtenção
Mesmos Consequentes
Inexist. FC
Regras
Exist. FC
Regras
Peso de importância relativa
de cada critério
Normalização dos valores
Utilização de uma métrica
FEUP, 17 de Dezembro de 2002
24
Alternativas de Obtenção dos Mesmos
Consequentes (inexist. FC nas regras)
1.
2.
3.
Para cada tuplo, determinar
o número de alternativas
que permitem obter os
mesmos consequentes
Ordenar os tuplos por
ordem crescente do número
de regras que não possuem
alternativa
Reordenar os tuplos (em
situação de igualdade), em
função da média do número
de alternativas
4.
Possibilidade de suavizar a
média à custa do desvio
padrão
Reordenar os tuplos (em
situação de igualdade) por
ordem crescente do n.º de
regras que os compõem
FEUP, 17 de Dezembro de 2002
P-r1-L1
ac
P-r7-L1
ce
bc
efp
P-r8-L1
d Métodos
f
Ordenação
jl
dos Tuplos
pr
lmo
km
op
no
Expansões sem
Erros Afectadas
gi
Alternativas Obtenção
pq
Mesmos Consequentes
ip
D-r3-L1
hi
Inexist. FC D-r1-L2
Exist. FC
Inexist. FC
Regras
Regras
Regras
1. Nº de Alternativas dos tuplos:
{P-r7-L1; P-r8-L1} (4, 0)
{P-r8-L1; D-r3-L1} (0, 0)
{P-r1-L1; D-r1-L2} (1, 1)
Exist. FC
Regras
2. Ordenação dos tuplos:
{P-r1-L1; D-r1-L2} (1, 1)
{P-r7-L1; P-r8-L1} (4, 0)
{P-r8-L1; D-r3-L1} (0, 0)
25
Alternativas de Obtenção dos Mesmos
Consequentes (existência FC nas regras)
1.
Para cada tuplo, determinar
O número de alternativas que
permitem obter os mesmos
consequentes
A certeza média com que se obtêm os
mesmos consequentes pelas
alternativas existentes
2.
3.
Utilização do mecanismo de
propagação dos FC
Ordenar os tuplos por ordem
crescente do número de regras que
não possuem alternativa
Reordenar os tuplos (em situação de
igualdade) em função da média do
número de alternativas e da certeza
média com que se obtêm as
conclusões
Métodos Ordenação
dos Tuplos
Expansões sem
Erros Afectadas
Inexist. FC
Regras
Exist. FC
Regras
Alternativas Obtenção
Mesmos Consequentes
Inexist. FC
Regras
Exist. FC
Regras
Peso de importância relativa atribuído
a cada critério
Possibilidade de suavizar a média à
custa do desvio padrão
Normalização dos valores
Utilização de uma métrica
FEUP, 17 de Dezembro de 2002
26
Selecção do SMC de Regras
A selecção do tuplo compete
ao utilizador
Classificação Anomalias-Erros
A eliminação das regras (do
tuplo) resultam num SMC de
regras (BC final consistente)
Identificação Expansões Finais
As regras eliminadas são
Separação Expansões Geradas
Definição Restrições
Geração Soluções Possíveis (Tuplos)
colocadas num repositório de
conhecimento eliminado
A BC final reúne condições
para se tornar na nova BC do
Definição Factos Possíveis
Aplicação Método Ordenação Tuplos
Selecção SMC Regras
SBR
FEUP, 17 de Dezembro de 2002
27
Estudo de Caso
Domínio: mediação de seguros
Área: contratos / apólices
Bases de conhecimento
Adquirido
Descoberto
Recolhida a partir de um perito da área
Composta por 21 regras
Utilização do SDCBD Clementine e do algoritmo de indução de regras
C5.0
Composta por 14 regras
Objectivo
Obter um BC consistente resultante da fusão do conhecimento
descoberto com o conhecimento adquirido
FEUP, 17 de Dezembro de 2002
28
Estudo de Caso (II)
Erros detectados
Método aplicado
Expansões sem erros afectadas (n.º e certeza média)
Diferentes cenários
Ambivalência ao longo de múltiplas cadeias de inferência
Inconsistência ao longo de múltiplas cadeias de inferência
Atribuídos pesos de importância relativa diferentes
Introduzidas restrições à geração de tuplos
Conclusões obtidas
Tuplos seriados em função da perda de conhecimento que implicam
A ordenação auxiliou na selecção do tuplo a adoptar
A eliminação das regras do tuplo resultou numa BC consistente
A nova BC permite a obtenção de novas conclusões quando
comparada com a BC adquirido inicial
FEUP, 17 de Dezembro de 2002
29
Conclusões
Análise, concepção e desenvolvimento de uma arquitectura
para a fusão de conhecimento
Baseada em aspectos sintácticos
Preocupação com outro tipo de erros, para além das inconsistências
Implementação do sistema de fusão de conhecimento
Aplicação a um caso na área da mediação de seguros,
confirmou a validade da arquitectura
FEUP, 17 de Dezembro de 2002
30
Trabalho Futuro
Incorporar conhecimento semântico (meta-conhecimento)
nos métodos de ordenação dos tuplos
Manipular erros do tipo redundância
Considerar, de alguma forma, no processo de fusão, o
conhecimento anteriormente eliminado
Aplicar o FUNDARE a novos casos de fusão de
conhecimento
Construir uma operatória que efectue uma análise
comparativa aos resultados obtidos em cada um dos
métodos
FEUP, 17 de Dezembro de 2002
31
Fusão e Tratamento de Ambiguidades em
Conhecimento Descoberto e Adquirido
Paulo Oliveira
FEUP, 17 de Dezembro de 2002