Marcus Sampaio
DSC/UFCG
Marcus Sampaio
DSC/UFCG
Classificação Não Supervisionada
• As instâncias não são previamente classificadas
• Um algoritmo de classificação não supervisionada
define dinamicamente o atributo de classificação e
as classes
– Algoritmos de lógica muito complexa
Lógica de Clustering
Marcus Sampaio
DSC/UFCG
• O objetivo é mostrar as instâncias caem
dentro de um grupo (cluster)
– Um grupo podia ser clientes que compram muito
equipamentos eletrônicos
• Os algoritmos de clustering diferem
– Na forma como os grupos são visualizados
– Na precisão com que os grupos são definidos
Marcus Sampaio
DSC/UFCG
Visualização de Grupos
e
d
c
j
a
h
k
b
f
i
g
Visualização de Grupos (2)
d
e
a
j
c
f
k
h
g
i
b
Note que uma instância pode pertencer a mais de um grupo
Marcus Sampaio
DSC/UFCG
Semântica de Grupos
Marcus Sampaio
DSC/UFCG
• O estágio de agrupamento (clustering) é
muitas vezes seguido de outro estágio
– Dado um grupo, uma árvore de decisão ou um
conjunto de regras de classificação são inferidas
para o grupo (definição do grupo)
Algoritmo CobWeb
•
•
•
•
Marcus Sampaio
DSC/UFCG
Técnica incremental de agrupamento
Atributos nominais
Agrupamentos hierárquicos de instâncias
Category Utility
– Medida de qualidade de um grupo
Marcus Sampaio
DSC/UFCG
Algoritmo CobWeb (2)
Estado
Temp
Umid
Vento
Jogo
ensol
quente
alta
falso
não (a)
ensol
quente
alta
verdade
não (b)
nublado
quente
alta
falso
sim (c)
chuvoso
amena
alta
falso
sim (d)
chuvoso
fria
normal
falso
sim (e)
chuvoso
fria
normal
verdade
não (f)
nublado
fria
normal
verdade
sim (g)
ensol
amena
alta
falso
não (h)
ensol
fria
normal
falso
sim (i)
Marcus Sampaio
DSC/UFCG
Algoritmo CobWeb (3)
chuvoso
amena
normal
falso
sim (j)
ensol
amena
normal
verdade
sim (k)
nublado
amena
alta
verdade
sim (l)
nublado
quente
normal
falso
sim (m)
chuvoso
amena
alta
verdade
não (n)
Marcus Sampaio
DSC/UFCG
Algoritmo CobWeb (4)
a:não
a:não
b:não
c:sim
(1)
d:sim
(2)
a:não
b:não
c:sim
d:sim
e:sim
f:não
(3)
e:sim
Marcus Sampaio
DSC/UFCG
Algoritmo CobWeb (5)
a:não
b:não
c:sim
d:sim
e:sim
f:não
(4)
g:sim
Algoritmo CobWeb (6)
b:não
a:não
d:sim
h:não
c:sim
e:sim
(5)
Marcus Sampaio
DSC/UFCG
f:não
g:sim
Marcus Sampaio
DSC/UFCG
Algoritmo CobWeb (7)
1
2
3
5
4
e:sim
a:não
d:sim
f:não
6
h:não
i:sim
g:sim
j:sim
7
c:sim
l:sim
m:sim
b:não
k:sim
(6)
n:não
Marcus Sampaio
DSC/UFCG
Algoritmo CobWeb (8)
Estado
Temp
Umid
Vento
Jogo
ensol
quente
alta
falso
não (a, 1-24)
ensol
quente
alta
verdade
não (b), 1-25-7
nublado
quente
alta
falso
sim (c), 1-25
chuvoso
amena
alta
falso
sim (d, 1-24)
chuvoso
fria
normal
falso
sim (e), 1-36
chuvoso
fria
normal
verdade
não (f), 1-3
nublado
fria
normal
verdade
sim (g), 1-3
ensol
amena
alta
falso
não (h, 1-24)
ensol
fria
normal
falso
sim (i), 1-3-6
Marcus Sampaio
DSC/UFCG
Algoritmo CobWeb (9)
chuvoso
amena
normal
falso
sim (j), 1-3
ensol
amena
normal
verdade
sim (k), 1-25-7
nublado
amena
alta
verdade
sim (l), 1-2-5
nublado
quente
normal
falso
sim (m), 1-3
chuvoso
amena
alta
verdade
não (n), 1-3
Algoritmo CobWeb (10)
Marcus Sampaio
DSC/UFCG
• Aplicando um algoritmo de classificação,
pode-se inferir a semântica dos grupos
–
–
–
–
–
1-2-4
1-2-5-7
1-2-5
1-3-6
1-3
Algoritmo CobWeb (11)
Marcus Sampaio
DSC/UFCG
• Para ver como a qualidade — category utility
— de um grupo é calculada, consulte o livrotexto
– Págs. 217-218
Algoritmo CobWeb (12)
Marcus Sampaio
DSC/UFCG
• Como fazer predição com um modelo
induzido por um algoritmo clustering?
– Dada uma instância de execução, o algoritmo
classifica a instância como pertencendo a um ou
mais grupos
Download

Algoritmo CobWeb (3)