Marcus Sampaio DSC/UFCG Marcus Sampaio DSC/UFCG Classificação Não Supervisionada • As instâncias não são previamente classificadas • Um algoritmo de classificação não supervisionada define dinamicamente o atributo de classificação e as classes – Algoritmos de lógica muito complexa Lógica de Clustering Marcus Sampaio DSC/UFCG • O objetivo é mostrar as instâncias caem dentro de um grupo (cluster) – Um grupo podia ser clientes que compram muito equipamentos eletrônicos • Os algoritmos de clustering diferem – Na forma como os grupos são visualizados – Na precisão com que os grupos são definidos Marcus Sampaio DSC/UFCG Visualização de Grupos e d c j a h k b f i g Visualização de Grupos (2) d e a j c f k h g i b Note que uma instância pode pertencer a mais de um grupo Marcus Sampaio DSC/UFCG Semântica de Grupos Marcus Sampaio DSC/UFCG • O estágio de agrupamento (clustering) é muitas vezes seguido de outro estágio – Dado um grupo, uma árvore de decisão ou um conjunto de regras de classificação são inferidas para o grupo (definição do grupo) Algoritmo CobWeb • • • • Marcus Sampaio DSC/UFCG Técnica incremental de agrupamento Atributos nominais Agrupamentos hierárquicos de instâncias Category Utility – Medida de qualidade de um grupo Marcus Sampaio DSC/UFCG Algoritmo CobWeb (2) Estado Temp Umid Vento Jogo ensol quente alta falso não (a) ensol quente alta verdade não (b) nublado quente alta falso sim (c) chuvoso amena alta falso sim (d) chuvoso fria normal falso sim (e) chuvoso fria normal verdade não (f) nublado fria normal verdade sim (g) ensol amena alta falso não (h) ensol fria normal falso sim (i) Marcus Sampaio DSC/UFCG Algoritmo CobWeb (3) chuvoso amena normal falso sim (j) ensol amena normal verdade sim (k) nublado amena alta verdade sim (l) nublado quente normal falso sim (m) chuvoso amena alta verdade não (n) Marcus Sampaio DSC/UFCG Algoritmo CobWeb (4) a:não a:não b:não c:sim (1) d:sim (2) a:não b:não c:sim d:sim e:sim f:não (3) e:sim Marcus Sampaio DSC/UFCG Algoritmo CobWeb (5) a:não b:não c:sim d:sim e:sim f:não (4) g:sim Algoritmo CobWeb (6) b:não a:não d:sim h:não c:sim e:sim (5) Marcus Sampaio DSC/UFCG f:não g:sim Marcus Sampaio DSC/UFCG Algoritmo CobWeb (7) 1 2 3 5 4 e:sim a:não d:sim f:não 6 h:não i:sim g:sim j:sim 7 c:sim l:sim m:sim b:não k:sim (6) n:não Marcus Sampaio DSC/UFCG Algoritmo CobWeb (8) Estado Temp Umid Vento Jogo ensol quente alta falso não (a, 1-24) ensol quente alta verdade não (b), 1-25-7 nublado quente alta falso sim (c), 1-25 chuvoso amena alta falso sim (d, 1-24) chuvoso fria normal falso sim (e), 1-36 chuvoso fria normal verdade não (f), 1-3 nublado fria normal verdade sim (g), 1-3 ensol amena alta falso não (h, 1-24) ensol fria normal falso sim (i), 1-3-6 Marcus Sampaio DSC/UFCG Algoritmo CobWeb (9) chuvoso amena normal falso sim (j), 1-3 ensol amena normal verdade sim (k), 1-25-7 nublado amena alta verdade sim (l), 1-2-5 nublado quente normal falso sim (m), 1-3 chuvoso amena alta verdade não (n), 1-3 Algoritmo CobWeb (10) Marcus Sampaio DSC/UFCG • Aplicando um algoritmo de classificação, pode-se inferir a semântica dos grupos – – – – – 1-2-4 1-2-5-7 1-2-5 1-3-6 1-3 Algoritmo CobWeb (11) Marcus Sampaio DSC/UFCG • Para ver como a qualidade — category utility — de um grupo é calculada, consulte o livrotexto – Págs. 217-218 Algoritmo CobWeb (12) Marcus Sampaio DSC/UFCG • Como fazer predição com um modelo induzido por um algoritmo clustering? – Dada uma instância de execução, o algoritmo classifica a instância como pertencendo a um ou mais grupos