Marcus Sampaio DSC/UFCG CART • • • • Marcus Sampaio DSC/UFCG URL: www.salford-systems.com Função: Classificação Técnica: Árvore de Decisão Descrição Pré-processamento Preenche valores faltando Diferentes técnicas de fragmentação Ler dados de mais de 80 formatos diferentes Excel, LOtus, Informix, Oracle, ... Clementine Marcus Sampaio DSC/UFCG • URL: www.spss.com/clementine • Funções: Regras de associação, classificação, “clustering”, descoberta de seqüências, previsão • Técnicas: Apriori, C5.0, regressão linear, e outras • Descrição Escala Arquitetura cliente/servidor Acesso a BD Geração automática de consultas SQL Data Mining Suite Marcus Sampaio DSC/UFCG • URL: www.datamining.com/dmsuite.htm • Funções: Regras de associação, “clustering”, classificação, série temporal • Técnicas: Regras de Associação, Regras de Classificação, predição, ... • Descrição Modelos resultantes são armazenados e consultados com a linguagem Pattern Query Language Intelligent Miner Marcus Sampaio DSC/UFCG • www.software.ibm.com/data/iminer • Funções: Regras de associação, classificação, “clustering”, séries temporais, padrões de seqüências • Técnicas: Árvores de Decisão (CART), redes neurais, regressão linear • Descrição Integrado com o SGBD DB2 Compatibilidade com o SGBD Oracle Oracle9(10)i Database Marcus Sampaio DSC/UFCG • URL: www.oracle.com/ip/deploy/database/oracle9i/ bi_dm.html • Funções: Regras de Associação, classificação • Técnicas: Apriori, NaïveBayes • Descrição Componente de mineração de dados embutido no SGBD Oracle9(10)i See5 Marcus Sampaio DSC/UFCG • URL: www.rulequest.com/sse5-info.html • Função: Classificação • Técnica: Árvores de decisão, regras de classificação • Descrição Implementação comercial do C5.0 Programas em C podem hospedar comandos da API do sistema WebMiner Marcus Sampaio DSC/UFCG • URL: www.webminer.com • Função: “Web mining” • Descrição Ferramenta de mineração de dados para sites de comércio eletrônico, visando a personalização Outros Produtos Marcus Sampaio DSC/UFCG • www.engr.smu.edu/~mhd/dmbook/app.pdf Uma Classificação de Produtos Marcus Sampaio DSC/UFCG General Purpose Data Mining •WEKA (Source: Java) •MLC++ (Source: C++) •SIPINA •List from KDNuggets (Various) •List from Data Management Center (Various) Classification •C4.5 (Decision tree) •OC1 (Oblique decision tree) •Ripper (Rule-based) •CBA (association-rule based) •bayes (Naive Bayes) •Evidential distance-based (nearest-neighbor) •PEBLS (nearest-neighbor) •mlp (Neural Network) •tiberius (Neural Network) •svmlight (Support Vector Machine) Uma Classificação de Produtos (2) Marcus Sampaio DSC/UFCG Association Analysis •FIMI Repository of Algorithms •Apriori, Eclat, and FP Growth •ARTool •ARMADA (Association rule mining in Matlab) •Tree Mining, Closed Itemsets, Sequential Pattern Mining •Tree Mining, Closed Itemsets, Sequential Pattern Mining •PAFI Cluster Analysis •CLUTO Open Source Clustering Software •Model-based Clustering •Online software for Clustering Uma Classificação de Produtos (3) Marcus Sampaio DSC/UFCG Anomaly Detection •ORCA (distance based) Regression •Regression routines Data Preprocessing •Feature Selection •Isomap (Dimensionality Reduction - in Matlab) Banco de “Data Sets” Data Sets •IDS data sets •Data Sets for Data Mining •Competition Data Set •UCI Machine learning repository •Quest data repository •KDNuggets Marcus Sampaio DSC/UFCG