Marcus Sampaio
DSC/UFCG
CART
•
•
•
•
Marcus Sampaio
DSC/UFCG
URL: www.salford-systems.com
Função: Classificação
Técnica: Árvore de Decisão
Descrição
Pré-processamento
Preenche valores faltando
Diferentes técnicas de fragmentação
Ler dados de mais de 80 formatos diferentes
Excel, LOtus, Informix, Oracle, ...
Clementine
Marcus Sampaio
DSC/UFCG
• URL: www.spss.com/clementine
• Funções: Regras de associação,
classificação, “clustering”, descoberta de
seqüências, previsão
• Técnicas: Apriori, C5.0, regressão linear, e
outras
• Descrição
Escala
Arquitetura cliente/servidor
Acesso a BD
Geração automática de consultas SQL
Data Mining Suite
Marcus Sampaio
DSC/UFCG
• URL: www.datamining.com/dmsuite.htm
• Funções: Regras de associação, “clustering”,
classificação, série temporal
• Técnicas: Regras de Associação, Regras de
Classificação, predição, ...
• Descrição
Modelos resultantes são armazenados e consultados
com a linguagem Pattern Query Language
Intelligent Miner
Marcus Sampaio
DSC/UFCG
• www.software.ibm.com/data/iminer
• Funções: Regras de associação,
classificação, “clustering”, séries temporais,
padrões de seqüências
• Técnicas: Árvores de Decisão (CART), redes
neurais, regressão linear
• Descrição
Integrado com o SGBD DB2
Compatibilidade com o SGBD Oracle
Oracle9(10)i Database
Marcus Sampaio
DSC/UFCG
• URL:
www.oracle.com/ip/deploy/database/oracle9i/
bi_dm.html
• Funções: Regras de Associação,
classificação
• Técnicas: Apriori, NaïveBayes
• Descrição
Componente de mineração de dados embutido no
SGBD Oracle9(10)i
See5
Marcus Sampaio
DSC/UFCG
• URL: www.rulequest.com/sse5-info.html
• Função: Classificação
• Técnica: Árvores de decisão, regras de
classificação
• Descrição
Implementação comercial do C5.0
Programas em C podem hospedar comandos da API
do sistema
WebMiner
Marcus Sampaio
DSC/UFCG
• URL: www.webminer.com
• Função: “Web mining”
• Descrição
Ferramenta de mineração de dados para sites de
comércio eletrônico, visando a personalização
Outros Produtos
Marcus Sampaio
DSC/UFCG
• www.engr.smu.edu/~mhd/dmbook/app.pdf
Uma Classificação de
Produtos
Marcus Sampaio
DSC/UFCG
General Purpose Data
Mining
•WEKA (Source: Java)
•MLC++ (Source: C++)
•SIPINA
•List from KDNuggets (Various)
•List from Data Management Center (Various)
Classification
•C4.5 (Decision tree)
•OC1 (Oblique decision tree)
•Ripper (Rule-based)
•CBA (association-rule based)
•bayes (Naive Bayes)
•Evidential distance-based (nearest-neighbor)
•PEBLS (nearest-neighbor)
•mlp (Neural Network)
•tiberius (Neural Network)
•svmlight (Support Vector Machine)
Uma Classificação de
Produtos (2)
Marcus Sampaio
DSC/UFCG
Association Analysis
•FIMI Repository of Algorithms
•Apriori, Eclat, and FP Growth
•ARTool
•ARMADA (Association rule mining in
Matlab)
•Tree Mining, Closed Itemsets, Sequential
Pattern Mining
•Tree Mining, Closed Itemsets, Sequential
Pattern Mining
•PAFI
Cluster Analysis
•CLUTO
Open Source Clustering Software
•Model-based Clustering
•Online software for Clustering
Uma Classificação
de Produtos (3)
Marcus Sampaio
DSC/UFCG
Anomaly Detection
•ORCA (distance based)
Regression
•Regression routines
Data Preprocessing
•Feature Selection
•Isomap (Dimensionality Reduction - in
Matlab)
Banco de “Data Sets”
Data Sets
•IDS data sets
•Data Sets for Data Mining
•Competition Data Set
•UCI Machine learning repository
•Quest data repository
•KDNuggets
Marcus Sampaio
DSC/UFCG
Download

10. Produtos de Mineração de Dados