DATA MINING
Fabiany Lamboia
Luciano Machado Pereira
Sumário
•
•
•
•
•
•
•
•
Introdução
Conceitos
Principais Tarefas
Técnicas
Algoritmos utilizados
Aplicações
Tecnologias
Conclusão
Introdução
Empresas acumulam diversos dados em seus
bancos de dados
Informação sobre os vários processos das
funções da empresa
Estes dados podem contribuir com a empresa,
sugerindo tendências e particularidades pertinentes a
ela
A tecnologia de Data Mining com suas ferramentas
permite a "mineração“ destes dados.
Conceito
Data mining (DM), é o processo de
seleção, exploração de dados e
criação de modelos que utiliza um
grande volume de armazenamento de
dados
para
identificar
padrões
previamente desconhecidos.
Principais Tarefas
•
•
•
•
•
Classificação
Estimativa
Segmentação
Regressão
Agregação (cluster)
Principais Tarefas
•
•
•
•
•
Sumarização
Modelo de Dependência
Associação
Análise de Seqüência
Predição
Técnicas
• Estatística
• Métodos Lineares
• Indução de Regras
– Regras de Classificação
– Regras de Associação
– Regras de Caracterização
Algoritmos utilizados
•
•
•
•
Árvores de Decisão
Cluster
Naive Bayes
Adaptive Bayes Network
Aplicação
•
•
•
•
•
•
Marketing
Vendas
Finanças
Manufatua
Saúde
Energia
Tecnologias
• IBM DB2 Enterprise Edition 8.2: suporta
técnicas de árvore de decisão regressão,
associação e técnicas de agrupamento;
• Oracle Database 10g: Naive Bayes, redes
Adaptive Bayes e Support Vector Machines;
• Microsoft SQL Server 2000 Analisys
Services: suporta árvores de decisão.
Empresas
• Wall Mart : 60% das mães que
compram boneca Barbie, levam
também uma barra de chocolate;
• Banco Itaú : aumentar sua taxa de
retorno nas malas diretas para 30%;
• Sprint : previa com 61% de segurança
se o consumidor trocaria de companhia
de telefone dentro de um período de 2
meses;
• SERPRO : cruzar e analisar
informações em cinco minutos, o que
antes demorava quinze dias de
Conclusão
A tendência é que todo
desenvolvedor de banco de dados
dever ser capaz de criar e treinar
os modelos de data mining para
incorporar esses recursos
avançados nos aplicativos do
consumidor.
Download

DATA MINING