DATA MINING Fabiany Lamboia Luciano Machado Pereira Sumário • • • • • • • • Introdução Conceitos Principais Tarefas Técnicas Algoritmos utilizados Aplicações Tecnologias Conclusão Introdução Empresas acumulam diversos dados em seus bancos de dados Informação sobre os vários processos das funções da empresa Estes dados podem contribuir com a empresa, sugerindo tendências e particularidades pertinentes a ela A tecnologia de Data Mining com suas ferramentas permite a "mineração“ destes dados. Conceito Data mining (DM), é o processo de seleção, exploração de dados e criação de modelos que utiliza um grande volume de armazenamento de dados para identificar padrões previamente desconhecidos. Principais Tarefas • • • • • Classificação Estimativa Segmentação Regressão Agregação (cluster) Principais Tarefas • • • • • Sumarização Modelo de Dependência Associação Análise de Seqüência Predição Técnicas • Estatística • Métodos Lineares • Indução de Regras – Regras de Classificação – Regras de Associação – Regras de Caracterização Algoritmos utilizados • • • • Árvores de Decisão Cluster Naive Bayes Adaptive Bayes Network Aplicação • • • • • • Marketing Vendas Finanças Manufatua Saúde Energia Tecnologias • IBM DB2 Enterprise Edition 8.2: suporta técnicas de árvore de decisão regressão, associação e técnicas de agrupamento; • Oracle Database 10g: Naive Bayes, redes Adaptive Bayes e Support Vector Machines; • Microsoft SQL Server 2000 Analisys Services: suporta árvores de decisão. Empresas • Wall Mart : 60% das mães que compram boneca Barbie, levam também uma barra de chocolate; • Banco Itaú : aumentar sua taxa de retorno nas malas diretas para 30%; • Sprint : previa com 61% de segurança se o consumidor trocaria de companhia de telefone dentro de um período de 2 meses; • SERPRO : cruzar e analisar informações em cinco minutos, o que antes demorava quinze dias de Conclusão A tendência é que todo desenvolvedor de banco de dados dever ser capaz de criar e treinar os modelos de data mining para incorporar esses recursos avançados nos aplicativos do consumidor.