Data Mining Estudo de um Caso Utilizando o Clementine 5.2 (Database Marketing) Problema: existe uma base de dados com dados acerca dos clientes de uma instituição bancária que aderiram a um produto de PPR através campanha via mail Objectivo: Induzir um modelo/perfil dos clientes que compram PPR para contactar directamente aqueles que se inserem neste modelo (aplicando o modelo aos clientes não contactados) Conjunto de Treino Conjunto de Teste Clientes Contactados Os Dados e Campos Id Age Sex: M ou F Região: innercity, rural, suburban, town Income: rendimento do cliente Married: Y ou N Children: número de filhos Car: tem carro? Y/N Save_act: save account - tem conta poupança? Y/N Clientes não contactados Current_act: current account - tem conta à ordem? Y/N Mortgage: possui hipoteca? Y/N Pep: tem PPR? Y/N Indução de Regras (C5) Campos importantes para o modelo Children e Income •Para 0 filhos não existe nenhum padrão •Para 1 ou mais filhos à medida que o número de filhos aumenta diminui a possibilidade de ter um PEP •Sugere que a partir de 1 filho existe uma relação inversa entre Income e Children Derivação de um Novo Campo: Realincome Indução de Regras (C5) Validade do Modelo •Validade de 92%com conjunto de treino (ANALYSIS NODE) •Validade de 90% com conjunto teste (ANALYSIS NODE) •Modelo SIMPLES (interpretável) e muito VÁLIDO •Pode ser utilizado para seleccionar os clientes aos está associada uma forte possibilidade de comprarem PEP •REPORT NODE - seleccionar o ID dos clientes com probabilidade acima de 90% (utilizando os níveis de suporte das regras) Estudo de Segmentação •Utilização de uma rede neuronal Kohonen •Segmentar os casos da BD dispondo-os numa matriz de células 5x7 •Os casos podem ser visualizados num gráfico (com ou sem sobreposição de pontos) e identificados pelas coordenadas X e Y •Encontrar similaridades escondidas Clusters / Segmentos Fixando a variável Sex Estudo de um Segmento (assinalado no gráfico e usando o C5) Rule #1 for T: if sex==FEMALE and REGION=INNER_CITY and car=NO then ->T (85.0, 0.953)