Data Mining Estudo de um Caso
Utilizando o Clementine 5.2
(Database Marketing)
Problema:
existe uma base de dados com dados acerca dos
clientes de uma instituição bancária que aderiram a
um produto de PPR através campanha via mail
Objectivo:
Induzir um modelo/perfil dos clientes que compram
PPR para contactar directamente aqueles que se
inserem neste modelo (aplicando o modelo aos
clientes não contactados)
Conjunto de
Treino
Conjunto de
Teste
Clientes Contactados
Os Dados e Campos
Id
Age
Sex: M ou F
Região: innercity, rural, suburban, town
Income: rendimento do cliente
Married: Y ou N
Children: número de filhos
Car: tem carro? Y/N
Save_act: save account - tem conta poupança? Y/N
Clientes
não
contactados
Current_act: current account - tem conta à ordem?
Y/N
Mortgage: possui hipoteca? Y/N
Pep: tem PPR? Y/N
Indução de Regras (C5)
Campos importantes para o modelo
Children e Income
•Para 0 filhos não existe nenhum padrão
•Para 1 ou mais filhos à medida que o número de filhos aumenta diminui a
possibilidade de ter um PEP
•Sugere que a partir de 1 filho existe uma relação inversa entre Income e Children
Derivação de um Novo Campo: Realincome
Indução de Regras (C5)
Validade do Modelo
•Validade de 92%com conjunto de treino (ANALYSIS NODE)
•Validade de 90% com conjunto teste (ANALYSIS NODE)
•Modelo SIMPLES (interpretável) e muito VÁLIDO
•Pode ser utilizado para seleccionar os clientes aos está associada uma forte
possibilidade de comprarem PEP
•REPORT NODE - seleccionar o ID dos clientes com probabilidade acima de 90%
(utilizando os níveis de suporte das regras)
Estudo de Segmentação
•Utilização de uma rede neuronal Kohonen
•Segmentar os casos da BD dispondo-os numa matriz de células 5x7
•Os casos podem ser visualizados num gráfico (com ou sem sobreposição de pontos)
e identificados pelas coordenadas X e Y
•Encontrar similaridades escondidas
Clusters / Segmentos
Fixando a variável Sex
Estudo de um Segmento
(assinalado no gráfico e usando o C5)
Rule #1 for T:
if sex==FEMALE
and REGION=INNER_CITY
and car=NO
then ->T (85.0, 0.953)
Download

Data Mining Estudo de um Caso Utilizando o Clementine 5.2