O USO DE TÉCNICAS QUANTITATIVAS EM CRM: uma aplicação no varejo brasileiro. João Marcelo Leal Gomes Leite Universidade Federal do Rio de Janeiro Instituto COPPEAD de Administração Mestre em Administração Orientador: Eduardo Saliby, Ph.D. Rio de Janeiro, RJ - Brasil 2001 ii O USO DE TÉCNICAS QUANTITATIVAS EM CRM: uma aplicação no varejo brasileiro. João Marcelo Leal Gomes Leite Dissertação submetida ao corpo docente do Instituto de Pós-Graduação e Pesquisa em Administração da Universidade Federal do Rio de Janeiro – COPPEAD/UFRJ, como parte dos requisitos necessários à obtenção do grau de Mestre em Ciências em Administração. Aprovada por: Prof. ______________________________________ Eduardo Saliby - Ph.D. University of Lancaster Prof. ______________________________________ Letícia Moreira Casotti - D.Sc. UFRJ Prof. ______________________________________ Monica Barros - D.Sc. PUC-Rio Rio de Janeiro Dezembro/2001 - Orientador iii Leite, João Marcelo Leal Gomes. O uso de técnicas quantitativas em CRM: uma aplicação no varejo brasileiro/ João Marcelo Leal Gomes Leite. Rio de Janeiro: UFRJ/COPPEAD, 2001. xvii, 148 p. ; il. Dissertação (Mestrado) – Universidade Federal do Rio de Janeiro, COPPEAD, 2001. Orientador: Eduardo Saliby. 1. CRM. 2. Relacionamento com clientes. 3. Tese (Mestr. UFRJ/COPPEAD). 4. Saliby, Eduardo, orient. I. Título. iv DEDICATÓRIA À minha família, principalmente meu pai, minha mãe, minha irmã, minha madrinha, minha avó e minha Ná. Por estarem sempre ao meu lado nestes anos todos de estudo. À COPPEAD (professores e funcionários), por me proporcionarem estes dois anos de conhecimento. Ao meu orientador e amigo, Eduardo Saliby, por esta dissertação e por tudo o que fez por mim. À minha banca, Letícia e Monica, pela disponibilidade e paciência. v RESUMO LEITE, João Marcelo Leal Gomes. O uso de técnicas quantitativas em CRM: uma aplicação no varejo brasileiro.. Orientador: Eduardo Saliby. Rio de Janeiro: UFRJ/COPPEAD; 2001. Dissertação (Mestrado em Administração). Com o advento do CRM (Customer Relationship Management) muitas empresas passaram a compreender a importância da construção de um relacionamento com os seus clientes e começaram uma busca desenfreada por informações sobre eles. Entretanto, a extração do conhecimento muitas vezes parece uma tarefa difícil, quase impossível. Esta dissertação tem por objetivo ressaltar a importância do CRM e mostrar que a obtenção de informações sobre os clientes é uma tarefa mais simples do que aparenta. Utilizando o exemplo de uma rede de hipermercados, mostra-se que, com a construção de um banco de dados com as compras dos clientes e a utilização de técnicas estatísticas simples, é possível extrair bastante conhecimento relevante sobre os clientes. Este conhecimento estimula ainda mais a obtenção de novas informações, mas já é o suficiente para, se for bem aplicado, trazer uma importante vantagem competitiva para a empresa neste mundo tão competitivo. vi ABSTRACT LEITE, João Marcelo Leal Gomes. O uso de técnicas quantitativas em CRM: uma aplicação no varejo brasileiro.. Orientador: Eduardo Saliby. Rio de Janeiro: UFRJ/COPPEAD; 2001. Dissertação (Mestrado em Administração). With the coming of CRM (Customer Relationship Management) a lot of companies started to understand the importance of the construction of a relationship with their clients and they began a wild search for information on them. However, the exploration of the knowledge many times it seems a task difficult, almost impossible. This dissertation has for objective to emphasize the importance of CRM and to show that the obtaining of information on the clients is a simpler task than it looks. Using the example of a hypermarket company, it is shown that, with the construction of a database system with the clie nts' purchases and the use of simple statistical techniques, it is possible to extract plenty relevant knowledge on the clients. This knowledge still stimulates more the obtaining of new information, but it is already enough for, if it goes very applied, to bring an important competitive advantage for the company in such competitive world. vii LISTA DE FIGURAS Figura 1 Processo de extração de conhecimento .......................................... 41 Figura 2 Visão holística do processo data mining .......................................... 41 Figura 3 Arquitetura do data warehouse .......................................................... 47 Figura 4 Mapeamento das classes segundo a SOM (branco para compradores, preto para não compradores e tons de cinza para classes não bem definidas) ................................................................ 60 Figura 5 Posicionamento dos 5 super-clusters no mapa da SOM............... 62 viii LISTA DE GRÁFICOS Gráfico 1 Percentual acumulativo dos clientes versus o percentual acumulativo de abandono ................................................................... 55 Gráfico 2 Posicionamento dos clusters quanto as variáveis RM ................... 57 Gráfico 3 Qualidade versus número de clusters .............................................. 61 Gráfico 4 Segmento supermercado x Total auto -serviço - número de lojas (em mil) .................................................................................................. 68 Gráfico 5 Evolução da participação de lojas supermercados no faturamento total do setor de auto-serviços (em %) ............................................. 69 Gráfico 6 Histograma e P-P Plot do Valor das compras. ................................ 81 Gráfico 7 Histograma e P-P Plot do Número de dias entre compras. .......... 83 Gráfico 8 Gráfico de dispersão entre o Número de dias entre compras e o Valor das compras. .............................................................................. 84 Gráfico 9 Gráfico de barras do número total, média e valor total de compras em relação ao mês do ano. ................................................................ 86 Gráfico 10 Número total, média e valor total de compras ao longo dos dias do ano. ......................................................................................................... 88 Gráfico 11 Função de auto-correlação do número total, média e valor total de compras ao longo dos dias do ano. .................................................. 89 Gráfico 12 Gráfico de barras do número total, média e valor total de compras em relação ao dia do mês. ................................................................. 91 Gráfico 13 Gráfico de barras do número de dias desde a última compra em relação ao dia do mês. ........................................................................ 91 ix Gráfico 14 Histograma e P-P Plot do valor das compras para as quinzenas.93 Gráfico 15 Gráfico de barras do número total, média e valor total de compras em relação à quinzena. ....................................................................... 94 Gráfico 16 Gráfico de barras do número diário de compras conforme a quinzena. ............................................................................................... 95 Gráfico 17 Gráfico de barras do valor médio diário das compras conforme a quinzena. ............................................................................................... 96 Gráfico 18 Gráfico de barras do valor total diário das compras conforme a quinzena. ............................................................................................... 97 Gráfico 19 Gráfico de barras do número de dias entre compras conforme a quinzena. ............................................................................................... 98 Gráfico 20 Histograma do Número de dias entre compras para as quinzenas.99 Gráfico 21 Gráfico de barras do coeficiente de variação das compras em relação ao dia da semana. ............................................................... 101 Gráfico 22 Gráfico de barras do número total, média e valor total de compras em relação ao dia da semana. ......................................................... 102 Gráfico 23 Gráfico de barras do número médio diário de compras em função do dia da semana............................................................................... 103 Gráfico 24 Gráfico de barras do valor diário médio por compra em função do dia da semana. ................................................................................... 104 Gráfico 25 Gráfico de barras do valor diário total de compras em função do dia da semana. ................................................................................... 106 Gráfico 26 Gráfico de barras do número de dias entre compras conforme o dia da semana. ................................................................................... 108 Gráfico 27 Histograma do Número de dias entre compras para as quinzenas.109 x Gráfico 28 Gráfico de barras com o dia da semana da compra anterior conforme o dia da semana. .............................................................. 110 Gráfico 29 Gráfico de barras do número total, média e valor total de compras por loja. ................................................................................................ 112 Gráfico 30 Gráfico de barras do número de dias entre compras por loja. ... 113 Gráfico 31 Gráfico de barras com o número de clientes e a média do número de compras por cliente para cada loja. ........................................... 113 Gráfico 32 Evolução do número total, média e valor total de compras por loja ao longo dos meses do ano. ............................................................ 114 Gráfico 33 Gráfico de barras com o número total e o valor médio das compras por dia da semana para cada loja................................... 114 Gráfico 34 Gráfico de barras com o número médio de dias entre compras por loja. ....................................................................................................... 115 Gráfico 35 Comparação entre o número de compras e o seu valor médio entre as duas principais lojas em função da quinzena e do dia da semana. ............................................................................................... 116 Gráfico 36 Histograma do Número de compras por cliente............................ 119 Gráfico 37 Gráfico de Pareto para o número de compras. ............................. 119 Gráfico 38 Histograma e P-P Plot do Valor médio das compras por cliente.121 Gráfico 39 Histograma e P-P Plot do Valor total das compras por cliente... 122 Gráfico 40 Gráfico de Pareto para o valor total das compras ........................ 122 Gráfico 41 Gráfico de barras do número, média e valor total de compras conforme a segmentação por quinzena. ........................................ 126 Gráfico 42 Gráfico de barras do número, média e valor total de compras conforme a segmentação por número de dias da semana. ........ 129 xi Gráfico 43 Gráfico de barras do número, média e valor total de compras conforme a segmentação por loja. .................................................. 134 xii LISTA DE TABELAS Tabela 1 Resultado final da segmentação de clientes ................................... 58 Tabela 2 Descrição e atributos dos 5 fatores selecionados .......................... 59 Tabela 3 O auto serviço alimentar brasileiro .................................................... 67 Tabela 4 Síntese do resultados - 1999 ............................................................. 67 Tabela 5 Mapa das análises. .............................................................................. 78 Tabela 6 Estatísticas descritivas e percentis do Valor das compras. .......... 80 Tabela 7 Teste Kolmogorov-Smirnov. ............................................................... 81 Tabela 8 Estatísticas descritivas e percentis do Número de dias entre compras. ................................................................................................ 82 Tabela 9 Estatísticas descritivas do Valor das compras para os diferentes meses do ano. ...................................................................................... 85 Tabela 10 Percentis do Valor das compras para os diferentes meses do ano.87 Tabela 11 Estatísticas descritivas e percentis do Valor das compras para as quinzenas. ............................................................................................. 92 Tabela 12 Estatísticas descritivas e percentis do número diário de compras para as quinzenas. ............................................................................... 94 Tabela 13 Estatísticas descritivas e percentis do valor médio diário das compras para as quinzenas. .............................................................. 96 Tabela 14 Estatísticas descritivas e percentis do valor total diário das compras para as quinzenas. .............................................................. 97 Tabela 15 Estatísticas descritivas e percentis do número de dias entre compras para as quinzenas. .............................................................. 98 xiii Tabela 16 Estatísticas descritivas do valor das compras para os dias da semana. ............................................................................................... 100 Tabela 17 Percentis do valor das compras para os dias da semana........... 101 Tabela 18 Percentis do número médio diário de compras para os dias da semana. ............................................................................................... 102 Tabela 19 Estatísticas descritivas do número médio diário de compras para os dias da semana. ............................................................................ 103 Tabela 20 Estatísticas descritivas do valor diário médio por compra para os dias da semana. ................................................................................. 104 Tabela 21 Percentis do valor diário médio por compra para os dias da semana. ............................................................................................... 104 Tabela 22 Estatísticas descritivas do valor diário total de compras para os dias da semana. ................................................................................. 105 Tabela 23 Percentis do valor diário total de compras para os dias da semana. ............................................................................................... 105 Tabela 24 Estatísticas descritivas do número de dias entre compras para os dias da semana. ................................................................................. 107 Tabela 25 Percentis do número de dias entre compras para os dias da semana. ............................................................................................... 108 Tabela 26 Estatísticas descritivas e percentis do Número de compras por cliente. .................................................................................................. 118 Tabela 27 Estatísticas descritivas e percentis do Valor médio das compras por cliente. ........................................................................................... 120 Tabela 28 Estatísticas descritivas e percentis do Valor total das compras por cliente. .................................................................................................. 121 Tabela 29 Regressão Número de compras por cliente x Valor médio das compras por cliente............................................................................ 123 xiv Tabela 30 Estatísticas descritivas e percentis do número de compras conforme a segmentação por quinzena. ........................................ 124 Tabela 31 Estatísticas descritivas e percentis do valor médio das compras conforme a segmentação por quinzena. ........................................ 125 Tabela 32 Estatísticas descritivas e percentis do valor total das compras conforme a segmentação por quinzena. ........................................ 126 Tabela 33 Estatísticas descritivas e percentis do número de compras conforme a segmentação por número de dias da semana. ........ 127 Tabela 34 Estatísticas descritivas e percentis do valor médio das compras conforme a segmentação por número de dias da semana. ........ 128 Tabela 35 Estatísticas descritivas e percentis do valor total das compras conforme a segmentação por número de dias da semana. ........ 129 Tabela 36 Estatísticas descritivas do número de compras conforme a segmentação por loja. ....................................................................... 130 Tabela 37 Percentis do número de compras conforme a segmentação por loja. ....................................................................................................... 131 Tabela 38 Estatísticas descritivas do valor médio das compras conforme a segmentação por loja. ....................................................................... 132 Tabela 39 Percentis do valor médio das compras conforme a segmentação por loja. ................................................................................................ 132 Tabela 40 Estatísticas descritivas do valor total das compras conforme a segmentação por loja. ....................................................................... 133 Tabela 41 Percentis do valor total das compras conforme a segmentação por loja. ....................................................................................................... 133 xv SUMÁRIO CAPÍTULO I O PROBLEMA ................................................................................... 1 I.1. Introdução e pergunta ................................................................................ 1 I.2. Objetivos ........................................................................................................ 2 I.3. Relevância ..................................................................................................... 2 I.4. Delimitação .................................................................................................... 3 I.5. Definição dos termos.................................................................................. 4 CAPÍTULO II REVISÃO DE LITERATURA........................................................... 5 II.1. Customer Relationship Management (CRM) ........................................ 5 II.1.1. Definição de Customer Relationship Management (CRM) 5 II.1.2. Vantagens do CRM 7 II.1.3. Vantagens da fidelização 8 II.1.4. Como implementar o CRM 11 II.1.5. Cálculo do valor de um cliente 16 II.1.6. Criação de valor para os clientes 19 II.1.7. O papel das novas tecnologias 23 II.2. Extração do Conhecimento..................................................................... 27 II.2.1. O papel dos bancos de dados (database marketing) 27 II.2.2. Definição de Data Mining 33 II.2.3. Benefícios do Data Mining 35 II.2.4. Implementação e etapas do Data Mining 39 II.2.5. Data Warehouse 46 II.2.6. Objetivos,aplicações e técnicas de Data Mining 49 xvi II.3. Aplicações reais de técnicas de extração de conhecimento ........ 54 II.3.1. Descoberta do perfil dos clientes que não renovam o contrato em uma empresa de telefonia celular 54 II.3.2. Segmentação de clientes de um shopping duty-free 55 II.3.3. Segmentação e detecção do perfil de compradores on-line 59 II.3.4. Outros exemplos 63 II.4. Fidelização e o varejo ............................................................................... 64 II.4.1. Relacionamento com clientes no varejo 64 II.4.2. Oportunidades do comércio on-line 65 II.4.3. Uma breve descrição do mercado varejista brasileiro 66 II.4.4. Exemplos de aplicação do CRM no mercado varejista brasileiro 70 CAPÍTULO III METODOLOGIA .............................................................................. 73 III.1. Tipo de pesquisa........................................................................................ 73 III.2. Universo e amostra ................................................................................... 74 III.3. Coleta de dados ......................................................................................... 75 III.4. Tratamento dos dados ............................................................................. 75 III.5. Limitações do método .............................................................................. 77 CAPÍTULO IV ANÁLISES DESCRITIVAS ............................................................ 78 IV.1. Análise das compras ................................................................................ 79 IV.1.1. Análise geral de todas as compras 79 IV.1.2. Análise da evolução das compras ao longo do tempo 84 IV.1.3. Análise dos padrões sazonais de compras 89 IV.1.4. Análise por loja 111 IV.2. Análise dos clientes ................................................................................117 IV.2.1. Análise geral de todos os clientes 117 xvii IV.2.2. Segmentação por período do mês 123 IV.2.3. Segmentação por número de dias da semana 127 IV.2.4. Segmentação por loja 130 CAPÍTULO V CONCLUSÃO.................................................................................135 V.1. A importância do CRM ...........................................................................135 V.2. Resultados e conclusões da análise dos dados.............................137 V.3. Sugestão para estudos futuros ...........................................................141 REFERÊNCIAS BIBLIOGRÁFICAS ......................................................................144 CAPÍTULO I I.1. O PROBLEMA INTRODUÇÃO E PERGUNTA Com o crescimento das empresas multinacionais e com o avanço da globalização mundial, os mercados estão se tornando mais competitivos. Está cada vez mais difícil para as firmas se diferenciarem de seus concorrentes e manter a fidelidade de seus clientes. Uma das alternativas para enfrentar este cenário é o desenvolvimento de meios de comunicação mais eficientes entre a empresa, seus clientes e o mercado de consumidores em potencial. A sigla CRM, Customer Relationship Management, surgiu exatamente para dar nome a esta prática da administração que visa um maior relacionamento entre empresas e seus clientes. Entre as técnicas mais utilizadas para promover o CRM encontra-se a utilização de bancos de dados com informações sobre os atuais clientes. Através destes bancos de dados, é possível: a. Descobrir quais são os seus clientes mais lucrativos e quais são os que não trazem lucro para a empresa; b. Conhecer melhor o perfil destes clientes lucrativos e assim desenvolver meios de comunicação mais baratos e que lhes falem diretamente, sem a interferência e conhecimento dos concorrentes. c. Descobrir novos consumidores, que possuem características parecidas com as dos atuais, mas que, por algum motivo desconhecido, ainda não utilizam os produtos, ou serviços, oferecidos pela empresa. Para que se possa explorar todo o potencial dos bancos de dados, é necessário que as firmas saibam transformar os dados em informações e conhecimento. Esta tarefa nem sempre é fácil, principalmente em bancos de dados muito grandes. É neste ponto que técnicas quantitativas exercem um papel fundamental, transformando um amontoado de números em informações 2 relevantes para as tomadas de decisões. E o data mining nada mais é do que um conjunto de técnicas quantitativas, entre elas técnicas estatísticas e de inteligência artificial, que tem por objetivo a extração da informação contidas em bancos de dados. Neste contexto, este trabalho tentará responder a seguinte pergunta: Como técnicas quantitativas podem ajudar no gerenciamento de uma política de relacionamento entre empresas e clientes? Para ajudar a respondê-la, apresenta-se uma revisão da literatura sobre este assunto e, ao final, um exemplo da utilização de algumas destas técnicas em dados obtidos em um banco de dados de uma empresa de varejo brasileira. I.2. OBJETIVOS O objetivo deste trabalho é mostrar como técnicas quantitativas podem ajudar no gerenciamento de uma política de relacionamento entre empresas e clientes. Para atingir este propósito final, é necessário que este trabalho responda a três objetivos intermediários: a. Mostrar a importância da obtenção de informações sobre os seus clientes e da utilização de uma estratégia CRM, no sucesso das empresas; b. Apresentar aos leitores as técnicas de extração de conhecimento, já que muitas são bastante recentes e ainda não foram muito divulgadas na literatura brasileira; c. Exemplificar a utilização de técnicas quantitativas em bancos de dados através da sua aplicação e da análise dos resultados obtidos. I.3. RELEVÂNCIA Com o aumento da velocidade dos computadores, é possível manipular um maior número de dados, obtendo-se mais informações. Assim sendo, cada vez mais técnicas quantitativas poderão ser utilizadas, mesmo em áreas onde o 3 volume de informação antes as tornava inviáveis. A obtenção de informação sobre os clientes surge como uma destas áreas, onde os computadores poderão ser utilizados mais freqüentemente para ajudar na formulação das estratégias empresariais. Este trabalho se torna relevante pois apresenta algumas técnicas quantitativas que podem ser implementadas em computadores e que ajudam na obtenção de informações sobre clientes contidas em bancos de dados. Deste modo, espera-se que este estudo ofereça uma ajuda às muitas empresas que se sentem perdidas face à quantidade de dados que possuem sobre os seus clientes, e não conseguem transformá-los em informação relevante para a tomada de decisão. I.4. DELIMITAÇÃO Este trabalho tem por objetivo mostrar como técnicas quantitativas podem ajudar no gerenciamento de uma política de relacionamento entre empresas e clientes. Entretanto, não se pretende detalhar profundamente o processo de construção de um banco de dados. Não serão abordados tópicos de informática relativos a bancos de dados, tais como: qual seria a melhor linguagem, o melhor software e a melhor estruturação para o banco de dados. Supõe-se que os dados estão armazenados de alguma forma que seja possível acessá-los rapidamente quando necessário. Também, supõe-se que os dados já estão salvos em formatos compatíveis aos programas de análise de dados que serão utilizados. O trabalho também não irá propor quais as medidas de marketing devem ser tomadas (call center, correspondência direta ou outra forma de contato). Estas medidas dependem muito da indústria em questão. Este trabalho se limita a mostrar técnicas quantitativas que auxiliem na obtenção de informações contidas nos dados, de modo que elas ajudem as empresas a desenvolverem suas estratégias de CRM. 4 I.5. DEFINIÇÃO DOS TERMOS Customer Relationship Management (CRM) – Conceito segundo o qual as empresas devem explorar o relacionamento com seus clientes para obter uma vantagem estratégica. Data Mining – Conjunto de técnicas que visam a extração de informação contida em um banco de dados. Data Warehouse – Local no banco de dados onde ficam armazenados os dados. É o armazém de dados. Database Marketing – Utilização de bancos de dados como uma importante fonte de informação de auxílio ao marketing e à área estratégica de negócios de uma empresa. Machine-learning – Técnica quantitativa onde nenhum modelo pré-definido para a análise dos dados é imposto. Cabe ao próprio computador detectar este modelo através dos padrões existentes nos dados. Também é conhecido com Inteligência Artificial (IA). Overfitting – Erro comum aos modelos de inteligência artificial que ocorre quando o método se especializa demais nos dados de treinamento e perde a capacidade de generalização. 5 CAPÍTULO II REVISÃO DE LITERATURA II.1. CUSTOMER R ELATIONSHIP MANAGEMENT (CRM) II.1.1. Definição de Customer Relationship Management (CRM) “Houve um tempo quando varejistas, bancos, companhias seguradoras e negociadores de carros tinham um estreito relacionamento com seus clientes. Eles freqüentemente os conheciam pessoalmente, sabiam o que eles desejavam e satisfaziam suas necessidades através de um serviço pessoal personalizado. Como resultado, obtinham a lealdade e uma grande fatia dos consumidores do seu mercado. Este, entretanto, era um sistema custoso e ineficiente e era necessário que os clientes subsidiassem este relacionamento, pagando altos preços. Com o passar do tempo, com o marketing de massa e o aumento do consumo, os clientes trocaram os relacionamentos pelo anonimato, com uma redução na variedade e nos preços. Hoje em dia, através do uso eficaz da informação e das tecnologias de comunicação, esta troca não é mais necessária; as organizações podem oferecer a seus clientes variedade, preços baixos e um serviço personalizado, e tudo ao mesmo tempo. (...) Esta é a prática de CRM.” 1 (PEPPARD, 2000, pg. 312). Fazendo uma definição formal, CRM e marketing de relacionamento são conceitos que chegam a se confundir. Analisando a definição de Stone, Woodcock e Wilson (1996, p. 675) para marketing de relacionamento é possível observar a semelhança entre ambos: “Marketing de relacionamento é o uso de uma vasta gama de técnicas de marketing, vendas, comunicação, serviço e atendimento ao cliente visando: a. identificar o cliente individual característico da empresa; b. criar um relacionamento entre a empresa e seus clientes que vá além das várias transações; c. administrar o relacionamento em benefício dos clientes e da companhia.” 2 1 Tradução livre do autor deste projeto. 2 Tradução livre do autor deste projeto. 6 Peppers, Rogers e Dorf (1999, p. 151) chegam a firmar que ambos são a mesma coisa: “A idéia é simples: marketing um para um (também chamado de marketing de relacionamento ou customer relationship management) significa estar atento e ser capaz de mudar seu comportamento para uma maneira voltada para o cliente individual, baseado no que ele diz e no que for possível saber sobre ele.” 3 Esta confusão ocorre pois o foco de ambos é o relacionamento com o cliente, e a construção de uma vantagem competitiva baseada neste relacionamento. Para Jackson (1985) existe um espectro contínuo onde em uma ponta se localiza o marketing de transação e na outra o marketing de relacionamento, sendo que, normalmente, as situações de negócios se encaixam em posições intermediárias neste espectro. O autor afirma que nem sempre é justificável um investimento na linha de frente para ganhar clientes e estabelecer um relacionamento de longo prazo. Neste extremo, encontram-se os clientes que fazem compras repetidas de um produto, mas que podem facilmente trocar de fornecedores, só se interessando por relacionamentos de curto prazo. Neste caso o marketing de transação seria o mais apropriado. Entretanto, há clientes que fazem uma série de compras ao longo do tempo e preferem se comprometerem com somente um vendedor, em troca de um relacionamento e benefícios de longo prazo. Neste ambiente é justificável que as empresas aumentem seus gastos para obterem novos clientes e para aumentar o comprometimento destes. Neste caso o marketing de relacionamento seria o ideal para estes consumidores e paras as firmas. Já Newell (2000, p. 8-9) prefere utilizar a definição de CRM feita pelo Carlson Marketing Group: "Uma estratégia de negócios que constrói antecipadamente uma tendência ou preferência por uma organização com seus funcionários, canais e clientes, resultando em uma maior retenção e em um desempenho melhor.” 3 Tradução livre do autor deste projeto. 7 II.1.2. Vantagens do CRM Não há acordo entre os autores se o CRM traz vantagens que já poderiam ser medidas no curto prazo. Peppers, Rogers e Dorf (1999) afirmam que o CRM não traz somente benefícios de longo prazo. É possível observar alguns resultados deste programa já no curto prazo, tais como: aumento das vendas cruzadas, redução da deserção de clientes, aumento em seu nível de satisfação e diminuição dos custos de transação, tornando mais rápidos os ciclos de compras. Contudo, Newell (2000) discorda, alertando que pode levar até três anos para que uma política de CRM apresente resultados expressivos. Apesar da discordância quanto às vantagens de curto prazo, há um consenso em relação aos benefícios trazidos pelo CRM no longo prazo. O primeiro deles seriam as informações sobre os clientes. Stone, Woodcock e Wilson (1996) afirmam que através do marketing de relacionamento as empresas podem obter inúmeras informações tais como: a. A análise detalhada da lucratividade atual e esperada deste relacionamento de longo prazo; b. Novos serviços de que seus clientes precisem; c. O nível do relacionamento sob o ponto de vista dos clientes e qual o tipo de relacionamento eles gostariam de ter; d. As políticas de aquisição e retenção de clientes praticadas por seus concorrentes; e. O grau de satisfação dos métodos atuais de relacionamento e se eles atingem as expectativas dos clientes; f. Testes de novos modelos de relacionamento. Entretanto, a maior vantagem trazida pelo CRM é o relacionamento com os clientes. Segundo Peppard (2000), o principal foco do CRM é um relacionamento estreito e profundo com seus clientes. Seu objetivo principal é maximizar o valor do cliente para a organização. As vantagens deste 8 relacionamento com os clientes são irresistíveis: a construção da comunicação bilateral; a possibilidade de antecipar os seus desejos observando o seu comportamento; e a retenção dos mesmos, que tem se mostrada mais lucrativa do que a atração de novos consumidores. Kelly (2000), Pine II, Peppers e Rogers (1995), Saunders e Metzer (2001) e Stone, Woodcock e Wilson (1996) também concordam que o relacionamento leva ao aumento da retenção e lealdade dos clientes e ao aumento da lucratividade. II.1.3. Vantagens da fidelização Como é possível perceber, uma das vantagens mais citadas pelo CRM é a retenção, a lealdade e a fidelização dos clientes. Mas quais são as reais vantagens da fidelização de clientes para as empresas? Segundo Pessanha Filho (2000), clientes fiéis compram mais freqüentemente, defendem a empresa, são menos atentos à concorrência e compram extensões das linhas de produtos das quais já são consumidores. A retenção de clientes também se reflete internamente na empresa já que proporciona uma satisfação maior nos funcionários. Pine II, Peppers e Rogers (1995) também alertam para a importância que a fidelização tem no aumento da lucratividade da empresa. Quanto mais tempo os clientes são fiéis à empresa, mais lucrativos eles se tornam devido às compras repetidas, à redução nos custos fixos, aos preços premiums, à redução no custo de aquisição e à ajuda dada através de sugestões. Para Stone, Woodcock e Wilson (1996) a fidelização de clientes impacta positivamente na lucratividade através da diminuição dos custos de recrutamento de novos clientes e da redução do custo das vendas. Os programas de fidelização têm como objetivo aumentar a satisfação dos clientes. Anderson, Fornell e Lehmann (1994) afirmam que as organizações cujos clientes estão satisfeitos conseguem retornos financeiros superiores devido ao: 9 a. Aumento da lealdade, aumentando o valor do cliente devido às compras repetidas no futuro; b. Redução da elasticidade no preço, pois clientes satisfeitos aceitam pagar mais; c. Redução da possibilidade dos seus clientes serem afetados pelos apelos dos competidores; d. Diminuição do custo das transações futuras; e. Redução dos custos por falhas, já que como os desejos dos clientes são atendidos, há poucas falhas para serem corrigidas; f. Diminuição do custo de atração de novos clientes; g. Aumento da reputação da firma, facilitando a aceitação de novos produtos que poderiam ser rejeitados devido aos riscos de tentativas. Já segundo Pine II, Peppers e Rogers (1995) esta política de relacionamento entre empresa e clientes pode levar à vantagem competitiva. O primeiro motivo é que quanto mais informações os clientes passam para a empresa, melhor se torna o serviço prestado por ela, torna ndo a competição mais difícil para os concorrentes. Estas informações, e a relação de aprendizagem, se tornam uma vantagem competitiva para a empresa, permitindo que ela continue a oferecer um serviço ou produto customizado de alta qualidade, com preços competitivos e que esteja sempre utilizando tecnologias atualizadas. O segundo motivo é que a troca de informações requer um esforço por parte dos clientes. A decisão de acabar com um relacionamento e iniciá-lo com uma outra empresa exige que os clientes refaçam todo este trabalho de fornecimento de dados. Assim sendo, quanto maior for a quantidade de informações que uma empresa possui sobre os seus clientes, maior o comprometido destes com o relacionamento, trazendo uma vantagem competitiva para a organização. Evans e Wurster (1997) concordam que a informação pode não somente limitar e restringir um relacionamento, mas pode servir como base para a formação de uma vantagem competitiva. Para os autores, a informação é a 10 “cola” que liga e une a estrutura de um negócio. Quando administradores falam sobre o valor do relacionamento com os clientes, eles deveriam estar preocupados com a informação que eles possuem sobre os seus clientes e a informação que estes possuem sobre a empresa, pois assim estariam construindo uma vantagem competitiva para suas firmas. Jackson (1985) também destaca que o aumento nos custos de mudanças percebidos pelos clientes é uma das vantagens obtidas com o desenvolvimento de uma política de fidelização de clientes. Analisando de uma maneira simples e direta, um programa de fidelização bem sucedido cria custos de mudanças para os clientes, de modo que seja melhor para eles permanecer com a empresa. Por isso, as companhias que desejam manter seus clientes devem manter o custo de mudança maior que o custo de permanência. O primeiro custo de mudança é o investimento que os clientes precisam fazer para se adaptarem aos novos produtos, serviços ou sistemas. Estes investimentos podem ser em dinheiro, pessoas, ativos e procedimentos. Quanto maior for o investimento, maior será a relutância para a mudança. A segunda maior categoria de custos de mudanças se refere ao risco e à exposição necessária para realizar a mudança, ou seja, o perigo do cliente fazer uma escolha errada. O medo de uma ruptura e de uma performance insatisfatória pode tornar o cliente relutante à mudança. Alguns autores mostram exemplos numéricos proporcionados pela fidelização de clientes. Saunders e Metzer (2001) concordam com os benefícios que um programa de fidelização de clientes pode trazer. Eles afirmam que estudos têm mostrado que as empresas gastam cinco vezes mais para conquistar novos clientes do que para manter os atuais, e que é possível aumentar os lucros em 100% aumentando a taxa de retenção dos clientes em apenas 5%. Kelly (2000) cita alguns exemplos que mostram o valor da retenção de um cliente: 11 a. Clientes insatisfeitos contam seu desapontamento para outras dez pessoas, sendo que dessas, 12% espalham para outras 20 pessoas; b. Custa 5 vezes mais atrair novos clientes do que manter os atuais; c. Se 20 clientes estão insatisfeitos com você, 19 não dirão mas irão embora; d. Clientes satisfeitos contam para outros 5 clientes sobre suas experiências positivas; e. A maneira como você trata os clientes é um dos primeiros pontos de comparação que os clientes fazem entre você e seus concorrentes; f. Clientes satisfeitos quase sempre dão referências sobre outros pontos de vista. II.1.4. Como implementar o CRM Peppers, Roger e Dorf (1999) afirmam que para começar o CRM, a empresa deve primeiramente saber situar a estágio atual do seu relacionamento com seus clientes. Depois disto, há quatro passos chaves para colocá-lo em funcionamento: a. Identificar seus clientes – É necessário que a empresa seja capaz de localizar e entrar em contato com um bom número de clientes, principalmente os mais valiosos. Por isso é importante obter a maior quantidade de informação possível sobre eles (não somente dados demográficos, mas também os hábitos e as preferências). Também é necessário que a empresa obtenha informações em cada contato, e não somente em um determinado período de tempo. Caso não seja possível para a empresa obter estas informações de seus clientes finais é possível tentar este tipo de relacionamento com seus clientes diretos. b. Diferenciar seus clientes – Os clientes são diferentes pois têm diferentes necessidades e porque têm diferentes valores para a empresa. O passo seguinte após identificá-los é diferenciá-los, pois assim é possível 12 focalizar os esforços nos mais rentáveis e moldar o comportamento da empresa de modo que ela possa atingir os valores e necessidades de cada cliente. c. Interagir com os seus clientes – Melhorar o binômio custo-eficiência e a eficácia dos contatos com os clientes são componentes críticos do CRM. É possível melhorar o custo-eficiência adotando métodos automáticos e mais baratos de interação direta com os clientes. E para melhorar a eficácia é necessário que a empresa gere informações interessantes e rápidas sobre os desejos e valores dos clientes, lembrando que em cada contato ela deve utilizar as informações obtidas em todos os contatos anteriores. d. Customizar o comportamento da empresa – Para prender seus clientes num relacionamento, a empresa deve adaptar alguns aspectos do seu comportamento para atender os desejos expressos de seus clientes. Isto pode ser feito através da customização em massa de seus produtos, ou moldando algum aspecto dos serviços que envolvem os produtos. Os dois primeiros passos (identificar e diferenciar os clientes) são considerados análises internas, enquanto os dois últimos (interagir e customizar) são ações externas, visíveis para o consumidor. Ainda segundo os autores, após decidir implantar o programa, cabe à empresa definir quais os aspectos mais importantes e priorizá-los, nunca esquecendo que as prioridades devem obedecer aos desejos e valores dos clientes. De qualquer modo, quanto mais diferenciada sua base de clientes e quanto maior a concentração de clientes lucrativos em uma pequena parcela de sua base total, mais eficiente e menos custoso será o relacionamento. Pine II, Peppers e Rogers (1995) alertam que a implantação do CRM pode ser mais difícil dependendo da posição da empresa na cadeia de fornecimento e do tipo de indústria. Empresas que não têm o contato direto com o cliente final têm maiores dificuldades de construir este relacionamento. Entretanto elas podem construir este relacionamento com seus clientes diretos. Outro exemplo de indústria que enfrenta dificuldade na implantação do CRM é a de fabricantes 13 de produtos com pequeno valor unitário (tais como os clipes para papéis). Neste caso a solução é a construção do relacionamento com os varejistas que interagem diretamente com os clientes finais. Empresas que vendem commodities também enfrentam dificuldades na customização dos seus produtos aos gostos dos clientes, contudo elas podem oferecer serviços pósvenda diferenciados. Os mesmos autores também dizem quais são as indústrias onde o relacionamento pode ser construído mais facilmente. São as indústrias e prestadores de serviço onde: o cliente compra sempre o mesmo tipo de produto, o produto pode ser enviado diretamente à casa do cliente e onde já há uma relação existente entre a marca e o cliente. No caso de empresas que tenham como clientes outras empresas, Knox (1998) afirma que a administração tradicional baseada em contas não traz benefícios pois a comunicação é feita exclusivamente através do gerente de conta. Para o autor este relacionamento deveria evoluir para um estágio onde as interações empresa-cliente e empresa-vendedor ocorrem em vários pontos. Com a construção deste relacionamento os custos de transação diminuiriam e ambas seriam beneficiadas. Newell (2000) lembra que mesmo em relações empresa-empresa, os clientes finais são sempre indivíduos, possibilitando o desenvolvimento de um programa de relacionamento personalizado. Newell (2000) também fala das particularidades da implantação do CRM em outras indústrias. No varejo, as empresas devem abandonar o antigo foco em vender qualquer produto, em qualquer lugar, a qualquer hora e para todos os clientes. Os varejistas devem se concentrar em manter os clientes mais lucrativos, oferecendo-lhes produtos selecionados e que lhes tragam satisfação. Neste ambiente, a internet deve ser considerada uma aliada que pode ajudar a trazer o cliente para a loja real. Na industria de bens de consumo, onde as empresas não vendem diretamente seus produtos para os clientes, Newell (2000) afirma que só há duas alternativas para a criação de um relacionamento com os principais clientes finais. A primeira é a criação de parcerias com os canais de vendas 14 para que eles possam estar fornecendo informações sobre os clientes finais. A segunda é escolher melhor os canais de marketing, de modo que a empresa deixe de gastar dinheiro com aqueles que não são clientes potenciais ou que não geram lucro. Este mesmo autor afirma que as instituições financeiras já perceberam o valor que o CRM pode trazer para a empresa. Os bancos criaram serviços e produtos customizados que dão motivos para os clientes permanecerem fiéis. Este é um ótimo exemplo do papel que a tecnologia pode exercer, facilitando a comunicação com os clientes, através de múltiplos canais. A última indústria na qual Newell (2000) mostra as particularidades e as vantagens da implantação do CRM é a mídia. Na mídia, o CRM fornece duas oportunidades: aumentar o envolvimento do público para reduzir a queda na audiência e ajudar os anunciantes identificando quem são os melhores clientes para os seus produtos específicos. O autor afirma que mesmo os meios de comunicação de massa devem tentar desenvolver um relacionamento com os seus clientes, pois os anunciantes preferirão utilizar os meios onde eles sabem para quais clientes estão falando. Mesmo com todo o planejamento e seguindo todos os passos para implementar o CRM com sucesso, um componente e que não deve ser esquecido é o comprometimento da empresa como um todo. Davids (1999) afirma que uma das maiores causas de falhas na implementação do CRM é a organização da própria firma onde o programa está sendo implantado. Segundo o autor, alguns dos erros mais comuns são: não ter uma estratégia a priori, subestimar o grau de envolvimento necessário em toda a companhia, não buscar soluções fora da firma quando for necessário, demorar muito para operacionalizar o programa, não começar pequeno e superestimar o esforço necessário para começar. Pine II, Peppers e Rogers (1995) reafirmam a importância da empresa perceber que a implementação do CRM só é possível se houver uma mudança de mentalidade dentro dela própria. Ela deve ter consciência que a implantação 15 do relacionamento só é possível se, em vez de fazer produtos e empurrá-los para os clientes, ela passar a fazer o que os clientes pedem. Newell (2000) afirma que a implantação do CRM exigirá mudanças fundamentais dentro da organização, passando por todas as áreas. Para que o CRM seja mais facilmente vendido para a direção da companhia, é necessário que haja um defensor de nível sênior. O sucesso de CRM também requer a ampla comunicação em toda a empresa, de modo que todos os participantes o vejam como um benefício para eles e seus clientes. O relacionamento com o cliente deve se tornar parte da marca da firma. Para que a implantação seja monitorada com sucesso, novas medidas de avaliação serão exigidas. Elas devem revelar o valor que o relacionamento está trazendo para a empresa e para os seus clientes, e não se basearem em resultados financeiros de curto prazo. Stone, Woodcock e Wilson (1996) observam que muitas organizações quando adotam o marketing de relacionamento não desenvolvem uma cultura interna (com atitudes e estruturas organizacionais) para administrar os diferentes tipos de relacionamento que serão necessários. Com isso, elas não usufruem todos os benefícios do relacionamento. Taurion (2001b) faz o alerta: é necessário que a empresa entenda que não adianta colocar a responsabilidade no departamento de marketing e deixar tudo como estava antes. É necessário comprometimento e tempo para o relacionamento produzir os frutos esperados. Entretanto, mesmo havendo o comprometimento da empresa e seguindo-se todos os passos sugeridos na implantação de uma política de relacionamento com o cliente, o sucesso não é obtido de um dia para o outro. Ele precisa ser continuamente monitorado. O relacionamento se desenvolve em etapas, e a implementação de CRM deve estar preparada para dar suporte à companhia em todos estes momentos. Segundo Stone, Woodcock e Wilson (1996) os diferentes estágios dos relacionamentos para os quais as empresas precisam estar preparadas são: 16 a. Recrutamento – Quando o cliente é visto como um cliente apropriado para a firma e é induzido a juntar-se a ela; b. Boas Vindas – Depois de juntar-se, é necessário que a empresa se assegure que o cliente realmente esteja integrado a companhia; c. Aquisição de conhecimento – Este estágio é essencial, pois é quando ocorrem as primeiras trocas de informações entre ambos; d. Administração da conta – É quando o relacionamento já está estabelecido e cabe à empresa mantê-lo, continuando a obter informações atualizadas sobre os clientes. É o estágio ideal, que todas as organizações buscam ter com seus clientes mais lucrativos; e. Cuidado intensivo – Quando o relacionamento com o cliente apresentou algum problema é necessário dar-lhe uma atenção especial para se ter certeza de que ele retornará a relacionar-se com a empresa; f. Divórcio potencial – A insatisfação do cliente é tanta que o divórcio é iminente; g. Divórcio – Apesar do cliente estar afastado da empresa, é possível que após algum período de esfriamento dos ânimos, ele volte; h. Retorno – Se o divórcio foi causado por altos preços ou por um produto errado é mais fácil contorná-lo de que se ele for causado por um serviço ruim (a não ser que o dos concorrentes seja pior). II.1.5. Cálculo do valor de um cliente Como pôde ser reparado, uma das primeiras tarefas a serem realizadas na implementação de CRM é o cálculo do valor de seus clientes ao longo do relacionamento. Buttle (2001) afirma que existem quatro tipos de clientes estrategicamente importantes, e que as empresas deveriam se esforçar para cativá-los: a. Clientes fiéis, que compram em grandes volumes e suas exigências não são maiores que sua lucratividade para a empresa; 17 b. Clientes que têm poder de influência sobre as outras pessoas; c. Clientes que fazem críticas construtivas e ajudam as empresas a detectar e corrigir seus defeitos; d. Clientes cujo atendimento envolve o dispêndio de um custo fixo, deste modo eles entram na divisão dos custos totais, diminuindo o custo de atendimento dos demais. Para Knox (1998), as empresas deveriam segmentar sua base de clientes segundo a sua fidelidade com a organização. O desenvolvimento de clientes deve capitalizar o envolvimento com o cliente quando este for presente e explorar a indiferença dos clientes quando for lucrativo. Essencialmente isto significa que os mais lucrativos devem ser apoiados em seus comportamentos e crenças com um pacote de benefícios que represente o valor econômico estimado que eles têm para a empresa. Estes clientes leais tendem a gastar mais com as empresas preferidas e servem como fonte de novos clientes. Por outro lado, os clientes sem valor devem receber o tratamento inverso. Uma vez identificados, os recursos que antes eram direcionados para eles devem ser seletivamente racionalizados e direcionados para os mais lucrativos. Newell (2000) concorda que o CRM não deve ser dirigido para todos os clientes da empresa. O verdadeiro objetivo do CRM é detectar os melhores e os potencialmente melhores, para que ela possa focalizar os seus esforços nestes grupos. A retenção começa com o recrutamento dos clientes certos. Normalmente, observa-se que menos de 1% dos clientes é responsável por quase 10% das vendas, e uma participação ainda menor contribui com 10% do lucro total de uma empresa. Segundo a filosofia do CRM, os melhores clientes são o ativo mais valioso de uma organização. Uma imensa participação de mercado nem sempre garante altos lucros. O segredo não é obter muitos clientes. É conseguir os clientes certos e mantê-los. Seguindo esta linha de raciocínio, Davids (1999) afirma que um dos grandes erros cometidos por empresas na construção do CRM é o não questionamento de qual será a contribuição deste relacionamento para a própria empresa. O 18 autor alerta que, apesar do cliente ter sempre razão, ele não é sempre lucrativo e por isso, um programa eficaz de CRM precisa considerar o seu valor ao longo de sua vida. Pine II, Peppers e Rogers (1995) também alertam para a importância do aumento da lucratividade obtido através do cálculo do valor do cliente ao longo de sua vida. Segundo os autores, a estratégia de pagamentos é um dos componentes principais que devem ser pensados quando se vai construir um relacionamento. Por isso, as empresas devem decidir com cuidado qual o nível de relacionamento que vale a pena. Stone, Woodcock e Wilson (1996) também falam sobre a importância do cálculo do valor do cliente para a companhia. Conforme os autores, o modo tradicional de administrar os clientes tem como objetivo tentar atingir qualquer um que queira comprar os produtos e administrá-los da mesma maneira. Só se faz exceção para os maiores. Esta forma de gerenciar os clientes está ultrapassada. Na realidade, as empresas deveriam deixar de trabalhar com os que nunca serão lucrativos e manter o foco no recrutamento e manutenção daqueles que possuem alto valor no longo prazo. Some nte assim elas aumentariam sua força competitiva e a lucratividade. Conforme o artigo publicado pela Qube Consulting (2001), calcular o valor monetário de um cliente é fundamental pois torna possível identificar quem são os mais lucrativos e nestes concentrar os esforços. O CRM não se justifica somente pelo fato de reter mais clientes, ele só é viável se for possível aumentar a lucratividade da empresa aumentando a fidelização dos consumidores. Ainda segundo a consultoria, conseguir prever o valor de um cliente também ajuda a responder muitas perguntas que normalmente aparecem quando se pensa em realizar um plano estratégico voltado para a sua retenção: a. Qual será o aumento na retenção de clientes se for feita uma intervenção ativa neste sentido? b. Como a retenção vai se refletir nas vendas? 19 c. Quais os segmentos de clientes devem ser focalizados na retenção? d. Deve-se gastar em marketing ou em operações para conseguir atingir o objetivo? Como último aviso sobre a importância da segmentação dos clientes conforme o valor que trazem para a organização, fica a constatação de Anderson, Fornell e Lehmann (1994) de que apesar de ser intuitivamente esperado, nem sempre market-share e satisfação dos clientes andam lado a lado. Se por um lado o aumento da base de clientes traz economias de escala, por outro ele dilui as possibilidades de tratamento diferenciado, contribuindo para a insatisfação dos clientes. II.1.6. Criação de valor para os clientes Outra condição essencial muito citada para o perfeito funcionamento do relacionamento, é a criação de valor para o cliente. Davids (1999) afirma que o CRM não deve ser visto como um programa de vendas, pois o cliente só dará as informações necessárias se perceber que receberá algo em troca. Davids (1999, p. 23) utiliza colocação de Arthur Hughes, vice-presidente da Database Marketing: “você têm que ser capaz de imaginar o seu cliente dizendo „eu sou grato por vocês estarem fazendo isto porque ...‟ – e você sabe quais são estas razões”. 4 Anderson e Naurius (1998) afirmam que saber quais os ele mentos que seus clientes valorizam é importante pois ajuda a: a. Administrar os produtos já oferecidos pela empresa – Às vezes itens considerados da fábrica, deveriam ser vendidos como acessórios somente para quem os deseja, pois assim muitos clientes que não os necessitam poderiam receber um desconto no preço. 4 Tradução livre do autor deste projeto. 20 b. Desenvolver novos produtos – É importante saber se o cliente está realmente disposto a pagar a diferença de preço para receber um novo serviço. c. “Ganhar” os clientes – A empresa passa a oferecer propostas de valor persuasivas. d. Sustentar o relacionamento com o cliente – O relacionamento com o cliente deve ser baseado em confiança e empenho. A aplicação do CRM ajuda a mostrar que a empresa está comprometida nesta relação. Fournier, Dobscha e Mick (1998) constatam que infelizmente, ao olhar mais de perto o fenômeno dos relacionamentos entre empresas e clientes, percebese que nem tudo está perfeito pois as empresas não estão sendo capazes de criar benefícios para seus clientes. Quando se conversa com as pessoas sobre sua vida de consumidor, ouve-se muita reclamação sobre confusões, estresses, insensibilidade e manipulação de mercado, fazendo-as se sentir vítimas e enganados. Os autores mostram o relacionamento de marketing do ponto de vista do cliente: a. O número de relacionamento um para um que as empresas pedem para os consumidores manterem é insustentável. O resultado é que muitas iniciativas parecem triviais e inúteis, em vez de únicas e valiosas; b. Existe um balanço entre dar e obter um bom relacionamento. Mas quando as empresas pedem a amizade, a lealdade e o respeito de seus clientes elas freqüentemente não dão amizade, lealdade e respeito em troca. c. Companhias falam de importância em se medir o valor de cliente. Entretanto algumas vezes eles se sentem em desvantagem devido à sua lealdade. Outras vezes, a preocupação das empresas com os clientes mais lucrativos deixa os outros clientes lucrativos se sentindo excluídos e desapreciados; 21 Segundo os autores, as regras universais da amizade são: dê suporte emocional, respeite a privacidade, preserve a confiança e seja tolerante com outras amizades. As empresas violam todas estas regras. As organizações precisam se comportar de modo que demonstrem para os clientes que elas podem ser valiosas com parceiras. Elas devem provar através de ações que o marketing de relacionamento não precisa ser vazio, sem significado ou estressante. A verdadeira intimidade com o cliente necessita um profundo conhecimento de contexto no qual os produtos e serviços são usados no seu dia-a-dia. Newell (2000) afirma que a maioria dos programas de fidelização fracassa porque uma organização de marketing não sabe como o cliente se beneficia deles. Muitas empresas acham que um cartão de fidelidade é suficiente para deixá-los satisfeitos. A maioria dos programas de fidelização já não é especial. Qualquer programa de pontos ou de descontos pode ser imitado rapidamente pelo concorrente e a empresa que tiver mais recursos financeiros acabará saindo com vencedora. O verdadeiro CRM deve se concentrar no que o cliente valoriza, e não no que a empresa deseja vender. Segundo o autor, todo contato ou comunicação com o cliente deve ser positivo, do ponto de vista do cliente. As empresas devem prestar atenção em quatro recados fundamentais passados pelos clientes ao implementar o CRM: a. Os clientes exigem pré-requisitos mínimos para fazerem negócios com uma empresa. Estes pré-requisitos funcionam como elementos qualificadores. Sem eles, os clientes não fazem negócios, mas as organizações não devem contar com eles para construir a fidelidade; b. Além de oferecer o mínimo necessário, as firmas devem se esforçar continuamente para oferecer valor para os clientes. Somente assim elas conseguirão se diferenciar das outras empresas que também ultrapassam os pré-requisitos básicos; c. Uma das maneiras de aumentar o valor do serviço oferecido pela empresa é acabar com os procedimentos que irritam os clientes. Muitas vezes, estes procedimentos são tradicionais na indústria, mas do ponto 22 de vista do cliente só atrapalham o relacionamento. Os clientes irão preferir as empresas que eliminam estes procedimentos; d. Muitas das iniciativas que as empresas pensam estar agradando passam desapercebidas. Para saber quais esforços serão percebidos como valiosos pelos clientes, as empresas devem realizar pesquisas. O procedimento correto de criação de valor para os clientes deveria ser: a. Identificar os valores do consumidor que são pertinentes à sua empresa. b. Entender a importância relativa desses valores a cada segmento de cliente. c. Determinar se esses valores afetarão o resultado financeiro positivamente. d. Comunicar e oferecer os valores adequados a cada segmento. e. Medir os resultados e fornecer retorno sobre o investimento (ROI). Stone, Woodcock e Wilson (1996) dão algumas sugestões de como as empresas podem fazer o cliente perceber o valor que receberão com o relacionamento: a. Criar uma marca que passe confiança; b. Mostrar os benefícios e as vantagens dos diferentes tipos de relacionamento; c. Promover diversos modos de acesso dos clientes a seus produtos; d. Garantir que os clientes possam facilmente ter acesso às informações sobre o relacionamento e seus benefícios. Kelly (2000) concorda que para se manter um cliente por toda a vida deve-se começar por vendê-lo o produto correto, pelo preço certo e para as necessidades certas. As empresas devem ter em mente que os clientes querem fazer negócio do jeito que lhes convier, sempre, e preferem comandar a compra. Eles também gostam de receber avisos de que são apreciados pela 23 companhia. Para mantê-los, as empresas devem: atender sempre suas necessidades cultivando a sua felicidade e antecipar os seus desejos futuros. Ou seja, o segredo para maximizar o valor dos clientes pode ser resumido em atendê-los do jeito que eles querem ser atendidos. Para implantar esta estratégia de maximização do valor do cliente, as empresas devem primeiramente analisar o produto que oferecem e em seguida analisar o mercado. O próximo passo é analisar os canais de distribuição. O objetivo final é: vender os produtos mais lucrativos para os mercados mais lucrativos através dos canais de distribuição mais baratos. Dado que a criação de valor é um pré-requisito fundamental para o sucesso do CRM, a comunicação com os clientes também deve ser feita de modo que lhes seja favorável. Newell (2000) afirma que esta comunicação deve ser planejada, trazendo algum benefício para eles, tais como: informações vitais, o reconhecimento da importância do cliente, atenção personalizada e uma noção de amizade. A empresa deve adotar uma postura pró -ativa e ter um plano de comunicação para cada cliente, e até mesmo para os ex-clientes e para os potenciais. Jamais se deve esquecer que o diálogo é a palavra mais importante no léxico do CRM, mas este diálogo deve ser nos dois sentidos. Resumindo toda esta questão sobre a importância da criação de valor para o cliente, Newell (2000) afirma que as empresas devem saber que suas ações contarão mais de que suas palavras e que o CRM no fundo consiste na prestação de um serviço. E por isso, é necessário surpreender sempre os clientes, incorporando aos produtos serviços que lhes tragam valor. II.1.7. O papel das novas tecnologias Como já foi dito, as novas tecnologias desempenharam um papel fundamental no desenvolvimento do CRM. Segundo Evans (1997), quando a informação se propagava somente através de meios físicos, havia uma lei básica: o trade-off entre riqueza e alcance. Alcance significa o número de pessoas que trocam a informação. Riqueza é a qualidade desta informação, e pode ser definida por três aspectos: largura da 24 banda, customização e interatividade. Este trade-off acabou com o surgimento dos meios de comunicações eletrônicos. Entretanto, apesar de todos os negócios serem afetados pela mudança na economia da informação, nem todos serão com a mesma intensidade. No caso do relacionamento entre empresas e cliente, os principais impactos das novas tecnologias são: a. O poder de barganha mudará como resultado de uma redução na possibilidade de monopolizar o controle da informação; b. O custo de mudança para os clientes diminuirá, e as empresas terão que desenvolver novos métodos de promover a lealdade dos clientes. Stone, Woodcock e Wilson (1996) fazem uma observação com relação ao comportamento dos usuários destas novas tecnologias. Eles afirmam que estes clientes são: mais freqüentes, adaptativos, não possuem tecnofobia e possuem um nível de renda maior. Por isso, eles seriam muito atraentes para as organizações. Peppard (2000) afirma que a promessa do marketing um para um, a análise de valor do cliente e a customização em massa se tornaram possíveis graças aos avanços nas tecnologias e nas comunicações. O autor também ressalta que a tecnologia permite que se alcance os clientes de diversas maneiras: internet, TV digital, cartões inteligentes, telefones e quiosques. E que é necessária a troca perfeita de informação entre estes canais, fato nem sempre observado nas companhias. Pine II, Peppers e Rogers (1995) afirmam que a tecnologia permite dois avanços: a. Customização em massa: a empresa é capaz de fornecer produtos e serviços customizados para seus clientes. Este é exatamente o oposto da produção em massa focada no produto, paradigma vigente em muitas empresas onde a empresa deve empurrar seus produtos através dos canais de distribuição, para assim atingir seus consumidores. 25 b. Marketing um para um: a empresa adquire informações sobre os desejos e necessidades dos seus clientes, e faz a comunicação com eles baseada nestas informações. Este é o oposto do marketing de massa, onde se usa a tecnologia de informação para definir o cliente padrão. Em seu artigo original, Pine, Victor e Boynton (1993) definem a customização em massa como um mundo onde a imprevisibilidade de cada cliente pode ser considerada uma oportunidade que para ser explorada. As organizações poderão estar constantemente gerando novos produtos. Qualidade e custos baixos, assim como customização e custos baixos, eram considerados antônimos. Mas com a customização em massa, percebeu-se que era possível ultrapassar este modelo de trocas: as empresas poderiam ter ambos. Em um ambiente de customização em massa, ninguém sabe ao certo o que os clientes desejarão, e por isso não sabem quais os produtos que devem ser criados. Ninguém sabe qual a janela de mercado que se abrirá, e conseqüentemente, ninguém pode criar uma visão de longo prazo sobre os seus produtos. Entretanto, todos sabem que os clientes desejarão algo, que esta oportunidade estará aí e que poderá ser explorada. As únicas ressalvas quanto à utilização da tecnologia são feitas por Davids (1999) e Apicella (1999). Segundo o primeiro autor, é necessário que as empresas sempre comecem a adotá-las em projetos pequenos, e somente ir crescendo aos poucos. Todos os passos devem ser precedidos de testes, para evitar falhas. Mas por outro lado, o segundo autor afirma que a implementação de uma tecnologia voltada para CRM pode ser um grande desafio, pois, se for muito demorada, aumenta as chances da empresa ser ultrapassada por seus concorrentes, ficar sem dinheiro e perder o interesse pelo projeto. E a internet também tem um papel importa nte nesta mudança de cenários. Segundo Sweat (2000), com o desenvolvimento da internet, os consumidores estão se tornando cada vez mais exigentes. Este fenômeno ocorre pois a rede mundial de computadores (através dos sites de informação, grupos de discussão e sites de comparação de preços) facilita a obtenção de informação sobre as companhias, seus produtos, serviços e preços, ajudando o cliente na 26 sua tomada de decisão. Entretanto, a internet também pode ajudar as empresas, pois estas podem conseguir mais informações sobre os seus clientes, possibilitando oferecer-lhes mais valor. Newell (2000) também fala do impacto das novas tecnologias no CRM. A internet terá um papel fundamental no relacionamento entre empresas e clientes. As organizações devem entender e aceitar a nova ordem econômica da Internet, e devem pensar nela como sendo mais do que um simples ecommerce. O valor da web não está na tecnologia, está nos benefícios que ela traz para as pessoas. A internet é importante pois ela será um canal onde será possível estabelecer diálogo com indivíduos, obtendo informação e ouvindo-os. A internet é um meio dos clientes fazerem negócios mais facilmente com uma firma, permitindo que ela reaja em tempo real. Outra facilidade da internet são os e-mails. Os clientes valorizam empresas que se comunicam através de emails, mas estes não devem ser utilizados somente de forma passiva. Eles devem permitir que a empresa converse individualmente com cada cliente em uma escala maciça. A comunicação por e -mail deve trazer valor para os clientes, por isso ela deve ser simples, curta e objetiva. Newell (2000) também ressalta a importância de outras tecnologias que não são tão recentes quanto a internet, mas que ainda oferecem oportunidades para serem exploradas: o telemarketing e os call centers. Eles devem ajudar na construção de relacionamentos por telefone com a confiança e o respeito mútuos. Eles devem fornecer informações úteis para os clientes, permitindo uma interação completa. Para isto, é importante manter o toque humano, pois o componente do contato é importante para o CRM. Newell (2000) também afirma que há alguns ensinamentos da relação entre tecnologia e CRM que devem ser sempre lembrados. Os profissionais de CRM precisam estar atentos às novas tecnologias, pois os avanços digitais de amanhã colocarão os dados do cliente nas mãos de todos. As empresas devem ser capazes de adivinhar o que o cliente quer antes mesmo dele saber. Para isso será necessário um gerenciamento criativo para desenvolver o CRM 27 mais valioso ao cliente. Ao adotar novas tecnologias, a empresa deve sempre tentar responder a três perguntas: a. Por que adotá-la? b. Qual é a promessa para o cliente? c. O que se quer que ela faça? Neste ambiente de constantes mudanças tecnológicas, a capacidade de aprender mais rápido do que seu concorrente será a única vantagem sustentável. E para isto o feedback ao cliente terá um papel fundamental. II.2. EXTRAÇÃO DO C ONHECIMENTO II.2.1. O papel dos bancos de dados (database marketing) Segundo Ha e Park (1998), database marketing é um processo de marketing voltado para a informação. Gerenciado através de tecnologias de bancos de dados, ele proporciona aos profissionais de marketing a possibilidade de desenvolverem, testarem, implementarem, medirem e modificarem programas e estratégias de marketing personalizado. Alguns dos efeitos do database marketing são: a. Conhecer mais sobre os vários tipos de clientes da companhia, e determinar a possibilidade deles comprarem ou não determinados produtos ou serviços; b. Facilitar o alcance dos clientes com produtos e ofertas certas, no momento certo; c. Permitir a atualização contínua da informação no banco de dados, possibilitando o desenvolvimento de futuras estratégias de marketing baseadas nos resultados das campanhas anteriores; 28 d. Ajudar a desenvolver serviços que aumentem a possibilidade dos clientes comprarem mais, e a estabelecer uma comunicação bilateral com o cliente através de uma variedade de canais de contatos. Jackson e Wang (1994) afirmam que o ambiente atual dificulta a interação entre as firmas e seus clientes, e que a utilização de novas tecnologias em busca de informações sobre os clientes pode ser uma solução. Segundo os autores, a propaganda através dos meios de comunicação está mais cara e mais ineficiente, pois não permite que a empresa fale especificamente com seu público alvo. Dentro deste cenário, as empresas devem descobrir novos meios de se comunicarem diretamente com seus clientes. A utilização da informação obtida através dos bancos de dados é uma alternativa. Os autores listam uma série de benefícios provenientes da utilização de bancos de dados: a. Identificar quais são os seus melhores clientes; b. Desenvolver novos clientes; c. Enviar uma informação consistente com o seu produto e seus clientes; d. Reforçar as decisões de compras de seus cons umidores; e. Promover a venda cruzada e a venda complementar de produtos; f. Melhorar a comunicação com os clientes; g. Melhorar as promoções de vendas; h. Refinar o processo de marketing; i. Aumentar a eficácia dos canais de distribuição de marketing; j. Manter o poder da marca; k. Estabelecer uma administração de recursos; l. Se comunicar sigilosamente com seus clientes; m. Conduzir pesquisas de marketing, produtos e clientes; 29 n. Personalizar o serviço ao consumidor; o. Promover a sinergia e a integração de programas. Peppard (2000) também ressalta a importância das informações contidas em bancos de dados. Para o autor, com as informações dos clientes, as firmas devem ser capazes de: entender suas necessidades, diferenciá-los através da segmentação, prever a possibilidade da sua perda e realizar análises sobre sua lealdade, lucratividade e rentabilidade, sobre rentabilidade e eficácia dos canais e sobre performance das campanhas de vendas. Sanders e Mertzer (2001) também enumeram as vantagens de se ter informações guardadas em um data warehouse. Segundo o autor, para conseguir reter seus clientes as empresas devem saber responder à seguinte pergunta: quais os produtos, ou serviços, que devem ser oferecidos, para quais grupos de clientes, através de quais canais de distribuição, de modo que maximize o lucro? O data warehouse ajuda a responder estas perguntas fornecendo informação sobre quem são os seus clientes (permitindo servir-lhes melhor) e sobre de onde vem os maiores lucros da empresa (permitindo maximizá-los). O data warehouse permite guardar informações como os nomes e os endereços dos clientes. Com estes dados é possível tratá-los os clientes como indivíduos, identificando quais os produtos que eles compram da empresa, e até diferenciando os membros de uma mesma família. Para demonstrar as oportunidades que a utilização de bancos de dados oferece, Kish (2000) utiliza o exemplo das instituições financeiras. A cada ano os bancos perdem entre 15 e 25 por cento de seus clientes e são obrigados a gastar milhões de dólares para reconquistá-los e recrutar novos clientes. Por isso, é hora dos bancos desenvolverem estratégias mais agressivas para acabar com o descontentamento, principalmente entre os clientes mais valiosos, criando programas de administração do atrito baseados em novas tecnologias. A utilização de banco de dados possibilitaria às instituições financeiras mapearem e interpretarem o mais acurado indicador de probabilidade de deserção: a inatividade dos clientes. Através dos bancos de dados, as instituições seriam capazes de: 30 a. Obter informação continuamente de todos os canais de comunicação que os clientes utilizam para interagir com os bancos; b. Criar um perfil atual para cada cliente que sirva de base para cada comportamento individual normal; c. Monitorar e interpretar a atividade e a i natividade dos clientes; d. Reconhecer quando o comportamento de um cliente mudar, indicando um momento de risco; e. Comparar as mudanças de comportamento individual, histórico e característico, para reconhecer níveis de risco e determinar as respostas apropriadas; f. Avisar continuamente quem são os clientes em risco e os seus perfis; g. Responder em tempo real sempre que necessário, tanto nas ameaças quanto nas oportunidades. Implantando estes programas, os bancos seriam capazes de detectar os clientes que exibem comportamento de risco, permitindo que atitudes sejam tomadas antes da deserção acontecer. Estas tecnologias são eficazes pois vêem os clientes como indivíduos e conhecem seu comportamento normal, detectando qualquer período de inatividade. Em 30 dias é possível para uma instituição financeira criar um perfil do consumidor que reflita suas rotinas regulares, suas preferências e características (tudo isto através de padrões históricos). Para construir o banco de dados, um passo fundamental é a obtenção dos dados. Davids (1999) afirma que as empresas devem aproveitar todas as interações com os clientes para obter novas informações. Pine II, Peppers e Rogers (1995) afirmam que há varias maneiras de se obter informação sobre seus clientes, entre elas: quiosques, serviços on-line e correspondência. É importante que a empresa tenha consciência de que o gosto dos clientes não é estático, podendo variar com o passar de tempo, e, por isso, qualquer contato com o cliente deve servir como fonte de novas informações. 31 Segundo Berson, Smith e Thearling (1999), há três tipos de dados sobre os clientes que interessam às organizações: a. Descritivos – Tentam responder a seguinte pergunta: quem é o cliente? Os dados descritivos não variam muito e podem ser atualizados trimestralmente ou semestralmente; b. Promocionais – Tentam responder a seguinte pergunta: o que foi feito com o cliente? A obtenção destes dados depende da sofisticação do sistema CRM; c. Transacional – Tentam responder a seguinte pergunta: como o cliente reagiu às promoções? Estes dados variam muito e precisam ser continuamente coletados. Um grupo de dados que tem sido muito trabalhado para detectar o padrão de consumo de clientes são as variáveis RFM (recency, frequency, monetary). Ha e Park (1998), que as utilizou no seu trabalho, explica cada um dos termos do RFM: d. Recência (recency) – Mede o período de tempo decorrido desde a última compra realizada pelo cliente; e. Freqüência (frequency) – Mede o número de compras feito pelo cliente em um determinado período de tempo; f. Valor monetário (monetary) – Mede o volume monetário gasto pelo cliente durante um certo período de tempo. Hughes (1996) complementa, afirmando que a grande vantagem do RFM é a sua facilidade de implementação. Comparando a segmentação demográfica (que fornece informações sobre quem são os clientes) com o RFM (que fornece informações sobre o que eles fazem), este último apresenta resultados melhores pois, quando se faz uma campanha de marketing, o objetivo final é descobrir o que seus clientes irão fazer, e não quem eles são. 32 Newell (2000) também ressalta a importância do controle do valor financeiro, da freqüência e da recência das compras feitas pelos clientes. Entretanto, para o autor, estes dados devem ser utilizados de uma forma diferente, visando entender melhor o que um cliente valorizará em um relacionamento com sua empresa. Para isto, não bastam só as ferramentas, é necessário e importante desenvolver ou contratar os profissionais certos. O autor também lembra a importância da privacidade na construção de um relacionamento baseado em confiança. Em geral, as pessoas temem o que não entendem, e não sabem muito sobre database marketing. Por isso os relacionamentos devem ser construídos com base na confiança. A informação sobre os clientes é um combustível para os negócios, sendo necessária uma atenção enorme para evitar vazamentos de informação. Pine II, Peppers e Rogers (1995) concordam sobre a importância da questão ética e da privacidade que os clientes merecem. Dada a importância de um banco de dados, ele deve ser considerado um ativo muito valioso, e que por isso não deve ser negociado. Berson, Smith e Thearling (1999) também afirmam que a privacidade é uma questão importante na política de obtenção e tratamento dos dados dos clientes. Como ainda não há leis para todos os casos envolvendo a questão da privacidade em banco de dados, as empresas devem ser cautelosas, evitando tomar atitudes que possam trazer problemas no futuro. Para evitar problemas com privacidade algumas sugestões são: a. Tentar manter o anonimato e a identidade dos clientes – Deve-se evitar a associação dos dados com o nome ou o número de identidade do cliente; b. Trabalhar com dados consolidados, em vez de detalhados – Muitas vezes para se obter o mesmo resultado não é necessário trabalhar com dados individualizados, podendo-se agrupar os dados de uma determinada variável. c. Usar a informação somente para medir e não para manipular o comportamento do cliente – Apesar de ser difícil determinar até onde vai 33 a medição e a partir de que momento começa a manipulação, os clientes aceitam quando percebem que a informação é utilizada para complementar as suas vidas. Contudo, eles não gostam quando acham que estão sendo manipulados. II.2.2. Definição de Data Mining Segundo Ha e Park (1998), o termo data mining tem significados diferentes na academia e no mundo de negócios. Na academia o data mining é somente uma etapa no processo de procura de padrão nos dados, enquanto que no mercado ele é visto como todo o processo de descoberta de conhecimento. Pode-se verificar esta confusão comparando a definição de diversos autores para o termo data mining. Entre os autores que utilizam a definição de mercado, pode-se citar: Data Distilleries (2000), Ha e Park (1998), Newell (2000) e Taurion (2001). “Data mining é a descoberta de conhecimento interessante, mas escondido em grandes bases de dados. Bases de dados corporativas freqüentemente contêm tendências desconhecidas, relações entre objetos, como clientes e produtos, que são de importância estratégica para a organização.” (Data Distilleries, 2001, p. 8). “Data mining, que também é conhecido como descoberta de conhecimento em banco de dados, é uma ciência emergente que aplica tecnologias modernas de estatística e inteligência artificial ao problema de extração de informações válidas, previamente desconhecidas, compreensíveis e passíveis de ação contidas em bancos de dados e utiliza-as na tomada de decisões cruciais para os negócios.” 5 (Ha e Park, 1998, p. 1). “O processo de extrair informações a partir de dados é o que chamamos de data mining. (...) O data mining é a descoberta de conhecimento.” (Newell, 2000, p. 121 e p. 126) “Tecnologia data mining é o conjunto de ferramentas que permitem manipulações e análises estatísticas em cima de bases de dados, buscando extrair e identificar relacionamento entre estes dados. (...) Uma ferramenta de data mining pode ser uma arma poderosa para extração de informações úteis perdidas em toneladas de dados aparentemente sem relacionamentos entre si. E por outro lado, um uso incorreto desta 5 Tradução livre do autor deste projeto. 34 tecnologia pode gerar muito mais confusão, levando a empresa a tomar decisões erradas.” (Taurion, 2001a, p.1). Já entre os autores que preferem a definição acadêmica, pode-se citar: Berson, Smith e Thearling (1999) e Saarenvirta (1998). "Data mining, em uma definição simples, automatiza a detecção de padrões relevantes em um banco de dados. (...) Data mining utiliza técnicas bem estabelecidas de estatística e de aprendizado de máquinas para construir modelos que prevêem o comportamento do consumidor.” 6 (Berson, Smith e Thearling, 1999, p. 6). “Um processo que as companhias podem usar para transformar seus dados operacionais em informação úteis no processo de decisão é o data mining. Este processo, utilizando ferramentas avançadas de inteligência artificial e de machine-learning, pode aumentar a lucratividade corporativa através da redução dos custos e do aumento das receitas.” 7 (Saarenvirta, 1998, p.9). Data mining pode ser entendido melhor através da analogia da mineração feita por Berson, Smith e Thearling (1999): há uma montanha de dados (data warehouse) e o objetivo é achar as pedras preciosas (informações relevantes) nesta montanha, as ferramentas de data mining ajudam nesta mineração da informação. Observando todas as definições, pode não ficar claro a difere nça entre o data mining e a estatística. Segundo a consultoria Data Distilleries (2001), apesar do data mining utilizar técnicas estatísticas e de machine-learning, ele difere de técnicas estatísticas porque, ao invés de verificar padrões hipotéticos, utiliza os próprios dados para descobrir tais padrões. O data mining explora as bases de dados através de dezenas de centenas de pontos de vista diferentes. Berson, Smith e Thearling (1999) afirmam que o data mining não é somente estatística. Analisar dados para melhor entender um negócio é uma tarefa que já vem sendo feita há muito tempo, entretanto o data mining viabiliza esta análise quando o volume de dados é muito grande. As principais vantagens do data mining em relação à estatística são: a facilidade de utilização pelas 6 Tradução livre do autor deste projeto. 7 Tradução livre do autor deste projeto. 35 pessoas de negócios, não precisando ser estatístico para entendê-lo, e o fim da necessidade dos dados circularem entre os diversos departamentos da firma antes de serem convertidos em informação. Apesar da estatística e do data mining serem técnicas que possuem os mesmos objetivos e utilizam a mesma base para alcançá-los (os dados), o data mining é mais robusto e por isso pode ser utilizado por pessoas não experts. II.2.3. Benefícios do Data Mining O primeiro grande benefício do data mining é o acesso à informação. Berson, Smith e Thearling (1999) constatam que o data mining pode revelar informações que os usuários não desconfiavam que existissem. Para os autores há duas maneiras possíveis de lidar com essas informações: aceitá-las como uma caixa preta ou questioná-las. Entretanto, somente através do questionamento que se consegue compreendê-las, e o data mining ajuda nesta tarefa. Para Data Distilleries (2001), graças à tecnologia da informação a empresa consegue diferenciar: os seus dados, as suas análises, a interação com os clientes e a sua produção. E o data mining ajuda nesta diferenciação e ainda tem as seguintes vantagens: a. Os modelos são de fácil compreensão; b. As grandes bases de dados podem ser analisadas; c. Informações que não se esperava podem ser descobertas; d. As variáveis não necessitam ser preparadas; e. Os modelos são precisos; f. Os modelos são construídos rapidamente. Esta busca por informações escondidas pode ser implementada em diversas áreas da organização. Para Berson, Smith e Thearling (1999), as principais áreas onde o data mining pode ser aplicado são: 36 a. Retenção de clientes; b. Serviços de vendas e para clientes; c. Marketing; d. Detecção de fraudes e medição de risco; Saarenvirta (1998) também identifica as principais oportunidades para a utilização do data mining. Entre elas o autor cita: a. Lucratividade e segmentação dos clientes; b. Marketing dirigido; c. Análise e separação de clientes; d. Administração do risco de crédito; e. Prevenção à fraudes e abusos; f. Análises de vendas cruzadas; g. Lucratividade de produtos e carteiras; h. Serviço ao consumidor. Como é possível perceber, muitas das aplicações estão voltadas para o marketing e para o CRM. Isto acontece devido ao valor contido nestas novas informações que podem ajudar a melhorar o relacionamento da companhia com os seus clientes. Berson, Smith e Thearling (1999) afirmam que o mundo de negócios está cada vez mais difícil para as empresas e, para conquistar seus clientes elas precisarão fazer: a oferta certa, para a pessoa certa, no momento certo e através do canal certo. O data mining é a ferramenta que pode ajudar as organizações a melhorar esta interação com os seus clientes. Analisando a utilização do data mining em programas de marketing e CRM, o autores destacam os seguintes benefícios: a. Aumento na receita; 37 b. Aumento dos lucros; c. Diminuição dos custos; d. Retorno sobre investimentos (ROI); e. Criação de vantagem competitiva; f. Pioneirismo ao se adotar uma nova tecnologia. Já segundo Jackson e Wang (1994), o impacto da utilização e da integração de bancos de dados na estratégia das empresas depende do estágio de implementação. Há três estágios: a. Dados históricos e sistemas de administração – É a utilização dos bancos de dados de marketing que visam somente auxiliar programas de correspondência com os consumidores. É considerado um uso passivo dos bancos de dados. b. Bases de dados como auxilio à inteligência de marketing – O banco de dados possui mais informações que no caso anterior. A empresa utiliza os dados no auxilio à tomada de decisões de marketing. c. Fonte integrada de negócios – O banco de dados serve como guia para todas as decisões da empresa, não somente as decisões de marketing. O banco de dados interfere nas decisões referentes ao serviço aos clientes, ao marketing, a vendas, à distribuição dos produtos, à pesquisa e às finanças das empresas. São muitas as maneiras de se conseguir estes benefícios da integração entre data mining e CRM. Para Feldens e Reategui (2001), os benefícios do data mining podem ser aplicados a três áreas: na relação das empresas com seus clientes, no aumento das vendas e do faturamento e na identificação de padrões de navegação e de perfis de usuários da internet. Na relação das empresas com os seus clientes, o data mining atua na: 38 a. Redução de atrito - Um projeto de redução de atrito visa identificar motivos de conflito com os clientes e definir ações para diminuição das taxas de atrito; b. Retenção através de downgrade - O princípio da retenção por downgrade é o de identificar clientes que utilizem produtos ou serviços da empresa que estejam superdimensionados, e que por isso, têm tendência a procurar produtos ou serviços da concorrência; c. Prospecção de clientes qualificados - O principal objetivo da prospecção de clientes qualificados é a conquista de novos clientes. Isto pode ser alcançado através da identificação de perfis com alto potencial de consumo e da criação de modelos que possam ser usados para encontrar estes clientes em outras bases de dados. No aumento de vendas e faturamento, o data mining auxilia no: a. Projeto de cross-sales - O objetivo de um projeto de cross-sales é o de realizar ofertas de produtos e serviços de forma personalizada a cada cliente, aumentando a satisfação dos clientes e aproveitando oportunidades de vendas cruzadas nos diferentes momentos de venda; b. Projeto de up-sales - O objetivo de um projeto de up-sales é identificar clientes com poder de consumo maior do que o demonstrado até então, para que se possa criar e dirigir ações que visem o aumento de consumo destes clientes. Em relação à internet, o data mining permite a: a. Identificação de perfis e padrões de navegação – Através da identificação de perfis e padrões de navegação é possível personalizar o conteúdo, as ofertas e a estrutura do web site de acordo com o perfil do internauta. Já segundo Berson, Smith e Thearling (1999), as principais aplicações do data mining no CRM são: 39 a. Conquista de novos clientes – O data mining pode ajudar na tarefa da seleção de público alvo para as campanhas de marketing. O data mining ajuda a prever o comportamento de resposta dos clientes que seriam atingidos pelo programa de marketing, possibilitando a empresa escolher somente aqueles que têm maior probabilidade de responderem à sua campanha; b. Venda cruzada – Venda cruzada é o processo onde uma empresa oferece aos seus clientes novos produtos e serviços, complementando os seus desejos. O data mining atua prevendo o comportamento dos clientes e detectando as oportunidades de vendas cruzadas as quais os clientes têm maiores chances de responder; c. Retenção de clientes – O data mining ajuda a detectar o comportamento padrão dos clientes que abandonam a empresa. Com este modelo, a companhia pode prever quando um cliente está pretendendo deixar de fazer compras com ela, e atuar antes que esta perda seja consumada; d. Segmentação – O data mining ajuda na segmentação dos clientes de uma empresa. A segmentação permite que a firma analise sua base de clientes por um nível mais alto. Só por trazer a tona o conceito de diferenciação dos clientes, o processo de segmentação já é benéfico para a empresa. Apesar de todas os possíveis benefícios do data mining, nunca se deve esquecer o aviso dado por Newel (2000). O autor alerta que o data mining realmente permite que uma firma entenda melhor os dados que possui e assim adquira novos conhecimentos. Contudo, um dos segredos do seu sucesso não é a ferramenta em si, mas a habilidade e o poder da equipe que atua com as estas informações no desafio empresarial do dia-a-dia. II.2.4. Implementação e etapas do Data Mining Um momento importantíssimo na determinação do sucesso de um projeto data mining é a sua implementação. Para que ela seja perfeita, as companhias 40 devem conseguir integrar as três peças fundamentais citadas por Jackson e Wang (1994). As três peças são: os dados, a tecnologia e as técnicas estatísticas. Os dados servem de base para a obtenção da informação, que só será relevante e confiável se eles forem de boa qualidade, a tecnologia viabiliza todo o processo, e as técnicas quantitativas fazem a extração da informação. Esta integração e a extração do conhecimento não são obtidas facilmente. Diversos autores enumeram as diversas etapas que um projeto data mining deve ter para garanti-las. Apesar de não haver uma concordância quanto ao número de etapas, todos estão de acordo que a primeira é a análise da contribuição que o data mining pode trazer para o negócio e a última deve ser a aplicação e avaliação do conhecimento obtido. Saarenvirta (1998) contabiliza seis etapas: análise do negócio, análise dos dados necessários, implementação do projeto de data mining, aplicação nos negócios e análise dos resultados. Sendo que, deve-se ter uma atenção especial com: a. A escolha do hardware de data warehouse; b. O funcionamento do banco de dados e do data warehouse; c. A escolha dos produtos de transformação do data warehouse; d. As aplicações de data mining; e. O treinamento de pessoal. Para Berson, Smith e Thearling (1999), analisando-se somente o processo de extração do conhecimento, o data mining é composto por seis etapas (conforme mostrado na Figura 1): a obtenção dos dados, a seleção de um subconjunto específico de dados, o pré -processamento dos dados, a transformação dos dados, a aplicação dos modelos data mining para previsão e a interpretação humana visando a extração do conhecimento. 41 Dados Seleção Subconjunto específico de dados Pré-proc essamento Dados préprocessados Trans formação Dados formatados Data mining Modelos de previsão Interpretação humana Conhecimento Figura 1 Processo de extração de conhecimento Estes mesmos autores afirmam que o contexto do negócio também tem um papel importante antes da implementação do projeto. Este contexto deve estar claro para as pessoas envolvidas pois caso contrário, a probabilidade de que sejam cometidos erros aumenta. Esta visão mais holística e preocupada com os negócios sobre data mining é representada na Figura 2. Problema do negócio Definição de valor Definição de ROI (retorno sobre investimento) Dados Entender Definição dos dados Data mining Modelos de previsão Definição de valor Aplicação ROI previsto Desenvolver ROI Figura 2 Visão holística do processo data mining 42 Já Ha e Park (1998) descrevem o data mining como um processo interativo e iterativo, composto por nove etapas: a. Desenvolvimento e entendimento do domínio da aplicação e dos objetivos dos usuários finais; b. Criação de um grupo de dados alvo, selecionando um subgrupo ou focando em um subgrupo de variáveis onde o processo de descoberta será realizado. c. Pré-processamento e limpeza dos dados, envolvendo basicamente: remoção de dados espúrios ou outliers e gerenciamento de missing values. d. Transformação e redução dos dados; e. Escolha das técnicas a serem realizadas no processo data mining, entre elas: descoberta de regras associativas, clusterização, classificação, seqüenciamento e previsão; f. Escolha dos algoritmos, selecionando os métodos, os modelos e os parâmetros; g. Procura por padrões; h. Interpretação dos resultados obtidos nas etapas anteriores e possível retorno a uma destas etapas; i. Consolidação do conhecimento descoberto, incorporando este conhecimento no sistema ou documentando-o. E por último, Hui e Jha (2000) afirmam que o processo de implementação do data mining contém sete passos: a. Estabelecimento das metas do data mining – É o conhecimento do negócio da empresa; b. Seleção dos dados – É a identificação do grupo de variáveis onde o data mining será aplicado; 43 c. Pré-processamento dos dados – É a remoção das impurezas dos dados (dados incorretos ou desnecessários); d. Transformação dos dados – É a alteração do formato dos dados, já que muitas vezes eles estão armazenados de formas incompatíveis com as utilizadas no data mining; e. Data warehousing – É o processo de ter a visão, planejar, construir, usar, gerenciar, manter e expandir os bancos de dados; f. Data mining – Inclui as funções de resumo, associação, classificação, previsão e clusterização; g. Avaliação dos resultados – É a aplicação dos resultados no negócio da empresa. Dentro da etapa que muitos autores chamam de data mining ou descoberta de padrões, um procedimento essencial é a realização das previsões ou pontuação dos clientes. Berson, Smith e Thearling (1999) alertam que, na verdade, a previsão é o objetivo final do data mining. Normalmente este processo consiste em: identificação de um segmento interessante, pontuação dos clientes através do modelo de previsão, ordenação segundo a pontuação, escolha dos primeiro da classificação e envio destes selecionados para o departamento de marketing. Para minimizar os erros nesta etapa, os autores sugerem que as companhias devem se assegurar que: a. A definição de segmentação está correta e que os clientes certos foram selecionados para a pontuação; b. Os clientes certos foram pontuados; c. O modelo correto foi utilizado; d. A pontuação foi colocada no local correto dentro da base de dados; e. A forma como a pontuação deve ser ordenada foi entendida. O primeiro passo necessário para que este processo de previsão seja bem feito é a preparação dos dados, devendo-se verificar a consistência entre os 44 dados históricos e os que serão utilizados como previsores. Em seguida, devese mapear as variáveis que serão utilizadas como previsores, já que nem todas serão utilizadas. Há variáveis diretas, que são as mesmas que foram utilizadas na base histórica, e as que necessitam de ajustes (nesta categoria se enquadram as variáveis temporais, pois a cada mês é preciso alterar o mês da variável utilizada). O último passo importante neste processo de pontuação dos clientes é integrar o resultado da pontuação nas diversas aplicações da empresa. Mesmo estando cientes de todas as etapas que um projeto data mining deve conter, a implementação nem sempre é uma tarefa tranqüila. Visando ajudar as empresas, Berson, Smith e Thearling (1999) apontam dez passos que devem ser seguidos na implementação, pois facilitam a obtenção do sucesso final: a. Definir o problema – É importante definir onde ele será aplicado e como as metas serão atingidas. Facilita muito esta etapa se o projeto for bem focado e pequeno, mas é necessário que seja algo importante para o negócio e que por trás de tudo esteja a filosofia CRM; b. Definir o usuário – É importante saber quem será o usuário final, para que não ocorra um dos dois erros mais comuns: sistemas complexos demais para usuários não sofisticados, ou sistemas muito básicos para usuários sofisticados. Sabendo o perfil do usuário final será possível fornecer um sistema com o nível ótimo de sofisticação; c. Definir os dados – Não adianta o quão sofisticado é o programa se os dados não forem de boa qualidade. Acima de tudo, funciona a lei: Garbage In, Garbage Out (entra lixo, sai lixo). Para manter a qualidade dos dados é importante ter um local onde fiquem anotadas todas as características, descrições e alterações do banco de dados; d. Definir a integridade dos dados – É importante verificar a integridade dos dados que foram obtidos. Isto pode ser feito comparando as diferentes fontes de dados; 45 e. Definir o escopo do projeto – O projeto não deve perder o foco e crescer para áreas para o qual não foi planejado. Uma maneira de se evitar isto é criando um documento que deixe bem claro o escopo do projeto; f. Testar – Deve-se lançar um programa de teste pequeno e que dê liberdade aos usuários finais deve ser lançado; g. Garantir a segurança – Muitas pessoas não confiam nas novas tecnologias. Por isso, é necessário um programa que assegure a qualidade do projeto. Este programa deve funcionar tanto internamente, conferindo os resultados, como externamente, fazendo propaganda e diminuindo a tecnofobia dentro da empresa; h. Educar – Os usuários finais devem ser treinados para se familiarizarem com a nova tecnologia; i. Lançar – O lançamento só deve ser realizado após se ter certeza de que não há erros no programa. Os usuários iniciais devem ser escolhidos cuidadosamente, e não se deve relaxar enquanto os resultados não aparecerem. Nesta etapa de lançamento, é importante ajudar os usuários a entenderem e interpretarem os resultados; j. Continuar – O processo não pode ser encarado como pontual. Novos modelos precisarão ser criados, os velhos deverão ser arquivados e a performance precisará ser medida continuamente. Seguindo estas etapas, as organizações conseguem diminuir os principais custos de um projeto data mining citados por estes mesmos autores: a. Aquisição de dados; b. Infraestrutura física – Computadores, data warehouse, software de data mining e difusão dos resultados através da empresa; c. Pessoal – Data miner, Web designer, data designer, gerente de projetos, interface com o marketing e interface com o banco de dados; 46 d. Custos de manutenção – Software, hardware, atualizações de dados, teste, criação de novos modelos data mining, desenvolvimento dos modelos atuais e validação dos modelos. II.2.5. Data Warehouse Como pôde ser visto, um componente importante no data mining é o data warehouse. Para Taurion (2001a), o data warehouse é essencial pois integra dados de múltiplas fontes e assegura a qualidade dos dados que serão garimpados. E este é um aspecto importante pois, se a base de dados não for válida, não será extraída nenhuma informação útil. Ha e Park (1998) definem data warehouse como uma coleção de dados orientada para sujeitos, integrada, variante no tempo e não volátil, utilizada no suporte do processo de tomada de decisão. Ele é orientado para sujeitos pois é realmente voltado para: clientes, vendedores, produtos e atividades da empresa. É integrado pois os dados armazenados são provenientes de múltiplas fontes que se encontram no ambiente operacional. É variante no tempo devido a três características: a base contém dados históricos e não somente de um momento específico, cada dado é associado a uma data específica (dia, mês ou ano) e os dados nunca são atualizados (quando são armazenados pela primeira vez, eles já devem estar com o valor correto). O data warehouse é não volátil pois só há duas operações que podem ser feitas: carregamento inicial dos dados e o acesso aos dados, não há atualização. Berson, Smith e Thearling (1999) observam que as empresas possuem dados operacionais e dados informativos. Os primeiros refletem a situação atual da operação, sendo atualizado constantemente. Os dados informativos servem para tomada de decisão e por isso precisam conter informações históricas e não precisam ser tão ágeis quanto os dados operacionais. O local onde as empresas guardam estes dados é o data warehouse, e suas principais características são: a. É uma base de dados desenhada para tarefas analíticas; 47 b. Suporta um número relativamente pequeno de usuários com longas interações; c. É voltada para a leitura intensiva; d. É atualizada periodicamente; e. Contém dados atuais e históricos; f. Contém poucas tabelas, mas que guardam um grande volume de dados; g. Cada pesquisa resulta em um amplo conjunto de resultados. O funcionamento e a arquitetura básica do data warehouse, segundo os autores, estão ilustrados na Figura 3. Os componentes desta arquitetura são: Sistema de entrega de informação 6 7 Plataforma de gerenciamento Metadata Reports, EIS, Consul tas e Ferramentas 1 Extrair, Limpar e Ferramentas OLAP Carregar os Dados Data Warehouse DBMS Data Marts Dados Externos e Operacionais 2 Plataforma de Admini stração Figura 3 3 4 Repositório 5 Ferramentas Data Mining Ferramentas e Aplicações Arquitetura do data warehouse a. Banco de dados data warehouse (número 3 na Figura 3) – É onde os dados ficam implementação; armazenados. Existem diversas tecnologias de 48 b. Ferramentas para alimentação, aquisição, limpeza e transformação dos dados (número 1 na Figura 3) – Faz todas as conversões, resumos, mudanças chaves, mudanças estruturais e condensações necessárias para transformar dados díspares em informação relevante; c. Metadata – Metadata são os dados que descrevem o data warehouse: são os dados sobre os dados. O metadata fornece acesso interativo aos usuários, ajudando no entendimento do conteúdo e na localização dos dados. O gerenciamento do metadata é feito pelo repositório metadata (número 2 na Figura 3). d. Ferramentas de acesso (números 5 e 7 na Figura 3) – É onde os usuários interagem com o data warehouse e obtêm as informações. Uma das questões mais importante está no acesso e na visualização dos dados. Há cinco tipos de ferramentas principais: procura de dados e ferramentas para relatórios; ferramentas de desenvolvimento de aplicações; ferramentas executive information system (EIS); on-line analytical processing tools (OLAP) e ferramentas data mining. e. Data marts (número 4 na Figura 3) – Data marts são bancos de dados subsidiários ao data warehouse. Muitas pessoas pensam que eles podem ser uma alternativa menor e mais barata ao data warehouse, entretanto, eles não comportam o mesmo volume de dados. f. Administração e gerenciamento do data warehouse (6) – O gerenciamento do data warehouse inclui: segurança e gerenciamento de prioridades; monitoramento das atualizações; conferência da qualidade dos dados; gerenciamento e atualização do metadata; auditoria e relatórios sobre a utilização e o status do data warehouse; apagamento de dados; replicação, distribuição e agrupamento de dados; backup e recuperação de dados; e gerenciamento do data warehouse. Para os autores, a internet proporciona uma expansão na capacidade de acesso a um data warehouse, já que o usuário final não precisa ter o seu próprio banco de dados. 49 Ha e Park (1998) dividem a estrutura do data warehouse em: dados correntes, dados antigos, dados rapidamente resumidos, dados extremamente resumidos e metadata, Os dados correntes refletem as transações mais recentes, eles são mais volumosos pois são estocados com o mais baixo nível de granularidade. Os dados antigos não são acessados freqüentemente. Os dados rapidamente resumidos são provenientes dos dados correntes. Os dados extremamente resumidos são mais resumidos e compactos que os dados rapidamente resumidos. O metadata contém a estrutura dos dados, os algoritmos utilizados nos resumos e o fluxo de dados do ambiente operacional para o data warehouse. Como via de regra, quanto mais resumido o dado, mais ele é utilizado devido à rapidez e à eficiência do acesso. Normalmente os dados saem do data warehouse e vão para os departamento que os utilizam de maneira customizada para a tomada de decisão. O local dentro destes departamentos onde os dados ficam guardados é chamado de data marts. Há várias vantagens organizacionais, tecnológicas e econômicas na utilização de data marts, sendo que elas se tornam mais atrativas à medida que o data warehouse cresce em volume: a. Quando um departamento utiliza o seu próprio data mart, ele pode personalizar o fluxo de dados vindo do data warehouse. Ele pode utilizar os dados sem se preocupar com o reflexo nas outras áreas da empresa; b. O departamento pode selecionar um período histórico muito menor do que se o encontrado no data warehouse; c. O departamento pode selecionar softwares personalizados para o seu data mart; d. O custo unitário de processamento e armazenagem nas máquinas do data mart é menor do que no data warehouse. II.2.6. Objetivos,aplicações e técnicas de Data Mining Tanto Berson, Smith e Thearling (1999) e Ha e Park (1998) concordam que os principais objetivos do data mining são a descoberta e a previsão. Ha e Park 50 (1998) explicam mais detalhadamente que existem duas formas de data mining: o voltado para verificação (testando hipóteses formuladas pelos usuários) e o voltado para descoberta (extraindo informação automaticamente dos dados). Sendo que, no data mining voltado para descoberta há dois objetivos principais: a previsão e a descrição. Os diversos autores também concordam quando falam das principais aplicações do data mining. Continuando a explicar os objetivo, Ha e Park (1998) citam as quatro principais aplicações do data mining, sendo que as duas primeiras são descritivas e as duas últimas para previsão: a. Regras de associação – São da forma X Y (se X, então Y), onde X e Y são frases sobre valores de atributos do banco de dados. b. Clusterização – Também conhecido como segmentação. Divide a base de dados em um conjunto finito de grupos ou clusters onde cada variável possui características similares; c. Classificação – Se refere à descoberta de padrões de previsão para classes. Existem dois tipos de métodos de classificação: as árvores de classificação e os classificadores Bayesianos; d. Previsão - Utiliza dados históricos para formular modelos cujos objetivos é prever o comportamento futuro. Entre as quatro principais aplicações do data mining citadas por Saarenvirta (1998) duas coincidem com as de Ha e Park (1998): a. Previsão – Utilizam dados históricos para prever o consumo dos clientes, as respostas às promoções, a lucratividade e o risco. O desempenho dos modelos depende de quais os dados históricos estão disponíveis; b. Clusterização – Classifica os clientes em grupos homogêneos de acordo com seus atributos; 51 c. Segmentação – Cria segmentos de clientes definidos pela separação máxima de um atributo em particular, que pode ser: a lucratividade, o risco, o valor ao longo do tempo e a resposta às promoções; d. Análise de afinidades – É a identificação de padrões, desconhecidos ou conhecidos, que existem em um grupo de itens. Os grupos de itens normalmente incluem a cesta de compras e as contas dos clientes. Os padrões a serem descobertos podem ser: a combinação de produtos, a seqüência de produtos e séries temporais similares. Já Newell (2000) afirma que são seis as aplicações do data mining. A grande diferença é que este autor separa a previsão em regressão e séries temporais: a. Classificação – Utiliza os dados para identificar o padrão que caracteriza um grupo de clientes; b. Regressão – Utiliza os dados atuais para prever o comportamento futuro; c. Séries temporais – Semelhante à regressão, mas utiliza dados temporais; d. Análise por conglomerados – Procura por grupos de clientes que tenham comportamentos distintos ou semelhantes; e. Análise de associações – Tenta descobrir ações dos clientes que ocorram de forma conjunta; f. Descoberta seqüencial – Tenta descobrir ações dos clientes que ocorram de forma seqüencial. Os métodos para por em prática estas aplicações são muitos. Ha e Park (1998) enumeram cinco: a. Árvores de decisão e regras; b. Regressão não linear e métodos de classificação; c. Métodos baseados em exemplos; d. Modelos de dependência probabilística; 52 e. Modelos de aprendizagem relacional. Berson, Smith e Thearling (1999) dividem os métodos em dois grupos em função da data de criação e da aceitação: os métodos clássicos e os recentes. São três os clássicos: a. Estatística –A estatística tenta responder a perguntas sobre que padrões existem, qual a probabilidade deles ocorrerem, eles são significativos e como resumir as informações contidas no banco de dados. As principais ferramentas estatísticas são os histogramas e as regressões; b. Nearest neighbor – Esta técnica faz previsões através da semelhança de um dado com os seus vizinhos; c. Clusterização – Esta técnica tenta agrupar os dados segundo suas semelhanças, não havendo como comparar se os grupos formados estão corretos ou não. Como não há como saber o número ideal de grupos, sempre há o trade-off entre múltiplos grupos (tendendo no limite para grupos de um só elemento) e poucos grupos (tendendo no limite para apenas um grupo com todos os elementos). Também são três as técnicas recentes: a. Árvore de decisão – Na árvore de decisão cada galho da árvore é uma pergunta que classifica os dados e os divide pelas folhas, sem que nenhum seja perdido. Por isso, a árvore de decisão pode ser vista como uma segmentação nos dados. A grande vantagem desta técnica é a sua facilidade de compreensão pelo usuário. Ela pode ser utilizada para explorar os dados e para fazer previsões. O primeiro passo é fazer o crescimento da árvore, para isso deve -se fazer as melhores perguntas possíveis em cada galho O segundo passo para a implementação é decidir quando parar com a árvore, havendo três condições que indiquem este momento: quando o segmento só contém um dado, quando todos os elementos do segmento possuem características semelhantes e quando a melhora a ser obtida não justifica a pergunta. Árvores muito grandes e detalhadas correm o risco de cometerem o erro do overfitting; 53 b. Redes neurais – São as vedetes do data mining. As redes neurais aprendem os padrão através da apresentação dos dados, mas esta característica do aprendizado não significa que ela seja muito melhor que as técnicas tradicionais. Há uma crença de que as redes neurais podem ser deixadas trabalhando sozinhas e que por isso não dão muito trabalho. Isto não é verdade, e na realidade elas não são muito fáceis de serem utilizadas. As redes neurais têm um poder de previsão muito alto, mas utilizam modelos que são muito difíceis de serem entendidos e explicados. Assim sendo, os sistemas que implementam redes neurais ou já vêm fechados (oferecendo a solução completa para um determinado problema) ou precisam do acompanhamento de um expert (o que elimina uma das vantagens do data mining que é a fácil utilização). Redes neurais podem ser utilizadas para clusterização, análise de outliers e para análise de componentes principais (redução da dimensão de variáveis). O excesso de treinamento da rede pode levar ao overfitting. A principal crítica à rede neural é a dificuldade de entendimento do modelo, e por isso, muito esforço tem sido gasto para tentar entender melhor os modelos criados. c. Indução de regras – Esta é possivelmente a técnica mais associada ao data mining. Através da indução de regras, tenta-se extrair todos os padrões contidos nos dados. Um dos problemas desta técnica é exatamente o excesso de padrões que podem ser extraídos. As regras são da seguinte forma “se isto e isto e isto, então isto”. Existem dois tipos de informação que verificam a relevância da regra obtida: a exatidão (com que freqüência a regra está correta – probabilidade condicional) e a cobertura (com que freqüência a regra é aplicada – probabilidade de eventos múltiplos). É importante sempre lembrar que a regra não impli ca causalidade, ela simplesmente afirma que, nos dados, a ocorrência do padrão é alta. Os autores avisam que é difícil saber a priori qual a técnica de data mining deve ser aplicada. Muitas vezes é necessário um processo de tentativa e erro. 54 Entretanto, as empresas não devem gastar muito tempo, pois a decisão pode vir tarde demais devido à rapidez das mudanças no ambiente de negócios. II.3. APLICAÇÕES REAIS DE TÉCNICAS DE EXTRAÇÃO DE CONHECIMENTO II.3.1. Descoberta do perfil dos clientes que não renovam o contrato em uma empresa de telefonia celular O primeiro exemplo utilizado é dado por Berson, Smith e Thearling (1999). O exemplo ilustra o caso de uma empresa de telefonia celular que, através do método da arvore de decisão, implementou um programa para detectar o perfil dos clientes que mais abandonavam a empresa. A empresa inglesa possuía uma base de 300.000 clientes e a taxa média de abandono na indústria era maior que 40%. Neste exemplo, a aplicação do programa se restringiu aos clientes não corporativos (260.000 clientes). O modelo foi aplicado para segmentar os clientes conforme a probabilidade de abandono. Utilizou-se dados de março de 1998 para prever o abandono dos clientes em abril de 1998. Foi implementado o CART (Classification and Regression Trees). O modelo produzido possuía 29 segmentos, cada um correspondendo a uma folha da árvore. O Gráfico 5 ilustra o percentual acumulativo dos clientes versus o percentual acumulativo de abandono. Fazendo uma amostragem aleatória dos clientes, estes dois percentuais acumulativos devem ser iguais (linha cinza „Sem estudo‟). Fazendo a segmentação dos clientes, é possível detectar uma parcela pequena dos clientes que seja responsável pela maior parte dos abandonos (linha preta „Com dados de maio de 1998‟). Através do estudo foi possível detectar que: a. Apenas 5,2% dos clientes eram responsáveis por 27,7% dos abandonos; b. Apenas 10,5% dos clientes eram responsáveis por 41,5% dos abandonos; 55 c. Apenas 19,7% dos clientes eram responsáveis por 55,8% dos abandonos. 100% 90% Abandono (%) 80% 70% 60% 50% 40% 30% 20% Sem estudo Com dados de Maio de 1998 10% 0% 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% Base de clientes (%) Gráfico 1 Percentual acumulativo dos clientes versus o percentual acumulativo de abandono A campanha de marketing direto foi direcionada para 101.003 clientes (35,9% do total), um número considerado elevado. Os resultados apresentados foram de certa forma surpreendentes. Enquanto que nos primeiros meses ocorreu o esperado, uma diminuição na taxa de abandono, a partir do terceiro mês o grupo que recebeu a campanha passou a apresentar uma taxa maior de abandono. Acredita-se que a pressão feita pela campanha possa ter antecipado a decisão de abandono de alguns clientes. Deste modo, como sugestão para as próximas previsões, além de se levar em conta a probabilidade de abandono, o modelo deve predizer a probabilidade do cliente responder positivamente à campanha. II.3.2. Segmentação de clientes de um shopping duty-free O segundo exemplo utilizado é dado por Ha e Park (1998). O objetivo final era aumentar o volume de vendas e a satisfação dos clientes de um shopping 56 duty-free. Clientes VIP seriam selecionado para o envio de promoções e ofertas através de correspondência direta, e para isso, era preciso descobrir quem eram estas pessoas. O banco de dados utilizado foi fornecido pelo próprio shopping duty-free e continha dados POS (Point Of Sales) que eram originários das transações de vendas. Trabalhou-se com os valores RFM (recency, frequency, monetary) dos clientes. Foi utilizado o Self-Organizing Map (SOM) para segmentar os clientes em grupos de características similares do ponto de vista do RFM, e apontar cada cliente para um dos grupos. A partir daí, seriam escolhidos alguns grupos através do posicionamento estratégico de seus clientes, e estes receberiam a correspondência direta. Os grupos de clientes também seriam utilizados para classificá-los como leais ou vulneráveis, utilizando-se uma árvore de classificação C4.5. Esta árvore faria a classificação utilizando os atributos RFM e as classes já conhecidas (os clusters), produzindo algumas regras para esta classificação. A segmentação dos clientes começou com a extração dos dados. Foram agrupados os clientes de todos os estandes usando as três variáveis RFM. O primeiro passo foi a separação dos dados contendo: a identificação dos clientes e as variáveis de recência, freqüência e valor monetário. Para trabalhar com o SOM foi necessário padronizar o valor de todas as variáveis entre 0 e 1, para que nenhuma tivesse um peso maior que as outras. A clusterização dos clientes foi dividida em duas fases: o treinamento dos dados e o mapeamento dos clientes. No treinamento foram utilizados 9 clusters. Este valor foi escolhido pois cada variável RFM de entrada poderia ser dividida em duas categorias: abaixo da média e acima da média. Assim sendo, os nove grupos são suficientes para cobrir todas as oito possibilidades de combinações (2x2x2=8). Após o treinamento, o SOM formou um mapa topológico utilizando os grupos. O mapeamento dos clientes nos grupos refletia as similaridades existentes. Após o mapeamento, foi possível saber quantos e quais clientes pertenciam a cada grupo, assim como o seu valor médio das variáveis RFM. 57 Uma análise interessante foi a construção do gráfico que relaciona os valores médios das variáveis RFM de cada grupo (Gráfico 2). Neste gráfico foi possível posicionar cada grupo escolhendo duas das variáveis RFM (recência e valor monetário), os valores médios de cada grupo puderam ser comparados com os valores médios de todos os clientes. Utilizou-se o símbolo “seta para cima” ( ) para indicar quando o valor era maior que a média e o símbolo “seta para baixo” ( ) para indicar quando o valor era menor que a média. Recência (todos os grupos) Valor Monetário Gráfico 2 Posicionamento dos clusters quanto as variáveis RM Entre os nove grupos, os que tiveram R F M foram selecionados como os prioritários, seguidos pelos R F M e pelos R F M . O motivo da seleção destes grupos foi a maior probabilidade da campanha de marketing direto obter êxito. Os resultados finais, com o número de clientes, os valores médios das variáveis RFM e a classificação dos grupos podem ser vistos na Tabela 1. 58 Tabela 1 Resultado final da segmentação de clientes Número de clientes Recência média Freqüência média Valor monetário médio Outros 1 117 83,78 3,60 1.617, 45 R F M 2 250 436,16 1,22 545,55 R F M 3 567 162,43 1,27 471,88 R F M 4 140 295,19 2,14 1.590, 79 R F M 5 165 278,58 1,45 570,62 R F M 6 95 87,53 6,01 3.278, 25 R F M 7 287 68,87 1,44 544.02 R F M 8 130 112,78 3,37 2.600, 83 R F M 9 285 167,25 1,66 1.351, 65 R F M 190,88 1,91 1.031, 90 Cluster Média total A próxima meta foi a classificação dos clientes como leais ou vulneráveis. Para alcançar este objetivo, o processo foi dividido em três etapas: extração dos dados, criação das árvores de decisão e obtenção das regras. Novamente, os dados utilizados foram as informações RFM, e as classes utilizadas foram os 9 clusters criados pelo SOM. O treinamento da árvore foi feito com os 2.036 casos que foram utilizados no SOM. A partir das regras geradas, a classificação poderia ser aplicada aos demais dados. O treinamento gerou 10 árvores, sendo que uma foi automaticamente selecionada como a melhor. Esta árvore selecionada passou por um processo de simplificação, com o descarte de um ou mais galhos. A partir destas árvores se fez a geração das regras. Esta geração de regras pode utilizar mais de uma árvore, sendo que no exemplo foram utilizadas todas as 10 árvores, pois esta foi a combinação que apresentou a menor taxa de erro e o menor número de regras (81 regras). As regras produzidas foram da forma E D (se E, então D), onde o lado esquerdo E era uma conjunção de testes baseados nos atributos e o lado direito D era uma classe. Junto com a regra apresentava-se a probabilidade condicional de sua ocorrência. Após o término deste trabalho, uma pergunta ficou sem ser respondida: qual foi o efeito desta correspondência direta no aumento das vendas? Esta seria a 59 sugestão para novos trabalhos e para começá-la o primeiro desafio seria projetar um meio de obter estas informações com os clientes. II.3.3. Segmentação e detecção do perfil de compradores online O terceiro exemplo utilizado é dado por Vellido, Lisboa e Meehan (1998). O objetivo deste estudo foi desenvolver uma segmentação exploratória no mercado de compras on-line, que fornecesse algumas idéias sobre a sua estrutura e a caracterização dos compradores on-line. Foi utilizado o SelfOrganizing Map (SOM) no processo de análise das variáveis e clusterização. Os dados utilizados eram públicos e foram obtidos na Ninth GVU’s WWW User Survey. Estes dados eram respostas à questionários sobre a internet. Foram selecionados 44 itens das duas primeiras perguntas (opiniões gerais comparando a compra on-line com as compras tradicionais e opinião dos vendedores on-line comparadas com as outras formas de compras). A variável dependente era binária por natureza, e correspondia se o respondente já fez ou não compras on-line. Os 44 itens foram reduzidos para nove através de uma análise de fatores. A Tabela 2 mostra os 5 fatores mais relevantes que foram selecionados por um modelo chamado Automatic Relevance Determination. O fator 2 (controle do risco) continha o maior poder de previsão. Em seguida vieram os fatores 1 (compatibilidade) e 3 (poder financeiro). Finalmente, os fatores selecionados menos relevantes foram o 4 (facilidade de uso) e 5 (esforço/taxa de resposta). Tabela 2 Descrição e atributos dos 5 fatores selecionados Fator Descrição Atributos 1 Experiência de compras: compatibilidade Cont role e conveniência 2 Cont role do risco por parte do cliente/ Controle de Confiança e segurança ambiente 3 Poder financeiro - 4 Experiência de compras: esforço Facilidade de us o 5 Experiência de compras/ serviço ao client e Esforço/ empatia tax a de resposta e 60 O modelo utilizado no estudo foi uma SOM bidimensional retangular com 15 x 12 células hexagonais. Na primeira etapa a SOM, que é um modelo não supervisionado, foi utilizada em conjunto com um modelo supervisionado. A utilização de um modelo não supervisionado foi justificada pela sua contribuição, fazendo a tomada de decisão mais intuitiva através da explicação do processo de classificação. O mapeamento das classes (branco para compradores, preto para não compradores e tons de cinza para classes não bem definidas) é mostrado na Figura 4. Figura 4 Mapeamento das classes segundo a SOM (branco para compradores, preto para não compradores e tons de cinza para classes não bem definidas) Como é possível reparar, o lado esquerdo e a parte de baixo correspondem a classe dos não compradores, enquanto que a parte de cima, o lado direito e o centro correspondem aos compradores. Como se tratam de dados reais, não foi possível separá-los completamente. Esta classificação obtida através do método não supervisionado pôde ser melhorada de duas formas. A primeira foi comparando o mapa obtido com os mapas que mostravam os pesos de cada variável em cada célula do mapa. A segunda foi renomeando cada célula com o nome do atributo cujo peso fosse o 61 maior (em valor absoluto). Ambos os métodos ajudaram a determinar a importância relativa de cada fator individualmente, mas não forneciam explicação da correlação destes fatores com a propensão a fazer compras online. Na segunda etapa, utilizando-se apenas o treinamento não supervisionado, tentou-se agrupar os clusters obtidos em super-clusters. Para a criação dos super-clusters foi utilizado uma combinação de métodos onde as células com a menor distância para os vizinhos seriam consideradas centróides, e as outra unidades seriam agrupadas nos clusters. A escolha do número de centróides é arbitrária. Entretanto utilizou-se um modelo que mede a qualidade da segmentação em função do número de clusters. A base do deste cálculo é que a segmentação deve maximizar tanto a homogeneidade interna dos grupos, como a heterogeneidade entre grupos. O Gráfico 3 mostra o resultado obtido. Em função deste resultado, decidiu-se trabalhar com 5 super-clusters. Estes grupos são mostrados na Figura 5. PONTUAÇÃO DE QUALIDADE NÚMERO DE CLUSTERS Gráfico 3 Qualidade versus número de clusters 62 Figura 5 Posicionamento dos 5 super-clusters no mapa da SOM Para se chegar a uma conclusão sobre as características destes grupos, complementou-se estas informações com as obtidas na utilização do SOM em conjunto com métodos supervisionados: a. Grupo 1 – Englobava a região dominada por uma baixa pontuação no poder financeiro, sendo também influenciada por baixos valores no fator controle do risco. Para este grupo, a principal barreira à realização de compras on-line era a falta de dinheiro. Este grupo pôde ser rotulado como os „conscientes do custo‟ (C.C.) e envolvia 12,2% dos padrões de treinamento; b. Grupo 2 – Englobava a região dominada por baixos valores de facilidade de uso, sendo reforçado por baixos ou médios valores nos demais quesitos. Eram as pessoas que sofrem de tecnofobia e são relutantes contra as novas inovações. Este grupo pôde ser rotulado como os „avessos à complexidade‟ (A.C.) e envolvia 11,4% dos padrões de treinamento; c. Grupo 3 – Englobava a região dominada por baixos valores de compatibilidade, havendo um subgrupo, no meio, com altos valores no fator controle do risco. Eram as pessoas que não acham a experiência de compras on-line conveniente ou compatível suficiente com os seus 63 hábitos. Este grupo foi rotulado como os „não convictos‟ (N.C.) e envolvia 25% dos padrões de treinamento; d. Grupo 4 – Englobava a região dominada por altos valores nos fatores compatibilidade, controle do risco e poder financeiro. Era o oposto do grupo 3, sendo composto por pessoas que achavam as compras on-line conveniente e compatível e não tinham problemas com o risco ou a falta de dinheiro. Este grupo foi ser rotulado como os „convictos‟ (C.) e envolvia 36,7% dos padrões de treinamento; e. Grupo 5 – Englobava a região dominada por baixos valores no fator controle do risco, combinados com altos valores de compatibilidade. Na parte de baixo do mapa predominavam altos valores de esforço. Este grupo foi rotulado como os „cientes da segurança‟ (C.S.) e envolvia 14,6% dos padrões de treinamento. II.3.4. Outros exemplos Há diversos outros exemplos na literatura sobre aplicações do data mining no mundo de negócios, e principalmente no CRM. Um exemplo interessante, não relacionado ao CRM é mostrado por Hui e Jha (2000). No seu artigo, os autores descrevem como é possível aplicar técnicas de data mining que extraiam conhecimento de uma base de dados de serviço ao cliente. Este conhecimento visa dois tipos de iniciativas: a tomada de decisão no nível gerencial e o diagnóstico de falha nas máquinas. Outro exemplo que merece ser citado é descrito por Sforna (2000). Uma empresa energética italiana utilizou o data mining em sua base de clientes corporativos para descobrir hábitos de consumos anômalos. Detectando os clientes que possuíam perfis de consumo não condizentes com os seus tipos de contratos, a empresa pôde propor-lhes novos contratos que se ajustassem melhor às suas necessidades. 64 II.4. FIDELIZAÇ ÃO E O VAREJO II.4.1. Relacionamento com clientes no varejo Segundo Cross e Smith (1994), a união de forças sociais, econômicas e tecnológicas está transformando a indústria do varejo nos E.U.A.. Entre as mudanças que podem ser observadas os autores citam: a. Mais de 50% dos consumidores não têm tempo para gastar com as suas compras, e preferem os canais que lhes oferecem maior valor e conveniência, reconhecendo a sua lealdade; b. Os clientes estão ficando resistentes às mensagens e formatos tradicionais de marketing; c. A proliferação dos canais de vendas está aumentando o poder de barganha dos clientes; d. Os clientes estão respondendo às novas tecnologias, desde que estas simplifiquem suas compras, tornando-as mais rápidas e convenientes; e. Os clientes também estão respondendo aos programas de marketing customizados, onde a comunicação se baseia no histórico de transações e que recompensem a lealdade dos clientes. Os autores afirmam que hoje em dia, muitos varejistas ainda constroem suas bases de dados como meios de atingir seus clientes mais valiosos através de propaganda e promoções. Deste modo esta base de dados de clientes não está criando lealdade. Para ir um passo além, os varejistas precisam adotar uma nova visão: os dados precisam ser considerados um ativo essencial para o marketing, pois só assim é possível utilizar estes dados de forma mais criativa: a. Aumentando a penetração geográfica através determinam quais as localizações ótimas das lojas; de modelos que 65 b. Aumentando a lealdade através do diálogo com o cliente, criando comunicações personalizadas; c. Criando sinergias entre os diversos canais de marketing, maximizando o fluxo de comunicação e o tráfico de informação por estas mídias; d. Determinando os momentos ideais para que os estoques sejam abastecidos, baseado nos padrões de consumo dos clientes; e. Recrutando parceiros de marketing que estejam interessados em atingir sua base de clientes, e parceiros que possuem uma base de clientes que interesse para a empresa; f. Integrando totalmente a informação dos clientes através de dados financeiros e operacionais. Taher, Leight e French (1996) afirmam que os varejistas precisam expandir o conceito de varejo para além da loja e do produto físico. Uma pesquisa da McKinsey revela que 65% da satisfação dos clientes resultam de fatores intangíveis e subjetivos que transcendem o produto em si. Para manter e conquistar seus clientes, os varejistas precisarão estar constantemente superando as expectativas, e a melhor maneira de surpreendê-los e conquistálos é agregando serviços aos produtos. II.4.2. Oportunidades do comércio on-line Conforme Albertin e Marques (1999) a informatização e a internet não servem apenas para agilizar a operação das lojas. Elas são meios eficientes de transformar os dados, que são armazenados ao longo de todo o processo de comercialização, em informações que permitam a análise de resultados e a definição de planejamentos estratégicos. Segundo os autores, o comércio eletrônico ajuda na relação entre empresas e clientes, pois facilita as empresas compreendê-los e realizar a venda próativa de novos produtos. O comércio eletrônico permite uma melhor comunicação com os clientes, relações de vendas mais eficientes e um aumento da atratividade dos mercados de consumo. 66 Os autores afirmam que pôde ser observado em dois casos estudados, que a grande contribuição do uso da tecnologia foi a viabilização da customização em massa. Este fato ficou claro pois, nos dois casos, os sites montados pelas empresas varejistas elaboravam carrinhos de compras de acordo com as necessidades de cada usuário. Em um dos casos, a empresa chegava a utilizar os dados obtidos através das compras on-line na construção de um programa de marketing direto, onde as malas diretas eram segmentadas de acordo com o perfil de cada cliente. II.4.3. Uma breve descrição do mercado varejista brasileiro Uma pesquisa elaborada em conjunto pela Abras (Associação Brasileira de Supermercados) e ACNielsen mostra o panorama do mercado de auto -serviço brasileiro (SUPERHIPER, 2000). A pesquisa revela, conforme pode ser observado na Tabela 3, que o auto-serviço brasileiro faturou em 1999 R$ 60,123 bilhões, 2,7% menos que no ano anterior, mantendo sua participação de 6% no PIB nacional. O lucro médio auferido deste setor também diminuiu em relação a 1998, passando de 1,5% para 1,3%. Mesmo assim, houve um aumento de 7,4% no número de lojas, chegando a mais de 55 mil pontos-devenda no Brasil em 1999, contra os 51,5 mil do ano anterior. Deste modo, o setor apresentou, ainda que discreto, um aumento de postos de trabalhos disponíveis, ultrapassando a marca dos 670 mil empregos diretos. O espaço total da área de vendas no setor também cresceu, exibindo um aumento de 3,1% em relação a 1998, e alcançando a marca de 13,1 milhões de metros quadrados em todo o Brasil. 67 Tabela 3 O auto serviço alimentar brasileiro 1994 Nº de lojas (total autoserviço) Faturamento anual (em bilhões de reais nominais) Faturamento anual – em bilhões a preços de 1999* Participação % do faturamento sobre o P IB* 37.543 1995 1996 41.839 43.763 1997 1998 1999 47.787 51.502 55.313 1998x1999 Variação % 7,4 34,9 40,6 46,8 50,4 55,5 60,1 +8,3 nominal 58,4 56,3 58,4 58,3 61,8 60,1 -2,7 real 6 7 6 6 6 6 - Nº de empregos diretos 650.000 655.200 625.000 655.000 666.752 670.086 Área de vendas (em milhões n.d. n.d. n.d. 12,0 12,7 13,1 2 de m ) Nº check -outs n.d. n.d. n.d. 123.170 125.867 135.914 0,5 3,1 8,0 * A preços de 1999 – todos os valores foram trazidos para 31/12/ 1999 Fonte: Abras/ACNielsen (S UPERHIPER, 2000) n.d.: Não disponível Tabela 4 Síntese do resultados - 1999 Faturamento nominal (R$ bilhões) Nº de lojas Nº de check -outs Nº de funcionários Área de vendas 2 em m (milhões) Setor aut o-serviço 60,1 55.313 135.914 670.086 13,1 Segmento supermercado 55,4 24.112 104.713 292.103 10,1 20 maiores * 30,0 1.548 25.201 177.674 3,0 300 maiores * 42,0 3.199 37.641 262.797 4,3 *Dados ajustados devido às moviment ações do setor em 1999 (fusões, aquisições, fechamentos, falências, ausências e etc.). Fonte: Abras/ACNielsen (S UPERHIPER, 2000) O segmento de supermercados (composto pelas lojas que possuem dois ou mais check-outs) cresceu no último ano a uma taxa ligeiramente superior à média do auto-serviço: 10,6% contra 7,4%, totalizando 24,1 mil lojas, ou o correspondente a 43,6% do total do setor de auto -serviço (ver Tabela 4 e Gráfico 4). Este segmento também aumentou sua participação no faturamento do auto-serviço em relação ao ano anterior, saindo de 91% em 1998 para 92,2% do faturamento total nominal (o equivalente a R$ 55,4 bilhões) em 1999. 68 Este aumento de participação vem se mantendo nos últimos cinco anos, partindo de 87,5% em 1995 para mais de 92% em 1999 (ver Gráfico 5). 60 50 33,4 40 30 32,7 34,0 37,5 41,0 43,8 55,3 51,5 23,3 20 14,2 14,7 15,9 16,6 17,0 19,9 20,7 21,2 10 0 90 47,8 91 92 93 94 95 96 Segmento supermercado (2 ou mais check-outs) 97 21,8 98 24,1 99 Total auto-serviço Gráfico 4 Segmento supermercado x Total auto-serviço - número de lojas (em mil) O setor de supermercado tradicional (entre 251 e 2.500 metros quadrados) responde por mais de 63% do total das 24.100 lojas com dois ou mais checkouts. Já o formato hipermercado, que no final de 1999 registrava pouco menos de 200 lojas e um índice de participação de 5,3% do número total de lojas no país, se consolidou como um abastecedor, tendo seu foco dirigido às pessoas que fazem suas compras de abastecimento uma ou duas vezes por mês. As 20 maiores redes do setor, possuem um alto faturamento, entretanto a média de área de vendas de cada uma das suas lojas diminuiu significativamente. Ao longo de toda a década até 1998, havia um mo vimento crescente de área de vendas média por loja – as 20 maiores saíram de uma média de 1.539 metros quadrados por ponto-de-venda em 1990 para 2.585 metros quadrados por loja em 1998. Entretanto, de janeiro a dezembro do ano de 1999, houve um decréscimo desse valor médio, baixando para 1.910 metros quadrados por loja. Esse indicador de performance pode ser reflexo do forte 69 processo de aquisição de redes com lojas menores implantado pelas três primeiras empresas do ranking. Pela representatividade das 300 maiores empresas no setor, que somam 3.199 lojas, nota-se que estas apresentaram resultado muito próximo à média do setor em 1999, ou seja, índice negativo de desempenho de 2,1%, contra o de 2,7% do setor auto-serviço como um todo. Essa diferença de percentual advém da influência do desempenho negativo do faturamento das 20 maiores, que registraram queda de 2,9% no ano de 1999 em relação a 1998. Já as 280 restantes praticamente obtiveram resultados estáveis frentes ao ano anterior – índice negativo de 0,1%. Um dos principais fatores que podem ter contribuído para o baixo resultado das 20 principais empresas do setor é a acirrada concorrência estabelecida entre elas. 100 12,5 12,6 9,4 9,0 7,8 87,5 87,4 90,6 91,0 92,2 80 60 40 20 0 95 96 97 98 99 Auto-serviço 1 check-out Segmento supermercado (2 ou mais check-outs) Gráfico 5 Evolução da participação de lojas supermercados no faturamento total do setor de auto-serviços (em % ) A pesquisa confirma que, a exemplo de 1997 e de 1998, em 1999 houve um aumento no nível de concentração do setor supermercadista brasileiro nas mãos das principais redes. Os dados apontam para um índice de concentração 6% maior em 1999, em relação a 1998, que, por sua vez, também já fora 6% 70 superior ao de 1997. Com isso, as cinco maiores fecharam dezembro último com 39% das vendas totais do setor. II.4.4. Exemplos de aplicação do CRM no mercado varejista brasileiro Hirata (2000) mostra três exemplos de aplicações de iniciativas de CRM no varejo brasileiro: a rede ABC Supermercados (Divinópolis, MG), o grupo Pão de Açúcar e o supermercado d‟Avó (São Paulo). II.4.4.1. Rede ABC Supermercados (Divinópolis, MG) O ABC Supermercados, com seis lojas em Divinópolis (MG), contratou a empresa Key Work Tecnologia e Marketing para a instalação de um software canadense com a finalidade de armazenar, nos primeiros seis meses, dados de 50 mil clientes. Estes dados seriam obtidos através do lançamento de um cartão de fidelização. Para obter o cartão o cliente deveria preencher uma proposta de adesão, que seria avaliada. Em caso de aprovação, ele receberia o cartão num prazo de 15 dias. Para incentivar a adoção do cartão, a empresa lançaria a campanha „Usou, ganhou‟, onde para cada R$ 1,00 em compras o cliente acumularia dois pontos que, somados aos pontos extras acumulados em determinados produtos, poderiam ser trocados por prêmios. Os pontos extras nos produtos seriam definidos através de parcerias com os fornecedores. Com este programa de fidelização, a empresa pretendia acumular informações sobre quem compra nas lojas da rede e direcionar seus gastos com marketing. A partir destes dados seria possível lançar campanhas específicas, tendo como base o cruzamento das informações no banco de dados da empresa. A expectativa era de registrar 280 mil cartões em oito meses. Com o novo sistema, a rede pretendia faturar R$ 63 milhões em 2000, frente aos R$ 50 milhões registrados no ano anterior. Para o desenvolvimento do 71 programa de fidelização, o ABC Supermercados destinaria desde julho de 2000, durante 90 dias, 2% do seu faturamento. II.4.4.2. Grupo Pão de Açúcar O Grupo Pão de Açúcar lançou o „Pão de Açúcar Mais‟, um cartão de fidelidade que permite identificar os hábitos de compra de cada um dos seus clientes. A empresa investiu R$ 5 milhões no projeto, que incluiu a compra de um software americano cuja capacidade de armazenamento é de cinco anos de histórico para cada cliente. Este era um cartão de identificação e não de pagamento, pois ele não estava atrelado à oferta de brindes. A utilização do cartão Mais funcionaria nos mesmos moldes que os demais cartões de fidelização existentes no mercado. O cliente apresentaria o cartão no caixa toda vez que realizasse suas compras, o leitor óptico faria a decodificação e o software coletaria as informações qualitativas e quantitativas, tais como dados de compra, tipo de produto, freqüência na loja e valor da compra. Essas informações seriam cadastradas em um computador centra l e a partir delas a empresa lançaria perguntas sobre um determinado perfil de cliente. Com as respostas fornecidas pelo software, o departamento de marketing desenvolveria promoções de iniciativa da própria empresa ou com o apoio dos fornecedores. Havia uma estimativa de que uma campanha de marketing pode influenciar o cliente de 15 a 25 vezes por ano, no mínimo. Em um mês e meio de funcionamento do sistema, foram cadastradas 210 mil famílias. Esse número foi suficiente para iniciar as ações de marketing dirigidas. Em quatro meses os primeiro resultados já puderam ser percebidos nas famílias registradas: a. O aumento do tíquete médio de compras foi de 19%; b. O aumento na freqüência desses consumidores às lojas foi de 42%. Neste período, a empresa lançou 38 campanhas de marca própria e outras em conjunto com os fornecedores, havendo casos de fornecedores que tiveram aumento de 50% nas vendas. Uma das campanhas que a empresa lançou foi o 72 „Dia a Dia Mais‟. A cada R$ 50 de compras e mais R$ 9,90, o cliente ganhava um kit de panelas especialmente desenhadas para o Pão de Açúcar. II.4.4.3. Supermercado d’Avó (São Paulo) A cadeia de supermercado D‟Avó, com seis lojas em São Paulo, lançou o Cartão Confiança em 1997. Trata-se de um cartão de crédito direcionado para o consumidor de baixa renda, que não tinha acesso ao sistema bancário e que, por essa razão, não possuía talão de cheque. O objetivo do cartão era: resolver a questão de crédito e ao mesmo tempo fidelizar o cliente. O D‟Avó tem o registro de todos os portadores do Cartão Confiança desde 1997. Neste período, a empresa já registrou 145 mil pessoas, que podem a qualquer momento serem surpreendidas com uma promoção ou apenas um gesto singelo das lojas da rede D‟Avó. Um exemplo de campanha de marketing que só foi possível através do cartão foi a distribuição de cestas de café da manhã para um seleto grupo de clientes. Para traçar o perfil dos consumidores que receberiam as cestas, o D‟Avó buscou em seu banco de dados senhoras que tinham o Cartão Confiança, eram casadas, com filhos, que mantinham suas contas do cartão em dia e que freqüentavam a loja todos os sábados. O cruzamento desses dados foi realizado e chegou-se a 180 pessoas com esse perfil que foram contempladas com as cestas de café da manhã. No ano anterior, 150 clientes haviam sido contemplados com a mesma campanha. Outra campanha foi a de reavaliação de crédito. Nesse caso, os dados encaminhados para o sistema eram de consumidores que gastavam todo o crédito do cartão e pagavam 100% da fatura. Foram selecionados 1.643 clientes com esse perfil. 73 CAPÍTULO III METODOLOGIA III.1. TIPO DE PESQUISA Após fazer uma breve revisão da literatura sobre CRM e apresentar algumas técnicas de extração de conhecimento em banco de dados, este trabalho, a partir deste ponto, vai exemplificar a utilização de algumas destas técnicas destacando as informações que podem ser obtidas. Para classificar este estudo, foi adotada a proposta apresentada por Vergara (1997), segundo a qual uma pesquisa pode ser classificada quanto aos seus fins e quanto aos seus meios. Quanto aos fins, esta pesquisa é uma pesquisa aplicada. Ela é motivada por um problema real enfrentado por empresas de varejo brasileiras, e para resolvê-lo foram utilizados dados reais. Quanto aos meios, esta será uma pesquisa de laboratório, telematizada e bibliográfica. Para desenvolver o referencial teórico foi feita uma introdução sobre CRM, sendo necessário pesquisar publicações que falem sobre este tema. Para isto foi necessário pesquisar materiais publicados em revistas, livros, jornais e que sejam acessíveis ao público de uma maneira geral. Por estes motivos pode-se caracterizar este estudo como bibliográfico. Por ser um tema novo e que está diretamente envolvido com novas tecnologias, principalmente o computador, muito material ainda não foi publicado mas está disponível nos meios de comunicação. A internet é uma fonte rica de conhecimento sobre a extração de conhecimento em bancos de dados. Nela é possível encontrar artigos, opiniões e fóruns de debates que falam exclusivamente sobre o CRM. Deste modo foi necessário pesquisar neste meio, caracterizando a pesquisa como telematizada. 74 Para finalizar, este trabalho também pode ser classificado como uma pesquisa de campo pois, apesar de uma grande parte do esforço ter sido gasto com a utilização de computadores na aplicação de modelos que ajudem a descrever o comportamento dos clientes, os dados utilizados eram reais. Eles foram obtidos na base de dados de uma empresa de varejo. III.2. UNIVERSO E AMOSTRA Os dados utilizados nesta pesquisa foram obtidos junto a uma empresa varejista brasileira. Esta empresa é uma das maiores do país pois, apesar de não estar presente em todas as regiões, ela tem uma grande importância na região onde está concentrada. Ela possui diversas cadeias de lojas, mas o trabalho foi feito somente na cadeia de hipermercados. Foram analisados os dados de quatro lojas, todas na mesma região metropolitana, porém localizadas em bairros diferentes. O perfil demográfico destes bairros é bem diferente. Devido a questões de sigilo, nem o nome da empresa, nem a localização das lojas será divulgada. O banco de dados utilizado continha as seguintes informações sobre as compras realizadas no ano 2000: o número de identificação do cliente, o valor da compra, a data da sua realização e a loja onde ela foi feita. Este banco de dados não continha informação sobre todas as compras realizadas nas lojas, havia somente dados das compras realizadas pelos clientes que possuíam um cartão de fidelização. Este cartão não era exclusivo da rede de hipermercados, nem da empresa. Por isto, estes clientes não eram, necessariamente, os mais fiéis, leais ou lucrativos. Na verdade, pode haver pessoas que possuem este cartão e nunca fizeram compras neste hipermercado. Este cartão pode ser obtido facilmente através do pagamento de uma taxa. Ele distribui brindes à medida que os clientes acumulam pontos nas diversas empresas que participam deste projeto. Ele não é individual, possibilitando que uma família inteira utilize somente um cartão. 75 Os dados utilizados correspondem a todas as compras realizadas com o cartão de fidelidade, em qualquer uma das 4 lojas estudadas da rede de varejo, durante o ano 2000. Seguindo a classificação sugerida por Vergara (1997), a amostra dos dados foi obtida por acessibilidade já que o motivo da escolha da empresa utilizada foi a facilidade de acesso aos dados. III.3. COLETA DE DADOS Os dados foram coletados diretamente do banco de dados da empresa. Por isto, este estudo só pôde analisar as variáveis que estavam contidas neste banco de dados. Não foi feita nenhum tipo de entrevista ou questionário com os clientes para saber se os dados realmente refletem a realidade. Também não se procurou saber o envolvimento dos clientes no programa de fidelização. Este estudo se limitou exclusivamente a analisar os dados obtidos no banco de dados e a descobrir informações escondidas que auxiliem na construção do relacionamento entre a empresa e os clientes. III.4. TRATAMENTO DOS DADOS Como já foi dito, originalmente o banco de dados continha as seguintes informações por compra: o número de identificação do cliente, o seu valor, a data da sua realização e a loja onde ela foi feita. Deste modo como estava organizado o banco de dados, se um cliente após ter feito o pagamento se lembrasse que esqueceu um item e resolvesse adquiri-lo neste mesmo instante, eram computadas duas compras separadas para este cliente. Mesmo tendo sido realizadas num mesmo dia, por um mesmo cliente e na mesma loja, estas compras não eram agrupadas. Por este motivo, decidiu-se que todas as compras realizadas por um mesmo cliente, em um mesmo dia, na mesma loja deveriam ser tratadas como uma compra só. Mesmo sabendo-se que pode ter havido casos em que um mesmo cliente 76 tenha feito duas compras independentes (por exemplo, uma de manhã e outra à tarde), preferiu-se trabalhar como se fosse uma compra só. A primeira análise foi feita em cima das compras. Com os dados disponíveis foi possível construir novas variáveis que informavam: o dia do mês da realização da compra, o dia da semana e quanto tempo já havia se passado desde que aquele mesmo cliente tivesse feito a compra anterior. De posse de todas estas variáveis, primeiramente foram analisadas todas as compras. Em seguida foi estudado como elas evoluíram ao longo do ano. O próximo passo foi a descoberta de padrões sazonais ao longo do ano 2000. Por último foram comparadas as características de cada loja. O segundo grande grupo de análises foi feito em cima dos clientes. Em vez de utilizar o banco de dados em que cada entrada era uma compra, as informações foram agrupadas por cliente. Para cada cliente foi possível obter as seguintes informações: valor médio das suas compras, valor total gasto, número de compras que realizou, a loja onde realizou a maioria de suas compras, o período do mês e o número de dias da semana onde concentrou suas compras. Depois de construir este novo banco de dados, decidiu-se trabalhar somente com os clientes que tivessem feito mais de doze compras ao longo do ano (média de uma por mês). Selecionou-se estes clientes pois só eles poderiam ter características de fidelidade e lealdade que seriam interessantes para a empresa. O primeiro estudo em cima deste novo banco de dados se limitou a descrever as principais características deste grupo de clientes selecionados. Por último, tentou-se descobrir e verificar se era possível criar alguma segmentação, baseada no padrão de compras, que indicasse quem eram os clientes principais da rede. Utilizaram-se os seguintes critérios: o período do mês, a quantidade de dias da semana e a loja que preferem fazer suas compras. Para fazer todas estas análises utilizou-se principalmente o pacote estatístico SPSS. 77 III.5. LIMITAÇÕES DO MÉTODO Os modelos que foram utilizados podem até ser aplicados em outras empresas de varejo, dependendo do grau de semelhança entre o comportamento dos clientes e de como estiver montada a base de dados, mas não necessariamente podem ser generalizados para todas as empresas que possuem programas para gerenciar os dados de seus clientes. Alguns dos padrões de compras encontrados podem até ser considerados como comportamento característico dos clientes das redes de varejo em geral, entretanto, os valores exatos obtidos serão diferentes quando este mesmo estudo for aplicado a outras firmas. Empresas varejistas que atuem em outras regiões ou outros segmentos de mercado podem encontrar resultados e padrões de comportamento diferentes. De qualquer forma, quando estes modelos forem aplicados em outras bases de dados, será necessário o acompanhamento de especialistas no setor para confirmarem a relevância e a coerência das informações obtidas. 78 CAPÍTULO IV ANÁLISES DESCRITIVAS Primeiramente foi feita a análise das compras isoladamente, sem tentar identificar os clientes. Cada compra era uma entrada no banco de dados. Para cada compra se tinha as seguintes informações: data (dia, mês e dia da semana), valor, a loja onde foi realizada e o número de identificação do cliente. Foram estudadas as estatísticas descritivas de todas as compras ao mesmo tempo. Em seguida analisou-se a evolução das compras ao longo do tempo para tentar detectar a existência de padrões sazonais. Descobertos estes padrões, o próximo passo foi examiná-los. Por último, estudou-se a diferença entre as lojas. Com as informações obtidas através das análises das compras, partiu-se para a análise dos clientes. Neste caso, cada cliente era uma entrada no banco de dados. Para cada cliente foi possível obter as informações já citadas sobre todas as compras que realizou. O objetivo deste estudo foi a detecção de possíveis características que possam auxiliar na segmentação e na descoberta de quem são os clientes mais valiosos para a empresa. Tentou-se dividir os clientes conforme o seu comportamento de compra ao longo do mês, ao longo da semana e conforme a loja de sua preferência. O roteiro de todas estas análises está mostrado na Tabela 5. Tabela 5 IV.1 Análise das compras............................................................................................... 79 IV.1.1 IV.1.2 IV.1.3 IV.1.4 IV.2 Mapa das análises. Análise geral de todas as compras ...................................................................... 79 Análise da evolução das compras ao longo do tempo .......................................... 84 Análise dos padrões sazonais de compras .......................................................... 89 Análise por loja ................................................................................................ 111 Análise dos clientes .............................................................................................. 117 IV.2.1 IV.2.2 IV.2.3 IV.2.4 Análise geral de todos os clientes ..................................................................... 117 Segmentação por período do mês .................................................................... 123 Segmentação por número de dias da semana ................................................... 127 Segmentação por loja ...................................................................................... 130 79 IV.1. ANÁLISE DAS COMPRAS Através da análise das compras, a empresa pode dimensionar melhor a quantidade de funcionários em função da quantidade de compras esperada para um determinado dia, mantendo o nível de qualidade, mesmo quando o número de clientes na loja é elevado. Com esta análise, também é possível descobrir quais os dias em que o volume de vendas é baixo e tentar criar campanhas de marketing que estimulem os consumidores a comprarem nestes dias. Esta análise ainda não permite um contato direto com os clientes, nem a identificação dos mais valiosos, entretanto através da descoberta de padrões existentes nas compras é possível estendê-los e utilizá-los como base para a segmentação dos clientes. IV.1.1. Análise geral de todas as compras Para servir de base comparativa para as outras análises, o primeiro estudo incluiu todas as compras, não havendo nenhuma separação quanto ao período ou à loja onde a compra foi feita IV.1.1.1. Análise do valor das compras A primeira variável que foi estudada foi o valor de cada compra realizada. Conforme pode ser visto na Tabela 6, a base de dados contém 1.209.201 compras. O valor mínimo foi de R$5,00, sendo este valor determinado pela empresa como o mínimo para a utilização do cartão de fidelização. Para transações com valores menores que este, não é permitida a utilização do cartão de fidelização. A maior compra foi de R$21.139,00, que é um valor muito alto levando-se em consideração que ela foi feita em uma loja de varejo. Provavelmente, esta compra continha aparelhos eletro-eletrônicos, que são os itens de maior valor agregados nas lojas. O valor médio das compras foi de R$110,36, a moda R$133.450.190,00. foi R$19,50 e a receita total das compras foi 80 Tabela 6 Estatísticas descritivas e percentis do Valor das compras. Estatí stica Número de casos Erro padrão Percentis (%) Valor 1.209. 201 5 10,50 5,00 21.139 10 25 15,50 30,50 Soma 133.450.190 50 67,50 Média 110,36 75 140,00 Moda Des vio Padrão 19,50 153,67 90 95 244,00 334,50 Mínimo Máximo Assimetria Curt ose 14,11 ,0022 871,19 ,0045 Observando o coeficiente de assimetria, de curtose e os percentis mostrados na Tabela 6 é possível observar que a distribuição do valor das compras é muito assimétrica positivamente. O histograma e o P-P Plot exibidos no Gráfico 6 confirmam esta suspeita (em função da quantidade de dados, não foi possível fazer estes gráficos com todos os dados, foram utilizados somente 1% das compras, sorteadas aleatoriamente). É interessante notar que devido à limitação do valor mínimo para a utilização de cartão, a distribuição não pode ser considerada uma exponencial. A Tabela 7 mostra o resultado do teste Kolmogorov-Smirnov que rejeita a hipótese da distribuição do valor das compras ser exponencial. É interessante notar que devido ao volume de dados, este teste estatístico perde seu valor pois os intervalos de confiança passam a ser muito baixos e qualquer perturbação já causa a rejeição da hipótese de igualdade das distribuições. Por este motivo, nas próximas comparações entre distribuições só se mostrará os resultados do teste Kolmogorov-Smirnov se ele indicar similaridade. 81 P-P Plot exponencial Histograma Valor das compras Valor das compras 3.000 ,25 480 - 500 280 - 300 240 - 260 200 - 220 160 - 180 80 - 100 120 - 140 0 - 20 0 440 - 460 500 ,50 400 - 420 1.000 ,75 360 - 380 1.500 320 - 340 2.000 40 - 60 Número de casos 2.500 Probabilidade cumulativa esperada 1,00 0,00 0,00 Valor das compras ,25 ,50 ,75 1,00 Probabilidade cumulativa observada Gráfico 6 Histograma e P-P Plot do Valor das compras. Tabela 7 Teste Kolmogorov-Smirnov. Valor das compras N Parâmetro da exponencial 11.888 a,b Média 109,28 Absoluta Positiva Negativa Kolmogorov-Smirnov Z ,0495 ,0495 -,0481 5,40 Significância (bi -caudal) ,0000 Diferenças mais extremas a Distribuição teste é exponencial. b Calculado dos dados. IV.1.1.2. Análise do número de dias entre compras de um mesmo cliente Para começar a detectar padrões de compras entre os clientes, foi estudado o número de dias entre compras realizadas por um mesmo cliente. Para cada compra, foi calculado o intervalo de tempo entre esta compra e a anterior realizada pelo mesmo cliente. O objetivo de estudar esta variável foi investigar se há alguma correlação entre o intervalo de tempo e o valor de uma compra. Intuitivamente, era esperado que, para clientes fiéis, quanto maior o intervalo de tempo desde a última compra, maior o valor da compra. 82 A Tabela 8 mostra as estatísticas descritivas do número de dias entre compras realizadas por um mesmo cliente. O número de casos estudados (1.112.512 casos) foi menor que o número de compras total pois não foi possível calcular o intervalo de tempo para a primeira compra de cada cliente. Mesmo considerando que todas as compras realizadas por um mesmo cliente em uma mesma loja num mesmo dia eram uma compra só, houve casos onde clientes realizaram compras em lojas diferentes num mesmo dia. Por isso, o intervalo mínimo entre compras foi zero. O intervalo máximo foi de 359 dias, ou seja, esta pessoa ficou praticamente um ano sem voltar a uma loja da rede. O intervalo médio de compras foi de 16,48 dias, que equivale a pouco mais que duas semanas. Entretanto este valor médio é muito influenciado por valores extremos e não é a moda e nem a mediana da distribuição. A moda foi o intervalo de 7 dias. Pela análise dos percentis, é possível verificar que 50% das compras foram feitas com um intervalo de tempo de até uma semana. Tabela 8 Estatísticas descritivas e percentis do Número de dias entre compras. Estatí stica Número de casos Erro padrão Percentis (%) Valor 1.112. 512 5 1 0 359 10 25 2 4 Média 16,48 50 7 Moda 7 75 17 90 95 37 62 Mínimo Máximo Des vio Padrão Assimetria 26,64 4,43 ,0023 Curt ose 26,81 ,0046 Como pode ser observado na Tabela 8 e no Gráfico 78 a distribuição é assimétrica positivamente. Como as compras realizadas na mesma loja em um 8 No eixo do “Número de dias entre compras”, o intervalo das barras inclui o valor inferior, mas não compreende o valor superior escrito no eixo. Por exemplo, na primeira barra, onde está escrito o int ervalo “0-1” no eixo, somente o período de zero dia de intervalo entre compras está incluso. A barra seguinte, cujo valor do intervalo não está escrito, compreende as compras 83 mesmo dia por um mesmo cliente foram agrupadas, o número de casos que o intervalo entre compras é igual a zero é muito pequeno. No histograma, é possível observar que a distribuição não pode ser considerada uma exponencial, principalmente devido ao grande número de casos em que o intervalo entre compras é um múltiplo de sete dias, ou seja múltiplos de uma semana. Esta é uma constatação interessante, pois revela que os clientes tendem a ter um dia fixo na semana em q ue realizam suas compras. Este padrão de repetição de compras semanal é muito maior que o padrão de compras mensal. No histograma não é nem possível observar uma concentração do intervalo entre compras próximo a 30 dias. Histograma P-P Plot exponencial Número de dias entre compras Número de dias entre compras 1.200 38 - 39 36 - 37 34 - 35 32 - 33 ,25 30 - 31 20 - 21 18 - 19 16 - 17 14 - 15 12 - 13 6 -7 9 108- -11 4 -5 2 -3 0 ,50 28 - 29 200 ,75 26 - 27 400 24 - 25 600 0 -1 Número de casos 800 22 - 23 1.000 Probabilidade cumulativa esperada 1,00 Número de dias entre compras Gráfico 7 0,00 0,00 ,25 ,50 ,75 1,00 Probabilidade cumulativa observada Histograma e P-P Plot do Número de dias entre compras. IV.1.1.3. Análise da relação entre o valor das compras e o número de dias entre compras de um mesmo cliente Numa tentativa de detectar uma relação entre o valor das compras e o intervalo de tempo entre a última compra do cliente, foi feita uma regressão em que a variável independente era o intervalo de tempo e a variável dependente era o valor da compra. O coeficiente beta, que mede a significância desta regressão, foi muito baixo (0,09), indicando que não há correlação entre as variáveis. Para visualizar melhor esta falta de correlação, utilizou-se 0,01% dos com um dia de int ervalo. Esta mesma convenç ão vale para todos os histogramas cujos eixos das abscissas estejam representados por intervalos. 84 dados para construir um gráfico de dispersão entre o intervalo de tempo e o valor das compras (Gráfico 8). Visualizando este gráfico, não é possível confirmar a existência de qualquer relação entre os dados, principalmente em função da enorme quantidade de dados que podem ser considerados outliers. Valor das compras x Número de dias entre compras 1.000 800 Valor das compras 600 400 200 0 0 10 20 30 40 50 Número de dias entre compras Gráfico 8 Gráfico de dispersão entre o Número de dias entre compras e o Valor das compras. IV.1.2. Análise da evolução das compras ao longo do tempo Após a análise de todas as compras, o próximo passo foi estudar a sua evolução ao longo do ano. Saber como se comporta o volume de compras ao longo dos meses e dos dias do ano é o primeiro passo para se conseguir fazer previsões de vendas para períodos específicos. O estudo da evolução das compras ao longo do tempo também possibilita a descoberta de padrões de sazonalidades, que ajudam a entender o comportamento dos clie ntes. IV.1.2.1. Análise das compras ao longo dos meses do ano Nesta análise, as compras foram agrupadas conforme os meses em que foram realizadas. A Tabela 9 mostra as estatísticas descritivas do valor das compras agrupadas conforme os meses do ano e é possível verificar que há significativas variações de comportamento com o decorrer dos meses. O mês com maior número de compras é agosto (116.588 compras), superando inclusive o mês de dezembro quando o Natal normalmente causa um aumento 85 nas vendas (a comparação entre o número de compras por mês também pode ser vista no Gráfico 9). Entretanto, dezembro é o mês com maior valor médio (R$123,44) e maior valor total de compras (R$13.729.916,00) – estes resultados também podem ser vistos no Gráfico 9. Em função destes resultados, a empresa deve tentar entender qual foi o motivo da maior quantidade de vendas em agosto. A causa pode ter sido fatores econômicos externos, já que o consumo depende das co ndições financeiras da população, ou a realização de promoções que estimularam o consumo neste mês. No caso deste aumento de vendas em agosto ter sido causado por promoções, cabe à empresa analisar se o resultado final foi lucrativo ou não. Tabela 9 Estatísticas descritivas do Valor das compras para os diferentes meses do ano. Número Mínimo Máximo de casos Janeiro 91.465 5,00 Fevereiro 91.913 Março 93.796 Abril Maio Soma Média Desvio Padrão Assimetria Curtose 6.296 10.315.630 112,78 146,91 5,00 9.528 10.006.010 108,86 133,35 5,00 16.047 10.437.050 111,27 151,44 94.064 101.288 5,00 5,00 4.060 10.489.020 111,51 8.588 11.534.513 113,88 134,81 164,91 5,68 9,56 75,67 215,31 Junho 104.959 5,00 10.878 11.605.691 110,57 161,80 12,23 420,32 Julho 109.543 5,00 6.101 11.688.460 106,70 143,39 7,95 163,61 Agosto Setembro 116.588 103.878 5,00 5,00 8.550 12.625.400 108,29 7.116 11.097.365 106,83 155,67 149,70 9,50 7,66 227,52 136,85 99.374 5,00 6.307 10.462.016 105,28 137,85 7,62 161,57 91.109 111.224 5,00 5,00 21.139 9.459. 114 103,82 11.667 13.729.916 123,44 179,60 172,82 Outubro Novembro Dezembro 7,59 142,65 9,57 386,94 23,87 1.816, 27 40,90 3.845, 64 9,99 317,93 Observando a análise dos percentis para o valor das compras (Tabela 10), é possível perceber que até o percentil 10% os meses apresentam comportamento muito semelhantes. Para percentis maiores, o mês de dezembro passa a se diferenciar apresentando os maiores valores de compras. Comparando os percentis com o desvio padrão e a assimetria, pode-se reparar que valores extremos têm uma importância muito grande no cálculo 86 destas estatísticas. O mês de novembro só apresenta o maior desvio padrão e a maior assimetria devido ao fato da maior compra do ano ter sido realizada neste mês, já que pela análise dos percentis os seus resultados não são diferentes dos outros meses. Mês do ano x Número de Compras Mês do ano x Valor Médio da Compra 120.000 130 110.000 120 100.000 110 90.000 100 90 80.000 80 Valor médio das compras 60.000 50.000 40.000 30.000 20.000 10.000 0 Janeiro Março Feverei ro Maio Abril Junho Julho 70 60 50 40 30 20 10 0 Setembro Novembro Agosto Outubro Janeiro Dezembro Março Feverei ro Mês do ano da realização da compra Maio Abril Julho Junho Setembro Novembro Agosto Outubro Dezembro Mês do ano da realização da compra Mês do ano x Valor Total das Compras 14.000.000 13.000.000 12.000.000 11.000.000 10.000.000 9.000.000 Valor total das compras Número de compras 70.000 8.000.000 7.000.000 6.000.000 5.000.000 4.000.000 3.000.000 2.000.000 1.000.000 0 Janeiro Março Feverei ro Abril Maio Julho Junho Setembro Novembro Agosto Outubro Dezembro Mês do ano da realização da compra Gráfico 9 Gráfico de barras do número total, média e valor total de compras em relação ao mês do ano. A comparação entre médias através do método ANOVA rejeitou a hipótese de igualdade do valor médio das compras entre os meses do ano. O valor da estatística F foi de 119,32, que para uma distribuição com 1.209.200 graus de liberdade no total corresponde a um nível de significância igual a 0,0000, e o valor do coeficiente R2 foi de 0,001. Esta rejeição já era esperada através da análise visual do Gráfico 9. Entretanto, o método ANOVA apresenta a mesma limitação que o teste Kolmogorov-Smirnov, pois devido ao grande número de dados, o intervalo de confiança para as médias fica muito pequeno, e qualquer perturbação é suficiente para levar à rejeição da hipótese de igualdade. 87 Tabela 10 Percentis do Valor das compras para os diferentes meses do ano. Percentis (%) 5 10 25 50 75 90 95 Janeiro 11,50 16,50 33,00 71,50 143,00 245,00 335,50 Fevereiro 11,00 16,00 32,00 69,50 141,50 242,50 328,00 Março Abril 11,50 11,50 16,50 17,00 33,00 33,00 72,00 71,50 145,00 144,50 246,00 247,00 330,50 331,50 Maio 11,00 16,00 31,50 69,00 142,50 248,00 339,50 Junho 10,50 15,00 29,50 66,00 140,00 244,50 337,00 Julho Agosto 10,50 10,00 15,00 14,50 29,00 29,00 64,50 64,50 135,50 135,50 237,50 239,50 325,00 329,50 Setembro 10,00 14,50 28,50 64,00 133,50 236,50 325,50 Outubro 10,00 14,50 29,00 64,00 135,50 235,50 323,50 Novembro Dezembro 10,00 11,50 14,50 16,50 27,50 34,00 61,00 75,00 129,00 153,50 232,00 272,50 321,50 381,00 Não foi possível fazer a comparação entre o número de dias entre compras de um mesmo cliente ao longo dos meses do ano pois só há dados a partir de janeiro de 2000. Deste modo, no mês de janeiro a maioria das compras foi calculada como se fosse a primeira do cliente, e não há como saber quando foi a última vez que ele havia feito compra em 1999. IV.1.2.2. Análise das compras ao longo dos dias do ano Pode-se entender melhor as variações das compras ao longo dos meses do ano, através dos gráficos com o número, o valor médio e o valor total das compras ao longo dos dias do ano (Gráfico 10). É possível observar no gráfico que o período onde as vendas foram mais fracas foi no início de março e no final de abril (as linhas pretas nos gráficos dividem os meses do ano). Nestas datas ocorreram o carnaval e a semana santa respectivamente. Também é possível notar o aumento das vendas em agosto, principalmente na primeira quinzena. 88 Dia do ano x Número de Compras 6.000 Dia do ano x Valor Médio da Compra 180 160 5.000 140 Valor médio da compra 120 3.000 2.000 1.000 0 2,00 42,00 22,00 100 80 60 40 20 0 82,00 122,00 162,00 202,00 242,00 282,00 323,00 364,00 2,00 62,00 102,00 142,00 182,00 222,00 262,00 303,00 343,00 Dia do ano da realização da compra 42,00 22,00 82,00 122,00 162,00 202,00 242,00 282,00 323,00 364,00 62,00 102,00 142,00 182,00 222,00 262,00 303,00 343,00 Dia do ano da realização da compra Dia do ano x Valor Total das Compras 800.000 700.000 600.000 500.000 Valor total das compras Número de compras 4.000 400.000 300.000 200.000 100.000 0 2,00 42,00 82,00 122,00 162,00 202,00 242,00 282,00 323,00 364,00 22,00 62,00 102,00 142,00 182,00 222,00 262,00 303,00 343,00 Dia do ano da realização da compra Gráfico 10 Número total, média e valor total de compras ao longo dos dias do ano. Analisando bem os gráficos é possível perceber que há um padrão sazonal de alta freqüência, com a repetição dentro de um mês de vários dias com valores abaixo da média. As funções de auto -correlação parcial para o número total, a média e o valor total das compras (Gráfico 11) confirmam a existência deste padrão sazonal. Nestes gráficos as linhas representam as semanas, e é possível perceber que o padrão sazonal semanal é muito forte. A autocorrelação para diferenças múltiplas de uma semana é bastante positiva, revelando que há um padrão de compras que se repete. Observando com muita atenção, principalmente o gráfico com o valor médio das compras, também é possível observar que há uma sazonalidade mensal. Este padrão é mais fraco, entretanto é possível ver que para diferenças de dias entre 10 e 20 dias a correlação é negativa e para diferenças entre 28 e 37 dias a correlação é positiva. Número de compras Valor médio das compras realizadas no dia do ano realizadas no dia do ano 1,0 ,5 ,5 Função de auto-correlação 1,0 Intervalo de tempo (lag) 64 57 50 43 36 29 22 8 15 1 64 -1,0 57 36 29 22 8 15 1 -1,0 -,5 50 -,5 0,0 43 0,0 Intervalo de tempo (lag) Valor total das compras realizadas no dia do ano 1,0 ,5 0,0 -,5 64 57 50 43 36 29 22 15 8 -1,0 1 Função de auto-correlação Função de auto-correlação 89 Intervalo de tempo (lag) Gráfico 11 Função de auto-correlação do número total, média e valor total de compras ao longo dos dias do ano. IV.1.3. Análise dos padrões sazonais de compras A existência de padrões de compras semanais e mensais indica um comportamento dos clientes que deverá ser lembrado quando for feita a sua segmentação. Para entender melhor estes padrões sazonais, o próximo passo foi estudá-los mais a fundo. IV.1.3.1. Análise da sazonalidade mensal A existência de padrões de sazonalidade mensal é causada pelo fato da maioria das pessoas receber o salário mensalmente. Antes de comentar os resultados obtidos, é importante saber que a rede de varejo não funcionou nos dias: 1º de janeiro (ano novo), 16 de outubro (dia do comércio) e 25 de dezembro (natal). Os resultados também foram muito influenciados pelo fato de 90 fevereiro não possuir 30 dias, pela ocorrência de feriados e pela localização destes dias dentro da semana. O Gráfico 12 mostra o número de compras, o valor médio das compras e o valor total das compras ao longo dos dias dos meses. Os gráficos com o número de compras e o valor total das compras são os mais influenciados pelos problemas com datas e feriados. Por exemplo, o menor número de compras observado no dia 16 pode ser explicado devido à ocorrência do feriado do dia do comércio. Estudando o valor médio das compras ao longo dos dias do mês, é possível observar que ela possui um pico no início do mês e que seus valores diminuem na metade do mês. Este resultado pode ser uma conseqüência do fato de que no início do mês, quando as pessoas recebem seus salários, elas tendem a fazerem compras maiores para abastecerem suas casas. No meio do mês, as compras passam a conter somente itens que tenham se acabado e produtos perecíveis. Para tentar verificar a hipótese de que os clientes comparecem mais às lojas no início do mês, construiu-se o gráfico do número de dias desde a última compra em função do dia do mês (Gráfico 13). Era de se esperar que no início do mês o número de dias desde a última compra fosse maior, entretanto este fato não foi comprovado. Pelo que é possível concluir, a quantidade de compras permanece constante ao longo do mês, e por isso o intervalo de compras não apresenta nenhum padrão que se destaque. Dia do Mês x Número de Compras Dia do Mês x Valor Médio da Compra 50.000 130 120 110 40.000 100 90 80 Valor médio das compras Número de compras 30.000 20.000 10.000 0 1,00 5,00 3,00 7,00 9,00 13,00 11,00 17,00 15,00 60 50 40 30 20 10 0 21,00 19,00 Dia do mês da realização da compra 70 25,00 23,00 29,00 27,00 31,00 1,00 5,00 3,00 9,00 7,00 13,00 11,00 17,00 15,00 21,00 19,00 Dia do mês da realização da compra 25,00 23,00 29,00 27,00 31,00 91 Dia do Mês x Valor Total das Compras 6.000.000 5.000.000 Valor total das compras 4.000.000 3.000.000 2.000.000 1.000.000 0 1,00 5,00 3,00 9,00 7,00 13,00 11,00 17,00 15,00 21,00 19,00 25,00 23,00 29,00 27,00 31,00 Dia do mês da realização da compra Gráfico 12 Gráfico de barras do número total, média e valor total de compras em relação ao dia do mês. Dia do Mês x Número de dias desde a última compra Número de dias desde a última compra 20 16 12 8 4 0 1,00 5,00 3,00 9,00 7,00 13,00 11,00 17,00 15,00 21,00 19,00 25,00 23,00 29,00 27,00 31,00 Dia do mês da realização da compra Gráfico 13 Gráfico de barras do número de dias desde a última compra em relação ao dia do mês. Para estudar melhor a sazonalidade mensal, os dias do mês foram divididos em dois grupos, conforme a quinzena do mês a que pertencem: o primeiro reuniu as compras realizadas entre os dias 29 do mês anterior e 13 do mês estudado e o segundo agrupou as compras realizadas entre os dias 14 e 28 do mês observado. Esta divisão foi feita em função dos resultados obtidos no Gráfico 12 e tem por objetivo dividir os dados conforme a proximidade do pagamento de salários dos clientes. Como normalmente o pagamento de salários é feito no início do mês, estando dentro do intervalo entre os dias 29 e 13, era esperado que as compras feitas nesta quinzena apresentassem um valor maior. 92 Dividindo todas as compras conforme a quinzena em que foram realizadas, pôde-se confirmar que o valor médio das compras é maior entre os dias 29 e 13 (a Tabela 11 mostra as estatísticas descritivas e os percentis para cada quinzena). A média das compras realizadas entre os dias 29 e 13 é de R$114,27 e a das compras realizadas entre os dias 14 e 28 é de R$106,19. Observando os percentis, é possível verificar que este resultado não ocorreu devido a existência de outliers. Enquanto que entre os dias 14 e 28 cinco por cento das compras tiveram valores maiores que R$324,50, entre os dias 29 e 13 cinco por cento das compras possuíram valores maiores que R$342,50. Este deslocamento para a direita da distribuição dos valores das compras na quinzena que compreende os dias entre 29 e 13 pode ser confirmada no Gráfico 14, onde são mostrados os histogramas e os P-P plots. Tabela 11 Estatísticas descritivas e percentis do Valor das compras para as quinzenas. dia 14 a 28 dia 29 a 13 Percentis (%) dia 14 a 28 dia 29 a 13 N Mínimo 584.701 5,00 624.500 5,00 5 10 10,50 15,00 11,00 16,00 Máximo 21.139,00 16.180,00 25 29,50 32,00 62.088.175 71.362.014 50 64,00 71,00 106,19 152,84 114,27 154,35 75 90 133,00 233,50 147,00 253,00 16,27 12,16 95 324,50 342,50 Erro Padrão ,0032 ,0031 Curt ose Erro Padrão 1.162, 75 ,0064 611,23 ,0062 Soma Média Des vio Padrão Assimetria 93 Histograma P-P Plot exponencial Valor das compras (dia 14 a 28) Valor das compras (dia 14 a 28) 1.200 ,25 480 - 500 280 - 300 240 - 260 200 - 220 160 - 180 80 - 100 120 - 140 0 - 20 0 440 - 460 200 ,50 400 - 420 400 ,75 360 - 380 600 320 - 340 800 40 - 60 Número de casos 1.000 Probabilidade cumulativa esperada 1,00 0,00 0,00 ,75 Probabilidade cumulativa observada Histograma P-P Plot exponencial Valor das compras (dia 29 a 13) 1,00 Valor das compras (dia 29 a 13) 280 - 300 240 - 260 200 - 220 160 - 180 80 - 100 120 - 140 40 - 60 0 Valor das compras Gráfico 14 ,25 480 - 500 200 ,50 440 - 460 400 400 - 420 600 ,75 360 - 380 800 Probabilidade cumulativa esperada 320 - 340 1,00 1.000 0 - 20 ,50 Valor das compras 1.200 Número de casos ,25 0,00 0,00 ,25 ,50 ,75 1,00 Probabilidade cumulativa observada Histograma e P-P Plot do valor das compras para as quinzenas. A diferença no número de compras e no valor total de compras entre as duas quinzenas, que pode ser observado no Gráfico 15 e na Tabela 11, não deve ser levada em consideração devido ao diferente número de dias em cada grupo. Para contornar este problema, decidiu-se trabalhar com a média diária de cada quinzena. Analisando o número de compras por dia entre as duas quinzenas ( Tabela 12 e Gráfico 16), é possível perceber que os valores são bastante semelhantes. A média para a quinzena entre os dias 28 e 13 foi de 3.375 compras por dia e para a outra quinzena a média foi de 3.284. A hipótese de igualdade de médias é aceita pelo teste ANOVA com um intervalo de confiança igual a 95%. O valor da estatística F é de 1,86 que equivale a um nível de significância igual a 0,1729 com 362 graus de liberdade no total. 94 Quinzena x Número de Compras Quinzena x Valor Médio da Compra 650.000 120 600.000 550.000 100 500.000 450.000 80 400.000 Valor médio da compra 350.000 Número de compras 300.000 250.000 200.000 150.000 100.000 50.000 0 di a 14 a 28 60 40 20 0 di a 29 a 13 di a 14 a 28 Se a compra foi feita entre o dia 29 e 13 di a 29 a 13 Se a compra foi feita entre o dia 29 e 13 Quinzena x Valor Total das Compras 75.000.000 60.000.000 Valor total das compras 45.000.000 30.000.000 15.000.000 0 di a 14 a 28 di a 29 a 13 Se a compra foi feita entre o dia 29 e 13 Gráfico 15 Gráfico de barras do número total, média e valor total de compras em relação à quinzena. Tabela 12 Estatísticas descritivas e percentis do número diário de compras para as quinzenas. dia 14 a 28 N dia 29 a 13 Percentis (%) dia 14 a 28 dia 29 a 13 178 185 5 2.144 2.072 1.633 5.403 1.112 5.083 10 25 2.411 2.944 2.515 3.047 Soma 584.701 624.500 50 3.291 3.444 Média 3.284, 84 3.375, 68 75 3.674 3.780 609,46 -,0084 655,95 -,5862 90 95 3.952 4.323 4.120 4.339 Erro Padrão ,1821 ,1787 Curt ose Erro Padrão ,7357 ,3622 ,8159 ,3555 Mínimo Máximo Des vio Padrão Assimetria 95 Quinzena x Média diária do número de compras Média diária do número de compras 3.500 3.000 2.500 2.000 1.500 1.000 500 0 di a 14 a 28 di a 29 a 13 Se a compra foi realizada entre o dia 29 e 13 Gráfico 16 Gráfico de barras do número diário de compras conforme a quinzena. Já para o valor médio diário das compras, não se aceita a hipótese de igualdade entre as quinzenas através de um teste ANOVA. O valor do coeficiente R2 foi de 0,10 e o valor da estatística F foi de 41,98 que equivale a um nível de significância igual a 0,0000 com 362 graus de liberdade no total. O valor médio diário para a quinzena do dia 29 ao dia 13 foi de R$113,63 enquanto que para a outra quinzena o valor médio diário foi de R$105,79. Uma comparação melhor entre as duas quinzenas pode ser feita analisando-se o Tabela 13 e Gráfico 17. Analisando os percentis de ambas as distribuições, é possível perceber que, até o percentil 95%, o valor médio diário das compras realizadas entre os dias 29 e 13 é consistentemente maior que a da outra quinzena. Esta diferença só desaparece para percentis maiores que 95% devido à ocorrência de outliers. 96 Tabela 13 Estatísticas descritivas e percentis do valor médio diário das compras para as quinzenas. dia 14 a 28 dia 29 a 13 Percentis (%) N Mínimo 178 73,51 185 79,93 5 10 Máximo 157,62 147,19 Média Des vio Padrão 105,79 12,27 113,63 10,75 Assimetria 1,1975 Erro Padrão Curt ose Erro Padrão dia 14 a 28 dia 29 a 13 90,27 92,75 95,55 100,11 25 97,39 106,53 50 75 104,18 112,10 113,14 120,83 -,0587 90 118,32 128,25 ,1821 ,1787 95 131,01 130,89 2,8793 ,3622 ,2755 ,3555 Quinzena x Média diária do valor médio das compras Média diária do valor médio das compras 120 100 80 60 40 20 0 di a 14 a 28 di a 29 a 13 Se a compra foi realizada entre o dia 29 e 13 Gráfico 17 Gráfico de barras do valor médio diário das compras conforme a quinzena. Em virtude da diferença de valores médios, também não se aceita a hipótese de igualdade de valores totais diários entre as quinzenas (Gráfico 18 e Tabela 14). O valor do coeficiente R2 foi de 0,044 e o valor da estatística F foi de 16,14 que equivale a um nível de significância igual a 0,0001 com 362 graus de liberdade no total. Para a quinzena que compreende os dias entre 14 e 28, o valor total médio diário é de R$348.809,00 sendo inferior ao da outra quinzena (R$385.740,00). Esta diferença também pode ser confirmada através da análise dos percentis, somente para o percentil 5% a quinzena que engloba os dias entre 14 e 28 apresenta um valor total diário maior. 97 Tabela 14 Estatísticas descritivas e percentis do valor total diário das compras para as quinzenas. dia 14 a 28 N dia 29 a 13 178 Percentis (%) dia 14 a 28 dia 29 a 13 185 5 223.291 214.449 Mínimo 120.039 88.878 10 254.839 276.750 Máximo Soma 720.093 62.088.175 643.284 71.362.014 25 50 302.405 342.403 342.352 385.102 348.809 385.740 75 384.492 438.134 Des vio Padrão 84.709 90.206 90 446.019 497.133 Assimetria Erro Padrão 1,0795 ,1821 -,2051 ,1787 95 517.309 533.706 Curt ose Erro Padrão 3,2536 ,3622 ,9275 ,3555 Média Quinzena x Média diária do valor total das compras Média diária do valor total das compras 400.000 350.000 300.000 250.000 200.000 150.000 100.000 50.000 0 di a 14 a 28 di a 29 a 13 Se a compra foi realizada entre o dia 29 e 13 Gráfico 18 Gráfico de barras do valor total diário das compras conforme a quinzena. Voltando a analisar as compras isoladamente, sem agrupá-las por dia, o Gráfico 19 mostra o gráfico de barras do número de dias entre compras e a Tabela 15 mostra as estatísticas descritivas e percentis do número de dias entre compras para as quinzenas. O valor médio do número de dias entre compras é de 16,14 para a quinzena entre os dias 14 e 28 e 16,80 para a outra. Estes valores são muito parecidos e esta semelhança pode ser 98 confirmada pela análise dos percentis: a diferença máxima para um mesmo percentil entre as duas quinzenas é de dois dias. Tabela 15 Estatísticas descritivas e percentis do número de dias entre compras para as quinzenas. dia 14 a 28 dia 29 a 13 Percentis (%) dia 14 a 28 dia 29 a 13 N Mínimo 546.366 ,00 566.146 ,00 5 10 1 2 1 2 Máximo 357,00 359,00 25 4 4 Média 16,14 16,80 50 7 8 Des vio Padrão Assimetria 26,57 4,60 26,71 4,27 75 90 16 36 18 37 Erro Padrão ,0033 ,0033 95 61 63 Curt ose Erro Padrão 28,91 ,0066 24,85 ,0065 Quinzena x Número de dias entre compras 18 Número de dias entre compras 15 12 9 6 3 0 di a 14 a 28 di a 29 a 13 Se a compra foi feita entre o dia 29 e 13 Gráfico 19 Gráfico de barras do número de dias entre compras conforme a quinzena. Observando os histogramas (Gráfico 20) é possível perceber que para as compras feitas no meio do mês, entre os dias 14 e 28, há uma sazonalidade semanal um pouco mais forte, representada pela grande quantidade de casos onde o número de dias entre compras é igual a sete. 99 Histograma Histograma Número de dias entre compras (dia 29 a 13) 500 500 400 400 100 Número de dias entre compras Gráfico 20 38 - 39 36 - 37 34 - 35 32 - 33 30 - 31 28 - 29 26 - 27 24 - 25 22 - 23 20 - 21 18 - 19 16 - 17 14 - 15 12 - 13 6 -7 9 108- -11 4 -5 0 2 -3 32 - 33 30 - 31 28 - 29 26 - 27 24 - 25 22 - 23 20 - 21 18 - 19 16 - 17 14 - 15 12 - 13 6 -7 9 108- -11 4 -5 2 -3 0 200 0 -1 100 300 38 - 39 200 36 - 37 300 34 - 35 Número de casos 600 0 -1 Número de casos Número de dias entre compras (dia 14 a 28) 600 Número de dias entre compras Histograma do Número de dias entre compras para as quinzenas. Voltando a estudar a média diária em cada quinzena, aceita-se a hipótese de igualdade da média diária do intervalo de tempo desde a última compra para as duas quinzenas. Aplicando o teste ANOVA, o valor da estatística F foi de 0,31 que equivale a um nível de significância igual a 0,5769 com 361 graus de liberdade no total. Observando todas estas características de padrões de compras mensais, é possível concluir que o valor médio das compras, e por conseqüência o valor total das compras, é maior no início do mês em função do recebimento de salários. Porém, não se observa uma diferença no número de compras nem nos padrões de freqüência às lojas devido ao período do mês. Ou seja, conforme o mês passa, os clientes continuam comparecendo às lojas, contudo, fazendo compras de valores menores. IV.1.3.2. Análise da sazonalidade semanal O segundo padrão de compras que foi observado na análise de compras ao longo dos dias do ano foi o semanal. Através das estatísticas descritivas, dos percentis e dos gráficos de barras (Tabela 16, Tabela 17 e Gráfico 22 respectivamente), pode-se observar que o número de compras varia muito dependendo do dia. Sábado e terça-feira são os dias que apresentam o maior número de transações, com 200.040 e 200.646 respectivamente. Este resultado já poderia ser esperado para sábado, pois muitas pessoas deixam 100 para fazerem as compras da semana neste dia do final de semana, mas não para terça-feira. Entretanto, há uma explicação para a quantidade de compras neste dia inesperado: todas as terças-feiras a rede de varejo promove uma promoção na seção legumes, verduras e frutas. O dia com maior valor médio de compras também é sábado (R$119,71), entretanto o desvio padrão neste dia também é o maior (R$161,28). Segunda-feira é o dia com menor valor médio por compra (R$99,38) e com menor desvio padrão (R$140,67), caracterizando-se como o dia onde as compras são mais homogêneas. Analisando o coeficiente de variação, entretanto, sexta-feira é o dia com o menor valor (1,3368) e quinta-feira é o dia com o maior (1,4435). O Gráfico 21 mostra o coeficiente de variação para os dias da semana. Como conseqüência da segunda maior quantidade de vendas e do maior valor médio, sábado é o dia com maior receita total (R$23.946.034,00), seguido pela terça-feira (R$20.780.362,00). A análise dos percentis também confirma o maior volume de compras no sábado. Enquanto que neste dia metade das compras possui valor acima de R$77,50, na sexta-feira metade das compras tem valor acima apenas de R$69,50. Tabela 16 Estatísticas descritivas do valor das compras para os dias da semana. Domingo Segunda Terça Quarta Quinta Sexta Sábado N Mínimo 122.052 5,00 174.082 5,00 200.464 5,00 169.352 5,00 166.352 5,00 176.859 5,00 200.040 5,00 Máximo 17.171 16.047 11.667 9.802 16.180 6.365 21.139 Soma Média Des vio Padrão Coeficiente de Variação Assimetria Erro Padrão Curt ose Erro Padrão 13.313.473 17.300.112 20.780.362 19.132.092 19.156.010 19.822.108 23.946.034 109,08 99,38 103,66 112,97 115,15 112,08 119,71 156,67 140,67 142,62 157,77 166,22 149,83 161,28 1,4363 1,4154 1,3758 1,3965 1,4435 1,3368 1,3473 18,08 17,89 12,53 8,92 15,05 7,99 18,13 ,0070 ,0059 ,0055 ,0060 ,0060 ,0058 ,0055 1.319, 20 1.288, 81 556,13 231,29 820,86 155,57 1.580, 32 ,0140 ,0117 ,0109 ,0119 ,0120 ,0116 ,0110 101 Dia da Semana x Coeficiente de Variação 1,50 Coeficiente de Variação 1,20 0,90 0,60 0,30 0,00 Domingo Segunda Terça Quarta Quinta Sexta Sábado Dia da semana da realização da compra Gráfico 21 Gráfico de barras do coeficiente de variação das compras em relação ao dia da semana. Tabela 17 Percentis do valor das compras para os dias da semana. Percentis (%) Domingo Segunda Terça Quarta Quinta Sexta Sábado 5 10,50 10,00 10,50 10,50 10,50 10,50 12,50 10 25 15,50 30,50 14,50 27,50 15,00 29,00 15,00 29,50 15,00 30,50 15,50 31,00 18,00 36,00 50 66,00 59,50 63,50 67,50 69,00 69,50 77,50 75 137,50 125,50 131,50 143,00 146,00 143,50 152,38 90 95 241,00 332,00 223,50 307,50 230,00 315,00 252,50 345,50 256,50 353,00 246,00 335,50 258,00 349,50 Calculando as médias diárias por dia da semana, os resultados são muito semelhantes. Sábado e terça-feira são os dias com maiores médias diárias de transações, alcançando uma média superior a 3.800 transações por dia. Na Tabela 19 e no Gráfico 23 é possível perceber que no sábado o número médio de compras é de 3.846, na terça-feira é de 3.855, enquanto que na segundafeira (o dia com o terceiro maior volume médio) esta média é de 3.481. Entretanto, sábado e terça-feira também são os dias com maiores desvios padrões. A análise de percentis (Tabela 18) também confirma o maior número de compras na terça-feira e no sábado. Enquanto que mais da metade das terças-feiras tiveram uma quantidade de vendas superior a 3.800, apenas 102 pouco mais de 10% das segundas-feiras tiveram um volume de vendas superior a este valor. Dia da Semana x Número de Compras Dia da Semana x Valor Médio da Compra 250.000 150 200.000 120 Valor médio da compra 90 100.000 50.000 0 Domingo T erça Segunda 60 30 Quinta Quarta Sábado 0 Sexta Domingo Segunda Dia da semana da realização da compra T erça Quarta Quinta Sexta Sábado Dia da semana da realização da compra Dia da Semana x Valor Total das Compras 27.000.000 24.000.000 21.000.000 Valor total das compras Número de casos 150.000 18.000.000 15.000.000 12.000.000 9.000.000 6.000.000 3.000.000 0 Domingo Segunda T erça Quinta Sábado Quarta Sexta Dia da semana da realização da compra Gráfico 22 Gráfico de barras do número total, média e valor total de compras em relação ao dia da semana. Tabela 18 Percentis do número médio diário de compras para os dias da semana. Percentis (%) Domingo Segunda Terça Quarta Quinta Sexta Sábado 5 1.662 2.883 3.174 2.727 2.788 2.905 3.160 10 25 1.897 2.066 3.101 3.285 3.366 3.604 2.781 2.947 2.854 2.940 3.029 3.114 3.293 3.557 50 2.342 3.465 3.871 3.221 3.164 3.323 3.772 75 2.548 3.736 4.147 3.551 3.387 3.619 4.089 90 95 2.721 2.826 3.812 4.086 4.435 4.616 3.746 3.877 3.606 3.884 3.904 4.195 4.546 4.872 103 Tabela 19 Estatísticas descritivas do número médio diário de compras para os dias da semana. Domingo N Mínimo Segunda 53 1.326 Máximo Terça 50 2.082 Quarta 52 1.112 Quinta 52 2.711 52 2.739 Sexta 52 2.774 Sábado 52 3.066 3.024 4.335 4.840 4.112 4.319 4.666 5.403 122.052 2.302 174.082 3.481 200.464 3.855 169.352 3.256 166.352 3.199 176.859 3.401 200.040 3.846 Des vio Padrão 343,25 360,64 545,12 366,82 333,79 370,91 479,37 Assimetria Erro Padrão -,3923 ,3274 -,9072 ,3366 -2,3783 ,3304 ,2889 ,3304 1,4112 ,3304 1,1323 ,3304 1,0956 ,3304 Curt ose Erro Padrão ,1572 ,6444 3,8063 ,6619 11,7176 ,6501 -,8898 ,6501 2,8897 ,6501 1,9400 ,6501 1,6066 ,6501 Soma Média Dia da semana x Média diária do número de compras Média diária do número de compras 4.000 3.000 2.000 1.000 0 Domingo T erça Segunda Quinta Quarta Sábado Sexta Dia da semana da realização da compra Gráfico 23 Gráfico de barras do número médio diário de compras em função do dia da semana. Os valores médios diários também confirmam as observações anteriores. Através das estatísticas descritivas mostradas na Tabela 20 e no gráfico de barras mostrado no Gráfico 24, é possível verificar que sábado é o dia com maior valor médio de compras (R$119,16) e segunda-feira é o dia com o menor (R$99,16). A análise dos percentis mostradas na Tabela 21 também confirma o maior valor médio por compras no sábado. Metade dos sábados tiveram um valor médio por compras superior a R$117,85, enquanto que na quinta-feira o valor da mediana é de R$114,15. 104 Tabela 20 Estatísticas descritivas do valor diário médio por compra para os dias da semana. Domingo Segunda Terça Quarta Quinta Sexta Sábado N Mínimo 53 73,51 50 81,79 52 79,93 52 95,53 52 93,24 52 93,31 52 97,00 Máximo 151,21 129,99 139,24 140,30 157,62 136,45 147,19 Média Des vio Padrão 108,01 13,21 99,16 8,35 103,11 9,65 112,51 9,84 114,62 11,40 111,55 8,88 119,16 11,02 Assimetria Erro Padrão ,4179 ,3274 ,8123 ,3366 ,7955 ,3304 ,4891 ,3304 1,2657 ,3304 ,3965 ,3304 ,1669 ,3304 Curt ose Erro Padrão 1,5494 ,6444 2,5242 ,6619 2,6193 ,6501 ,0871 ,6501 3,2053 ,6501 -,0257 ,6501 -,2364 ,6501 Tabela 21 Percentis do valor diário médio por compra para os dias da semana. Percentis (%) Domingo Segunda Terça Quarta Quinta Sexta Sábado 5 88,43 87,03 91,17 96,78 99,03 99,69 98,70 10 25 93,97 99,01 88,76 94,11 92,23 96,62 100,39 104,96 102,79 106,75 100,47 103,88 104,40 112,05 50 107,46 97,96 102,12 111,61 114,15 111,58 117,85 75 115,38 104,20 109,90 119,88 119,56 118,11 126,16 90 95 124,09 130,08 107,53 112,18 113,89 116,35 124,89 131,83 130,14 135,63 123,76 126,72 134,76 136,75 Dia da semana x Média diária do valor médio das compras Média diária do valor médio das compras 140 120 100 80 60 40 20 0 Domingo Segunda T erça Quarta Quinta Sexta Sábado Dia da semana da realização da compra Gráfico 24 Gráfico de barras do valor diário médio por compra em função do dia da semana. 105 Em função do resultados obtidos anteriormente, maior quantidade e maior valor médio, sábado é o dia com maior média diária de receitas: R$460.500,00. Este valor é mais de 15% superior à média da terça-feira (dia com a segunda maior média). Segunda-feira é o dia com menor valor total médio de vendas (R$346.002,00) mas com o menor desvio padrão. O Gráfico 25 mostra o gráfico de barras do valor diário total de compras em função do dia da semana, a Tabela 22 exibe as estatísticas descritivas e a Tabela 23 mostra os percentis. Tabela 22 Estatísticas descritivas do valor diário total de compras para os dias da semana. Domingo Segunda Terça Quarta Quinta Sexta Sábado N Mínimo 53 120.039 50 200.540 52 88.878 52 278.126 52 255.381 52 274.992 52 300.539 Máximo 457.261 537.360 642.026 556.006 615.838 636.654 720.093 Soma 13.313.473 17.300.112 20.780.362 19.132.091 19.156.010 19.822.107 23.946.034 Média Des vio Padrão Assimetria Erro Padrão 251.197 346.002 399.622 367.924 368.384 381.194 460.500 60.587 53.032 75.522 63.599 65.820 66.014 85.036 ,6355 ,3274 ,7606 ,3366 -,6265 ,3304 ,7993 ,3304 1,3924 ,3304 1,4260 ,3304 ,7970 ,3304 Curt ose Erro Padrão 1,6511 ,6444 3,8482 ,6619 6,1545 ,6501 ,5434 ,6501 2,9041 ,6501 3,5165 ,6501 ,7107 ,6501 Tabela 23 Percentis do valor diário total de compras para os dias da semana. Percentis (%) Domingo Segunda Terça Quarta Quinta Sexta Sábado 5 147.495 260.699 305.635 288.211 287.735 285.674 343.440 10 184.625 293.416 324.488 293.707 305.286 314.731 362.872 25 50 212.149 244.855 318.337 342.769 357.687 397.174 305.724 362.601 324.617 350.682 340.323 369.419 401.713 439.630 75 283.390 368.159 438.720 403.768 394.053 420.086 524.146 90 337.625 401.362 468.699 453.477 460.620 454.981 563.476 95 349.304 445.896 525.698 505.377 503.278 515.266 635.222 106 Dia da semana x Média diária do valor total das compras Média diária do valor total das compras 500.000 400.000 300.000 200.000 100.000 0 Domingo T erça Segunda Quinta Quarta Sábado Sexta Dia da semana da realização da compra Gráfico 25 Gráfico de barras do valor diário total de compras em função do dia da semana. Em todas estas comparações o teste ANOVA rejeita a hipótese de igualdade de valores dos valores médios diários em função do dia de semana. Voltando a analisar todas as compras sem calcular a média diária, pode-se perceber que o padrão de freqüência também é diferente em função do dia da semana (Tabela 24, Tabela 25 e Gráfico 26). O intervalo médio desde a última compra e o seu desvio padrão são menores na segunda-feira (14,95 e 23,61 respectivamente) e na terça-feira (15,07 e 24,08 respectivamente), indicando que os clientes que fazem compras nestes dias apresentam um comportamento mais regular. Em compensação, no sábado e no domingo estes valores são maiores, indicando que os clientes que escolhem estes dias para fazerem suas compras não são tão fiéis. Estas observações podem ser comprovadas também na análise dos percentis que é menos sensível a outliers do que as estatísticas descritivas. É interessante notar que quarta-feira, quintafeira e sexta-feira apresentam valores para as estatísticas descritivas e para os percentis dos intervalos entre compras muito semelhantes, indicando uma possível similaridade no padrão de compras dos clientes que preferem estes dias. Observando os histogramas do intervalo de tempo desde a última compra (Gráfico 27) fica mais clara a diferença na freqüência de compras conforme os dias da semana. O histograma revela que para as compras feitas no domingo, 107 há uma quantidade substancial de casos em que o intervalo desde a última compra é de 7 e 8 dias, que corresponde ao final de semana anterior. No sábado há uma grande quantidade de compras feitas com um intervalo de 7 dias. Estes dois histogramas levam à uma conclusão: há um grupo grande de clientes que preferem realizar suas compras somente no final de semana. Na terça-feira também é possível perceber uma grande concentração de compras co intervalo de uma semana. Devido à promoção que acontece neste dia muitos clientes deixam para fazerem suas compras somente neste dia. Nos demais dias da semana é possível verificar um fenômeno inverso: em vez de terem um dia de preferência, os clientes têm um dia em que têm aversão a fazerem compras. São poucos os casos onde compras feitas em um dia da semana tiveram sua compra anterior feita em um domingo. Para exemplificar, no histograma da quarta-feira é possível observar que os intervalos de 3 e 10 dias apresentam poucos casos, e estes intervalos correspondem exatamente a domingos. Tabela 24 Estatísticas descritivas do número de dias entre compras para os dias da semana. Domingo N Segunda Terça Quarta Quinta Sexta Sábado 110.315 160.175 185.760 156.190 153.633 164.081 182.358 Mínimo 0 0 0 0 0 0 0 Máximo 353 344 352 357 353 359 359 Média Des vio Padrão 19,55 30,60 14,95 23,61 15,07 24,08 15,81 25,74 15,83 26,09 16,00 27,00 18,95 29,51 Assimetria Erro Padrão 3,86 ,0074 4,72 ,0061 4,81 ,0057 4,45 ,0062 4,51 ,0062 4,59 ,0060 4,03 ,0057 Curt ose Erro Padrão 19,78 ,0147 31,31 ,0122 32,43 ,0114 27,26 ,0124 27,84 ,0125 28,56 ,0121 21,91 ,0115 108 Tabela 25 Percentis do número de dias entre compras para os dias da semana. Percentis (%) Domingo Segunda Terça Quarta Quinta Sexta Sábado 5 10 1 2 2 2 1 2 1 1 1 2 1 2 1 2 25 4 4 4 4 3 3 4 50 75 9 21 7 16 7 15 7 16 7 16 7 16 8 21 90 46 33 33 35 35 36 43 95 76 54 55 60 59 61 71 Dia da Semana x Número de dias entre compras 21 Número de dias entre compras 18 15 12 9 6 3 0 Domingo Segunda T erça Quarta Quinta Sexta Sábado Dia da semana da realização da compra Gráfico 26 Gráfico de barras do número de dias entre compras conforme o dia da semana. Histograma Histograma Número de dias entre compras (segunda) 180 180 150 150 Número de dias entre compras 30 Número de dias entre compras 38 - 39 36 - 37 34 - 35 32 - 33 30 - 31 28 - 29 26 - 27 24 - 25 22 - 23 20 - 21 18 - 19 16 - 17 14 - 15 12 - 13 6 -7 9 108- -11 0 4 -5 32 - 33 30 - 31 28 - 29 26 - 27 24 - 25 22 - 23 20 - 21 18 - 19 16 - 17 14 - 15 12 - 13 6 -7 9 108- -11 4 -5 2 -3 0 60 2 -3 30 90 0 -1 60 120 38 - 39 90 36 - 37 120 34 - 35 Número de casos 210 0 -1 Número de casos Número de dias entre compras (domingo) 210 109 Histograma Histograma Número de dias entre compras (quarta) 180 180 150 150 30 34 - 35 32 - 33 30 - 31 120 90 60 30 34 - 35 32 - 33 30 - 31 28 - 29 26 - 27 24 - 25 22 - 23 20 - 21 18 - 19 16 - 17 14 - 15 12 - 13 9 108- -11 6 -7 4 -5 2 -3 0 -1 38 - 39 0 36 - 37 32 - 33 30 - 31 28 - 29 26 - 27 24 - 25 22 - 23 20 - 21 18 - 19 16 - 17 14 - 15 12 - 13 9 108- -11 6 -7 4 -5 2 -3 0 34 - 35 30 38 - 39 150 60 36 - 37 180 150 Número de casos 180 90 28 - 29 Número de dias entre compras (sexta) 210 120 38 - 39 Histograma 36 - 37 Histograma 26 - 27 24 - 25 22 - 23 20 - 21 18 - 19 16 - 17 14 - 15 12 - 13 Número de dias entre compras 210 0 -1 6 -7 Número de dias entre compras Número de dias entre compras (quinta) Número de dias entre compras Número de dias entre compras Histograma Número de dias entre compras (sábado) 210 180 150 120 90 60 30 38 - 39 36 - 37 34 - 35 32 - 33 30 - 31 28 - 29 26 - 27 24 - 25 22 - 23 20 - 21 18 - 19 16 - 17 14 - 15 12 - 13 9 108- -11 6 -7 4 -5 2 -3 0 0 -1 Número de casos Número de casos 9 108- -11 0 4 -5 32 - 33 30 - 31 28 - 29 26 - 27 24 - 25 22 - 23 20 - 21 18 - 19 16 - 17 14 - 15 12 - 13 6 -7 9 108- -11 4 -5 2 -3 0 60 2 -3 30 90 0 -1 60 120 38 - 39 90 36 - 37 120 34 - 35 Número de casos 210 0 -1 Número de casos Número de dias entre compras (terça) 210 Número de dias entre compras Gráfico 27 Histograma do Número de dias entre compras para as quinzenas. Analisando o gráfico de barras que relaciona o dia da semana da realização da compra com o dia da compra anterior (Gráfico 28) é possível confirmar algumas das características sazonais já observadas. Das 200.040 compras realizadas nos sábados, em mais de 40.000 os clientes haviam feito sua compra anterior em um outro sábado. Este valor corresponde a mais de 20% 110 das compras. No domingo e na terça-feira também se observa este fenômeno de compras seguidas em um mesmo dia da semana. Nos dias de semana é possível observar a aversão aos domingos. Dia da semana da compra anterior 50.000 Compra anterior 40.000 Domingo Segunda 30.000 Número de casos Terça 20.000 Quarta Quinta 10.000 Sexta Sábado 0 Domingo Terça Segunda Quinta Quarta Sábado Sexta Dia da semana da realização da compra Gráfico 28 Gráfico de barras com o dia da semana da compra anterior conforme o dia da semana. Resumindo todas as informações obtidas, as principais características dos dias da semana são: a. Sábado – Muitos clientes escolheram este dia como o dia em que preferem fazer suas compras. Por isso, este dia possui forte sazonalidade semanal, mas o intervalo médio desde a última compra é maior que a média dos outros dias. Os valores médios das compras são os maiores mas também são os mais heterogêneos; b. Domingo – O intervalo médio desde a última compra neste dia é maior que a média dos outros dias, e os valores médios das compras são baixos. É o dia com menor volume de vendas. Também apresenta uma grande heterogeneidade de clientes; c. Segunda-feira – Apresenta o menor intervalo médio desde a última compra significando que pode ser o dia escolhido pelos clientes mais fiéis e homogêneos. Entretanto, os valores médios das compras são os menores; 111 d. Terça-feira – Apresenta uma grande freqüência de compras, com um baixo intervalo desde a última compra. Os valores médios das compras são baixos. É o dia com o segundo maior volume de compras, sendo que esta característica pode ser uma conseqüência da promoção que existe neste dia da semana; e. Quarta-feira, quinta-feira e sexta-feira – Apresentam basicamente as mesmas características. São os dias que não possuem valores extremos nem para a freqüência nem para o valor médio das compras. IV.1.4. Análise por loja Apesar de já terem sido detectado alguns padrões de comportamento entre as compras da rede de varejo, é de se esperar que este comportamento não seja o mesmo se elas fossem separadas por lojas. Com o intuito de detectar essas possíveis diferenças, as quatro lojas da rede foram analisadas separadamente para poderem ser comparadas. As quatro lojas não apresentam a mesma participação no volume de vendas da empresa. Duas das lojas são responsáveis por mais de 80% do número de compras (Gráfico 29). O valor médio de cada compra também é diferente por loja. Há uma loja que possui a média consideravelmente menor que a das outras. É interessante notar que esta loja é uma das duas que tem um grande volume de vendas. Deste modo, a outra loja com bom volume de vendas e elevado valor médio por compra se destaca como a geradora da maior parte da receita total da empresa, quase 50%. Observando o número médio de dias entre compras por cliente de cada loja (Gráfico 30), é possível começar entender porque uma loja possui o valor médio por compra menor que as outras. Esta loja é a que possui o menor intervalo tempo médio entre compras, indicando que seus clientes sejam mais fiéis e freqüentes. Para confirmar esta hipótese o Gráfico 31 mostra o número de clientes e o número médio de compras por cliente para cada loja. Antes de se fazer qualquer comentário é necessário explicar que não foi feita nenhuma seleção de outliers na contagem do número de clientes. Clientes que fizeram 112 suas compras em uma determinada loja, mas que alguma vez também adquiriram algum produto em outra loja, foram considerados consumidores dos dois estabelecimentos. Neste gráfico é possível perceber que a loja que possui a maior receita total é a que possui o maior número de clientes. Em compensação, a loja que tem o menor valor médio por compra possui uma quantidade de clientes reduzida, mas que fazem compras freqüentemente. O número de clientes desta loja é quase o mesmo que o das duas lojas que têm participação irrisória na receita total, mas devido à freqüência de seus clientes, que é quase o dobro da média das outras lojas, a sua participação na receita total chega a aproximadamente 30%. Lojas x Número de compras Loja x Valor médio da compra 600.000 150 500.000 120 400.000 Valor médio da compra 90 200.000 100.000 0 Loja 1 Loja 2 Loja 3 60 30 0 Loja 4 Loja 1 Número do estabelecimento Loja 2 Loja 3 Loja 4 Número do estabelecimento Loja x Valor Total das Compras 70.000.000 60.000.000 50.000.000 Valor Total das Compras Número de compras 300.000 40.000.000 30.000.000 20.000.000 10.000.000 0 Loja 1 Loja 2 Loja 3 Loja 4 Número do estabelecimento Gráfico 29 Gráfico de barras do número total, média e valor total de compras por loja. 113 Loja x Número de dias entre compras 24 Número de dias entre compras 20 16 12 8 4 0 Loja 1 Loja 2 Loja 3 Loja 4 Número do estabelecimento Gráfico 30 Gráfico de barras do número de dias entre compras por loja. Loja x Número de clientes Loja x 60.000 40.000 30.000 Número de clientes Média do número de compras por cliente Média do número de compras por cliente 50.000 20.000 10.000 0 Loja 1 20 16 12 8 4 0 Loja 2 Loja 3 Loja 4 Loja 1 Número do estabelecimento Gráfico 31 Loja 2 Loja 3 Loja 4 Número do estabelecimento Gráfico de barras com o número de clientes e a média do número de compras por cliente para cada loja. Mês do ano x Mês do ano x Número de compras por loja Valor médio da compra por loja 60.000 160 50.000 120 Valor médio das compras Número de compras 40.000 30.000 20.000 10.000 0 Janeiro Março Feverei ro Maio Abril Julho Junho Mês da realização da compra Loja 80 Loja 1 Loja 2 Loja 2 40 Loja 3 Loja 4 Setembro Novembro Agosto Loja Loja 1 Outubro Dezembro Loja 3 0 Loja 4 Janeiro Março Feverei ro Maio Abril Julho Junho Mês da realização da compra Setembro Novembro Agosto Outubro Dezembro 114 Mês do ano x Valor total das compras 7.000.000 6.000.000 Valor total das compras 5.000.000 4.000.000 Loja 3.000.000 Loja 1 2.000.000 Loja 2 1.000.000 Loja 3 0 Loja 4 Janeiro Março Feverei ro Maio Abril Julho Junho Setembro Novembro Agosto Outubro Dezembro Mês da realização da compra Gráfico 32 Evolução do número total, média e valor total de compras por loja ao longo dos meses do ano. Analisando a evolução do número de compras, do valor médio e do valor total das compras ao longo do ano (Gráfico 32), é possível perceber que não houve nenhuma alteração nas relações entre as lojas. A loja que teve o maior número de vendas e a maior receita total não foi alcançada em nenhum mês, e a loja com menor valor médio por compra não esboçou nenhuma mudança neste padrão ao longo do ano. Loja x Loja x Valor médio das compras Número de compras por dia da semana 100.000 Valor médio das compras Número de compras 80.000 60.000 40.000 20.000 0 Loja 1 Loja 2 Loja 3 Número do estabelecimento Gráfico 33 Loja 4 por dia da semana Dia da semana 150 Domingo 120 Dia da semana Domingo Segunda Segunda Terça Quarta 90 Terça Quarta 60 Quinta Quinta Sexta Sábado 30 Sexta 0 Sábado Loja 1 Loja 2 Loja 3 Loja 4 Número do estabelecimento Gráfico de barras com o número total e o valor médio das compras por dia da semana para cada loja. 115 Loja x Número de dias entre compras Número de dias entre compras por dia da semana 30 Dia da semana 25 Domingo 20 Segunda Terça 15 Quarta 10 Quinta 5 Sexta 0 Sábado Loja 1 Loja 2 Loja 3 Loja 4 Número do estabelecimento Gráfico 34 Gráfico de barras com o número médio de dias entre compras por loja. Comparando o padrão de compras ao longo dos dias da semana entre as lojas (Gráfico 33 e Gráfico 34), é possível perceber que sábado é um dia forte nas vendas em todas elas. Entretanto, nas duas principais lojas, terça-feira feira também se destaca devido à promoção na seção de frutas, legumes e verduras. Em todas as lojas, os dias com maior intervalo entre compras são sábado e domingo. Este padrão está presente inclusive na loja onde os clientes são mais freqüentes. Havia uma dúvida se a evolução das compras por dia da semana poderia variar em função da loja e da quinzena. O Gráfico 35 mostra esta comparação para o número e o valor médio das compras entre as duas principais lojas da rede. Quanto ao número de compras por dia da semana, é possível observar que na quinzena entre os dias 28 e 13 (quando as pessoas recebem seus salários) o volume aos sábados é maior que na outra quinzena. Este fato ocorre nas duas lojas, entretanto, na loja 2, mesmo nesta quinzena, terça-feira continua sendo o dia com maior número de compras. Outra diferença entre as duas lojas é o volume de vendas na segunda-feira, na loja 2 na quinzena entre 28 e 13 ele é significativamente maior que nos outros dias úteis (exceto terçafeira). Comparando o valor médio das compras, é mais difícil perceber alguma diferença entre as lojas. Só é possível perceber que na loja 2 o valor médio na 116 quinta-feira, comparando-se com os outros dias da semana, é maior que na loja 1. Quinzena x Quinzena x Valor médio das compras Número de compras por dia da semana Loja 1 50.000 Domingo Valor médio das compras Número de compras 40.000 30.000 20.000 10.000 0 di a 14 a 28 Segunda T erça Dia da semana Loja 1 150 Domingo 120 Segunda T erça 90 Quarta Quarta 60 Quinta Sexta Sábado Quinta 30 Sexta 0 Sábado di a 29 a 13 di a 14 a 28 di a 29 a 13 Se a compra foi feita entre o dia 29 e 13 Se a compra foi feita entre o dia 29 e 13 Quinzena x Quinzena x Valor médio das compras Número de compras por dia da semana por dia da semana Dia da semana Loja 2 50.000 Domingo Valor médio das compras 40.000 Número de compras por dia da semana Dia da semana 30.000 20.000 10.000 0 di a 14 a 28 di a 29 a 13 Se a compra foi feita entre o dia 29 e 13 Gráfico 35 Segunda T erça Dia da semana Loja 2 150 Domingo 120 Segunda T erça 90 Quarta Quarta 60 Quinta Sexta Sábado Quinta 30 Sexta 0 Sábado di a 14 a 28 di a 29 a 13 Se a compra foi feita entre o dia 29 e 13 Comparação entre o número de compras e o seu valor médio entre as duas principais lojas em função da quinzena e do dia da semana. Em função de todos estes resultados obtidos ao se comparar a performance de cada loja separadamente, é interessante notar que mesmo pertencendo à mesma rede de varejo os seus padrões de compras são bastante diferentes. A loja 1, mesmo não sendo a mais importante em receita, apresenta um caso interessante devido ao seu menor número de clientes, que, entretanto, são mais fiéis. Esta fidelidade pode compensar o menor volume de vendas na medida que não é necessário fazer tanta propaganda para manter estes clientes. A empresa deveria estudar cuidadosamente porque esta loja apresenta um relacionamento muito mais forte com os seus clientes do que as outras. Será que foram promoções, iniciativas da loja ou simplesmente 117 características do mercado local que proporcionaram esta fidelização? Respondendo estas perguntas, a companhia poderia tentar replicar esta característica de sucesso nas outras lojas do grupo. IV.2. ANÁLISE DOS CLIENTES Até o momento, somente as compras foram analisadas. Através delas é possível inferir alguns padrões recorrentes, mas não se é capaz de diferenciar os clientes individualmente. Conhecer a característica de cada um possibilita a comunicação personalizada, permitindo a construção e a manutenção de um relacionamento, quando este for interessante para eles e para a empresa. A partir de agora, o objeto de estudo passa a ser os clientes e quais são os seus padrões de compras. Perguntas como quais são os mais freqüentes, quais os que fazem mais compras e qual a loja que eles preferem tentaram ser respondidas. Somente através destas respostas é possível para a firma construir um relacionamento duradouro com os seus clientes. IV.2.1. Análise geral de todos os clientes Antes de se tentar fazer qualquer segmentação dos clientes, é interessante analisar todos ao mesmo tempo. Foram 96.689 clientes que fizeram compras na rede de varejo e utilizaram o cartão de fidelização. Entretanto, muitos deles fizeram poucas compras e não devem ser considerados clientes usuais da empresa. Por isso, só foram estudados os consumidores que fizeram pelo menos 12 compras nas lojas da rede ao longo do ano de 2000. Fazendo este corte, foi estudado o comportamento de compra de 32.576 pessoas. A pessoa que fez o maior número de compras fez 310 aquisições. Esta freqüência é muito elevada, quase uma vez a cada 1,17 dias em que as lojas estiveram abertas. Este valor pode ser uma fraude e a empresa deveria tentar descobrir que é esta pessoa. No total, estes clientes fizeram 953.258 compras, uma média superior a 2.600 por dia. Cada cliente fez em média 29,26 compras no ano, ou seja, uma vez a cada 12,4 dias. Somente 10% dos clientes têm uma média de compras superior a 53 compras por ano, o que seria equivalente a 118 uma compra por semana. Outros 10% fizeram menos do que 13 compras, o que equivale a praticamente uma compra por mês. Estes valores podem se verificados nas estatísticas descritivas e na análise de percentis apresentados na Tabela 26. Tabela 26 Estatísticas descritivas e percentis do Número de compras por cliente. Estatí stica Número de casos Erro padrão Percentis (%) Valor 32.576 5 12 12 310 10 25 13 16 Soma 953.258 50 23 Média 29,26 75 36 Moda Des vio Padrão 12 19,55 90 95 53 66 Mínimo Máximo Assimetria Curt ose 2,62 ,0136 12,43 ,0271 A distribuição do número de compras por cliente se assemelha muito com uma exponencial. A principal diferença que pode ser notada no histograma (Gráfico 36) é o corte dos clientes que não fizeram no mínimo 12 compras no ano. Este fato da distribuição apresentar uma forma exponencial é uma característica interessante para a empresa pois significa que há um grupo seleto de clientes que é responsável por um percentual elevado de todas as compras da rede. A firma deve tentar descobrir quem são estes clientes especiais que fazem compras relacionamento com eles. freqüentemente e tentar construir um 119 Histograma Número de compras 8.000 4.000 2.000 112 - 116 88 - 92 96 - 100 104 - 108 80 - 84 72 - 76 64 - 68 56 - 60 48 - 52 40 - 44 32 - 36 24 - 28 0 0 -4 8 - 12 16 - 20 Número de casos 6.000 Número de compras Gráfico 36 Histograma do Número de compras por cliente. Gráfico de Pareto para Percentual do número de compras total o número de compras 1,00 ,80 ,60 ,40 ,20 0,00 ,01 ,11 ,06 ,21 ,16 ,31 ,26 ,41 ,36 ,51 ,46 ,61 ,56 ,71 ,66 ,81 ,76 ,91 ,86 ,96 Percentual dos clientes Gráfico 37 Gráfico de Pareto para o número de compras. O Gráfico 37 mostra o gráfico de Pareto entre o número de clientes e o de compras. É possível verificar que apenas 20% dos clientes são responsáveis por 40% das compras e que apenas 28% dos clientes respondem por mais de 50% do volume de vendas. Apesar de já ser bastante expressivo, é interessante lembrar que este resultado não leva em conta os clientes que fizeram menos de 12 compras ao longo do ano. As estatísticas descritivas e os percentis do valor médio das compras por cliente estão mostrados na Tabela 27. É possível verificar que o valor médio das compra por cliente foi de R$112,73, mas a amplitude é muito alta sendo que o pior cliente tem um valor médio de compra igual a R$8,13 e o melhor 120 R$5.791,42. Por este motivo, o desvio padrão tem quase o mesmo valor que a média: R$87,86. A moda da distribuição foi R$94,50. Mais de 10% dos clientes tiveram um valor médio por compra acima de R$200,00. Levando-se em conta que estes clientes foram no mínimo 12 vezes à loja durante o ano, estes clientes certamente gastaram mais de R$2.400,00 nas lojas da rede durante o ano. Estes também são clientes especiais que deveriam receber um tratamento especial. Tabela 27 Estatísticas descritivas e percentis do Valor médio das compras por cliente. Estatí stica Número de casos Mínimo Erro padrão Percentis (%) Valor 32.576 8,13 5 10 31,39 40,54 5.791, 42 25 61,09 112,73 50 94,08 Moda Des vio Padrão 94,50 87,86 75 90 141,48 201,55 Assimetria 12,09 ,0136 95 250,06 587,69 ,0271 Máximo Média Curt ose O histograma do valor médio de compras por cliente se assemelha muito com a distribuição lognormal. O Gráfico 38 mostra, além do histograma, o P-P Plot comparativo com a distribuição lognormal, onde é possível observar a semelhança entre ambas. Novamente é possível perceber que apenas uma parcela dos clientes é responsável pelas maiores médias por compras. 121 Histograma P-P Plot Lognormal Valor médio das compras Valor médio das compras 6.000 280 - 300 240 - 260 200 - 220 160 - 180 80 - 100 120 - 140 0 - 20 40 - 60 0 ,25 480 - 500 1.000 ,50 440 - 460 2.000 400 - 420 3.000 ,75 360 - 380 Número de casos 4.000 320 - 340 5.000 Probabilidade cumulativa esperada 1,00 0,00 0,00 Valor médio das compras Gráfico 38 ,25 ,50 ,75 1,00 Probabilidade cumulativa observada Histograma e P-P Plot do Valor médio das compras por cliente. Analisando agora o gasto total por cliente ao longo de 2000, a Tabela 28 mostra as estatísticas descritivas e os percentis do valor total das compras por cliente. O cliente que mais gastou nas lojas da rede adquiriu R$78.693,00 em compras. Este valor é extremamente elevado e se não for uma fraude, deve ser resultado de compras de eletrodomésticos ou eletro-eletrônicos. Na média, os clientes gastaram R$3.009,62 no ano, que corresponde a pouco mais de R$250,00 por mês. Em compensação, 50% dos clientes consumiram mais de R$2.370,25 e 10% compraram mais de R$5.723.95, que equivale a mais de R$475,00 por mês. Tabela 28 Estatísticas descritivas e percentis do Valor total das compras por cliente. Estatí stica Erro padrão Percentis (%) Valor Número de casos 32.576 5 648,92 Mínimo 127,00 10 881,50 Máximo 78.693 25 1.424, 50 Soma Média 98.041.466 3.009 50 75 2.370, 25 3.803, 50 Moda 967,00 90 5.723, 95 2.697 6,28 95 7.305, 28 ,0136 101,74 ,0271 Des vio Padrão Assimetria Curt ose 122 A distribuição do valor total também se assemelha muito com um lognormal, fato que pode ser observado através do histograma e do P-P Plot (Gráfico 39). Histograma P-P Plot Lognormal Valor total das compras Valor total das compras 5.000 1.000 8.000 - 8.500 9.000 - 9.500 10.000 - 10.500 7.000 - 7.500 6.000 - 6.500 5.000 - 5.500 4.000 - 4.500 3.000 - 3.500 0 - 500 2.000 - 2.500 1.000 - 1.500 0 ,50 14.000 - 14.500 2.000 ,75 13.000 - 13.500 3.000 12.000 - 12.500 Número de casos 4.000 - 11.500 11.000 Probabilidade cumulativa esperada 1,00 ,25 0,00 0,00 Valor total das compras Gráfico 39 ,25 ,50 ,75 1,00 Probabilidade cumulativa observada Histograma e P-P Plot do Valor total das compras por cliente. Gráfico de Pareto para Percentual do valor total das compras o valor total das compras 1,00 ,80 ,60 ,40 ,20 0,00 ,01 ,11 ,06 ,21 ,16 ,31 ,26 ,41 ,36 ,51 ,46 ,61 ,56 ,71 ,66 ,81 ,76 ,91 ,86 ,96 Percentual dos clientes Gráfico 40 Gráfico de Pareto para o valor total das compras O Gráfico 40 mostra o gráfico de Pareto entre o valor total das compras e o número de clientes. É possível verificar que apenas 22% dos clientes são responsáveis por metade das receitas. Estes são os clientes que deveriam receber uma atenção especial da empresa. Repetindo a tentativa de se montar uma regressão que explique o valor médio das compras pela freqüência com que o cliente vai a loja, os resultados obtidos foram melhores mas continuam sendo não significativos. O poder de explicação do valor médio das compras através do número de compras do cliente é muito baixo. A correlação entre ambos, que pode ser visto na Tabela 123 29 como coeficiente beta, é de apenas –0,1683. A correlação negativa significa que a medida que o cliente faz mais compras, o valor médio da compra diminui. Tabela 29 Regressão Número de compras por cliente x Valor médio das compras por cliente. a Coeficientes (Constante) Número de compra s Coeficientes não padronizados B Erro padrão Coeficientes padronizados T Beta Significância. Intervalo de confianç a 95% para B Limite inferior Limite superior 134,86 ,8639 -,76 ,0245 156,11 -,1683 -30,81 ,0000 ,0000 133,17 136,55 -,80 -,71 a Variável dependente: Valor médio das compras Ficou claro nestes estudos que há um grupo de clientes mais lucrativo e fiel. O próximo passo foi tentar descobrir se há algum padrão de compra que torne possível identificar estes clientes. Estes padrões podem ser o período do mês, o dia da semana ou a loja onde preferem fazer suas compras. IV.2.2. Segmentação por período do mês O primeiro critério de segmentação tem por objetivo verificar se é possível identificar os principais clientes da organização através do período do mês em que concentram suas compras. Serão utilizadas as mesmas quinzenas da análise das compras: entre os dias 14 e 28 do mesmo mês e entre o dia 29 do mês anterior e o dia 13. Se o consumidor tiver mais de 70% do valor total de suas compras em uma destas quinzenas ele será classificado como cliente da mesma, caso ele não concentre suas compras ele será classificado como „Sem quinzena‟. A Tabela 30 mostra as estatísticas descritivas e os percentis do número de compras conforme a segmentação por quinzena e o Gráfico 41 exibe o gráfico de barras do número, média e valor total de compras conforme a segmentação 124 por quinzena. Os clientes que preferem realizar suas compras entre os dias 29 e 13 têm uma freqüência de compras um pouco maior que os clientes que preferem o meio e o final do mês, 21,42 contra 19,75 respectivamente. Entretanto, estes que pertencem a uma das duas quinzenas realizam, na média, um número menor de compras que os compradores que foram classificados como „Sem quinzena‟ (31,39). Esta freqüência menor de compras pode ser observada também nos percentis. Na verdade, apenas 20% dos clientes puderam se classificados em um dos períodos do mês. A grande maioria dos clientes não concentra suas compras em algumas das quinzenas. Tabela 30 Estatísticas descritivas e percentis do número de compras conforme a segmentação por quinzena. N Mínimo Máximo Soma Média dia 14 a 28 dia 29 a 13 Sem quinzena Percentis (%) dia 14 dia 29 a 28 a 13 Sem quinzena 2.072 4.532 25.972 5 12,00 12,00 12,00 12 12 12 10 12,00 12,00 14,00 109 128 40.926 97.067 310 815.265 25 50 13,00 17,00 14,00 18,00 17,00 25,00 19,75 21,42 31,39 75 22,75 25,00 39,00 Des vio Padrão 9,52 11,22 20,68 90 32,00 35,00 57,00 Assimetria Erro Padrão 2,78 ,0538 2,57 ,0364 2,47 ,0152 95 39,00 44,35 70,00 Curt ose Erro Padrão 13,07 ,1075 10,35 ,0727 11,19 ,0304 Apesar de fazerem menos compras, os consumidores que pertencem a uma das duas quinzenas as realizam com valor médio maior. Isto deve acontecer pois, como eles vão menos freqüentemente às lojas, suas compras devem ser suficientes para abastecê-los por um período maior de dias. A Tabela 31 mostra as estatísticas descritivas e os percentis do valor médio das compras conforme a segmentação por quinzena. 125 Tabela 31 Estatísticas descritivas e percentis do valor médio das compras conforme a segmentação por quinzena. dia 14 a 28 N 2.072 Mínimo Máximo Média dia 29 a 13 Sem quinzena Percentis (%) dia 14 dia 29 a 28 a 13 Sem quinzena 4.532 25.972 5 33,64 34,65 30,57 13,63 8,36 1.729, 91 2.542, 37 8,13 5.791, 42 10 25 43,41 66,26 46,27 69,76 39,57 59,48 127,49 127,27 109,01 50 105,97 105,29 91,29 Des vio Padrão 95,75 95,47 85,40 75 159,77 160,19 136,99 Assimetria Erro Padrão 4,14 ,0538 5,78 ,0364 14,61 ,0152 90 238,35 226,34 95 293,17 284,17 194,54 238,57 Curt ose Erro Padrão 45,39 ,1075 101,57 ,0727 793,71 ,0304 Mesmo tendo um valor médio de compras maior, os clientes que concentram suas compras gastam menos por mês. Os clientes classificados como “Sem quinzena” gastaram em média R$3.140,00 ao longo do ano 2000. Em compensação, os clientes que preferem a quinzena entre os dias 14 e 28 gastaram R$2.419,00 e os da outra quinzena R$2.530,00. Comparando as duas quinzenas, os clientes do início do mês são melhores que os do meio do mês. A Tabela 32 exibe as estatísticas descritivas e os percentis do valor total das compras conforme a segmentação por quinzena. A conclusão que pode ser tirada em função do comportamento dos clientes ao longo das quinzenas é que o melhor consumidor é aquele que vai sempre na loja, independentemente do período do mês. Este cliente não concentra suas compras em período algum, e por isso está sempre comprando na rede de varejo. 126 Tabela 32 Estatísticas descritivas e percentis do valor total das compras conforme a segmentação por quinzena. dia 14 a 28 N Sem quinzena 2.072 4.532 25.972 186,50 65.736 127,00 76.271 5.014. 215 11.469.096 Mínimo Máximo Soma dia 29 a 13 Percentis dia 14 (%) a 28 5 dia 29 a 13 534,83 Sem quinzena 611,33 671,50 136,00 78.693 10 733,15 824,80 25 1.165, 38 1.343, 50 905,15 1.472, 00 81.558.156 50 1.916, 50 2.117, 00 2.469, 00 Média 2.419 2.530 3.140 75 3.096, 38 3.176, 88 3.982, 50 Des vio Padrão Assimetria 2.260 11,67 2.143 11,23 2.799 5,63 90 4.572, 15 4.552, 90 95 5.844, 25 5.678, 85 6.014, 20 7.607, 85 Erro Padrão ,0538 ,0364 ,0152 Curt ose Erro Padrão 299,64 ,1075 325,25 ,0727 80,37 ,0304 Média do número de compras x Valor médio das compras x Segmentação por quinzena Segmentação por quinzena 35 150 120 Valor médio das compras 25 20 15 10 5 0 di a 14 a 28 di a 29 a 13 90 60 30 0 Sem quinzena di a 14 a 28 Segmentação por quinzena di a 29 a 13 Sem quinzena Segmentação por quinzena Valor total das compras x Segmentação por quinzena 3.500 3.000 2.500 Valor total das compras Média do número de compras 30 2.000 1.500 1.000 500 0 di a 14 a 28 di a 29 a 13 Sem quinzena Segmentação quinzena Gráfico 41 Gráfico de barras do número, média e valor total de compras conforme a segmentação por quinzena. 127 IV.2.3. Segmentação por número de dias da semana Este segundo critério tem por objetivo verificar se é possível segmentar os clientes através da quantidade de dias da semana em que preferem fazer compras. Se o consumidor realizou 50% ou mais dos seus gastos em um dia específico da semana, ele foi classificado como „Um dia‟. Se ele fez menos de 50% das compras em somente um dia, mas concentrou 80% ou mais de seus gastos em dois determinados dias da semana, ele foi classificado como „Dois dias‟. E se ele não obedeceu nenhum destes critérios ele foi classificado como „Sem dia‟. Espera-se que os clientes que concentram suas compras em um ou dois dias da semana sejam muito fiéis à loja e que suas compras não tenham valores médios tão baixos. Conforme pode ser visto na Tabela 33 e no Gráfico 42, os clientes que fizeram suas compras em um ou dois dias são menos freqüentes e realizaram menos compras em média. Isto pode ser confirmado tanto através da média como dos percentis. Enquanto que os clientes classificados como “Sem dia” realizaram em média 30 compras na rede, os clientes “Um dia” fizeram 24,67 e os clientes “Dois dias” 22,16. Como havia acontecido com a segmentação anterior, somente uma pequena parcela de todos os compradores (19%) foi classificada como clientes de um ou dois dias. Tabela 33 Estatísticas descritivas e percentis do número de compras conforme a segmentação por número de dias da semana. N Sem dia Um dia Doi s dias Percentis (%) Sem dia Um dia Doi s dias 26.246 5.815 515 5 12 12 12 Mínimo 12 12 12 10 13 12 12 Máximo 310 124 89 25 16 14 14 798.371 143.473 30,42 24,67 11.414 22,16 50 75 24 37 20 30 18 26 Soma Média Des vio Padrão Assimetria Erro Padrão Curt ose Erro Padrão 20,48 14,26 12,00 90 55 46 38 2,59 1,81 2,10 95 69 54 47 ,0151 12,00 ,0302 ,0321 4,02 ,0642 ,1076 5,52 ,2148 128 Mesmo realizando menos compras, o valor médio dos clientes que concentram suas compras em somente um ou dois dias da semana é consideravelmente maior quer o dos outros clientes. A médias dos cientes que concentram suas compras em somente um dia da semana é R$129,16 contra R$108,78 dos clientes não classificados. Esta diferença corresponde a 18,74% do valor médio dos compradores „Sem dia‟ (Tabela 34 e Gráfico 42). Tabela 34 Estatísticas descritivas e percentis do valor médio das compras conforme a segmentação por número de dias da semana. Sem dia N Mínimo Máximo Média 26.246 8,13 Um dia Doi s dias Percentis (%) Sem dia Um dia Doi s dias 5.815 8,36 515 8,86 5 10 30,23 39,38 36,81 47,01 37,99 50,57 5.791, 42 1.126, 37 567,63 25 58,92 72,24 71,98 108,78 129,16 128,25 50 90,52 110,28 108,64 87,33 14,57 88,84 2,97 80,58 1,68 75 90 136,25 194,76 160,80 225,72 169,42 230,15 Erro Padrão ,0151 ,0321 ,1076 95 241,75 282,54 286,95 Curt ose Erro Padrão 745,23 ,0302 18,28 ,0642 4,13 ,2148 Des vio Padrão Assimetria Em função deste maior valor médio de compras, os clientes que preferem realizar suas compras em somente um dia da semana possuem um valor total médio de compras maior: R$3.087,01 e R$2.996,64 respectivamente (Tabela 35 e Gráfico 42). Apesar de pequena, esta superioridade é comprovada estatisticamente através da comparação de médias pelo teste-t entre amostras independentes com um intervalo de confiança igual a 95%. A hipótese de igualdade entre as médias é rejeitada pois o valor da estatística t é de –2,26, com 8.394 graus de liberdade (não assumindo a igualdade de variâncias), resultando numa significância bi-caudal de 0,024. 129 Tabela 35 Estatísticas descritivas e percentis do valor total das compras conforme a segmentação por número de dias da semana. Sem dia Um dia Doi s dias Percentis (%) Sem dia Um dia Doi s dias N 26.246 5.815 515 5 651,67 628,50 617,60 Mínimo 127,00 146,50 273,50 10 888,00 853,50 868,40 25 1.428, 00 1.416, 00 50 2.376, 00 2.366, 50 1.290, 50 2.161, 50 Máximo Soma 78.693 49.158 24.923 78.649.693 17.950.946 1.440. 827 Média 2.996 3.087 2.797 75 3.797, 00 3.885, 00 3.472, 00 Des vio Padrão 2.685 2.776 2.398 90 5.663, 95 6.000, 20 5.330, 80 Assimetria Erro Padrão 6,83 ,0151 4,20 ,0321 3,12 ,1076 95 7.191, 15 7.736, 00 8.247, 00 Curt ose Erro Padrão 118,97 ,0302 37,52 ,0642 17,61 ,2148 Média do número de compras x Valor médio das compras x Segmentação por número de dias da semana 35 Segmentação por número de dias da semana 150 120 Valor médio das compras 25 20 15 10 5 0 Sem dia Um dia 90 60 30 0 Dois dias Sem dia Segmentação por número de dias da semana Um dia Dois dias Segmentação por número de dias da semana Valor total das compras x Segmentação número de dias da semana 3.500 3.000 2.500 Valor total das compras Média do número de compras 30 2.000 1.500 1.000 500 0 Sem dia da semana Um dia Dois dias Segmentação por número de dias da semana Gráfico 42 Gráfico de barras do número, média e valor total de compras conforme a segmentação por número de dias da semana. 130 A conclusão que pode ser tirada desta segmentação por número de dias da semana em que concentram suas compras é que as pessoas que as fazem compras em um determinado dia da semana realmente apresentam algumas características bem atrativas para a empresa. Apesar de não serem os clientes mais freqüentes, seu volume total de compras é maior que a média. IV.2.4. Segmentação por loja A última segmentação que foi feita é a separação dos clientes por lojas. Se uma pessoa teve uma freqüência em uma determinada loja maior ou igual a 80% do número total suas de compras ela foi classificada como cliente desta loja. Tabela 36 Estatísticas descritivas do número de compras conforme a segmentação por loja. Sem loja N Loja 1 Loja 2 Loja 3 Loja 4 891 12.276 13.689 4.506 1.214 Mínimo 12 12 12 12 12 Máximo Soma 197 20.878 310 389.785 239 406.430 227 105.299 216 30.866 Média 23,43 31,75 29,69 23,37 25,43 Des vio Padrão Assimetria 16,01 4,45 20,93 2,58 19,78 2,37 13,85 3,06 16,83 3,48 ,0819 32,23 ,1637 ,0221 13,00 ,0442 ,0209 9,06 ,0419 ,0365 19,80 ,0729 ,0702 22,17 ,1403 Erro Padrão Curt ose Erro Padrão 131 Tabela 37 Percentis do número de compras conforme a segmentação por loja. Percentis (%) Sem loja Loja 1 Loja 2 Loja 3 Loja 4 5 10 12,00 13,00 13,00 14,00 12,00 13,00 12,00 12,00 12,00 13,00 25 14,00 17,00 16,00 14,00 15,00 50 75 19,00 27,00 25,00 39,00 23,00 37,00 19,00 27,00 20,00 30,00 90 37,00 57,00 54,00 41,00 44,00 95 50,00 71,00 67,50 51,00 56,00 A Tabela 36 mostra as estatísticas descritivas do número de compras conforme a segmentação por loja e o Gráfico 43 exibe o gráfico de barras do número, média e valor total de compras conforme a segmentação por loja. Ao contrário dos outros critérios de segmentação, apenas 3% não foram classificados segundo este critério. Os clientes das lojas 1 e 2 são os mais freqüentes, sendo que os primeiros são um pouco mais. Apesar de pequena, esta superioridade é comprovada estatisticamente através do comparação de médias pelo teste-t entre amostras independentes, o valor da estatística t é de 8,13, com 25.271 graus de liberdade (não assumindo a igualdade de variâncias), resultando numa significância bi-caudal de 0,000. Através da análise de percentis exibida na Tabela 39 é possível confirmar a maior freqüência dos clientes da loja 1 e da loja 2. Enquanto que 25% dos clientes da loja 1 fizeram 39 compras ou mais durante o ano, na loja 3 apenas 10% dos clientes fizeram 41 compras ou mais. 132 Tabela 38 Estatísticas descritivas do valor médio das compras conforme a segmentação por loja. Sem loja Loja 1 Loja 2 891 15,21 Máximo 2.185, 73 5.791, 42 2.542, 37 799,28 970,73 116.119 130,32 1.255. 564 102,28 1.639. 307 119,75 520.641 115,54 140.547 115,77 144,80 85,45 88,51 75,45 81,13 Assimetria Erro Padrão 7,62 ,0819 25,61 ,0221 4,66 ,0209 2,04 ,0365 2,74 ,0702 Curt ose 84,71 ,1637 1.609, 55 ,0442 69,22 ,0419 8,10 ,0729 15,60 ,1403 Des vio Padrão Erro Padrão Tabela 39 Percentis do valor médio 13.689 8,13 das 4.506 8,44 Loja 4 N Mínimo Soma Média 12.276 8,20 Loja 3 compras 1.214 13,34 conforme a segmentação por loja. Percentis (%) Sem loja Loja 1 Loja 2 Loja 3 Loja 4 5 10 31,98 41,12 29,72 38,17 32,31 42,56 32,12 42,09 34,62 43,39 25 64,74 56,83 64,39 63,70 61,91 50 101,66 86,68 100,18 97,81 93,20 75 90 150,79 224,41 129,09 181,31 150,19 215,96 147,74 207,71 146,33 216,35 95 299,95 219,22 269,06 255,66 258,86 Passando a analisar o valor médio por compra, os clientes da loja 1 já não apresentam um bom desempenho. Através das estatísticas descritivas exibidas na Tabela 38 pode-se verificar que a sua média (R$102, 28) é a menor de todas, correspondendo a 85% da média dos clientes da loja 2 (R$119,75), a maior de todas. Comparando os percentis exibidos na Tabela 39 é possível comprovar a maior média dos clientes da loja 2, onde 25% dos clientes têm um valor médio por compra acima de R$150,00. 133 Tabela 40 Estatísticas descritivas do valor total das compras conforme a segmentação por loja. Sem loja N Mínimo 891 182,50 Máximo Loja 1 Loja 2 12.276 150,50 Loja 3 13.689 127,00 Loja 4 4.506 136,00 1.214 174,00 62.376 69.497 78.693 41.562 22.908 2.639. 466 2.962 35.728.308 2.910 44.924.545 3.281 11.454.100 2.541 3.295. 047 2.714 Des vio Padrão 4.285 2.284 3.048 2.157 2.276 Assimetria Erro Padrão 7,69 ,0819 5,04 ,0221 6,24 ,0209 5,06 ,0365 3,06 ,0702 Curt ose Erro Padrão 79,52 ,1637 86,45 ,0442 96,86 ,0419 56,52 ,0729 15,27 ,1403 Soma Média Tabela 41 Percentis do valor total das compras conforme a segmentação por loja. Percentis (%) Sem loja Loja 1 Loja 2 Loja 3 Loja 4 5 10 605,30 808,50 676,93 907,00 656,00 905,00 580,67 780,35 684,63 911,75 25 1.211, 50 1.454, 13 1.490, 75 1.261, 75 1.305, 13 50 2.021, 50 2.380, 75 2.539, 00 2.043, 75 2.089, 00 75 90 3.324, 50 5.244, 40 3.761, 38 5.445, 60 4.166, 00 6.328, 00 3.168, 00 4.718, 20 3.327, 50 5.167, 25 95 7.621, 00 6.836, 37 8.079, 00 6.137, 40 6.797, 88 Como era de se esperar, os clientes da loja 2 são os que apresentam a maior média de compras ao longo do ano 2000. Analisando as estatísticas descritivas exibidas na Tabela 40 é possível observar que a média dos gastos destes clientes foi de R$3.281,00. Mesmo não tendo uma grande média por compra, os clientes da loja 1 apresentam a segunda maior média de consumo durante o ano graças à sua freqüência à loja: R$2.910.00. Observando os percentis mostrados na Tabela 41, é possível perceber que na loja 2, dez por cento dos clientes gastaram mais de R$6.300,00 durante o ano, que corresponde a mais de R$525,00 por ano. Em compensação, analisando os desvios padrão, pode-se constatar que os clientes da loja 1 são mais 134 homogêneos. Enquanto que o seu desvio padrão é de R$2.284,00, o dos clientes da loja 2 é de R$3.084,00. Média do número de compras x Valor médio das compras x Segmentação por loja Segmentação por loja 35 150 120 Valor médio das compras 25 20 15 10 5 0 Sem loj a Loja 1 Loja 2 Loja 3 90 60 30 0 Loja 4 Sem loj a Segmentação por loja Loja 1 Loja 2 Loja 3 Loja 4 Segmentação por loja Valor total das compras x Segmentação por loja 3.500 3.000 2.500 Valor total das compras Média do número de compras 30 2.000 1.500 1.000 500 0 Sem loj a Loja 1 Loja 2 Loja 3 Loja 4 Segmentação por loja Gráfico 43 Gráfico de barras do número, média e valor total de compras conforme a segmentação por loja. Estes resultados confirmam as conclusões tiradas na análise das compras por loja: os clientes da loja 1 são mais freqüentes e consomem menos por compra. Por outro lado, os clientes da loja 2 são os que mais gastam em suas compras. Mas será que a empresa não precisa de maiores gastos em propaganda para manter os clientes da loja 2 do que os da loja 1? Cabe à empresa fazer este estudo e responder esta pergunta. 135 CAPÍTULO V CONCLUSÃO V.1. A IMPORTÂNCIA DO CRM Neste trabalho, tentou-se mostrar a importância do CRM e como a utilização de técnicas quantitativas pode ajudar muito na construção do relacionamento entre empresas e clientes. Para mostrar a importância que o CRM está tendo no mundo atual, foi feita uma revisão da literatura onde diversos autores concordam que a criação de um relacionamento de longo prazo com seus clientes pode ser o caminho para muitas empresas frente ao aumento da concorrência. Também foi possível constatar que a tecnologia, hoje em dia, está tornando cada vez mais viável este relacionamento possibilitando a customização da comunicação e da produção em massa. Estes fatos, entre outros, vem despertando a curiosidade do meio acadêmico e empresarial para o CRM. Entre os diversos benefícios do CRM, a principal vantagem é a fidelização dos clientes. Através da repetição de compras bem sucedidas, onde suas expectativas foram atingidas ou superadas, o cliente vai se tornando mais fiel a uma empresa e mais inacessível a seus concorrentes. Deste modo, a organização não precisa fazer pesados investimentos em propaganda para manter ou buscar novos clientes. Além disso, quando o faz, sua com unicação é muito mais direta e eficiente. Contudo, apesar da redução nos custos diretos de manutenção e de aquisição de clientes, estar sempre atendendo os seus desejos traz outras despesas para a empresa. Por isto, este relacionamento não deve ser construído com todos os clientes, cabendo à organização calcular quem são os mais valiosos. Para calcular o valor de um cliente, a empresa não deve levar em conta somente o seu comportamento atual, pois há muitos casos onde a mudança de perfil de um consumidor é esperada. As empresas devem estar atentas a estes momentos, pois a mudança pode representar uma grande oportunidade. Outro fato para o qual as firmas precisam estar atentas é que o 136 relacionamento não é construído de um dia para o outro, e nem é eterno. Elas precisam estar continuamente criando valor para seus clientes segundo o ponto de vista deles. Um dos motivos que desperta tanta atenção para o CRM é que o conceito de relacionamento, que embora não seja novo, parece difícil de ser implementado num mundo dominado pela produção em massa e pela preocupação com custos. Calcular o valor de um cliente e estar sempre criando valor para eles não são tarefas triviais, pois dependem do comprometimento de toda a firma e do tipo da indústria onde a empresa atua. O primeiro passo para colocar o CRM em funcionamento é obter o máximo de informações sobre os clientes. Somente assim, uma empresa saberá quem são seus melhores clientes e como agradá-los. Neste contexto, os bancos de dados, o data warehouse e o data mining são ferramentas muito úteis na obtenção, armazenamento, manipulação e extração de conhecimento a partir destes dados. Os bancos de dados e o data warehouse permitem que estas informações sejam armazenadas de forma segura, que estejam sempre atualizadas e que possam ser manipuladas de forma fácil. Já o data mining viabiliza a extração de conhecimento a partir destes dados. O data mining utiliza o avanço tecnológico para extrair o conhecimento de grandes bases de dados, conseguindo informações que dificilmente poderiam ser obtidas por outros métodos. Apesar de muitos autores afirmarem que o data mining é uma ferramenta de fácil utilização, há controvérsias pois ele utiliza modelos quantitativos bastante complexos. Diz-se que por utilizar modelos de inteligência artificial o data mining não necessita qualquer interferência humana, pois toda informação pode ser obtida exclusivamente pelo computador. Contudo, isto não é totalmente verdade, pois estas informações precisam sempre ser confrontadas com a realidade, não devendo ser encaradas como verdade absoluta. Muitas vezes é necessário a interferência humana para compatibilizar os modelos com a realidade e devido à complexidade do data mining esta tarefa exige mão-de-obra muito especializada. Mesmo assim, atualmente, já há vários exemplos de empresas 137 que conseguiram melhorar o relacionamento com os seus clientes através das informações obtidas utilizando-se o data mining e o CRM. Um exemplo de indústria onde o CRM pode causar uma revolução é o varejo. Devido ao contato direto com os clientes e com o advento das compras on line, a obtenção de informações sobre o seu comportamento de compra e a criação de valor para eles deixaram de ser tarefas impossíveis. No Brasil especificamente, devido ao grande grau de concorrência entre as principais empresas, o CRM poderá ser ainda mais útil. É exatamente na indústria varejista onde este trabalho mostra um exemplo de como é possível obter conhecimento com a utilização de técnicas quantitativas simples. V.2. RESULTADOS E CONCLUSÕES DA ANÁLISE DOS DADOS Dada a competitividade atual do mercado varejista, uma empresa que consiga extrair o máximo de informações sobre seus clientes e construir um relacionamento de longo prazo com eles estará obtendo uma importante vantagem competitiva. Através do exemplo de análise de dados de uma rede varejista, esperou-se ilustrar uma pequena parte das informações que podem ser obtidas. Através das informações obtidas a empresa poderia repensar alguns de seus processos, seu posicionamento e sua estratégia, estreitando o relacionamento com os seus clientes mais valiosos. O primeiro estudo feito foi a análise de todas as compras. Ao contrário do que era esperado, não foi possível estabelecer uma relação entre o valor da compra e o número de dias desde que um cliente havia feito a sua última compra. Esta relação não foi possível devido à grande variedade no perfil de compra dos clientes. A primeira conclusão que pôde ser tirada é que devido à heterogeneidade dos dados é muito difícil chegar a alguma conclusão analisando todos os clientes ao mesmo tempo. Por este motivo, deve-se tentar algum tipo de segmentação para que o padrão de compra de cada grupo de consumidor fique mais claro. 138 Continuando a analisar as compras, o próximo estudo feito foi o seu acompanhamento ao longo do ano. Como era esperado, dezembro se mostrou como um mês de vendas fortes, entretanto, o mês de agosto superou-o no número de compras. Como só foram analisados os dados do ano 2000, é impossível concluir que o mês de agosto seja sempre um mês de vendas fortes. Na verdade, é bem provável que o desempenho deste mês tenha sido causado por um fator externo econômico, ou devido a alguma promoção. Cabe à empresa tentar verificar o que causou este desempenho inesperado. Se a causa tiver sido um fator econômico externo, a firma deve tentar descobrir qual foi, e passar a ficar atenta pois quando ele se repetir é provável que o volume de vendas volte a crescer novamente. Por outro lado, se a causa tiver sido a realização de uma promoção, a firma deve ava liar se o aumento das vendas realmente atingiu o esperado e se o resultado final foi compensador. Ainda analisando a evolução das compras ao longo do tempo, foi possível detectar dois padrões sazonais no comportamento dos clientes: o semanal e o mensal. Ao contrário do que poderia ser esperado, o padrão semanal foi mais forte que o mensal. Este pode ser um reflexo da estabilidade monetária brasileira, pois em épocas de inflação mais alta é provável que a sazonalidade mensal fosse mais forte. Estudando o comportamento das compras ao longo do mês a única diferença que pôde ser notada foi um pequeno aumento no valor médio das compras no início do mês. A quantidade de compras permanece praticamente a mesma, mostrando que os clientes não escolhem somente o início do mês para fazerem suas compras. Em relação a sazonalidade semanal, uma grande diferença foi encontrada entre os finais de semana e os outros dias da semana. Como era de se esperar, a compras nos finais de semana são mais heterogêneas. Sábado é o dia com maior receita total de compras. Domingo possui a menor. É possível notar que muitos clientes fazem suas compras nos finais de semana não podem fazê-las nos outros dias, e por isso escolhem principalmente o sábado. Por outro lado, analisando os dias de segunda a sexta-feira, percebe-se exatamente o contrário: os clientes que podem fazer suas compras nestes dias não têm um dia fixo de preferência, mas evitam os finais de semana. A exceção fica para a 139 terça-feira, pois devido a uma promoção na seção de verduras e legumes, muitos clientes preferem fazer compras neste dia. Devido à forte sazonalidade semanal, muitas sugestões podem ser dadas para explorar este fato: a. Como domingo é o dia com menores vendas, a empresa deve discutir se realmente vale a pena abrir as lojas neste dia. Entretanto, mesmo que financeiramente não seja compensador, a empresa não deve esquecer a questão da imagem da rede que deixaria de ter suas lojas “abertas todos os dias da semana” e deixaria de ser uma loja de conveniência; b. Decidindo manter as lojas abertas aos domingos, a empresa poderia avaliar a criação de incentivos para algumas pessoas trocarem o sábado pelo domingo. Assim, a ociosidade aos domingos seria reduzida e a empresa poderia prestar um serviço melhor aos sábados, quando atualmente as lojas estão mais cheias; c. Devido à resposta à promoção nas terças -feiras, a empresa deve avaliar se este resultado é compensador. Seria interessante estudar qual seria o impacto se esta promoção acabasse ou se ela fosse estendia a mais um ou dois dias da semana, por exemplo; d. Como foi possível perceber uma diferença de padrão de compras conforme os dias da semana, a empresa poderia avaliar se outros tipos de promoções, conforme as características das compras de cada dia, não poderiam ser lucrativas. Por exemplo, na segunda-feira as compras são mais homogêneas e os clientes mais constantes, será que uma promoção que premiasse estas características não atrairia ainda mais clientes neste dia e aumentaria a fidelidade dos atuais? A última análise feita com as compras foi separando-as por loja. Foi possível perceber que a diferença de receita e do perfil dos clientes entre as lojas era grande. Para confirmar a existência destas diferenças, no final do estudo, fezse a segmentação dos clientes conforme as lojas. 140 Depois de analisar as compras, passou-se a estudar os clientes. A primeira conclusão que pôde ser tirada foi a confirmação de que apenas uma pequena parte dos clientes é responsável pela maioria das compras e da receita. Por este motivo, a empresa deve tentar achar um meio de identificar estes clientes pois eles são os mais valiosos e merecem a construção de um relacionamento de longo prazo. A primeira tentativa de segmentação foi através do período do mês em que os clientes fazem compras. Entretanto, esta segmentação não trouxe resultados significativos devido a dificuldade de classificação dos clientes. Como os clientes atualmente comparecem durante todo o mês, é difícil separálos segundo este critério. O segundo critério foi o número de dias da semana em que eles preferem fazer suas compras. Era esperado que os clientes mais fiéis tivessem um ou dois dias de preferência. Novamente este critério não apresentou resultados muito bons pois poucos clientes foram classificados. O último critério foi a separação por loja de preferência. Esta foi a segmentação que apresentou os melhores resultados. Os clientes da loja 1 se destacaram como os mais freqüentes apesar de terem um valor médio das compras menor. Já os da loja 2 são os que possuem o maior valor médio por compra. Em função destes resultados a empresa deveria estudar a viabilidade e a lucratividade de cada loja. Será que todas as quatro são lucrativas e devem ser mantidas? Outro questionamento que a empresa deve fazer é: será que esta diferença de resultados se deve exclusivamente à diferenças no perfil populacional de cada região a que cada loja atende? É bem provável que essas diferenças não possam ser justificadas exclusivamente por fatores externos à empresa. A imagem e o posicionamento das lojas em suas regiões podem ser diferentes e estas são variáveis que podem ser trabalhadas pelo marketing. Mesmo que a conclusão seja que a localização e as características da região são fatores importantíssimos, cabe a firma descobrir quais são os fatores que caracterizam uma boa região para que as novas lojas sejam construídas em locais onde estes resultados possam ser repetidos. 141 Analisando todas estas informações obtidas, foi possível mostrar que com a utilização de métodos quantitativos simples muito conhecimento pode ser extraído. Cabe à empresa, de posse de todo este conhecimento, reunir seus departamentos de marketing, finanças e operações para reavaliar a sua estratégia. O departamento de marketing deve analisar se as promoções realmente estão de acordo com o perfil dos clientes. Deve verificar também se este tipo de cliente era realmente o alvo da empresa e pensar em novas promoções para criar ou manter a sua fidelidade. O departamento de finanças deveria analisar se o resultado das promoções realizadas realmente foi satisfatório. Em conjunto com o departamento de marketing, ele também deveria estudar se a política de vendas a prazo e concessão de crédito está de acordo com o perfil de cliente encontrado. Já o departamento de operações deveria verificar se o abastecimento da loja e o atendimento aos clientes estão sendo planejados levando em consideração o padrão de compras apresentado pelos clientes. Se a firma for capaz de utilizar eficientemente todo este conhecimento, ela estará dando um grande passo rumo à vitória neste mundo tão competitivo. V.3. SUGESTÃO PARA ESTUDOS FUTUROS Como este trabalho se limitou a exemplificar apenas alguns métodos quantitativos, há diversas sugestões de estudos que podem ser feitos no futuro por esta empresa. Há sugestões que vão desde simples aprofundamento do que já foi feito, até outras que envolvem a utilização de ferramentas quantitativas e bancos de dados mais complexos: a. Segmentar os clientes por dia da semana – Já que a segmentação por número de dias na semana não trouxe o resultado esperado (mas está claro que os dias da semana têm diferentes perfis de compras) deve-se continuar tentando algum tipo de segmentação que utilize esta informação. Também poder-se-ia tentar diferenciar os clientes como “clientes de finais de semana” ou “clientes de segunda a sexta-feira”; 142 b. Utilizar técnicas mais avançadas de data mining – Para ajudar na segmentação dos clientes poder-se-ia utilizar ferramentas quantitativas mais complexas como análise de clusters e redes neurais. Estas ferramentas podem ajudar ainda mais na tarefa de identificação do perfil de compra dos clientes mais valiosos; c. Combinar a utilização das variáveis RFM para classificar os clientes – Seguindo exemplos já citados na literatura, poder-se-ia tentar segmentar os clientes em função das variáveis RFM (recency, frequency e monetary); d. Criar um alarme de freqüência – Além de se preocupar em identificar quem são os seus clientes principais, seria interessante criar um mecanismo que ajude a identificar quando estes clientes estão mudando o seu comportamento, indicando que possam estar abandonando a empresa. Utilizando ferramentas quantitativas, pode ser possível a criação deste alarme que ajude a identificar quando um cliente importante para a empresa está mudando (diminuindo) o seu padrão de freqüência às lojas; e. Expandir a janela do banco de dados armazenando dados por um período maior do que um ano – Conforme o banco de dados se tornar maior, possuindo dados mais antigos, informações como a evolução do número de dias entre compras ao longo do ano e a descoberta de sazonalidades dentro do ano poderiam ser obtidas; f. Expandir o banco de dados com informações sobre a cesta de compras de cada cliente – Através desta expansão seria possível estudar qual o tipo de compra padrão dos clientes mais valiosos, além de identificar produtos que normalmente são comprados em conjunto; g. Aprofundar a análise dos clientes mais importantes – Dado que foi possível mostra através do gráfico de Pareto que realmente existe um grupo de clientes especial, a empresa deve tentar conhecê-los mais detalhadamente. Para isto, ela poderia utilizar além dos dados das 143 compras (valores e cesta), os seus dados sócio-econômicos. Analisando todas estas informações, ficaria mais fácil descobri quem são estes clientes. Como se pode perceber o limite para obtenção de novas informações é praticamente infinito. Cabe à empresa saber utilizar este conhecimento e avaliar até quando o esforço e os gastos compensam. 144 REFERÊNCIAS BIBLIOGRÁFICAS ALBERTIN, A.L.; MARQUES, E.V. Os aspectos e contribuições do comércio eletrônico para o setor de varejo. In: ENCONTRO ANUAL DA ANPAD ENANPAD, 23, 1999, Foz do Iguaçu. Anais eletrônicos... São Paulo: EAESP/FGV, 1999. 1 CD. ANDERSON, E.W.; FORNELL, C.; LEHMANN, D.R. Customer satisfaction, market share, and profitability: findings from Sweden. Journal of Marketing, Chicago, v. 58, n. 3, p. 53-66, jul. 1994. ANDERSON, J.C.; NAURUS, J.A. Business marketing: understanding what customers value. Harvard Business Review, Boston, v. 76, n. 6, p. 53-65, nov./dec. 1998. APICELLA, M. Customer relationship management: ramping up sales service. InfoWorld, Framingham, v. 21, n. 33, p. 68-80, 16 aug. 1999. BERSON, A.; SMITH, S.; THEARLING, K. Building data mining applications for CRM. New York: McGraw-Hill, 1999. 510p. BUTTLE, F. The CRM value chain. Disponível em: <http://www.crmforum.com>. Acesso em 08 jan. 2001. COOPER, B.L.; WATSON, H.J.; WIXON, B.H.; GOODHUE, D.L. Data warehousing supports corporate strategy at First American Corporation. MIS Quarterly, (Minneapolis), v. 24, n. 4, p. 547-567, dec. 2000. CROSS, R.; SMITH, J. Retailers move toward new customer relationships. Direct Marketing, New York, v.57, n.8, p. 20-22, dec. 1994. DATA DISTILLERIES. Introdução à mineração de dados – descobrindo valor escondido nas suas bases de dados. Disponível <http://www.marketingdeprecisao.com.br>. Acesso em 11 jan. 2001. em: 145 DAVIDS, M. How to avoid the 10 biggest mistakes in CRM. Journal of Business Strategy, Boston, v. 20, n. 6, p. 22-26, nov. 1999. EVANS, P.B.; WURSTER, T.S. Strategy and the new economics of information. Harvard Business Review, Boston, v. 75, n. 5, p. 71-82, sept./oct. 1997. FELDENS, M.; REATEGUI, E. Roadmaps para projetos de marketing de precisão. Disponível em: <http://www.marketingdeprecisao.com.br>. Acesso em 11 jan. 2001. FOURNIER, S.; DOBSCHA, S.; MICK, D.G. Preventing the premature death of relationship marketing. Harvard Business Review, Boston, v. 76, n. 1, p. 4251, jan./feb. 1998. HA, S.H.; PARK, S.C. Application of data mining tools to hotel data mart on the internet for database marketing. Expert Systems with Applications, Amsterdam, v. 15, n. 1, p. 1-31, jul. 1998. HIRATA, C. O cliente é quem manda. SuperHiper, São Paulo, v.26, n.300, p. 10-20, ago. 2000. HUGHES, A.M. Boosting response with RFM – recency, frequency, and monetary analysis finds the buyers in your database. American Demographics, Ithaca, p. 4-10, may 1996. HUI, S.C.; JHA, G. Data mining for customer service support. Information & Management, Oxford, v. 38, n. 1, p. 1-13, oct. 2000. JACKSON, B.B. Build customer relationships that last. Harvard Business Review, Boston, v. 63, n. 6, p. 120-128, nov./dec. 1985. JACKSON, R.R.; WANG, P. Strategic database marketing. Lincolnwood: NTC Business Books, 1994. 262p. KELLY, T.H. Maximizing lifetime customer value. LIMRA’s MarketFacts, Hartford, v. 19, n. 6, p. 30-36, nov./dec. 2000. 146 KISH, J. Before your customers leave... Bank Marketing, Washington, v. 32, n. 12, p. 30-35, dec. 2000. KNOX, S. Loyalty-based segmentation and the customer development process. European Management Journal, Oxford, v. 16, n. 6, p. 729-737, dec. 1998. NEWELL, F. Fidelidade.com. São Paulo: Makron Books, 2000. 285p. PAES, A.M.M. Programas de lealdade em montadoras: um estudo na indústria automobilística brasileira. Rio de Janeiro: UFRJ/COPPEAD, 1999. 136p. Dissertação. (Mestrado em Administração) PEPPARD, J. Customer relationship managemet (CRM) in financial services. European Management Journal, Oxford, v. 19, n. 3, p. 312-327, jun. 2000. PEPPERS, D.; ROGERS, M.; DORF, B. Is your company ready for one-to-one marketing? Harvard Business Review, Boston, v. 77, n. 1, p. 151-160, jan./feb. 1999. PESSANHA FILHO, R.C.; FERREIRA, A.L.; CORREA, S.C.H. Clube de clientes: no marketing de relacionamento “o essencial é invisível para os olhos”. In: ENCONTRO ANUAL DA ANPAD - ENANPAD, 24, 2000, Florianópolis. Anais eletrônicos... Rio de Janeiro: COPPEAD/UFRJ, 2000. 1 CD. PINE II, B.J.; PEPPERS, D.; ROGERS, M. Do you want to keep your customers forever? Harvard Business Review, Boston, v. 73, n. 2, p. 103-114, mar./apr. 1995. PINE II, B.J.; VICTOR, B.; BOYNTON, A.C. Making mass customization work. Harvard Business Review, Boston, v. 71, n. 5, p. 108-119, sept./oct. 1993. QUBE CONSULTING. Predicting and using customer lifetime value to improve profitability. Disponível em: <http://www.crm-forum.com>. Acesso em 11 jan. 2001. 147 SAARENVIRTA, G. Data mining to improve profitability. CMA, Hamilton, v. 72, n. 2, p. 8-12, mar. 1998. SANTOS, O.G. Avaliação de bases de segmentação de mercados: um estudo do mercado de automóveis de passeio da cidade do Rio de Janeiro. Rio de Janeiro: UFRJ/COPPEAD, 1978. 88p. Dissertação. (Mestrado em Administração) SAUNDERS, C.; MERTZER, M. Driving customer retention, development and acquisition for profit in the insurance business. Disponível em: <http://www.crm-forum.com>. Acesso em 08 jan. 2001. SFORNA, M. Data mining in a power company customer database. Electric Power Systems Research, Texas, v. 55, n. 3, p. 201-209, sept. 2000. STONE, M.; WOODCOCK, N.; WILSON, M. Managing the change from marketing planning to customer relationship management. Long Range Planning, Exeter, v. 29, n. 5, p. .675-683, oct. 1996. SUPERHIPER. São Paulo: Abras, v. 26, n. 297, mai. 2000. SWEAT, J. Are customers kings? InformationWeek, Manhasset, Issue 816, p. 42-54, 11 dec. 2000. TAURION, C. Apanhado geral de data mining. Disponível em: <http://www.marketingdeprecisao.com.br>. Acesso em 11 jan. 2001a. TAURION, C. Implementando CRM com sucesso: algumas recomendações. Disponível em: < http://www.marketingdeprecisao.com.br/>. Acesso em 10 jan. 2001b. VELLIDO, A.; LISBOA, P.J.G.; MEEHAN, K. Segmentation of the on-line shopping marketing using neural networks. Expert Applications, Amsterdam, v. 17, n. 4, p. 303-314, nov. 1999. Systems with 148 VERGARA, S.C. Projetos e relatórios de pesquisa em administração. São Paulo: Atlas, 1997. 90p.