0 UNIVERSIDADE DO SUL DE SANTA CATARINA CÁSSIUS HENRIQUE LEMES VICTOR ALMEIDA DE SOUZA ANÁLISE EXPLORATÓRIA DE DADOS: ESTUDO DE CASO DA REDE DE RESTAURANTES MIYOSHI Palhoça 2008 1 CÁSSIUS HENRIQUE LEMES VICTOR ALMEIDA DE SOUZA ANÁLISE EXPLORATÓRIA DE DADOS: ESTUDO DE CASO DA REDE DE RESTAURANTES MIYOSHI Trabalho de Conclusão de Curso apresentado ao Curso de Graduação em Sistemas de Informação da Universidade do Sul de Santa Catarina, como requisito parcial à obtenção do título de Bacharel em Sistemas de Informação. Orientador: Aran Bey Tcholakian Morales Palhoça 2008 2 CÁSSIUS HENRIQUE LEMES VICTOR ALMEIDA DE SOUZA ANÁLISE EXPLORATÓRIA DE DADOS: ESTUDO DE CASO DA REDE DE RESTAURANTES MIYOSHI Este Trabalho de Conclusão de Curso foi julgado adequado à obtenção do título de Bacharel em Sistemas de Informação e aprovado em sua forma final pelo curso de Sistemas de Informação, da Universidade do Sul de Santa Catarina. Palhoça, 2 de julho de 2008. __________________________________________________ Prof. e orientador Aran Bey Tcholakian Morales, Dr. Universidade do Sul de Santa Catarina __________________________________________________ Prof. João Luiz Alkaim, Dr. Universidade do Sul de Santa Catarina __________________________________________________ Rosana Velasco Friedrich Convidada externa 3 "Ao meu pai, meu melhor amigo." 4 AGRADECIMENTOS CÁSSIUS: Como não poderia deixar de ser, começo agradecendo aquele que tornou este trabalho possível, a mim. Graças a minha força de vontade e dedicação, consegui concluir mais esta etapa. Porém, outras pessoas foram fundamentais para isto. Agradeço aos meus pais, Marcos Antônio Lemes e Sandra Helena da Silva por tudo que fizeram, fazem e farão por mim, sempre ao meu lado, mesmo quando não o fizera por merecer tal atitude. Agradeço àquela que, muito antes de adentrar a esta jornada, já estava ao meu lado. Keilla de Souza Ferreira, obrigado pela compreensão, paciência e amor ao longo deste s anos todos. Agradeço ao Senhor Londres Machado, pelas oportunidades e confiança despejada sobre mim. Ao meu amigo Victor Almeida de Souza que foi um excelente parceiro no desenvolvimento deste trabalho, assim como foi durante toda vida. Ao Prof. Aran Bey Tcholakian Morales pela excelente orientação e por todo conhecimento passado durante este período. A todos os funcionários da Rede de Restaurantes Miyoshi, em especial para Rosana Friedrich (Marketing - Miyoshi), André Becker Testa (T.I - Miyoshi) e Rafael Augusto Nito (Gerência - Miyoshi) por todo auxílio e boa vontade demonstrados quando requisitados. A toda Família Yamaguchi, minha segunda família, mas não menos importante. Aos meus cachorros, principalmente ao Simba Alface, por manterem o silêncio e a ordem durante o desenvolvimento deste trabalho. VICTOR: Aos meus pais, Nicéia Mara Almeida de Souza e Joceli de Souza, e à minha irmã Rafaela Almeida de Souza, pelo amor e dedicação constantes, proporcionados durante toda minha vida. À minha namorada Pâmela Pereira de Oliveira, pelo amor e por me apoiar sempre. Ao meu amigo Cássius Henrique Lemes, por também ser um excelente parceiro durante toda a vida. Ao meu orientador Aran Bey Tcholakian Morales , pelos conselhos e apoios valiosos e por nos ensinar a procurar os caminhos científicos a serem percorridos. 5 "Pobres de ti se pensas estar vencido. Tua derrota é caso decidido. Queres vencer, mas em ti não crês, tua descrença esmaga -te de vez." ANÔNIMO “Somos o que repetidamen te fazemos. A excelência, portanto, não é um feito, mas um hábito.” ARISTÓTELES 6 RESUMO O presente estudo tem por finalidade analisar os dados dos clientes e os diversos formulários de opinião de uma empresa , para descobrir informações e conhecimento qu e auxiliem na busca de estratégias de melhoria no atendimento e relacionamento com o cliente , com aplicação na Rede de Restaurantes Miyoshi. Para tanto, contextualizou -se o trabalho com um acurado levantamento bibliográfico sobre gerência de relacionamento com o cliente e análise exploratória de dados. A metodologia utilizada foi a ICONIX, como modelo de proposta de solução. O exame dos resultados aponta algumas medidas de melhoria para aplicação no sistema, com informações úteis para a empresa até então desconhecidas. Palavras-chave: Análise exploratória de dados. Data warehouse. Fidelização. Gerência de relacionamento com o cliente. Satisfação. 7 ABSTRACT The present study it has for purpose to analyze the data of the customers and d iverse forms of opinion of a company, to discover information and knowledge that assist in the search of strategies of improvement in the attendance and relationship with the customer, with application in the net of Miyoshi restaurants. For in such a way, the work was contextualized with the accurate bibliographical survey on management of relationship with the customer and exploratory analysis of data. As a model of solution proposal it was used the I CONIX methodology. The examination of the results points some measures of improvement with respect to application in the system, with useful information for the company until then unknown. Keywords: Exploratory analysis of data. Data warehouse. Fidelizing. Customer relationship management. Satisfaction. 8 LISTA DE FIGURAS FIGURA 01: Esquema da solução proposta ........................................................................ 15 FIGURA 02: Ferramentas para acompanhar e medir a sa tisfação de clientes ....................... 22 FIGURA 03: Comparação entre dados de natureza operacional e informacional ................. 26 FIGURA 04: Dados, informação e conhecimento................................................................ 27 FIGURA 05: O ciclo de tratamento dos dados ..................................................................... 30 FIGURA 06: Análise exploratória de dados versus estatística tradicional ............................ 31 FIGURA 07: ICONIX – Atividades da análise de requisitos ............................................... 44 FIGURA 08: ICONIX – Atividades da análise e projeto prel iminar .................................... 45 FIGURA 09: ICONIX – Atividades do projeto ................................................................... 46 FIGURA 10: Diagrama de classes....................................................................................... 47 FIGURA 11: Requisitos funcionais ..................................................................................... 48 FIGURA 12: Casos de uso .................................................................................................. 49 FIGURA 13: CSU001 – Extração, transformação e carga - ETL ......................................... 49 FIGURA 14: CSU001 – Descrição...................................................................................... 50 FIGURA 15: CSU002 – Ferramenta de front-end................................................................ 50 FIGURA 16: CSU002 – Descrição...................................................................................... 51 FIGURA 17: Diagrama de robustez – ETL ......................................................................... 51 FIGURA 18: Diagrama de robustez – Ferramenta de front-end ........................................... 52 FIGURA 19: Diagrama de tabela de dados .......................................................................... 56 FIGURA 20: Reformulação das tabelas de fid elidade.......................................................... 57 FIGURA 21: Reformulação das tabelas de satisfação .......................................................... 57 FIGURA 22: Cadastro de clientes ....................................................................................... 58 FIGURA 23: Percentual de clientes por estado .................................................................... 59 FIGURA 24: Percentual de clientes por cidades de Santa Catarina ...................................... 59 FIGURA 25: Percentual de clientes por bairros de Florianópolis ......................................... 60 FIGURA 26: Percentual de clientes por bairros de São José ................................................ 60 FIGURA 27: Percentual de clientes por bairros de Blumenau ............................................. 61 FIGURA 28: Percentual de clientes por faixa etária ............................................................ 61 FIGURA 29: Percentual de clientes por ocupação ............................................................... 62 FIGURA 30: Média de idade por cidade ............................................................................. 62 FIGURA 31: Evolução da fidelização ................................................................................. 63 FIGURA 32: Média de gasto por loja .................................................................................. 63 FIGURA 33: Evolução do faturamento ............................................................................... 64 FIGURA 34: Faturamento mensal por ano .......................................................................... 64 FIGURA 35: Percentual de gasto quinzenal ........................................................................ 65 FIGURA 36: Faturamento por cidade.................................................................................. 66 FIGURA 37: Faturamento por cidade, por loja .................................................................... 66 FIGURA 38: Média de gasto por faixa etária ...................................................................... 67 FIGURA 39: Percentual do faturamento por faixa etária ..................................................... 67 FIGURA 40: Formulário de satisfação ................................................................................ 68 FIGURA 41: Tipo de propaganda ....................................................................................... 69 FIGURA 42: Qualificação geral .......................................................................................... 70 FIGURA 43: Qualificação dos clientes fidelizados e não fidelizados................................... 71 FIGURA 44: Média das qualificações por loja .................................................................... 71 FIGURA 45: Avaliação dos comentários ............................................................................ 72 FIGURA 46: Percentual de formulários por loja ................................................................. 72 9 FIGURA 47: Bairros por região .......................................................................................... 73 10 SUMÁRIO 1 INTRODUÇÃO............................................................................................................... 12 1.1 APRESENTAÇÃO DO PROBLEMA ............................................................................ 12 1.2 JUSTIFICATIVA .......................................................................................................... 13 1.3 OBJETIVOS .................................................................................................................. 13 1.3.1 Geral .......................................................................................................................... 14 1.3.2 Específicos ................................................................................................................. 14 1.4 PROPOSTA DE SOLUÇÃO .......................................................................................... 14 1.5 DELIMITAÇÃO ............................................................................................................ 15 1.6 METODOLOGIA DA PESQUISA ................................................................................ 16 1.7 ESTRUTURA DO TRABALHO ................................................................................... 17 2 REVISÃO BIBLIOGRÁFICA ....................................................................................... 18 2.1 GERÊNCIA DE RELACIONAMENTO COM O CLIENTE ( CUSTOMER RELATIONSHIP MANAGEMENT - CRM) ................................................................................... 18 2.1.1 Conceitos.................................................................................................................... 18 2.1.2 Objetivos .................................................................................................................... 19 2.1.3 Satisfação e fidelização .............................................................................................. 21 2.2 ANÁLISE EXPLORATÓRIA DE DADOS ................................................................... 24 2.2.1 Dados, informação e conhecimento .......................................................................... 25 2.2.2 Data warehouse (armazém de dados)........................................................................ 28 2.2.2.1 Modelo dimensional ................................................................................................. 28 2.2.2.2 Extração, transformação e carga - ETL ..................................................................... 29 2.2.3 Análises estatísticas ................................................................................................... 31 2.2.4 On-Line Analytical Processing (OLAP) .................................................................... 32 2.2.5 Mineração de dados (data mining)............................................................................ 32 2.3 ANÁLISE EXPLORATÓRIA DE DADOS APLICADA À CRM .................................. 35 2.4 CONSIDERAÇÕES FINAIS DA REVISÃO BIBLIOGRÁFICA .................................. 38 3 MODELAGEM ............................................................................................................... 39 3.1 INTRODUÇÃO ............................................................................................................. 39 3.2 LINGUAGEM DE MODELAGEM UNIFICADA - UML ............................................. 40 3.3 ICONIX ......................................................................................................................... 42 3.3.1 Análise de requisitos .................................................................................................. 43 3.3.2 Análise e projeto preliminar ..................................................................................... 44 3.3.3 Projeto ....................................................................................................................... 45 3.3.4 Implementação .......................................................................................................... 46 3.4 MODELAGEM DO PROTÓTIPO ................................................................................. 46 3.4.1 Análise de requisitos .................................................................................................. 48 3.4.2 Análise e projeto preliminar ..................................................................................... 51 3.4.3 Projeto ....................................................................................................................... 52 3.4.4 Implementação .......................................................................................................... 52 3.5 CONSIDERAÇÕES FINAIS DA MODELAGEM ......................................................... 53 4 ESTUDO DE CASO: REDE D E RESTAURANTES MIYOSHI .................................. 54 4.1 A EMPRESA ................................................................................................................. 54 4.2 ANÁLISE DOS DADOS ............................................................................................... 55 4.2.1 Análises de clientes fidelidade ................................................................................... 58 4.2.2 Análises dos formulários de satisfação ..................................................................... 68 4.3 CONSIDERAÇÕES FINAIS DA ANÁLISE DOS DADOS .......................................... 73 11 5 CONCLUSÃO ................................................................................................................. 75 5.1 TRABALHOS FUTUROS ............................................................................................. 76 5.1.1 Integração do Cartão Fidelidade versus Colibri Food.............................................. 76 5.1.2 Implementação de novos relatórios .......................................................................... 76 5.1.3 Novo modelo de Formulário d e Satisfação ............................................................... 76 5.1.4 Aplicação de algoritmos de mineração de dados ...................................................... 77 REFERÊNCIAS ................................................................................................................. 78 APÊNDICE ........................................................................................................................ 80 12 1 INTRODUÇÃO 1.1 APRESENTAÇÃO DO PROBLEMA A situação da economia global e a grande competitividade têm tornado as empresas mais cautelosas em relação à fidelização de seus clientes. A importância que as organizações dão ao atendimento do consumidor e à qualidade do que lhe é oferecido é cada vez maior, assim como a de manter-se atualizadas. Os cuidados são redobrados na venda de seus produtos e serviços, através da elaboração de diferentes técnicas e métodos para obte nção de um maior grau de satisfação de consumidores. Segundo Kotler (2000, p.58), s atisfação consiste na “sensação de prazer ou desapontamento resultante da comparação do desempenho (ou resultado ) percebido de um produto em relação às expectativas do comprador ”. Para ele, além de satisfazer as necessidades dos clientes, é preciso encantá -los. Sabendo da importância de manter um cliente satisfeito, muitas organizações elaboram formulários para ter informações deles (clientes), suas preferências, reclamações e sugestões a respeito de produtos e serviços ofertados. Entretanto, muitas vezes, observa-se que os dados coletados não são aproveitados como deveriam, pois diversas informações essenciais p ara aprimoramento da empresa não são levadas em consideração, o que torna o sistema ineficiente. Desta forma, este trabalho procurará responder à seguinte questão -problema: como converter os dados coletados – através de formulários de satisfação, cartões de fidelidade de clientes ou outras formas de opinião – em informações que possam auxiliar as organizações a entenderem melhor seus clientes e, a partir daí, oferecer serviços e produtos mais adequados às expectativas deles? 13 1.2 JUSTIFICATIVA No ambiente competitivo da atualidade , a informação torna-se uma aliada indispensável para empresas que perseguem o sucesso. Consciente desse fato, procurou -se referenciar um conjunto de métodos, técnicas e ferramentas , responsáveis por transformar dados e informações em conhecimentos¹, com o objetivo de gerar benefícios às organizações. O trabalho desenvolvido procura integrar a prática à teoria até hoje aprendida na Universidade do Sul de Santa Catarina – UNISUL, e possibilitar que os empresários tenham ciência da importância da informação e conheçam as vantagens que podem ser obtidas quando ela é tratada de forma adequada. Dentre os benefícios e vantagens que o estudo possibilita à empresa, destacam-se: Aumento do controle sobre as informações fornecidas pelos c lientes; Maior aproveitamento dos dados; Integração e relacionamento dos dados; Visão dimensional das informações, o que facilita a análise; e Possibilidade de elaboração de estratégias de m ercado mais apropriadas. 1.3 OBJETIVOS Em seguida, serão apresentados o objetivo geral e os específicos deste trabalho. ______________ ¹ Dados, informação e conhecimento: ver página 25. 14 1.3.1 Geral Analisar os dados dos clientes e dos diversos formulários de opinião sobre os serviços e produtos de uma empresa, para descobrir informações e conhecimento, através de técnicas de análise exploratória de dados (AED)¹, que auxiliem na busca de estratégias para melhoria do atendimento e relacionamento com os clientes . 1.3.2 Específicos Levantar as técnicas de AED mais adequadas aos dados disponíveis; Coletar dados dos formulários de opinião dos clientes sobre serviços e produtos de uma empresa; Levantar dados do cadastro dos clientes para complementar as informações dos formulários de satisfação e, com isto, enriquecer as análises; Integrar os dados apurados em um único banco de dados; Aplicar técnicas de AED para extrair informações e conhecimento úteis com a finalidade de melhorar o relacionamento com os clientes; e Realizar um estudo de caso com a base de dados fornecida pela Rede de Restaurantes Miyoshi. 1.4 PROPOSTA DE SOLUÇÃO Segundo Barbiere (2001), as empresas possuem uma grande dificuldade em gerenciar o grande volume de dados que adquirem hoje, tornando -se assim impotentes no processo de tomada de decisão. ______________ ¹ Análise exploratória de dados: ver página 24. 15 Para atingir ao objetivo, serão utilizadas técnicas de Business Intelligence (BI)¹, destinadas a melhor adequação específica dos dados, integrando-as de maneira estruturada em um repositório com as propriedades similares aos modelos dimensionais utilizados na construção de data warehouse (DW)². Definido o banco de dados integrado, aplicar-se-á ferramentas de análise exploratória de dados (AED), para se obter informações e conhecimento d e interesse da organização. As informações obtidas serão repassadas para o Analista de Negócios da empresa que, por sua vez, estudará propostas de melhoria e buscará estratégias de marketing, fidelização de clientes, aumento da performance de vendas, dentre outras. FIGURA 01: Esquema da solução proposta FONTE: Elaboração dos autores 1.5 DELIMITAÇÃO O projeto abrange a definição e a construção de um data warehouse, e aplicação e elaboração de rotinas de suporte à decisão de mercado (extração, transfo rmação e carga – ETL). Foram aplicadas ferramentas de análise exploratória de dados, porém técnicas de mineração e análises analíticas não. ______________ ¹ Business Intelligence (BI), ou Inteligência de Negócios, é a busca de estratégias de competitividad e nos negócios de uma empresa através de variadas fontes de informação. (BARBIERI, 2001) ² Data warehouse (DW): ver página 28. 16 Os dados analisados no trabalho foram coletados até o dia 10/10/2007 . Como ferramenta de front-end¹ foram utilizados os softwares MySQL-Front e Microsoft Excel 2007. Foram analisadas somente as tabelas “ qwpurchase”, “qwcliente” e “opiniao”² da base de dados da Rede de Restaurantes Miyoshi , descartando todas as outras das análises. Todo o estudo foi voltado somente para os usuários gerenciais. 1.6 METODOLOGIA DA PESQUISA Segundo Silva & Menezes (2005), a classificação das pesquisas pode ser feita a partir de vários pontos de vista, no entanto destacam as quatro formas clássicas: Quanto à natureza; Quanto à forma de abordagem ; Quanto aos objetivos; e Quanto aos procedimentos técnicos . O presente estudo, do ponto de vista de sua natureza, utilizou a pesquisa aplicada pois “objetiva gerar conhecimentos para aplicação prática e dirigidos à solução de problemas específicos”. Quanto à forma de abordagem do problema, é uma pesquisa qua ntitativa porque “considera que tudo pode ser quantificável, o que significa traduzir em números opiniões e informações para classificá -las e analisá-las”. (SILVA & MENEZES, 2005, p.20) De acordo com Gil (1991, apud SILVA & MENEZES, 2005, p.21), do ponto de vista dos objetivos, a metodologia utilizada é a pesquisa exploratória, pois: visa proporcionar maior familiaridade com o problema com vistas a torná -lo explícito ou a construir hipóteses. Envolve levan tamento bibliográfico; entrevistas com pessoas que tiveram experiências práticas com o problema pesquisado; análise de exemplos que estimulem a compreensão. Assume, em geral, as formas de Pesquisas Bibliográficas e Estudos de Caso. ______________ ¹ Front-end é a parte do sistema de software que interage diretamente com o usuário. ² Tabelas “qwpurchase”, “qwcliente” e “opiniao”: ver página 56. 17 Quanto aos procedimentos técnicos, pode ser tanto uma pesquisa bibliográfica, pois esta é “elaborada a partir de ma terial já publicado, constituído principalmente de livros, artigos de periódicos”, quanto um estudo de caso, que “ envolve o estudo profundo e exaustivo de um ou poucos objetos de maneira que se permita o seu amplo e detalhado conhecimento ”. (GIL, 1991, p.21) 1.7 ESTRUTURA DO TRABALHO O primeiro capítulo apresenta uma introdução ao assunto pesquisado, contextualiza o tema, define o objetivo geral e os específicos e propõe uma solução para o problema em estudo. Com a revisão bibliográfica, no capítulo se guinte, são fornecidos os conceitos de gerência de relacionamento com o cliente e de análise exploratória de dados, dentre outros. No terceiro, é exposta a modelagem do protótipo construído. Já no quarto, é feito um estudo de caso com os dados coletados na base de dados da Rede de Restaurantes Miyoshi. O quinto e último capítulo traz as considerações finais, onde é apresentada a conclusão do estudo. 18 2 REVISÃO BIBLIOGRÁFICA Neste capítulo serão apresentadas referências sobre gerência de relacionamento com o cliente (CRM), seus conceitos e objetivos . Também serão relacionados temas sobre satisfação e fidelização de cliente. Outra abordagem é sobre análise exploratória de dados , aonde serão conceituados dados, informação e conhecimento. Alé m desse, data warehouse e seus processos de extração, transformação e carga (ETL). Por fim, análises estatísticas, algumas técnicas analíticas de processamento de dados ( OLAP) e mineração de dados farão parte deste capítulo. 2.1 GERÊNCIA DE RELACIONAMENT O COM O CLIENTE (CUSTOMER RELATIONSHIP MANAGEMENT - CRM) Com o surgimento do computador, da flexibilidade das fábricas e do marketing de banco de dados, reduziu-se o custo de oferta de produtos a cada tipo de cliente. Já é possível realizar encomendas de peças de roupas específicas, sobre medida e únicas no mercado ou de um automóvel personalizado de acordo com o gosto do cliente. (KOTLER, 1999) Após os anos noventa, nasce uma estrutura de conceitos capaz de estreitar a relação entre a empresa e o cliente, que busca conhecimento profundo de seus anseios, além de uma forma de serviços que visa satisfazê-lo antes que a concorrência o faça. Esse é o novo código deste início de milênio: C ustomer Relationship Management – CRM (gerência de relacionamento com o cliente). (BARBIERI, 2001) 2.1.1 Conceitos Segundo Brown (2001, p.XXIII), o C ustomer Relationship Management – CRM (gerência de relacionamento com o cliente) “não é nem um conceito nem um projeto. Ao 19 contrário, é uma estratégia de negócios que visa entender, antecipar e administrar as necessidades dos clientes atuais e potenciais de uma organização”. Greenberg (2001) afirma que o CRM é um sistema completo que, além de oferecer alternativas e métodos para fidelizar um cliente, auxilia na sua identific ação, conquista e manutenção, oferecendo uma visão exclusiva do cliente em relação à empresa como um todo. Segundo Richers (2000, p.376) , o CRM é “uma estratégia de negócios projetada para elevar a lucratividade e a receita da empresa, por meio do aumento do nível de satisfação daqueles que utilizam os bens e serviços por ela comercializados”. Para o autor, o CRM colabora com a racionalização e fidelização de clientes por segmento de mercado. A essência do conceito de CRM está no pleno conheci mento do perfil do consumidor, em que é possível a segmentação desta classe visando a probabilidade de negócios, melhoria no planejamento de campanhas e ações de marketing mais objetivas. (BARBIERI, 2001) 2.1.2 Objetivos No momento em que um cliente busca serviços o u produtos de uma empresa, despertam-se expectativas que determinarão seu comportamento, de acordo com a experiência vivida. No caso de a experiência ser positiva, fortalecerá sua fide lidade; se negativa, o levará à busca de serviços ou produtos oferecidos pela concorrência. A capacidade de identificar e gerenciar esse processo é a essência do CRM. (GREENBERG, 2001) O CRM mostra com clareza o processo interativo que converte informações sobre os clientes em relacionamentos positivos com os mesmos; denota a abordagem empresarial que objetiva entender e influenciar o comportamento dos clientes, através de comunicações significativas para melhorar as compras, a retenção, a lealdade e a lucratividade deles. (SWIFT, 2001) A tecnologia CRM fornece uma infra -estrutura focada na manutenção da flexibilidade, tanto na forma de tratamento e do tipo de dado coletado, quanto nos métodos de acesso para fornecer informações no local certo, na hora certa, da maneira certa. Esta tecnologia é a integração entre o marketing e a informação, com o objetivo de munir a empresa de meios mais eficazes para permitir um maior conhecimento sobre o cliente. (BRETZKE, 2000) Para Jamil (2001), o CRM visa analisar as maneiras de se coletar, classificar, processar e informar conhecimento sob re as reações, hábitos e preferências dos clientes. 20 Para Swift (2001, p.14-16), o objetivo do CRM é melhorar o processo de comunicação com o cliente certo, efetuando a oferta certa, através de um canal certo, no tempo certo. Segundo o autor, o CRM efetiva mente engloba a capacidade de uma organização para: Descobrir clientes. Conhecer os mesmos. Manter comunicações com eles. Assegurar que eles recebam o que desejam da organização – não somente quanto ao aspecto do produto, mas em cada detalhe de como a org anização lida com eles. Verificar se eles recebem o que lhes foi prometido – certamente, desde que seja lucrativo. Assegurar que o cliente seja mantido – mesmo que o cliente não seja lucrativo atualmente, o objetivo é lucratividade a longo prazo. Brown (2001) aponta algumas vantagens do uso do CRM em relação ao tradicional marketing de massa, como a redução de custos de propaganda, a diminuição do tempo entre o desenvolvimento e a comercialização de um produto, a focagem em clientes específicos, além da diminuição de gastos com clientes de baixo valor. De acordo com Swift (2001), os benefícios do CRM podem ser encontrados em diversas áreas, tais como: redução do custo de vendas ; maior lucratividade por cliente ; retenção e lealdade dos clientes; melhores custos na conquista de novos clientes. Brown (2001) divide o CRM em quatro tipos de programas , de acordo com a finalidade: Reconquistar ou salvar: processo que visa convencer um cliente a se manter fiel à empresa ou a reconquistar ex -clientes; Busca de clientes em potencial (prospecting): objetiva a busca de novos clientes, através de segmentação, seletividade e fontes; Fidelidade: procura evitar o abandono de clientes utilizando segmentação com base no valor e de suas necessidades, além de dispositivos de previsão de desistência; e Cross-selling / up-selling: tem por objetivo aumentar os gastos do cliente com a empresa através de ofertas complementares que ele gostaria de receber. Swift (2001) expõe os principais objetivos e benefícios de um processo de CRM como a retenção, obtenção e lucratividade de clientes , afirmando que o CRM é composto por um ciclo de quatro processos, a saber: 21 Descoberta do conhecimento: identifica oportunidades de mercado e estratégias de investimento, através da análise das inform ações do cliente; Planejamento de mercado: responsável por estabelecer ofertas específicas para os clientes, canais de distribuição, programas e dependências, o que permite desenvolver planos ou programas de comunicações estratégicas; Interação com clientes: de extrema importância, permite estabelecer e gerenciar comunicações com os clientes existentes e/ou potenciais , com informações e ofertas relevantes e convenientes; e Análise e refinamento: compreende uma aprendizagem ininterrupta a partir de diálogos com os clientes, capturando e analisando os dados destas interações, para entender as respostas relativas aos estímulos fornecidos a eles. 2.1.3 Satisfação e fidelização Segundo Kotler (2000), antes as empresas não se preocupavam em satisfazer seus clientes. Acreditavam que os mesmos eram garantidos, uma vez que não dispunham de alternativas de compra, em razão da deficiência dos concorrentes em geral. Já nos tempos atuais, com o aumento das abordagens por parte da concorrência, os clientes tornaram -se mais inteligentes, conscientes e exigentes. Ao contrário do que aplicava, hoje é dada maior importância ao relacionamento com os clientes existentes, monitorando seus níveis de satisfação e aplicando -lhes ações que os estimulem. (KOTLER, 1999) Para isto, profissionais de marketing, com visão empreendedora, estão se utilizando do gerenciamento de dados dos clientes potenciais e atuais para a obtenção de vantagens competitivas. (KOTLER, 1999) Para Kotler (1999), é criada uma expectativa a partir de comentár ios de outras pessoas, das promessas do vendedor e da experiência de compras similares. O autor ainda afirma que, ao usufruir um produto ou serviço, o cliente poderá assumir cinco níveis de satisfação: muito satisfeito, satisfeito, indiferente, insatisfeit o ou muito insatisfeito. 22 A probabilidade de um cliente muito satisfeito retornar à empresa é bem maior do que um meramente satisfeito, uma vez que ele poderá experimentar outra empresa que lhe prometa satisfação igual ou maior. Já os demais níveis são cons iderados como clientes perdidos pela empresa. (KOTLER 1999) Segundo Kotler (2000), a satisfação dos clientes, para algumas empresas, é ao mesmo tempo uma meta e uma ferramenta de marketing. Empresas que atingem altos índices de satisfação fazem questão que seu mercado alvo saiba disso. Na FIGURA 02, o autor descreve quatro métodos utilizados pelas empresas para acompanhar a satisfação dos clientes . FIGURA 02: Ferramentas para acompanhar e medir a satisfação de clientes Sistemas de reclamações e sugestões Pesquisas de satisfação de clientes Compras simuladas Análise de clientes perdidos FONTE: Kotler (2000, p.60) Organizações centradas no cliente facilitam o recebimento de sugestões e reclamações, oferecem formu lários para que seus clientes relacionem os itens de que gostaram e de que não gostaram , criam sistemas de ligações gratuitas, utilizam páginas web e e-mail, para facilitar a recepção e resposta das comunicações, entre outros, o que permite agir com rapidez na solução de problemas. De acordo com alguns estudos , os níveis de reclamação não são uma boa medida de satisfação, visto que, apesar da insatisfação, menos de cinco por cento dos clientes reclamam. A maioria deles simplesmente passa a comprar menos ou muda de fornecedor. Algumas empresas enviam questionários, telefonam aleatoriamente para clientes recentes ou solicita m opiniões dos compradores quanto ao desempenho da concorrência, para medir a satisfação de forma direta. Ao coletar dados de satisfação de clientes, é útil medir também o nível da intenção de recompra, que normalmente será alto se houver alto nível de satisfação de cliente. Recomenda -se ainda avaliar a probabilidade de esse novo cliente recomendar a empresa e a marca para outras pessoas, assim como sua disposição para isso. Um alto índice positivo de propaganda boca a boca indica que a empresa está produzi ndo alto nível de satisfação de clientes As empresas podem contratar pessoas para se passar por compradores potenciais, a fim de relatar pontos fortes e fracos vivenciados na compra de produtos da empresa e dos concorrentes. Esses compr adores misteriosos podem até testar se a equipe de vendas da empresa está preparada para lidar adequadamente com diversas situações. Assim, um comprador misterioso pode reclamar da comida de um restaurante para testar como o restaurante lida com esse tipo de reclamação. As empresas não devem se limitar a contratar compradores misteriosos. Os gerentes devem sair de suas salas de tempos em tempos, simular uma situação de compra tanto na sua empresa quanto nas concorrentes em que não são conhecidos e experimen tar em primeira mão o tratamento que recebem como ‘clientes’. Uma variação dessa ferramenta consiste em os gerentes telefonarem para sua empresa com perguntas e reclamações para verificar como os telefonemas são atendidos. As empresas devem contatar clientes que deixaram de comprar ou que tenham mudado para outro fornecedor a fim de verificar por que isso aconteceu. Quando a IBM perde um cliente, ela empreende um esforço minucioso para descobrir onde errou. É importante não ap enas conduzir entrevistas de saída quando os clientes param de comprar, como também acompanhar o índice de perdas de clientes. Se estiver crescendo, é um claro indício de que a empresa não está conseguindo deixar seus clientes satisfeitos. 23 Para Kotler (1999), é importante que as empresas pesquisem periodicamente o Índice de Satisfação do Cliente (ISC), visando um aumento da fidelidade dos mesmos. Pesquisas apontadas pelo autor afirmam que noventa e cinco por cento dos clientes nã o reclamam por não saber como ou a quem reclamar, porém, quando reclamam e têm sua queixa atendida de forma satisfatória, tornam-se clientes mais fiéis do que outros que jamais ficaram insatisfeitos. Segundo Richers (2000, p.187), de oitenta a noventa por cento das empresas dos Estados Unidos se preocupam em: conhecer melhor o grau de satisfação do consumidor com seus produtos, sua participação de mercado em relação a seus concorrentes, a forma como o setor segmenta o mercado, o grau de conscientização das marcas e as modalidades de comportamento de compra de seus clientes. Estudos mencionados pelo autor apontam que um cliente insatisfeito pode repassar sua insatisfação para até onze pessoas, sendo que cada uma delas contará a terceiros, gerando assim um crescimento geométrico de clientes potenciais que terão ouvido comentários negativos sobre a empresa. (KOTLER , 1999) As empresas devem estar cientes de que clientes podem se dizer altamente satisfeitos por motivos diversos. Um pode ser o tipo de pessoa que está sempre satisfeito e o outro pode ser uma pessoa realmente exigente que nes se momento ficou satisfeito. Além disso, devem considerar que vendedores e gerentes podem manipular índices de satisfação por saber em que estão sendo avaliados: podem fazer de t udo para agradar clientes na hora da pesquisa ou até mesmo excluir da pesquisa clientes insatisfeitos. (KOTLER, 2000) Para Kotler (1999), nem todos os clientes têm a mesma importância e, em virtude disto, as empresas devem avaliar a lucratividade de cada u m deles. O autor cita uma regra freqüentemente adotada, que estabelece que vinte por cento dos clientes mais lucrativos são responsáveis por oitenta por cento dos lucros da empresa e trinta por cento dos menos lucrativos reduzem os lucros pela metade. Nos anos oitenta, a palavra de ordem para as empresas era a satisfação do cliente. A preocupação em bem atender e superar as expectativas dos clientes era de todos. A crença era de que comprariam mais e com maior freqüência os clientes satisfeitos. Porém, pesquisas realizadas sugerem que altos níveis de satisfação não necessariamente se traduzem em compras regulares ou aumento de vendas. (GRIFFIN, 1998) Para Gitomer (1998 apud KOTLER, 2000, p.68) “o desafio não é deixar os clientes satisfeitos; vários concorren tes podem fazer isso. O desafio é conquista r clientes fiéis”. 24 Chegou a era da fidelização, da customização, da sedução do cliente e da inteligência aplicada aos negócios (BARBIERI, 2001). Machado (2000) afirma que os pontos pr incipais para um relacionament o diferenciado com o cliente devem ser centrados na identificação, diferenciação, interação e personalização do contato com o mesmo. Para Barbieri (2001, p.12), “é cinco vezes mais caro conquistar um novo cliente do que mantê-lo, e é nove vezes mais caro reconquistar um cliente perdido”. Já Kotler (2000) afirma que conquistar novos clientes pode custar até cinco vezes o valor para satisfazer e manter os já existentes, porque necessita de um grande empenho para estimular clientes satisfeitos a deixar de contratar seus concorrentes. Com o intuito de aumentar a fidelização de seus clientes, uma empresa pode criar programas de associação que gerem benefícios para os mesmos. Desta forma, os clientes associados ficarão relutantes em partir e abrir mão des ses benefícios, caso sejam suficientes. (KOTLER, 1999) Algumas estatísticas mencionadas por Swift (2001) afirmam que um acréscimo de cinco por cento na taxa de retenção de clientes pode aumentar os lucros de uma empresa de sessenta a cem por cento. Para ele, os clientes fiéis que indicam a empresa a outros geram negócios a um custo muito baixo ou até mesmo sem custos. Para Swift (2001), o segredo do sucesso de uma empresa não está somente em ter os melhores produtos ou serviços, a melhor publicidade, ou a melhor marca, mas sim ter os melhores clientes. A partir do momento que você conhece seus clientes, você pode suprir suas necessidades repetidamente e , pelo preço certo, conquista r sua lealdade. 2.2 ANÁLISE EXPLORATÓRIA DE DADOS A análise exploratória de dad os neste estudo será voltada à área de Inteligência de Negócios (Business Intelligence - BI). Para descobrir novas relações dos clientes não identificadas a olho nu , são utilizados alguns procedimentos, por meio da análise dos dados dos clientes encontrad os nos registros das empresas. Tais análises procuram encontrar pontos em comuns entre clientes, divididos por regiões, por data de compra, por faixa etária, etc. . Assim, podem-se descobrir alguns 25 fatores que determinem, por exemplo, a queda de vendas em d eterminada região e, posteriormente, tomar decisões para solucionar o problema detect ado. 2.2.1 Dados, informação e conhecimento Dados, segundo O’Brien (2003, p.23), “são fatos ou observações cruz, normalmente sobre fenômenos físicos ou transações de negócios”; “são medidas objetivas dos atributos (as características) de entidades (como pessoas, lugares, coisas e eventos) ”. Para o autor, eles podem ter diversas formas, tais como textos, imagens, sons, entre outros. Para Oliveira (2004, p.275), o dado “é qualquer elemento identificado em sua forma bruta que, por si, não conduz a uma compreensão de determinado fato ou situação”. Machado (2000) define dado como um valor relativo à descrição de um objeto de interesse. Para Inmon (1997, p.18) existem doi s tipos de dados: os primitivos (ou operacionais) e os derivados. Dados primitivos são ricos em detalhes, podem ser atualizados, possuem alta disponibilidade e são exatos em relação ao momento do acesso. Já os dados derivados, são resumidos ou refinados, n ão podem ser atualizados e representam valores de momentos passados ou instantâneos. Stevenson (2001) divide os dados em quatro tipos: Dados contínuos: podem assumir qualquer valor num intervalo contínuo. Ex.: altura, peso, velocidade; Dados discretos: são valores inteiros resultantes da contagem do número de itens. Ex.: quantidade de café vendida por dia, gasolina vendida por hora, número diário de clientes; Dados nominais: são relativos a categorias específicas onde é contado o número de observações referentes a elas. Ex.: sexo (masculino ou feminino), desempenho (excelente, bom, sofrível ou mau); e Dados por postos: valores relativos com finalidade de denotar ordem. Ex.: primeiro, segundo, último. 26 Já Barbieri (2001), define a natureza dos dados como o peracionais e informacionais : FIGURA 03: Comparação entre dados de natureza operacional e informacional Características Conteúdo Dados operacionais Valores concorrentes Organização dos dados Natureza dos dados Por aplicação/sistema de informação Dinâmica Formato das estruturas Relacional, próprio para computação transacional Atualização campo a campo Altamente estruturado, processamento repetitivo Otimizado para 2 a 3 segundos Atualização dos dados Uso Tempo de resposta Dados informacionais Valores sumariados, calculados, integrados de várias fontes Por assuntos/negócios Estática até o “refreshment” dos dados Dimensional, simplificado, próprio par atividades analíticas Acesso sem update Desestruturado, com processamento analítico/heurístico Análises mais complexas com tempos de respostas maiores FONTE: Barbieri (2001, p.47) Os dados, quando não processados, muitas vezes podem não possuir sentido e , em grandes quantidades, podem gerar confusão. Isto acontece, pois a mente não é capaz de compreender a variedade e os detalhes inerentes a grandes conjuntos de números. O processamento converte dados em informação eliminando detalhes menores e destacando os aspectos mais importantes de forma organizada e consistente. (STEVENSON, 2001) Informação, para Oliveira (2004, p.276), “é o dado trabalhado que permite ao executivo tomar decisões”. Segundo Bretzke (2000, p.101) , o data base “é particularmente importante nesse contexto, pois fornece, em tempo real, informações relevantes sobre os clientes atuais e potenciais, tais como: preferências, necessidades não atendidas, hábitos de compra e muitas outras que subsidiam a tomada de decisão referente à estratégia”. Segundo Stevenson (2001), freqüentemente grandes conjuntos de dados podem ser reduzidos a algumas medidas numéricas que resumem todo o conjunto, facilitando assim seu manejo e compreensão, que, por sua vez, são fundamentais para aplicação de técnicas computacionais. Para Kotler (1999, p.15-16), existe uma enorme diferença entre dados, informações, conhecimento e sabedoria. “A não ser que os dados sejam processados em informações que, por sua vez, se transformem em conhecimento, que mais tarde se torne sabedoria de mercado, quase tudo é desperdiçado”. Tendo conhecimento dos tipos de informações de que a e mpresa necessita, nasce a pergunta de como obtê-las eficientemente. Valiosas são as informações, mas têm um custo. 27 Empresas podem gastar fortunas adquirindo -as, sem conseguir extrair o conhecimento desejado. (KOTLER, 1999) Dados são os componentes básicos , a partir do qual a informação é criada. Exemplo: nota fiscal número 1.040 emitida em 23.09.2003; foi cancelada em 30.09.2003; motivo: pedido entregue com atraso. Informação são dados com significado, inseridos num contexto. Exemplo: relação de notas fisc ais canceladas em setembro de 2003, agrupadas pelos respectivos motivos. Conhecimento é o que orienta as pessoas no uso da informação para que possam trabalhar. Exemplo: as causas mais expressivas de atrasos nas entregas devem ser evitadas a todo custo, e a organização deve aprender com tais erros, trabalhando para evitar cancelamentos e descontentamentos por parte dos clientes. (FILHO, 2004, p.11) As armas competitivas do século XXI mais valiosas do que os recursos naturais, grandes empresas ou consideráv eis contas bancárias, são conhecimento e informação. Garantem o sucesso de quem as possui e utiliza melhor (em tempo e com boa qualidade) , em qualquer setor. (FILHO, 2004) Existem dois tipos básicos de co nhecimento: técnico e sobre atributos. Com eles, é possível estabelecer uma espécie de foco, de acordo com a atividade desempenhada . (FILHO, 2004) Segundo Filho (2004, p.63), para visualizar a evolução do dado em conhecimento, “é obrigatório o domínio dos significados de dado, informação e do próprio conh ecimento”, os quais podemos observar na FIGURA 04. Para o autor, “saber identificar as características de cada um, e como tratá-las, é o passaporte para o crescimento gradual”. FIGURA 04: Dados, informação e conhecimento Dado São simples observações sobre o estado do mundo Facilmente estruturado Facilmente obtido por intermédio de sistemas Freqüentemente quantificado Facilmente transferível Claro, apresentável Informação São dados dotados de relevância e propósito Requer unidade de análise Exige consenso sobre o significado Exige necessariamente uma medição humana Transferível com uma certa dose de esforço Exige uma camada de apresentação que formate-o em gráficos ou indicadores de desempenho Conhecimento É valioso na mente humana Inclui reflexão, síntese e contexto De difícil estruturação De difícil captura em máquina De difícil transferência De difícil apresentação compartilhamento e FONTE: Filho (2004, p.64) Para atender às necessidades de se adequar às exigências do mercado, as empresas passaram a investir em soluções de forma a transformar dados em informação. 28 Posteriormente, para a obtenção de uma sucessão de idéias que auxiliem na tomada de decisão, é interessante a proposta de um projeto de data warehouse. Finalmente, interagindo com cada profissional dentro das empresas, consegue -se converter informação em conhecimento. (FILHO, 2004) 2.2.2 Data warehouse (armazém de dados) Barbieri (2001, p.49) define data warehouse como “um banco de dados, destinado a sistemas de apoio à decisão e cujos dados foram armazenados em estruturas lógicas dimensionais, possibilitando o seu processamento analítico por ferramentas especiais (OLAP e mining)”. De acordo com Inmon (1997, p.33), data warehouse é “um conjunto de dados baseado em assuntos, integrado, n ão-volátil, e variável em relação ao tempo, de apoio às decisões gerenciais”. O data warehouse apresenta uma integração de dados consistente e precisa, para a realização de análises gerenciais estratégicas de uma empresa , feita a partir de fontes internas e/ou externas, sumarizando, filtrando e limpando os dados para uma futura análise e apoio à decisão. MACHADO (2000) Para Machado (2000, p.11), o “principal objetivo do data warehouse é disponibilizar informações para o apoio à s decisões da empresa”. Já Barbieri (2001, p.51) sugere que o objetivo do data warehouse é “armazenar os dados em vários graus de relacionamento e sumariação, de forma a facilitar e agilizar os processos de tomada de decisão por diferentes níveis gerenciais”. 2.2.2.1 Modelo dimensional Segundo Filho (2004, p.175), “as técnicas de modelagem dimensional são voltadas exclusivamente aos projetos de data warehouse, ou sistemas para o ambiente de suporte à decisão”. Para o autor, a modelagem dimensional é projetada para tornar possível a 29 observação da mesma informação , por diferentes maneiras, pelos usuários do ambiente de apoio à decisão. Segundo Machado (2000, apud ANTUNES & VIEIRA, 2006) um modelo dimensional possui três elementos básicos: Fato: representa um negócio, utilizando medidas, e é implementado em tabelas denominadas tabela de fato ( fact tables); um item ou uma transação de negócio . São utilizados para analisar o processo de negócio de uma empresa; Dimensões: elementos que participam de um ou mais fatos, ou assuntos de neg ócios; determinam um assunto de negócio, ou seja, um banco de dados que analisa vendas de produtos; e Medidas: atributos numéricos que representam um fato; representam o desempenho de um indicador de negócios referente às dimensões que participam de tal fa to. 2.2.2.2 Extração, transformação e carga - ETL “A inteligência de um data warehouse reside em seus programas de extração de dados.” O ETL - extração, transformação e carga ( que em inglês significa Extraction, Transformation and Load) pode ser um aplicativo desenvolvido como suporte à decisão para o mercado. (FILHO, 2004, p.188) Segundo Filho (2004), independente da solução aceita, para realizar o ETL deve -se respeitar algumas regras básicas de seqüência, freqüência e tipo de carga, atentando para a s necessidades de adaptações ainda que a escolha seja por um produto existente no mercado. Para o autor, ao construir programas de ETL , algumas dificuldades são encontradas, como a grande variedade das fontes de dados, que na maioria das vezes encontram -se espalhadas dentro das organizações. Existem ainda três fatores a serem considerados : quantidade de tempo disponível para coleta, processamento e distribuição das informações. O ciclo de tratamento de dados para o data warehouse é executado, principalmente, em três fases: (FILHO, 2004) 30 Extração: são obtidas informações dos sistemas transacionais com mínimo processamento possível, para que não haja impacto no desempenho (dos sistemas). As informações são depositadas em uma área especial do banco de dados do data warehouse, chamada de área de transformação. Eventualmente, há nesse ciclo alguns processos de transformação, que visam melhor adequar o dado captado do sistema transacional ao mecanismo que ocorrerá em seguida; Transformação: utiliza informações captadas pela extração, criando tabelas que estão de acordo com as especificações contidas nos modelos do banco de dados do data warehouse, e aplica rotinas de transformação para uniformizar a informação; e Carga em produção: os dados transformados são tra nsferidos para a área de produção, onde podem ser acessados pelos usuários do ambiente de suporte à decisão . FIGURA 05: O ciclo de tratamento dos dados FONTE: Filho (2004, p.190) Em alguns casos, pode haver ainda uma quarta fase, conhecida como pós -produção, cujo intuito é semelhante à pós-produção cinematográfica: realiza ajustes finos nos dados, para atender demandas específicas. Como exemplo, tem-se a criação de tabelas auxiliares 31 atuando como filtro dos dados para bibliotecas de consultas, a fim de que usuários de filiais da empresa possam acessar as informações de forma segmentada. (FILHO, 2004) O investimento de tempo e recursos na fase de captação deve ser o suficiente para transportar os dados, sem florear em demasia o processo. Na transformação , todo o trabalho pode ser considerado pouco, uma vez que é neste momento que os dados começam a se transformar em informação com valor agregado. Na fase de carga em produção, o esforço deve ser equilibrado para garantir a entrega das informações, em tempo, para os usuários. (FILHO, 2004, p.191) 2.2.3 Análises estatísticas Para Spiegel (1994), a estatística diz respeito a métodos científicos para coleta, organização, resumo, apresentação e análise de dados, além de obtenção de conclusões válidas e na tomada de decisões baseadas nos resultados. A palavra estatística pode ser descrita como um conjunto de dados numéricos ou um ramo da matemática que se ocupa da análise de dados levantados. As técnicas estatísticas associadas a programas específicos de comp utadores são importantes instrumentos na administração. (DOWNING, 2000) Dados estatísticos são obtidos através de um processo que engloba a observação ou mensuração de itens. Conhecidos como variáveis, tendem a possuir um grau específico de variação, quando mensurados sucessivamente. (STEVENSON, 2001) Para Triola (1999), análise exploratória de dados tem por objetivos tornar mais clara a descrição dos dados e atingir uma visão mais extensa d e sua essência. Na FIGURA 06, o autor faz uma comparação da análise exploratória de dados com a estatística tradicional em suas três principais áreas: FIGURA 06: Análise exploratória de dados versus estatística tradicional Análise exploratória de dados Explora os dados em um nível preliminar Poucas (ou talvez nenhuma) hipóteses são feitas sobre os dados Costuma exigir cálculos e gráficos relativamente simples FONTE: Triola (1999, p.51) Estatística tradicional Confirma conclusões finais sobre os dados Tipicamente, exige hipóteses muito importantes sobre os dados Em geral, os cálculos são complexo s e os gráficos desnecessários 32 2.2.4 On-Line Analytical Processing (OLAP) Segundo Filho (2004, p.91), a tradução literal de On-Line Analytical Processing (OLAP) é “Processamento On-Line Analítico. São as ferramentas direcion adas aos usuários finais para acessar as informações do data warehouse (ou de suas fontes de dados), com os quais é possível gerar relatórios capazes de permitir a tomada de decisão ”. O autor expõe algumas ferramentas OLAP, cada qual com seu enfoque: ROLAP – Relational On-Line Analytical Processing: utiliza os próprios sistemas gerenciados de banco de dados, através de tabelas implementadas com uma estrutura relacional básica. Oferece as vantagens dos sistemas gerenciados, mas exige esforços para o gerenciamento do desempenho, pois o tempo de resposta das pesquisas pode ser comprometido pelo excesso de tabelas; MOLAP – Multi-dimensional On-Line Analytical Processing: parece-se com o modelo anterior por utilizar sistemas gerenciados, mas com ferramentas par a tratamento dimensional dos dados e características especiais de armazenamento; HOLAP – Hybrid On-Line Analytical Processing: é um composto dos modelos ROLAP E MOLAP, com utilização de estruturas relacionadas para dados de maior granularidade e as dimensionais para armazenar informações consolidadas; e DOLAP – Desktop On-Line Analytical Processing: neste modelo, com o propósito de facilitar o desempenho, estruturas dimensionais ou multidimensionais são transferidas do data warehouse para a estação de trabalho do cliente, minimizando o tráfego na rede da empresa. 2.2.5 Mineração de dados (data mining) A mineração de dados, segundo Carvalho (2001, p.7), consiste no “uso de técnicas automáticas de exploração de grandes quantidades de dados de forma a des cobrir novos padrões e relações que, devido ao volume de dados, não seriam facilmente descobertos a olho 33 nu pelo ser humano”. Para o autor, o data mining, quando colocado em prática , melhora a interação entre empresa e cliente, aumenta as vendas e conduz a s estratégias de marketing. Para Swift (2001, p.97), mineração de dados “é o processo de extração e apresentação de novos conhecimentos, anteriormente não detectáveis, selecionados de bancos de dados para decisões que possam ser acionadas”. Segundo Barbieri (2001), o data mining tem por objetivo melhorar o uso de uma imensa quantidade de informação, identificando padrões de relacionamentos, normalmente invisíveis em análises convencionais. Já para O’Brain (2003), o data mining tem por finalidade identifica r fatores e tendências chaves nos padrões das atividades de negócios, através do processamento dos dados de um data warehouse. Por sua vez, seu resultado poderá auxiliar tomadas de decisões sobre mudanças estratégicas nas operações da empresa, buscando van tagens competitivas no mercado. Para Filho (2004, p.257), data mining é uma técnica com o intuito de melhorar a tomada de decisões, buscando informações imperceptíveis às ferramentas tradicionais, gerando relatórios ou cubos de decisão. O autor faz a seg uinte definição científica: um conjunto estruturado de processos de exploração e análise de grandes volumes de dados, por meio de métodos automáticos e semi -automáticos, com o intuito de descobrir e determinar padrões, tendências, relacionamentos e regras , que permitam converter tais dados em conhecim ento de alto valor estratégico. O objetivo do data mining, segundo Filho (2004, p.258) é “automatizar ao máximo o processo de análise de informações contidas em um banco de dados, descobrindo correlações, associações, ausência ou presença e ciclos que, a princípio, são impossíveis de se enxergar a olho nu”. Filho (2004) divide o data mining em três classes de atuação, cada uma com objetivos diferentes e, portanto, levando a resultados característicos: Descoberta: o banco de dados é submetido a um exame em busca de padrões de comportamento ocultos, sem uma idéia ou hipótese predeterminada. Em grandes bancos de dados é difícil de se imaginar quais perguntas são necessárias para obtenção de certos padrões. Os diferenciais apresentados aqui são a qualidade da informação libertada e a riqueza dos padrões que podem ser expressos e descobertos; 34 Modelagem de prognóstico : os padrões descobertos são usados para gerar previsões, permitindo ao usuário a criação de cenário s, com a inserção de valores hipotéticos para a execução do data mining. Enquanto o processo de descoberta busca padrões nos dados, a modelagem de prognóstico emprega tais padrões para delinear ambientes virtuais, simulando ações dos executivos; Análise prévia: é o processo no qual os padrões extraídos são aplicados para descobrir anomalias ou elementos de dados raros. Para tanto, precisa -se primeiro detectar os dados que seguem um padrão para, a partir daí, ser possível identificar os que fogem dele. Segundo Filho (2004), quando se fala em data mining, deve-se pensar em pesquisar o desconhecido. O objetivo é garimpar informações essenciais para determinadas decisões a serem tomadas dentro de uma empresa. Para o autor, is so só é possível com a utilização de algumas técnicas estatísticas, tais como: Árvores de decisão; Retenção de dados; Destilação de padrões; Semelhança lógica; Regra indutiva; Algoritmos genéticos; Tabulação cruzada; Agentes; Redes de confiança; Aproximações equacionais ; e Redes neurais. Para executar projetos de mineração de dados e alocar seus recursos, foi desenvolvida uma metodologia chamada de Cross-Industry Standard Process for Data Mining - CRISPDM. Segundo tal metodologia, para atingir aos objetivos, podemos dividir a implementaçã o de um sistema de mineração de dados em seis fases interdependentes, as quais vão listadas a seguir: (FILHO, 2004) 35 Entendimento do negócio: é a fase inicial do projeto. Seu objetivo é iden tificar metas e requerimentos através de uma perspectiva de negóci o, convertendo-as para uma aplicação de mineração de dados; Entendimento dos dados: a principal atividade é avaliar o ambiente onde se encontram e extrair uma amostra dos dados a serem utilizados; Preparação dos dados: baseia-se na criação de programas de extração, limpeza e transformação dos dados para uso pelos algoritmos de mineração de dados; Modelagem: seleciona o que será utilizado, com foco no processamento do modelo. Como determinados algoritmos necessitam dos dados em formatos específicos, causa alguns retornos à fase de preparação dos dados; Avaliação do modelo: avalia os modelos com a visão do negócio, certificando-se da inexistência de falhas ou contradições e relação às regras do neg ócio; Publicação: a validação e a criação do modelo torna m possível alcançar mais um passo, com intuito de tornar a informação gerada acessível, através de várias maneiras. 2.3 ANÁLISE EXPLORATÓRIA DE DADOS APLICADA À CRM No mundo atual, quase tudo é copiável: equipamentos, produtos e procedimentos da concorrência. O que não se pode copiar são as informações e o capital intelectual das empresas, diferenciando-as umas das outras competitivamente. (KOTLER, 1999) Espalhadas por inúmeros cantos e armazenadas de várias maneiras, as informações que as empresas reúnem sã o inimagináveis. O modo como são organizadas essas informações é que levam as empresas a encontrar com maior facilidade respostas a muitas perguntas e tomar decisões fundamentadas. (KOTLER, 1999) Segundo Kotler (1999, p.100), os dois tipos de erros relacionados a informações que as empresas podem cometer são o de “reuni-las em quantidade excessiva ou insuficiente”. Para Kotler (1999), as empresas são grandes depósitos de registros internos , ricos em informações de todos os tipos. De acordo com o autor, estas informações são utilizadas pelos gerentes para preparar previsões de vendas, distribuição orçamentária, balancetes e assim por diante. 36 Com informações detalhadas dos clientes, temos um banco de dados de grande importância, com características de cada um, perfil e reações. Porém, muitas vezes , estas informações não se encontram disponíveis ao alcance de todos da empresa, pois ficam concentradas em determinadas pessoas, vendedores ou gerentes, muitas vezes sem acesso a outras áreas da estrutura, o que lev a à perda quando se afastam da organização (os colaboradores). Por tal razão, através de complexos sistemas de automação de vendas, muitas empresas captam os dados dos computadores dos vendedores e os concentram em um computador central. (KOTLER, 1999) Para a coleta de informações são identificadas três abordagens: observações, dados secundários e dados primários. A observação normalmente não é capaz de produzir evidências fortes ou sistemáticas – para uso da pesquisa exploratória – mas colabora com o apren dizado dos gerentes. Dados secundários são os preexistentes coletados para outro propósito . O que se costuma é examiná-los, para tentar solucionar problemas sem a necessidade da coleta de dados primários, que são mais onerosos e que podem ser obtidos comprando de empresas ou através de uma variedade de publicações governamentais, enciclopédias e periódicos. (KOTLER, 1999) Um fato bastante preocupante é quando os dados primários estão defasados, imprecisos, incompletos ou não são confiáveis , já que possuem um preço mais elevado. Divididos em entrevistas individuais, entrevistas grupais, levantamentos por correio ou telefone e pesquisa experimental , são responsáveis por discutir um produto, serviço, organização ou outra entidade de marketing, para realização d e estudos destinados à compreensão de crenças, atitudes e comportamento s dos consumidores, explorando novas idéias, opiniões e percepções, descobrindo o nível de conhecimento, as preferências e a satisfação das pessoas, e para medir a amplitude dessas desc obertas na população-alvo, obtendo os relacionamentos de causa e efeito por meio da eliminação das discrepâncias de análise nas diferenças observadas. (KOTLER, 1999) Kotler (1999) aconselha a criação de um Centro de Informações de Marketing (CIM) para o gerenciamento das informações pois , muitas vezes, estas se encontram espalhadas pela empresa. Tal centro seria responsável pela coleta, classificação e avaliação das informações, bem como pela definição de suas necessidades. Para o autor, é importante a existência de um sistema de apoio a decisões de marketing , que abranja uma coleção de dados, sistemas, ferramentas e técnicas auxiliadas por software e hardware, com o intuito de reunir, interpretar e transformar as informações em uma base para ações que serão empreendidas, para apoio de 37 decisões como: estabelecimento de preços, verbas para propaganda, análise de veículos de comunicação, entre outras. Para Kotler (1999), o avanço tecnológico promete uma nova era de estratégias de marketing baseadas na inform ação. Hoje, já é possível: desenvolver uma intranet para otimizar a movimentação das informações dentro de uma empresa ; estabelecer uma extranet para a troca de dados ou sugestões entre a empresa e seus clientes, fornecedores e distribuidores; utilizar a própria internet para obter um enorme número de informações. Devido à fragmentação do mercado, estão surgindo cada vez mais veículos de comunicação especializados, como revistas e canais de televisão, voltados para um público específico que pode ser atingido de maneira mais eficiente graças aos bancos de dados gerenciados pelas empresas, onde se tem o perfil de milhares ou até mesmo milhões de clientes em potencial. (KOTLER, 1999) Segundo Kotler (1999), através de uma classificação de clientes em bancos de dados, é possível formar subconjuntos que representem oportunidades de marketing. O autor ainda exemplifica que uma empresa, ao conhecer um subconjunto de clientes que adquiriram microcomputadores, já possui um público -alvo de clientes que possivelmente te rá mais interesse em adquirir um scanner em promoção. Para Kotler (1999, p.148), devido à imensa quantidade de informações dos bancos de dados, diversas possibilidades de agrupamentos só podem ser encontradas através de técnicas avançadas, ressaltando que: o banco de dados de clientes representa um data warehouse que exige triagem de dados por meio de ferramentas estatísticas e matemáticas avançadas. Ao utilizar essas ferramentas, as empresas são capazes de definir melhor seus mercados -alvo e aumentar o índice de resposta. Segundo Kotler (2000, p.138), um sistema de apoio a decisões de marketing é: um conjunto coordenado de dados, sistemas, ferramentas e técnicas com software e hardware de suporte, por meio do qual uma empresa coleta e interpreta informa ções relevantes provenientes dos negócios e do ambiente e as transformações em uma base para ação em marketing. 38 2.4 CONSIDERAÇÕES FINAIS DA REVISÃO BIBLIOGRÁFICA Com o levantamento bibliográfico realizado pudemos compreender melhor as técnicas de extração, transformação e carga, para então realizar a análise exploratória de dados . Para tanto, no capítulo seguinte, foi realizada a modelagem da proposta de solução exposta no primeiro capítulo. 39 3 MODELAGEM 3.1 INTRODUÇÃO Segundo Bezerra (2002), nos dias atuais, uma empresa que possui à sua disposição um maior número de informações sobre seu processo de negócio está em vantagem em relação às concorrentes. Ele afirma que , devido ao aumento da importância da informação, se f ez necessário gerenciar as mesmas de forma adequada e eficiente, razão pela qual surgiu os sistemas de informações. Um sistema de informações é uma combinação de pessoas, dados, processos, interfaces, redes de comunicação e tecnologia que interagem com o objetivo de dar suporte e melhorar o processo de neg ócio de uma organização empresarial com relação às informações que nela fluem. (BEZERRA 2002, p.1) Para Bezerra (2002), o desenvolvimento de um sistema de informações é algo complexo, que abrange diverso s componentes, entre eles um sistema de software que, por sua vez, é responsável pelos módulos funcionais computadorizados que interagem com o usuário, proporcionando a automatização de diversas tarefas. Para o autor, devido à grande complexidade do desenvolvimento de sistemas de software, é necessário um planejamento inicial anterior feito através de um modelo que atuará como uma representação idealizada do sistema a ser construído. Cougo (1997, p.7) conceitua modelo como sendo uma “representação abstrata e simplificada de um sistema real, com a qual se pode explicar ou testar o seu comportamento, em seu todo ou em partes”. Bezerra (2002) relata que um modelo de sistema de software é composto de diversas representações gráficas denominadas diagramas. O auto r esclarece que um diagrama nada mais é do que um conjunto de elementos gráficos com um significado predefinido. Existe ainda a necessidade de informações textuais, que por sua vez podem explicar ou definir certas partes do diagrama. Os diagramas em conjun to com as informações textuais formam a documentação do modelo. A modelagem de dados não é apenas uma ferramenta para projeto de banco de dados. Serve para facilitar o tratamento de várias aplicações, dentre as quais destacam -se: 40 representar um ambiente o bservado; servir de instrumento para comunicação ; favorecer o processo de verificação e validação ; capturar aspectos de relacioname nto entre os objetos observados; servir como referencial para a geração de estruturas de dados ; e estabelecer conceitos únicos a partir de visões diversas. (COUGO, 1997) A modelagem de sistemas de software, segundo Bezerra (2002, p.4), “consiste na utilização de notações gráficas e textuais com o objetivo de construir modelos que representem as partes essenciais de um sistema, c onsiderando-se diversas perspectivas diferentes e complementares”. Para Cougo (1997), antes de iniciar o trabalho de modelagem, deve -se definir alguns pontos importantes para a geração do produto esperado: Abrangência: sua definição é essencial; é importante para definir que objetos serão buscados no processo de observação, pois expectativas mal definidas podem levar ao descarte do melhor dos projetos ; Nível de detalhamento: mesmo com a abrangência bem definida é preciso saber quais são as expectativas com relação ao nível de detalhamento esperado para o produto final; Tempo para produção do modelo : é de suma importância saber as expectativas de prazo para a conclusão do trabalho , para não ter dificuldades em produzir o modelo esperado; e Recursos disponíveis: deve-se considerar o número de indivíduos, especialistas ou não, a serem alocados para participar da modelagem . 3.2 LINGUAGEM DE MODELAGEM UNIFICADA - UML Com o surgimento no final da década de 1990, a Linguagem de Modelagem Unificada (Unified Modeling Language - UML) é definida como uma “união de diversas notações preexistentes, com alguns elementos removidos e outros elementos adicionados com o objetivo de torná-la mais expressiva”. (BEZERRA, 2002, p.13) 41 É uma linguagem visual, podendo ser utiliz ada na modelagem de sistemas, independente tanto de processos de desenvolvimento quanto de linguagens de programação. (BEZERRA, 2002) Para Booch et al. (2000 apud BEZERRA, 2002), existem cinco visões interdependentes do sistema UML, cada uma enfatizando as pectos diferentes, a saber: Visão de casos de uso: o sistema é descrito sob o ponto de vista externo como um conjunto de interações entre ele e os agentes externos a ele; Visão de projeto: salienta as características do sistema que dão suporte às funcionalidades extremamente visíveis , tanto comportamentais quanto estruturais; Visão de implementação: compreende a gerência de versões do sistema, que apóiam tanto comportamental quanto estrutural em relação às funcionalidades externamente visíveis do sistema; Visão de implantação: corresponde à distribuição física do sistema em seus subsistemas e à conexão entre eles; e Visão de processo: salienta as características de concorrência, sincronismo e desempenho do sistema. O desenvolvimento de um sistema que utili ze a linguagem UML como suporte à modelagem envolve a criação de documentos, textuais ou gráficos, denominados artefatos de software, os quais, por sua vez, compõem as visões do sistema. (BEZERRA, 2002) Para aproveitar a UML de maneira eficiente e produtiva, deve-se utilizar boas metodologias e ferramentas pois, para o sucesso de qualquer projeto , é fundamental a sua boa definição e gerenciamento . Para especificar artefatos de qualidade, dirigir a equipe de desenvolvimento em suas atividades e fornecer prin cípios para monitoração e medição das atividades e produtos do projeto , é importante a utilização de metodologias como a Rational Unified Process – RUP, Extreme Programming – XP, entre outras. (LIMA, 2005) No presente estudo, utilizaremos a metodologia ICONIX pois, segundo Rosenberg & Scott (2001), está situada entre a RUP e a XP. Para os autores, seus criadores, a ICONIX é orientada a casos de uso, assim como a RUP – porém sem muito da sobrecarga imposta por ela –, e é relativamente compacta e pequena, assim como a XP – mas não descartando a análise de projeto feita pela mesma. 42 3.3 ICONIX A metodologia ICONIX, de acordo com Bona (2002, p.60), “é um processo simplificado que unifica conjuntos de métodos de orientação a objetos em uma abordagem completa, com o objetivo de dar cobertura ao ciclo de vida”. Para Silva & Videira (2001 apud SANTI & PEREIRA, 2007, p.66), a ICONIX “é uma metodologia prática, intermediária entre a complexidade da RUP, que gera muita documentação, e a simplicidade da XP, e não de ixa a desejar na análise de design”. Para o autor, a metodologia é dirigida por casos de uso e segue o ciclo de vida iterativo e incremental. A base da ICONIX é responder algumas questões fundamentais sobre o software. Utiliza técnicas da UML para auxilia r a prover a melhor resposta. As questões e as técnicas são: (ROSENBERG & SCOTT, 1999 apud BONA, 2002, p.61) Quem são os usuários do sistema (ou atores), e o que eles estão tentando fazer? Para isto, deve-se utilizar casos de uso; O que são, no “mundo real” (chamado domínio de problema), os objetos e as associações entre eles? Deve-se utilizar o diagrama de classe de alto nível; Que objetos são necessários para cada caso de uso? Utilizar análise de robustez; Como objetos estão colaborando e interagindo den tro de cada caso de uso? Utilizar diagrama de seqüência e de colaboração; Como serão manipulados, em tempo-real, aspectos de controle? Utilizar diagrama de estado; e Como realmente será construído o sistem a em um nível prático? Utilizar diagrama de classe de baixo nível. Para Borillo (2000 apud BONA, 2002, p.61), a ICONIX possui três características fundamentais: Iterativo e incremental: ocorrem várias iterações entre o desenvolvimento do modelo de domínio e a identificação dos ca sos de uso. O modelo dinâ mico refina incrementalmente o modelo estático; 43 Rastreabilidade (traceability): cada passo referencia para os requisitos de alguma forma. Silva e Videira (2001) definem rastreabilidade como sendo a capaci dade de seguir a relação entre os diferentes artefatos produzidos. Desta forma, pode-se determinar qual o impacto que a alteração de um requisito tem em todos os artefatos restantes; e Aerodinâmica da UML: a metodologia oferece o uso “aerodin âmico” da UML (OMG, 2001) como os diagramas de casos de uso, os diagramas de seqüência e cola boração, e diagramas de robustez. Segundo Rosenberg & Scott (1999 apud BONA, 2002), a metodologia ICONIX é dividida em quatro fases: análise de requisitos, análise e projeto preliminar, projeto e implementação. 3.3.1 Análise de requisitos Segundo Bona (2002), a tarefa de análise de requisitos é composta pela realização das seguintes atividades: Modelo de domínio: é um diagrama de classe de alto nível que visa identificar no “mundo real” os objetos e to das as relações de agregação de generalização entre eles; Prototipação: apresentar, se possível, uma prototipação rápida de interface do sistema , para que o cliente compreenda melhor a proposta; Modelo de casos de uso: identificar os casos de uso do sistema mostrando os atores envolvidos; Diagrama de pacotes: é empregado para organizar os casos de uso em grupos ; e Associação de requisitos: associar os requisitos funcionais aos casos d e uso e aos objetos de domínio. 44 FIGURA 07: ICONIX – Atividades da análise de requisitos FONTE: Bona (2002, p.62) Uma importante característica da ICONIX é que um requisito se diferencia explicitamente de um caso de uso. “Neste sentido, um caso de uso descreve um comportamento; um requisito descreve uma regra para o comportamento ”. Assim, um caso de uso corresponde a um ou mais requisitos funcionais e um requisito funcional também pode corresponder a um ou mais casos de uso. (SILVA & VIDEIRA, 2001 apud BONA, 2002, p.63) 3.3.2 Análise e projeto preliminar Fazem parte da tarefa de análise e projeto preliminar as seguintes atividades: (BONA, 2002, p.63) Casos de uso: escrever os casos de uso, com fluxo principal das ações, podendo conter o fluxo alternativo e o fluxo de exceção; Análise de robustez: apresentá -la de maneira que para cada caso de uso seja identificado um conjunto de objetos (usar os estereótipos de classes) e atualizado o diagrama de classes do modelo de domínio; e Diagrama de classes: terminar sua atualização . 45 FIGURA 08: ICONIX – Atividades da análise e projeto prelimin ar FONTE: Bona (2002, p.63) 3.3.3 Projeto De acordo com Bona (2002), a fase do projeto é composta pela realização das seguintes atividades: Utilizar o diagrama de seqüência para especificar o comportamento do projeto, identificando as mensagens entre os diferentes objetos para cada caso de uso. Utilizar o diagrama de colaboração, se necessário, para representar as transações ch aves entre os objetos. Complementa-se utilizando diagrama de estado s para mostrar o comportamento em tempo real; Concluir o modelo estático, acrescentando detalhes ao projeto no diagrama de classes; e Conferir se todos os requisitos identificados são cumpridos pelo projeto. 46 FIGURA 09: ICONIX – Atividades do projeto FONTE: Bona (2002, p.64) 3.3.4 Implementação As atividades que dão suporte à tarefa de implementação são, segundo Bona (2002, p.64): Utilização do diagrama de componente para apoiar a fase de desenvolvimento, se necessária; Escrever e gerar o código; Realizar testes de unidade e de integração; e Realizar testes de aceitação do usuário. 3.4 MODELAGEM DO PROTÓTIPO De acordo com o que foi proposto no primeiro capítulo do presente trabalho, será realizado um estudo de caso com os formulários de satisfação e com o cadastro de clientes da Rede de Restaurantes Miyoshi. 47 A definição de classe, segundo Rumbaugh (apud BONA, 2002, p.66), é entendida como sendo “uma descrição de um grupo de objetos com propriedades similares, comportamento comum, relações comum, e semântica comum”. FIGURA 10: Diagrama de classes class Diagrama de Classes Extração ETL Transformação Carga FONTE: Elaboração dos autores Na ICONIX, os requisitos têm conceitos distintos dos casos de uso. Apesar disso, possuem relação um com o outro. (BONA, 2002) . Para Robertson (1999 apud BONA, 2002, p.94), os “requisitos são coisas a descobrir antes de começar a construir um produto”. A proposta tem os seguintes requisitos funcionais: RF001 – Extração, Transformação e Carga – ETL Descrição: esta funcionalidade promove a extração dos dados da base operacional, verificando e eliminando os possíveis err os encontrados, tais como formatos inválidos e dados incoerentes. Após, os dados são carregados em um data warehouse. RF002 – Ferramenta de Front-End Descrição: possibilita a visualização e manipulação dos dados armazenados no warehouse, assim como a aplicação de técnicas OLAP nos mesmos. data 48 RF003 – Banco de dados operacional Descrição: é a fonte de todas as informações, porém ainda na sua forma bruta. O banco de dados é composto de cinco tabelas: qwclient, qwpurchase, opinião, staff e store. RF004 – Data warehouse Descrição: requisito que permite que os dados nele armazenados de forma integrada sejam processados por ferramentas de front-end. FIGURA 11: Requisitos funcionais custom Functional Requirements RF001 - Extração, Transformação e Carga - ETL RF002 - Ferramenta de Front-End RF003 - Banco de dados operacional RF004 - Data warehouse FONTE: Elaboração dos autores 3.4.1 Análise de requisitos Nesta fase é feita a identificação e descrição dos casos de uso . Para este projeto foram identificados dois casos de uso, como mostrados nas figuras seguintes, juntamente com as respectivas descrições: 49 FIGURA 12: Casos de uso uc Casos de Uso Banco de Dados ETL Front End Data Warehouse administrador FONTE: Elaboração dos autores FIGURA 13: CSU001 – Extração, transformação e carga - ETL class CSU001 - Extração Transformação e Carga - ETL Administrador Extrair os dados FONTE: Elaboração dos autores Transformar dados Carregar dados no DW 50 FIGURA 14: CSU001 – Descrição CSU001 - Extração, Transformação e Carga - ETL Sumário: extrair os dados da base operacional, verificando e corrigindo erros , e carregá-los no data warehouse. Ator principal: administrador do sistema Ator secundário: banco de dados, ferramenta de front-end Pré-condição: definição dos dados usados das tabelas que serão processadas Fluxo principal: 1. Selecionar os dados definidos; 2. Extrair os dados; 3. Transformar os dados; 4. Carregar os dados Fluxo alternativo: 5. Mensagem de erro: dados não carregados Pós-condição: dados carregados FONTE: Elaboração dos autores FIGURA 15: CSU002 – Ferramenta de front-end class CSU002 - Ferramenta de Front-End Define as Tabelas Seleciona os Parâmetros Administrador Executa a Query «precedes» Data Warehouse Visualização dos Dados FONTE: Elaboração dos autores 51 FIGURA 16: CSU002 – Descrição CSU002 – Ferramenta de Front-End Sumário: visualização e manipulação dos dados armazenados no data warehouse Ator principal: administrador Ator secundário: data warehouse Pré-condição: possuir um data warehouse Fluxo principal: 1. Definir as tabelas 2. Selecionar os parâmetros 3. Executar a query 4. Visualização dos dados Pós-condição: dados visualizados FONTE: Elaboração dos autores 3.4.2 Análise e projeto preliminar Esta etapa ilustra graficamente as int erações entre os objetos participantes dos casos de uso, através do diagrama de robustez. FIGURA 17: Diagrama de robustez – ETL class ETL - Diagrama de robustez Administrador Extrair dados filtrados Selecionar variáveis Transformar dados Seleciona tabela Exportar dados Data warehouse FONTE: Elaboração dos autores 52 FIGURA 18: Diagrama de robustez – Ferramenta de front-end class Diagrama de Robustez - Ferramenta de Front-End Define a Tabela Executa Query Administrador Data Warehouse Seleciona os Parâmetros «flow» Visualização dos Dados FONTE: Elaboração dos autores 3.4.3 Projeto Nesta etapa são construídos os diagramas de seqüência , os quais têm a finalidade de instruir o desenvolvedor na fase de implementação quanto à ordem dos processos envolvidos. Tais diagramas serão elaborados numa próxima análise dos dados. 3.4.4 Implementação “O ICONIX considera que a atividade de implementação está fora do seu âmbito e foco de interesse”. Apesar disso, sugere algumas sugestões que auxiliam na atribuição de determinadas atividades, tais como: (SILVA & VIDEIRA, 2001 apud B ONA, 2002, p.99) 53 Que os casos de uso sejam escritos por pessoas com experiência em desenho de interface ou por técnicos com experiência na produção de manuais de usuário; Que os modelos de domínio e diagramas de classe detalhados sejam construídos por pessoas com experiência em projeto s de base de dados; Que os programadores de sistema devem pensar em aspectos como desempenho, segurança, bem como serem responsáveis pelos diagramas de estado e colaboração, se forem utilizados; e Que a tarefa de desenho detalhado, em especial o diagrama de seqüência, seja realizada, ou pelo menos supervisionada, por pessoas com experiência em modelação orientada a objetos (OO). 3.5 CONSIDERAÇÕES FINAIS DA MODELAGEM Através dos conceitos de metodologia de linguagem UML e de ICONIX, foi possível a elaboração da modelagem da proposta no primeiro capítulo do presente estudo. No próximo, será apresentado o estudo de caso. 54 4 ESTUDO DE CASO: REDE DE RESTAURANTES MIYOSHI No presente capítulo, será realizada uma análise da base de dados da Rede de Restaurantes Miyoshi. Os dados foram obtidos através de uma base já existente, criada pela própria empresa. A análise será dividida em duas etapas: a primeira, a partir dos dados dos clientes que possuem cartão fidelidad e, inclusive em relação às compras efetuadas; a segunda, em relação aos formulários de satisfação de clientes. 4.1 A EMPRESA A Rede de Restaurantes Miyoshi teve origem em 1979, na cidade de Porto Velho, em Rondônia, e tinha como foco inicial a culinár ia chinesa. Em 1992, foi inaugurada a primeira loja de Florianópolis, localizada na Rodovia SC -401, no bairro Saco Grande. Com o aumento da procura por comidas da culinária de origem oriental, t rês anos depois uma nova loja foi criada, no Centro da Capital, com a inclusão de pratos típicos japoneses no cardápio, como o sushi e o sashimi. Em 1998, outra dependência é aberta, agora num dos cartões postais mais belos da Ilha de Santa Catarina, a Lagoa da Conceição. Devido ao grande sucesso da rede, cinco an os mais tarde (2003), o bairro Kobrasol, no vizinho município São José, é contemplado com uma filial. Em 2006 foi a vez de Blumenau. Devido à popularização dos sushis e sashimis, foram montadas unidades de vendas em supermercados de diversas cidades, como Joinville, Jaraguá do Sul, Balneário Camboriú e Porto Alegre. Atualmente, a Empresa Miyoshi é referência em matéria de culinária oriental, contando com seis restaurant es, 13 unidades de venda em Santa Catarina e 9 no Rio Grande do Sul, e mais de 185 colaboradores. 55 4.2 ANÁLISE DOS DADOS A empresa conta com uma base de dados própria, que possui como front-end um Sistema Web de gerenciamento interno denominado “ Miyoshi Network”. Este sistema foi desenvolvido em linguagem de programação PHP que se integr a à base de dados MySQL. A principal função desse sistema é a integração entre os diversos setores de administração da empresa, tais como recursos humanos, marketing e compras. Composto por diversos módulos, possui controle de acesso por nível de usuários. Através dele (sistema) é possível realizar comunicações internas, registrar anomalias, cadastr ar formulários de satisfação, gerenciar os cartões de fidelidade, dentre outros procedimentos. As principais fontes que abastecem a base de dados são o cadastro de cartões de fidelidade e os formulários de controle de satisfação. Atualmente, conforme relatado pelo setor de marketing, a empresa não utiliza os dados coletad os de forma eficiente como deveria, ficando limitada a envio de cartões de aniversário, publicidade (e-marketing) e datas comemorativas (tipo dia do profissional). No banco de dados do sistema, encontram-se cinco tabelas relacionadas entre si responsáveis pelo armazenamento dos dados do cartão fidelidade e dos formulários de satisfação dos clientes. Abaixo, temos a modelagem dessas tabelas: 56 FIGURA 19: Diagrama de tabela de dados FONTE: Elaboração dos autores A tabela “staff” armazena os dados dos funcionários que utilizam o sistema. A de “brindes”, os dados dos brindes disponívei s para troca por pontos. Para os dados das lojas matriz e filiais é usada a intitulada “lojas”. Os dados do questionário de satisfação do cliente estão relacionados à tabela “opiniao”. Os relativos ao cartão de fidelidade, na tabela “qwclient”. Por fim, na “qwpurchase” são mantidos os dados de compras feitas com uso do cartão de fidelidade. É importante registrar que f oram ignoradas as tabelas “ staff”, “lojas” e “brindes” por não conterem dados considerados fundamentais para nossa análise. 57 Aplicando técnicas de ETL, estudadas no segundo capítulo, foram montadas novas tabelas para integrar todos os dados já limpos e relevantes para o estudo, com uso dos seguintes critérios: Alteração para o valor 1/1/1900 com conseqüente desconsideração de d atas incoerentes, como de visita anterior à data de cadastro ou datas de nascimento em que o cliente teria menos de 18 anos ou mais de 120 anos; Agrupamento em gênero e padronização de p rofissões e ocupações; Eliminação de registros com insuficiência de dados, como por exemplo, sem endereço, sem data de nascimento; Padronização de primeira inicial em letra maiúscula e as demais letras em forma minúscula, em todas as palavras; Após a conferência dos nomes de bairros, cidades e estados, foram corrigidas as incoerências e campos vazios através do CEP informado; e Foram ignorados e marcados como “NI” os ca mpos vazios detectados. Na tabela “qwpurchase”, foram removidos 9.847 (9,29%) registros de um total de 105.933 armazenados, passando a denominar-se “compra”. Já na tabela “qwclient”, que apresentava 9.595 registros, passou a ter o nome de “cliente”, após as devidas remoções. As figuras abaixo apresentam a síntese do trabalho realizado: FIGURA 20: Reformulação das tabelas de fidelidade FONTE: Elaboração dos autores. Assim como nas referentes ao cartão de fidelidade, a tabela “opniao” foi reformulada e originou uma nova com um aproveitamento de 100% dos registros , que totaliza 15.316. FIGURA 21: Reformulação das tabelas de satisfação FONTE: Elaboração dos autores. 58 O dicionário de dados e os modelos das novas tabelas constam no APÊNDICE deste trabalho. Com as tabelas já limpas, deu -se início ao processo de análise das mesmas , feitas em diversas dimensões, com o objetivo de gerar dados que não eram conhecidos pela empres a e que teriam potenciais para desenvolver estratégias e auxiliar nas tomadas de decisões. 4.2.1 Análises de clientes fidelidade Os dados coletados e armazenados que integram o sistema de fidelização são compostos de dados básicos do cliente, como nome , data de nascimento e endereço, bem como referentes ao registro de suas compras, como valor, data e loja. O sistema foi criado com a finalidade de atrair e manter os clientes da rede de restaurantes, onde a cada R$ 10,00 em compra, é somado um ponto ao cartão de fidelidade. De acordo com a pontuação adquirida pelo cliente, é possível efetuar a troca por diversos brindes temáticos. Como as informações da lista de brindes, troca e pontuação são irrelevantes para o estudo, foram desconsideradas. Abaixo, a título de exemplo, é apresentado o rosto do cadastro de um cliente para a geração de seu cartão de fidelidade: FIGURA 22: Cadastro de clientes FONTE: Miyoshi LTDA. 59 A partir do percentual de clientes , por estado, constata-se que a grande maioria reside em Santa Catarina, o que torna inexpressiva a quantidade observada nas demais unidades da federação. Isto se deve ao fato de que, de um total de seis lojas, cinco estão situadas em solo catarinense. FIGURA 23: Percentual de clientes por estado ESTADO – BRASIL QTDADE % SC 9372 97,80% Demais Estados 167 1,74% NI 44 0,46% Total 9583 100,00% FONTE: Elaboração dos autores De um total de cinco lojas em Santa Catarina, três estão em Florianópolis, uma em São José e uma em Blumenau. Em razão disso, o percentual de clientes por município apresenta uma grande concentração na Capital (74,66%) e, em seguida, ainda com alguma relevância, São José (15,89%) e Blumenau (3,99%). A participação observada nos demais municípios é irrelevante (5,46%). FIGURA 24: Percentual de clientes por cidades de Santa Catarina FONTE: Elaboração dos autores 60 Em Florianópolis, a maioria dos clientes concentra-se na região central (26,78%) . Percebe-se que os bairros com maior concentração de clientes são também os mais populosos do município e aqueles cujas lojas encontram -se próximas a eles. FIGURA 25: Percentual de clientes por bairros de Florianópolis FONTE: Elaboração dos autores Observa-se uma distribuição concentrada nos bairros Kobra sol (24,24%), Campinas (22,9%) e Barreiros (19,41%), regiões responsáveis por mais de 65% dos clientes do município, justamente as mais próximas à filial. FIGURA 26: Percentual de clientes por bairros de São José FONTE: Elaboração dos autores 61 Pela análise do gráfico c onstata-se uma distribuição equilibrada entre os bairros do município, a partir da localização da filial, localizada no Bairro Ponta Aguda . FIGURA 27: Percentual de clientes por bairros de Blumenau FONTE: Elaboração dos autores Depreende-se que o público que freqüenta a Rede é relativamente jovem, pois a faixa etária compreendida entre dezoito e trinta e sete anos corresponde a 70% do total. FIGURA 28: Percentual de clientes por faixa etária FONTE: Elaboração dos autores O gráfico de percentual de clientes por ocupação tem a maior parte de estudantes (22,47%), seguido de empresários (5,46%), advogados (5,37%) e administradores (5,11%). Isso se deve ao fato de que, conforme ressaltado anteriormente, grande parte d o público é 62 considerado jovem. Cabe ressaltar que 5,44% de um total de 9585 ocupações não foram informadas, o que é relevante para a manutenção de um cadastro confiável. FIGURA 29: Percentual de clientes por ocupação FONTE: Elaboração dos autores A idade média dos clientes da rede em Santa Catarina é de 33,2 a nos. A mais alta foi observada em Joinville (36,2 anos) e a mais baixa em Palhoça (30,6 anos). FIGURA 30: Média de idade por cidade FONTE: Elaboração dos autore s 63 O crescente aumento do número de clientes fidelizados pode ser observado no gráfico acima, o qual mostra que, num período de quatro anos, houve um aumento de quase 600% do número de adesão ao programa. FIGURA 31: Evolução da fidelização FONTE: Elaboração dos autores Na FIGURA 32, é possível perceber uma média de gasto por cliente equilibr ada entre as lojas, exceto na de Blumenau, na qual se verifica um valor maior. FIGURA 32: Média de gasto por loja FONTE: Elaboração dos autores 64 Comparando-se o gráfico “evolução do faturamento ” com o de “evolução da fidelização” constata-se uma similariedade entre ambos, pois com o aumento do número de clientes fidelizados também se eleva o montante faturado pela empresa . FIGURA 33: Evolução do faturamento FONTE: Elaboração dos autores A representação abaixo demonstra a relação do faturamento mensal obtido dos clientes fidelizados durante o período pesquisado. Percebe-se uma equivalência entre os meses do ano, visto que o período de alta temporada de férias de verão não interfere diretamente nas vendas para esses clientes, já que residem em Santa Catarina. Outro fator importante a registrar é o crescimento do volume das vendas, ano após ano, já objeto de análise em gráficos anteriores. FIGURA 34: Faturamento mensal por ano FONTE: Elaboração dos autores 65 Este gráfico busca determinar qual quinzena de cada mês representa o maior consumo dos clientes fidelizados. Pode-se perceber que as quinzenas se intercalam no decorrer de todo os meses dos anos, o que leva à conclusão de que não existe uma grande variação entre elas. FIGURA 35: Percentual de gasto quinzenal FONTE: Elaboração dos autores É notória a representatividade dos consumidores da cida de de Florianópolis no faturamento da rede que se deve ao fato de ter três lojas na cidade, conforme já dito anteriormente. 66 FIGURA 36: Faturamento por cidade FONTE: Elaboração dos autores Depreende-se que a loja da cidade de Blumenau tem mais de 80% de vendas para clientes fidelizados da mesma cidade. Já a de São José (Kobrasol) tem parte de seus clientes residentes em Florianópolis, cujo fator pode ser atribuído à proximidade entre as duas cidades. FIGURA 37: Faturamento por cidade, por loja FONTE: Elaboração dos autores 67 Observa-se um aumento crescente do gasto de acordo com a elevação da faixa etária, exceto na última que apresentou uma alta queda. Este fato pode representar que a clientela jovem possui um poder aquisitivo menor do que a mais idosa, além de que esta consume alimentos em menor quantidade. FIGURA 38: Média de gasto por faixa etária FONTE: Elaboração dos autores Apesar da faixa etária entre 58 a 67 anos ser responsável pela maior média de gasto, as duas faixas etárias mais jovens respondem por quase 70% do faturamento da empresa . Podese atribuir isso ao fato de que os jovens são em maior número, os mais freqüentadores das lojas. FIGURA 39: Percentual do faturamento por faixa etária FONTE: Elaboração dos autores 68 4.2.2 Análises dos formulários de satisfação Com sua inicialização em março de 2006, o s formulários de satisfação dos clientes da Rede de Restaurantes Miyoshi refletem as opiniões que eles deixam toda vez que visitam uma das lojas. No momento em que é entregue a conta ao cliente, é fornecido um questionário com perguntas com a finalidade de melhorar a qualidade dos produtos e serviços ofertados , cujo preenchimento também pode ser feito através do website da empresa. O modelo do formulário vai abaixo descrito: FIGURA 40: Formulário de satisfação FONTE: Rede de Restaurantes Miyoshi 69 Em quase metade dos questionários de satisfação , a indicação foi o principal meio de informação do estabelecimento. Daí a importância da prestação de serviço de qualidade para satisfação dos anseios e necessidades dos clientes, para que façam a divulgação “boca-a-boca” da rede. FIGURA 41: Tipo de propaganda FONTE: Elaboração dos autores Em relação à qualificação geral do estabelecimento, foram listados oito itens : qualidade do atendimento, velocidade do atendimento, qualidade da comida japonesa, qualidade da comida chinesa, qualidade da bebida, limpeza, apresentação de nossa equipe e conforto. Para cada um deles, foram solicitadas notas, de 1(fraco) a 5(excelente). A grande maioria das respostas ficou entre 4 e 5, o que demonstra clientes bastante satisfeitos. 70 FIGURA 42: Qualificação geral FONTE: Elaboração dos autores A seguir, são apresentadas duas comparações com relação à qualificação: foram separados os clientes fidelizados dos não fidelizados , e separadas as qualificações por loja. Na comparação entre clientes fidelizados e não fidelizados, pouca diferença é observada. Apenas nos itens “qualidade da bebida” e “conforto” as médias das qualificações dos clientes fidelizados foi inferior às dos não fidelizados. 71 FIGURA 43: Qualificação dos clientes fidelizados e não fidelizados FONTE: Elaboração dos autores Na comparação por loja há pouca diferença. A menor qualificação d e loja foi a da Lagoa, em relação aos itens “qualidade da bebida” e “conforto”, talvez porque a pesquisa tenha sido realizada antes da reforma do ambiente e aquisição de novos refrigeradores pa ra permitir a temperatura ideal da bebida. FIGURA 44: Média das qualificações por loja FONTE: Elaboração dos autores 72 A avaliação dos comentários é feita por um profissional responsável pela área de marketing da rede de restaurantes , que lê os questionários e faz a qualificação da seguinte forma: comentários neutros e em branco (avaliados como neutros); comentários negativos; comentários positivos; e sugestões. FIGURA 45: Avaliação dos comentários FONTE: Elaboração dos autores Pela observação do gráfico constata-se uma maior quantidade de clientes que visitam a loja Centro, seguidos da loga Matriz e Lagoa. A pouca quantidade de formulários respondidos na loja de Porto Velho deve-se ao fato de que lá o preenchimento não é incentivado. FIGURA 46: Percentual de formulários por loja FONTE: Elaboração dos autores 73 Optou-se por fazer uma divisão de bairros por região , para visualizar se o cliente que mora em um determinado local costuma ir à loja mais próxima ou se vai em outra de sua preferência. Em geral, o público procurou a loja mais próxima de sua residência, à exceção dos clientes residentes no bairro Santa Mônica e região que, por não possuirem uma loja nas proximidades, se distribuem entre as do Centro, Matriz e Lagoa. FIGURA 47: Bairros por região FONTE: Elaboração dos autores 4.3 CONSIDERAÇÕES FINAIS DA ANÁLISE DOS DADOS Neste estudo, foi possível perceber a riqueza dos dados coletados, que tem um enorme potencial para a obtenção de informações que po dem ser utilizadas como diferencial de mercado. A falta de informação por parte da empresa e o desconhecimento do melhor uso dos dados são os principais fatores da baixa utilização dos dados armazenados e das aplicações não recomendáveis. O banco de dados da empresa estudada apresentou uma vasta inconsistência, porém com uma baixa redundância. Uma das grandes causas encontradas foi a falha humana, pois o 74 sistema permite a inserção de dados incompletos, com erros e até mesmo com incoerências , facilmente perceptíveis, como por exemplo cidades catarinenses agrupadas em outros estados. Tais problemas acarretam dificuldade s para expressar dados com precisão, tirando a solidez de toda uma análise. Para diminuir futuros erros, uma maneira encontrada para melhorar a forma de inserção dos dados no siste ma, é substituir os campos de preenchimento abertos por campos pré -selecionáveis, assim como verifica r e validar campos. Também é recomendável um treinamento mais rígido para os responsáveis pela inserção dos dados no sistema. Visando aumentar as dimensões das análises e da coleta dos dados, sugere-se também a inserção de novos campos nos formulários, tanto para cadastro do cartão de fidelidade quanto para o formulário de satisfação do cliente. Campos que não foram encontrados atualmente, como sexo e estad o civil, seriam enriquecedores. Pode -se também tornar obrigatório o preenchimento de outros campos que atualmente encontram -se na situação de opcionais, o que diminuirá o percentual de campos não informados. 75 5 CONCLUSÃO No presente estudo, foi possível verificar as mudanças de visões das empresas em relação aos seus clientes, com o passar dos tempos, o que mostra que é cada vez mais importante entender e conhecer o perfil dos clientes. Esta é a principal abordagem do CRM, que visa oferecer métodos e alternativas para absorver características, hábitos e comportamentos de clientes, buscando um diferencial no tratamento e nas ofertas de produtos e serviços para eles. O CRM pode ser considerado como ferramenta para alcançar vantagem compe titiva, seja através de redução de gastos, busca de novos clientes, melhorias nas aplicações de marketing ou aumento do percentual de fidelização de clientes. A fidelização de clientes mostrou -se como um grande diferencial para uma empresa, a qual torna possível não apenas aumentar os lucros, como também evitar a perda do cliente para seus concorrentes. Porém, para tornar um cliente fiél a empresa, se faz necessário que o mesmo atinja um alto grau de satisfação. Uma das maneiras de se mensurar o nível de satisfação dos clientes em relação aos produtos e serviços prestados por uma empresa, é através do preenchimento de formulários de satisfação. Tanto a implantação de um sistema de fidelização de clientes quanto a pesquisa de satisfação dos mesmos, geram um a base de dados bem nutrida. Pode -se concluir que, na era em que vivemos, tanto o dado quanto a informação, são bens essenciais para as empresas, porém só serão válidos se aplicados de forma adequada. Conforme Kotler (1999), de nada adianta armazenar dados , processá-los em informações e até mesmo convertê -las em conhecimento, se este não for aplicado. Este é o caso da empresa estudada que, até o presente momento, faz a coleta e armazenagem de ricas informações, porém não as usufrui de maneira eficiente. Através deste trabalho mostramos como é possível reunir diferentes visões por meio de um conjunto de dados coletados, e com isso, gerar diversas informações que poderão ser fundamentais na elaboração de estratégias e tomadas de decisões, atingindo assim noss o objetivo geral relatado no primeiro capítulo. 76 5.1 TRABALHOS FUTUROS 5.1.1 Integração do Cartão Fidelidade versus Colibri Food Visando um enriquecimento dos dados coletados e buscando um perfil mais específico de cada cliente será projetado uma int egração do sistema fidelidade com o software de gestão de vendas denominado Colibri Food. Com isto, será possível ampliar as dimensões das análises, como período de permanencia de cada cliente na loja, bebidas e pratos mais pedidos, bem como suas quantidades. Um dos grandes desafios deste projeto será a integração da base de dados de ambos sistemas, uma vez que o software Colibri Food é um sistema muito amplo que comporta diversos módulos e uma extensa base de dados. 5.1.2 Implementação de novos relatórios Atualmente o sistema de controle do cartã o fidelidade e do formulário de satisfação geram apenas relatórios básicos, sem cruzamento de dados. Futuramente, baseado nos modelos apresentados neste estudo, serão implementados novos módulos para emissão de relatórios e gráficos em diversas dimensões, ampliando as possibilidades de análises dos ambientes referidos. 5.1.3 Novo modelo de Formulário de Satisfaç ão Um novo modelo de Formulário de Satisfação já está em fase de confecção. Este novo modelo buscará uma maior facilitação para preenchimento por parte dos clientes. Além disso, serão adicionados novos campos que poderão nutrir ainda mais a base de dados. Do ponto de vista estético, um novo design para o mesmo também está sendo estudado, alterando posicionamento de campos e suas cores. 77 5.1.4 Aplicação de algoritmos de mineração de dados A aplicação de algoritmos de mineração de dados para extrai r outras informações relevantes é um dos objetivos posteriores a este estudo. O emprego de ferramentas c omo Weka (Waikato Environment for Knowledge Analysis ), RapidMiner e SPSS (Statistical Package for the Social Sciences ) permitirá a descoberta de novos conhecimentos, entre outras vantagens. A facilitação de já se ter uma base de dados limpa será um fator i mportante para colocar esse futuro projeto em prática. 78 REFERÊNCIAS ANTUNES, D. M; VIEIRA, E. M. Data warehouse: análise e apoio às decisões gerenciais. Trabalho de conclusão de curso apresentado ao Curso de graduação em Sistema s de Informação da Universidade do Sul de Santa Catarina, como requisito parcial à obtenção do título de Bacharel em Sistemas de Informação, 200 6. BARBIERI, C. BI - Business Intelligence – Modelagem e Tecnologia. Rio de Janeiro: Axcel Books do Brasil Editora Ltda, 2001. BEZERRA, E. Princípios de análise e projeto de sistemas com UML. Rio de Janeiro: Campus, 2002. BRETZKE, M. Marketing de relacionamento e competição em tempo real com CRM (Customer relationship manager). São Paulo: Atlas, 2000. BONA, C. Avaliação de processos de software: um estudo de caso em XP e ICONIX . Dissertação de Pós-Graduação em Engenharia de Produção da Universidade Federal de Santa Catarina como requisito parcial para obtenção de grau de Mestre em Engenharia de Produção, 2002. BROWN, S. A. CRM – Customer relationship management: uma ferramenta estratégica para o mundo e-business.São Paulo: Makron Books, 2001. CARVALHO, L. A. V. Datamining: a mineração de dados no marketing, medicina, economia, engenharia e administração. São Pau lo: Érica, 2001. COUGO, P. S. Modelagem conceitual e projeto de banco de dados. Rio de Janeiro: Campus, 1997. DOWNING, D; CLARK, J. Estatística aplicada. São Paulo: Saraiva, 2000. FILHO, T. L. Business intelligence no Microsoft Excel. Rio de Janeiro: Axcel Books do Brasil Editora Ltda, 2004. GREENBERG, P. CRM – Customer relationship management na velocidade da luz: conquista e lealdade de clientes em tempo real na Internet. Rio de Janeiro: Campus, 2001. GRIFFIN, J. Como conquistar e manter o cliente fi el: transforme seus clientes em verdadeiros parceiros. São Paulo: Futura, 1998. JAMIL, G. L. Repensando a TI na empresa moderna: atualizando a gestão com a tecnologia da informação. Rio de Janeiro: Axcel Books do Brasil Editora Ltda, 2001. INMON, W. H. Como construir o data Warehouse. 2. ed. Rio de Janeiro: Campus, 1997. KOTLER, P. Administração de marketing: a edição do milênio. 10. ed. São Paulo: Prentice Hall, 2000. 79 KOTLER, P. Marketing para o século XXI: como criar, conquistar e dominar mercados. São Paulo: Futura, 1999. LIMA, A. S. UML 2.0: do requisito à solução. São Paulo: Érica, 2005. MACHADO, F. N. R. Projeto de data warehouse: uma visão multidimensional. São Paulo: Érica, 2000. O'BRIEN, J. A. Sistemas de informação: e as decisões gerenciais na era da internet. 2. ed. São Paulo: Saraiva, 2003. OLIVEIRA, D. P. R. Sistemas de informações gerenciais: estratégias, táticas, operacionais. 9. ed. São Paulo: Atlas, 2004. RICHERS, R. Marketing: uma visão brasileira. São Paulo: Negócio Editora, 2000. ROSENBERG, D; SCOTT, K. Applying use case driven object modeling with UML: an annotated e-commerce example. Boston: Addison-Wesley, 2001. SANTI, J; PEREIRA, M. T. XP versus ICONIX: comparação de métodos ágeis. Trabalho de conclusão de curso apresenta do ao Curso de graduação em Sistemas de Informação da Universidade do Sul de Santa Catarina, como requisito parcial à obtenção do título de Bacharel em Sistemas de Informação, 2007. SILVA, E. L; MENEZES, E. M. Metodologia da pesquisa e elaboração de disse rtação. 3. ed. Florianópolis: UFSC, 2005. SPIEGEL, M. R. Estatística: 383 problemas resolvidos, 416 problemas suplementares. 3. ed. São Paulo: Makron Books, 1994. STEVENSON, W. J. Estatística aplicada à administração. São Paulo: Harbra, 2001 SWIFT, R. CRM – Customer relationshio management: o revolucionário marketing de relacionamentos com o cliente. 5. ed. Rio de Janeiro: Campus, 2001. TRIOLA, M. F. Introdução à estatística. 7. ed. Rio de Janeiro: LTC, 1999. 80 APÊNDICE 81 QUALIFICAÇÕES POR LOJA BLUMENAU MÉDIA CENTRO MÉDIA Qualidade do atendimento 4,62 Qualidade do atendimento 4,24 Velocidade do atendimento 4,54 Velocidade do atendimento 4,24 Qualidade da comida japonesa 4,53 Qualidade da comida japonesa 4,33 Qualidade da comida chinesa 4,44 Qualidade da comida chinesa 4,18 Qualidade da bebida 4,66 Qualidade da bebida 4,71 Limpeza 4,65 Limpeza 4,3 Apresentação de nossa equipe 4,69 Apresentação de nossa equipe 4,31 Conforto 4,73 Conforto 4,42 MÉDIA 4,6075 MÉDIA 4,34125 KOBRASOL MÉDIA LAGOA MÉDIA Qualidade do atendimento 4,53 Qualidade do atendimento 4,36 Velocidade do atendimento 4,53 Velocidade do atendimento 4,35 Qualidade da comida japonesa 4,46 Qualidade da comida japonesa 4,37 Qualidade da comida chinesa 4,35 Qualidade da comida chinesa 4,21 Qualidade da bebida 4,87 Qualidade da bebida 4,16 Limpeza 4,47 Limpeza 4,34 Apresentação de nossa equipe 4,47 Apresentação de nossa equipe 4,34 Conforto 4,37 Conforto 4 MÉDIA 4,50625 MÉDIA 4,26625 MATRIZ MÉDIA PORTO VELHO MÉDIA Qualidade do atendimento 4,64 Qualidade do atendimento 4,69 Velocidade do atendimento 4,49 Velocidade do atendimento 4,69 Qualidade da comida japonesa 4,56 Qualidade da comida japonesa 4,66 Qualidade da comida chinesa 4,47 Qualidade da comida chinesa 4,66 Qualidade da bebida 4,65 Qualidade da bebida - Limpeza 4,64 Limpeza 4,3 Apresentação de nossa equipe 4,73 Apresentação de nossa equipe 4,3 Conforto 4,78 Conforto - MÉDIA 4,62 MÉDIA 4,55 82 DISTRIBUIÇÃO DE OCUPAÇÃO POR FAIXA ETÁRIA OCUPAÇÃO 18 a 27 28 a 37 38 a 47 48 a 57 58 a 67 68 a 77 mais 77 NI Administrador(a) 111 251 90 21 6 0 0 11 Advogado(a) 77 296 75 27 9 1 1 29 Analista de Sistemas 34 84 16 5 1 0 0 4 Aposentado 0 0 2 21 21 13 0 3 Arquiteto(a) 24 51 25 17 0 0 0 5 Bancário(a) 45 80 28 20 1 0 0 7 Comerciante 43 135 85 43 8 0 0 14 Demais Ocupações 647 1002 428 153 47 11 0 74 Empresário(a) 82 204 133 61 19 2 0 23 Engenheiro(a) 38 114 71 63 26 0 0 11 Estudante 1715 247 17 4 0 0 0 171 Funcionário(a) Público(a) 35 81 72 40 7 2 0 7 Gerente 38 57 17 5 0 0 0 4 Jornalista 31 57 14 6 0 0 0 4 Médico(a) 22 104 66 32 11 1 0 18 NI 171 153 71 23 9 3 0 91 Odontologista 19 61 23 7 2 0 0 5 Professor(a) 66 161 118 73 19 4 0 17 Psicólogo(a) 27 66 27 17 1 0 0 8 Publicitário(a) 55 56 32 6 3 0 0 5 Representante Comercial 16 40 23 9 1 0 0 2 Vendendor(a) 70 57 25 5 0 0 0 4 83 PERCENTUAL DE FAIXA ETÁRIA POR OCUPAÇÃO 18 a 28 a 38 a 48 a 58 a 68 a mais OCUPAÇÃO 27(%) 37(%) 47(%) 57(%) 67(%) 77(%) 77(%) NI(%) Administrador(a) 3,30% 7,48% 6,17% 3,19% 3,14% 0,00% 0,00% 2,13% Advogado(a) 2,29% 8,82% 5,14% 4,10% 4,71% 2,70% 100,00% 5,61% Analista de Sistemas 1,01% 2,50% 1,10% 0,76% 0,52% 0,00% 0,00% 0,77% Aposentado 0,00% 0,00% 0,14% 3,19% 10,99% 35,14% 0,00% 0,58% Arquiteto(a) 0,71% 1,52% 1,71% 2,58% 0,00% 0,00% 0,00% 0,97% Bancário(a) 1,34% 2,38% 1,92% 3,04% 0,52% 0,00% 0,00% 1,35% Comerciante 1,28% 4,02% 5,83% 6,53% 4,19% 0,00% 0,00% 2,71% Demais Ocupações 19,22% 29,85% 29,36% 23,25% 24,61% 29,73% 0,00% 14,31% Empresário(a) 2,44% 6,08% 9,12% 9,27% 9,95% 5,41% 0,00% 4,45% Engenheiro(a) 1,13% 3,40% 4,87% 9,57% 13,61% 0,00% 0,00% 2,13% Estudante 50,95% 7,36% 1,17% 0,61% 0,00% 0,00% 0,00% 33,08% Funcionário(a) Público(a) 1,04% 2,41% 4,94% 6,08% 3,66% 5,41% 0,00% 1,35% Gerente 1,13% 1,70% 1,17% 0,76% 0,00% 0,00% 0,00% 0,77% Jornalista 0,92% 1,70% 0,96% 0,91% 0,00% 0,00% 0,00% 0,77% Médico(a) 0,65% 3,10% 4,53% 4,86% 5,76% 2,70% 0,00% 3,48% NI 5,08% 4,56% 4,87% 3,50% 4,71% 8,11% 0,00% 17,60% Odontologista 0,56% 1,82% 1,58% 1,06% 1,05% 0,00% 0,00% 0,97% Professor(a) 1,96% 4,80% 8,09% 11,09% 9,95% 10,81% 0,00% 3,29% Psicólogo(a) 0,80% 1,97% 1,85% 2,58% 0,52% 0,00% 0,00% 1,55% Publicitário(a) 1,63% 1,67% 2,19% 0,91% 1,57% 0,00% 0,00% 0,97% Representante Comercial 0,48% 1,19% 1,58% 1,37% 0,52% 0,00% 0,00% 0,39% Vendendor(a) 2,08% 1,70% 1,71% 0,76% 0,00% 0,00% 0,00% 0,77% 84 PERCENTUAL DE OCUPAÇÃO POR FAIXA ETÁRIA OCUPAÇÃO 18 a 27 28 a 37 68 a 77 mais 77 NI Administrador(a)(%) 22,65% 51,22% 18,37% 4,29% 1,22% 0,00% 0,00% 2,24% Advogado(a)(%) 14,95% 57,48% 14,56% 5,24% 1,75% 0,19% 0,19% 5,63% Analista de Sistemas(%) 23,61% 58,33% 11,11% 3,47% 0,69% 0,00% 0,00% 2,78% Aposentado(%) 0,00% 35,00% 35,00% 21,67% 0,00% 5,00% Arquiteto(a)(%) 19,67% 41,80% 20,49% 13,93% 0,00% 0,00% 0,00% 4,10% Bancário(a)(%) 24,86% 44,20% 15,47% 11,05% 0,55% 0,00% 0,00% 3,87% Comerciante(%) 13,11% 41,16% 25,91% 13,11% 2,44% 0,00% 0,00% 4,27% Demais Ocupações(%) 27,39% 42,42% 18,12% 6,48% 1,99% 0,47% 0,00% 3,13% Empresário(a)(%) 15,65% 38,93% 25,38% 11,64% 3,63% 0,38% 0,00% 4,39% Engenheiro(a)(%) 11,76% 35,29% 21,98% 19,50% 8,05% 0,00% 0,00% 3,41% Estudante(%) 79,62% 11,47% 0,79% 0,00% 0,00% 0,00% 7,94% Funcionário(a) Público(a)(%) 14,34% 33,20% 29,51% 16,39% 2,87% 0,82% 0,00% 2,87% Gerente(%) 31,40% 47,11% 14,05% 4,13% 0,00% 0,00% 0,00% 3,31% Jornalista(%) 27,68% 50,89% 12,50% 5,36% 0,00% 0,00% 0,00% 3,57% Médico(a)(%) 8,66% 40,94% 25,98% 12,60% 4,33% 0,39% 0,00% 7,09% NI(%) 32,82% 29,37% 13,63% 4,41% 1,73% 0,58% 0,00% 17,47% Odontologista(%) 16,24% 52,14% 19,66% 5,98% 1,71% 0,00% 0,00% 4,27% Professor(a)(%) 14,41% 35,15% 25,76% 15,94% 4,15% 0,87% 0,00% 3,71% Psicólogo(a)(%) 18,49% 45,21% 18,49% 11,64% 0,68% 0,00% 0,00% 5,48% Publicitário(a)(%) 35,03% 35,67% 20,38% 3,82% 1,91% 0,00% 0,00% 3,18% Representante Comercial(%) 17,58% 43,96% 25,27% 9,89% 1,10% 0,00% 0,00% 2,20% Vendendor(a)(%) 43,48% 35,40% 15,53% 3,11% 0,00% 0,00% 0,00% 2,48% 0,00% 38 a 47 3,33% 48 a 57 58 a 67 0,19% 85 DICIONÁRIO DE DADOS TABELA CLIENTE TABELA COMPRA 86 TABELA OPINIAO 87 MODELO DAS NOVAS TABELAS