Universidade Presbiteriana Mackenzie ANÁLISE DE LOGÍSTICA FIDELIZAÇÃO DE CLIENTES UTILIZANDO REGRESSÃO Karina Cavalcante Duarte (IC) e Raquel Cymrot (Orientadora) Apoio: PIBIC Mackenzie/MackPesquisa Resumo A fidelização de clientes tem sido usada como estratégia competitiva para aumentar a lucratividade de uma companhia. A temática desta pesquisa é analisar o relacionamento dos clientes de uma empresa, tendo por objetivo identificar pontos que auxiliem uma maior retenção de seus consumidores. Este estudo propõe a construção de um modelo matemático que preveja a probabilidade de algumas variáveis importantes na fidelização de clientes baseada em outras variáveis conhecidas. A ferramenta escolhida para esse fim foi a regressão logística. Primeiramente esse estudo oferece uma revisão teórica sobre o setor no qual a empresa em questão está inserida, sobre marketing de relacionamento, fidelização, segmentação de clientes e regressão logística. A análise descritiva dos dados foi feita com o auxílio do programa Minitab®. Foram realizados alguns testes de independência entre pares de variáveis pertinentes, bem como propostos dois modelos de regressão logística que tiveram como resposta duas variáveis importantes que influenciam uma possível fidelização. Uma delas foi a indicação positiva da empresa por parte dos clientes e a outra foi a excelência no desempenho de seu produto. No primeiro modelo, percebeu-se que a indicação positiva está relacionada com a satisfação na instalação e desempenho, enquanto no segundo, a variável excelência no desempenho apresentou forte ligação com a excelência na assistência técnica, localização (capital ou interior), região do Brasil e excelência na instalação. O primeiro modelo apresentou pequena melhora no poder preditivo da variável enquanto no segundo modelo a melhora foi significativa. Palavras-chave: fidelização de clientes, regressão logística, segmentação de clientes Abstract The customer loyalty has been used as a competitive strategy to increase company profitability. The theme of this research is to analyze the relationship of a company's customers, aiming to identify points that help having a greater retention of their customers. This study proposes the construction of a mathematical model that will provide the probability some important variables in customer loyalty based on other known variables. The tool chosen for this purpose was logistic regression. Firstly this study provides a theoretical review about the sector which the company in question is placed, about relationship marketing, loyalty, customer segmentation and logistic regression. The descriptive analysis was done with the using the program Minitab®. It was done some independence tests between pairs of relevant variables as well as proposed two logistic regression models that had resulted two important variables that can influence a customer loyalty One was a positive indication of the company by customers and the other was the excellence of the performance of their product. In the first model, it was noted that the positive indication is related to satisfaction with installation and performance, while in the second, the variable performance excellence had a strong connection with excellence in service, location (capital or countryside) region of Brazil and excellence in installation. The first model showed little improvement in predictive power of the variable while the second model the improvement was significant. Key-words: customer loyalty, logistic regression, segmentation of customers 1 VII Jornada de Iniciação Científica - 2011 1 INTRODUÇÃO A alta competitividade do mercado atual e o fato de empresas oferecerem produtos e serviços equivalentes tornam os consumidores cada vez mais conscientes do poder que têm nas mãos, ou seja, eles estão mais atentos em relação às ofertas dos concorrentes e mais suscetíveis a migrar de uma marca para outra em busca do que consideram melhor para si. Portanto, atrair novos clientes pode ser uma tarefa fácil para os profissionais de marketing, porém somente atraí-los não basta, é importante saber mantê-los (VAVRA, 1993). De acordo com Jeffrey Gitomer (1998 apud KOTLER; KELLER, 2007, pg153), o grande desafio não é deixar os clientes apenas satisfeitos e sim conquistar clientes fieis. Clientes satisfeitos e fieis constituem o capital de relacionamento com o cliente da empresa. Por exemplo, para realizar uma avaliação de quanto vale uma determinada empresa, deve-se considerar não só os equipamentos, as instalações, a marca, mas também a base de clientes existente, uma vez que um eventual comprador também pagaria pela listagem dos clientes com os quais poderia realizar futuros negócios (KOTLER; KELLER, 2007). Segundo os mesmos autores alguns motivos para fidelizar um cliente são: a) Reter um cliente é cinco vezes mais barato que conquistar novos. b) Empresas perdem ao ano em média dez por cento de seus clientes. c) Ao reduzir em cinco por cento a perda de clientes, uma empresa pode aumentar de vinte a oitenta e cinco por cento seus lucros. d) A taxa de lucro por cliente tende a aumentar ao longo do tempo conforme sua retenção. Rust, Zahorik e Keiningham (1995 apud SUZUKI, 2010, p.11) justificam que um relacionamento duradouro com clientes tem relação direta com a lucratividade, pois clientes antigos são menos sensíveis a preços e consequentemente têm mais capacidade de produzir fluxo de caixa e lucro. Outro ponto a ser considerado é que esses clientes costumam divulgar a empresa quando estão satisfeitos. No presente estudo, pretende-se analisar essa relação com o auxílio da variável Indicação, obtida a partir do questionário elaborado pela empresa e respondido por alguns de seus clientes. Também é preciso salientar que a fidelização não pode ser investigada sem se levar em conta a satisfação do cliente, que por sua vez está ligada a qualidade. Empresas que atingem alta performance são aquelas que desenvolvem a qualidade conforme o cliente a define, para assim obter qualidade tanto no produto quanto no serviço prestado (WHITELEY, 1992). 2 Universidade Presbiteriana Mackenzie 1.1 PROBLEMA DE PESQUISA O objeto de estudo desta pesquisa é uma empresa de equipamentos odontológicos de grande porte, localizada no interior de São Paulo. Compreender o consumidor é uma tarefa que exige um database marketing (base de dados de marketing) bem organizado capaz de armazenar não apenas as informações dos clientes, mas o histórico de todas as suas transações. Esta ferramenta deve ser atualizada constantemente para que seja possível acompanhar periodicamente o comportamento dos consumidores, de modo a prever suas ações e permitir a empresa antecipar-se quanto às suas necessidades e desejos, realizando um planejamento corporativo mais preciso (STONE; WOODCOCK, 2002). Vavra (1993) afirma que os programas de relacionamento se destinam a aumentar o tempo de vida dos clientes. Quanto maior esse tempo, maiores são as chances do cliente comprar novamente produtos ou serviços de uma mesma empresa, podendo também se tornar mais dependente deste fornecedor. 1.2 OBJETIVOS Com o intuito analisar o relacionamento entre a referida empresa com seus consumidores e obter maior lealdade por parte destes, o objetivo desse trabalho é construir um modelo de regressão logística a partir do qual se possa identificar variáveis importantes para a fidelização de clientes baseado em outras variáveis conhecidas. Desta forma a empresa poderá melhorar seu dimensionamento de esforços de marketing, bem como seus processos de venda e pós-venda. A partir da segmentação de clientes e entendimento de suas necessidades individuais poderá ser obtida uma maior retenção de clientes, levando assim a uma provável redução de despesas e maximização de lucros. 2 REVISÃO DA LITERATURA Para a realização desta pesquisa alguns tópicos foram especialmente estudados. Estes estão apresentados com mais detalhes a seguir: 2.1 O SETOR DE EQUIPAMENTOS ODONTOLÓGICOS NO BRASIL De acordo com Gutierrez e Alexandre (2004), o setor de equipamentos odontológicos é caracterizado por equipamentos médicos e insumos cuja aplicação de seus materiais e 3 VII Jornada de Iniciação Científica - 2011 instrumentos se dá na prática odontológica. Seus principais equipamentos são as cadeiras de dentista, refletores, dosador e misturador de amálgamas, equipos, raios X, mochos etc. Este setor também é caracterizado por empresas multinacionais desde pequeno e médio porte, com equipamentos simplificados, até as grandes, que possuem alta tecnologia e produção sofisticada. Estas últimas, por apresentarem facilidades de compra, como financiamento, pacotes de produtos e garantias de assistência técnica, possuem certa vantagem competitiva em relação às nacionais menores e acabam por dominar o mercado de equipamentos de alta tecnologia (TELES, 2002). A mesma autora ressalta que o poder de comercialização das indústrias brasileiras e estrangeiras e o diferencial tecnológico atraem mais compradores como em licitações públicas e pacotes fechados. Existe grande dinamismo tecnológico e busca por inovação neste tipo de indústria, envolvendo então diversos outros setores, como enfatizado por Furtado ([199-] apud TELES, 2002, p. 35), o de informática, mecânica de precisão, setor químico, eletrônica digital etc. Ele também destaca que é uma prática habitual das grandes empresas se associarem às empresas menores em busca do aumento de sua produção e melhor política de comercialização. Contudo tal prática ocorre, principalmente, desde que as indústrias menores possuam uma tecnologia que agregue às maiores. Desde 1999 a indústria brasileira de equipamentos odontológicos, laboratórios, médicohospitalares e insumos têm mantido bom ritmo de expansão. Em 2007 obteve faturamento de U$ 3,74 bilhões e gerou 31,3 mil postos de trabalho, o que representa, com base em 2006, um crescimento de 21% (ASSOCIAÇÃO BRASILEIRA DA INDÚSTRIA DE ARTIGOS E EQUIPAMENTOS MÉDICOS, ODONTOLÓGICOS, HOSPITALARES E DE LABORATÓRIOS, 2011b). Dentro da indústria de equipamentos e materiais médicos, hospitalares e odontológicos, no Brasil, o setor de odontologia é o mais competitivo. Por haver uma procura elevada por serviços dessa área, ocorreu um aumento da oferta por parte dos profissionais do segmento, favorecendo assim o seu desenvolvimento. Por exemplo, em 2009, existiam no país aproximadamente 200 mil dentistas, o que conferiu ao setor de equipamentos e insumos odontológicos o segundo lugar do mundo, perdendo apenas para os Estados Unidos (PIERONI; REIS; SOUZA, 2010). No Brasil, segundo Manfredini (2006), tal indústria possui algumas características que as diferenciam das demais, dentre elas se sobressaem: a maciça participação das exportações sobre as importações, o volume considerável de países para onde os produtos são exportados e a produção autossuficiente no país. 4 Universidade Presbiteriana Mackenzie Nas regiões Sul e Sudeste está presente a maior concentração das indústrias do setor no país. Na região Sul, principalmente no Rio Grande do Sul e Paraná, localiza-se 16,7% das empresas do setor. Só em São Paulo, na região Sudeste, há 67% das empresas, sendo 45% na Grande São Paulo (ASSOCIAÇÃO BRASILEIRA DA INDÚSTRIA DE ARTIGOS E EQUIPAMENTOS MÉDICOS, ODONTOLÓGICOS, HOSPITALARES E DE LABORATÓRIOS, 2011a). No Brasil, de acordo com dados de 2009, sabe-se que mais de 90% do capital é de origem nacional. Dentre os compradores desses produtos, 68,6% são do setor privado, 21,5% do público, 8,8% provém de exportações, enquanto 1% do total se distribui entre leasing, contratos exclusivos de fornecimento de insumos e serviços, etc. ASSOCIAÇÃO BRASILEIRA DA INDÚSTRIA DE ARTIGOS E EQUIPAMENTOS MÉDICOS, ODONTOLÓGICOS, HOSPITALARES E DE LABORATÓRIOS, 2011c). Na indústria internacional pode-se dizer que entre 1989 e 1998, o valor das importações cresceu 7,7 vezes, o que provocou um aumento de US$ 1.597.205 para US$ 12.300.66. No subgrupo de equipamentos odontológicos, as exportações foram muito dinâmicas, cobrindo o aumento das importações, sendo que o setor de aparelhos odontológicos (MANFREDINI, 2006). 2.2 SEGMENTAÇÃO DO MERCADO CONSUMIDOR De acordo com Shepard (1993) segmentar clientes significa alocar em pequenos grupos ou conglomerados indivíduos que tenham características, necessidades e atitudes semelhantes. Essa tarefa é crucial para se criar modelos de previsão, isso porque é esperado que clientes pertencentes ao mesmo conglomerado tenham comportamentos semelhantes. Além disso, ao conhecer o segmento ao qual determinado cliente pertence, a empresa poderá tratá-lo de forma diferenciada de acordo com as características desse segmento em relação ao produto ou serviço oferecido. A segmentação de mercado também tem a função de auxiliar o entendimento, a composição e as necessidades dos segmentos individuais de mercado. Porém antes de se coletar informações dos clientes é necessário estabelecer os objetivos que se pretende alcançar, para que seja possível desenvolver instrumentos de pesquisa adequados às respostas desejadas. Mowen e Minor (2006) definem a segmentação de mercado como um mercado dividido em subconjuntos de clientes com equivalentes necessidades e vontades individuais, no qual cada um deles pode ser atingido com o auxílio de um mix de marketing diferente, ou seja, 5 VII Jornada de Iniciação Científica - 2011 esses segmentos devem permitir ao consumidor acesso ao preço, à praça (local de venda), ao produto e promoção (comunicação, publicidade e propaganda). Segundo os mesmos autores esses segmentos devem ser capazes de efetuar medidas demográficas, de análise psicográfica, de atitudes e personalidade, a partir das quais se possam analisar as características e vontades do segmento. Além disso, eles devem ser substanciais em tamanho e receita a fim de que sejam capazes de obter vendas satisfatórias. Apesar da grande vantagem de se utilizar a segmentação na coleta de dados, algumas empresas encontram dificuldades ao aplicar esse conceito na prática, principalmente no que se trata de escolher as variáveis mais adequadas para a separação e caracterização dos segmentos e escolha de qual técnica utilizar para definir os grupos (FREITAS; HEINECK, 2008). Um sistema de coleta de dados pode ser classificado basicamente de duas formas: dados de fonte primária e secundária. São considerados dados primários aqueles que são obtidos diretamente da fonte, ou seja, por meio de interações diretas com as pessoas ou objetos de pesquisa (SHEPARD,1993). De acordo com Malhotra (2004) os dados primários têm por objetivo solucionar problemas imediatos e que ajudem diretamente na tomada de decisão. Por exigir levantamentos, experimentos, dentre outros, sua grande desvantagem é se tratar de uma pesquisa longa, dispendiosa e cara. Em muitos casos decide-se usar dados de fontes secundárias, que são dados obtidos de outras maneiras que não por meio do próprio indivíduo. Eles podem ser conseguidos rapidamente e com custo muito baixo porque se costuma usar dados já coletados em outra pesquisa que tinha outra finalidade. Contudo, esse tipo de coleta envolve uma série de riscos. Segundo Aaker, Kumar e Day (2004), para evitar imprecisões ao utilizar esses dados devese levar em consideração a origem e reputação da fonte, se há interesse de determinado grupo que deseja ser favorecido pela pesquisa, se a metodologia para coleta era adequada, se os dados são obsoletos e se a fonte pode ser usada como base de comparação para a pesquisa atual, ou seja, verificar se há pretensão de chegar ao mesmo resultado utilizando métodos diferentes. Além disso, alguns dados são difíceis de utilizar, pois podem ter sido agrupados de maneira pouco compreensível. Nesta pesquisa foram utilizados dados primários obtidos a partir do banco de dados da empresa estudada. 2.3 A REGRESSÃO LOGÍSTICA Em situações nas quais se deseja separar dois grupos distintos ou alocar um novo elemento em quaisquer desses grupos, duas técnicas estatísticas são recomendadas, a Análise 6 Universidade Presbiteriana Mackenzie Discriminante e a Regressão Logística. Ambas podem ser descritas como métodos que verificam a existência de dependência estatística de uma variável denominada dependente (prevista ou explicada), em relação a uma ou mais variáveis independentes (explanatórias ou preditoras) (HAIR et al., 2009; RODRIGUES; PAULO, 2007). A aplicação da análise discriminante envolve muitas suposições às variáveis independentes, dentre elas ter normalidade e matrizes de variância e covariância iguais entre ambos os grupos de classificação. O modelo logístico costuma ser mais utilizado, pois além de não exigir todas estas suposições, permite uma interpretação direta de seus coeficientes e, assim como na regressão múltipla, consegue introduzir efeitos não lineares (HAIR et al., 2009). Outro aspecto ressaltado pelos mesmos autores indica que o uso da análise discriminante pode não ser tão favorável, pois ela possui um score (dispositivo discriminatório) classificado em ordem crescente, o que não indica nenhum método probabilístico. A regressão logística é um caso particular de regressão na qual a variável resposta Y é dicotômica, ou seja, pode assumir apenas dois resultados mutuamente excludentes, como por exemplo, bom ou mal, sucesso ou fracasso, aceitar ou rejeitar, dentre outros (HAIR et al., 2009). Na regressão logística, em geral, atribui-se o código um ao resultado de interesse, denominado sucesso, que representaria a presença de uma particular característica e zero ao evento complementar, denominado fracasso. A regressão logística é utilizada quando o objetivo é estabelecer uma relação entre uma variável resposta dicotômica e uma ou mais variáveis explicativas as quais podem ser tanto qualitativas como quantitativas. Quando de interesse de uma aplicação, a regressão logística pode ser utilizada mesmo quando a resposta não for originalmente binária, bastando para isto dicotomizar a variável resposta (FARHAT, 2003). A representação matemática de uma regressão linear múltipla é dada por: Y = β0 + β1x1 + β2x2 + ... + βnxn + ε (1) , sendo Y a variável dependente; X1, X2, ..., Xn, as variáveis independentes; β0, β1, β2, ... , βn, os coeficientes das variáveis independentes e ε o erro ou resíduo da regressão. Segundo Hosmer e Lemeshow (2000), os métodos empregados na regressão logística seguem os mesmos princípios gerais usados na regressão linear, apesar de apresentar respostas e suposições de modelo diferentes. De maneira mais ampla, a regressão logística atribui à variável resposta um intervalo compreendido entre zero e um, que pode ser interpretado como a probabilidade de ocorrência de determinado evento. Baseado na regra de decisão, resultados superiores a 0,5 são assumidos como possível sucesso e inferiores como possível fracasso. (DIAS FILHO; CORRAR, 2007). 7 VII Jornada de Iniciação Científica - 2011 Tal relação se deve à transformação da variável resposta em razão de chance (probabilidade) e a uma transformação logarítmica, como apresentado a seguir. Seja g(xi) uma função linear simples, isto é: g(xi) = β0 + β1xi (2) A probabilidade de a variável resposta ser classificada como sucesso dado que o valor da variável explicativa foi igual a xi é dada por (FARHAT, 2003): e β0 + β1xi π ( xi ) = P(Y = 1 | xi ) = 1 + e β0 + β1xi (3) No modelo de regressão logística simples ajusta-se uma função da variável resposta, g(x). As estimações dos parâmetros β0 e β1 são realizadas utilizando-se a função de máxima verossimilhança. Utiliza-se o modelo de regressão logística múltipla quando houver mais de uma variável explicativa (qualitativas ou quantitativas). Neste caso tem-se: g(xi) = β0 + β1xi1 + β2xi2 + ... + βpxip (4) As estimativas dos parâmetros são obtidas por métodos iterativos (ROSA, 2000). É conveniente o uso de pacotes estatísticos, como software Minitab®, para a realização do cálculo destas estimativas. Na regressão logística os resultados inferenciais são assintóticos, enquanto na regressão normal linear tais resultados são exatos. Tem-se também que devido à variável resposta ser dicotômica, os resíduos não têm distribuição Normal, nem variância constante (FARHAT, 2003). Uma vez estabelecido o modelo de regressão logística é necessário o teste da significância dos parâmetros bem como do ajuste do modelo. Dentre alguns possíveis modelos deve-se escolher o modelo mais simples possível dado que tenha um bom ajuste (princípio da parcimônia). Após a determinação do modelo de regressão logística faz-se necessário realizar alguns testes que assegurem sua validade. Estes testes permitem reconhecer tanto as variáveis que influenciam diretamente a estimação dos parâmetros da regressão quanto àquelas que não se ajustam bem e, portanto, devem ser descartadas do modelo final. 8 Universidade Presbiteriana Mackenzie O nível descritivo do teste, ou valor P, indica a probabilidade de um valor no mínimo tão extremo quanto o nível de significância do teste que acarreta a rejeição da hipótese nula a partir dos dados obtidos. No caso do valor P ser, no máximo, igual ao nível de significância do teste, a hipótese nula será rejeitada (MONTGOMERY; RUNGER, 2003). A estimativa dos coeficientes da regressão logística pode ser interpretada a partir da razão entre a probabilidade de sucesso e a probabilidade de fracasso, ou seja, a razão de chance de ocorrência de um evento, conhecida também como “odds ratio” (MOORE; McCABE, 2002). Para conseguir estimar a razão de chance basta fazer o exponencial da estimativa de cada coeficiente. Para fins de validação de modelo são desenvolvidas algumas estatísticas, como a de Pearson, Deviance e Hosmer-Lemeshow. O teste de Pearson analisa as observações e mede o seu poder de adequação do modelo. As que não apresentarem bom ajuste são aquelas que possuem valor de Pearson alto. Já o teste de Hosmer-Lemeshow compara a as frequências observadas e esperadas para verificar se o modelo apresentou bom ajuste. Neste caso ele consegue associar os dados às suas respectivas probabilidades estimadas em ordem crescente (da mais baixa a mais alta), sendo posteriormente feito um teste Quiquadrado para comprovar se as frequências observadas estão próximas das frequências esperadas. A estatística de Deviance é calculada em função da soma de quadrados dos resíduos do modelo logístico. Tal estatística também tem distribuição Quiquadrado (HOSMER, LEMESHOW; 2000). Nos três testes são desejáveis valores baixos de Quiquadrado que resultem em nível descritivo superior a 5%. As estatísticas de Somers’D, Goodman-Kruskal Gamma, e Kendall’s Tau-a são testes correlação e resumem a tabela dos pares concordantes e discordantes. Estas medidas devem estar compreendidas no intervalo entre zero e um, nos quais os valores mais altos indicam que o modelo tem melhor poder de previsão (PENHA, 2002). 3 METODOLOGIA A pesquisa foi submetida e aprovada pelo Comitê de Ética em Pesquisa da Universidade Presbiteriana Mackenzie. Para a obtenção dos dados pertinentes à empresa em questão, o responsável desta instituição pelas informações concedidas leu a Carta de Informação à Instituição e concordou em participar da pesquisa, tendo assinado o Termo de Consentimento Livre e Esclarecido e enviado a seguir por e-mail os dados solicitados que estavam disponíveis. Cabe aqui salientar que não foi disponibilizado pela empresa dados a respeito da fidelização de clientes (base de dados com clientes ativos e inativos) e sim 9 VII Jornada de Iniciação Científica - 2011 dados de pesquisa telefônica realizada rotineiramente pelo Serviço de Atendimento ao Consumidor (SAC) desta empresa. Desta pesquisa foram disponibilizadas as variáveis: cidade de localização do cliente, como o cliente avalia a instalação dos produtos (pós-venda), como este avalia o desempenho dos produtos (pós-venda), como este avalia a assistência técnica (pós-venda) e se este cliente indicaria a empresa a alguém. Para as quatro últimas variáveis os clientes atribuíam notas que variavam entre cinco (5) e zero (0), sendo tais classificações respectivamente iguais a excelente, muito bom, bom, razoável, ruim e péssimo. Cabe salientar que tal instrumento de pesquisa foi desenvolvido pela empresa e por esta é aplicado regularmente. A variável cidade de localização do cliente foi, para a realização da análise estatística, categorizada de duas formas, a saber: região do Brasil na qual o cliente se localiza (Norte, Nordeste, CentroOeste, Sudeste e Sul) e localização do cliente (interior ou capital). A amostragem utilizada foi a casual simples, sem reposição, coletada pela empresa a partir de seu banco de dados de clientes, sendo a amostra resultante a de clientes que responderam à pesquisa de satisfação entre os meses de janeiro a junho de 2011. Na amostra casual simples todos os elementos da população têm chances iguais de pertencer à amostra e tal amostragem garante que as inferências sejam válidas (BOLFARINE, BUSSAB, 2005). A amostra disponibilizada continha as respostas de 1492 clientes. Esta amostra foi dividida em duas partes, a primeira foi utilizada para a construção do modelo logístico, na qual havia 926 dados provenientes dos meses de janeiro, fevereiro, março e abril. A segunda parte, com 566 dados coletados em maio e junho, foi usada para a validação do modelo. Foram realizadas análises descritivas dos dados por meio de construção de tabelas e realizados testes Quiquadrado de independência entre alguns pares de variáveis aleatórias. O teste Quiquadrado é utilizado quando se deseja saber se dois grupos diferem em relação a alguma particularidade qualquer que seja (SIEGEL; CASTELLAN, 2008, p. 134), isto é, se há alguma medida de discrepância entre as frequências observadas e esperadas. Tal estatística é expressa por: 2 r c χ =∑ ∑ i =1 j =1 (o − eij ) 2 ij eij r c =∑ ∑ i =1 j =1 oij2 eij −n (5) , com o valor esperado eij definido como o produto das marginais da observação oij, dividido pelo tamanho da amostra n. As variáveis são apresentadas em uma tabela de contingência de modo que uma variável está disposta nas linhas e outra nas colunas. Obtêm-se então uma tabela de dupla entrada (SIEGEL; CASTELLAN, 2008). 10 Universidade Presbiteriana Mackenzie Adotando r como o número de níveis da primeira frequência e c o número de níveis da segunda, o grau de liberdade será igual a (r-1) (c-1) e o valor do Quiquadrado será encontrado a partir da equação 5. Caso a tabela de contingência não seja 2 x 2, a prova que Quiquadrado somente pode ser aplicada se o número de células com freqüência inferior a 5 for menor que 20% do total de células e se nenhuma célula tiver freqüência esperada inferior a 1. Se essas condições não forem satisfeitas pelos dados na forma em que foram coletados originalmente, deve-se combinar categorias de modo a aumentar as freqüências esperadas nas diversas células. Se em uma tabela 2 x 2 houver alguma frequência esperada inferior a 5, o teste Quiquadrado não poderá ser usado. Neste caso é aconselhável que o pesquisador use o teste não-paramétrico exato de Fisher (COSTA NETO, 2002). Foram construídos dois modelos de regressão logística, um tendo como variável resposta a indicação positiva da empresa (notas 3, 4 ou 5) e outra tendo como variável resposta a excelência no desempenho (nota 5). Foram testados diversos modelos de regressão logística e escolhidos os modelos que se mostraram mais adequados. Após a escolha dos modelos estes foram utilizados no segundo conjunto de dados e medida a sua respectivas probabilidades de acerto. O nível de significância adotado foi 0,05 e foram construídos intervalos com 95% de confiança. Os dados foram analisados com o auxílio do programa Minitab®. 4 RESULTADOS E DISCUSSÃO As Tabelas 1, 2 e 3 apresentam as variáveis de caracterização dos clientes referentes à região, ao mês e localização dentre os 926 indivíduos da amostra utilizada para construção do modelo. Tabela 1: Região, frequência e percentual. Região Norte Nordeste Centro-Oeste Sudeste Sul Frequência 18 260 60 434 154 Percentual 1,94 28,08 6,48 46,87 16,63 11 VII Jornada de Iniciação Científica - 2011 Tabela 2: Mês, frequência e percentual. Mês Janeiro Fevereiro Março Abril Frequência 311 260 212 143 Percentual 33,59 28,08 22,89 15,44 Tabela 3: Localização, frequência e percentual. Localização Interior Capital Frequência 560 366 Percentual 60,48 39,52 Nas Tabelas 4, 5, 6 e 7 estão presentes as variáveis de satisfação com: instalação, desempenho, assistência técnica e indicação da marca. Tabela 4: Satisfação com a instalação, frequência e percentual. Instalação Péssimo Ruim Razoável Bom Muito Bom Excelente Frequência 0 6 17 213 153 537 Percentual 0,00 0,65 1,84 23,00 16,52 57,99 Tabela 5: Satisfação com o desempenho, frequência e percentual. Desempenho Péssimo Ruim Razoável Bom Muito Bom Excelente Frequência 2 7 27 230 187 473 Percentual 0,22 0,76 2,92 24,84 20,19 51,08 Tabela 6: Satisfação com a assistência, frequência e percentual. Assistência Péssimo Ruim Razoável Bom Muito Bom Excelente Frequência 0 4 24 242 150 506 Percentual 0,00 0,43 2,59 26,13 16,20 54,64 12 Universidade Presbiteriana Mackenzie Tabela 7: Satisfação com a indicação, frequência e percentual. Indicação Péssimo Ruim Razoável Bom Muito Bom Excelente Frequência 19 0 0 0 1 906 Percentual 2,05 0,00 0,00 0,00 0,11 97,84 Algumas variáveis binárias auxiliares foram criadas com o intuito de se obter mais opções para testar modelos de regressão logística para variáveis que auxiliem na previsão de fidelização de clientes. No caso das variáveis de satisfação foram criados dois grupos, o de Excelência e o de Positividade. No grupo de Excelência, as variáveis Instalação, Desempenho e Assistência foram dicotomizadas de modo que os elementos que obtiveram nota excelente assumiram o valor um e os demais o valor zero. Já para a Positividade foram dicotomizadas as mesmas variáveis considerando como um os elementos que obtiveram notas positivas (excelente, muito bom e bom), ou seja, as notas cinco (5), quatro (4) e três (3), enquanto às demais notas foi atribuído o valor zero. A variável Região também foi transformada em binária. Assim as regiões Sul e Sudeste adotaram o valor um e as regiões Norte, Nordeste e Centro-Oeste o valor zero. A Tabela 8 apresenta estas variáveis auxiliares com suas respectivas freqüências e porcentagens de ocorrência do valor um. Tabela 8: Variáveis auxiliares, percentual dos valores 1 e frequências dos valores 1 e 0. VARIÁVEIS Excelência na Instalação Excelência no Desempenho Excelência na Assistência Excelência na Indicação Instalação positiva Desempenho positivo Assistência positiva Indicação positiva Região Agrupada Percentual de 1 57,99 51,08 54,64 97,84 97,52 96,11 96,98 97,95 63,50 Frequência de 1 537 473 506 906 903 890 898 907 588 Frequência de 0 389 453 420 20 23 36 28 19 338 O teste Quiquadrado foi aplicado aos pares de variáveis pertinentes ao estudo. A tabela 9 apresenta os resultados e conclusões obtidas. Ao nível de significância de 5%, pode-se verificar que houve independência entre todos os pares de variáveis aleatórias analisados, com exceção das variáveis localização e instalação positiva. Neste caso há indicação de que clientes de cidades que são capitais de seus estados se mostraram proporcionalmente mais satisfeitos com relação à instalação dos 13 VII Jornada de Iniciação Científica - 2011 equipamentos adquiridos, tendo escolhido proporcionalmente mais as opções de satisfação excelente, muito bom e bom. Cabe salientar que, ao nível de significância de 5%, houve independência entre região agrupada na qual se situa o cliente e escolher a opção de desempenho positivo. Porém como o nível descritivo deste teste foi próximo a 5% (P = 0,086), há indicação de tendência de que os clientes das regiões Sul e Sudeste escolham proporcionalmente mais a opção de desempenho positivo que os das demais regiões. Aconselha-se a realização de novas pesquisas para confirmar ou não tal tendência. Tabela 9: teste Quiquadrado, níveis descritivos e conclusões VARIÁVEIS DE INTERE SSE Valo r P Localização X Instalação Positiva 0,009 Co nclusão Rejeita-se H 0 Localização X Assistência Positiva 0,979 Não se rejeita H 0 Localização X Indicação Positiva 0,809 Não se rejeita H 0 Localização X Desempenho Positivo 0,937 Não se rejeita H 0 Região agrupada X Instalação Positiva 0,862 Não se rejeita H 0 Região agrupada X Assistência Positiva 0,627 Não se rejeita H 0 Região agrupada X Indicação Positiva 0,320 Não se rejeita H 0 Região agrupada X Desempenho Positivo 0,086 Não se rejeita H 0 Localização X Excelência na instalação 0,433 Não se rejeita H 0 Localização X Excelência na assistência 0,590 Não se rejeita H 0 Localização X Excelência na indicação 0,676 Não se rejeita H 0 Localização X Excelência no desem penho 0,783 Não se rejeita H 0 Região agrupada X Excelência na instalação 0,129 Não se rejeita H 0 Região agrupada X Excelência na assistência 0,255 Não se rejeita H 0 Região agrupada X Excelência na indicação 0,205 Não se rejeita H 0 Região agrupada X Excelência no desem penho 0,158 Não se rejeita H 0 Para que o modelo de regressão logística seja aceito, exige-se pelo menos um dos coeficientes seja diferente de zero, que testes de ajuste de modelo tenham seu nível descritivo, ou valor P, maior que o nível de significância de 0,05, indicando seu ajuste. Deve haver também um alto índice de concordância interna do modelo e uma boa capacidade de previsão. Dois modelos de regressão logística foram construídos, o primeiro para prever a indicação positiva da empresa e o segundo para prever a excelência no desempenho. Vários possíveis modelos foram testados e a seguir são descritos os modelos que apresentaram melhores resultados. O primeiro modelo encontrado foi: Yindicação positiva = – 5,44133 + 0,630572 Xinstalação + 2,43750 Xdesempenho 14 Universidade Presbiteriana Mackenzie Tanto a variável Xinstalação como a variável Xdesempenho valem 0, 1, 2, 3, 4 ou 5 representando respectivamente a satisfação com classificação respectivamente igual a péssimo, ruim, razoável, bom, muito bom e excelente. A Tabela 10 apresenta os resultados do modelo desta regressão logística binária: Tabela 10 – Coeficientes, erro padrão do coeficiente, valor Z, nível descritivo P, razão de chances, e intervalo com 95% de confiança para a razão de chances. Intervalo com 95% de confiança Coeficiente Erro padrão do coeficiente Z P constante -5,44133 1,32174 -4,12 0,000 Instalação 0,630572 0,344982 1,83 0,068 1,88 0,96 3,69 2,4375 0,433805 5,62 0,000 11,44 4,89 26,78 Preditor Desempenho Razão de chances Limite inferior Limite superior Valores longe de um para a razão de chances indicam maior associação entre a ocorrência do fator e a ocorrência da variável resposta. Para a variável satisfação com a instalação, uma razão de chances igual a 1,88 indica que há um aumento de 88% na chance de sucesso da variável resposta (indicação positiva) quando a variável regressora, satisfação com a instalação, se acrescer em uma unidade (melhora em um nível na satisfação). Já para a variável satisfação com o desempenho, uma razão de chances igual a 11,44 indica que há um aumento de 1044% na chance de sucesso da variável resposta (indicação positiva) quando a variável regressora, satisfação com o desempenho, se acrescer em uma unidade (melhora em um nível na satisfação). A probabilidade de um cliente indicar positivamente a empresa é dada por: P(indicação positiva ) = eY 1 + eY (6) Se esta probabilidade for superior a 0,50, o indivíduo será classificado como cliente que provavelmente irá indicar positivamente a empresa. Por exemplo, para um indivíduo com satisfação boa na instalação e satisfação muito boa no desempenho: Yindicação positiva = –5,44133 + 0,630572 x 3 + 2,43750 x 4 = 6,2004. Tem-se então que P(indicação positiva) = 0,9980 > 0,5, logo este cliente será classificado como um cliente que indicará positivamente a empresa. A estatística G testa a hipótese de que todos os coeficientes são iguais a zero contra a hipótese de que ao menos um deles é diferente de zero. O software forneceu valor G = 100,246, como seu respectivo nível descritivo P igual a 0,000, portanto pode-se afirmar que há evidências de que pelo menos um dos coeficientes é diferente de zero. 15 VII Jornada de Iniciação Científica - 2011 O modelo foi submetido aos três diferentes testes de adequação. O método de Pearson apresentou valor-P = 0,320, o método de Deviance, um valor-P = 0,425 e o método de Hosmer-Lemeshow, um valor-P = 0,581. Portanto, como todos os indicadores foram maiores que 0,05, concluindo-se, ao nível de significância de 5%, que o modelo foi bem ajustado. Foram calculadas várias medidas de associação entre a variável resposta e as probabilidades de previsão. Para os dados da amostra usada na escolha do modelo há 907 indivíduos que indicam positivamente a marca contra 19 indivíduos que indicam de forma regular ou negativa. Podem-se formar assim 907 x 19 = 17233 pares com valores de respostas diferentes. Com base no modelo, um par é considerado concordante se o indivíduo que indica a marca de maneira positiva tem probabilidade maior de ser classificado como tal do que o indivíduo que indica a marca de maneira regular ou negativa. A porcentagem de concordância do modelo foi de 95,5%. Também foram feitos os cálculos das estatísticas de Somers' D, com valor igual a 0,93, de Goodman-Kruskal, com valor igual a 0,96 e de Kendall's Tau-a, com valor 0,04. Estas estatísticas resumem as tabelas de concordância e discordância dos pares de observações e devem estar compreendidas entre 0 e 1. Valores altos indicam que o modelo tem uma boa capacidade de previsão. Como somente o teste de Kendall’s Tau-a apresentou índice baixo contra outros dois índices muito altos, o modelo foi considerado bom. A amostra de teste foi utilizada para calcular a probabilidade de indicação positiva nos 566 indivíduos restantes. Como era conhecida a verdadeira situação quanto à indicação positiva, pode-se calcular a porcentagem de acerto que foi igual a 98,23%. Sem realizar nenhuma estatística a probabilidade de indicação positiva era de 97,95%, faltando 2,05% para completar os 100%. O novo modelo explicou a mais 0,28%, o que corresponde a 13,66% do que faltava explicar. O segundo modelo encontrado foi: Yexcelência no desempenho = –5,04820 + 3,39812 Xexcelência na instalação + 4,65198 Xexcelência na assistencia + 0,300791 Xlocalização - 0,158439 Xregião agrupada Tanto a variável Xexcelência na instalação como a variável Xexcelência na assistencia valem 1 se a satisfação foi classificada como excelente e zero caso contrário. A variável Xlocalização vale 1 se o cliente se localiza na capital e zero se este se localiza no interior. Já a variável Xregião agrupada vale um se o cliente estiver na região Sul ou Sudeste e zero se tiver na região Norte, Nordeste ou Centro-Oeste. A Tabela 11 apresenta os resultados do modelo desta regressão logística binária: 16 Universidade Presbiteriana Mackenzie Tabela 11 – Coeficientes, erro padrão do coeficiente, valor Z, nível descritivo P, razão de chances, e intervalo com 95% de confiança para a razão de chances.. Intervalo com 95% de confiança Coeficiente Erro padrão do coeficiente Z P constante -5,048200 0,472911 -10,67 0,000 Exc na Instal. 3,398120 0,336708 10,09 Exc na Assist. 4,651980 0,342700 Localização 0,300791 0,316863 Região agrup. -0,158439 0,315336 Preditor Razão de chances Limite inferior Limite superior 0,000 29,91 15,46 57,86 13,57 0,000 104,79 53,53 205,13 0,95 0,342 1,35 0,73 2,51 -0,50 0,615 0,85 0,46 1,58 Para a variável excelência na instalação, uma razão de chances igual a 29,91 indica que há um aumento de 2891% na chance de sucesso da variável resposta (excelência no desempenho) quando a variável regressora, a satisfação com a instalação for classificada como excelente. De forma análoga a razão de chances igual a 104,79 indica que há um aumento de 10379% na chance de sucesso da variável resposta (excelência no desempenho) quando a variável regressora, a satisfação com a assistência for classificada como excelente. Já a variável localização apresenta uma razão de chances igual a 1,35 indicando que há um aumento de 35% na chance de sucesso da variável resposta (excelência no desempenho) quando a variável regressora, localização, for uma capital. Por último, a variável região agrupada tem uma razão de chances igual a 0,85 que indica que há uma diminuição de 15% na chance de sucesso da variável resposta (excelência no desempenho) quando a variável regressora, região agrupada for a região Sul ou Sudeste. Conforme a equação 6, se por exemplo, o cliente tiver satisfação excelente na instalação, muito boa na assistência e se localizar no interior da região Sul, tem-se: Yexcelência no desempenho = –5,04820 + 3,39812 x 1 + 4,65198 x 0 + 0,300791 x 0 - 0,158439 x 1 = – 1,8085. Tem-se então que P(excelência no desempenho) = 0,1408 < 0,5, logo este cliente será classificado como um cliente que não classificará como excelente o desempenho. A estatística G foi igual a 954,322, com valor-P igual a 0,000, ou seja, pode-se afirmar, ao nível de significância de 5%, de que há evidências de que pelo menos um dos coeficientes é diferente de zero. Assim como no modelo anterior, esse modelo foi submetido aos testes de adequação. O método de Pearson apresentou valor-P igual a 0,001, no método de Deviance o valor-P foi igual a p = 0,004 e no de Hosmer-Lemeshow, o valor-P foi igual a 0,117. Este resultado não é o ideal, mas como pelo menos sob um dos critérios (teste de Hosmer-Lemeshow) o modelo foi adequado, prosseguiu-se a análise. Para os dados da amostra usada na escolha do modelo há 473 indivíduos que consideram excelente o desempenho contra 453 indivíduos que consideraram o desempenho muito 17 VII Jornada de Iniciação Científica - 2011 bom, bom, regular, ruim ou péssimo. Podem-se formar assim 473 x 453 = 214269 pares com valores de respostas diferentes. Um par é considerado concordante se o indivíduo que considera o desempenho excelente tem probabilidade maior de ser classificado como tal do que o indivíduo que atribuiu nota diferente de 5 ao desempenho. A porcentagem de concordância do modelo foi de 96,1%. Também foram feitos os cálculos das estatísticas de Somers' D, com valor igual a 0,94, de Goodman-Kruskal, com valor igual a 0,96 e de Kendall's Tau-a, com valor 0,47. Todos estes valores foram favoráveis, atestando a boa condição de previsão do modelo. A amostra de teste foi utilizada para calcular a probabilidade de indicação positiva nos 566 indivíduos restantes. Sendo assim, a porcentagem de acerto que foi igual a 92,23%. Sem realizar nenhuma estatística a probabilidade de desempenho excelente era de 51,08%, faltando 48,92% para completar os 100%. O novo modelo explicou a mais 41,15%, o que corresponde a 84,12% do que faltava explicar. 5 CONCLUSÃO O instrumento de pesquisa de satisfação dos clientes foi desenvolvido pela empresa pesquisada. Este apresenta problemas metodológicos, uma vez que sua escala não é equilibrada, variando entre péssimo, ruim, razoável, bom, muito bom e excelente. Tal situação pode levar a algum vício, levando a crer que a satisfação seja maior que a real. A empresa foi alertada sobre esses problemas e se mostrou favorável a rever tal escala, incluindo a opção muito ruim, tornando desta forma a escala equilibrada. Outro fator que também pode levar a um vício é o fato da pesquisa realizada pelo SAC ser feita por telefone, podendo causar constrangimento a quem responde ao instrumento de pesquisa. Foi sugerido que em um mês, fosse sorteado aleatoriamente parte dos clientes para continuar a responder a pesquisa por telefone e parte para respondê-la por meio de um questionário anônimo via Internet, equivalente ao utilizado usualmente, construído e disponibilizado por meio, por exemplo, da ferramenta Google Docs. Os resultados seriam então comparados para detectar se há ou não alguma diferença entre eles. Cabe salientar, entretanto, que é reconhecida pelo mercado a grande satisfação dos clientes desta empresa. Para atingir tal característica deve ter contribuído o fato desta empresa ter seus processos de fabricação certificados por órgãos competentes de qualidade (EN ISO 9001, BPF-Boas práticas de fabricação, EN ISO 13485 dentre outros). A indicação positiva da empresa esteve influenciada por uma boa satisfação tanto com a instalação quanto com o desempenho do equipamento adquirido, tendo o desempenho um 18 Universidade Presbiteriana Mackenzie peso bem maior que a instalação. Já a excelência na satisfação com o desempenho do equipamento esteve ligada à excelência na satisfação com a instalação, na excelência na satisfação com a assistência, com a localização na capital e nas regiões Norte, Nordeste e Centro-Oeste, levando a empresa a verificar a atuação quanto aos clientes do interior bem como a verificação de diferenças nas diversas regiões do Brasil. Embora o melhor modelo tenha incluído as variáveis localização e região, seus pesos foram pequenos quando comparados aos das outras duas variáveis incluídas no modelo, a saber, satisfação com a instalação e com a assistência. Esta última teve um peso bem maior que as demais para a escolha da excelência no desempenho. Sabe-se que enquanto na capital existem predominantemente filiais da empresa, no interior o que predomina são revendedores contratados, os quais em geral não estão presentes quando da instalação dos equipamentos. Sabe-se também que uma condição que pode estar influenciando a diferença de regiões é a existência de uma grande quantidade de cursos novos em odontologia nas regiões Norte, Nordeste e Centro-Oeste. Tal situação faz com que haja muitos novos profissionais nestas localidades, bem atualizados também em termos tecnológicos, valorizando desta forma a alta tecnologia disponível nos equipamentos da empresa pesquisada. O resultado destas investigações pode levar a empresa a adotar medidas que resultem em maiores satisfações e consequentemente maior fidelização dos clientes. Cabe finalmente ressaltar que o modelo de regressão logística funciona melhor quando a variável resposta tem historicamente uma probabilidade de ocorrência perto de 50% (muita incerteza na classificação dicotômica). Esta evidência fez com que o modelo de regressão logística fosse mais adequado para a previsão da variável excelência no desempenho do que para a variável indicação positiva. REFERÊNCIAS AAKER, D. A.; KUMAR V.; DAY, G. S. Pesquisa de Marketing. 2.ed. São Paulo : Atlas, 2004. ASSOCIAÇÃO BRASILEIRA DA INDÚSTRIA DE ARTIGOS E EQUIPAMENTOS MÉDICOS, ODONTOLÓGICOS, HOSPITALARES E DE LABORATÓRIOS - ABIMO, Dados econômicos, São Paulo, 2011a. Disponível em: <http://www.abimo.org.br/content.php?page=DADOS_ECONOMICOS_PT>. Acesso em: 27 jun. 2011. ASSOCIAÇÃO BRASILEIRA DA INDÚSTRIA DE ARTIGOS E EQUIPAMENTOS MÉDICOS, ODONTOLÓGICOS, HOSPITALARES E DE LABORATÓRIOS - ABIMO, Histórico, São Paulo, 2011b. Disponível em: <http://www.abimo.org.br/content.php?page=HISTORICO_PT>. Acesso em: 27 jun. 2011. 19 VII Jornada de Iniciação Científica - 2011 ASSOCIAÇÃO BRASILEIRA DA INDÚSTRIA DE ARTIGOS E EQUIPAMENTOS MÉDICOS, ODONTOLÓGICOS, HOSPITALARES E DE LABORATÓRIOS - ABIMO, Dados econômicos, São Paulo, 2011c. Disponível em: < http://www.abimo.org.br/content.php?page=DADOS_ECONOMICOS_PT>. Acesso em: 27 jun. 2011. BOLFARINE, H.; BUSSAB, W. O. Elementos de amostragem. ABE-Projeto Fisher, São Paulo: Edgard Blücher, 2005. COSTA, G. G. O. Modelagem da Fidelidade dos Clientes com a Academia em que Praticam Esportes: Uma Aplicação do Modelo de Regressão Logística. In: SEGET 2008 – SIMPÓSIO DE EXCELÊNCIA EM GESTÃO E TECNOLOGIA. Anais..., Resende, 2008. Disponível em: <http://www.aedb.br/seget/artigos2008.php?pag=59>. Acesso em: 15 mar. 2010. COSTA NETO, P. L. O. Estatística. 2 ed. São Paulo, Edgard Blücher, 2002. DIAS FILHO, J. M.; CORRAR, L. Regressão logística. In: CORRAR, L.; PAULO, E.; DIAS FILHO, J. M. (Org.). Análise multivariada para os cursos de Administração, Ciências Contábeis e Economia. São Paulo: Atlas, 2007. FARHAT, C. A. V. Análise de diagnóstico em regressão logística. 2003. Dissertação (Mestrado em Estatística)-Instituto de Matemática e Estatística da Universidade de São Paulo, São Paulo, 2003. FREITAS, A. A. F.; HEINECK, L. F. M. Segmentação de mercado: proposta de uma metodologia de associação entre clientes e produtos no contexto do mercado imobiliário. Associação Nacional de Tecnologia do Ambiente Construído, Porto alegre: 2008. Disponível em: < http://seer.ufrgs.br/ambienteconstruido/article/view/5181>. Acesso em: 20 jun. 2011. GUITIERRES, R. M. V.; ALEXANDRE, P. V. M. Complexo industrial da saúde: uma introdução ao setor de insumos e equipamentos médicos. BNDES Setorial, Rio de Janeiro, 2004. Disponível em: <http://www.bndes.gov.br/SiteBNDES/export/sites/default/bndes_pt/Galerias/Arquivos/conhe cimento/bnset/set1906.pdf>. Acesso em: 28 jun. 2011. HAIR, J. F.; BLACK, W. C.; BABIN, B.; ANDERSON, R. E.; TATHAM, R.. Análise multivariada de dados. 6. ed. Porto Alegre: Bookman, 2009. HOSMER, D. W.; LEMESHOW, S. Applied Logistic Regression. 2 ed. New York: John Wiley & Sons, 2000. KOTLER, P.; KELLER, K. L. Administração de marketing. 12 ed. São Paulo: Pearson Prentice Hall, 2007. MALHOTRA, N. K. Pesquisa de marketing: uma orientação aplicada. 3 ed. Porto Alegre: Bookman, 2004. MANFREDINI, M. A. Características da indústria de equipamentos odontológicos e de produtos para higiene bucal, 2006. Dissertação (Mestrado em Ciências)- Coordenadoria de Controle de Doenças da Secretaria de Estado da Saúde de São Paulo, São Paulo, 2006.Disponível em: <http://www.isaude.sp.gov.br/observatorio/manfredini.pdf>. Acesso em: 28 jun. 2011. MONTGOMERY, D. C.; RUNGER, G. C. Estatística Aplicada e Probabilidades para Engenheiros. 4. ed. Rio de Janeiro: LTC, 2009. 20 Universidade Presbiteriana Mackenzie MOORE, D. S.; McCABE, G. P. Introdução à prática da Estatística. 3 ed. Rio de Janeiro: LTC, 2002. MOWEN, J. C.; MINOR, M. Comportamento do consumidor. São Paulo: Prentice-Hall, 200. PENHA, R. N. Um estudo sobre regressão logística binária. Trabalho de Conclusão de Curso (Graduação em Engenharia de Produção)- Instituto de Engenharia Mecânica, Departamento de Produção da Universidade Federal de Itajubá, Itajubá, 2002. Disponível em: <www.epr.unifei.edu.br/PFG/producao2002/trabalhos/Renata.PDF>. Acesso em: 17 fev. 2011 PIERONI, J. O; REIS, C.; SOUZA, J. O. B. A indústria de equipamentos e materiais médicos, hospitalares e odontológicos: uma proposta de atuação do BNDES. BNDES Setorial, Rio de Janeiro, 2010. Disponível em: <http://www.bndes.gov.br/SiteBNDES/export/sites/default/bndes_pt/Galerias/Arquivos/conhe cimento/bnset/set3105.pdf>. Acesso em: 28 jun. 2011. RODRIGUES, A.; PAULO, E. Introdução à Análise Multivariada. In: CORRAR, L.; PAULO, E.; DIAS FILHO, J. M. (Org.). Análise multivariada para os cursos de Administração, Ciências Contábeis e Economia. São Paulo: Atlas, 2007. ROSA, P. T. M. Modelos de “Credit Scoring”: regressão logística, chaid e real. 2000. Dissertação (Mestrado em Estatística)-Instituto de Matemática e Estatística da Universidade de São Paulo, São Paulo, 2000. SHEPARD, D. Database Marketing. São Paulo: Makron Books, 1993. SIEGEL; S.; CASTELLAN JR., N. J. Estatística não-paramétrica para ciências do comportamento. Métodos de Pesquisa. 2 ed. Porto Alegre: Bookman, 2008. STONE, M.; WOODCOCK, N. Marketing de relacionamento. 4 ed. São Paulo: Littera mundi, 2002). SUZUKI, Marcelo. Modelagem de Churn a partir de registros de solicitações de reparo de clientes. 2010. Dissertação (Mestrado em Administração de Empresas)- Escola de Administração de Empresas da Fundação Getúlio Vargas São Paulo, 2010. TELES, J. O. Clusters e a indústria ligada à área da saúde em Ribeirão Preto, 2002. Dissertação (Mestrado em Economia) – Departamento de Economia da Faculdade de Economia, Administração e Contabilidade da Universidade de São Paulo, São Paulo, 2002. Disponível em: <http://www.teses.usp.br/teses/disponiveis/12/12138/tde-10122002104359/pt-br.php>. Acesso em: 28 jun. 2011. VAVRA, T. G. Marketing de relacionamento (aftermarketing): como usar o database marketing para a retenção de clientes ou consumidores e obter a recompra continuada de seus produtos ou serviços. São Paulo: Atlas, 1993. WHITELEY, R. C. A empresa totalmente voltada para o cliente: do planejamento à ação. 4 ed. Rio de Janeiro: Campus, 1992 Contato: [email protected] e [email protected] 21