Universidade Presbiteriana Mackenzie
ANÁLISE DE
LOGÍSTICA
FIDELIZAÇÃO
DE
CLIENTES
UTILIZANDO
REGRESSÃO
Karina Cavalcante Duarte (IC) e Raquel Cymrot (Orientadora)
Apoio: PIBIC Mackenzie/MackPesquisa
Resumo
A fidelização de clientes tem sido usada como estratégia competitiva para aumentar a lucratividade
de uma companhia. A temática desta pesquisa é analisar o relacionamento dos clientes de uma
empresa, tendo por objetivo identificar pontos que auxiliem uma maior retenção de seus
consumidores. Este estudo propõe a construção de um modelo matemático que preveja a
probabilidade de algumas variáveis importantes na fidelização de clientes baseada em outras
variáveis conhecidas. A ferramenta escolhida para esse fim foi a regressão logística. Primeiramente
esse estudo oferece uma revisão teórica sobre o setor no qual a empresa em questão está inserida,
sobre marketing de relacionamento, fidelização, segmentação de clientes e regressão logística. A
análise descritiva dos dados foi feita com o auxílio do programa Minitab®. Foram realizados alguns
testes de independência entre pares de variáveis pertinentes, bem como propostos dois modelos de
regressão logística que tiveram como resposta duas variáveis importantes que influenciam uma
possível fidelização. Uma delas foi a indicação positiva da empresa por parte dos clientes e a outra foi
a excelência no desempenho de seu produto. No primeiro modelo, percebeu-se que a indicação
positiva está relacionada com a satisfação na instalação e desempenho, enquanto no segundo, a
variável excelência no desempenho apresentou forte ligação com a excelência na assistência técnica,
localização (capital ou interior), região do Brasil e excelência na instalação. O primeiro modelo
apresentou pequena melhora no poder preditivo da variável enquanto no segundo modelo a melhora
foi significativa.
Palavras-chave: fidelização de clientes, regressão logística, segmentação de clientes
Abstract
The customer loyalty has been used as a competitive strategy to increase company profitability. The
theme of this research is to analyze the relationship of a company's customers, aiming to identify
points that help having a greater retention of their customers. This study proposes the construction of
a mathematical model that will provide the probability some important variables in customer loyalty
based on other known variables. The tool chosen for this purpose was logistic regression. Firstly this
study provides a theoretical review about the sector which the company in question is placed, about
relationship marketing, loyalty, customer segmentation and logistic regression. The descriptive
analysis was done with the using the program Minitab®. It was done some independence tests
between pairs of relevant variables as well as proposed two logistic regression models that had
resulted two important variables that can influence a customer loyalty One was a positive indication of
the company by customers and the other was the excellence of the performance of their product. In
the first model, it was noted that the positive indication is related to satisfaction with installation and
performance, while in the second, the variable performance excellence had a strong connection with
excellence in service, location (capital or countryside) region of Brazil and excellence in installation.
The first model showed little improvement in predictive power of the variable while the second model
the improvement was significant.
Key-words: customer loyalty, logistic regression, segmentation of customers
1
VII Jornada de Iniciação Científica - 2011
1
INTRODUÇÃO
A alta competitividade do mercado atual e o fato de empresas oferecerem produtos e
serviços equivalentes tornam os consumidores cada vez mais conscientes do poder que têm
nas mãos, ou seja, eles estão mais atentos em relação às ofertas dos concorrentes e mais
suscetíveis a migrar de uma marca para outra em busca do que consideram melhor para si.
Portanto, atrair novos clientes pode ser uma tarefa fácil para os profissionais de marketing,
porém somente atraí-los não basta, é importante saber mantê-los (VAVRA, 1993).
De acordo com Jeffrey Gitomer (1998 apud KOTLER; KELLER, 2007, pg153), o grande
desafio não é deixar os clientes apenas satisfeitos e sim conquistar clientes fieis. Clientes
satisfeitos e fieis constituem o capital de relacionamento com o cliente da empresa. Por
exemplo, para realizar uma avaliação de quanto vale uma determinada empresa, deve-se
considerar não só os equipamentos, as instalações, a marca, mas também a base de
clientes existente, uma vez que um eventual comprador também pagaria pela listagem dos
clientes com os quais poderia realizar futuros negócios (KOTLER; KELLER, 2007).
Segundo os mesmos autores alguns motivos para fidelizar um cliente são:
a) Reter um cliente é cinco vezes mais barato que conquistar novos.
b) Empresas perdem ao ano em média dez por cento de seus clientes.
c) Ao reduzir em cinco por cento a perda de clientes, uma empresa pode aumentar de
vinte a oitenta e cinco por cento seus lucros.
d) A taxa de lucro por cliente tende a aumentar ao longo do tempo conforme sua
retenção.
Rust, Zahorik e Keiningham (1995 apud SUZUKI, 2010, p.11) justificam que um
relacionamento duradouro com clientes tem relação direta com a lucratividade, pois clientes
antigos são menos sensíveis a preços e consequentemente têm mais capacidade de
produzir fluxo de caixa e lucro. Outro ponto a ser considerado é que esses clientes
costumam divulgar a empresa quando estão satisfeitos. No presente estudo, pretende-se
analisar essa relação com o auxílio da variável Indicação, obtida a partir do questionário
elaborado pela empresa e respondido por alguns de seus clientes.
Também é preciso salientar que a fidelização não pode ser investigada sem se levar em
conta a satisfação do cliente, que por sua vez está ligada a qualidade. Empresas que
atingem alta performance são aquelas que desenvolvem a qualidade conforme o cliente a
define, para assim obter qualidade tanto no produto quanto no serviço prestado
(WHITELEY, 1992).
2
Universidade Presbiteriana Mackenzie
1.1
PROBLEMA DE PESQUISA
O objeto de estudo desta pesquisa é uma empresa de equipamentos odontológicos de
grande porte, localizada no interior de São Paulo. Compreender o consumidor é uma tarefa
que exige um database marketing (base de dados de marketing) bem organizado capaz de
armazenar não apenas as informações dos clientes, mas o histórico de todas as suas
transações. Esta ferramenta deve ser atualizada constantemente para que seja possível
acompanhar periodicamente o comportamento dos consumidores, de modo a prever suas
ações e permitir a empresa antecipar-se quanto às suas necessidades e desejos, realizando
um planejamento corporativo mais preciso (STONE; WOODCOCK, 2002).
Vavra (1993) afirma que os programas de relacionamento se destinam a aumentar o tempo
de vida dos clientes. Quanto maior esse tempo, maiores são as chances do cliente comprar
novamente produtos ou serviços de uma mesma empresa, podendo também se tornar mais
dependente deste fornecedor.
1.2
OBJETIVOS
Com o intuito analisar o relacionamento entre a referida empresa com seus consumidores e
obter maior lealdade por parte destes, o objetivo desse trabalho é construir um modelo de
regressão logística a partir do qual se possa identificar variáveis importantes para a
fidelização de clientes baseado em outras variáveis conhecidas. Desta forma a empresa
poderá melhorar seu dimensionamento de esforços de marketing, bem como seus
processos de venda e pós-venda. A partir da segmentação de clientes e entendimento de
suas necessidades individuais poderá ser obtida uma maior retenção de clientes, levando
assim a uma provável redução de despesas e maximização de lucros.
2
REVISÃO DA LITERATURA
Para a realização desta pesquisa alguns tópicos foram especialmente estudados. Estes
estão apresentados com mais detalhes a seguir:
2.1
O SETOR DE EQUIPAMENTOS ODONTOLÓGICOS NO BRASIL
De acordo com Gutierrez e Alexandre (2004), o setor de equipamentos odontológicos é
caracterizado por equipamentos médicos e insumos cuja aplicação de seus materiais e
3
VII Jornada de Iniciação Científica - 2011
instrumentos se dá na prática odontológica. Seus principais equipamentos são as cadeiras
de dentista, refletores, dosador e misturador de amálgamas, equipos, raios X, mochos etc.
Este setor também é caracterizado por empresas multinacionais desde pequeno e médio
porte, com equipamentos simplificados, até as grandes, que possuem alta tecnologia e
produção sofisticada. Estas últimas, por apresentarem facilidades de compra, como
financiamento, pacotes de produtos e garantias de assistência técnica, possuem certa
vantagem competitiva em relação às nacionais menores e acabam por dominar o mercado
de equipamentos de alta tecnologia (TELES, 2002). A mesma autora ressalta que o poder
de comercialização das indústrias brasileiras e estrangeiras e o diferencial tecnológico
atraem mais compradores como em licitações públicas e pacotes fechados.
Existe grande dinamismo tecnológico e busca por inovação neste tipo de indústria,
envolvendo então diversos outros setores, como enfatizado por Furtado ([199-] apud
TELES, 2002, p. 35), o de informática, mecânica de precisão, setor químico, eletrônica
digital etc. Ele também destaca que é uma prática habitual das grandes empresas se
associarem às empresas menores em busca do aumento de sua produção e melhor política
de comercialização. Contudo tal prática ocorre, principalmente, desde que as indústrias
menores possuam uma tecnologia que agregue às maiores.
Desde 1999 a indústria brasileira de equipamentos odontológicos, laboratórios, médicohospitalares e insumos têm mantido bom ritmo de expansão. Em 2007 obteve faturamento
de U$ 3,74 bilhões e gerou 31,3 mil postos de trabalho, o que representa, com base em
2006, um crescimento de 21% (ASSOCIAÇÃO BRASILEIRA DA INDÚSTRIA DE ARTIGOS
E
EQUIPAMENTOS
MÉDICOS,
ODONTOLÓGICOS,
HOSPITALARES
E
DE
LABORATÓRIOS, 2011b).
Dentro da indústria de equipamentos e materiais médicos, hospitalares e odontológicos, no
Brasil, o setor de odontologia é o mais competitivo. Por haver uma procura elevada por
serviços dessa área, ocorreu um aumento da oferta por parte dos profissionais do
segmento, favorecendo assim o seu desenvolvimento. Por exemplo, em 2009, existiam no
país aproximadamente 200 mil dentistas, o que conferiu ao setor de equipamentos e
insumos odontológicos o segundo lugar do mundo, perdendo apenas para os Estados
Unidos (PIERONI; REIS; SOUZA, 2010).
No Brasil, segundo Manfredini (2006), tal indústria possui algumas características que as
diferenciam das demais, dentre elas se sobressaem: a maciça participação das exportações
sobre as importações, o volume considerável de países para onde os produtos são
exportados e a produção autossuficiente no país.
4
Universidade Presbiteriana Mackenzie
Nas regiões Sul e Sudeste está presente a maior concentração das indústrias do setor no
país. Na região Sul, principalmente no Rio Grande do Sul e Paraná, localiza-se 16,7% das
empresas do setor. Só em São Paulo, na região Sudeste, há 67% das empresas, sendo
45% na Grande São Paulo (ASSOCIAÇÃO BRASILEIRA DA INDÚSTRIA DE ARTIGOS E
EQUIPAMENTOS
MÉDICOS,
ODONTOLÓGICOS,
HOSPITALARES
E
DE
LABORATÓRIOS, 2011a).
No Brasil, de acordo com dados de 2009, sabe-se que mais de 90% do capital é de origem
nacional. Dentre os compradores desses produtos, 68,6% são do setor privado, 21,5% do
público, 8,8% provém de exportações, enquanto 1% do total se distribui entre leasing,
contratos exclusivos de fornecimento de insumos e serviços, etc. ASSOCIAÇÃO
BRASILEIRA
DA
INDÚSTRIA
DE
ARTIGOS
E
EQUIPAMENTOS
MÉDICOS,
ODONTOLÓGICOS, HOSPITALARES E DE LABORATÓRIOS, 2011c).
Na indústria internacional pode-se dizer que entre 1989 e 1998, o valor das importações
cresceu 7,7 vezes, o que provocou um aumento de US$ 1.597.205 para US$ 12.300.66. No
subgrupo de equipamentos odontológicos, as exportações foram muito dinâmicas, cobrindo
o aumento das importações, sendo que o setor de aparelhos odontológicos (MANFREDINI,
2006).
2.2
SEGMENTAÇÃO DO MERCADO CONSUMIDOR
De acordo com Shepard (1993) segmentar clientes significa alocar em pequenos grupos ou
conglomerados
indivíduos
que
tenham
características,
necessidades
e
atitudes
semelhantes. Essa tarefa é crucial para se criar modelos de previsão, isso porque é
esperado que clientes pertencentes ao mesmo conglomerado tenham comportamentos
semelhantes. Além disso, ao conhecer o segmento ao qual determinado cliente pertence, a
empresa poderá tratá-lo de forma diferenciada de acordo com as características desse
segmento em relação ao produto ou serviço oferecido.
A segmentação de mercado também tem a função de auxiliar o entendimento, a composição
e as necessidades dos segmentos individuais de mercado.
Porém antes de se coletar informações dos clientes é necessário estabelecer os objetivos
que se pretende alcançar, para que seja possível desenvolver instrumentos de pesquisa
adequados às respostas desejadas.
Mowen e Minor (2006) definem a segmentação de mercado como um mercado dividido em
subconjuntos de clientes com equivalentes necessidades e vontades individuais, no qual
cada um deles pode ser atingido com o auxílio de um mix de marketing diferente, ou seja,
5
VII Jornada de Iniciação Científica - 2011
esses segmentos devem permitir ao consumidor acesso ao preço, à praça (local de venda),
ao produto e promoção (comunicação, publicidade e propaganda). Segundo os mesmos
autores esses segmentos devem ser capazes de efetuar medidas demográficas, de análise
psicográfica, de atitudes e personalidade, a partir das quais se possam analisar as
características e vontades do segmento. Além disso, eles devem ser substanciais em
tamanho e receita a fim de que sejam capazes de obter vendas satisfatórias.
Apesar da grande vantagem de se utilizar a segmentação na coleta de dados, algumas
empresas encontram dificuldades ao aplicar esse conceito na prática, principalmente no que
se trata de escolher as variáveis mais adequadas para a separação e caracterização dos
segmentos e escolha de qual técnica utilizar para definir os grupos (FREITAS; HEINECK,
2008).
Um sistema de coleta de dados pode ser classificado basicamente de duas formas: dados
de fonte primária e secundária. São considerados dados primários aqueles que são obtidos
diretamente da fonte, ou seja, por meio de interações diretas com as pessoas ou objetos de
pesquisa (SHEPARD,1993). De acordo com Malhotra (2004) os dados primários têm por
objetivo solucionar problemas imediatos e que ajudem diretamente na tomada de decisão.
Por exigir levantamentos, experimentos, dentre outros, sua grande desvantagem é se tratar
de uma pesquisa longa, dispendiosa e cara. Em muitos casos decide-se usar dados de
fontes secundárias, que são dados obtidos de outras maneiras que não por meio do próprio
indivíduo. Eles podem ser conseguidos rapidamente e com custo muito baixo porque se
costuma usar dados já coletados em outra pesquisa que tinha outra finalidade. Contudo,
esse tipo de coleta envolve uma série de riscos.
Segundo Aaker, Kumar e Day (2004), para evitar imprecisões ao utilizar esses dados devese levar em consideração a origem e reputação da fonte, se há interesse de determinado
grupo que deseja ser favorecido pela pesquisa, se a metodologia para coleta era adequada,
se os dados são obsoletos e se a fonte pode ser usada como base de comparação para a
pesquisa atual, ou seja, verificar se há pretensão de chegar ao mesmo resultado utilizando
métodos diferentes. Além disso, alguns dados são difíceis de utilizar, pois podem ter sido
agrupados de maneira pouco compreensível.
Nesta pesquisa foram utilizados dados primários obtidos a partir do banco de dados da
empresa estudada.
2.3
A REGRESSÃO LOGÍSTICA
Em situações nas quais se deseja separar dois grupos distintos ou alocar um novo elemento
em quaisquer desses grupos, duas técnicas estatísticas são recomendadas, a Análise
6
Universidade Presbiteriana Mackenzie
Discriminante e a Regressão Logística. Ambas podem ser descritas como métodos que
verificam a existência de dependência estatística de uma variável denominada dependente
(prevista ou explicada), em relação a uma ou mais variáveis independentes (explanatórias
ou preditoras) (HAIR et al., 2009; RODRIGUES; PAULO, 2007). A aplicação da análise
discriminante envolve muitas suposições às variáveis independentes, dentre elas ter
normalidade e matrizes de variância e covariância iguais entre ambos os grupos de
classificação. O modelo logístico costuma ser mais utilizado, pois além de não exigir todas
estas suposições, permite uma interpretação direta de seus coeficientes e, assim como na
regressão múltipla, consegue introduzir efeitos não lineares (HAIR et al., 2009). Outro
aspecto ressaltado pelos mesmos autores indica que o uso da análise discriminante pode
não ser tão favorável, pois ela possui um score (dispositivo discriminatório) classificado em
ordem crescente, o que não indica nenhum método probabilístico.
A regressão logística é um caso particular de regressão na qual a variável resposta Y é
dicotômica, ou seja, pode assumir apenas dois resultados mutuamente excludentes, como
por exemplo, bom ou mal, sucesso ou fracasso, aceitar ou rejeitar, dentre outros (HAIR et
al., 2009).
Na regressão logística, em geral, atribui-se o código um ao resultado de interesse,
denominado sucesso, que representaria a presença de uma particular característica e zero
ao evento complementar, denominado fracasso. A regressão logística é utilizada quando o
objetivo é estabelecer uma relação entre uma variável resposta dicotômica e uma ou mais
variáveis explicativas as quais podem ser tanto qualitativas como quantitativas. Quando de
interesse de uma aplicação, a regressão logística pode ser utilizada mesmo quando a
resposta não for originalmente binária, bastando para isto dicotomizar a variável resposta
(FARHAT, 2003). A representação matemática de uma regressão linear múltipla é dada por:
Y = β0 + β1x1 + β2x2 + ... + βnxn + ε
(1)
, sendo Y a variável dependente; X1, X2, ..., Xn, as variáveis independentes; β0, β1, β2, ... , βn,
os coeficientes das variáveis independentes e ε o erro ou resíduo da regressão.
Segundo Hosmer e Lemeshow (2000), os métodos empregados na regressão logística
seguem os mesmos princípios gerais usados na regressão linear, apesar de apresentar
respostas e suposições de modelo diferentes. De maneira mais ampla, a regressão logística
atribui à variável resposta um intervalo compreendido entre zero e um, que pode ser
interpretado como a probabilidade de ocorrência de determinado evento. Baseado na regra
de decisão, resultados superiores a 0,5 são assumidos como possível sucesso e inferiores
como possível fracasso. (DIAS FILHO; CORRAR, 2007).
7
VII Jornada de Iniciação Científica - 2011
Tal relação se deve à transformação da variável resposta em razão de chance
(probabilidade) e a uma transformação logarítmica, como apresentado a seguir. Seja g(xi)
uma função linear simples, isto é:
g(xi) = β0 + β1xi
(2)
A probabilidade de a variável resposta ser classificada como sucesso dado que o valor da
variável explicativa foi igual a xi é dada por (FARHAT, 2003):
e β0 + β1xi
π ( xi ) = P(Y = 1 | xi ) =
1 + e β0 + β1xi
(3)
No modelo de regressão logística simples ajusta-se uma função da variável resposta, g(x).
As estimações dos parâmetros β0 e β1 são realizadas utilizando-se a função de máxima
verossimilhança.
Utiliza-se o modelo de regressão logística múltipla quando houver mais de uma variável
explicativa (qualitativas ou quantitativas). Neste caso tem-se:
g(xi)
=
β0
+
β1xi1
+
β2xi2
+
...
+
βpxip
(4)
As estimativas dos parâmetros são obtidas por métodos iterativos (ROSA, 2000). É
conveniente o uso de pacotes estatísticos, como software Minitab®, para a realização do
cálculo destas estimativas.
Na regressão logística os resultados inferenciais são assintóticos, enquanto na regressão
normal linear tais resultados são exatos. Tem-se também que devido à variável resposta ser
dicotômica, os resíduos não têm distribuição Normal, nem variância constante (FARHAT,
2003).
Uma vez estabelecido o modelo de regressão logística é necessário o teste da significância
dos parâmetros bem como do ajuste do modelo. Dentre alguns possíveis modelos deve-se
escolher o modelo mais simples possível dado que tenha um bom ajuste (princípio da
parcimônia).
Após a determinação do modelo de regressão logística faz-se necessário realizar alguns
testes que assegurem sua validade. Estes testes permitem reconhecer tanto as variáveis
que influenciam diretamente a estimação dos parâmetros da regressão quanto àquelas que
não se ajustam bem e, portanto, devem ser descartadas do modelo final.
8
Universidade Presbiteriana Mackenzie
O nível descritivo do teste, ou valor P, indica a probabilidade de um valor no mínimo tão
extremo quanto o nível de significância do teste que acarreta a rejeição da hipótese nula a
partir dos dados obtidos. No caso do valor P ser, no máximo, igual ao nível de significância
do teste, a hipótese nula será rejeitada (MONTGOMERY; RUNGER, 2003).
A estimativa dos coeficientes da regressão logística pode ser interpretada a partir da razão
entre a probabilidade de sucesso e a probabilidade de fracasso, ou seja, a razão de chance
de ocorrência de um evento, conhecida também como “odds ratio” (MOORE; McCABE,
2002). Para conseguir estimar a razão de chance basta fazer o exponencial da estimativa de
cada coeficiente.
Para fins de validação de modelo são desenvolvidas algumas estatísticas, como a de
Pearson, Deviance e Hosmer-Lemeshow. O teste de Pearson analisa as observações e
mede o seu poder de adequação do modelo. As que não apresentarem bom ajuste são
aquelas que possuem valor de Pearson alto. Já o teste de Hosmer-Lemeshow compara a as
frequências observadas e esperadas para verificar se o modelo apresentou bom ajuste.
Neste caso ele consegue associar os dados às suas respectivas probabilidades estimadas
em ordem crescente (da mais baixa a mais alta), sendo posteriormente feito um teste
Quiquadrado para comprovar se as frequências observadas estão próximas das frequências
esperadas. A estatística de Deviance é calculada em função da soma de quadrados dos
resíduos do modelo logístico. Tal estatística também tem distribuição Quiquadrado
(HOSMER, LEMESHOW; 2000). Nos três testes são desejáveis valores baixos de
Quiquadrado que resultem em nível descritivo superior a 5%.
As estatísticas de Somers’D, Goodman-Kruskal Gamma, e Kendall’s Tau-a são testes
correlação e resumem a tabela dos pares concordantes e discordantes. Estas medidas
devem estar compreendidas no intervalo entre zero e um, nos quais os valores mais altos
indicam que o modelo tem melhor poder de previsão (PENHA, 2002).
3
METODOLOGIA
A pesquisa foi submetida e aprovada pelo Comitê de Ética em Pesquisa da Universidade
Presbiteriana Mackenzie. Para a obtenção dos dados pertinentes à empresa em questão, o
responsável desta instituição pelas informações concedidas leu a Carta de Informação à
Instituição e concordou em participar da pesquisa, tendo assinado o Termo de
Consentimento Livre e Esclarecido e enviado a seguir por e-mail os dados solicitados que
estavam disponíveis. Cabe aqui salientar que não foi disponibilizado pela empresa dados a
respeito da fidelização de clientes (base de dados com clientes ativos e inativos) e sim
9
VII Jornada de Iniciação Científica - 2011
dados de pesquisa telefônica realizada rotineiramente pelo Serviço de Atendimento ao
Consumidor (SAC) desta empresa.
Desta pesquisa foram disponibilizadas as variáveis: cidade de localização do cliente, como o
cliente avalia a instalação dos produtos (pós-venda), como este avalia o desempenho dos
produtos (pós-venda), como este avalia a assistência técnica (pós-venda) e se este cliente
indicaria a empresa a alguém. Para as quatro últimas variáveis os clientes atribuíam notas
que variavam entre cinco (5) e zero (0), sendo tais classificações respectivamente iguais a
excelente, muito bom, bom, razoável, ruim e péssimo. Cabe salientar que tal instrumento de
pesquisa foi desenvolvido pela empresa e por esta é aplicado regularmente. A variável
cidade de localização do cliente foi, para a realização da análise estatística, categorizada de
duas formas, a saber: região do Brasil na qual o cliente se localiza (Norte, Nordeste, CentroOeste, Sudeste e Sul) e localização do cliente (interior ou capital).
A amostragem utilizada foi a casual simples, sem reposição, coletada pela empresa a partir
de seu banco de dados de clientes, sendo a amostra resultante a de clientes que
responderam à pesquisa de satisfação entre os meses de janeiro a junho de 2011. Na
amostra casual simples todos os elementos da população têm chances iguais de pertencer
à amostra e tal amostragem garante que as inferências sejam válidas (BOLFARINE,
BUSSAB, 2005).
A amostra disponibilizada continha as respostas de 1492 clientes. Esta amostra foi dividida
em duas partes, a primeira foi utilizada para a construção do modelo logístico, na qual havia
926 dados provenientes dos meses de janeiro, fevereiro, março e abril. A segunda parte,
com 566 dados coletados em maio e junho, foi usada para a validação do modelo.
Foram realizadas análises descritivas dos dados por meio de construção de tabelas e
realizados testes Quiquadrado de independência entre alguns pares de variáveis aleatórias.
O teste Quiquadrado é utilizado quando se deseja saber se dois grupos diferem em relação
a alguma particularidade qualquer que seja (SIEGEL; CASTELLAN, 2008, p. 134), isto é, se
há alguma medida de discrepância entre as frequências observadas e esperadas. Tal
estatística é expressa por:
2
r
c
χ =∑
∑
i =1
j =1
(o
− eij )
2
ij
eij
r
c
=∑
∑
i =1
j =1
oij2
eij
−n
(5)
, com o valor esperado eij definido como o produto das marginais da observação oij, dividido
pelo tamanho da amostra n. As variáveis são apresentadas em uma tabela de contingência
de modo que uma variável está disposta nas linhas e outra nas colunas. Obtêm-se então
uma tabela de dupla entrada (SIEGEL; CASTELLAN, 2008).
10
Universidade Presbiteriana Mackenzie
Adotando r como o número de níveis da primeira frequência e c o número de níveis da
segunda, o grau de liberdade será igual a (r-1) (c-1) e o valor do Quiquadrado será
encontrado a partir da equação 5.
Caso a tabela de contingência não seja 2 x 2, a prova que Quiquadrado somente pode ser
aplicada se o número de células com freqüência inferior a 5 for menor que 20% do total de
células e se nenhuma célula tiver freqüência esperada inferior a 1. Se essas condições não
forem satisfeitas pelos dados na forma em que foram coletados originalmente, deve-se
combinar categorias de modo a aumentar as freqüências esperadas nas diversas células.
Se em uma tabela 2 x 2 houver alguma frequência esperada inferior a 5, o teste
Quiquadrado não poderá ser usado. Neste caso é aconselhável que o pesquisador use o
teste não-paramétrico exato de Fisher (COSTA NETO, 2002).
Foram construídos dois modelos de regressão logística, um tendo como variável resposta a
indicação positiva da empresa (notas 3, 4 ou 5) e outra tendo como variável resposta a
excelência no desempenho (nota 5).
Foram testados diversos modelos de regressão logística e escolhidos os modelos que se
mostraram mais adequados. Após a escolha dos modelos estes foram utilizados no segundo
conjunto de dados e medida a sua respectivas probabilidades de acerto.
O nível de significância adotado foi 0,05 e foram construídos intervalos com 95% de
confiança.
Os dados foram analisados com o auxílio do programa Minitab®.
4
RESULTADOS E DISCUSSÃO
As Tabelas 1, 2 e 3 apresentam as variáveis de caracterização dos clientes referentes à
região, ao mês e localização dentre os 926 indivíduos da amostra utilizada para construção
do modelo.
Tabela 1: Região, frequência e percentual.
Região
Norte
Nordeste
Centro-Oeste
Sudeste
Sul
Frequência
18
260
60
434
154
Percentual
1,94
28,08
6,48
46,87
16,63
11
VII Jornada de Iniciação Científica - 2011
Tabela 2: Mês, frequência e percentual.
Mês
Janeiro
Fevereiro
Março
Abril
Frequência
311
260
212
143
Percentual
33,59
28,08
22,89
15,44
Tabela 3: Localização, frequência e percentual.
Localização
Interior
Capital
Frequência
560
366
Percentual
60,48
39,52
Nas Tabelas 4, 5, 6 e 7 estão presentes as variáveis de satisfação com: instalação,
desempenho, assistência técnica e indicação da marca.
Tabela 4: Satisfação com a instalação, frequência e percentual.
Instalação
Péssimo
Ruim
Razoável
Bom
Muito Bom
Excelente
Frequência
0
6
17
213
153
537
Percentual
0,00
0,65
1,84
23,00
16,52
57,99
Tabela 5: Satisfação com o desempenho, frequência e percentual.
Desempenho
Péssimo
Ruim
Razoável
Bom
Muito Bom
Excelente
Frequência
2
7
27
230
187
473
Percentual
0,22
0,76
2,92
24,84
20,19
51,08
Tabela 6: Satisfação com a assistência, frequência e percentual.
Assistência
Péssimo
Ruim
Razoável
Bom
Muito Bom
Excelente
Frequência
0
4
24
242
150
506
Percentual
0,00
0,43
2,59
26,13
16,20
54,64
12
Universidade Presbiteriana Mackenzie
Tabela 7: Satisfação com a indicação, frequência e percentual.
Indicação
Péssimo
Ruim
Razoável
Bom
Muito Bom
Excelente
Frequência
19
0
0
0
1
906
Percentual
2,05
0,00
0,00
0,00
0,11
97,84
Algumas variáveis binárias auxiliares foram criadas com o intuito de se obter mais opções
para testar modelos de regressão logística para variáveis que auxiliem na previsão de
fidelização de clientes. No caso das variáveis de satisfação foram criados dois grupos, o de
Excelência e o de Positividade. No grupo de Excelência, as variáveis Instalação,
Desempenho e Assistência foram dicotomizadas de modo que os elementos que obtiveram
nota excelente assumiram o valor um e os demais o valor zero. Já para a Positividade foram
dicotomizadas as mesmas variáveis considerando como um os elementos que obtiveram
notas positivas (excelente, muito bom e bom), ou seja, as notas cinco (5), quatro (4) e três
(3), enquanto às demais notas foi atribuído o valor zero. A variável Região também foi
transformada em binária. Assim as regiões Sul e Sudeste adotaram o valor um e as regiões
Norte, Nordeste e Centro-Oeste o valor zero. A Tabela 8 apresenta estas variáveis auxiliares
com suas respectivas freqüências e porcentagens de ocorrência do valor um.
Tabela 8: Variáveis auxiliares, percentual dos valores 1 e frequências dos valores 1 e 0.
VARIÁVEIS
Excelência na Instalação
Excelência no Desempenho
Excelência na Assistência
Excelência na Indicação
Instalação positiva
Desempenho positivo
Assistência positiva
Indicação positiva
Região Agrupada
Percentual de 1
57,99
51,08
54,64
97,84
97,52
96,11
96,98
97,95
63,50
Frequência de 1
537
473
506
906
903
890
898
907
588
Frequência de 0
389
453
420
20
23
36
28
19
338
O teste Quiquadrado foi aplicado aos pares de variáveis pertinentes ao estudo. A tabela 9
apresenta os resultados e conclusões obtidas.
Ao nível de significância de 5%, pode-se verificar que houve independência entre todos os
pares de variáveis aleatórias analisados, com exceção das variáveis localização e instalação
positiva. Neste caso há indicação de que clientes de cidades que são capitais de seus
estados se mostraram proporcionalmente mais satisfeitos com relação à instalação dos
13
VII Jornada de Iniciação Científica - 2011
equipamentos adquiridos, tendo escolhido proporcionalmente mais as opções de satisfação
excelente, muito bom e bom.
Cabe salientar que, ao nível de significância de 5%, houve independência entre região
agrupada na qual se situa o cliente e escolher a opção de desempenho positivo. Porém
como o nível descritivo deste teste foi próximo a 5% (P = 0,086), há indicação de tendência
de que os clientes das regiões Sul e Sudeste escolham proporcionalmente mais a opção de
desempenho positivo que os das demais regiões. Aconselha-se a realização de novas
pesquisas para confirmar ou não tal tendência.
Tabela 9: teste Quiquadrado, níveis descritivos e conclusões
VARIÁVEIS DE INTERE SSE
Valo r P
Localização X Instalação Positiva
0,009
Co nclusão
Rejeita-se H 0
Localização X Assistência Positiva
0,979
Não se rejeita H 0
Localização X Indicação Positiva
0,809
Não se rejeita H 0
Localização X Desempenho Positivo
0,937
Não se rejeita H 0
Região agrupada X Instalação Positiva
0,862
Não se rejeita H 0
Região agrupada X Assistência Positiva
0,627
Não se rejeita H 0
Região agrupada X Indicação Positiva
0,320
Não se rejeita H 0
Região agrupada X Desempenho Positivo
0,086
Não se rejeita H 0
Localização X Excelência na instalação
0,433
Não se rejeita H 0
Localização X Excelência na assistência
0,590
Não se rejeita H 0
Localização X Excelência na indicação
0,676
Não se rejeita H 0
Localização X Excelência no desem penho
0,783
Não se rejeita H 0
Região agrupada X Excelência na instalação
0,129
Não se rejeita H 0
Região agrupada X Excelência na assistência
0,255
Não se rejeita H 0
Região agrupada X Excelência na indicação
0,205
Não se rejeita H 0
Região agrupada X Excelência no desem penho
0,158
Não se rejeita H 0
Para que o modelo de regressão logística seja aceito, exige-se pelo menos um dos
coeficientes seja diferente de zero, que testes de ajuste de modelo tenham seu nível
descritivo, ou valor P, maior que o nível de significância de 0,05, indicando seu ajuste. Deve
haver também um alto índice de concordância interna do modelo e uma boa capacidade de
previsão.
Dois modelos de regressão logística foram construídos, o primeiro para prever a indicação
positiva da empresa e o segundo para prever a excelência no desempenho. Vários
possíveis modelos foram testados e a seguir são descritos os modelos que apresentaram
melhores resultados.
O primeiro modelo encontrado foi:
Yindicação positiva = – 5,44133 + 0,630572 Xinstalação + 2,43750 Xdesempenho
14
Universidade Presbiteriana Mackenzie
Tanto a variável Xinstalação como a variável Xdesempenho valem 0, 1, 2, 3, 4 ou 5 representando
respectivamente a satisfação com classificação respectivamente igual a péssimo, ruim,
razoável, bom, muito bom e excelente.
A Tabela 10 apresenta os resultados do modelo desta regressão logística binária:
Tabela 10 – Coeficientes, erro padrão do coeficiente, valor Z, nível descritivo P, razão de chances, e intervalo
com 95% de confiança para a razão de chances.
Intervalo com 95% de confiança
Coeficiente
Erro padrão do
coeficiente
Z
P
constante
-5,44133
1,32174
-4,12
0,000
Instalação
0,630572
0,344982
1,83
0,068
1,88
0,96
3,69
2,4375
0,433805
5,62
0,000
11,44
4,89
26,78
Preditor
Desempenho
Razão de
chances
Limite inferior
Limite
superior
Valores longe de um para a razão de chances indicam maior associação entre a ocorrência
do fator e a ocorrência da variável resposta. Para a variável satisfação com a instalação,
uma razão de chances igual a 1,88 indica que há um aumento de 88% na chance de
sucesso da variável resposta (indicação positiva) quando a variável regressora, satisfação
com a instalação, se acrescer em uma unidade (melhora em um nível na satisfação). Já
para a variável satisfação com o desempenho, uma razão de chances igual a 11,44 indica
que há um aumento de 1044% na chance de sucesso da variável resposta (indicação
positiva) quando a variável regressora, satisfação com o desempenho, se acrescer em uma
unidade (melhora em um nível na satisfação).
A probabilidade de um cliente indicar positivamente a empresa é dada por:
P(indicação positiva ) =
eY
1 + eY
(6)
Se esta probabilidade for superior a 0,50, o indivíduo será classificado como cliente que
provavelmente irá indicar positivamente a empresa. Por exemplo, para um indivíduo com
satisfação boa na instalação e satisfação muito boa no desempenho:
Yindicação
positiva
= –5,44133 + 0,630572 x 3 + 2,43750 x 4 = 6,2004. Tem-se então que
P(indicação positiva) = 0,9980 > 0,5, logo este cliente será classificado como um cliente que
indicará positivamente a empresa.
A estatística G testa a hipótese de que todos os coeficientes são iguais a zero contra a
hipótese de que ao menos um deles é diferente de zero. O software forneceu valor G =
100,246, como seu respectivo nível descritivo P igual a 0,000, portanto pode-se afirmar que
há evidências de que pelo menos um dos coeficientes é diferente de zero.
15
VII Jornada de Iniciação Científica - 2011
O modelo foi submetido aos três diferentes testes de adequação. O método de Pearson
apresentou valor-P = 0,320, o método de Deviance, um valor-P = 0,425 e o método de
Hosmer-Lemeshow, um valor-P = 0,581. Portanto, como todos os indicadores foram maiores
que 0,05, concluindo-se, ao nível de significância de 5%, que o modelo foi bem ajustado.
Foram calculadas várias medidas de associação entre a variável resposta e as
probabilidades de previsão.
Para os dados da amostra usada na escolha do modelo há 907 indivíduos que indicam
positivamente a marca contra 19 indivíduos que indicam de forma regular ou negativa.
Podem-se formar assim 907 x 19 = 17233 pares com valores de respostas diferentes. Com
base no modelo, um par é considerado concordante se o indivíduo que indica a marca de
maneira positiva tem probabilidade maior de ser classificado como tal do que o indivíduo
que indica a marca de maneira regular ou negativa. A porcentagem de concordância do
modelo foi de 95,5%.
Também foram feitos os cálculos das estatísticas de Somers' D, com valor igual a 0,93, de
Goodman-Kruskal, com valor igual a 0,96 e de Kendall's Tau-a, com valor 0,04. Estas
estatísticas resumem as tabelas de concordância e discordância dos pares de observações
e devem estar compreendidas entre 0 e 1. Valores altos indicam que o modelo tem uma boa
capacidade de previsão. Como somente o teste de Kendall’s Tau-a apresentou índice baixo
contra outros dois índices muito altos, o modelo foi considerado bom.
A amostra de teste foi utilizada para calcular a probabilidade de indicação positiva nos 566
indivíduos restantes. Como era conhecida a verdadeira situação quanto à indicação positiva,
pode-se calcular a porcentagem de acerto que foi igual a 98,23%. Sem realizar nenhuma
estatística a probabilidade de indicação positiva era de 97,95%, faltando 2,05% para
completar os 100%. O novo modelo explicou a mais 0,28%, o que corresponde a 13,66% do
que faltava explicar.
O segundo modelo encontrado foi:
Yexcelência no desempenho = –5,04820 + 3,39812 Xexcelência na instalação + 4,65198 Xexcelência na assistencia +
0,300791 Xlocalização - 0,158439 Xregião agrupada
Tanto a variável Xexcelência na instalação como a variável Xexcelência na assistencia valem 1 se a satisfação
foi classificada como excelente e zero caso contrário. A variável Xlocalização vale 1 se o cliente
se localiza na capital e zero se este se localiza no interior. Já a variável Xregião agrupada vale um
se o cliente estiver na região Sul ou Sudeste e zero se tiver na região Norte, Nordeste ou
Centro-Oeste.
A Tabela 11 apresenta os resultados do modelo desta regressão logística binária:
16
Universidade Presbiteriana Mackenzie
Tabela 11 – Coeficientes, erro padrão do coeficiente, valor Z, nível descritivo P, razão de chances, e intervalo
com 95% de confiança para a razão de chances..
Intervalo com 95% de confiança
Coeficiente
Erro padrão do
coeficiente
Z
P
constante
-5,048200
0,472911
-10,67
0,000
Exc na Instal.
3,398120
0,336708
10,09
Exc na Assist.
4,651980
0,342700
Localização
0,300791
0,316863
Região agrup.
-0,158439
0,315336
Preditor
Razão de
chances
Limite inferior
Limite
superior
0,000
29,91
15,46
57,86
13,57
0,000
104,79
53,53
205,13
0,95
0,342
1,35
0,73
2,51
-0,50
0,615
0,85
0,46
1,58
Para a variável excelência na instalação, uma razão de chances igual a 29,91 indica que há
um aumento de 2891% na chance de sucesso da variável resposta (excelência no
desempenho) quando a variável regressora, a satisfação com a instalação for classificada
como excelente. De forma análoga a razão de chances igual a 104,79 indica que há um
aumento de 10379% na chance de sucesso da variável resposta (excelência no
desempenho) quando a variável regressora, a satisfação com a assistência for classificada
como excelente. Já a variável localização apresenta uma razão de chances igual a 1,35
indicando que há um aumento de 35% na chance de sucesso da variável resposta
(excelência no desempenho) quando a variável regressora, localização, for uma capital. Por
último, a variável região agrupada tem uma razão de chances igual a 0,85 que indica que há
uma diminuição de 15% na chance de sucesso da variável resposta (excelência no
desempenho) quando a variável regressora, região agrupada for a região Sul ou Sudeste.
Conforme a equação 6, se por exemplo, o cliente tiver satisfação excelente na instalação,
muito boa na assistência e se localizar no interior da região Sul, tem-se:
Yexcelência no desempenho = –5,04820 + 3,39812 x 1 + 4,65198 x 0 + 0,300791 x 0 - 0,158439 x 1 =
– 1,8085. Tem-se então que P(excelência no desempenho) = 0,1408 < 0,5, logo este cliente
será classificado como um cliente que não classificará como excelente o desempenho.
A estatística G foi igual a 954,322, com valor-P igual a 0,000, ou seja, pode-se afirmar, ao
nível de significância de 5%, de que há evidências de que pelo menos um dos coeficientes é
diferente de zero.
Assim como no modelo anterior, esse modelo foi submetido aos testes de adequação. O
método de Pearson apresentou valor-P igual a 0,001, no método de Deviance o valor-P foi
igual a p = 0,004 e no de Hosmer-Lemeshow, o valor-P foi igual a 0,117. Este resultado não
é o ideal, mas como pelo menos sob um dos critérios (teste de Hosmer-Lemeshow) o
modelo foi adequado, prosseguiu-se a análise.
Para os dados da amostra usada na escolha do modelo há 473 indivíduos que consideram
excelente o desempenho contra 453 indivíduos que consideraram o desempenho muito
17
VII Jornada de Iniciação Científica - 2011
bom, bom, regular, ruim ou péssimo. Podem-se formar assim 473 x 453 = 214269 pares
com valores de respostas diferentes. Um par é considerado concordante se o indivíduo que
considera o desempenho excelente tem probabilidade maior de ser classificado como tal do
que o indivíduo que atribuiu nota diferente de 5 ao desempenho. A porcentagem de
concordância do modelo foi de 96,1%.
Também foram feitos os cálculos das estatísticas de Somers' D, com valor igual a 0,94, de
Goodman-Kruskal, com valor igual a 0,96 e de Kendall's Tau-a, com valor 0,47. Todos estes
valores foram favoráveis, atestando a boa condição de previsão do modelo.
A amostra de teste foi utilizada para calcular a probabilidade de indicação positiva nos 566
indivíduos restantes. Sendo assim, a porcentagem de acerto que foi igual a 92,23%. Sem
realizar nenhuma estatística a probabilidade de desempenho excelente era de 51,08%,
faltando 48,92% para completar os 100%. O novo modelo explicou a mais 41,15%, o que
corresponde a 84,12% do que faltava explicar.
5
CONCLUSÃO
O instrumento de pesquisa de satisfação dos clientes foi desenvolvido pela empresa
pesquisada. Este apresenta problemas metodológicos, uma vez que sua escala não é
equilibrada, variando entre péssimo, ruim, razoável, bom, muito bom e excelente. Tal
situação pode levar a algum vício, levando a crer que a satisfação seja maior que a real. A
empresa foi alertada sobre esses problemas e se mostrou favorável a rever tal escala,
incluindo a opção muito ruim, tornando desta forma a escala equilibrada.
Outro fator que também pode levar a um vício é o fato da pesquisa realizada pelo SAC ser
feita por telefone, podendo causar constrangimento a quem responde ao instrumento de
pesquisa. Foi sugerido que em um mês, fosse sorteado aleatoriamente parte dos clientes
para continuar a responder a pesquisa por telefone e parte para respondê-la por meio de um
questionário anônimo via Internet, equivalente ao utilizado usualmente, construído e
disponibilizado por meio, por exemplo, da ferramenta Google Docs. Os resultados seriam
então comparados para detectar se há ou não alguma diferença entre eles.
Cabe salientar, entretanto, que é reconhecida pelo mercado a grande satisfação dos clientes
desta empresa. Para atingir tal característica deve ter contribuído o fato desta empresa ter
seus processos de fabricação certificados por órgãos competentes de qualidade (EN ISO
9001, BPF-Boas práticas de fabricação, EN ISO 13485 dentre outros).
A indicação positiva da empresa esteve influenciada por uma boa satisfação tanto com a
instalação quanto com o desempenho do equipamento adquirido, tendo o desempenho um
18
Universidade Presbiteriana Mackenzie
peso bem maior que a instalação. Já a excelência na satisfação com o desempenho do
equipamento esteve ligada à excelência na satisfação com a instalação, na excelência na
satisfação com a assistência, com a localização na capital e nas regiões Norte, Nordeste e
Centro-Oeste, levando a empresa a verificar a atuação quanto aos clientes do interior bem
como a verificação de diferenças nas diversas regiões do Brasil. Embora o melhor modelo
tenha incluído as variáveis localização e região, seus pesos foram pequenos quando
comparados aos das outras duas variáveis incluídas no modelo, a saber, satisfação com a
instalação e com a assistência. Esta última teve um peso bem maior que as demais para a
escolha da excelência no desempenho.
Sabe-se que enquanto na capital existem predominantemente filiais da empresa, no interior
o que predomina são revendedores contratados, os quais em geral não estão presentes
quando da instalação dos equipamentos. Sabe-se também que uma condição que pode
estar influenciando a diferença de regiões é a existência de uma grande quantidade de
cursos novos em odontologia nas regiões Norte, Nordeste e Centro-Oeste. Tal situação faz
com que haja muitos novos profissionais nestas localidades, bem atualizados também em
termos tecnológicos, valorizando desta forma a alta tecnologia disponível nos equipamentos
da empresa pesquisada.
O resultado destas investigações pode levar a empresa a adotar medidas que resultem em
maiores satisfações e consequentemente maior fidelização dos clientes.
Cabe finalmente ressaltar que o modelo de regressão logística funciona melhor quando a
variável resposta tem historicamente uma probabilidade de ocorrência perto de 50% (muita
incerteza na classificação dicotômica). Esta evidência fez com que o modelo de regressão
logística fosse mais adequado para a previsão da variável excelência no desempenho do
que para a variável indicação positiva.
REFERÊNCIAS
AAKER, D. A.; KUMAR V.; DAY, G. S. Pesquisa de Marketing. 2.ed. São Paulo : Atlas,
2004.
ASSOCIAÇÃO BRASILEIRA DA INDÚSTRIA DE ARTIGOS E EQUIPAMENTOS MÉDICOS,
ODONTOLÓGICOS, HOSPITALARES E DE LABORATÓRIOS - ABIMO, Dados
econômicos, São Paulo, 2011a. Disponível em:
<http://www.abimo.org.br/content.php?page=DADOS_ECONOMICOS_PT>. Acesso em: 27
jun. 2011.
ASSOCIAÇÃO BRASILEIRA DA INDÚSTRIA DE ARTIGOS E EQUIPAMENTOS MÉDICOS,
ODONTOLÓGICOS, HOSPITALARES E DE LABORATÓRIOS - ABIMO, Histórico, São
Paulo, 2011b. Disponível em:
<http://www.abimo.org.br/content.php?page=HISTORICO_PT>. Acesso em: 27 jun. 2011.
19
VII Jornada de Iniciação Científica - 2011
ASSOCIAÇÃO BRASILEIRA DA INDÚSTRIA DE ARTIGOS E EQUIPAMENTOS MÉDICOS,
ODONTOLÓGICOS, HOSPITALARES E DE LABORATÓRIOS - ABIMO, Dados
econômicos, São Paulo, 2011c. Disponível em: <
http://www.abimo.org.br/content.php?page=DADOS_ECONOMICOS_PT>. Acesso em: 27
jun. 2011.
BOLFARINE, H.; BUSSAB, W. O. Elementos de amostragem. ABE-Projeto Fisher, São
Paulo: Edgard Blücher, 2005.
COSTA, G. G. O. Modelagem da Fidelidade dos Clientes com a Academia em que Praticam
Esportes: Uma Aplicação do Modelo de Regressão Logística. In: SEGET 2008 – SIMPÓSIO
DE EXCELÊNCIA EM GESTÃO E TECNOLOGIA. Anais..., Resende, 2008. Disponível em:
<http://www.aedb.br/seget/artigos2008.php?pag=59>. Acesso em: 15 mar. 2010.
COSTA NETO, P. L. O. Estatística. 2 ed. São Paulo, Edgard Blücher, 2002.
DIAS FILHO, J. M.; CORRAR, L. Regressão logística. In: CORRAR, L.; PAULO, E.; DIAS
FILHO, J. M. (Org.). Análise multivariada para os cursos de Administração, Ciências
Contábeis e Economia. São Paulo: Atlas, 2007.
FARHAT, C. A. V. Análise de diagnóstico em regressão logística. 2003. Dissertação
(Mestrado em Estatística)-Instituto de Matemática e Estatística da Universidade de São
Paulo, São Paulo, 2003.
FREITAS, A. A. F.; HEINECK, L. F. M. Segmentação de mercado: proposta de uma
metodologia de associação entre clientes e produtos no contexto do mercado imobiliário.
Associação Nacional de Tecnologia do Ambiente Construído, Porto alegre: 2008. Disponível
em: < http://seer.ufrgs.br/ambienteconstruido/article/view/5181>. Acesso em: 20 jun. 2011.
GUITIERRES, R. M. V.; ALEXANDRE, P. V. M. Complexo industrial da saúde: uma
introdução ao setor de insumos e equipamentos médicos. BNDES Setorial, Rio de Janeiro,
2004. Disponível em:
<http://www.bndes.gov.br/SiteBNDES/export/sites/default/bndes_pt/Galerias/Arquivos/conhe
cimento/bnset/set1906.pdf>. Acesso em: 28 jun. 2011.
HAIR, J. F.; BLACK, W. C.; BABIN, B.; ANDERSON, R. E.; TATHAM, R.. Análise
multivariada de dados. 6. ed. Porto Alegre: Bookman, 2009.
HOSMER, D. W.; LEMESHOW, S. Applied Logistic Regression. 2 ed. New York: John Wiley
& Sons, 2000.
KOTLER, P.; KELLER, K. L. Administração de marketing. 12 ed. São Paulo: Pearson
Prentice Hall, 2007.
MALHOTRA, N. K. Pesquisa de marketing: uma orientação aplicada. 3 ed. Porto Alegre:
Bookman, 2004.
MANFREDINI, M. A. Características da indústria de equipamentos odontológicos e de
produtos para higiene bucal, 2006. Dissertação (Mestrado em Ciências)- Coordenadoria de
Controle de Doenças da Secretaria de Estado da Saúde de São Paulo, São Paulo,
2006.Disponível em: <http://www.isaude.sp.gov.br/observatorio/manfredini.pdf>. Acesso em:
28 jun. 2011.
MONTGOMERY, D. C.; RUNGER, G. C. Estatística Aplicada e Probabilidades para
Engenheiros. 4. ed. Rio de Janeiro: LTC, 2009.
20
Universidade Presbiteriana Mackenzie
MOORE, D. S.; McCABE, G. P. Introdução à prática da Estatística. 3 ed. Rio de Janeiro:
LTC, 2002.
MOWEN, J. C.; MINOR, M. Comportamento do consumidor. São Paulo: Prentice-Hall, 200.
PENHA, R. N. Um estudo sobre regressão logística binária. Trabalho de Conclusão de
Curso (Graduação em Engenharia de Produção)- Instituto de Engenharia Mecânica,
Departamento de Produção da Universidade Federal de Itajubá, Itajubá, 2002. Disponível
em: <www.epr.unifei.edu.br/PFG/producao2002/trabalhos/Renata.PDF>. Acesso em: 17 fev.
2011
PIERONI, J. O; REIS, C.; SOUZA, J. O. B. A indústria de equipamentos e materiais
médicos, hospitalares e odontológicos: uma proposta de atuação do BNDES. BNDES
Setorial, Rio de Janeiro, 2010. Disponível em:
<http://www.bndes.gov.br/SiteBNDES/export/sites/default/bndes_pt/Galerias/Arquivos/conhe
cimento/bnset/set3105.pdf>. Acesso em: 28 jun. 2011.
RODRIGUES, A.; PAULO, E. Introdução à Análise Multivariada. In: CORRAR, L.; PAULO,
E.; DIAS FILHO, J. M. (Org.). Análise multivariada para os cursos de Administração,
Ciências Contábeis e Economia. São Paulo: Atlas, 2007.
ROSA, P. T. M. Modelos de “Credit Scoring”: regressão logística, chaid e real. 2000.
Dissertação (Mestrado em Estatística)-Instituto de Matemática e Estatística da Universidade
de São Paulo, São Paulo, 2000.
SHEPARD, D. Database Marketing. São Paulo: Makron Books, 1993.
SIEGEL; S.; CASTELLAN JR., N. J. Estatística não-paramétrica para ciências do
comportamento. Métodos de Pesquisa. 2 ed. Porto Alegre: Bookman, 2008.
STONE, M.; WOODCOCK, N. Marketing de relacionamento. 4 ed. São Paulo: Littera mundi,
2002).
SUZUKI, Marcelo. Modelagem de Churn a partir de registros de solicitações de reparo de
clientes. 2010. Dissertação (Mestrado em Administração de Empresas)- Escola de
Administração de Empresas da Fundação Getúlio Vargas São Paulo, 2010.
TELES, J. O. Clusters e a indústria ligada à área da saúde em Ribeirão Preto, 2002.
Dissertação (Mestrado em Economia) – Departamento de Economia da Faculdade de
Economia, Administração e Contabilidade da Universidade de São Paulo, São Paulo, 2002.
Disponível em: <http://www.teses.usp.br/teses/disponiveis/12/12138/tde-10122002104359/pt-br.php>. Acesso em: 28 jun. 2011.
VAVRA, T. G. Marketing de relacionamento (aftermarketing): como usar o database
marketing para a retenção de clientes ou consumidores e obter a recompra continuada de
seus produtos ou serviços. São Paulo: Atlas, 1993.
WHITELEY, R. C. A empresa totalmente voltada para o cliente: do planejamento à ação. 4
ed. Rio de Janeiro: Campus, 1992
Contato: [email protected] e [email protected]
21
Download

Karina Cavalcante Duarte