A CRIAÇÃO DE UM INDICADOR PARA GESTÃO DE RELACIONAMENTO COM
OS CLIENTES BASEADO EM ANÁLISE DE HOMOGENEIDADE
Márcio Luís Moreira de Souza1
Ronaldo Rocha Bastos2
Marcel de Toledo Vieira3
A análise multivariada de dados se dá na presença de três ou mais variáveis
em que se deseja analisar o efeito conjunto das mesmas para se obter informações
generalizadas a respeito de um determinado contexto. Esse tipo de análise
considera cada variável como uma dimensão do espaço e teve maior impulso nas
últimas décadas, em função do desenvolvimento e aperfeiçoamento das tecnologias
computacionais,
vista
a
inviabilidade
dessas
análises
serem
conduzidas
manualmente (PEREIRA, 1999). Tais técnicas têm como uma de suas principais
funções a redução de dimensionalidade.
O principal objetivo deste trabalho é propor uma metodologia para o cálculo
de escores ponderados a partir de um conjunto de dados categóricos, baseando-se
nas propriedades matemáticas da técnica de Análise de Homogeneidade.
A Análise de Homogeneidade é uma técnica bastante abrangente, pois
permite a análise de um conjunto de variáveis categóricas nominais, categóricas
ordinais e variáveis numéricas (GIFI, 1990). As observações e as variáveis são
representadas como pontos em um espaço reduzido no qual se encontra, distribuída
em suas dimensões, o tanto quanto possível da variabilidade total dos dados,
1
Professor das Faculdades Integradas Vianna Júnior.
Universidade Federal de Juiz de Fora, Departamento de Estatística.
3
Universidade Federal de Juiz de Fora, Departamento de Estatística.
2
permitindo a identificação e interpretação das associações entre as observações e
as categorias das variáveis de estudo. A primeira dimensão apresenta a maior parte
da variabilidade total dos dados (maior autovalor), a segunda dimensão apresenta a
segunda maior parte da variabilidade total dos dados (segundo maior autovalor) e
assim por diante.
Em relação às observações e às categorias das variáveis estudadas, são
produzidas as matrizes dos escores dos objetos e a da quantificação das categorias
com dimensões
(
e
, respectivamente. A matriz dos escores dos objetos
) e a matriz da quantificação das categorias (
) informam as coordenadas em
que as observações e as categorias das variáveis se encontram nesse espaço
reduzido. Inicialmente os dados são codificados utilizando matrizes indicadoras
, com valores iguais a 1 (um) se o objeto
da variável
pertencer à categoria
e 0 (zero) caso contrário.
Propomos o cálculo dos escores a partir da expressão:
Onde:
representa o valor numérico da categoria da variável
-ésimo indivíduo;
e
a qual pertence o
são os pesos aplicados na média ponderada, de
forma que:
e
Ambos os pesos apresentados acima são representações matriciais do inverso das
seguintesdistâncias euclidianas: (i) entre o
variável
a qual ele pertence (
-ésimo indivíduo e a categoria da
); e (ii) entre a categoria da variável
ésimo indivíduo pertence e a origem do gráfico n-dimensional (
acima,
representa a posição no gráfico
solução da Análise de Homogeneidade do
posição da categoria da
a qual o
-
). Na expressão
-dimensional proporcionado pela
-ésimoindivíduo e
-ésima variável a qual o
representa a
-ésimo indivíduo pertence.Os
cálculos/fórmulas desse trabalho foram implementadas no software
, versão 3.0.0,
disponível gratuitamente em www.r-projet.org(R Development Core Team, 2010).
A metodologia apresentada nesse estudo permite a criação escores que
representam variáveis dependentes de modelos explicativos para atitudes,
satisfação, impactos e outras variáveis multidimensionais. Permite também a
aplicação subsequente de modelos explicativos do tipo transversais e longitudinais,
uma vez que o perfil médio dos escores pode sofrer alterações ao longo do tempo.
REFERÊNCIAS
PEREIRA, J. C. R., 1999, Análise de dados quantitativos: estratégias
metodológicas para as ciências da saúde, humanas e sociais. 2.ed. São Paulo,
Editora da Universidade de São Paulo.
GIFI, A., Nonlinear Multivariate Analysis, Chichester: Wiley,1990
R DEVELOPMENT CORE TEAM, 2010, R: A language and environment for
statistical computing. R Foundation for Statistical Computing, Vienna, Austria.
Download

A criação de um Indicador para Gestão de Relacionamento com os