A CRIAÇÃO DE UM INDICADOR PARA GESTÃO DE RELACIONAMENTO COM OS CLIENTES BASEADO EM ANÁLISE DE HOMOGENEIDADE Márcio Luís Moreira de Souza1 Ronaldo Rocha Bastos2 Marcel de Toledo Vieira3 A análise multivariada de dados se dá na presença de três ou mais variáveis em que se deseja analisar o efeito conjunto das mesmas para se obter informações generalizadas a respeito de um determinado contexto. Esse tipo de análise considera cada variável como uma dimensão do espaço e teve maior impulso nas últimas décadas, em função do desenvolvimento e aperfeiçoamento das tecnologias computacionais, vista a inviabilidade dessas análises serem conduzidas manualmente (PEREIRA, 1999). Tais técnicas têm como uma de suas principais funções a redução de dimensionalidade. O principal objetivo deste trabalho é propor uma metodologia para o cálculo de escores ponderados a partir de um conjunto de dados categóricos, baseando-se nas propriedades matemáticas da técnica de Análise de Homogeneidade. A Análise de Homogeneidade é uma técnica bastante abrangente, pois permite a análise de um conjunto de variáveis categóricas nominais, categóricas ordinais e variáveis numéricas (GIFI, 1990). As observações e as variáveis são representadas como pontos em um espaço reduzido no qual se encontra, distribuída em suas dimensões, o tanto quanto possível da variabilidade total dos dados, 1 Professor das Faculdades Integradas Vianna Júnior. Universidade Federal de Juiz de Fora, Departamento de Estatística. 3 Universidade Federal de Juiz de Fora, Departamento de Estatística. 2 permitindo a identificação e interpretação das associações entre as observações e as categorias das variáveis de estudo. A primeira dimensão apresenta a maior parte da variabilidade total dos dados (maior autovalor), a segunda dimensão apresenta a segunda maior parte da variabilidade total dos dados (segundo maior autovalor) e assim por diante. Em relação às observações e às categorias das variáveis estudadas, são produzidas as matrizes dos escores dos objetos e a da quantificação das categorias com dimensões ( e , respectivamente. A matriz dos escores dos objetos ) e a matriz da quantificação das categorias ( ) informam as coordenadas em que as observações e as categorias das variáveis se encontram nesse espaço reduzido. Inicialmente os dados são codificados utilizando matrizes indicadoras , com valores iguais a 1 (um) se o objeto da variável pertencer à categoria e 0 (zero) caso contrário. Propomos o cálculo dos escores a partir da expressão: Onde: representa o valor numérico da categoria da variável -ésimo indivíduo; e a qual pertence o são os pesos aplicados na média ponderada, de forma que: e Ambos os pesos apresentados acima são representações matriciais do inverso das seguintesdistâncias euclidianas: (i) entre o variável a qual ele pertence ( -ésimo indivíduo e a categoria da ); e (ii) entre a categoria da variável ésimo indivíduo pertence e a origem do gráfico n-dimensional ( acima, representa a posição no gráfico solução da Análise de Homogeneidade do posição da categoria da a qual o - ). Na expressão -dimensional proporcionado pela -ésimoindivíduo e -ésima variável a qual o representa a -ésimo indivíduo pertence.Os cálculos/fórmulas desse trabalho foram implementadas no software , versão 3.0.0, disponível gratuitamente em www.r-projet.org(R Development Core Team, 2010). A metodologia apresentada nesse estudo permite a criação escores que representam variáveis dependentes de modelos explicativos para atitudes, satisfação, impactos e outras variáveis multidimensionais. Permite também a aplicação subsequente de modelos explicativos do tipo transversais e longitudinais, uma vez que o perfil médio dos escores pode sofrer alterações ao longo do tempo. REFERÊNCIAS PEREIRA, J. C. R., 1999, Análise de dados quantitativos: estratégias metodológicas para as ciências da saúde, humanas e sociais. 2.ed. São Paulo, Editora da Universidade de São Paulo. GIFI, A., Nonlinear Multivariate Analysis, Chichester: Wiley,1990 R DEVELOPMENT CORE TEAM, 2010, R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria.