DESENVOLVIMENTO DE UM SISTEMA DE RECOMENDAÇÃO FAZENDO USO
DE TÉCNICAS DE MINERAÇÃO DE DADOS
ADEMIR BRESOLIN
ACADÊMICO1
RESUMO: Este estudo resulta de uma pesquisa realizada sobre Sistemas de
Recomendação e Data Mining. Possui conceitos de KDD (Knowledge Discovery in
Databases), pois o Data Mining é uma de suas etapas. Sendo escolhida a técnica de
Árvores de Decisões para a mineração dos dados e descoberta do conhecimentos na bases
de dados deste estudo de caso. Além dos estudos teóricos, para comprovar as técnicas
abordadas, foi implementado um de um sistema que recomende filmes baseado em perfis
de usuários. Perfis estes elaborados através do histórico de acesso a um portal de vídeo
locadora.
PALAVRAS-CHAVE: Sistemas de Recomendação; Mineração de Dados; Árvores de
Decisão.
INTRODUÇÃO: Nos últimos anos observou-se uma crescente segmentação no mercado,
cada vez mais as empresas optam por trabalhar em segmentos específicos e
conseqüentemente com uma cartela de clientes específicos. por exemplo o canal de tv
cartoon network, é um canal com um segmento especifico em desenhos, seus clientes
possuem gostos semelhantes.
As empresas estão procurando isolar alguns segmentos amplos que formam o
mercado e estão personalizando seus produtos para seus clientes, visto que os
consumidores são bastantes similares em desejos e necessidades, mas não são iguais.
podendo ser feito um atendimento personalizado a cada cliente.
Como o objetivo principal deste artigo é esse atendimento personalizado (marketing
one-to-one), o estudo de caso adotado é uma vídeo locadora. visto que a satisfação e a
fidelidade do cliente aumenta a partir que ele recebe um atendimento diferenciado e
personalizado, através da recomendação de um filme, por exemplo.
Fazendo uma analogia, enquanto a vídeo locadora é pequena há uma relação de
atendimento personalizado com o cliente, pois o gestor até conhece o perfil de cada um de
seus clientes. contudo a partir do momento que a vídeo locadora cresce não é mais possível
prestar esse atendimento personalizado e exclusivo a cada cliente, pois serão vários clientes
e cada um possui um gosto diferente, enfim, fica quase que impossível o gestor lembrar do
gosto particular por filmes de todos os seus clientes.
Com o auxilio da tecnologia da informação, aplicada as técnicas de sistemas de
recomendação e data mining é possível proporcionar uma solução personalizada para cada
cliente de uma vídeo locadora por exemplo.
O presente artigo busca a partir de bases históricas e interações dos usuários à um
portal na internet, definir perfis para cada cliente sabendo quais os filmes / gêneros que este
aprecia. Esta base servirá como fonte para a mineração dos dados, de onde se extrairá com
maior certeza informações que irão compor o perfil de filmes deste cliente. Perfis estes que
não serão os mesmos para cada cliente, entretanto poderá haver similaridades entre
1 Graduação do Curso de Sistemas de Informação
clientes que possuam o mesmo gosto por gênero ou classificação de filmes, ou seja,
afinidade.
OBJETIVOS: O presente estudo objetiva desenvolver um sistema que recomende filmes
baseado em perfis de usuários para uma vídeo locadora. Perfis estes criados a partir de
técnicas de mineração, árvores de decisão. Para que o objetivo geral seja atingido, fazemse necessárias as seguintes etapas:
Estudar as principais técnicas utilizadas em Sistemas de Recomendação e Data
Mining na internet.
Mostrar como o Data Mining pode descobrir conhecimento escondido em grandes
massas de dados.
Produzir um portal onde os usuários vão interagir, para o sistema de recomendação
coletar os dados e montar os perfis destes.
Documentar a pesquisa e o desenvolvimento deste.
METODOLOGIA: Um sistema de recomendação nada mais é que um mecanismo capaz
de aprender através de iterações dos usuários com o sistema de recomendação, afim de
obter experiências para poder recomendar, dentre os produtos disponíveis, ou seja, o que
tiver uma maior relação com o usuário.(VENSON,2002).
Para Cazella (2000), o processo de recomendação envolve várias questões para
recomendar o produto certo para a pessoa certa. Os seres humanos possuem
personalidades diferente e conseqüentemente afinidades diferentes um do outro.
Baseado nisso, temos em nosso meio a Internet como maior meio de comunicação
da atualidade, disponibiliza uma grande quantidade de conteúdos, porém muitas vezes não
se consegue selecionar o que realmente é de interesse, devido a grande variedade de
opções que tem-se hoje na internet. O que acontece muitas vezes é que o usuário desvia
seu foco do que realmente deseja buscar.
Frente a tantas informações acaba-se aceitando as recomendações de terceiros,
estas nem sempre sendo as mais eficazes.
Isso fica claro quando Jeff Bezoz (2000), CEO2 da Amazon, declarou no início de
2000, “Se eu tenho 2 milhões de clientes na Web, devo ter 2 milhões de lojas virtuais”. Se
referindo a customização dos usuários relacionados aos websites de comércio eletrônicos.
Devido o conceito de customização fico claro que não preciso ter uma loja especifica
para cada tipo de cliente e sim uma loja que se adapta a cada cliente.
“Um dos grandes desafios deste tipo de sistema é realizar o casamento correto entre
os que estão recomendando e aqueles que estão recebendo a recomendação, ou seja,
definir e descobrir este relacionamento de interesses”.(CAZZELA,2000).
Quando surgiram as primeiras técnicas de personalização eram baseadas em perfis,
segmentação e regras de comportamento médio. Podendo ser estas divididas em classe
social, nível de escolaridade, dados demográficos, sexo, idade, estado civil entre outras, a
partir destes dados eram formados os perfis de acordo com determinado produto, e assim
podendo oferecer este para seus clientes relacionados aquele perfil. A base de dados era
filtrada e assim conseguia-se definir os novos segmentos de mercado.(VENSON,2002).
O que acontecia era o cliente mudar seu foco a determinado produto, por exemplo,
comprava somente livros de culinária e agora começou a comprar livros de informática, ai
não tinha mais o perfil integro do cliente. Obteve a necessidade então das formas de
classificação dos clientes não ser mais por segmentação e sim por personalização, ou seja,
por comportamento real de compra
Surgindo uma nova filosofia, o marketing one-to-one, ao invés de olhar os produtos e
2
CEO(Chief Executive Officer) : Diretor Executivo.
definir quais clientes podem adquirir-lo. Esta nova filosofia de marketing define que deve-se
olhar para cada cliente e então verificar quais produtos adquiriria.
Conhecer os clientes é conhecer realmente suas preferências sobre música, livros,
viagens, restaurantes, filmes, etc. Além disso também identificar o seu comportamento
através do histórico de acesso ou de compras.(VENSON,2002).
Muitos se confundem os termos personalização e customização.
Para Sindell (2000), a customização na Internet é controlada especificamente pelo
usuário, como irão aparecer as cores ou em que localização, Já a personalização é
geralmente gerenciado pela organização responsável pelo site, oferecer um atendimento
especifico.
Atualmente na era digital, onde o principal meio de comunicação é a internet, as
empresas estão se moldando e, cada vez mais websites de comércio eletrônico surgem com
o intuito de prestar um serviço diferenciado e personalizado a cada cliente.
Resultados: O estudo de caso para este artigo é uma Vídeo Locadora.
Até então a vídeo locadora não possuía um portal para divulgação dos seus produtos
e serviços prestados, todo o processo de recomendação é baseado em slides, estes
mondados e repassados para toda a lista de contatos da empresa, não tendo um serviço
personalizado para cada cliente.
Para formação dos perfis dos usuários, é realizada a interação dos usuários com o
portal a fim de criar registros históricos (comentários, avaliações e preferências), e
cadastrais para começar a ter informações suficientes para descobertas destes.
No entanto um pré-requisito foi exigido. O usuário deveria estar cadastrado para
poder interagir no portal, através de comentários e avaliações sobre os filmes, preenchendo
um pré-cadastro informando suas preferencias de gêneros, atores, produtoras, entre outros.
A captura dos dados foi feita diariamente conforme suas ações, coletando-as de
forma implícita e explicita: De forma explicitas os comentários, avaliações e o pré-cadastro
de preferências; e de forma implícita a sessão do usuário logado.
Como foi feita a importação da base de dados local para a web, grande parte desses
dados foram utilizados para agilizar o processo de coleta para a criação dos perfis.
Basicamente as informações das ultimas locações, as preferência cadastrais que
foram pré-cadastradas, as avaliações e comentários realizados pelo usuário, foram
utilizados para gerar o perfil de cada usuário. Com essas informações fez-se uso de um
algoritmo próprio baseado em técnicas de Árvore de Decisão, para criar esses perfis. Essa
técnica busca varrer uma estrutura hierárquica fazendo várias comparações de acordo com
as ações do usuário.
A partir das informações contidas no portal, uma árvore é montada de acordo com
cada usuário, sendo esta diferente para cada um. Como o algoritmo monta e percorre a
árvore, é necessário antes definir os elementos que compõe a estrutura desta árvore.
Esta estrutura é composta por ramificações ou relacionamentos de um filme com o
outro, assim tendo algo em comum, seja um ator/atriz, um diretor, um gênero, uma
produtora entre outros.
Uma árvore é composta por um conjunto de nós, estes nós podem estar no inicio
(raiz), no meio (nós) e no fim (folhas) da estrutura, o ultimo nível contém as informações de
classificação do algoritmo, ou seja, a partir do momento que o algoritmo tiver estabelecido
todas as informações necessárias para percorrer a árvore, ele encontra através de
várias tomadas de decisões uma recomendação personalizada para cada usuário.
Esta recomendação personalizada é feita percorrendo os ramos da árvore,
recursivamente testando as condições até chegar em uma nova recomendação.
A análise realizada dos atributos e valores que constituem a árvore, foram definidos
pelo pessoal da vídeo locadora, pela sua experiência.
Assim o algoritmo foi construído baseado em pesos, cada atributo de um filme tem
um peso, para haver a recomendação é necessário ter pelo menos uma ação, sendo está
uma recomendação ou locação. Este peso é então acumulado e por fim, classificado os
filmes de maior peso para a recomendação sendo estes os que mais atenderam os
requisitos pré-estabelecidos na árvore.
O interessante das árvores de decisões é que utiliza a estratégia de dividir para
conquistar, um problema complexo é decomposto em subproblemas mais simples e
recursivamente a mesma estratégia é aplicada a cada subproblema.
Considerações Finais: Apesar de vários problemas previstos e não previstos durante a
fase de concepção do artigo e a parceria com a vídeo locadora deu certo, mal foi para o ar o
portal e já possui centenas de acessos.
Foi prazeroso estudar estas tecnologias, pois me identifiquei com elas o que tornou
mais agradável escrever este artigo.
Posso afirmar com certeza que tem muito a ser estudado ainda nestas áreas, tanto
de Sistemas de Recomendação, como Mineração de Dados (Data Mining), Inteligencia
Artificial, Data Warehouse, CRM entre outros conceitos abordados durante este artigo.
Principalmente muito ainda a ser explorado na web.
Ao termino deste estudo realizado, o sistema de recomendação foi aceite e está
sendo utilizado pela grande maioria dos clientes da Vídeo locadora, estão conseguindo
através do portal divulgar seus serviços/produtos de forma interativa, também fornecendo
um atendimento personalizado para cada cliente através dos perfis criados. Graças a ajuda
a fonte financiadora da bolsa de ATCC que contribui com esse projeto.
REFERÊNCIAS:
BEZOS, Jeff. CEO da Amazon, 2000. disponível em : <http://www.amazon.com>. Acessado
em: 01 jul 2008.
CARVALHO, Luís Alfredo Vidal de. Dataminig: A Mineração de dados no Marketing,
Medicina, Economia, Engenharia e Administração. São Paulo: Érica, 2001. 1 v.
CARVALHO, Luiz Alfredo Videal de. DATAMINING: Mineração de dados no Marketing,
Medicina, Economia, Engenharia e Administração. Rio de Janeiro : Ciência Moderna, 2005.
p. 19-20. 2 v.
CAZELLA, Sílvio César; REATEGUI, Eliseo Berni. Sistemas de Recomendação. São
Leopoldo: XXV Congresso da Sociedade Brasileira de Computação, 2005.
SINDELL, Kathleen. Loyalty Marketing for the Internet Age. Dearborn Financial Publishing
Inc, 2000.
VENSON, Elaine. Um Modelo de Sistema de Recomendação Baseado em Filtragem
Colaborativa e Correlação de Itens para Personalização no Comércio Eletrônico.
Florianópolis : UFSC, 2002.
Download

desenvolvimento de um sistema de recomendação fazendo uso de