DESENVOLVIMENTO DE UM SISTEMA DE RECOMENDAÇÃO FAZENDO USO DE TÉCNICAS DE MINERAÇÃO DE DADOS ADEMIR BRESOLIN ACADÊMICO1 RESUMO: Este estudo resulta de uma pesquisa realizada sobre Sistemas de Recomendação e Data Mining. Possui conceitos de KDD (Knowledge Discovery in Databases), pois o Data Mining é uma de suas etapas. Sendo escolhida a técnica de Árvores de Decisões para a mineração dos dados e descoberta do conhecimentos na bases de dados deste estudo de caso. Além dos estudos teóricos, para comprovar as técnicas abordadas, foi implementado um de um sistema que recomende filmes baseado em perfis de usuários. Perfis estes elaborados através do histórico de acesso a um portal de vídeo locadora. PALAVRAS-CHAVE: Sistemas de Recomendação; Mineração de Dados; Árvores de Decisão. INTRODUÇÃO: Nos últimos anos observou-se uma crescente segmentação no mercado, cada vez mais as empresas optam por trabalhar em segmentos específicos e conseqüentemente com uma cartela de clientes específicos. por exemplo o canal de tv cartoon network, é um canal com um segmento especifico em desenhos, seus clientes possuem gostos semelhantes. As empresas estão procurando isolar alguns segmentos amplos que formam o mercado e estão personalizando seus produtos para seus clientes, visto que os consumidores são bastantes similares em desejos e necessidades, mas não são iguais. podendo ser feito um atendimento personalizado a cada cliente. Como o objetivo principal deste artigo é esse atendimento personalizado (marketing one-to-one), o estudo de caso adotado é uma vídeo locadora. visto que a satisfação e a fidelidade do cliente aumenta a partir que ele recebe um atendimento diferenciado e personalizado, através da recomendação de um filme, por exemplo. Fazendo uma analogia, enquanto a vídeo locadora é pequena há uma relação de atendimento personalizado com o cliente, pois o gestor até conhece o perfil de cada um de seus clientes. contudo a partir do momento que a vídeo locadora cresce não é mais possível prestar esse atendimento personalizado e exclusivo a cada cliente, pois serão vários clientes e cada um possui um gosto diferente, enfim, fica quase que impossível o gestor lembrar do gosto particular por filmes de todos os seus clientes. Com o auxilio da tecnologia da informação, aplicada as técnicas de sistemas de recomendação e data mining é possível proporcionar uma solução personalizada para cada cliente de uma vídeo locadora por exemplo. O presente artigo busca a partir de bases históricas e interações dos usuários à um portal na internet, definir perfis para cada cliente sabendo quais os filmes / gêneros que este aprecia. Esta base servirá como fonte para a mineração dos dados, de onde se extrairá com maior certeza informações que irão compor o perfil de filmes deste cliente. Perfis estes que não serão os mesmos para cada cliente, entretanto poderá haver similaridades entre 1 Graduação do Curso de Sistemas de Informação clientes que possuam o mesmo gosto por gênero ou classificação de filmes, ou seja, afinidade. OBJETIVOS: O presente estudo objetiva desenvolver um sistema que recomende filmes baseado em perfis de usuários para uma vídeo locadora. Perfis estes criados a partir de técnicas de mineração, árvores de decisão. Para que o objetivo geral seja atingido, fazemse necessárias as seguintes etapas: Estudar as principais técnicas utilizadas em Sistemas de Recomendação e Data Mining na internet. Mostrar como o Data Mining pode descobrir conhecimento escondido em grandes massas de dados. Produzir um portal onde os usuários vão interagir, para o sistema de recomendação coletar os dados e montar os perfis destes. Documentar a pesquisa e o desenvolvimento deste. METODOLOGIA: Um sistema de recomendação nada mais é que um mecanismo capaz de aprender através de iterações dos usuários com o sistema de recomendação, afim de obter experiências para poder recomendar, dentre os produtos disponíveis, ou seja, o que tiver uma maior relação com o usuário.(VENSON,2002). Para Cazella (2000), o processo de recomendação envolve várias questões para recomendar o produto certo para a pessoa certa. Os seres humanos possuem personalidades diferente e conseqüentemente afinidades diferentes um do outro. Baseado nisso, temos em nosso meio a Internet como maior meio de comunicação da atualidade, disponibiliza uma grande quantidade de conteúdos, porém muitas vezes não se consegue selecionar o que realmente é de interesse, devido a grande variedade de opções que tem-se hoje na internet. O que acontece muitas vezes é que o usuário desvia seu foco do que realmente deseja buscar. Frente a tantas informações acaba-se aceitando as recomendações de terceiros, estas nem sempre sendo as mais eficazes. Isso fica claro quando Jeff Bezoz (2000), CEO2 da Amazon, declarou no início de 2000, “Se eu tenho 2 milhões de clientes na Web, devo ter 2 milhões de lojas virtuais”. Se referindo a customização dos usuários relacionados aos websites de comércio eletrônicos. Devido o conceito de customização fico claro que não preciso ter uma loja especifica para cada tipo de cliente e sim uma loja que se adapta a cada cliente. “Um dos grandes desafios deste tipo de sistema é realizar o casamento correto entre os que estão recomendando e aqueles que estão recebendo a recomendação, ou seja, definir e descobrir este relacionamento de interesses”.(CAZZELA,2000). Quando surgiram as primeiras técnicas de personalização eram baseadas em perfis, segmentação e regras de comportamento médio. Podendo ser estas divididas em classe social, nível de escolaridade, dados demográficos, sexo, idade, estado civil entre outras, a partir destes dados eram formados os perfis de acordo com determinado produto, e assim podendo oferecer este para seus clientes relacionados aquele perfil. A base de dados era filtrada e assim conseguia-se definir os novos segmentos de mercado.(VENSON,2002). O que acontecia era o cliente mudar seu foco a determinado produto, por exemplo, comprava somente livros de culinária e agora começou a comprar livros de informática, ai não tinha mais o perfil integro do cliente. Obteve a necessidade então das formas de classificação dos clientes não ser mais por segmentação e sim por personalização, ou seja, por comportamento real de compra Surgindo uma nova filosofia, o marketing one-to-one, ao invés de olhar os produtos e 2 CEO(Chief Executive Officer) : Diretor Executivo. definir quais clientes podem adquirir-lo. Esta nova filosofia de marketing define que deve-se olhar para cada cliente e então verificar quais produtos adquiriria. Conhecer os clientes é conhecer realmente suas preferências sobre música, livros, viagens, restaurantes, filmes, etc. Além disso também identificar o seu comportamento através do histórico de acesso ou de compras.(VENSON,2002). Muitos se confundem os termos personalização e customização. Para Sindell (2000), a customização na Internet é controlada especificamente pelo usuário, como irão aparecer as cores ou em que localização, Já a personalização é geralmente gerenciado pela organização responsável pelo site, oferecer um atendimento especifico. Atualmente na era digital, onde o principal meio de comunicação é a internet, as empresas estão se moldando e, cada vez mais websites de comércio eletrônico surgem com o intuito de prestar um serviço diferenciado e personalizado a cada cliente. Resultados: O estudo de caso para este artigo é uma Vídeo Locadora. Até então a vídeo locadora não possuía um portal para divulgação dos seus produtos e serviços prestados, todo o processo de recomendação é baseado em slides, estes mondados e repassados para toda a lista de contatos da empresa, não tendo um serviço personalizado para cada cliente. Para formação dos perfis dos usuários, é realizada a interação dos usuários com o portal a fim de criar registros históricos (comentários, avaliações e preferências), e cadastrais para começar a ter informações suficientes para descobertas destes. No entanto um pré-requisito foi exigido. O usuário deveria estar cadastrado para poder interagir no portal, através de comentários e avaliações sobre os filmes, preenchendo um pré-cadastro informando suas preferencias de gêneros, atores, produtoras, entre outros. A captura dos dados foi feita diariamente conforme suas ações, coletando-as de forma implícita e explicita: De forma explicitas os comentários, avaliações e o pré-cadastro de preferências; e de forma implícita a sessão do usuário logado. Como foi feita a importação da base de dados local para a web, grande parte desses dados foram utilizados para agilizar o processo de coleta para a criação dos perfis. Basicamente as informações das ultimas locações, as preferência cadastrais que foram pré-cadastradas, as avaliações e comentários realizados pelo usuário, foram utilizados para gerar o perfil de cada usuário. Com essas informações fez-se uso de um algoritmo próprio baseado em técnicas de Árvore de Decisão, para criar esses perfis. Essa técnica busca varrer uma estrutura hierárquica fazendo várias comparações de acordo com as ações do usuário. A partir das informações contidas no portal, uma árvore é montada de acordo com cada usuário, sendo esta diferente para cada um. Como o algoritmo monta e percorre a árvore, é necessário antes definir os elementos que compõe a estrutura desta árvore. Esta estrutura é composta por ramificações ou relacionamentos de um filme com o outro, assim tendo algo em comum, seja um ator/atriz, um diretor, um gênero, uma produtora entre outros. Uma árvore é composta por um conjunto de nós, estes nós podem estar no inicio (raiz), no meio (nós) e no fim (folhas) da estrutura, o ultimo nível contém as informações de classificação do algoritmo, ou seja, a partir do momento que o algoritmo tiver estabelecido todas as informações necessárias para percorrer a árvore, ele encontra através de várias tomadas de decisões uma recomendação personalizada para cada usuário. Esta recomendação personalizada é feita percorrendo os ramos da árvore, recursivamente testando as condições até chegar em uma nova recomendação. A análise realizada dos atributos e valores que constituem a árvore, foram definidos pelo pessoal da vídeo locadora, pela sua experiência. Assim o algoritmo foi construído baseado em pesos, cada atributo de um filme tem um peso, para haver a recomendação é necessário ter pelo menos uma ação, sendo está uma recomendação ou locação. Este peso é então acumulado e por fim, classificado os filmes de maior peso para a recomendação sendo estes os que mais atenderam os requisitos pré-estabelecidos na árvore. O interessante das árvores de decisões é que utiliza a estratégia de dividir para conquistar, um problema complexo é decomposto em subproblemas mais simples e recursivamente a mesma estratégia é aplicada a cada subproblema. Considerações Finais: Apesar de vários problemas previstos e não previstos durante a fase de concepção do artigo e a parceria com a vídeo locadora deu certo, mal foi para o ar o portal e já possui centenas de acessos. Foi prazeroso estudar estas tecnologias, pois me identifiquei com elas o que tornou mais agradável escrever este artigo. Posso afirmar com certeza que tem muito a ser estudado ainda nestas áreas, tanto de Sistemas de Recomendação, como Mineração de Dados (Data Mining), Inteligencia Artificial, Data Warehouse, CRM entre outros conceitos abordados durante este artigo. Principalmente muito ainda a ser explorado na web. Ao termino deste estudo realizado, o sistema de recomendação foi aceite e está sendo utilizado pela grande maioria dos clientes da Vídeo locadora, estão conseguindo através do portal divulgar seus serviços/produtos de forma interativa, também fornecendo um atendimento personalizado para cada cliente através dos perfis criados. Graças a ajuda a fonte financiadora da bolsa de ATCC que contribui com esse projeto. REFERÊNCIAS: BEZOS, Jeff. CEO da Amazon, 2000. disponível em : <http://www.amazon.com>. Acessado em: 01 jul 2008. CARVALHO, Luís Alfredo Vidal de. Dataminig: A Mineração de dados no Marketing, Medicina, Economia, Engenharia e Administração. São Paulo: Érica, 2001. 1 v. CARVALHO, Luiz Alfredo Videal de. DATAMINING: Mineração de dados no Marketing, Medicina, Economia, Engenharia e Administração. Rio de Janeiro : Ciência Moderna, 2005. p. 19-20. 2 v. CAZELLA, Sílvio César; REATEGUI, Eliseo Berni. Sistemas de Recomendação. São Leopoldo: XXV Congresso da Sociedade Brasileira de Computação, 2005. SINDELL, Kathleen. Loyalty Marketing for the Internet Age. Dearborn Financial Publishing Inc, 2000. VENSON, Elaine. Um Modelo de Sistema de Recomendação Baseado em Filtragem Colaborativa e Correlação de Itens para Personalização no Comércio Eletrônico. Florianópolis : UFSC, 2002.