Algoritmos Colaborativos para Sistemas de Recomendação José Graciano Almeida Ramos Orientador: Prof. Doutor Jaime S. Cardoso Responsável no INESC - Porto: Mestre Ricardo Sousa Mestrado Integrado em Engenharia Informática e Computação MIEIC-FEUP 20 de Julho de 2010 1 Estrutura •Objectivos •Sistemas de Recomendação •Estado da Arte •Exemplos da Aplicação dos Sistemas de Recomendação •Formulação dos Algoritmos Colaborativos •Classificação dos Algoritmos Colaborativos • Collaborative Filtering with Interlaced Generalized linear Models •Filtragem Colaborativa baseada na Média das avaliações. MIEIC-FEUP 2 Objectivos MIEIC-FEUP 3 Sistemas de Recomendação Mundo Actual Acesso fácil a novas tecnologias de informação Crescimento exponencial da quantidade de dados a tratar COMO SELECIONAR/ENCONTRAR INFORMAÇÃO? Sorte Maior esforço das partes envolvidas no processo de tomada de decisão Pedir recomendação de um amigo Sistemas de Recomendação MIEIC-FEUP 4 Sistemas de Recomendação •São utilizados pelas empresas para gerar recomendações de novos produtos aos clientes. •Apoia nos Algoritmos recomendações. Colaborativos MIEIC-FEUP para gerar 5 Sistemas de Recomendação MIEIC-FEUP 6 Estado da Arte MIEIC-FEUP 7 Exemplos de Aplicação MIEIC-FEUP 8 Formulação dos Sistemas de Recomendação U = conjunto de utilizadores Y = conjunto de itens MIEIC-FEUP 9 Classificação dos Algoritmos Colaborativos MIEIC-FEUP 10 Métodos Baseados em Pesquisa MIEIC-FEUP 11 Filtragem Baseada no Conteúdo Talvez seja melhor começar a aprender com as acções dos utilizadores… MIEIC-FEUP 12 Filtragem Colaborativa A filtragem colaborativa (FC) pode ser descrita como a tarefa de identificar (filtrar) interesses dos utilizadores através da aprendizagem de relações com outros utilizadores (colaboração). A recomendação é baseada em produtos que pessoas com gostos e preferências similares apreciaram no passado. MIEIC-FEUP 13 Modelo de Conjuntos MIEIC-FEUP 14 Abordagem Híbrida MIEIC-FEUP 15 MIEIC-FEUP 16 Collaborative Filtering with Interlaced Generalized Linear Models [Delannay e Verleysen] • Procura identificar interesses dos utilizadores através da similaridade dos seus comportamentos. •Centra-se na previsão de novas avaliações baseada na factorização da matriz das avaliações e na utilização de modelos probabilísticos para representar incertezas nas avaliações. MIEIC-FEUP 17 Descrição do Modelo •Os Utilizadores e os Itens são representados por vectores de características que representam os parâmetros principais do modelo. •A previsão da avaliação atribuída por um utilizador a um determinado item é representada como o produto entre os respectivos vectores de características . •O vector de características do utilizador é entendido como diferentes sensibilidades a um conjunto de aspectos que descrevem os itens e o vector de características dos itens corresponde a esses aspectos. MIEIC-FEUP 18 Descrição do Modelo MIEIC-FEUP 19 Configuração do Modelo K=2 • A optimização dos vectores de características é feita utilizando o formalismo dos Modelos Lineares Generalizados. MIEIC-FEUP 20 Filtragem Colaborativa baseada na Média das Avaliações •Neste modelo mantêm-se a ideia chave do GLM entrelaçado que é representar os utilizadores e os itens por vector de características. •A apreciação dos itens expressa pelos utilizadores é estimada pelo produto dos respectivos vectores de características MIEIC-FEUP 21 Filtragem Colaborativa baseada na Média das Avaliações • Os vectores de características são optimizados aplicando a técnica de regressão linear regularizada. • Com a aplicação da regressão linear pretende-se estudar a dependência entre as avaliações atribuídas por um utilizador a um determinado item e as características dos utilizadores e dos itens, ou seja, como é que as características dos utilizadores e dos itens influenciam no processo de avaliação. MIEIC-FEUP 22 Filtragem Colaborativa baseada na Média das Avaliações MIEIC-FEUP 23 Configuração do Modelo K=2 MIEIC-FEUP 24 Base de Dados MovieLens ◦ 6040 Utilizadores ◦ 3900 Filmes (Itens) ◦ Aproximadamente 1 milhão de avaliações discretas no intervalo [1,5] MIEIC-FEUP 25 Desempenho MIEIC-FEUP 26 Desempenho • Root Mean Square error (RMSE) • Mean Absolut Error (MAE) MIEIC-FEUP 27 Desempenho MIEIC-FEUP 28 Desempenho MIEIC-FEUP 29 Desempenho MIEIC-FEUP 30 Contribuições •Levantamento do estado da arte sobre algoritmos colaborativos e sistemas de recomendação •Estudo comparativo de diferentes abordagens de sistemas de recomendação • Apresentação de uma nova abordagem híbrida para algoritmos colaborativos MIEIC-FEUP 31 Conclusão • Na última década os algoritmos colaborativos têm adquirido uma importância considerável, conseguindo avanços significativos devido ao surgimento de novas abordagens para o problema. •Apesar deste avanço, continuam a necessitar de optimizações para poderem ser aplicadas em situações da vida real. •Na maioria das situações é preciso considerar informações provenientes de vários contextos, o que não é considerado pela geração actual de algoritmos colaborativos por se encontrarem centralizados apenas na informação dos itens e dos utilizadores. MIEIC-FEUP 32 Obrigado MIEIC-FEUP 33