Sistemas de Recomendação
Mineração da Web
Equipe
Bruno Rodrigues
Danilo Torres
David Emmanuel
Rodrigo Siqueira
Roteiro
Motivação
Coleta
de informações
Estratégias
Técnicas
Filtragem de Informação
Arquitetura
Exemplos
Referências
Motivação
Diversidade
O
de opções
usuário deseja customização
Segmentação
Fidelização
de mercado
Motivação
Processo
de indicação já bastante
conhecido na relação social entre seres
humanos
Re-edição
do tempo onde os vendedores
conheciam os clientes
E-commerce
Empresas
lucram com isso!!
Coleta de Informações
Objetivo:
Conhecer o usuário
É necessário capturar e armazenar seus dados
pessoais e comportamentais
Há
duas formas habituais de
identificação:
no Servidor e no Cliente
Coleta de Informações
Identificação
Área de cadastro de informações pessoais
O usuário loga no sistema
Identificação com precisão
Identificação
no Servidor
no Cliente
Utilização de cookies
Assume-se que o computador é utilizado por
uma única pessoa
Mais simples, porém menos confiável
Coleta de Informações
Coleta de Informações Explícita
Coleta de Informações Implícita
A
partir de dados da navegação, inferemse suas preferências
Estratégias de Recomendações
Empresas
precisam lucrar!
Boas estratégias garantem fidelidade de
clientes
As estratégias são várias e de complexidade
variada:
Lista de recomendações
Avaliação dos usuários
Suas recomendações
“Interessados por X se interessam por Y”
Associação por conteúdo
Estratégia 1: Lista de Recomendação
Sem análises profundas
Tipos populares ordenados
Estratégia 2: Avaliação dos usuários
Bastante
Útil
Não
utilizada
para os potenciais consumidores
exige nenhum mecanismo de inteligência
na implementação
Estratégia 2: Avaliação dos usuários
Estratégia 2: Avaliação dos usuários
Estratégia 3: Suas recomendações
Sugestões
feitas especificamente para o
usuário
implícitas ou explícitas
Estratégia 3: Suas recomendações
Estratégia 4: “Interessados em X se
interessam por Y”
Associações
entre itens avaliados por usuários
comprados, lidos, ...
Bastante
comum em sites e-commerce
Estratégia
mais complexa que as outras
Estratégia 4: “Interessados em X se
interessam por Y”
Estratégia 5: Associação por conteúdo
Baseado
É
no conteúdo de determinado item
necessário encontrar associações
ex: Os livros A e B são freqüentemente vendidos
juntos
Diferentes
técnicas podem ser usadas para
esse tipo de estratégia
Estratégia 5: Associação por conteúdo
Recuperação de Informação (RI) X
Filtragem de Informação (FI)
RI
Envolve armazenamento, índices e tecnologia para
recuperação de documentos textuais
Mantém uma base com caracterísitica mais estática no
armazenamento de informações.
Início da interação provocada pelo usuário (query)
Baseia-se na percepção de uma necessidade de momento
FI
Mantém perfil dos interesses do usuário
Maior tempo de duração no casamento de interesses
Início da interação provocada pelo sistema
Não se refere ao momento, mas sim a preferências
Técnicas – Filtragem de Informações
Nome utilizado para descrever uma variedade de
processos que envolvem a entrega de informação
para as pessoas que realmente necessitam delas.
Quase todo sistema de recomendação vê a
filtragem de informações ou seleção de um
produto como um problema de classificação.
F(usuário, produto) | {gosta, não gosta}
Filtragem baseada em conteúdo
Baseada na análise de conteúdo dos itens e no perfil
do usuário
Descrição de interesses do usuário é obtida através de
informações fornecidas por ele mesmo ou através de
ações como seleção e aquisição de itens
Ferramentas utilizam
TF-IDF
Modelo Vetorial
Índices de Busca booleana
Filtragem probabilística
Interfaces de consulta com linguagem natural
Filtragem baseada em conteúdo
Como
utilizar:
Solicita ao usuário uma análise de itens
indicando se cada um destes é de interesse ou não
Após a avaliação feita pelo usuário
o sistema busca itens que “casam” em conteúdo
com o que foi classificado como de interesse
e desconsidera os que “casam” com o que foi
classificado como de não interesse
Filtragem baseada em conteúdo
Problemas:
Conteúdo de dados pouco estruturado é difícil de
ser analisado
Entendimento do conteúdo do texto prejudicado
pelo uso de sinônimos
Super-especialização
vídeo, som
só serão recomendados itens já avaliados, não
explorando novas categorias de itens
Falta de surpresa na recomendação
produtos que não se relacionam com o perfil do usuário
jamais serão recomendados
Filtragem baseada em conteúdo
Exemplos
filmes do mesmo gênero que o assistido
outros CD’s dos artistas já adquiridos
produtos complementares aos adquiridos
“DVD player” hometheater
Filtragem Colaborativa
Desenvolvida
para atender pontos que
estavam em aberto na filtragem baseada em
conteúdo
Diferencia-se da filtragem baseada em
conteúdo exatamente por não exigir a
compreensão ou reconhecimento do conteúdo
dos itens
Baseado na troca de experiências entre as
pessoas que possuem interesses comuns
Filtragem Colaborativa
Como
utilizar:
Itens filtrados baseados nas avaliações feitas
pelos usuários
Usuários dos sistemas colaborativos devem
pontuar cada item experimentado, indicando o
quanto este item casa com sua necessidade de
informação
Filtragem Colaborativa
Problemas:
1º avaliador: novo item no BD nunca é
recomendado até que um usuário o avalie
Pontuações esparsas: número de usuários
pequeno em relação ao volume de informações no
sistema
Similaridade:
um usuário exótico terá dificuldades para
encontrar outros usuários com gostos similares,
sendo assim suas recomendações podem se tornar
pobres
Filtragem Colaborativa
Detalhando
Calcular o peso de cada usuário em relação à
similaridade ao usuário ativo
o funcionamento
métrica de similaridade
Selecionar um subconjunto de usuários com
maiores similaridades (vizinhos) para
considerar na predição.
Normalizar as avaliações e computar as
predições ponderando as avaliações dos
vizinhos com seus pesos.
Filtragem Colaborativa - Exemplo
Se
quisermos recomendar um produto ao
usuário Mauro, procuraremos outros
usuários com hábitos de consumos
semelhantes
Filtragem Híbrida
Procura
combinar os pontos fortes da
filtragem colaborativa e da baseada em
conteúdo e ao mesmo tempo eliminar as
fraquezas de cada uma
Vantagens da Filtragem Híbrida
Utilizando
recomendações colaborativas,
experiências de outros usuários são
levadas em consideração;
Utilizando
recomendações baseadas em
conteúdo, é possível lidar com itens não
vistos por outros usuários;
É
possível recomendar bons itens a um
usuário mesmo que não haja usuários
semelhantes a ele.
Arquitetura
Um
Sistema de Recomendação
funcionar como um servidor
deve
capaz de recuperar, para determinado usuário,
suas
preferências
explícitas,
implícitas,
conteúdo e ofertas relacionadas a itens nos
quais já mostrou interesse
Deve
ficar em comunicação com o sistema
que irá apresentar as recomendações para
o usuário
Ex.: Servidor Web
Tipos de Arquitetura
Basicamente
existem
arquitetura possíveis
dois
tipo
Baseado em técnicas de filtragem
informação
Baseado em Mineração de Dados
de
de
Baseado em Técnicas de Filtragem de
Dados
Sistema de Apresentação
Banco de Estratégias
Módulo Central
Consulta dados pessoais
Consulta dados Transacionais
Baseado em Mineração de Dados
Armazena padrões
Módulo de
Mineração
Infere padrões
Demográficos e
Transacionais
Exemplo de Arquitetura
Sistema
Recommender
Sistema de Recomendação
Permite que clientes e visitantes do website de
uma empresa possam receber, no momento
exato, recomendações de produtos e serviços
adequados aos seus interesses
Recomendações obtidas através de indicações
explícitas de preferência ou através da técnica
de filtragem colaborativa
Exemplo de Arquitetura
Exemplo de Arquitetura
Recommender
Server
Utilizado
para
dar
SessionsControllers
e
recomendações
acesso
às
rotinas
aos
de
Exemplo de Arquitetura
Session Controller
Ao entrar no site, uma sessão é
iniciada para o usuário, onde
várias informações são
armazenadas sobre sua
interação
É carregado com todas as
informações coletadas no
passado sobre o usuário (itens
adquiridos, áreas de
preferência do site, etc.)
Exemplo de Arquitetura
StrategyList
Guarda vários modelos de recomendação, cada um
orientado a um tipo de recomendação específica
Baseado em listas armazenadas pelo sistema (mais
vendidos, lista de presentes, etc)
Baseado em preferências explícitas ou implícitas
Difetentes estratégias podem ser criadas e utilizadas em
paralelo em um mesmo website
Exemplo de Arquitetura
InterestList
Mantém as preferências explícitas e
implícitas do usuário
Coleta implícita: Na medida em que
o usuário navega, seleciona e adquiri
itens, suas preferências são
armazenadas na InterestList
Coleta Explícita: O usuário indica
espontaneamente suas preferências e
estas são armazenadas em outra
InterestList
Mais tarde, todas essas preferências
podem ser utilizadas
Exemplo de Arquitetura
FindingList
Complementam as informações que se tem sobre os
usuários
Utilizado para armazenar características demográficas
sobre eles (faixa etária, sexo, ocupação, ...) ou hábitos de
consumo (itens adquiridos ou colocados no carrinho de
compras)
É através desta “lista de achados” que se pode encontrar
recomendações precisas para o usuário
Implementando
Recomendação a partir dos itens comprados pelo
usuário:
Implementando
Recomendação
de novidades:
Sistemas de recomendação exemplos
Referral Web
GroupLens
Referências
Wikipedia
Reategui,Eliseo B. e Cazella, Sílvio C. Sistemas de
Recomendação
Dot.dot.dot