Computando o Equilı́brio de Nash para estratégias de
agregação na recomendação de itens para grupos de usuários
Lucas Augusto M. C. Carvalho, Hendrik T. Macedo
1
Programa de Pós-Graduação em Ciência da Computação
Universidade Federal de Sergipe, Brasil
[email protected], [email protected]
Abstract. Most work in progress regarding Group Recommenders seems to focus on how to combine the individual models of group members rather than
providing a model to the group itself. A major difficulty in such approach is how
to define an aggregation strategy of individual preferences to ensure, among
other things, maximizing group overall satisfaction. In this paper we propose a
non-cooperative game theory approach to group recommender systems. While
group members may be seen as game competitors, the different aggregation strategies proposed so far represent the set of possible actions. Satisfying the whole
group becomes thus a problem of finding Nash equilibria. Experiments using
MovieLens dataset and a satisfaction utility function have shown good results if
compared to such obtained from state-of-the-art’s approaches, specially to those
concerned with heterogeneous groups.
Resumo. A maior parte das pesquisas sobre recomendação para grupos se concentra no estudo sobre métodos de combinação de modelos individuais de seus
membros em detrimento da definição de um modelo para o grupo em si. A maior
dificuldade de tal abordagem é como definir uma estratégia de agregação individual que assegure, entre outras coisas, a maximização da satisfação média
do grupo. Neste artigo é proposta uma abordagem baseada na teoria dos jogos não-cooperativos para sistemas de recomendação para grupos. Enquanto
membros do grupo podem ser vistos como competidores em um jogo, as diferentes estratégias de agregação podem fornecer o conjunto de possı́veis ações.
Satisfazer o grupo como um todo torna-se então um problema de encontrar o
equilı́brio de Nash. Experimentos com a base de dados do MovieLens e uma
função de média aritmética para cálculo da previsão de satisfação do grupo
com a recomendação, apresentou resultados satisfatórios comparado ao das estratégias de agregação do estado-da-arte, especialmente quando as avaliações
entre os membros do grupo são mais heterogêneas.
1. Introdução
Sistemas de recomendação tradicionais realizam sugestões personalizadas de itens
ainda não avaliados pelo usuário e que são de potencial interesse para o mesmo
[Adomavicius e Tuzhilin 2005]. Baseado no histórico de itens previamente avaliados por
um usuário, um sistema de recomendação constrói um perfil representativo dos interesses
deste. A similaridade deste perfil com o de outros usuários do sistema (filtragem colaborativa) ou com outros itens da base (filtragem baseada em conteúdo) é então utilizada para
recomendação de itens inéditos para o usuário em questão [Burke 2002].
Em cenários onde grupos de pessoas compartilham o mesmo local ou interesse,
recomendação individual não é a mais adequada. A recomendação de um restaurante
para um almoço de negócios, a recomendação de um destino de viagem para uma turma
de amigos ou ainda a recomendação de um filme para a famı́lia são exemplos de cenários
onde a recomendação para grupo é mais apropriada. A recomendação para grupo considera as preferências dos membros de um grupo para realizar a recomendação. Entre
as dificuldades que se apresentam está o fato de que membros do grupo podem possuir
preferências diferentes ou até mesmo conflitantes. Para solução deste problema, a abordagem que tem recebido mais atenção na literatura cientı́fica é a agregação de preferências
individuais [Masthoff 2004, Jameson e Smyth 2007].
Para escolha de uma estratégia de agregação de preferência individual, faz-se necessário considerar as caracterı́sticas do grupo e da aplicação em questão. A maioria
dos sistemas de recomendação para grupo utiliza apenas um método de agregação de
preferência individual. Entretanto, uma estratégia mal escolhida, que não se adeque às
caracterı́sticas dos grupos que utilizam a aplicação, pode causar baixa satisfação dos itens
recomendados para os membros do grupo.
Uma das possı́veis soluções para minimizar o problema da escolha da estratégia
de agregação é o sistema possibilitar a seleção de métodos de agregação de preferência
para cada decisão [Jameson 2004]. O sistema poderia permitir que usuários decidam qual
mecanismo de agregação deve ser utilizado, tanto antes de uma recomendação ser feita
ou durante um processo iterativo de requisição de recomendações e ajustes da função
de agregação. A criação de métodos de seleção de estratégias de acordo com as caracterı́sticas do grupo vem sendo estudada na literatura [Senot et al. 2010]. Resultados
dos estudos mostram que membros de um grupo não são alheios as estratégias adotadas. De fato, eles procuram um equilı́brio entre a escolha mais justa para o grupo
e a sua preferência particular, apesar de não possuı́rem uma estratégia clara para isso
[Masthoff 2004].
[Senot et al. 2010] compara diferentes estratégias de agregação com o objetivo de
criar um framework de seleção automática da estratégia de agregação que mais se adeque
às caracterı́sticas do grupo [Senot et al. 2010]. Para isso, perfis de agregação são gerados
a partir das estratégias de agregação e comparados, a partir do cálculo de similaridade,
com um perfil de referência. O objetivo é definir qual estratégia de agregação mais se
aproxima desse perfil de referência com base nas diferentes caracterı́sticas dos grupos. O
trabalho, entretanto, não propõe qualquer nova estratégia de agregação.
[Bekkerman et al. 2006] aplica uma metodologia de negociação cooperativa para
a solução do problema de recomendação para grupo. Cada usuário é representado por um
agente negociador, todos com o mesmo comportamento. Uma vez que as recomendações
individuais são obtidas, o processo de negociação se inicia.
Este artigo propõe uma abordagem baseada em um jogo não-cooperativo de
informações imperfeitas para recomendação para grupos. Esta abordagem modela os
itens retornados pelas estratégias de agregação como ações do jogo e a recomendação
como um problema de encontrar o equilı́brio de Nash. Ao contrário do trabalho de
[Bekkerman et al. 2006], onde dentro de uma negociação o agente pode aceitar ou recusar uma oferta, em nossa abordagem o cálculo do equilı́brio de Nash seleciona de forma
racional o conjunto de itens.
Para validar a abordagem, experimentos com a base do MoviesLens1 foram realizados. Estes experimentos compararam a satisfação de grupos homogêneos e heterogêneos de diferentes tamanhos com a recomendação utilizando o equilı́brio de Nash
como estratégia de agregação e a satifação desses mesmos grupos com a recomendação
utilizando diversas outras estratégias de agregação de preferência individual encontradas
na literatura. A satisfação dos grupos foi calculada a partir de uma função de utilidade que
utiliza como base de cálculo o valor da previsão de preferência individual dos membros
do grupo para os itens recomendados.
A seção 2 introduz sistemas de recomendação para grupos e as estratégias de
agregação mais discutidas na literatura. Na seção 3, definimos formalmente o problema
da recomendação para grupos como um jogo não-cooperativo de informações imperfeitas
onde os itens a serem recomendados são frutos dos equilı́brios de Nash computados. A
seção 4 descreve os experimentos realizados com a base MovieLens e resultados obtidos
são devidamente discutidos. Finalmente, a seção 5 traz algumas conclusões e possibilidades de trabalhos futuros.
2. Sistema de Recomendação para Grupos
Apesar de sistemas de recomendação tradicionalmente recomendarem itens para usuários
individuais, há um crescente aumento de pesquisas na linha de recomendação para grupos
de usuários [Masthoff 2011, Jameson e Smyth 2007]. Sistemas de Recomendação para
grupo geram recomendações com o objetivo de satisfazer um grupo de usuários com
interesses potencialmente conflitantes. Os domı́nios com mais destaque na utilização de
recomendação para grupos são: filme, viagem, música, programas de TV e restaurante.
A necessidade de escolha de um método de agregação é a diferença mais estudada entre recomendação para grupos e recomendação para indivı́duos. Apesar das várias
abordagens de agregação diferirem na maneira de manipular e representar as preferências
dos usuários, praticamente todas fazem uso de um dos três esquemas: (1) agrega um
conjunto de recomendações individuais, (2) constroi um modelo de preferência do
grupo, (3) agrega as avaliações/preferências para itens particulares.
Masthoff [Masthoff 2004] enumera diversas estratégias de agregação de preferência individual baseadas na Social Choice Theory [Sen 1986, Pennock et al. 2000].
A problemática relacionada a social choice ou group decision making é decidir o que é
melhor para um grupo dado a opinião dos indivı́duos pertencentes ao mesmo grupo.
Antes de apresentar as estratégias é preciso saber que cada uma possui vantagens
e desvatagens e a comparação entre elas necessita de critérios de qualidade bem definidos.
Entre alguns critérios que podem ser adotados estão [Jameson e Smyth 2007]:
• Maximizar satisfação média: pode ser observado por uma função que computa
algum tipo de média das previsões de satisfação para cada membro para usar como
base de seleção dos itens candidatos.
• Minimizar miséria: deve evitar uma solução que deixe um ou mais membros
muito insatisfeitos com a recomendação.
1
http://www.grouplens.org/node/73/
• Assegurar algum grau de justiça: uma solução que satisfaz todo mundo igualmente bem é em geral preferı́vel a uma que satisfaz alguns em detrimento dos
outros.
Entre as principais estratégias de agregação definidas na Social Choice Theory,
estão:
• Average: assume uma importância igual para todos os membros do grupo e computa a média da satisfação de todo o grupo para qualquer item dado. A desvantagem desta estratégia é sua grande dependência das dimensões do grupo. Para
grupos com poucos membros, por exemplo, a opinião de cada membro tem maior
impacto na média.
• Fairness: items de maior preferência para todos os usuários são selecionados.
Quando itens são avaliados igualmente por um usuário, a opinião dos outros
usuários é levada em consideração. A fundamentação lógica desta estratégia é
que não é tão ruim aceitar algo que não é de seu agrado desde que você também
receba algo de seu agrado como compensação.
• Plurality Voting: o usuário sempre seleciona o item com maior preferência individual em um sistema de votação. Apesar de satisfazer a maioria do grupo,
eventualmente alguns membros permanecem insatisfeitos.
• Least Misery: assume a avaliação do membro menos satisfeito com um item
dado como o valor da satisfação para todo o grupo. A desvantagem dessa estratégia é que um item em que todos os membros estão pouco satisfeitos pode
ser recomendado no lugar de um item onde apenas um usuário está muito insatisfeito e os demais muito satisfeitos, podendo ocorrer miséria para todo o grupo na
recomendação.
• Most Pleasure: assume a avaliação do membro mais satisfeito com um item dado
como o valor da satisfação para todo o grupo. A desvantagem dessa estratégia
é que qualquer avaliação menos satisfatória para este item por parte dos outros
membros não terá nenhum efeito na recomendação.
• Utilitarian Multiplicative: os valores das avaliações dos membros para um dado
item são multiplicados e quanto maior esse valor, mais relevante o item será na
lista de recomendação para o grupo. Possui a mesma desvantagem da estratégia
Average.
• Average Without Misery Strategy: gera uma nova lista de avaliações com as
médias das avaliações individuais dos membros do grupo para um dado item,
porém retira os itens que possuam qualquer avaliação de preferência abaixo de
um valor mı́nimo.
Os diferentes tipos de grupos influenciam na maneira com que os usuários avaliam o resultado da estratégia de agregação adotada. No Polylens [O’Connor et al. 2002],
formado por grupos permanentes, a estratégia adotada Least Misery foi bem aceita por
77% dos usuários; o fato dos membros se conhecerem previamente acaba contribuindo
para tentarem evitar com relativo sucesso a insatisfação uns dos outros.
Outra caracterı́stica do grupo que deve ser analisada na escolha das estratégias
de agregação é a homogeneidade e heterogeneidade entre os membros do grupo. Na
avaliação do YU’s TV RECOMMENDER [Yu et al. 2006], a estratégia de agregação Average funcionou bem para grupos próximos da homogeneidade, porém o resultado piorou
significativamente quando o grupo se aproximou da heterogeneidade.
De acordo com [Senot et al. 2011], essas estratégias de agregação podem ser divididas em três categorias:
• estratégias baseadas em consenso: considera as preferências de todos os membros do grupo (ex: Average, Average without Misery, Fairness e Multiplicative).
• estratégias baseada em maioria: utiliza os itens mais populares entre os membros do grupo (ex: Plurality Voting).
• estratégias borderline: considera somente um subconjunto de itens, em perfis
individuais, baseados nas regras de usuários ou qualquer outro critério relevante.
Entre as estratégias nesta categoria destaca-se a estratégia Dictatorship, que usa
somente a preferência de um único membro que impõe seu gosto para o resto do
grupo. As estratégias Least Misery e Most Pleasure consideram apenas o menor e
o maior nı́vel de interesse, respectivamente, entre os membros do grupo.
3. Definição do Problema
Seja I = {i1 , i2 , ..., in } e U = {u1 , u2 , ..., uk } o conjunto de todos os itens e todos os
usuários respectivamente. Considere G o conjunto de todos os grupos que podem ser
formados por U com pelo menos 2 membros e, portanto, |G| = 2k − k − 1. Considere,
finalmente, g ∈ G, sendo |g| definido como o número m de membros do grupo g. Se, por
exemplo, um grupo é composto pelos usuários u1 , u2 e u3 , então este pode ser expresso
como g = {u1 , u2 , u3 } e |g| = 3.
Assuma p(u, i) como a avaliação para o item i fornecida pelo usuário u, e p(u, i) =
0, se o usuário u não avaliou o item i. Considere p̂(u, i) como a previsão de avaliação do
item i para o usuário u. A previsão de avaliação p̂(u, i) é obtida de uma função de previsão
p̂ que utiliza mais comumente uma função de similaridade entre itens s : I x I → R e/ou
entre usuários s : U x U → R.
A lista de itens recomendados R é definida pelos x melhores itens avaliados pelo
grupo com base em uma estratégia de agregação. As estratégias de agregação fazem uso
do valor da avaliação ou da previsão de avaliação do item pelo membro do grupo. No
exemplo da estratégia de agregação Average, representada na Equação 1, utilizou-se a
previsão de avaliação para o cálculo:
m
P
Ri = average(p̂(u, i)) =
p̂(uj , i)
j=1
m
(1)
Para cada estratégia, Ri retorna uma tupla que fornece um valor associado ao item
i que é utilizado para gerar um ranking entre os itens, onde os x primeiros itens formam
o conjunto R de recomendação para o grupo.
Dado um conjunto recomendação R de x itens para o grupo g, a satisfação média
desta recomendação para o usuário u, onde u ∈ g, é calculada pela função de utilidade
representada pela Equação 2:
x
P
S(u, R) =
p̂(u, ij )
j=1
x
(2)
O valor da satisfação média da recomendação R de tamanho x para o grupo g de
tamanho m é calculada pela função de utilidade representada pela Equação 3:
m
P
S(g, R) =
S(uj , R)
j=1
m
(3)
A maximização do S(g, R) significa a maximização da satisfação média dos membros do grupo para a lista de itens de recomendação.
A proposta deste artigo é modelar como um jogo de informações imperfeitas na
forma normal a seleção dos itens para recomendação para o grupo como o problema de
encontrar os equilı́brios de Nash no jogo.
Um jogo na forma normal é composto por uma tupla (m, A, f), onde:
• m é o número de jogadores, indexado por j;
• A = A1 x ... x Am , onde Aj é o conjunto finito de ações disponı́veis para o jogador
j; Cada vetor a = (a1 , ..., am ) ∈ A é conhecido como perfil de ações.
• f = (f1 , ..., fm ) onde fj : A → R é uma função de utilidade (ou payoff) para o
jogador j.
Seja Raj o conjunto de itens de tamanho x retornados pela estratégia da ação aj do jogador
j. Para o cálculo da função payoff para cada jogador, considera-se a união apenas do item
de maior preferência para o usuário j do conjunto de itens retornado pela estratégia aj . A
união está representada na Equação 4.
R=
m
[
Raj
(4)
j=1
A função payoff (Equação 5) calcula a satisfação do membro u do grupo com o
resultado das ações escolhidas por todos os jogadores em uma dada estratégia do jogo.
|R|
P
f=
p̂(u, iw )
w=1
|R|
, onde iw ∈ R
(5)
Intuitivamente, o jogador membro do grupo deseja encontrar a estratégia de
agregação que maximize o resultado da sua função payoff. Um equilı́brio de Nash é
um perfil de estratégia estável: não há qualquer incentivo para que o jogador desvie da
estratégia pertencente ao equilı́brio.
As ações disponı́veis no jogo foram escolhidas entre os itens retornados pelas
estratégias de agregação ao invés de todos os itens possı́veis de serem recomendados.
Esta decisão procura se aproximar mais da realidade dos usuários considerando o resultado de um experimento com participantes que mostrou que indivı́duos usam algumas
das estratégias de agregação apresentadas na seção 2, principalmente as estratégias Average, Average Without Misery e Least Misery [Masthoff 2004]. Este mesmo experimento
mostrou que os participantes se preocupam com o equilı́brio entre justiça e atender suas
próprias preferências.
O equilı́brio com a justiça na abordagem deste artigo é buscado através do uso
de diferentes estratégias de agregação como ações do jogo. Já para atender as próprias
preferências dos membros do grupo, a função payoff considera exclusivamente as preferências do jogador na escolha do item de maior preferência entre os itens retornados
pela estratégia de agregação como ação do jogo de fato e também no cálculo do equilı́brio.
Consequentemente, cada jogador possui um perfil de ações diferentes e, portanto, para as
mesmas estratégias, os jogadores podem escolher itens diferentes como a ação de fato do
jogador.
Quando ocorre do cálculo do equilı́brio retornar mais de um equilı́brio de Nash
para o grupo, significando que mais de um conjunto diferente de itens pode ser recomendado para o grupo, a escolha de qual desses conjunto será recomendado é realizada
através do uso de uma função de média harmônica (Equação 6). Esta função realiza o
cálculo a partir das preferências dos membros do grupo para o conjunto de itens de cada
um dos equilı́brios de Nash. O conjunto que possui a maior média harmônica, será escolhido como o conjunto a ser recomendado para o grupo. A decisão de utilizar uma
média harmônica também considerou a justiça entre os membros do grupo, visto que ao
contrário da média aritmética, a média harmônica ”’prioriza”’ conjuntos de valores de
menor variância.
n
harmonic(x) = P
n
1
i=1
(6)
xi
4. Experimento
Por ser bastante utilizada em vários outros estudos de recomendação para grupos, mesmo
não havendo informações sobre grupos de usuários, a base de dados do MovieLens foi
escolhida para validação da abordagem. Essa base de dados possui no total 943 usuários,
1.682 filmes e 100.000 avaliações no intervalo de 1 a 5.
Na primeira etapa do experimento, utilizando como base as avaliações individuais p(u, i) dos usuários, gerou-se uma lista de previsão de avaliação de todos os filmes
ainda não assistidos por cada usuário. As previsões de avaliação foram geradas a partir de um algoritmo de filtragem colaborativa baseado em KNN (K-Nearest Neighbor)
[Dasarathy 1991].
Após a geração das previsões de avaliação, pode-se notar, como apresentado na
Figura 1(a), que a distribuição dos valores das previsões obtidas das avaliações da base
do MovieLens tendem para valores altos, com média de 4,01 e desvio padrão de 0,41.
Esta distribuição representa o cenário 1 do experimento. Para se contrapor a este cenário,
gerou-se uma outra distribuição artificial com média de 2,5 e desvio padrão 1,01 para os
valores das previsões de avaliação para os mesmos itens do cenário 1, com o objetivo
de representar uma distribuição mais próxima de uma distribuição normal e com valores
mais dispersos pela escala de avaliação, conforme observa-se na Figura 1(b).
No experimento, os itens potencialmente a serem recomendados para cada grupo
pertencem ao conjunto de items que não foram avaliados por nenhum membro do grupo.
Por tanto, eles são obtidos a partir da intersecção das listas de itens de previsão de
avaliação de cada usuário do grupo. Os itens pertencentes a esta lista e os valores das
(a)
(b)
Figura 1. Histogramas de previsão de avaliação para diferentes cenários.
previsões que definem as preferências individuais dos usuários do grupo no experimento
serão utilizadas nas estratégias de agregação de preferências.
Como a base do MovieLens não possui grupos definidos, fez-se necessário a
formação automática dos grupos. Nesta etapa, os usuários da base do MovieLens foram
agrupados, utilizando o vetor de previsão de preferência de cada usuário, em 31 clusters
com centróide aleatórios com base no método K-Means. Criou-se um conjunto de cluster
para cada um dos cenários do experimento. A partir desses clusters, foram selecionados
aleatoriamente membros para formar dois tipos de grupos: homogêneo, contendo usuários
do mesmo cluster e heterogêneo, contendo usuários de clusters diferentes. Foram ainda
gerados 20 grupos desses dois tipos com 3, 5 e 7 número de membros. Efetuaram-se então
10 execuções para cada cenário nessas configurações do experimento.
Na quarta etapa do experimento, as estratégias de agregação selecionadas como
ações disponı́veis para o jogo (Average, Least Misery e Plurality Vote) foram aplicadas para a criação dos perfis de agregação do grupo. Estas estratégias de agregação
foram consideradas especificamente por estarem em categorias diferentes segundo
[Senot et al. 2010], e com isso apresentarem diferentes itens como resultados.
Para construção dos jogos na forma normal e cálculo do equilı́brio de Nash,
utilizou-se a ferramenta Gambit [McKelvey et al. 2010] e a sua interface na linguagem
Python. Para o experimento deste artigo, calculou-se apenas o equilı́brio de Nash para
as estratégias puras. Experimentos futuros podem considerar o cálculo dos equilı́brios de
Nash para estratégias mistas.
Após o calculo, comparou-se o resultado da estratégia de agregação do equilı́brio
de Nash com as estratégias de agregação: Least Misery (L.M.), Average (Ave.), Average
Without Misery (A.W.M), Multiplicative (M.), Most Pleasure (M.P.), Fairness (F.) e Plurality Vote (P.V.). O resultado baseou-se no cálculo da satisfação a partir da função de utilidade (Equação 3) dos itens recomendados para o grupo por cada estratégia de agregação.
4.1. Resultados do cenário de experimentação 1
O resultado do experimento neste cenário, que utiliza a previsão de avaliação a partir das
avaliações dos usuários da base do MovieLens, é apresentado nas Tabelas 1, 2 e 3. Este
cenário responde a pergunta: qual o desempenho da estratégia de agregação utilizando
o equilı́brio de Nash em relação às demais estratégias de agregação, considerando um
cenário em que as avaliações e as previsões de avaliação se concentram em valores altos
da escala de avaliação, como é o caso da base do MovieLens?
Tabela 1. Previsão de satisfação média para grupos de 3 membros.
Tipo
S
L.M.
Ave.
A.W.M.
M
M.P.
F
P.V.
Equilibrium
µ
σ
µ
Hetero.
σ
4.632
0.152
4.588
0.169
4.675
0.135
4.637
0.149
4.675
0.135
4.637
0.149
4.675
0.135
4.637
0.149
4.488
0.189
4.473
0.170
4.695
0.154
4.642
0.182
4.591
0.169
4.551
0.193
4.653
0.164
4.616
0.159
Homo.
Tabela 2. Previsão de satisfação média para grupos de 5 membros.
Tipo
S
L.M.
Ave.
A.W.M.
M
M.P.
F
P.V.
Equilibrium
µ
σ
µ
Hetero.
σ
4.456
0.167
4.422
0.152
4.509
0.156
4.473
0.139
4.509
0.156
4.473
0.139
4.509
0.156
4.473
0.139
4.371
0.189
4.385
0.152
4.536
0.187
4.489
0.164
4.410
0.241
4.340
0.208
4.484
0.159
4.442
0.137
Homo.
Tabela 3. Previsão de satisfação média para grupos de 7 membros.
Tipo
S
L.M.
Ave.
A.W.M.
M
M.P.
F
P.V.
Equilibrium
µ
σ
µ
Hetero.
σ
4.357
0.213
4.307
0.161
4.404
0.216
4.343
0.170
4.404
0.216
4.343
0.170
4.404
0.216
4.343
0.170
4.323
0.206
4.303
0.161
4.450
0.238
4.379
0.175
4.277
0.259
4.215
0.167
4.374
0.218
4.319
0.165
Homo.
Nessas três tabelas é possı́vel verificar que por utilizarem uma distribuição com
valores de previsão de avaliação concentrados nos valores 4 e 5 como preferência individual dos usuários para os itens, as estratégias baseada em consenso obtiveram melhores
resultados do que todas as demais estratégias, inclusive melhor que a estratégia utilizando
o equilı́brio de Nash. A estratégia de agregação Fairness obteve o melhor resultado auxiliado pelo fato de retornar menos itens que as demais estratégias e com isso obteve uma
melhor previsão de satisfação média.
A estratégia utilizando equilı́brio de Nash para este cenário obteve desempenho
melhor comparado à estratégia baseada em maioria representada pela Plurality Voting e
também melhor desempenho comparado às estratégias baseadas em borderline representadas pela Least Misery e Most Pleasure.
O experimento também confirmou, assim como em diversos outros estudos
[Senot et al. 2010], que o aumento na quantidade de membros nos grupos leva a uma
diminuição na satisfação média do grupo para o conjunto de recomendação. Esta
diminuição na satisfação ocorre em todas as estratégias e nos dois cenários do experimento, pois há uma diminuição do consenso com o aumento do número de membros.
4.2. Resultados do cenário de experimentação 2
O resultado do experimento neste cenário utiliza a distribuição artificial dos valores de
previsão de avaliação dos itens mais próxima da distribuição normal do que a distribuição
do cenário 1. Pode-se considerar que os grupos gerados nesse cenário tendem a ser no
geral mais heterogêneos com relação às previsões de avaliação dos itens do que no cenário
1. O resultado é apresentado nas tabelas 4, 5 e 6. Este cenário responde a pergunta:
como se comporta a estratégia de agregação utilizando o equilı́brio de Nash em relação às
demais estratégias considerando um cenário em que as avaliações dos itens tendem para
valores mais esparsados na escala de avaliação?
Tabela 4. Previsão de satisfação média para grupos de 3 membros.
Tipo
S
L.M.
Ave.
A.W.M.
M
M.P.
F
P.V.
Equilibrium
µ
σ
µ
Hetero.
σ
3.361
0.903
3.314
0.730
3.718
0.957
3.685
0.456
3.702
0.992
3.442
1.383
3.706
0.979
3.586
0.822
3.241
0.848
3.275
0.466
3.513
0.912
3.520
0.445
3.427
0.912
3.449
0.502
3.658
0.949
3.637
0.464
Homo.
Tabela 5. Previsão de satisfação média para grupos de 5 membros.
Tipo
S
L.M.
Ave.
A.W.M.
M
M.P.
F
P.V.
Equilibrium
µ
σ
µ
Hetero.
σ
2.961
0.750
2.830
0.449
3.264
0.785
3.152
0.305
3.238
0.847
2.747
1.402
3.252
0.804
3.050
0.523
2.924
0.724
2.867
0.305
3.086
0.738
3.038
0.277
3.112
0.768
3.023
0.310
3.206
0.776
3.103
0.307
Homo.
Tabela 6. Previsão de satisfação média para grupos de 7 membros.
Tipo
S
L.M.
Ave.
A.W.M.
M
M.P.
F
P.V.
Equilibrium
µ
σ
µ
Hetero.
σ
2.705
0.691
2.602
0.352
2.955
0.718
2.787
0.320
2.896
0.790
2.144
1.438
2.938
0.757
2.713
0.419
2.726
0.665
2.643
0.289
2.848
0.683
2.738
0.293
2.854
0.712
2.692
0.340
2.899
0.714
2.724
0.311
Homo.
Nessas últimas três tabelas é possı́vel verificar que o resultado para este cenário
da estratégia de agregação utilizando o equilı́brio de Nash obteve um melhor resultado do
que o cenário 1 em comparação ao desempenho das demais estratégias de agregação.
Neste cenário, a estratégia de agregação utilizando equilı́brio de Nash ficou com
desempenho inferior apenas comparado à estratégia Average para qualquer número de
membros e tipos de grupo. Porém, ao contrário do cenário 1, neste cenário a estratégia
de agregação utilizando o equilı́brio de Nash obteve melhor desempenho do que as estratégias Multiplicative e Average Without Misery quando calculado a satisfação para grupos heterogêneos.
Neste cenário, a estratégia de agregação utilizando equilı́brio de Nash não obteve
desempenho melhor do que a estratégia Fairness, mesmo recomendando mais itens do
que essa estratégia, somente para 7 membros e para grupos heterogêneos. Esse melhor
desempenho especı́fico da estratégia Fairness foi obtido devido ao aumento na diferença
no número de itens retornados entre a estratégia utilizando o equilı́brio de Nash e a estratégia Fairness.
A estratégia utilizando equilı́brio de Nash obteve desempenho melhor comparado
às estratégias baseadas em borderline e baseadas em maioria, assim como ocorreu no
cenário 1.
5. Conclusão
Neste artigo, o problema da recomendação de itens para grupos de pessoas foi definido
como um jogo não-cooperativo. Equilı́brio de Nash foi utilizado para seleção do conjunto
de itens a serem recomendados para o grupo visando o satisfazer a escolha mais justa
para o grupo e as preferências individuais de seus membros. As estratégias de agregação
Average, Plurality Vote e Least Misery foram escolhidas para fornecer os itens utilizados como ação do jogo, como forma de priorizar a justiça. A justiça também foi buscada na seleção do conjunto de itens em equilı́brio de Nash que seriam retornados como
recomendação para o grupo. A satisfação da preferência dos membros do grupo foi buscada através do cálculo do equilı́brio que considera apenas as preferências de cada usuário
de forma racional.
Experimentos foram realizados com a base MovieLens e compararam a abordagem utilizando a identificação dos equilı́brios com as estratégias Least Misery, Average,
Average Without Misery, Multiplicative, Most Pleasure, Fairness e Plurality Vote que representam o Estado da Arte da pesquisa em recomendação para grupos.
Resultados mostraram que na satisfação alcançadada, a abordagem do equilı́brio
obteve um resultado melhor, comparado às demais estratégias de agregação, no cenário
em que os valores de previsão de avaliação estão distribuı́dos de forma mais esparsa pela
escala de valores do que no cenário em que os valores de previsão de avaliação estão
concentrados em valores altos da escala de avaliação.
Este melhor resultado no segundo cenário deve-se a previsão de avaliação dos itens
serem distribuı́da de forma mais esparsa entre a escala de valores, ou seja, as avaliações
entre os membros, mesmo em grupos homogêneos (membros no mesmo cluster), tendem a ser mais heterogêneas do que no cenário 1. Portanto, quanto mais heterogêneo as
avaliações entre os grupos, melhor o desempenho da estratégia baseada no equilı́brio em
comparação com as demais estratégias.
Novos experimentos estão sendo realizados com o intuito de demonstrar quantas e
quais são as melhores estratégias de agregação para seleção dos itens a serem utilizados no
cálculo do equilı́brio de Nash. Outras métricas de qualidade, como Justiça e Minimização
de Miséria, também serão utilizadas para avaliar a qualidade da proposta.
Referências
Adomavicius, G. e Tuzhilin, A. (2005). Toward the next generation of recommender
systems: a survey of the state-of-the-art and possible extensions. IEEE Transactions
on Knowledge and Data Engineering, 17(6):734–749.
Bekkerman, P., Kraus, S., e Ricci, F. (2006). Applying cooperative negotiation methodology to group recommendation problem. In Felfernig, A. e Zanker, M., editors,
Proceedings of Workshop on RecSys in ECAI 2006, pages 72–75, Riva del Garda, Italy.
Burke, R. (2002). Hybrid Recommender Systems: Survey and Experiments. Jornal of
UMUAI, 12(4):331–370.
Dasarathy, B. W. (1991). Nearest Neighbor (NN). Los Alamitos, CA. IEEE Computer
Society Press.
Jameson, A. (2004). More than the sum of its members: challenges for group recommender systems. In Proceedings of AVI ’04, page 48, New York, USA. ACM Press.
Jameson, A. e Smyth, B. (2007). Recommendation to Groups. In Brusilovsky, P., Kobsa,
A., e Nejdl, W., editors, The Adaptive Web (LNCS), volume 4321 of LNCS, pages
596–627. Springer Berlin Heidelberg, Berlin, Heidelberg.
Masthoff, J. (2004). Group Modeling: Selecting a Sequence of Television Items to Suit a
Group of Viewers. Jornal of UMUAI, 14(1):37–85.
Masthoff, J. (2011). Group recommender systems: combining individual models. In
Ricci, F., Rokach, L., Shapira, B., e Kantor, P. B., editors, Recommender Systems
Handbook, page 677. Springer US, Boston, MA.
McKelvey, R. D., McLennan, A. M., e Turocy, T. L. (2010). Gambit: Software Tools for
Game Theory.
O’Connor, M., Cosley, D., Konstan, J. A., e Riedl, J. T. (2002). PolyLens: A Recommender System for Groups of Users. In Prinz, W., Jarke, M., Rogers, Y., Schmidt,
K., e Wulf, V., editors, ECSCW 2001, pages 199–218. Kluwer Academic Publishers,
Dordrecht.
Pennock, D. M., Horvitz, E., e Giles, C. L. (2000). Social choice theory and recommender
systems: Analysis of the axiomatic foundations of collaborative filtering. In Proc. 17th
AAAI.
Sen, A. (1986). An adaptive in-vehicle multimedia recommender for group users . In
Handbook of Mathematical Economics, volume 3. Elsevier Science.
Senot, C., Kostadinov, D., Bouzid, M., Picault, J., e Aghasaryan, A. (2011). Evaluation
of Group Profiling Strategies. In Proceedings of the 22nd Int. Joint Conf. on Art. Int.,
pages 2728 –2733, Barcelona. the Association for the Adv. of Art. Int. (AAAI).
Senot, C., Kostadinov, D., Bouzid, M., Picault, J., Aghasaryan, A., e Bernier, C. (2010).
Analysis of Strategies for Building Group Profiles. In Bra, P., Kobsa, A., e Chin, D.,
editors, UMAP, volume 6075 of LNCS, pages 40–51. Springer Berlin Heidelberg.
Yu, Z., Zhou, X., Hao, Y., e Gu, J. (2006). TV Program Recommendation for Multiple
Viewers Based on user Profile Merging. Jornal of UMUAI, 16(1):63–82.
Download

Computando o Equilıbrio de Nash para estratégias de agregaç ˜ao