Agentes que Negociam...
Negociação... O que é?
Utilidades... E Estratégias
Equilíbrio de Nash
Negociando Recursos
Negociando mais...
Leilões
Protocolos
Cenas dos Próximos Capítulos
1
Algumas Observações
Importantes
“Não há SMA de um só agente...”
Diferentes agentes tem diferentes
influências no ambiente... Lembram da
figurinha?
Agentes estão conectados por relações
(muitas vezes de dependência), e têm
objetivos próprios.
2
Negociando...
De acordo com o Aurélio...
Negociar significa manter relações para
concluir tratados ou convênios
Para SMA...
Negociação é uma forma de interação entre
agentes self-interested. Em outras palavras,
é o processo de conseguir um acordo para
cooperação entre agentes buscando seus
objetivos pessoais.
3
Negociamos ...
Para Determinar
A distribuição das Tarefas
A distribuição dos Recursos
A coordenação das atividades
Entre
Dois Agentes
Entre múltiplos agentes
Formação de coligações
4
O Processo deve Ser
Eficiente
Maximiza o somatório das utilidades.
Estável
Racionalidade Individual
Racionalidade de grupo
Deve ser preferível atuar em grupo
É melhor participar deste grupo do que de outro
Racionalidade de coligação
Ninguém quer sair da coligação
5
Como possibilitar?
Precisamos definir...
A linguagem utilizada pelos participantes
Como cada um decide suas posições?
Os Protocolos seguidos pelos agentes.
6
Representando Preferências
Função de Utilidade
i e j são dois agentes
= {1, 2,...,n}
x é um estado do mundo.
As preferências dos agentes são capturadas
pela função de utilidade.
i : j :
7
Por exemplo...
Imagine que eu seja um agente querendo
ir prá casa.
1 = chego em casa em 20min
2 = pego a caxangá e chego em 1 hora...
Em qual dos casos eu fico mais feliz?
E... Se tiver mais de um agente envolvido?
8
Encontros...
Suponha que agentes i e j (capazes de duas
ações C ou D) têm a seguinte função:
i(D,D) = 1 i(D,C) = 1 i(C,D) = 4 i(C,C) = 4
j(D,D) = 1 j(D,C) = 4 j(C,D) = 1 j(C,C) = 4
O que você faria no lugar de i?
9
Matriz de Recompensa
i
D
C
j
D
4
4
C
1
4
4
1
1
1
10
Estratégias Dominantes
Que ações tomar?
Uma estratégia 1 domina 2 para o agente i se
todo o elemento de 1 é preferido a todos os
elementos de 2.
1 domina fortemente 2 se 1 1 , 2 2 , 1
>i 2
Nem sempre teremos estratégias fortemente
dominantes! As vezes precisamos ter estratégias
fracamente dominantes.
11
Equilíbrio de Nash
Duas estratégias estão em EN se:
Considerando que agente i executa S1 agente
j não pode fazer melhor que executar S2.
Considerando que o agente j vai executar S2 i
não pode fazer melhor que S1
No equilíbrio, os agentes não têm incentivo
de se desviar... O problema é que nem todas
as situações tem EN.
12
Pensando mais um pouco...
Interações Competitivas...
Suponha que temos dois agentes i e j, onde i
prefere um estado 1 sss j prefere 2.
Interações de soma Zero.
Quando a i (1) + j (1) = 0
Ex. um jogo de xadrez
Vamos ver um exemplo?
13
Exemplos de Interações
Competitivas
O dilema do Prisioneiro
Dois homens são acusados de um crime e
mantidos incomunicáveis. Se um confessar e
outro não – um vai ser livre e o outro preso
por 3 anos
Se ambos confessarem ambos serão presos
por dois anos
Se nenhum confessar ambos serão presos
por um ano.
14
Recompensas...
i
D
C
j
D
2
2
C
0
5
5
0
3
3
15
Decidindo o que fazer...
Se eu cooperar, a maior recompensa é
zero
Se eu desertar, a maior recompensa é
dois...
Então... É melhor desertar!
O dilema do prisioneiro também pode
ser jogado interativamente...
16
Algumas Estratégias...
All-D
Randômico
Sempre deserta
O nome já explica...
Tit-for-Tat
Coopere no primeiro round
No round t faça o que seu oponente fez
no round t-1
17
Mais estratégias...
Tester: explorador de programas que não
castigavam deserção. Deserta na primeira
rodada. Se o oponente não retaliasse,
jogava Tit-for-tat, senão, cooperava por
dois rounds e desertava no terceiro.
Joss-Tit-for-tat, porém desertava 10% das
vezes em que deveria cooperar...
18
Mas...
E quando computar utilidades for muito
caro?
Negociar envolve planejamento...
E um modelo do oponente!
Vários aspectos sob negociação...
19
Agora... E esse babado de
concordar?
Quando o problema é alocar recursos...
Leilões
Se precisamos coordenar tarefas,
decidir o que e quando fazer...
Coordenação
Argumentação
20
Um parêntese...
Negociação
Ato de Discutir com o objetivo de atingir um
consenso.
Argumentação
Apresentar argumentos contra ou a favor de
algo, com o intuito de convencer alguém de
nossa própria opinião.
21
Voltando...
Consensos dependem da capacidade de
negociação e argumentação dos agentes
envolvidos...
Negociação governada por protocolos...
Como desenvolver estratégias para os
agentes utilizarem enquanto negociam?
22
Parâmetros (Possíveis) no
design de Protocolos...
Sucesso Garantido... Em algum momento!
Maximização do Bem-Estar Social
A soma das utilidades é maximizada
Pareto-Eficiência
Não há nenhum outro resultado que vá tornar
um agente melhor de vida sem prejudicar os
outros.
23
Parâmetros (Possíveis) no
design de Protocolos...
Individualmente Racional
Estabilidade
Jogar limpo é o melhor a fazer
Um protocolo é estável se incentiva os agentes a se
comportarem de uma determinada forma
Simplicidade e Distribuição
É fácil ver qual a melhor forma de agir
Não há autoridade central
24
Alocando Recursos... Os
Leilões
Forma de Negociação cada vez mais comum...
Duas classes de Agentes:
Leiloeiro
Compradores
Alguns fatores alteram o protocolo...
Valor público?
Ou privado?
Valor Correlato
25
Dimensões dos Protocolos
Determinação do Vencedor
Lances
First x Second Price
Open-Cry
Sealed Bid
Mecanismo Utilizado
One Shot
Crescente
Descendente
26
Leilões Ingleses (English
Auctions)
Características
Open Cry
First Price
Ascending
Que estratégia utilizar?
Aumentar o lance em pequenos incrementos,
e depois se retirar
Maldição do Vencedor
27
Leilões Holandeses (Dutch)
Características
Open Cry
Descending
Não Há estratégias dominantes
Também sujeitos à Maldição do
Vencedor.
28
Outros
First Price Sealed Bid
One Shot
Agente deve oferecer um pouco menos do
que o valor estimado... Mas quanto menos?
Vickrey
Second Price Sealed Bid
Oferecer o valor real da mercadoria.
Pode gerar comportamento anti-social ...
29
Lucro esperado
Com compradores risk-neutral
Com compradores avessos ao risco
Os 4 tipos geram lucros parecidos
Dutch e First Price Sealed são os
melhores
Para Leiloeiros Avessos ao Risco
English e Vickrey
30
Mentiras e Conluios
Nada impede que os compradores se
juntem...
Uma solução...
Impedir os compradores de se
identificarem...
Mas o leiloeiro também pode ser
desonesto!
Contra-especulação...
31
Negociando...
Para situações mais complexas, leilões
não bastam...
Qualquer negociação tem 4 componentes:
Conjunto de negociação
Um protocolo
Uma coleção de estratégias
Uma regra que determina quando o consenso
foi atingido
32
Um Protocolo Famoso... A
Contract net
A1 reconhece que tem um problema
A1 anuncia que precisa de um serviço
Pode envolver um broadcast geral... Um
limitado... Ou um contato direto.
Ai,...,Aj respondem, oferecendo seus
préstimos.
A1 contrata o serviço, via award.
Quando o contratado termina, envia um
relatório ao contratante.
33
Quando recebemos as
mensagens...
Processando um anúncio...
Agente decide se é candidato...
Guarda os detalhes da tarefa, para
poder competir por elas...
Processando a oferta
Gerentes guardam as ofertas até o
deadline. Depois a tarefa é alocada a um
competidor.
34
Quando recebemos as
mensagens...
Processando o Award
Ganhador começa os procedimentos para
executar a tarefa.
Requerimentos e Informação
O conteúdo que chega é adicionado à
base de conhecimento do agente.
35
Complicando...
Quantas questões estão sendo discutidas?
Comprar um carro x Pechinchar no preço da cerveja
Quem está envolvido?
Um prá um
Muitos prá um
Muitos prá muitos
Podemos ter até n(n-1)/2 threads de negociação
36
Dois tipos fundamentais de
domínio
Orientados a Tarefas (DOT)
Representados por uma tupla <T,Ag,C>
T é o conjunto de todas as tarefas
Ag = {1,..,n} é o conjunto de participantes
C é a função de custo para cada subconjunto
de tarefas.
37
Acordos... (Deals)
Um acordo é uma alocação de tarefas.
A utilidade do acordo é a diferença
entre o custo das tarefas que o agente
faria inicialmente (Ti) e as tarefas que
lhe foram atribuídas.
Utilityi() n= c(Ti) –c(i)
Se os agentes não chegarem a um acordo
temos o conflict deal.
38
Mais sobre acordos
Um acordo 1 domina 2 se
1 é tão bom quanto 2 para todos os agentes.
1 é melhor que 2 para algum agente.
1 domina fracamente 2 se a primeira
condição se verifica.
Um acordo que não é dominado por nenhum
outro é chamado de pareto-optimal.
é individual racional se domina
fracamente o acordo de conflito
39
Assim...
O conjunto de possibilidades a colocar
em negociação consiste nos conjuntos
de acordos que são
Individual racional
Pareto optimal
40
Um protocolo...
Protocolo de Concessão Monotônico
Negociação acontece em rounds.
No primeiro, ambos os agentes propõem
acordos no conjunto de negociação
Um acorde é alcançado se
Utility1 (2 ) utility1(1) ou
Utility2 (1 ) utility2(2)
Sem consenso, a negociação continua
Negociação termina com o conflict deal.
41
Como proceder...
Propor o melhor deal.
Quem deve ceder?
Depende da “vontade” de um agente
arriscar conflito.
Maior a vontade se a diferença entre a
proposta e o conflict deal for baixa.
42
Definindo Risco
Riskit= utilidade perdida aceitando a
oferta/ utilidade perdida causando
conflito
1 se
utility (jt) = 0
Riskit=
utility (it) - utility (jt) /
utility (it)
43
Quanto ceder?
O menos necessário para mudar o
balanço de risco
Protocolo exponencial!
Equilíbrio de Nash
Agentes podem enrolar... Criando
tarefas fantasmas... Ou escondendo
tarefas!
44
Domínios Orientados a Valor
Um DOV é uma tupla <E, Ag, J, C> onde
E é o conjunto de estados do ambientes
Ag é o conjunto de Agentes participantes do
processo
J é a coleção de planos conjuntos
C : JxAg R é o custo de realização.
Um encontro é o par <e,W>
Agentes negociam tanto sobre o estado a que
querem chegar quanto sobre os meios para
atingi-lo.
45
Cenas dos Próximos Capítulos
Hoje vimos...
Formas de expressar as preferências
dos agentes...
Conceito de estratégias
Algumas formas de negociação...
Domínios Orientados a Tarefa
Domínios Orientados a Valor
Veremos...
Argumentação e Colaboração
46