Agentes que Negociam...




Negociação... O que é?
Utilidades... E Estratégias
Equilíbrio de Nash
Negociando Recursos


Negociando mais...


Leilões
Protocolos
Cenas dos Próximos Capítulos
1
Algumas Observações
Importantes



“Não há SMA de um só agente...”
Diferentes agentes tem diferentes
influências no ambiente... Lembram da
figurinha?
Agentes estão conectados por relações
(muitas vezes de dependência), e têm
objetivos próprios.
2
Negociando...

De acordo com o Aurélio...


Negociar significa manter relações para
concluir tratados ou convênios
Para SMA...

Negociação é uma forma de interação entre
agentes self-interested. Em outras palavras,
é o processo de conseguir um acordo para
cooperação entre agentes buscando seus
objetivos pessoais.
3
Negociamos ...

Para Determinar




A distribuição das Tarefas
A distribuição dos Recursos
A coordenação das atividades
Entre


Dois Agentes
Entre múltiplos agentes

Formação de coligações
4
O Processo deve Ser

Eficiente


Maximiza o somatório das utilidades.
Estável

Racionalidade Individual


Racionalidade de grupo


Deve ser preferível atuar em grupo
É melhor participar deste grupo do que de outro
Racionalidade de coligação

Ninguém quer sair da coligação
5
Como possibilitar?

Precisamos definir...



A linguagem utilizada pelos participantes
Como cada um decide suas posições?
Os Protocolos seguidos pelos agentes.
6
Representando Preferências

Função de Utilidade


i e j são dois agentes
 = {1, 2,...,n}

x é um estado do mundo.
As preferências dos agentes são capturadas
pela função de utilidade.
i :   j :  

7
Por exemplo...



Imagine que eu seja um agente querendo
ir prá casa.
1 = chego em casa em 20min
2 = pego a caxangá e chego em 1 hora... 


Em qual dos casos eu fico mais feliz?
E... Se tiver mais de um agente envolvido?
8
Encontros...

Suponha que agentes i e j (capazes de duas
ações C ou D) têm a seguinte função:
i(D,D) = 1 i(D,C) = 1 i(C,D) = 4 i(C,C) = 4
j(D,D) = 1 j(D,C) = 4 j(C,D) = 1 j(C,C) = 4
O que você faria no lugar de i?
9
Matriz de Recompensa
i
D
C
j
D
4
4
C
1
4
4
1
1
1
10
Estratégias Dominantes

Que ações tomar?



Uma estratégia 1 domina 2 para o agente i se
todo o elemento de 1 é preferido a todos os
elementos de 2.
1 domina fortemente 2 se 1  1 , 2  2 , 1
>i 2
Nem sempre teremos estratégias fortemente
dominantes! As vezes precisamos ter estratégias
fracamente dominantes.
11
Equilíbrio de Nash

Duas estratégias estão em EN se:



Considerando que agente i executa S1 agente
j não pode fazer melhor que executar S2.
Considerando que o agente j vai executar S2 i
não pode fazer melhor que S1
No equilíbrio, os agentes não têm incentivo
de se desviar... O problema é que nem todas
as situações tem EN.
12
Pensando mais um pouco...

Interações Competitivas...


Suponha que temos dois agentes i e j, onde i
prefere um estado 1 sss j prefere 2.
Interações de soma Zero.



Quando a i (1) + j (1) = 0
Ex. um jogo de xadrez
Vamos ver um exemplo?
13
Exemplos de Interações
Competitivas

O dilema do Prisioneiro



Dois homens são acusados de um crime e
mantidos incomunicáveis. Se um confessar e
outro não – um vai ser livre e o outro preso
por 3 anos
Se ambos confessarem ambos serão presos
por dois anos
Se nenhum confessar ambos serão presos
por um ano.
14
Recompensas...
i
D
C
j
D
2
2
C
0
5
5
0
3
3
15
Decidindo o que fazer...




Se eu cooperar, a maior recompensa é
zero
Se eu desertar, a maior recompensa é
dois...
Então... É melhor desertar!
O dilema do prisioneiro também pode
ser jogado interativamente...
16
Algumas Estratégias...

All-D


Randômico


Sempre deserta
O nome já explica... 
Tit-for-Tat


Coopere no primeiro round
No round t faça o que seu oponente fez
no round t-1
17
Mais estratégias...


Tester: explorador de programas que não
castigavam deserção. Deserta na primeira
rodada. Se o oponente não retaliasse,
jogava Tit-for-tat, senão, cooperava por
dois rounds e desertava no terceiro.
Joss-Tit-for-tat, porém desertava 10% das
vezes em que deveria cooperar...
18
Mas...

E quando computar utilidades for muito
caro?


Negociar envolve planejamento...
E um modelo do oponente!

Vários aspectos sob negociação...
19
Agora... E esse babado de
concordar?

Quando o problema é alocar recursos...


Leilões
Se precisamos coordenar tarefas,
decidir o que e quando fazer...


Coordenação
Argumentação
20
Um parêntese...

Negociação
Ato de Discutir com o objetivo de atingir um
consenso.

Argumentação
Apresentar argumentos contra ou a favor de
algo, com o intuito de convencer alguém de
nossa própria opinião.
21
Voltando...



Consensos dependem da capacidade de
negociação e argumentação dos agentes
envolvidos...
Negociação governada por protocolos...
Como desenvolver estratégias para os
agentes utilizarem enquanto negociam?
22
Parâmetros (Possíveis) no
design de Protocolos...


Sucesso Garantido... Em algum momento!
Maximização do Bem-Estar Social


A soma das utilidades é maximizada
Pareto-Eficiência

Não há nenhum outro resultado que vá tornar
um agente melhor de vida sem prejudicar os
outros.
23
Parâmetros (Possíveis) no
design de Protocolos...

Individualmente Racional


Estabilidade


Jogar limpo é o melhor a fazer
Um protocolo é estável se incentiva os agentes a se
comportarem de uma determinada forma
Simplicidade e Distribuição


É fácil ver qual a melhor forma de agir
Não há autoridade central
24
Alocando Recursos... Os
Leilões


Forma de Negociação cada vez mais comum...
Duas classes de Agentes:



Leiloeiro
Compradores
Alguns fatores alteram o protocolo...



Valor público?
Ou privado?
Valor Correlato
25
Dimensões dos Protocolos

Determinação do Vencedor


Lances



First x Second Price
Open-Cry
Sealed Bid
Mecanismo Utilizado



One Shot
Crescente
Descendente
26
Leilões Ingleses (English
Auctions)

Características




Open Cry
First Price
Ascending
Que estratégia utilizar?


Aumentar o lance em pequenos incrementos,
e depois se retirar
Maldição do Vencedor
27
Leilões Holandeses (Dutch)

Características




Open Cry
Descending
Não Há estratégias dominantes
Também sujeitos à Maldição do
Vencedor.
28
Outros

First Price Sealed Bid



One Shot
Agente deve oferecer um pouco menos do
que o valor estimado... Mas quanto menos?
Vickrey



Second Price Sealed Bid
Oferecer o valor real da mercadoria.
Pode gerar comportamento anti-social ...
29
Lucro esperado

Com compradores risk-neutral


Com compradores avessos ao risco


Os 4 tipos geram lucros parecidos
Dutch e First Price Sealed são os
melhores
Para Leiloeiros Avessos ao Risco

English e Vickrey
30
Mentiras e Conluios


Nada impede que os compradores se
juntem...
Uma solução...



Impedir os compradores de se
identificarem...
Mas o leiloeiro também pode ser
desonesto!
Contra-especulação...
31
Negociando...


Para situações mais complexas, leilões
não bastam...
Qualquer negociação tem 4 componentes:




Conjunto de negociação
Um protocolo
Uma coleção de estratégias
Uma regra que determina quando o consenso
foi atingido
32
Um Protocolo Famoso... A
Contract net


A1 reconhece que tem um problema
A1 anuncia que precisa de um serviço




Pode envolver um broadcast geral... Um
limitado... Ou um contato direto.
Ai,...,Aj respondem, oferecendo seus
préstimos.
A1 contrata o serviço, via award.
Quando o contratado termina, envia um
relatório ao contratante.
33
Quando recebemos as
mensagens...

Processando um anúncio...



Agente decide se é candidato...
Guarda os detalhes da tarefa, para
poder competir por elas...
Processando a oferta

Gerentes guardam as ofertas até o
deadline. Depois a tarefa é alocada a um
competidor.
34
Quando recebemos as
mensagens...

Processando o Award


Ganhador começa os procedimentos para
executar a tarefa.
Requerimentos e Informação

O conteúdo que chega é adicionado à
base de conhecimento do agente.
35
Complicando...

Quantas questões estão sendo discutidas?


Comprar um carro x Pechinchar no preço da cerveja
Quem está envolvido?



Um prá um
Muitos prá um
Muitos prá muitos

Podemos ter até n(n-1)/2 threads de negociação
36
Dois tipos fundamentais de
domínio


Orientados a Tarefas (DOT)
Representados por uma tupla <T,Ag,C>



T é o conjunto de todas as tarefas
Ag = {1,..,n} é o conjunto de participantes
C é a função de custo para cada subconjunto
de tarefas.
37
Acordos... (Deals)


Um acordo é uma alocação de tarefas.
A utilidade do acordo  é a diferença
entre o custo das tarefas que o agente
faria inicialmente (Ti) e as tarefas que
lhe foram atribuídas.


Utilityi() n= c(Ti) –c(i)
Se os agentes não chegarem a um acordo
temos o conflict deal.
38
Mais sobre acordos

Um acordo 1 domina 2 se





1 é tão bom quanto 2 para todos os agentes.
1 é melhor que 2 para algum agente.
1 domina fracamente 2 se a primeira
condição se verifica.
Um acordo que não é dominado por nenhum
outro é chamado de pareto-optimal.
 é individual racional se domina
fracamente o acordo de conflito
39
Assim...

O conjunto de possibilidades a colocar
em negociação consiste nos conjuntos
de acordos que são


Individual racional
Pareto optimal
40
Um protocolo...

Protocolo de Concessão Monotônico



Negociação acontece em rounds.
No primeiro, ambos os agentes propõem
acordos no conjunto de negociação
Um acorde é alcançado se




Utility1 (2 )  utility1(1) ou
Utility2 (1 )  utility2(2)
Sem consenso, a negociação continua
Negociação termina com o conflict deal.
41
Como proceder...


Propor o melhor deal.
Quem deve ceder?


Depende da “vontade” de um agente
arriscar conflito.
Maior a vontade se a diferença entre a
proposta e o conflict deal for baixa.
42
Definindo Risco
Riskit= utilidade perdida aceitando a
oferta/ utilidade perdida causando
conflito
1 se
utility (jt) = 0
Riskit=
utility (it) - utility (jt) /
utility (it)
43
Quanto ceder?




O menos necessário para mudar o
balanço de risco
Protocolo exponencial!
Equilíbrio de Nash
Agentes podem enrolar... Criando
tarefas fantasmas... Ou escondendo
tarefas!
44
Domínios Orientados a Valor

Um DOV é uma tupla <E, Ag, J, C> onde






E é o conjunto de estados do ambientes
Ag é o conjunto de Agentes participantes do
processo
J é a coleção de planos conjuntos
C : JxAg  R é o custo de realização.
Um encontro é o par <e,W>
Agentes negociam tanto sobre o estado a que
querem chegar quanto sobre os meios para
atingi-lo.
45
Cenas dos Próximos Capítulos

Hoje vimos...



Formas de expressar as preferências
dos agentes...
Conceito de estratégias
Algumas formas de negociação...



Domínios Orientados a Tarefa
Domínios Orientados a Valor
Veremos...

Argumentação e Colaboração
46
Download

SMA-Negociação