Estratégia empresarial de TI
Aula 6 – Teoria dos jogos (4)
Prof. E. A. Schmitz
Information set
Definições:
1-Um information set de um player i é um conjunto de nós
da árvore do jogo que são indistintos para o player i.
2-Informação perfeita: todos os information sets do jogo
contém somente um nó.
Estratégia pura
Uma estratégia pura para o jogador I é um plano completo
de ação.
Especifica o que cada jogador deve fazer em cada um de
seus information sets.
Subgames
Um subgame de uma árvore de jogo é uma sub-arvore
com as seguintes características:
1. sua raiz contém um único nó
2. contém todos os sucessores daquele nó
3. não contém information sets incompletos
Subgame perfect equilibrium
Um equilibrio Nash (S1*,s2*,..sn*)
é chamado de subgame perfect se:
induz um NE em cada um dos subgames do jogo.
Jogos de informação incompleta
Jogos de informação perfeita:
quando o passado é conhecido
Jogos de informação incompleta:
os pay-offs de outros jogadores são desconhecidos
Modela muitas situações do mundo real
Jogos de informação incompleta
Jogos de informação incompleta:
estratégias e pay-offs dos jogadores (type) não são
completamente conhecidos
Harsanyi *:
todo jogo de informação incompleta pode ser
modelado por um jogo de informação imperfeita
Idéia do Harsanyi:
Natureza “sorteia” o type dos jogadores
*Nobel junto com Nash
Jogo da propaganda modificado (1)
½
(P1 é tipo A)
H
L
H
4,4
6,3
L
3,4
5,5
½
(P1 é tipo B)
H
L
H
0,4
2,3
L
3,4
5,5
Jogo da propaganda modificado (2)
Jogo da propaganda modificado (3)
Se P1 for tipo A
então sua estratégia dominante é H
Se P1 for tipo B
então sua estratégia dominante é L
P2 acredita (belief) que p seja a probabilidade de P1
ser do tipo A.
Jogo da propaganda modificado (4)
O ganho esperado para P2 será:
Payoff(P2|H)=p*4+(1-p)*4=4
Payoff(P2|L)=p*3+(1-p)*5=5-2p
P2 maximiza seu retorno esperado ao jogar H se:
4> 5-2p  p>1/2
P2 ficará indiferente entre H e L quando p=1/2
Dilema dos prisioneiros (1)
c
n
c
0;0
7;-2
n
-2;7
5;5
Tipo 1
p
c
n
c
0;-2
7;0
n
-2;5
5;7
Tipo 2
(1-p)
Player 1: não sabe o tipo do Player 2; somente uma percepção
a priori da probabilidade dele ser do Tipo 1 ou 2.
Player 2: conhece seu tipo e o do Player 1.
Solução: pode ser obtida por dominância.
Dilema dos prisioneiros (1)
c
n
c
0;0
7;-2
n
-2;7
5;5
Tipo 1
p
c
n
c
0;-2
7;0
n
-2;5
5;7
Tipo 2
(1-p)
Solução
Player 1: independentemente do tipo do Player 2, “c” domina
“n”. Joga “c”.
Player 2: se for Tipo 1 joga “c” senão “n”
Dilema dos prisioneiros (2)
c
n
c
0;0
7;-2
n
-2;7
5;5
Tipo 1
p
c
n
c
-2;-2
5;0
n
0;5
7;7
Tipo 2
(1-p)
Player 1: não sabe o tipo do Player 2; somente uma percepção
a priori da probabilidade dele ser do Tipo 1 ou 2.
Player 2: conhece seu tipo e o do Player 1.
Dilema dos prisioneiros (3)
c
n
c
0;0
7;-2
n
-2;7
5;5
Tipo 1
p
c
n
c
-2;-2
5;0
n
0;5
7;7
Tipo 2
(1-p)
Solução
Player 2: se for Tipo 1 joga “c” senão “n”
Player 1: se tivesse certeza que Player 2 é Tipo 1 – joga “c”, se tem
certeza que é Tipo 2 joga “n”. Para outros valores:
Ganho 1 (“c”) = p*0+(1-p)*5=-5p+5
Ganho 1 (“n”) = p*-2+(1-p)*7=-9p+7
Joga “c” se p>1/2 e “n” se p <1/2.
Batalha dos sexos (1)
F
O
F
3;1
0;0
O
0;0
1;3
Loving
p
F
O
F
3;0
0;1
O
0;3
1;0
Leaving
(1-p)
Player 1: não sabe o tipo do Player 2; somente uma percepção
a priori da probabilidade dele ser do Tipo 1 ou 2.
Player 2: conhece seu tipo e o do Player 1.
Batalha dos sexos (2)
F
O
F
3;1
0;0
O
0;0
1;3
Loving
p
F
O
F
3;0
0;1
O
0;3
1;0
Leaving
(1-p)
Solução
Jogos de informação incompleta
Primeira: Em jogos dinâmicos com informação incompleta os jogadores
podem aprender sobre os outros jogadores observando suas jogadas
passadas. Isto gera a oportunidade de jogadores influenciarem as
expectativas dos outros modificando suas jogadas.
Segunda: Os jogadores sabem que os oponentes tem um incentivo para
esconder sua identidade verdadeira. Isso vai influenciar como um
jogador avalia a sua estimativa de probabilidade sobre do tipo do outro
pela observação de suas ações.
Equilíbrio perfeito Bayesiano
Equilibrio: Bayesian subgame perfect é um NE, onde a
.
observação
da jogada dos outros muda a percepção do tipo
Algoritmo
1-Escolha um perfil estratégico.
2-Identifique quais beliefs este perfil gera quando os jogadores atualizam
suas crenças em resposta as escolhas do outros.
3-Verifique que dadas as crenças (sobre os outros jogadores) juntamente
com suas escolhas, cada jogador está selecionando a sua melhor resposta.
Download

Sistemas de tempo real