Estratégia empresarial de TI Aula 6 – Teoria dos jogos (4) Prof. E. A. Schmitz Information set Definições: 1-Um information set de um player i é um conjunto de nós da árvore do jogo que são indistintos para o player i. 2-Informação perfeita: todos os information sets do jogo contém somente um nó. Estratégia pura Uma estratégia pura para o jogador I é um plano completo de ação. Especifica o que cada jogador deve fazer em cada um de seus information sets. Subgames Um subgame de uma árvore de jogo é uma sub-arvore com as seguintes características: 1. sua raiz contém um único nó 2. contém todos os sucessores daquele nó 3. não contém information sets incompletos Subgame perfect equilibrium Um equilibrio Nash (S1*,s2*,..sn*) é chamado de subgame perfect se: induz um NE em cada um dos subgames do jogo. Jogos de informação incompleta Jogos de informação perfeita: quando o passado é conhecido Jogos de informação incompleta: os pay-offs de outros jogadores são desconhecidos Modela muitas situações do mundo real Jogos de informação incompleta Jogos de informação incompleta: estratégias e pay-offs dos jogadores (type) não são completamente conhecidos Harsanyi *: todo jogo de informação incompleta pode ser modelado por um jogo de informação imperfeita Idéia do Harsanyi: Natureza “sorteia” o type dos jogadores *Nobel junto com Nash Jogo da propaganda modificado (1) ½ (P1 é tipo A) H L H 4,4 6,3 L 3,4 5,5 ½ (P1 é tipo B) H L H 0,4 2,3 L 3,4 5,5 Jogo da propaganda modificado (2) Jogo da propaganda modificado (3) Se P1 for tipo A então sua estratégia dominante é H Se P1 for tipo B então sua estratégia dominante é L P2 acredita (belief) que p seja a probabilidade de P1 ser do tipo A. Jogo da propaganda modificado (4) O ganho esperado para P2 será: Payoff(P2|H)=p*4+(1-p)*4=4 Payoff(P2|L)=p*3+(1-p)*5=5-2p P2 maximiza seu retorno esperado ao jogar H se: 4> 5-2p p>1/2 P2 ficará indiferente entre H e L quando p=1/2 Dilema dos prisioneiros (1) c n c 0;0 7;-2 n -2;7 5;5 Tipo 1 p c n c 0;-2 7;0 n -2;5 5;7 Tipo 2 (1-p) Player 1: não sabe o tipo do Player 2; somente uma percepção a priori da probabilidade dele ser do Tipo 1 ou 2. Player 2: conhece seu tipo e o do Player 1. Solução: pode ser obtida por dominância. Dilema dos prisioneiros (1) c n c 0;0 7;-2 n -2;7 5;5 Tipo 1 p c n c 0;-2 7;0 n -2;5 5;7 Tipo 2 (1-p) Solução Player 1: independentemente do tipo do Player 2, “c” domina “n”. Joga “c”. Player 2: se for Tipo 1 joga “c” senão “n” Dilema dos prisioneiros (2) c n c 0;0 7;-2 n -2;7 5;5 Tipo 1 p c n c -2;-2 5;0 n 0;5 7;7 Tipo 2 (1-p) Player 1: não sabe o tipo do Player 2; somente uma percepção a priori da probabilidade dele ser do Tipo 1 ou 2. Player 2: conhece seu tipo e o do Player 1. Dilema dos prisioneiros (3) c n c 0;0 7;-2 n -2;7 5;5 Tipo 1 p c n c -2;-2 5;0 n 0;5 7;7 Tipo 2 (1-p) Solução Player 2: se for Tipo 1 joga “c” senão “n” Player 1: se tivesse certeza que Player 2 é Tipo 1 – joga “c”, se tem certeza que é Tipo 2 joga “n”. Para outros valores: Ganho 1 (“c”) = p*0+(1-p)*5=-5p+5 Ganho 1 (“n”) = p*-2+(1-p)*7=-9p+7 Joga “c” se p>1/2 e “n” se p <1/2. Batalha dos sexos (1) F O F 3;1 0;0 O 0;0 1;3 Loving p F O F 3;0 0;1 O 0;3 1;0 Leaving (1-p) Player 1: não sabe o tipo do Player 2; somente uma percepção a priori da probabilidade dele ser do Tipo 1 ou 2. Player 2: conhece seu tipo e o do Player 1. Batalha dos sexos (2) F O F 3;1 0;0 O 0;0 1;3 Loving p F O F 3;0 0;1 O 0;3 1;0 Leaving (1-p) Solução Jogos de informação incompleta Primeira: Em jogos dinâmicos com informação incompleta os jogadores podem aprender sobre os outros jogadores observando suas jogadas passadas. Isto gera a oportunidade de jogadores influenciarem as expectativas dos outros modificando suas jogadas. Segunda: Os jogadores sabem que os oponentes tem um incentivo para esconder sua identidade verdadeira. Isso vai influenciar como um jogador avalia a sua estimativa de probabilidade sobre do tipo do outro pela observação de suas ações. Equilíbrio perfeito Bayesiano Equilibrio: Bayesian subgame perfect é um NE, onde a . observação da jogada dos outros muda a percepção do tipo Algoritmo 1-Escolha um perfil estratégico. 2-Identifique quais beliefs este perfil gera quando os jogadores atualizam suas crenças em resposta as escolhas do outros. 3-Verifique que dadas as crenças (sobre os outros jogadores) juntamente com suas escolhas, cada jogador está selecionando a sua melhor resposta.