ISSN 2317-3300 A teoria da dualidade e o equilíbrio de Nash Lara Martins Barbosa1, Marcos Antônio da Câmara2, Letícia Ferreira Martins1 UFU - Faculdade de Matemática β Campus Santa Mônica 38408-100, Uberlândia, Minas Gerais E-mail: [email protected], [email protected], [email protected] Palavras-chave: Painéis IC, dualidade, teoria dos jogos, equilíbrio de Nash Resumo: Neste trabalho estudamos a teoria da dualidade da programação linear e sua aplicação na demonstração da existência do equilíbrio de Nash em estratégias mistas para jogos de soma zero com dois jogadores. 1 Introdução A teoria dos jogos é uma teoria matemática criada para se modelar fenômenos que podem ser observados quando dois ou mais agentes de decisão interagem entre si. Ela fornece linguagem para a descrição de processos de decisões conscientes envolvendo mais do que um indivíduo. Em seu início, a teoria dos jogos chamou pouca atenção. Em 1928, John Von Neumann mudou essa situação ao demonstrar que todo jogo finito de soma zero possui uma solução em estratégias mistas. A demonstração original usava topologia e análise funcional e era difícil de acompanhar. Em 1937, ele forneceu uma nova demonstração baseada no teorema do ponto fixo de Brouwer. Neste trabalho apresentaremos uma demonstração que utiliza a Teoria da Dualidade da Programação Linear. 2 A teoria da dualidade Os problemas duais da programação linear denominados, respectivamente, de PRIMAL e DUAL são: minimizar π π = πΆ π π sujeito a π΄π β₯ π΅ (1) πβ₯0 em que π΄ = πππ ππ₯π , π΅ = ππ ππ₯ 1 , πΆ = ππ maximizar sujeito a ππ₯ 1 , π = π₯π ππ₯ 1 ππ· π = π΅π π π΄π π β€ πΆ (2) πβ₯0 e π = π¦π ππ₯ 1 . De outra forma, podemos considerar (2) o PRIMAL e (1) o DUAL. Teorema 1: Se π e π são soluções viáveis quaisquer, respectivamente, do primal e do dual, então π π β₯ ππ· π . Corolário 1: Se π β e π β são soluções viáveis, respectivamente, do primal e do dual, tais que π π β = ππ· π β , então π β e π β são soluções ótimas dos seus respectivos problemas. Corolário 2: Se a função objetivo é ilimitada no conjunto das soluções viáveis ππ do primal, então o conjunto das soluções viáveis ππ· do dual é vazio. Resumindo todas as alternativas de soluções possíveis para o para primal-dual, teremos somente uma das seguintes alternativas: 1 Bolsistas do PET Matemática da UFU β SESu/MEC 2 Tutor do PET Matemática da UFU β SESU/MEC 591 ISSN 2317-3300 PRIMAL DUAL Existe solução ótima π β Existe solução ótima π β π π β = ππ· π β ππ = β ππ = β π π β β ββ ππ· = β ππ· π β β +β ππ· = β 3 Teoria dos jogos A teoria dos jogos pode ser definida como a teoria dos modelos matemáticos que estuda a escolha de decisões ótimas sob condições de conflito. Um jogo tem os seguintes elementos básicos: existe um conjunto finito de jogadores, representado por πΊ = π1 , π2 , β¦ , ππ . Cada jogador possui um conjunto finito ππ = π π1 , π π2 , β¦ , π ππ π de opções, denominadas estratégias puras do jogador ππ , ππ β₯ 2. Definição 1: Um jogo de soma constante com dois jogadores é um jogo com dois jogadores, comumente denominados jogador linha ππ e jogador coluna ππ , com estratégias ππ = 1, 2, 3, β¦ , π e ππ = 1, 2, 3, β¦ , π e matriz de payoff πππ , πππ , π = 1, 2, β― , π e π = 1, 2, β¦ , π, em que πππ e πππ representam os payoffs de cada jogador para as escolhas da estratégia π de ππ e estratégia π de ππ , satisfazendo πππ + πππ = π, π β β. Vamos considerar o caso particular em que π = 0, ou seja, jogos que tem soma zero. Nesse caso, πππ = βπππ . Além disso, vamos considerar o jogo do ponto de vista probabilístico, ou seja, ao invés de escolher um perfil de estratégia pura, o jogador deve escolher uma distribuição de probabilidade sobre suas estratégias puras. Uma estratégia mista π = π1 , π2 , π3 , β¦ , ππ para ππ é uma distribuição de probabilidade para as estratégias puras desse jogador e uma estratégia mista π = π1 , π2 , π3 , β¦ , ππ é uma distribuição de probabilidade para as estratégias puras desse π jogador, em que π π=1 ππ = 1, ππ β₯ 0 e π =1 ππ = 1, ππ β₯ 0. Nesse caso, o payoff esperado para ππ é π’π π, π = ππ π΄π, com π΄ = πππ ππ₯π e o payoff esperado para ππ é π’π π, π = ππ π΅π, com π΅ = πππ ππ₯π . Definição 2: (Equilíbrio de Nash) Dizemos que um perfil de estratégia mista πβ , πβ é um equilíbrio de Nash se π’π πβ , πβ β₯ π’π π, πβ π π’π πβ , πβ β₯ π’π πβ , π , para quaisquer π e π. Isto significa que nenhum jogador sente motivação de trocar sua estratégia mista se o outro não o fizer. Ao utilizar a estratégia π, o ganho médio mínimo de ππ é minπ π’π π, π e ππ tentará escolher π de forma a maximizar esta quantia, isto é, tentará encontrar um número ππ > 0 tal que ππ = maxπ minπ π’π π, π . Ao utilizar a estratégia π, a perda média máxima de ππ é maxπ π’π π, π e ππ tentará escolher π de forma a minimizar esta quantia, isto é, tentará encontrar um número ππ > 0 tal que ππ = minπ maxπ π’π π, π . Para otimizar ambas as estratégias espera-se que ππ = ππ . Mas, isto é possível. Teorema 2 (Minimax de von Neumann) 1 Bolsistas do PET Matemática da UFU β SESu/MEC 2 Tutor do PET Matemática da UFU β SESU/MEC 592 ISSN 2317-3300 Para todo jogo de soma zero com dois jogadores, representado pela matriz de payoffs π΄ do jogador linha, sempre existe um perfil de estratégia mista πβ , πβ satisfazendo maxπ minπ π’π π, π = π’π πβ , πβ = minπ maxπ π’π π, π . Demonstração: O problema de ππ é encontrar um vetor ππ» = π1 , π2 , π3 , β¦ , ππ e um número 1 ππ π ππ tal que π΄π π β₯ ππ πππ , π π=1 π₯π = π , π=1 ππ = 1 e ππ β₯ 0. Colocando π₯π = π , teremos π π que queremos minimizar, pois queremos maximizar ππ . Nesse caso, teremos o seguinte PPL: minimizar sujeito a em que π π = π₯1 , π₯2 , β¦ , π₯π e 1 π π π=1 π₯π 1 =π π π΄π π β₯ 1 πβ₯0 (1) = 1, 1, β¦ , 1 . O problema de ππ é encontrar um vetor ππ» = π1 , π2 , π3 , β― , ππ e um número ππ tal que ππ 1 π π π΄π β€ ππ πππ , π=1 π¦π = π , que π =1 ππ = 1 e ππ β₯ 0. Colocando π¦π = π , teremos π π queremos maximizar, pois queremos minimizar ππ . Nesse caso, teremos o seguinte PPL: maximizar sujeito a em que π π = π¦1 , π¦2 , β¦ , π¦π e 1 π π π=1 π¦π = 1 ππ π΄π β€ 1 πβ₯0 (2) = 1, 1, β¦ , 1 . Os problemas (1) e (2) são duais e, portanto, min π π=1 π₯π = max π π=1 π¦π , ou seja, 1 ππ 1 =π β π ππ = ππ . β Em particular, πβ , πβ é um equilíbrio de Nash. Além de estabelecer a existência de equilíbrios de Nash, a demonstração sugere uma maneira de encontrá-los: resolvendo-se dois problemas duais da programação linear. Referências [1] D. G. Luenberger, Linear and Nonlinear Programming, Second Edition. Addison-Wesley Publishing Company, 1989. [2] H. V. Machado, Programação Linear, IMPA, Rio de Janeiro, 1975. [3] B. A. Sartini, G. Garbugio, H. J. Bortolossi, P. A. Santos, L. S. Barreto, Uma Introdução à Teoria dos Jogos, II Bienal da SBM, 2004. 1 Bolsistas do PET Matemática da UFU β SESu/MEC 2 Tutor do PET Matemática da UFU β SESU/MEC 593