jogos em forma normal - de.ufpe.brleandro/slide_formanormal.pdf · teoria dos jogos pode ser...

121
Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Jogos em Forma Normal Prof. Leandro Chaves Rêgo Programa de Pós-Graduação em Estatística - UFPE Programa de Pós-Graduação em Engenharia de Produção - UFPE Recife, 26 de Agosto de 2014

Upload: buidien

Post on 12-Dec-2018

214 views

Category:

Documents


0 download

TRANSCRIPT

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Jogos em Forma Normal

Prof. Leandro Chaves Rêgo

Programa de Pós-Graduação em Estatística - UFPE

Programa de Pós-Graduação em Engenharia de Produção - UFPE

Recife, 26 de Agosto de 2014

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Jogos em Forma Normal

Definição

Teoria dos jogos pode ser pensada como um problema de decisão que envolvemais de um agente. Inicialmente, estaremos interessados em estudar jogosestáticos, ou seja, jogos em que os agentes se movem simultaneamente e umaúnica vez. Estes jogos são conhecidos na literatura como jogos em formalnormal ou estratégica. Todo jogo em forma normal tem as seguintescomponentes

Existe um conjunto de agentes ou jogadores N.

Cada jogador i pode escolher ações de um conjunto de estratégias

(puras) ou ações Ci .

O resultado do jogo é definido pelo perfil de estratégias que

consiste de todas as estratégias escolhidas pelos jogadores

individuais. Matematicamente, o conjunto de perfis de

estratégias é dado por C = ×i∈NCi .

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Jogos em Forma Normal

Definição

Jogadores têm preferência sobre os possíveis resultados do jogo. Note quejogadores não têm preferência sobre suas ações, pois em um jogo meupagamento pode depender das ações dos demais jogadores. Portanto, oque importa para os jogadores são os resultados do jogo, ou os perfis deestratégias, não suas próprias estratégias. Claro que suas ações fazemparte do perfil de estratégia e portanto influenciam no resultado do jogo,mas para cada ação podem existir vários resultados possíveis. Recordeque podemos representar preferências sobre resultados através de umafunção de utilidade. Matematicamente, preferências sobre resultados sãodefinidas por um conjunto de funções utilidades sendo uma para cadajogador, ui : C → IR , i ∈ N.

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Jogos em Forma Normal

2 Jogadores

Quando temos dois jogadores, toda esta informação pode ser expressaconvenientemente em uma matriz como a mostrada a seguir:

E CE 1,1 0,0C 0,0 1,1

Nesta matriz o jogador 1 escolhe uma das linha E ou C, e jogador 2 escolheuma das colunas E ou C. Cada célula da matriz tem um par de números onde aprimeira componente representa a utilidade do jogador 1 e a segundacomponente representa a utilidade do jogador 2.

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Jogos em Forma Normal

Suposições

Note que o fator tempo não está presente em um jogo em forma normal. Aidéia é que cada jogador escolhe sua estratégia uma vez por todas e que osjogadores escolhem suas estratégias simultaneamente, no sentido de que elesnão possuem informação a respeito das escolhas dos outros jogadores antes dassuas escolhas. Apesar disto, uma estratégia pode envolver escolhas queacontecem ao passar do tempo. Por exemplo, uma estratégia pode depender deresultados de acontecimentos do futuro, por exemplo, se a cotação do dólarbaixar de R$1,50, passarei férias no exterior, caso contrário, passarei férias noBrasil. O fato que o tempo não está no modelo significa que quandoanalisamos a situação como um jogo em forma normal, desconsideramos ascomplicações que podem surgir quando permitimos que um jogador mude deestratégia quando os eventos ocorrem. Também assumimos que os jogadoresfazem sua escolha de modo independente, ou seja, os jogadores não podemescolher estratégias que dependem das escolhas dos outros jogadores.

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Exemplos

Batalha dos Sexos

Suponha que um casal está decidindo em que local a família vai passear nopróximo domingo. Existem duas opções: passar o dia no shopping center, oupassar o dia na praia. Suponha que o marido (jogador 1) prefere ir a praia e aesposa (jogador 2) prefere ir ao shopping. Mas ambos ganham algumautilidade em ir juntos ao mesmo local. Irem para locais diferentes tem utilidadezero para ambos. A matriz de pagamentos desse jogo é a seguinte:

S PS 1,2 0,0P 0,0 2,1

O interessante neste jogo é que jogadores têm um incentivo a escolheremjuntos ao invés de um contra o outro, pois ambos se dão melhor se elesescolhem a mesma ação. O próximo exemplo ocorre exatamente o oposto, asoma das utilidades de cada resultado do jogo para os jogadores é igual a zero(ou a uma constante).

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Exemplos

Jogos de Soma-Zero

Em jogos de soma-zero qualquer ganho de uma das partes provoca uma perdade igual utilidade para os outros jogadores. Pense, por exemplo, em comodividir uma pizza. O tamanho da pizza não se altera, precisamos apenas sabercomo distribuir a pizza entre os jogadores. O jogo de soma-zero mais simples éconhecido como combinando centavos. Este jogo contém dois agentes, onde oagente 1 ganha um real do agente 2 se ambos escolherem a mesma ação, eperde um real em caso contrário:

H TH 1,-1 -1,1T -1,1 1,-1

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Exemplos

Medindo Forças

Suponha que temos dois jovens dirigindo para casa em uma rua estreita comseus carros em direções opostas. Nenhum deles quer sair do caminho, quem sairdo caminho é considerado fraco e perde seu orgulho, enquanto o outro ganhafama de forte. Porém, se ambos não saem do caminho, eles se acidentamgravemente. Se ambos saem do caminho, nenhum deles fica feliz ou infeliz.

F SF -20,-20 10,-5S -5,10 0,0

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Exemplos

Dilema do Prisioneiro

Este jogo provavelmente é o mais famoso de todos. A estória é que doisprisioneiros são interrogados. Se ambos cooperarem no julgamento, eles saemcada um com um ano de prisão. Se ambos delatarem um ao outro, eles pegamcada um 3 anos de cadeia. Se um cooperar e o outro delatar, então aquele quecooperar vai a prisão por 5 anos, e o delator sai livre.

D CD -3,-3 0,-5C -5,0 -1,-1

Note que o melhor resultado se os jogadores decidirem juntos é (C ,C ), é o quetêm a maior soma de utilidades. O resultado (D ,D) é o pior possível seconsiderarmos a soma das utilidades de ambos jogadores, e é pior do que oresultado (C ,C ) para ambos os jogadores. Então claramente, (D ,D) parece serum péssimo resultado.

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Dilema do Prisioneiro

Aplicações

Alguns exemplos práticos onde o Dilema do Prisioneiro pode surgir são osseguintes:

Corrida Armamentista. Dois países entram em uma corrida armamentista.Ambos gostariam de gastar seu dinheiro com o sistema de saúde (C), porexemplo, mas se um deles gasta dinheiro com o sistema de saúde (C), e ooutro gasta dinheiro em armas (D), o primeiro país será invadido.

Escudo Anti-Míssil. Os EUA (País 1) podem tanto construir um sistemade defesa anti-míssil (D) como não construir tal sistema (C). Rússia (País2) pode tanto construir mais mísseis (D) como não construir mais mísseis(C). Se os EUA não construirem o sistema anti-míssil, e a Russia nãoconstruir mais mísseis, então ambos países estão razoavelmente bem. Sea Rússia construir mais mísseis e os EUA não tiverem o sistemaanti-míssil, então os EUA se sentirão muito inseguros. Se os EUAconstruírem um escudo anti-míssil, e a Rússia não construir mísseis, entãoos EUA estão felizes, mas a Rússia se sente insegura. Se os EUAconstruírem o sistema anti-míssil e a Rússia construir mais mísseis, entãoeles estão com o mesmo grau de insegurança que no caso (C ,C ), maseles estão piores pois têm menos recursos para investir em outras áreas.

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Dilema do Prisioneiro

Aplicações

Mercado de Aviação. O mercado da aviação é um exemplo do dilema doprisioneiro na área empresarial. Como todo serviço, o problema com apassagem aérea é que, uma vez que o avião levanta vôo, cada assentonão vendido é uma perda. Não é possível estocar a vaga para vendê-ladepois. Além de deixar de ganhar com mais uma venda, as empresasaéreas ainda têm de arcar com o prejuízo de colocar o avião no ar, quenão muda muito pela lotação. Portanto, a motivação para uma empresabaixar seus preços, principalmente em vôos difíceis de vender, é muitoalta. Como a maioria das pessoas não faz distinção de companhiasaéreas, desde que chegue a seu destino, a empresa com preços maisbaixos tende a voar com a maior lotação possível, enquanto asconcorrentes agonizam com os prejuízos. Essa dinâmica pode chegar aoextremo de empresas competindo por clientes enquanto sabidamente têmprejuízo em alguns vôos, simplesmente por ser pior para elas voaremvazias do que com um prejuízo diminuído.

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Exemplos

Duopólio de Cournot

Este jogo tem um conjunto de estratégia infinito. Duas firmas escolhem o nívelde produção qi e têm custos de produção ci (qi). Os produtos não sãodiferenciáveis e a demanda de mercado determina um preço unitário dep(q1 + q2). Note que esta especificação assume que os produtos sãosubstitutos perfeitos. Neste caso, temos N = {1, 2}, C1 = C2 = IR+,u1(q1, q2) = q1p(q1 + q2)− c1(q1), e u2(q1, q2) = q2p(q1 + q2)− c2(q2).

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Exemplos

Duopólio de Bertrand

Este duopólio pode ser visto como em oposição ao duopólio de Cournot.Firmas continuam produzindo produtos que são substitutos perfeitos, masagora elas determinam o preço. Consumidores compram da firma com menorpreço, e se ambas cobrarem o mesmo preço elas dividem a demandaigualmente. Ambas firmas têm o mesmo custo unitário c > 0, são capazes deatender toda a demanda solicitada, e só produzem produtos que têm demanda.A demanda varia linearmente com o preço, ou seja, D = a − b(min(p1, p2)),onde b > 0, e a − bc > 0. Neste caso, temos N = {1, 2}, C1 = C2 = IR+,

u1(p1, p2) =

(p1 − c)(a − bp1) se p1 < p2,(p1 − c) (a−bp1)

2se p1 = p2,

0 se p1 > p2,

e

u2(p1, p2) =

0 se p1 < p2,(p2 − c) (a−bp2)

2se p1 = p2,

(p2 − c)(a − bp2) se p1 > p2.

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Racionalizabilidade e Dominância

Experimento 7:

Suponha que você é o jogador 1, ou seja tem que escolher uma das linhas damatriz abaixo. Qual a sua escolha? Justifique sua resposta.

A B C DA 5,2 2,6 1,4 0,4B 0,0 3,2 2,1 1,1C 7,0 2,2 1,5 5,1D 9,5 1,3 0,2 4,8

Como agentes jogam um jogo? Iremos encontrar soluções para alguns jogospartindo da suposição que agentes são racionais, isto é escolhem estratégiasque maximizam suas utilidades esperadas, e que cada agente sabe que osoutros agentes também são racionais.

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Comportamento Racional

Assuma que o agente i tem crenças descritas por uma distribuição deprobabilidade µi sobre as estratégias utilizadas pelos outros agentes do jogo.Se s é um perfil de estratégias de um jogo, denotaremos por s−i todas asestratégias deste perfil exceto a estratégia do agente i .

Definição 3.1

Uma estratégia si é uma escolha racional para o agente i com crença µi se

si ∈ argmaxti∈Ci

s−i∈C−i

ui (ti , s−i )µi (s−i ).

Note, que dado que o agente i possui crença µi , ele está diante de umproblema de decisão sob incerteza, e para jogos consideraremos que agentesdevem utilizar a regra MUE.

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Estratégias Randomizada

Definição 3.2

Dado qualquer conjunto enumerável B, seja ∆(B) = {µ : (B, 2B , µ) é umespaço de probabilidade}, isto é ∆(B) é o conjunto de todas as medidas deprobabilidade definidas na σ-álgebra 2B . Se Ci é o conjunto de estratégiaspuras para o agente i , σi ∈ ∆(Ci) é uma estratégia randomizada ou mista

para o agente i . Denotaremos por [si ] a estratégia randomizada que escolhea estratégia pura si com probabilidade 1.

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Estratégias Dominadas

Definição 3.3

Estratégia si ∈ Ci é estritamente dominada para o agente i se existe algumaestratégia randomizada σi ∈ ∆(Ci ) tal que

ui (si , s−i ) <∑

di∈Ci

σi (di )ui (di , s−i ),∀s−i ∈ C−i .

Similarmente, uma estratégia si ∈ Ci é fracamente dominada para o agente ise existe alguma estratégia randomizada σi ∈ ∆(Ci ) tal que

ui (si , s−i ) ≤∑

di∈Ci

σi (di )ui (di , s−i ),∀s−i ∈ C−i , e

existe s−i ∈ C−i tal que a desigualdade é estrita.

Em palavras, uma si estratégia é estritamente dominada se existe uma outraestratégia (randomizada) que é sempre melhor que si ; e si é fracamentedominada se existe uma outra estratégia (randomizada) que nunca é pior que sie em pelo menos uma situação é estritamente melhor que si .

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Estratégias Dominadas

Proposição 3.4

Se o agente i é racional ele nunca jogará uma estratégia estritamente dominada.

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Estratégias Dominadas

Prova: Se uma estratégia si ∈ Ci é estritamente dominada por σi ∈ ∆(Ci ),então

ui (si , s−i ) <∑

di∈Ci

σi (di )ui (di , s−i ),∀s−i ∈ C−i .

Logo, para qualquer crença µi , temos∑

s−i

µi (s−i )ui (si , s−i ) <∑

s−i

µi (s−i )∑

di∈Ci

σi (di)ui (di , s−i ).

Trocando a ordem dos somatórios, temos:∑

s−i

µi (s−i )ui (si , s−i ) <∑

di∈Ci

σi (di )∑

s−i

µi (s−i )ui (di , s−i ).

Portanto, existe di ∈ Ci tal que∑

s−i

µi (s−i )ui (si , s−i ) <∑

s−i

µi (s−i )ui (di , s−i ).

Então, si não é uma escolha racional para o agente i .

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Dominância Iterada

Uma das coisas mais difíceis quando analisamos um jogo é determinar ascrenças dos agentes. Muitos jogos podem ser simplificados assumindoracionalidade dos agentes e conhecimentos sobre racionalidade dos outrosagentes. Por exemplo, considere o Dilema do Prisioneiro. Cooperar é umaestratégia dominada. Um agente racional portanto nunca cooperará. Portanto,isto resolve o jogo pois todos os agentes irão delatar. Note que um agente nãoprecisa saber nada sobre o outro agente, a não ser que ele é racional. Esteresultado é intrigante, pois ele é o pior resultado em termos da soma dasutilidades dos jogadores e ambos melhorariam seu resultado se cooperassem.Este resultado mostra que às vezes é benéfico restringir as opções dos agentes.Por exemplo, no caso do sistema de defesa anti-mísseis ambos os países sairiamganhando se assinassem acordos que proibissem a construção de escudoanti-mísseis e a construção de novos mísseis. Então ambos países só teriamuma opção de cooperar e ambos sairiam ganhando.

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Dominância Iterada

Considere novamente o jogo do Experimento 7 abaixo.

A B C DA 5,2 2,6 1,4 0,4B 0,0 3,2 2,1 1,1C 7,0 2,2 1,5 5,1D 9,5 1,3 0,2 4,8

Neste jogo, para o jogador 2, a estratégia A é estritamente dominada pelaestratégia D , assim, a primeira coluna da matriz pode ser eliminada.

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Dominância Iterada

B C DA 2,6 1,4 0,4B 3,2 2,1 1,1C 2,2 1,5 5,1D 1,3 0,2 4,8

Agora, nesta matriz reduzida, para o jogador 1, as estratégias A e D sãoestritamente dominadas pelas estratégias B e C , respectivamente. Portanto, aslinhas 1 e 4 podem ser eliminadas.

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Dominância Iterada

B C DB 3,2 2,1 1,1C 2,2 1,5 5,1

Além disso, a estratégia D do jogador 2 é estritamente dominada pelasestratégia B. Assim, a coluna 3 também pode ser eliminada. Obtemos entãouma matriz reduzida 2 × 2.

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Dominância Iterada

B CB 3,2 2,1C 2,2 1,5

Finalmente, a estratégia C do jogador 1 é estritamente dominada pelaestratégia B e, na matriz 1 × 2 resultante, a estratégia C do jogador 2 éestritamente dominada pela estratégia B. Vemos então que o resultado do jogoé (3, 2), isto é, o jogador 1 escolhe a estratégia B e o jogador 2 escolhe aestratégia B. Neste caso, temos que a técnica de eliminação de dominânciaestrita iterada fornece um único perfil de estratégia como solução do jogo.Contudo, na grande maioria dos jogos esta técnica não determina uma soluçãoúnica.

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Dominância Iterada

Vale a pena discutir o nível de conhecimento que requeremos dos jogadoresquando aplicamos esta técnica de eliminação de estratégias estritamentedominadas. Agente 1 tem que saber que o agente 2 é racional. Agente 2 temque saber que o agente 1 sabe que o agente 2 é racional. Não é suficientesaber que o outro agente é racional, também é necessário saber que o outroagente sabe que o primeiro é racional. É necessário conhecimento de ordensainda maiores. Eu posso saber que meu adversário é racional e que ele sabeque eu sou racional. Mas pode ser que ele não saiba que eu sei que ele sabe.Quanto maior for a ordem do conhecimento, mais o processo de eliminação deestratégias estritamente dominadas pode ser repetido. Se racionalidade forconhecimento comum podemos repetir este processo de eliminação deestratégias estritamente dominadas infinitamente. Assumiremos queracionalidade é conhecimento comum na maior parte deste curso.

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Dominância Iterada

Seja Ci o conjunto de estratégias puras do jogador i e Di um subconjuntonão-vazio de Ci . Defina D = ×i∈NDi , um subconjunto do conjunto de perfis deestratégias do jogo e D−i = ×j∈N−{i}Dj , ou seja, um subconjunto do conjuntodos perfis de estratégias puras dos adversários de i . Vamos definir por Ui (D) osubconjunto de Di de estratégias que não são estritamente dominadasconsiderando que os demais jogadores escolhem estratégias em D−i , ou seja,para todo i ∈ N

Ui (D) = {si ∈ Di : ∄σi ∈ ∆(Di ) tal que∑

di∈Di

σi (di )ui(di , s−i ) > ui (si , s−i ),∀s−i ∈ D−i}.

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Definição Formal

A definição formal do algoritmo de eliminação das estratégias estritamentedominadas é a seguinte:

Passo 1: Defina S0i = Ci ,∀i ∈ N.

Passo k+1: Para k ≥ 1, defina Ski = Ui (S

k−1),∀i ∈ N. Ski é o conjunto

de estratégias que não são estritamente dominadas quando você sabe queos outros agentes utilizam estratégias em Sk−1

−i .

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Definição Formal

A definição formal do algoritmo de eliminação das estratégias estritamentedominadas é a seguinte:

Passo 1: Defina S0i = Ci ,∀i ∈ N.

Passo k+1: Para k ≥ 1, defina Ski = Ui (S

k−1),∀i ∈ N. Ski é o conjunto

de estratégias que não são estritamente dominadas quando você sabe queos outros agentes utilizam estratégias em Sk−1

−i .

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Definição Formal

Passo ∞: Defina S∞i = ∩∞

k=0Ski . Note que se o conjunto de estratégias

Si for finito para todo i , então o algoritmo deve parar após um númerofinito de iterações pois os conjuntos se tornam menores a cada iteração.No caso particular, de um jogo com dois jogadores que têm n e m açõesdisponíveis o processo iterativo deve parar após no máximo n + m − 2passos.

Definição 3.5

Um jogo tem solução determinada por eliminação de estratégias estritamentedominadas se S∞ contém um único perfil de estratégias.

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Ordem de Eliminação

1 Apesar da maioria dos jogos não ter solução determinada por eliminaçãode estratégias estritamente dominadas, este processo nos leva adeterminar que estratégias não deverão ser utilizadas caso a hipótese deconhecimento comum sobre racionalidade dos jogadores seja satisfeita.

2 Não especificamos a ordem na qual as estratégias devem ser eliminadas.Pode-se mostrar que a ordem de eliminação não importa. (Exercício)

Intuição: Assuma que você não eliminou todas as estratégias

dominadas em algum passo da iteração. Você a eliminará

depois? Claro que sim, uma estratégia dominada permanecerá

sendo dominada, o máximo que pode ter acontecido é que

algumas outras estratégias dos outros agentes foram

eliminadas, o que diminui as restrições na definição de

estratégia dominada. O mesmo não é verdade para eliminação

de estratégias fracamente dominadas.

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Ordem de Eliminação

L RT 1,1 0,0M 1,1 2,1B 0,0 2,1

Poderíamos eliminar primeiro T e depois L. Neste caso, temos que a soluçãodaria utilidades (2,1) com certeza. Contudo, se eliminarmos primeiro B edepois R a solução daria resultado (1,1) com certeza. Portanto, eliminação deestratégias fracamente dominadas nem sempre resulta em resultadosconsistentes, logo é uma opção de solução menos atraente.

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Observações

1 Com um conjunto de estratégias finitas o conjunto S∞ é sempre nãovazio por que após cada passo da iteração deve existir alguma estratégiadominante que restou.

2 Para o caso geral de um conjunto infinito de estratégias, não é obvio queo processo iterativo resultará em um conjunto não-vazio. Existemexemplos de sequências monotônicas de conjuntos cuja intersecção évazia: Sn = (0, ( 1

2)n). A intersecção S∞ de todos estes intervalos abertos

é vazia. Uma maneira de garantir que temos um conjunto S∞ não-vazioé assegurar que os conjuntos Sk são fechados e limitados, e portantocompactos, assumindo um espaço de ações de dimensão finita.Geralmente, este é o caso se as funções utilidades forem contínuas nasestratégias dos agentes.

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Racionalizabilidade

Na maioria das situações estratégicas, não é o caso que um jogador podededuzir as estratégias que os outros jogadores usam. Como todos os jogadorestentam maximizar sua utilidade esperada e isto é conhecimento comum, omelhor que um jogador pode esperar fazer é deduzir um conjunto de estratégiasplausíveis para os outros jogadores. Aqui, assumimos que uma “estratégiaplausível” é uma melhor resposta para alguma crença plausível que um jogadorpode ter a respeito do perfil de estratégias sendo jogado. Esta é a intuição queo conceito de solução de racionalizabilidade tenta capturar. Podemos pensarneste conceito como sendo o que caracteriza que os jogadores agemotimamente dado suas crenças.

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Melhor Resposta

Formalmente, seja Ci o conjunto de estratégias puras para o jogador i ;C = ×i∈NCi é, portanto, o conjunto de perfis de estratégias puras. Suponhaque cada jogador i é racional e é conhecimento comum que ele escolhe umaestratégia de um subconjunto Di de Ci . Seja D−i = ×j 6=iDi e

B(D−i ) = {argmaxsi ∈Ci

d−i∈D−i

π(d−i)ui (si , d−i ) :

para algum π ∈ ∆(D−i )};

isto é, B(D−i ) consiste das estratégias em Ci que são melhores respostas paraalguma crença que o jogador i pudesse ter sobre as estratégias que os outrosjogadores estão usando.

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Estratégias Racionalizáveis

O conjunto S = ×i∈NSi de estratégias racionalizáveis correlacionadas écaracterizado pelas duas seguintes propriedades:

(a) para todo i ∈ N, Si ⊆ B(S−i ) e

(b) S é o maior conjunto que satisfaz condição (a), no sentido que, para todoconjunto de perfis de estratégia D que satisfaz (a), temos que D ⊆ S .

Uma estratégia si ∈ Si é chamada de uma estratégia racionalizávelcorrelacionada para o jogador i.

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Não-Correlacionadas

Freqüentemente assume-se que os jogadores escolhem suas estratégias demaneira independente uns dos outros e que isto é conhecimento comum entreos jogadores. Se nós assumimos essa hipótese, nós temos um conceito desolução um pouco mais forte (pelo menos, no caso em que |N| ≥ 3), quechama-se racionalizabilidade não-correlacionada. Formalmente, suponha quecada jogador é racional e é conhecimento comum que ele escolhe umaestratégia do subconjunto Di de Ci . Seja D−i = ×j 6=iDi e

O(D−i ) = {argmaxsi ∈Ci

d−i

j∈N−{i}

πj(dj)ui (si , d−i ) :

para πj ∈ ∆(Dj )};

isto é, O(D−i) consiste das estratégias em Ci que são melhores respostas paraalguma crença que o jogador i pudesse ter sobre as estratégias que os outrosjogadores estão usando, assumindo que é conhecimento comum que jogadoresescolhem suas ações independentemente.

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Não-Correlacionadas

O conjunto Su = ×i∈NSui de estratégias racionalizáveis não-correlacionadas é

caracterizado pelas duas seguintes propriedades:

(a) para todo i ∈ N, Sui ⊆ O(Su

−i) e

(b) Su é o maior conjunto que satisfaz condição (a), no sentido que, paraqualquer conjunto de perfis de estratégias D que satisfaz (a), temos queD ⊆ Su.

Uma estratégia sui ∈ Su

i é chamada de uma estratégia racionalizávelnão-correlacionada para o jogador i.

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Construção

Pode-se construir S através do seguinte processo de iteração.

Passo 1: Defina C0i = Ci ,∀i ∈ N.

Passo k+1: Para k ≥ 1, defina Cki = B(Ck−1

−i ),∀i ∈ N. Cki é o conjunto

de estratégias que são melhores respostas para alguma crença do jogadori quando i sabe que os outros agentes utilizam estratégias em Ck−1

−i epodem correlacionar as estratégias.

Passo ∞: Defina S∗i = ∩∞

k=1Cki .

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Construção

Como o conjunto de estratégias Ci é finito para todo i , então o algoritmo deveparar após um número finito de iterações pois os conjuntos Ck

i ’s se tornammenores a cada iteração. Seja j o primeiro passo no qual não há mais nenhumaeliminação de estratégias no algoritmo. Portanto, S∗

i = Cji . Vamos mostrar que

o conjunto S∗ = ×i∈NSi é realmente o conjunto de estratégias racionalizáveiscorrelacionadas do jogo. Como B(Ck

i )k≥0 é uma sequência não crescente deconjuntos, temos que

S∗i = Cj

i = ∩∞k=1C

ki = ∩∞

k=1B(Ck−1−i ) = B(Cj

−i ) = B(S∗−i ).

Portanto, a condição (a) da definição é satisfeita. Vamos verificar a condição(b).

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Construção

Suponha, por contradição, que exista outro D ⊆ C tal que Di ⊆ B(D−i ) paratodo i ∈ N e D * S∗. Como a sequência Ck é não crescente, defina como k∗ oprimeiro passo no qual para algum jogador j ∈ N uma estratégiasj ∈ Dj ⊆ B(D−j ) não pertença à Ck∗−1

j . Por definição do algoritmo, temos

que sj /∈ B(Ck∗−2−j ). Como D−j ⊆ Ck∗−2

−j , temos que B(D−j ) ⊆ B(Ck∗−2−j ), uma

contradição. Portanto, S∗ é o conjunto de estratégias racionalizáveiscorrelacionadas do jogo e S∗

i = B(S∗i ) para todo jogador i .

O conjunto de estratégias racionalizáveis não-correlacionadas Su pode serconstruído de forma similar (claro, substituindo B(·) por O(·)). ComoO(D−i ) ⊆ B(D−i ), é fácil ver que Su ⊆ S .

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Exemplo

O seguinte exemplo ilustra as diferenças entre os três conceitos: eliminação deestratégias estritamente dominadas, estratégias racionalizáveis correlacionadase não-correlacionadas.Considere o seguinte jogo com três jogadores. O jogador a possui trêsestratégias puras a1, a2, a3, enquanto os jogadores b e c possuem duasestratégias puras cada um b1, b2 e c1, c2, respectivamente. Vamos agora definirquais estratégias pertencem aos conjuntos Ui (C), B(C−i ) e O(C−i). Temos quepara j ∈ {1, 2, 3}, aj ∈ Ua(C) se, e somente se, não existe pa ∈ ∆(Ca) tal que

ua(aj , s−a) <3

i=1

pa(ai )ua(ai , s−a), para todo s−a ∈ Cb × Cc ,

ou seja, aj ∈ Ua(C) se, e somente se, não existir nenhuma estratégia mista pa

que tenha utilidade esperada estritamente melhor que aj para o jogador a dadoqualquer par de estratégias puras utilizado pelos jogadores b e c.

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Exemplo

Por outro lado, temos que para j ∈ {1, 2, 3}, aj ∈ B(C−a) = B(Cb × Cc) se, esomente se, existir p−a ∈ ∆(C−a) = ∆(Cb × Cc) tal que

2∑

i=1

2∑

k=1

p−a(bi , ck)ua(aj , bi , ck) ≥2

i=1

2∑

k=1

p−a(bi , ck)ua(al , bi , ck),

para todo l ∈ {1, 2, 3}, ou seja, aj ∈ B(C−a) se, e somente se, aj for umamelhor resposta para alguma crença que o jogador a tenha a respeito de comoos jogadores b e c podem jogar o jogo admitindo a possibilidade de que b e ccorrelacionem suas estratégias de acordo com a distribuição p−a.

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Exemplo

Finalmente, temos que para j ∈ {1, 2, 3}, aj ∈ O(C−a) = O(Cb × Cc) se, esomente se, existirem pb ∈ ∆(Cb) e pc ∈ ∆(Cc) tais que

2∑

i=1

2∑

k=1

pb(bi )pc(ck)ua(aj , bi , ck) ≥2

i=1

2∑

k=1

pb(bi )pc(ck)ua(al , bi , ck),

para todo l ∈ {1, 2, 3}, ou seja, aj ∈ O(C−a) se, e somente se, aj for umamelhor resposta para alguma crença que o jogador a tenha a respeito de comoos jogadores b e c podem jogar o jogo admitindo que os jogadores b e cescolham suas estratégias independentemente de acordo com as distribuiçõespb e pc , respectivamente.

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Racionalibilidade e Dominância

Mostraremos a seguir que o conjunto de estratégias racionalizáveiscorrelacionadas é exatamente igual ao conjunto de estratégias que sobrevivemao processo de eliminação iterada de estratégias estritamente dominadas.Considere a seguinte definição:

Definição 3.6

Considere um jogo em forma normal com conjunto de perfis de estratégiadado por C = ×i∈NCi . Uma estratégia si do jogador i em um jogo em formanormal nunca é uma melhor resposta se si /∈ B(C−i ).

Lema 3.7

Uma estratégia para um jogador em um jogo de forma normal finito (isto é, noqual N e C são finitos) nunca é uma melhor resposta se, e somente se, ela forestritamente dominada.

Prova: Omitida. Ver Lema 60.1 em Osborne e Rubinstein.

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Racionalibilidade e Dominância

Teorema 3.8

Para qualquer jogo em forma normal finito (N, (Ci )i∈N , (ui )i∈N), temos queS∞ = S .

Prova: Consequência imediata do Lema 3.7 e dos algoritmos para encontrarS∞ = S .

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Exemplos

Considere uma situação onde duas pessoas tem que dividir R$6,00 entre si.Eles usam o seguinte procedimento. Cada pessoa escolhe uma quantidadeinteira e não-negativa de reais no máximo igual a R$6,00. Se a soma for nomáximo R$6,00, então cada pessoa receberá a quantidade que escolheu. Se asoma exceder R$6,00 e eles tiverem escolhido o mesmo número então elesdividirão os R$6,00 igualmente. Se a soma exceder R$6,00 e eles tiveremescolhido valores diferentes, o que escolheu o menor valor recebe a quantidadeque escolheu enquanto o outro recebe o restante. Quais as estratégiasracionalizáveis dos jogadores? Responda a mesma pergunta se mudarmos aregra do jogo no último caso e tivermos que neste caso o jogador que escolhero maior número (ao invés do menor) recebe a quantidade que escolheuenquanto o outro recebe a diferença.

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Dominância Fraca

Poderíamos tentar utilizar um outro conceito de solução usando a noção dedominância fraca. Poderíamos olhar para o maior conjunto D = ×i∈NDi talque para todo jogador i , Di é o conjunto de todas as estratégias que não sãofracamente dominadas quando sabe-se que os outros jogadores escolhemestratégias em D−i . Porém existem jogos onde este conjunto D é vazioconforme o exemplo a seguir.

x2 y2

x1 1,1 1,0y1 1,0 0,1

Se y1 /∈ D1, então segue que y2 /∈ D2. Mas neste caso, temos que y1 não podeser excluído. Se y1 ∈ D1, então y2 ∈ D2. Mas neste caso, temos que y1 podeser excluído. Portanto, este não é um bom conceito de solução.

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Equilíbrio de Nash

Eliminação de estratégias estritamente dominadas é um conceito desolução atrativo porque somente assume que os jogadores são racionais eque é conhecimento comum que todo jogador é racional (mesmo assimisto pode ser uma suposição muito forte já que estamos assumindo queser racional é utilizar a regra de decisão MUE). É essencialmente umconceito construtivo - a idéia é restringir suposições sobre as estratégiasescolhidas por outros jogadores eliminando estratégias uma a uma. Parauma grande classe de jogos, este conceito reduz significativamente oconjunto de estratégias. Contudo, apenas uma pequena classe deproblemas pode ser resolvida desta maneira.

Vamos introduzir agora o conceito de solução mais famoso em Teoria dosJogos: equilíbrio de Nash. Mostraremos adiante que todo jogo finito tempelo menos um equilíbrio de Nash e que o conjunto de equilíbrios de Nashé um subconjunto das estratégias racionalizáveis não-correlacionadas, e,portanto, um subconjunto das estratégias que sobrevivem ao processoiterativo de eliminação de estratégias dominadas. Neste sentido, equilíbriode Nash faz predições mais fortes que os conceitos anteriores.

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Definições

Definição 4.1

Um perfil de estratégias σ é um equilíbrio de Nash em estratégias de G se, esomente se, ui(σ) ≥ ui (σ−i , τi ) para todo jogador i e toda estratégiaτi ∈ ∆(Ci ).

Definição 4.2

Um equilíbrio de Nash σ é dito ser puro se para todo jogador i , σi dáprobabilidade 1 a uma única estratégia em Ci .

Em palavras, um perfil de estratégia é um equilíbrio de Nash se mesmo que umjogador saiba as estratégias que estão sendo usadas pelos demais, ele não temincentivo a mudar sua estratégia porque sua estratégia é uma melhor respostaas estratégias dos demais jogadores.

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Estratégia mista

Em um jogo em forma normal finito ou enumerável, se σi é uma estratégiarandomizada para jogador i , uma estratégia pura si ∈ Ci pertence ao suporte deσi se σi (si ) > 0. O próximo teorema mostra que se σ é um equilíbrio de Nash,então para todo jogador i , todas as estratégias puras no suporte de σi tem amesma utilidade esperada para o jogador i dado que os demais jogadoresjogam σ−i .

Teorema 4.3

Se σ é um equilíbrio de Nash de um jogo em forma normal finito ouenumerável, então para todo jogador i, para quaisquer pares de estratégiaspuras si , ti no suporte de σi , temos ui (si , σ−i ) = ui (ti , σ−i ). Portanto,ui (σ) = ui (si , σ−i ) para qualquer estratégia pura si no suporte de σi .

Prova: Suponha por contradição que exista si , ti no suporte de σi tal queui (si , σ−i ) > ui (ti , σ−i ). Considere a seguinte estratégia randomizada τi talque τi (ci ) = σi (ci ) para todo ci ∈ Ci − {si , ti}, e τ (si ) = σi (si ) + σi (ti ). Então,temos que ui (τi , σ−i )− ui (σ) = σi (ti )(ui (si , σ−i )− ui(ti , σ−i )) > 0, umacontradição pois σ é um equilíbrio de Nash.

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Jogos com um Único Equilíbrio de Nash

Dilema do Prisioneiro.

D CD -3,-3 0,-5C -5,0 -1,-1

Este jogo tem apenas um único equilíbrio de Nash onde os jogadores escolhemD com probabilidade 1. É fácil checar que pelo menos um jogador temincentivo a mudar de qualquer outro perfil de estratégias. Por exemplo, ambosos jogadores escolherem C com probabilidade 1 não pode ser um equilíbrio deNash, pois ambos jogadores ganhariam se mudassem para estratégia queescolhe D com probabilidade 1.

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Equilíbrio e Dominância

Antes de analisarmos o próximo exemplo consideremos a seguinte Proposição.

Proposição 4.4

Se σ é um equilíbrio de Nash de um jogo em forma normal finito ou enumerável,então para todo jogador i, se si pertence ao suporte de σi , si sobrevive aoprocesso iterativo de eliminação de estratégias estritamente dominadas.

Prova: Suponha, por contradição que existam si pertencentes ao suporte de σtais que si não sobrevive ao processo iterativo de eliminação de estratégiasestritamente dominadas. Seja k o menor inteiro no qual existe um si nosuporte de σ tal que si ∈ Sk

i , mas si /∈ Sk+1i , ou seja, existe τi com suporte em

Ski tal que ui (si , d−i ) < ui (τi , d−i ) para todo d−i ∈ Sk

−i . Como todasestratégias no suporte de σ−i estão em Sk

−i , temos que

ui (si , σ−i ) =∑

d−i∈Sk−i

σ−i (d−i )ui (si , d−i) <∑

d−i∈Sk−i

σ−i (d−i)ui (τi , d−i ) = ui (τi , σ−i ).

Então, pelo Teorema 4.3, ui (σ) < ui (τi , σ−i ), uma contradição pois σ é umequilíbrio de Nash.

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Exemplo

L M RU 2,2 1,1 4,0D 1,2 4,1 3,5

Neste jogo o único equilíbrio de Nash é ([U],[L]). É fácil ver que ([U],[L]) é umequilíbrio de Nash, pois ambos jogadores perderiam se mudassem de estratégia.Para verificar que este equilíbrio é único note que este perfil é o único quesobrevive ao processo de eliminação de estratégias estritamente dominadas.Logo, o resultado segue da Proposição 4.4.

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Combinando Centavos.

H TH 1,-1 -1,1T -1,1 1,-1

Neste jogo o único equilíbrio de Nash tem ambos os jogadores escolhendo cadauma de suas estratégias puras com igual probabilidade. Neste equilíbrio, autilidade esperada de ambos os agentes é igual a zero.

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Trabalho em Dupla.

Considere uma situação em que duas pessoas tem que realizar um trabalho ecada uma delas pode colocar um esforço xi ∈ [0, 1] para o qual ela terá umcusto de c(xi ). O resultado do projeto vale f (x1, x2) e a dupla divide este valorigualmente independente do esforço que cada pessoa teve. Encontre oequilíbrio de Nash nas seguinte situações:

(a) f (x1, x2) = 4x1x2 e c(xi ) = x2i , para i = 1, 2.

(b) f (x1, x2) = 3x1x2 e c(xi ) = xi , para i = 1, 2.

Em cada um dos casos, existe um outro par de esforços (x1, x2) que dá a ambosjogadores um melhor resultado do que o resultado obtido no equilíbrio de Nash?

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Jogos com Múltiplos Equilíbrios de Nash

Exemplo 4.5

Considere o seguinte jogo de coordenação.

E C

E 1,1 0,0

C 0,0 1,1

Este jogo tem três equilíbrios de Nash - ([E],[E]), ([C],[C]), e(1/2[E]+1/2[C],1/2[E]+1/2[C]).

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Medindo Forças.

F SF -20,-20 10,-5S -5,10 0,0

Este jogo tem três equilíbrios de Nash - ([F],[S]), ([S],[F]), e(2/5[F]+3/5[S],2/5[F]+3/5[S]).

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Jogo de Votos

Exemplo 4.6

Três jogadores escolhem simultaneamente uma de três alternativas A, B ouC. Se a maioria escolher uma alternativa, esta será a vencedora. Se os votosse dividirem em 1-1-1, assumimos que a alternativa A será escolhida.Suponha que as preferências sejam representadas por: u1(A) = 3,u1(B) = 2, u1(C ) = 1, u2(A) = 1, u2(B) = 3, u2(C ) = 2, u3(A) = 2,u3(B) = 1, e u3(C ) = 3.Este jogo têm vários equilíbrios de Nash, entre os quais podemos citar:([A],[A],[A]), ([B],[B],[B]), ([C],[C],[C]).

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Pontos Focais

O conceito de equilíbrio de Nash não nos permite determinar que equilíbrio serájogado em uma particular realização do jogo se este possui múltiplos equilíbrios.No Exemplo 4.5 não existe nenhuma maneira de determinar qual dos equilíbrios([E],[E]) ou ([C],[C]) é melhor, pois ambos resultam em utilidade 1 para osjogadores. Por outro lado, o equilíbrio (1/2[E]+1/2[C],1/2[E]+1/2[C])resultado em uma utilidade esperada de 1/2 para os jogadores.Para alguns jogos é possível é possível que exista algum equilíbrio de Nash quese destaque em relação aos demais, estes equilíbrios são chamados de pontosfocais. Por exemplo, o fato que brasileiros dirigem do lado direito da ruapoderia ser utilizado para determinar o ponto focal do próximo exemplo:

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Pontos Focais

Exemplo 4.7

João e José dirigem em dois carros numa pista de duas faixas em direçõesopostas. Eles podem dirigir tanto do lado esquerdo como do direito, mas seeles não coordenarem suas ações eles podem causar um acidente detrânsito. Este jogo pode ser descrito pela seguinte matriz:

D E

D 1,1 0,0

E 0,0 1,1

Esperamos que ambos escolham ([D],[D]) que é a norma socialmente aceitaneste jogo.

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Batalha dos Sexos.

Considere novamente o jogo da batalha dos sexos.

S PS 1,2 0,0P 0,0 2,1

([S],[S]) e ([P],[P]) são equilíbrios de Nash deste jogo. Este jogo é interessante,pois os jogadores não são indiferentes entre qual equilíbrio implementar.Jogador 1 prefere ([P],[P]) e o jogador 2 prefere ([S],[S]).

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Experimentos

Experimento 8: Suponha que você é o jogador 1 na batalha dos sexos. Qualserá a sua escolha?Experimento 9: Suponha novamente que você é o jogador 1 na batalha dossexos. Jogador 2 escolhe uma ação primeiro. Você não pode observar a escolhado jogador 2 antes de escolher sua própria ação. Qual será a sua escolha?Experimento 10: Suponha novamente que você é o jogador 1 na batalha dossexos. Antes do jogo começar, o jogador 2 tem uma oportunidade de fazer umanuncio. Seu anuncio é “Jogarei S”. Você não pode fazer um anúncio antes dojogo. Qual será a sua ação?

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Conversa Fiada

Este tipo de comunicação é conhecido como conversa fiada pois este anuncionão muda em nada a análise. Note que, simplesmente expandindo o espaço deestratégias para o jogador 2. Ao invés das estratégias S e P, jogador 2 agoratem 4 estratégias: Ss, Sp, Pp, Ps, onde estratégia Sp significa que jogador 2escolhe S e anuncia que iria jogar p. Claramente, as estratégias Ss e Sp têm amesma utilidade esperada quando jogada contra qualquer estratégia do jogador1. Portanto, o jogo continua tendo o “mesmo” conjunto de equilíbrios de Nashque antes. Contudo, o anúncio pode criar um ponto focal no jogo.

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Risco Dominante

Considere o seguinte jogo.

A BA 9,9 -15,8B 8,-15 7,7

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Risco Dominante

Este jogo tem dois equilíbrios de Nash em estratégias puras: ([A],[A]) and([B],[B]). Ao contrário dos jogos anteriores, o equilíbrio ([A],[A]) é melhor paraambos os jogadores. Podemos então ser tentados a pensar que este equilíbrio émais jogado na prática. Contudo, muitas pessoas tipicamente escolhemestratégia B na maioria dos experimentos. Escolher A parece ser muitoarriscado. Assuma que você não sabe muito sobre o outro jogador e acha que éigualmente provável que ele escolherá uma de sua estratégias puras que fazemparte de um equilíbrio de Nash. Então, escolher A lhe dá uma utilidadeesperada de -3 enquanto escolher B lhe dá 7,5. Portanto, A é risco dominadapor B.

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Dominância Conjunta

Um outro critério de seleção de equilíbrios é escolher os equilíbrios nos quaisnão existe outro equilíbrio onde todos os jogadores recebem um pagamentoesperado pelo menos igual a este equilíbrio e pelo menos um dos jogadoresesteja estritamente melhor. Segundo este critério os jogadores no jogo da seçãoanterior deveriam escolher o equilíbrio ([A],[A]). Para um outro exemploconsidere o seguinte jogo:

A BA 1,3 2,3B 1,1 2,1

Neste jogo, os 4 perfis de estratégias puras são equilíbrios de Nash. Segundo ocritério de dominância conjunta, o equilíbrio selecionado seria o par ([A],[B]).

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Modelo de Cournot com Duas Empresas

Definição

Este jogo tem um conjunto de estratégia infinito. Duas firmas escolhem o nívelde produção qi e têm custos de produção ci (qi). Os produtos não sãodiferenciáveis e a demanda de mercado determina um preço unitário dep(q1 + q2). Note que esta especificação assume que os produtos sãosubstitutos perfeitos. Neste caso, temos N = {1, 2}, C1 = C2 = IR+,u1(q1, q2) = q1p(q1 + q2)− c1(q1), e u2(q1, q2) = q2p(q1 + q2)− c2(q2).Vamos considerar o caso em que ci (qi ) = cqi , para i = 1, 2, ep(q1 + q2) = a − b(q1 + q2), onde a ,b e c são constantes positivas. Destemodo, tem-se u1(q1, q2) = (a − c)q1 − b(q2

1 + q1q2), eu2(q1, q2) = (a − c)q2 − b(q1q2 + q2

2).

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Modelo de Cournot com Duas Empresas

Então, para um dado nível q2 de produção da empresa 2, a empresa 1 desejamaximizar u1(q1, q2). Derivando u1(q1, q2) em relação a q1 e igualando a zero,temos:

q1 =a − c − bq2

2b. (1)

Esta função é conhecida como função melhor resposta da empresa 1 edetermina para cada nível de produção da empresa 2, a quantidade ótima a serproduzida pela empresa 1. Similarmente, para um dado nível q1 de produçãoda empresa 1, a empresa 2 deseja maximizar u2(q1, q2). Derivando u2(q1, q2)em relação a q2 e igualando a zero, temos:

q2 =a − c − bq1

2b. (2)

Esta é a função melhor resposta da empresa 2. Como em um equilíbrio deNash, ambas as empresas tem que estar jogando uma melhor resposta dado aestratégia da outra. O equilíbrio de Nash deste jogo é encontrado,resolvendo-se o sistema de equações formado pelas duas últimas equações.Desta forma, obtém-se a solução:

q∗1 = q∗

2 =a − c

3b.

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Modelo de Cournot com n Empresas

Vamos agora considerar o caso em que n empresas produzem produtos que sãosubstitutos perfeitos, que a empresa i possui custo de produção ci (qi ) = cqi ,para i = 1, 2, . . . , n, e a demanda de mercado determina um preço unitário dep(q1, q2, . . . , qn) = a − b

∑n

i=1 qi . Neste caso, temos N = {1, 2, . . . , n},Ci = IR+, ui (q1, q2, . . . , qn) = (a − c)qi − bqi

∑n

i=1 qj , para i = 1, 2, . . . , n.Obtendo a função melhor resposta para a empresa i através da derivada deui (q1, q2, . . . , qn) em relação a qi , temos:

qi =a − c − b

∑n

j=1,j 6=i qj

2b. (3)

Considerando as n funções melhores respostas das n empresas, podemosencontrar o(s) equilíbrio(s) de Nash resolvendo um sistema de n equações e nincógnitas. Contudo, como neste exemplo, as empresas tem custos idênticos eproduzem produtos que são substitutos perfeitos, é razoável assumir quedividirão o mercado igualmente entre si. Então,

∑n

j=1,j 6=i q∗j = (n − 1)q∗

i .Substituindo na equação anterior, temos:

q∗i =

a − c

(n + 1)b. (4)

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Modelo de Cournot com n Empresas

Então, no equilíbrio, temos:

p(q∗1 , q

∗2 , . . . , q

∗n) = a −

n(a − c)

n + 1

e

ui (q∗1 , q

∗2 , . . . , q

∗n) =

(a − c)2

(n + 1)b− n

(a − c)2

(n + 1)2b.

Logo, quando n tende ao infinito, temos que o preço de mercado decai para ovalor do custo unitário do produto e que a utilidade das empresas decrescempara zero no equilíbrio.

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Duopólio de Bertrand sem Restrição deCapacidade

Definição

Este duopólio pode ser visto como em oposição ao duopólio de Cournot.Firmas continuam produzindo produtos que são substitutos perfeitos, masagora elas determinam o preço. Consumidores compram da firma com menorpreço, e se ambas cobrarem o mesmo preço elas dividem a demandaigualmente. Ambas firmas têm o mesmo custo unitário c > 0, são capazes deatender toda a demanda solicitada, e só produzem produtos que têm demanda.A demanda varia linearmente com o preço, ou seja, D = a − b(min(p1, p2)),onde b > 0, e a − bc > 0. Neste caso, temos N = {1, 2}, C1 = C2 = IR+,

u1(p1, p2) =

(p1 − c)(a − bp1) se p1 < p2,(p1 − c) (a−bp1)

2se p1 = p2,

0 se p1 > p2,

e

u2(p1, p2) =

0 se p1 < p2,(p2 − c) (a−bp2)

2se p1 = p2,

(p2 − c)(a − bp2) se p1 > p2.

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Duopólio de Bertrand sem Restrição deCapacidade

Encontrando o Equilíbrio

Primeiro note que nenhuma empresa tem incentivo a cobrar pelos produtos umpreço abaixo de seu custo unitário, pois estaria em uma melhor situação emproduzir nada. Agora suponha que uma das empresas escolha um preço p > c,então uma melhor resposta para a outra empresa seria cobrar um preço p′ talque p > p′ > c. Mas sabendo que a segunda empresa iria cobrar p′ > c, aprimeiro por sua vez iria querer cobrar um preço p′′ tal que p′ > p′′ > c. Dessemodo, o único par de preços que consiste de melhores respostas para ambas asempresas consiste de p∗

1 = p∗2 = c. Deste modo, no equilíbrio temos que as

empresas tem lucro zero.

Vamos agora analisar o modelo de Bertrand relaxando algumas de suashipóteses. Em particular, vamos analisar o que ocorre se as empresas possuíremrestrição de capacidade e não puderem atender toda a demanda.

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Duopólio de Bertrand com Restrição deCapacidade

Definição

Suponha no cenário do Duopólio de Bertrand que as empresas só conseguematender a uma demanda d < a − bc. Neste caso, temos N = {1, 2},C1 = C2 = IR+,

ui (p1, p2) =

(pi − c)min(a − bpi , d) se pi < pj ,(pi − c)min( (a−bpi )

2, d) se pi = pj ,

0 se pi > pj e a − bpj ≤ d ,(pi − c)(a − bpi − d) se pi > pj e a − bpj > d ,

para i = 1, 2.O primeiro e o segundo caso foram modificados para levar em conta que acapacidade de produção das empresas é igual a d . No terceiro caso, temos quea empresa i cobra um preço maior que a empresa j , que cobra um preço pj paracuja demanda a − bpj , a empresa j é capaz de atender. Logo, a empresa i nãoproduz nada e obtém lucro zero. No último caso, apesar da empresa i tambémcobrar um preço maior, ela atende a demanda residual que a empresa j nãoconseguiu atender.

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Duopólio de Bertrand com Restrição deCapacidade

Análise 1

Vamos agora analisar qual será o equilíbrio agora. Será que p∗1 = p∗

2 = c aindaconstitui um equilíbrio? Neste caso, vamos ver o que acontece se a empresaresolve aumentar o preço acima de c. Então, a utilidade da empresa estarádada pela expressão do quarto caso. Derivando (p1 − c)(a − bp1 − d) emrelação a p1 e igualando zero, temos:

p′1 =

a − d + bc

2b> c.

Portanto, u1(p′1, c) > 0 = u1(c, c), o que implica que (c, c) não é um equilíbrio

de Nash.

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Duopólio de Bertrand com Restrição deCapacidade

Análise 2

Vamos agora mostrar que nem sempre um equilíbrio existe neste caso. Paratanto, analisemos o caso particular em que a = 100, b = 1, c = 5 e d = 60. Jávimos que p∗

1 = p∗2 = 5 não constitui um equilíbrio. Vamos ver o que acontece

se p1 = p2 > 5. Temos que considerar dois casos: (a) p2 ≥ 40; (b) p2 < 40.No caso (a), se a empresa 1 mudar de p1 = p2 para p′

1 = p2 − ǫ, deixará de terum lucro de (p2 − 5) (100−p2)

2e passará a ter um lucro maior de

(p2 − ǫ− 5)(100 − p2). Portanto, o caso (a) não constitui um equilíbrio deNash. No caso (b), se a empresa 1 mudar de p1 = p2 para p′

1 = p2 − ǫ1,deixará de ter um lucro de (p2 − 5) (100−p2)

2e passará a ter um lucro de

(p2 − ǫ1 − 5)60 que é maior para valores de p2 > 5. Logo, o caso (b) tambémnão constitui um equilíbrio de Nash.

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Duopólio de Bertrand com Restrição deCapacidade

Análise 3

Agora vamos considerar o caso se existem equilíbrios nos seguintes casos: (a)p1 > p2 ≥ 40, (b) p1 > p2 e p2 < 40. No caso (a), a empresa 1 tem lucro zeroe aumentaria seu lucro caso reduzisse seu preço para p2. No caso (b), aempresa 2 pode aumentar seus lucros subindo seu preço para um valor igual amin(p1, 40) − ǫ, pois ainda venderá toda sua capacidade de produção a umpreço maior. Então, também não existe equilíbrio de Nash neste caso. Então,provamos que não existe equilíbrio de Nash em estratégias puras para este jogo.Pode-se provar que este jogo tem um equilíbrio em estratégias mistas, mas istoestá fora do escopo deste curso.

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Duopólio de Bertrand com Produtos Diferenciados

Definição

Suponha agora que as empresa não fabricam produtos idênticos. Neste caso,não necessariamente toda a demanda irá para a empresa com um menor preço,pois o preço agora é apenas uma das características que diferenciam osprodutos das empresas e não a única como no caso anterior. Desta forma, ademanda de uma firma diminui com o aumento do preço do seu produto, mascresce com o aumento do preço da concorrente. Suponha então que asempresas possuam custo unitário de fabricação c e apresentem funções dedemanda igual a q1 = a− b1p1 + b2p2 e q2 = a − b1p2 + b2p1, onde a, b1, b2, csão constantes positivas. Note que neste caso, se uma empresa praticar umpreço um pouco maior que a outra ela não perde toda a demanda, mas apenastem uma diminuição na sua demanda. As funções utilidades das empresas sãodadas por:

u1(p1, p2) = (p1 − c)(a − b1p1 + b2p2)

eu2(p1, p2) = (p2 − c)(a − b1p2 + b2p1).

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Duopólio de Bertrand com Produtos Diferenciados

Análise

Derivando u1 em relação a p1 e igualando a zero temos:

p1 =a + b1c + b2p2

2b1

.

Similarmente, derivando u2 em relação a p2 e igualando a zero temos:

p2 =a + b1c + b2p1

2b1

.

Estas duas equações formam as funções melhores respostas das empresas. Oequilíbrio de Nash é resolvido encontrando o resultado da solução do sistema de2 equações e 2 incógnitas de onde obtém-se:

p∗1 = p∗

2 =a + b1c

2b1 − b2

.

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Prova da Existência

Agora provaremos que todo jogo em forma normal finito possui um equilíbriode Nash em estratégias randomizadas. A demonstração que apresentaremos fazuso do Teorema do ponto fixo de Brouwer.

Teorema 6.1

Se M é um subconjunto compacto e convexo de um espaço euclidiano dedimensão finita e F : M → M é uma função contínua, então F possui umponto fixo em M, isto é, existe x∗ ∈ M tal que F (x∗) = x∗.

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Prova da Existência

Provaremos a existência do equilíbrio de Nash em jogos finitos através de umasérie de lemas. Para cada jogador i ∈ N e cada estratégia s ∈ Ci sejazsi : ∆(Ci ) → IR tal que

zsi (σ) = ui ([s], σ−i )− ui (σ),

isto é, zsi mede o ganho ou perda do jogador i quando ele muda de estratégia

σi para [s].

Lema 6.2

σ∗ é um equilíbrio de Nash se, e somente se, zsi (σ

∗) ≤ 0, ∀i ∈ N e s ∈ Ci .

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Prova da Existência

Prova: Assuma que σ∗ é um equilíbrio de Nash, então ui (σ∗) ≥ ui ([s], σ

∗−i )

para todo i ∈ N e s ∈ Ci . Conseqüentemente, zsi (σ

∗) ≤ 0.Por outro lado, se zs

i (σ∗) ≤ 0, ∀i ∈ N e s ∈ Ci , então ui ([s], σ

∗−i ) ≤ ui (σ

∗),∀i ∈ N e s ∈ Ci . Precisamos mostrar que para todo σi , ui (σi , σ

∗−i ) ≤ ui (σ

∗).Pela linearidade da esperança, temos

ui (σi , σ∗−i ) =

s∈Ci

σi (s)ui ([s], σ∗−i )

≤∑

s∈Ci

σi (s)ui (σ∗) = ui (σ

∗)∑

s∈Ci

σi (s) = ui (σ∗)

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Prova da Existência

Corolário 6.3

Seja g si (σ) = max(0, zs

i ), então σ∗ é um equilíbrio de Nash se, e somente,g si (σ

∗) = 0, ∀i ∈ N e s ∈ Ci .

Considere a seguinte aplicação F : ×i∈N∆(Ci) → ×i∈N∆(Ci ) tal que para todoi ∈ N e s ∈ Ci :

Fi (σ)(s) =σi (s) + g s

i (σ)

1 +∑

t∈Cig ti (σ)

.

Lema 6.4

σ∗ é um equilíbrio de Nash se, e somente se, F (σ∗) = σ∗, isto é, se, e somentese, σ∗ é um ponto fixo da aplicação F .

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Prova da Existência

Observe que, de fato, F (×i∈N∆(Ci)) ⊆ ×i∈N∆(Ci ), pois claramenteFi (σ)(s) ≥ 0 e

s∈Ci

Fi (σ)(s) =∑

s∈Ci

σi (s) + g si (σ)

1 +∑

t∈Cig ti (σ)

11 +

t∈Cig ti (σ)

(∑

s∈Ci

σi (s) + g si (σ))

11 +

t∈Cig ti (σ)

(1 +∑

s∈Ci

g si (σ)) = 1,

portanto, para todo i ∈ N e σ temos que Fi (σ) ∈ ∆(Ci ).

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Prova da Existência

Assuma que σ∗ é um equilíbrio de Nash, então g si (σ

∗) = 0 para cadai ∈ N e s ∈ Ci . Desta maneira, Fi (σ

∗)(s) = σ∗i (s) para cada i ∈ N e

s ∈ Ci , ou seja, F (σ∗) = σ∗.

Assuma agora que σ∗ é um ponto fixo da aplicação F , então temos quepara todo i ∈ N e s ∈ Ci :

σ∗i (s) =

σ∗i (s) + g s

i (σ∗)

1 +∑

t∈Cig ti (σ

∗).

Segue-se então que para todo i ∈ N e s ∈ Ci :

σ∗i (s)

t∈Ci

g ti (σ

∗) = g si (σ

∗).

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Prova da Existência

Vamos agora provar que∑

t∈Cig ti (σ

∗) = 0, o que por sua vez implica que

g ti (σ

∗) = 0 para todo i ∈ N e t ∈ Ci . Suponha, por absurdo, que∑

t∈Cig ti (σ

∗) > 0, então temos que

g si (σ

∗) > 0 se, e somente se, σ∗i (s) > 0.

Observe que para todo i ∈ N e s ∈ Ci , se g si (σ

∗) > 0 entãoui ([s], σ

∗−i ) > ui (σ

∗). Logo,

ui (σ∗) = ui (

s∈Ci

σ∗i (s)[s], σ

∗−i )

=∑

s∈Ci

σ∗i (s)ui([s], σ

∗−i ) =

s∈Ci ,σ∗

i(s)>0

σ∗i (s)ui ([s], σ

∗−i )

>∑

s∈Ci ,σ∗

i(s)>0

σ∗i (s)ui (σ

∗) = ui (σ∗),

um absurdo. Isto demonstra que g ti (σ

∗) = 0 para todo i ∈ N e t ∈ Ci e, assim,σ∗ é um equilíbrio de Nash em estratégias mistas.

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Prova da Existência

Teorema 6.5

Todo jogo em forma normal finito possui um equilíbrio de Nash.

Prova: A aplicação F : ×i∈N∆(Ci ) → ×i∈N∆(Ci ) definida anteriormente écontínua e ×i∈N∆(Ci ) é um conjunto compacto e convexo de um espaçoeuclidiano de dimensão finita. Pelo teorema do ponto fixo de Brouwer, Fpossui um ponto fixo σ∗. Pelo teorema anterior, σ∗ é um equilíbrio de Nash.

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Cálculo de Equilíbrio de Nash

O Teorema 6.5 sugere uma maneira de se calcular os equilíbrios de Nash de umjogo. Eles são soluções do seguinte problema de otimização não-linear:

minσ∈×i∈N∆(Ci )

i∈N

s∈Ci

g si (σ)

Como g si (σ) ≥ 0 para todo i ∈ N, s ∈ Ci e σ ∈ ×i∈N∆(Ci ), temos que o

somatório é igual zero se, e somente se, cada parcela for igual a zero, o quecomo visto, implica que os perfis σ que solucionam o problema de otimizaçãoacima são realmente os equilíbrios de Nash do jogo. A seguir sugerimos umoutro algoritmo para encontrar equilíbrios de Nash de jogos em forma normalfinitos.

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Cálculo de Equilíbrio de Nash

Vamos considerar o problema de calcular os equilíbrios de Nash de um jogo emforma normal finito

Γ = (N, (Ci)i∈N , (ui )i∈N).

Embora existam infinitas estratégias randomizadas para este jogo, existeapenas um número finito de subconjuntos de C que pode constituir o suportedas estratégias de um equilíbrio de Nash. Podemos então encontrar todos osequilíbrios de Nash de Γ considerando seqüencialmente todos os possíveissuportes.Para cada jogador i seja Di ⊆ Ci . Di representa nossa atual tentativa deestratégias que fazem parte do suporte de algum equilíbrio de Nash. Se existealgum equilíbrio de Nash σ com suporte em ×i∈NDi , o Teorema 4.3 garanteque cada jogador i deve ser indiferente entre as estratégias em Di . Portanto asquatro condições seguintes devem ser satisfeitas:

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Cálculo de Equilíbrio de Nash

∀i ∈ N,∀di ∈ Di ,∑

c−i∈C−i

(∏

j∈N−{i}

σj (cj))ui (c−i , di ) = wi , (5)

σi (ei ) = 0, ∀i ∈ N,∀ei ∈ Ci − Di , (6)∑

ci∈Di

σi (ci ) = 1,∀i ∈ N, (7)

σi (di ) > 0,∀i ∈ N, ∀di ∈ Di . (8)

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Cálculo de Equilíbrio de Nash

Condição (5) assegura que todos os jogadores têm a mesma utilidade esperadawi de utilizar qualquer uma das estratégias puras no suporte de σi .Condições (6), (7), e (8) asseguram que σi tem suporte Di . Note que as trêsprimeiras condições formam um sistema de

i∈N(||Ci ||+ 1) equações e mesmonúmero de incógnitas. Portanto, teoricamente pode-se resolver este sistema.No caso de dois jogadores, teremos um sistema linear de equações. No caso demais de dois jogadores temos um sistema não linear. Assumindo que existesolução para este sistema e que podemos encontrar todas as soluções destesistema teremos que verificar que a Condição (8) é satisfeita. Além disso aindatemos que assegurar que nenhuma outra estratégia ei ∈ Ci − Di é melhor parao jogador i que σi , ou seja, temos que garantir que:

∀i ∈ N,∀ei ∈ Ci − Di ,

wi ≥∑

c−i∈C−i

(∏

j∈N−{i}

σj(cj ))ui(c−i , ei ). (9)

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Cálculo de Equilíbrio de Nash

Se conseguirmos encontrar uma solução (σ,w) para o sistema (5)–(7) quesatisfaz também (8) e (9), temos que σ é um equilíbrio de Nash de Γ e que wi

é a utilidade esperada para o jogador i neste equilíbrio. Por outro lado, se nãoexiste nenhuma solução que satisfaz (5)–(9) temos que não existe equilíbriocom suporte em ×i∈NDi . Para encontrar um equilíbrio temos que tentar outrosuporte. O Teorema da existência do equilíbrio de Nash garante que existe pelomenos um suporte ×i∈NDi que satisfaz (5)–(9).

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Exemplo

Considere o seguinte jogo.

x2 y2 z2

x1 0,0 5,4 4,5y1 4,5 0,0 5,4z1 5,4 4,5 0,0

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Exemplo

Primeiro note que não existe nenhum equilíbrio de Nash em estratégias purasneste jogo. Vamos verificar se existe algum equilíbrio onde a estratégia dojogador 1 tem suporte D1 = {x1, y1}. Note que neste caso a estratégia y2 dojogador 2 é estritamente dominada pela estratégia z2 e portanto não pode fazerparte do suporte do equilíbrio, se ele existir. Mas se y2 /∈ D2, temos que x1 éestritamente dominada por y1. Logo, x1 não pode estar no suporte doequilíbrio e, portanto não existe equilíbrio com suporte D1 = {x1, y1}. Os casosem que D1 = {x1, z1} e D1 = {y1, z1} também podem ser resolvidos de formasimilar para chegar-se a conclusão que eles não são suporte de nenhumequilíbrio. Pela simetria do jogo, temos que também não existe equilíbrioquando D2 = {x2, y2}, D2 = {x2, z2}, ou D2 = {y2, z2}. Portanto, só nos restao caso em que D1 = {x1, y1, z1} e D2 = {x2, y2, z2}. Vamos assumir queσ1 = (p1, p2, 1 − p1 − p2) e que σ2 = (q1, q2, 1 − q1 − q2). Calculando, autilidade esperada do jogador 1 para cada uma de suas três estratégias purastemos:

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Exemplo

u1(x1, σ2) = 0q1 + 5q2 + 4(1 − q1 − q2) = 4 − 4q1 + q2

u1(y1, σ2) = 4q1 + 0q2 + 5(1 − q1 − q2) = 5 − q1 − 5q2

u1(z1, σ2) = 5q1 + 4q2 + 0(1 − q1 − q2) = 5q1 + 4q2

Igualando estas três quantidades, temos a solução q1 = q2 = 1/3. Fazendocalculo similar para o jogador 2, pela simetria do problema obtemosp1 = p2 = 1/3.

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Interpretações de Equilíbrio de Nash

O processo de eliminação de estratégias estritamente dominadas é umalgoritmo construtivo e não assume que os jogadores sabem das estratégias dosoutros jogadores. Em contraste, em um equilíbrio de Nash jogadores têmcrenças precisas sobre as estratégias dos outros. Precisamos saber de ondeessas crenças vêm para podermos interpretar esta noção de equilíbrio. Existemvárias interpretações:

Estratégias são prescritas. Algum árbitro não envolvido no jogo prescreveuma maneira de como o jogo deve ser jogado. Esta prescrição é estávelno sentido de que nenhum jogador tem incentivo a desviar delaunilateralmente.

Comunicação prévia. Existe uma comunicação prévia na qual jogadorespodem se comunicar e concordar em como jogar o jogo. Novamente esteacordo é estável.

Introspecção Racional. Um equilíbrio de Nash parece ser uma maneiraplausível de jogar o jogo, pois minhas crenças sobre os outros jogadoressão consistentes com o fato que eles são racionais. Esta é uma boaexplicação para jogos que contém um único equilíbrio de Nash. Contudo,é menos convincente para jogos com múltiplos equilíbrios de Nash.

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Interpretações de Equilíbrio de Nash

Ponto Focal. Normas sociais ou outras características podem induzirjogadores a preferir algumas estratégias.

Aprendizado. Agentes aprendem as estratégias dos outros jogando omesmo jogo muitas vezes. Por exemplo, pense na interação entreconsumidores e vendedores. Eles interagem repetidas vezes, em muitoscasos um particular consumidor interage somente uma vez com um dadovendedor, ou interage repetidamente mas anonimamente como no casoem que o vendedor é uma grande loja. Consumidores e vendedores maisexperientes podem formar crenças baseadas em interações passadas comoutros clientes para obter um melhor resultado na barganha.

Evolução. Agentes são programados para jogar certas estratégias e sãopareados aleatoriamente uns contra os outros. Assuma que agentes nãojogam um equilíbrio de Nash inicialmente. Ocasionalmente “mutações”ocorrem, isto é, agentes que jogam uma estratégia diferente surgem. Seesta nova estratégia for lucrativa, estes agentes se multiplicarão a umataxa mais rápida do que outros agentes e eventualmente passam a sermaioria. Sob certas circunstâncias, este sistema converge para um estadoonde os agentes jogam um equilíbrio de Nash, e futuras mutações nãopodem mais se beneficiar de estratégias novas.

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Interpretações de Equilíbrio de Nash

É importante ressaltar que cada uma dessas interpretações tem uma hipótesediferente com respeito ao conhecimento dos agentes. Para o caso deestratégias prescritas é suficiente que cada jogador seja racional, esimplesmente acredite no árbitro. Para introspecção racional, é necessário queseja conhecimento comum que os jogadores são racionais. Para evolução,jogadores não precisam nem ser racionais.Algumas interpretações têm menos problemas em lidar com multiplicidade deequilíbrios. Se acreditarmos que o equilíbrio surge por que um árbitro oprescreveu, então não temos que nos preocupar com o problema damultiplicidade de equilíbrios de Nash. Introspecção racional é bem maisproblemática: cada um dos jogadores podem racionalizar qualquer um dosmúltiplos equilíbrios e portanto não têm nenhuma maneira de escolher entreeles.

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Jogo Simétrico em Forma Normal

Em muitas situações estratégicas, os jogadores envolvidos possuem o mesmoconjunto de ações e avaliam o resultado do jogo de maneira similar, ou seja,possuem a mesma utilidade para os perfis de estratégias independente de qualseja a sua posição no jogo. Estes jogos são chamados de jogos simétricos.Formalmente, temos:

Definição 6.6

Um jogo em forma normal Γ = (N, {Ci : i ∈ N}, {ui : i ∈ N}) é simétrico se(1) Ci = Cj para todo par de jogadores i , j ∈ N e (2) se para todo par dejogadores i , j ∈ N e perfil de estratégias c ∈ C, temos ui (c) = uj(c

′), ondec ′k = ck para todo k ∈ N − {i , j}, c ′

i = cj e c ′j = ci , ou seja, se c ′ for o perfil

de estratégias onde apenas as estratégias dos jogadores i e j são permutadasem relação ao perfil c, e a maneira que j avalia c ′ é idêntica a que o jogadori avalia c.

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Equilíbrio Simétrico

Nessas situações como os jogadores são simétricos faz sentido buscarmos umponto de equilíbrio onde os jogadores utilizem a mesma estratégia. Para istodefine-se a noção de equilíbrio de Nash simétrico:

Definição 6.7

Um equilíbrio de Nash σ∗ é simétrico se σ∗i = σ∗

j para todo par de jogadoresi , j ∈ N.

O próximo teorema prova que todo jogo em forma normal simétrico finito tempelo menos um equilíbrio de Nash simétrico.

Teorema 6.8

Um jogo em forma normal simétrico finito tem pelo menos um equilíbrio deNash simétrico.

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Equilíbrio Simétrico

Prova: A idéia da prova é análoga a prova da existência do equilíbrio de Nashno caso geral. Considere a função Fi : ∆(Ci) → ∆(Ci ):

Fi (σi )(s) =σi (s) + g s

i (σ)

1 +∑

t∈Cig ti (σ)

,

onde s ∈ Ci e σ é o perfil de estratégias mistas onde todos os jogadores jogamσi . Vamos mostrar que os pontos fixos de Fi constituem as estratégias dosequilíbrios de Nash simétricos. Já provamos que se σ for um equilíbrio de Nash(simétrico), então σi é um ponto fixo de Fi , pois neste caso temos g s

i (σ) = 0para todo s ∈ Ci . Por outro lado, se σi for um ponto fixo de Fi , entãoargumento idêntico a prova da existência do equilíbrio de Nash, nos leva aconcluir que g s

i (σ) = 0 para todo s ∈ Ci , o que por sua vez implica que σi éuma melhor resposta para σ−i . Como o jogo é simétrico, isto implica que σ éum equilíbrio de Nash simétrico.

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Equilíbrio Simétrico

Apesar de todo jogo simétrico possuir um equilíbrio simétrico em estratégiasmistas, isto nem sempre é verdade para equilíbrios simétricos em estratégiaspuras. Por exemplo, considere o seguinte jogo:

A B

A 0,0 1,1B 1,1 0,0

Os equilíbrios de Nash em estratégia puras deste jogo são ([B], [A]) e ([A], [B]).Portanto não são simétricos. O único equilíbrio de Nash simétrico é aquele noqual ambos os jogadores escolhem cada uma de suas estratégias puras comprobabilidade 1/2.

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Exemplo

Considere o seguinte jogo em forma normal simétrico:

A B C

A 1,1 2,1 4,1B 1,2 5,5 3,6C 1,4 6,3 0,0

Encontre todos os equilíbrios de Nash do jogo e determine quais são osequilíbrios simétricos.

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Exemplo

Solução: Primeiro note que os equilíbrios em estratégias puras são ([A], [A]),([C ], [A]) e ([A], [C ]). Vamos considerar se existe algum equilíbrio onde ojogador 1 utiliza uma estratégia com suporte em {A,B}. Neste caso, a melhorresposta para o jogador 2 seria escolher C com probabilidade 1, o que por suavez levaria o jogador 1 a escolher A com probabilidade 1. Logo, não existemequilíbrios onde o jogador 1 (e por simetria o jogador 2) escolhe uma estratégiacom suporte em {A,B}.Considere agora o caso em que o jogador 1 escolhe uma estratégia com suporteem {A,C}. Neste caso, a melhor resposta para o jogador 2 seria escolher Acom probabilidade 1. Neste caso, então o jogador 1 estaria indiferente entre Ae C e qualquer distribuição de probabilidade com que ele escolhe uma dessasações leva a um equilíbrio de Nash. Por simetria, se o jogador 2 tambémrandomizar entre A e C e o jogador 1 escolher A com probabilidade 1 tambémconstitui um equilíbrio.

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Exemplo

Considere agora o caso em que o jogador 1 escolhe uma estratégia com suporteem {B,C}. Seja p a probabilidade com que o jogador 1 escolhe B. Então, asutilidades esperadas para o jogador 2 das ações A, B e C são respectivamente:2p + 4(1− p), 5p + 3(1− p) e 6p. Se p ≤ 1/4, então A é uma melhor respostapara o jogador 2. Neste caso, o jogador 1 estaria indiferente entre B e C epoderia randomizar entre essas estratégias. Se p = 1/4, então o jogador 2 éindiferente entre A e B, mas já provamos que não existe nenhum equilíbrioonde 2 randomiza entre A e B. Se p = 1/2, então o jogador 2 ficará indiferenteentre A e C , mas neste caso já vimos que o jogador 1 escolheria A comprobabilidade 1, logo não há equilíbrio. Se p = 3/4, então o jogador 2 ficaráindiferente entre B e C , e por simetria, se o jogador 2 também escolher B comprobabilidade 3/4, o jogador 1 ficará indiferente entre B e C , então temos umequilíbrio onde ambos jogadores escolhem B com probabilidade 3/4 e C comprobabilidade 1/4.

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Exemplo

Finalmente, considere o caso em que o jogador 1 escolhe uma estratégia comsuporte em {A,B,C}. Suponha que o jogador 1 escolhe A, B e C comprobabilidades p1, p2 e 1 − p1 − p2, respectivamente. Neste caso, a utilidadeesperada para o jogador 2 das ações A, B e C são respectivamente:p1 + 2p2 + 4(1 − p1 − p2), p1 + 5p2 + 3(1 − p1 − p2) e p1 + 6p2. Pela simetriado problema, só poderá existir um equilíbrio neste caso se o jogador 2 tambémutilizar uma estratégia com suporte em {A,B,C}, pois os demais casos jáforam analisados. Para tanto, as utilidades esperadas dessas 3 ações deve ser amesma. Igualando as três expressões obtemos p1 = 1 e p2 = 0, o que nãosatisfaz a restrição do suporte ser em {A,B,C}, logo não há equilíbrios nestecaso.

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Exemplo

Resumindo, temos os seguintes equilíbrios:

([A], [A]), ([C ], [A]) e ([A], [C ]).

(p[A] + (1 − p)[C ], [A]) e ([A], p[A] + (1 − p)[C ]), para qualquerp ∈ (0, 1).

(p[B] + (1 − p)[C ], [A]) e ([A], p[B] + (1 − p)[C ]), para qualquerp ∈ (0, 1/4].

(3/4[B] + 1/4[C ], 3/4[B] + 1/4[C ]).

Apenas, o primeiro e o último deles são simétricos.

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Jogo de Dois Agentes com Soma Constante

Os primeiros trabalhos em teoria dos jogos se desenvolveram em jogos de somaconstante, em particular em jogos de soma zero. Um jogo com dois agentescom soma constante em forma normal é qualquer jogoΓ = ({1, 2}, C1, C2, u1, u2) tal que

u1(s1, s2) + u2(s1, s2) = K , ∀s1 ∈ C1,∀s2 ∈ C2.

Se K = 0, temos um jogo de soma zero. Note que jogos com dois agentes desoma constante descrevem situações em que os dois jogadores estão em plenaoposição um ao outro, ou seja, o ganho de um agente é exatamente igual aperda do outro. Note que em tais jogos, podemos descrever o objetivo dojogador 2 como sendo minimizar a utilidade esperada do jogador 1, tendo emvista que minimizar a utilidade esperada do jogador 1 é o mesmo quemaximizar a utilidade esperada do jogador 2.

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Jogo de Dois Agentes com Soma Constante

Suponha um jogo de soma constante de dois agentes finito onde o jogador ipossui conjunto de estratégias dada por Ci = {si,1, si,2, . . . , si,k(i)}. Seja A umamatriz k(1)× k(2), onde o elemento aij representa a utilidade para o jogador 1quando ele escolhe a estratégia s1,i e o jogador 2 escolhe a estratégia s2,j , ouseja, aij = ui (s1,i , s2,j ). Define-se um ponto de sela de uma matriz como sendoum elemento da matriz que é menor ou igual a todos na sua linha e é maior ouigual a todos na sua coluna. É fácil ver que aij é um ponto de sela da matriz Ase, e somente se, (s1,i , s2,j ) for um equilíbrio de Nash em estratégias puras dojogo.

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Maxmin

O próximo teorema trata do caso mais geral de equilíbrios de Nash emestratégia mista de um jogo de soma constante.

Teorema 7.1

(σ1, σ2) é um equilíbrio de Nash de um jogo finito de soma constanteΓ = ({1, 2}, C1, C2, u1, u2), se e somente se,

σ1 ∈ argmaxτ1∈∆(C1)min

τ2∈∆(C2)u1(τ1, τ2)

eσ2 ∈ argminτ2∈∆(C2)

maxτ1∈∆(C1)

u1(τ1, τ2).

Além disso, se (σ1, σ2) for um equilíbrio de Nash de Γ, então

u1(σ1, σ2) = maxτ1∈∆(C1)

minτ2∈∆(C2)

u1(τ1, τ2) = minτ2∈∆(C2)

maxτ1∈∆(C1)

u1(τ1, τ2).

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Demonstração

Suponha primeiro que (σ1, σ2) é um equilíbrio de Nash. Então,

maxτ1∈∆(C1)

u1(τ1, σ2) = u1(σ1, σ2) = minτ2∈∆(C2)

u1(σ1, τ2).

Como u1(τ1, σ2) ≥ minτ2∈∆(C2) u1(τ1, τ2) e u1(σ1, τ2) ≤ maxτ1∈∆(C1) u1(τ1, τ2),temos que

maxτ1∈∆(C1)

u1(τ1, σ2) ≥ maxτ1∈∆(C1)

minτ2∈∆(C2)

u1(τ1, τ2)

emin

τ2∈∆(C2)u1(σ1, τ2) ≤ min

τ2∈∆(C2)max

τ1∈∆(C1)u1(τ1, τ2).

Além disso, como σ1 ∈ ∆(C1) e σ2 ∈ ∆(C2), temos que

maxτ1∈∆(C1)

minτ2∈∆(C2)

u1(τ1, τ2) ≥ minτ2∈∆(C2)

u1(σ1, τ2)

emin

τ2∈∆(C2)max

τ1∈∆(C1)u1(τ1, τ2) ≤ max

τ1∈∆(C1)u1(τ1, σ2).

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Demonstração

Portanto,

u1(σ1, σ2) = maxτ1∈∆(C1)

u1(τ1, σ2)

≥ maxτ1∈∆(C1)

minτ2∈∆(C2)

u1(τ1, τ2)

≥ minτ2∈∆(C2)

u1(σ1, τ2) = u1(σ1, σ2)

e

u1(σ1, σ2) = minτ2∈∆(C2)

u1(σ1, τ2)

≤ minτ2∈∆(C2)

maxτ1∈∆(C1)

u1(τ1, τ2)

≤ maxτ1∈∆(C1)

u1(τ1, σ2) = u1(σ1, σ2).

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Demonstração

Logo, devemos ter igualdade acima, o que implica que

u1(σ1, σ2) = maxτ1∈∆(C1)

minτ2∈∆(C2)

u1(τ1, τ2) = minτ2∈∆(C2)

maxτ1∈∆(C1)

u1(τ1, τ2).

Além disso, como

minτ2∈∆(C2)

u1(σ1, τ2) = maxτ1∈∆(C1)

minτ2∈∆(C2)

u1(τ1, τ2)

emax

τ1∈∆(C1)u1(τ1, σ2) = min

τ2∈∆(C2)max

τ1∈∆(C1)u1(τ1, τ2),

temos queσ1 ∈ argmaxτ1∈∆(C1) min

τ2∈∆(C2)u1(τ1, τ2)

eσ2 ∈ argminτ2∈∆(C2) max

τ1∈∆(C1)u1(τ1, τ2).

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Demonstração

Para provar a recíproca suponha que

σ1 ∈ argmaxτ1∈∆(C1) minτ2∈∆(C2)

u1(τ1, τ2)

eσ2 ∈ argminτ2∈∆(C2) max

τ1∈∆(C1)u1(τ1, τ2).

Como temos um jogo finito, sabe-se que existe um equilíbrio de Nash do jogo,então segue da primeira parte da prova que

maxτ1∈∆(C1)

minτ2∈∆(C2)

u1(τ1, τ2) = minτ2∈∆(C2)

maxτ1∈∆(C1)

u1(τ1, τ2).

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Demonstração

Portanto, segue que

u1(σ1, σ2) ≥ minτ2∈∆(C2)

u1(σ1, τ2)

= maxτ1∈∆(C1)

minτ2∈∆(C2)

u1(τ1, τ2)

= minτ2∈∆(C2)

maxτ1∈∆(C1)

u1(τ1, τ2)

= maxτ1∈∆(C1)

u1(τ1, σ2) ≥ u1(σ1, σ2).

Logo, devemos ter igualdade acima, e temos

u1(σ1, σ2) = maxτ1∈∆(C1)

u1(τ1, σ2)

eu1(σ1, σ2) = min

τ2∈∆(C2)u1(σ1, τ2) = K − max

τ2∈∆(C2)u2(σ1, τ2).

Portanto, (σ1, σ2) é equilíbrio de Nash.

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Observações

Este teorema implica que em todos os equilíbrios de um jogo de somaconstante os jogadores têm a mesma utilidade esperada. Vamos ver a seguirque podemos determinar a solução de um jogo de soma constante finito atravésda solução de dois problemas de programação lineares.

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Cálculo do Equilíbrio

Seja A a matriz de dimensão k(1)× k(2) de utilidades do jogador 1. Comopreferências são invariantes a transformações afins positivas da funçãoutilidade, podemos assumir sem perda de generalidade que todos os elementosde A são positivos.Sejam c e b duas matrizes colunas de dimensões k(1) e k(2), respectivamente,onde todos os elementos são iguais a 1. Neste desenvolvimento vamos associaruma estratégia mista para o jogador i como sendo um vetor coluna dedimensão k(i), onde os elementos são não negativos e cuja soma é igual a 1.Considere o seguinte problema de programação linear:

max bT y

sujeito a Ay ≤ c, y ≥ 0.

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Cálculo do Equilíbrio

Como os elementos de A são positivos, é fácil ver que o conjunto viável é nãovazio e compacto. Portanto, existe uma solução. O problema dual pode serescrito como:

min cTx

sujeito a xT A ≥ bT , x ≥ 0.

O Teorema da Dualidade de programação linear nos garante que se o problemaprimal possui uma solução y∗ o problema dual também possui uma solução x∗

de tal forma que bTy∗ = cTx∗.

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Cálculo do Equilíbrio

Defina θ = bTy∗. Como os elementos de A são não negativos, temos queθ > 0. Note que x∗TAy∗ = θ (multiplique a restrição do problema primal porx∗T a esquerda para obter x∗T Ay∗ ≤ θ e a restrição do problema dual por y∗ adireita para obter x∗TAy∗ ≥ θ). Vamos provar que σ1 = x∗/θ e σ2 = y∗/θ éum equilíbrio de Nash do jogo. Como x∗T A ≥ bT , temos que para qualquerτ ∈ ∆(C2), x∗TAτ ≥ bT τ =

∑k(2)i=1 τ (s2,i ) = 1. Dividindo tudo por θ, temos

u1(σ1, τ ) = σT1 Aτ = (θ)−1x∗TAτ ≥ (θ)−1 (10)

= (θ)−2x∗TAy∗ = σT1 Aσ2 = u1(σ1, σ2).

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Cálculo do Equilíbrio

Portanto, o jogador 2 não tem incentivo a desviar sua estratégia de σ2 para τ .Similarmente, como Ay∗ ≤ c, temos que para qualquer τ ∈ ∆(C1),τTAy∗ ≤ τTc =

∑k(1)i=1 τ (s1,i ) = 1. Dividindo tudo por θ, temos

u1(τ, σ2) = τTAσ2 = τTAy∗(θ)−1 ≤ (θ)−1 (11)

= (θ)−2x∗TAy∗ = σT1 Aσ2 = u1(σ1, σ2).

Portanto, o jogador 1 não tem incentivo a desviar sua estratégia de σ1 para τ .Logo, (σ1, σ2) é um equilíbrio de Nash do jogo.

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Exemplo

O próximo exemplo ilustra esta metodologia para o cálculo do equilíbrio deNash em jogos de soma constante.Considere o seguinte jogo de soma constante:

A B C D

A 8,2 6,4 1,9 2,8B 5,5 3,7 7,3 5,5C 7,3 10,0 0,10 6,4D 7,3 5,5 5,5 9,1

Definição Exemplos Racionalizabilidade e Dominância Equilíbrio de Nash Aplicando o Equilíbrio de Nash Existência Soma

Exemplo

Neste caso, a matriz A é dada por:

8 6 1 25 3 7 57 10 0 67 5 5 9

Resolvendo o problema de programação linear primal acima, chegamos ao vetory∗T = [0 1

10110

0]. Já o problema dual possui uma infinidade de soluções da

forma x∗T = [0 5p

35

2p

35

2(1−p)10

], onde p ∈ [0, 1]. Desta forma, temos queθ = 2/10 e que os equilíbrios de Nash do jogo são da forma (σ1, σ2), ondeσ1 = [0 5p

7

2p

7(1 − p)], onde p ∈ [0, 1], e σ2 = [0 1

212

0].