teoria dos jogos

107
TEORIA DOS JOGOS Microeconomia II 2015

Upload: jonathannobre

Post on 15-Apr-2016

48 views

Category:

Documents


12 download

DESCRIPTION

Teoria dos Jogos

TRANSCRIPT

TEORIA DOS JOGOS

Microeconomia II

2015

DEFINIÇÕES

Uma maneira formal de se analisar

interações entre agentes racionais que

agem estrategicamente.

Um conjunto de técnicas para prever o resultado da interação de agentes na qual a ação de um participante diretamente afeta a recompensa dos outros participantes.

O QUE É TEORIA DOS JOGOS?

Jogos de soma zero

O interesse de cada jogador está em conflito

com o outro. Ou seja, qualquer jogo que exista

um vencedor e um perdedor como, por

exemplo, futebol e xadrez.

Jogos de soma não zero

O interesse dos jogadores não está sempre

em conflito havendo possibilidade dos dois

jogadores ganharem.

TIPOS DE JOGOS

Há dois ou mais jogadores

Há uma escolha estratégica de ações

Há um ou mais resultados

Há interação estratégica, ou seja, o resultados

depende da estratégia escolhida pelos jogadores.

Deste modo nós não estudaremos jogos de sorte

como loteria nos quais a estratégia não faz a

menor diferença, nem jogos de apenas um jogador

no qual o jogador não interagem estrategicamente

com outros jogadores.

CARACTERÍSTICAS DOS JOGOS

Jogador: qualquer indivíduo, grupo ou

organização envolvidos no processo de interação

estratégica e que tenha autonomia para tomar

decisões.

Ação ou Movimento: é uma escolha que o

jogador pode fazer em um dado momento do

jogo.

Conjunto de Ações: conjunto que descreve todas

as possíveis ações de um jogador.

DEFINIÇÕES

Por exemplo, em um jogo que dois bancos estão

decidindo se renovam ou não o empréstimo de uma

firma devedora que está tendo problema para pagar o

empréstimo o conjunto de ações de cada banco é

composto por duas ações: renova o empréstimo e não

renova o empréstimo. Assim o conjunto de ação do

banco A pode ser escrito como:

𝐴𝐴={Renova o empréstimo, Não renova o empréstimo}

Deste modo, qual seria o conjunto de ações do banco

B?

Qual o conjunto de ações do jogador 1 em um jogo

zero ou um?

CONJUNTO DE AÇÕES - CONTINUAÇÃO

Em um jogo em que cada jogador é identificado por

um subíndice i, no qual i=1,2,..,n, o conjunto de ações

do i-ésimo jogador lista todas as ações disponíveis

para aquele jogador. Esse conjunto de ações é

representado por:

𝑨𝒊{𝒂𝒊}

Conhecer o conjunto de ações de cada jogador é um

passo fundamental na análise de um processo de

interação estratégica.

Ao avaliar a melhor ação, cada jogador considera não

apenas toas as ações relevantes que dispões, mas

também todas as ações relevantes disponíveis para os

demais jogadores.

CONJUNTO DE AÇÕES - GENERALIZANDO

Estratégia : um plano de ações que especifica, para um

determinado jogador, que ação tomar em todos os momentos em

que ele terá de decidir o que fazer.

Conjunto de Estratégias ou Espaço de Estratégias :

conjunto de estratégias que cada jogador dispõe.

Por exemplo, em um jogo que a empresa inovadora está

decidindo antes se lança um produto novo ou não e a empresa

l íder decidindo depois se mantém ou reduz o preço do seu

produto antigo, o conjunto de estratégias da empresa inovadora

é:

𝑆 𝑖𝑛𝑜𝑣𝑎𝑑𝑜𝑟𝑎 = {𝑙𝑎𝑛ç𝑎 𝑜 𝑝𝑟𝑜𝑑𝑢𝑡𝑜 𝑛𝑜𝑣𝑜, 𝑛ã𝑜 𝑙𝑎𝑛ç𝑎 𝑜 𝑝𝑟𝑜𝑑𝑢𝑡𝑜 𝑛𝑜𝑣𝑜}

No caso do jogo dos bancos que decidem renovar ou não o

empréstimo da firma devedora o conjunto de estratégias dos

dois bancos coincide com o conjunto de ações dos dois bancos.

CONJUNTO DE ESTRATÉGIAS

Como a empresa líder decidindo depois da empresa inovadora

se mantém ou reduz o preço do seu produto antigo, o conjunto

de estratégias da empresa líder é um pouco mais complexo:

𝑆 𝑙í𝑑𝑒𝑟 = {mantém o preço se inovadora lança produto novo, mantém o preço se inovadora não lança o produto novo; reduz o preço se inovadora lança produto novo, mantém o preço se inovadora não lança o produto novo; mantém o preço se inovadora lança produto novo, reduz o preço se inovadora não lança o produto novo; reduz o preço se inovadora lança produto novo, reduz o preço se inovadora não lança o produto novo}

O conjunto de estratégia da empresa líder é mais complexo

porque o conjunto a empresa líder possui mais informação

quando ela toma sua decisão.

CONJUNTO DE ESTRATÉGIAS -

CONTINUAÇÃO

Se chamarmos de 𝑠𝑗𝑖 a j-ésima estratégia do

jogador i, o conjunto de estratégias ou espaço

de estratégias do jogador i é dado por:

𝑆 𝑖 = 𝑠𝑗𝑖

Combinação de Estratégias é representada por

um conjunto ordenado, no qual cada elemento é

uma estratégia para cada um dos n jogadores.

𝑆 = 𝑠1 , 𝑠2 … , 𝑠𝑛

CONJUNTO DE ESTRATÉGIAS -

GENERALIZAÇÃO

Recompensa (Payoff): aquilo que o jogador obtém depois de

encerrado o jogo, de acordo com suas próprias escolhas e a dos

demais jogadores.

Função de Recompensa: especifica um valor numérico que nos

ajuda a perceber como o jogador avalia um determinado

resultado do jogo. Deste modo, a função de recompensa

possibilita a ordenação dos possíveis resultados do jogo. Então

a função de recompensa é tal que:

∀ 𝒙 𝒆 𝒚, 𝝅 𝒙 ≥ 𝝅 𝒚 𝒔𝒆 𝒙 ≿ 𝒚

A função de recompensa ordena as preferências de um mesmo

jogador.

A função de preferência não pode ser usada para ordenar as

preferências de jogadores diferentes.

Cada combinação estratégica produz recompensas diferentes

para os jogadores.

DEFINIÇÕES - CONTINUAÇÃO

JOGOS SIMULTÂNEOS COM

INFORMAÇÃO COMPLETA

Forma

Normal

1. Recompensas são fixas e conhecidas.

2. Os jogadores se comportam de forma

racional

Entendem o jogo e cada jogador busca

maximizar sua a recompensa.

3. As regras do jogo, incluindo recompensas,

são de conhecimento comum

4. Jogadores são neutros ao risco

Maximizam o retorno esperado.

JOGOS SIMULTÂNEOS COM INFORMAÇÃO

COMPLETA - HIPÓTESES

Toda informação (quem são os jogadores, quais são as

estratégias, quais são as recompensas para cada possível

combinação de estratégias) é conhecida por todos os

jogadores e todos os jogadores sabem que os outros

jogadores sabem que os outros jogadores conhecem toda

informação do jogo.

Os jogadores racionais adotarão as estratégias que

maximizam suas recompensas, por isso, afirmar que as

recompensas são de conhecimento comum significa dizer

que nenhum dos jogadores possui dúvidas sobre o resultado

que os demais jogadores buscam obter. Assim, cada

jogador sabe exatamente com quem está jogando, pois

sabe quais os objetivos dos outros jogadores.

CONHECIMENTO COMUM

Os jogos simultâneos com informação completa são, geralmente, representados pela forma normal.

Definição:

A representação na formal normal de um jogo especifica os jogadores i=1,2,..,n, os espaços de estratégias 𝑆1 , 𝑆2,… , 𝑆𝑛 dos jogadores e suas funções de recompensas

𝜋1 , 𝜋2 ,...,𝜋𝑛

Desta forma o jogo pode ser denotado por

𝐺 = 1,2,...,n; 𝑆1 , 𝑆2,… , 𝑆𝑛 ; 𝜋1 , 𝜋2 ,...,𝜋𝑛 .

Observação: Os valores das recompensas não precisam representa exatamente o valor obtido por cada jogador, mas sim a ordenação de suas preferências.

FORMA NORMAL

Jogadores: Luísa (linha) e Carlos (coluna);

Luísa quer ir ao cinema;

Carlos quer ir ao Futebol;

Os dois gostam de ficarem juntos.

EXEMPLO: BATALHA DOS SEXOS

Futebol Cinema

Futebol 1,2 0,0

Cinema 0,0 2,1

Carlos

Luís

a

Confessa Não Confessa

Confessa -2,-2 0,-4

Não Confessa -4,0 -1,-1

BUSCANDO A SOLUÇÃO DO JOGO: ELIMINANDO

ESTRATÉGIAS ESTRITAMENTE DOMINADAS

Dilema dos Prisioneiros:

Para o jogador 1, a estratégia confessar estritamente domina a estratégia

não confessar. Ou seja, a estratégia não confessar é estritamente dominada

pela estratégia confessar.

Definição:

Uma estratégia 𝑠𝑖∗∗ é estritamente dominada

para o jogador i por uma estratégia 𝑠𝑖∗ se:

𝜋 𝑠𝑖∗ , 𝑠−𝑖 > 𝜋 𝑠𝑖

∗∗ , 𝑠−𝑖 , para todo 𝑠−𝑖

ESTRATÉGIA ESTRITAMENTE DOMINADA

Definição:

Uma estratégia 𝑠𝑖∗ é estritamente dominante

para o jogador i em relação a uma estratégia

𝑠𝑖∗∗ se:

𝜋 𝑠𝑖∗ , 𝑠−𝑖 > 𝜋 𝑠𝑖

∗∗ , 𝑠−𝑖 , para todo 𝑠−𝑖

ESTRATÉGIA ESTRITAMENTE DOMINANTE

AGORA É A SUA VEZ: IDENTIFIQUE E ELIMINE A

ESTRATÉGIA ESTRITAMENTE DOMINADA DO

JOGADOR 2

Dilema dos Prisioneiros:

Para o jogador 2, a estratégia confessar é estritamente dominante em

relação à estratégia não confessar.

Ou seja, a estratégia não confessar é estritamente dominada pela estratégia

confessar.

BUSCANDO A SOLUÇÃO DO JOGO: ELIMINANDO

ESTRATÉGIAS ESTRITAMENTE DOMINADAS

Dilema dos Prisioneiros:

Confessar é a estratégia estritamente dominante para os dois jogadores,

então a solução desse jogos é os prisioneiros confessam e cada um será

sentenciado com dois anos de cadeia.

Este jogo é solucionável por dominância, ou seja, podemos encontrar a

solução (o equilíbrio) através da eliminação iterativa das estratégias

dominantes.

Lançar Nova

Versão

Reduzir Preço

Lançar Modelo

Próprio

1,4 1,3

Importar da

Matriz

2,2 2,3

BUSCANDO A SOLUÇÃO DO JOGO: ELIMINANDO

ESTRATÉGIAS ESTRITAMENTE DOMINADAS

O resultado dado pela combinação das estratégias (Importar da Matriz,

Reduzir o Preço) é um equilíbrio em estratégias estritamente dominantes.

Este jogo é solucionável por dominância.

Para solucionar o jogo por intermédio da

eliminação iterativa de estratégias estritamente

dominadas assumiu-se o conhecimento comum

da racionalidade (CCR).

O jogador 1 sabe que os jogadores 1 e 2 são racionais. O

jogador 2 sabe que jogador 1 sabe que os jogadores 1 e 2

são racionais. O jogador 1 sabe que o jogador 2 sabe que

jogador 1 sabe que os jogadores 1 e 2 são racionais,...

CONSIDERAÇÕES

As estratégias que resultam da eliminação iterativa

de estratégias estritamente dominadas são

chamadas de racionalizáveis.

Uma dada estratégia 𝑠𝑖∗ do um jogador 𝑖 é

considerada a melhor resposta desse jogador 𝑖 a

uma dada estratégia 𝑠−𝑖 dos demais jogadores se:

𝜋 𝑠𝑖∗ , 𝑠−𝑖 ≥ 𝜋 𝑠𝑖

, , 𝑠−𝑖 , para algum 𝑠−𝑖 e todo 𝑠𝑖, ≠ 𝑠𝑖

Ou seja, a melhor resposta é a estratégia que dá a

melhor recompensa ao jogador 𝑖 para uma dada

estratégia dos outros jogadores.

ESTRATÉGIAS RACIONALIZÁVEIS E

MELHOR RESPOSTA

Lançar nova

versão

Manter

preço

Reduzir

Preço

Lançar

modelo

próprio

1,4 4,1 1,3

Importar da

matriz 2,2 2,1 2,3

Não competir 0,1 0,6 0,0

BUSCANDO A SOLUÇÃO DO JOGO: ELIMINANDO

ESTRATÉGIAS ESTRITAMENTE DOMINADAS

A estratégia Não Competir não é a melhor resposta para

nenhuma estratégia que a empresa Carro Novo possa adotar,

então a estratégia Não Competir não é uma estratégia

racionalizável para a empresa Novo Auto.

Empresa Carro Novo

Em

pre

sa

No

vo A

uto

BUSCANDO A SOLUÇÃO DO JOGO: ELIMINANDO

ESTRATÉGIAS ESTRITAMENTE DOMINADAS

Este jogo não é solucionável por dominância.

Eliminar estratégias fortemente dominadas pode não

ser aplicável, mas sempre que é dá certo.

Não

Exporta

Exporta

em

Pequena

Escala

Exporta

em

Grande

Escala

Investe 2,1 1,0 0,-1

Não Investe 1,0 2,1 -1,2

JOGO DA PREVENÇÃO DA ENTRADA NO

MERCADO NACIONAL

Entrante Potencial

Em

pre

sa

Do

min

an

te

Nem sempre as estratégias que não podem ser eliminadas em um

processo de eliminação iterativa de estratégias estritamente

dominadas são, necessariamente, racionalizáveis.

Exportar em pequena escala não é uma estratégia racionalizável para a

empresa entrante.

EQUILÍBRIO DE NASH

Diz-se que uma combinação de estratégias constitui um equilíbrio de Nash quando cada estratégia é a melhor resposta possível às estratégias dos demais jogadores, e isso é verdade para todos os jogadores.

Definição: as estratégias 𝑠1 , 𝑠2 , … , 𝑠𝑛 constituem um equilíbrio de Nash para o jogo G se:

𝜋𝑖 𝑠𝑖,∗𝑠−𝑖,

∗ ≥ 𝜋𝑖 𝑠𝑖 ,𝑠−𝑖,∗ para todo 𝑠𝑖 , e todo 𝑖 .

Ou seja, no Equilíbrio de Nash nenhum jogador conseguirá aumentar a sua recompensa mudando unilateralmente a sua estratégia.

EQUILÍBRIO DE NASH

Lançar Nova

Versão

Reduzir Preço

Lançar Modelo

Próprio

1,4 1,3

Importar da

Matriz

2,2 2,3

BUSCANDO A SOLUÇÃO DO JOGO:

IDENTIFICADOS AS ESTRATÉGIAS QUE SÃO

MELHOR RESPOSTAS

Conforme discutido anteriormente, o resultado dado pela combinação das

estratégias (Importar da Matriz, Reduzir o Preço) é um equilíbrio em

estratégias estritamente dominantes. Ou seja, este jogo é solucionável por

dominância.

Este mesmo resultado é, também um equilíbrio de Nash.

ENCONTRANDO O EQUILÍBRIO DE NASH

Este jogo não é solucionável por dominância.

Porém, este jogo possui uma solução que corresponde

ao conceito de equilíbrio de Nash.

Não

Exporta

Exporta

em

Pequena

Escala

Exporta

em

Grande

Escala

Investe 2,1 1,0 0,-1

Não Investe 1,0 2,1 -1,2

JOGO DA PREVENÇÃO DA ENTRADA NO

MERCADO NACIONAL

Entrante Potencial

Em

pre

sa

Do

min

an

te

O resultado dado pela combinação das estratégias

(Investe, Não Exporta) é o Equilíbrio de Nash neste jogo.

BUSCANDO A SOLUÇÃO DO JOGO: ELIMINANDO

ESTRATÉGIAS ESTRITAMENTE DOMINADAS

Dilema dos Prisioneiros:

O resultado dado pela combinação das estratégias

(Confessa, Confessa) é o Equilíbrio de Nash neste jogo.

EXEMPLO: BATALHA DOS SEXOS

Futebol Cinema

Futebol 1,2 0,0

Cinema 0,0 2,1

Carlos

Luís

a

Os resultados (Futebol, Cinema) e (Cinema, Futebol)

são soluções para este jogo.

Há mais que um Equilíbrio de Nash neste jogo.

JOGO DURÃO E MEDROSO

Os resultados (M, D) e (D, M) são soluções para este

jogo.

Há mais que um Equilíbrio de Nash neste jogo.

Definição:

As estratégias 𝑠1 , 𝑠2 , … , 𝑠𝑛 constituem um equilíbrio

de Nash Estrito para o jogo G se:

𝜋𝑖 𝑠𝑖,∗𝑠−𝑖,

∗ > 𝜋𝑖 𝑠𝑖 ,𝑠−𝑖,∗ para todo 𝑠𝑖 , e todo 𝑖 .

Dado a estratégia escolhida do oponente, não há

nenhuma estratégia que seja pelo menos tão boa

quanto a estratégia que os outros jogadores estão

jogando no equilíbrio de Nash.

EQUILÍBRIO DE NASH ESTRITO

IDENTIFICANDO EQUILÍBRIO DE NASH

ESTRITO

Dilema dos Prisioneiros:

O resultado dado pela combinação das estratégias

(Confessa, Confessa) é um Equilíbrio de Nash Estrito.

Um equilíbrio em estratégia estritamente

dominantes é sempre um equilíbrio de Nash,

mas um equilíbrio de Nash nem sempre é um

equilíbrio em estratégia dominante.

Se existir um equilíbrio em estratégia

estritamente dominantes este equilíbrio

também é um equilíbrio de Nash Estrito.

RELAÇÃO ENTRE EQUILÍBRIO DE NASH E

EQUILÍBRIO EM ESTRATÉGIAS ESTRITAMENTE

DOMINANTES

Ótimo de Pareto: um dada situação em que não é

possível melhorar a situação de um agente sem

piorar a de outro.

Equilíbrio de Nash: Cada jogador individualmente

adota a melhor resposta às estratégias dos demais

jogadores, mas isso não significa que a situação

resultante das decisões conjuntas será a melhor

possível.

EQUILÍBRIO DE NASH E ÓTIMO DE PARETO

DILEMA DOS PRISIONEIROS

O resultado dado pela combinação das estratégias (Confessa,

Confessa) é um Equilíbrio de Nash, mas não é uma Alocação

Ótima de Pareto. Se os dois jogadores conseguissem cooperar

eles poderiam melhorar as recompensas obtidas desse jogo.

Definições:

Um jogo é dito Não-Cooperativo quando os jogadores

não podem estabelecer compromissos garantidos.

Se os jogadores podem estabelecer compromissos, e

esses compromissos possuem garantias efetivas, diz-

se que o jogo é Cooperativo.

JOGOS COOPERATIVOS E NÃO-

COOPERATIVOS

Tarifa Alta Tarifa Baixa

Tarifa Alta 800 , 800 2.300 , (700)

Tarifa Baixa (700) , 2300 1.700 , 1.700

O JOGO DO COMÉRCIO INTERNACIONAL

Vimos no Jogo da Batalha dos Sexos que é possível que haja mais que um equilíbrio de Nash para um dado jogo.

Esse jogo é um exemplo de coordenação com várias opções.

Na realidade, há uma série de situações com várias possibilidades de equilíbrio, ou seja, situações em que os agentes não teriam estímulos para mudar suas decisões.

Porém em qual desses equilíbrios os agentes irão acomodar-se?

EQUILÍBRIO DE NASH: CONSIDERAÇÕES

Adota Campanha

Agressiva

Não Adota

Campanha

Agressiva

Adota Campanha

Agressiva -20,-20 10,-10

Não Adota

Campanha

Agressiva

-10,10 0,0

O JOGO DA CAMPANHA PUBLICITÁRIA

Definição:

Um ponto focal é um elemento que destaca de um

contexto, e que permite aos jogadores coordenarem suas

decisões em um dentre vários equilíbrios de Nash

possíveis.

O conceito do ponto focal baseará a coordenação dos

agentes para a obtenção da solução cooperativa.

Para tanto, precisaremos que existam:

1. Conhecimento comum;

2. Compartilhamento de experiência;

3. Pequenos grupos de jogadores.

O CONCEITO DO PONTO FOCAL

Atualizar Não Atualizar

Desenvolver 2,1 -1,-2

Não Desenvolver 0,-1 1,2

JOGO DE COORDENAÇÃO DO PADRÃO

TECNOLÓGICO

Empresa de Antivírus

Em

pre

sa

de

Sis

tem

a

Op

era

cio

na

l

Ponto Focal: Colunista especializado em uma revista

internacional de novidades em tecnologia de

informação.

Cara Coroa

Cara 1,-1 -1,1

Coroa -1,1 1,-1

AUSÊNCIA DE EQUILÍBRIO DE NASH

Não existe equilíbrio de Nash com estratégias puras.

Esse jogo, matching pennies, é um jogo estritamente

competitivo ou de soma zero.

Nesta aula nós discutimos alguns jogos que são

importantes na literatura da teoria dos jogos, como:

1. A batalha dos Sexos

Coordenação com várias opções.

2. O Dilema do Prisioneiro

Cooperação versus interesse próprio.

3. O Jogo da Galinha

Competição destrutiva

JOGOS IMPORTANTES

Cervo Lebre

Cervo 3,3 0,1

Lebre 1,0 1,1

O JOGO DA CAÇA AO CORVO: O DILEMA DO

CONTRATO SOCIAL

O jogo da caça ao cervo representa situações de interação

estratégicas em que:

O melhor resultado depende da cooperação de todos.

Se alguém buscar um resultado individual mais imediato,

aqueles que se mantiverem fiéis ao compromisso inicial serão

prejudicados.

JOGOS ESTRITAMENTE

COMPETITIVOS

Também conhecidos como Jogos de Soma Zero.

Jogadores estão preocupados em infligir o maior dano

possível uns aos outros, uma vez que a perda para um

dos jogadores representa o ganho para o outro.

Definição: Seja um par qualquer de estratégias do

jogador 𝑎 , representado por 𝒔𝒊𝒂 , 𝒔𝒋

𝒂 , e seja um par

qualquer de estratégias do jogador 𝒃, representado por

𝒔𝒊𝒃 , 𝒔𝒋

𝒃 . Para que o jogo seja estritamente competitivo,

é necessário que:

𝝅𝒂 𝒔𝒊𝒂 , 𝒔𝒋

𝒃 ≥ 𝝅𝒂 𝒔𝒋𝒂 , 𝒔𝒊

𝒃 𝒔𝒆, 𝒆 𝒔𝒐𝒎𝒆𝒏𝒕𝒆 𝒔𝒆, 𝝅𝒃 𝒔𝒋𝒂 , 𝒔𝒊

𝒃

≥ 𝝅𝒃 𝒔𝒊𝒂 , 𝒔𝒋

𝒃

JOGOS ESTRITAMENTE COMPETITIVOS

Uma combinação de estratégias fornece uma

recompensa maior ou igual à outra combinação de

estratégias para um dos jogadores, se o inverso

acontecer para o outro jogador.

Portanto, é permitido escrever os jogos estritamente

competitivos indicando apenas as recompensas de um

dos jogadores, pois o resultado que um dos jogadores

prefere é exatamente o resultado que o outro jogador

despreza.

JOGOS ESTRITAMENTE COMPETITIVOS

Então, podemos escrever a recompensa de um dos

jogadores como sendo a recompensa do outro jogador, com

o sinal trocado:

𝝅𝒂 𝒔𝒊𝒂 , 𝒔𝒋

𝒃 = −𝝅𝒃 𝒔𝒊𝒂 , 𝒔𝒋

𝒃

Logo, a soma das recompensas dos dois jogadores será

zero:

𝝅𝒂 𝒔𝒊𝒂 , 𝒔𝒋

𝒃 +𝝅𝒃 𝒔𝒊𝒂 , 𝒔𝒋

𝒃 =0

Esta é a razão desses jogos serem conhecidos como jogos

de soma zero.

Assim, em um jogo estritamente competitivo, não existe

combinação de estratégias preferível a qualquer outra para

os dois jogadores simultaneamente.

JOGOS ESTRITAMENTE COMPETITIVOS

A BATALHA DE BISMARK:

ESTE JOGO É UM JOGO ESTRITAMENTE

COMPETITIVO?

Rota Sul Rota Norte

Busca Rota Sul no primeiro dia 3,-3 1,-1

Busca Rota Norte primeiro dia 2,-2 2,-2

Comboio Japonês

Forç

as A

liad

as

Cara Coroa

Cara 1,-1 -1,1

Coroa -1,1 1,-1

MATCHING PENNIES

Esse jogo é um jogo estritamente competitivo ou de soma

zero.

Jogadores: Luísa (linha) e Carlos (coluna);

Número iguais Luísa ganha;

Números diferentes Carlos ganha;

ZERO OU UM

0 1

0 1,-1 -1,1

1 -1,1 1,-1

Luís

a

Carlos

Jogadores: Luísa (linha) e Carlos (coluna);

TESOURA , PAPEL OU PEDRA

T PP PR

T 0,0 1,-1 -1,1

PP -1,1 0,0 1,-1

PR 1,-1 -1,1 0,0

Luís

a

Carlos

Alternativamente podemos representar os jogos

estritamente competitivos (ou jogos de soma zero)

representando apenas a recompensa do jogador que

está na linha, uma vez que a recompensa do jogador

que está na coluna é o seu oposto.

REPRESENTAÇÃO ALTERNATIVA

0 1

0 1,-1 -1,1

1 -1,1 1,-1

Luís

a

Carlos

0 1

0 1 -1

1 -1 1

Carlos

Luís

a

A BATALHA DE BISMARK

Rota Sul Rota Norte

Busca Rota Sul no primeiro dia 3,-3 1,-1

Busca Rota Norte primeiro dia 2,-2 2,-2

Comboio Japonês

Forç

as A

liad

as

Rota Sul Rota Norte

Busca Rota Sul no primeiro dia 3 1

Busca Rota Norte primeiro dia 2 2Forç

as A

liad

as

Comboio Japonês

EQUILÍBRIO EM JOGOS

ESTRITAMENTE

COMPETITIVOS

Minimax e Maxmin

Cada jogador está tomando suas decisões

procurando causar o maior dano possível ao outro

jogador.

Uma estratégia prudente é tentar minimizar o dano

que o oponente pode lhe causar.

QUAL A MELHOR ESTRATÉGIA EM UM JOGO

ESTRITAMENTE COMPETITIVO?

Representando as recompensas apenas do jogador

que está na linha, podemos representar o pior

resultado que o jogador que está na coluna pode obter

caso ele escolha a estratégia representada pela

coluna 𝑡 ′ por:

max𝑠

𝜋 𝑠, 𝑡 ′

Onde s é a estratégia do jogador que está na linha. E a

função de recompensa acima apresentada é a função

de recompensa do jogador que está na linha.

RESOLVENDO PELO MÉTODO DO MAXMIN OU

MINIMAX

O pior resultado que o jogador que está na linha pode

obter caso ele escolha a estratégia representada pela

linha 𝑠 ′ é representado por:

min𝑡

𝜋 𝑠 ′ , 𝑡

Onde t é a estratégia do jogador que está na coluna. E

a função de recompensa acima apresentada é a

função de recompensa do jogador que está na linha.

RESOLVENDO PELO MÉTODO DO MAXMIN OU

MINIMAX

A BATALHA DE BISMARK

Rota Sul Rota Norte

Busca Rota Sul no primeiro dia 3 1

Busca Rota Norte primeiro dia 2 2Forç

as A

liad

as

Comboio Japonês

Então, o valor maxmin do jogo, ou seja, o maior dano que os aliados podem garantir, dadas as suas opções e as opções da marinha japonesa, é dado por:

max𝑠

min𝑡

𝜋 𝑠, 𝑡 = 𝜋 𝑠2 , 𝑡2

Quando a combinação de estratégias para os quais o

máximo entre os mínimos que o jogador na linha

pode obter for a mesma para o qual o jogador nas

colunas obtém o mínimo entre os máximos, temos:

𝑚𝑖𝑛𝑖𝑚𝑎𝑥 𝑛𝑎𝑠 𝑐𝑜𝑙𝑢𝑛𝑎𝑠 = 𝑚𝑎𝑥𝑚𝑖𝑛 𝑛𝑎𝑠 𝑙𝑖𝑛ℎ𝑎𝑠

Ou seja,

Que no caso anterior é 𝜋 𝑠2 , 𝑡2 = 2.

PONTO DE SELA

min𝑡

max𝑠

𝜋 𝑠, 𝑡 =max𝑠

min𝑡

𝜋 𝑠, 𝑡

PONTO DE SELA

O equilíbrio maxmin-minimax é um equilíbrio, pois nenhum

dos jogadores tem incentivo a desviar da escolha

estratégica que compõe a combinação de estratégias que

tenta impor o maior dano possível ao seu oponente.

A combinação de estratégias cuja recompensa tenta impor

o maior dano possível ao seu oponente, tem como melhor

resposta minimizar as suas próprias perdas.

Assim, como cada jogador está buscando escolher a

estratégia que é a melhor resposta a estratégia do seu

oponente, o equilíbrio maxmin-minimax é um Equilíbrio de

Nash.

EQUILÍBRIO MINIMAX

ESTRATÉGIAS MISTAS

Os jogadores jogam estratégias puras quando

adotam uma estratégia com certeza.

Quando um jogador varia a escolha de suas

estratégias de forma a tentar surpreender o outro

jogador, diz-se que ele adota estratégia mista.

Faz-se uso de estratégias mistas para buscar

surpreender e evitar ser surpreendido, neutralizando

os efeitos da estratégia escolhida pelo outro

jogador.

ESTRATÉGIA MISTAS

Definição:

Quando, em vez de escolher entre suas estratégias

uma dada estratégia para jogá-la com certeza, um

jogador decide alternar entre suas estratégias

aleatoriamente, atribuindo uma probabilidade a

cada estratégia a ser escolhida, diz-se que o jogador

utiliza estratégias mistas. Caso contrário, diz-se que

emprega estratégias puras .

ESTRATÉGIA MISTAS

Definição :

A recompensa esperada de um jogador pela adoção

de uma dada estratégia é a recompensa que ele

pode vir a obter, em média, dadas as probabilidades

com que os outros jogadores escolhem suas

estratégias.

RECOMPENSA ESPERADA

ZERO OU UM: RESOLVENDO POR

ESTRATÉGIAS MISTAS.

𝜋𝐶𝑎𝑟𝑙𝑜𝑠𝑒 0 = 𝑝 × −1 + 1 − 𝑝 × 1

𝜋𝐶𝑎𝑟𝑙𝑜𝑠𝑒 1 = 𝑝 × 1 + 1 − 𝑝 × −1

𝜋𝐿𝑢í𝑠𝑎𝑒 0 = 𝑞 × 1 + 1 − 𝑞 × −1

𝜋𝐿𝑢í𝑠𝑎𝑒 1 = 𝑞 × −1 + 1 − 𝑞 × 1

0 (q) 1 (1-q) RE Luísa

0 (p) 1,-1 -1,1 q*1+(1-q)*(-1)

1 (1-p) -1,1 1,-1 q*(-1)+(1-q)*(1)

RE Carlos p*(-1)+(1-p)*1 p*1+(1-p)*(-1)

Luís

a

Carlos

ZERO OU UM: RESOLVENDO POR

ESTRATÉGIAS MISTAS.

O Jogo zero ou um não tem equilíbrio em estratégias

estritamente dominantes, não tem equilíbrio de Nash

em estratégias puras, mas tem equilíbrio em

estratégias mistas.

0 (q) 1 (1-q) RE Luísa

0 (p) 1,-1 -1,1 q*1+(1-q)*(-1)

1 (1-p) -1,1 1,-1 q*(-1)+(1-q)*(1)

RE Carlos p*(-1)+(1-p)*1 p*1+(1-p)*(-1)

Luís

a

Carlos

ZERO OU UM: RESOLVENDO POR

ESTRATÉGIAS MISTAS.

O Jogo zero ou um não tem equilíbrio em estratégias

estritamente dominantes, não tem equilíbrio de Nash em

estratégias puras, mas tem equilíbrio em estratégias mistas.

O equilíbrio de Nash em estratégias mista para esse jogo

acontece quando a Luísa e o Carlos escolhem suas estratégias

com a mesma probabilidade, 𝑝 = 𝑞 = 12 , de tal forma que

nenhum deles consegue antecipar se o seu oponente escolherá

zero ou um.

Ou seja, cada um dos jogadores neutralizou a vantagem que seu

oponente teria variando aleatoriamente sua escolha.

O Equilíbrio de Nash em estratégias mistas é:

𝑝, 1 − 𝑝 , 𝑞, 1 − 𝑞 =1

2,1

2,1

2,1

2

ZERO OU UM: A FUNÇÃO DE RECOMPENSA

ESPERADA QUANDO TODOS OS JOGADORES

JOGAM ESTRATÉGIAS MISTAS.

𝜋𝐿𝑢í𝑠𝑎𝑒 = 𝑝𝑞 1 + 1 − 𝑝 1 − 𝑞 −1

+ 1 − 𝑝 𝑞 −1 + 1 − 𝑝 1 − 𝑞 1 = 0

𝜋𝐶𝑎𝑟𝑙𝑜𝑠𝑒 = 𝑝𝑞 −1 + 1 − 𝑝 𝑞(1)+ 𝑝 1 − 𝑞 (1) +1 − 𝑝 1 − 𝑞 −1 =0

0 (q) 1 (1-q) RE Luísa

0 (p) 1,-1 -1,1 q*1+(1-q)*(-1)

1 (1-p) -1,1 1,-1 q*(-1)+(1-q)*(1)

RE Carlos p*(-1)+(1-p)*1 p*1+(1-p)*(-1)

Luís

a

Carlos

O JOGO DA GUERRA FRIA:

RESOLVENDO POR ESTRATÉGIAS MISTAS

Ameaça Não Ameaça

Ameaça -100,-100 10,-10

Não Ameaça -10,10 0,0

URSS

EUA

O JOGO DA GUERRA FRIA:

RESOLVENDO POR ESTRATÉGIAS MISTAS

Ameaça (q) Não Ameaça (1-q) RE EUA

Ameaça (p) -100,-100 10,-10 q*(-100)+(1-q)*10

Não Ameaça (1-p) -10,10 0,0 q*(-10)+(1-q)*0

RE URSS p*(-100)+(1-p)*10 p*(-10)+(1-p)*0

EUA

URSS

Os EUA escolherão a probabilidade de ameaçar que fará a URSS

ser indiferente entre ameaçar e não ameaçar. Ou seja:

𝜋𝑈𝑅𝑆𝑆𝑒 𝐴𝑚𝑒𝑎ç𝑎 = 𝜋𝑈𝑅𝑆𝑆

𝑒 𝑁ã𝑜 𝐴𝑚𝑒𝑎ç𝑎

Sendo,

𝜋𝑈𝑅𝑆𝑆𝑒 𝐴𝑚𝑒𝑎ç𝑎 = 𝑝 × −100 + 1 − 𝑝 × 10

𝜋𝑈𝑅𝑆𝑆𝑒 𝑁ã𝑜 𝐴𝑚𝑒𝑎ç𝑎 = 𝑝 × (−10) + 1 − 𝑝 × 0

O JOGO DA GUERRA FRIA:

RESOLVENDO POR ESTRATÉGIAS MISTAS

Ameaça (q) Não Ameaça (1-q) RE EUA

Ameaça (p) -100,-100 10,-10 q*(-100)+(1-q)*10

Não Ameaça (1-p) -10,10 0,0 q*(-10)+(1-q)*0

RE URSS p*(-100)+(1-p)*10 p*(-10)+(1-p)*0

EUA

URSS

A URSS, também, escolherá a probabilidade de ameaçar que

fará os EUA ser indiferente entre ameaçar e não ameaçar. Ou

seja:

𝜋𝐸𝑈𝐴𝑒 𝐴𝑚𝑒𝑎ç𝑎 = 𝜋𝐸𝑈𝐴

𝑒 𝑁ã𝑜 𝐴𝑚𝑒𝑎ç𝑎

Sendo,

𝜋𝑈𝑅𝑆𝑆𝑒 𝐴𝑚𝑒𝑎ç𝑎 = 𝑞 × −100 + 1 − 𝑞 × 10

𝜋𝑈𝑅𝑆𝑆𝑒 𝑁ã𝑜 𝐴𝑚𝑒𝑎ç𝑎 = 𝑞 × (−10) + 1 − 𝑞 ×0

Assim, a combinação de estratégias mistas que faz os

jogadores indiferentes entre ameaçar e não ameaçar é

Este jogo possui dois equilíbrios de Nash em estratégias

pura e um equilíbrio em estratégia mistas.

É melhor escolher o equilíbrio em estratégia mista que dá

uma recompensa de -1 a cada um do jogadores, que é

uma recompensa melhor do que ter a chance de uma

ameaça mútua.

O JOGO DA GUERRA FRIA:

RESOLVENDO POR ESTRATÉGIAS MISTAS

𝑝, 1 − 𝑝 , 𝑞, 1 − 𝑞 =1

10,9

10,

1

10,9

10

Em todo o jogo que há um número

finito de jogadores, com um número

finito de estratégias, sempre há um

equilíbrio de Nash, provavelmente em

estratégias mistas.

ESTRATÉGIAS MISTAS

JOGOS SEQUENCIAIS

Que acontece em sequencia, ou seja, os

jogadores se movem (um após o outro) em

resposta a ações e reações do oponente.

Mais comumente representado pela forma

extensiva

Representação de possíveis movimentos de um

jogo no formato de uma árvore de decisões.

JOGOS SEQUENCIAIS

A BATALHA DOS SEXOS JOGADA

SEQUENCIALMENTE

Luísa escolhe primeiro, Carlos observa escolha e joga em

seguida.

No jogo simultâneo, haviam dois equilíbrios de Nash: (Futebol,

Futebol) e (Cinema, Cinema).

Agora a Luísa tem a vantagem de ser a primeira a escolher.

Matriz esconde a característica sequencial do jogo, (Futebol,

Futebol) não será um equilíbrio razoável neste jogo sequencial.

FORMA EXTENSIVA DO JOGO -

INFORMAÇÃO PERFEITA

Luísa

Carlos

Futebol

Cinema

Futebol

Cinema

Futebol

Cinema

1,2

0,0

0, 0

2, 1

Jogo com informação Perfeita.

Resolução do jogo por indução reversa

(Luísa, Carlos)

Carlos

Árvore de

Escolha

Equilíbrio por

indução reversa

ou equilíbrio de

Nash

sequencialmente

racional.

FORMA EXTENSIVA DO JOGO –

INFORMAÇÃO IMPERFEITA

Luísa

Carlos

Futebol

Cinema

Futebol

Cinema

Futebol

Cinema

1,2

0,0

0, 0

2, 1

Jogo com informação Imperfeita.

Resolução do jogo por subjogo perfeito

Carlos

O conceito de

subjogo

perfeito foi

desenvolvido

por Selten e é

um

refinamento

do conceito de

equilíbrio de

Nash.

JOGO DA CONFIANÇA

Consumidor

Empresa

Confia

Não Confia

Entrega

Não Entrega

1,1

-1,2

0,0

JOGO COM BARREIRAS À

ENTRADA

Entrante

Escolhe

Estabelecido

escolhe

Fica de

fora

Entra

Luta

Não

luta

Luta

Não

luta

1, 9

1, 9

0, 0

2, 1 Estabelecido

escolhe

Lutar é uma ameaça crível? Entrante espera que Estabelecido aja

racionalmente.

Uma vez que a entrada ocorreu, o melhor a fazer é não lutar: ameaça

é vazia.

JOGO COM BARREIRAS À

ENTRADA

Entrante

Escolhe

Estabelecido

escolhe

Fica de

fora

Entra

Luta

Não

luta

Luta

Não

luta

1, 9

1, 9

0, 2

2, 1 Estabelecido

escolhe

Se estabelecido tiver

capacidade extra que

permita lutar no caso de

entrada e ganhar 2.

Lutar torna-se uma

ameaça crível.

Equilíbrio de Nash: (Fica

de fora, não luta)

Firma estabelecida

continua monopolista e

nunca usa capacidade

extra.

“Excesso” de

capacidade para manter

credibilidade da ameaça a

possíveis entrantes.

JOGOS REPETIDOS

Jogos nos quais as ações são tomadas e

as decorrentes recompensas são

recebidos várias vezes, de modo

consecutivo.

JOGOS REPETIDOS

DILEMA DOS PRISIONEIROS

O resultado do jogo não repetido é dado pela combinação das

estratégias (Confessa, Confessa) que é um Equilíbrio de Nash

Estrito.

Se o jogo for repetido dez vezes os jogadores serão capazes de

cooperar e atingir um resultado que é Pareto eficiente, (Não

Confessa, Não Confessa)?

Qualquer jogo repetido em n finitas vezes, em que o jogo-base apresente apenas um equilíbrio de Nash, possui um único equilíbrio de Nash em subjogo perfeito, que consiste em jogar o equilíbrio de Nash do jogo-base em todas as n etapas.

Se um jogo-base possui mais de um equilíbrio de Nash, combinações de estratégias que não envolvam em alguma etapa do jogo um equilíbrio de Nash no subjogo podem constituir um equilíbrio de Nash em subjogo perfeito.

JOGOS COM UM NÚMERO FINITO DE

REPETIÇÕES

É a presença de estratégias que envolvam

retaliações em função do comportamento dos

demais jogadores ao longo da história do jogo

que possibilitam um equilíbrio de Nash em

subjogo perfeito composto por combinações

de estratégias que não necessariamente são

equilíbrio de Nash no jogo-base em todos os

subjogos.

AMEAÇAS E RETALIAÇÕES

A empresa automobilística informa a fornecedora que

pedirá peça em liga especial com entrega urgência no

primeiro ano e se a fornecedora entregar ela pedirá

peça em liga especial com entrega rápida, senão ela

pedirá peça em aço comum com entrega normal.

A fornecedora cumpre o acordo, pois a soma das suas

recompensas é maior que se ela não cumprir o acordo.

O JOGO DA COORDENAÇÃO DA CADEIA

PRODUTIVA

Empresa Automobilística Entrega Urgente Entrega Normal Entrega Rápida

Peça em Liga Especial 4,3 0,0 2,5

Peça em Aço Comum 0,1 2,2 0,1

Fornecedor

DILEMA DOS PRISIONEIROS JOGADO

INFINITAMENTE

Se o jogo for repetido um número infinito de vezes os jogadores

serão capazes de cooperar e atingir um resultado que é Pareto

eficiente, (Não Confessa, Não Confessa)?

Neste caso, estratégias severas permitem que a cooperação seja

atingida no jogo finito.

Estratégia de Gatilho:

Cooperar enquanto o outro jogador cooperar e

não cooperar nunca mais quando o outro jogador

não cooperar uma vez.

Tit-for-tat:

Começa cooperando e depois adota a estratégia

que o oponente adotou na última jogada.

ESTRATÉGIAS SEVERAS

Se um jogo-base possui uma combinação de

estratégias com uma recompensa maior que a

recompensa do equilíbrio de Nash do jogo-

base, então, se os jogadores foram pacientes

(taxa de paciência próxima de um) e os

jogadores adotem estratégias severas, existe

um equilíbrio de Nash em subjogo perfeito em

que a recompensa média esperada do jogo

infinito será o valor da maior recompensa do

jogo-base.

TEOREMA POPULAR: VERSÃO DO

FRIEDMAN (1971)

LEILÕES

Mercados em que os produtos são

comprados e vendidos por meio de

processos formais de lances.

Há vários tipos de leilões:

Aberto versus fechados

Primeiro preço e segundo preço.

Valor privado e valor comum

LEILÕES

TIPOS DE LEILÃO

Leilão inglês (ou oral)

Leilão em que o vendedor solicita ativamente lances

mais altos de um grupo de potenciais compradores.

Leilão holandês

Leilão em que um vendedor inicia oferecendo o item a

um preço relativamente alto que depois é reduzido em

quantias fixas até que ocorra a venda.

Leilão de lances fechados

Leilão em que todos os lances são feitos

simultaneamente em envelopes lacrados e o vencedor

é aquele que oferece maior valor.

TIPOS DE LEILÃO

Leilão de primeiro preço

Leilão em que o preço de venda é igual ao lance mais alto.

Leilão de segundo preço

Leilão em que o preço de venda é igual ao segundo lance

mais alto.

Leilão de valor privado

Leilão em que cada potencial comprador sabe qual é sua

avaliação individual do objeto leiloado e as avaliações

diferem de um comprador para outro.

Leilão de valor comum

Leilão em que o item a ser leiloado tem o mesmo valor para

todos os potenciais compradores, mas este não sabe

exatamente qual é o valor e, por isso, as estimativas variam.

ESTRATÉGIAS EM LEILÕES DE VALOR

PRIVADO

Qualquer que seja o tipo do leilão, cada comprador

deve ter uma estratégia.

Em um leilão inglês, a estratégia é a escolha do valor

em que se deixará de oferecer lances.

Em um leilão holandês, a estratégia é o preço que os

indivíduos esperam utilizar para fazer o único lance.

Em um leilão de lances fechados, a estratégia é a

escolha do lance a ser colocado no envelope.

Suponhamos que você e outras quatro pessoas

estejam participando de um leilão oral para comprar

um pote de moedas, que irá para o vencedor a um

preço igual ao lance mais alto.

Depois de estimar o número de moedas no pote, qual

será sua decisão de lances mais favorável?

Maldição do vencedor

Situação em que o vencedor de um leilão de valor

comum obtém pior resultado por haver

superestimado o valor do item e oferecido um lance

maior.

ESTRATÉGIAS EM LEILÕES DE VALOR

COMUM

Em um leilão de valor privado, incentive o maior número

possível de compradores a participar.

Em um leilão de valor comum,

(a) utilize um leilão aberto em vez de um de lances

fechados, pois, como regra geral, um leilão inglês

(aberto) de valor comum gera maior receita esperada

do que um leilão de lances fechados; e

(b) revele informações sobre o valor real do objeto em

leilão para reduzir a preocupação com a maldição do

vencedor e incentivar mais lances.

Em um leilão de valor privado, estabeleça um lance

mínimo igual, ou até mesmo um pouco superior, ao valor

que o faria guardar o bem para uma venda futura.

MAXIMIZAÇÃO DA RECEITA DO LEILÃO

LANCES E COALIZÕES

Os compradores também podem aumentar

o poder de barganha ao reduzirem o

número de participantes no leilão ou a

frequência de lances. Em alguns casos, isso

pode ser conseguido legalmente por meio

da formação de grupos de compradores;

mas a manobra também pode ser feita

ilegalmente, graças a acordos de coalizão

que violam a legislação antistruste.

Como o eBay conseguiu dominar o mercado de leilões

pela Internet? Por que outros sites de leilão (como o do

Yahoo ou o da Amazon) não conseguiram avançar

sobre a fatia de mercado do eBay?

A resposta é que os leilões por Internet estão sujeitos a

externalidades de difusão muito fortes.

Se você quisesse leiloar algumas moedas raras ou

cartões do Pokémon, qual site de leilão você

escolheria?

Aquele que tivesse o maior número de compradores potenciais.

Da mesma maneira, se você estivesse atrás de moedas raras ou cartões do

Pokémon, você escolheria o site com o maior número de vendedores.

Como foi o primeiro grande site de leilão na Internet, o eBay já começou com a

maior fatia de mercado, e ela cresceu graças à externalidade de difusão.