elementos da teoria dos jogos e aplicações aula 5 maio, 2005

31
Elementos da Teoria dos Jogos e Aplicações Aula 5 Maio, 2005

Upload: internet

Post on 22-Apr-2015

107 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: Elementos da Teoria dos Jogos e Aplicações Aula 5 Maio, 2005

Elementos da Teoria dos Jogos e Aplicações

Aula 5

Maio, 2005

Page 2: Elementos da Teoria dos Jogos e Aplicações Aula 5 Maio, 2005

Revisão

Principais conceitos e definições

Page 3: Elementos da Teoria dos Jogos e Aplicações Aula 5 Maio, 2005

Revisão Jogo estático

“Common knowledge” Eliminação de estratégias estritamente

dominadas Equilíbrio de Nash Estratégias mistas

Jogo Dinâmico Estratégia Subjogo Equilíbrio de Nash Perfeito em Subjogos

Page 4: Elementos da Teoria dos Jogos e Aplicações Aula 5 Maio, 2005

Jogos Repetidos

Horizonte finito e infinitoReputação e credibilidade

Punições

Page 5: Elementos da Teoria dos Jogos e Aplicações Aula 5 Maio, 2005

Dilema dos Prisioneiros Considere a seguinte versão do dilema

dos prisioneiros.

Pergunta: há meios de implementar cooperação em relações duradouras?

2

1

C NC

C 1,1 5,0

NC 0,5 4,4

Page 6: Elementos da Teoria dos Jogos e Aplicações Aula 5 Maio, 2005

Horizonte Finito

Page 7: Elementos da Teoria dos Jogos e Aplicações Aula 5 Maio, 2005

Dilema dos prisioneiros em 2 períodos Taxa de desconto: =1.

Expansão da árvore é exponencial: 1o período: 4 resultados possíveis 2o período: 16 resultados possíveis

Estratégia: deve estabelecer o que será feito por cada jogador, em cada história possível do jogo.

Page 8: Elementos da Teoria dos Jogos e Aplicações Aula 5 Maio, 2005

Indução retroativa

Menor subjogo: é o próprio jogo constituinte; independente da história pregressa.

EN do menor subjogo: (C,C).

Page 9: Elementos da Teoria dos Jogos e Aplicações Aula 5 Maio, 2005

1o período Considerando que no segundo período

será jogado (C,C), o primeiro período é representado por:

2

1

C NC

C 2,2 6,1

NC 1,6 5,5

Page 10: Elementos da Teoria dos Jogos e Aplicações Aula 5 Maio, 2005

Equilíbrio de Nash Perfeito em Subjogos

Jogador i: (C; C,C,C,C)

O ENPS é único.

Não há como implementar cooperação.

Caso houvesse N períodos, o resultado seria análogo.

Page 11: Elementos da Teoria dos Jogos e Aplicações Aula 5 Maio, 2005

Proposição

Caso o jogo constituinte tenha um único equilíbrio de Nash, o jogo repetido N vezes também terá um único equilíbrio de Nash perfeito em subjogos.

Esse ENPS corresponde à repetição dos equilíbrios do jogo constituinte.

Page 12: Elementos da Teoria dos Jogos e Aplicações Aula 5 Maio, 2005

Cooperação em jogos com horizonte finito

Suponha que, por alguma razão, haja uma nova possibilidade no jogo constituinte, representada por X.

2

1

C NC X

C 1,1 5,0 0,0

NC 0,5 4,4 0,0

X 0,0 0,0 3,3

Page 13: Elementos da Teoria dos Jogos e Aplicações Aula 5 Maio, 2005

Sustentando cooperação

Considere o seguinte par de estratégias: Primeiro período: NC Segundo período: X caso tenha ocorrido

(NC,NC); C caso contrário.

Objetivo: ao invés de caracterizar o conjunto de todos os equilíbrios, iremos mostrar que as estratégias acima constituem um ENPS.

Page 14: Elementos da Teoria dos Jogos e Aplicações Aula 5 Maio, 2005

Indução retroativa

2o período:

As estratégias determinam que ambos escolham C ou ambos escolham X.

Como (C,C) e (X,X) são EN do jogo constituinte, não há problema.

Page 15: Elementos da Teoria dos Jogos e Aplicações Aula 5 Maio, 2005

1o período

2

1

C NC X

C 2,2 6,1 1,1

NC 1,6 7,7 1,1

X 1,1 1,1 4,4

Page 16: Elementos da Teoria dos Jogos e Aplicações Aula 5 Maio, 2005

Características

Só é possível implementar cooperação em jogos repetidos com horizonte finito se o jogo constituinte apresentar equilíbrios múltiplos.

apenas as ameaças críveis de punições futuras podem afetar o comportamento corrente.

Caso haja um único EN no jogo constituinte, será jogado em cada repetição.

Page 17: Elementos da Teoria dos Jogos e Aplicações Aula 5 Maio, 2005

Horizonte Infinito

Page 18: Elementos da Teoria dos Jogos e Aplicações Aula 5 Maio, 2005

Estrutura Jogo constituinte G.

Infinitas repetições – se aplica para relações duradouras que não possuem prazo de validade.

Taxa de desconto: 0<<1. Impaciência. Probabilidade do jogo se repetir por mais 1

período.

Page 19: Elementos da Teoria dos Jogos e Aplicações Aula 5 Maio, 2005

Dilema dos prisioneiros

Estratégia do gatilho: Joga NC no 1o período; Joga NC se observou (NC,NC) em todos os

períodos anteriores e C caso contrário.

2

1

C NC

C 1,1 5,0

NC 0,5 4,4

Page 20: Elementos da Teoria dos Jogos e Aplicações Aula 5 Maio, 2005

Teste A estratégia do gatilho constitui um

equilíbrio de Nash perfeito em subjogos?

2 tipos relevantes de subjogos: subjogos de “cooperação”; subjogos de “não-cooperação”.

Naqueles subjogos de não-cooperação, a estratégia prevê um equilíbrio de Nash do jogo constituinte.

Page 21: Elementos da Teoria dos Jogos e Aplicações Aula 5 Maio, 2005

Subjogos de cooperação

Nos subjogos de cooperação, as estratégias constituem equilíbrio se:

4+4+42+... ≥ 5++2...

4/(1-) ≥ 5+/(1-)

≥ 1/4.

Page 22: Elementos da Teoria dos Jogos e Aplicações Aula 5 Maio, 2005

Implementando o que é possível O que acontece se <1/4 ?

Considere uma versão modificada do dilema dos prisioneiros, em que:

2

1

C NC

C 1,1 5,0

NC 0,5 M,M

Page 23: Elementos da Teoria dos Jogos e Aplicações Aula 5 Maio, 2005

Continuação Estratégia do gatilho:

Joga NC no 1o período; Joga NC se observou (NC,NC) em todos os períodos

anteriores e C caso contrário. Nos subjogos de cooperação, as estratégias

constituem equilíbrio se:M+M+M2+... ≥ 5++2...

M/(1-) ≥ 5+/(1-)

M ≥ 5-4.

Page 24: Elementos da Teoria dos Jogos e Aplicações Aula 5 Maio, 2005

Lições

Como os jogadores descontam muito o futuro, torna-se necessária uma compensação maior para que a cooperação ocorra.

No jogo analisado, existem apenas duas estratégias. Não há possibilidade de implementar uma cooperação que envolva menos incentivos ao desvio.

Page 25: Elementos da Teoria dos Jogos e Aplicações Aula 5 Maio, 2005

Implementando cooperação com punições mais brandas A estratégia do gatilho envolve punições

muito agressivas que, diante de um desvio, penaliza os jogadores indefinidamente.

Considere o seguinte par de estratégias (“stick and carrot”): Joga NC no 1o período; Joga NC se observou (NC,NC) ou (C,C) no período

anterior; Joga C caso contrário.

Page 26: Elementos da Teoria dos Jogos e Aplicações Aula 5 Maio, 2005

Estratégia

Diante de um desvio em k+1, a punição tem duração de apenas 1 período.

t ação de 1 ação de 2

k NC NC

k+1 NC C

k+2 C C

k+3 NC NC

Page 27: Elementos da Teoria dos Jogos e Aplicações Aula 5 Maio, 2005

Equilíbrio de Nash Perfeito em Subjogos Nos subjogos de punição, a análise é a mesma

da estratégia do gatilho.

Nos subjogos de cooperação, as estratégias constituem equilíbrio se:

4+4+42+... ≥ 5++42...

4+4 ≥ 5+

≥ 1/3.

Page 28: Elementos da Teoria dos Jogos e Aplicações Aula 5 Maio, 2005

Lição

Punições mais brandas requerem uma taxa de desconto mínima maior para a implementação da cooperação.

Page 29: Elementos da Teoria dos Jogos e Aplicações Aula 5 Maio, 2005

Definições Ganho médio: 1, 2, 3,...

(1-) t t-1t.

Ganhos factíveis:

(0,5)

(4,4)

(1,1) (5,0)

Page 30: Elementos da Teoria dos Jogos e Aplicações Aula 5 Maio, 2005

Teorema Folk Friedman, 1971

Seja G um jogo estratégico com informação completa e (e1,...,eN) os ganhos de um equilíbrio de Nash de G. Seja (x1,...,xN) um vetor de ganhos factíveis de G.

Se xi > ei para todo i e for suficientemente próximo de 1, existe um ENPS do jogo repetido com horizonte infinito que atinge (x1,...,xN) como ganho médio.

Page 31: Elementos da Teoria dos Jogos e Aplicações Aula 5 Maio, 2005

Teorema Folk

(0,5)

(4,4)

(1,1) (5,0)

Ganhos atingíveis em ENPS