teoria dos jogos evolutiva em um contínuo de estratégias · 2020. 7. 27. · teoria dos jogos...

60

Upload: others

Post on 31-Jan-2021

2 views

Category:

Documents


0 download

TRANSCRIPT

  • Teoria dos Jogos Evolutiva em umContínuo de Estratégias

    Felipe de Almeida Murgel

    Dissertação de Mestrado apresentada ao Pro-grama de Pós-graduação em Matemática doInstituto de Matemática e Estatística da U-niversidade Federal Fluminense, IME-UFF,como parte dos requisitos necessários na ob-tenção do título de Mestre em Matemática.

    Orientador: Max Souza

    Niterói-RJ

    Junho / 2016

  • Ficha catalográfica elaborada pela Biblioteca do Instituto de Matemática e Estatística

    M973 Murgel , Felipe de Almeida Teoria dos jodos evolutiva em um contínuo de estratégias / Felipe de Almeida Murgel. – Niterói, RJ : [s.n.], 2016.

    56 f.

    Orientador: Prof. Dr. Max Souza Dissertação (Mestrado em Matemática) – Universidade Federal Fluminense, 2016.

    1. Matemática Aplicada. 2. Teoria dos jogos. 3.Dinâmica Populacional. I. Título.

    CDD 519.3

  • Agradecimentos

    Agradeço a minha família por todo apoio que sempre deram a minha edu-cação, e por toda paciência ao longo dos meus estudos. Agradeço ainda aminha família por compreender minha ausência e contornar todas as minhasfaltas de maneira gentil. Sem eles, nada disso seria possível.

    Ao meu orientador, agradeço por toda atenção e preocupação com o nossotrabalho. Apesar de todo conhecimento, permaneceu um homem humilde epaciente, que deixa claro a qualquer um que observe com o mínimo de atençãocomo a matemática pode ser prazerosa.

    Finalmente, agraço a CAPES pelo suporte �nanceiro.

    3

  • Resumo

    As formulações usuais de Teoria dos Jogos pressupõem um conjunto discretode estratégias disponíveis para cada jogador. Porém, jogos com um contí-nuo de estratégias aparecem naturalmente em diversas situações de ecologiaevolutiva�dinâmica adaptativa é um exemplo pertinente. Dentro da visão dedinâmica populacional da Teoria dos Jogos, o estado da população é descritopor uma medida de probabilidade no espaço mensurável das estratégias.

    Neste trabalho, estudamos uma formulação da dinâmica evolutiva comdois jogadores e um contínuo de estratégias devida a R. Cressman & J.Hofbauer, Measure dynamics on a one-dimensional continuous trait-space:theoretical foundations for adaptive dynamics. Theor. Pop. Biol 67:47�59,2005. Esta formulação leva, de maneira natural, ao estudo de uma versãoda dinâmica do replicador no espaço de medidas de probabilidade em umintervalo compacto.

    A partir daí, estudamos a conexão entre os pontos de equilíbrio estáveisda dinâmica e que satisfazem superioridade local (ou global) com Estraté-gias Continuamente Estáveis. Essa conexão é usada para classi�car jogospotenciais (nos quais a função de �tness é simétrica).

    Palavras-chave: Teoria dos Jogos, Dinâmica Populacional, Dinâmicado Replicador, Jogos Potenciais, Jogos Contínuos.

    4

  • Abstract

    Classical Game Theory assumes a discrete set of strategies for each player.However, games with a continuous set of strategies are common in evolu-tionary ecology�adaptive dynamics is such an example. According to thepopulation dynamics viewpoint of Game Theory, the population state is des-cribed by a probability measure in a measurable space of strategies.

    This dissertation discusses an evolutionary dynamics formulation withtwo players and a continuous set of strategies due to R. Cressman & J.Hofbauer, Measure dynamics on a one-dimensional continuous trait-space:theoretical foundations for adaptive dynamics. Theor. Pop. Biol 67:47�59,2005. This formulation leads, in a very natural way, to a measure theore-tic version of the Replicator Dynamics in the space of probability measuresin a compact interval. Within this framework, the connection between sta-ble equilibria satisfying local (or global) superiority with Convergent StableStrategies (CSS) is explored. This connection is used to classify potentialgames�i.e. games with a symmetric �tness function.

    Keywords: Game Theory, Population Dynamics, Replicator Dynamics,Potential Games, Continuous Games.

    5

  • Sumário

    Introdução 7

    1 Teoria dos Jogos 9

    1.1 Preliminares . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91.2 Teoria dos Jogos Evolutiva e estratégias estáveis . . . . . . . . 111.3 Dinâmica do Replicador . . . . . . . . . . . . . . . . . . . . . 17

    2 Medidas 22

    2.1 Um pouco sobre medida . . . . . . . . . . . . . . . . . . . . . 232.2 Jogos de dois jogadores com estratégias contínuas . . . . . . . 252.3 Dinâmica de Medidas . . . . . . . . . . . . . . . . . . . . . . . 28

    3 Estudando a Dinâmica 34

    3.1 Existência e Unicidade . . . . . . . . . . . . . . . . . . . . . . 343.2 Topologia, algumas considerações . . . . . . . . . . . . . . . . 383.3 Convergência e Estabilidade . . . . . . . . . . . . . . . . . . . 403.4 Jogos de Parceria . . . . . . . . . . . . . . . . . . . . . . . . . 43

    4 Classi�cação de jogos de parceria 45

    4.1 Momentos e a relação deles com o payo� . . . . . . . . . . . . 454.2 O caso a < 0 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 464.3 O caso a > 0 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52

    5 Discussão 55

    6

  • Introdução

    As formulações usuais de Teoria dos Jogos pressupõem a existência de umnúmero �nito de estratégias disponíveis para cada jogador. Por outro lado,jogos com um contínuo de estratégias aparecem naturalmente em situaçõesonde a evolução depende não só da frequência das estratégias, mas tambémda densidade populacional�dinâmica adaptativa é um exemplo pertinente.Dentro da visão de dinâmica populacional da teoria dos jogos, o estado dapopulação é descrito por uma medida no espaço mensurável das estratégias.

    Nesta dissertação, estudamos uma formulação da dinâmica evolutiva comdois jogadores e um contínuo de estratégias devida a Cressman & Hofbauer[8]. Nesta formulação, o espaço mensurável das estratégias, denotado por S, éum intervalo real compacto e a dinâmica é dada por uma equação diferencialordinária (EDO) emMs(S)�o espaço de medidas com sinal sobre S. Munidoda topologia dada pela norma da variação total, Ms(S) é um espaço deBanach e uma dinâmica pode ser de�nida de forma bastante natural�cf. [14].Sob certas condições, naturais do ponto de vista de modelagem, esta dinâmicaé bem de�nida globalmente e pode ser reduzida a um par de equações:

    • uma EDO escalar para a população total;

    • uma versão da dinâmica do replicador em ∆S�o conjunto de medidasde probabilidade em S.

    A partir desta equivalência, estudamos a conexão entre os pontos de equilíbrioestáveis da dinâmica original, que satisfaçam a condição de superioridadelocal (ou global), com a estabilidade dinâmica do sistema acima e com oconceito de Estratégias Continuamente Estáveis (CSS, do inglês ContinuouslyStable Strategies)�em particular, discutimos as condições encontradas em [8]para um equilíbrio da dinâmica evolutiva ser um atrator local.

    De posse desses resultados, seguimos [8] e analisamos os jogos de parceria�jogos cuja função de �tness é simétrica. Neste caso, o �tness médio é uma

    7

  • INTRODUÇÃO 8

    função de Lyapunov estritamente crescente fora dos equilíbrios�que no casode estratégias contínuas, não são isolados.

    Esta dissertação está organizada da seguinte forma: no Capítulo 1, revi-samos brevemente os conceitos clássicos de Teoria dos Jogos com estratégias�nitas. No Capítulo 2, introduzimos as noções básicas de Teoria da Me-dida e apresentamos a dinâmica proposta por [8] e sua redução à dinâmicado replicador sobre medidas. No Capítulo 3, estudamos a estabilidade dosequilíbrios da dinâmica evolutiva sob a topologia fraca de ∆S (de fato, atopologia fraca-*). No Capítulo 4, discutimos detalhadamente a classi�caçãoapresentada por [8] para jogos de parceria.

  • Capítulo 1

    Teoria dos Jogos

    Iremos apresentar as de�nições fundamentais do que envolve um jogo �nito,conhecer um pouco da Dinâmica do Replicador e abordar um caso particu-lar ao �nal do capítulo com o objetivo de dar intuição ao leitor ainda nãofamiliarizado com a teoria.

    Ao longo deste capítulo iremos seguir as notas preliminares gentilmentecedidas pelo Prof. Chalub [7].

    1.1 Preliminares

    Comecemos esclarecendo o que é um jogo.

    De�nição 1.1 (Jogo). Um jogo é dado pelos seguintes elementos:

    1. Um conjunto de N ∈ N jogadores.

    2. Para cada j = 1, . . . , N um conjunto de n(j) ∈ N estratégias puras e(j)i ,i = 1, . . . , n(j).

    3. Uma função de retorno (pay-o�) para cada jogador j = 1, . . . , N :

    ϕ(j) :N∏k=1

    {e(k)1 , . . . , e(k)n } → R+.

    De�nição 1.2 (Estratégia acessível). Diremos que uma distribuição de pro-babilidade discreta de S(j), o conjunto das estratégias puras do jogador j,é uma Estratégia Acessível ao jogador j. O conjunto de todas EstratégiasAcessíveis ao jogador j será denotado por ∆n

    (j)−1.

    9

  • CAPÍTULO 1. TEORIA DOS JOGOS 10

    De�nição 1.3 (Estratégia mista). Toda estratégia acessível, que não é pura,é uma estratégia mista.

    De�nição 1.4 (Per�l de Estratégias). Ponha ∆̃ := ∆n1−1 × . . . × ∆nN−1.Diremos que Q ∈ ∆̃ é um Per�l de Estratégias.

    A extensão do pay-o� para as Estratégias Acessíveis é dada por

    ϕ(k)(q(1), . . . , q(N)) =∑

    i1,...,iN

    N∏j=1

    qjijϕ(e(1)i1, . . . , e

    (N)iN

    ).

    De�nição 1.5 (Jogador Racional). Dizemos que um jogador i é racionalquando, conhecidas as outras N − 1 estratégias, a estratégia utilizada por eleé q(i) tal que

    ϕ(i)(q(1), . . . , q(i), . . . , q(N)) = maxq∈∆ni−1

    ϕ(i)(q(1), . . . , q, . . . , q(N)).

    Observe que o Jogador Racional sempre consegue jogar, visto que ϕ(i) écontinua e ∆ni−1 é compacto.

    De�nição 1.6 (Melhor Resposta). Uma estratégia de um Jogador Racionalé dita a Melhor Resposta. Mais precisamente,

    Bi(Q(−i)) := arg max

    q∈∆ni−1ϕ(i)(q(1), . . . , q, . . . , q(N))

    é o conjunto das Melhores Respostas do jogador i. E Q(−i) = (q(1), . . . , q(i−1), q(i+1), . . . , q(N)).

    Se considerarmos um jogo de Jogadores Racionais, q(i) ∈ Bi(Q(−i)) paracada jogador i. Então, é de se esperar que o per�l de estratégias adotadoseja Q̃ ∈ B(Q̃), em que

    B : ∆̃→ ∆̃; B(Q) = (B1(Q(−1)), . . . , BN(Q(N))).De�nição 1.7 (Equilíbrio de Nash). Dado um Jogo qualquer, chamamos umponto Q ∈ B(Q) de Equilíbrio de Nash.Teorema 1.1. Todo jogo tem um Equilíbrio de Nash.

    Demonstração. A prova original�na tese de Nash� usa o teorema do ponto�xo de Brouwer e uma versão pode ser encontrada em [7]. Uma versãosimpli�cada da prova usando o Teorema do Ponto Fixo de Kakutani�que éuma generalização do Teorema do Ponto Fixo de Brouwer para funções comvalores em conjuntos�aparece no primeiro artigo de Nash [13]. Para umademonstração do Tereoma de Kakutani, a partir do Teorema de Brouwer eda demonstração do teorema de Nash veja [16].

  • CAPÍTULO 1. TEORIA DOS JOGOS 11

    1.2 Teoria dos Jogos Evolutiva e estratégias es-

    táveis

    No restante deste capítulo, iremos considerar apenas Jogos Simétricos.

    De�nição 1.8 (Jogo Simétrico). Dado um jogo, suponha que n = n(j) = n(j′)

    e e(j)i = e(j′)i ∀j, j′ = 1, . . . , N e ∀i = 1, . . . , n. E, além disso,

    ϕ(j)(e(1)i1, . . . , e

    (N)iN

    ) = ϕ(p(j))(e(1)ip(1)

    , . . . , e(N)ip(N)

    )

    para toda permutação p : {1, . . . , N} → {1, . . . , N}. Neste caso, diz-se que ojogo é simétrico.

    De�nição 1.9 (Estado da população). Uma população com uma frequênciaxi de estrategistas do tipo pi ∈ ∆n

    (i)−1, com i = 1, . . . ,m, está no Estadox =

    ∑mi=1 xiei ∈ ∆m−1. Aqui, identi�camos cada um dos m tipos com os

    vetores da base canônica de Rm.

    Seja W : ∆m−1 × ∆m−1 → R+ uma função bilinear, em que o númeroW(ei,x) é diretamente proporcional à probabilidade do tipo ei deixar des-cendentes em uma população no estado x. W(y,x) é, por de�nição, o �tnessde y numa população em estado x.

    De�nição 1.10 (população bem misturada). Uma população está bem mis-turada quando a probabilidade de encontrarmos um tipo de estrategista é igualà sua frequência relativa.

    De�nição 1.11 (Equilíbrio de Nash Simétrico). Um Equilíbrio de Nash daforma (x,x) ∈ ∆n−1 × ∆n−1 é dito Equilíbrio de Nash Simétrico e serádenotado por x.

    É natural procurar estratégias que se destacam, no sentido evolutivo,em relação às demais. Ou seja, estados populacionais capazes de resistir apequenas invasões. Em 1974, Maynard Smith [15] formalizou essa ideia.

    De�nição 1.12 (ESS-Maynard Smith). A estratégia x ∈ ∆m−1 é um ESSquando existe, para cada y 6= x, um �0(y) > 0 tal que

    W(y, (1− �)x + �y)

  • CAPÍTULO 1. TEORIA DOS JOGOS 12

    De fato, o próprio Maynard Smith mostrou que sua de�nição de ESStinha uma caracterização equivalente dada por duas condições, atualmentesão conhecidas como condição de equilíbrio e condição de estabilidade.

    Lema 1.1. A estratégia x ∈ ∆n−1 é um ESS-Maynard Smith se, e somentese,

    1. W(y,x) ≤ W(x,x) ∀ y ∈ ∆n−1;

    2. W(y,x) =W(x,x); y 6= x =⇒ W(y,y) 0 tal que

    W(y, (1− ξ)x + ξy)

  • CAPÍTULO 1. TEORIA DOS JOGOS 13

    Vamos escolher ξ(y) como o supremo de todos aqueles ξy que satisfazema desigualdade acima. Ele está bem de�nido pela compacidade de ∆n−1.Agora, se W(y,x) =W(x,x), então, para todo ξ > 0, vale

    W(y, (1− ξ)x + ξy) = (1− ξ)W(y,x) + ξW(y,y)< (1− ξ)W(x,x) + ξW(x,y)=W(x, (1− ξ)x + ξy).

    Aqui podemos arbitrar. Então, tomamos ξ(y) = 1.

    Mais adiante, em 1987, Vickers e Cannings [17] mostraram, para um nú-mero �nito de estratégias puras, que a exitência de uma barreira de invasãopara cada estado do simplexo implica na existência de uma barreira de in-vasão uniforme. Veja o Teorema 2 de [17]. Portanto, a de�nição abaixo éequivalente à de�nição de Maynard Smith.

    De�nição 1.13 (ESS). Em uma população bem misturada, como de�nidoem 1.10, dizemos que x ∈ ∆n−1 é um ESS quando existe um ξ0 > 0 tal que

    W(y, (1−ξ)x+ξy)

  • CAPÍTULO 1. TEORIA DOS JOGOS 14

    Agora iremos multiplicar por ξ e somar (1− ξ)W(x, (1− ξ)x + ξz) a ambosos lados da desigualdade acima. Então, obtemos

    W((1− ξ)x + ξz, (1− ξ)x + ξz) 0 , su�cientemente pequeno, segue que

    (1− ξy)x + ξyy := zξy ∈ Bδ(x) ∩∆n−1,

  • CAPÍTULO 1. TEORIA DOS JOGOS 15

    e, então,W(zξy , zξy)

  • CAPÍTULO 1. TEORIA DOS JOGOS 16

    Teorema 1.2 (Bishop-Cannings). Se i ∈ suppx e x é um ESS, entãoW(ei,x) =W(x,x).

    Demonstração. De fato,W(ei,x) ≤ W(x,x). Suponha, por absurdo,W(ei,x) <W(x,x). Agora, de�na a estratégia

    x̃ :=1

    1− xi(x− xiei) ∈ ∆n−1.

    Estamos supondo x 6= ei. Um cálculo direto nos dá

    W(x̃,x) = 11− xi

    (W(x,x)− xiW(ei,x))

    >1

    1− xi(W(x,x)− xiW(x,x))

    =W(x,x).

    Contrariando a condição de equilíbrio de x.

    O leitor atento observará que apenas a condição de equilíbrio foi usadana demonstração acima. Essa observação leva ao seguinte resultado:

    Proposição 1.1 (Extensão de BC para EN). Supondo Q = (x,x) ∈ ∆̃ umEN, devemos ter ei ∈ Bj(Q(−j)) sempre que i ∈ suppx.

    Demonstração. Sem perda de generalidade, faremos para j = 1. Devemosmostrar que ei ∈ B1(Q(−1)) quando i ∈ suppx.

    De fato,

    ϕ(1)(x,x) =∑l

    xlϕ(1)(el,x) ≤

    ∑l

    xlϕ(1)(ek,x) = ϕ

    (1)(ek,x).

    Na desigualdade acima, ek é tal que ϕ(1)(el,x) ≤ ϕ(1)(ek,x) para todo l.Por outro lado, Q ∈ B(Q), então devemos ter x ∈ B1(Q(−1)). E isso

    implica emϕ(1)(ek,x) ≤ ϕ(1)(x,x).

    O que nos leva a concluir que ϕ(1)(ek,x) = ϕ(1)(x,x) e que ek ∈ B1(Q(−1)).Daí, ∑

    l

    xl(ϕ(1)(ek,x)− ϕ(1)(el,x)) = 0.

  • CAPÍTULO 1. TEORIA DOS JOGOS 17

    E uma análise breve nos mostra que todas as parcelas da soma devem serigual a zero. Então,

    xl(ϕ(1)(ek,x)− ϕ(1)(el,x)) = 0 ∀l

    Portanto, para l = i ∈ suppx, segue

    ϕ(1)(ek,x) = ϕ(1)(ei,x) =⇒ ei ∈ B1(Q(−1)).

    1.3 Dinâmica do Replicador

    Em uma população bem misturada, a Dinâmica do Replicador, proposta porTaylor e Jonker, em 1974, é dada pelo sistema de equações:

    x′i = xi(W(ei,x)−W(x,x)); x = (x1, . . . , xn) ∈ ∆n−1, i = 1, . . . , n. (1.1)

    Antes de proceder, o leitor não familiarizado com o �uxo de uma equaçãodiferencial deve consultar o Capítulo 10 de [9].

    Lema 1.3. Seja x0 ∈ ∆n−1 e x(t) a solução de (1.1) com x(0) = x0.

    1. x(t) ∈ ∆n−1 ∀ t ≥ 0.

    2. O interior de ∆n−1 é invariante pelo �uxo.

    3. As fronteiras de ∆n−1 são invariantes pelo �uxo.

    Demonstração. Com efeito,

    xi(t) = xi(0) exp (

    ∫ t0

    [W(ei,x(s))−W(x(s),x(s))]ds).

    Logo, xi(0) > 0, (xi(0) = 0) =⇒ xi(t) > 0, (xi(t) = 0) ∀t > 0.

    Além disso, de�nindo S(t) =∑

    i xi(t), obtemos o PVI

    S ′(t) = (1− S(t))W(x,x); S(0) = 1De fato, S(t) = 1 ∀t é solução.

  • CAPÍTULO 1. TEORIA DOS JOGOS 18

    O próximo resultado deixa claro como, no longo prazo, uma dinâmicaevolutiva pode levar uma população ao mesmo estado de equilíbrio em queencontraríamos uma população dotada de racionalidade.

    Teorema 1.3. Dado um jogo, considere seus equilíbrios de Nash simétricose a dinâmica do replicador associada. Então,

    1. Se x∗ é EN, então é equilíbrio da dinâmica.

    2. Se x∗ ∈ int∆n−1 é um w − limite isolado de uma órbita da dinâmica,então x∗ é EN.

    3. Se x∗ é equilíbrio assintoticamente estável da dinâmica, então x∗ é EN.

    Demonstração. Veja uma demonstração em [7], pg 112

    Os próximos dois resultados serão estendidos mais à frente, no caso deum contínuo de estratégias.

    Lema 1.4. Seja x∗ ∈ ∆n−1 e de�na, numa vizinhança apropriada de x∗,

    V (x) =∑

    i∈suppx∗x∗i log

    x∗ixi.

    Então x∗ é um ESS se, e somente se, V é função de Lyapunov estrita.

    Demonstração. Observe que, para uma vizinhança su�cientemente pequenade x∗, i ∈ suppx∗ =⇒ i ∈ suppx para todo x da vizinhança. Então V ébem de�nida em alguma vizinhança su�cientemente pequena de x∗.

    Suponhamos x∗ ESS.Com efeito, a função logarítmica é côncava. Isto é, para todo α ∈ (0, 1),

    (1− α) logw + α log z ≤ log((1− α)w + αz).

    Portanto,

    V (x) = −∑

    i∈suppx∗x∗i log

    xix∗i≥ − log

    ∑i∈suppx∗

    xi = − log 1 = 0.

  • CAPÍTULO 1. TEORIA DOS JOGOS 19

    Não é difícil mostrar que a igualdade é verdadeira se, e somente se, x = x∗.E, além disso, ao longo das soluções da dinâmica dada pela Equação (1.1),

    d

    dtV (x) = −

    ∑i∈suppx∗

    x∗ix′ixi

    = −∑

    i∈suppx∗x∗i (W(ei,x)−W(x,x)) = −(W(x∗,x)−W(x,x)).

    Então, do Lema 1.2, obtemos

    d

    dtV (x) ≤ 0

    para uma vizinhança apropriada e, além disso, a igualdade é verdadeira se,e somente se, x = x∗.

    Então, V é, numa vizinhança apropriada, função de Lyapunov estritapara x∗.

    Com as contas já feitas, a volta é imediata. Pois,

    d

    dtV (x) ≤ 0

    no domínio de V com igualdade se, e somente se, x = x∗. Segue que

    W(x,x)

  • CAPÍTULO 1. TEORIA DOS JOGOS 20

    Portanto,V (y) ≥ 0 ∀y ∈ A

    com igualdade se, e somente se, y = x∗.

    Agora, note que, pela simetria e bilinearidade de W ,

    d

    dtV (y) = −

    ∑i

    y′iW(ei,y).

    E, ao longo das soluções da dinâmica dada pela Equação 1.1, podemos es-crever

    −∑i

    y′iW(ei,y) = −∑i

    yi(W(ei,y)−W(y,y))W(ei,y) =

    −∑i

    yi[W(ei,y)−W(y,y)]2 +W(y.y)2 −W(y,y)2 =

    −∑i

    yi[W(ei,y)−W(y,y)]2 ≤ 0.

    Então, ddtV (y) ≤ 0 ao longo das soluções da Dinâmica do Replicador. E mais:

    a igualdade é verdadeira se, e somente se,W(ei,y) =W(y,y) ∀i ∈ suppy,e isso ocorre se, e somente se, y(t) = x∗.

    De fato, se y(t) = x∗, então, pelo Teorema 1.2,W(ei,x∗) =W(x∗,x∗) ∀i ∈suppx∗. Para veri�car a volta, suponha, por absurdo, y(t) 6= x∗. Assim, deveexistir i ∈ suppx∗ tal queW(ei,y) >W(y,y). Pois, caso contrário, teríamos

    W(x∗,y) =∑i

    x∗iW(ei,y) ≤∑i

    x∗iW(y,y) =W(y,y),

    violando o Lema 1.2.

    Portanto, V , em A, é uma função de Lypunov estrita para x∗.

    Vamos encerrar essa parte aplicando a Teoria desenvolvida até esse mo-mento a um caso particular.

    Exemplo 1.1. Considerando uma população de dois tipos, seu estado é dadopelo vetor x = (x, 1 − x) ∈ ∆1. Com efeito, existe um vetor (a, b, c, d) ∈ R4

  • CAPÍTULO 1. TEORIA DOS JOGOS 21

    tal que W(e1,x) = ax + b(1 − x) e W(e2,x) = cx + d(1 − x). Além disso,W(x,x) = xW(e1,x) + (1− x)W(e2,x). Substituindo em (1.1), obtemos

    x′ = x(1− x)(αx+ β(1− x)) := ψ(x),

    onde α = a − c e β = b − d. Neste caso, temos três pontos de equilíbrio:x1 = 0, x2 = 1 e x3 =

    ββ−α . Note que x3 só faz sentido se 0 <

    ββ−α < 1 (ou

    seja, quando α < 0 < β ou β < 0 < α).Para entender melhor a dinâmica próxima aos equilíbrios, precisaremos

    do seguinte lema.

    Lema 1.6. Considere a equação do replicador x′ = ψ(x). Considere aindaque existe x∗ tal que ψ(x∗) = 0 com x∗ ∈ (0, 1) e ψ′(x∗) < 0. Então, a funçãodada por

    F (x) = −∫ xx∗ψ(y)dy

    é uma função de Lyapunov estrita para x∗ numa vizinhança apropriada.

    Demonstração. É evidente que F (x∗) = 0. Agora, como ψ(x∗) = 0 e ψ′(x∗) <0, existe ξ1 > 0, su�cientemente pequeno, tal que ψ(x) < 0 ∀x ∈ (x∗, x∗ +ξ1). O que nos dá F (x) > 0 ∀x ∈ (x∗, x∗ + ξ1). Por outro lado, existe umξ2 > 0 tal que ψ(x) > 0 ∀x ∈ (x∗ − ξ2, x∗). Então,

    F (x) =

    ∫ x∗x

    ψ(y)dy > 0 ∀x ∈ (x∗ − ξ2, x∗)

    . Portanto, F (x) ≥ 0 ∀x ∈ (x∗ − ξ2, x∗ + ξ1) com igualdade verdadeira se,e somente se, x = x∗.

    Além disso, ao longo de uma solução da Dinâmica do Replicador,

    d

    dtF (x(t)) = −ψ(x(t))x′(t) = −ψ(x(t))2 ≤ 0

    com igualdade se, e somente se, x(t) = x∗.Então, �nalmente, em (x∗ − ξ2, x∗ + ξ1), F é função de Lyapunov estrita

    para x∗.

    Voltando aos equilíbrios, ψ′(0) = β, ψ′(x3) = x3(1 − x3)(α − β) = αββ−α eψ′(1) = −α. Com o Lema 1.6 em vista, a tarefa de entender o comporta-mento da dinâmica próximo aos equilíbrios se resume a uma análise de sinaltrivial para os casos não degenerados (αβ 6= 0).

  • Capítulo 2

    Medidas

    E se quiséssemos descrever uma população através de um contínuo de estra-tégias? Nossos tipos não poderiam mais ser identi�cados com um conjuntodiscreto. Então, como descrever matematicamente o estado de uma popula-ção desse gênero? E ainda como prever o estado de uma população após umdeterminado período?

    Além do ponto de vista populacional, jogos com estratégias puras numcontínuo aparecem naturalmente, quando, por exemplo: o tempo, localiza-ção, e valor estão envolvidos. Alguns exemplos conhecidos, e tratados em[14], levam o nome de "The War o� Attrition", "Nash demand game", e"Cournot duopoly".

    Então, suponhamos que nossas estratégias puras sejam parametrizadaspor uma variável real em um intervalo compacto da reta, digamos S = [α, β].Para associar a cada aberto de S um número real positivo, que represente aparcela da população utilizando estratégias nesse aberto, com a estrutura desoma semelhante a que tínhamos com as distribuições de probabilidade doCapítulo 1, o objeto mais natural é a medida com sinal.

    De fato, podemos mergulhar as estratégias puras de S no espaço de me-didas através das diracs. Desse ponto de vista, as medidas de probabilidadeseriam uma espécie de generalização das estratégias acessíveis de�nidas noCapítulo 1.

    Na seção 2.1 faremos uma breve revisão dos fatos de medida e integração�seguindo [2]�que serão necessários no restante do texto. Nas seções 2.2 e2.3 discutiremos o modelo evolutivo proposto por [8], que pode ser pensado

    22

  • CAPÍTULO 2. MEDIDAS 23

    como uma extensão do modelo proposto por [14].

    2.1 Um pouco sobre medida

    Apresentaremos algumas de�nições de objetos que serão nessários para onosso estudo.

    De�nição 2.1 (σ-álgebra). Uma família X de subconjuntos de X é dita umaσ-álgebra, se

    1. ∅ ∈ X .

    2. A ∈ X =⇒ AC ∈ X .

    3. Toda união enumerável de elementos em X ainda é um elemento de X .

    De�nição 2.2 (Espaço mensurável). Um par ordenado (X,X ) formado porum conjunto X e uma σ-álgebra X é dito espaço mensurável.

    Em nosso estudo, daremos mais atenção aos Borelianos, elementos daσ-álgebra de Borel, a interseção de todas as σ-álgebras que contém todosos intervalos abertos da reta e, portanto, a menor delas. Logo, o espaçomensurável em questão é o par (R,B).

    Agora, segue a de�nição do objeto que desempenhará um papel funda-mental em nosso estudo, a medida.

    De�nição 2.3 (Medida). Uma função µ : X → R+, de�nida numa σ-álgebra, é dita medida quando valem

    1. µ(∅) = 0.

    2. Para toda (En) sequência em X tal que Ei ∩ Ej = ∅ sempre que i 6= j,temos

    µ(∞⋃i=1

    Ei) =∞∑i=1

    µ(Ei).

    De�nição 2.4 (Função mensurável). Uma função f : X → R é dita X -mensurável (ou apenas mensurável) quando, para todo c ∈ R,

    {x ∈ X; f(x) > c} ∈ X .

  • CAPÍTULO 2. MEDIDAS 24

    Também será fundamental a integral de medidas. Então, seguem maisalgumas de�nições.

    De�nição 2.5 (Função simples). Uma função real é dita simples quandopossui um número �nito de valores.

    De�nição 2.6 (Representação padrão). Dizemos que uma função simples,ϕ, de�nida em X, está na representação padrão se

    ϕ =∑

    ajCEj ,

    onde CEj é a função característica, aj 6= ai e Ej ∩ Ei = ∅ sempre que i 6= je X =

    ⋃iEi.

    De�nição 2.7 (Integral de uma função simples com respeito a uma medida).Sejam ϕ uma função simples na sua forma padrão de�nida em X, (X,X )um espaço mensurável e µ uma medida de�nida em X . A integral de ϕ comrespeito a µ é dada por ∫

    ϕdµ :=∑

    ajµ(Ej).

    Agora, através da integral de funções simples, vamos de�nir a integralde funções mensuráveis não negativas. Finalmente, adiante, iremos de�nir aintegral de uma função mensurável e concluir dizendo o que é uma funçãointegrável.

    De�nição 2.8 (Integral de uma função mensurável não negativa). Se f ∈M+(X,X )(espaço das funções X -mensuráveis não negativas), então de�ni-mos ∫

    fdµ := supϕ

    ∫ϕdµ,

    onde ϕ ∈M+(X,X ) é simples e 0 ≤ ϕ(x) ≤ f(x).

    De�nição 2.9 (função integrável). Dados um espaço mensurável (X,X ) euma medida µ, de�nida em X , a coleção de funções integráveis com respeitoa µ é a coleção de todas as funções reais X -mensuráveis, tais que f+ e f−tenham integrais �nitas com respeito a µ. Sendo assim, escrevemos∫

    fdµ =

    ∫f+dµ−

    ∫f−dµ.

  • CAPÍTULO 2. MEDIDAS 25

    Encerraremos essa seção com um teorema de grande importância paraTeoria das Medidas.

    Teorema 2.1 (Teorema da Convergência Monótona). Se (fn) é uma sequên-cia monótona crescente de funções em M+(X,X ) convergindo para f , então∫

    fdµ = limn→∞

    ∫fndµ.

    Demonstração. Veja uma demonstração em [2], pg 31.

    O objeto da De�nição 2.3, a Medida, é uma ferramenta apropriada paradescrever o estado de uma população no sentido proposto no início dessecapítulo. Vamos considerar os borelianos restritos a S, denotaremos por BS,e descrever o estado de uma população por uma medida µ : BS → R+.Entenderemos µ(A) como a quantidade da população que utiliza estratégiasem A, assim, µ(S) é o total da população.

    Nesse momento, já podemos descrever o estado de uma população numcontinuo de estratégias. Mas, para prosseguir e entender a evolução de umapopulação ao longo do tempo, precisaremos de muito mais.

    2.2 Jogos de dois jogadores com estratégias con-

    tínuas

    Vamos precisar reformular nossa função de �tness esperado. Agora, pre-cisamos reger os encontros dois a dois de estratégias parametrizadas numintervalo compacto da reta, S = [α, β]. Utilizaremos o modelo quadráticopara descrever o �tness esperado de x numa população em estado y . Maisprecisamente: seja π : S × S × R→ R dada por

    π(x, y,N) = ax2 + bxy + cy2 + dx+ ey + f(N),

    onde f é uma função conhecida como �Background Fitness�, ela depende dotamanho da população predominante. Essa função tem o papel de representara in�uência do meio no processo evolutivo, como a abundância , ou falta dealimentos, clima, ou uma simples limitação geográ�ca. A função f é tomadade forma que

    1. ExistaN ∈ N su�cientemente grande tal que π(x, y,N) < 0 ∀(x, y) ∈ S2.

  • CAPÍTULO 2. MEDIDAS 26

    2. π(x, y, 0) > 0 ∀(x, y) ∈ S2.

    Observe que a condição 1 nos permite limitar de certa forma o processoevolutivo. Já a condição 2, tem motivações de cunho técnico, ela evita umfenômeno indesejado, conhecido por �Alle e�ect�. Não entraremos em deta-lhes.

    Pediremos que f seja uma função diferenciável, tal que f ′(N) ≤ c < 0para obtermos 1 e com f(0) grande o su�ciente para obtermos 2.

    De�nição 2.10 (Densidade de Equilíbrio). N é densidade de equilíbrio parax ∈ S se π(x, x,N) = 0.

    Observe que π(x, x,N) = 0 se, e somente se, f(N) = −(ax2 + bx2 + cx2 +dx + ex). Como f é uma aplicação diferenciável estritamente decrescentecom f(0) > 0, f−1(−(ax2 + bx2 + cx2 + dx+ ex)) está bem de�nido.

    Sempre que desejarmos calcular o �tness esperado da estratégia x numapopulação no estado y, faremos isso na densidade de equilíbrio para y, deno-tada por N(y).

    De�nição 2.11 (Convergence Stable). Uma estratégia x∗ ∈ S é dita CS se,e somente se, existe ξ > 0 tal que para todo y satisfazendo 0 < |y − x∗| < ξ,existe um δ > 0 tal que para todo x satisfazendo 0 < |y − x| < δ, temos

    π(x, y,N(y)) > π(y, y,N(y)) = 0

    se, e somente se, 0 < |x− x∗| < |y − x∗|.

    A motivação para de�nição é clara: um estrategista só se saíra melhor quea população residente quando estiver mais próximo do CS que a populaçãoresidente. Isso nos leva a crer que o estado da população tende ao estado CSao longo do tempo.

    Proposição 2.1 (Caracterização da estratégia CS). x∗ ∈ S é CS se, e so-mente se,

    1. 2ax∗ + bx∗ + d = 0.

    2. 2a+ b < 0.

  • CAPÍTULO 2. MEDIDAS 27

    Demonstração. De fato,

    π(x, y,N(y))− π(y, y,N(y)) = (x− y)[a(x+ y) + by + d].

    Suponhamos que x∗ é CS.Se, por um absurdo, 2ax∗+ bx∗+d > 0, então, caso x∗ < x < y, teríamos

    π(x, y,N(y))− π(y, y,N(y)) < 0

    para y su�cientemente próximo de x∗. Pois, (x + y) se aproxima de 2x∗

    enquanto y → x∗.

    Se, por um absurdo, 2ax∗ + bx∗ + d < 0, então, caso y < x < x∗, umraciocínio análogo ao utilizado acima nos dá

    π(x, y,N(y))− π(y, y,N(y)) < 0.

    Em ambos os casos, a hipótese sobre x∗ é contrariada. Logo, só nos restaadmitir a Condição 1. Então,

    (2a+ b)x∗ + d = 0.

    Se, por um absurdo, 2a+ b = 0, então d = 0. E, daí,

    π(x, y,N(y))− π(y, y,N(y)) = a(x− y)2.

    O sinal dessa diferença depende exclusivamente de a sempre que x 6= y, então,x∗ não pode ser CS, contrariando mais uma vez nossa hipótese. Portanto,2a+ b 6= 0.

    Note que

    π(x, y,N(y))− π(y, y,N(y)) = (x− y)[a(x+ y) + by + d] =(x− y)[a(x− x∗) + a(y − x∗) + b(y − x∗) + 2ax∗ + bx∗ + d] =

    (2a+ b)(x− y)(y − x∗) + a(x− y)2.

    Uma análise da diferença, do ponto de vista apresentado acima, mostraque, para |y − x| < |2a+b||y−x

    ∗||a| , o sinal é determinado pelo termo

    (2a+ b)(x− y)(y − x∗).

  • CAPÍTULO 2. MEDIDAS 28

    Note que x∗ < y < x =⇒ 2a+ b < 0.Conclusão:

    x∗ CS =⇒ 2ax∗ + bx∗ + d = 0 e 2a+ b < 0.Agora, supondo as Condições 1 e 2 verdadeiras e limitando |x − y| <

    |2a+b||y−x∗||a| ,

    π(x, y,N(y))− π(y, y,N(y)) > 0 ⇐⇒ 0 < |x− x∗| < |y − x∗|.

    Então, pondo δ := |2a+b||y−x∗|

    |a| , por de�nição, x∗ é CS.

    O leitor atento deve ter notado a ausência de controle de |y − x∗|. Issonão foi necessário durante a demonstração. Ou seja, para qualquer y 6= x∗no interior de S, existe o δ da de�nição - supondo x∗ CS.

    Tendo em vista a Proposição 2.1, façamos a seguinte translação

    x −→ x− d2a+ b

    y −→ y − d2a+ b

    Agora o monomor�smo x∗ = −d2a+b

    é levado no zero e o termo dx é elimi-nado da equação. Ficamos com

    π(x, y,N) = ax2 + bxy + cy2 + ey + f(N)

    e com a hipótese adicional de que 0 ∈ S.

    2.3 Dinâmica de Medidas

    Apresentaremos a dinâmica populacional que será generalizada no restantedesse trabalho na tentativa de entender a evolução do estado de uma popu-lação ao decorrer do tempo.

    Diremos que uma população está no estado (n1, . . . , nr) quando existirem{x1, . . . , xr} estratégias diferentes sendo usadas e a frequência em que encon-tramos o tipo xi é ni. O �tness esperado de um estrategista xi será dadopor

    Fi(n1, . . . , nr) =r∑j=1

    njNπ(xi, xj, N),

  • CAPÍTULO 2. MEDIDAS 29

    ondeN =∑r

    j=1 nj e a dinâmica populacional é dada pelo sistema de equações

    n′i = niFi(n1, . . . , nr). (2.1)

    De�nição 2.12 (Evolutionarily Stable). A estratégia x∗ = 0 é ES para densi-dade de equilíbrio N∗ se, para toda escolha {x2, . . . , xr}, o estado (N∗, 0, 0, . . . , 0)é equilíbrio assintoticamente estável para dinâmica dada pela Equação (2.1)com x1 := x∗.

    Proposição 2.2. A estratégia x∗ = 0 é ES se a < 0 e é instável se a > 0.

    Demonstração. Estamos tratando de um sistema r×r de equações diferenci-ais. A estratégia será linearizá-lo para estudar a estabilidade de (N∗, 0, 0, . . . , 0)através do Teorema de Lyapunov-Perron ([9], pg195), a saber, uma singula-ridade que é um poço para um campo, é assintoticamente estável para essecampo.

    Vejamos que (N∗, 0, 0, . . . , 0) é, de fato, uma singularidade.É imediato que, para i > 1,

    niFi = 0Fi = 0.

    Em particular,

    N∗F1(N∗, 0, 0, . . . , 0) = N∗π(x∗, x∗, N∗) = N∗0 = 0.

    Agora, falta veri�car se é, de fato, um poço.Precisamos determinar as entradas da matriz Dg(N∗, 0, 0, . . . , 0), onde

    g := (n1F1, . . . , nrFr).

    Pondo gi := niFi, temos a diagonal dada por

    ∂gi∂ni

    = Fi + ni∂Fi∂ni

    .

    Para i > 1, temos

    Fi(N∗, 0, 0, . . . , 0) = π(xi, x

    ∗, N∗) = ax2i .

    Em particular,

    ∂F1∂n1

    (N∗, 0, 0, . . . , 0) =∂

    ∂n1(n1

    π(x∗, x∗, N)

    N)(N∗, 0, 0, . . . , 0) = f ′(N∗) < 0.

  • CAPÍTULO 2. MEDIDAS 30

    Então,

    diag[Dg(N∗, 0, 0, . . . , 0)] = (N∗f ′(N∗), ax22, ax23, . . . , ax

    2r).

    Agora, se i > j( =⇒ i > 1), em (N∗, 0, 0, . . . , 0),

    ∂gi∂nj

    = ni∂Fi∂nj

    = 0Fi = 0.

    Portanto, Dg(N∗, 0, 0, . . . , 0) é uma matriz triangular superior. Então, daÁlgebra Linear, segue que (N∗, 0, 0, . . . , 0) é um poço para g se a < 0.

    Para o caso a > 0, segue do Teorema 5.4, de [9]-pg 198, que (N∗, 0, 0, . . . , 0)é instável.

    Nosso objetivo passa a ser generalizar a dinâmica dada pela Equação(2.1). Precisaremos de um espaço de Banach contendo todos os possíveisestados de uma população para estudar a evolução ao longo do tempo.

    De�nição 2.13 (Medida com Sinal). Diremos que λ é uma medida com sinalquando existirem duas medidas �nitas λ1 e λ2, tais que

    λ = λ1 − λ2.

    Denotaremos por M e(S,BS) o espaço de todas as Medidas com Sinalde�nidas em BS. É imediato veri�car que M e é um espaço vetorial.

    De�nição 2.14 (Norma Variacional). A Norma Variacional de uma Medidaem M e(S,BS) é de�nida pela equação

    ||µ|| = supf|∫fdµ|,

    onde f : S → R é BS-mesurável com supS |f(s)| ≤ 1.

    Proposição 2.3. Munido da Norma Variacional, M e(S,BS) é um espaço deBanach.

    Demonstração. Veja uma demonstração em [10].

    Para entender a evolução do estado de uma população ao longo do tempo,precisaremos da noção de caminho diferenciável.

  • CAPÍTULO 2. MEDIDAS 31

    De�nição 2.15 (Caminho diferenciável emM e). Um caminho µ : R+ → M eé dito diferenciável quando, para cada t ∈ R, o limite

    limh→0

    µ(t+ h)− µ(t)h

    existe com respeito à Norma Variacional. O limite, quando existir, serádenotado por µ′(t).

    Seja µ uma medida �nita de�nida na σ-álgebra de Borel restrita a S,BS. O �tness esperado de um indivíduo usando estratégia x em S numapopulação em estado µ é dado por

    π(x, µ) =1

    µ(S)

    ∫S

    π(x, y, µ(S))µ(dy),

    e a dinâmica de medidas é dada por

    µ′(t)(B) =

    ∫B

    π(x, µ)µ(dx). (2.2)

    Observe que se o suppµ = {x1, . . . , xr}, recaímos na dinâmica dada pelaEquação (2.1), mas estamos mais interessados nos casos em que o suporte édado por uma união de intervalos. Para esse estudo é conveniente reescrevera dinâmica de medidas de�nindo

    P =µ

    µ(S). (2.3)

    P é dita medida de probabilidade e agora faz sentido escrever

    π(x, P, µ(S)) =

    ∫S

    π(x, y, µ(S))P (dy),

    e

    π(P, P, µ(S)) =

    ∫S

    π(x, P, µ(S))P (dx).

    Um cálculo utilizando a regra do quociente na Equação (2.3) nos dá

    P ′(B) =

    ∫B

    (π(x, P, µ(S))− π(P, P, µ(S))P (dx).

  • CAPÍTULO 2. MEDIDAS 32

    Agora, vamos enxugar a notação. Observe que o integrando π(x, P, µ(S))−π(P, P, µ(S)) não depende de µ(S), o termo f(µ(S)) é eliminado. Então, en-tenderemos π(x, y) = π(x, y, µ(S)), e a dinâmica de medida de probabilidadeé dada pela equação

    P ′(B) =

    ∫B

    (π(x, P )− π(P, P ))P (dx). (2.4)

    Iremos estudar a Equação (2.4) com mais atenção no próximo capítulo,mas antes repare que o total da população pode ser observado ao longo dotempo pela equação

    µ′(S) =

    ∫S

    π(x, P, µ(S))P (dx)µ(S).

    Observe que µ(S) := N : R+ → R e∫Sπ(x, P, µ(S))P (dx)µ(S) := g :

    R+ × R→ R.

    Proposição 2.4. A dinâmica unidimensional dada por N ′(t) = g(t, N) pos-sui uma única solução para cada N(0) = N0 dado.

    Demonstração. De acordo com o Teorema 10.2 em [9]-pg 382, basta mostrarque g : [c1, c2] ⊂ R+ × R→ R é Lipschitziana.

    Observe que

    g(t, N) = N(t)

    ∫S

    ∫S

    π(x, y,N(t))Pt(dy)Pt(dx).

    =⇒g(t, N) = N(t)

    ∫S

    ∫S

    π(x, y)Pt(dy)Pt(dx) +N(t)f(N(t)).

    Pondo λ(t) :=∫S

    ∫Sπ(x, y)Pt(dy)Pt(dx), obtemos

    g(t, N) = N(t)λ(t) +N(t)f(N(t)).

    Supondo f de classe C1, g(t, ∗) é uma função de classe C1 e, portanto, g éLipschitziana.

    De fato, π(x.P, 0) > 0 e π(x, P, µ(S)) < 0 para todo P se µ(S) é su�ci-entemente grande. Além disso, se Pt → P ∗, então µt → N∗P ∗, em que N∗satisfaz

    ∫Sπ(x, P ∗, N∗)P ∗(dx) = 0.

  • CAPÍTULO 2. MEDIDAS 33

    Da união da discussão acima com o Teorema 10.12 de [9]-pg 391, segue quea solução é global. Essa discussão também deixa claro que podemos restringirnossa atenção para o estudo da convergência e estabilidade da dinâmica dadapela Equação (2.4).

  • Capítulo 3

    Estudando a Dinâmica

    Ao longo deste capítulo, iremos estudar mais de perto a Equação (2.4), veri�-caremos sua consistência na primeira seção, para depois darmos mais atençãoaos aspectos topológicos. Terminaremos estudando um caso particular: osJogos de Parceria.

    Na primeira seção, seguiremos [14], já na segunda parte iremos nos apoiarem [1] e, no restante do capítulo, voltaremos a [8].

    3.1 Existência e Unicidade

    Seja Q uma medida de probabilidade. Ponha σ(x,Q) :=∫Sπ(x, y)Q(dy) −∫

    S

    ∫Sπ(x, y)Q(dx)Q(dy). De fato,∫

    B

    (π(x,Q)− π(Q,Q))Q(dx) =∫B

    σ(x,Q)Q(dx).

    Com essa nova notação, podemos reescrever a Equação (2.4), para obter

    Q′(B) =

    ∫B

    σ(x,Q)Q(dx) := F (Q). (3.1)

    Teorema 3.1. Seja F̃ : M e → M e contínua e seja µ ∈ M e. Consideremosa equação

    µ′(t) = F̃ (µ(t)). (3.2)

    Suponha que F̃ é limitada e globalmente K-lipschitziana. Então, (3.2)possui solução única para cada µ(0) = λ0 ∈M e dado.

    34

  • CAPÍTULO 3. ESTUDANDO A DINÂMICA 35

    Demonstração. Veja uma demonstração em [9], Capítulo 10.

    Como é mais fácil trabalhar com M e, a seguir mostraremos, sob algumashipóteses para σ, que é possível obter F̃ como no Teorema 3.1 tal que suarestrição ao conjunto de medidas de probabilidade de�nidas nos borelianosde S, que denotaremos por ∆, coincida com F da Equação (3.1).

    Lema 3.1. Suponhamos que as seguintes condições sejam verdadeiras.

    1. ||Q||, ||R|| ≤ 2 =⇒ supx |σ(x,Q)− σ(x,R)| ≤ L||Q−R||.

    2. supQ:||Q||≤2 |σ(x,Q)| ≤ σ∞.

    Então, existe F̃ : M e → M e limitada, lipschitziana, tal que sua restrição à∆ coincida com F da Equação (3.1).

    Demonstração. Com efeito,

    F̃ (Q) := (2− ||Q||)+F (Q).

    Veja uma demonstração em [14].

    Lema 3.2. Se a função de pay-o� π : S2 → R é limitada, então as condiçõesdo Lema 3.1 valem.

    Demonstração. Seja M > 0 uma limitação para π(x, y). Daí,

    |π(x,Q)| =∣∣∣∣∫S

    π(x, y)Q(dy)

    ∣∣∣∣ ≤M ||Q||e, além disso,

    |π(Q,Q)| =∣∣∣∣∫S

    ∫S

    π(x, y)Q(dx)Q(dy)

    ∣∣∣∣ ≤M ||Q||2.Portanto,

    |σ(x,Q)| ≤M ||Q||(1 + ||Q||),e σ∞ := 6M .

    Para obtermos a Condição 1, observe que

    |σ(x,Q)− σ(x,R)| ≤∣∣∣∣∫S

    π(x, y)(Q−R)(dy)∣∣∣∣+ |π(Q,Q)− π(R,R)|

    ≤M ||Q−R||+ |π(Q,Q)− π(R,R)|.

  • CAPÍTULO 3. ESTUDANDO A DINÂMICA 36

    E, além disso,

    |π(Q,Q)− π(R,R)| ≤ |π(Q−R,Q)|+ |π(R,Q−R)|,

    onde,

    |π(R,Q−R)| ≤M ||R|| ||Q−R||;|π(Q−R,Q)| ≤M ||Q−R|| ||Q||.

    Finalmente,

    |σ(x,Q)− σ(x,R)| ≤M ||Q−R||(1 + ||R||+ ||Q||).

    Lema 3.3. Seja Q(t) solução de (3.2) e suponha Q(0) := P ∈ ∆. Então,Q(t) ∈ ∆ para todo t ∈ R+, existem γt,Γt > 0 tais que

    γtQ(t)(B) ≤ P (B) ≤ ΓtQ(t)(B) ∀ B ∈ BS

    e, além disso,dQ(t)

    dP(x) = exp

    ∫ t0

    σ(x,Q(s))ds.

    Demonstração. Seja Q(t) a única solução de 3.2 com Q(0) = P . De�na Rpela equação

    dR(t)

    dP(x) = exp

    (∫ t0

    σ(x,Q(s))ds

    ).

    Foi visto no Lema 3.2 que σ é uniformemente limitada com x num compacto.E, além disso, Q é contínua. Então, R está bem de�nida e a densidade élimitada longe do zero. De fato, R é �nita e uniformemente equivalente a P .

    Além disso, vejamos que R′(t)(A) =∫Aσ(x,Q(t))R(t)(dx). Basta mos-

    trar que

    limh→0

    1

    h||R(t+ h)−R(t)− h

    ∫σ(x,Q(t))R(t)(dx)|| = 0.

    Com efeito, o Teorema 2 de [14] nos dá uma maneira conveniente para calculara norma variacional utilizando densidade. Em particular, se µ é absoluta-mente continua com respeito a R,

    ||µ|| =∫S

    ∣∣∣∣ dµdR∣∣∣∣ dR.

  • CAPÍTULO 3. ESTUDANDO A DINÂMICA 37

    Daí,

    1

    h||R(t+ h)−R(t)− h

    ∫σ(x,Q(t))R(t)(dx)||

    =1

    h

    ∫ ∣∣∣∣dR(t+ h)dR(t) (x)− 1− hσ(x,Q(t))∣∣∣∣R(t)(dx)

    =

    ∫1

    h

    ∣∣∣∣exp(∫ t+ht

    σ(x,Q(s))ds

    )− 1− hσ(x,Q(t))

    ∣∣∣∣R(t)(dx).O Teorema do Valor Médio para Integrais garante a existência de um

    s0 ∈ (t, t+ h) satisfazendo

    hσ(x,Q(s0)) =

    ∫ t+ht

    σ(x,Q(s)).

    E, além disso, a Expansão de Taylor nos permite escrever ez = 1 + z+ 12z2 +

    r(z), em que limz→0r(z)z2

    = 0.Esses dois fatos unidos à continuidade de σ em s nos permitem concluir

    que o integrando converge a zero quando h → 0 para cada x. Como σ élimitada em x, segue o desejado.

    Agora falta mostrar que R(t) = Q(t). Seja f uma função mensurávellimitada por 1. De fato,

    ∣∣∣∣∫ fd(R(t)−Q(t))∣∣∣∣ = ∣∣∣∣∫ t0

    [∫fd(Ṙs − Q̇s)

    ]ds

    ∣∣∣∣=

    ∣∣∣∣∫ t0

    [∫f(x)σ(x,Q(s))(R(s)−Q(s))(dx)

    ]ds

    ∣∣∣∣≤∫ t

    0

    ∣∣∣∣∫ f(x)σ(x,Q(s))(R(s)−Q(s))(dx)∣∣∣∣ ds.Pelo visto, na demonstração do lema anterior, segue que

    |f(x)σ(x,Q(s))| ≤M ||Q(s)||(1 + ||Q(s)||).

    Da continuidade de Q e compacidade de S, podemos tomar uma constantec ∈ R positiva satisfazendo |f(x)σ(x,Q(s))| ≤Mc. Portanto,[∫

    fd(R(t)−Q(t))∣∣∣∣ ≤Mc ∫ t

    0

    ||R(s)−Q(s)||ds

  • CAPÍTULO 3. ESTUDANDO A DINÂMICA 38

    para toda função mensurável f limitada por 1. Daí,

    ||R(t)−Q(t)|| = supp f :|f |≤1∣∣∣∣∫ fd(R(t)−Q(t))∣∣∣∣ ≤Mc ∫ t

    0

    ||R(s)−Q(s)||ds.

    Finalmente, a Desigualdade de Gronwall [9] nos permite concluir o dese-jado: ||R(t)−Q(t)|| = 0.

    Teorema 3.2. Se π é limitada, então a Equação (3.1) possui uma únicasolução em ∆ para cada condição inicial em ∆.

    Demonstração. Combinando os Lemas 3.1, 3.2 e 3.3, segue a demonstraçãodo resultado.

    3.2 Topologia, algumas considerações

    Um ponto importante a considerar é a topologia a ser usada em ∆. Faremosalgumas observações breves nesta seção.

    De�nição 3.1 (Espaço Topológico). O par (X, τ), onde X é um conjuntonão vazio e τ é uma coleção de subconjuntos de X satisfazendo

    1. ∅, X ∈ τ .

    2. Uma união qualquer de elementos de τ ainda é um elemento de τ .

    3. A interseção �nita de elementos de τ ainda é um elemento de τ .

    é dito Espaço Topológico, e τ é uma Topologia em X.

    De�nição 3.2 (Base para uma Topologia). Seja X um conjunto não vazio.Uma base para uma Topologia em X é uma coleção B de subconjuntos de Xcom as seguintes propriedades.

    1. ∀x ∈ X existe B ∈ B tal que x ∈ B.

    2. x ∈ A1 ∩ A2 =⇒ x ∈ A3 ⊂ A1 ∩ A2, onde Ai ∈ B para i = 1, 2, 3.

    Proposição 3.1. Uma Base para uma Topologia em um conjunto X induzuma Topologia em X.

  • CAPÍTULO 3. ESTUDANDO A DINÂMICA 39

    Demonstração. Veja uma demonstração em [1].

    Considere a seguinte situação: sejam X um conjunto não vazio, (Y, τ)um espaço topológico e F = {ϕα : X → Y : α ∈ Γ} uma família de funçõesindexada por Γ.

    Proposição 3.2. O conjunto

    B = {⋂

    α∈Γ∗,A∈Y

    ϕ−1α (A) : Γ∗ ⊂ Γ é �nito, Y é uma família de abertos de Y }

    é Base para uma Topologia σ(X,F) em X, na qual todas as funções de Fsão contínuas.

    Demonstração. Veja uma demonstração em [1].

    De�nição 3.3 (Topologia Fraca). A Topologia Fraca de X, espaço normado,é a Topologia σ(X,X∗) da Proposição 3.2, onde X∗ é o Dual Topológico deX.

    De fato, uma sequência (xn) em X converge para x na Topologia Fracase, e somente se,

    lim f(xn) = f(x) ∀f ∈ X∗.

    De�nição 3.4 (Topologia Fraca*). A Topologia Fraca* de X∗ é a Topologiaσ(X∗, (X∗)∗).

    De fato, uma sequência (fn) em X∗ converge para f na Topologia Fraca*se, e somente se,

    lim fn(x) = f(x) ∀x ∈ X.Uma norma induz uma métrica natural d em X ao de�nirmos d(x, y) =

    ||x − y||. E o conjunto de todas as bolas abertas sob a métrica d é basepara uma topologia em X. Em particular, a Norma Variacional induz umatopologia em ∆.

    De�nição 3.5 (Topologia Forte). A Topologia induzida por uma Norma édita Topologia Forte.

    Um dos pontos levantados em [8] é que a Topologia Fraca é mais adequadapara o estudo da evolução. Um dos argumentos é que monomor�smos quecorrespondam a estratégias próximas deveriam ser "estados"próximos. Comoilustra a seguinte proposição, isso não acontece na Topologia Forte.

  • CAPÍTULO 3. ESTUDANDO A DINÂMICA 40

    Proposição 3.3. Na Topologia Forte, dados δy, δx ∈ ∆ com y 6= x., vale

    ||δy − δx|| = 2.

    Demonstração. Oechssller e Riedel provaram que, para medidas de probabi-lidade, vale

    ||P −Q|| = 2 supA∈BS

    |P (A)−Q(B)|.

    Uma demonstração desse fato pode ser encontrada em [14]. Com esse conhe-cimento, a demonstração da proposição é trivial.

    Proposição 3.4. . O conjunto ∆ é compacto na Topologia Fraca.

    Demonstração. Esse resultado é conhecido como Teorema de Prokhorov. Umademonstração pode ser encontrada em [3].

    3.3 Convergência e Estabilidade

    Seguindo nosso estudo (na topologia fraca), segue a de�nição de LSS.

    De�nição 3.6 (Locally Superior Strategy). Diremos que P ∗ ∈ ∆ é LSSquando existir uma vizinhança V ⊂ ∆ de P ∗ tal que

    π(P ∗, Q) > π(Q,Q); ∀Q ∈ V − {P ∗}.

    Diremos que é Globalmente Superior (GS) quando a desigualdade for verda-deira para toda Q 6= P ∗.

    Observe que nossa inspiração nunca deixa de ser o jogo �nito, a de�niçãode LSS tem uma ligação íntima com o Lema 1.2.

    Agora, daremos algumas de�nições importantes para enunciar o primeiroresultado expressivo de Cressman e Ho�bauer.

    De�nição 3.7 (Absolutamente Contínua). Diremos que P ∈ ∆ é absoluta-mente continua com respeito a Q ∈ ∆ quando Q(B) = 0 =⇒ P (A) = 0para todo B ∈ BS. Denotamos por P

  • CAPÍTULO 3. ESTUDANDO A DINÂMICA 41

    De�nição 3.8 (Derivada de Radon-Nikodym). Sejam P,Q ∈ ∆ com P 0, ∀P ∗ ∈ U1−{P ∗}. Como P ∗ é estável segundo Lyapunov, existeuma vizinhança U2 tal que ∀Q ∈ U2 e t ≥ 0 temos Qt ∈ U1.

    Supoha agora que P ∗ não esteja no ω-limite da trajetória Qt. Então,existe uma vizinhança aberta de U3 de P ∗ tal que Qt 6∈ U3 ∀ t ≥ 0. Pelacompacidade de U1 − U3 e continuidade de π temos π(P ∗, P ) − π(P, P ) ≥2c > 0, para algum c > 0. Em particular, para P̃ su�ciente próximo de P ∗

    temosπ(P̃ , P )− π(P, P ) ≥ c > 0,∀P ∈ U1 − U3.

  • CAPÍTULO 3. ESTUDANDO A DINÂMICA 42

    Como suppP ∗ ⊂ suppQ, existe um P̃ su�ciente próximo de P ∗ que sejaabsolutamente contínuo com respeito a Qt�veja a Proposição 3.5. Segue-se,então, que a "cross-entropy"satisfaz

    d

    dtL(Qt) ≤ −c < 0

    ao longo da órbita. Logo, L(Qt)→ −∞ em contradição com o fato de termosL(Qt) ≥ 0.

    Portanto, P ∗ está no conjunto ω-limite de Qt. Como P ∗ é estável segundoLyapunov, ele será o único ω-limite.

    Se P ∗ for globalmente superior, podemos tomar U1 = U2 = ∆.

    O leitor atento deve ter notado a semelhança entre a �Cross Entropy� e afunção de Lyapunov do Lema 1.4. Mas, infelizmente, a �cross entropy�não écontínua na Topologia Fraca. Então, a estabilidade já não é mais garantidasalvo o caso em que S = {x1, . . . , xr}. Assim, nossa Cross Entropy passa aser exatamente a função do Lema 1.4, mas esse não é o caso de nosso interesseno momento.

    Proposição 3.5. O fecho fraco do conjunto de medidas de probabilidade quesão absolutamente contínuas com respeito a Q é o conjunto de medidas deprobabilidade que possuem suporte contido no suporte de Q.

    Demonstração. Veja uma demonstração em [4].

    Agora, vamos caracterizar um LSS com dois resultados que se apoiam nabilinearidade de π(P, P ), herdada da linearidade da Integral de Medidas.

    Lema 3.4. Todo LSS é um Equilíbrio de Nash. Ou seja,

    π(Q,P ∗) ≤ π(P ∗, P ∗) ∀Q ∈ ∆.

    Demonstração. Seja P ∗ LSS na vizinhança V .Dado Q ∈ ∆, existe ξ > 0 tal que

    (1− ξ)P ∗ + ξQ ∈ V.

    Então,

    π((1− ξ)P ∗ + ξQ, (1− ξ)P ∗ + ξQ) ≤ π(P ∗, (1− ξ)P ∗ + ξQ).

  • CAPÍTULO 3. ESTUDANDO A DINÂMICA 43

    Daí,

    0 ≤ π(P ∗, (1− ξ)P ∗ + ξQ)− π((1− ξ)P ∗ + ξQ, (1− ξ)P ∗ + ξQ)

    =⇒

    0 ≤π(P ∗ − (1− ξ)P ∗ − ξQ, (1− ξ)P ∗ + ξQ)=ξπ((P ∗ −Q), (1− ξ)P ∗ + ξQ)≤π((P ∗ −Q), (1− ξ)P ∗ + ξQ).

    Então, quando ξ → 0, obtemos

    0 ≤ π((P ∗ −Q), P ∗) ⇐⇒ π(Q,P ∗) ≤ π(P ∗, P ∗) ∀Q ∈ ∆.

    Lema 3.5. Num jogo de�nido negativo (i.e π(P − Q,P − Q) < 0, Q 6= P )existe uma estratégia GS.

    Demonstração. Seja P ∗ um equilíbrio de Nash. Daí,

    π(P ∗, Q)− π(Q,Q) = π(P ∗ −Q,P )− π(P ∗ −Q,P ∗ −Q)≥ −π(P ∗ −Q,P ∗ −Q)> 0.

    A existência de Equilíbrios de Nash num contínuo de estratégias tambémé garantida, veja em [11].

    3.4 Jogos de Parceria

    Agora, vamos estudar um caso particular, onde π : S2 → R é simétrica. Ouseja, π(x, y) = π(y, x). Isso nos leva, ainda no nosso modelo quadrático, àfunção

    π(x, y) = ax2 + bxy + ay2.

  • CAPÍTULO 3. ESTUDANDO A DINÂMICA 44

    Proposição 3.6. A função π(P, P ) é estritamente crescente fora dos equilí-brios num Jogo de Parceria e satisfaz

    d

    dtπ(P, P ) = 2

    ∫S

    (π(x, P )− π(P, P ))2P (dx).

    Demonstração. Segue da bilinearidade e simetria de π que

    d

    dtπ(P, P ) = 2π(Ṗ , P ).

    Onde, de fato,

    π(Ṗ , P ) =

    ∫S

    π(x, P )Ṗ (dx) =

    ∫S

    π(x, P )[π(x, P )− π(P, P )]P (dx)

    =

    ∫S

    [π(x, P )− π(P, P )]2P (dx) +∫S

    π(P, P )[π(x, P )− π(P, P )P (dx)]

    =

    ∫S

    [π(x, P )− π(P, P )]2P (dx) + 0

    =

    ∫S

    [π(x, P )− π(P, P )]2P (dx).

    Lema 3.6. Se P ∗ é LSS num jogo de parceria, então é um máximo local deπ(P, P ).

    Demonstração. Seja V uma vizinhança de P ∗ dada pela hipótese de LSS.Para toda Q ∈ V ,

    π(P ∗, P ∗) ≥ π(Q,P ∗) = π(P ∗, Q) ≥ π(Q,Q),

    em que a primeira desigualdade se dá pelo Lema 3.4 e a segunda desigualdadese dá pela de�nição de LSS.

    Teorema 3.4. Se P ∗ é um LSS em um jogo de parceria, então P ∗ é es-tável segundo Lyapunov e, para todo Q(0) numa vizinhança apropriada deP ∗ com suppP ∗ ⊂ suppQ(0), Q(t) → P ∗ quando t → ∞. Se P ∗ é GS esuppP ∗ ⊂ suppQ(0), então Q(t)→ P ∗.

    Demonstração. Basta combinar os dois resultados anteriores com o Teorema3.3.

  • Capítulo 4

    Classi�cação da estabilidade

    dinâmica de payo�s quadráticos e

    simétricos

    Finalmente, aplicaremos a teoria ao caso particular onde o pay-o� é simétrico,seguindo o que é feito em [8]. Iremos estudar os desdobramentos dos casosa > 0 e a < 0, atentando-nos para aspectos de convergência e estabilidadecom o auxílio do Teorema (3.4). Precisaremos de um argumento novo paraum dos casos que não se enquadra nas hipóteses dos resultados já conhecidos,é o último Teorema de [8].

    4.1 Momentos e a relação deles com o payo�

    Para um melhor estudo dos casos de um Jogo de Parceria, onde

    π(x, y) = ax2 + bxy + ay2,

    vamos considerar π(P,Q), π(P, P ), π(x, P ) − π(P, P ), π(P − Q,P − Q) emtermos do Valor Esperado e da Variância de P . Ponha

    Pk :=

    ∫xkP (dx).

    Daí, E(P ) = P1, Var(P ) = P2 − P 21 e algumas manipulações nos levam àsseguintes equações:

    45

  • CAPÍTULO 4. CLASSIFICAÇÃO DE JOGOS DE PARCERIA 46

    1. π(P,Q) = a(Var(P ) + E(P )2 + Var(Q) + E(Q)2) + bE(P )E(Q).

    2. π(P, P ) = 2aVar(P ) + (2a+ b)E(P )2.

    3. π(x, P )− π(P, P ) = a(x2 − P2) + b(xP1 − P 21 ).

    4. π(P −Q,P −Q) = b(E(P )− E(Q))2.

    Nosso principal critério de classi�cação será o sinal de a. A motivaçãopor trás disso vem do seguinte:

    O subespaço de medidas de probabilidade, que são simétricas com respeitoao zero, são invariantes sob nosso modelo quadrático, e, nesse subespaço, avariância é crescente quando a > 0 e decrescente quando a < 0.

    De fato, simetria implica em P1 = 0. Então, das Equações (2.4) e 3, segue

    Ṗ (B) = Ṗ (−B).

    Além disso, de 3 e de

    Ṗk =

    ∫xkdṖ =

    ∫xk[π(x, P )− π(P, P )]P (dx),

    temosṖ2 = a(P4 − P 22 ) + b(P3P1 − P2P 21 ).

    Com efeito, P (0) simétrica com respeito ao zero implica em P (t) simétricacom respeito ao zero para todo tempo �nito. Então, Pi = 0 para todo iímpar. E, daí,

    Ṗ2 = a(P4 − P 22 ); P4 ≥ P 22 .Portanto, uma solução de (2.4) com condição inicial no subespaço de medidasde probabilidade simétricas com respeito ao zero não pode convergir para δ0quando a > 0. De fato,

    Ṗ2(t) > 0 ∀t ∈ R+, P2(0) ≥ 0 =⇒ P2(t) > 0 ∀t > 0.

    Então, P (t) não pode convergir para uma medida de variância nula.

    4.2 O caso a < 0

    Nesse caso,

    π(P, δ0) = a(Var(P ) + E(P )2) < 0 = π(δ0, δ0) ∀P 6= δ0.

    Então, δ0 é EN estrito.

  • CAPÍTULO 4. CLASSIFICAÇÃO DE JOGOS DE PARCERIA 47

    a+ b < 0

    A Equação 3 nos dá

    π(δ0, Q)− π(Q,Q) = −aVar(Q)− (a+ b)E(Q)2 > 0.

    Então, δ0 é GS e, pelo Teorema 3.4, δ0 atrai toda condição inicial quecontenha o zero no suporte.

    2a+ b < 0 ≤ a+ bNesse caso, P ∗ = δ0 é um máximo global de π(P, P ), mas não é um LSS.

    De fato, para P 6= δ0,

    π(P, P ) = 2aVar(P ) + (2a+ b)E(P )2 < 0 = π(δ0, δ0),

    e, por outro lado, tomando P = δs com s ∈ S − {0},

    π(δ0, P )− π(P, P ) = −P2(a+ b) ≤ 0.

    Aqui, o Teorema 3.3 não é mais verdadeiro e, consequentemente, o Teorema3.4 também não. Entretanto, o próximo resultado irá mostrar que P ∗ aindaatrai toda condição inicial com suporte completo.

    Teorema 4.1. Suponha a < 0 e 2a+ b < 0 ≤ a+ b. Se o suporte de Q(0) éum intervalo que contem x∗ = 0, então Q(t)→ δ0 (na topologia fraca).

    Demonstração. Sem perda de generalidade, suponha que [0, β] ⊂ suppQ(0).De fato,

    0 < −bβ2a

    < β.

    Ponha x∗ = − b2aβ∗ com 0 < β∗ ≤ β, e sejam

    A = [x∗ + 3�, β∗] e B = [x∗ + �, x∗ + 2�],

    onde � > 0 e x∗ + 3� < β∗. Agora, observe que, para todo x ∈ B, y ∈ A ez ∈ S,

  • CAPÍTULO 4. CLASSIFICAÇÃO DE JOGOS DE PARCERIA 48

    π(x, z)− π(y, z) = −a(y − x)(x+ y) + bz(x− y)

    = −a[(y − x)(x+ y)− 2x

    β∗(y − x)z

    ]= −a(y − x)

    [(x+ y)− 2x

    β∗z

    ]≥ −a(y − x)

    [2x∗ + 4�− 2x

    β∗z

    ]> −2a(y − x)

    [x∗ + �− x

    β∗z

    ]= −2a(y − x)

    [x∗(1− z

    β∗) + �

    ].

    Além disso, pela regra do quociente,

    d

    dt

    (Q(B)

    Q(A)

    )=

    1

    Q(A)2

    ∫S

    [∫A

    ∫B

    (π(x, z)− π(y, z))Q(dx)Q(dy)]Q(dz).

    Agora, se tomarmos β∗ = β, teremos

    1− zβ∗

    > 0,

    e, consequentemente,

    π(x, z)− π(y, z) > −2a�2

    para todo x ∈ B, y ∈ A e z ∈ S. E, então,

    d

    dt

    (Q(B)

    Q(A)

    )> −Q(B)

    Q(A)2a�2 > 0

    =⇒

    d

    dt

    (Q(B)

    Q(A)

    )> −2a�2e−2a�2t+c > 0.

    A última desigualdade nos diz que ddt

    (Q(B)Q(A)

    )cresce para in�nito em ordem

    exponencial. Como Q(t)(B) é limitado, podemos concluir que Q(t)(A) → 0

  • CAPÍTULO 4. CLASSIFICAÇÃO DE JOGOS DE PARCERIA 49

    se t → ∞. Em particular, � pode ser tomado de forma que x∗ + 3� = x∗+β2

    .Assim,

    limt→∞

    Q(t) ([γ∗, β]) = 0,

    onde, 0 < γ∗ = 12(x∗ + β) < β.

    Façamos algumas mudanças: tome β∗ = γ∗. Assim,

    π(x, z)− π(y, z) > −2a�2

    para todo z ∈ [α, γ∗). Portanto, é conveniente abrirmos ddt

    (Q(B)Q(A)

    )como

    segue:

    d

    dt

    (Q(B)

    Q(A)

    )=

    1

    Q(A)2

    ∫[γ∗,β]

    [∫A

    ∫B

    (π(x, z)− π(y, z))Q(dx)Q(dy)]Q(dz)

    +1

    Q(A)2

    ∫S−[γ∗,β]

    [∫A

    ∫B

    (π(x, z)− π(y, z))Q(dx)Q(dy)]Q(dz).

    Por outro lado, colocando K := maxx,y∈S |π(x, y)|,

    1

    Q(A)2

    ∫[γ∗,β]

    [∫A

    ∫B

    (π(x, z)− π(y, z))Q(dx)Q(dy)]Q(dz)

    ≤ 1Q(A)2

    ∫[γ∗,β]

    [∫A

    ∫B

    |π(x, z)− π(y, z)|Q(dx)Q(dy)]Q(dz)

    ≤ 1Q(A)2

    ∫[γ∗,β]

    [∫A

    ∫B

    |π(x, z)|+ |π(y, z)|Q(dx)Q(dy)]Q(dz)

    ≤ 2KQ(A)2

    ∫[γ∗,β]

    [∫A

    ∫B

    Q(dx)Q(dy)

    ]Q(dz)

    = 2KQ([γ∗, β])Q(B)

    Q(A).

    Portanto,

  • CAPÍTULO 4. CLASSIFICAÇÃO DE JOGOS DE PARCERIA 50

    d

    dt

    (Q(B)

    Q(A)

    )> −2KQ([γ∗, β])Q(B)

    Q(A)− 2a�2Q(S − [γ∗, β])Q(B)

    Q(A)

    = −(2KQ([γ∗, β]) + 2a�2Q(S − [γ∗, β])Q(B)Q(A)

    := −n(t)Q(B)Q(A)

    Observe que limt→∞ n(t) = 2a�2 e 2a�2 < n(t) < 0 para todo tempo�nito su�cientemente grande. Em particular, existe um t0 tal que

    t > t0 =⇒ 2a�2 < n(t) < a�2 < 0.

    Logo, para t > t0, −n(t) > −a�2 > 0. E, portanto,

    d

    dt

    (Q(B)

    Q(A)

    )> −a�2Q(B)

    Q(A)> 0.

    Como já foi visto, essa desigualdade nos leva a concluir que Q(t)(A)→ 0quando t → ∞. Agora, basta tomar γ = β

    (x0+β

    )npara concluir que

    limt→∞Q(t)([γ, β]) = 0 para todo γ > 0.

    Um argumento similar para o intervalo [α, γ] com γ < 0 completa ademonstração.

    2a+ b = 0

    Neste caso, π(δx, δx) = 0 ∀x ∈ S, e toda dirac é um EN estrito e um máximode π(P, P ).

    De fato, π(x, y) = a(x− y)2 , além disso

    π(P, P ) = 2aVar(P ) ≤ 0 ∀P.

    Agora, para ver que é EN estrito, note que

    π(P, δs) = a[Var(P ) + (E(P )− s)2] < 0 ∀P 6= δs.

    Então,

  • CAPÍTULO 4. CLASSIFICAÇÃO DE JOGOS DE PARCERIA 51

    π(P, δs) < 0 = π(δs, δs) ∀P 6= δs.Nesse caso, não podemos ter estratégias do tipo LSS. De fato, se P ∗ é

    LSS, então é um máximo de π(P, P ). Logo, pelo discutido acima, P ∗ = δspara algum s ∈ S. Mas,

    π(δs, δx) < 0 = π(δx, δx) ∀x 6= s.

    2a+ b > 0

    Neste caso, δ0 é um ponto de sela de π(P, P ). Além disso, δα e δβ são osúnicos máximos locais de π(P, P ). Esses extremos também são LSS com res-peito às medidas Q com Esperança em [α, ξ1) ou (ξ2, β], respectivamente, emque ξ1 = − aαa+b , e ξ2 = −

    aαa+b

    . Por outro lado, na Topologia Fraca*, medidasnuma vizinhança su�cientemente pequena, possuem Esperanças arbitraria-mente próximas. Logo, δα e δβ são, de fato, LSS. Porém, isso não nos dáuma situação biestável, como a�rma [8, 5.1.4].

    De fato,

    π(δs, δs) = (2a+ b)s2 > 0 ∀s 6= 0,

    e, por outro lado, podemos tomar P arbitrariamente próxima de δ0 e aindasimétrica para obter

    π(P, P ) = 2aVar(P ) ≤ 0.Seguindo nossa análise, observe que

    π(P, P ) ≤ (2a+ b)E(P )2,onde,

    αP ([α, 0)) ≤ E(P ) ≤ βP ([0, β]).Agora, pondo q = P ([α, 0)), obtemos

    π(P, P ) ≤ (2a+ b) max{α2q2, β2(1− q)2}.Portanto, se q estiver su�cientemente próximo de 1, temos

    π(P, P ) ≤ (2a+ b)α2q2 = q2π(δα, δα) < π(δα, δα),

  • CAPÍTULO 4. CLASSIFICAÇÃO DE JOGOS DE PARCERIA 52

    e, por outro lado, se q estiver su�cientemente próximo de 0, temos

    π(P, P ) ≤ (2a+ b)β2(1− q)2 = (1− q)2π(δβ, δβ) < π(δβ, δβ).

    Finalmente, observe que

    g(E(Q)) := π(δβ, Q)− π(Q,Q) ≥ −(a+ b)E(Q)2 + bβE(Q) + aβ2.

    Assim, g de�nida acima é uma parábola em E(Q) com a concavidade voltadapara baixo e raízes iguais a ξ2 e β. Portanto, toda medida Q com esperançaE(Q) ∈ (ξ2, β) satisfaz g(E(Q)) > 0.

    Antes de estudar o próximo caso, vejamos um exemplo que chama aten-ção para a in�uência do sinal de (a + b) sobre a bacia de atração de δ0.E deixa evidente que uma estratégia maximizadora do �tness médio não,necessariamente, atrai toda condição inicial.

    Exemplo 4.1. Seja Q(0) um dimor�smo com suporte {0, s}, em que 0 <s ≤ β e suponha a + b > 0. Pondo q = Q(t)({0}) e 1 − q = Q(t)({s}),obtemos

    q′ = q(1− q)s2[bq − (a+ b)].

    Então, se 0 < q < (a+b)b

    , q′ < 0. Isto é, q → 0, se q é su�cientemente pequenoinicialmente. Note que 0 < (a+b)

    b< 1

    2, então δ0 possui uma bacia de atração

    maior que a de δs.

    4.3 O caso a > 0

    Ao analisarmos a Equação 2, podemos perceber que um máximo local P ∗ deπ(P, P ) deve ter a maior variância possível dado E(P ∗) := E. Então, P ∗ temo suporte contido em {α, β}. De fato, P ∗E = p∗1δβ + p∗2δα, em que p∗1 = E−αβ−α ep∗2 =

    β−Eβ−α . Então, devemos maximizar

    π(P ∗E, P∗E) = bE

    2 + 2a(α + β)E − 2aαβ.

    Se b < 0, estamos tratando de uma parábola com concavidade para baixoe máximo em E∗ = −a

    b(α + β). Caso E∗ ∈ S, o dimor�smo dado está bem

    de�nido. Caso contrário, há duas possibilidades:

  • CAPÍTULO 4. CLASSIFICAÇÃO DE JOGOS DE PARCERIA 53

    1. β < E∗ =⇒ P ∗ = δβ

    2. E∗ < α =⇒ P ∗ = δα

    Como P ∗ é um EN,

    π(P ∗, Q)− π(Q,Q) = π(P ∗ −Q,P ∗) + π(P ∗ −Q,Q− P ∗)≥ π(P ∗ −Q,Q− P ∗)= −b(E(P ∗)− E(Q))2 ≥ 0.

    E mais: se E(P ∗) = E(Q), então π(P ∗, Q) − π(Q,Q) = a(Var(P ∗) −Var(Q)). Daí, π(P ∗, Q)−π(Q,Q) > 0, salvo quando P ∗ e Q possuem mesmavariância e valor esperado. Como P ∗ é o (único) de maior variância para umvalor esperado dado, segue que P ∗ é GS num jogo de parceria. Então, peloTeorema 3.4, P ∗ atrai toda condição inicial que contenha o suporte de P ∗.

    2a+ b < 0

    Note que b < 0, então, pelo discutido acima, P ∗ é um dimor�smo com suporteem {α, β} que atrai toda condição inicial contendo seu suporte.

    De fato,

    2a+ b ≤ 0 =⇒ (a+ b) ≤ −a=⇒ (a+ b)β ≤ −aβ=⇒ (a+ b)β + aα ≤ a(α− β) < 0=⇒ a(α + β) < −bβ

    =⇒ −ab

    (α + β) < β,

    e, analogamente,α < −a

    b(α + β).

    2a+ b ≥ 0 e b < 0P ∗ ainda é GS, mas pode assumir qualquer uma das três formas discutidasno início da seção.

    Com efeito,

  • CAPÍTULO 4. CLASSIFICAÇÃO DE JOGOS DE PARCERIA 54

    1. P ∗ = δβ se (a+ b)β + aα ≥ 0.

    2. P ∗ = δα se(a+ b)α + aβ ≤ 0.

    3. P ∗ é dimor�smo se (a+ b)β + aα < 0 e (a+ b)α + aβ > 0.

    De fato, se 2a + b = 0, então vale três para qualquer escolha de α e β.Caso contrário, uma análise trivial deixa claro que pode-se assumir as trêssituações, dependendo dos valores absolutos de α e β, após �xados a e b.

    b > 0

    Aqui, a parábola π(P ∗E, P∗E) tem sua concavidade voltada para baixo, então

    δα e δβ são máximos locais. Estamos num caso de biestabilidade.

    De fato,

    π(δβ, Q)− π(Q,Q) = −(a+ b)E(Q)2 + bβE(Q) + aβ2 − aVar(Q),

    onde, Var(Q) = Q2 − E(Q)2. Então, para toda medida Q ∈ ∆ − {δβ} comsuporte em (0, β],

    π(δβ, Q)− π(Q,Q) = −bE(Q)2 + bβE(Q) + a(β2 −Q2)> −bE(Q)2 + bβE(Q)= bE(Q)(β − E(Q))> 0.

    Um resultado análogo vale para δα.

  • Capítulo 5

    Discussão

    Nesta dissertação, estudamos uma dinâmica populacional com um contínuode estratégias puras proposta orginalmente por Cressman e Hofbauer [8].Esta dinâmica pode ser reduzida a um sistema de equações diferencias ordi-nárias (EDO) com uma equação escalar e uma equação do replicador de�nidasno espaço de medidas de probabilidade.

    Desta forma, discutimos uma extensão natural da Teoria dos Jogos clás-sica para um contínuo de estratégias puras. Os resultados apresentados cha-mam atenção para as diferenças entre situações em que o conjunto de es-tratégias puras é �nito e situações onde estas estratégias são um conjuntocontínuo�veja a tabela abaixo:

    Finito ContínuoS = {1, . . . , n} S = [α, β]W(y,x) π(P,Q)∑ ∫

    Neste sentido, seguindo [8] e [14], de�nimos a dinâmica de medidas usandoa norma variacional, que torna o problema de existência uma extensão na-tural para espaços de Banach do resultado clássico para EDOs. Esta norma,entretanto, é muito forte e não é adequada para o estudo de estabilidade�conforme dicutido no Capítulo 3. Em vista deste fatos, estudamos a con-vergência e estabilidade na topologia fraca das medidas. Neste caso, umaoutra diferença notável é que mesmo a existência de uma função de Lyapu-nov estrita�como no caso de jogos de parceria�não é su�ciente para provar

    55

  • CAPÍTULO 5. DISCUSSÃO 56

    estabilidade no caso contínuo e isso leva a necessidade de uma análise alter-nativa apresentada no Capítulo 4.

    Essas diferenças levantam várias questões sobre os modelos e de�niçõesusados�inclusive sobre qual seria a de�nição mais adequada de um ESS.

    Em particular, as equivalências entre vários tipos de ESS descritos noCapítulo 1, verdadeiras no caso �nito, requerem mais cuidado quando a di-mensão é in�nita�que é o caso do espaço de medidas� e uma perguntanatural surge: quais equivalências permanecem verdadeiras?

    De fato,

    • a de�nição original de Maynard-Smith implica as condições de equi-líbrio e estabilidade em qualquer situação�Lema 1.1. Entretanto, arecíproca deixa de ser necessariamente verdadeira em dimensão in�-nita;

    • Vickers e Cannings deram um contra-exemplo, veja em [17], para mos-trar que um ESS de Maynard Smith�nem sempre�é um ESS combarreira uniforme;

    • Hofbauer, Schuster e Sigmund, em [12], estudaram a relação entre aexistência de uma barreira de invasão uniforme e a de�nição de supe-rioridade local;

    • Zeeman contribuiu com a relação mais complicada de se obter, entre ade�nição original de Maynard Smith e a de superioridade local�vejaem [18].

    Estudar essas equivalências�ou não equivalências�é, certamente, umassunto de interesse futuro, em que a topologia a ser usada no espaço demedidas se torna fundamental.

    Apesar de termos utilizado diferentes topologias, seria natural e conveni-ente de�nir a dinâmica na mesma topologia em que se estuda sua estabili-dade. Um resultado recente devido a Cañizo, Carrillo, e Cuadrado [6] sugereque tal distinção é desnecessária e que, de fato, podemos de�nir a dinâmicadiretamente na topologia fraca∗.

    Do ponto de vista da intuição da de�nição original de um ESS porMaynard-Smith [15] e Zeeman [18], equilíbrios assintoticamente estáveis sãocandidatos naturais a ESS. Entretanto, esta de�nição prescinde de uma di-nâmica subjacente�o que não é o caso quando temos um conjunto �nito de

  • CAPÍTULO 5. DISCUSSÃO 57

    estratégias puras. Neste sentido, parece bastante natural procurar uma con-dição que contenha, como caso particular, a de�nição, aparentemente maisgeral, de um ESS em dimensão �nita.

  • Referências Bibliográ�cas

    [1] C. Barroso. Análise funcional: Uma introdução. Notas do curso noEMALCA 2009.

    [2] R. G. Bartle. The Elements of Integration. John Wiley & Sons, NewYork, 1966.

    [3] P. Billingsley. Convergence of probability measures. John Wiley & Sons,2013.

    [4] V. I. Bogachev. Measure theory, volume 1. Springer Science & BusinessMedia, 2007.

    [5] I. M. Bomze. Cross entropy minimization in uninvadable states of com-plex populations. Journal of Mathematical Biology, 30(1):73�87, 1991.

    [6] J. A. Cañizo, J. A. Carrillo, and S. Cuadrado. Measure solutions forsome models in population dynamics. Acta applicandae mathematicae,123(1):141�156, 2013.

    [7] F. A. C. C. Chalub. Dinâmica populacional: uma abordagem matemá-tica. Manuscrito não publicado., 2015.

    [8] R. Cressman and J. Hofbauer. Measure dynamics on a one-dimensionalcontinuous trait space: theoretical foundations for adaptive dynamics.Theor. Pop. Biol., 2005.

    [9] C. Doering and A. Lopes. Equações Diferenciais Ordinárias. ColeçãoMatemática Universitária. IMPA, Rio de Janeiro, 2012.

    [10] I. Fonseca and G. Leoni. Modern Methods in the Calculus of Variations:L� p Spaces. Springer Science & Business Media, 2007.

    58

  • REFERÊNCIAS BIBLIOGRÁFICAS 59

    [11] I. L. Glicksberg. A further generalization of the kakutani �xed pointtheorem, with application to nash equilibrium points. Proceedings ofthe American Mathematical Society, 3(1):170�174, 1952.

    [12] J. Hofbauer, P. Schuster, and K. Sigmund. A note on evolutionarystable strategies and game dynamics. Journal of Theoretical Biology,81(3):609�612, 1979.

    [13] J. F. Nash et al. Equilibrium points in n-person games. Proc. Nat. Acad.Sci. USA, 36(1):48�49, 1950.

    [14] J. Oechssler and F. Riedel. Evolutionary dynamics on in�nite strategyspaces. Economic Theory, 17(1):141�162, 2001.

    [15] J. M. Smith. The theory of games and the evolution of animal con�icts.Journal of theoretical biology, 47(1):209�221, 1974.

    [16] G. Teschl. Topics in real and functional analysis. Notas de aulas dispo-níveis em http://www. mat. univie. ac. at/� gerald, 2016.

    [17] G. T. Vickers and C. Cannings. On the de�nition of an evolutionarilystable strategy. Journal of Theoretical Biology, 129(3):349�353, 1987.

    [18] E. C. Zeeman. Dynamics of the evolution of animal con�icts. Journalof theoretical Biology, 89(2):249�270, 1981.