estima˘c~ao das taxas de infec˘c~ao e cura no processo ... · assim como eu, luiz, l eo e f abio...

Universidade Federal do Rio de Janeiro

Estimacao das taxas de infeccao e cura noProcesso de Contato

Felipe Rafael Ribeiro Melo

Rio de Janeiro

2008

Felipe Rafael Ribeiro Melo

Estimacao das taxas de infeccao e cura no Processo de Contato

Dissertacao de Mestrado apresentada ao Programa

de Pos-graduacao em Estatıstica do Instituto de

Matematica da Universidade Federal do Rio de Janeiro

como parte dos requisitos necessarios a obtencao do

tıtulo de Mestre em Estatıstica.

Orientador:

Glauco Valle da Silva Coelho

Departamento de Metodos Estatısticos

Instituto de Matematica

Universidade Federal do Rio de Janeiro

Maio de 2008

Folha de exame

Dissertacao de Mestrado apresentada ao Programa

de Pos-graduacao em Estatıstica do Instituto de

Matematica da Universidade Federal do Rio de Janeiro

como parte dos requisitos necessarios a obtencao do

tıtulo de Mestre em Estatıstica.

Banca examinadora:

Glauco Valle da Silva Coelho

Instituto de Matematica - UFRJ

Nei Carlos dos Santos Rocha

Instituto de Matematica - UFRJ

Valentin Sisko

Instituto de Matematica - UFF

Aos meus pais.

i

Agradecimentos

E com muito orgulho que escrevo esta pagina, pois sozinhos nao somos nada. Em

primeiro lugar, agradeco a Deus, forca suprema e causa primaria de todas as coisas, e

todas as forcas invisıveis que contribuıram comigo para que este trabalho chegasse ao

ponto que chegou; e minha famılia, a base de tudo, pela confianca no meu potencial,

pelo apoio e incentivo que nunca deixaram de existir, e pela paciencia em lidar com meu

stress e, por vezes, perfeccionismo, fruto do esforco para obter um bom rendimento na

dissertacao.

Aos professores que passaram na minha vida, dos quais extraı grande parte da base

intelectual que hoje possuo, desde a Tia Aldineia no C.A. ao meu orientador Glauco

Valle. A este, um agradecimento especial, por todo o entrosamento obtido nesses

aproximadamente 15 meses trabalhando juntos, pela atencao dedicada e pela paciencia

com minha relativa falta de forte base matematica (e tambem de Processos Estocasticos).

Agradeco ao pessoal do corpo discente da pos-graduacao, em particular aos meus

companheiros da turma de Mestrado de 2006, que souberam como foi viver toda a pressao

do primeiro ano de curso. Assim como eu, Luiz, Leo e Fabio (grande companheiro desde

os tempos de UERJ, que seria de nos se nao fossem as ajudas que um oferecia ao outro

nas disciplinas do Mestrado!?) continuaram para o segundo ano, mas nao poderia me

esquecer de companheiros que nao estao mais no curso, como Simone, Cleide e Flavinha.

Tambem agradeco em especial a Val (que me ofereceu o preambulo para o relatorio e

me deu dicas para edicao do texto); o Vinıcius, com o qual tive meu primeiro contato

com o Latex no minicurso que ele ministrou, alem do divertido convıvio (mesmo que

em pequena escala) e da aceitacao em otimizar meu algoritmo em C (acabou nao sendo

necessario, mas valeu a intencao!); o Joaquim, que veio com o minicurso de Ox na hora

ii

em que eu mais precisava e que me tirou algumas duvidas a respeito deste software; e a

todos que tiveram paciencia com meus programas rodando no laboratorio, pois sei que

foram muitos!

Aos meus amigos Giselli, Luciana e Douglas, pessoas que mais me ajudaram quando

estive fraco e desmotivado com a vida, momento que coincidiu com o comeco da

dissertacao. A melhor forma de agradecer a voces e mostrar que estou aqui, renascido e

com uma dissertacao pronta, pronto para me tornar Mestre!

Ao povo da sala 714 da Escola Nacional de Saude Publica, mas em especial

quero destacar a professora Mariane Branco Alves, sempre presente em minha vida

academica desde 2003, seja como aluno, orientando de Projeto de Extensao, orientando

de monografia de Graduacao ou assistente de pesquisa. Alguem que admiro muito como

pessoa e profissional e que, sem ela, minha vida academica nao seria a mesma. Tambem

a todas as outras pessoas importantes que surgiram no meu caminho gracas a Fundacao

Oswaldo Cruz.

A CAPES, pelo apoio financeiro.

Aos membros da comunidade do Latex no Orkut, na qual retirei muitas duvidas em

relacao a esta linguagem.

Por fim, agradeco a todos que torceram por mim, desde os que estao no Rio aos que

estao a muitos quilometros de distancia. Muito Obrigado!

iii

Resumo

Os processos de contato sao modelos interessantes e uteis para uma variedade de

problemas em Probabilidade Aplicada, como modelos que tratam de propagacao de

epidemias, infeccoes de ordem biologica em determinada estrutura celular ou crescimento

de sistemas ecologicos. Essencialmente, sao processos de Markov a tempo contınuo, onde

cada ponto (sıtio) em uma grade d-dimensional de valores inteiros possui um de dois

possıveis estados: sadio ou infectado. O processo inicia-se com um conjunto nao-vazio

de sıtios infectados e desenvolve-se com a infeccao sendo transmitida para vizinhos dos

sıtios infectados e, independentemente, cura de sıtios infectados, ao longo do tempo

transcorrido.

O presente trabalho traz o embasamento teorico desta classe de processos, incluindo

uma serie de resultados, e alternativas para a estimacao dos parametros de infeccao e cura.

Tambem foi avaliada uma diferente classe de processos de contato onde ha imunizacao

de sıtios, uma vez que estes foram curados da infeccao. Sugerimos uma alternativa para

a estimacao dos parametros deste modelo. Simulacoes computacionais foram realizadas

para verificarmos empiricamente diversos pontos analisados na teoria que se desenrola

ao longo dos capıtulos desta dissertacao para o processo de contato usual, assim como

realizamos simulacoes dos processos com imunizacao, objetivando verificar se o estimador

sugerido e razoavel.

iv

Abstract

The contact processes are interesting and useful models for a variety of applied

probability problems, such as models concerned with spread of epidemics, biological

infection on a cellular structure or growth of ecological systems. Essentially, the contact

processes are Markov processes in continuous time, which every point in a d-dimensional

integer lattice is in one of two possible states: healthy or infected. The process starts

with a nonempty set of infected sites and evolves with infection being transmitted to

neighboring sites of infected sites and independently infected sites being cured along the

time.

This dissertation brings the theoretical framework for this class of processes, including

some important theoretical results and alternatives for the parameters estimation. We

also study a class of models with immunization of sites once cured of its infection. We

propose an alternative for the estimation of the infection parameter for this model.

Computational simulations were made to check empirically various points viewed in

theory over the chapters in this dissertation for the usual contact process, and the process

with immunization to verify whether the proposed estimators are reasonable.

v

Sumario

Introducao 1

1 Definicoes e Resultados Preliminares 8

1.1 Construcao dos processos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

1.2 Sobrevivencia da infeccao: casos supercrıtico e subcrıtico . . . . . . . . . . . . . . . . . . . 14

1.3 O Teorema da Convergencia Completa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

1.4 O Teorema da Forma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

2 Estimadores de Maxima Verossimilhanca 22

2.1 Definicoes preliminares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

2.2 Funcao de Verossimilhanca . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

2.3 Estimadores e suas propriedades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

3 Estimacao via um metodo de contagem 34

3.1 Metodologia de estimacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

3.2 O uso do envoltorio convexo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

3.3 Comportamento assintotico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

3.4 Estabelecendo o teorema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

3.5 Comparacao de estimadores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

3.6 Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51

4 Processos com imunizacao 59

4.1 Dinamica do processo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59

4.2 Percolacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60

4.3 Teorema da Forma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64

4.4 Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65

5 Conclusoes e Comparacoes 70

vi

Apendice A: Algoritmo em Ox para simulacoes de Processos de Contato de parametros

(λ, 1) 75

Apendice B: Algoritmo em Ox para simulacoes de Processos com imunizacao de

parametros (λ, 1) 82

vii

Lista de Figuras

1.1 Representacao grafica do cilindro RC(−1,1) ∩R(−3,2) ∩R(3,2). . . . . . . . . . . . . . . . . . 9

1.2 Representacao grafica dos processos de contato no caso unidimensional. . . . . . . . . . . 13

3.1 Exemplo de contorno L1 do envoltorio convexo da configuracao de sıtios infectados em

um determinado instante de tempo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

3.2 Amostra da configuracao de um processo de contato com parametros λ = 2 e µ = 1 no

instante T = 20. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51

3.3 Amostra da configuracao de um processo de contato com parametros λ = 3 e µ = 1 no

instante T = 20. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52

3.4 Amostra de um processo de contato de parametros (2, 1) para instantes de tempo T = 5,

T = 10 e T = 20. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

3.5 Amostra de um processo de contato de parametros (3, 1) para instantes de tempo T = 5,

T = 10 e T = 20. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

3.6 Amostra de um processo de contato de parametros (5, 1) para instantes de tempo T = 5

e T = 10. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

3.7 Distribuicoes empıricas para as estimativas sem peeling. . . . . . . . . . . . . . . . . . . . 57

3.8 Distribuicoes empıricas para as estimativas com peeling. . . . . . . . . . . . . . . . . . . . 58

4.1 Exemplo de percolacao para processos com imunizacao com infeccao comecando na origem. 62

4.2 Representacao grafica de processos com imunizacao no caso unidimensional. . . . . . . . . 63

4.3 Amostra da configuracao de um processo com imunizacao de parametro λ = 3 no instante

T = 20. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66

4.4 Amostra de um processo de contato com imunizacao de parametro λ = 3 para instantes

de tempo T = 5, T = 10 e T = 20. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67

4.5 Amostra de um processo com imunizacao de parametro λ = 5 para instantes de tempo

T = 5 e T = 10. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68

4.6 Distribuicoes empıricas para as estimativas do parametro de infeccao do processo com

imunizacao. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69

viii

Lista de Tabelas

3.1 Medias e desvios padroes amostrais das estimativas de cada grupo de amostras de

processos simulados com os mesmos valores de λ e T considerando toda a grade

bidimensional. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55


processos simulados com os mesmos valores de λ e T utilizando peeling. . . . . . . . . . . 55


processos com imunizacao simulados com os mesmos valores de λ e T . . . . . . . . . . . . 68

ix

Introducao

Os processos de contato – e, mais genericamente, sistemas de partıculas interagentes –

foram primeiramente estudados e apresentados por Harris [10]. O rigoroso embasamento

teorico de tais processos mostra-se util no tocante a provar teorias, em especial nas areas

da Fısica e da Biologia Teorica. Alem disto, sao modelos interessantes e uteis para

uma variedade de problemas em Probabilidade Aplicada. Os exemplos mais comuns

sao: modelos que tratam de propagacao de epidemias; infeccoes de ordem biologica em

determinado tecido/orgao; crescimento de sistemas ecologicos.

Para compreensao do processo, primeiramente considere a grade d-dimensional de

valores inteiros Zd = x = (x1, . . . , xd) : xi ∈ Z, i = 1, . . . , d. Na linguagem

de sistemas de partıculas, tais pontos sao denominados sıtios. Cada um desses sıtios

possui um de dois possıveis estados: sadio ou infectado. Sendo assim, tem-se, a cada

instante t ≥ 0, uma configuracao em 0, 1Zd. No instante inicial (t = 0) o conjunto

de sıtios infectados e nao-vazio e definido atraves de uma distribuicao de probabilidade

no espaco de configuracoes possıveis. A dinamica do processo ocorre da seguinte forma:

com o decorrer do tempo, a infeccao se transmite de um sıtio infectado para um sıtio

sadio (independentemente entre estes tipos de pares de vizinhos) segundo um processo

de Poisson de taxa λ; por outro lado, de modo independente, cada sıtio infectado,

independentemente um do outro, torna-se sadio segundo um processo de Poisson de

taxa µ. Aqui, taxa se refere ao parametro da distribuicao exponencial que representa

a distribuicao do intervalo de tempo entre a ocorrencia de dois pontos consecutivos no

processo de Poisson. Entende-se por vizinhos dois sıtios tal que a distancia L1 entre estes

e igual a 1, onde a distancia L1 entre dois pontos x = (x1, . . . , xd) e y = (y1, . . . , yd) em

1

Zd e dada por

|x− y| :=d∑i=1

|xi − yi|.

Temos assim um modelo parametrico: o processo de contato de parametros (λ, µ). O

principal interesse neste projeto e a estimacao dos parametros de infeccao λ e cura µ

do referido processo. A obtencao de tais estimadores e realizada atraves de diferentes

maneiras vistas na literatura. Em algumas situacoes, considera-se o parametro de cura

conhecido e igual a 1, e o interesse volta-se somente a estimacao do parametro de infeccao

(isto nao e uma grande perda, porque com uma renormalizacao temporal apropriada

pode-se transformar qualquer processo de contato em outro processo de contato com

µ = 1). Segue abaixo os principais objetivos deste trabalho.

• Compreensao da teoria dos processos de contato, envolvendo desde nocoes contidas

em processos estocasticos ate o desenvolvimento presente, passando pelo estudo de

distribuicoes de equilıbrio, criterios de convergencia (processos limite), entre outros

conceitos.

• Estimar o parametro de infeccao e o parametro de cura atraves de diferentes

maneiras vistas na literatura, bem como a comparacao destes diferentes metodos

de estimacao e estimadores.

• Estudo da consistencia e comportamento assintotico dos estimadores encontrados.

• Elaboracao de rotinas para simulacoes de processos de contato, desta forma

verificando empiricamente a teoria estudada e reforcando as abordagens

construtivas usadas nas descricoes de processos estocasticos.

• Discutir estimacao dos parametros em modelos com imunizacao.

• Por fim, um apanhado de conclusoes obtidas apos todo o trabalho realizado

envolvendo estimacoes de parametros em processos de contato, alem de perspectivas

de trabalhos futuros.

2

A abordagem deste texto e principalmente teorica e nossa analise estatıstica e

frequentista. Em termos de aplicacao e inferencia bayesiana, faz-se pertinente citar

(em linha de raciocınio semelhante a dinamica dos processos de contato no que diz

respeito aos relogios exponenciais que governam instantes de infeccao e cura) o modelo de

mistura a dois nıveis (two-levels mixing models) de Demiris & O’Neil [4], que e baseado na

construcao de grafos aleatorios tracados entre indivıduos dentro da mesma residencia e

entre indivıduos de diferentes residencias, utilizando abordagem bayesiana na estimacao

dos paramentros de infeccao (local e global). No estudo mencionado e realizada aplicacao

utilizando os dados provenientes do surto do vırus influenza A(H3N2) na cidade de

Tecumseh, no estado de Michigan, Estados Unidos.

A existencia de resultados teoricos em modelos com imunizacao – como o modelo de

incendio em florestas em Cox & Durrett [3] – tem prerrogativas semelhantes ao processo de

contato, com a diferenca da utilizacao de tres diferentes estados (alem de sadio e infectado,

tal modelo possui o estado imune, ou seja, um indivıduo que, uma vez infectado, se

cura, nao se torna novamente sadio, mas sim imune, e permanece neste estado para

sempre no sistema). Por fim, em estudos na chamada Biologia Teorica, tambem existem

possibilidades para aplicacao de modelos de partıculas interagentes do ponto de vista

probabilıstico. O estudo de propagacao celula a celula (spread cell-to-cell) do vırus da

herpes em Lodmell et al [14] menciona que ha pelo menos tres diferentes maneiras pelas

quais vırus podem se espalhar de uma celula a outra: (i) propagacao para celulas proximas

ou distantes atraves de rotas extracelulares; (ii) celula infectada pelo vırus, ao entrar em

processo de divisao celular, gera duas celulas infectadas; e (iii) propagacao do vırus para

celulas adjacentes atraves de pontes intercelulares. Esta ultima e a forma pela qual o

vırus da herpes se propaga. Interpretando celulas como sıtios, celulas adjacentes como

sıtios vizinhos e logo pontes intercelulares como elos ligando celulas adjacentes, temos um

modelo semelhante ao processo de contato e, por conseguinte, caminhos para aplicacao

de modelos de partıculas interagentes. Alem disto, a partir do momento no qual uma

celula infectada se cura (pela acao de anticorpos), esta celula permanece imune a infeccao

devido ainda a acao destes anticorpos. Equivalentemente, do ponto de vista da evolucao

da infeccao, poderıamos ter no lugar desta imunizacao permanente a ocorrencia de morte

3

celular ocasionada pela permanencia do vırus na referida celula. Dessa forma, temos o

modelo semelhante a Cox & Durrett [3], uma vez que esta acao imunizadora dure para

sempre (caso contrario, temos um modelo de maior complexibilidade).

Esta dissertacao se organiza da seguinte forma. A definicao, dada de maneira

mais formal e matematica, e a apresentacao dos principais resultados e caracterısticas

dos processos de contato serao destacadas no primeiro capıtulo do presente trabalho.

Inicialmente apresentaremos o gerador infinitesimal que implica na existencia de um

processo de Markov chamado de processo de contato. A representacao grafica dos

processos de contato, desenvolvida por Harris [10], sera descrita a seguir. Atraves desta,

a dinamica do processo de contato pode ser compreendida, assim como e possıvel verificar

empiricamente caraterısticas inerentes deste tipo de processo, como a atratividade e a

auto-dualidade. O evento que denota o tempo de sobrevivencia da infeccao tambem

sera apresentado. Uma vez que este evento e definido e o conjunto inicial de sıtios

infectados possui cardinalidade finita, a enfase direciona-se para os casos onde a infeccao

no sistema permanece para sempre com probabilidade nao-nula (caso supercrıtico) e

onde a infeccao desaparece (em determinado instante de tempo) com probabilidade 1

(caso subcrıtico). Estas ramificacoes dependem de um valor crıtico ρd que depende da

dimensao d da grade de inteiros onde o processo esta definido de forma que se λ/µ > ρd

o processo e supercrıtico, caso contrario e subcrıtico. Se a infeccao desaparecer em um

determinado instante de tempo (que acontece quase certamente no caso subcrıtico e

ocorre com probabilidade positiva no caso supercrıtico), a configuracao do sistema neste

instante sera nenhum sıtio infectado, e assim permanecera para qualquer instante de

tempo a seguir. Portanto, esta configuracao sem sıtios infectados e chamada de ponto de

absorcao de um processo de contato. Quando a cardinalidade do conjunto inicial de sıtios

infectados e infinita, em ambos os casos (supercrıtico e subcrıtico) a infeccao sobrevive

para sempre com probabilidade 1. Ainda no mesmo capıtulo, sao apresentados dois dos

principais teoremas referentes aos processos de contato: o Teorema da Convergencia

Completa e o Teorema da Forma. O Teorema da Convergencia Completa diz que

para um instante de tempo relativamente grande, a distribuicao do processo converge

fracamente para uma distribuicao que e combinacao convexa de duas medidas extremais,

4

ponderadas por probabilidades relativas a sobrevivencia da infeccao no sistema. A medida

de probabilidade concentrada na configuracao com nenhum sıtio infectado e ponderada

pela probabilidade da infeccao desaparecer; e, ponderada pela probabilidade da infeccao

nao se extinguir, temos a chamada medida de equilıbrio superior, no sentido de que

qualquer outra medida de equilıbrio do sistema e estocasticamente dominada por ela.

Tal medida (tambem chamada de medida invariante superior, devido a estacionaridade

desta) sera amplamente citada e estudada no decorrer deste trabalho. O Teorema da

Forma (ver Bezuidenhout & Grimmett [1], Durrett [5]) assegura que, a partir de um

determinado instante de tempo t suficientemente grande, para um conjunto inicial de

sıtios infectados unitario e sob a condicao de sobrevivencia do processo (situacao possıvel

apenas no caso supercrıtico), a infeccao se propaga linearmente a uma taxa constante

e que a regiao de sıtios infectados tem aproximadamente a forma tU no tempo t, onde

U ⊂ Rd e um conjunto convexo, limitado e com a origem como um ponto interior. Sob

a condicao de sobrevivencia do processo, a distribuicao limite do processo e ν, portanto

logo apos a infeccao chegar em um sıtio, a distribuicao na vizinhanca deste sıtio converge

para a medida de equilıbrio superior.

Fortemente baseado na representacao grafica dos processos de contato, construımos

um algoritmo que fornece amostras de um processo de contato de parametros (λ, 1)

em um instante de tempo imputado no programa. A ideia e fazer este algoritmo

rodar em um tempo suficientemente grande a ponto de atingir a distribuicao limite

e as respectivas propriedades assintoticas. Alem da figura com a configuracao, o

programa construıdo retorna o valor do estimador baseado no equilıbrio das taxas de

crescimento/decrescimento segundo Fiocco & van Zwet [9]. Atraves da figura gerada pela

simulacao feita pelo algoritmo construıdo, tambem tem-se a ideia da forma do conjunto

U citado no Teorema da Forma (ver Figuras 3.2 e 3.3). O algoritmo tambem e adaptavel

ao processo com imunizacao de Cox & Durrett [3].

O segundo capıtulo desta dissertacao trata dos estimadores de maxima

verossimilhanca dos parametros de infeccao e de cura para o processo que inicia com

apenas a origem infectada. Estes estimadores sao dados em funcao de processos de

contagem (que denotam o numero de transicoes de sadio para infectado e de infectado

5

para sadio do referido processo de contato ate um determinado instante de tempo); e de

certas taxas integradas referentes ao processo. Grandezas como a taxa de mudanca em

um sıtio e taxa total de mudanca em qualquer sıtio sao tambem definidas neste capıtulo,

e a verossimilhanca do processo observado ate determinado instante de tempo t e descrita

de maneira analıtica, considerando que o processo no intervalo [0, t] passa por exatas N

transicoes. Dado que o processo nao se extingue, distribuicao e propriedades assintoticas

dos estimadores sao citadas. Os estimadores de maxima verossimilhanca sao consistentes,

assintoticamente nao-viciados e eficientes, e a distribuicao conjunta dos estimadores de

infeccao e cura (apos devida normalizacao) e assintoticamente normal bivariada.

No terceiro capıtulo, apresentamos a tecnica de estimacao via um metodo de

contagem. Primeiramente, seja o processo de contato de parametros (λ, 1) com apenas

a origem infetada no instante inicial. A estimativa de λ com base na realizacao do

processo ate um determinado instante t depende apenas da configuracao do processo no

instante t. A ideia principal deste estimador esta baseada na suposicao de equilıbrio

do processo para um instante de tempo suficientemente grande, ou seja, a taxa media

de crescimento do processo (sıtios sadios tornando-se infectados) e aproximadamente

igual a taxa media de decrescimento (sıtios infectados tornando-se sadios). Todavia,

se considerarmos estas taxas em todo reticulado, o estimador sofre um vıcio negativo.

Simulacoes computacionais confirmam que este estimador subestima λ substancialmente.

O estimador nao e calculado baseado em todo reticulado, mas no conjunto que define o

envoltorio convexo do conjunto de sıtios infectados no instante t. Ainda assim, os sıtios

proximos da regiao de fronteira deste conjunto ainda nao estao no equilıbrio desejado, e

portanto sao desconsiderados na contagem. A remocao de certa proporcao de sıtios em

geral produz estimativas convincentes para λ. Assim como os estimadores de maxima

verossimilhanca, este estimador tambem possui propriedades assintoticas (condicional a

sobrevivencia do processo): consistencia e normalidade assintotica.

No quarto capıtulo desta dissertacao, abandonaremos em parte o contexto visto ate

o momento sobre os processos de contato e apresentaremos um modelo diferente de

propagacao de epidemias, baseado em Cox & Durrett [3]. Sera apresentada a ideia

deste processo e alguns resultados relevantes. Em tal modelo, alem dos estados sadio

6

e infectado, temos tambem o estado imune. A dinamica ocorre da seguinte maneira:

cada sıtio z ∈ Z2 esta em um dentre tres estados: sadio, infectado ou imune. Como

nos processos de contato vistos ate aqui, este processo se inicia com um conjunto

nao-vazio de sıtios infectados, estando todos os outros no estado sadio. Conforme

o passar do tempo, um sıtio infectado, independentemente de qualquer outro sıtio,

espera tempos exponencias independentes de parametro λ associados a cada um de

seus vizinhos proximos e, apos cada um desses tempos, se ainda infectado, transmite

a infeccao ao respectivo sıtio vizinho, o qual se torna infectado caso esteja no estado

sadio. Independentemente, um sıtio infectado permanece neste estado por um tempo

aleatorio com distribuicao exponencial de parametro 1. Uma vez terminado este perıodo

de infeccao, o sıtio torna-se imune e nao pode mais contrair a infeccao.

Por fim, o ultimo capıtulo traz uma serie de conclusoes referentes a todo o estudo

realizado, e comparacoes pertinentes, no que diz respeito as diferentes maneiras de obter

estimadores e simulacoes realizadas com diferentes taxas de infeccao e diferentes duracoes,

inclusive dos processos vistos no Capıtulo 4. Em Apendice, temos os algoritmos, em Ox,

que geram as configuracoes das simulacoes obtidas.

7

Capıtulo 1

Definicoes e Resultados Preliminares

1.1 Construcao dos processos

Os processos de contato sao processos que apresentam espaco de estados definido

por Ω = 0, 1Zd, onde cada configuracao ξ ∈ Ω tem a seguinte interpretacao: um

sıtio x e definido como infectado se ξ(x) = 1 ou sadio se ξ(x) = 0, para todo

x ∈ Zd. Em Ω, estamos sempre considerando a σ-algebra B gerada pelos conjuntos

Rx = ξ ∈ Ω : ξ(x) = 1 (esta e, de fato, a σ-algebra de Borel associada a topologia

produto), ou seja, a menor σ-algebra contendo (Rx)x∈Zd . Todo conjunto de configuracoes

determinado pela especificacao da configuracao em um numero finito de sıtios e chamada

de cilindro. Os conjuntos Rx sao cilindros e todo cilindro e interseccao de cilindros Rx

ou seus complementares.

Exemplo 1.1 : O cilindro ξ ∈ Ω : ξ(x1) = 0, ξ(x2) = 1, ξ(x3) = 1 pode ser escrito como

RCx1∩Rx2 ∩Rx3 . Para facilitar a interpretacao, podemos imaginar que, neste caso acima,

estamos em Z2 e os sıtios sao x1 = (−1, 1), x2 = (3, 2) e x3 = (−3, 2), conforme exibe a

Figura 1.1. Assim, atraves do uso de cilindros, complementares de cilindros, unioes e/ou

interseccoes, podemos definir qualquer configuracao ξ possıvel que exija certo numero

(finito) de sıtios infectados e/ou sadios.

Como o espaco de estados em questao Ω e nao-enumeravel, definimos o processo

de contato atraves do gerador infinitesimal aplicado em funcoes cilındricas, ou

8

Figura 1.1: Representacao grafica do cilindro RC(−1,1) ∩R(−3,2) ∩R(3,2). Os pontos preenchidosem preto representam sıtios infectados, e o ponto em branco representa sıtio sadio. Todos osoutros sıtios em Z2 podem estar em qualquer estado.

seja, f : Ω → R que seja determinada por um conjunto finito de coordenadas, isto e,

∃A ⊂ Zd finito tal que se ξ(x) = η(x), para todo x ∈ A, entao f(ξ) = f(η). Assim, se f

e cilındrica, define-se Lf em cada configuracao ξ ∈ Ω por

(Lf)(ξ) =∑x∈Zd

∑y:|x−y|=1

λ ξ(x)[1− ξ(y)][f(ξy)− f(ξ)] +

+∑x∈Zd

µ ξ(x)[f(ξx)− f(ξ)], (1.1)

onde, para z ∈ Zd,

ξx(z) =

ξ(z) , z 6= x,

1− ξ(z) , z = x.

A configuracao ξx denota a mesma configuracao ξ exceto no sıtio x. O gerador descreve

a variacao infinitesimal do processo com relacao ao tempo quando em determinada

configuracao. Quando situados em processos de Markov homogeneos a tempo contınuo

com espaco de estados finito, temos o semigrupo de matrizes de transicao indexado pelo

tempo representando, para cada instante de tempo t, as probabilidades de transicao entre

os diferentes estados, e o seu gerador infinitesimal L consiste na matriz obtida da derivada

9

no instante t = 0 em cada termo deste semigrupo de transicao. Mais a frente, veremos

uma construcao mais intuitiva e geometrica. O gerador em (1.1) implica a existencia

de um processo de Markov com espaco de estados Ω (ver Teorema 3.9 em Liggett [13]),

que denotaremos por (ξt)t≥0 e chamaremos de processo de contato de parametros (λ, µ).

Denota-se o estado do processo no sıtio x em um dado instante t ≥ 0 atraves da variavel

aleatoria ξt(x), dada por

ξt(x) =

1 , se o sıtio x esta infectado no instante t,

0 , se o sıtio x esta sadio no instante t.

Tambem e comum representar o processo atraves da evolucao do conjunto de sıtios

infectados. Assim como a funcao descrita acima ξt : Zd → 0, 1, este conjunto e,

abusando um pouco da notacao, denotado por ξt, na forma

ξt = x ∈ Zd : ξt(x) = 1.

Aqui, retrata-se de uma bijecao na seguinte funcao:

Ω → P(Zd)

ξ 7→ B(ξ) = x ∈ Zd : ξ(x) = 1.

A medida de probabilidade π em Ω = 0, 1Zd

e equivalente a medida de probabilidade,

digamos, π, em P(Zd) (conjunto das partes de Zd), ou seja,

π(B ⊂ Zd : B ⊃ F ) = π(ξ ∈ 0, 1Zd

: ξ(x) = 1,∀x ∈ F )

= π

( ⋂x∈F

Rx

),

para todo conjunto finito F , com B ∈ B.

Exemplo 1.2 : Seja d = 2 e a famılia de configuracoes com os sıtios (−2, 1) e (0, 3)

infectados, ou seja, ξ ∈ R(−2,1) ∩ R(0,3). Logo, temos o conjunto F = (−2, 1), (0, 3).

10

Entao, para todo conjunto B(ξ) ⊃ F ,

π(ξ ∈ Ω : ξ(−2, 1) = ξ(0, 3) = 1) =

π(B ⊂ Zd : B ⊃ (−2, 1), (0, 3)) =

π(R(−2,1) ∩R(0,3)).

A distribuicao do processo de contato ξt depende de sua distribuicao inicial, que

pode ser qualquer probabilidade no espaco Ω. Denotando esta distribuicao por ξ0 ∼ π,

tem-se ξπt : t ≥ 0 como o processo de contato de parametros (λ, µ) com conjunto

inicial de sıtios infectados distribuıdos conforme π. Esta distribuicao e independente do

desenvolvimento futuro do processo. No caso do conjunto inicial de sıtios infectados ser

dado de forma determinıstica, denotaremos tal conjunto inicial por A e o processo referido

por ξAt : t ≥ 0. Este e um caso particular quando π e a distribuicao concentrada na

configuracao

ξA0 (x) =

1 , se x ∈ A,

0 , caso contrario.

Temos assim um modelo parametrico: o processo de contato de parametros (λ, µ).

Formalmente, o processo de contato e um processo de Markov com espaco de estados

Ω = 0, 1Zde configuracao ξ ∈ Ω. Definido o estado inicial A ⊂ Zd de sıtios infectados,

a cada instante t ≥ 0, temos uma configuracao ξAt ∈ Ω. Obviamente, ξA0 = A. A

dinamica do processo ocorre da seguinte forma: com o decorrer do tempo, um sıtio sadio

e infectado independentemente por cada sıtio infectado entre seus 2d vizinhos segundo

um processo de Poisson de taxa λ; independentemente, um sıtio infectado torna-se sadio

segundo um processo de Poisson de taxa µ. Tal dinamica pode ser compreendida pela

representacao grafica de Harris [10]. Para descrever esta construcao, considere o

espaco (d+1)-dimensional Zd× [0,∞), onde as semi-retas x× [0,∞) denotam o tempo

para o correspondente sıtio x ∈ Zd. Para cada sıtio x ∈ Zd define-se na semi-reta

x × [0,∞) marcas conforme um processo de Poisson com parametro µ; e para cada

par de sıtios vizinhos x e y, define-se setas perpendiculares partindo de x × [0,∞) em

direcao a y × [0,∞) conforme um processo de Poisson com parametro λ. Todos estes

11

processos de Poisson sao independentes.

No instante t = 0, seja A ⊂ Zd o conjunto inicial de sıtios infectados. Mudancas no

sistema so ocorrem de duas formas: a medida que o tempo passa, o estado de um sıtio

infectado se modifica para sadio quando encontra uma marca do processo de Poisson de

parametro µ; ou um sıtio y sadio passa ao estado infectado se receber uma seta de um

sıtio x infectado. A Figura 1.2 traz um exemplo de representacao grafica no caso mais

simples, com d = 1.

Digamos que para x′, x ∈ Zd, e t ≥ 0, um caminho ativo de x′ no instante t =

0 para o sıtio x no instante t = T e um caminho orientado no sentido crescente do

tempo na representacao grafica do processo cujos segmentos verticais nao contem pontos

nos processos de Poisson de parametro µ. Na Figura 1.2, estes caminhos ativos estao

demarcados em negrito. Os caminhos ativos representam as formas pelas quais a infeccao

pode chegar do sıtio x′ no instante t = 0 ate o sıtio x no instante, digamos, t = T . Para

qualquer conjunto A ⊂ Zd, defina ξAt como o conjunto de sıtios x para os quais existe

um caminho ativo do sıtio x′ ∈ A no tempo t = 0 para o sıtio x no tempo t = T .

Claramente, ξAt : t ≥ 0 esta distribuıdo como um proceso de contato com estado inicial

A (escolhendo um conjunto inicial aleatorio com distribuicao π, tem-se ξπt : t ≥ 0

como referido processo). De fato, podemos assumir que esta e a definicao do processo de

contato de parametros (λ, µ).

A questao de sobrevivencia da infeccao com probabilidade nao-nula esta ligada a

existencia de um “caminho ativo infinito” partindo de x ∈ A em t = 0. Isto e o que

estuda a area da probabilidade chamada de Percolacao (ver Capıtulo VI em Liggett [13]).

Dizemos que o sistema percola se e somente se existe tal caminho com probabilidade

positiva. Como a mudanca de estado de um sıtio sadio para infectado so acontece devido

a existencia de pelo menos um sıtio vizinho anteriormente infectado, para a infeccao

nao se extinguir deve haver, em qualquer que seja o instante de tempo, ao menos um

caminho ativo que parta de um sıtio infectado em t = 0 na direcao de algum sıtio x ∈ Zd.

Entretanto, o sistema percola se e somente se a probabilidade de sobrevivencia do sistema

comecando com um unico sıtio infectado e estritamente positiva, e isto e consequencia da

invariancia por translacao, isto e, a probabilidade de existir um caminho infinito partindo

12

Figura 1.2: Representacao grafica dos processos de contato para d = 1: processo com estadoinicial ξ0 = ..., 1, 1, 0, 1, 0, 0, 1, ... e configuracao ξT = ..., 1, 1, 1, 0, 1, 1, 0, .... As marcas representam os pontos onde um sıtio infectado se cura, e as setas partindo de sıtios infectadosdenotam infeccao chegando ao sıtio que a recebe. Os caminhos ativos estao representados emnegrito.

do sıtio x e igual a probabilidade de existir um caminho infinito partindo do sıtio y, pois

os processos de Poisson em cada semi-reta z × [0,∞), com z ∈ Zd, sao independentes

e estao sujeitos a mesma parametrizacao.

Uma das grandes vantagens da representacao grafica de Harris se da no tocante

a comparacao de processos atraves de acoplamento. Definindo ξAt e ξBt como dois

processos de contato de parametros (λ, µ), ambos estarao sujeitos a mesma representacao

grafica. Assumiremos que todos os processos de contato sao acoplados de acordo com a

representacao grafica, ou seja, usaremos os mesmos processos de Poisson que definem os

tempos de cura e infeccao. Dizemos assim que os processos estao acoplados conforme

a representacao grafica. Com o acoplamento, temos os processos definidos em um

mesmo espaco de probabilidade e e possıvel verificar empiricamente propriedades dos

processos de contato, como atratividade e auto-dualidade.

Lema 1.1 (Atratividade): Sejam (ξAt )t≥0 e (ξBt )t≥0 dois processos de contato acoplados

conforme a mesma representacao grafica. Se A ⊂ B, entao ξAt ⊂ ξBt para todo t ≥ 0.

Lema 1.2 (Auto-dualidade): Se, na representacao grafica, o tempo corre de maneira

inversa e todas as setas revertem o sentido, esta nova representacao grafica tem

precisamente a mesma estrutura probabilıstica da original. Em particular, temos a

13

seguinte equacao:

P (ξAt ∩B = ∅) = P (ξBt ∩ A = ∅), para todo A,B ⊂ Zd, t ≥ 0. (1.2)

1.2 Sobrevivencia da infeccao: casos supercrıtico e

subcrıtico

Uma questao pertinente no estudo dos processos de contato e o conhecimento em

relacao a sobrevivencia do referido processo. Definimos entao a variavel

τA = inft : ξAt = ∅

como o tempo de extincao da infeccao, ou seja, o tempo que a infeccao permanece

no sistema. Se esta infeccao sobrevive para sempre (ou seja, sempre havera ao menos

um sıtio infectado para todo t ≥ 0), usamos a notacao τA = ∞. Logo, a notacao

τA < ∞ denota morte da infeccao, mesmo nao definindo o exato instante da extincao

desta. Termino da infeccao remete em termino de evolucao do processo, pois a partir do

momento que a configuracao nao possui nenhum sıtio infectado, o processo permanecera

desta forma para todo instante de tempo subsequente (a infeccao e transmitida apenas

por sıtios infectados, nao existem fatores externos ao sistema que causam infeccao). A

configuracao com todos os sıtios sadios e chamada de ponto de absorcao do processo.

Matematicamente falando, se o conjunto ξAs = ∅, temos que ξAt = ∅, para todo t ≥ s.

Nota 1.1 : Seja ρ = λ/µ a razao entre as taxas de infeccao e cura do processo. Existe

um valor ρd ∈[

12d−1

; 2d

], chamado de parametro crıtico do processo de contato tal

que, se ρ > ρd, a infeccao permanece para sempre no sistema com probabilidade nao-

nula. Esta situacao e chamada de caso supercrıtico. Se ρ ≤ ρd, temos o chamado

caso subcrıtico: a infeccao se extinguira com probabilidade 1 se |A| < ∞, e quando

|A| =∞, a infeccao dentro de uma caixa finita qualquer (porem fixada) desaparecera com

alta probabilidade para t suficientemente grande. No caso supercrıtico, a probabilidade de

sobrevivencia da infeccao depende da dimensao d e do conjunto A (ver Capıtulo VI em

14

Liggett [13]). No caso particular da cardinalidade de A, denotada por |A|, ser infinita

(por exemplo, A = Zd), a probabilidade do processo sobreviver para sempre e igual a 1.

A questao da sobrevivencia da infeccao com probabilidade 1 quando o processo tem

inicialmente um numero infinito de sıtios infectados pode ser demonstrada via Lema

de Borel-Cantelli. Tal demonstracao nao faz diferenciacao entre os casos supercrıtico

e subcrıtico, isto e, a probabilidade de haver ao menos um sıtio infectado para todo

t ≥ 0 tambem e verdadeira para o segundo caso, pois a infeccao se extingue com alta

probabilidade para t suficientemente grande apenas no interior de caixas finitas, e nao

em toda a grade. Representemos o evento de interesse τA =∞ como uma interseccao

infinita de eventos decrescentes em t, ou seja,

τA =∞ =⋂t>0

τA > t.

Assim, temos que P(τA = ∞) = limt→∞

P(τA > t), e basta mostrarmos que P(τA > t) =

1, para todo t > 0. Sejam Tn∣∣∞n=1

variaveis aleatorias independentes e identicamente

distribuıdas que representem os tempos que o sıtios xn ∈ A levam para se curar pela

primeira vez. Sabemos que Tn ∼ Exp(µ). Podemos entao definir a seguinte relacao de

inclusao:

τA > t ⊃∞⋃n=1

Tn > t,

e partindo desta,

τA > t ⊃∞⋃n=1

Tn > t ⊃∞⋂n=1

⋃m≥n

Tm > t =

= lim supt→∞

Tn > t = [Tn > t infinitas vezes].

Pelo Lema de Borel-Cantelli, P(Tn > t infinitas vezes) = 1, pois∞∑n=1

P(Tn > t) = ∞, ja

que os termos da soma sao positivos e iguais para todo n, e dependem apenas de t e do

parametro µ. Assim, para qualquer t ≥ 0,

1 ≥ P(τA > t) ≥ P(Tn > t infinitas vezes) = 1,

15

ou seja, P(τA > t) = 1. Portanto, se |A| =∞, P(τA =∞) = limt→∞

P(τA > t) = 1.

1.3 O Teorema da Convergencia Completa

Uma questao inerente em Probabilidade e Processos Estocaticos e o estudo de criterios

de convergencia em distribuicao e caracterizacao das distribuicoes limites. Seja πt a

distribuicao do processo ξπt . Esta distribuicao convergira fracamente para uma medida

limite, digamos β, quando t → ∞? Dizemos que uma famılia de medidas (πt) em

(Ω,B) converge fracamente para uma outra distribuicao β, ou seja, πtf→ β, se

limt→∞

πtB ⊂ Zd : B ⊃ F = βB ⊂ Zd : B ⊃ F, (1.3)

para todo conjunto finito F ⊂ Zd, com B ∈ B. Portanto, por (1.3), convergencia fraca

no espaco de probabilidades sobre (Ω,B) e equivalente a convergencia em distribuicao de

suas projecoes finito-dimensionais. A projecao finito-dimensional ξAt (x) : x ∈ F e

a configuracao do processo apenas em um numero finito de coordenadas (os elementos

do conjunto F ). Dada uma configuracao em F , ela ocorre com certa probabilidade.

A distribuicao dos sıtios em F depende do tempo e converge em distribuicao se pi(t)

converge para todo i = 1, ..., 2|F | (existem 2|F | configuracoes possıveis em F , e pi(t) denota

a medida de probabilidade de, no instante t, o processo situar-se na i-esima configuracao),

isto e, ∃ qi tal que pi(t) → qi quando t → ∞. Entao2|F |∑i=1

qi = 1 e q = (q1, ..., q2|F |) e a

distribuicao limite. Esta distribuicao e a finito dimensional de β nos sıtios x ∈ F .

Como vimos na Secao 1.2, no caso subcrıtico, a infeccao desaparece quase certamente

(em toda grade quando |A| < ∞ e no interior de uma caixa finita fixada quando |A| =

∞). Ja no caso supercrıtico (genericamente falando), a probabilidade do processo nunca

se extinguir tem probabilidade postitiva, e nao quase certa. Para ambos os casos, a

distribuicao limite e apresentada pelo Teorema da Convergencia Completa. Seja δ∅ a

medida que assegura probabilidade 1 ao conjunto vazio (nenhum sıtio infectado);

e νρ a chamada medida de equilıbrio superior (ou medida invariante superior),

a qual depende apenas da razao ρ e da dimensao d da grade em questao.

16

Teorema 1.1 (Teorema da Convergencia Completa, Liggett [13]): Quando t → ∞, a

distribuicao do processo ξAt converge fracamente para a distribuicao limite

P(τA <∞)δ∅ + P(τA =∞)νρ.

Para simplificar a notacao, vamos denotar a medida de equilıbrio superior simplesmente

por ν, o que nao causa problema tendo em vista que os parametros estao fixados.

Como seu proprio nome relata, a medida ν e invariante, ou seja, o processo ξνt (que

possui inicialmente conjunto aleatorio de sıtios infectados distribuıdos conforme ν) e

estacionario, distribuıdo conforme ν para todo t ≥ 0. Matematicamente falando,

ξνt ∼ ν, para todo t ≥ 0. Obviamente, pela estacionariedade, podemos representar

a distribuicao do processo ξνt para qualquer que seja t ≥ 0 como ξν ∼ ν, ou seja,

desprezando t no tocante a notacao de distribuicao (o processo nao e constante ao longo

do tempo, e sim sua distribuicao!). Temos que ν e uma medida de equilıbrio superior

no sentido de que qualquer outra medida de equilıbrio do sistema e estocasticamente

dominada por ela. Dizemos que uma medida de probabilidade µ e estocasticamente

dominada por (ou estocasticamente menor que) uma medida de probabilidade µ, o

que e denotado por µst

≤ µ, se

Eµ[f(η)] ≤ Eµ[f(η)] , para qualquer funcao nao-decrescente f. (1.4)

Quando µst

≤ µ, podemos construir um par de configuracoes aleatorias (ζ, η) em um

mesmo espaco de probabilidade tal que ζ tem distribuicao µ, η tem distribuicao µ e com

probabilidade 1 temos que ζ ⊂ η. Baseado nisto, em certos momentos abusaremos da

notacao escrevendo ζst

≤ η quando o par de configuracoes aleatorias (ζ, η) esta definido

em um mesmo espaco de probabilidade e com probabilidade 1 temos que ζ ⊂ η.

Como ja citado, o Teorema 1.1 e valido para qualquer ρ ∈ (0,∞). Para processos

de contato com conjunto inicial de sıtios infectados com cardinalidade infinita, temos

P(τA =∞) = 1, portanto a convergencia da distribuicao deste processo para a medida ν

de fato acontece. Quando ρ ≤ ρd (caso subcrıtico) e |A| <∞, temos que P(τA <∞) = 1.

Logo, P(τA =∞) = 0 e a medida limite para processos situados no caso subcrıtico com

17

conjunto inicial de sıtios infectados finito e δ∅. Em contrapartida, se |A| < ∞ e o

processo sobrevive para sempre – o que so e possıvel no caso supercrıtico – a distribuicao

do processo converge fracamente para a medida de equilıbrio superior ν.

Lema 1.3 (Durrett [5]): Considere os processos ξ0t e ξZd

t , comecando com a infeccao

apenas na origem e em todos os sıtios em Zd respectivamente. A velocidade da

convergencia em distribuicao de ξZd

t para ξνt pode ser expressa em termos da probabilidade

do processo ξ0t se extinguir apos o instante t, isto e,

0 ≤ P(ξZd

t (x) = 1)− P(ξν(x) = 1) = P(t < τ 0 <∞) ≤ Ce−γt, (1.5)

com C e γ constantes positivas.

Para demonstrarmos o Lema 1.3, seja A = 0 e B = Zd em (1.2):

P(τ 0 < t) = P(ξ0t = ∅) = P(ξ

0t ∩ Zd = ∅)

= P(ξZd

t ∩ 0 = ∅) = P(ξZd

t (0) = 0).

Portanto,

1− P(ξZd

t (0) = 0) = 1− P(τ 0 < t) = P(ξZd

t (0) = 1) = P(t < τ 0 ≤ ∞). (1.6)

Usando raciocınio analogo para t→∞, temos

P(τ 0 <∞) = limt→∞

P(τ 0 < t) = limt→∞

P(ξZd

t ∩ 0 = ∅)

= P(ξν ∩ 0 = ∅) = P(ξν(0) = 0).

Logo,

1− P(ξν(0) = 0) = 1− P(τ 0 <∞)⇒

⇒ P(ξν(0) = 1) = P(τ 0 =∞). (1.7)

Como o conjunto inicial Zd contem qualquer outra configuracao inicial, podemos

18

acoplar os processos ξZd

t e ξνt de forma que, pela atratividade, ξνt ⊂ ξZd

t para todo t ≥ 0,

o que implica em P(ξν(x) = 1) ≤ P(ξZd

t (x) = 1), para todo x ∈ Zd. Dotados desta

informacao e das equacoes (1.6) e (1.7), facilmente chegamos em

0 ≤ P(ξZd

t (0) = 1)− P(ξν(0) = 1) = P(t < τ 0 <∞). (1.8)

Os processos ξZd

t e ξνt sao espacialmente invariantes, isto e, suas distribuicoes nao

mudam se um incremento inteiro for aplicado nos sıtios em Zd, ou seja, a distribuicao

de z ⊕ ξt : t ≥ 0 e independente do incremento z ∈ Zd. Finalmente, fazendo z = x,

provamos que a velocidade da convergencia em distribuicao de ξZd

t para ξνt pode ser

expressa em termos da probabilidade do processo ξ0t se extinguir apos o instante t, ou

seja,

0 ≤ P(ξZd

t (x) = 1)− P(ξν(x) = 1) = P(t < τ 0 <∞).

Alem de poder ser expressa em termos da probabilidade do processo ξ0t se extinguir

apos o instante t, a velocidade da convergengia de ξZd

t para ξνt e de ordem exponencial,

conforme descreve a ultima desigualdade em (1.5). Isto e assegurado pelo lema a seguir.

Lema 1.4 (Fiocco & van Zwet [7]): No caso supercrıtico, existem constantes positivas

C e γ tais que para todo instante t > 0 e conjunto inicial de infectados A ⊂ Zd com

cardinalidade |A|,

P(t < τA <∞) ≤ Ce−γt , (1.9)

P(τA <∞) ≤ Ce−γ|A|. (1.10)

A interpretacao da equacao em (1.9) e que a probabilidade da infeccao se extinguir

apos um instante de tempo t decai exponencialmente conforme t cresce. A equacao

(1.10) diz respeito a relacao entre desaparecimento da infeccao e a cardinalidade do

conjunto inicial de sıtios infectados. A probabilidade da infeccao se extinguir decai

exponencialmente conforme aumentamos o numero inicial de sıtios infectados. Em

particular, se |A| e infinita, entao a infeccao sobrevivera para sempre quase certamente

19

(Fiocco & van Zwet [7]), conforme provamos anteriormente, na Secao 1.2. Pela equacao

em (1.9), completamos a demonstracao do Lema 1.3. Ainda nesta discussao, o valor

esperado do processo ξνt no sıtio x e igual a probabilidade do processo ξ0t sobreviver

para sempre.

1.4 O Teorema da Forma

Outro resultado de interesse nos processos de contato e o chamado Teorema da Forma.

Antes de enuncia-lo, precisamos definir algumas quantidades inseridas no teorema. Defina

Ht =⋃s≤t

ξs ⊕ [−1/2, 1/2]d , Kt = x ∈ Zd : ξ0t (x) = ξZd

t (x) ⊕ [−1/2, 1/2]d, (1.11)

ou seja, Ht e a uniao dos cubos de hipervolume 1 centrados nos sıtios que, por algum

instante no intervalo [0, t], estiveram infectados no processo ξ0t ; e Kt descreve a uniao

dos hipercubos centrados nos sıtios que apresentam o mesmo estado no instante t dos

processos que comecam com apenas a origem infectada e com todos os sıtios infectados.

Teorema 1.2 (Teorema da Forma, Bezuidenhout & Grimmett [1], Durrett [5]): Existe

um conjunto convexo limitado U ⊂ Rd com a origem como um ponto interior tal que para

ε ∈ (0, 1) e t suficientemente grande,

(1− ε)tU ⊂ Ht ∩Kt ⊂ Ht ⊂ (1 + ε)tU (1.12)

quase certamente no conjunto τ 0 =∞.

Portanto, a ideia que este teorema passa e que, no caso da infeccao persistir para

sempre, para t suficientemente grande, Ht crescera linearmente em todas as direcoes e,

reescalonado por t−1, assumira a forma aproximada de U . Este crescimento e radial

em torno da origem da infeccao. As relacoes de continencia deste teorema tambem nos

dizem que os processos ξZd

t e ξ0t se distribuem aproximadamente conforme a medida de

equilıbrio superior ν no conjunto (1 − ε)tU para t suficientemente grande, ou seja, os

sıtios incluıdos neste conjunto ja se encontram em equilıbrio. Se acoplarmos os processos

20

ξ0t e ξZd

t temos, pela atratividade, ξ0t ⊂ ξZd

t para todo t, mas ao mesmo tempo

ξ0t ∩ (1− ε)tU = ξZd

t ∩ (1− ε)tU (1.13)

quase certamente sob a condicao de sobrevivencia do processo. Pela invariancia por

translacao, podemos estender este raciocınio para qualquer conjunto inicial de sıtios

infectados unitario, ou seja, para todo z ∈ Zd, temos

ξzt ∩ (1− ε)t(U ⊕ z) = ξZd

t ∩ (1 + ε)t(U ⊕ z)

quase certamente condicionado a sobrevivencia do processo. Nestes casos, o conjunto U

e transladado, e logo sua simetria radial se da em torno da origem da infeccao, isto e, em

torno do sıtio z.

O Teorema 1.2 assegura que, com conjunto inicial unitario de sıtios infectados, a

infeccao se espalha linearmente em torno da origem da infeccao em todas as direcoes,

assumindo a forma assintotica tU , e pouco tempo depois desta infeccao chegar em um

sıtio, sua vizinhanca sera aproximadamente distribuıda conforme ν.

21

Capıtulo 2

Estimadores de Maxima

Verossimilhanca

2.1 Definicoes preliminares

Neste capıtulo apresentaremos a estimacao via maxima verossimilhanca dos

parametros λ e µ do processo de contato. Antes de apresentar a funcao de

verossimilhanca e os estimadores provindos desta, e necessario definir algumas

quantidades. Primeiramente, sejam

nAt =∑x∈Zd

ξAt (x) , kAt =∑x∈Zd

(1− ξAt (x))∑|x−y|=1

ξAt (y)

(2.1)

respectivamente o numero de sıtios infectados e o numero de pares de sıtios vizinhos

proximos onde um esta infectado e outro sadio no instante t do processo com conjunto

inicial finito de sıtios infectados A. Defina os processos de contagem (Ut)t≥0 e (Dt)t≥0,

que denotam respectivamente o numero de saltos ascendentes e descendentes do

processo ξ0s : 0 ≤ s ≤ t. Enquanto o primeiro processo denota o numero de transicoes

observadas do estado sadio para o estado infectado do processo com estado inicial A

no intervalo [0, t], o segundo representa o numero de transicoes observadas do estado

infectado para o estado sadio do mesmo processo no mesmo intervalo. Sejam os processos

22

(Xt)t≥0 e (Yt)t≥0 definidos por

Xt = Ut − λFt , Yt = Dt − µGt, para todo t ≥ 0, (2.2)

onde λFt e µGt sao os compensadores (ou taxas integradas) de respectivamente Ut e Dt,

com Ft e Gt definidos por

Ft =

∫ t

0

k0s ds , Gt =

∫ t

0

n0s ds.

Os processos Xt e Yt sao martingais de media 0. Entende-se por martingal um

processo (Zt)t≥0 com Zt integravel e seu valor esperado condicional ao historico do

processo em [0, s] (com s ≤ t) e igual ao estado do processo no instante s. Formalmente,

temos

E[Zt|Fs] = E[Zt|Zu, 0 ≤ u ≤ s] = Zs, s ≤ t, (2.3)

onde a σ-algebra Fs = σ(Zu, 0 ≤ u ≤ s) representa toda informacao gerada pelo processo

no intervalo de tempo [0, s]. Se em (2.3) temos uma inequacao no lugar da igualdade, ha

dois casos de interesse:

Se E[Zt|Fs] ≥ Zs, para todo s < t, entao dizemos que Zt e um submartingal,

Se E[Zt|Fs] ≤ Zs, para todo s < t, entao dizemos que Zt e um supermartingal.

Como as taxas integradas sao quantidades nao-negativas, os processos de contagem Ut

e Dt sao submartingais. Fica claro entao que Ut = Xt + λFt e Dt = Yt + µGt sao

respectivamente as decomposicoes de Doob-Meyer de Ut eDt (ver Varadhan [16], Teorema

5.9).

Suponha que observamos o processo ξ0s : 0 ≤ s ≤ t, ou seja, o processo que

inicia com apenas a origem infectada. Como uma colecao enumeravel de processos de

Poisson independentes nao contem um par de processos tendo um ponto em comum,

pela construcao do processo de contato nao ocorre mais de uma transicao em um

mesmo instante de tempo. Suponha tambem que ocorrem exatamente N transicoes

23

(sadio tornando-se infectado ou infectado tornando-se sadio) neste perıodo, nos instantes

T1 < · · · < TN , e que no instante Ti, a mudanca de estado ocorre no sıtio xi, i = 1, ..., N .

Observe que N = Ut + Dt, pois a cada Ti, ocorre um salto de tamanho 1 no numero

de sıtios infectados na grade, seja este salto ascendente ou descendente. E conveniente

adotarmos T0 = 0, TN+1 = t e ξi = ξ0Ti

como a configuracao do processo no instante Ti.

Dada a configuracao ξi−1 no instante Ti−1, definimos a taxa de mudanca no sıtio x,

denotada por ri(x) e dada por

ri(x) =

λ∑|x−y|=1

ξi−1(y) , se ξi−1(x) = 0,

µ , se ξi−1(x) = 1.

(2.4)

A parcela∑|x−y|=1

ξi−1(y) em (2.4) refere-se ao numero de vizinhos do sıtio x que estao

infectados no intervalo [Ti−1, Ti), isto e, λ∑|x−y|=1

ξi−1(y) e a taxa com que o sıtio x no

estado sadio durante o intervalo [Ti−1, Ti) torna-se infectado. Da mesma forma, µ e a

taxa com que um sıtio x no estado infectado em [Ti−1, Ti) torna-se sadio. O somatorio

das taxas de mudanca de todos os sıtios x ∈ Zd no instante Ti resulta na taxa total de

mudanca no instante Ti, que denotaremos por

Ri =∑x∈Zd

ri(x).

Note que Ri e finito, pois o conjunto inicial de sıtios infectados e finito. Vamos obter

uma expressao mais apropriada para Ri:

Ri =∑x∈Zd

ri(x) =∑x∈Zd

[Iξi−1(x)=0λ

∑|x−y|=1

ξi−1(y) + Iξi−1(x)=1µ

]

= λ∑x∈Zd

[Iξi−1(x)=0

∑|x−y|=1

ξi−1(y)

]+∑x∈Zd

Iξi−1(x)=1µ

= λ∑x∈Zd

[(1− Iξi−1(x)=1)

∑|x−y|=1

ξi−1(y)

]+ µ

∑x∈Zd

Iξi−1(x)=1

= λ∑x∈Zd

[(1− ξi−1(x))

∑|x−y|=1

ξi−1(y)

]+ µ

∑x∈Zd

ξi−1(x) = λk0Ti−1

+ µn0Ti−1

. (2.5)

24

2.2 Funcao de Verossimilhanca

Atraves das definicoes apresentadas na secao anterior, podemos construir a funcao

de verossimilhanca. A verossimilhanca do processo ξ0s observado em [0, t] e construıda

condicional as N transicoes que o processo sofre neste intervalo de tempo, e remete as

chances relativas do processo atingir determinada configuracao. Temos que (Ti − Ti−1) e

uma variavel aleatoria que denota o intervalo de tempo que o processo permanece sem

modificacoes dado que ja sofreu i−1 transicoes. Este tempo aleatorio e exponencialmente

distribuıdo com parametro Ri, a taxa total de mudanca do sistema apos a (i− 1)-esima

transicao. Como ocorrem exatamente N transicoes e os processos de Poisson que definem

infeccao ou cura sao independentes, a verossimilhanca e escrita da seguinte forma:

L(λ, µ) =

[N∏i=1

Ri exp−Ri[Ti − Ti−1]︸︷︷︸(∗)

ri(xi)

Ri︸︷︷︸(∗∗)

]exp−RN+1[t− TN ]︸︷︷︸

(∗∗∗)

. (2.6)

As expressoes (∗) e (∗∗) em (2.6) representam a densidade dos instantes de salto

condicional ao sıtio que muda de estado no processo, ou seja, (Ti − Ti−1) ∼ Exp(Ri)

dado que no instante Ti ocorre mudanca de estado no sıtio xi. A expressao (∗ ∗ ∗) e

referente a densidade no intervalo [TN , t], onde nao ocorre transicao e, portanto, nao

ha condicionamento relativo a mudanca de configuracao do processo. A funcao de log-

verossimilhanca e dada por

logL(λ, µ) =N∑i=1

log

[Ri exp−Ri[Ti − Ti−1]ri(xi)

Ri

]+ log(exp−RN+1[t− TN ])

= −N∑i=1

Ri[Ti − Ti−1] +N∑i=1

log ri(xi)−RN+1[t− TN ]

= −N+1∑i=1

Ri[Ti − Ti−1] +N∑i=1

log ri(xi). (2.7)

Em [0, t], o processo realiza Ut mudancas de sadio para infectado e Dt mudancas de

infectado para sadio. Logo, o segundo termo de (2.7) pode ser escrito como

25

N∑i=1

log ri(xi) =N∑i=1

log[Iξi−1(xi)=0λ

∑|xi−y|=1

ξi−1(y) + Iξi−1(xi)=1µ]

=∑

i:ξi−1(xi)=0

log

λ ∑|xi−y|=1

ξi−1(y)

+∑

i: ξi−1(xi)=1

log µ

=∑

i:ξi−1(xi)=0

log λ+∑

i:ξi−1(xi)=1

log µ+∑

i:ξi−1(xi)=0

log∑

|xi−y|=1

ξi−1(y)

= Ut log λ+Dt log µ+ h(ξ0), (2.8)

onde h(ξ0) depende do processo ξ0s : 0 ≤ s ≤ t, mas nao depende dos parametros λ e

µ. Aqui, Ut e Dt sao os processos de contagem definidos na Secao 2.1 (saltos ascendentes

e descendentes, respectivamente), que tambem podem ser expressos da seguinte forma:

Ut = #1 ≤ i ≤ N : ξi−1(xi) = 0 = #1 ≤ i ≤ N : ξi(xi) = 1,

Dt = #1 ≤ i ≤ N : ξi−1(xi) = 1 = #1 ≤ i ≤ N : ξi(xi) = 0.

Como TN+1 = t e a configuracao do processo se modifica apenas em T1 < · · · < TN , ou

seja, n0s e k

0s sao constantes para s ∈ [Ti−1, Ti), i = 1, ..., N + 1, por (2.5), o primeiro

termo de (2.7) pode ser escrito como

N+1∑i=1

Ri[Ti − Ti−1] =N+1∑i=1

[λk0T i−1 + µn

0T i−1][Ti − Ti−1]

= λ

N+1∑i=1

k0T i−1(Ti − Ti−1) + µ

N+1∑i=1

n0T i−1(Ti − Ti−1)

= λ

∫ t

0

k0s ds+ µ

∫ t

0

n0s ds = λFt + µGt. (2.9)

Finalmente, aplicando (2.8) e (2.9) em (2.7), temos a log-verossimilhanca dada da

forma

logL(λ, µ) = −λFt − µGt + Ut log λ+Dt log µ+ h(ξ0). (2.10)

26

2.3 Estimadores e suas propriedades

Derivando a expressao para log-verossimilhanca obtida em (2.10) em relacao ao

parametro que se deseja estimar (λ ou µ) e igualando a zero, encontramos os estimadores

de verossimilhanca:

d

dλlogL(λ, µ) = −Ft +

Utλ

= 0 ⇒ λt =UtFt, (2.11)

d

dµlogL(λ, µ) = −Gt +

Dt

µ= 0 ⇒ µt =

Dt

Gt

. (2.12)

Note que, por (2.2), como E[Xt] = E[Yt] = 0 para todo t, temos

E[Ut] = E[λFt] ⇒ λ =E[Ut]

E[Ft], (2.13)

E[Dt] = E[µGt] ⇒ µ =E[Dt]

E[Gt], (2.14)

e como os processos de contagem Ut e Dt e as somas Ft e Gt sao processos crescentes, uma

vez que a razao entre os valores esperados em (2.13) e (2.14) convirjam respectivamente

para λ e µ, estes estimadores possuem um apelo intuitivo (ver Lema 2.1).

O estimador da razao entre as taxas de infeccao e cura e a razao entre os estimadores

das referidas taxas, ou seja,

ρt =λtµt

=UtGt

DtFt.

Apos devida normalizacao, os estimadores de maxima verossimilhanca de infeccao e

cura possuem distribuicao assintotica normal bivariada, e o estimador ρt tem distribuicao

assintotica normal, conforme enuncia o teorema a seguir.

Teorema 2.1 (Fiocco & van Zwet [7]): Seja U o conjunto convexo limitado descrito no

Teorema 1.2 e m(U) sua medida de Lebesgue em Rd. Dado que τ 0 =∞, temos que,

quando t → ∞, a distribuicao conjunta de t(d+1)/2(λt − λ) e t(d+1)/2(µt − µ) converge

em distribuicao para N(0,Σ), onde a matriz de covariancia Σ = (σij) i=1,2j=1,2

tem entradas

27

σ1,2 = σ2,1 = 0 e

σ1,1 =(d+ 1)λ2

µm(U)P(τ 0 =∞), σ2,2 =

(d+ 1)µ

m(U)P(τ 0 =∞). (2.15)

Sob a condicao de sobrevivencia do processo, a distribuicao limite de t(d+1)/2(ρt − ρ) e

N(0, σ2ρ), onde

σ2ρ =

2(d+ 1)λ2

µ3m(U)P(τ 0 =∞).

Demonstracao: Precisamos demonstrar que a distribuicao limite de t(d+1)/2(λt − λ) e

N(0, σ1,1). O caminho para demonstrar que a distribuicao limite de t(d+1)/2(µt − µ) e

N(0, σ2,2) e analogo e nao sera feito aqui. Pela dinamica do processo de contato, os

processos Ut e Dt sao independentes, e condicional a τ 0 = ∞, os martingais Xt e

Yt sao assintoticamente nao correlacionados, pois sao gerados a partir de processos de

Poisson independentes. Portanto, λt e µt sao independentes, e logo σ1,2 = σ2,1 = 0.

Entao, provar a distribuicao assintotica de t(d+1)/2(λt − λ) e suficiente para provar o

Teorema 2.1. Primeiramente, considere as notacoes P∗, E∗ e Var∗ como respectivamante

a probabilidade condicional, o valor esperado e a variancia dado τ 0 = ∞. Para

C ⊂ Zd, defina

nπt (C) =∑x∈C

ξπt (x) , kπt (C) =∑x∈C

(1− ξπt (x))∑|x−y|=1

ξπt (y)

, (2.16)

ou seja, nAt e kAt definidos em (2.1) sao iguais a respectivamente nπt (Zd) e kπt (Zd) com

distribuicao inicial π concentrada em A. Seja U o conjunto definido pelo Teorema 1.2.

Por (1.12) e (1.13), temos que, para ε arbitrariamente pequeno,

lim supt→∞

t−d−1

∣∣∣∣Ft − ∫ t

0

kZd

s (sU)ds

∣∣∣∣ = 0 (2.17)

28

quase certamente sob P∗, pois

t−d−1

∣∣∣∣Ft − ∫ t

0

kZd

s (sU)ds

∣∣∣∣ = t−d−1

∣∣∣∣∫ t

0

kZd

s (Zd \ sU)ds

∣∣∣∣= t−d−1

∣∣∣∣∫ t

0

kZd

s ((1 + ε)sU \ sU)ds

∣∣∣∣ ≤ Cε

para todo t suficientemente grande sob P∗ quase certamente, com C constante positiva e a

segunda igualdade valida devido ao Teorema 1.2. Logo, conforme t aumenta, a expressao

no lim sup tende a zero. Alem disso, novamente pelo Teorema 1.2 e pelo Teorema 1.1,

quando t→∞,

t−d−1

∣∣∣∣∫ t

0

kZd

s (sU)ds−∫ t

0

E[kZd

s (sU)]ds

∣∣∣∣ P−→ 0. (2.18)

Combinando (2.17) e (2.18), chega-se na equacao abaixo:

t−d−1

∣∣∣∣Ft − ∫ t

0

E[kZd

s (sU)]ds

∣∣∣∣ P∗−→ 0 quando t→∞. (2.19)

De posse de (2.19), nosso foco volta-se para obter E[kν(sU)], pois pelo Teorema 1.2,

as configuracoes dos processos ξZd

s e ξνs sao iguais em media no interior de sU para

s suficientemente grade. Quando s → ∞, o numero de sıtios em sU e de ordem de

m(U)sd, e pela invariancia por translacoes do processo ξνs ,

E[kν(sU)] =∑x∈sU

E

∑|x−y|=1

(1− ξν(x))ξν(y)

=∑x∈sU

E

∑|y|=1

(1− ξν(0))ξν(y)

=

∑x∈sU

E[kν(0)] ∼= m(U)sdE[kν(0)].

Para o processo ξνs , temos que sua taxa media de crescimento e λE[kν(0)], que e igual

a sua taxa media de decrescimento µE[nν(0)] = µE[ξν(0)] para todo s > 0, devido a

ν ser uma medida de equilıbrio. Portanto, por (1.8),

E[kν(sU)] ∼=µm(U)P(τ 0 =∞)sd

λ. (2.20)

29

Aplicando (2.20) em (2.19), chegamos a

[t−(d+1)Ft −

µm(U)P(τ 0 =∞)

(d+ 1)λ

]P∗−→ 0 quando t→∞. (2.21)

Pelas definicoes de Xt, Ft e λt, temos (λt− λ) = Xt/Ft, e dotados desta informacao e da

convergencia de Ft expressa na equacao (2.21),

t(d+1)/2(λt − λ)D∗∼ (d+ 1)λ

µm(U)P(τ 0 =∞)t−(d+1)/2Xt,

ondeD∗∼ denota equivalencia assintotica em distribuicao sob P∗. Agora, precisamos

mostrar que t−(d+1)/2Xt e assintoticamente normal sob a distribuicao condicional P∗.

Isto e feito atraves do uso de uma condicao tipo Lindeberg, tecnicas de martingais e

estimativas de momentos. Sejam 0 = s0 < s1 < s2 < ... os instantes onde ocorrem

transicoes no processo ξ0s : 0 ≤ s ≤ t e seja Fsia σ-algebra gerada pelo processo ate o

instante aleatorio si, i ∈ Z+. Fiocco & van Zwet [7] apresentam os seguintes resultados:

n−1∑i=0

E∗[s−(d+1)/2n (Xsi+1

−Xsi)|Fsi

]≈ oP∗

(s−(d+1)/2n

) P∗−→ 0 quando n→∞, (2.22)

n−1∑i=0

Var∗[s−(d+1)/2n (Xsi+1

−Xsi)|Fsi

] P∗−→ µm(U)E[ξν(0)]d+ 1

. (2.23)

Como E[ξν(0)] = P(τ 0 = ∞) e sn → ∞ quando n → ∞, aplicando o valor esperado

em (2.22) e (2.23), o uso de tecnicas de martingais e estimativa de momentos obtemos

que

E∗[t−(d+1)/2Xt

] t→∞−→ 0, (2.24)

Var∗[t−(d+1)/2Xt

] t→∞−→ µm(U)P(τ 0 =∞)

d+ 1. (2.25)

Resta provar que a forma desta distribuicao assintotica e normal quando t→∞. Seja a

equacao abaixo, descrita em Fiocco & vam Zwet [7]: Para todo ε > 0,

n−1∑i=0

s−(d+1)n E∗

[(Xsi+1

−Xsi)2I|Xsi+1−Xsi |≥εs(d+1)/2

n

|Fsi

]P∗−→ 0 (2.26)

30

quando n→∞. Atraves da equacao (2.26), e possıvel mostrar a normalidade assintotica

gracas ao uso de uma condicao tipo Lindeberg, e assim por (2.24) e (2.25) temos que a

distribuicao assintotica de t(d+1)/2(λt − λ) e N(0, σ1,1).

Lema 2.1 (Fiocco & van Zwet [7]): Os estimadores de maxima verossimilhanca sao

consistentes, assintoticamente nao-viciados e eficientes.

Demonstracao: A consistencia e consequencia do Teorema 2.1. De fato, pelo Teorema

2.1 e o Teorema de Slutsky (ver Barry James [11], Teorema 6.4),

λt − λ = t−(d+1)/2t(d+1)/2(λt − λ)D−→ 0 quando t→∞,

e como λt − λ converge para uma constante, convergencia em distribuicao implica em

convergencia em probabilidade, logo λtP−→ λ, e assim a consistencia de λt esta provada.

A demonstracao para o estimador de maxima verossimilhanca µt de µ e analoga. O

resultado da consistencia tambem e valido para o estimador ρt de ρ.

Para demonstrarmos que os estimadores de maxima verossimilhanca sao

assintoticamente nao-viciados, utilizamos uma consequencia do Teorema Central do

Limite, pela qual os valores esperados convergem para o valor esperado da distribuicao

normal limite, dada pelo Teorema 2.1. Entao, limt→∞

E[t(d+1)/2(λt − λ)] = 0. Logo, para

t→∞,

limt→∞

E[λt]− λ = limt→∞

t−(d+1)/2E[t(d+1)/2(λt − λ)] = 0.

Portanto, λt e um estimador assintoticamente nao viciado de λ. O processo e analogo

para demonstrar que µt e um estimador assintoticamente nao-viciado de µ. Assim como

a consistencia, esta caracterıstica tambem vale para o estimador da razao das taxas de

infeccao e cura.

A demostracao da eficiencia assintotica dos estimadores de maxima verossimilhanca

e mais complexa, pois envolve resultados mais sofisticados em Fiocco & van Zwet [7].

Assim como na demonstracao do Teorema 2.1, considere as notacoes P∗, E∗ e Var∗.

31

Primeiramente, devemos modificar ligeiramente a expressao da log-verossimilhanca em

(2.7) para obter a verossimilhanca do modelo condicionado ao processo sobreviver para

sempre, adicionando o logaritmo da probabilidade do evento τ 0 = ∞ condicionado

a realizacao do processo ate o instante t. Mas, sob a condicao de sobrevivencia do

processo, o numero de sıtios infectados no instante t e de ordem td, portanto pela equacao

(1.10), a probabilidade do processo morrer apos t e de ordem exp−γtd. Assim, esse

termo e excessivamente pequeno e pode ser seguramente desprezado para instantes de

tempo relativamente grandes. De (2.11) e (2.12), obtemos as derivadas segundas da

verossimilhanca original, e logo

−∂2L(λ, µ)

∂λ2=Utλ2

, −∂2L(λ, µ)

∂µ2=Dt

µ2, −∂

2L(λ, µ)

∂λ∂µ= −∂

2L(λ, µ)

∂µ∂λ= 0.

Para a verossimilhanca condicional L∗(λ, µ) sob P∗, temos

−∂2L∗(λ, µ)

∂λ2=Utλ2

+ oP∗(1) , −∂2L∗(λ, µ)

∂µ2=Dt

µ2+ oP∗(1), (2.27)

−∂2L∗(λ, µ)

∂λ∂µ= −∂

2L∗(λ, µ)

∂µ∂λ= oP∗(1),

onde oP∗(1) e um termo de ordem 1 que tende a 0 quando t→∞ sob P∗ quase certamente.

A eficiencia assintotica do estimador λt e provada se o erro quadratico medio converge

para o inverso da informacao esperada de Fisher I∗(λ) sob P∗, com o mesmo raciocınio

aplicado para o estimador µt. Pelas expressoes em (2.15) e por λt e µt serem estimadores

assintoticamente nao-viciados de respectivamente λ e µ,

σ1,1 ≈ Var∗[t(d+1)/2(λt − λ)

]≈ t(d+1)E∗[(λt − λ)2], (2.28)

σ2,2 ≈ Var∗[t(d+1)/2(µt − µ)

]≈ t(d+1)E∗[(µt − µ)2]. (2.29)

Como o valor esperado dos martingais Xt e Yt e igual a 0, temos, por (2.2) e (2.27), que

I∗(λ, t) = E∗[−∂

2L∗(λ, µ)

∂λ2

]= E∗

[Utλ2

+ oP∗(1)

]=

E∗[Ft]λ

+ oP∗(1),

I∗(µ, t) = E∗[−∂

2L∗(λ, µ)

∂µ2

]= E∗

[Dt

µ2+ oP∗(1)

]=

E∗[Gt]

µ+ oP∗(1).

32

Sob a condicao de sobrevivencia do processo, temos a equacao (2.21) e o analogo para

Gt, que e [t−(d+1)Gt −

m(U)P(τ 0 =∞)

(d+ 1)

]P∗−→ 0 quando t→∞. (2.30)

Por (2.21) e (2.30), quando t→∞ temos que

I∗(λ, t) ≈ 1

λ× µm(U)P(τ 0 =∞)

(d+ 1)λtd+1 ⇒ lim

t→∞

I∗(λ, t)

td+1=

1

σ1,1

, (2.31)

I∗(µ, t) ≈ 1

µ× m(U)P(τ 0 =∞)

d+ 1td+1 ⇒ lim

t→∞

I∗(µ, t)

td+1=

1

σ2,2

. (2.32)

Logo, pelas equacoes (2.28), (2.29), (2.31) e (2.32),

limt→∞

td+1[I∗(λ, t)]−1 = limt→∞

td+1E[(λt − λ)2],

limt→∞

td+1[I∗(µ, t)]−1 = limt→∞

td+1E[(µt − µ)2],

e portanto os erros medios quadraticos de λt e µt apropriadamente escalonados convergem

para o inverso das respectivas medidas esperadas de informacao de Fisher, e assim

provamos que os estimadores de maxima verossimilhanca de λ e µ sao assintoticamente

eficientes, terminando a demonstracao do Lema 2.1.

A primeira vista, os resultados no Teorema 2.1 parecem nao ser de muita utilidade

pratica, pois estao sob a condicao do processo sobreviver para sempre, e observamos

tal processo apenas no intervalo [0, t]. Todavia, o Lema 1.4 garante que, para tempos

relativamente grandes, a probabilidade do processo vir a se extinguir dado que ele

sobreviveu e muito pequena – decresce em ordem exponencial conforme t aumenta.

Portanto, para tempos suficientemente grandes, a condicao τ 0 > t pode substituir a

condicao do processo sobreviver para sempre.

Um ponto a ressaltar e a presenca da medida de Lebesgue do conjunto U , m(U), nas

variancias das distribuicoes assintoticas de t(d+1)/2(λt−λ), t(d+1)/2(µt−µ) e t(d+1)/2(ρt−ρ),

cujo valor e desconhecido. O Teorema 1.2 e um resultado de existencia e nao fornece

nem a forma do conjunto U nem m(U), que dependem dos parametros, que tambem sao

desconhecidos.

33

Capıtulo 3

Estimacao via um metodo de

contagem

3.1 Metodologia de estimacao

Este metodo de estimacao e descrito no artigo de Fiocco & van Zwet [9]. A ideia deste

estimador volta-se para a situacao de equilıbrio do processo a partir de um determinado

instante de tempo relativamente grande. Do ponto de vista estatıstico, o problema de

interesse e a estimacao do parametro de infeccao λ quando apenas a configuracao presente

do processo e conhecida. O parametro de cura, neste caso, e suposto conhecido e igual

a 1, portanto nao sendo de interesse no tocante a estimacao. Isto nao e uma grande

perda, pois com uma renormalizacao temporal apropriada pode-se transformar qualquer

processo de contato em outro processo de contato com µ = 1, ou seja, reescalonando

o tempo por uma constante c > 0, se X(t) e um processo de Poisson de parametro ψ,

entao Y (t) = X(ct) e um processo de Poisson de parametro cψ. Como µ, apesar de

desconhecido, e fixo, temos c = 1µ

e transformamos o processo de contato de parametros,

digamos, (λ, µ) em um processo de contato de parametros(λµ, 1)

.

Vamos supor o conjunto inicial de sıtios infectados A = 0, ou seja, apenas a origem

infectada em t = 0. Como mencionado, o estimador para λ e baseado na configuracao

do processo apenas no instante t, nao nos interessando conhecer a historia inteira ξ0s :

0 ≤ s ≤ t, mas apenas a configuracao que temos a nossa disposicao no instante t (e

34

como se observassemos a infeccao apenas hoje, sem acompanhar o desenvolvimento da

mesma, sabendo apenas que ela teve inıcio com apenas um sıtio infectado na origem). A

distribuicao exata do estimador, digamos, λt – condicional a sobrevivencia da infeccao –

e intratavel, mas se mostrarmos que este e um estimador consistente de λ, td/2(λt − λ)

deve ter uma distribuicao limite tratavel do ponto de vista analıtico. Portanto, vamos

restringir a atencao para t suficientemente grande.

Nao existe metodo padrao para obter estimadores em casos como este. Portanto,

como ja fora comentado, usaremos a suposicao de equilıbrio do processo ξ0t para t

suficientemente grande dado que o processo sobrevive para sempre, explicada pelos

Teoremas 1.1 e 1.2. Seja um sıtio x ∈ Zd e t ≥ 0. No instante de tempo t, tal sıtio

muda do estado infectado para o estado sadio a taxa ξ0t (x), ao passo que um sıtio sadio

muda para o estado infectado a taxa λ(1− ξ0t (x))∑|x−y|=1

ξ0t (y). O Teorema 1.2 sugere

que o processo ξ0t se comporta como ξνt no interior do conjunto (1− ε)tU , e no segundo

processo a taxa de crescimento (sıtio sadio tornando-se infectado) e igual em media a

taxa de decrescimento (sıtio infectado tornando-se sadio), ou seja, para todo x ∈ Zd e

t ≥ 0,

E[ξν(x)] = E[λ(1− ξν(x))

∑|x−y|=1

ξν(y)

].

Para um conjunto arbitrario de sıtios E ⊂ Zd, defina as quantidades

nπt (E) =∑x∈E

ξπt (x) , kπt (E) =∑x∈E

(1− ξπt (x))∑|x−y|=1

ξπt (y)

(3.1)

como respectivamente o numero de sıtios infectados pertencentes ao conjunto E e o

numero de pares de sıtios vizinhos proximos com um infectado e o outro sadio, sendo o

sadio pertencente ao conjunto E, no instante t do processo com conjunto inicial de sıtios

infectados distribuıdos conforme π, em raciocınio analogo a (2.16). Temos entao que, no

conjunto E, nπt (E) define a taxa de decrescimento do processo ξπt no instante t e λkπt (E)

define a taxa de crescimento do mesmo processo em t. Como no processo ξνt as taxas

35

referidas sao iguais em media, temos, para todo E ⊂ Zd e t ≥ 0,

E[nν(E)] = E[λkν(E)]⇒ λ =E[nν(E)]

E[kν(E)]. (3.2)

Considere uma famılia de conjuntos (Dt)t>0 em Zd tal que Dt ⊂ (1 − ε)tU ∩ Zd, para

todo t > 0. Como em (1 − ε)tU o processo ξ0t atinge distribuicao segundo a medida

de equilıbrio superior quando t → ∞ – condicional a sobrevivencia do processo –, as

grandezas n0t (Dt) e λk

0t (Dt) sao assintoticamente iguais em media. Portanto, sob

uma escolha adequada de (Dt)t>0, n0t (Dt)/k

0t (Dt) e, a primeira vista, um estimador

razoavel de λ.

3.2 O uso do envoltorio convexo

Fixado ε ∈ (0, 1), um problema em definir o estimador como a razao citada no final

da secao anterior e a condicao de que a mascara Dt e, por definicao, um subconjunto de

(1−ε)tU , dependendo assim do conjunto U , que e desconhecido e depende do parametro

λ. Sobre tal conjunto, sabemos (pelo Teorema 1.2) que este contem a origem como

um ponto interior, e limitado e tambem convexo. O fato de U nao ser conhecido e

contornado com procedimentos que garantem que Dt estara contido em (1 − ε)tU com

grande probabilidade. Portanto, seja C(ξ0t ) o envoltorio convexo de ξ0t , ou seja,

C(ξ0t ) e o menor conjunto convexo em Rd que contem todos os sıtios infectados no

instante t. Temos que, para todo ε′ ∈ (0, 1), existe δ ∈(

ε′

1+ε′, 1)

tal que (1− δ)C(ξ0t ) ⊂

(1− ε)tU para ε ∈ (0, 1), pois

(1− δ)C(ξ0t ) ⊂ (1− δ)C(Ht) ⊂ (1− δ)(1 + ε′)tU = (1− ε)tU. (3.3)

Note que, como (1− δ)C(ξ0t ) ⊂ (1− ε)tU , temos (1− δ)C(ξ0t ) ∩ Zd ⊂ (1− ε)tU ∩ Zd.

Logo, (1 − δ)C(ξ0t ) ∩ Zd pertence a famılia de conjuntos (Dt)t>0 em Zd tal que Dt ⊂

(1− ε)tU ∩Zd, para todo t > 0. Vamos justificar (3.3), e para isto denotemos a mascara

Ct = (1− δ)C(ξ0t ) ∩ Zd. (3.4)

36

Como ξ0t denota o conjunto de sıtios infectados em t, temos que ξ

0t ⊂ Ht, pois Ht

contem todos os hipercubos de hipervolume 1 em Zd centrados em sıtios que estiveram

infectados em algum instante no intervalo [0, t]. Logo, C(ξ0t ) ⊂ C(Ht) e, portanto,

(1 − δ)C(ξ0t ) ⊂ (1 − δ)C(Ht), provando a primeira inclusao em (3.3). Para provarmos

a segunda inclusao em (3.3), precisamos mostrar que C(Ht) ⊂ (1 + ε′)tU . O Teorema

1.2 assegura que para todo ε′ ∈ (0, 1), o conjunto Ht esta contido em (1 + ε′)tU quase

certamente para t suficientemente grande, e como U e um conjunto limitado e convexo,

o envoltorio convexo de tU e o proprio conjunto tU . Logo, C(Ht) ⊂ (1 + ε′)tU para t

suficientemente grande. O intervalo de variacao de δ como funcao de ε′ se da devido a

(1− ε) = (1− δ)(1 + ε′). Isto implica que ε = δ(1 + ε′)− ε′, e como ε ∈ (0, 1),

δ(1 + ε′)− ε′ > 0 ⇒ δ >ε′

1 + ε′,

δ(1 + ε′)− ε′ < 1 ⇒ δ <1 + ε′

1 + ε′= 1.

Logo, δ ∈ ( ε′

1+ε′, 1).

A mascara Ct depende exclusivamente da configuracao do processo no instante t e da

constante δ. O termo (1− δ) serve para encolher o envoltorio convexo, fazendo com que

a mascara contenha apenas os sıtios nos quais o processo ja esta em equilıbrio. Esta e

a saıda para a obtencao do estimador sem a dependencia direta do conjunto U , o qual

depende de λ. Assim, o estimador via metodo de contagem do parametro λ no instante

t e dado por λ0t (Ct) = n

0t (Ct)/k

0t (Ct).

3.3 Comportamento assintotico

Uma vez definido o estimador na secao anterior, o interesse volta-se para o estudo de

seu comportamento assintotico.

Teorema 3.1 (Fiocco & van Zwet [9]): Condicionado ao processo ξ0t sobreviver para

sempre, o estimador λ0t (Ct) converge em probabilidade para λ quando t → ∞. Alem

disso, a distribuicao condicional de |Ct|d/2(λ0t (Ct) − λ) dado τ 0 = ∞ converge

fracamente para a distribuicao N(0, σ2), onde σ2 pode ser expressa em termos da medida

37

invariante ν por

σ2 = λ2

∑x∈Zd

cov[ξν0 (0), ξν0 (x)]

(E[ξν0 (0)])2+

∑x∈Zd

cov[kν0(0), kν0(x)]

(E[kν0(0)])2−

2×∑x∈Zd

cov[kν0(0), ξν0 (x)]

E[ξν0 (0)]E[kν0(0)]

,(3.5)

onde kν0(x) = λ(1− ξν0 (x))∑|x−y|=1

ξν0 (y).

A forma de expressar a variancia acima esta em Fiocco & van Zwet [8]. De

momento, voltemos a atencao para alguns comentarios importantes provenientes do

teorema enunciado.

A primeira preocupacao consiste na condicao da infeccao nunca se extinguir, que nao

pode ser verificada, pois observamos o processo apenas no instante t, desconhecendo

seu comportamento futuro. Porem, nosso interesse reside no comportamento assintotico

do estimador quando t → ∞, e sob a mesma condicao ja explicada no comportamento

assintotico dos estimadores de maxima verossimilhanca e por argumentos semelhantes,

podemos usar o Lema 1.4 para substituir o condicionamento com respeito a τ 0 =∞

por τ 0 > t.

Outro problema reside na construcao da mascara aleatoria Ct, que envolve

encolhimento do envoltorio convexo de ξ0t pelo fator (1− δ). A tecnica de encolhimento

pelo fator (1− δ) pode nos levar a uma estimativa errada se a origem da infeccao estiver

longe do centro do envoltorio convexo do conjunto de sıtios infectados em t (tambem ha

casos nos quais nao se sabe onde a infeccao comecou, isto e, em qual ponto a infeccao

se deu por iniciada). A saıda e substituir tal encolhimento por uma tecnica chamada

peeling. Como o proprio nome remete, isto e feito tomando o envoltorio convexo de ξ0t

e “descascando-o”, removendo os elementos de ξ0t do contorno L1 de C(ξ0t ), onde o

contorno L1 de um conjunto convexo S ∈ Rd e dado pelas uniao das bolas L1 centradas

nos pontos da fronteira de S, ou seja,⋃c∈∂S

B(c, 1), onde B(a, r) = z : |z − a| < r e ∂S

denota a fronteira de S. Este procedimento e repetido k vezes ate uma fracao positiva

de pontos de ξ0t ser removida, com os sıtios restantes formando uma nova mascara. O

Teorema 3.1 continua valendo da mesma forma que antes para a nova mascara obtida.

38

Exemplo 3.1 : Seja a observacao do processo ξAt : t ≥ 0 em um determinado instante

s. Os sıtios infectados em t = s encontram-se preenchidos na cor preta na Figura 3.1.

O envoltorio convexo C(ξAt ) no instante t = s, isto e, C(ξAs ), e dado pelo conjunto

delimitado pela linha preenchida, e o contorno L1 e delimitado estritamente entre as

linhas pontilhadas. A nova mascara e dada pelo subconjunto de sıtios de C(ξAs ) que nao

pertencem ao contorno L1 do referido envoltorio convexo.

Figura 3.1: Exemplo de contorno L1 do envoltorio convexo da configuracao de sıtios infectadosem um determinado instante de tempo.

A remocao de uma fracao positiva de pontos de ξ0t proximos a regiao de fronteira do

conjunto C(ξ0t ) (seja pelo uso do fator (1− δ) ou pelo peeling) e um passo fundamental

no processo de estimacao. Nos sıtios nos quais a infeccao chegou recentemente, o

processo ainda nao atingiu o equilıbrio, ponto-chave da metodologia deste estimador. A

consistencia citada no Teorema 3.1 e mantida mesmo sem remocao de sıtios em C(ξ0t ),

porem a distribuicao (assintotica) normal nao pode ser provada. E razoavel pensar que

a caracterıstica da consistencia e mantida, pois a regiao de infeccao cresce linearmente

conforme t assumindo aproxidamente a forma tU , e a proporcao de sıtios distribuıdos

conforme a medida de equilıbrio ν torna-se maior em relacao a proporcao de sıtios

39

proximos a regiao de fronteira. Portanto a influencia destes no processo de estimacao

diminui conforme t aumenta. Simulacoes computacionais mostram empiricamente que

o estimador n0t (Zd)/k

0t (Zd) subestima λ, e isto se deve a presenca de “bracos” da

regiao de sıtios infectados, que claramente implicam maior numero de pares de vizinhos

infectado-sadio. Todavia, se por um lado a remocao citada reduz o vıcio do estimador,

por outro lado aumenta a variancia do mesmo. Logo, precisamos estabelecer uma

fracao positiva de pontos removidos que nao prejudique o estimador no tocante a sua

variancia. Remover cerca de 30 % dos pontos de ξ0t produz estimativas convincentes

de λ, como testado pelas nossas simulacoes (ver Tabelas 3.1 e 3.2). Temos tambem que

uma proporcao menor de pontos precisa ser descartada para valores altos de λ e/ou t.

Para valores de λ proximos do valor crıtico, a estimacao e mais delicada e sujeita a erros

maiores (algumas destas questoes acima serao empiricamente testadas neste capıtulo,

quando tratarmos dos resultados obtidos em simulacao). Como a tecnica de peeling nao

necessita de conhecimento (ou estimacao) da origem da infeccao, este metodo e preferıvel

ao encolhimento pelo fator (1− δ).

Por fim, tanto o estimador quanto suas propriedades assintoticas aqui descritas nao

se alteram se o processo ξ0t for substituıdo por ξAt , para A finito. A diferenca e que

teremos , dependendo do conjunto A, que esperar um tempo maior para termos a regiao

em equilıbrio reconhecıvel, pois se temos pontos (ou conjuntos de pontos) distantes um

do outro, teremos, a princıpio, regioes de infeccao disjuntas, e quando enfim estas se

encontrarem, teremos mais cedo ou mais tarde a regiao com o equilıbrio desejado.

3.4 Estabelecendo o teorema

Nesta secao nao apresentaremos a demonstracao do Teorema 3.1, mas sim a ideia dos

principais passos que demonstram as propriedades garantidas por este teorema.

O teorema em questao volta-se para a distribuicao condicional da estatıstica λ0t (Ct)

– apos devida normalizacao – dado que o processo sobrevive para sempre quando t→∞.

Pelo Teorema 1.2 e por (3.3), a mascara Ct = (1−δ)C(ξ0t )∩Zd esta contida em (1−ε)tU

para todo t suficientemente grande quase certamente com respeito a distribuicao do

40

processo. Entretanto, a mascara Ct e aleatoria e depende dos limites do conjunto C(ξ0t ),

para o qual o Teorema 1.2 nao garante que esteja contido em (1 − ε)tU para qualquer

ε ∈ (0, 1) quase certamente. Porem, o resultado a seguir assegura que o envoltorio

convexo do processo ξ0t possui o mesmo comportamento assintotico de Ht e Ht ∩Kt.

Lema 3.1 : Para todo ε ∈ (0, 1),

(1− ε)tU ⊂ C(ξ0t ) ⊂ (1 + ε)tU (3.6)

quase certamente a partir de um determinado instante de tempo suficientemente grande

e sob a condicao do processo sobreviver para sempre.

Tal resultado e compreensıvel no sentido de que a relacao de inclusao entreHt (ondeHt

e Kt sao definidos em (1.11)) e o envoltorio convexo do processo em t e C(ξ0t ) ⊂ C(Ht),

conforme visto na Secao 3.2. Portanto, pelo Teorema 1.2, C(ξ0t ) ⊂ (1 + ε)tU para

t suficientemente grande, quase certamente. A outra relacao de inclusao em (3.6) nao

pode ser provada com os resultados obtidos ate aqui. Porem, o resultado abaixo assegura

que, dado que a infeccao nunca se extingue, a probabilidade de (1 − ε)tU estar contido

em C(ξ0t ) tende a 1 quando t→∞, e assim provamos ambas as relacoes de inclusao em

(3.6).

Lema 3.2 (Fiocco & van Zwet [6]): Para todo ε ∈ (0, 1) e r > 0, existe um numero

positivo Ar,ε tal que, para todo t ≥ 0,

P((1− ε)tU ⊂ Ht ∩Kt|τ 0 =∞) ≥ 1− Ar,εt−r,

P((1− ε)tU ⊂ C(ξ0t )|τ 0 =∞) ≥ 1− Ar,εt−r.

Com base no Lema 3.1, primeiramente vamos provar uma versao do Teorema 3.1

substituindo Ct por uma mascara nao-aleatoria Att≥0 que esteja sempre contida em

(1− ε)tU ∩Zd e com a condicao |At| → ∞ conforme t→∞. Uma vez que se demonstre

as caracterısticas de consistencia e normalidade assintotica para o estimador baseado

na mascara At, denotado por λ0t (At), tais caracterısticas sao aplicaveis tambem ao

estimador baseado na mascara aleatoria Ct quando t → ∞. De fato, pelo Lema 3.1,

41

podemos fazer Ct limitado por (1− δ)(1− ε)tU e (1− δ)(1 + ε)tU com ε→ 0. Logo, para

todo t suficientemente grande, o conjunto Ct tem o comportamento de At exceto por um

conjunto de probabilidade pequena.

O estimador tomado sobre At – dado que a infeccao sobrevive para sempre – depende

apenas de ξ0t ∩ (1 − ε)tU e, pelo Teorema 1.2, podemos substituir ξ

0t por ξZd

t , pois

(1−ε)tU ⊂ Ht∩Kt ⊂ (1+ε)tU implica que as configuracoes dos processos ξ0t e ξZd

t sao,

com grande probabilidade, iguais no interior do conjunto (1−ε)tU para t suficientemente

grande. Uma vez realizada a substituicao acima, o processo de interesse e ξZd

t |τ 0 =∞.

Entretanto, para tempos suficientemente grandes, podemos substituir ξZd

t |τ 0 = ∞

pelo processo ξZd

t . Isto e consequencia da proposicao abaixo.

Proposicao 3.1 (Fiocco & van Zwet [6]): Seja o processo de contato ξZd

t : t ≥ 0.

A distribuicao condicional de ξZd

t dado que o processo sobrevive para sempre converge

fracamente para a distribuicao de ξZd

t quando t→∞.

Demonstracao: Para demonstrar a Proposicao 3.1, seja s um instante de tempo fixo

no intervalo (0, t) e considere o processo ξ′t : t ≥ s, com t = s como instante

inicial e configuracao com todos os sıtios infectados em Zd neste referido instante. Pela

atratividade, o processo ξZd

t |τ 0 > s esta contido em ξ′t para todo t ≥ s (ambos os

processos acoplados conforme a representacao grafica em t ≥ s). Portanto,

P(ξZd

t (x) = 1|τ 0 > s) ≤ P(ξZd

t−s(x) = 1). (3.7)

Pelo Lema 1.3, P(ξZd

t−s(x) = 1)−P(ξνt−s(x) = 1) ≤ Ce−γ(t−s). Logo, pela estacionariedade

do processo ξνt : t ≥ 0,

P(ξZd

t−s(x) = 1) ≤ P(ξν(x) = 1) + Ce−γ(t−s). (3.8)

Novamente, por acoplamento, obtemos P(ξν(x) = 1) ≤ P(ξZd

t (x) = 1), e assim por (3.7)

e (3.8),

P(ξZd

t (x) = 1|τ 0 > s) ≤ P(ξZd

t (x) = 1) + Ce−γ(t−s). (3.9)

Continuando a analisar o processo ξZd

t para instantes superiores a s, dado que o

42

processo sobrevive pelo menos ate s, obtemos

P(ξZd

t (x) = 1|τ 0 > s) =P(ξZd

t (x) = 1 ∩ τ 0 > s)P(τ 0 > s)

≥

≥ P(ξZd

t (x) = 1 ∩ τ 0 =∞)P(τ 0 > s)

=P(ξZd

t (x) = 1)P(τ 0 =∞)

P(τ 0 > s), (3.10)

com ξZd

t denotando o processo ξZd

t |τ 0 = ∞. A desigualdade acima e trivial, pois

τ 0 > s ⊃ τ 0 =∞. Desenvolvendo a ultima parcela de (3.10),

P(ξZd

t (x) = 1)P(τ 0 =∞)

P(τ 0 > s)= P(ξ

Zd

t (x) = 1)P(τ 0 > s)− P(s < τ 0 <∞)

P(τ 0 > s)

= P(ξZd

t (x) = 1)

[1− P(s < τ 0 <∞)

P(τ 0 > s)

],

e pela equacao (1.9),

P(ξZd

t (x) = 1)

[1− P(s < τ 0 <∞)

P(τ 0 > s)

]≥ P(ξ

Zd

t (x) = 1)

[1− Ce−γs

P(τ 0 > s)

]≥

≥ P(ξZd

t (x) = 1)

[1− Ce−γs

P(τ 0 =∞)

]≥ P(ξ

Zd

t (x) = 1)− C ′e−γs, (3.11)

com C ′ = C/P(τ 0 = ∞), onde a segunda e terceira inequacoes sao validas devido a

τ 0 > s ⊃ τ 0 =∞ e P(ξZd

t (x) = 1) ≥ 0. Portanto, de (3.10) e (3.11), obtemos que

P(ξZd

t (x) = 1|τ 0 > s) ≥ P(ξZd

t (x) = 1)− C ′e−γs. (3.12)

Unindo as equacoes (3.9) e (3.12), temos

P(ξZd

t (x) = 1)− C ′e−γs ≤ P(ξZd

t (x) = 1) + Ce−γ(t−s),

daı

P(ξZd

t (x) = 1)− P(ξZd

t (x) = 1) ≤ Ce−γ(t−s) + C ′e−γs, (3.13)

43

para 0 < s < t. Em particular, se s = t/2, temos

P(ξZd

t (x) = 1)− P(ξZd

t (x) = 1) ≤ (C + C ′)e−γt.

Ou seja, a distribuicao de ξZd

t = ξZd

t |τ 0 = ∞ se aproxima da distribuicao

do processo ξZd

t quando t → ∞ desde que P(ξZd

t (x) = 1) ≤ P(ξZd

t (x) = 1), ou

equivalentemente,

E[ξZd

t (x)] ≤ E[ξZd

t (x)]. (3.14)

Isto sendo provado tambem implica que a velocidade da convergencia de ξZd

t |τ 0 =∞

para ξZd

t e de ordem exponencial. Porem, Fiocco & van Zwet [6] mostram que ξAtst

≤ ξAt

para qualquer A ⊂ Zd, onde ξAt denota o processo condicional ξAt |τ 0 = ∞. Os

principais passos da demonstracao deste resultado podem ser encontrados no artigo acima

referido. A demonstracao completa e extensa e a omitiremos no presente trabalho. Uma

vez que a funcao f na definicao de processos estocasticamente dominados em (1.4) seja

f(ξ) = ξ(x), obtemos (3.14) e provamos a Proposicao 3.1.

Agora fixamos uma mascara nao-aleatoria Att≥0 tal que At ⊂ (1 − ε)tU ∩ Zd,

para todo t e |At| → ∞ quando t → ∞. Pelo Teorema 1.2 e pela Proposicao 3.1,

reduzimos o problema de trabalhar com o processo ξ0t |τ 0 = ∞ pelo processo ξZd

t ,

que e relativamente facil de se manejar. Em analogia a (3.1), definimos

nZd

t (At) =∑x∈At

ξZd

t (x) , kZd

t (At) =∑x∈At

(1− ξZd

t (x))∑|x−y|=1

ξZd

t (y)

e o estimador

λZd

t (At) = nZd

t (At)/kZd

t (At),

entao provar a versao do Teorema 3.1 para a mascara nao-aleatoria At se reduz a provar

os mesmos resultados – sem a condicao de sobrevivencia do processo – para λZd

t (At). Pelo

Lema 1.3, tal processo se comporta como ξνt quando t → ∞, e por (3.2) com E = x

44

temos que, para todo t ≥ 0 e x ∈ Zd,

λ =E[nν(x)]

E[kν(x)]=

E[nν(0)]

E[kν(0)],

pois o processo ξνt e espacialmente invariante a translacoes. O processo ξZd

t tambem

apresenta esta caracterıstica. Agora, seja o resultado a seguir:

Proposicao 3.2 (Fiocco & van Zwet [8]): Suponha que para t ≥ 0, os conjuntos At ⊂ Zd

satisfacam At ⊂ At′ se t < t′, |At| <∞ e |At| → ∞ para t→∞. Entao, quando t→∞,

nZd

t (At)

|At|P−→ E[ξν(0)], (3.15)

kZd

t (At)

|At|P−→ E[kν(0)]. (3.16)

Alem disto, se

lim inft→∞

|At|tδ

> 0 para algum δ > 0, (3.17)

entao, quando t→∞,

nZd

t (At)

|At|→ E[ξν(0)] quase certamente, (3.18)

kZd

t (At)

|At|→ E[kν(0)] quase certamente. (3.19)

A Proposicao 3.2 nos permite provar a consistencia (fraca e forte) estabelecida pelo

Teorema 3.1, pois

λZd

t (At) =nZd

t (At)

kZd

t (At)=

nZd

t (At)

|At|

kZdt (At)

|At|

P−→ E[nν(0)]

E[kν(0)]= λ quando t→∞. (3.20)

A ultima convergencia em (3.20) e valida pelo Teorema de Slutsky. Vamos agora

demonstrar as convergencias em probabilidade da Proposicao 3.2. Para isto, precisamos

de estimativas dos momentos dos desvios em torno da media de nZd

t (At) e kZd

t (At).

Portanto, considere a proposicao a seguir:

45

Proposicao 3.3 (Fiocco & van Zwet [8]): Para qualquer k ∈ Z+, existe um numero

positivo Ck tal que para todo D ⊂ Zd e t ≥ 0,

E[(nZd

t (D)− E[nZd

t (D)])2k]≤ Ck|D|k,

E[(kZd

t (D)− E[kZd

t (D)])2k]≤ Ck|D|k.

A demonstracao de (3.16) e analoga a demonstracao de (3.15). Pela desigualdade de

Markov e pela Proposicao 3.3, temos

P

(∣∣∣∣∣nZd

t (At)

|At|− E[nZd

t (At)]

|At|

∣∣∣∣∣ ≥ ε

)≤ 1

ε2kE

∣∣∣∣∣nZd

t (At)

|At|− E[nZd

t (At)]

|At|

∣∣∣∣∣2k =

=

E[∣∣∣nZd

t (At)− E[nZd

t (At)]∣∣∣2k]

ε2k|At|2k≤ Ck|At|k

ε2k|At|2k= Ck,ε|At|−k,

para k ∈ Z+. Como |At| → ∞ quando t→∞,

limt→∞

P

(∣∣∣∣∣nZd

t (At)

|At|− E[nZd

t (At)]

|At|

∣∣∣∣∣ ≥ ε

)= 0.

Logo,nZd

t (At)

|At|− E[nZd

t (At)]

|At|P−→ 0 quando t→∞,

e pela invariancia por translacoes do processo ξZd

t e pelo Lema 1.3,

E[nZd

t (At)]

|At|=

∑x∈At

E[ξZd

t (0)]

|At|= E[ξZd

t (0)]→ E[ξν(0)].

Dessa forma,nZd

t (At)

|At|P−→ E[ξν(0)] e provamos (3.15), com demonstracao analoga para

(3.16). A demonstracao da convergencia quase certa em (3.18) e (3.19) e apresentada em

Fiocco & van Zwet [8].

De posse da Proposicao 3.2 e por Ct respeitar o comportamento de At quando t→∞

conforme ja explicado pelo Lema 3.1, estamos em posicao de enunciar a consistencia do

46

estimador tomado sobre a mascara aleatoria Ct no teorema a seguir, encerrando nossos

comentarios sobre o estabelecimento da consistencia do estimador λ0t (Ct). Observe que

a condicao (3.17) na Proposicao 3.2 e satisfeita quase certamente por Ct para δ < 1, pois

|Ct| e de ordem td para t suficientemente grande pelo Teorema 1.2.

Teorema 3.2 (Fiocco & van Zwet [8]): Seja λ0t (Ct) o estimador de λ para o processo

ξ0t tomado sobre a mascara Ct definida em (3.4). Entao, no conjunto onde ξ

0t sobrevive

para sempre,

λ0t (Ct)→ λ quase certamente.

Em relacao a normalidade assintotica do estimador λZd

t (At) para a mascara nao

aleatoria, um resultado importante para estabelece-la e o decaimento exponencial das

correlacoes de funcoes nao-decrescentes de ξZd

t com respeito a distancia entre os suportes

destas funcoes. Antes de enunciar o resultado, precisamos apresentar algumas notacoes.

Consideramos a distancia L1 entre dois conjuntos R1, R2 ⊂ Zd por

d(R1, R2) = infx∈R1,y∈R2

|x− y| = infx∈R1,y∈R2

d∑i=1

|xi − yi|.

Para duas configuracoes η1, η2 ⊂ Ω, uma funcao nao-decrescente f : Ω → R e x ∈ Zd,

defina

∆f (x) = sup|f(η1)− f(η2)| : η1, η2 ∈ Ω e η1(y) = η2(y),∀y 6= x.

Agora, ponha

|||f ||| =∑x∈Zd

∆f (x).

Para fixar a notacao, vamos considerar um exemplo:

Exemplo 3.2 : Considere a funcao f : Ω → R dada por fN(η) =∑x∈ΛN

η(x), onde ΛN e

a caixa −N, ..., Nd. Temos entao

∆fN(x) =

1 , se x ∈ ΛN

0 , caso contrario .

47

e

|||fN ||| =∑x∈Zd

∆fN(x) = (2N + 1)d.

Por fim, seja DR a classe de funcoes nao-decrescentes f : Ω→ R com |||f ||| <∞ tal

que a funcao f aplicada na configuracao η dependa de η apenas nos sıtios em R ∈ Zd.

Proposicao 3.4 (Fiocco & van Zwet [6]): Existem constantes positivas C e γ tais que,

para todo R1, R2 ⊂ Zd, f ∈ DR1, g ∈ DR2 e t ≥ 0,

|cov(f(ξZd

t ), g(ξZd

t ))| ≤ C|||f ||||||g|||e−γd(R1,R2),

onde ξZd

t denota o processo de contato de parametros (λ, 1) com todos os sıtios da grade

infectados em t = 0.

Claramente, a Proposicao 3.4 mostra que, quanto maior a distancia entre os

conjuntos R1 e R2, menor sera a correlacao entre as configuracoes contidas em tais

conjuntos. Isto assegura um grau suficiente de independencia entre termos de somas

como nZd

t (At) e kZd

t (At), e junto com cotas para seus momentos, isto garante que o

Teorema Central do Limite funcionara para ambas as somas apos devida normalizacao,

pois sao verificadas condicoes de versao geral do Teorema Central do Limite para campos

aleatorios invariantes por translacao obtidos por Bolthausen [2]. Assim, quando t→∞,

a distribuicao de |At|d/2(λZd

t (At) − λ) e aproximadamente normal sob a condicao de

sobrevivencia da infeccao.

Todavia, para que a normalidade assintotica seja aplicavel para o estimador baseado

na mascara aleatoria Ct, uma versao da Proposicao 3.4 deve ser valida para o processo

ξ0t dado que τ 0 =∞. Seja a Proposicao abaixo.

Proposicao 3.5 (Fiocco & van Zwet [6]): Para todo ε ∈ (0, 1) e r > 0, existe um

numero positivo Ar,ε e constantes positivas C e γ tais que para todo t > 0 e toda f e g

48

satisfazendo f ∈ DR1 com R1 ⊂ (1− ε)tU ∩ Zd e g ∈ DR2 com R2 ⊂ Zd,

|cov(f(ξ

0t ), g(ξ

0t ))| ≤ |||f ||||||g|||(Ce−γd(R1,R2) + Ar,εt

−r), (3.21)

onde ξ0t denota o processo ξ

0t condicionado ao evento τ 0 =∞.

O resultado acima apresentada um decaimento da correlacao suficiente em relacao

a distancia entre os suportes das funcoes nao-decrescentes f e g em ξ0t e em relacao

ao tempo. Portanto, seja a proposicao acima com R1 = Ct ∩ ξ0t : x ∈ (1 − ε)tU e

R2 = Ct∩ξ0t : x 6∈ (1−ε/2)tU. A distancia entre estes conjuntos aumenta conforme t

cresce, entao o segundo membro da inequacao (3.21) converge para zero. Com o passar do

tempo, o decaimento governado pelo termo polinomial torna-se cada vez mais dominante

em relacao ao decaimento governado pelo termo exponencial. No limite, quando t→∞, o

decaimento das correlacoes de funcoes nao-decrescentes de ξ0t e polinomial. Entretanto

isto basta para provar que, no limite, quando t → ∞, Ct apresenta comportamento

similar a mascara nao-aleatoria At, pois a contribuicao dos sıtios em (1+ε)tU \ (1−ε)tU

com respeito a |Ct|d/2(λ0t (Ct)−λ) e desprezıvel. Dessa forma, |Ct|d/2(λ

0t (Ct)−λ) tem

distribuicao assintoticamente normal de media 0 quando t→∞. A variancia assintotica

σ2 expressa em (3.5) e tambem obtida do Teorema Central do Limite de Bolthausen [2].

3.5 Comparacao de estimadores

O metodo de estimacao visto neste capıtulo possui maior difusao nas referencias

consultadas em relacao a estimacao por maxima verossimilhanca. O principal fator e que

os estimadores de maxima verossimilhanca estao baseados em toda a historia do processo

no intervalo [0, t], enquanto o estimador para a taxa de infeccao visto neste capıtulo

depende somente da configuracao do processo no instante t, nao importando quantas e

quais transicoes ocorreram para que tal configuracao fosse alcancada. Do ponto de vista

computacional, a estimacao via metodo de contagem e mais simples de ser implementada

em relacao a estimacao por maxima verossimilhanca, pois basta obter a configuracao do

processo para o instante t. Uma vez obtida tal configuracao, aplica-se alguma tecnica

49

para a retirada dos sıtios proximos a fronteira do envoltorio convexo do processo e, desta

nova configuracao, calculamos o numero de sıtios infectados e o numero de vizinhos que

apresentam estados diferentes. A razao destas quantidades retorna uma estimativa de λ.

Para o calculo dos estimadores de maxima verossimilhanca, a cada transicao ocorrida,

e necessario contar os saltos ascendentes e descendentes ocorridos. Alem disso, obter as

taxas integradas Ft e Gt e ainda mais trabalhoso, pois a cada mudanca, precisarıamos

calcular o numero de sıtios infectados (para Ft) e o numero de vizinhos com estados

diferentes (para Gt), alem de conhecer e anotar os instantes de transicao.

A questao de trabalho computacional e da construcao de algoritmos para simular

processos de contato e um ponto fundamental, pois atraves destas simulacoes podemos

verificar empiricamente questoes teoricas aqui citadas, como: observar se, com o metodo

de estimacao programado, a estimativa esta proxima do valor real do parametro; a forma

que a infeccao toma, dando assim a ideia da forma do conjunto U ; entre outras. A

diferenca mencionada acima tambem tem sua importancia pratica, pois acompanhar

toda a historia de um fenomeno natural pode ser cara ou ate mesmo impossıvel.

Outro problema e que ambas as variancias nao podem ser determinadas

explicitamente. Para os estimadores de maxima verossimilhanca, quando t → ∞, tanto

a matriz de covariancias Σ da distribuicao N(0,Σ) de(t(d+1)/2(λt − λ) , t(d+1)/2(µt −

µ))

quanto a variancia σ2ρ da distribuicao N(0, σ2

ρ) de t(d+1)/2(ρt − ρ) dependem da

probabilidade do processo nunca se extinguir (a qual e desconhecida) e da medida

de Lebesgue do conjunto U (definido pelo Teorema 1.2). A forma que este conjunto

assume depende do processo, que por sua vez depende dos parametros. Logo, m(U) e

desconhecido e depende de (λ, µ). Para o estimador via metodo de contagem, a forma

pela qual a variancia e expressa depende de covariancias e primeiros momentos tomados

sobre a medida invariante ν, que e desconhecida.

Por fim, a estimacao via metodo de contagem apresenta a vantagem de reducao nos

parametros a serem estimados, pois qualquer processo de contato de parametros (λ′, µ′)

pode se transformar em um processo de contato de parametro (λ, 1) atraves de devida

renormalizacao temporal (conforme visto na Secao 3.1), e desta forma nao temos uma

grande perda.

50

3.6 Resultados

Nesta secao trataremos dos resultados obtidos em simulacao. O algoritmo, feito no

programa Ox, encontra-se no Apendice A da presente dissertacao. Tal algoritmo utiliza

o parametro de infeccao λ e o instante de tempo T como suas entradas. O processo de

contato em Z2 de parametros (λ, 1) com A = (0, 0) desenvolve-se ate o instante T ,

e assim temos a configuracao neste instante de tempo como dado de saıda. Esta saıda

possibilita a geracao da figura da configuracao, conforme vemos nas Figuras 3.2 e 3.3.

Para os sıtios que encontram-se no estado infectado no instante T , quadrados de lado

unitario centrados nestes sıtios sao plotados e preenchidos na cor preta (ideia similar a

usada na Secao 1.4).

Figura 3.2: Amostra da configuracao de um processo de contato com parametros λ = 2 e µ = 1no instante T = 20.

Para cada par de entradas (λ, T ), foram realizadas 15 replicacoes do processo de

contato de parametros (λ, 1) em um determinado intervalo [0, T ]. Cada replicacao esta

sujeita a uma representacao grafica diferente, pois e caracterizada pela mudanca da

semente (ranseed) no programa, a qual e responsavel pela geracao dos tempos de infeccao

e cura. Portanto, temos uma amostra de 15 observacoes (configuracoes) para cada par

51

Figura 3.3: Amostra da configuracao de um processo de contato com parametros λ = 3 e µ = 1no instante T = 20.

de entradas. Os valores de λ escolhidos foram: λ = 2, λ = 3 e λ = 5. Como a

dimensao da grade e d = 2, temos que o valor crıtico esta situado no intervalo[

13

; 1], e

portanto os valores escolhidos para λ remetem que todas as simulacoes realizadas estao

situadas no caso supercrıtico, ou seja, a probabilidade da infeccao nunca se extinguir

e estritamente positiva. Os instantes escolhidos para observarmos a configuracao dos

processos simulados foram: T = 5, T = 10 e T = 20 (este ultimo exceto para

λ = 5). Como a condicao de sobrevivencia da infeccao e essencial para nossos propositos,

simulacoes nas quais a infeccao nao sobreviveu foram descartadas e outras sementes

foram utilizadas no lugar das sementes relativas aos processos que vieram a se extinguir.

Esta situacao ocorreu apenas em simulacoes com λ = 2, em duas replicacoes, onde a

configuracao ξ0T = ∅ ocorre para T = 5, e obviamente tambem ocorre para T = 10 e

T = 20.

Pela Figuras 3.2 e 3.3, temos a ideia da forma do conjunto U apresentado no Teorema

da Forma (Teorema 1.2), pois a regiao de sıtios infectados deve ter a forma aproximada

de 20U , com probabilidade alta. Conforme comentado no Capıtulo 3, o conjunto U

depende de λ, e empiricamente vemos que, no segundo caso (λ = 3), tal conjunto e

52

maior quando comparado ao primeiro caso (λ = 2). O crescimento da infeccao e linear

e tem simetria radial em torno da origem da mesma, ou seja, a area de infeccao cresce

em todos os sentidos. As Figuras 3.4, 3.5 e 3.6 transmitem a ideia da evolucao da

infeccao com o passar do tempo (para cada uma das tres figuras, a mesma semente foi

utilizada para todas as configuracoes). Como o desenvolvimento da infeccao e governado

pela aleatoriedade dos processos de Poisson segundo a representacao grafica de Harris,

e importante reforcar que a figura gerada pode apresentar um comportamento no qual

o centro da area de sıtios infectados esteja, de maneira mais perceptıvel, fora da origem

da infeccao. Todavia, esta distancia e de ordem oP(t) sob o condicionamento da infeccao

sobreviver para sempre. Este contratempo pode afetar o estimador quando e realizado o

encolhimento pelo fator (1− δ), mas e indiferente se utilizarmos a tecnica de peeling. As

Tabelas 3.1 e 3.2 descrevem media e desvio padrao amostral dos processos simulados, com

e sem peeling. Seguindo a proposta em Fiocco & van Zwet [9], programamos o peeling

para retirar em torno de 30% dos sıtios infectados mais proximos da regiao de fronteira

da configuracao ξ0T .

Figura 3.4: Amostra de um processo de contato de parametros (2, 1) para instantes de tempoT = 5, T = 10 e T = 20.

A ideia principal dos resultados de nossas simulacoes e verificar se o estimador

estudado no Capıtulo 3 produz de fato estimativas confiaveis para o parametro de

infeccao, ou em outras palavras, nosso objetivo principal e verificar empiricamente

53

Figura 3.5: Amostra de um processo de contato de parametros (3, 1) para instantes de tempoT = 5, T = 10 e T = 20.

Figura 3.6: Amostra de um processo de contato de parametros (5, 1) para instantes de tempoT = 5 e T = 10.

o estimador apresentado no Capıtulo 3. Primeiramente, note que ao compararmos

as Tabelas 3.1 e 3.2, verifica-se que o estimador tomando por base toda a grade Z2

subestima o valor real do parametro de infeccao, ao passo que utilizando peeling, os valores

computados para o estimador estao claramente mais proximos de λ. Note tambem que

na Tabela 3.2 temos o erro absoluto entre o parametro e a media amostral das estimativas

decrescendo conforme o tempo T aumenta. Portanto, os resultados obtidos mostram forte

indıcio no tocante a consistencia do estimador (interessante notar que tal comportamento

54

Tabela 3.1: Medias e desvios padroes amostrais das estimativas de cada grupo deamostras de processos simulados com os mesmos valores de λ e T considerando todaa grade bidimensional.

Parametro Tempo Media Amostral D.P. Amostral

5 1,4086 0,0933λ = 2 10 1,6305 0,0735

20 1,8222 0,03765 2,1209 0,1313

λ = 3 10 2,4848 0,074520 2,7352 0,0679

λ = 5 5 3,5488 0,170810 4,1477 0,0752

Tabela 3.2: Medias e desvios padroes amostrais das estimativas de cada grupo deamostras de processos simulados com os mesmos valores de λ e T utilizando peeling.


5 1,8996 0,1917λ = 2 10 1,9550 0,1019

20 2,0132 0,04885 2,9562 0,2949

λ = 3 10 2,9854 0,119220 3,0105 0,0564

λ = 5 5 4,8876 0,302110 4,9279 0,1385

tambem ocorre quando nao utilizamos tecnica de encolhimento, conforme Tabela 3.1).

Outro fator de destaque nas tabelas em questao reside nos desvios das estimativas sem

peeling serem menores do que os desvios das estimativas com peeling. Esta situacao

foi mencionada na Secao 3.3, ao relatar que tecnicas de encolhimento diminuem o vıcio

negativo, mas aumentam a variancia. Tal comportamento so nao foi observado no caso

λ = 3 e T = 20, mas com diferenca relativamente pequena comparada aos demais casos.

Analisando as tabelas separadamente, em ambas o desvio padrao diminui conforme o

tempo cresce. Portanto, pelas simulacoes realizadas, o estimador se aproxima do valor

real do parametro – consistencia – conforme o passar do tempo, enquanto o desvio padrao

das estimativas observadas decresce. Ainda em relacao ao desvios, se fixarmos o tempo,

em ambas as tabelas o desvio aumenta conforme o parametro de infeccao cresce.

55

As distribuicoes empıricas do estimador para λ = 2, λ = 3 e λ = 5 nos instantes de

tempo analisados podem ser verificadas nos histogramas das Figuras 3.7 (sem peeling)

e 3.8 (com peeling). O comportamento das estimativas sem o uso de peeling mostra

maior concetracao em torno de valores menores que o valor do parametro. Conforme

o passar do tempo, esta concentracao esta se aproximando ao valor real do parametro.

Todavia, tal convergencia e demorada, conforme comentado na Secao 3.3. A dispersao das

estimativas tende a decrescer com o passar do tempo, pois tanto o valor maximo quanto

o valor mınimo entre as estimativas aumentam, e o primeiro sofre maior incremento.

No caso das estimativas com o uso de peeling, espera-se que a maior concentracao de

pontos esteja proxima ao valor do parametro (o final do ultimo paragrafo remete a esse

comportamento). De fato, isto se observa na maior parte dos histogramas na Figura 3.8.

Nestes, repare que a dispersao das estimativas em torno da media decresce conforme o

passar o tempo em todos os casos (λ = 2, λ = 3 e λ = 5), e esta concentracao esta

cada vez mais proxima do valor real do parametro. Diferentemente do caso sem peeling,

o valor mınimo cresce ao passo que o valor maximo decresce no tocante a reducao da

dispersao atraves do tempo.

Portanto, a presente secao mostrou, atraves dos resultados obtidos em simulacao,

diversos pontos abordados da teoria estudada na literatura sobre processos de contato,

como:

• A relacao de dependencia do conjunto U apresentado pelo Teorema 1.2 com o

parametro de infeccao λ, assim como sua forma radial em torno da origem da

infeccao;

• O crescimento da infeccao a taxa constante ocorrendo em todas as direcoes,

assumindo aproximadamente, no instante de tempo t, a forma de tU , o que tambem

e assegurado pelo Teorema 1.2;

• A eficiencia do uso do peeling, retirando cerca de 30% dos sıtios infectados mais

proximos da regiao de fronteira da configuracao ξ0T , produzindo estimativas mais

convincentes de λ. Ao calcularmos o estimador sobre toda a grade bidimensional,

obtivemos valores para as estimativas que claramente subestimam o valor real do

56

Figura 3.7: Distribuicoes empıricas para as estimativas sem peeling.

parametro de infeccao;

• A consistencia assegurada pelo Teorema 3.1, onde foi utilizada a media amostral

das estimativas obtidas pelas replicacoes como estatıstica suficiente. Ainda sobre a

consistencia, evidencia-se que esta ainda se mantem mesmo sem uso de tecnicas de

encolhimento, porem com convergencia mais demorada;

• Aumento da variancia com o uso da tecnica de peeling em relacao a variancia das

estimativas tomadas sem uso de encolhimento exceto em um dos casos analisados,

57

Figura 3.8: Distribuicoes empıricas para as estimativas com peeling.

no qual o decrescimo e relativamente pequeno.

58

Capıtulo 4

Processos com imunizacao

4.1 Dinamica do processo

Neste capıtulo, apresentaremos um diferente modelo de propagacao de epidemias.

Em tal modelo, alem dos estados sadio e infectado, temos tambem o estado imune:

quando um sıtio infectado se cura, este nao se torna novamente sadio, mas sim imune

(nao esta mais infectado e nao pode mais contrair a infeccao). A principal referencia e o

trabalho de Cox & Durrett [3]. Como este tipo de modelo nao e o alvo principal desta

dissertacao, apresentaremos apenas a ideia deste processo e alguns dos resultados mais

relevantes. Sugerimos tambem um estimador para o parametro de infeccao e testamos o

seu comportamento com simulacoes do processo.

Primeiramente, cada sıtio z ∈ Z2 esta em um dentre tres estados: 0 (sadio); 1

(infectado); e i (imune). Denotaremos por ηt(x) o estado do sıtio x no instante t. A

dinamica do processo com imunizacao ocorre da seguinte forma: uma vez infectado, um

sıtio x ∈ Z2, independentemente de qualquer outro sıtio, espera tempos exponencias

independentes de parametro λ associados a cada um de seus quatro vizinhos mais

proximos e, apos cada um desses tempos, se ainda infectado, transmite a infeccao ao

respectivo vizinho. Quando tal infeccao atinge um sıtio sadio, este torna-se infectado.

Independentemente, um sıtio infectado permanece neste estado por um tempo aleatorio

com distribuicao exponencial de parametro 1, e quando o perıodo de infeccao acaba,

este sıtio torna-se imune a qualquer infeccao futura. O referido artigo ainda cita

59

uma interessante analogia do uso deste processo com um modelo probabilıstico para

a propagacao de incendios em florestas: o estado 0 (sadio) denota uma arvore (ainda)

nao atingida pelo fogo; 1 (infectado) denota uma arvore que esta em chamas, desta forma

podendo “transmitir” o fogo para uma arvore vizinha; e i (imune) representa uma arvore

ja queimada, morta, que sequer tem condicoes de transmitir o incendio.

De posse das descricoes dos paragrafos acima, vamos apresentar nas proximas secoes

deste capıtulo alguns dos principais resultados teoricos da literatura relativa a processos

com imunizacao.

4.2 Percolacao

Para cada sıtio x ∈ Zd, sejam as variaveis aleatorias independentes e identicamente

distribuıdas Tx ∼ Exp(1) denotando o tempo de permanencia da infeccao no sıtio x.

Em outras palavras, Tx e o tempo decorrente do instante em que o sıtio x recebe a

infeccao de um vizinho ate o instante em que x se torna imune. Definamos tambem,

para x, y ∈ Z2 tal que |x − y| = 1, variaveis aleatorias independentes e identicamente

distribuıdas e(x, y) ∼ Exp(λ), que denotam o tempo decorrente do instante em que o

sıtio x torna-se infectado ate o intante no qual este tenta infectar o sıtio y (com a infeccao

de fato ocorrendo se y estiver no estado sadio e x nao estiver imune). Portanto, seja

τ(x, y) =

e(x, y) se Tx > e(x, y),

∞ se Tx ≤ e(x, y).

Dizemos que a aresta orientada (x, y) e aberta se τ(x, y) <∞ (caso contrario, a aresta

orientada (x, y) e fechada). A primeira situacao refere-se a possibilidade de ocorrencia

de infeccao de y pelo sıtio x, pois a infeccao em x dura tempo suficiente a ponto de x

emitir a infeccao na direcao de y. No segundo caso, o tempo da infeccao em x se encerra

antes de x emiti-la na direcao de y e, a grosso modo, ∞ representa o fato de que x nao

passa a infeccao para y durante o perıodo que se encontra infectado (como cura implica

em imunidade, x nunca mais voltara a ser infectado e, consequentemente, nao podera

mais ser transmissor da infeccao). Assim, a variavel τ(x, y) define o tempo decorrente

60

do instante em que o sıtio x torna-se infectado ate o intante no qual este tenta

infectar o sıtio y, tomando o valor ∞ caso isto nunca ocorra. Para um modelo

com apenas um sıtio infectado em t = 0 (digamos, a origem), a probabilidade da aresta

orientada que liga o par (0, 0) a um de seus quatro vizinhos estar aberta, denotada por

p, pode ser usada como um parametro do modelo epidemico, e e definida por

p = P(T0 > e(0, y)) =

∫ ∞0

P (T0 > e(0, y) | e(0, y) = s) fe(0,y)(s)ds

=

∫ ∞0

e−sλe−λsds = λ

∫ ∞0

e−(λ+1)sds =λ

λ+ 1,

onde y e um dos quatro vizinhos do sıtio (0, 0), este denotado apenas por 0. Agora, seja

C0 = x : x pode ser alcancado por (0, 0) por um caminho de arestas abertas. (4.1)

Claramente, a expressao acima denota o conjunto de todos os sıtios para os quais ha

ligacao com a origem (0, 0) atraves de arestas abertas. No processo com imunizacao (ou

modelo epidemico, como e diversas vezes mencionado em Cox & Durrett [3]), C0 denota

o conjunto de sıtios que podem ser infectados uma vez que a configuracao η0 possua

a coordenada (0, 0) no estado 1 (infectado) e todos os outros sıtios em Z2 no estado 0

(sadio), ou seja, a configuracao inicial do processo η0t .

Definida a expressao em (4.1), o interesse volta-se para o estudo da existencia de um

“caminho infinito” de arestas abertas, que remete a percolacao. Conforme fora descrito

na Secao 1.1, a questao de sobrevivencia da infeccao com probabilidade nao-nula do

processo de contato definido no Capıtulo 1 esta ligada a existencia de ao menos um

“caminho ativo infinito”. No caso do processo com imunizacao, precisamos analisar de

maneira um pouco diferenciada essa existencia de caminho infinito. No modelo com

imunizacao, sıtios que se curam tornam-se imunes, e portanto bloqueiam a passagem

de infeccao pelas suas respectivas arestas. A Figura 4.1 ilustra a ideia a ser passada.

Neste exemplo, se o sıtio (−3, 0) se curar antes de passar infeccao para pelo menos um

de seus vizinhos sadios (neste caso, (−4, 0) ou (−3,−1)), todos os outros sıtios ainda no

estado infectado estarao cercados por sıtios imunes ou infectados. Logo, eles nao tem

61

Figura 4.1: Exemplo de percolacao para processos com imunizacao com infeccao comecando em(0, 0). Os pontos preenchidos em preto denotam sıtios infectados, os pontos brancos representamsıtios sadios e as marcas ××× representam sıtios imunes.

mais como transmitir infeccao, e apenas permanecerao neste estado infectado por um

tempo aleatorio governado por uma distribuicao exponencial de parametro 1. Assim,

quando todos estes sıtios infectados tornarem-se imunes, a configuracao atinge um ponto

de absorcao: todos os sıtios que foram infectados ate o confinamento do aglomerado de

sıtios ligados a origem por caminhos abertos permanecerao no estado imune e todos os

outros sıtios em Z2 no estado sadio. Portanto, neste caso, o sistema nao percola. Para

que o sistema percole, precisamos de ao menos um caminho aberto infinito que passe

pela origem da infeccao, pois dessa forma e impossıvel que todos os sıtios infectados

tornem-se imunes antes de ao menos um destes transmitir a infeccao. Isto equivale a

P(|C0| =∞) > 0. Portanto, sejam

λc = infλ : P(|C0| =∞) > 0

e

pc = 1− ET0[e−λcs

]=

λcλc + 1

respectivamente os parametros crıticos relativos a taxa de infeccao e a probabilidade

da infeccao de um determinado vizinho de (0, 0) ocorrer em virtude da aresta partindo

deste. Cox & Durrett [3] enunciam o parametro crıtico pc ∈ [0, 5; 0, 5927], o que implica

62

em λc ∈ [1; 1, 4552]. Quando λ > λc, o sistema percola com probabilidade positiva,

e assim tracamos um paralelo com o caso supercrıtico dos processo de contato sem

uso de imunizacao. Assim como neste tipo de processo, tambem podemos adaptar a

representacao grafica de Harris para o modelo com imunizacao. As setas de infeccao que

partem das semi-retas z × [0,∞) apos o sıtio z estar no estado imune sao obsoletas,

representando desta forma as arestas (orientadas) fechadas. Tambem temos que um

sıtio imune bloqueia o recebimento de infeccao vinda de qualquer um de seus vizinhos,

conforme a dinamica do processo em questao. A partir do momento que todos os

sıtios infectados na representacao grafica nao encontrarem vizinhos para os quais podem

transmitir a infeccao (ou seja, encontrarem apenas vizinhos no estado infectado ou

imune), a infeccao se extinguira nestes sıtios, ficando assim no estado imune e atingindo

ponto de absorcao, conforme explicado atraves da Figura 4.1. A Figura 4.2 e uma versao

da Figura 1.2 para o processo com imunizacao.

Figura 4.2: Representacao grafica dos processos de contato para d = 1: processo com estadoinicial η0 = ..., 1, 1, 0, 1, 0, 0, 1, ... e configuracao ηT = ..., 1, 1, i, i, 1, 1, i, .... As marcas representam os pontos onde um sıtio infectado se cura e torna-se imune, e as setas partindo desıtios infectados denotam infeccao chegando ao sıtio que a recebe (caso esteja sadio). A setatracejada representa tentativa de infeccao atraves de um aresta fechada.

E pertinente observar que, na representacao grafica de Harris, as marcas conforme

o processo de Poisson de parametro 1 em todas as semi-retas z × [0,∞) sao tracadas

partindo de t = 0, nao levando em conta se o sıtio esta infectado, sadio ou imune. O

tempo aleatorio exponencialmente distribuıdo de permanencia da infeccao nao comeca a

63

ser computado a partir do momento da infeccao, mas sim a partir da ultima marca em

x × [0,∞) antes da ocorrencia da infeccao de x (ou a partir de t = 0, caso a infeccao

em x ocorra antes da ocorrencia de marcas de cura na semi-reta x × [0,∞)). Logo,

nesta adaptacao, as marcas conforme o processo de Poisson de parametro 1 poderiam ser

tracadas apenas a partir da ocorrencia da infeccao, sendo necessario apenas uma marca

para cada semi-reta.

4.3 Teorema da Forma

Ate o presente momento, no nosso estudo de processos de contato com imunizacao,

observamos alguns paralelos em relacao aos processos de contato usuais apresentados

no Capıtulo 1, como percolacao, parametro crıtico e representacao grafica. Alem destas

caracterısticas, tambem temos uma adaptacao para o Teorema 1.2 (Teorema da Forma).

Seja η0t o modelo epidemico em Z2 com a origem infectada e todos os outros sıtios sadios

em t = 0 e

ξ0t = x : η

0t (x) = 1,

ζ0t = x : η

0t (x) = i,

ou seja, ξ0t representa os sıtios que estao infectados no instante t e ζ

0t denota os sıtios

que estao imunes em t.

Teorema 4.1 (Cox & Durrett [3]): Assuma que λ > λc. Entao, ha um conjunto convexo

D tal que para qualquer ε ∈ (0, 1) e para todo t suficientemente grande,

P(C0 ∩ (1− ε)tD ⊂ ζ0t ⊂ (1 + ε)tD) = 1,

P(ξ0t ⊂ (1 + ε)tD \ (1− ε)tD) = 1.

O Teorema 4.1 nos informa que a regiao de sıtios imunes assume a forma assintotica

tD para instantes de tempo suficientemente grandes, ao passo que ao redor dessa area

de sıtios imunes existe uma regiao de sıtios infectados na forma assintotica de uma coroa

64

circular. Tal forma que a configuracao assume sera verificada atraves dos processos

simulados na Secao 4.4.

4.4 Resultados

Nesta secao apresentaremos e discutiremos os resultados obtidos em simulacao para

processos com imunizacao. A princıpio, o algoritmo utilizado poderia ser analogo

ao utilizado para os processos de contato usuais na Secao 3.6, isto e, baseado na

representacao grafica de Harris, com as modificacoes necessarias por envolver o estado

imune. Entretanto, no intuito de otimiza-lo em funcao de sıtios no estado imune nao

poderem receber setas de infeccao e serem indiferentes a marcas de cura, construımos

um algoritmo diferente que retorna os resultados mais rapidamente. Entao, definindo as

entradas λ e T do algoritmo, temos o processo com imunizacao (em Z2) de parametro λ

com apenas o sıtio (0, 0) no estado infectado em t = 0 desenvolvendo-se ate o instante

T , retornando a configuracao neste instante de tempo como dado de saıda. A Figura 4.3

e gerada de uma amostra da configuracao do processo de parametro λ = 3 no instante

T = 20. Para os sıtios que se encontram no estado infectado em T , quadrados de lado

unitario centrados nestes sıtios sao plotados e preenchidos na cor preta. O mesmo ocorre

com a cor cinza para sıtios imunes. Note que a referida figura se comporta conforme

o Teorema 4.1 enuncia: o conjunto de sıtios imunes (e que se tornarao imunes, uma

vez que estao infectados e cercados por sıtios imunes) possui forma assintotica convexa

(neste caso, 20D, onde D e o conjunto convexo apresentado no referido teorema); e,

circundando esta area de sıtios imunes, temos sıtios que estao no estado infectado em T

na forma assintotica de uma coroa circular. O conjunto D apresenta simetria radial em

torno da origem da infeccao (sıtio (0, 0)).

Dentre os principais objetivos desta dissertacao esta a obtencao de estimadores dos

parametros dos processos apresentados ao longo deste trabalho. Em relacao ao processo

com imunizacao, a literatura estudada nao sugere ideias para a estimacao do parametro

λ. Sugerimos um metodo de estimacao similar ao apresentado para o processo de contato

sem imunizacao no Capıtulo 3. O envoltorio convexo do conjunto ξ0t , ζ0t contem,

65

Figura 4.3: Amostra da configuracao de um processo com imunizacao de parametro λ = 3 noinstante T = 20.

alem de sıtios infectados e sadios, sıtios imunes, e a grande proporcao de elementos

neste envoltorio convexo se da por sıtios no estado imune. Pela forma da configuracao

enunciada pelo Teorema 4.1 e verificada empiricamente na Figura 4.3, e inviavel a

utilizacao de tecnicas de encolhimento, pois com isto estarıamos reduzindo em potencial

a proporcao de sıtios infectados da configuracao em determinado instante de tempo.

Portanto, utilizamos como metodo de estimacao para processos com imunizacao a razao

entre o numero de indivıduos infectados e o numero de vizinhos no qual um esta infectado

e o outro sadio, quantidades tomadas no interior do envoltorio convexo de ξ0t , ζ0t .

Para cada par de entradas (λ, T ), foram realizadas 15 replicacoes do processo com

imunizacao de parametro λ em um determinado intervalo [0, T ]. Cada replicacao esta

sujeita a uma representacao grafica diferente, pois e caracterizada pela mudanca da

semente (ranseed) no programa, a qual e responsavel pela geracao dos tempos de infeccao

e cura. Portanto, temos uma amostra de 15 observacoes (configuracoes) para cada par de

entradas. Os valores de λ escolhidos foram: λ = 3 e λ = 5. O valor crıtico λc esta situado

no intervalo [ 1 ; 1, 4552 ], e portanto os valores escolhidos para λ remetem que todas as

simulacoes realizadas estao situadas no caso onde o sistema percola com probabilidade

66

estritamente positiva. Os instantes escolhidos para observarmos a configuracao dos

processos simulados foram: T = 5, T = 10 e T = 20 (este ultimo exceto para λ = 5).

Nenhuma replicacao resultou em morte da infeccao. As Figuras 4.4 e 4.5 passam a

ideia da evolucao temporal da infeccao para de processos com parametros λ = 3 e λ = 5

respectivamente. Note que o desenvolvimento e linear no tempo, com a infeccao crescendo

para todos os lados e assumindo uma forma radial. Repare tambem que raros sao os sıtios

que nao foram infectados na regiao central da configuracao cercada por arestas fechadas.

Figura 4.4: Amostra de um processo de contato com imunizacao de parametro λ = 3 parainstantes de tempo T = 5, T = 10 e T = 20.

De posse de todas as amostras, computamos o numero de sıtios infectados e o

numero de vizinhos infectado-sadio para obter o estimador sugerido. Para cada grupo

de 15 amostras com as mesmas entradas λ e T , calculamos a media e o desvio padrao

amostral. Tais resultados encontram-se na Tabela 4.1. Pelos resultados obtidos em

nossas simulacoes, observamos a media das estimativas se aproximando do valor real do

parametro conforme T aumenta. Fixando T , o desvio padrao amostral das estimativas

dos processos com λ = 5 e ligeiramente maior do que o desvio das estimativas dos

processos com λ = 3.

As distribuicoes empıricas do estimador proposto para λ = 3 e λ = 5 nos instantes de

tempo analisados podem ser verificadas nos histogramas da Figura 4.6. A dispersao das

67

Figura 4.5: Amostra de um processo com imunizacao de parametro λ = 5 para instantes detempo T = 5 e T = 10.

Tabela 4.1: Medias e desvios padroes amostrais das estimativas de cada grupo deamostras de processos com imunizacao simulados com os mesmos valores de λ e T .


5 2,3759 0,1783λ = 3 10 2,6640 0,1213

20 2,8420 0,1312λ = 5 5 3,9426 0,1873

10 4,4682 0,1329

estimativas tende a decrescer com o passar do tempo para os dois valores de parametro de

infeccao analisados, pois tanto o valor maximo quanto o valor mınimo entre as estimativas

aumentam, com o primeiro sofrendo maior incremento. Estes intervalos de dispersao,

alem de encolherem com o passar do tempo, tambem se aproximam do real valor do

parametro, apesar de nenhum destes intervalos conter de fato este real valor.

Com os resultados obtidos nesta secao, verificamos empiricamente questoes como

a forma da infeccao conforme descrita no Teorema 4.1 e a sobrevivencia da infeccao

em todos os processos com imunizacao simulados. Quanto ao estimador proposto, ha

indıcios de que este metodo de estimacao apresente consistencia, porem com necessidade

de tempos maiores para convergir em relacao ao estimador via metodo de contagem

para o processo de contato usual. Outro fator interessante e o decaimento dos desvios

68

Figura 4.6: Distribuicoes empıricas para as estimativas do parametro de infeccao do processocom imunizacao.

conforme o passar do tempo, que ocorre de T = 5 para T = 10 em ambos os parametros

analisados. Comparando as amostras dos processos com λ = 3 nos instantes T = 10 e

T = 20, verifica-se um ligeiro aumento no desvio padrao amostral do primeiro para o

segundo. Aumentar o tamanho das amostras poderia ser uma solucao para verificar com

maior seguranca evidencias de que os desvios decrescem conforme o passar do tempo.

69

Capıtulo 5

Conclusoes e Comparacoes

Apos todo o estudo teorico e avaliacao dos resultados obtidos em simulacoes, seguem

abaixo topicos com as principais conclusoes relativas ao conteudo desta dissertacao.

• Apresentacao de maneira sucinta dos principais pontos teoricos relativos aos

processos de contato usuais e processos com imunizacao, no tocante a construcao,

notacao utilizada, sobrevivencia (ou nao) da infeccao no sistema, distribuicao limite

de processos assim como a forma que a infeccao adquire quando iniciamos o processo

com apenas um sıtio infectado, do ponto de vista assintotico (uma vez que esta

infeccao nao tenha se extinguido);

• Descricao de dois diferentes metodos de estimacao: estimadores de maxima

verossimilhanca; e o estimador para o parametro de infeccao via metodo de

contagem (com parametro de cura fixo e igual a 1). Do ponto de vista teorico,

ambos os estimadores sao razoaveis, visto que sao consistentes e temos resultados

apropriados de normalidade assintotica. Entretanto, o segundo metodo mostra-

se mais acessıvel, pois e de implementacao menos complexa do ponto de vista

computacional; e, na pratica, acompanhar toda a historia de um fenomeno natural

pode ser caro ou ate mesmo impossıvel. O primeiro metodo de estimacao necessita

de todo este historico, ao passo que o outro metodo necessita apenas da configuracao

no instante atual;

• Simulacoes realizadas para os processos de contato apresentados no primeiro

70

capıtulo deste trabalho descreveram de maneira empırica pontos analisados na

teoria estudada, como a forma do conjunto U , a taxa constante de crescimento

da regiao de sıtios infectados e a relacao entre o conjunto U e o parametro de

infeccao λ;

• A estimacao via metodo de contagem, feita atraves das simulacoes acima citadas,

apresentou resultados satisfatorios. O uso da tecnica de peeling para o encolhimento

fez diferenca substancial no tocante a estimacao. Alem disto, verificamos

empiricamente indıcios da consistencia (a qual e citada na literatura estudada)

do estimador;

• Simulacoes realizadas para os processos com imunizacao tambem descreveram de

maneira empırica pontos analisados na teoria estudada, como a forma do conjunto

D, a disposicao de sıtios imunes e infectados na configuracao do processo e o

desenvolvimento linear da infeccao no tempo, com esta crescendo para todos os

lados e assumindo uma forma radial;

• Nossa proposta de construir um metodo de estimacao para o parametro de infeccao

do processo com imunizacao de maneira analoga a estimacao via metodo de

contagem apresenta resultados interessantes no sentido de mostrar indıcios de

consistencia, apesar da convergencia aparentar ser mais lenta em relacao ao processo

de contato sem imunizacao. Possivelmente isto se deve a ausencia do uso de tecnicas

de encolhimento no caso do estimador para o parametro de infeccao do processo

com imunizacao.

Como perspectiva de trabalhos futuros, temos:

• Estudo mais aprofundado do estimador sugerido para o parametro de infeccao do

processo com imunizacao;

• Verificar possıveis otimizacoes para ambos os algoritmos, no intuito de realizar

simulacoes para tempos maiores;

71

• Inferencia do ponto de vista bayesiano no tocante aos parametros de interesse do

modelo;

• Construcao de algoritmos que retornem os estimadores de maxima verossimilhanca

dos parametros de infeccao e cura do processo de contato.

72

Referencias Bibliograficas

[1] Bezuidenhout, C. & Grimmett, G.: The critical process contact dies out. Annals of

Probability, 18: 1462 - 1282, 1990.

[2] Bolthausen, E.: On the central limit theorem for stationary mixing random fields.

Annals of Probability, 10: 1047 - 1050, 1982.

[3] Cox, J.T. & Durrett, R.: Limit theorems for the spread of epidemics and forest fires.

Sthocastic Processes and their Applications, 30:171 - 191, 1988.

[4] Demiris, N. & O’Neill,P.D.: Bayesian inference for stochastic multitype epidemics

in structured population via random graphs. J. R. Statist. Soc. B, 67(5):731-745,

2005.

[5] Durrett, R.: The contact process. AMS Lectures im Applied Mathematics, 27:1 - 18,

1991.

[6] Fiocco, M. & van Zwet,W.R.: Decaying correlations for the supercritical contact

process conditioned on survival. Bernoulli, 9(5):763-781, 2003.

[7] Fiocco, M. & van Zwet,W.R.: Maximum likelihood for the fully observed contact

process. Journal of Computacional and Applied Mathematics, 186:117–129, 2005.

[8] Fiocco, M. & van Zwet,W.R.: Parameter estimation for the supercritical contact

process. Bernoulli, 9(6):1071-1092, 2003.

[9] Fiocco, M. & van Zwet,W.R.: Statistics for the contact process. Statistica

Neerlandica, 56(2):243–251, 2002.

73

[10] Harris, T.E.: Contact Interaction on a lattice. Annals of Probability, 2:969-988, 1974.

[11] James, B.R.: Probabilidade: Um Curso em Nıvel Intermediario. IMPA, 3a edicao,

1994.

[12] Lawler, G.: Introduction to Stochastic Processes. London: Chapman & Hall, 1996.

[13] Liggett, T.: Interacting Particle Systems. New York: Springer-Verlag, 1985.

[14] Lodmell, D. L., Niwa, A., Hayashi, K. & Notkind, A. L.: Prevention of cell-to-cell

spread of herpes simplexvirus by leukocytes. The Journal of Experimental Medicine,

137:706-720, 1973.

[15] Seppalainen, T.: Translation Invariant Exclusion Processes(Book in Progress).

Department of Mathematics, University of Wisconsin, 2003.

[16] Varadhan, S.R.S.: Notas do Capıtulo 5 (Martingales) em Limit Theorems (Fall 02).

Disponıvel em http://www.math.nyu.edu/faculty/varadhan/course/PROB.ch5.pdf

74

Apendice A:

Algoritmo em Ox para simulacoes de

Processos de Contato de parametros

(λ, 1)

#include < oxprob.h >#include < oxstd.h >#import < simula >

main()decl t; t = 0.5;decl k1; k1 = 1;decl k2; k2 = 1;decl mud; mud = 0; //variavel de controle que determina se a caixa aumenta ou nao.decl lambda; lambda = 3; //decl C; C = 6;decl T; T = 20;decl xit;ranseed(1);

/ ∗%%% Inıcio do programa: %%% ∗ /

decl M;while(k1 <= T/t)

/* temos que aumentar k1 se de fato a distancia entre a infeccao e o bordo daconfiguracao for menor que C. */

decl N; N = min(C ∗ k2, 125);

75

M = 2 ∗ N;if(k1 == 1) //Condicao inicialxit = zeros(2 ∗ C + 1, 2 ∗ C + 1);xit[C][C] = 1;if(k1 >= 2) //completando as bordas com zeros.if(C ∗ k2 <= 125) if(mud == 1) decl rzero; decl czero; decl obj1; decl obj2; decl obj3;rzero = zeros(C, M− 2 ∗ C + 1);czero = zeros(M + 1, C);obj1 = rzero|xit;obj2 = obj1|rzero;obj3 = czero ∼ obj2;xit = obj3 ∼ czero;

/ ∗ Relogios exponenciais: ∗ /

decl Ei; Ei = ranexp(M + 1, M + 1, 4 ∗ lambda);decl Em; Em = ranexp(M + 1, M + 1, 1);

decl temposEi; temposEi = Ei;decl temposEm; temposEm = Em;

decl somaEi; somaEi = Ei;decl somaEm; somaEm = Em;

decl Ji; Ji = zeros(M + 1, M + 1);decl Jm; Jm = zeros(M + 1, M + 1);

decl novoEi; decl novoEm; decl k; decl l; / ∗ var. auxiliares ∗ /

/ ∗Geracao dos tempos de infeccao: ∗ /

while(min(somaEi) < t) for(k = 0; k <= M; k + +) for(l = 0; l <= M; l + +) if(somaEi[k][l] < t) Ji[k][l] = Ji[k][l] + 1; novoEi = ranexp(M + 1, M + 1, 4 ∗ lambda);Ei = Ei ∼ novoEi ;

76

somaEi = somaEi + novoEi;temposEi = temposEi ∼ somaEi ;

/ ∗Geracao dos tempos de cura: ∗ /

while(min(somaEm) < t) for(k = 0; k <= M; k + +) for(l = 0; l <= M; l + +) if(somaEm[k][l] < t) Jm[k][l] = Jm[k][l] + 1; novoEm = ranexp(M + 1, M + 1, 1);Em = Em ∼ novoEm ;somaEm = somaEm + novoEm;temposEm = temposEm ∼ somaEm ;

decl temposfinal; decl tempos; decl temposind;decl indic; decl indicord; decl n; decl m; / ∗ var.auxiliares ∗ /

/ ∗Ordenacao dos tempos de infeccao e cura: ∗ /

temposfinal = newarray[M + 1][M + 1];

for(n = 0; n <= M; n + +) for(m = 0; m <= M; m + +) if(Ji[n][m] > 0 && Jm[n][m] > 0) tempos = temposEi[0][n][m];for(k = 2; k <= Ji[n][m]; k + +) tempos = tempos|temposEi[k− 1][n][m]; for(l = 1; l <= Jm[n][m]; l + +) tempos = tempos|temposEm[l− 1][n][m]; indic = ones(Ji[n][m], 1)|zeros(Jm[n][m], 1);temposind = sortbyc(tempos ∼ indic, 0);if(Ji[n][m] > 0 && Jm[n][m] < 1) tempos = temposEi[0][n][m];if(Ji[n][m] > 1) for(k = 2; k <= Ji[n][m]; k + +) tempos = tempos|temposEi[k− 1][n][m]; indic = ones(Ji[n][m], 1);temposind = sortbyc(tempos ∼ indic, 0);if(Ji[n][m] < 1 && Jm[n][m] > 0) tempos = temposEm[0][n][m];if(Jm[n][m] > 1) for(k = 2; k <= Jm[n][m]; k + +) tempos = tempos|temposEm[k− 1][n][m]; indic = zeros(Jm[n][m], 1);

77

temposind = sortbyc(tempos ∼ indic, 0);if(Ji[n][m] < 1 && Jm[n][m] < 1) tempos = 0;indic =< 2 >;temposind = tempos ∼ indic;temposfinal[n][m] = temposind;

/ ∗ Remocao de transicoes que ocorrem em tempos superiores a t = T: ∗ /

decl tipotrans; decl postransx; decl postransy; decl transicao;

tempos = temposfinal[0][0][0][0];tipotrans = temposfinal[0][0][0][1];

postransx = zeros(1);postransy = zeros(1);

for(l = 0; l <= M; l + +) for(k = 0; k <= M; k + +) for(m = 0; m <= Ji[l][k] + Jm[l][k]− 1; m + +) if(l > 0 || k > 0 || m > 0) tempos = tempos|temposfinal[l][k][m][0];if(temposfinal[l][k][m][0] > t) temposfinal[l][k][m][1] = 2; tipotrans = tipotrans|temposfinal[l][k][m][1];postransx = postransx| l ;postransy = postransy| k ;

/ ∗ Construindo a matriz de (tentativa de) transicao: ∗ /

transicao = zeros(rows(tempos), 4);

for(l = 0; l <= rows(tempos)− 1; l + +) transicao[l][0] = tempos[l];transicao[l][1] = postransx[l];transicao[l][2] = postransy[l];transicao[l][3] = tipotrans[l];

78

transicao = sortbyc(transicao, 0);transicao = transicao[ ][1 : 3];

/ ∗ Dinamica do processo: ∗ /

decl x; decl y; decl neigh; decl delta; decl xlin; decl ylin;

for(k = 0; k <= rows(transicao)− 1; k + +) x = transicao[k][0];y = transicao[k][1];if(transicao[k][2] == 1) if(xit[x][y] == 1) neigh = floor(4 ∗ ranu(1, 1)) + 1;if(neigh == 2 || neigh == 4) delta = 0; elseif(neigh == 1 || neigh == 3) delta = 1; xlin = ((x− 2) + neigh) ∗ delta + x ∗ (1− delta);ylin = ((y− 3) + neigh) ∗ (1− delta) + y ∗ delta;if(((xlin >= 0) && (xlin <= M)) && ((ylin >= 0) && (ylin <= M))) xit[xlin][ylin] = 1; if(transicao[k][2] == 0) xit[x][y] = 0;

/* Verificando se a infeccao esta proxima ao bordo da caixa por uma distanciainferior a C sıtios: */

decl erro; erro = 0;if((sumr(xit)[0] + sumc(xit)[0] + sumr(xit)[2 ∗ N] + sumc(xit)[2 ∗ N]) > 0) erro = 1;

println(“Erro = ”, erro);mud = 0;

for(l = 0; l <= C− 1; l + +) for(k = 0; k <= M; k + +) if(xit[k][M− l] == 1 || xit[k][l] == 1 || xit[l][k] == 1 || xit[M− l][k] == 1) mud = 1; if(mud == 1) k2 = k2 + 1; ;

k1 = k1 + 1;

79

/ ∗%%% Fim do programa: %%% ∗ /

println(“”);println(“Configuracao final : ”, xit);

/ ∗ Estimador da taxa de infeccao: ∗ /

//1 - Fazendo sem o peeling:decl kt; decl nt; decl k; decl l; decl estimador;

nt = sumr(sumc(xit));

kt = 0;for(k = 0; k <= rows(xit)− 1; k + +) for(l = 0; l <= columns(xit)− 2; l + +) if(xit[k][l] + xit[k][l + 1] == 1) kt = kt + 1;

for(k = 0; k <= rows(xit)− 2; k + +) for(l = 0; l <= columns(xit)− 1; l + +) if(xit[k][l] + xit[k + 1][l] == 1) kt = kt + 1;

estimador = nt/kt;

println(“”);println(“”);println(“Processo de contato com lambda = ”, lambda, “ e T = ”, T);println(“”);println(“”);println(“Sem o peeling : ”);println(“”);println(“Sitios infectados = ”, nt);println(“Vizinhos infectado− sadio = ”, kt);println(“lambda estimado = ”, estimador);println(“”);

//2 - Retirando cerca de 30% dos sıtios infectados mais distantes da origem:

decl obj4; decl obj5; decl obj6; decl i; i = 0;decl novoxit; novoxit = xit;

while(sumc(sumr(novoxit))/sumc(sumr(xit)) > 0.7)

80

obj4 = dropc(novoxit, 0);obj5 = dropc(obj4, M− 2 ∗ i− 1);obj6 = dropr(obj5, 0);novoxit = dropr(obj6, M− 2 ∗ i− 1);i = i + 1;

decl ktp; decl ntp; decl estimadorp;

ntp = sumr(sumc(novoxit));

ktp = 0;for(k = 0; k <= rows(novoxit)− 1; k + +) for(l = 0; l <= columns(novoxit)− 2; l + +) if(novoxit[k][l] + novoxit[k][l + 1] == 1) ktp = ktp + 1;

for(k = 0; k <= rows(novoxit)− 2; k + +) for(l = 0; l <= columns(novoxit)− 1; l + +) if(novoxit[k][l] + novoxit[k + 1][l] == 1) ktp = ktp + 1;

estimadorp = ntp/ktp;

println(“”);println(“Com o peeling : ”);println(“”);println(“Sitios infectados = ”, ntp);println(“Vizinhos infectado− sadio = ”, ktp);println(“lambda estimado = ”, estimadorp);println(“”);

/* Salvando a configuracao, desmembrando-a em dois arquivos diferentes: */

decl n; n = (columns(xit))/2; decl xit1; decl xit2;xit1 = xit[ ][: n]; xit2 = xit[ ][(n + 1) :];savemat(“contato lambda first 3 20 1.xls”, xit1);savemat(“contato lambda second 3 20 1.xls”, xit2);

81

Apendice B:

Algoritmo em Ox para simulacoes de

Processos com imunizacao de

parametros (λ, 1)

#include < oxprob.h >#include < oxstd.h >#import < simula >

main()

/ ∗ Escolha do seed: ∗ /

ranseed(110);

/ ∗ Definicao dos parametros: ∗ /

decl lambda; lambda = 5;decl T; T = 10;decl xit;decl M;decl N; N = 130;M = 2 ∗ N;

/ ∗ Configuracao inicial: ∗ /

xit = zeros(M + 1, M + 1);xit[N][N] = 1;

82

/ ∗ Tempos de infeccao e imunizacao: ∗ /

decl Em; decl Eidir; decl Eiesq; decl Eiup; decl Eidown; decl tempos;Em = ranexp(M + 1, M + 1, 1);Eidir = ranexp(M + 1, M + 1, lambda);Eiesq = ranexp(M + 1, M + 1, lambda);Eiup = ranexp(M + 1, M + 1, lambda);Eidown = ranexp(M + 1, M + 1, lambda);

tempos = newarray[M + 1][M + 1];

decl k; decl l;for(k = 0; k <= M; k + +) for(l = 0; l <= M; l + +) tempos[k][l] = sortbyc ( (Em[k][l] ∼ 0)|(Eidir[k][l] ∼ 1)|(Eiesq[k][l] ∼ 2)|(Eiup[k][l] ∼ 3)|(Eidown[k][l] ∼ 4), 0 ) ;

/ ∗ Propagacao da infeccao: ∗ /

decl tempo; decl j; decl tempopos;tempo = 0;

while(tempo < T) tempopos = zeros(1, 4); j = 0;

for(k = 0; k <= M; k + +) for(l = 0; l <= M; l + +) if(xit[k][l] == 1) j = j + 1;tempopos = tempopos|zeros(1, 4);tempopos[j][0] = tempos[k][l][0][0];tempopos[j][1] = tempos[k][l][0][1];tempopos[j][2] = k;tempopos[j][3] = l;

tempopos = sortbyc(tempopos, 0);

for(k = 0; k <= M; k + +) for(l = 0; l <= M; l + +) if(xit[k][l] == 1)tempos[k][l][ ][0] = tempos[k][l][ ][0]− tempopos[1][0];

83

if(tempopos[1][1] >= 1) tempos[tempopos[1][2]][tempopos[1][3]] =dropr(tempos[tempopos[1][2]][tempopos[1][3]], 0);

tempo = tempo + tempopos[1][0];

if(tempo < T) decl xlin; decl ylin; decl delta;

if(tempopos[1][1] == 0)xit[tempopos[1][2]][tempopos[1][3]] = −1;

if(tempopos[1][1] > 0) if(tempopos[1][1] == 3||tempopos[1][1] == 4)delta = 1; elseif(tempopos[1][1] == 1||tempopos[1][1] == 2)delta = 0;

xlin = ((tempopos[1][2]− 3) + (2 ∗ (tempopos[1][1]− 2))) ∗ delta+tempopos[1][2] ∗ (1− delta);ylin = ((tempopos[1][3] + 3)− (2 ∗ tempopos[1][1])) ∗ (1− delta)+tempopos[1][3] ∗ delta;

if(((xlin >= 0)&&(xlin <= M))&&((ylin >= 0)&&(ylin <= M))) if(xit[xlin][ylin] == 0)xit[xlin][ylin] = 1; println(tempo);

/ ∗%%% Fim do programa: %%% ∗ /

println(“”);println(“Configuracao final : ”, xit);

/ ∗ Estimador da taxa de infeccao: ∗ /

decl kt; decl nt; decl h; decl i; decl estimador;

nt = sumr(sumc(setbounds(xit, 0, .Inf)));

kt = 0;for(h = 0; h <= rows(xit)− 1; h + +) for(i = 0; i <= columns(xit)− 2; i + +)

84

if(xit[h][i] + xit[h][i + 1] == 1)kt = kt + 1;

for(h = 0; h <= rows(xit)− 2; h + +) for(i = 0; i <= columns(xit)− 1; i + +) if(xit[h][i] + xit[h + 1][i] == 1)kt = kt + 1;

estimador = nt/kt;

println(“”);println(“”);println(“Processo com imunizacao com lambda = ”, lambda, “ e T = ”, T);println(“”);println(“”);println(“Sitios infectados = ”, nt);println(“Vizinhos infectado− sadio = ”, kt);println(“lambda estimado = ”, estimador);println(“”);

/* Salvando a configuracao, desmembrando-a em dois arquivos diferentes: */

decl n; n = (columns(xit))/2; decl xit1; decl xit2;xit1 = xit[ ][: n]; xit2 = xit[ ][(n + 1) :];savemat(“floresta lambda first 5 10 110.xls”, xit1);savemat(“floresta lambda second 5 10 110.xls”, xit2);

85

estima˘c~ao das taxas de infec˘c~ao e cura no processo ... · assim como eu, luiz, l eo e f abio...

Documents