estima˘c~ao das taxas de infec˘c~ao e cura no processo ... · assim como eu, luiz, l eo e f abio...
TRANSCRIPT
Universidade Federal do Rio de Janeiro
Estimacao das taxas de infeccao e cura noProcesso de Contato
Felipe Rafael Ribeiro Melo
Rio de Janeiro
2008
Felipe Rafael Ribeiro Melo
Estimacao das taxas de infeccao e cura no Processo de Contato
Dissertacao de Mestrado apresentada ao Programa
de Pos-graduacao em Estatıstica do Instituto de
Matematica da Universidade Federal do Rio de Janeiro
como parte dos requisitos necessarios a obtencao do
tıtulo de Mestre em Estatıstica.
Orientador:
Glauco Valle da Silva Coelho
Departamento de Metodos Estatısticos
Instituto de Matematica
Universidade Federal do Rio de Janeiro
Maio de 2008
Folha de exame
Dissertacao de Mestrado apresentada ao Programa
de Pos-graduacao em Estatıstica do Instituto de
Matematica da Universidade Federal do Rio de Janeiro
como parte dos requisitos necessarios a obtencao do
tıtulo de Mestre em Estatıstica.
Banca examinadora:
Glauco Valle da Silva Coelho
Instituto de Matematica - UFRJ
Nei Carlos dos Santos Rocha
Instituto de Matematica - UFRJ
Valentin Sisko
Instituto de Matematica - UFF
Aos meus pais.
i
Agradecimentos
E com muito orgulho que escrevo esta pagina, pois sozinhos nao somos nada. Em
primeiro lugar, agradeco a Deus, forca suprema e causa primaria de todas as coisas, e
todas as forcas invisıveis que contribuıram comigo para que este trabalho chegasse ao
ponto que chegou; e minha famılia, a base de tudo, pela confianca no meu potencial,
pelo apoio e incentivo que nunca deixaram de existir, e pela paciencia em lidar com meu
stress e, por vezes, perfeccionismo, fruto do esforco para obter um bom rendimento na
dissertacao.
Aos professores que passaram na minha vida, dos quais extraı grande parte da base
intelectual que hoje possuo, desde a Tia Aldineia no C.A. ao meu orientador Glauco
Valle. A este, um agradecimento especial, por todo o entrosamento obtido nesses
aproximadamente 15 meses trabalhando juntos, pela atencao dedicada e pela paciencia
com minha relativa falta de forte base matematica (e tambem de Processos Estocasticos).
Agradeco ao pessoal do corpo discente da pos-graduacao, em particular aos meus
companheiros da turma de Mestrado de 2006, que souberam como foi viver toda a pressao
do primeiro ano de curso. Assim como eu, Luiz, Leo e Fabio (grande companheiro desde
os tempos de UERJ, que seria de nos se nao fossem as ajudas que um oferecia ao outro
nas disciplinas do Mestrado!?) continuaram para o segundo ano, mas nao poderia me
esquecer de companheiros que nao estao mais no curso, como Simone, Cleide e Flavinha.
Tambem agradeco em especial a Val (que me ofereceu o preambulo para o relatorio e
me deu dicas para edicao do texto); o Vinıcius, com o qual tive meu primeiro contato
com o Latex no minicurso que ele ministrou, alem do divertido convıvio (mesmo que
em pequena escala) e da aceitacao em otimizar meu algoritmo em C (acabou nao sendo
necessario, mas valeu a intencao!); o Joaquim, que veio com o minicurso de Ox na hora
ii
em que eu mais precisava e que me tirou algumas duvidas a respeito deste software; e a
todos que tiveram paciencia com meus programas rodando no laboratorio, pois sei que
foram muitos!
Aos meus amigos Giselli, Luciana e Douglas, pessoas que mais me ajudaram quando
estive fraco e desmotivado com a vida, momento que coincidiu com o comeco da
dissertacao. A melhor forma de agradecer a voces e mostrar que estou aqui, renascido e
com uma dissertacao pronta, pronto para me tornar Mestre!
Ao povo da sala 714 da Escola Nacional de Saude Publica, mas em especial
quero destacar a professora Mariane Branco Alves, sempre presente em minha vida
academica desde 2003, seja como aluno, orientando de Projeto de Extensao, orientando
de monografia de Graduacao ou assistente de pesquisa. Alguem que admiro muito como
pessoa e profissional e que, sem ela, minha vida academica nao seria a mesma. Tambem
a todas as outras pessoas importantes que surgiram no meu caminho gracas a Fundacao
Oswaldo Cruz.
A CAPES, pelo apoio financeiro.
Aos membros da comunidade do Latex no Orkut, na qual retirei muitas duvidas em
relacao a esta linguagem.
Por fim, agradeco a todos que torceram por mim, desde os que estao no Rio aos que
estao a muitos quilometros de distancia. Muito Obrigado!
iii
Resumo
Os processos de contato sao modelos interessantes e uteis para uma variedade de
problemas em Probabilidade Aplicada, como modelos que tratam de propagacao de
epidemias, infeccoes de ordem biologica em determinada estrutura celular ou crescimento
de sistemas ecologicos. Essencialmente, sao processos de Markov a tempo contınuo, onde
cada ponto (sıtio) em uma grade d-dimensional de valores inteiros possui um de dois
possıveis estados: sadio ou infectado. O processo inicia-se com um conjunto nao-vazio
de sıtios infectados e desenvolve-se com a infeccao sendo transmitida para vizinhos dos
sıtios infectados e, independentemente, cura de sıtios infectados, ao longo do tempo
transcorrido.
O presente trabalho traz o embasamento teorico desta classe de processos, incluindo
uma serie de resultados, e alternativas para a estimacao dos parametros de infeccao e cura.
Tambem foi avaliada uma diferente classe de processos de contato onde ha imunizacao
de sıtios, uma vez que estes foram curados da infeccao. Sugerimos uma alternativa para
a estimacao dos parametros deste modelo. Simulacoes computacionais foram realizadas
para verificarmos empiricamente diversos pontos analisados na teoria que se desenrola
ao longo dos capıtulos desta dissertacao para o processo de contato usual, assim como
realizamos simulacoes dos processos com imunizacao, objetivando verificar se o estimador
sugerido e razoavel.
iv
Abstract
The contact processes are interesting and useful models for a variety of applied
probability problems, such as models concerned with spread of epidemics, biological
infection on a cellular structure or growth of ecological systems. Essentially, the contact
processes are Markov processes in continuous time, which every point in a d-dimensional
integer lattice is in one of two possible states: healthy or infected. The process starts
with a nonempty set of infected sites and evolves with infection being transmitted to
neighboring sites of infected sites and independently infected sites being cured along the
time.
This dissertation brings the theoretical framework for this class of processes, including
some important theoretical results and alternatives for the parameters estimation. We
also study a class of models with immunization of sites once cured of its infection. We
propose an alternative for the estimation of the infection parameter for this model.
Computational simulations were made to check empirically various points viewed in
theory over the chapters in this dissertation for the usual contact process, and the process
with immunization to verify whether the proposed estimators are reasonable.
v
Sumario
Introducao 1
1 Definicoes e Resultados Preliminares 8
1.1 Construcao dos processos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.2 Sobrevivencia da infeccao: casos supercrıtico e subcrıtico . . . . . . . . . . . . . . . . . . . 14
1.3 O Teorema da Convergencia Completa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.4 O Teorema da Forma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2 Estimadores de Maxima Verossimilhanca 22
2.1 Definicoes preliminares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.2 Funcao de Verossimilhanca . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.3 Estimadores e suas propriedades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
3 Estimacao via um metodo de contagem 34
3.1 Metodologia de estimacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
3.2 O uso do envoltorio convexo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
3.3 Comportamento assintotico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
3.4 Estabelecendo o teorema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
3.5 Comparacao de estimadores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
3.6 Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
4 Processos com imunizacao 59
4.1 Dinamica do processo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
4.2 Percolacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
4.3 Teorema da Forma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
4.4 Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
5 Conclusoes e Comparacoes 70
vi
Apendice A: Algoritmo em Ox para simulacoes de Processos de Contato de parametros
(λ, 1) 75
Apendice B: Algoritmo em Ox para simulacoes de Processos com imunizacao de
parametros (λ, 1) 82
vii
Lista de Figuras
1.1 Representacao grafica do cilindro RC(−1,1) ∩R(−3,2) ∩R(3,2). . . . . . . . . . . . . . . . . . 9
1.2 Representacao grafica dos processos de contato no caso unidimensional. . . . . . . . . . . 13
3.1 Exemplo de contorno L1 do envoltorio convexo da configuracao de sıtios infectados em
um determinado instante de tempo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
3.2 Amostra da configuracao de um processo de contato com parametros λ = 2 e µ = 1 no
instante T = 20. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
3.3 Amostra da configuracao de um processo de contato com parametros λ = 3 e µ = 1 no
instante T = 20. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
3.4 Amostra de um processo de contato de parametros (2, 1) para instantes de tempo T = 5,
T = 10 e T = 20. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
3.5 Amostra de um processo de contato de parametros (3, 1) para instantes de tempo T = 5,
T = 10 e T = 20. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
3.6 Amostra de um processo de contato de parametros (5, 1) para instantes de tempo T = 5
e T = 10. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
3.7 Distribuicoes empıricas para as estimativas sem peeling. . . . . . . . . . . . . . . . . . . . 57
3.8 Distribuicoes empıricas para as estimativas com peeling. . . . . . . . . . . . . . . . . . . . 58
4.1 Exemplo de percolacao para processos com imunizacao com infeccao comecando na origem. 62
4.2 Representacao grafica de processos com imunizacao no caso unidimensional. . . . . . . . . 63
4.3 Amostra da configuracao de um processo com imunizacao de parametro λ = 3 no instante
T = 20. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
4.4 Amostra de um processo de contato com imunizacao de parametro λ = 3 para instantes
de tempo T = 5, T = 10 e T = 20. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
4.5 Amostra de um processo com imunizacao de parametro λ = 5 para instantes de tempo
T = 5 e T = 10. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
4.6 Distribuicoes empıricas para as estimativas do parametro de infeccao do processo com
imunizacao. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
viii
Lista de Tabelas
3.1 Medias e desvios padroes amostrais das estimativas de cada grupo de amostras de
processos simulados com os mesmos valores de λ e T considerando toda a grade
bidimensional. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
3.2 Medias e desvios padroes amostrais das estimativas de cada grupo de amostras de
processos simulados com os mesmos valores de λ e T utilizando peeling. . . . . . . . . . . 55
4.1 Medias e desvios padroes amostrais das estimativas de cada grupo de amostras de
processos com imunizacao simulados com os mesmos valores de λ e T . . . . . . . . . . . . 68
ix
Introducao
Os processos de contato – e, mais genericamente, sistemas de partıculas interagentes –
foram primeiramente estudados e apresentados por Harris [10]. O rigoroso embasamento
teorico de tais processos mostra-se util no tocante a provar teorias, em especial nas areas
da Fısica e da Biologia Teorica. Alem disto, sao modelos interessantes e uteis para
uma variedade de problemas em Probabilidade Aplicada. Os exemplos mais comuns
sao: modelos que tratam de propagacao de epidemias; infeccoes de ordem biologica em
determinado tecido/orgao; crescimento de sistemas ecologicos.
Para compreensao do processo, primeiramente considere a grade d-dimensional de
valores inteiros Zd = x = (x1, . . . , xd) : xi ∈ Z, i = 1, . . . , d. Na linguagem
de sistemas de partıculas, tais pontos sao denominados sıtios. Cada um desses sıtios
possui um de dois possıveis estados: sadio ou infectado. Sendo assim, tem-se, a cada
instante t ≥ 0, uma configuracao em 0, 1Zd. No instante inicial (t = 0) o conjunto
de sıtios infectados e nao-vazio e definido atraves de uma distribuicao de probabilidade
no espaco de configuracoes possıveis. A dinamica do processo ocorre da seguinte forma:
com o decorrer do tempo, a infeccao se transmite de um sıtio infectado para um sıtio
sadio (independentemente entre estes tipos de pares de vizinhos) segundo um processo
de Poisson de taxa λ; por outro lado, de modo independente, cada sıtio infectado,
independentemente um do outro, torna-se sadio segundo um processo de Poisson de
taxa µ. Aqui, taxa se refere ao parametro da distribuicao exponencial que representa
a distribuicao do intervalo de tempo entre a ocorrencia de dois pontos consecutivos no
processo de Poisson. Entende-se por vizinhos dois sıtios tal que a distancia L1 entre estes
e igual a 1, onde a distancia L1 entre dois pontos x = (x1, . . . , xd) e y = (y1, . . . , yd) em
1
Zd e dada por
|x− y| :=d∑i=1
|xi − yi|.
Temos assim um modelo parametrico: o processo de contato de parametros (λ, µ). O
principal interesse neste projeto e a estimacao dos parametros de infeccao λ e cura µ
do referido processo. A obtencao de tais estimadores e realizada atraves de diferentes
maneiras vistas na literatura. Em algumas situacoes, considera-se o parametro de cura
conhecido e igual a 1, e o interesse volta-se somente a estimacao do parametro de infeccao
(isto nao e uma grande perda, porque com uma renormalizacao temporal apropriada
pode-se transformar qualquer processo de contato em outro processo de contato com
µ = 1). Segue abaixo os principais objetivos deste trabalho.
• Compreensao da teoria dos processos de contato, envolvendo desde nocoes contidas
em processos estocasticos ate o desenvolvimento presente, passando pelo estudo de
distribuicoes de equilıbrio, criterios de convergencia (processos limite), entre outros
conceitos.
• Estimar o parametro de infeccao e o parametro de cura atraves de diferentes
maneiras vistas na literatura, bem como a comparacao destes diferentes metodos
de estimacao e estimadores.
• Estudo da consistencia e comportamento assintotico dos estimadores encontrados.
• Elaboracao de rotinas para simulacoes de processos de contato, desta forma
verificando empiricamente a teoria estudada e reforcando as abordagens
construtivas usadas nas descricoes de processos estocasticos.
• Discutir estimacao dos parametros em modelos com imunizacao.
• Por fim, um apanhado de conclusoes obtidas apos todo o trabalho realizado
envolvendo estimacoes de parametros em processos de contato, alem de perspectivas
de trabalhos futuros.
2
A abordagem deste texto e principalmente teorica e nossa analise estatıstica e
frequentista. Em termos de aplicacao e inferencia bayesiana, faz-se pertinente citar
(em linha de raciocınio semelhante a dinamica dos processos de contato no que diz
respeito aos relogios exponenciais que governam instantes de infeccao e cura) o modelo de
mistura a dois nıveis (two-levels mixing models) de Demiris & O’Neil [4], que e baseado na
construcao de grafos aleatorios tracados entre indivıduos dentro da mesma residencia e
entre indivıduos de diferentes residencias, utilizando abordagem bayesiana na estimacao
dos paramentros de infeccao (local e global). No estudo mencionado e realizada aplicacao
utilizando os dados provenientes do surto do vırus influenza A(H3N2) na cidade de
Tecumseh, no estado de Michigan, Estados Unidos.
A existencia de resultados teoricos em modelos com imunizacao – como o modelo de
incendio em florestas em Cox & Durrett [3] – tem prerrogativas semelhantes ao processo de
contato, com a diferenca da utilizacao de tres diferentes estados (alem de sadio e infectado,
tal modelo possui o estado imune, ou seja, um indivıduo que, uma vez infectado, se
cura, nao se torna novamente sadio, mas sim imune, e permanece neste estado para
sempre no sistema). Por fim, em estudos na chamada Biologia Teorica, tambem existem
possibilidades para aplicacao de modelos de partıculas interagentes do ponto de vista
probabilıstico. O estudo de propagacao celula a celula (spread cell-to-cell) do vırus da
herpes em Lodmell et al [14] menciona que ha pelo menos tres diferentes maneiras pelas
quais vırus podem se espalhar de uma celula a outra: (i) propagacao para celulas proximas
ou distantes atraves de rotas extracelulares; (ii) celula infectada pelo vırus, ao entrar em
processo de divisao celular, gera duas celulas infectadas; e (iii) propagacao do vırus para
celulas adjacentes atraves de pontes intercelulares. Esta ultima e a forma pela qual o
vırus da herpes se propaga. Interpretando celulas como sıtios, celulas adjacentes como
sıtios vizinhos e logo pontes intercelulares como elos ligando celulas adjacentes, temos um
modelo semelhante ao processo de contato e, por conseguinte, caminhos para aplicacao
de modelos de partıculas interagentes. Alem disto, a partir do momento no qual uma
celula infectada se cura (pela acao de anticorpos), esta celula permanece imune a infeccao
devido ainda a acao destes anticorpos. Equivalentemente, do ponto de vista da evolucao
da infeccao, poderıamos ter no lugar desta imunizacao permanente a ocorrencia de morte
3
celular ocasionada pela permanencia do vırus na referida celula. Dessa forma, temos o
modelo semelhante a Cox & Durrett [3], uma vez que esta acao imunizadora dure para
sempre (caso contrario, temos um modelo de maior complexibilidade).
Esta dissertacao se organiza da seguinte forma. A definicao, dada de maneira
mais formal e matematica, e a apresentacao dos principais resultados e caracterısticas
dos processos de contato serao destacadas no primeiro capıtulo do presente trabalho.
Inicialmente apresentaremos o gerador infinitesimal que implica na existencia de um
processo de Markov chamado de processo de contato. A representacao grafica dos
processos de contato, desenvolvida por Harris [10], sera descrita a seguir. Atraves desta,
a dinamica do processo de contato pode ser compreendida, assim como e possıvel verificar
empiricamente caraterısticas inerentes deste tipo de processo, como a atratividade e a
auto-dualidade. O evento que denota o tempo de sobrevivencia da infeccao tambem
sera apresentado. Uma vez que este evento e definido e o conjunto inicial de sıtios
infectados possui cardinalidade finita, a enfase direciona-se para os casos onde a infeccao
no sistema permanece para sempre com probabilidade nao-nula (caso supercrıtico) e
onde a infeccao desaparece (em determinado instante de tempo) com probabilidade 1
(caso subcrıtico). Estas ramificacoes dependem de um valor crıtico ρd que depende da
dimensao d da grade de inteiros onde o processo esta definido de forma que se λ/µ > ρd
o processo e supercrıtico, caso contrario e subcrıtico. Se a infeccao desaparecer em um
determinado instante de tempo (que acontece quase certamente no caso subcrıtico e
ocorre com probabilidade positiva no caso supercrıtico), a configuracao do sistema neste
instante sera nenhum sıtio infectado, e assim permanecera para qualquer instante de
tempo a seguir. Portanto, esta configuracao sem sıtios infectados e chamada de ponto de
absorcao de um processo de contato. Quando a cardinalidade do conjunto inicial de sıtios
infectados e infinita, em ambos os casos (supercrıtico e subcrıtico) a infeccao sobrevive
para sempre com probabilidade 1. Ainda no mesmo capıtulo, sao apresentados dois dos
principais teoremas referentes aos processos de contato: o Teorema da Convergencia
Completa e o Teorema da Forma. O Teorema da Convergencia Completa diz que
para um instante de tempo relativamente grande, a distribuicao do processo converge
fracamente para uma distribuicao que e combinacao convexa de duas medidas extremais,
4
ponderadas por probabilidades relativas a sobrevivencia da infeccao no sistema. A medida
de probabilidade concentrada na configuracao com nenhum sıtio infectado e ponderada
pela probabilidade da infeccao desaparecer; e, ponderada pela probabilidade da infeccao
nao se extinguir, temos a chamada medida de equilıbrio superior, no sentido de que
qualquer outra medida de equilıbrio do sistema e estocasticamente dominada por ela.
Tal medida (tambem chamada de medida invariante superior, devido a estacionaridade
desta) sera amplamente citada e estudada no decorrer deste trabalho. O Teorema da
Forma (ver Bezuidenhout & Grimmett [1], Durrett [5]) assegura que, a partir de um
determinado instante de tempo t suficientemente grande, para um conjunto inicial de
sıtios infectados unitario e sob a condicao de sobrevivencia do processo (situacao possıvel
apenas no caso supercrıtico), a infeccao se propaga linearmente a uma taxa constante
e que a regiao de sıtios infectados tem aproximadamente a forma tU no tempo t, onde
U ⊂ Rd e um conjunto convexo, limitado e com a origem como um ponto interior. Sob
a condicao de sobrevivencia do processo, a distribuicao limite do processo e ν, portanto
logo apos a infeccao chegar em um sıtio, a distribuicao na vizinhanca deste sıtio converge
para a medida de equilıbrio superior.
Fortemente baseado na representacao grafica dos processos de contato, construımos
um algoritmo que fornece amostras de um processo de contato de parametros (λ, 1)
em um instante de tempo imputado no programa. A ideia e fazer este algoritmo
rodar em um tempo suficientemente grande a ponto de atingir a distribuicao limite
e as respectivas propriedades assintoticas. Alem da figura com a configuracao, o
programa construıdo retorna o valor do estimador baseado no equilıbrio das taxas de
crescimento/decrescimento segundo Fiocco & van Zwet [9]. Atraves da figura gerada pela
simulacao feita pelo algoritmo construıdo, tambem tem-se a ideia da forma do conjunto
U citado no Teorema da Forma (ver Figuras 3.2 e 3.3). O algoritmo tambem e adaptavel
ao processo com imunizacao de Cox & Durrett [3].
O segundo capıtulo desta dissertacao trata dos estimadores de maxima
verossimilhanca dos parametros de infeccao e de cura para o processo que inicia com
apenas a origem infectada. Estes estimadores sao dados em funcao de processos de
contagem (que denotam o numero de transicoes de sadio para infectado e de infectado
5
para sadio do referido processo de contato ate um determinado instante de tempo); e de
certas taxas integradas referentes ao processo. Grandezas como a taxa de mudanca em
um sıtio e taxa total de mudanca em qualquer sıtio sao tambem definidas neste capıtulo,
e a verossimilhanca do processo observado ate determinado instante de tempo t e descrita
de maneira analıtica, considerando que o processo no intervalo [0, t] passa por exatas N
transicoes. Dado que o processo nao se extingue, distribuicao e propriedades assintoticas
dos estimadores sao citadas. Os estimadores de maxima verossimilhanca sao consistentes,
assintoticamente nao-viciados e eficientes, e a distribuicao conjunta dos estimadores de
infeccao e cura (apos devida normalizacao) e assintoticamente normal bivariada.
No terceiro capıtulo, apresentamos a tecnica de estimacao via um metodo de
contagem. Primeiramente, seja o processo de contato de parametros (λ, 1) com apenas
a origem infetada no instante inicial. A estimativa de λ com base na realizacao do
processo ate um determinado instante t depende apenas da configuracao do processo no
instante t. A ideia principal deste estimador esta baseada na suposicao de equilıbrio
do processo para um instante de tempo suficientemente grande, ou seja, a taxa media
de crescimento do processo (sıtios sadios tornando-se infectados) e aproximadamente
igual a taxa media de decrescimento (sıtios infectados tornando-se sadios). Todavia,
se considerarmos estas taxas em todo reticulado, o estimador sofre um vıcio negativo.
Simulacoes computacionais confirmam que este estimador subestima λ substancialmente.
O estimador nao e calculado baseado em todo reticulado, mas no conjunto que define o
envoltorio convexo do conjunto de sıtios infectados no instante t. Ainda assim, os sıtios
proximos da regiao de fronteira deste conjunto ainda nao estao no equilıbrio desejado, e
portanto sao desconsiderados na contagem. A remocao de certa proporcao de sıtios em
geral produz estimativas convincentes para λ. Assim como os estimadores de maxima
verossimilhanca, este estimador tambem possui propriedades assintoticas (condicional a
sobrevivencia do processo): consistencia e normalidade assintotica.
No quarto capıtulo desta dissertacao, abandonaremos em parte o contexto visto ate
o momento sobre os processos de contato e apresentaremos um modelo diferente de
propagacao de epidemias, baseado em Cox & Durrett [3]. Sera apresentada a ideia
deste processo e alguns resultados relevantes. Em tal modelo, alem dos estados sadio
6
e infectado, temos tambem o estado imune. A dinamica ocorre da seguinte maneira:
cada sıtio z ∈ Z2 esta em um dentre tres estados: sadio, infectado ou imune. Como
nos processos de contato vistos ate aqui, este processo se inicia com um conjunto
nao-vazio de sıtios infectados, estando todos os outros no estado sadio. Conforme
o passar do tempo, um sıtio infectado, independentemente de qualquer outro sıtio,
espera tempos exponencias independentes de parametro λ associados a cada um de
seus vizinhos proximos e, apos cada um desses tempos, se ainda infectado, transmite
a infeccao ao respectivo sıtio vizinho, o qual se torna infectado caso esteja no estado
sadio. Independentemente, um sıtio infectado permanece neste estado por um tempo
aleatorio com distribuicao exponencial de parametro 1. Uma vez terminado este perıodo
de infeccao, o sıtio torna-se imune e nao pode mais contrair a infeccao.
Por fim, o ultimo capıtulo traz uma serie de conclusoes referentes a todo o estudo
realizado, e comparacoes pertinentes, no que diz respeito as diferentes maneiras de obter
estimadores e simulacoes realizadas com diferentes taxas de infeccao e diferentes duracoes,
inclusive dos processos vistos no Capıtulo 4. Em Apendice, temos os algoritmos, em Ox,
que geram as configuracoes das simulacoes obtidas.
7
Capıtulo 1
Definicoes e Resultados Preliminares
1.1 Construcao dos processos
Os processos de contato sao processos que apresentam espaco de estados definido
por Ω = 0, 1Zd, onde cada configuracao ξ ∈ Ω tem a seguinte interpretacao: um
sıtio x e definido como infectado se ξ(x) = 1 ou sadio se ξ(x) = 0, para todo
x ∈ Zd. Em Ω, estamos sempre considerando a σ-algebra B gerada pelos conjuntos
Rx = ξ ∈ Ω : ξ(x) = 1 (esta e, de fato, a σ-algebra de Borel associada a topologia
produto), ou seja, a menor σ-algebra contendo (Rx)x∈Zd . Todo conjunto de configuracoes
determinado pela especificacao da configuracao em um numero finito de sıtios e chamada
de cilindro. Os conjuntos Rx sao cilindros e todo cilindro e interseccao de cilindros Rx
ou seus complementares.
Exemplo 1.1 : O cilindro ξ ∈ Ω : ξ(x1) = 0, ξ(x2) = 1, ξ(x3) = 1 pode ser escrito como
RCx1∩Rx2 ∩Rx3 . Para facilitar a interpretacao, podemos imaginar que, neste caso acima,
estamos em Z2 e os sıtios sao x1 = (−1, 1), x2 = (3, 2) e x3 = (−3, 2), conforme exibe a
Figura 1.1. Assim, atraves do uso de cilindros, complementares de cilindros, unioes e/ou
interseccoes, podemos definir qualquer configuracao ξ possıvel que exija certo numero
(finito) de sıtios infectados e/ou sadios.
Como o espaco de estados em questao Ω e nao-enumeravel, definimos o processo
de contato atraves do gerador infinitesimal aplicado em funcoes cilındricas, ou
8
Figura 1.1: Representacao grafica do cilindro RC(−1,1) ∩R(−3,2) ∩R(3,2). Os pontos preenchidosem preto representam sıtios infectados, e o ponto em branco representa sıtio sadio. Todos osoutros sıtios em Z2 podem estar em qualquer estado.
seja, f : Ω → R que seja determinada por um conjunto finito de coordenadas, isto e,
∃A ⊂ Zd finito tal que se ξ(x) = η(x), para todo x ∈ A, entao f(ξ) = f(η). Assim, se f
e cilındrica, define-se Lf em cada configuracao ξ ∈ Ω por
(Lf)(ξ) =∑x∈Zd
∑y:|x−y|=1
λ ξ(x)[1− ξ(y)][f(ξy)− f(ξ)] +
+∑x∈Zd
µ ξ(x)[f(ξx)− f(ξ)], (1.1)
onde, para z ∈ Zd,
ξx(z) =
ξ(z) , z 6= x,
1− ξ(z) , z = x.
A configuracao ξx denota a mesma configuracao ξ exceto no sıtio x. O gerador descreve
a variacao infinitesimal do processo com relacao ao tempo quando em determinada
configuracao. Quando situados em processos de Markov homogeneos a tempo contınuo
com espaco de estados finito, temos o semigrupo de matrizes de transicao indexado pelo
tempo representando, para cada instante de tempo t, as probabilidades de transicao entre
os diferentes estados, e o seu gerador infinitesimal L consiste na matriz obtida da derivada
9
no instante t = 0 em cada termo deste semigrupo de transicao. Mais a frente, veremos
uma construcao mais intuitiva e geometrica. O gerador em (1.1) implica a existencia
de um processo de Markov com espaco de estados Ω (ver Teorema 3.9 em Liggett [13]),
que denotaremos por (ξt)t≥0 e chamaremos de processo de contato de parametros (λ, µ).
Denota-se o estado do processo no sıtio x em um dado instante t ≥ 0 atraves da variavel
aleatoria ξt(x), dada por
ξt(x) =
1 , se o sıtio x esta infectado no instante t,
0 , se o sıtio x esta sadio no instante t.
Tambem e comum representar o processo atraves da evolucao do conjunto de sıtios
infectados. Assim como a funcao descrita acima ξt : Zd → 0, 1, este conjunto e,
abusando um pouco da notacao, denotado por ξt, na forma
ξt = x ∈ Zd : ξt(x) = 1.
Aqui, retrata-se de uma bijecao na seguinte funcao:
Ω → P(Zd)
ξ 7→ B(ξ) = x ∈ Zd : ξ(x) = 1.
A medida de probabilidade π em Ω = 0, 1Zd
e equivalente a medida de probabilidade,
digamos, π, em P(Zd) (conjunto das partes de Zd), ou seja,
π(B ⊂ Zd : B ⊃ F ) = π(ξ ∈ 0, 1Zd
: ξ(x) = 1,∀x ∈ F )
= π
( ⋂x∈F
Rx
),
para todo conjunto finito F , com B ∈ B.
Exemplo 1.2 : Seja d = 2 e a famılia de configuracoes com os sıtios (−2, 1) e (0, 3)
infectados, ou seja, ξ ∈ R(−2,1) ∩ R(0,3). Logo, temos o conjunto F = (−2, 1), (0, 3).
10
Entao, para todo conjunto B(ξ) ⊃ F ,
π(ξ ∈ Ω : ξ(−2, 1) = ξ(0, 3) = 1) =
π(B ⊂ Zd : B ⊃ (−2, 1), (0, 3)) =
π(R(−2,1) ∩R(0,3)).
A distribuicao do processo de contato ξt depende de sua distribuicao inicial, que
pode ser qualquer probabilidade no espaco Ω. Denotando esta distribuicao por ξ0 ∼ π,
tem-se ξπt : t ≥ 0 como o processo de contato de parametros (λ, µ) com conjunto
inicial de sıtios infectados distribuıdos conforme π. Esta distribuicao e independente do
desenvolvimento futuro do processo. No caso do conjunto inicial de sıtios infectados ser
dado de forma determinıstica, denotaremos tal conjunto inicial por A e o processo referido
por ξAt : t ≥ 0. Este e um caso particular quando π e a distribuicao concentrada na
configuracao
ξA0 (x) =
1 , se x ∈ A,
0 , caso contrario.
Temos assim um modelo parametrico: o processo de contato de parametros (λ, µ).
Formalmente, o processo de contato e um processo de Markov com espaco de estados
Ω = 0, 1Zde configuracao ξ ∈ Ω. Definido o estado inicial A ⊂ Zd de sıtios infectados,
a cada instante t ≥ 0, temos uma configuracao ξAt ∈ Ω. Obviamente, ξA0 = A. A
dinamica do processo ocorre da seguinte forma: com o decorrer do tempo, um sıtio sadio
e infectado independentemente por cada sıtio infectado entre seus 2d vizinhos segundo
um processo de Poisson de taxa λ; independentemente, um sıtio infectado torna-se sadio
segundo um processo de Poisson de taxa µ. Tal dinamica pode ser compreendida pela
representacao grafica de Harris [10]. Para descrever esta construcao, considere o
espaco (d+1)-dimensional Zd× [0,∞), onde as semi-retas x× [0,∞) denotam o tempo
para o correspondente sıtio x ∈ Zd. Para cada sıtio x ∈ Zd define-se na semi-reta
x × [0,∞) marcas conforme um processo de Poisson com parametro µ; e para cada
par de sıtios vizinhos x e y, define-se setas perpendiculares partindo de x × [0,∞) em
direcao a y × [0,∞) conforme um processo de Poisson com parametro λ. Todos estes
11
processos de Poisson sao independentes.
No instante t = 0, seja A ⊂ Zd o conjunto inicial de sıtios infectados. Mudancas no
sistema so ocorrem de duas formas: a medida que o tempo passa, o estado de um sıtio
infectado se modifica para sadio quando encontra uma marca do processo de Poisson de
parametro µ; ou um sıtio y sadio passa ao estado infectado se receber uma seta de um
sıtio x infectado. A Figura 1.2 traz um exemplo de representacao grafica no caso mais
simples, com d = 1.
Digamos que para x′, x ∈ Zd, e t ≥ 0, um caminho ativo de x′ no instante t =
0 para o sıtio x no instante t = T e um caminho orientado no sentido crescente do
tempo na representacao grafica do processo cujos segmentos verticais nao contem pontos
nos processos de Poisson de parametro µ. Na Figura 1.2, estes caminhos ativos estao
demarcados em negrito. Os caminhos ativos representam as formas pelas quais a infeccao
pode chegar do sıtio x′ no instante t = 0 ate o sıtio x no instante, digamos, t = T . Para
qualquer conjunto A ⊂ Zd, defina ξAt como o conjunto de sıtios x para os quais existe
um caminho ativo do sıtio x′ ∈ A no tempo t = 0 para o sıtio x no tempo t = T .
Claramente, ξAt : t ≥ 0 esta distribuıdo como um proceso de contato com estado inicial
A (escolhendo um conjunto inicial aleatorio com distribuicao π, tem-se ξπt : t ≥ 0
como referido processo). De fato, podemos assumir que esta e a definicao do processo de
contato de parametros (λ, µ).
A questao de sobrevivencia da infeccao com probabilidade nao-nula esta ligada a
existencia de um “caminho ativo infinito” partindo de x ∈ A em t = 0. Isto e o que
estuda a area da probabilidade chamada de Percolacao (ver Capıtulo VI em Liggett [13]).
Dizemos que o sistema percola se e somente se existe tal caminho com probabilidade
positiva. Como a mudanca de estado de um sıtio sadio para infectado so acontece devido
a existencia de pelo menos um sıtio vizinho anteriormente infectado, para a infeccao
nao se extinguir deve haver, em qualquer que seja o instante de tempo, ao menos um
caminho ativo que parta de um sıtio infectado em t = 0 na direcao de algum sıtio x ∈ Zd.
Entretanto, o sistema percola se e somente se a probabilidade de sobrevivencia do sistema
comecando com um unico sıtio infectado e estritamente positiva, e isto e consequencia da
invariancia por translacao, isto e, a probabilidade de existir um caminho infinito partindo
12
Figura 1.2: Representacao grafica dos processos de contato para d = 1: processo com estadoinicial ξ0 = ..., 1, 1, 0, 1, 0, 0, 1, ... e configuracao ξT = ..., 1, 1, 1, 0, 1, 1, 0, .... As marcas representam os pontos onde um sıtio infectado se cura, e as setas partindo de sıtios infectadosdenotam infeccao chegando ao sıtio que a recebe. Os caminhos ativos estao representados emnegrito.
do sıtio x e igual a probabilidade de existir um caminho infinito partindo do sıtio y, pois
os processos de Poisson em cada semi-reta z × [0,∞), com z ∈ Zd, sao independentes
e estao sujeitos a mesma parametrizacao.
Uma das grandes vantagens da representacao grafica de Harris se da no tocante
a comparacao de processos atraves de acoplamento. Definindo ξAt e ξBt como dois
processos de contato de parametros (λ, µ), ambos estarao sujeitos a mesma representacao
grafica. Assumiremos que todos os processos de contato sao acoplados de acordo com a
representacao grafica, ou seja, usaremos os mesmos processos de Poisson que definem os
tempos de cura e infeccao. Dizemos assim que os processos estao acoplados conforme
a representacao grafica. Com o acoplamento, temos os processos definidos em um
mesmo espaco de probabilidade e e possıvel verificar empiricamente propriedades dos
processos de contato, como atratividade e auto-dualidade.
Lema 1.1 (Atratividade): Sejam (ξAt )t≥0 e (ξBt )t≥0 dois processos de contato acoplados
conforme a mesma representacao grafica. Se A ⊂ B, entao ξAt ⊂ ξBt para todo t ≥ 0.
Lema 1.2 (Auto-dualidade): Se, na representacao grafica, o tempo corre de maneira
inversa e todas as setas revertem o sentido, esta nova representacao grafica tem
precisamente a mesma estrutura probabilıstica da original. Em particular, temos a
13
seguinte equacao:
P (ξAt ∩B = ∅) = P (ξBt ∩ A = ∅), para todo A,B ⊂ Zd, t ≥ 0. (1.2)
1.2 Sobrevivencia da infeccao: casos supercrıtico e
subcrıtico
Uma questao pertinente no estudo dos processos de contato e o conhecimento em
relacao a sobrevivencia do referido processo. Definimos entao a variavel
τA = inft : ξAt = ∅
como o tempo de extincao da infeccao, ou seja, o tempo que a infeccao permanece
no sistema. Se esta infeccao sobrevive para sempre (ou seja, sempre havera ao menos
um sıtio infectado para todo t ≥ 0), usamos a notacao τA = ∞. Logo, a notacao
τA < ∞ denota morte da infeccao, mesmo nao definindo o exato instante da extincao
desta. Termino da infeccao remete em termino de evolucao do processo, pois a partir do
momento que a configuracao nao possui nenhum sıtio infectado, o processo permanecera
desta forma para todo instante de tempo subsequente (a infeccao e transmitida apenas
por sıtios infectados, nao existem fatores externos ao sistema que causam infeccao). A
configuracao com todos os sıtios sadios e chamada de ponto de absorcao do processo.
Matematicamente falando, se o conjunto ξAs = ∅, temos que ξAt = ∅, para todo t ≥ s.
Nota 1.1 : Seja ρ = λ/µ a razao entre as taxas de infeccao e cura do processo. Existe
um valor ρd ∈[
12d−1
; 2d
], chamado de parametro crıtico do processo de contato tal
que, se ρ > ρd, a infeccao permanece para sempre no sistema com probabilidade nao-
nula. Esta situacao e chamada de caso supercrıtico. Se ρ ≤ ρd, temos o chamado
caso subcrıtico: a infeccao se extinguira com probabilidade 1 se |A| < ∞, e quando
|A| =∞, a infeccao dentro de uma caixa finita qualquer (porem fixada) desaparecera com
alta probabilidade para t suficientemente grande. No caso supercrıtico, a probabilidade de
sobrevivencia da infeccao depende da dimensao d e do conjunto A (ver Capıtulo VI em
14
Liggett [13]). No caso particular da cardinalidade de A, denotada por |A|, ser infinita
(por exemplo, A = Zd), a probabilidade do processo sobreviver para sempre e igual a 1.
A questao da sobrevivencia da infeccao com probabilidade 1 quando o processo tem
inicialmente um numero infinito de sıtios infectados pode ser demonstrada via Lema
de Borel-Cantelli. Tal demonstracao nao faz diferenciacao entre os casos supercrıtico
e subcrıtico, isto e, a probabilidade de haver ao menos um sıtio infectado para todo
t ≥ 0 tambem e verdadeira para o segundo caso, pois a infeccao se extingue com alta
probabilidade para t suficientemente grande apenas no interior de caixas finitas, e nao
em toda a grade. Representemos o evento de interesse τA =∞ como uma interseccao
infinita de eventos decrescentes em t, ou seja,
τA =∞ =⋂t>0
τA > t.
Assim, temos que P(τA = ∞) = limt→∞
P(τA > t), e basta mostrarmos que P(τA > t) =
1, para todo t > 0. Sejam Tn∣∣∞n=1
variaveis aleatorias independentes e identicamente
distribuıdas que representem os tempos que o sıtios xn ∈ A levam para se curar pela
primeira vez. Sabemos que Tn ∼ Exp(µ). Podemos entao definir a seguinte relacao de
inclusao:
τA > t ⊃∞⋃n=1
Tn > t,
e partindo desta,
τA > t ⊃∞⋃n=1
Tn > t ⊃∞⋂n=1
⋃m≥n
Tm > t =
= lim supt→∞
Tn > t = [Tn > t infinitas vezes].
Pelo Lema de Borel-Cantelli, P(Tn > t infinitas vezes) = 1, pois∞∑n=1
P(Tn > t) = ∞, ja
que os termos da soma sao positivos e iguais para todo n, e dependem apenas de t e do
parametro µ. Assim, para qualquer t ≥ 0,
1 ≥ P(τA > t) ≥ P(Tn > t infinitas vezes) = 1,
15
ou seja, P(τA > t) = 1. Portanto, se |A| =∞, P(τA =∞) = limt→∞
P(τA > t) = 1.
1.3 O Teorema da Convergencia Completa
Uma questao inerente em Probabilidade e Processos Estocaticos e o estudo de criterios
de convergencia em distribuicao e caracterizacao das distribuicoes limites. Seja πt a
distribuicao do processo ξπt . Esta distribuicao convergira fracamente para uma medida
limite, digamos β, quando t → ∞? Dizemos que uma famılia de medidas (πt) em
(Ω,B) converge fracamente para uma outra distribuicao β, ou seja, πtf→ β, se
limt→∞
πtB ⊂ Zd : B ⊃ F = βB ⊂ Zd : B ⊃ F, (1.3)
para todo conjunto finito F ⊂ Zd, com B ∈ B. Portanto, por (1.3), convergencia fraca
no espaco de probabilidades sobre (Ω,B) e equivalente a convergencia em distribuicao de
suas projecoes finito-dimensionais. A projecao finito-dimensional ξAt (x) : x ∈ F e
a configuracao do processo apenas em um numero finito de coordenadas (os elementos
do conjunto F ). Dada uma configuracao em F , ela ocorre com certa probabilidade.
A distribuicao dos sıtios em F depende do tempo e converge em distribuicao se pi(t)
converge para todo i = 1, ..., 2|F | (existem 2|F | configuracoes possıveis em F , e pi(t) denota
a medida de probabilidade de, no instante t, o processo situar-se na i-esima configuracao),
isto e, ∃ qi tal que pi(t) → qi quando t → ∞. Entao2|F |∑i=1
qi = 1 e q = (q1, ..., q2|F |) e a
distribuicao limite. Esta distribuicao e a finito dimensional de β nos sıtios x ∈ F .
Como vimos na Secao 1.2, no caso subcrıtico, a infeccao desaparece quase certamente
(em toda grade quando |A| < ∞ e no interior de uma caixa finita fixada quando |A| =
∞). Ja no caso supercrıtico (genericamente falando), a probabilidade do processo nunca
se extinguir tem probabilidade postitiva, e nao quase certa. Para ambos os casos, a
distribuicao limite e apresentada pelo Teorema da Convergencia Completa. Seja δ∅ a
medida que assegura probabilidade 1 ao conjunto vazio (nenhum sıtio infectado);
e νρ a chamada medida de equilıbrio superior (ou medida invariante superior),
a qual depende apenas da razao ρ e da dimensao d da grade em questao.
16
Teorema 1.1 (Teorema da Convergencia Completa, Liggett [13]): Quando t → ∞, a
distribuicao do processo ξAt converge fracamente para a distribuicao limite
P(τA <∞)δ∅ + P(τA =∞)νρ.
Para simplificar a notacao, vamos denotar a medida de equilıbrio superior simplesmente
por ν, o que nao causa problema tendo em vista que os parametros estao fixados.
Como seu proprio nome relata, a medida ν e invariante, ou seja, o processo ξνt (que
possui inicialmente conjunto aleatorio de sıtios infectados distribuıdos conforme ν) e
estacionario, distribuıdo conforme ν para todo t ≥ 0. Matematicamente falando,
ξνt ∼ ν, para todo t ≥ 0. Obviamente, pela estacionariedade, podemos representar
a distribuicao do processo ξνt para qualquer que seja t ≥ 0 como ξν ∼ ν, ou seja,
desprezando t no tocante a notacao de distribuicao (o processo nao e constante ao longo
do tempo, e sim sua distribuicao!). Temos que ν e uma medida de equilıbrio superior
no sentido de que qualquer outra medida de equilıbrio do sistema e estocasticamente
dominada por ela. Dizemos que uma medida de probabilidade µ e estocasticamente
dominada por (ou estocasticamente menor que) uma medida de probabilidade µ, o
que e denotado por µst
≤ µ, se
Eµ[f(η)] ≤ Eµ[f(η)] , para qualquer funcao nao-decrescente f. (1.4)
Quando µst
≤ µ, podemos construir um par de configuracoes aleatorias (ζ, η) em um
mesmo espaco de probabilidade tal que ζ tem distribuicao µ, η tem distribuicao µ e com
probabilidade 1 temos que ζ ⊂ η. Baseado nisto, em certos momentos abusaremos da
notacao escrevendo ζst
≤ η quando o par de configuracoes aleatorias (ζ, η) esta definido
em um mesmo espaco de probabilidade e com probabilidade 1 temos que ζ ⊂ η.
Como ja citado, o Teorema 1.1 e valido para qualquer ρ ∈ (0,∞). Para processos
de contato com conjunto inicial de sıtios infectados com cardinalidade infinita, temos
P(τA =∞) = 1, portanto a convergencia da distribuicao deste processo para a medida ν
de fato acontece. Quando ρ ≤ ρd (caso subcrıtico) e |A| <∞, temos que P(τA <∞) = 1.
Logo, P(τA =∞) = 0 e a medida limite para processos situados no caso subcrıtico com
17
conjunto inicial de sıtios infectados finito e δ∅. Em contrapartida, se |A| < ∞ e o
processo sobrevive para sempre – o que so e possıvel no caso supercrıtico – a distribuicao
do processo converge fracamente para a medida de equilıbrio superior ν.
Lema 1.3 (Durrett [5]): Considere os processos ξ0t e ξZd
t , comecando com a infeccao
apenas na origem e em todos os sıtios em Zd respectivamente. A velocidade da
convergencia em distribuicao de ξZd
t para ξνt pode ser expressa em termos da probabilidade
do processo ξ0t se extinguir apos o instante t, isto e,
0 ≤ P(ξZd
t (x) = 1)− P(ξν(x) = 1) = P(t < τ 0 <∞) ≤ Ce−γt, (1.5)
com C e γ constantes positivas.
Para demonstrarmos o Lema 1.3, seja A = 0 e B = Zd em (1.2):
P(τ 0 < t) = P(ξ0t = ∅) = P(ξ
0t ∩ Zd = ∅)
= P(ξZd
t ∩ 0 = ∅) = P(ξZd
t (0) = 0).
Portanto,
1− P(ξZd
t (0) = 0) = 1− P(τ 0 < t) = P(ξZd
t (0) = 1) = P(t < τ 0 ≤ ∞). (1.6)
Usando raciocınio analogo para t→∞, temos
P(τ 0 <∞) = limt→∞
P(τ 0 < t) = limt→∞
P(ξZd
t ∩ 0 = ∅)
= P(ξν ∩ 0 = ∅) = P(ξν(0) = 0).
Logo,
1− P(ξν(0) = 0) = 1− P(τ 0 <∞)⇒
⇒ P(ξν(0) = 1) = P(τ 0 =∞). (1.7)
Como o conjunto inicial Zd contem qualquer outra configuracao inicial, podemos
18
acoplar os processos ξZd
t e ξνt de forma que, pela atratividade, ξνt ⊂ ξZd
t para todo t ≥ 0,
o que implica em P(ξν(x) = 1) ≤ P(ξZd
t (x) = 1), para todo x ∈ Zd. Dotados desta
informacao e das equacoes (1.6) e (1.7), facilmente chegamos em
0 ≤ P(ξZd
t (0) = 1)− P(ξν(0) = 1) = P(t < τ 0 <∞). (1.8)
Os processos ξZd
t e ξνt sao espacialmente invariantes, isto e, suas distribuicoes nao
mudam se um incremento inteiro for aplicado nos sıtios em Zd, ou seja, a distribuicao
de z ⊕ ξt : t ≥ 0 e independente do incremento z ∈ Zd. Finalmente, fazendo z = x,
provamos que a velocidade da convergencia em distribuicao de ξZd
t para ξνt pode ser
expressa em termos da probabilidade do processo ξ0t se extinguir apos o instante t, ou
seja,
0 ≤ P(ξZd
t (x) = 1)− P(ξν(x) = 1) = P(t < τ 0 <∞).
Alem de poder ser expressa em termos da probabilidade do processo ξ0t se extinguir
apos o instante t, a velocidade da convergengia de ξZd
t para ξνt e de ordem exponencial,
conforme descreve a ultima desigualdade em (1.5). Isto e assegurado pelo lema a seguir.
Lema 1.4 (Fiocco & van Zwet [7]): No caso supercrıtico, existem constantes positivas
C e γ tais que para todo instante t > 0 e conjunto inicial de infectados A ⊂ Zd com
cardinalidade |A|,
P(t < τA <∞) ≤ Ce−γt , (1.9)
P(τA <∞) ≤ Ce−γ|A|. (1.10)
A interpretacao da equacao em (1.9) e que a probabilidade da infeccao se extinguir
apos um instante de tempo t decai exponencialmente conforme t cresce. A equacao
(1.10) diz respeito a relacao entre desaparecimento da infeccao e a cardinalidade do
conjunto inicial de sıtios infectados. A probabilidade da infeccao se extinguir decai
exponencialmente conforme aumentamos o numero inicial de sıtios infectados. Em
particular, se |A| e infinita, entao a infeccao sobrevivera para sempre quase certamente
19
(Fiocco & van Zwet [7]), conforme provamos anteriormente, na Secao 1.2. Pela equacao
em (1.9), completamos a demonstracao do Lema 1.3. Ainda nesta discussao, o valor
esperado do processo ξνt no sıtio x e igual a probabilidade do processo ξ0t sobreviver
para sempre.
1.4 O Teorema da Forma
Outro resultado de interesse nos processos de contato e o chamado Teorema da Forma.
Antes de enuncia-lo, precisamos definir algumas quantidades inseridas no teorema. Defina
Ht =⋃s≤t
ξs ⊕ [−1/2, 1/2]d , Kt = x ∈ Zd : ξ0t (x) = ξZd
t (x) ⊕ [−1/2, 1/2]d, (1.11)
ou seja, Ht e a uniao dos cubos de hipervolume 1 centrados nos sıtios que, por algum
instante no intervalo [0, t], estiveram infectados no processo ξ0t ; e Kt descreve a uniao
dos hipercubos centrados nos sıtios que apresentam o mesmo estado no instante t dos
processos que comecam com apenas a origem infectada e com todos os sıtios infectados.
Teorema 1.2 (Teorema da Forma, Bezuidenhout & Grimmett [1], Durrett [5]): Existe
um conjunto convexo limitado U ⊂ Rd com a origem como um ponto interior tal que para
ε ∈ (0, 1) e t suficientemente grande,
(1− ε)tU ⊂ Ht ∩Kt ⊂ Ht ⊂ (1 + ε)tU (1.12)
quase certamente no conjunto τ 0 =∞.
Portanto, a ideia que este teorema passa e que, no caso da infeccao persistir para
sempre, para t suficientemente grande, Ht crescera linearmente em todas as direcoes e,
reescalonado por t−1, assumira a forma aproximada de U . Este crescimento e radial
em torno da origem da infeccao. As relacoes de continencia deste teorema tambem nos
dizem que os processos ξZd
t e ξ0t se distribuem aproximadamente conforme a medida de
equilıbrio superior ν no conjunto (1 − ε)tU para t suficientemente grande, ou seja, os
sıtios incluıdos neste conjunto ja se encontram em equilıbrio. Se acoplarmos os processos
20
ξ0t e ξZd
t temos, pela atratividade, ξ0t ⊂ ξZd
t para todo t, mas ao mesmo tempo
ξ0t ∩ (1− ε)tU = ξZd
t ∩ (1− ε)tU (1.13)
quase certamente sob a condicao de sobrevivencia do processo. Pela invariancia por
translacao, podemos estender este raciocınio para qualquer conjunto inicial de sıtios
infectados unitario, ou seja, para todo z ∈ Zd, temos
ξzt ∩ (1− ε)t(U ⊕ z) = ξZd
t ∩ (1 + ε)t(U ⊕ z)
quase certamente condicionado a sobrevivencia do processo. Nestes casos, o conjunto U
e transladado, e logo sua simetria radial se da em torno da origem da infeccao, isto e, em
torno do sıtio z.
O Teorema 1.2 assegura que, com conjunto inicial unitario de sıtios infectados, a
infeccao se espalha linearmente em torno da origem da infeccao em todas as direcoes,
assumindo a forma assintotica tU , e pouco tempo depois desta infeccao chegar em um
sıtio, sua vizinhanca sera aproximadamente distribuıda conforme ν.
21
Capıtulo 2
Estimadores de Maxima
Verossimilhanca
2.1 Definicoes preliminares
Neste capıtulo apresentaremos a estimacao via maxima verossimilhanca dos
parametros λ e µ do processo de contato. Antes de apresentar a funcao de
verossimilhanca e os estimadores provindos desta, e necessario definir algumas
quantidades. Primeiramente, sejam
nAt =∑x∈Zd
ξAt (x) , kAt =∑x∈Zd
(1− ξAt (x))∑|x−y|=1
ξAt (y)
(2.1)
respectivamente o numero de sıtios infectados e o numero de pares de sıtios vizinhos
proximos onde um esta infectado e outro sadio no instante t do processo com conjunto
inicial finito de sıtios infectados A. Defina os processos de contagem (Ut)t≥0 e (Dt)t≥0,
que denotam respectivamente o numero de saltos ascendentes e descendentes do
processo ξ0s : 0 ≤ s ≤ t. Enquanto o primeiro processo denota o numero de transicoes
observadas do estado sadio para o estado infectado do processo com estado inicial A
no intervalo [0, t], o segundo representa o numero de transicoes observadas do estado
infectado para o estado sadio do mesmo processo no mesmo intervalo. Sejam os processos
22
(Xt)t≥0 e (Yt)t≥0 definidos por
Xt = Ut − λFt , Yt = Dt − µGt, para todo t ≥ 0, (2.2)
onde λFt e µGt sao os compensadores (ou taxas integradas) de respectivamente Ut e Dt,
com Ft e Gt definidos por
Ft =
∫ t
0
k0s ds , Gt =
∫ t
0
n0s ds.
Os processos Xt e Yt sao martingais de media 0. Entende-se por martingal um
processo (Zt)t≥0 com Zt integravel e seu valor esperado condicional ao historico do
processo em [0, s] (com s ≤ t) e igual ao estado do processo no instante s. Formalmente,
temos
E[Zt|Fs] = E[Zt|Zu, 0 ≤ u ≤ s] = Zs, s ≤ t, (2.3)
onde a σ-algebra Fs = σ(Zu, 0 ≤ u ≤ s) representa toda informacao gerada pelo processo
no intervalo de tempo [0, s]. Se em (2.3) temos uma inequacao no lugar da igualdade, ha
dois casos de interesse:
Se E[Zt|Fs] ≥ Zs, para todo s < t, entao dizemos que Zt e um submartingal,
Se E[Zt|Fs] ≤ Zs, para todo s < t, entao dizemos que Zt e um supermartingal.
Como as taxas integradas sao quantidades nao-negativas, os processos de contagem Ut
e Dt sao submartingais. Fica claro entao que Ut = Xt + λFt e Dt = Yt + µGt sao
respectivamente as decomposicoes de Doob-Meyer de Ut eDt (ver Varadhan [16], Teorema
5.9).
Suponha que observamos o processo ξ0s : 0 ≤ s ≤ t, ou seja, o processo que
inicia com apenas a origem infectada. Como uma colecao enumeravel de processos de
Poisson independentes nao contem um par de processos tendo um ponto em comum,
pela construcao do processo de contato nao ocorre mais de uma transicao em um
mesmo instante de tempo. Suponha tambem que ocorrem exatamente N transicoes
23
(sadio tornando-se infectado ou infectado tornando-se sadio) neste perıodo, nos instantes
T1 < · · · < TN , e que no instante Ti, a mudanca de estado ocorre no sıtio xi, i = 1, ..., N .
Observe que N = Ut + Dt, pois a cada Ti, ocorre um salto de tamanho 1 no numero
de sıtios infectados na grade, seja este salto ascendente ou descendente. E conveniente
adotarmos T0 = 0, TN+1 = t e ξi = ξ0Ti
como a configuracao do processo no instante Ti.
Dada a configuracao ξi−1 no instante Ti−1, definimos a taxa de mudanca no sıtio x,
denotada por ri(x) e dada por
ri(x) =
λ∑|x−y|=1
ξi−1(y) , se ξi−1(x) = 0,
µ , se ξi−1(x) = 1.
(2.4)
A parcela∑|x−y|=1
ξi−1(y) em (2.4) refere-se ao numero de vizinhos do sıtio x que estao
infectados no intervalo [Ti−1, Ti), isto e, λ∑|x−y|=1
ξi−1(y) e a taxa com que o sıtio x no
estado sadio durante o intervalo [Ti−1, Ti) torna-se infectado. Da mesma forma, µ e a
taxa com que um sıtio x no estado infectado em [Ti−1, Ti) torna-se sadio. O somatorio
das taxas de mudanca de todos os sıtios x ∈ Zd no instante Ti resulta na taxa total de
mudanca no instante Ti, que denotaremos por
Ri =∑x∈Zd
ri(x).
Note que Ri e finito, pois o conjunto inicial de sıtios infectados e finito. Vamos obter
uma expressao mais apropriada para Ri:
Ri =∑x∈Zd
ri(x) =∑x∈Zd
[Iξi−1(x)=0λ
∑|x−y|=1
ξi−1(y) + Iξi−1(x)=1µ
]
= λ∑x∈Zd
[Iξi−1(x)=0
∑|x−y|=1
ξi−1(y)
]+∑x∈Zd
Iξi−1(x)=1µ
= λ∑x∈Zd
[(1− Iξi−1(x)=1)
∑|x−y|=1
ξi−1(y)
]+ µ
∑x∈Zd
Iξi−1(x)=1
= λ∑x∈Zd
[(1− ξi−1(x))
∑|x−y|=1
ξi−1(y)
]+ µ
∑x∈Zd
ξi−1(x) = λk0Ti−1
+ µn0Ti−1
. (2.5)
24
2.2 Funcao de Verossimilhanca
Atraves das definicoes apresentadas na secao anterior, podemos construir a funcao
de verossimilhanca. A verossimilhanca do processo ξ0s observado em [0, t] e construıda
condicional as N transicoes que o processo sofre neste intervalo de tempo, e remete as
chances relativas do processo atingir determinada configuracao. Temos que (Ti − Ti−1) e
uma variavel aleatoria que denota o intervalo de tempo que o processo permanece sem
modificacoes dado que ja sofreu i−1 transicoes. Este tempo aleatorio e exponencialmente
distribuıdo com parametro Ri, a taxa total de mudanca do sistema apos a (i− 1)-esima
transicao. Como ocorrem exatamente N transicoes e os processos de Poisson que definem
infeccao ou cura sao independentes, a verossimilhanca e escrita da seguinte forma:
L(λ, µ) =
[N∏i=1
Ri exp−Ri[Ti − Ti−1]︸ ︷︷ ︸(∗)
ri(xi)
Ri︸ ︷︷ ︸(∗∗)
]exp−RN+1[t− TN ]︸ ︷︷ ︸
(∗∗∗)
. (2.6)
As expressoes (∗) e (∗∗) em (2.6) representam a densidade dos instantes de salto
condicional ao sıtio que muda de estado no processo, ou seja, (Ti − Ti−1) ∼ Exp(Ri)
dado que no instante Ti ocorre mudanca de estado no sıtio xi. A expressao (∗ ∗ ∗) e
referente a densidade no intervalo [TN , t], onde nao ocorre transicao e, portanto, nao
ha condicionamento relativo a mudanca de configuracao do processo. A funcao de log-
verossimilhanca e dada por
logL(λ, µ) =N∑i=1
log
[Ri exp−Ri[Ti − Ti−1]ri(xi)
Ri
]+ log(exp−RN+1[t− TN ])
= −N∑i=1
Ri[Ti − Ti−1] +N∑i=1
log ri(xi)−RN+1[t− TN ]
= −N+1∑i=1
Ri[Ti − Ti−1] +N∑i=1
log ri(xi). (2.7)
Em [0, t], o processo realiza Ut mudancas de sadio para infectado e Dt mudancas de
infectado para sadio. Logo, o segundo termo de (2.7) pode ser escrito como
25
N∑i=1
log ri(xi) =N∑i=1
log[Iξi−1(xi)=0λ
∑|xi−y|=1
ξi−1(y) + Iξi−1(xi)=1µ]
=∑
i:ξi−1(xi)=0
log
λ ∑|xi−y|=1
ξi−1(y)
+∑
i: ξi−1(xi)=1
log µ
=∑
i:ξi−1(xi)=0
log λ+∑
i:ξi−1(xi)=1
log µ+∑
i:ξi−1(xi)=0
log∑
|xi−y|=1
ξi−1(y)
= Ut log λ+Dt log µ+ h(ξ0), (2.8)
onde h(ξ0) depende do processo ξ0s : 0 ≤ s ≤ t, mas nao depende dos parametros λ e
µ. Aqui, Ut e Dt sao os processos de contagem definidos na Secao 2.1 (saltos ascendentes
e descendentes, respectivamente), que tambem podem ser expressos da seguinte forma:
Ut = #1 ≤ i ≤ N : ξi−1(xi) = 0 = #1 ≤ i ≤ N : ξi(xi) = 1,
Dt = #1 ≤ i ≤ N : ξi−1(xi) = 1 = #1 ≤ i ≤ N : ξi(xi) = 0.
Como TN+1 = t e a configuracao do processo se modifica apenas em T1 < · · · < TN , ou
seja, n0s e k
0s sao constantes para s ∈ [Ti−1, Ti), i = 1, ..., N + 1, por (2.5), o primeiro
termo de (2.7) pode ser escrito como
N+1∑i=1
Ri[Ti − Ti−1] =N+1∑i=1
[λk0T i−1 + µn
0T i−1][Ti − Ti−1]
= λ
N+1∑i=1
k0T i−1(Ti − Ti−1) + µ
N+1∑i=1
n0T i−1(Ti − Ti−1)
= λ
∫ t
0
k0s ds+ µ
∫ t
0
n0s ds = λFt + µGt. (2.9)
Finalmente, aplicando (2.8) e (2.9) em (2.7), temos a log-verossimilhanca dada da
forma
logL(λ, µ) = −λFt − µGt + Ut log λ+Dt log µ+ h(ξ0). (2.10)
26
2.3 Estimadores e suas propriedades
Derivando a expressao para log-verossimilhanca obtida em (2.10) em relacao ao
parametro que se deseja estimar (λ ou µ) e igualando a zero, encontramos os estimadores
de verossimilhanca:
d
dλlogL(λ, µ) = −Ft +
Utλ
= 0 ⇒ λt =UtFt, (2.11)
d
dµlogL(λ, µ) = −Gt +
Dt
µ= 0 ⇒ µt =
Dt
Gt
. (2.12)
Note que, por (2.2), como E[Xt] = E[Yt] = 0 para todo t, temos
E[Ut] = E[λFt] ⇒ λ =E[Ut]
E[Ft], (2.13)
E[Dt] = E[µGt] ⇒ µ =E[Dt]
E[Gt], (2.14)
e como os processos de contagem Ut e Dt e as somas Ft e Gt sao processos crescentes, uma
vez que a razao entre os valores esperados em (2.13) e (2.14) convirjam respectivamente
para λ e µ, estes estimadores possuem um apelo intuitivo (ver Lema 2.1).
O estimador da razao entre as taxas de infeccao e cura e a razao entre os estimadores
das referidas taxas, ou seja,
ρt =λtµt
=UtGt
DtFt.
Apos devida normalizacao, os estimadores de maxima verossimilhanca de infeccao e
cura possuem distribuicao assintotica normal bivariada, e o estimador ρt tem distribuicao
assintotica normal, conforme enuncia o teorema a seguir.
Teorema 2.1 (Fiocco & van Zwet [7]): Seja U o conjunto convexo limitado descrito no
Teorema 1.2 e m(U) sua medida de Lebesgue em Rd. Dado que τ 0 =∞, temos que,
quando t → ∞, a distribuicao conjunta de t(d+1)/2(λt − λ) e t(d+1)/2(µt − µ) converge
em distribuicao para N(0,Σ), onde a matriz de covariancia Σ = (σij) i=1,2j=1,2
tem entradas
27
σ1,2 = σ2,1 = 0 e
σ1,1 =(d+ 1)λ2
µm(U)P(τ 0 =∞), σ2,2 =
(d+ 1)µ
m(U)P(τ 0 =∞). (2.15)
Sob a condicao de sobrevivencia do processo, a distribuicao limite de t(d+1)/2(ρt − ρ) e
N(0, σ2ρ), onde
σ2ρ =
2(d+ 1)λ2
µ3m(U)P(τ 0 =∞).
Demonstracao: Precisamos demonstrar que a distribuicao limite de t(d+1)/2(λt − λ) e
N(0, σ1,1). O caminho para demonstrar que a distribuicao limite de t(d+1)/2(µt − µ) e
N(0, σ2,2) e analogo e nao sera feito aqui. Pela dinamica do processo de contato, os
processos Ut e Dt sao independentes, e condicional a τ 0 = ∞, os martingais Xt e
Yt sao assintoticamente nao correlacionados, pois sao gerados a partir de processos de
Poisson independentes. Portanto, λt e µt sao independentes, e logo σ1,2 = σ2,1 = 0.
Entao, provar a distribuicao assintotica de t(d+1)/2(λt − λ) e suficiente para provar o
Teorema 2.1. Primeiramente, considere as notacoes P∗, E∗ e Var∗ como respectivamante
a probabilidade condicional, o valor esperado e a variancia dado τ 0 = ∞. Para
C ⊂ Zd, defina
nπt (C) =∑x∈C
ξπt (x) , kπt (C) =∑x∈C
(1− ξπt (x))∑|x−y|=1
ξπt (y)
, (2.16)
ou seja, nAt e kAt definidos em (2.1) sao iguais a respectivamente nπt (Zd) e kπt (Zd) com
distribuicao inicial π concentrada em A. Seja U o conjunto definido pelo Teorema 1.2.
Por (1.12) e (1.13), temos que, para ε arbitrariamente pequeno,
lim supt→∞
t−d−1
∣∣∣∣Ft − ∫ t
0
kZd
s (sU)ds
∣∣∣∣ = 0 (2.17)
28
quase certamente sob P∗, pois
t−d−1
∣∣∣∣Ft − ∫ t
0
kZd
s (sU)ds
∣∣∣∣ = t−d−1
∣∣∣∣∫ t
0
kZd
s (Zd \ sU)ds
∣∣∣∣= t−d−1
∣∣∣∣∫ t
0
kZd
s ((1 + ε)sU \ sU)ds
∣∣∣∣ ≤ Cε
para todo t suficientemente grande sob P∗ quase certamente, com C constante positiva e a
segunda igualdade valida devido ao Teorema 1.2. Logo, conforme t aumenta, a expressao
no lim sup tende a zero. Alem disso, novamente pelo Teorema 1.2 e pelo Teorema 1.1,
quando t→∞,
t−d−1
∣∣∣∣∫ t
0
kZd
s (sU)ds−∫ t
0
E[kZd
s (sU)]ds
∣∣∣∣ P−→ 0. (2.18)
Combinando (2.17) e (2.18), chega-se na equacao abaixo:
t−d−1
∣∣∣∣Ft − ∫ t
0
E[kZd
s (sU)]ds
∣∣∣∣ P∗−→ 0 quando t→∞. (2.19)
De posse de (2.19), nosso foco volta-se para obter E[kν(sU)], pois pelo Teorema 1.2,
as configuracoes dos processos ξZd
s e ξνs sao iguais em media no interior de sU para
s suficientemente grade. Quando s → ∞, o numero de sıtios em sU e de ordem de
m(U)sd, e pela invariancia por translacoes do processo ξνs ,
E[kν(sU)] =∑x∈sU
E
∑|x−y|=1
(1− ξν(x))ξν(y)
=∑x∈sU
E
∑|y|=1
(1− ξν(0))ξν(y)
=
∑x∈sU
E[kν(0)] ∼= m(U)sdE[kν(0)].
Para o processo ξνs , temos que sua taxa media de crescimento e λE[kν(0)], que e igual
a sua taxa media de decrescimento µE[nν(0)] = µE[ξν(0)] para todo s > 0, devido a
ν ser uma medida de equilıbrio. Portanto, por (1.8),
E[kν(sU)] ∼=µm(U)P(τ 0 =∞)sd
λ. (2.20)
29
Aplicando (2.20) em (2.19), chegamos a
[t−(d+1)Ft −
µm(U)P(τ 0 =∞)
(d+ 1)λ
]P∗−→ 0 quando t→∞. (2.21)
Pelas definicoes de Xt, Ft e λt, temos (λt− λ) = Xt/Ft, e dotados desta informacao e da
convergencia de Ft expressa na equacao (2.21),
t(d+1)/2(λt − λ)D∗∼ (d+ 1)λ
µm(U)P(τ 0 =∞)t−(d+1)/2Xt,
ondeD∗∼ denota equivalencia assintotica em distribuicao sob P∗. Agora, precisamos
mostrar que t−(d+1)/2Xt e assintoticamente normal sob a distribuicao condicional P∗.
Isto e feito atraves do uso de uma condicao tipo Lindeberg, tecnicas de martingais e
estimativas de momentos. Sejam 0 = s0 < s1 < s2 < ... os instantes onde ocorrem
transicoes no processo ξ0s : 0 ≤ s ≤ t e seja Fsia σ-algebra gerada pelo processo ate o
instante aleatorio si, i ∈ Z+. Fiocco & van Zwet [7] apresentam os seguintes resultados:
n−1∑i=0
E∗[s−(d+1)/2n (Xsi+1
−Xsi)|Fsi
]≈ oP∗
(s−(d+1)/2n
) P∗−→ 0 quando n→∞, (2.22)
n−1∑i=0
Var∗[s−(d+1)/2n (Xsi+1
−Xsi)|Fsi
] P∗−→ µm(U)E[ξν(0)]d+ 1
. (2.23)
Como E[ξν(0)] = P(τ 0 = ∞) e sn → ∞ quando n → ∞, aplicando o valor esperado
em (2.22) e (2.23), o uso de tecnicas de martingais e estimativa de momentos obtemos
que
E∗[t−(d+1)/2Xt
] t→∞−→ 0, (2.24)
Var∗[t−(d+1)/2Xt
] t→∞−→ µm(U)P(τ 0 =∞)
d+ 1. (2.25)
Resta provar que a forma desta distribuicao assintotica e normal quando t→∞. Seja a
equacao abaixo, descrita em Fiocco & vam Zwet [7]: Para todo ε > 0,
n−1∑i=0
s−(d+1)n E∗
[(Xsi+1
−Xsi)2I|Xsi+1−Xsi |≥εs(d+1)/2
n
|Fsi
]P∗−→ 0 (2.26)
30
quando n→∞. Atraves da equacao (2.26), e possıvel mostrar a normalidade assintotica
gracas ao uso de uma condicao tipo Lindeberg, e assim por (2.24) e (2.25) temos que a
distribuicao assintotica de t(d+1)/2(λt − λ) e N(0, σ1,1).
Lema 2.1 (Fiocco & van Zwet [7]): Os estimadores de maxima verossimilhanca sao
consistentes, assintoticamente nao-viciados e eficientes.
Demonstracao: A consistencia e consequencia do Teorema 2.1. De fato, pelo Teorema
2.1 e o Teorema de Slutsky (ver Barry James [11], Teorema 6.4),
λt − λ = t−(d+1)/2t(d+1)/2(λt − λ)D−→ 0 quando t→∞,
e como λt − λ converge para uma constante, convergencia em distribuicao implica em
convergencia em probabilidade, logo λtP−→ λ, e assim a consistencia de λt esta provada.
A demonstracao para o estimador de maxima verossimilhanca µt de µ e analoga. O
resultado da consistencia tambem e valido para o estimador ρt de ρ.
Para demonstrarmos que os estimadores de maxima verossimilhanca sao
assintoticamente nao-viciados, utilizamos uma consequencia do Teorema Central do
Limite, pela qual os valores esperados convergem para o valor esperado da distribuicao
normal limite, dada pelo Teorema 2.1. Entao, limt→∞
E[t(d+1)/2(λt − λ)] = 0. Logo, para
t→∞,
limt→∞
E[λt]− λ = limt→∞
t−(d+1)/2E[t(d+1)/2(λt − λ)] = 0.
Portanto, λt e um estimador assintoticamente nao viciado de λ. O processo e analogo
para demonstrar que µt e um estimador assintoticamente nao-viciado de µ. Assim como
a consistencia, esta caracterıstica tambem vale para o estimador da razao das taxas de
infeccao e cura.
A demostracao da eficiencia assintotica dos estimadores de maxima verossimilhanca
e mais complexa, pois envolve resultados mais sofisticados em Fiocco & van Zwet [7].
Assim como na demonstracao do Teorema 2.1, considere as notacoes P∗, E∗ e Var∗.
31
Primeiramente, devemos modificar ligeiramente a expressao da log-verossimilhanca em
(2.7) para obter a verossimilhanca do modelo condicionado ao processo sobreviver para
sempre, adicionando o logaritmo da probabilidade do evento τ 0 = ∞ condicionado
a realizacao do processo ate o instante t. Mas, sob a condicao de sobrevivencia do
processo, o numero de sıtios infectados no instante t e de ordem td, portanto pela equacao
(1.10), a probabilidade do processo morrer apos t e de ordem exp−γtd. Assim, esse
termo e excessivamente pequeno e pode ser seguramente desprezado para instantes de
tempo relativamente grandes. De (2.11) e (2.12), obtemos as derivadas segundas da
verossimilhanca original, e logo
−∂2L(λ, µ)
∂λ2=Utλ2
, −∂2L(λ, µ)
∂µ2=Dt
µ2, −∂
2L(λ, µ)
∂λ∂µ= −∂
2L(λ, µ)
∂µ∂λ= 0.
Para a verossimilhanca condicional L∗(λ, µ) sob P∗, temos
−∂2L∗(λ, µ)
∂λ2=Utλ2
+ oP∗(1) , −∂2L∗(λ, µ)
∂µ2=Dt
µ2+ oP∗(1), (2.27)
−∂2L∗(λ, µ)
∂λ∂µ= −∂
2L∗(λ, µ)
∂µ∂λ= oP∗(1),
onde oP∗(1) e um termo de ordem 1 que tende a 0 quando t→∞ sob P∗ quase certamente.
A eficiencia assintotica do estimador λt e provada se o erro quadratico medio converge
para o inverso da informacao esperada de Fisher I∗(λ) sob P∗, com o mesmo raciocınio
aplicado para o estimador µt. Pelas expressoes em (2.15) e por λt e µt serem estimadores
assintoticamente nao-viciados de respectivamente λ e µ,
σ1,1 ≈ Var∗[t(d+1)/2(λt − λ)
]≈ t(d+1)E∗[(λt − λ)2], (2.28)
σ2,2 ≈ Var∗[t(d+1)/2(µt − µ)
]≈ t(d+1)E∗[(µt − µ)2]. (2.29)
Como o valor esperado dos martingais Xt e Yt e igual a 0, temos, por (2.2) e (2.27), que
I∗(λ, t) = E∗[−∂
2L∗(λ, µ)
∂λ2
]= E∗
[Utλ2
+ oP∗(1)
]=
E∗[Ft]λ
+ oP∗(1),
I∗(µ, t) = E∗[−∂
2L∗(λ, µ)
∂µ2
]= E∗
[Dt
µ2+ oP∗(1)
]=
E∗[Gt]
µ+ oP∗(1).
32
Sob a condicao de sobrevivencia do processo, temos a equacao (2.21) e o analogo para
Gt, que e [t−(d+1)Gt −
m(U)P(τ 0 =∞)
(d+ 1)
]P∗−→ 0 quando t→∞. (2.30)
Por (2.21) e (2.30), quando t→∞ temos que
I∗(λ, t) ≈ 1
λ× µm(U)P(τ 0 =∞)
(d+ 1)λtd+1 ⇒ lim
t→∞
I∗(λ, t)
td+1=
1
σ1,1
, (2.31)
I∗(µ, t) ≈ 1
µ× m(U)P(τ 0 =∞)
d+ 1td+1 ⇒ lim
t→∞
I∗(µ, t)
td+1=
1
σ2,2
. (2.32)
Logo, pelas equacoes (2.28), (2.29), (2.31) e (2.32),
limt→∞
td+1[I∗(λ, t)]−1 = limt→∞
td+1E[(λt − λ)2],
limt→∞
td+1[I∗(µ, t)]−1 = limt→∞
td+1E[(µt − µ)2],
e portanto os erros medios quadraticos de λt e µt apropriadamente escalonados convergem
para o inverso das respectivas medidas esperadas de informacao de Fisher, e assim
provamos que os estimadores de maxima verossimilhanca de λ e µ sao assintoticamente
eficientes, terminando a demonstracao do Lema 2.1.
A primeira vista, os resultados no Teorema 2.1 parecem nao ser de muita utilidade
pratica, pois estao sob a condicao do processo sobreviver para sempre, e observamos
tal processo apenas no intervalo [0, t]. Todavia, o Lema 1.4 garante que, para tempos
relativamente grandes, a probabilidade do processo vir a se extinguir dado que ele
sobreviveu e muito pequena – decresce em ordem exponencial conforme t aumenta.
Portanto, para tempos suficientemente grandes, a condicao τ 0 > t pode substituir a
condicao do processo sobreviver para sempre.
Um ponto a ressaltar e a presenca da medida de Lebesgue do conjunto U , m(U), nas
variancias das distribuicoes assintoticas de t(d+1)/2(λt−λ), t(d+1)/2(µt−µ) e t(d+1)/2(ρt−ρ),
cujo valor e desconhecido. O Teorema 1.2 e um resultado de existencia e nao fornece
nem a forma do conjunto U nem m(U), que dependem dos parametros, que tambem sao
desconhecidos.
33
Capıtulo 3
Estimacao via um metodo de
contagem
3.1 Metodologia de estimacao
Este metodo de estimacao e descrito no artigo de Fiocco & van Zwet [9]. A ideia deste
estimador volta-se para a situacao de equilıbrio do processo a partir de um determinado
instante de tempo relativamente grande. Do ponto de vista estatıstico, o problema de
interesse e a estimacao do parametro de infeccao λ quando apenas a configuracao presente
do processo e conhecida. O parametro de cura, neste caso, e suposto conhecido e igual
a 1, portanto nao sendo de interesse no tocante a estimacao. Isto nao e uma grande
perda, pois com uma renormalizacao temporal apropriada pode-se transformar qualquer
processo de contato em outro processo de contato com µ = 1, ou seja, reescalonando
o tempo por uma constante c > 0, se X(t) e um processo de Poisson de parametro ψ,
entao Y (t) = X(ct) e um processo de Poisson de parametro cψ. Como µ, apesar de
desconhecido, e fixo, temos c = 1µ
e transformamos o processo de contato de parametros,
digamos, (λ, µ) em um processo de contato de parametros(λµ, 1)
.
Vamos supor o conjunto inicial de sıtios infectados A = 0, ou seja, apenas a origem
infectada em t = 0. Como mencionado, o estimador para λ e baseado na configuracao
do processo apenas no instante t, nao nos interessando conhecer a historia inteira ξ0s :
0 ≤ s ≤ t, mas apenas a configuracao que temos a nossa disposicao no instante t (e
34
como se observassemos a infeccao apenas hoje, sem acompanhar o desenvolvimento da
mesma, sabendo apenas que ela teve inıcio com apenas um sıtio infectado na origem). A
distribuicao exata do estimador, digamos, λt – condicional a sobrevivencia da infeccao –
e intratavel, mas se mostrarmos que este e um estimador consistente de λ, td/2(λt − λ)
deve ter uma distribuicao limite tratavel do ponto de vista analıtico. Portanto, vamos
restringir a atencao para t suficientemente grande.
Nao existe metodo padrao para obter estimadores em casos como este. Portanto,
como ja fora comentado, usaremos a suposicao de equilıbrio do processo ξ0t para t
suficientemente grande dado que o processo sobrevive para sempre, explicada pelos
Teoremas 1.1 e 1.2. Seja um sıtio x ∈ Zd e t ≥ 0. No instante de tempo t, tal sıtio
muda do estado infectado para o estado sadio a taxa ξ0t (x), ao passo que um sıtio sadio
muda para o estado infectado a taxa λ(1− ξ0t (x))∑|x−y|=1
ξ0t (y). O Teorema 1.2 sugere
que o processo ξ0t se comporta como ξνt no interior do conjunto (1− ε)tU , e no segundo
processo a taxa de crescimento (sıtio sadio tornando-se infectado) e igual em media a
taxa de decrescimento (sıtio infectado tornando-se sadio), ou seja, para todo x ∈ Zd e
t ≥ 0,
E[ξν(x)] = E[λ(1− ξν(x))
∑|x−y|=1
ξν(y)
].
Para um conjunto arbitrario de sıtios E ⊂ Zd, defina as quantidades
nπt (E) =∑x∈E
ξπt (x) , kπt (E) =∑x∈E
(1− ξπt (x))∑|x−y|=1
ξπt (y)
(3.1)
como respectivamente o numero de sıtios infectados pertencentes ao conjunto E e o
numero de pares de sıtios vizinhos proximos com um infectado e o outro sadio, sendo o
sadio pertencente ao conjunto E, no instante t do processo com conjunto inicial de sıtios
infectados distribuıdos conforme π, em raciocınio analogo a (2.16). Temos entao que, no
conjunto E, nπt (E) define a taxa de decrescimento do processo ξπt no instante t e λkπt (E)
define a taxa de crescimento do mesmo processo em t. Como no processo ξνt as taxas
35
referidas sao iguais em media, temos, para todo E ⊂ Zd e t ≥ 0,
E[nν(E)] = E[λkν(E)]⇒ λ =E[nν(E)]
E[kν(E)]. (3.2)
Considere uma famılia de conjuntos (Dt)t>0 em Zd tal que Dt ⊂ (1 − ε)tU ∩ Zd, para
todo t > 0. Como em (1 − ε)tU o processo ξ0t atinge distribuicao segundo a medida
de equilıbrio superior quando t → ∞ – condicional a sobrevivencia do processo –, as
grandezas n0t (Dt) e λk
0t (Dt) sao assintoticamente iguais em media. Portanto, sob
uma escolha adequada de (Dt)t>0, n0t (Dt)/k
0t (Dt) e, a primeira vista, um estimador
razoavel de λ.
3.2 O uso do envoltorio convexo
Fixado ε ∈ (0, 1), um problema em definir o estimador como a razao citada no final
da secao anterior e a condicao de que a mascara Dt e, por definicao, um subconjunto de
(1−ε)tU , dependendo assim do conjunto U , que e desconhecido e depende do parametro
λ. Sobre tal conjunto, sabemos (pelo Teorema 1.2) que este contem a origem como
um ponto interior, e limitado e tambem convexo. O fato de U nao ser conhecido e
contornado com procedimentos que garantem que Dt estara contido em (1 − ε)tU com
grande probabilidade. Portanto, seja C(ξ0t ) o envoltorio convexo de ξ0t , ou seja,
C(ξ0t ) e o menor conjunto convexo em Rd que contem todos os sıtios infectados no
instante t. Temos que, para todo ε′ ∈ (0, 1), existe δ ∈(
ε′
1+ε′, 1)
tal que (1− δ)C(ξ0t ) ⊂
(1− ε)tU para ε ∈ (0, 1), pois
(1− δ)C(ξ0t ) ⊂ (1− δ)C(Ht) ⊂ (1− δ)(1 + ε′)tU = (1− ε)tU. (3.3)
Note que, como (1− δ)C(ξ0t ) ⊂ (1− ε)tU , temos (1− δ)C(ξ0t ) ∩ Zd ⊂ (1− ε)tU ∩ Zd.
Logo, (1 − δ)C(ξ0t ) ∩ Zd pertence a famılia de conjuntos (Dt)t>0 em Zd tal que Dt ⊂
(1− ε)tU ∩Zd, para todo t > 0. Vamos justificar (3.3), e para isto denotemos a mascara
Ct = (1− δ)C(ξ0t ) ∩ Zd. (3.4)
36
Como ξ0t denota o conjunto de sıtios infectados em t, temos que ξ
0t ⊂ Ht, pois Ht
contem todos os hipercubos de hipervolume 1 em Zd centrados em sıtios que estiveram
infectados em algum instante no intervalo [0, t]. Logo, C(ξ0t ) ⊂ C(Ht) e, portanto,
(1 − δ)C(ξ0t ) ⊂ (1 − δ)C(Ht), provando a primeira inclusao em (3.3). Para provarmos
a segunda inclusao em (3.3), precisamos mostrar que C(Ht) ⊂ (1 + ε′)tU . O Teorema
1.2 assegura que para todo ε′ ∈ (0, 1), o conjunto Ht esta contido em (1 + ε′)tU quase
certamente para t suficientemente grande, e como U e um conjunto limitado e convexo,
o envoltorio convexo de tU e o proprio conjunto tU . Logo, C(Ht) ⊂ (1 + ε′)tU para t
suficientemente grande. O intervalo de variacao de δ como funcao de ε′ se da devido a
(1− ε) = (1− δ)(1 + ε′). Isto implica que ε = δ(1 + ε′)− ε′, e como ε ∈ (0, 1),
δ(1 + ε′)− ε′ > 0 ⇒ δ >ε′
1 + ε′,
δ(1 + ε′)− ε′ < 1 ⇒ δ <1 + ε′
1 + ε′= 1.
Logo, δ ∈ ( ε′
1+ε′, 1).
A mascara Ct depende exclusivamente da configuracao do processo no instante t e da
constante δ. O termo (1− δ) serve para encolher o envoltorio convexo, fazendo com que
a mascara contenha apenas os sıtios nos quais o processo ja esta em equilıbrio. Esta e
a saıda para a obtencao do estimador sem a dependencia direta do conjunto U , o qual
depende de λ. Assim, o estimador via metodo de contagem do parametro λ no instante
t e dado por λ0t (Ct) = n
0t (Ct)/k
0t (Ct).
3.3 Comportamento assintotico
Uma vez definido o estimador na secao anterior, o interesse volta-se para o estudo de
seu comportamento assintotico.
Teorema 3.1 (Fiocco & van Zwet [9]): Condicionado ao processo ξ0t sobreviver para
sempre, o estimador λ0t (Ct) converge em probabilidade para λ quando t → ∞. Alem
disso, a distribuicao condicional de |Ct|d/2(λ0t (Ct) − λ) dado τ 0 = ∞ converge
fracamente para a distribuicao N(0, σ2), onde σ2 pode ser expressa em termos da medida
37
invariante ν por
σ2 = λ2
∑x∈Zd
cov[ξν0 (0), ξν0 (x)]
(E[ξν0 (0)])2+
∑x∈Zd
cov[kν0(0), kν0(x)]
(E[kν0(0)])2−
2×∑x∈Zd
cov[kν0(0), ξν0 (x)]
E[ξν0 (0)]E[kν0(0)]
,(3.5)
onde kν0(x) = λ(1− ξν0 (x))∑|x−y|=1
ξν0 (y).
A forma de expressar a variancia acima esta em Fiocco & van Zwet [8]. De
momento, voltemos a atencao para alguns comentarios importantes provenientes do
teorema enunciado.
A primeira preocupacao consiste na condicao da infeccao nunca se extinguir, que nao
pode ser verificada, pois observamos o processo apenas no instante t, desconhecendo
seu comportamento futuro. Porem, nosso interesse reside no comportamento assintotico
do estimador quando t → ∞, e sob a mesma condicao ja explicada no comportamento
assintotico dos estimadores de maxima verossimilhanca e por argumentos semelhantes,
podemos usar o Lema 1.4 para substituir o condicionamento com respeito a τ 0 =∞
por τ 0 > t.
Outro problema reside na construcao da mascara aleatoria Ct, que envolve
encolhimento do envoltorio convexo de ξ0t pelo fator (1− δ). A tecnica de encolhimento
pelo fator (1− δ) pode nos levar a uma estimativa errada se a origem da infeccao estiver
longe do centro do envoltorio convexo do conjunto de sıtios infectados em t (tambem ha
casos nos quais nao se sabe onde a infeccao comecou, isto e, em qual ponto a infeccao
se deu por iniciada). A saıda e substituir tal encolhimento por uma tecnica chamada
peeling. Como o proprio nome remete, isto e feito tomando o envoltorio convexo de ξ0t
e “descascando-o”, removendo os elementos de ξ0t do contorno L1 de C(ξ0t ), onde o
contorno L1 de um conjunto convexo S ∈ Rd e dado pelas uniao das bolas L1 centradas
nos pontos da fronteira de S, ou seja,⋃c∈∂S
B(c, 1), onde B(a, r) = z : |z − a| < r e ∂S
denota a fronteira de S. Este procedimento e repetido k vezes ate uma fracao positiva
de pontos de ξ0t ser removida, com os sıtios restantes formando uma nova mascara. O
Teorema 3.1 continua valendo da mesma forma que antes para a nova mascara obtida.
38
Exemplo 3.1 : Seja a observacao do processo ξAt : t ≥ 0 em um determinado instante
s. Os sıtios infectados em t = s encontram-se preenchidos na cor preta na Figura 3.1.
O envoltorio convexo C(ξAt ) no instante t = s, isto e, C(ξAs ), e dado pelo conjunto
delimitado pela linha preenchida, e o contorno L1 e delimitado estritamente entre as
linhas pontilhadas. A nova mascara e dada pelo subconjunto de sıtios de C(ξAs ) que nao
pertencem ao contorno L1 do referido envoltorio convexo.
Figura 3.1: Exemplo de contorno L1 do envoltorio convexo da configuracao de sıtios infectadosem um determinado instante de tempo.
A remocao de uma fracao positiva de pontos de ξ0t proximos a regiao de fronteira do
conjunto C(ξ0t ) (seja pelo uso do fator (1− δ) ou pelo peeling) e um passo fundamental
no processo de estimacao. Nos sıtios nos quais a infeccao chegou recentemente, o
processo ainda nao atingiu o equilıbrio, ponto-chave da metodologia deste estimador. A
consistencia citada no Teorema 3.1 e mantida mesmo sem remocao de sıtios em C(ξ0t ),
porem a distribuicao (assintotica) normal nao pode ser provada. E razoavel pensar que
a caracterıstica da consistencia e mantida, pois a regiao de infeccao cresce linearmente
conforme t assumindo aproxidamente a forma tU , e a proporcao de sıtios distribuıdos
conforme a medida de equilıbrio ν torna-se maior em relacao a proporcao de sıtios
39
proximos a regiao de fronteira. Portanto a influencia destes no processo de estimacao
diminui conforme t aumenta. Simulacoes computacionais mostram empiricamente que
o estimador n0t (Zd)/k
0t (Zd) subestima λ, e isto se deve a presenca de “bracos” da
regiao de sıtios infectados, que claramente implicam maior numero de pares de vizinhos
infectado-sadio. Todavia, se por um lado a remocao citada reduz o vıcio do estimador,
por outro lado aumenta a variancia do mesmo. Logo, precisamos estabelecer uma
fracao positiva de pontos removidos que nao prejudique o estimador no tocante a sua
variancia. Remover cerca de 30 % dos pontos de ξ0t produz estimativas convincentes
de λ, como testado pelas nossas simulacoes (ver Tabelas 3.1 e 3.2). Temos tambem que
uma proporcao menor de pontos precisa ser descartada para valores altos de λ e/ou t.
Para valores de λ proximos do valor crıtico, a estimacao e mais delicada e sujeita a erros
maiores (algumas destas questoes acima serao empiricamente testadas neste capıtulo,
quando tratarmos dos resultados obtidos em simulacao). Como a tecnica de peeling nao
necessita de conhecimento (ou estimacao) da origem da infeccao, este metodo e preferıvel
ao encolhimento pelo fator (1− δ).
Por fim, tanto o estimador quanto suas propriedades assintoticas aqui descritas nao
se alteram se o processo ξ0t for substituıdo por ξAt , para A finito. A diferenca e que
teremos , dependendo do conjunto A, que esperar um tempo maior para termos a regiao
em equilıbrio reconhecıvel, pois se temos pontos (ou conjuntos de pontos) distantes um
do outro, teremos, a princıpio, regioes de infeccao disjuntas, e quando enfim estas se
encontrarem, teremos mais cedo ou mais tarde a regiao com o equilıbrio desejado.
3.4 Estabelecendo o teorema
Nesta secao nao apresentaremos a demonstracao do Teorema 3.1, mas sim a ideia dos
principais passos que demonstram as propriedades garantidas por este teorema.
O teorema em questao volta-se para a distribuicao condicional da estatıstica λ0t (Ct)
– apos devida normalizacao – dado que o processo sobrevive para sempre quando t→∞.
Pelo Teorema 1.2 e por (3.3), a mascara Ct = (1−δ)C(ξ0t )∩Zd esta contida em (1−ε)tU
para todo t suficientemente grande quase certamente com respeito a distribuicao do
40
processo. Entretanto, a mascara Ct e aleatoria e depende dos limites do conjunto C(ξ0t ),
para o qual o Teorema 1.2 nao garante que esteja contido em (1 − ε)tU para qualquer
ε ∈ (0, 1) quase certamente. Porem, o resultado a seguir assegura que o envoltorio
convexo do processo ξ0t possui o mesmo comportamento assintotico de Ht e Ht ∩Kt.
Lema 3.1 : Para todo ε ∈ (0, 1),
(1− ε)tU ⊂ C(ξ0t ) ⊂ (1 + ε)tU (3.6)
quase certamente a partir de um determinado instante de tempo suficientemente grande
e sob a condicao do processo sobreviver para sempre.
Tal resultado e compreensıvel no sentido de que a relacao de inclusao entreHt (ondeHt
e Kt sao definidos em (1.11)) e o envoltorio convexo do processo em t e C(ξ0t ) ⊂ C(Ht),
conforme visto na Secao 3.2. Portanto, pelo Teorema 1.2, C(ξ0t ) ⊂ (1 + ε)tU para
t suficientemente grande, quase certamente. A outra relacao de inclusao em (3.6) nao
pode ser provada com os resultados obtidos ate aqui. Porem, o resultado abaixo assegura
que, dado que a infeccao nunca se extingue, a probabilidade de (1 − ε)tU estar contido
em C(ξ0t ) tende a 1 quando t→∞, e assim provamos ambas as relacoes de inclusao em
(3.6).
Lema 3.2 (Fiocco & van Zwet [6]): Para todo ε ∈ (0, 1) e r > 0, existe um numero
positivo Ar,ε tal que, para todo t ≥ 0,
P((1− ε)tU ⊂ Ht ∩Kt|τ 0 =∞) ≥ 1− Ar,εt−r,
P((1− ε)tU ⊂ C(ξ0t )|τ 0 =∞) ≥ 1− Ar,εt−r.
Com base no Lema 3.1, primeiramente vamos provar uma versao do Teorema 3.1
substituindo Ct por uma mascara nao-aleatoria Att≥0 que esteja sempre contida em
(1− ε)tU ∩Zd e com a condicao |At| → ∞ conforme t→∞. Uma vez que se demonstre
as caracterısticas de consistencia e normalidade assintotica para o estimador baseado
na mascara At, denotado por λ0t (At), tais caracterısticas sao aplicaveis tambem ao
estimador baseado na mascara aleatoria Ct quando t → ∞. De fato, pelo Lema 3.1,
41
podemos fazer Ct limitado por (1− δ)(1− ε)tU e (1− δ)(1 + ε)tU com ε→ 0. Logo, para
todo t suficientemente grande, o conjunto Ct tem o comportamento de At exceto por um
conjunto de probabilidade pequena.
O estimador tomado sobre At – dado que a infeccao sobrevive para sempre – depende
apenas de ξ0t ∩ (1 − ε)tU e, pelo Teorema 1.2, podemos substituir ξ
0t por ξZd
t , pois
(1−ε)tU ⊂ Ht∩Kt ⊂ (1+ε)tU implica que as configuracoes dos processos ξ0t e ξZd
t sao,
com grande probabilidade, iguais no interior do conjunto (1−ε)tU para t suficientemente
grande. Uma vez realizada a substituicao acima, o processo de interesse e ξZd
t |τ 0 =∞.
Entretanto, para tempos suficientemente grandes, podemos substituir ξZd
t |τ 0 = ∞
pelo processo ξZd
t . Isto e consequencia da proposicao abaixo.
Proposicao 3.1 (Fiocco & van Zwet [6]): Seja o processo de contato ξZd
t : t ≥ 0.
A distribuicao condicional de ξZd
t dado que o processo sobrevive para sempre converge
fracamente para a distribuicao de ξZd
t quando t→∞.
Demonstracao: Para demonstrar a Proposicao 3.1, seja s um instante de tempo fixo
no intervalo (0, t) e considere o processo ξ′t : t ≥ s, com t = s como instante
inicial e configuracao com todos os sıtios infectados em Zd neste referido instante. Pela
atratividade, o processo ξZd
t |τ 0 > s esta contido em ξ′t para todo t ≥ s (ambos os
processos acoplados conforme a representacao grafica em t ≥ s). Portanto,
P(ξZd
t (x) = 1|τ 0 > s) ≤ P(ξZd
t−s(x) = 1). (3.7)
Pelo Lema 1.3, P(ξZd
t−s(x) = 1)−P(ξνt−s(x) = 1) ≤ Ce−γ(t−s). Logo, pela estacionariedade
do processo ξνt : t ≥ 0,
P(ξZd
t−s(x) = 1) ≤ P(ξν(x) = 1) + Ce−γ(t−s). (3.8)
Novamente, por acoplamento, obtemos P(ξν(x) = 1) ≤ P(ξZd
t (x) = 1), e assim por (3.7)
e (3.8),
P(ξZd
t (x) = 1|τ 0 > s) ≤ P(ξZd
t (x) = 1) + Ce−γ(t−s). (3.9)
Continuando a analisar o processo ξZd
t para instantes superiores a s, dado que o
42
processo sobrevive pelo menos ate s, obtemos
P(ξZd
t (x) = 1|τ 0 > s) =P(ξZd
t (x) = 1 ∩ τ 0 > s)P(τ 0 > s)
≥
≥ P(ξZd
t (x) = 1 ∩ τ 0 =∞)P(τ 0 > s)
=P(ξZd
t (x) = 1)P(τ 0 =∞)
P(τ 0 > s), (3.10)
com ξZd
t denotando o processo ξZd
t |τ 0 = ∞. A desigualdade acima e trivial, pois
τ 0 > s ⊃ τ 0 =∞. Desenvolvendo a ultima parcela de (3.10),
P(ξZd
t (x) = 1)P(τ 0 =∞)
P(τ 0 > s)= P(ξ
Zd
t (x) = 1)P(τ 0 > s)− P(s < τ 0 <∞)
P(τ 0 > s)
= P(ξZd
t (x) = 1)
[1− P(s < τ 0 <∞)
P(τ 0 > s)
],
e pela equacao (1.9),
P(ξZd
t (x) = 1)
[1− P(s < τ 0 <∞)
P(τ 0 > s)
]≥ P(ξ
Zd
t (x) = 1)
[1− Ce−γs
P(τ 0 > s)
]≥
≥ P(ξZd
t (x) = 1)
[1− Ce−γs
P(τ 0 =∞)
]≥ P(ξ
Zd
t (x) = 1)− C ′e−γs, (3.11)
com C ′ = C/P(τ 0 = ∞), onde a segunda e terceira inequacoes sao validas devido a
τ 0 > s ⊃ τ 0 =∞ e P(ξZd
t (x) = 1) ≥ 0. Portanto, de (3.10) e (3.11), obtemos que
P(ξZd
t (x) = 1|τ 0 > s) ≥ P(ξZd
t (x) = 1)− C ′e−γs. (3.12)
Unindo as equacoes (3.9) e (3.12), temos
P(ξZd
t (x) = 1)− C ′e−γs ≤ P(ξZd
t (x) = 1) + Ce−γ(t−s),
daı
P(ξZd
t (x) = 1)− P(ξZd
t (x) = 1) ≤ Ce−γ(t−s) + C ′e−γs, (3.13)
43
para 0 < s < t. Em particular, se s = t/2, temos
P(ξZd
t (x) = 1)− P(ξZd
t (x) = 1) ≤ (C + C ′)e−γt.
Ou seja, a distribuicao de ξZd
t = ξZd
t |τ 0 = ∞ se aproxima da distribuicao
do processo ξZd
t quando t → ∞ desde que P(ξZd
t (x) = 1) ≤ P(ξZd
t (x) = 1), ou
equivalentemente,
E[ξZd
t (x)] ≤ E[ξZd
t (x)]. (3.14)
Isto sendo provado tambem implica que a velocidade da convergencia de ξZd
t |τ 0 =∞
para ξZd
t e de ordem exponencial. Porem, Fiocco & van Zwet [6] mostram que ξAtst
≤ ξAt
para qualquer A ⊂ Zd, onde ξAt denota o processo condicional ξAt |τ 0 = ∞. Os
principais passos da demonstracao deste resultado podem ser encontrados no artigo acima
referido. A demonstracao completa e extensa e a omitiremos no presente trabalho. Uma
vez que a funcao f na definicao de processos estocasticamente dominados em (1.4) seja
f(ξ) = ξ(x), obtemos (3.14) e provamos a Proposicao 3.1.
Agora fixamos uma mascara nao-aleatoria Att≥0 tal que At ⊂ (1 − ε)tU ∩ Zd,
para todo t e |At| → ∞ quando t → ∞. Pelo Teorema 1.2 e pela Proposicao 3.1,
reduzimos o problema de trabalhar com o processo ξ0t |τ 0 = ∞ pelo processo ξZd
t ,
que e relativamente facil de se manejar. Em analogia a (3.1), definimos
nZd
t (At) =∑x∈At
ξZd
t (x) , kZd
t (At) =∑x∈At
(1− ξZd
t (x))∑|x−y|=1
ξZd
t (y)
e o estimador
λZd
t (At) = nZd
t (At)/kZd
t (At),
entao provar a versao do Teorema 3.1 para a mascara nao-aleatoria At se reduz a provar
os mesmos resultados – sem a condicao de sobrevivencia do processo – para λZd
t (At). Pelo
Lema 1.3, tal processo se comporta como ξνt quando t → ∞, e por (3.2) com E = x
44
temos que, para todo t ≥ 0 e x ∈ Zd,
λ =E[nν(x)]
E[kν(x)]=
E[nν(0)]
E[kν(0)],
pois o processo ξνt e espacialmente invariante a translacoes. O processo ξZd
t tambem
apresenta esta caracterıstica. Agora, seja o resultado a seguir:
Proposicao 3.2 (Fiocco & van Zwet [8]): Suponha que para t ≥ 0, os conjuntos At ⊂ Zd
satisfacam At ⊂ At′ se t < t′, |At| <∞ e |At| → ∞ para t→∞. Entao, quando t→∞,
nZd
t (At)
|At|P−→ E[ξν(0)], (3.15)
kZd
t (At)
|At|P−→ E[kν(0)]. (3.16)
Alem disto, se
lim inft→∞
|At|tδ
> 0 para algum δ > 0, (3.17)
entao, quando t→∞,
nZd
t (At)
|At|→ E[ξν(0)] quase certamente, (3.18)
kZd
t (At)
|At|→ E[kν(0)] quase certamente. (3.19)
A Proposicao 3.2 nos permite provar a consistencia (fraca e forte) estabelecida pelo
Teorema 3.1, pois
λZd
t (At) =nZd
t (At)
kZd
t (At)=
nZd
t (At)
|At|
kZdt (At)
|At|
P−→ E[nν(0)]
E[kν(0)]= λ quando t→∞. (3.20)
A ultima convergencia em (3.20) e valida pelo Teorema de Slutsky. Vamos agora
demonstrar as convergencias em probabilidade da Proposicao 3.2. Para isto, precisamos
de estimativas dos momentos dos desvios em torno da media de nZd
t (At) e kZd
t (At).
Portanto, considere a proposicao a seguir:
45
Proposicao 3.3 (Fiocco & van Zwet [8]): Para qualquer k ∈ Z+, existe um numero
positivo Ck tal que para todo D ⊂ Zd e t ≥ 0,
E[(nZd
t (D)− E[nZd
t (D)])2k]≤ Ck|D|k,
E[(kZd
t (D)− E[kZd
t (D)])2k]≤ Ck|D|k.
A demonstracao de (3.16) e analoga a demonstracao de (3.15). Pela desigualdade de
Markov e pela Proposicao 3.3, temos
P
(∣∣∣∣∣nZd
t (At)
|At|− E[nZd
t (At)]
|At|
∣∣∣∣∣ ≥ ε
)≤ 1
ε2kE
∣∣∣∣∣nZd
t (At)
|At|− E[nZd
t (At)]
|At|
∣∣∣∣∣2k =
=
E[∣∣∣nZd
t (At)− E[nZd
t (At)]∣∣∣2k]
ε2k|At|2k≤ Ck|At|k
ε2k|At|2k= Ck,ε|At|−k,
para k ∈ Z+. Como |At| → ∞ quando t→∞,
limt→∞
P
(∣∣∣∣∣nZd
t (At)
|At|− E[nZd
t (At)]
|At|
∣∣∣∣∣ ≥ ε
)= 0.
Logo,nZd
t (At)
|At|− E[nZd
t (At)]
|At|P−→ 0 quando t→∞,
e pela invariancia por translacoes do processo ξZd
t e pelo Lema 1.3,
E[nZd
t (At)]
|At|=
∑x∈At
E[ξZd
t (0)]
|At|= E[ξZd
t (0)]→ E[ξν(0)].
Dessa forma,nZd
t (At)
|At|P−→ E[ξν(0)] e provamos (3.15), com demonstracao analoga para
(3.16). A demonstracao da convergencia quase certa em (3.18) e (3.19) e apresentada em
Fiocco & van Zwet [8].
De posse da Proposicao 3.2 e por Ct respeitar o comportamento de At quando t→∞
conforme ja explicado pelo Lema 3.1, estamos em posicao de enunciar a consistencia do
46
estimador tomado sobre a mascara aleatoria Ct no teorema a seguir, encerrando nossos
comentarios sobre o estabelecimento da consistencia do estimador λ0t (Ct). Observe que
a condicao (3.17) na Proposicao 3.2 e satisfeita quase certamente por Ct para δ < 1, pois
|Ct| e de ordem td para t suficientemente grande pelo Teorema 1.2.
Teorema 3.2 (Fiocco & van Zwet [8]): Seja λ0t (Ct) o estimador de λ para o processo
ξ0t tomado sobre a mascara Ct definida em (3.4). Entao, no conjunto onde ξ
0t sobrevive
para sempre,
λ0t (Ct)→ λ quase certamente.
Em relacao a normalidade assintotica do estimador λZd
t (At) para a mascara nao
aleatoria, um resultado importante para estabelece-la e o decaimento exponencial das
correlacoes de funcoes nao-decrescentes de ξZd
t com respeito a distancia entre os suportes
destas funcoes. Antes de enunciar o resultado, precisamos apresentar algumas notacoes.
Consideramos a distancia L1 entre dois conjuntos R1, R2 ⊂ Zd por
d(R1, R2) = infx∈R1,y∈R2
|x− y| = infx∈R1,y∈R2
d∑i=1
|xi − yi|.
Para duas configuracoes η1, η2 ⊂ Ω, uma funcao nao-decrescente f : Ω → R e x ∈ Zd,
defina
∆f (x) = sup|f(η1)− f(η2)| : η1, η2 ∈ Ω e η1(y) = η2(y),∀y 6= x.
Agora, ponha
|||f ||| =∑x∈Zd
∆f (x).
Para fixar a notacao, vamos considerar um exemplo:
Exemplo 3.2 : Considere a funcao f : Ω → R dada por fN(η) =∑x∈ΛN
η(x), onde ΛN e
a caixa −N, ..., Nd. Temos entao
∆fN(x) =
1 , se x ∈ ΛN
0 , caso contrario .
47
e
|||fN ||| =∑x∈Zd
∆fN(x) = (2N + 1)d.
Por fim, seja DR a classe de funcoes nao-decrescentes f : Ω→ R com |||f ||| <∞ tal
que a funcao f aplicada na configuracao η dependa de η apenas nos sıtios em R ∈ Zd.
Proposicao 3.4 (Fiocco & van Zwet [6]): Existem constantes positivas C e γ tais que,
para todo R1, R2 ⊂ Zd, f ∈ DR1, g ∈ DR2 e t ≥ 0,
|cov(f(ξZd
t ), g(ξZd
t ))| ≤ C|||f ||||||g|||e−γd(R1,R2),
onde ξZd
t denota o processo de contato de parametros (λ, 1) com todos os sıtios da grade
infectados em t = 0.
Claramente, a Proposicao 3.4 mostra que, quanto maior a distancia entre os
conjuntos R1 e R2, menor sera a correlacao entre as configuracoes contidas em tais
conjuntos. Isto assegura um grau suficiente de independencia entre termos de somas
como nZd
t (At) e kZd
t (At), e junto com cotas para seus momentos, isto garante que o
Teorema Central do Limite funcionara para ambas as somas apos devida normalizacao,
pois sao verificadas condicoes de versao geral do Teorema Central do Limite para campos
aleatorios invariantes por translacao obtidos por Bolthausen [2]. Assim, quando t→∞,
a distribuicao de |At|d/2(λZd
t (At) − λ) e aproximadamente normal sob a condicao de
sobrevivencia da infeccao.
Todavia, para que a normalidade assintotica seja aplicavel para o estimador baseado
na mascara aleatoria Ct, uma versao da Proposicao 3.4 deve ser valida para o processo
ξ0t dado que τ 0 =∞. Seja a Proposicao abaixo.
Proposicao 3.5 (Fiocco & van Zwet [6]): Para todo ε ∈ (0, 1) e r > 0, existe um
numero positivo Ar,ε e constantes positivas C e γ tais que para todo t > 0 e toda f e g
48
satisfazendo f ∈ DR1 com R1 ⊂ (1− ε)tU ∩ Zd e g ∈ DR2 com R2 ⊂ Zd,
|cov(f(ξ
0t ), g(ξ
0t ))| ≤ |||f ||||||g|||(Ce−γd(R1,R2) + Ar,εt
−r), (3.21)
onde ξ0t denota o processo ξ
0t condicionado ao evento τ 0 =∞.
O resultado acima apresentada um decaimento da correlacao suficiente em relacao
a distancia entre os suportes das funcoes nao-decrescentes f e g em ξ0t e em relacao
ao tempo. Portanto, seja a proposicao acima com R1 = Ct ∩ ξ0t : x ∈ (1 − ε)tU e
R2 = Ct∩ξ0t : x 6∈ (1−ε/2)tU. A distancia entre estes conjuntos aumenta conforme t
cresce, entao o segundo membro da inequacao (3.21) converge para zero. Com o passar do
tempo, o decaimento governado pelo termo polinomial torna-se cada vez mais dominante
em relacao ao decaimento governado pelo termo exponencial. No limite, quando t→∞, o
decaimento das correlacoes de funcoes nao-decrescentes de ξ0t e polinomial. Entretanto
isto basta para provar que, no limite, quando t → ∞, Ct apresenta comportamento
similar a mascara nao-aleatoria At, pois a contribuicao dos sıtios em (1+ε)tU \ (1−ε)tU
com respeito a |Ct|d/2(λ0t (Ct)−λ) e desprezıvel. Dessa forma, |Ct|d/2(λ
0t (Ct)−λ) tem
distribuicao assintoticamente normal de media 0 quando t→∞. A variancia assintotica
σ2 expressa em (3.5) e tambem obtida do Teorema Central do Limite de Bolthausen [2].
3.5 Comparacao de estimadores
O metodo de estimacao visto neste capıtulo possui maior difusao nas referencias
consultadas em relacao a estimacao por maxima verossimilhanca. O principal fator e que
os estimadores de maxima verossimilhanca estao baseados em toda a historia do processo
no intervalo [0, t], enquanto o estimador para a taxa de infeccao visto neste capıtulo
depende somente da configuracao do processo no instante t, nao importando quantas e
quais transicoes ocorreram para que tal configuracao fosse alcancada. Do ponto de vista
computacional, a estimacao via metodo de contagem e mais simples de ser implementada
em relacao a estimacao por maxima verossimilhanca, pois basta obter a configuracao do
processo para o instante t. Uma vez obtida tal configuracao, aplica-se alguma tecnica
49
para a retirada dos sıtios proximos a fronteira do envoltorio convexo do processo e, desta
nova configuracao, calculamos o numero de sıtios infectados e o numero de vizinhos que
apresentam estados diferentes. A razao destas quantidades retorna uma estimativa de λ.
Para o calculo dos estimadores de maxima verossimilhanca, a cada transicao ocorrida,
e necessario contar os saltos ascendentes e descendentes ocorridos. Alem disso, obter as
taxas integradas Ft e Gt e ainda mais trabalhoso, pois a cada mudanca, precisarıamos
calcular o numero de sıtios infectados (para Ft) e o numero de vizinhos com estados
diferentes (para Gt), alem de conhecer e anotar os instantes de transicao.
A questao de trabalho computacional e da construcao de algoritmos para simular
processos de contato e um ponto fundamental, pois atraves destas simulacoes podemos
verificar empiricamente questoes teoricas aqui citadas, como: observar se, com o metodo
de estimacao programado, a estimativa esta proxima do valor real do parametro; a forma
que a infeccao toma, dando assim a ideia da forma do conjunto U ; entre outras. A
diferenca mencionada acima tambem tem sua importancia pratica, pois acompanhar
toda a historia de um fenomeno natural pode ser cara ou ate mesmo impossıvel.
Outro problema e que ambas as variancias nao podem ser determinadas
explicitamente. Para os estimadores de maxima verossimilhanca, quando t → ∞, tanto
a matriz de covariancias Σ da distribuicao N(0,Σ) de(t(d+1)/2(λt − λ) , t(d+1)/2(µt −
µ))
quanto a variancia σ2ρ da distribuicao N(0, σ2
ρ) de t(d+1)/2(ρt − ρ) dependem da
probabilidade do processo nunca se extinguir (a qual e desconhecida) e da medida
de Lebesgue do conjunto U (definido pelo Teorema 1.2). A forma que este conjunto
assume depende do processo, que por sua vez depende dos parametros. Logo, m(U) e
desconhecido e depende de (λ, µ). Para o estimador via metodo de contagem, a forma
pela qual a variancia e expressa depende de covariancias e primeiros momentos tomados
sobre a medida invariante ν, que e desconhecida.
Por fim, a estimacao via metodo de contagem apresenta a vantagem de reducao nos
parametros a serem estimados, pois qualquer processo de contato de parametros (λ′, µ′)
pode se transformar em um processo de contato de parametro (λ, 1) atraves de devida
renormalizacao temporal (conforme visto na Secao 3.1), e desta forma nao temos uma
grande perda.
50
3.6 Resultados
Nesta secao trataremos dos resultados obtidos em simulacao. O algoritmo, feito no
programa Ox, encontra-se no Apendice A da presente dissertacao. Tal algoritmo utiliza
o parametro de infeccao λ e o instante de tempo T como suas entradas. O processo de
contato em Z2 de parametros (λ, 1) com A = (0, 0) desenvolve-se ate o instante T ,
e assim temos a configuracao neste instante de tempo como dado de saıda. Esta saıda
possibilita a geracao da figura da configuracao, conforme vemos nas Figuras 3.2 e 3.3.
Para os sıtios que encontram-se no estado infectado no instante T , quadrados de lado
unitario centrados nestes sıtios sao plotados e preenchidos na cor preta (ideia similar a
usada na Secao 1.4).
Figura 3.2: Amostra da configuracao de um processo de contato com parametros λ = 2 e µ = 1no instante T = 20.
Para cada par de entradas (λ, T ), foram realizadas 15 replicacoes do processo de
contato de parametros (λ, 1) em um determinado intervalo [0, T ]. Cada replicacao esta
sujeita a uma representacao grafica diferente, pois e caracterizada pela mudanca da
semente (ranseed) no programa, a qual e responsavel pela geracao dos tempos de infeccao
e cura. Portanto, temos uma amostra de 15 observacoes (configuracoes) para cada par
51
Figura 3.3: Amostra da configuracao de um processo de contato com parametros λ = 3 e µ = 1no instante T = 20.
de entradas. Os valores de λ escolhidos foram: λ = 2, λ = 3 e λ = 5. Como a
dimensao da grade e d = 2, temos que o valor crıtico esta situado no intervalo[
13
; 1], e
portanto os valores escolhidos para λ remetem que todas as simulacoes realizadas estao
situadas no caso supercrıtico, ou seja, a probabilidade da infeccao nunca se extinguir
e estritamente positiva. Os instantes escolhidos para observarmos a configuracao dos
processos simulados foram: T = 5, T = 10 e T = 20 (este ultimo exceto para
λ = 5). Como a condicao de sobrevivencia da infeccao e essencial para nossos propositos,
simulacoes nas quais a infeccao nao sobreviveu foram descartadas e outras sementes
foram utilizadas no lugar das sementes relativas aos processos que vieram a se extinguir.
Esta situacao ocorreu apenas em simulacoes com λ = 2, em duas replicacoes, onde a
configuracao ξ0T = ∅ ocorre para T = 5, e obviamente tambem ocorre para T = 10 e
T = 20.
Pela Figuras 3.2 e 3.3, temos a ideia da forma do conjunto U apresentado no Teorema
da Forma (Teorema 1.2), pois a regiao de sıtios infectados deve ter a forma aproximada
de 20U , com probabilidade alta. Conforme comentado no Capıtulo 3, o conjunto U
depende de λ, e empiricamente vemos que, no segundo caso (λ = 3), tal conjunto e
52
maior quando comparado ao primeiro caso (λ = 2). O crescimento da infeccao e linear
e tem simetria radial em torno da origem da mesma, ou seja, a area de infeccao cresce
em todos os sentidos. As Figuras 3.4, 3.5 e 3.6 transmitem a ideia da evolucao da
infeccao com o passar do tempo (para cada uma das tres figuras, a mesma semente foi
utilizada para todas as configuracoes). Como o desenvolvimento da infeccao e governado
pela aleatoriedade dos processos de Poisson segundo a representacao grafica de Harris,
e importante reforcar que a figura gerada pode apresentar um comportamento no qual
o centro da area de sıtios infectados esteja, de maneira mais perceptıvel, fora da origem
da infeccao. Todavia, esta distancia e de ordem oP(t) sob o condicionamento da infeccao
sobreviver para sempre. Este contratempo pode afetar o estimador quando e realizado o
encolhimento pelo fator (1− δ), mas e indiferente se utilizarmos a tecnica de peeling. As
Tabelas 3.1 e 3.2 descrevem media e desvio padrao amostral dos processos simulados, com
e sem peeling. Seguindo a proposta em Fiocco & van Zwet [9], programamos o peeling
para retirar em torno de 30% dos sıtios infectados mais proximos da regiao de fronteira
da configuracao ξ0T .
Figura 3.4: Amostra de um processo de contato de parametros (2, 1) para instantes de tempoT = 5, T = 10 e T = 20.
A ideia principal dos resultados de nossas simulacoes e verificar se o estimador
estudado no Capıtulo 3 produz de fato estimativas confiaveis para o parametro de
infeccao, ou em outras palavras, nosso objetivo principal e verificar empiricamente
53
Figura 3.5: Amostra de um processo de contato de parametros (3, 1) para instantes de tempoT = 5, T = 10 e T = 20.
Figura 3.6: Amostra de um processo de contato de parametros (5, 1) para instantes de tempoT = 5 e T = 10.
o estimador apresentado no Capıtulo 3. Primeiramente, note que ao compararmos
as Tabelas 3.1 e 3.2, verifica-se que o estimador tomando por base toda a grade Z2
subestima o valor real do parametro de infeccao, ao passo que utilizando peeling, os valores
computados para o estimador estao claramente mais proximos de λ. Note tambem que
na Tabela 3.2 temos o erro absoluto entre o parametro e a media amostral das estimativas
decrescendo conforme o tempo T aumenta. Portanto, os resultados obtidos mostram forte
indıcio no tocante a consistencia do estimador (interessante notar que tal comportamento
54
Tabela 3.1: Medias e desvios padroes amostrais das estimativas de cada grupo deamostras de processos simulados com os mesmos valores de λ e T considerando todaa grade bidimensional.
Parametro Tempo Media Amostral D.P. Amostral
5 1,4086 0,0933λ = 2 10 1,6305 0,0735
20 1,8222 0,03765 2,1209 0,1313
λ = 3 10 2,4848 0,074520 2,7352 0,0679
λ = 5 5 3,5488 0,170810 4,1477 0,0752
Tabela 3.2: Medias e desvios padroes amostrais das estimativas de cada grupo deamostras de processos simulados com os mesmos valores de λ e T utilizando peeling.
Parametro Tempo Media Amostral D.P. Amostral
5 1,8996 0,1917λ = 2 10 1,9550 0,1019
20 2,0132 0,04885 2,9562 0,2949
λ = 3 10 2,9854 0,119220 3,0105 0,0564
λ = 5 5 4,8876 0,302110 4,9279 0,1385
tambem ocorre quando nao utilizamos tecnica de encolhimento, conforme Tabela 3.1).
Outro fator de destaque nas tabelas em questao reside nos desvios das estimativas sem
peeling serem menores do que os desvios das estimativas com peeling. Esta situacao
foi mencionada na Secao 3.3, ao relatar que tecnicas de encolhimento diminuem o vıcio
negativo, mas aumentam a variancia. Tal comportamento so nao foi observado no caso
λ = 3 e T = 20, mas com diferenca relativamente pequena comparada aos demais casos.
Analisando as tabelas separadamente, em ambas o desvio padrao diminui conforme o
tempo cresce. Portanto, pelas simulacoes realizadas, o estimador se aproxima do valor
real do parametro – consistencia – conforme o passar do tempo, enquanto o desvio padrao
das estimativas observadas decresce. Ainda em relacao ao desvios, se fixarmos o tempo,
em ambas as tabelas o desvio aumenta conforme o parametro de infeccao cresce.
55
As distribuicoes empıricas do estimador para λ = 2, λ = 3 e λ = 5 nos instantes de
tempo analisados podem ser verificadas nos histogramas das Figuras 3.7 (sem peeling)
e 3.8 (com peeling). O comportamento das estimativas sem o uso de peeling mostra
maior concetracao em torno de valores menores que o valor do parametro. Conforme
o passar do tempo, esta concentracao esta se aproximando ao valor real do parametro.
Todavia, tal convergencia e demorada, conforme comentado na Secao 3.3. A dispersao das
estimativas tende a decrescer com o passar do tempo, pois tanto o valor maximo quanto
o valor mınimo entre as estimativas aumentam, e o primeiro sofre maior incremento.
No caso das estimativas com o uso de peeling, espera-se que a maior concentracao de
pontos esteja proxima ao valor do parametro (o final do ultimo paragrafo remete a esse
comportamento). De fato, isto se observa na maior parte dos histogramas na Figura 3.8.
Nestes, repare que a dispersao das estimativas em torno da media decresce conforme o
passar o tempo em todos os casos (λ = 2, λ = 3 e λ = 5), e esta concentracao esta
cada vez mais proxima do valor real do parametro. Diferentemente do caso sem peeling,
o valor mınimo cresce ao passo que o valor maximo decresce no tocante a reducao da
dispersao atraves do tempo.
Portanto, a presente secao mostrou, atraves dos resultados obtidos em simulacao,
diversos pontos abordados da teoria estudada na literatura sobre processos de contato,
como:
• A relacao de dependencia do conjunto U apresentado pelo Teorema 1.2 com o
parametro de infeccao λ, assim como sua forma radial em torno da origem da
infeccao;
• O crescimento da infeccao a taxa constante ocorrendo em todas as direcoes,
assumindo aproximadamente, no instante de tempo t, a forma de tU , o que tambem
e assegurado pelo Teorema 1.2;
• A eficiencia do uso do peeling, retirando cerca de 30% dos sıtios infectados mais
proximos da regiao de fronteira da configuracao ξ0T , produzindo estimativas mais
convincentes de λ. Ao calcularmos o estimador sobre toda a grade bidimensional,
obtivemos valores para as estimativas que claramente subestimam o valor real do
56
Figura 3.7: Distribuicoes empıricas para as estimativas sem peeling.
parametro de infeccao;
• A consistencia assegurada pelo Teorema 3.1, onde foi utilizada a media amostral
das estimativas obtidas pelas replicacoes como estatıstica suficiente. Ainda sobre a
consistencia, evidencia-se que esta ainda se mantem mesmo sem uso de tecnicas de
encolhimento, porem com convergencia mais demorada;
• Aumento da variancia com o uso da tecnica de peeling em relacao a variancia das
estimativas tomadas sem uso de encolhimento exceto em um dos casos analisados,
57
Figura 3.8: Distribuicoes empıricas para as estimativas com peeling.
no qual o decrescimo e relativamente pequeno.
58
Capıtulo 4
Processos com imunizacao
4.1 Dinamica do processo
Neste capıtulo, apresentaremos um diferente modelo de propagacao de epidemias.
Em tal modelo, alem dos estados sadio e infectado, temos tambem o estado imune:
quando um sıtio infectado se cura, este nao se torna novamente sadio, mas sim imune
(nao esta mais infectado e nao pode mais contrair a infeccao). A principal referencia e o
trabalho de Cox & Durrett [3]. Como este tipo de modelo nao e o alvo principal desta
dissertacao, apresentaremos apenas a ideia deste processo e alguns dos resultados mais
relevantes. Sugerimos tambem um estimador para o parametro de infeccao e testamos o
seu comportamento com simulacoes do processo.
Primeiramente, cada sıtio z ∈ Z2 esta em um dentre tres estados: 0 (sadio); 1
(infectado); e i (imune). Denotaremos por ηt(x) o estado do sıtio x no instante t. A
dinamica do processo com imunizacao ocorre da seguinte forma: uma vez infectado, um
sıtio x ∈ Z2, independentemente de qualquer outro sıtio, espera tempos exponencias
independentes de parametro λ associados a cada um de seus quatro vizinhos mais
proximos e, apos cada um desses tempos, se ainda infectado, transmite a infeccao ao
respectivo vizinho. Quando tal infeccao atinge um sıtio sadio, este torna-se infectado.
Independentemente, um sıtio infectado permanece neste estado por um tempo aleatorio
com distribuicao exponencial de parametro 1, e quando o perıodo de infeccao acaba,
este sıtio torna-se imune a qualquer infeccao futura. O referido artigo ainda cita
59
uma interessante analogia do uso deste processo com um modelo probabilıstico para
a propagacao de incendios em florestas: o estado 0 (sadio) denota uma arvore (ainda)
nao atingida pelo fogo; 1 (infectado) denota uma arvore que esta em chamas, desta forma
podendo “transmitir” o fogo para uma arvore vizinha; e i (imune) representa uma arvore
ja queimada, morta, que sequer tem condicoes de transmitir o incendio.
De posse das descricoes dos paragrafos acima, vamos apresentar nas proximas secoes
deste capıtulo alguns dos principais resultados teoricos da literatura relativa a processos
com imunizacao.
4.2 Percolacao
Para cada sıtio x ∈ Zd, sejam as variaveis aleatorias independentes e identicamente
distribuıdas Tx ∼ Exp(1) denotando o tempo de permanencia da infeccao no sıtio x.
Em outras palavras, Tx e o tempo decorrente do instante em que o sıtio x recebe a
infeccao de um vizinho ate o instante em que x se torna imune. Definamos tambem,
para x, y ∈ Z2 tal que |x − y| = 1, variaveis aleatorias independentes e identicamente
distribuıdas e(x, y) ∼ Exp(λ), que denotam o tempo decorrente do instante em que o
sıtio x torna-se infectado ate o intante no qual este tenta infectar o sıtio y (com a infeccao
de fato ocorrendo se y estiver no estado sadio e x nao estiver imune). Portanto, seja
τ(x, y) =
e(x, y) se Tx > e(x, y),
∞ se Tx ≤ e(x, y).
Dizemos que a aresta orientada (x, y) e aberta se τ(x, y) <∞ (caso contrario, a aresta
orientada (x, y) e fechada). A primeira situacao refere-se a possibilidade de ocorrencia
de infeccao de y pelo sıtio x, pois a infeccao em x dura tempo suficiente a ponto de x
emitir a infeccao na direcao de y. No segundo caso, o tempo da infeccao em x se encerra
antes de x emiti-la na direcao de y e, a grosso modo, ∞ representa o fato de que x nao
passa a infeccao para y durante o perıodo que se encontra infectado (como cura implica
em imunidade, x nunca mais voltara a ser infectado e, consequentemente, nao podera
mais ser transmissor da infeccao). Assim, a variavel τ(x, y) define o tempo decorrente
60
do instante em que o sıtio x torna-se infectado ate o intante no qual este tenta
infectar o sıtio y, tomando o valor ∞ caso isto nunca ocorra. Para um modelo
com apenas um sıtio infectado em t = 0 (digamos, a origem), a probabilidade da aresta
orientada que liga o par (0, 0) a um de seus quatro vizinhos estar aberta, denotada por
p, pode ser usada como um parametro do modelo epidemico, e e definida por
p = P(T0 > e(0, y)) =
∫ ∞0
P (T0 > e(0, y) | e(0, y) = s) fe(0,y)(s)ds
=
∫ ∞0
e−sλe−λsds = λ
∫ ∞0
e−(λ+1)sds =λ
λ+ 1,
onde y e um dos quatro vizinhos do sıtio (0, 0), este denotado apenas por 0. Agora, seja
C0 = x : x pode ser alcancado por (0, 0) por um caminho de arestas abertas. (4.1)
Claramente, a expressao acima denota o conjunto de todos os sıtios para os quais ha
ligacao com a origem (0, 0) atraves de arestas abertas. No processo com imunizacao (ou
modelo epidemico, como e diversas vezes mencionado em Cox & Durrett [3]), C0 denota
o conjunto de sıtios que podem ser infectados uma vez que a configuracao η0 possua
a coordenada (0, 0) no estado 1 (infectado) e todos os outros sıtios em Z2 no estado 0
(sadio), ou seja, a configuracao inicial do processo η0t .
Definida a expressao em (4.1), o interesse volta-se para o estudo da existencia de um
“caminho infinito” de arestas abertas, que remete a percolacao. Conforme fora descrito
na Secao 1.1, a questao de sobrevivencia da infeccao com probabilidade nao-nula do
processo de contato definido no Capıtulo 1 esta ligada a existencia de ao menos um
“caminho ativo infinito”. No caso do processo com imunizacao, precisamos analisar de
maneira um pouco diferenciada essa existencia de caminho infinito. No modelo com
imunizacao, sıtios que se curam tornam-se imunes, e portanto bloqueiam a passagem
de infeccao pelas suas respectivas arestas. A Figura 4.1 ilustra a ideia a ser passada.
Neste exemplo, se o sıtio (−3, 0) se curar antes de passar infeccao para pelo menos um
de seus vizinhos sadios (neste caso, (−4, 0) ou (−3,−1)), todos os outros sıtios ainda no
estado infectado estarao cercados por sıtios imunes ou infectados. Logo, eles nao tem
61
Figura 4.1: Exemplo de percolacao para processos com imunizacao com infeccao comecando em(0, 0). Os pontos preenchidos em preto denotam sıtios infectados, os pontos brancos representamsıtios sadios e as marcas ××× representam sıtios imunes.
mais como transmitir infeccao, e apenas permanecerao neste estado infectado por um
tempo aleatorio governado por uma distribuicao exponencial de parametro 1. Assim,
quando todos estes sıtios infectados tornarem-se imunes, a configuracao atinge um ponto
de absorcao: todos os sıtios que foram infectados ate o confinamento do aglomerado de
sıtios ligados a origem por caminhos abertos permanecerao no estado imune e todos os
outros sıtios em Z2 no estado sadio. Portanto, neste caso, o sistema nao percola. Para
que o sistema percole, precisamos de ao menos um caminho aberto infinito que passe
pela origem da infeccao, pois dessa forma e impossıvel que todos os sıtios infectados
tornem-se imunes antes de ao menos um destes transmitir a infeccao. Isto equivale a
P(|C0| =∞) > 0. Portanto, sejam
λc = infλ : P(|C0| =∞) > 0
e
pc = 1− ET0[e−λcs
]=
λcλc + 1
respectivamente os parametros crıticos relativos a taxa de infeccao e a probabilidade
da infeccao de um determinado vizinho de (0, 0) ocorrer em virtude da aresta partindo
deste. Cox & Durrett [3] enunciam o parametro crıtico pc ∈ [0, 5; 0, 5927], o que implica
62
em λc ∈ [1; 1, 4552]. Quando λ > λc, o sistema percola com probabilidade positiva,
e assim tracamos um paralelo com o caso supercrıtico dos processo de contato sem
uso de imunizacao. Assim como neste tipo de processo, tambem podemos adaptar a
representacao grafica de Harris para o modelo com imunizacao. As setas de infeccao que
partem das semi-retas z × [0,∞) apos o sıtio z estar no estado imune sao obsoletas,
representando desta forma as arestas (orientadas) fechadas. Tambem temos que um
sıtio imune bloqueia o recebimento de infeccao vinda de qualquer um de seus vizinhos,
conforme a dinamica do processo em questao. A partir do momento que todos os
sıtios infectados na representacao grafica nao encontrarem vizinhos para os quais podem
transmitir a infeccao (ou seja, encontrarem apenas vizinhos no estado infectado ou
imune), a infeccao se extinguira nestes sıtios, ficando assim no estado imune e atingindo
ponto de absorcao, conforme explicado atraves da Figura 4.1. A Figura 4.2 e uma versao
da Figura 1.2 para o processo com imunizacao.
Figura 4.2: Representacao grafica dos processos de contato para d = 1: processo com estadoinicial η0 = ..., 1, 1, 0, 1, 0, 0, 1, ... e configuracao ηT = ..., 1, 1, i, i, 1, 1, i, .... As marcas representam os pontos onde um sıtio infectado se cura e torna-se imune, e as setas partindo desıtios infectados denotam infeccao chegando ao sıtio que a recebe (caso esteja sadio). A setatracejada representa tentativa de infeccao atraves de um aresta fechada.
E pertinente observar que, na representacao grafica de Harris, as marcas conforme
o processo de Poisson de parametro 1 em todas as semi-retas z × [0,∞) sao tracadas
partindo de t = 0, nao levando em conta se o sıtio esta infectado, sadio ou imune. O
tempo aleatorio exponencialmente distribuıdo de permanencia da infeccao nao comeca a
63
ser computado a partir do momento da infeccao, mas sim a partir da ultima marca em
x × [0,∞) antes da ocorrencia da infeccao de x (ou a partir de t = 0, caso a infeccao
em x ocorra antes da ocorrencia de marcas de cura na semi-reta x × [0,∞)). Logo,
nesta adaptacao, as marcas conforme o processo de Poisson de parametro 1 poderiam ser
tracadas apenas a partir da ocorrencia da infeccao, sendo necessario apenas uma marca
para cada semi-reta.
4.3 Teorema da Forma
Ate o presente momento, no nosso estudo de processos de contato com imunizacao,
observamos alguns paralelos em relacao aos processos de contato usuais apresentados
no Capıtulo 1, como percolacao, parametro crıtico e representacao grafica. Alem destas
caracterısticas, tambem temos uma adaptacao para o Teorema 1.2 (Teorema da Forma).
Seja η0t o modelo epidemico em Z2 com a origem infectada e todos os outros sıtios sadios
em t = 0 e
ξ0t = x : η
0t (x) = 1,
ζ0t = x : η
0t (x) = i,
ou seja, ξ0t representa os sıtios que estao infectados no instante t e ζ
0t denota os sıtios
que estao imunes em t.
Teorema 4.1 (Cox & Durrett [3]): Assuma que λ > λc. Entao, ha um conjunto convexo
D tal que para qualquer ε ∈ (0, 1) e para todo t suficientemente grande,
P(C0 ∩ (1− ε)tD ⊂ ζ0t ⊂ (1 + ε)tD) = 1,
P(ξ0t ⊂ (1 + ε)tD \ (1− ε)tD) = 1.
O Teorema 4.1 nos informa que a regiao de sıtios imunes assume a forma assintotica
tD para instantes de tempo suficientemente grandes, ao passo que ao redor dessa area
de sıtios imunes existe uma regiao de sıtios infectados na forma assintotica de uma coroa
64
circular. Tal forma que a configuracao assume sera verificada atraves dos processos
simulados na Secao 4.4.
4.4 Resultados
Nesta secao apresentaremos e discutiremos os resultados obtidos em simulacao para
processos com imunizacao. A princıpio, o algoritmo utilizado poderia ser analogo
ao utilizado para os processos de contato usuais na Secao 3.6, isto e, baseado na
representacao grafica de Harris, com as modificacoes necessarias por envolver o estado
imune. Entretanto, no intuito de otimiza-lo em funcao de sıtios no estado imune nao
poderem receber setas de infeccao e serem indiferentes a marcas de cura, construımos
um algoritmo diferente que retorna os resultados mais rapidamente. Entao, definindo as
entradas λ e T do algoritmo, temos o processo com imunizacao (em Z2) de parametro λ
com apenas o sıtio (0, 0) no estado infectado em t = 0 desenvolvendo-se ate o instante
T , retornando a configuracao neste instante de tempo como dado de saıda. A Figura 4.3
e gerada de uma amostra da configuracao do processo de parametro λ = 3 no instante
T = 20. Para os sıtios que se encontram no estado infectado em T , quadrados de lado
unitario centrados nestes sıtios sao plotados e preenchidos na cor preta. O mesmo ocorre
com a cor cinza para sıtios imunes. Note que a referida figura se comporta conforme
o Teorema 4.1 enuncia: o conjunto de sıtios imunes (e que se tornarao imunes, uma
vez que estao infectados e cercados por sıtios imunes) possui forma assintotica convexa
(neste caso, 20D, onde D e o conjunto convexo apresentado no referido teorema); e,
circundando esta area de sıtios imunes, temos sıtios que estao no estado infectado em T
na forma assintotica de uma coroa circular. O conjunto D apresenta simetria radial em
torno da origem da infeccao (sıtio (0, 0)).
Dentre os principais objetivos desta dissertacao esta a obtencao de estimadores dos
parametros dos processos apresentados ao longo deste trabalho. Em relacao ao processo
com imunizacao, a literatura estudada nao sugere ideias para a estimacao do parametro
λ. Sugerimos um metodo de estimacao similar ao apresentado para o processo de contato
sem imunizacao no Capıtulo 3. O envoltorio convexo do conjunto ξ0t , ζ0t contem,
65
Figura 4.3: Amostra da configuracao de um processo com imunizacao de parametro λ = 3 noinstante T = 20.
alem de sıtios infectados e sadios, sıtios imunes, e a grande proporcao de elementos
neste envoltorio convexo se da por sıtios no estado imune. Pela forma da configuracao
enunciada pelo Teorema 4.1 e verificada empiricamente na Figura 4.3, e inviavel a
utilizacao de tecnicas de encolhimento, pois com isto estarıamos reduzindo em potencial
a proporcao de sıtios infectados da configuracao em determinado instante de tempo.
Portanto, utilizamos como metodo de estimacao para processos com imunizacao a razao
entre o numero de indivıduos infectados e o numero de vizinhos no qual um esta infectado
e o outro sadio, quantidades tomadas no interior do envoltorio convexo de ξ0t , ζ0t .
Para cada par de entradas (λ, T ), foram realizadas 15 replicacoes do processo com
imunizacao de parametro λ em um determinado intervalo [0, T ]. Cada replicacao esta
sujeita a uma representacao grafica diferente, pois e caracterizada pela mudanca da
semente (ranseed) no programa, a qual e responsavel pela geracao dos tempos de infeccao
e cura. Portanto, temos uma amostra de 15 observacoes (configuracoes) para cada par de
entradas. Os valores de λ escolhidos foram: λ = 3 e λ = 5. O valor crıtico λc esta situado
no intervalo [ 1 ; 1, 4552 ], e portanto os valores escolhidos para λ remetem que todas as
simulacoes realizadas estao situadas no caso onde o sistema percola com probabilidade
66
estritamente positiva. Os instantes escolhidos para observarmos a configuracao dos
processos simulados foram: T = 5, T = 10 e T = 20 (este ultimo exceto para λ = 5).
Nenhuma replicacao resultou em morte da infeccao. As Figuras 4.4 e 4.5 passam a
ideia da evolucao temporal da infeccao para de processos com parametros λ = 3 e λ = 5
respectivamente. Note que o desenvolvimento e linear no tempo, com a infeccao crescendo
para todos os lados e assumindo uma forma radial. Repare tambem que raros sao os sıtios
que nao foram infectados na regiao central da configuracao cercada por arestas fechadas.
Figura 4.4: Amostra de um processo de contato com imunizacao de parametro λ = 3 parainstantes de tempo T = 5, T = 10 e T = 20.
De posse de todas as amostras, computamos o numero de sıtios infectados e o
numero de vizinhos infectado-sadio para obter o estimador sugerido. Para cada grupo
de 15 amostras com as mesmas entradas λ e T , calculamos a media e o desvio padrao
amostral. Tais resultados encontram-se na Tabela 4.1. Pelos resultados obtidos em
nossas simulacoes, observamos a media das estimativas se aproximando do valor real do
parametro conforme T aumenta. Fixando T , o desvio padrao amostral das estimativas
dos processos com λ = 5 e ligeiramente maior do que o desvio das estimativas dos
processos com λ = 3.
As distribuicoes empıricas do estimador proposto para λ = 3 e λ = 5 nos instantes de
tempo analisados podem ser verificadas nos histogramas da Figura 4.6. A dispersao das
67
Figura 4.5: Amostra de um processo com imunizacao de parametro λ = 5 para instantes detempo T = 5 e T = 10.
Tabela 4.1: Medias e desvios padroes amostrais das estimativas de cada grupo deamostras de processos com imunizacao simulados com os mesmos valores de λ e T .
Parametro Tempo Media Amostral D.P. Amostral
5 2,3759 0,1783λ = 3 10 2,6640 0,1213
20 2,8420 0,1312λ = 5 5 3,9426 0,1873
10 4,4682 0,1329
estimativas tende a decrescer com o passar do tempo para os dois valores de parametro de
infeccao analisados, pois tanto o valor maximo quanto o valor mınimo entre as estimativas
aumentam, com o primeiro sofrendo maior incremento. Estes intervalos de dispersao,
alem de encolherem com o passar do tempo, tambem se aproximam do real valor do
parametro, apesar de nenhum destes intervalos conter de fato este real valor.
Com os resultados obtidos nesta secao, verificamos empiricamente questoes como
a forma da infeccao conforme descrita no Teorema 4.1 e a sobrevivencia da infeccao
em todos os processos com imunizacao simulados. Quanto ao estimador proposto, ha
indıcios de que este metodo de estimacao apresente consistencia, porem com necessidade
de tempos maiores para convergir em relacao ao estimador via metodo de contagem
para o processo de contato usual. Outro fator interessante e o decaimento dos desvios
68
Figura 4.6: Distribuicoes empıricas para as estimativas do parametro de infeccao do processocom imunizacao.
conforme o passar do tempo, que ocorre de T = 5 para T = 10 em ambos os parametros
analisados. Comparando as amostras dos processos com λ = 3 nos instantes T = 10 e
T = 20, verifica-se um ligeiro aumento no desvio padrao amostral do primeiro para o
segundo. Aumentar o tamanho das amostras poderia ser uma solucao para verificar com
maior seguranca evidencias de que os desvios decrescem conforme o passar do tempo.
69
Capıtulo 5
Conclusoes e Comparacoes
Apos todo o estudo teorico e avaliacao dos resultados obtidos em simulacoes, seguem
abaixo topicos com as principais conclusoes relativas ao conteudo desta dissertacao.
• Apresentacao de maneira sucinta dos principais pontos teoricos relativos aos
processos de contato usuais e processos com imunizacao, no tocante a construcao,
notacao utilizada, sobrevivencia (ou nao) da infeccao no sistema, distribuicao limite
de processos assim como a forma que a infeccao adquire quando iniciamos o processo
com apenas um sıtio infectado, do ponto de vista assintotico (uma vez que esta
infeccao nao tenha se extinguido);
• Descricao de dois diferentes metodos de estimacao: estimadores de maxima
verossimilhanca; e o estimador para o parametro de infeccao via metodo de
contagem (com parametro de cura fixo e igual a 1). Do ponto de vista teorico,
ambos os estimadores sao razoaveis, visto que sao consistentes e temos resultados
apropriados de normalidade assintotica. Entretanto, o segundo metodo mostra-
se mais acessıvel, pois e de implementacao menos complexa do ponto de vista
computacional; e, na pratica, acompanhar toda a historia de um fenomeno natural
pode ser caro ou ate mesmo impossıvel. O primeiro metodo de estimacao necessita
de todo este historico, ao passo que o outro metodo necessita apenas da configuracao
no instante atual;
• Simulacoes realizadas para os processos de contato apresentados no primeiro
70
capıtulo deste trabalho descreveram de maneira empırica pontos analisados na
teoria estudada, como a forma do conjunto U , a taxa constante de crescimento
da regiao de sıtios infectados e a relacao entre o conjunto U e o parametro de
infeccao λ;
• A estimacao via metodo de contagem, feita atraves das simulacoes acima citadas,
apresentou resultados satisfatorios. O uso da tecnica de peeling para o encolhimento
fez diferenca substancial no tocante a estimacao. Alem disto, verificamos
empiricamente indıcios da consistencia (a qual e citada na literatura estudada)
do estimador;
• Simulacoes realizadas para os processos com imunizacao tambem descreveram de
maneira empırica pontos analisados na teoria estudada, como a forma do conjunto
D, a disposicao de sıtios imunes e infectados na configuracao do processo e o
desenvolvimento linear da infeccao no tempo, com esta crescendo para todos os
lados e assumindo uma forma radial;
• Nossa proposta de construir um metodo de estimacao para o parametro de infeccao
do processo com imunizacao de maneira analoga a estimacao via metodo de
contagem apresenta resultados interessantes no sentido de mostrar indıcios de
consistencia, apesar da convergencia aparentar ser mais lenta em relacao ao processo
de contato sem imunizacao. Possivelmente isto se deve a ausencia do uso de tecnicas
de encolhimento no caso do estimador para o parametro de infeccao do processo
com imunizacao.
Como perspectiva de trabalhos futuros, temos:
• Estudo mais aprofundado do estimador sugerido para o parametro de infeccao do
processo com imunizacao;
• Verificar possıveis otimizacoes para ambos os algoritmos, no intuito de realizar
simulacoes para tempos maiores;
71
• Inferencia do ponto de vista bayesiano no tocante aos parametros de interesse do
modelo;
• Construcao de algoritmos que retornem os estimadores de maxima verossimilhanca
dos parametros de infeccao e cura do processo de contato.
72
Referencias Bibliograficas
[1] Bezuidenhout, C. & Grimmett, G.: The critical process contact dies out. Annals of
Probability, 18: 1462 - 1282, 1990.
[2] Bolthausen, E.: On the central limit theorem for stationary mixing random fields.
Annals of Probability, 10: 1047 - 1050, 1982.
[3] Cox, J.T. & Durrett, R.: Limit theorems for the spread of epidemics and forest fires.
Sthocastic Processes and their Applications, 30:171 - 191, 1988.
[4] Demiris, N. & O’Neill,P.D.: Bayesian inference for stochastic multitype epidemics
in structured population via random graphs. J. R. Statist. Soc. B, 67(5):731-745,
2005.
[5] Durrett, R.: The contact process. AMS Lectures im Applied Mathematics, 27:1 - 18,
1991.
[6] Fiocco, M. & van Zwet,W.R.: Decaying correlations for the supercritical contact
process conditioned on survival. Bernoulli, 9(5):763-781, 2003.
[7] Fiocco, M. & van Zwet,W.R.: Maximum likelihood for the fully observed contact
process. Journal of Computacional and Applied Mathematics, 186:117–129, 2005.
[8] Fiocco, M. & van Zwet,W.R.: Parameter estimation for the supercritical contact
process. Bernoulli, 9(6):1071-1092, 2003.
[9] Fiocco, M. & van Zwet,W.R.: Statistics for the contact process. Statistica
Neerlandica, 56(2):243–251, 2002.
73
[10] Harris, T.E.: Contact Interaction on a lattice. Annals of Probability, 2:969-988, 1974.
[11] James, B.R.: Probabilidade: Um Curso em Nıvel Intermediario. IMPA, 3a edicao,
1994.
[12] Lawler, G.: Introduction to Stochastic Processes. London: Chapman & Hall, 1996.
[13] Liggett, T.: Interacting Particle Systems. New York: Springer-Verlag, 1985.
[14] Lodmell, D. L., Niwa, A., Hayashi, K. & Notkind, A. L.: Prevention of cell-to-cell
spread of herpes simplexvirus by leukocytes. The Journal of Experimental Medicine,
137:706-720, 1973.
[15] Seppalainen, T.: Translation Invariant Exclusion Processes(Book in Progress).
Department of Mathematics, University of Wisconsin, 2003.
[16] Varadhan, S.R.S.: Notas do Capıtulo 5 (Martingales) em Limit Theorems (Fall 02).
Disponıvel em http://www.math.nyu.edu/faculty/varadhan/course/PROB.ch5.pdf
74
Apendice A:
Algoritmo em Ox para simulacoes de
Processos de Contato de parametros
(λ, 1)
#include < oxprob.h >#include < oxstd.h >#import < simula >
main()decl t; t = 0.5;decl k1; k1 = 1;decl k2; k2 = 1;decl mud; mud = 0; //variavel de controle que determina se a caixa aumenta ou nao.decl lambda; lambda = 3; //decl C; C = 6;decl T; T = 20;decl xit;ranseed(1);
/ ∗%%% Inıcio do programa: %%% ∗ /
decl M;while(k1 <= T/t)
/* temos que aumentar k1 se de fato a distancia entre a infeccao e o bordo daconfiguracao for menor que C. */
decl N; N = min(C ∗ k2, 125);
75
M = 2 ∗ N;if(k1 == 1) //Condicao inicialxit = zeros(2 ∗ C + 1, 2 ∗ C + 1);xit[C][C] = 1;if(k1 >= 2) //completando as bordas com zeros.if(C ∗ k2 <= 125) if(mud == 1) decl rzero; decl czero; decl obj1; decl obj2; decl obj3;rzero = zeros(C, M− 2 ∗ C + 1);czero = zeros(M + 1, C);obj1 = rzero|xit;obj2 = obj1|rzero;obj3 = czero ∼ obj2;xit = obj3 ∼ czero;
/ ∗ Relogios exponenciais: ∗ /
decl Ei; Ei = ranexp(M + 1, M + 1, 4 ∗ lambda);decl Em; Em = ranexp(M + 1, M + 1, 1);
decl temposEi; temposEi = Ei;decl temposEm; temposEm = Em;
decl somaEi; somaEi = Ei;decl somaEm; somaEm = Em;
decl Ji; Ji = zeros(M + 1, M + 1);decl Jm; Jm = zeros(M + 1, M + 1);
decl novoEi; decl novoEm; decl k; decl l; / ∗ var. auxiliares ∗ /
/ ∗Geracao dos tempos de infeccao: ∗ /
while(min(somaEi) < t) for(k = 0; k <= M; k + +) for(l = 0; l <= M; l + +) if(somaEi[k][l] < t) Ji[k][l] = Ji[k][l] + 1; novoEi = ranexp(M + 1, M + 1, 4 ∗ lambda);Ei = Ei ∼ novoEi ;
76
somaEi = somaEi + novoEi;temposEi = temposEi ∼ somaEi ;
/ ∗Geracao dos tempos de cura: ∗ /
while(min(somaEm) < t) for(k = 0; k <= M; k + +) for(l = 0; l <= M; l + +) if(somaEm[k][l] < t) Jm[k][l] = Jm[k][l] + 1; novoEm = ranexp(M + 1, M + 1, 1);Em = Em ∼ novoEm ;somaEm = somaEm + novoEm;temposEm = temposEm ∼ somaEm ;
decl temposfinal; decl tempos; decl temposind;decl indic; decl indicord; decl n; decl m; / ∗ var.auxiliares ∗ /
/ ∗Ordenacao dos tempos de infeccao e cura: ∗ /
temposfinal = newarray[M + 1][M + 1];
for(n = 0; n <= M; n + +) for(m = 0; m <= M; m + +) if(Ji[n][m] > 0 && Jm[n][m] > 0) tempos = temposEi[0][n][m];for(k = 2; k <= Ji[n][m]; k + +) tempos = tempos|temposEi[k− 1][n][m]; for(l = 1; l <= Jm[n][m]; l + +) tempos = tempos|temposEm[l− 1][n][m]; indic = ones(Ji[n][m], 1)|zeros(Jm[n][m], 1);temposind = sortbyc(tempos ∼ indic, 0);if(Ji[n][m] > 0 && Jm[n][m] < 1) tempos = temposEi[0][n][m];if(Ji[n][m] > 1) for(k = 2; k <= Ji[n][m]; k + +) tempos = tempos|temposEi[k− 1][n][m]; indic = ones(Ji[n][m], 1);temposind = sortbyc(tempos ∼ indic, 0);if(Ji[n][m] < 1 && Jm[n][m] > 0) tempos = temposEm[0][n][m];if(Jm[n][m] > 1) for(k = 2; k <= Jm[n][m]; k + +) tempos = tempos|temposEm[k− 1][n][m]; indic = zeros(Jm[n][m], 1);
77
temposind = sortbyc(tempos ∼ indic, 0);if(Ji[n][m] < 1 && Jm[n][m] < 1) tempos = 0;indic =< 2 >;temposind = tempos ∼ indic;temposfinal[n][m] = temposind;
/ ∗ Remocao de transicoes que ocorrem em tempos superiores a t = T: ∗ /
decl tipotrans; decl postransx; decl postransy; decl transicao;
tempos = temposfinal[0][0][0][0];tipotrans = temposfinal[0][0][0][1];
postransx = zeros(1);postransy = zeros(1);
for(l = 0; l <= M; l + +) for(k = 0; k <= M; k + +) for(m = 0; m <= Ji[l][k] + Jm[l][k]− 1; m + +) if(l > 0 || k > 0 || m > 0) tempos = tempos|temposfinal[l][k][m][0];if(temposfinal[l][k][m][0] > t) temposfinal[l][k][m][1] = 2; tipotrans = tipotrans|temposfinal[l][k][m][1];postransx = postransx| l ;postransy = postransy| k ;
/ ∗ Construindo a matriz de (tentativa de) transicao: ∗ /
transicao = zeros(rows(tempos), 4);
for(l = 0; l <= rows(tempos)− 1; l + +) transicao[l][0] = tempos[l];transicao[l][1] = postransx[l];transicao[l][2] = postransy[l];transicao[l][3] = tipotrans[l];
78
transicao = sortbyc(transicao, 0);transicao = transicao[ ][1 : 3];
/ ∗ Dinamica do processo: ∗ /
decl x; decl y; decl neigh; decl delta; decl xlin; decl ylin;
for(k = 0; k <= rows(transicao)− 1; k + +) x = transicao[k][0];y = transicao[k][1];if(transicao[k][2] == 1) if(xit[x][y] == 1) neigh = floor(4 ∗ ranu(1, 1)) + 1;if(neigh == 2 || neigh == 4) delta = 0; elseif(neigh == 1 || neigh == 3) delta = 1; xlin = ((x− 2) + neigh) ∗ delta + x ∗ (1− delta);ylin = ((y− 3) + neigh) ∗ (1− delta) + y ∗ delta;if(((xlin >= 0) && (xlin <= M)) && ((ylin >= 0) && (ylin <= M))) xit[xlin][ylin] = 1; if(transicao[k][2] == 0) xit[x][y] = 0;
/* Verificando se a infeccao esta proxima ao bordo da caixa por uma distanciainferior a C sıtios: */
decl erro; erro = 0;if((sumr(xit)[0] + sumc(xit)[0] + sumr(xit)[2 ∗ N] + sumc(xit)[2 ∗ N]) > 0) erro = 1;
println(“Erro = ”, erro);mud = 0;
for(l = 0; l <= C− 1; l + +) for(k = 0; k <= M; k + +) if(xit[k][M− l] == 1 || xit[k][l] == 1 || xit[l][k] == 1 || xit[M− l][k] == 1) mud = 1; if(mud == 1) k2 = k2 + 1; ;
k1 = k1 + 1;
79
/ ∗%%% Fim do programa: %%% ∗ /
println(“”);println(“Configuracao final : ”, xit);
/ ∗ Estimador da taxa de infeccao: ∗ /
//1 - Fazendo sem o peeling:decl kt; decl nt; decl k; decl l; decl estimador;
nt = sumr(sumc(xit));
kt = 0;for(k = 0; k <= rows(xit)− 1; k + +) for(l = 0; l <= columns(xit)− 2; l + +) if(xit[k][l] + xit[k][l + 1] == 1) kt = kt + 1;
for(k = 0; k <= rows(xit)− 2; k + +) for(l = 0; l <= columns(xit)− 1; l + +) if(xit[k][l] + xit[k + 1][l] == 1) kt = kt + 1;
estimador = nt/kt;
println(“”);println(“”);println(“Processo de contato com lambda = ”, lambda, “ e T = ”, T);println(“”);println(“”);println(“Sem o peeling : ”);println(“”);println(“Sitios infectados = ”, nt);println(“Vizinhos infectado− sadio = ”, kt);println(“lambda estimado = ”, estimador);println(“”);
//2 - Retirando cerca de 30% dos sıtios infectados mais distantes da origem:
decl obj4; decl obj5; decl obj6; decl i; i = 0;decl novoxit; novoxit = xit;
while(sumc(sumr(novoxit))/sumc(sumr(xit)) > 0.7)
80
obj4 = dropc(novoxit, 0);obj5 = dropc(obj4, M− 2 ∗ i− 1);obj6 = dropr(obj5, 0);novoxit = dropr(obj6, M− 2 ∗ i− 1);i = i + 1;
decl ktp; decl ntp; decl estimadorp;
ntp = sumr(sumc(novoxit));
ktp = 0;for(k = 0; k <= rows(novoxit)− 1; k + +) for(l = 0; l <= columns(novoxit)− 2; l + +) if(novoxit[k][l] + novoxit[k][l + 1] == 1) ktp = ktp + 1;
for(k = 0; k <= rows(novoxit)− 2; k + +) for(l = 0; l <= columns(novoxit)− 1; l + +) if(novoxit[k][l] + novoxit[k + 1][l] == 1) ktp = ktp + 1;
estimadorp = ntp/ktp;
println(“”);println(“Com o peeling : ”);println(“”);println(“Sitios infectados = ”, ntp);println(“Vizinhos infectado− sadio = ”, ktp);println(“lambda estimado = ”, estimadorp);println(“”);
/* Salvando a configuracao, desmembrando-a em dois arquivos diferentes: */
decl n; n = (columns(xit))/2; decl xit1; decl xit2;xit1 = xit[ ][: n]; xit2 = xit[ ][(n + 1) :];savemat(“contato lambda first 3 20 1.xls”, xit1);savemat(“contato lambda second 3 20 1.xls”, xit2);
81
Apendice B:
Algoritmo em Ox para simulacoes de
Processos com imunizacao de
parametros (λ, 1)
#include < oxprob.h >#include < oxstd.h >#import < simula >
main()
/ ∗ Escolha do seed: ∗ /
ranseed(110);
/ ∗ Definicao dos parametros: ∗ /
decl lambda; lambda = 5;decl T; T = 10;decl xit;decl M;decl N; N = 130;M = 2 ∗ N;
/ ∗ Configuracao inicial: ∗ /
xit = zeros(M + 1, M + 1);xit[N][N] = 1;
82
/ ∗ Tempos de infeccao e imunizacao: ∗ /
decl Em; decl Eidir; decl Eiesq; decl Eiup; decl Eidown; decl tempos;Em = ranexp(M + 1, M + 1, 1);Eidir = ranexp(M + 1, M + 1, lambda);Eiesq = ranexp(M + 1, M + 1, lambda);Eiup = ranexp(M + 1, M + 1, lambda);Eidown = ranexp(M + 1, M + 1, lambda);
tempos = newarray[M + 1][M + 1];
decl k; decl l;for(k = 0; k <= M; k + +) for(l = 0; l <= M; l + +) tempos[k][l] = sortbyc ( (Em[k][l] ∼ 0)|(Eidir[k][l] ∼ 1)|(Eiesq[k][l] ∼ 2)|(Eiup[k][l] ∼ 3)|(Eidown[k][l] ∼ 4), 0 ) ;
/ ∗ Propagacao da infeccao: ∗ /
decl tempo; decl j; decl tempopos;tempo = 0;
while(tempo < T) tempopos = zeros(1, 4); j = 0;
for(k = 0; k <= M; k + +) for(l = 0; l <= M; l + +) if(xit[k][l] == 1) j = j + 1;tempopos = tempopos|zeros(1, 4);tempopos[j][0] = tempos[k][l][0][0];tempopos[j][1] = tempos[k][l][0][1];tempopos[j][2] = k;tempopos[j][3] = l;
tempopos = sortbyc(tempopos, 0);
for(k = 0; k <= M; k + +) for(l = 0; l <= M; l + +) if(xit[k][l] == 1)tempos[k][l][ ][0] = tempos[k][l][ ][0]− tempopos[1][0];
83
if(tempopos[1][1] >= 1) tempos[tempopos[1][2]][tempopos[1][3]] =dropr(tempos[tempopos[1][2]][tempopos[1][3]], 0);
tempo = tempo + tempopos[1][0];
if(tempo < T) decl xlin; decl ylin; decl delta;
if(tempopos[1][1] == 0)xit[tempopos[1][2]][tempopos[1][3]] = −1;
if(tempopos[1][1] > 0) if(tempopos[1][1] == 3||tempopos[1][1] == 4)delta = 1; elseif(tempopos[1][1] == 1||tempopos[1][1] == 2)delta = 0;
xlin = ((tempopos[1][2]− 3) + (2 ∗ (tempopos[1][1]− 2))) ∗ delta+tempopos[1][2] ∗ (1− delta);ylin = ((tempopos[1][3] + 3)− (2 ∗ tempopos[1][1])) ∗ (1− delta)+tempopos[1][3] ∗ delta;
if(((xlin >= 0)&&(xlin <= M))&&((ylin >= 0)&&(ylin <= M))) if(xit[xlin][ylin] == 0)xit[xlin][ylin] = 1; println(tempo);
/ ∗%%% Fim do programa: %%% ∗ /
println(“”);println(“Configuracao final : ”, xit);
/ ∗ Estimador da taxa de infeccao: ∗ /
decl kt; decl nt; decl h; decl i; decl estimador;
nt = sumr(sumc(setbounds(xit, 0, .Inf)));
kt = 0;for(h = 0; h <= rows(xit)− 1; h + +) for(i = 0; i <= columns(xit)− 2; i + +)
84
if(xit[h][i] + xit[h][i + 1] == 1)kt = kt + 1;
for(h = 0; h <= rows(xit)− 2; h + +) for(i = 0; i <= columns(xit)− 1; i + +) if(xit[h][i] + xit[h + 1][i] == 1)kt = kt + 1;
estimador = nt/kt;
println(“”);println(“”);println(“Processo com imunizacao com lambda = ”, lambda, “ e T = ”, T);println(“”);println(“”);println(“Sitios infectados = ”, nt);println(“Vizinhos infectado− sadio = ”, kt);println(“lambda estimado = ”, estimador);println(“”);
/* Salvando a configuracao, desmembrando-a em dois arquivos diferentes: */
decl n; n = (columns(xit))/2; decl xit1; decl xit2;xit1 = xit[ ][: n]; xit2 = xit[ ][(n + 1) :];savemat(“floresta lambda first 5 10 110.xls”, xit1);savemat(“floresta lambda second 5 10 110.xls”, xit2);
85