cap´tulo 7 ı teoremas limiteslucambio/probabilidades/prob07.pdf · 2017-02-22 · defini¸c˜ao...

32
Cap´ ıtulo 7 Teoremas Limites Neste cap´ ıtulo vamos investigar em quais situa¸c˜ oes sequˆ encias de vari´aveis aleat´orias convergem a n´ umeros e em quais situa¸c˜oes a convergˆ encia ´ ea vari´aveis aleat´orias. Os grandes resultados que ser˜ao apresentados aqui po- dem ser reunidos em dois grandes grupos: diferentes leis de grandes n´ umeros e teoremas do limite central. Estes resultados s˜ao de grande importˆ ancia no estudo de probabilidade e estat´ ıstica, mais inda, o valor epistemol´ogico da teoria das probabilidades ´ e revelado apenas por teoremas limite. De fato, todo o valor epistemol´ogico da teoria das probabilidades se baseia nisso: fenˆomenos aleat´orios de grande escala em sua a¸c˜ ao coletiva criam uma regularidade estrita, n˜ao-aleat´oria. Assim como na an´alise matem´atica ´ e poss´ ıvel distinguir v´arios tipos de convergˆ encia. Diversos modos de convergˆ encias˜aointroduzidosnaSe¸c˜ao7.3. ASe¸c˜ ao 7.4 ´ e dedicada a lidar com as leis dos grandes n´ umeros e teoremas do limite central s˜ao apresentados e demonstrados na Se¸c˜ ao 7.5. Antes de tudo isso, estudaremos a chamada fun¸c˜ ao caracter´ ısticana Se¸c˜ ao 7.1. Estafun¸c˜ ao ser´aextremamente importantena demonstra¸c˜ ao de diversos resultados. Introduzimos na Se¸c˜ ao 7.2 uma classe de vari´aveis aleat´orias, chamadas innitamente divis´ ıveis, a qual constitui a classe das distribui¸c˜ oes limite. 7.1 Fun¸ ao caracter´ ıstica Para qualquer tipo de vari´avel aleat´oria o conceito de fun¸c˜ ao geradora de mo- mentos n˜aodene univocamente a fun¸c˜ ao de probabilidade ou de densidade. Embora mais complexo, o conceito de fun¸c˜ao caracter´ ıstica permite-nos esta identica¸ c˜ao. Ainda este conceito ser´a ´ util para provar resultados de con- vergˆ encia em distribui¸c˜ ao de vari´ aveis e vetores aleat´orios. 179

Upload: buicong

Post on 01-Oct-2018

225 views

Category:

Documents


0 download

TRANSCRIPT

Capıtulo 7

Teoremas Limites

Neste capıtulo vamos investigar em quais situacoes sequencias de variaveisaleatorias convergem a numeros e em quais situacoes a convergencia e avariaveis aleatorias. Os grandes resultados que serao apresentados aqui po-dem ser reunidos em dois grandes grupos: diferentes leis de grandes numerose teoremas do limite central.

Estes resultados sao de grande importancia no estudo de probabilidadee estatıstica, mais inda, o valor epistemologico da teoria das probabilidadese revelado apenas por teoremas limite. De fato, todo o valor epistemologicoda teoria das probabilidades se baseia nisso: fenomenos aleatorios de grandeescala em sua acao coletiva criam uma regularidade estrita, nao-aleatoria.

Assim como na analise matematica e possıvel distinguir varios tipos deconvergencia. Diversos modos de convergencia sao introduzidos na Secao 7.3.A Secao 7.4 e dedicada a lidar com as leis dos grandes numeros e teoremasdo limite central sao apresentados e demonstrados na Secao 7.5.

Antes de tudo isso, estudaremos a chamada funcao caracterıstica na Secao7.1. Esta funcao sera extremamente importante na demonstracao de diversosresultados. Introduzimos na Secao 7.2 uma classe de variaveis aleatorias,chamadas infinitamente divisıveis, a qual constitui a classe das distribuicoeslimite.

7.1 Funcao caracterıstica

Para qualquer tipo de variavel aleatoria o conceito de funcao geradora de mo-mentos nao define univocamente a funcao de probabilidade ou de densidade.Embora mais complexo, o conceito de funcao caracterıstica permite-nos estaidentificacao. Ainda este conceito sera util para provar resultados de con-vergencia em distribuicao de variaveis e vetores aleatorios.

179

180 CAPITULO 7. TEOREMAS LIMITES

Mesmo que as funcoes caracterısticas assumem valores nos numeros com-plexos, nao e preciso ter muita familiaridade com estes numeros para podertrabalhar com elas. Isso ficara claro no decorrer desta discussao.

Nesta secao, o sımbolo i representara o numero imaginario√−1. Se

X e Y forem duas variaveis aleatorias em (Ω,F , P ), entao Z = X + iY euma variavel aleatoria complexa. Esta nova variavel e definida em Ω poremassume valores complexos, com Z(ω) = X(ω) + iY (ω) para ω ∈ Ω.

A esperanca e definida por linearidade, E(Z) = E(X) + iE(Y ) no casode E(X) e E(Y ) finitas.

Definicao 7.1. Seja X uma variavel aleatoria. A funcao caracterıstica deX e a funcao complexa φ

X: R → C, definida como

φX(t) = E(eitX), (7.1)

para todo t ∈ R.

Devemos observar que

E(eitX) = E[cos(tX)] + iE[ sen(tX)], ∀t ∈ R,

pela formula de Euler1. Observamos tambem que a variavel aleatoria com-plexa eitX = cos(tX) + i sen(tX) sempre possui esperanca finita, para todavariavel aleatoria X, pois as variaveis aleatorias cos(X) e sen(X) sao limita-das. Assim, a esperanca na Definicao 7.1 e finita e devido a isso garantimosque a funcao caracterıstica sempre esta bem definida.

Ainda devemos perceber que segundo a Definicao 5.1, de esperanca deuma variavel aleatoria, temos que

φX(t) =

∫ +∞

−∞cos(tx) dFX(x) + i

∫ +∞

−∞sin(tx) dFX(x),

e, pela linearidade da integral, obtemos que

φX(t) =

∫ +∞

−∞eitx dFX(x), t ∈ R·

Esta ultima integral e chamada de transformada de Fourier de FX e forneceuma definicao alternativa de funcao caracterıstica.

1A formula de Euler, que mostra uma relacao entre as funcoes trigonometricas e afuncao exponencial, e dada por: eiz = cos(z) + i sen(z), para z ∈ R

7.1. FUNCAO CARACTERISTICA 181

Notemos que a funcao caracterıstica e determinada pela funcao de distri-buicao e, mais adiante, veremos que a funcao de distribuicao e determinadapela funcao caracterıstica.

Exemplo 7.1. Suponhamos que X ∼ Poisson(λ). Encontremos a expressaoda funcao caracterıstica. Pela definicao, temos que,

φX(t) =

∞∑

x=0

eitxe−λλx

x!= e−λ

∞∑

x=0

(λeit)x

x!= e−λeλe

it

= eλ(eit−1)·

7.1.1 Propriedades da funcao caracterıstica

Os seguintes resultados, que serao provados utilizando resultados padrao deanalise, nos permitirao entender a importancia da funcao caracterıstica. Umaexcelente referencia neste assunto e o livro Gnedenko & Kolmogorov (1954).

Teorema 7.1. A funcao caracterıstica e limitada por 1, isto e, |φX(t)| ≤ 1,

∀t ∈ R.

Demonstracao. O valor absoluto de um numero complexo z = x+ iy e |z| =√x2 + y2, de modo que

|φX(t)| = |E(eitX)| =

√E2[cos(tX)] + E2[ sen(tX)],

que, pela desigualdade de Jensen em (5.18), temos√

E2[cos(tX)] + E2[ sen(tX)] ≤√

E[cos2(tX)] + E[ sen2(tX)] = 1,

onde isto ultimo devido ao fato de que

E[cos2(tX) + sen2(tX)] = E[cos2(tX) + sen2(tX)]

e que cos2(tX) + sen2(tX) = 1.

Teorema 7.2. A funcao caracterıstica assume o valor 1 no ponto zero, ouseja, φ

X(0) = 1 e φ

X(t) = φ

X(−t), ∀t ∈ R, onde φ

X(t) e o complexo conju-

gado de φX(t).

Lembremos que se c = x + iy for um numero complexo qualquer, o seucomplexo conjugado e c = x− iy.

182 CAPITULO 7. TEOREMAS LIMITES

Demonstracao.φ

X(0) = E(ei0X) = E(1) = 1,

e

φX(t) = E[cos(tX)]−iE[ sen(tX)] = E[cos(−tX)]+iE[ sen(−tX)] = φ

X(−t),

lembrando que o coseno e uma funcao par e o seno e uma funcao impar.

Teorema 7.3. Se Y = aX + b, sendo a, b ∈ R quaisquer, entao φY(t) =

eitbφX(at).

Demonstracao.

φY(t) = E[eit(aX+b)] = eitb E(eiatX) = eitbφ

X(at)·

Exemplo 7.2. Seja Z ∼ N(0, 1). Encontremos a expressao da funcao ca-racterıstica. Pela definicao, temos que

φZ(t) =

∫ +∞

−∞eitz

1√2π

e−z2

2 dz·

Completando quadrado na integral, temos que

φZ(t) = e−

t2

2

∫ +∞

−∞

1√2π

e−(z−it)2

2 dz·

Sabemos que∫ +∞−∞

1√2πe−

(x−µ)2

2 dx = 1, pela definicao de distribuicao normal,para qualquer constante µ. Entao,

φZ(t) = e−

t2

2 (7.2)

e a expressao da funcao caracterıstica de uma variavel aleatoria normalpadrao. Agora, utilizando o Teorema 7.3 obtemos que, se Y = σZ + µ entaoY ∼ N(µ, σ2) e

φY(t) = eitµφ

Z(σt) = eitµ−

σ2t2

2 (7.3)

e a expressao da funcao caracterıstica de uma variavel aleatoria normal demedia µ e variancia σ2.

7.1. FUNCAO CARACTERISTICA 183

Devemos fazer distincao, neste exemplo, entre a variavel aleatoria nor-mal padrao Z e a variavel aleatoria complexa Z. Embora a funcao ca-racterıstica e uma funcao complexa, nao estamos interessados em estudarvariaveis aleatorias complexas. As variaveis aleatorias complexas foram in-troduzidas somente para entendermos o conceito de funcao caracterıstica.

Teorema 7.4. A funcao caracterıstica φX(t) e uniformemente contınua na

reta.

Para demonstrar esta propriedade devemos lembrar que uma funcao uni-formemente contınua e contınua em todo ponto. A recıproca deste resultadonao vale, por exemplo, a funcao f(x) = x2 e contınua na reta mas nao e uni-formemente contınua. Por definicao, uma funcao φ e uniformemente contınuase para ϵ > 0, existe δ = δ(ϵ) > 0 tal que |φ(t)−φ(s)| < ϵ, quando |t−s| < δ.Notemos que δ precisa depender apenas de ϵ.

Demonstracao. Observemos que

|φX(t)− φ

X(s)| =

∫ +∞

−∞(eitx − eisx) dFX(x)

≤∫ +∞

−∞

eitx − eisx dFX(x)

=

∫ +∞

−∞

eisx ei(t−s)x − 1

dFX(x)

≤∫ +∞

−∞

ei(t−s)x − 1 dFX(x)

Definamos esta ultima integral como h(t− s), isto e, definamos

h(t− s) =

∫ +∞

−∞

ei(t−s)x − 1 dFX(x)·

Observemos que h(u) = E |eiux − 1|, tambem 0 ≤ |eiux − 1| ≤ 2, 2 e in-tegravel e limu→0

eiuX(ω) − 1 = 0, ∀ω ∈ Ω.

Entao, pelo Teorema da Convergencia Dominada2

limu→0

h(u) = 0

e, neste caso, para dado ϵ > 0, existe δ > 0 tal que |t− s| < δ, o qual implicaque |φ

X(t)− φ

X(s)| ≤ h(t− s) < ϵ.

2Teorema da Convergencia Dominada: Seja fn uma sequencia de funcoes contınuasque convergem pontualmente a certa funcao f e suponhamos existe uma funcao integravelg, tal que |fn(x)| ≤ g(x). Entao temos

∫f = limn→∞

∫fn·.

184 CAPITULO 7. TEOREMAS LIMITES

Teorema 7.5. Sejam X e Y forem duas variaveis aleatorias independen-tes com funcoes caracterısticas respectivas φ

X(t) e φ

Y(t), entao φ

X+Y(t) =

φX(t)× φ

Y(t), ∀t ∈ R.

Demonstracao.

φX+Y

(t) = E[eit(X+Y )] = E(eitXeitY ) = E(eitX) E(eitY ) = φX(t)× φ

Y(t)·

Esta propriedade implica que o produto de duas funcoes caracterısticastambem e uma funcao caracterıstica. A demonstracao deste teorema tambempode ser realizada usando senos e cosenos.

Por inducao percebemos que

φX1+···+Xn

(t) =n∏

k=1

φXk(t), ∀t ∈ R, (7.4)

caso as variaveis aleatoriasX1, · · · , Xn sejam independentes, ou seja, a funcaocaracterıstica da soma de n variaveis aleatorias independentes e o produto dasfuncoes caracterısticas associadas a cada variavel aleatoria. Este resultadodemonstra-se utilizando repetidas vezes o Teorema 7.5.

Exemplo 7.3. Sabemos que se X1, X2, · · · , Xn forem n variaveis aleatoriasindependentes cada uma Bernoulli(p), entao Y = X1 + · · · + Xn tem pordistribuicao Y ∼ Binomial(n, p). Podemos encontrar agora a funcao carac-terıstica φ

Ycomo produto das funcoes caracterısticas φ

Xk.

Utilizando a definicao, temos que

φXk

= (1− p) + peit·

Agora, pelo resultado em (7.4), obtemos que

φY=

n∏

k=1

φXk

=n∏

k=1

[(1− p) + peit

]=

n∑

k=0

eitk(n

k

)pk(1− p)n−k,

lembrando que (peit)k= pkeitk. Como deverıamos esperar, o resultado corres-

ponde com a funcao caracterıstica de uma variavel aleatoria Binomial(n, p).

7.1. FUNCAO CARACTERISTICA 185

Demonstremos agora uma das propriedades mais importantes da funcaocaracterıstica. Comentamos, logo depois de definir a funcao caracterıstica,que ela e determinada pela funcao de distribuicao, ja que φ

X(t) =

∫eitx dFX(x).

A propriedade no Teorema 7.7 e uma recıproca disto, ou seja, essa proximapropriedade nos disse que a funcao caracterıstica determina sua funcao dedistribuicao univocamente.

O resultado a seguir implica que que duas funcoes de distribuicao saoiguais se, e somente se, suas funcoes caracterısticas o forem e como con-sequencia a funcao caracterıstica e uma representacao da funcao de distri-buicao. Esta e a principal razao do nosso interesse em funcoes caracterısticas,elas descrevem exclusivamente a funcao de distribuicao.

Antes de disso, precisamos de um resultado auxiliar, a chamada formulade inversao a qual permite calcularmos probabilidades de intervalos a partirda funcao caracterıstica.

Teorema 7.6 (Formula de Inversao). Se a variavel aleatoria X tem comofuncao caracterıstica φ

X(t), entao para qualquer intervalo (a, b) temos

P (a < X < b) +P (X = a) + P (X = b)

2=

= limT→∞

1

∫ T

−T

e−ita − e−itb

itφ

X(t) dt·

Demonstracao. Considere a integral

1

∫ T

−T

e−ita − e−itb

itφ

X(t) dt =

=1

∫ T

−T

e−ita − e−itb

it

[∫ +∞

−∞eitx dFX(x)

]dt

=

∫ T

−T

∫ +∞

−∞

eit(x−a) − eit(x−b)

2πitdFX(x) dt

=

∫ +∞

−∞

∫ T

−T

eit(x−a) − eit(x−b)

2πitdt dFX(x)·

Para qualquer numero real c temos que

∫ T

−T

eitc

2itdt =

∫ T

−T

[cos(tc)

2it+

i sen(tc)

2it

]dt·

186 CAPITULO 7. TEOREMAS LIMITES

Acontece quecos(tc)

te uma funcao ımpar e

sen(tc)

te uma funcao par, logo

∫ T

−T

cos(tc)

tdt = 0 e

∫ T

−T

sen(tc)

tdt = 2

∫ T

0

sen(tc)

tdt. Entao

∫ T

−T

eitc

2itdt =

∫ T

0

sen(tc)

tdt,

e deste resultado temos

1

∫ T

−T

e−ita − e−itb

itφ

X(t) dt =

=

∫ +∞

−∞

1

π

∫ T

0

sen[t(x− a)]

tdt−

∫ T

0

sen[t(x− b)]

tdt

dFX(x)·

A integral

limT→∞

∫ T

0

sen(t)

tdt =

π

2,

e conhecida como integral classica de Dirichlet e, a partir dela, podemoscalcular

limT→∞

1

π

∫ T

0

sen(tc)

tdt =

limT→∞

1

π

∫ cT

0

sen(t)

tdt =

1

2, se c > 0

limT→∞

− 1

π

∫ T

0

sen(−tc)

tdt = −1

2, se c < 0

e zero caso x = c, satisfazendo-se ∀c ∈ R.Utilizando o Teorema da Convergencia Dominada temos que

limT→∞

∫ +∞

−∞

1

π

∫ T

0

sen[t(x− a)]

tdt−

∫ T

0

sen[t(x− b)]

tdt

dFX(x) =

=

∫ +∞

−∞limT→∞

1

π

∫ T

0

sen[t(x− a)]

tdt−

∫ T

0

sen[t(x− b)]

tdt

dFX(x)·

Aplicando o resultado da integral de Dirichlet, esta ultima integral e iguala ∫ +∞

−∞g(x) dFX(x),

7.1. FUNCAO CARACTERISTICA 187

onde

g(x) =

1

2, se x = a

1, se a < x < b

1

2, se x = b

0, caso contrario

e esta integral e igual a

P (a < X < b) +P (X = a) + P (X = b)

Devemos observar que, caso os pontos a e b forem de continuidade dafuncao de distribuicao FX , a formula de inversao se reduz a expressao

FX(b)− FX(a) = limT→∞

1

∫ T

−T

e−ita − e−itb

itφ

X(t) dt· (7.5)

Isto significa que a funcao caracterıstica φX determina a funcao de distri-buicao FX e, portanto, a funcao de distribuicao pode ser calculada a partirda funcao caracterıstica.

Acontece que nao costuma ser pratico obter a funcao de distribuicaoatraves da formula de inversao. A utilidade desta formula e na demonstracaodo seguinte teorema, conhecido como Teorema de Unicidade.

Teorema 7.7 (Teorema de Unicidade). A funcao caracterıstica de umavariavel aleatoria X determina univocamente sua funcao de distribuicao.

Demonstracao. E uma consequencia direta do Teorema 7.6, a Formula deInversao, pois esta implica que, ∀x ∈ R

FX(x) = limb→x

lima→−∞

limT→∞

1

∫ T

−T

e−ita − e−itb

itφ

X(t) dt, (7.6)

sendo x um ponto de continuidade de FX e o limite e unico.

Este resultado permanece valido mesmo nao sendo x um ponto de conti-nuidade de FX . Mais ainda, os Teoremas 7.6 e 7.7 sao validos caso FX seja

188 CAPITULO 7. TEOREMAS LIMITES

uma funcao contınua a direita, arbitraria, de variacao limitada, restrita acondicao FX(−∞) = 0. De fato, tal funcao pode ser representada na forma

FX(x) = α1F1(x) + α2F2(x),

onde F1 e F2 sao funcoes de distribuicao. Para a funcao caracterıstica obte-mos, de forma obvia, a equacao correspondente

φX(x) = α1φX

(x) + α2φX(x)·

Dos resultados em (7.5) e (7.6), aplicados a F1 e F2 separadamente, obtemosimediatamente (7.5) e (7.6) para FX .

Corolario 7.8. Se as funcoes caracterısticas de duas variaveis aleatorias Xe Y coincidirem, entao X e Y tem a mesma distribuicao.

Demonstracao. Segue de imediato da Formula de Inversao.

Consideramos alguns exemplos da aplicacao destes ultimos resultados.

Exemplo 7.4. Se as variaveis independentes X1 e X2 sao normalmente dis-tribuıdas, entao sua soma Y = X1 +X2 e tambem normalmente distribuıda.

De fato, se E(X1) = µ1, Var(X1) = σ21, E(X2) = µ2 e Var(X2) = σ2

2,entao as funcoes caracterısticas das varaveis X1 e X2 sao, respectivamente,

φX1

= exp

iµ1t−

1

2σ21t

2

e exp

iµ2t−

1

2σ22t

2

·

Pelo Teorema 7.5, a funcao caracterıstica φYda soma Y = X1 +X2 e

φY(t) = φ

X1× φ

X2= exp

i(µ1 + µ2)t−

1

2(σ2

1 + σ22)t

2

·

Esta e a funcao caracterıstica da distribuicao normal com esperancaµ = µ1 + µ2 e variancia σ = σ2

1 + σ22. Com base no teorema de unicidade,

concluımos que a funcao de distribuicao da variavel aleatoria Y e normal. Einteressante mencionar que a proposicao inversa tambem e verdadeira: se asoma de duas variaveis aleatorias independentes e normalmente distribuıda,entao cada somando e normalmente distribuıdo (Cramer, 1936).

7.1. FUNCAO CARACTERISTICA 189

Exemplo 7.5. Caso as variaveis X1 ∼ Poisson(λ1) e X2 ∼ Poisson(λ2)sejam independentes, no Exemplo 7.1 foi obtido que a funcao caracterısticade cada uma e

φX1

= expλ1

(eit − 1

)e φ

X2= exp

λ2

(eit − 1

A funcao caracterıstica da soma Y +X1 +X2 e

φY= φ

X1× φ

X2= exp

(λ1 + λ2

)(eit − 1

),

isto e, a funcao caracterıstica de certa variavel aleatoria com distribuicaoPoisson. De acordo com o teorema de unicidade, a variavel Y tem distri-buicao Poisson de parametro λ = λ1 + λ2, ou seja,

P (Y = k) =(λ1 + λ2)

ke−(λ1+λ2)

k!, (k > 0)·

Raikov (1938) provou a proposicao inversa: se a soma de variaveis aleatoriasindependentes e distribuıda de acordo com uma distribuicao Poisson, entaocada uma delas e distribuıda de acordo com uma distribuicao Poisson.

Teorema 7.9. A variavel aleatoria X tem distribuicao simetrica em tornode zero se, e somente se, φ

X(t) e uma funcao real ∀t ∈ R.

Demonstracao. Uma variavel aleatoria tem distribuicao simetrica em tornode zero se P (X ≤ x) = P (X ≥ −x), ∀x ∈ R. Esta igualdade pode ser escritacomo P (X ≤ x) = P (−X ≤ x), ∀x ∈ R, isto significa que FX = F−X e queX e −X sao igualmente distribuıdas, logo

φX(t) = φ−X

(t) = φ−X(−t) = E[ei(−t)(−X)] = E(eitX) = φ

X(t)·

Mas, c = c se, e somente se, c e real. Entao X e simetrica em torno de zerose, e somente se, φ

X(t) e real ∀t ∈ R.

Exemplo 7.6. Seja φ(t) = cos(at), sendo a > 0. Mostremos que φ e funcaocaracterıstica para alguma variavel aleatoria X. Para demonstrar isto encon-tremos a funcao de distribuicao correspondente a φ. Primeiro observamosque φ e real, entao X e uma variavel aleatoria simetrica em torno de zero.Mais ainda, a funcao coseno e par, entao cos(at) = cos(−at). Significa quea variavel aleatoria X da qual φ e funcao caracterıstica assune somente osvalores a e −a. Do fato de ser simetrica ambos valores sao assumidos coma mesma probabilidade, assim temos que P (X = a) = P (X = −a) = 1/2.

190 CAPITULO 7. TEOREMAS LIMITES

Teorema 7.10. Se E|X|n < ∞, entao φX possui n derivadas contınuas e

φ(k)X(t) =

∫ +∞

−∞(ix)keitx dFX(x),

para k = 1, 2, · · · , n.

Esta propriedade nos disse que φ(k)X(0) = ik E(Xk), de modo que a funcao

caracterıstica e uma especie de funcao geradora de momentos. Aqui

φ(k)X(0) =

dkφX(t)

dtk

t=0

e a k-esima derivada de φXavaliada no ponto t = 0.

Demonstracao. Dado que X e integravel queremos provar que

φ′X(t) =

∫ +∞

−∞(ix)eitx dFX(x),

restando somente justificar a diferenciacao dentro da integral. Para quaisquert, h ∈ R, h = 0 temos que

φX(t+ h)− φ

X(t)

h=

∫ +∞

−∞

ei(t+h)x − eitx

hdFX(x) =

=

∫ +∞

−∞eitx

(eihx − 1)

hdFX(x) = E

[eitx

(eihx − 1)

h

Dado que

limh→0

[(eihx − 1)

h

]= ix, ∀x ∈ R

temos que

limh→0

[eitx

(eihx − 1)

h

]= ixeitx·

Por outro lado, ∀x ∈ R,eihx − 1

h

=

∫ h

0ixeiux du

h

= |x|

∫ h

0eiux du

h

≤ |x|∫ h

0|eiux| duh

= |x|∫ h

0du

h= |x|,

7.2. DISTRIBUICOES INFINITAMENTE DIVISIVEIS 191

entao eitx(eihx − 1)

h

≤ |x|·

Logo, pelo Teorema da Convergencia Dominada temos

φ′X(t) = lim

h→0

φX(t+ h)− φ

X(t)

h= lim

n→0E

[eitx

(eihx − 1)

h

]

= E(iXeitX) =

∫ ∞

−∞ixeitx dFX(x)·

A continuidade de φX(t) no ponto t decorre de lims→t ixe

isx = ixeitx e que|ixeisx| = |x|. O restante da demonstracao e obtida por inducao em n.

Exemplo 7.7 (Continuacao Exemplo 7.1). Vamos obter a media e varianciade X utilizando o Teorema 7.10. Sabemos que existem e com isto queremosdizer que sao finitas, as esperancas de X para qualquer n. Entao

iE(X) = φ′X(0) = iλeiteλ(e

it−1)t=0

= iλ·

Tambem

i2 E(X2) = φ′′X(0) =

d

dt

[iλeiteλ(e

it−1)]

t=0

= iλe−λeit+λeit(i+ iλeit)t=0

= iλe−λeλ(i+ iλ) = i2λ(1 + λ),

portanto, E(X) = λ, E(X2) = λ+ λ2 e Var(X) = λ.

7.2 Distribuicoes infinitamente divisıveis

Teoremas de limites classicos assim como generalizacoes, que constituem oconteudo principal desta secao, tem a ver com somas do tipo

X = ξ1 + ξ2 + · · ·+ ξn,

de um numero crescente de termos de uma sequencia ξ1, ξ2, · · · , ξn, · · · devariaveis aleatorias independentes. Neste capıtulo vai aparecer que as distri-buicoes infinitamente divisıveis desempenham um papel fundamental, mesmonos problemas classicos de teoremas limite para somas de variaveis aleatoriasdiscretas independentes.

192 CAPITULO 7. TEOREMAS LIMITES

Definicao 7.2. Dizemos que a variavel aleatoria X e infinitamente divisıvelse, para todo numero natural n, X pode ser escrita como a soma

X = ξ1 + ξ2 + · · ·+ ξn,

de n variaveis aleatorias ξ1, ξ2, · · · , ξn independentes e igualmente dis-tribuıdas.

As funcoes de distribuicao de variaveis aleatorias infinitamente divisıveisserao chamadas de funcoes de distribuicao infinitamente divisıveis. Obvia-mente, a funcao de distribuicao F e infinitamente divisıvel se, e somente se,sua funcao caracterıstica φ e.

Teorema 7.11. Seja X uma variavel aleatoria infinitamente divisıvel comfuncao caracterıstica φ

X. Entao, para todo numero natural n, φ

Xe a n-esima

potencia de alguma funcao caracterıstica φξn, isto e,

φX(t) = [φ

ξn(t)]n· (7.7)

Demonstracao. Sabemos, pela definicao 7.2, que para todo numero natural n,X pode ser escrita como a soma X = ξ1+ξ2+ · · ·+ξn, onde ξ1, ξ2, · · · , ξn saoindependentes e igualmente distribuıdas com funcao caracterıstica φ

ξn. Pelo

resultado em (7.4), sabemos que a funcao caracterıstica da soma de variaveisaleatorias independentes e igualmente distribuıdas e φ

X(t) = [φ

ξn(t)]n.

Exemplo 7.8. A variavel aleatoria X, normalmente distribuıda, e infinita-mente divisıvel. Suponhamos que E(X) = µ e Var(X) = σ2, sabemos que afuncao caracterıstica de X e

φX(t) = eiµt−

σ2

2t2 ·

Dado que, para todo n > 0,

φξn(t) = ei

µnt−σ2

2nt2

e a funcao caracterıstica de uma variavel aleatoria ξn com distribuicao normalde media µ/n e variancia σ2/n. Nossa afirmacao esta provada.

7.2. DISTRIBUICOES INFINITAMENTE DIVISIVEIS 193

A expressao inversa de (7.7)

φξn(t) = n

√φ

X(t),

nao determina exclusivamente os valores de φξn(t) em termos dos valores de

φX(t), a n-esima raiz tem n valores. Requisitos adicionais tornarao possıvel

determinar exclusivamente φξn(t) em todo intervalo de t.

Exemplo 7.9. A variavel aleatoria X, com distribuicao Poisson, e infinita-mente divisıvel. Suponhamos que os possıveis valores de X sejam da formaλ+ kh, k = 0, 1, 2, · · · e que

P (X = µ+ kh) =λke−λ

k!·

Entao, a funcao caracterıstica e

φX(t) = eiµt+λ(eith−1)·

Daı concluımos que, para todo n > 0,

n√φ

X(t) = ei

µnt+λ

n(eith−1),

e a funcao caracterıstica de uma variavel aleatoria, tambem com distribuicaoPoisson. Nossa afirmacao esta provada.

Exemplo 7.10. A variavel aleatoria X, com distribuicao Cauchy e infinita-mente divisıvel. A funcao de distribuicao, para σ > 0 assume a forma

FX(x) =1

π

2+ arctan

(x− µ

σ

))·

Obtemos, entao, que a funcao caracterıstica nesta situacao e da forma

φX(t) = eiµt−σ|t|·

Nossa afirmacao esta provada.

Exemplo 7.11. A variavel aleatoria X, com funcao de densidadeonde α > 0 e β > 0, e infinitamente divisıvel.

Teorema 7.12. A funcao caracterıstica de uma variavel aleatoria infinita-mente divisıvel nunca e zero.

Demonstracao. content...

194 CAPITULO 7. TEOREMAS LIMITES

Teorema 7.13. Se φX(t) uma funcao caracterıstica de alguma distribuicao

infinitamente divisıvel, entao para todo c > 0 a funcao φX(t)c e tambem

uma funcao caracterıstica.

Demonstracao. content...

7.3 Convergencia estocastica

Em probabilidade e estatıstica e muitas vezes necessario examinar a distri-buicao de uma variavel aleatoria, que e ela propria uma funcao de variasvariaveis aleatorias, por exemplo, Y = g(X1, · · · , Xn). Como exemplo sim-ples podemos pensar na media amostral Xn =

∑nk=1 Xk.

Infelizmente, encontrar a distribuicao exata e frequentemente muito difıcilou muito demorada mesmo se a distribuicao conjunta das variaveis aleatoriasseja conhecida exatamente. Em outros casos, podemos ter apenas informacoesparciais sobre a distribuicao conjunta deX1, · · · , Xn caso em que e impossıveldeterminar a distribuicao de Y . No entanto, quando n e grande, pode serpossıvel obter aproximacoes a distribuicao de Y , mesmo quando apenas umainformacao parcial sobre X1, · · · , Xn esteja disponıvel. Em muitos casos,estas aproximacoes podem ser extremamente precisas.

Para entender como obter aproximacoes a distribuicao de Y primeiro es-tudaremos diversas formas de convergencia estocastica assim como algumasdesigualdades probabilısticas e suas inter-relacoes. Algumas destas desigual-dades sao muito importantes para demonstrar resultados posteriores, comoa Lei dos Grandes Numeros na Secao 7.4 e o Teorema do Limite Central naSecao 7.5.

Uma questao importante e: qual o espaco de probabilidade da variavellimite? o espaco de probabilidade de cada uma das variaveis X1, X2, · · ·e (Ω,F , P ) mas, se a sequencia Xn convergir a uma variavel aleatoriaX, esta nao necessariamente tem que estar definida no mesmo espaco deprobabilidade.

Observemos que se

Ωn = (Ω, · · · ,Ω| z n vezes

)

for o espaco amostral do vetor (X1, · · · , Xn) entao o espaco amostral limite

7.3. CONVERGENCIA ESTOCASTICA 195

e Ω∞, a σ-algebra limite satisfaz que

Fn = (F , · · · ,F| z n vezes

)

e Fn+1 = (F , · · · ,F| z n vezes

,F) probabilidade e a funcao de probabilidade limite e

P n+1 = (P, · · · , P| z n vezes

,∞).

7.3.1 Convergencia em probabilidade

Suponha-se que X1, X2, · · · e uma sequencia de variaveis aleatorias. A grossomodo, diz-se que esta sequencia converge para um determinado numero c,se a distribuicao de probabilidade de Xn torna-se cada vez mais concentradaem torno de c, quando n → ∞. Para ser mais precisos, damos a seguintedefinicao.

Definicao 7.3. Seja Xn uma sequencia de variaveis aleatorias definidasno mesmo espaco de probabilidade. Dizemos que a sequencia Xn convergeem probabilidade a variavel aleatoria X se, para todo ϵ > 0,

limn→∞

P (|Xn −X| > ϵ) = 0· (7.8)

Nesta situacao escrevemos XnP−→ X.

Ressaltamos que esta definicao nao diz nada sobre a convergencia dasvariaveis aleatorias Xn a variavel aleatoria X, no sentido em que e entendido

em calculo. Entao se XnP−→ X isto nao implica que, Xn e X serao apro-

ximadamente iguais quando n seja suficientemente grande. Esta definicaosomente nos disse acerca da convergencia da sequencia de probabilidadesP (|Xn−X| > ϵ) a zero. Uma outra observacao que devemos fazer e que estadefinicao tambem nada informa acerca do espaco de probabilidade no qual avariavel limite esta definida.

Exemplo 7.12. Seja Xn uma sequencia de variaveis aleatorias com µn =E(Xn) e σ2

n = Var(Xn) tais que limn→∞ µn = c, onde c e uma constante elimn→∞ σ2

n = 0. Pela desigualdade de Markov em (5.17), temos que

limn→∞

P (|Xn − c| ≥ ϵ) ≤ limn→∞

E[(Xn − c)2]

ϵ2= 0,

196 CAPITULO 7. TEOREMAS LIMITES

devido a que E[(Xn − c)2] = σ2n + (µn − c)2. Portanto Xn

P−→ c.

Teorema 7.14. Seja Xn uma sequencia de variaveis aleatorias que con-verge em probabilidade a variavel aleatoria X e g uma funcao contınua defi-nida em R. Entao

g(Xn)P−→ g(X), (7.9)

quando n → ∞.

Demonstracao. Dado que X e variavel aleatoria, temos que, dado ϵ > 0podemos encontrar uma constante k = k(ϵ) de maneira que

P (|X| > k) =<ϵ

Tambem, g e contınua em R, logo e uniformemente contınua em [−k, k].Segue entao que existe δ = δ(ϵ, k) tal que

|g(xn)− g(x)| < ϵ,

sempre que |x| ≤ k e |xn − x| < δ. Sejam os eventos

A = ω ∈ Ω : |X(ω)| ≤ k, B = ω ∈ Ω : |Xn(ω)−X(ω)| < δ

eC = ω ∈ Ω : |g(Xn(ω))− g(X(ω))| ≤ ϵ·

Entao, A ∩ B ⊆ C. Segue que

P (Cc) ≤ P (Ac) + P (Bc),

isto e,

P (|g(Xn)− g(X)| ≥ ϵ) ≤ P (|X| > k) + P (|Xn −X| ≥ δ),

para n ≥ N(ϵ, δ, k), onde N(ϵ, δ, k) e escolhida satisfazendo

P (|Xn −X| ≥ δ) <ϵ

2, para n ≥ N(ϵ, δ, k)·

7.3. CONVERGENCIA ESTOCASTICA 197

Corolario 7.15. Seja Xnn≥1 uma sequencia de variaveis aleatorias tal que

XnP−→ c, onde c e uma constante. Entao, se g for uma funcao contınua

temos que

g(Xn)P−→ g(c), (7.10)

quando n → ∞.

Demonstracao. Exercıcio.

Exemplo 7.13. Seja ....

7.3.2 Convergencia em media

A situacao aqui e considerar X,X1, X2, · · · variaveis aleatorias definidas nomesmo espaco de probabilidade (Ω,F , P ) e suponha que Xn convirja pon-tualmente para X, quando n → ∞. Como a convergencia e pontual significaque Xn(ω) → X(ω), para todo ω ∈ Ω.

A questao e a seguinte: sob quais condicoes a esperanca do limite e olimite das esperancas? Isto e, queremos saber quando

E(X) = limn→∞

E(Xn)·

Infelizmente, nem sempre E(Xn) → E(X), quando n → ∞.

Exemplo 7.14. Seja X ∼ Cauchy(0, 1) e cada Xn definida como

Xn = X1[−n≤X≤n] =

X, se −n ≤ X ≤ n0, se |X| > n

·

Isto significa que cada Xn e uma variavel Cauchy truncada. Podemos perceberque Xn(ω) → X(ω), pois Xn(ω) = X(ω) para n ≥ |X(ω)|. Tambem percebe-mos que Xn e integravel, porque e limitada e ainda obtemos que E(Xn) = 0,isto por ser simetrica. Mas E(Xn) nao converge para E(X), porque E(X)nao existe.

Investigaremos respostas a questao anteriormente levantada. A primeiraresposta e apresentada no teorema a seguir, o qual nos disse que a esperancado limite e o limite das esperancas quando as variaveis sao nao negativas e asequencia cresce monotonamente.

198 CAPITULO 7. TEOREMAS LIMITES

Teorema 7.16 (Teorema da convergencia monotona). Sejam X1, X2, · · ·variaveis aleatorias definidas no espaco de probabilidade

Demonstracao. FFFF

Uma outra resposta a questao levantada no inıcio desta secao e tambemapresentada na forma de teorema, conhecido como de convergencia domi-nada. Resumidamente, a esperanca do limite e o limite das esperancasquando a sequencia seja uniformemente limitada ou dominada por uma variavelintegravel.

Teorema 7.17 (Teorema da convergencia dominada). Sejam X1, X2, · · ·variaveis aleatorias definidas no espaco de probabilidade

Demonstracao. FFFF

7.3.3 Convergencia quase certamente

Definicao 7.4. Seja Xnn≥1 uma sequencia de variaveis aleatorias defini-das no mesmo espaco de probabilidade (Ω,F , P ). Dizemos que a sequenciaXnn≥1 converge quase certamente a variavel aleatoria X se

P(

ω ∈ Ω : limn→∞

Xn(ω) = X(ω))

= 1· (7.11)

Nesta situacao escrevemos Xnq.c.−→ X.

Observemos que convergencia quase certamente e convergencia pontual, comprobabilidade 1. Costuma-se dizer queXn(ω) converge paraX(ω) para quasetudo ω.

7.3. CONVERGENCIA ESTOCASTICA 199

7.3.4 Convergencia em distribuicao

Comecamos com o modo mais fraco.

Definicao 7.5. Seja Fnn≥1 uma sequencia de funcoes de distribuicao. Seexiste uma funcao de distribuicao F de modo que, quando n → ∞

Fn(x) −→ F (x), (7.12)

em todo ponto x no qual F e contınua, dizemos que Fn converge em lei para

F e escrevemos FnL−→ F .

Devemos observar que e possıvel que uma determinada sequencia defuncoes de distribuicao convirja para uma funcao que nao seja funcao dedistribuicao.

Exemplo 7.15. Considere a sequencia de funcoes de distribuicao

Fn(x) =

0, se x < n1, se x ≥ n

·

Aqui Fn(x) e a funcao de distribuicao da variavel aleatoria degenerada emx = n. Observemos que Fn(x) converge a uma funcao F que e identicamenteigual a zero a qual, portanto, nao e uma funcao de distribuicao.

Exemplos .......

Teorema 7.18. Seja Xn uma sequencia de variaveis aleatorias com valoresinteiros

Definicao 7.6. Seja Xnn≥1 uma sequencia de variaveis aleatorias eFnn≥1 a correspondente sequencia de funcoes de distribuicao. Dizemos queXn converge em distribuicao a X se existe uma variavel aleatoria X, com

funcao de distribuicao F , de maneira que FnL−→ F . Escrevemos Xn

D−→ X.

200 CAPITULO 7. TEOREMAS LIMITES

Teorema 7.19. Sejam F e F1, F2, · · · funcoes de distribuicao. Se Fn −→n→∞

F

entao ∫g(x) dFn(x) −→

n→∞

∫g(x) dF (x), (7.13)

para toda funcao real g contınua e limitada.

Demonstracao. Para ...

Observemos que se XnD−→ X, deste teorema obtemos que E[g(Xn)] −→

n→∞E[g(X)]. Em particular

7.3.5 Relacoes entre os modos de convergencia

Queremos entender nesta secao como estao relacionados as diferentes formasde convergencia estocastica definidas. Isto significa que investigaremos emquais situacoes coincidem, em quais nao, e se existe uma forma mais fraca ealguma mais forte.

Teorema 7.20. Seja Xn uma sequencia de variaveis aleatorias e X uma

outra variavel aleatoria tais que XnP−→ X. Entao, Xn

D−→ X.

Demonstracao. Sejam Fn e F as funcoes de distribuicao de Xn e X, respec-tivamente. Temos entao que

ω : X(ω) ≤ x′ =

ω : Xn(ω) ≤ x,X(ω) ≤ x′∪

ω : Xn(ω) > x,X(ω) ≤ x′⊆ ω : X(ω) ≤ x

∪ω : Xn(ω) > x,X(ω) ≤ x′ ·

Segue entao que

F (x′) ≤ Fn(x) + P (Xn > x,X ≤ x′)·

Dado que Xn −XP−→ 0 temos que, para x′ < x

P (Xn > x,X ≤ x′) ≤ P (|Xn −X| > x− x′) −→n→∞

7.3. CONVERGENCIA ESTOCASTICA 201

Portanto

F (x′) ≤ lim infn→∞

Fn(x), x′ < x·

Similarmente, trocando X e Xn assim como x e x′, temos que

lim supn→∞

Fn(x) ≤ F (x′′), x < x′′·

Entao, para x′ < x < x′′, temos que

F (x′) ≤ lim infn→∞

Fn(x) ≤ lim supn→∞

Fn(x) ≤ F (x′′)·

Devido a F ter somente um numero enumeravel de pontos de descontinuida-des, escolhemos x como um ponto de continuidade de F e fazemos x′′ → x+

e x′ → x−, do qual temos que

F (x) = limn→∞

Fn(x)

em todo ponto de continuidade de F .

Teorema 7.21. Seja Xn uma sequencia de variaveis aleatorias tal que

XnD−→ c, onde c e uma constante. Entao, Xn

P−→ c.

Demonstracao. Exercıcio.

Corolario 7.22. Seja c uma constante. Entao XnD−→ c se, e somente se,

XnP−→ c.

Demonstracao. Consequencia dos teoremas 7.20 e 7.21.

Teorema 7.23. Se Xnq.c−→ X, entao Xn

P−→ X.

Demonstracao. content...

202 CAPITULO 7. TEOREMAS LIMITES

7.4 Lei dos Grandes Numeros

Nesta secao, vamos investigar respostas para a seguinte questao: existemsequencias de constantes An e Bn tais que a sequencia de variaveis aleatoriasB−1

n (Yn − An) converge, quando n → ∞, sendo Yn = g(X1, · · · , Xn). Umaprimeira resposta e considerada na Secao 7.4.1 e outra na Secao 7.4.2. Adiferenca fundamental e no tipo de convergencia. A lei fraca considera con-vergencia em probabilidade enquanto a lei forte refere-se a convergencia quasecerta.

7.4.1 Lei Fraca dos Grandes Numeros

Se considerarmos Xn uma sequencia de variaveis aleatorias e Sn =∑∞

n=1 Xn

a lei fraca, considerada aqui, trata das condicoes necessarias nas sequenciasde numeros An e Bn para que a sequencia de variaveis aleatorias B

−1n (Sn−An)

convirja em probabilidade para zero, quando n → ∞.

Definicao 7.7 (Lei Fraca dos Grandes Numeros). Seja Xn uma sequenciade variaveis aleatorias e Sn =

∑nk=1 Xk, n ≥ 1. Dizemos que a sequencia

Xn obedece a Lei Fraca dos Grandes Numeros com relacao a sequencia deconstantes Bn, Bn > 0 e limn→∞ Bn = ∞ se existir uma sequencia denumeros reais An tal que

Sn − An

Bn

P−→ 0· (7.14)

Os numeros An sao chamados de constantes de centralizacao e os Bn saochamados de constantes de normalizacao.

Claro que os diversos exemplos na Secao 7.3.1 servem como situacoesparticulares de sequencias que satisfazem a Lei Fraca dos Grandes Numeros,interessa-nos entao apresentar resultados mais gerais.

Teorema 7.24 (Lei dos Grandes Numeros de Chebyshev). Seja Xn umasequencia de variaveis aleatorias definidas no mesmo espaco de probabilidadetais que E(Xk) = µk, Var(Xk) = σ2

k e Cov(Xr, Xs) = 0, r = s. Se

limn→∞

n∑

k=1

σ2k = +∞

7.4. LEI DOS GRANDES NUMEROS 203

e escolhendo An =∑n

k=1 µk e Bn =∑n

k=1 σ2k, temos que

Sn − E(Sn)

Var(Sn)

P−→ 0· (7.15)

Demonstracao. Utilizando a Desigualdade de Chebyshev temos que, paratodo ϵ > 0,

P

(Sn −n∑

k=1

µk

≥ ϵ

n∑

k=1

σ2k

)≤

E

[n∑

k=1

(Xk − µk)

]2

ϵ2

(n∑

k=1

σ2k

)2 =1

ϵ2n∑

k=1

σ2k

−→n→∞

Logo, concluımos que a convergencia em (7.15) e valida.

Note que nesse caso, as variaveis aleatorias nao precisam ter esperancas evariancias iguais para ser valido este resultado. Claro que, caso a sequenciaXnn≥1 for composta de variaveis aleatorias independentes e igualmente dis-tribuıdas com media E(X1) = µ e Var(X1) = σ2 < ∞, entao Var(Sn)/n

2 =nσ2/n2 = σ2/n → 0, quando n → ∞ e, portanto, Xnn≥1 satisfaz a Lei dosGrandes Numeros de Chebyshev.

Embora o caso de variaveis aleatorias identicamente distribuıdas seja omais frequente, observe que essa condicao nao e necessaria, bastando qe quetodas as variaveis tenham a mesma media

Teorema 7.25 (Lei dos Grandes Numeros de Khinchine). Sejam X1, X2, · · ·variaveis aleatorias definidas no mesmo espaco de probabilidade independen-tes e igualmente distribuıdas tais que E(Xk) = µ < ∞ existe. Entao

Xn − µP−→ 0, (7.16)

quando n → ∞.

E interessante observar que a existencia do segundo momento nao e as-sumida, como no Teorema 7.24 de Chebyshev, mas as observacoes sao con-sideradas independentes e igualmente distribuıdas. A prova deste teorema,

204 CAPITULO 7. TEOREMAS LIMITES

apresentada a seguir, segue apenas resultados elementares e foi desenvolvidapor Markov.

Demonstracao. Definamos um par de novas variaveis aleatorias

Yi = Xi, Zi = 0, se |Xi| < δn,Yi = 0, Zi = Xi, se |Xi| ≥ δn,

para i = 1, · · · , n e δ > 0 fixo. Entao Xi = Yi + Zi. Seja E(Yi) = µn parai = 1, · · · , n. Dado que E(Xi) = µ

|µn − µ| < ϵ

para qualquer ϵ dado, se n e escolhido suficientemente grande.

Vimos que, se uma sequencia de funcoes de distribuicao cumulativas Fnconverge pontual a um limite, a funcao de limitar a F nao e necessariamenteuma funcao de distribuicao cumulativa. Para garantir que ele e, e necessarioque as distribuicoes estao apertados. Da mesma forma, se uma sequenciade funcoes caracterısticas convergem para cada t, o limite nao e, necessaria-mente, uma funcao caracterıstica de uma distribuicao de probabilidades. Noentanto, neste caso, o aperto de uma sequencia traduz numa condicao muitosimples na funcao caracterıstica limitativa.

7.4.2 Lei Forte dos Grandes Numeros

Se considerarmos Xn uma sequencia de variaveis aleatorias e Sn =∑∞

n=1 Xn

a lei fraca, considerada aqui, trata das condicoes necessarias nas sequenciasde numeros An e Bn para que a sequencia de variaveis aleatorias B

−1n (Sn−An)

convirja em probabilidade para zero, quando n → ∞.

Definicao 7.8 (Lei Forte dos Grandes Numeros). Seja Xnn≥1 umasequencia de variaveis aleatorias e seja Sn =

∑∞n=1 Xn, n = 1, 2, · · · . Dize-

mos que a sequencia obedece a Lei Fraca dos Grandes Numeros com relacaoa sequencia de constantes Bnn≥1, Bn > 0 e limn→∞ Bn = ∞ se existir umasequencia de numeros reais Ann≥1 tal que

(Sn − An)

Bn

q.c.−→ 0, (7.17)

] quando n → ∞. An sao chamadas de constantes de centralizacao e Bn deconstantes de normatizacao.

7.5. TEOREMA DO LIMITE CENTRAL 205

7.5 Teorema do Limite Central

O segundo teorema fundamental da probabilidade e o Teorema do LimiteCentral. Este teorema diz que se Sn e a soma de n variaveis aleatorias mutu-amente independentes a funcao de distribuicao de Sn e bem aproximada poruma funcao de densidade normal. Existem diversao versoes destes teorema,dentre elas, versoes aplicaveis a sequencias de variaveis aleatorias depen-dentes. Esses resultados embora importantes tambem, nao serao abordadosaqui. O leitor interessado pode consultar Billingsley (1961) ou Teicher &Chow (1978), por exemplo, para maiores detalhes.

Diferentemente da Lei dos Grandes Numeros, a qual da convergencia desequencias de variaveis aleatorias a numeros, o Teorema do Limite Centraltrata da convergencia de uma sequencia de variaveis aleatorias a uma variavelaleatoria.

O teorema central do limite tem uma historia interessante. A primeiraversao deste teorema foi postulada pelo matematico frances Abraham deMoivre , que em um notavel artigo publicado em 1733, usou a distribuicaonormal para aproximar a distribuicao do numero de caras resultantes de mui-tos lancamentos de uma moeda nao viciada. Esse pensamento foi muito afrente de seu tempo, mas fora esquecido ate que o famoso matematico francesPierre Simon de Laplace resgatou-o da obscuridade em sua monumental obraTheorie des Analytique probabilites, que foi publicada em 1812. Laplace ex-pandiu a descoberta de De Moivre e encontrou a aproximacao da distribuicaobinomial a partir distribuicao normal. Mas, como a descoberta de De Moi-vre, a descoberta de Laplace recebeu pouca atencao naquela epoca. Somenteno final do seculo XIX, que a importancia do teorema central do limite foidiscernida, quando em 1901, o matematico russo Aleksandr Lyapunov definiuem termos gerais e provou exatamente como o teorema funcionava matemati-camente. Hoje em dia, o teorema central do limite e considerado o soberanonao oficial da teoria da probabilidade.

Recordemos que a Lei dos Grandes Numeros trata da convergencia dasequencia de variaveis aleatorias .......

Teorema 7.26 (Teorema do Limite Central). Sejam X1, X2, · · · variaveisaleatorias independentes nao degeneradas com funcoes de distribuicao res-pectivas F1, F2, · · · . Assumiremos que E(Xk) = µk, Var(Xk) = σ2 e defini-remos

σ2Sn

= σ21 + σ2

2 + · · ·+ σ2n·

206 CAPITULO 7. TEOREMAS LIMITES

Se Fk e absolutamente contınua com funcao de densidade fk, assumiremosque a relacao

limn→∞

1

σ2Sn

n∑

k=1

|x−µk|>ϵSn

(x− µk)fk(x) dx = 0, (7.18)

e valida ∀ϵ > 0. Se Xk e do tipo discreta com probabilidade positiva pkl emxkl, l = 1, 2, · · · , assumiremos que a relacao

limn→∞

1

σ2Sn

n∑

k=1

|xkl−µk|>ϵSn

(xkl − µk)pkl = 0, (7.19)

e valida ∀ϵ > 0. Entao, a distribuicao da soma padronizada

S∗n =

Sn −∑n

k=1 µk

σSn

=

∑nk=1(Xk − µk)

σSn

(7.20)

converge em distribuicao a uma variavel aleatoria normal padrao, isto e,

∑nk=1(Xk − µk)

σSn

D−→ Z, (7.21)

onde Z ∼ N(0, 1).

Demonstracao. Vejamos que ...

Esta versao e conhecida como Teorema Central do Limite de Lindeberg,devido a ter sido ele quem o demonstrou com estas suposicoes em Lindeberg(1922). Uma excelente referencia acerca da historia deste teorema assimcomo tambem a historia de diferentes versoes pode ser consultada em Fischer(2010), algumas das quais serao consideradas aqui.

Corolario 7.27. Sejam X1, · · · , Xn sao variaveis aleatorias independentese igualmente distribuıdas com E(X1) = µ e Var(X1) = σ2, onde σ2 > 0.Entao

Sn − nµ

σ√n

D−→ Z, (7.22)

onde Z ∼ N(0, 1) quando n → ∞.

7.5. TEOREMA DO LIMITE CENTRAL 207

Demonstracao. Verifiquemos se a condicao de Lindeberg se satisfaz.

Corolario 7.28 (Liapunov Rao pg.127). Sejam X1, X2, · · · variaveisaleatorias independentes. Sejam E(Xk) = µk, E(Xk − µk)

2 = σ2k = 0 e

E|Xk − µk|3 = βk, os quais existem para cada k = 1, 2, · · · .

σ2Sn

= σ21 + σ2

2 + · · ·+ σ2n·

Se Fk e absolutamente contınua com funcao de densidade fk, assumiremosque a relacao

limn→∞

1

σ2Sn

n∑

k=1

|x−µk|>ϵSn

(x− µk)fk(x) dx = 0, (7.23)

e valida ∀ϵ > 0. Se Xk e do tipo discreta com probabilidade positiva pkl emxkl, l = 1, 2, · · · , assumiremos que a relacao

limn→∞

1

σ2Sn

n∑

k=1

|xkl−µk|>ϵSn

(xkl − µk)pkl = 0, (7.24)

e valida ∀ϵ > 0. Entao, a distribuicao da soma padronizada

S∗n =

Sn −∑n

k=1 µk

σSn

=

∑nk=1(Xk − µk)

σSn

(7.25)

converge em distribuicao a uma variavel aleatoria normal padrao, isto e,

∑nk=1(Xk − µk)

σSn

D−→ Z, (7.26)

onde Z ∼ N(0, 1).

Corolario 7.29 (Lindeberg-Feller Rao pg.128). Sejam X1, X2, · · · variaveisaleatorias independentes nao degeneradas com funcoes de distribuicao respec-tivas F1, F2, · · · . Assumiremos que E(Xk) = µk, Var(Xk) = σ2 e definiremos

σ2Sn

= σ21 + σ2

2 + · · ·+ σ2n·

208 CAPITULO 7. TEOREMAS LIMITES

Se Fk e absolutamente contınua com funcao de densidade fk, assumiremosque a relacao

limn→∞

1

σ2Sn

n∑

k=1

|x−µk|>ϵSn

(x− µk)fk(x) dx = 0, (7.27)

e valida ∀ϵ > 0. Se Xk e do tipo discreta com probabilidade positiva pkl emxkl, l = 1, 2, · · · , assumiremos que a relacao

limn→∞

1

σ2Sn

n∑

k=1

|xkl−µk|>ϵSn

(xkl − µk)pkl = 0, (7.28)

e valida ∀ϵ > 0. Entao, a distribuicao da soma padronizada

S∗n =

Sn −∑n

k=1 µk

σSn

=

∑nk=1(Xk − µk)

σSn

(7.29)

converge em distribuicao a uma variavel aleatoria normal padrao, isto e,

∑nk=1(Xk − µk)

σSn

D−→ Z, (7.30)

onde Z ∼ N(0, 1).

7.6. EXERCICIOS 209

7.6 Exercıcios

Exercıcios da Secao 7.1

1. Sejam X e Y duas variaveis aleatorias. Encontre Var(Z), onde Z = X + iY .

2. Seja FX uma funcao de distribuicao para alguma variavel aleatoria X e seja

G(x) = 1− FX(−x−),

onde x− denota o limite pela esquerda.

a) Prove que FX ∗G e uma funcao simetrica.

b) Prove que FX ∗G = G ∗ Fx.

3. Prove, utilizando funcao caracterıstica, que se limn→∞ Fn = F e limn→∞ Gn = G,entao limn→∞ Fn ∗Gn = F ∗G.

4. Prove que se φ(t) e uma funcao caracterıstica, entao |φ(t)|2 tambem e uma funcaocaracterıstica.

5. Seja Xnn≥1 uma sequencia de variaveis aleatorias com funcao de probabilidadedada por

P (Xn = 1) = 1/n e P (Xn = 0) = 1− 1/n, ∀n ≥ 1·

Prove que Xn = oP (1).

6. Encontre a expressao da funcao caracterıstica se a distribuicao e Cauchy(µ,σ).

Exercıcios da Secao 7.2

1. Devemos ....

Exercıcios da Secao 7.3

1. Seja Xnn≥1 uma sequencia de variaveis aleatorias com funcao de probabilidadedada por

P (Xn = 1) = 1/n e P (Xn = 0) = 1− 1/n, ∀n ≥ 1·

Prove que Xn = oP (1).

2. ....

3. Prove o Corolario 7.15.

210 CAPITULO 7. TEOREMAS LIMITES

Exercıcios da Secao 7.4

1. Seja Xn uma sequencia de variaveis aleatorias independentes e igualmente dis-tribuıdas com segundo momento finito. Seja

Yn =2

n(n+ 1)

n∑

i=1

iXi·

Prove que YnP−→ E(X1).

2. Seja Xnn≥1 uma sequencia de variaveis aleatorias com funcao de probabilidadedada por

P (Xn = 1) = 1/n e P (Xn = 0) = 1− 1/n, ∀n ≥ 1·

Prove que Xn = oP (1).

3. Seja Xn uma sequencia de variaveis aleatorias independentes e igualmente dis-tribuıdas com E|Xn| = +∞. Mostre que para todo numero positivo .....Rohatgi,pg. 276, ex. 5

Exercıcios da Secao 7.5

1. Seja Xnn≥1 uma sequencia de variaveis aleatorias independentes com as seguintesfuncoes de probabilidade. Em cada caso mostre se a condicao de Lindeberg e valida?

i) P (Xn = ± 1/2n) = 1/2.

ii) P (Xn = ± 2n+1) = 1/2n+3 e P (Xn = 0) = 1− 1/2n+2.

iii) P (Xn = ± 1) = (1− 2−n)/2 e P (Xn = ± 2−n) = 1/2n+1.

iv) Xnn≥1 e uma sequencia de variaveis aleatorias independentes Poisson(λn),n = 1, 2, · · · , tais que ∑∞

n=1 λn → ∞.

v) P (Xn = ± 2n) = 1/2.

vi) P (Xn = ± 2n) = 1/2n+1 e P (Xn = ± 1) = 1/2(1− 1/2n).

2. Seja Xnn≥1 uma sequencia de variaveis aleatorias independentes com funcao deprobabilidade Binomial(n, θ), 0 < θ < 1. Se Sn = Xn/n, para n ≥ 1,

i) prove que√n(Sn − θ)

D−→ Z, onde Z ∼ N(0, θ(1− θ)).

ii) determine o limite em distribuicao das sequencias de variaveis aleatorias√n(1/Sn − 1/θ) e

√n[Sn(1− Tn)− θ(1− θ)].

3. Seja X1, X2, · · · uma sequencia de variaveis aleatorias de X ∼ Uniforme[(0, θ)],θ > 0. Prove que

√n[log(2Xn) − log(θ)] converge me distribuicao. Encontre o

limite.

4. Seja X1, X2, · · · uma sequencia de variaveis aleatorias com mesma media µ e va-riancia σ2. Tambem seja, Xn = 1

n

∑nk=1 Xk e S2 = 1

n−1

∑nk=1(Xk −X)2. Mostre

que√n(Xn − µ)

D−→ Z, onde Z ∼ N(0, 1).