markov

7
Cadeias de Markov Reginaldo J. Santos Departamento de Matem´atica-ICEx Universidade Federal de Minas Gerais http://www.mat.ufmg.br/~regi 22 de mar¸ co de 2006 Vamos supor que uma popula¸ c˜ao´ e dividida em trˆ es estados (por exemplo: ricos, classe edia e pobres) e que em cada unidade de tempo a probabilidade de mudan¸ca de um estado para outro seja constante no tempo, s´o dependa dos estados. Este processo ´ e chamado cadeia de Markov. Seja t ij a probabilidade de mudan¸ ca do estado j para o estado i em uma unidade de tempo (gera¸c˜ao). Cuidado com a ordem dos´ ındices. A matriz T = 1 2 3 t 11 t 12 t 13 t 21 t 22 t 23 t 31 t 32 t 33 1 2 3 ´ e chamada matriz de transi¸ ao. A distribui¸ c˜aodapopula¸c˜ ao inicial entre os trˆ es estados pode ser descrita pela seguinte matriz: P 0 = p 1 p 2 p 3 est´ a no estado 1 est´ a no estado 2 est´ a no estado 3 A matriz P 0 caracteriza a distribui¸c˜ao inicial da popula¸c˜ ao entre os trˆ es estados e ´ e chamada vetor de estado. Ap´ os uma unidade de tempo a popula¸c˜ ao estar´a dividida entre os trˆ es estados da seguinte forma P 1 = t 11 p 1 + t 12 p 2 + t 13 p 3 t 21 p 1 + t 22 p 2 + t 23 p 3 t 31 p 1 + t 32 p 2 + t 33 p 3 estar´ a no estado 1 estar´ a no estado 2 estar´ a no estado 3 1

Upload: herbert-baioco-vasconcelos

Post on 23-Dec-2015

2 views

Category:

Documents


0 download

DESCRIPTION

cadeias de markov

TRANSCRIPT

Page 1: Markov

Cadeias de Markov

Reginaldo J. SantosDepartamento de Matematica-ICEx

Universidade Federal de Minas Geraishttp://www.mat.ufmg.br/~regi

22 de marco de 2006

Vamos supor que uma populacao e dividida em tres estados (por exemplo: ricos, classe

media e pobres) e que em cada unidade de tempo a probabilidade de mudanca de um

estado para outro seja constante no tempo, so dependa dos estados. Este processo e

chamado cadeia de Markov.

Seja tij a probabilidade de mudanca do estado j para o estado i em uma unidade de

tempo (geracao). Cuidado com a ordem dos ındices. A matriz

T =

1© 2© 3© t11 t12 t13t21 t22 t23t31 t32 t33

1©2©3©

e chamada matriz de transicao. A distribuicao da populacao inicial entre os tres estados

pode ser descrita pela seguinte matriz:

P0 =

p1p2p3

esta no estado 1esta no estado 2esta no estado 3

A matriz P0 caracteriza a distribuicao inicial da populacao entre os tres estados e e

chamada vetor de estado. Apos uma unidade de tempo a populacao estara dividida

entre os tres estados da seguinte forma

P1 =

t11p1 + t12p2 + t13p3t21p1 + t22p2 + t23p3t31p1 + t32p2 + t33p3

estara no estado 1estara no estado 2estara no estado 3

1

Page 2: Markov

2 1 MATRIZES

Lembre-se que tij e a probabilidade de mudanca do estado j para o estado i. Assim a

matriz de estado apos uma unidade de tempo e dada pelo produto de matrizes:

P1 = TP0.

1 Matrizes

Exemplo 1. Vamos considerar a matriz de transicao

T =

1© 2© 3©12

14

012

12

12

0 14

12

1©2©3©

(1)

e o vetor de estados inicial

P0 =

131313

esta no estado 1esta no estado 2esta no estado 3

(2)

que representa uma populacao dividida de forma que 1/3 da populacao esta em cada

estado.

Apos uma unidade de tempo a matriz de estado sera dada por

P1 = TP0 =

12

14

012

12

12

0 14

12

131313

=

141214

Como estamos assumindo que em cada unidade de tempo a matriz de transicao e a

mesma, entao apos k unidades de tempo a populacao estara dividida entre os tres estados

segundo a matriz de estado

Pk = TPk−1 = T 2Pk−2 = · · · = T kP0

Assim a matriz T k da a transicao entre k unidades de tempo.

Cadeias de Markov 22 de marco de 2006

Page 3: Markov

3

2 Sistemas Lineares

Exemplo 2. Vamos tomar a matriz de transicao do Exemplo 1 na pagina 2.

T =

1© 2© 3©12

14

012

12

12

0 14

12

1©2©3©

Vamos descobrir qual distribuicao inicial da populacao entre os tres estados e tal que,

geracao apos geracao, permanece inalterada. Ou seja, vamos determinar P tal que

TP = P ou TP = I3P ou (T − I3)P = 0.

Assim precisamos resolver o sistema linear homogeneo−1

2x + 1

4y = 0

12x − 1

2y + 1

2z = 0

14y − 1

2z = 0

cuja matriz aumentada e −12

14

0 012−1

212

0

0 14−1

20

1a. eliminacao:

−2×1a. linha −→ 2a. linha

1 −12

0 012−1

212

0

0 14−1

20

−1

2×1a. linha + 2a. linha −→ 2a. linha

1 −12

0 0

0 −14

12

0

0 14−1

20

2a. eliminacao:

−4×2a. linha −→ 2a. linha

1 −12

0 00 1 −2 00 1

4−1

20

22 de marco de 2006 Reginaldo J. Santos

Page 4: Markov

4 3 DIAGONALIZACAO

12×2a. linha + 1a. linha −→ 1a. linha

−14×2a. linha + 3a. linha −→ 3a. linha

1 0 −1 00 1 −2 00 0 0 0

Portanto o sistema dado e equivalente ao sistema seguinte{

x − z = 0y − 2z = 0

Seja z = α. Entao y = 2α e x = α. Assim, a solucao geral do sistema e

X =

p1p2p3

= α

121

, para todo α ∈ R.

Tomando a solucao tal que p1 + p2 + p3 = 1 obtemos que se a populacao inicial for

distribuıda de forma que p1 = 1/4 da populacao esteja no estado 1, p2 = 1/2 da populacao

esteja no estado 2 e p3 = 1/4, esteja no estado 3, entao esta distribuicao permanecera

constante geracao apos geracao.

3 Diagonalizacao

Exemplo 3. Vamos tomar a matriz de transicao do Exemplo 1 na pagina 2.

T =

1© 2© 3©12

14

012

12

12

0 14

12

1©2©3©

Vamos calcular potencias k de T , para k um inteiro positivo qualquer. Para isto

vamos diagonalizar a matriz T . Para isso precisamos determinar seus os autovalores e

autovetores. Para esta matriz o polinomio caracterıstico e

p(t) = det(T − t I3) = det

12− t 1

40

12

12− t 1

2

0 14

12− t

= (

1

2− t) det

[12− t 1

214

12− t

]− 1

4det

[12

12

0 12− t

]Cadeias de Markov 22 de marco de 2006

Page 5: Markov

5

= (1

2− t)

[(1

2− t)2 − 1

8

]− 1

8(1

2− t)

= −t3 +3

2t2 − 1

2t = t(−t2 +

3

2t− 1

2) = −t(t− 1)(t− 1

2)

Portanto os autovalores de T sao λ1 = 0, λ2 = 1/2 e λ3 = 1. Agora, vamos determinar os

autovetores associados aos autovalores λ1, λ2 e λ3. Para isto vamos resolver os sistemas

(T − λ1I3)X = 0, (T − λ2I3)X = 0 e (T − λ3I3)X = 0. Como

(T − λ1I3)X = TX = 0 e

12

14

012

12

12

0 14

12

xyz

=

000

A forma escalonada reduzida da matriz aumentada do sistema e 1 0 −1 0

0 1 2 00 0 0 0

Assim, a solucao geral do sistema (T − λ1I3)X = 0 e

W1 = {(α,−2α, α) | α ∈ R} ,

que e o conjunto de todos os autovetores associados a λ1 = 0 acrescentado o vetor nulo.

O conjunto {V1 = (1,−2, 1)} e uma base para W1, pois como (α,−2α, α) = α(1,−2, 1),

V1 gera W1 e um vetor nao nulo e L.I.

Com relacao ao autovalor λ2 = 1/2, o sistema (T − λ2I3)X = 0 e 0 14

012

0 12

0 14

0

xyz

=

000

A forma escalonada reduzida da matriz aumentada do sistema e 1 0 1 0

0 1 0 00 0 0 0

Assim, a solucao geral do sistema (T − λ2I3)X = 0 e

W2 = {(α, 0, α) | α ∈ R}.

22 de marco de 2006 Reginaldo J. Santos

Page 6: Markov

6 3 DIAGONALIZACAO

O conjunto {V2 = (1, 0, 1)} e uma base para W2, pois como (α, 0, α) = α(1, 0, 1), V3 gera

W2 e um vetor nao nulo e L.I.

Com relacao ao autovalor λ3 = 1, o sistema (T − λ3I3)X = 0 e −12

14

012−1

212

0 14−1

2

xyz

=

000

A forma escalonada reduzida da matriz aumentada do sistema e 1 0 −1 0

0 1 −2 00 0 0 0

Assim, a solucao geral do sistema (T − λ3I3)X = 0 e

W3 = {(α, 2α, α) | α ∈ R} ,

que e o conjunto de todos os autovetores associados a λ3 = 1 acrescentado o vetor nulo.

O conjunto {V1 = (1, 2, 1)} e uma base para W1, pois como (α, 2α, α) = α(1, 2, 1), V1 gera

W1 e um vetor nao nulo e L.I.

Como V1, V2 e V3 sao autovetores associados a λ1, λ2 e λ3, respectivamente, entao pela

os autovetores juntos V1, V2 e V3 sao L.I. Assim, a matriz A e diagonalizavel e as matrizes

D =

λ1 0 00 λ2 00 0 λ3

=

0 0 00 1

20

0 0 1

e Q = [ V1 V2 V3] =

1 −1 1−2 0 2

1 1 1

sao tais que

D = Q−1TQ ou T = QDQ−1.

Assim,

T k = QDkQ−1 =

1 −1 1

−2 0 2

1 1 1

0 0 0

0 (12)k 0

0 0 1

14−1

414

−12

0 12

14

14

14

=

14

+ (12)k+1 1

414− (1

2)k+1

12

12

12

14− (1

2)k+1 1

414

+ (12)k+1

Esta e a matriz que da a transicao entre k unidades de tempo (geracoes).

Cadeias de Markov 22 de marco de 2006

Page 7: Markov

REFERENCIAS 7

Referencias

[1] Reginaldo J. Santos. Um Curso de Geometria Analıtica e Algebra Linear. Imprensa

Universitaria da UFMG, Belo Horizonte, 2003.

22 de marco de 2006 Reginaldo J. Santos