vari aveis aleat orias discretasconteudo.icmc.usp.br/pessoas/ehlers/sme0320/discretas.pdf ·...
TRANSCRIPT
Variaveis Aleatorias Discretas
Ricardo [email protected]
Departamento de Matematica Aplicada e EstatısticaUniversidade de Sao Paulo
Definicao
Uma variavel aleatoria e uma funcao definida num espaco amostralque assume valores reais.
1
Exemplo. Uma moeda e lancada 3 vezes. Sejam os eventos, C :resultado cara, K : resultado coroa, e as funcoes X : o numero decaras e Y : o numero de faces iguais.
valores de X valores de Y
CCC 3 3CCK 2 2CKC 2 2KCC 2 2KKC 1 2KCK 1 2CKK 1 2KKK 0 3
2
Definicao
Uma variavel aleatoria discreta X assume valores x1, x2, . . . em umconjunto finito ou infinito enumeravel.
• Neste caso, probabilidades sao calculadas como somas,
P(X ∈ A) =∑xi∈A
P(X = xi ),
para um conjunto A qualquer.
• Para distribuicoes discretas de probabilidade tambem e semprepossıvel mostrar que
∞∑i=1
P(X = xi ) = 1.
3
No exemplo anterior, assumindo que a moeda e honesta e oslancamentos sao independentes todos os resultados do espacoamostral tem probabilidade 1/8. Por exemplo,
P(CCK ) = P(C )P(C )P(K ) =1
2
1
2
1
2=
1
8.
Distribuicao de probabilidades da variavel aleatoria X ,
Valores de X Probabilidades
3 0.1252 0.3751 0.3750 0.125
4
P(X = 3) = P(CCC ) =1
8
P(X = 2) = P(CCK ) + P(CKC ) + P(KCC ) =3
8
P(X = 1) = P(CKK ) + P(KKC ) + P(KCK ) =3
8
P(X = 0) = P(KKK ) =1
8
5
A partir da distribuicao de X outras probabilidades podem sercalculadas,
P(X ≥ 2) = P(X = 2) + P(X = 3) =3
8+
1
8=
1
2
P(X ≤ 2) = P(X = 2) + P(X = 1) + P(X = 0)
=3
8+
3
8+
1
8=
7
8
P(X < 2) = P(X = 1) + P(X = 0)
=3
8+
1
8=
4
8
6
Funcao de Distribuicao
Definicao
O equivalente teorico ao conceito de frequencias acumuladas e afuncao de distribuicao acumulada ou simplesmente funcao dedistribuicao definida como,
F (x) = P(X ≤ x) =∑xi≤x
P(X = xi ), ∀x ∈ R.
7
Exemplo. Uma moeda honesta e lancada 3 vezes de formaindependente e X representa o numero de caras.
F (x) =
0, x < 0,0.125, 0 ≤ x < 1,0.5, 1 ≤ x < 2,0.875, 2 ≤ x < 3,1, x ≥ 3.
8
Para uma variavel aleatoria discreta X que assume valoresx1, x2, . . .
F (x) =∑i :xi≤x
P(X = xi ).
10
Exemplo. Seja a variavel aleatoria X tal que,
F (x) =
0, x < 0,0.5, 0 ≤ x < 1,0.6, 1 ≤ x < 2,0.85, 2 ≤ x < 3,1, x ≥ 3.
P(X = 0) = F (0) = 0.5,
P(X = 1) = F (1)− F (0) = 0.10,
P(X = 2) = F (2)− F (1) = 0.25,
P(X = 3) = F (3)− F (2) = 0.15,
11
Principais Modelos Discretos
• Estudaremos alguns modelos teoricos que se adequam a umaserie de problemas praticos.
• Estes modelos envolvem parametros cujo conhecimento enecessario para calcular probabilidades.
• Na maioria dos problemas reais os parametros seraodesconhecidos e sera preciso fazer algum tipo de inferenciasobre eles.
• Por enquanto assumiremos que os parametros sao conhecidos.Vamos nos concentrar nas principais caracterısticas dosmodelos apresentados.
13
A distribuicao Uniforme Discreta
Suponha um experimento com um numero finito de possıveisresultados e cada um deles com a mesma probabilidade de ocorrer.
Defina uma variavel aleatoria X cujos possıveis valores {x1, . . . , xk}estao associados aos resultados deste experimento. Entao,
P(X = xi ) =1
k, i = 1, . . . , k.
14
A distribuicao de Bernoulli
• Em muitos experimentos os possıveis resultados apresentamou nao uma determinada caracterıstica.
• Esta caracterıstica sera muitas vezes determinada pelopesquisador dependendo dos objetivos do experimento.
• Neste tipo de experimento estaremos interessados naocorrencia de um sucesso ou falha.
• E usual denotar a probabilidade de sucesso por p,
P(sucesso) = p P(fracasso) = 1− p.
15
Podemos definir uma variavel aleatoria X como a variavelindicadora de sucesso em um experimento binario,
X =
{1, se ocorre sucesso0, se ocorre fracasso
e a probabilidade de X assumir cada um dos seus possıveis valores e
P(X = x) =
{px(1− p)1−x se x = 0, 1
0 caso contrario.
Dizemos que X tem distribuicao de Bernoulli com parametro p ouequivalentemente,
X ∼ Bernoulli(p), 0 < p < 1.
16
A distribuicao Binomial
• Suponha que n experimentos (ou ensaios) independentes, saoexecutados, sendo n fixo.
• Cada experimento resulta num sucesso com probabilidade pou numa falha com probabilidade 1− p.
• O experimento consiste na observacao das variaveis aleatoriasX1, . . . ,Xn onde Xi ∼ Bernoulli(p), i = 1, . . . , n.
• Frequentemente estaremos interessados no numero total desucessos obtidos, independente da ordem em que eles ocorrem.
• Por exemplo, uma moeda e lancada 10 vezes e o numero totalde caras e contado (aqui “cara” e um sucesso).
17
O numero total de sucessos e,
Y =n∑
i=1
Xi ,
cujos possıveis valores sao 0, 1, . . . , n.
Dizemos que Y e uma variavel aleatoria com distribuicao binomialcom parametros n e p, ou
Y ∼ Binomial(n, p).
18
As probabilidades de cada um destes possıveis valores sao dadaspor
P(Y = k) =
(n
k
)pk(1− p)n−k , k = 0, 1, . . . , n (1)
sendo (n
k
)=
n!
k!(n − k)!
e m! =∏m
i=1 i e o fatorial de m (define-se 0! = 1).
19
Probabilidades Binomiais com n = 5
x
0.0
0.1
0.2
0.3
0.4
0.5
0.6
0 1 2 3 4 5
p = 0.2 p = 0.5
p = 0.7
0 1 2 3 4 5
0.0
0.1
0.2
0.3
0.4
0.5
0.6
p = 0.9
20
Probabilidades Binomiais com n = 20
x
0.00
0.05
0.10
0.15
0.20
0.25
0 5 10 15 20
p = 0.2 p = 0.5
p = 0.7
0 5 10 15 20
0.00
0.05
0.10
0.15
0.20
0.25
p = 0.9
21
Probabilidades Binomiais com n = 100
x
0.00
0.05
0.10
0 20 40 60 80 100
p = 0.2 p = 0.5
p = 0.7
0 20 40 60 80 100
0.00
0.05
0.10
p = 0.9
22
Exemplo. Em uma linha de montagem estima-se que a proporcaode itens defeituosos e aproximadamente 0.1.
• Assume-se que esta proporcao e (aproximadamente) constanteao longo do processo,
• 20 itens sao selecionados de forma independente,
• calcular a probabilidade de no maximo 2 itens defeituosos.
23
Definindo a variavel aleatoria Y : numero de itens defeituosospodemos calcular P(no maximo 2 itens defeituosos) como,
P(Y ≤ 2) = P(Y = 0) + P(Y = 1) + P(Y = 2)
=
(20
0
)0.10 0.920 +
(20
1
)0.11 0.919 +
(20
2
)0.12 0.918
= 0.1216 + 0.2702 + 0.2852 = 0.677.
24
Experimentos nao binomiais
• Lancar um dado ate que apareca o numero 6. (Numero derepeticoes nao e fixo).
• Testar itens em um lote ate encontrar 5 defeituosos.
• De um conjunto de 20 prontuarios de pacientes dos quais 5sofreram infarto sortear 3 sem reposicao e contar quantossofreram infarto.
• De um lote de itens manufaturados retirar 15 itens semreposicao e verificar quantos sao defeituosos e naodefeituosos. (Ensaios nao sao independentes).
• Calcular a probabilidade de ganhar na Mega-Sena (apostadorescolhe 7 dezenas dentre 60).
25
Distribuicao Geometrica
• Suponha que ensaios de Bernoulli sao realizados de formaindependente e com a mesma probabilidade de sucesso (p).
• Seja X o numero de ensaios necessarios antes de ocorrerprimeiro sucesso. Por exemplo,
• Numero de inspecoes necessarias antes de encontrar-se umitem defeituoso em um lote.
• Numero de nascimentos antes de nascer um menino.
26
Dizemos que X tem distribuicao Geometrica com parametro p,
X ∼ Geometrica(p), 0 < p < 1.
Se X = k os k primeiros ensaios resultam em fracasso (comprobabilidade 1− p) e o ultimo ensaio resulta em sucesso (comprobabilidade p). Entao,
P(X = k) = pk∏
i=1
(1− p) = (1− p)kp, k = 0, 1, 2, . . .
Verifique que
∞∑k=0
P(X = k) =∞∑k=0
(1− p)kp = 1
27
Probabilidades Geometricas
x
0.0
0.2
0.4
0.6
0.8
0 5 10 15 20
p = 0.2 p = 0.5
p = 0.7
0 5 10 15 20
0.0
0.2
0.4
0.6
0.8
p = 0.9
28
Exemplo. Um motorista ve uma vaga de estacionamento em umarua. Ha cinco carros na frente dele, e cada um deles temprobabilidade 0.2 de tomar a vaga. Qual a probabilidade de a vagaser tomada pelo carro que esta imediatamente a frente dele?
• Defina a variavel aleatoria X como o numero de carros quepassam pela vaga antes que ela seja tomada.
• Assume-se que cada motorista toma a vaga ou nao de formaindependente.
• Calcule a probabilidade,
P(X = 4) = (0.8)4 0.2 = 0.08192.
29
Falta de memoria
Se X e uma variavel aleatoria com distribuicao Geometrica,
P(X ≥ j + k|X ≥ j) = P(X ≥ k).
Esta e a unica distribuicao discreta com esta propriedade.
Definicao alternativa
Seja Y o numero de ensaios ate ocorrer o primeiro sucesso. Entao,Y = X + 1, e
P(Y = j) = (1− p)j−1p, j = 1, 2, . . .
30
Distribuicao Binomial Negativa
Seja X o numero de ensaios de Bernoulli independentes antes deocorrerem r sucessos.
X tem distribuicao binomial negativa com parametros r e p ,denotando-se
X ∼ BN(r , p).
Sua funcao de probabilidade e dada por,
P(X = k) =
(r + k − 1
k
)pr (1− p)k , k = 0, 1, 2, . . .
com r ≥ 1 e 0 < p < 1.
31
Probabilidades Binomiais negativas com r = 2.
x
0.0
0.2
0.4
0.6
0.8
0 5 10 15 20
p = 0.2 p = 0.5
p = 0.7
0 5 10 15 20
0.0
0.2
0.4
0.6
0.8
p = 0.9
32
Probabilidades Binomiais negativas com r = 6.
x
0.0
0.1
0.2
0.3
0.4
0.5
0 10 20 30 40
p = 0.2 p = 0.5
p = 0.7
0 10 20 30 40
0.0
0.1
0.2
0.3
0.4
0.5
p = 0.9
33
Distribuicao de Poisson
Usada para modelar o numero de ocorrencias de um certofenomeno, durante um intervalo fixo de tempo ou regiao fixa doespaco. Exemplos,
• o numero de chamadas recebidas por uma central telefonicapor hora,
• o numero de defeitos por unidade de comprimento de uma fitamagnetica,
• o numero de nmetoides encontrados por unidade de superficiede solo,
• o numero diario de novos casos de cancer de mama, etc.
34
Seja a variavel aleatoria X o numero de ocorrencias por intervalofixo (de tempo ou espaco).
Dizemos que X tem distribuicao de Poisson com parametro λ,
X ∼ Poisson(λ), λ > 0,
com funcao de probabilidade,
P(X = k) =λke−λ
k!, k = 0, 1, 2, . . .
35
Probabilidades Poisson com λ ∈ {1, 2, 5, 15}.
x
0.0
0.1
0.2
0.3
0 5 10 15 20 25 30
lambda = 1 lambda = 15
lambda = 2
0 5 10 15 20 25 30
0.0
0.1
0.2
0.3
lambda = 5
36
• A constante λ pode ser interpretada como o numero esperado(ou numero medio) de ocorrencias por unidade de tempo ouespaco.
• Verifique que∞∑k=0
P(X = k) = 1.
37
Exemplo. O numero de partıculas radioativas emitidas em cadaintervalo de 5 segundos tem distribuicao de Poisson e sabe-se queem media 2 partıculas sao emitidas por intervalo. Se foremobservados 10 intervalos de tempo qual a probabilidade de que emcada um deles menos de 3 partıculas sejam emitidas?
38
• Defina a variavel aleatoria X como o numero de partıculasemitidas por intervalo sendo que o numero medio de emissoese λ = 2.
• Portanto X tem distribuicao de Poisson com parametro iguala 2 e queremos calcular P(X < 3),
P(X < 3) = P(X = 0) + P(X = 1) + P(X = 2)
=20e−2
0!+
21e−2
1!+
22e−2
2!= 0.1351 + 0.2707 + 0.2707 = 0.6767.
• Esta e a probabilidade de emissao de menos de 3 partıculasem um intervalo de tempo. Portanto, para 10 intervalos aprobabilidade sera 0.676710 = 0.0201.
39
Exemplo. O numero medio de gols em jogos de copa do mundo eaproximadamente 2.5 gols por jogo. Assumindo que o modelo dePoisson seja adequado e sendo X o numero de gols em umapartida,
k P(X = k)
0 0.0821 0.2052 0.2573 0.2134 0.1335 0.0676 0.0287 0.0108 0.003
40
Exemplo. Pacientes sao admitidos em uma unidade de tratamentointensivo (UTI) e deseja-se modelar o numero de dias que ospacientes permanecem na UTI. O modelo Poisson e adequado?
A distribuicao de Poisson nao e adequada pois o numero de diasnao pode ser zero.
Se X e o numero de dias na UTI poderiamos usar uma distribuicaode Poisson truncada em zero. Deseja-se calcular, P(X = k|X > 0).
41
Distribuicao Hipergeometrica
Considere um experimento que resulta em ensaios de Bernoullidependentes. Uma forma de induzir dependencia consiste emamostrar sem reposicao de uma populacao finita.
Suponha que temos uma amostra e uma populacao tais que,
• Populacao: tem M elementos do tipo I, N −M do tipo II.
• Amostra: k elementos do tipo I, n − k do tipo II.
Suponha que itens sao sorteados sem reposicao.
Seja a variavel aleatoria X o numero de elementos do tipo I naamostra.
42
Dizemos que X tem distribuicao hipergeometrica com funcao deprobabilidade,
P(X = k) =
(Mk
)(N−Mn−k
)(Nn
)k = 0, 1, . . . ,min(M, n).
43
Probabilidades Hipergeometricas com N = 500 e n = 100.
x
0.00
0.05
0.10
0.15
0 20 40 60 80
M = 50 M = 60
M = 70
0 20 40 60 80
0.00
0.05
0.10
0.15
M = 80
44
Probabilidades Hipergeometricas com N = 500 e n = 300.
x
0.00
0.02
0.04
0.06
0.08
0.10
0.12
0 20 40 60 80
M = 50 M = 60
M = 70
0 20 40 60 80
0.00
0.02
0.04
0.06
0.08
0.10
0.12
M = 80
45
Probabilidades Hypergeometricas com N = 500 e n = 300.
x
0.00
0.02
0.04
0.06
0.08
0 50 100
M = 100 M = 120
M = 130
0 50 100
0.00
0.02
0.04
0.06
0.08
M = 140
46
• Se n = 1 entao k = 0 ou k = 1,
P(X = 1) =
(M1
)(N−M0
)(N1
) =M
N
X ∼ Bernoulli(M/N)
• Se os itens forem sorteados com reposicao,
X ∼ Binomial
(n,
M
N
).
47
Exemplo. Um fabricante garante que produz 10% de itensdefeituosos. De um lote com 100 itens serao selecionados 5 aoacaso, sem reposicao. Qual a probabilidade de nenhum serdefeituoso?
Populacao: N = 100, M = 10 (itens defeituosos)
Amostra: n = 5, k = 0
X : numero de defeituosos na amostra.
P(X = 0) =
(100
)(905
)(1005
) ≈ 0.584
48
Medidas de Posicao para Variaveis Aleatorias Discretas
Seja uma variavel aleatoria discreta X que assume valoresx1, x2, . . .
• A esperanca matematica denotada por E (X ) e dada por,
E (X ) = x1P(X = x1) + x2P(X = x2) + · · · =∞∑i=1
xiP(X = xi ).
49
• A mediana de X e o valor Md que satisfaz as seguintescondicoes,
P(X ≥ Md) ≥ 1/2
P(X ≤ Md) ≥ 1/2
• Se as desigualdades sao satisfeitas num certo intervalo amediana sera o ponto medio do intervalo.
• A moda (Mo) e o valor (ou valores) de X que tem maiorprobabilidade de ocorrencia,
P(X = Mo) = max{p1, p2, . . . }
50
Exemplo. Sejam as variaveis aleatorias X e Y com asdistribuicoes de probabilidade abaixo.
X P(X=x) Y P(Y=y)
3 1/8 -3 4/92 3/8 -1 1/91 3/8 0 2/90 1/8 2 2/9
51
Os valores esperados de X e Y sao,
E (X ) = 0× 1/8 + 1× 3/8 + 2× 3/8 + 3× 1/8
= 12/8 = 1.5
E (Y ) = −3× 4/9− 1× 1/9 + 0× 2/9 + 2× 2/9
= −9/9 = −1
52
Transformacoes lineares
No exemplo anterior seja Z = 5X − 10 cuja distribuicao e,
Z P(Z=z)
5 1/80 3/8
-5 3/8-10 1/8
E (Z ) = 5× 1/8 + 0× 3/8− 5× 3/8− 10× 1/8 = −2.5
= 5E (X )− 10
53
Variancia de uma variavel aleatoria discreta
Definicao. A variancia de X e a media ponderada dos desviosquadraticos de seus valores em relacao a sua media.
Var(X ) = σ2X =
∞∑i=1
(xi − E (X ))2P(X = xi )
• A variancia e um valor esperado,
Var(X ) = E (X − E (X ))2 = E (X 2)− [E (X )]2
=∞∑i=1
x2i P(X = xi )− [E (X )]2
54
Para transformacoes lineares Z = aX + b valem as propriedades,
E (Z ) = aE (X ) + b
Var(Z ) = a2Var(X )
55
Exemplo. Seja X com distribuicao Bernoulli de parametro p.Entao,
E (X ) = p
E (X 2) = p
Var(X ) = p(1− p)
56
Exemplo. Seja X com distribuicao Poisson de parametro λ.Entao,
E (X ) =∞∑k=0
kλke−λ
k!= λe−λ
∞∑k−1=0
λk−1
(k − 1)!= λ
Var(X ) = λ
Portanto,E (X ) = Var(X ) = λ > 0.
57
Exemplo. Seja uma variavel aleatoria que representa o numero dereservas por hora em uma agencia online. Historicamente a agenciatem recebido aproximadamente 15 reservas por hora em mediacom desvio padrao igual a 2.5.
O modelo Poisson nao e adequado pois este assume queE (X ) = Var(X ).
58
Exemplo. Seja X com distribuicao Poisson truncada em zero eparametro λ. Entao,
P(X = k|X > 0) =1
P(X > 0)
λke−λ
k!
=1
1− P(X = 0)
λke−λ
k!
=1
1− e−λλke−λ
k!
E (X ) =λ
1− e−λ
Var(X ) = E (X )(1 + λ− E (X ))
59
Exemplo. Seja X com distribuicao Binomial de parametros n e p.Entao,
E (X ) = np
Var(X ) = np(1− p)
60
Exemplo. Seja X com distribuicao Geometrica de parametro p.Entao,
E (X ) =1− p
p
Var(X ) =1− p
p2
61