os exercícios a seguir são para resolver em sala - ufscar.br · ... as probabilidades para cada...
TRANSCRIPT
Os exercícios a seguir são para resolver em sala
i) Uma mulher tem 1/3 de chance de ainda estar viva daqui a 30 anos e
seu marido tem 2/5 de chance. Qual é a probabilidade de, daqui a 30
anos: a) Ambos estejam vivos b) Ao menos um esteja vivo. c) Só o homem estar vivo.
ii) Um dado equilibrado é lançado 12 vezes. Calcule a probabilidade de se obter: a) Dois seis. b) Quatro seis. c) Pelo menos dois seis. d) No máximo três seis.
10.7. VARIÁVEIS ALEATÓRIAS E MODELOS DE PROBABILIDADE 10.7.1. VARIÁVEIS ALEATÓRIAS
Uma variável aleatória (v.a.) é uma característica numérica que
associa valores do conjunto dos números reais aos eventos em Ω.
A v.a. representa uma característica individual das unidades
de uma população, que podem ser observadas através de uma amostra.
Exemplo 1: X = número de indivíduos abaixo da linha da pobreza numa amostra de
80 pessoas de uma comunidade;
T = tempo de recuperação de pacientes com fratura de femur;
Y = número de pessoas que votam no candidato Zelão;
R = renda familiar em salários mínimos, numa amostra de pessoas de uma população rural;
W = número de nascimentos do sexo feminino em uma maternidade, no período de uma semana;
Z = número de dias de estiagem até a ocorrência de chuva em São Carlos.
As variáveis aleatórias podem ser classificadas como
discretas e contínuas segundo a natureza do espaço amostral:
i) v.a.’s discretas assumem valores em espaços discretos e,
normalmente, são definidas por uma contagem;
ii) v.a.’s contínuas assumem valores em espaços contínuos e,
normalmente, são definidas por uma mensuração.
10.7.2. FUNÇÃO DE PROBABILIDADE E FUNÇÃO DENSIDADE A função de probabilidade e a função densidade são funções que associam probabilidades a uma v.a.
a) A função de probabilidade, denotada por p(x), é uma função
que associa probabilidades diretamente aos possíveis valores de uma v.a. discreta X, sendo definida por:
p(x) = P(X = x)
Exemplo 2: Considere os nascimentos, independentes, de três crianças e seja a v.a. que conta o número de nascimentos do sexo feminino nesses
3 nascimentos:
Espaço amostral: Ω = {(FFF), (FFM), (FMF), (MFF), (FMM), (MFM), (MMF), (MMM)}
Neste caso o espaço amostral é equiprovável, pois cada um de seus elementos tem mesma probabilidade. Considerendo que P(F) = P(M) = 1/2, e que os nascimentos são
independentes, temos que:
P(FFF) = P(F)×P(F)×P(F) = 1/8.
Obs: O mesmo vale para todos os demais elementos de Ω, resultando
P(FFF) = P(FFM) = P(FMF) = P(MFF) = P(FMM) = P(MFM) =
= P(MMF) = P(MMM) = 1/8
Associada a este espaço amostral a v.a.
X = número de crianças do sexo feminino dentre os três nascimentos,
Tabela 1: Função de probabilidade para uma v.a. discreta
Elementos de Ω Valores de X Probabilidade p(x) (FFF) 3 1/8
(FFM), (FMF), (MFF) 2 3/8 (FMM), (MFM), (MMF) 1 3/8
(MMM) 0 1/8
Desta forma, a função p(x) = P(X = x), dada pela tabela acima,
associa as probabilidades aos possíveis valos de X.
b) A função densidade, denotada por f(x), associa probabilidades a
intervalos de valores de uma v.a. contínua X, sendo dada pela
área1 abaixo de sua curva (ver figura):
A função densidade recebe, ainda, os nomes: função densidade de probabilidade ou função distribuição de probabilidade (fdp).
Nota: Um exemplo de função densidade de uma v.a. contínua será visto
mais adiante.
1 A operação matemática que calcula a área sob a curva de uma função f(x) é a integral:
P(a X b) = b
a
dxxf )( .
10.7.3. Principais modelos discretos de probabilidade: o modelo binomial.
Seja X uma v.a. discreta, porém, para a definição do modelo
binomial é que necessário que, antes, seja definido o que um ensaio de Bernoulli.
Ensaios de Bernoulli são ensaios (ou experimentos) nos quais temos
apenas dois resultados possíveis:
sim/não;
presença/ausência;
ocorre/não ocorre;
pertence/não pertence;
0 ou 1.
Ao realizarmos um ensaio de Bernoulli estamos interessados em
apenas um apenas um dos resultados ao qual chamaremos de sucesso
sendo que, a não ocorrência do evento de interesse vamos chamar de fracasso.
Por exemplo, a característica de interesse pode ser:
a presença de uma doença;
um hábito de comportamento ou de consumo;
uma característica física;
um defeito ou falha ;
o resultado de uma medição classificado por um ponto de corte.
etc...
Para um ensaio de Bernoulli temos associadas as seguintes
probabilidades:
p = P(sucesso) e (1 – p) = P(fracasso)
A observação individual da característica de interesse para os elementos da amostra caracteriza realizações independentes de
ensaios de Bernoulli.
O modelo binomial é caracterizado pela realização de n ensaios
independentes com apenas dois resultados possíveis (sucesso e
fracasso). Desta forma, P(sucesso) = p é constante.
Seja a v.a. X que conta os sucessos num número fixo de ensaios independentes de Bernoulli.
Então, X tem distribuição binomial com parâmetros n e p.
Notação: X binomial(n; p).
A função de probabilidade binomial é dada pela fórmula:
P(X = x) =
x
n px (1 – p)n – x, x = 0, 1, 2, ..., n.
Exemplo 3: A) Considere o exemplo dos nascimentos, independentes, de três crianças e seja a v.a. que conta o número de nascimentos do sexo
feminino nesses 3 nascimentos:
Podemos notar que o sexo tem apenas dois resultados possíveis: masculino e feminino.
Como o interesse está no nascimento de crianças do sexo feminino, então, o evento caracterizado como sucesso será exatamento o
nascimento do sexo feminino. Logo, a v.a. X = número de bebês do sexo feminino dentre os três
nascimentos tem distribuição binomial com parâmetros n = 3 e p = 1/2. Ou seja:
X binomial(3; 0.5).
e, a sua fnção de probabilidade é definida como:
P(X = x) = xx
x
35.015.0
3, x = 0, 1, 2, 3.
Assim, as probabilidades para cada um dos possíveis valores de X
sãocalculadas por:
P(X = 0) = 8
15.05.015.0
0
3 3030
;
P(X = 1) = 8
3)5.0(35.015.0
1
3 3131
;
P(X = 2) = 8
3)5.0(35.015.0
2
3 3232
;
P(X = 3) = 8
15.05.015.0
3
3 3333
.
Resolvendo as frações, temos:
125.0)3()3(,3
375.0)2()2(,2
375.0)1()1(,1
125.0)0()0(,0
XPpx
XPpx
XPpx
XPpx
Gráfico da função de probabilidade:
B) Suponha que uma característica genética é determinada por um par de genes, sendo D o gene dominante e d o gene recessivo. Assim
sendo, DD é dominante puro; Dd é híbrido e dd recessivo puro. Sabe-
se, ainda, que essa característica é determinada pelo gene recessivo. Uma família na qual os pais são ambos híbridos tem quatro filhos, determine:
i) A distribuição de probabilidade e os seus parâmetros. Qual é a probabilidade de que:
ii) três dos filhos tenham a característica genética;
iii) no máximo dois dos filhos tenham a característica. Com os dois pais híbridos, ou seja, ambos Dd, temos as seguintes
possibilidades de cargas genéticas para os filhos:
Considerando, ainda, P(D) = P(d) = 1/2, temos as seguintes
probabilidades associadas:
Filho
Dominante puro Hibrído Recessivo puro
DD Dd dd
probabilidade 1/4 1/2 1/4
i) Como a característica genética é determinada pelo gene recessivo, ela só vai se manifestar se o filho for dd. Assim sendo, teremos uma probabilidade igual a 0.25 de que um filho apresente a característica.
Seja a v.a. X = número de filhos com a característica genética dentre
os quatro irmãos.
Então, X tem distribuição binomial com parâmetros n = 4 e p = 0.25.
X binomial(4; 0.25).
e, a sua fnção de probabilidade é dada por:
p(x) = P(X = x) = xx
x
475.025.0
4, x = 0, 1, 2, 3, 4.
ii) Probabilidade de que três filhos apresentem a característica.
1375.025.0
3
4)3(
XP
0469.0)75.0()0156.0(4)3( XP
iii) Probabilidade de que, no máximo dois filhos tenham a característica.
)2()1()0()2( XPXPXPXP
ou, ainda,
)4()3(1)3(1)2( XPXPXPXP
Como 0039.0)4( XP , então:
9492.00039.00469.01)2( XP
10.7.4. Principais modelos contínuos: a distribuição Normal. Uma v.a. X tem distribuição normal ou Gaussiana, com
parâmetros e 2 se a sua função densidade de probabilidade (f.d.p.)
for:
,e2
1 222
xxf x , e 02 .
Notação: X N( ; 2).
As principais características da distribuição normal são:
i) X tem média e variância 2;
ii) é uma função simétrica em torno de : f( – k) = f( + k);
iii) a função muda sua curvatura nos pontos ( – ) e ( + );
iv) tem o conhecido formato de sino com probabilidade de
aproximadamente 95% entre ( – 2) e ( + 2) (ver figura).
A função de distribuição acumulada F(x) do modelo normal não pode
ser determinada algebricamente, o que dificulta o cálculo das probabilidades, pois
F(x) = P(X x)
No entanto, o resultado a seguir vem facilitar as coisas:
Resultado: a transformação a seguir padroniza a v.a. normal
XZ .
Fazendo com que Z tenha média igual a 0 e variância igual a 1.
Com este resultado, basta construir uma única tabela de probabilidades para a distribuição normal padronizada que teremos as probabilidades para uma v.a. normal qualquer.
Exemplo 4: C) Seja uma va X com distribuição normal com média 220 e variância
16, ou seja, X N(220; 16). Calcular as probabilidades abaixo:
a) P(X 225)
P(X 225) = 25.14
220225
4
220
ZP
XP = 0.8943
b) P(210 X 228)
P(210 X 228) =
4
220228
4
220
4
220210 XP
00.250.2 ZP
50.200.2 ZPZP 0.9773 – 0.0062 = 0.9711
c) Qual o valor de k tal que P(X k) = 0.01?
P(X k) =
4
220
4
220 kXP = 0.01,
Da tabela temos que 33.24
220
k k = 210.38
d) Quais os valores k1 e k2 simétricos em torno de , tal que
P(k1 X k2) = 0.95?
P(k1 X k2) =
4
220
4
220 21 kZ
kP = 0.95,
Da tabela temos que
4
220
4
220 21 kZP
kZP = 0.025,
e,
96.14
2201 k
k1 = 212.16
Como k1 e k2 simétricos em torno da média, então
96.14
2202 k
k2 = 227.84
D) Suponha que a renda de uma população (em s.m.) tenha
distribuição 0.36 4;N . Qual a probabilidade de que:
a) Uma pessoa escolhida ao acaso desta população tenha renda
inferior a 2.87sm?
b) Uma pessoa escolhida ao acaso desta população tenha renda
superior a 5.05sm?
c) Qual a proporção de pessoas com renda entre 2.8 e 5.2
sm’s?
a) P(X < 28.7)
P(X < 28.7) = 88.16
407.28
ZPZP = 0.0301
b) P(X > 50.5)
P(X > 50.5) = 75.116
405.50
ZPZP = 0.0401
c) P(28 < X < 52)
P(28 < X < 52) = 0.20.20.20.2 ZPZPZP
= 0.9773 – 0.0228 = 0.9545
E) O tempo até a falha dos televisores da marca X-View tem
distribuição normal com média 35 mil horas ( 4 anos) e
desvio padrão de 2.675 mil horas ( 3.7 meses). A empresa
deseja fixar a garantia do produto de forma que, no máximo
5% dos televisores apresentem problemas abaixo desse limite.
a) Encontre o limite de garantia L?
P(X < L) = 0.05
05.0675.2
35
LZP 645.1
675.2
35
L
)675.2()645.1(35 L
L = 30.6 mil horas ( 3.5 anos)
b) Os diretores da companhia traçam um plano de ação para
reduzir a variabilidade do processo de produção. De quanto
deve ser reduzido o desvio padrão do processo para que,
mantido o limite obtido em (a), o percentual de itens abaixo
do limite garantia caia pela metade?
P(X < 30.6) = 0.025
025.0*
356.30
ZP 96.1
*
356.30
96.1*
4.4
* = 2.245 mil horas ( 3.1 meses)
Definição:
Seja Z o quantil 100% da distribuição N(0, 1), então, Z é tal
que
P(Z Z) =
Principais quantis da distribuição Normal
Quantil Z
= 0.01 1% Z0.01 = –2.33
= 0.025 2.5% Z0.025 = –1.96
= 0.05 5% Z0.05 = –1.645
= 0.95 95% Z0.95 = 1.645
= 0.975 97.5% Z0.975 = 1.96
= 0.99 99% Z0.99 = 2.33
Obs: 1) Note que Z = – Z(1–), por exemplo Z0.025 = – Z0.975;
2) No programa R os quantis da normal são obtidos pelo
comando: qnorm(), 0 1.
F) Um produto é vendido em pacotes de um quilograma, sendo
que a distribuição do peso dos pacotes é normal com média
1005g e desvio padrão 12g.
a) Qual a probabilidade de que um pacote saia com peso 15g
abaixo da média?
b) Num fardo com 12 pacotes, qual é a probabilidade de no
máximo 2 estejam abaixo de 990g?
c) Um fiscal informou o produtor de que são aceitos apenas
5% dos pacotes com peso abaixo de 995g. De quanto deve
diminuir a variabilidade para que esse limite seja atendido?
d) Como o processo não permite o ajuste na variabilidade, a
opção seria aumentar a média para atender a especificação.
De quanto deve ser a nova média?
e) Com a nova média obtida no item anterior, de quanto se
espera seja o aumento na perda do empacotador em uma
tonelada do produto.