Probabilidade e Estatística I – Antonio Roque – Aula 19
1
A Distribuição Binomial
Muitas aplicações de probabilidade podem ser reduzidas a um modelo em que
um experimento é repetido várias vezes, cada uma independentemente da outra,
e com apenas dois resultados possíveis para cada experimento.
Quando um experimento tem apenas dois resultados possíveis e a probabilidade
de cada resultado permanece constante ao longo das suas repetições
independentes, ele é chamado de experimento binomial, ou experimento de
Bernoulli.
O modelo tradicional para um tal experimento é o de uma moeda sendo lançada,
com os possíveis resultados sendo cara ou coroa. Para cada repetição do
experimento (lançar a moeda), os resultados possíveis são sempre dois, cara ou
coroa, com probabilidades independentes dos resultados obtidos em
experimentos anteriores.
As propriedades de um experimento binomial são resumidas a seguir:
1. Deve haver um número definido de repetições.
2. O resultado de cada repetição deve ser um entre dois possíveis eventos.
3. As probabilidades de cada uma das duas possibilidades devem permanecer
constantes ao longo das repetições.
4. Cada repetição deve ser independente das outras.
Em geral, como apenas dois resultados são possíveis, denota-se a probabilidade
de um evento por p e a do outro por q=1-p.
Como exemplos, temos: a transmissão de uma doença genética, uma gravidez
resultar em menina ou menino, um paciente morrer ou não dentro de um ano,
um paciente ter teste positivo ou não etc.
Probabilidade e Estatística I – Antonio Roque – Aula 19
2
Suponhamos que se queira investigar a presença de certa doença genética entre
três filhos de um casal. Todos os resultados possíveis estão mostrados na tabela
a seguir (N=normal; D=doente):
Filho 1 Filho 2 Filho 3 Probabilidade Nº de
Normais
N N N p. p. p 3
N N D p. p. q 2
N D N p. q. p 2
D N N q. p. p 2
N D D p. q. q 1
D N D q. p. q 1
D D N q. q. p 1
D D D q. q. q 0
Para o cálculo das probabilidades, usou-se o produto das probabilidades dos
eventos individuais porque eles são independentes.
Para a tabela anterior, o filho 1 é o mais velho, o 2 é o do meio e o 3 é o mais
novo. A probabilidade de que uma criança seja normal é p e a probabilidade de
que ela seja doente é pq −= 1 . As probabilidades dadas na tabela foram
calculadas usando a fórmula para a probabilidade conjunta de três eventos
independentes: )()()() ( CPBPAPCeBeAP ⋅⋅= . Um sumário dos resultados,
desprezando a ordem das crianças é dado na tabela a seguir.
Nº de
Normais (K)
Nº de maneiras em que
K normais podem
ocorrer
Probabilidade de haver
K normais
Probabilidade e Estatística I – Antonio Roque – Aula 19
3
0 1 q3
1 3 3pq2
2 3 3p2q
3 1 P3
Como existem 3 crianças, há quatro possibilidades quanto ao número de
normais: 0 normais, 1 normal, 2 normais e os 3 normais.
Cada possibilidade pode ocorrer um certo número de vezes: nenhum normal
ocorre 1 vez; 1 normal pode ocorrer de 3 maneiras diferentes (NDD, DND,
DDN); 2 normais pode ocorrer de 3 maneiras diferentes (NND, NDN, DNN); e
3 normais só pode ocorrer de uma maneira.
Para se calcular as probabilidades de ocorrência de um dado número de normais,
usou-se a regra da soma de probabilidades.
Por exemplo, para se saber a probabilidade de que, dos 3 irmãos 2 sejam
normais calculou-se P(NND ou NDN ou DNN).
Como as três seqüências de nascimento são mutuamente exclusivas (se as
crianças nascem em uma ordem, não podem nascer em outra) basta somar as três
probabilidades para se obter o resultado desejado:
P(NND ou NDN ou DNN)=P(NND)+P(NDN)+P(DNN) =
qpppqpqpqpp 23=⋅⋅+⋅⋅+⋅⋅= .
Outra maneira útil de se visualizar experimentos binomiais é através de
“diagramas de árvore” (veja abaixo). Uma árvore começa com um dos dois
resultados possíveis e sua probabilidade, enquanto a outra árvore começa com o
outro resultado possível e sua probabilidade. Depois, elas se ramificam entre os
dois resultados possíveis e suas probabilidades e assim por diante. A
Probabilidade e Estatística I – Antonio Roque – Aula 19
4
probabilidade de uma seqüência será dada pelos produtos das probabilidades ao
longo do ramo associado à seqüência.
Por exemplo, a seqüência correspondente a nenhum nascimento normal (K=0) é
representada pelo ramo mais à direita da árvore à direita (DDD), na figura
acima. Sua probabilidade é então dada pelo produto das probabilidades
associadas a cada trecho do ramo:
P(No de normais = 0) =3qqqq =⋅⋅ .
Outro exemplo, a probabilidade de apenas 1 filho normal é dada pela soma das
probabilidades associadas aos ramos mais grossos na figura a seguir:
P(No de normais = 1) = 23pqpqqqpqqqp =⋅⋅+⋅⋅+⋅⋅ .
Probabilidade e Estatística I – Antonio Roque – Aula 19
5
As árvores desenhadas acima são uma maneira gráfica de representar o que se
chama matematicamente de função geratriz da distribuição de probabilidades
binomial, usualmente chamada apenas de função binomial.
Especificamente, para o exemplo em questão, todas as probabilidades de
ocorrência de qualquer número K de crianças normais em um total de 3 filhos
(ou 3 repetições do experimento binomial que é ter um filho) podem ser obtidas
da fórmula:
( ) ( ) ( ) ( ) ( ) ( )3223
223
332
qpqqppqpqpqpqpqpqpqp
+++=
=+⋅++=+⋅+⋅+=+
Para calcular a probabilidade p de se obter k normais, seleciona-se o termo para
o qual o expoente de p é igual a k (note que 10 =x , de maneira que 033 qpp = e
⎟⎠⎞= 303 qpq :
P(0 Normal) = termo para o qual 30 qk ⇒=
P(1 Normal) = termo para o qual 231 pqk ⇒=
P(2 Normais) = termo para o qual qpk 232⇒=
P(3 Normais) = termo para o qual 33 pk ⇒= .
Em geral, para qualquer experimento binomial, com possíveis resultados A e Ā
a cada repetição:
( )
.
10
0
0
1100
∑=
−
−−−
⎟⎟⎠
⎞⎜⎜⎝
⎛=⎟⎟
⎠
⎞⎜⎜⎝
⎛+
+⎟⎟⎠
⎞⎜⎜⎝
⎛++⎟⎟
⎠
⎞⎜⎜⎝
⎛+⎟⎟
⎠
⎞⎜⎜⎝
⎛=+
n
k
knkn
mnmnnn
qpkn
qpnn
qpmn
qpn
qpn
qp ……
Onde:
p = probabilidade de A, a cada repetição;
Probabilidade e Estatística I – Antonio Roque – Aula 19
6
q = 1 − p = probabilidade de Ā a cada repetição;
n = número de repetições;
( )!!!
, knknC
kn
kn −==⎟⎟
⎠
⎞⎜⎜⎝
⎛= possíveis combinações de k elementos
retirados de um conjunto de n elementos;
( )( ) ( )( )1221! …−−= nnnn = n fatorial.
Porque se usou a fórmula ( )!!!knk
nkn
−=⎟⎟
⎠
⎞⎜⎜⎝
⎛ para expressar o número de
formas possíveis de se obter k filhos normais em n nascimentos?
Esta fórmula dá o número de possíveis combinações de k elementos distintos
retirados de um conjunto de n elementos, como você deve se lembrar da aula
sobre análise combinatória. Como os pais não estão interessados (neste caso!) na
identidade dos filhos normais, mas apenas no número de maneiras em que k
filhos normais podem ser combinados em uma seqüência de n filhos, eles devem
usar a fórmula da combinação de n, k a k.
Se você está em dúvida sobre esta fórmula, releia as notas de aula sobre
contagem e, em particular, o último exercício daquelas notas.
Se você ainda continua em dúvida, veja o seguinte exemplo. Suponha que um
casal tenha 12 filhos (antigamente era comum) e que 5 deles sejam meninos (as
outras 7 sejam meninas). De quantas maneiras o casal pode ter 5 meninos em
um conjunto de 12 filhos? Observe que não estamos interessados na identidade
dos meninos, mas apenas no sexo deles.
Vamos considerar que os 12 filhos estão ordenados por ordem de nascimento (o
1o filho, o 2o filho, o 3o filho ... até o 12o filho). Então, tomando um dos 5
meninos ele pode ser qualquer um desses 12 filhos; há 12 possibilidades para
Probabilidade e Estatística I – Antonio Roque – Aula 19
7
ele. Fixando esse primeiro menino em uma posição qualquer, para o segundo
menino existem agora apenas 11 posições possíveis. O número de possibilidades
de colocarmos os dois na lista de 12 filhos é 12×11. Fixando os dois primeiros
meninos, o número de posições possíveis para o terceiro menino é agora 10.
Fixando este, o número de possibilidades para o quarto é igual a 9. Da mesma
forma, para o quinto o número de possibilidades é 8. Portanto, o número de
maneiras de distribuir 5 meninos em 12 posições é
12×11×10×9×8.
O resultado acima pode ser generalizado para o número de possibilidades de se
arranjar k meninos em n posições como
n×(n−1)×(n−2)× ... ×(n−k+2)×(n−k+1).
Como visto na aula sobre contagem, esta expressão corresponde ao arranjo de n
elementos k a k:
( ).!
!, kn
nA kn −=
Note, porém, que a fórmula acima leva em consideração a identidade dos
meninos e não apenas a sua posição.
Por exemplo, suponha que saibamos que há filhos meninos na 2a e na 5a
posições. Então, se o João é o 2o e o Pedro é o 5o ou se o Pedro é o 2o e o João é
o 5o faz diferença do ponto de vista da identidade deles, mas não do ponto de
vista de termos o 2o e o 5o filhos meninos. Se estamos preocupados apenas com
as posições ocupadas pelos filhos meninos, as duas situações (João na 2a e Pedro
na 5a ou Pedro na 2a e João na 5o) são idênticas.
Por causa disso, para calcularmos o número de possibilidades distintas de
combinarmos k filhos meninos em n posições devemos contar apenas uma de
todas as possíveis maneiras de se arranjar os k meninos em k posições dadas.
Para se fazer isso deve-se dividir o número acima por k!,
Probabilidade e Estatística I – Antonio Roque – Aula 19
8
( ).!!
!knk
n−
Por exemplo, para a condição em que os 5 filhos ocupam as posições (2a, 5a, 7a,
9a e 10a) existem 5! permutações diferentes, mas só se deve contar uma delas.
Para cada possível conjunto de 5 posições diferentes contido na fórmula
( )!512!12−
, existem 5! casos que somente diferem entre si quanto à identidade dos
filhos. Chamando o número de combinações diferentes de 5 posições dentre as
12 possíveis de C12,5, podemos escrever,
( ).x!5
!512!12
5,12C=−
Então,
( ).!512!5
!12512
5,12 −==⎟⎟
⎠
⎞⎜⎜⎝
⎛ C
Generalizando para o caso de n posições possíveis e k elementos a distribuir
entre elas,
( ).!!
!5,12 knk
nCkn
−==⎟⎟
⎠
⎞⎜⎜⎝
⎛
Para Fixar: FUNÇÃO BINOMIAL
A função binomial é dada por:
∑=
−−−⎟⎟⎠
⎞⎜⎜⎝
⎛++⎟⎟
⎠
⎞⎜⎜⎝
⎛+⎟⎟
⎠
⎞⎜⎜⎝
⎛=⎟⎟
⎠
⎞⎜⎜⎝
⎛=+
n
ok
onnonoknkn qpnn
qpn
qpon
qpkn
qp …11
1)( .
Onde:
.)!(!
!, mnm
nCmn
mn −==⎟⎟
⎠
⎞⎜⎜⎝
⎛
Cada termo da função binomial corresponde a um conjunto específico de ramos
dos diagramas de árvore apropriados.
Probabilidade e Estatística I – Antonio Roque – Aula 19
9
Para o exemplo dos 3 filhos temos:
n=3; P(normal)=p; P(doente)=q.
Usando a função binomial, temos:
∑=
−−−− +⎟⎟⎠
⎞⎜⎜⎝
⎛+⎟⎟
⎠
⎞⎜⎜⎝
⎛+⎟⎟
⎠
⎞⎜⎜⎝
⎛=⎟⎟
⎠
⎞⎜⎜⎝
⎛3
0
2321310303
23
13
033
k
kk qpqpqpqpk
+−
+−
=⎟⎟⎠
⎞⎜⎜⎝
⎛+ − 2130333
)!13(!1!3
)!03(!0!3
33
qpqpqp
+⋅⋅⋅
⋅⋅=
−+
−+ 300312
)123(1123
)!33(!3!3
)!23(!2!3 qpqpqp
=⋅⋅⋅
⋅⋅+
⋅⋅
⋅⋅+
⋅
⋅⋅+ 031221
1)123(123
)1()12(123
)12(1123 qpqpqp
322303122130 3333 pqppqqqpqpqpqp +++=+++= .
Então:
P(0 normais) = termo para o qual o expoente de p é zero = q3;
P(1 normal) = termo para o qual o expoente de p é 1 = 3pq2;
P(2 normais) = termo para o qual o expoente de p é 2 = 3p2q;
P(3 normais) = termo para o qual o expoente de p é 3 = p3.
A notação pode ainda ser mais refinada para tornar o uso da função binomial
mais produtivo. Suponha que o resultado que nos interessa em um experimento
binomial seja simbolizado pela letra y.
Então, pode-se escrever:
,),|( knkqpkn
pnkyP −⎟⎟⎠
⎞⎜⎜⎝
⎛== ,nk ≤
Probabilidade e Estatística I – Antonio Roque – Aula 19
10
que é igual à probabilidade de que o evento y ocorra k vezes em n repetições,
quando a probabilidade de ocorrência de y a cada repetição é p. Usando esta
notação concisa para o exemplo dos irmãos, e chamando a y de uma criança
normal:
P(No de normais = k|3, p) = ,3 3 kk qpk
−⎟⎟⎠
⎞⎜⎜⎝
⎛ 3,2,1=k .
A função de probabilidade binomial também pode ser utilizada para calcular
probabilidades de eventos compostos. Lembre-se que se alguns eventos forem
mutuamente exclusivos, a probabilidade de ocorrência de um ou de outro ou de
outro etc, é dada pela soma das probabilidades individuais.
P(dois ou mais normais|3, p) =
32032 333
23
),3|3(),3|2( pqpqpqppkPpkP +=⎟⎟⎠
⎞⎜⎜⎝
⎛+⎟⎟
⎠
⎞⎜⎜⎝
⎛==+== .
Poderíamos também ter escrito:
P(2 ou mais normais|3,p) =∑=
−⎟⎟⎠
⎞⎜⎜⎝
⎛3
2
33
k
kk qpk .
Em geral:
∑=
− ≤⎟⎟⎠
⎞⎜⎜⎝
⎛=≤
m
k
knk nmqpkn
pnmyP0
,),|( ,
e
∑=
− ≤⎟⎟⎠
⎞⎜⎜⎝
⎛=≥
n
mk
knk nmqpkn
pnmyP ,),|( .
A primeira fórmula dá a probabilidade de termos qualquer número de casos que
nos interessam, até m, em n repetições possíveis.
Probabilidade e Estatística I – Antonio Roque – Aula 19
11
A segunda fórmula dá a probabilidade de termos qualquer número de casos que
nos interessam, de m até o máximo número possível, quando este número
máximo é n.
Exemplos:
1. Suponha que a probabilidade de se transmitir um gene responsável por certa
doença seja de ¼. Qual a probabilidade de que, em uma família de 4 crianças,
haja um filho são ou nenhum filho são? E qual a probabilidade de que haja
exatamente 2 filhos doentes?
P(1 filho são ou 0 filhos sãos) = P(3 filhos doentes ou 4 filhos doentes) = P(3 ou
mais filhos doentes).
Aplicando a fórmula:
P(3 ou mais doentes/4, ¼) =∑=
− =⎟⎟⎠
⎞⎜⎜⎝
⎛4
3
44
k
kk qpk
=⋅⎟⎠
⎞⎜⎝
⎛+⎟⎠
⎞⎜⎝
⎛⎟⎠
⎞⎜⎝
⎛−
=⎟⎟⎠
⎞⎜⎜⎝
⎛+⎟⎟
⎠
⎞⎜⎜⎝
⎛= 1
41
!0!4!4
43
41
)!34(!3!4
44
34 43
0413 qpqp
25613
4112
41
434
41
!4!4
43
41
1)123(1234
444
43
=+
=+⋅=⎟⎠
⎞⎜⎝
⎛+⎟⎠
⎞⎜⎝
⎛⎟⎠
⎞⎜⎝
⎛⋅⋅⋅
⋅⋅⋅= .
Já a probabilidade de ter exatamente dois filhos doentes é:
P(2 doentes/4,¼) = =⎟⎠
⎞⎜⎝
⎛⎟⎠
⎞⎜⎝
⎛−
=⎟⎟⎠
⎞⎜⎜⎝
⎛ −22
242
43
41
)!24(!2!4
24
qp
12827
25654
169
1616
49
41
)12)(12(1234
22 ==××=⎟⎠
⎞⎜⎝
⎛⎟⎠
⎞⎜⎝
⎛⋅⋅
⋅⋅⋅= .
2. Um industrial percebeu que 15% das peças produzidas por uma certa máquina
apresentam defeitos. Em uma amostra aleatória de 5 peças produzidas pela
máquina, qual será a probabilidade de: (a) todas serem defeituosas; (b) uma ser
defeituosa; (c) duas serem defeituosas; e (d) pelo menos uma ser defeituosa.
Probabilidade e Estatística I – Antonio Roque – Aula 19
12
A probabilidade de uma peça ser defeituosa é p = 0,15, de maneira que q = 1 -
0,15 = 0,85. Temos 5 repetições do experimento binomial. Logo:
a) ( ) ( ) ( ) 00008,015,085,015,0)!55(!5
!555
)15,0,5/5( 505555 ==×−
=⎟⎟⎠
⎞⎜⎜⎝
⎛= −qpP ;
b) ( ) ( ) ( ) 39,052,015,0585,015,0!4!1!5
15
15,0,5/1 441 =××=×=⎟⎟⎠
⎞⎜⎜⎝
⎛= qpP ;
c) ( ) ( ) ( ) 14,061,00225,01085,015,0!3!2!5
25
15,0,5/2 3232 =××==⎟⎟⎠
⎞⎜⎜⎝
⎛= qpP ;
d)P(No de defeituosas ≥ 1/5,0,15) ( ) ( )∑=
− =⎟⎟⎠
⎞⎜⎜⎝
⎛=
5
1
585,015,05
k
kk
k
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) +⎟⎟⎠
⎞⎜⎜⎝
⎛+⎟⎟
⎠
⎞⎜⎜⎝
⎛+⎟⎟
⎠
⎞⎜⎜⎝
⎛+⎟⎟
⎠
⎞⎜⎜⎝
⎛= 14233241 85,015,0
45
85,015,035
85,015,025
85,015,015
( ) ( ) +××+××++=⎟⎟⎠
⎞⎜⎜⎝
⎛+ 85,00005,0572,00034,01014,039,085,015,055 05
556,000008,0002,002,014,039,000008,0 =++++=+ .
Note que o último item poderia ser resolvido de outra maneira mais direta
lembrando que P(ao menos uma) = 1 – P(nenhuma) = 1 – q5 = 1 – 0,444 =
0,556.