estatística distribuição binomial (aula 1)
Post on 17-Aug-2015
118 Views
Preview:
TRANSCRIPT
0
Associação Diocesana de Ensino e Cultura de Caruaru
FACULDADE DE FILOSOFIA, CIÊNCIAS E LETRAS DE CARUARU
Reconhecida pelo Decreto 6399 de 15.01.69 D.O. 17-01-69
CURSO: ADMINISTRAÇÃO
Prof. Wellington Marinho Falcão
AULA 1
1
DISTRIBUIÇÃO BINOMIAL
É uma distribuição probabilística. Mas o que é uma distribuição probabilística?
Toda vez que associamos, no plano cartesiano, uma variável x no eixo horizontal à sua probabilidade de ocorrência P(x) no eixo vertical, teremos uma distribuição probabilística.
x: x1, x2, x3, ..., xi, ..., xn
P(x): p1 p2 p3 …, pi …, pn
FIG. 1
2
Há várias distribuições probabilísticas, tais como: binomial, normal, t de student, poisson, etc.
Comecemos com a distribuição binomial!
Lancemos uma moeda honesta* duas vezes ou duas moedas honestas uma única vez, o que dá no mesmo, não é?
Chamemos cara de Ca e coroa de Co
Os resultados possíveis são: CaCa, CaCo, CoCa, CoCo; conforme é demonstrado no quadro abaixo:
M1 M2 Ca Co
Ca CaCa CaCo
Co CoCa CoCo
Tab. 1
Do exposto acima, já podemos destacar certas propriedades da distribuição binomial:
• Variáveis discretas; • Eventos Independentes; • Presunção de Reposição.
Lá atrás chamamos a probabilidade de o evento x ocorrer de p, ou seja, P(x) = p.
Chamaremos de q a probabilidade de o evento x não ocorrer, logo, p + q = 1. Evidente, pois a soma de todas as probabilidades é sempre igual a 1.
p + q = 1 q = 1 – p
Convencionou-se o seguinte:
p = sucesso
q = fracasso
3
CUIDADO!
O conceito de sucesso em estatística é diferente do que entendemos por sucesso no nosso dia-a-dia, pois na estatística, sucesso é a ocorrência do evento e fracasso é a não-ocorrência. Por exemplo: Se numa pesquisa estamos estudante a taxa de mortalidade infantil, ocorrer um óbito é sucesso e fracasso será sobreviver.
Temos aí, mais uma propriedade da distribuição binomial:
• Ocorrência de apenas dois resultados: p (sucesso) e q (fracasso).
Suponhamos que no lançamento de duas moedas honestas, sucesso “p” seja cara e fracasso “q” seja coroa, onde p0 será a probabilidade de zero cara, p1 de um cara e p2 de dois cara.
Levando para o plano cartesiano:
4
Mais uma propriedade:
• Não importa a ordem. Tanto faz se cara vem antes ou depois do coroa para x = 1.
Para o lançamento de três moedas honestas, teríamos:
Para 4 moedas teríamos:
5
Aumentando-se o número de lançamentos de moeda, aumenta-se o número de colunas como se pode ver nas figuras 2, 3 e 4.
Quando n (número de lançamentos) tende a infinito,um número infinito de colunas se acomoda na curva da figuras supracitadas. As colunas ficam tão finas (apinhadas sob a curva) quanto uma linha, que o gráfico, ao invés de colunas verticais poderá ser a própria curva. Aí tereos a distribuição normal que é válida para variáveis contínuas ou, quando n muito grande, para variáveis discretas (aproximação pela normal).
Veremos mais sobre a distribuição normal ao longo do curso.
Mas o que são variáveis discretas e variáveis contínuas?
Variável discreta é aquela que não é contínua. OH! OH! OH!
Parece óbvio, não é? E é mesmo!!!
No caso da moeda, não existe nenhum valor intermediário entre ocorrerem 2 caras ou 3 caras, por exemplo. Não há a possibilidade de ocorrerem 2,5 caras, ou seja, há uma descontinuidade entre 2 e 3.
Já uma variável peso ou altura seria contínua, pois não importa quão próximos estejam dois valores, sempre haverá infinitos valores entre os dois.
Vejamos!
Quantos valores haverá entre 10,6 kg e 11,0 kg?
Uma pessoa mais desavisada diria: 10,7 kg; 10,8 kg e 10,9 kg, ou seja, 3 valores. Mas aumentando o número de casas decimais de 1 para 2, teríamos entre 10,9 kg e 11,0 kg valores como: 10,92 kg ou 10,99 kg. E com 3 casas decimais teríamos entre 10,99 kg e 11 kg valores como: 10,991 kg ou 10,995 kg.
E com 4, 5, 6, ... casas decimais???
Não importa quão próximos estejam dois valores, sempre haverá uma infinidade de valores entre eles. Esta variável não sofre descontinuidade, isto é, ela é uma variável contínua.
6
Voltemos ao exemplo do lançamento de 2 moedas ou de 1 moeda duas vezes (que dá no mesmo)
Chamemos de p (sucesso) a probabilidade de sair cara e q (fracasso) a probabilidade de não sair cara, ou seja, sair coroa.
Perceba que as probabilidades para 0, 1 e 2 caras são as da FIG.2
7
O mesmo resultado da FIG.3
Sabendo-se que a ordem das parcelas não altera a soma:
p³ + 3qp² + 3pq² + q³ =
= q³ + 3q²p + 3qp² + p³ (I)
Em cada uma das parcelas da expressão acima há tanto q quanto p. Na 1ª parcela p não aparece, pois é p0 que é igual a 1 e na última q não aparece, pois é q0 que igual a 1. Vejamos!
=1q³p0 + 3q²p¹+ 3q¹p² + 1q0p³ (II)
Perceba que a expressão (II) é a mesmíssima coisa da expressão (I). Como a moeda foi lançada 3 vezes (n = 3), o expoente de q começa por 3 e vai diminuindo de 1 em 1 até zerar. O inverso ocorre com p que começ com o expoente zero e vai aumentando de 1 em e1 até chegar em 3 (n = 3)
Estes coeficientes da expressão (II) que são 1, 3, 3 e 1; vêm da linha n = 3 do triângulo de Pascal.
1q³p0 + 3q²p¹+ 3q¹p² + 1q0p³ (II)
Abaixo, temos o triângulo de pascal de n=1 até n=8
n
2 1 2 1
3 1 3 3 1
4 1 4 6 4 1
5 1 5 10 10 5 1
6 1 6 15 20 15 6 1
7 1 7 21 35 35 21 7 1
8 1 8 28 56 70 56 28 8 1
8
No Triângulo de Pascal, cada número resulta da soma do número acima com o número que está à esquerda do que está acima. Note o destaque dado ao número 21 da linha n =7. Ele é a soma do número que está acima: 6; com o que está à esquerda de 6: 15. Logo, 6 + 15 = 21.
EXERCÍCIO RESOLVIDO:
Qual a probabilidade de termos 3 caras em 8 lançamentos de uma moeda honesta?
Solução:
O expoente de q começa com 8 (n = 8) e vai diminuindo de 1 em 1, enquanto o expoente de p, começa em 0 e vai crescendo de 1 em 1 até chegar em 8 (n= 8)
1 q8p0 + 8 q7p1 + 28 q6p2 + 56 q5p3 + ...... (III)
n
2 1 2 1
3 1 3 3 1
4 1 4 6 4 1
5 1 5 10 10 5 1
6 1 6 15 20 15 6 1
7 1 7 21 35 35 21 7 1
8 1 8 28 56 70 56 28 8 1
O expoente de p significa o número de sucessos e o expoente de q o de fracassos. Como no enunciado da questão eu quero saber a probabilidade de saírem 3 caras em 8 lançamentos, eu preciso só do termo cujo expoente de p seja 3 que é: 56q5p³; daí o fato de
9
termos parado de construir a expressão (III). Se por exemplo, eu quisesse a probabilidade para 4 sucessos (4 caras em 8 lançamentos), eu deveria avançar em sua construção, ou seja, iria até 70q4p4.
6 1 6 15 20 15 6 1
7 1 7 21 35 35 21 7 1
8 1 8 28 56 70 56 28 8 1
Mas não é pedido no enunciado da questão, portanto:
A probabilidade de 3 caras em 8 lançamentos de uma moeda honesta (p = q = ½) é a seguinte:
56 q5p³ = 56 x (0,5)5 x (0,5)³ = 0,2187 = 21,87%
NÍVEL DE SIGNIFICÂNCIA
Para falarmos de nível de significância, precisamos de uma breve introdução ao Teste das Hipóteses, que será tratado com mais detalhes ao longo do curso.
Suponhamos o experimento a seguir:
Ao lançarmos uma moeda 6 vezes (n = 6), obtemos 1 cara e 5 coroas). O conjunto R de todos os resultados possíveis de número de sucessos (sair cara) em 6 lançamentos é:
R = {0,1,2,3,4,5,6 caras}
Lança-se a hipótese H0, chamada de hipótese probanda, de que a moeda é honesta, ou seja, a probabilidade de ser cara ou coroa é a mesma. Caso esta hipótese não seja aceita, parte-se para a Ha, hipótese alternativa, que, no nosso caso, é bem razoável crer que a probabilidade de cara seja menor que a de coroa.
10
Quando adentrarmos mais profundamente no Teste das Hipóteses, haverá um macete das setas e de lá faremos um flash-back até aqui.
O experimento pode fazer com que a gente rejeite a hipótese H0
(de que a moeda é honesta), pois apesar de a probabilidade de esta hipótese ser verdadeira existir, ela venha a ser muito pequena. Esta probabilidade pequeníssima é a probabilidade de se cometer este erro, conhecida como nível significância e quanto menor for este nível, melhor.
O nível de significância é indicado pela letra grega alfa (α)
Se estipularmos um α = 12%, indicamos que estamos dispostos a tolerar um erro de no máximo estes 12%. Se α = 5%, por exemplo, significa que ficamos menos tolerantes ao erro.
Vejamos a análise para α = 12%
6 1 6 15 20 15 6 1
7 1 7 21 35 35 21 7 1
8 1 8 28 56 70 56 28 8 1
Para x = 0 (nenhum cara): P(x=0) = 1q6p0 = q6 = (0,5)6 = 0,01562 = 1,56%
O que nos diz a expressão acima?
Que mesmo sendo honesta, é possível que em 6 lançamentos só saia coroa, embora esta probabilidade seja de meros 1,56%.
Uma pessoa em sã consciência rejeitaria a hipótese probanda (H0) de que a moeda é honesta e optaria pela hipótese (Ha) de que a probabilidade de cara seja menor que a de coroa.
Se para a infelicidade do cidadão a “danada” da moeda for honesta, ele erra ao rejeitar H0, mas esta possibilidade de errar é de meros 1,56%.
11
Lembre-se que 1,56% < α, ou seja, < 12%.
Como o pesquisador tolerou errar em até 12% (α), se não saísse nenhum cara ele optaria por Ha e correria o pequeno risco de cometer este erro
Para x = 1 (um cara), temos P(x=1) = 6q5p = 6 x (0,5)5 x (0,5) = 0,09375 = 9,37%.
Além do fato de 9,37% < α = 12%, nos levar a optar por Ha, é preciso que a soma de P(x=0) e P(x=1) também seja menor que α.
0,015625 + 0,09375 = 0,109375 = 10, 94% < 12%
Logo, saindo 1 cara em 6 lançamentos, nos leva a optar por Ha com uma chance de estarmos errados próxima de 11%.
Para x = 2 temos P(x=2) = 15q4p2 = 15 x (0,5)4 x (0,5)² = 0,234375 = 23,44%.
Como 23,44% > 12%, se saíssem duas caras em 6 lançamentos, eu não mais rejeitaria a H0 (moeda honesta), pois se assim o fizesse, eu teria uma probabilidade de estar errado de 23,44% que é muito além do erro máximo tolerado que é de 12% (nível de significância α)
RESULTADOS POSSÍVEIS:
0 1 2 3 4 5 6
Rc Rc*
Rc é a região de rejeição de H0 e Rc* é a região de não-rejeição para α = 12%
Se α passa-se para 5%, significaria que minha tolerância ao erro diminuiria e o “1” pularia de Rc para Rc*. Diante deste rigor de ser mais intolerante ao erro, o aparecimento de 1 cara em 6
12
lançamentos já é motivo o suficiente para não rejeitar H0, pois se assim o fizesse, eu estaria incorrendo na probabilidade de estar errado em 9,37%, quando minha tolerância ao erro é agora de 5%.
ALTERNATIVA AO TRIÂNGULO DE PASCAL
Vimos como capturar do triângulo de pascal no exercício resolvido lá atrás a probabilidade de 3 caras em 8 lançamentos de uma moeda honesta (p = q = ½):
56 q5p³ = 56 x (0,5)5 x (0,5)³ = 0,2187 = 21,87%
Mas o que ocorreira, por exemplo, se quiséssemos trabalhar com o valor de “n” muito grande: n= 15; n = 22, etc...
Não dá para fazer um triângulo de Pascal do tamenho das pirâmides do Egito, não é?
Para isto utilizamos a seguinte fórmula:
)
Onde k é o número de sucessos e n o número de lançamentos.
No caso de 3 caras (k =3) em 8 lançamentos (n=8)
[(8 x 7 x 6 x 5!) / (3 x 2 x 5!)] q5p3 = 56q5p3
kkn pqknk
n −
− )!(!
!
338
)!38(!3
!8pq −
−
BIBLIOGRAFIA
Introdução Ilustrada à Estatística – autor: Sérgio Francisco Costa – Editora Harbra
Estatística e Introdução à Econometria – autor: Alexandre Sartoris – Editora Saraiva
Estatística Aplicada à Gestão Empresarial – autor: Adriano Leal Bruni – Editora Atlas
Estatística Fácil – autor Antônio Arnot Crespo – Editora Saraiva
top related