estatística distribuição binomial (aula 1)

14
0 Associação Diocesana de Ensino e Cultura de Caruaru FACULDADE DE FILOSOFIA, CIÊNCIAS E LETRAS DE CARUARU Reconhecida pelo Decreto 6399 de 15.01.69 D.O. 17-01-69 CURSO: ADMINISTRAÇÃO Prof. Wellington Marinho Falcão AULA 1

Upload: wellington-marinho-falcao

Post on 17-Aug-2015

118 views

Category:

Education


5 download

TRANSCRIPT

0

Associação Diocesana de Ensino e Cultura de Caruaru

FACULDADE DE FILOSOFIA, CIÊNCIAS E LETRAS DE CARUARU

Reconhecida pelo Decreto 6399 de 15.01.69 D.O. 17-01-69

CURSO: ADMINISTRAÇÃO

Prof. Wellington Marinho Falcão

AULA 1

1

DISTRIBUIÇÃO BINOMIAL

É uma distribuição probabilística. Mas o que é uma distribuição probabilística?

Toda vez que associamos, no plano cartesiano, uma variável x no eixo horizontal à sua probabilidade de ocorrência P(x) no eixo vertical, teremos uma distribuição probabilística.

x: x1, x2, x3, ..., xi, ..., xn

P(x): p1 p2 p3 …, pi …, pn

FIG. 1

2

Há várias distribuições probabilísticas, tais como: binomial, normal, t de student, poisson, etc.

Comecemos com a distribuição binomial!

Lancemos uma moeda honesta* duas vezes ou duas moedas honestas uma única vez, o que dá no mesmo, não é?

Chamemos cara de Ca e coroa de Co

Os resultados possíveis são: CaCa, CaCo, CoCa, CoCo; conforme é demonstrado no quadro abaixo:

M1 M2 Ca Co

Ca CaCa CaCo

Co CoCa CoCo

Tab. 1

Do exposto acima, já podemos destacar certas propriedades da distribuição binomial:

• Variáveis discretas; • Eventos Independentes; • Presunção de Reposição.

Lá atrás chamamos a probabilidade de o evento x ocorrer de p, ou seja, P(x) = p.

Chamaremos de q a probabilidade de o evento x não ocorrer, logo, p + q = 1. Evidente, pois a soma de todas as probabilidades é sempre igual a 1.

p + q = 1 q = 1 – p

Convencionou-se o seguinte:

p = sucesso

q = fracasso

3

CUIDADO!

O conceito de sucesso em estatística é diferente do que entendemos por sucesso no nosso dia-a-dia, pois na estatística, sucesso é a ocorrência do evento e fracasso é a não-ocorrência. Por exemplo: Se numa pesquisa estamos estudante a taxa de mortalidade infantil, ocorrer um óbito é sucesso e fracasso será sobreviver.

Temos aí, mais uma propriedade da distribuição binomial:

• Ocorrência de apenas dois resultados: p (sucesso) e q (fracasso).

Suponhamos que no lançamento de duas moedas honestas, sucesso “p” seja cara e fracasso “q” seja coroa, onde p0 será a probabilidade de zero cara, p1 de um cara e p2 de dois cara.

Levando para o plano cartesiano:

4

Mais uma propriedade:

• Não importa a ordem. Tanto faz se cara vem antes ou depois do coroa para x = 1.

Para o lançamento de três moedas honestas, teríamos:

Para 4 moedas teríamos:

5

Aumentando-se o número de lançamentos de moeda, aumenta-se o número de colunas como se pode ver nas figuras 2, 3 e 4.

Quando n (número de lançamentos) tende a infinito,um número infinito de colunas se acomoda na curva da figuras supracitadas. As colunas ficam tão finas (apinhadas sob a curva) quanto uma linha, que o gráfico, ao invés de colunas verticais poderá ser a própria curva. Aí tereos a distribuição normal que é válida para variáveis contínuas ou, quando n muito grande, para variáveis discretas (aproximação pela normal).

Veremos mais sobre a distribuição normal ao longo do curso.

Mas o que são variáveis discretas e variáveis contínuas?

Variável discreta é aquela que não é contínua. OH! OH! OH!

Parece óbvio, não é? E é mesmo!!!

No caso da moeda, não existe nenhum valor intermediário entre ocorrerem 2 caras ou 3 caras, por exemplo. Não há a possibilidade de ocorrerem 2,5 caras, ou seja, há uma descontinuidade entre 2 e 3.

Já uma variável peso ou altura seria contínua, pois não importa quão próximos estejam dois valores, sempre haverá infinitos valores entre os dois.

Vejamos!

Quantos valores haverá entre 10,6 kg e 11,0 kg?

Uma pessoa mais desavisada diria: 10,7 kg; 10,8 kg e 10,9 kg, ou seja, 3 valores. Mas aumentando o número de casas decimais de 1 para 2, teríamos entre 10,9 kg e 11,0 kg valores como: 10,92 kg ou 10,99 kg. E com 3 casas decimais teríamos entre 10,99 kg e 11 kg valores como: 10,991 kg ou 10,995 kg.

E com 4, 5, 6, ... casas decimais???

Não importa quão próximos estejam dois valores, sempre haverá uma infinidade de valores entre eles. Esta variável não sofre descontinuidade, isto é, ela é uma variável contínua.

6

Voltemos ao exemplo do lançamento de 2 moedas ou de 1 moeda duas vezes (que dá no mesmo)

Chamemos de p (sucesso) a probabilidade de sair cara e q (fracasso) a probabilidade de não sair cara, ou seja, sair coroa.

Perceba que as probabilidades para 0, 1 e 2 caras são as da FIG.2

7

O mesmo resultado da FIG.3

Sabendo-se que a ordem das parcelas não altera a soma:

p³ + 3qp² + 3pq² + q³ =

= q³ + 3q²p + 3qp² + p³ (I)

Em cada uma das parcelas da expressão acima há tanto q quanto p. Na 1ª parcela p não aparece, pois é p0 que é igual a 1 e na última q não aparece, pois é q0 que igual a 1. Vejamos!

=1q³p0 + 3q²p¹+ 3q¹p² + 1q0p³ (II)

Perceba que a expressão (II) é a mesmíssima coisa da expressão (I). Como a moeda foi lançada 3 vezes (n = 3), o expoente de q começa por 3 e vai diminuindo de 1 em 1 até zerar. O inverso ocorre com p que começ com o expoente zero e vai aumentando de 1 em e1 até chegar em 3 (n = 3)

Estes coeficientes da expressão (II) que são 1, 3, 3 e 1; vêm da linha n = 3 do triângulo de Pascal.

1q³p0 + 3q²p¹+ 3q¹p² + 1q0p³ (II)

Abaixo, temos o triângulo de pascal de n=1 até n=8

n

2 1 2 1

3 1 3 3 1

4 1 4 6 4 1

5 1 5 10 10 5 1

6 1 6 15 20 15 6 1

7 1 7 21 35 35 21 7 1

8 1 8 28 56 70 56 28 8 1

8

No Triângulo de Pascal, cada número resulta da soma do número acima com o número que está à esquerda do que está acima. Note o destaque dado ao número 21 da linha n =7. Ele é a soma do número que está acima: 6; com o que está à esquerda de 6: 15. Logo, 6 + 15 = 21.

EXERCÍCIO RESOLVIDO:

Qual a probabilidade de termos 3 caras em 8 lançamentos de uma moeda honesta?

Solução:

O expoente de q começa com 8 (n = 8) e vai diminuindo de 1 em 1, enquanto o expoente de p, começa em 0 e vai crescendo de 1 em 1 até chegar em 8 (n= 8)

1 q8p0 + 8 q7p1 + 28 q6p2 + 56 q5p3 + ...... (III)

n

2 1 2 1

3 1 3 3 1

4 1 4 6 4 1

5 1 5 10 10 5 1

6 1 6 15 20 15 6 1

7 1 7 21 35 35 21 7 1

8 1 8 28 56 70 56 28 8 1

O expoente de p significa o número de sucessos e o expoente de q o de fracassos. Como no enunciado da questão eu quero saber a probabilidade de saírem 3 caras em 8 lançamentos, eu preciso só do termo cujo expoente de p seja 3 que é: 56q5p³; daí o fato de

9

termos parado de construir a expressão (III). Se por exemplo, eu quisesse a probabilidade para 4 sucessos (4 caras em 8 lançamentos), eu deveria avançar em sua construção, ou seja, iria até 70q4p4.

6 1 6 15 20 15 6 1

7 1 7 21 35 35 21 7 1

8 1 8 28 56 70 56 28 8 1

Mas não é pedido no enunciado da questão, portanto:

A probabilidade de 3 caras em 8 lançamentos de uma moeda honesta (p = q = ½) é a seguinte:

56 q5p³ = 56 x (0,5)5 x (0,5)³ = 0,2187 = 21,87%

NÍVEL DE SIGNIFICÂNCIA

Para falarmos de nível de significância, precisamos de uma breve introdução ao Teste das Hipóteses, que será tratado com mais detalhes ao longo do curso.

Suponhamos o experimento a seguir:

Ao lançarmos uma moeda 6 vezes (n = 6), obtemos 1 cara e 5 coroas). O conjunto R de todos os resultados possíveis de número de sucessos (sair cara) em 6 lançamentos é:

R = {0,1,2,3,4,5,6 caras}

Lança-se a hipótese H0, chamada de hipótese probanda, de que a moeda é honesta, ou seja, a probabilidade de ser cara ou coroa é a mesma. Caso esta hipótese não seja aceita, parte-se para a Ha, hipótese alternativa, que, no nosso caso, é bem razoável crer que a probabilidade de cara seja menor que a de coroa.

10

Quando adentrarmos mais profundamente no Teste das Hipóteses, haverá um macete das setas e de lá faremos um flash-back até aqui.

O experimento pode fazer com que a gente rejeite a hipótese H0

(de que a moeda é honesta), pois apesar de a probabilidade de esta hipótese ser verdadeira existir, ela venha a ser muito pequena. Esta probabilidade pequeníssima é a probabilidade de se cometer este erro, conhecida como nível significância e quanto menor for este nível, melhor.

O nível de significância é indicado pela letra grega alfa (α)

Se estipularmos um α = 12%, indicamos que estamos dispostos a tolerar um erro de no máximo estes 12%. Se α = 5%, por exemplo, significa que ficamos menos tolerantes ao erro.

Vejamos a análise para α = 12%

6 1 6 15 20 15 6 1

7 1 7 21 35 35 21 7 1

8 1 8 28 56 70 56 28 8 1

Para x = 0 (nenhum cara): P(x=0) = 1q6p0 = q6 = (0,5)6 = 0,01562 = 1,56%

O que nos diz a expressão acima?

Que mesmo sendo honesta, é possível que em 6 lançamentos só saia coroa, embora esta probabilidade seja de meros 1,56%.

Uma pessoa em sã consciência rejeitaria a hipótese probanda (H0) de que a moeda é honesta e optaria pela hipótese (Ha) de que a probabilidade de cara seja menor que a de coroa.

Se para a infelicidade do cidadão a “danada” da moeda for honesta, ele erra ao rejeitar H0, mas esta possibilidade de errar é de meros 1,56%.

11

Lembre-se que 1,56% < α, ou seja, < 12%.

Como o pesquisador tolerou errar em até 12% (α), se não saísse nenhum cara ele optaria por Ha e correria o pequeno risco de cometer este erro

Para x = 1 (um cara), temos P(x=1) = 6q5p = 6 x (0,5)5 x (0,5) = 0,09375 = 9,37%.

Além do fato de 9,37% < α = 12%, nos levar a optar por Ha, é preciso que a soma de P(x=0) e P(x=1) também seja menor que α.

0,015625 + 0,09375 = 0,109375 = 10, 94% < 12%

Logo, saindo 1 cara em 6 lançamentos, nos leva a optar por Ha com uma chance de estarmos errados próxima de 11%.

Para x = 2 temos P(x=2) = 15q4p2 = 15 x (0,5)4 x (0,5)² = 0,234375 = 23,44%.

Como 23,44% > 12%, se saíssem duas caras em 6 lançamentos, eu não mais rejeitaria a H0 (moeda honesta), pois se assim o fizesse, eu teria uma probabilidade de estar errado de 23,44% que é muito além do erro máximo tolerado que é de 12% (nível de significância α)

RESULTADOS POSSÍVEIS:

0 1 2 3 4 5 6

Rc Rc*

Rc é a região de rejeição de H0 e Rc* é a região de não-rejeição para α = 12%

Se α passa-se para 5%, significaria que minha tolerância ao erro diminuiria e o “1” pularia de Rc para Rc*. Diante deste rigor de ser mais intolerante ao erro, o aparecimento de 1 cara em 6

12

lançamentos já é motivo o suficiente para não rejeitar H0, pois se assim o fizesse, eu estaria incorrendo na probabilidade de estar errado em 9,37%, quando minha tolerância ao erro é agora de 5%.

ALTERNATIVA AO TRIÂNGULO DE PASCAL

Vimos como capturar do triângulo de pascal no exercício resolvido lá atrás a probabilidade de 3 caras em 8 lançamentos de uma moeda honesta (p = q = ½):

56 q5p³ = 56 x (0,5)5 x (0,5)³ = 0,2187 = 21,87%

Mas o que ocorreira, por exemplo, se quiséssemos trabalhar com o valor de “n” muito grande: n= 15; n = 22, etc...

Não dá para fazer um triângulo de Pascal do tamenho das pirâmides do Egito, não é?

Para isto utilizamos a seguinte fórmula:

)

Onde k é o número de sucessos e n o número de lançamentos.

No caso de 3 caras (k =3) em 8 lançamentos (n=8)

[(8 x 7 x 6 x 5!) / (3 x 2 x 5!)] q5p3 = 56q5p3

kkn pqknk

n −

− )!(!

!

338

)!38(!3

!8pq −

BIBLIOGRAFIA

Introdução Ilustrada à Estatística – autor: Sérgio Francisco Costa – Editora Harbra

Estatística e Introdução à Econometria – autor: Alexandre Sartoris – Editora Saraiva

Estatística Aplicada à Gestão Empresarial – autor: Adriano Leal Bruni – Editora Atlas

Estatística Fácil – autor Antônio Arnot Crespo – Editora Saraiva