estatística distribuição normal (aula 2)
TRANSCRIPT
Associação Diocesana de Ensino e Cultura de Caruaru
FACULDADE DE FILOSOFIA, CIÊNCIAS E LETRAS DE CARUARU
Reconhecida pelo Decreto 6399 de 15.01.69 D.O. 17-01-69
CURSO: ADMINISTRAÇÃO
Prof. Wellington Marinho Falcão
AULA 2
1
DISTRIBUIÇÃO NORMAL
A sua forma lembra um sino e média, moda e mediana são coincidentes, ou seja, se sobrepõem, conforme figura abaixo:
Por se tratar de uma distribuição de probabilidades (variável analisada no eixo horizontal e respectiva probabilidade no eixo vertical) a área entre a curva e o eixo horizontal é igual a 1.
A curva normal é simétrica em relação à média, isto é, há 50% de probabilidade de a variável ser maior que a média e 50% de ser menor.
A distribuição normal é apropriada para variáveis contínuas, enquanto, como já vimos, a distribuição binomial é própria para variáveis discretas, embora para amostras grandes (n > 30)
2
podemos usar com boa precisão a curva da distribuição normal (Curva de Gauss) para o cálculo de sua probabilidade.
Os parâmetros da distribuição normal se referem à sua população e são média (µ) e a variância (σ²).
Portanto, em função dos parâmetros µ e σ², há infinitas distribuições normais.
Mesma média (µa = µb), mas diferentes σ² (σb² > σa²)
Médias diferentes, porém mesma variância (σb² = σa²)
3
Quando escrevemos x N (µ;σ²), estamos dizendo que a variável x se distribui normalmente com média µ e variância σ². Por exemplo: N (20;9) significa distribuição normal de média µ = 20 e variância σ² = 9.
Uma propriedade interessante é a seguinte, sabendo-se que a raiz quadrada da variância σ² é o desvio-padrão σ:
As áreas (µ ± σ), (µ ± 2σ) e (µ ± 3σ) nos dizem que a média µ mais ou menos um desvio-padrão σ nos dá 68,26% de probabilidade de ocorrer; mais ou menos dois desvios-padrão 2σ cobre 95,44% das probabilidades e mais ou menos 3 desvio-padrão 3σ praticamente cobrimos todas as possibilidades (99,74%)
FIG. 4
68.26 %
99.73 %
µ µ+σ µ+3σµ+2σ
µ-σµ-2σ
µ-3σ
95.46 %
4
Os valores maiores que µ + 3σ ou menores que µ - 3σ só têm chance de ocorrer em 0,26% das vezes.
Ex: N (20,9) nos dá µ = 20 e σ = √9 = 3
µ ± σ = 20 ± 3 = 17 a 23 nos diz que 68,26% de probabilidade de o valor da variável estar entre 17 e 23;
µ ± 2σ = 20 ± 6 = 14 a 26 nos diz que 95,46% de probabilidade de o valor da variável estar entre 14 e 26;
µ ± 3σ = 20 ± 9 = 11 a 29 nos diz que 99,73% de probabilidade de o valor da variável estar entre 11 e 29;
Um valor para a variável menor que 11 e maior que 29 só tem 0,26% de chance de ocorrer.
Esta curva é assintótica em relação ao eixo horizontal, ou seja, ela se aproxima em ambas as caudas (esquerda e direita) do eixo horizontal, sem, contudo, tocá-lo.
Há a necessidade de se tabelar a probabilidade de uma variável distribuída normalmente, porém, como já foi dito, existem infinitas distribuições normais a depender da média µ e da variância σ², o que implicaria em infinitas tabelas. Seria uma loucura!
Para resolver isto, criou-se a normal reduzida N(0,1), isto é, µ = 0 e σ² = 1, que tem todos os seus valores tabelados e todas as outras distribuições normais que tenham pelo menos um dos parâmetros (µ ou σ²) diferentes dos parâmetros da normal reduzida, através de um processo de transformação, podem se utilizar desta tabela.
Vejamos:
1º) Para uma distribuição normal reduzida, qual a probabilidade de um valor estar entre -1,25 e 0?
P(-1,25 < z < 0) = ?
5
P(-1,25 < Z < 0) = a área hachurada entre -1,25 e zero.
A partir daí, recorremos à tabela 1 que consta do apêndice deste material. Nela há um detalhe: os valores tabelados para a área hachurada estão localizados à direita de 0, mas não há problema algum, pois uma vez que esta distribuição é simétrica em relação à média zero, o valor tabelado para 1,25 é idêntico ao valor que acharíamos para -1,25.
P(-1,25 < Z < 0) = P(0 < Z < 1,25).
Portanto, para consultarmos a referida tabela percorremos a primeira coluna Z até encontrarmos a linha cujo valor é 1,2 (algarismo anterior à vírgula mais a primeira casa decimal). Em seguida percorremos a coluna que tem a segunda casa decimal (0,05). Onde a linha de valor 1,2 cruza com a coluna 0,05 temos a probabilidade de o valor da variável estar entre 0 e 1,25, ou, para o nosso caso, entre 0 e -1,25 (simetria).
Vejamos como trabalhamos com a tabela citada:
6
Z 0,00 0,01 . . . 0,05 . . . 0,0 0,1 0,2 . . .
1,2 0,3944 . . .
Portanto,
P(-1,25 < Z < 0) = 0,3944 = 39,44%
Para a N(0;1) acima digo que entre a média zero e 1,25 desvios padrão há uma probabilidade de 39,44% de ocorrência da variável em estudo.
2º) P(-0,5 < Z < 1,48)
P(-0,5 < Z < 1,48) = P(-0,5 < Z < 0) + P(0< Z <1,48)
Por simetria a expressa acima é igual a:
P(0 < Z < 0,5) + P(0 < Z < 1,48) = 0,1915 + 0,4306
P(0 < Z < 0,5) + P(0 < Z < 1,48) = 0,6221 = 62,21%
7
3º) P(0,8 < Z < 1,23)
8
4º) P(Z > 0,6)
Isto será igual a toda a área à direita da média zero (0,5), pois ela é simétrica, menos a área entre 0 e 0,6, ou seja,
P(Z > 0,6) = 0,5 – P(0 < Z < 0,6) = 0,5 – 0,2258 = 0,2742 = 27,42%
5º) P(Z < 0,92)
Será a soma da área à esquerda da média zero (0,5) com a área entre 0 e 0,92. Portanto:
P(Z < 0,92) = 0,5 + P(0 < Z < 0,92) = 0,5 + 0,3212 = 0,8212 = 82,12%
9
6º) Qual a probabilidade de um valor se encontrar entre 2 e 2,05 para uma distribuição normal cuja média é 2 e desvio padrão é 0,04?
Neste caso não temos mais aquela distribuição normal padrão de média 0 (zero) e desvio padrão 1, cujos valores estavam todos tabelados.
Não há problema, pois é só fazermos aquela transformação citada lá atrás.
N(2 ; 0,04²) N(0;1)
Para x = 2
Para x = 2,05
S
XXZ
−=
2
0,04
004,0
22=
−=Z
25,104,0
205,2=
−=Z
10
Portanto, P(2 < X < 2,05) para a distribuição N(2 ; 0,04²) será igual a P(0 < Z < 1,25) para a distribuição N(0;1).
P(0 < Z < 1,25) = 0,3944 = 39,44%
11
12
BIBLIOGRAFIA
Introdução Ilustrada à Estatística – autor: Sérgio Francisco Costa – Editora Harbra
Estatística e Introdução à Econometria – autor: Alexandre Sartoris – Editora Saraiva
Estatística Aplicada à Gestão Empresarial – autor: Adriano Leal Bruni – Editora Atlas
Estatística Fácil – autor Antônio Arnot Crespo – Editora Saraiva