5 - distribuicoes

31
ESTATÍSTICA INFERENCIAL OU INDUTIVA DISTRIBUIÇÕES DE PROBABILIDADE

Upload: pablo-stuart

Post on 05-Dec-2014

137 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 5 - Distribuicoes

ESTATÍSTICA INFERENCIAL OU INDUTIVA

DISTRIBUIÇÕES DE PROBABILIDADE

Page 2: 5 - Distribuicoes

Neste capítulo vamos dar continuidade ao estudo de probabilidades, introduzindo os conceitos de variáveis aleatórias e de distribuições de probabilidade.

VARIÁVEIS ALEATÓRIAS

A variável aleatória (v.a) é uma variável que tem um valor único (determinado aleatoriamente) para cada resultado de um experimento. Uma variável aleatória associa um valor numérico a cada resultado de um fenômeno aleatório. Como exemplos, podemos citar:

o número de usuários que consultam um site de busca, em uma certa hora do dia, o número de atletas com lesões traumáticas no joelho, a pressão sanguínea de mulheres na menopausa. número de alunos que não compareceram a aula de estatística num determinado dia. altura de um adulto do sexo masculino selecionado aleatoriamente

Muitas vezes não estamos interessados propriamente no resultado de um experimento aleatório, mas em alguma característica numérica a ele associada. Essa característica é chamada variável aleatória. Suponhamos um espaço amostral S e que a cada ponto amostral seja atribuído um número. Fica, então, definida uma função chamada variável aleatória.

S Número associado ao ponto amostral s

Exemplo - O espaço amostral relativo ao "lançamento simultâneo de duas moedas" é S = {(ca,ca), (ca,co), (co,ca), (co,co)} e se X representa o "número de caras" que aparecem, a cada ponto amostral podemos associar um número para X, de acordo com o gráfico. (X é a variável aleatória associada ao número de caras observado)

S X = número de caras obtido

O resultado zero caras ocorre somente uma vez. O resultado 1 cara ocorre duas vezes. O resultado 2 caras ocorre uma vezes

NOTA - A variável aleatória X é uma associação de pontos no espaço amostral com pontos na reta dos números reais (0, 1, 2, 3, . . . ). Na realidade, uma variável aleatória é definida através de uma função em que o domínio é o conjunto de todos os resultados possíveis do experimento (conjunto S) e a imagem é o conjunto de

PSICOLOGIA – ESTATÍSTICA INFERENCIAL – 1/2013 Página 2

(ca, ca)

(ca, co)

(co, ca)

(co, co)

(ca, ca)

(ca, co)

(co, ca)

(co, co)

2

1

1

0

2

1

1

0

s s X(s)

X(s)

DISTRIBUIÇÕES DE PROBABILIDADEDISTRIBUIÇÕES DE PROBABILIDADE

Page 3: 5 - Distribuicoes

todos os valores assumidos pela variável aleatória (conjunto X). Note que a variável aleatória não é resultado do experimento, mas sim um valor associado a este.

Podemos colocar os resultados do experimento anterior em forma de tabela.

 Ponto Amostral X = Número de caras. (Valor da v.a.)

(ca,ca) 2

(ca,co) 1

(co,ca) 1

(co,co) 0

Uma variável aleatória pode ser classificada como variável aleatória discreta ou variável aleatória contínua.

Variável aleatória discreta: é aquela que assume valores inteiros e finitos. Uma variável aleatória discreta tem uma quantidade enumerável de valores, onde “enumerável” se refere ao fato de que podem existir infinitos valores, mas que podem ser associados a um processo de contagem. No exemplo anterior, X é uma variável aleatória discreta, já que podemos contar o número de caras.

Exemplos

Número de acidentes ocorridos em uma semana. Número de defeitos por peça produzida. Número de vitórias obtidas por um atleta. Número de filhos do sexo masculino por casal.

Variável aleatória contínua: é aquela que pode assumir inúmeros valores num intervalo de números

reais e é medida numa escala contínua.

Exemplos

Temperatura (º C), Peso. Altura.

Outros exemplos

Seja X a resposta a uma questão com “Sim”, “Não”, “Não Sei”. X não é uma v.a, pois são variáveis qualitativas.

Seja Y o  número de “Sim”. Y é uma v.a. discreta, pois podemos contar.

DISTRIBUIÇÃO DE PROBABILIDADE

Uma Distribuição de Probabilidade é uma lista de todos os resultados de um experimento e suas probabilidades associadas.

A distribuição de probabilidade de uma variável descreve como as probabilidades estão distribuídas sobre os valores da variável aleatória. Uma distribuição de probabilidade associa cada valor que a v.a pode assumir, com suas respectivas probabilidades.

Seja X uma variável aleatória que pode assumir os valores . A cada valor correspondem pontos do espaço amostral. Associamos, então, a cada valor a probabilidade de ocorrência de tais pontos no

espaço amostral.

PSICOLOGIA – ESTATÍSTICA INFERENCIAL – 1/2013 Página 3

Page 4: 5 - Distribuicoes

Exemplo – Lançamento de duas moedas, com X a variável aleatória associada ao “número de caras” observado.

S = {(ca, ca), (ca, co), (co, ca), (co, co)} X = número de caras observado.

X = 0 corresponde ao evento (co,co) com probabilidade

X = 1 corresponde ao evento (ca, co), (co, ca) com probabilidade

X = 2 corresponde ao evento {(ca, ca) com probabilidade

X = número de caras P(X) = probabilidade associada

Em forma de tabela.

X = Número de caras(Valor da v.a.)

P(X)

0 1/4

1 2/4

2 1/4

TOTAL 1

FUNÇÃO DE PROBABILIDADE

De forma mais rigorosa, é uma função matemática em que o domínio é os valores possíveis de uma variável aleatória ( ) e a imagem são as suas probabilidades associadas ( ).

Essa função, assim definida, é denominada FUNÇÃO PROBABILIDADE e denotamos por

A função P( ) será uma função de probabilidade se satisfizer as seguintes condições:

(1) P( ) 0, para todo

(2) GRÁFICO DE UMA FUNÇÃO DE PROBABILIDADE

A coleção de pares ordenados ( , P( )), i = 1, 2, 3, .... , n, denominamos distribuição de probabilidade da v.a X, que pode ser representada por meio de tabelas e gráficos.

PSICOLOGIA – ESTATÍSTICA INFERENCIAL – 1/2013 Página 4

0

1

2

0

1

2

1/4

2/4

1/4

0

1/4

2/4

1/4

0

f(x) = P(X = ) ou P() ou f(x) = P(X = ) ou P() ou

Page 5: 5 - Distribuicoes

Exemplo - Consideremos a distribuição de freqüências relativa ao número de acidentes diários na EPTG durante o mês de janeiro, de 12:00 as 14:00.

Número de Acidentes Frequência

0 22

1 5

2 2

3 1

TOTAL 30

 Podemos então escrever a tabela de distribuição de probabilidade:

Número de Acidentes Freqüência P(X)

0 22 22/30 = 0,73

1 5 5/ 30 = 0,17

2 2 2/30 = 0,07

3 1 1/30 = 0,03

Total 30 1,00

Em um dia, a probabilidade de:

Não ocorrer acidentes é de 0,73. Ocorrer um acidente é de 0,17. Ocorrerem dois acidentes é de 0,07. Ocorrerem três acidentes é de 0,03.

GRÁFICO

.

DISTRIBUIÇÕES DISCRETAS DE PROBABILIDADE

Definição 1 – Uma distribuição discreta de probabilidade enumera cada valor que a v.a pode assumir, ao lado de sua probabilidade.

A cada valor de uma variável aleatória discreta pode ser atribuída uma probabilidade. Ao aumentar cada valor da variável aleatória com a sua probabilidade correspondente, forma-se uma distribuição discreta de probabilidade.

PSICOLOGIA – ESTATÍSTICA INFERENCIAL – 1/2013 Página 5

Page 6: 5 - Distribuicoes

As distribuições discretas de probabilidades envolvem variáveis relativas a dados que podem ser contados.

Dentre as distribuições discretas de probabilidade, destacamos.

Distribuição Binomial Distribuição Multinomial Distribuição de Poisson Distribuição de Bernoulli Distribuição Geométrica Distribuição Hipergeométrica

Faremos apenas uma breve introdução da distribuição binomial. As outras distribuições ficam como pesquisa para aqueles que desejam aprofundar mais nos tipos de distribuições discretas de probabilidade.

DISTRIBUIÇÃO BINOMIAL

A distribuição binomial caracteriza-se por experimentos que apresentam apenas dois resultados: sucesso ou fracasso.

Exemplos de distribuições binomiais

Cara ou coroa Sim ou não Positivo ou negativo Empregado ou desempregado Fator Rh, etc

A distribuição binomial tem as seguintes características:

Considere um experimento que apresenta apenas dois resultados possíveis que são categorias mutuamente exclusivas: sucesso ou fracasso.

São repetidos diversas vezes este mesmo experimento. A probabilidade p de sucesso permanece constante para cada tentativa. Conseqüentemente, a

probabilidade q de falha também permanece constante. As tentativas são independentes, significando que o resultado de uma tentativa não afeta o resultado de

qualquer outra tentativa.

FÓRMULA PARA A DISTRIBUIÇÃO DE PROBABILIDADE BINOMIAL

Suponhamos que realizamos um mesmo experimento n vezes, sucessivamente e independentes. A probabilidade de que um evento se realize k vezes nas provas é dada pela função

onde, n é o número de tentativas k é o número de sucessos observados p é a probabilidade de sucesso em cada tentativa q é a probabilidade de fracasso em cada tentativa, que é igual a 1- p

O termo , e é chamado de termo binomial. Por isso distribuição binomial.

n! – Lê-se n fatorial. Por exemplo, 4! = 4 x 3 x 2 x 1 = 24. 0! = 1

PSICOLOGIA – ESTATÍSTICA INFERENCIAL – 1/2013 Página 6

knk qpk

nkXP

)(

Page 7: 5 - Distribuicoes

1! = 1.

Exemplo - O Departamento de Estatística do Trabalho de um município estimou que 20% da população estão desempregadas. Uma amostra de 14 trabalhadores é obtida deste município. Calcule a probabilidade de:

(a) três trabalhadores estarem desempregados na amostra.(b) no mínimo um dos trabalhadores da amostra está desempregado.(c) no máximo dois dos trabalhadores estarem desempregados.

-Solução-

Dados: n = 14 e p = 20% = 0,2. Neste caso, q = 1 – p = 1- 0,2 = 0,8.

(a) três trabalhadores estarem desempregados na amostra.

(b) no mínimo um dos trabalhadores da amostra está desempregado.

Neste caso, temos que subtrair a probabilidade do fracasso, ou seja, de se ter 0 desempregado. Ou seja,

(c) no máximo dois dos trabalhadores estarem desempregados.

Neste caso, P(x 2) = P(x = 0) + P(x = 1) + P(x = 2). Como já temos P(x = 0) no item b, precisamos

apenas de P(x = 1) e P(x = 2).

Logo,

PARAMETROS x ESTATÍSTICAS

Parâmetros: são medidas populacionais quando se investiga a população em sua totalidade, neste caso é impossível fazer inferências, pois toda a população foi investigada.

Estatísticas ou Estimadores: são medidas obtidas da amostra, torna-se possível neste caso utilizarmos as teorias inferências para que possamos fazer conclusões sobre a população.

PSICOLOGIA – ESTATÍSTICA INFERENCIAL – 1/2013 Página 7

Page 8: 5 - Distribuicoes

PARAMETROS PARA UMA DISTRIBUIÇÃO BINOMIAL

MÉDIA E VARIÂNCIA DE DISTRIBUIÇÃO BINOMIAL

A média μ (mi) de uma distribuição binomial é dada pela fórmula:

e a variância (sigma ao quadrado) é dada pela fórmula:

onde

p = probabilidade do sucesso q = probabilidade do fracasso n = numero de experimentos

Exemplo: Para calcular a média e variância de ocorrência de cara em 100 lançamentos de uma moeda,

μ = n.p = 100 . ½ = 50 caras

= n.p.q = 100 . ½ . ½ = 25

EXERCÍCIOS

1- Uma moeda é jogada 10 vezes. Calcule a probabilidade

(a) de dar pelo menos duas caras; R: 98,93% (b) de ocorrer seis caras; R: 20,51% (c) de não dar nenhuma coroa; R: 0,098% (d) de dar pelo menos uma coroa; R: 99,90% (e) de não dar 5 caras e 5 coroas R: 75,39%

2- Admitindo que o nascimento de meninos e meninas sejam iguais, calcule a probabilidade de um casal com seis filhos ter quatro filhos homens e duas mulheres. R: 23,44%

3- Admitindo que X tem distribuição de probabilidade de Poisson, encontre as probabilidades: (a) P(X=5) quando µ = 3,0 R: 10,08% (b) P(X ≤ 2) quando µ = 5,5) R: 8,84% (c) P(X ≥ 4) quando µ = 7,5) R: 5,91% (d) P(X = 8) quando µ = 4,0 R: 2,98%

4- Sabe-se que 20% dos animais submetidos a certo tratamento sobrevivem. Se esse tratamento foi aplicado em 20 animais e se X é o número não sobreviventes.

PSICOLOGIA – ESTATÍSTICA INFERENCIAL – 1/2013 Página 8

μ = n.pμ = n.p

= n.p.q = n.p.q

Page 9: 5 - Distribuicoes

(a) Qual a distribuição de X? (a) Calcular μ e . R: μ = 4 = 1,79

5- Uma loja atende, em média, dois clientes por hora. Calcule a probabilidade de em uma hora: (a) atender exatamente dois clientes. R: 27% (b) atender três clientes. R: 18%

DISTRIBUIÇÕES CONTÍNUAS DE PROBABILIDADE

Dentre as distribuições contínuas de probabilidade, destacamos:

Distribuição Uniforme ou Retangular Distribuição Exponencial Distribuição Normal ou Gaussiana Distribuição Distribuição t de Student Distribuição de Snedecor

Estudaremos nesta seção apenas a distribuição normal ou gaussiana, por ser uma das mais importantes distribuições estatísticas. Em seções adiante, estudaremos a distribuição e t de Student. As outras distribuições ficam como pesquisa para aqueles que se interessarem.

DISTRIBUIÇÃO NORMAL OU GAUSSIANA

Dentre as distribuições de variável aleatória contínua, a mais importante (e mais utilizada na prática) é a distribuição normal. Geralmente citada como curva normal ou curva de Gauss.

A Distribuição Normal é essencialmente importante na estatística por quatro razões principais:

1- Inúmeros fenômenos contínuos observados na natureza apresentam uma distribuição de probabilidade aproximadamente bem comportada (aproximadamente normal) ou podem ser aproximados por meio dela. Por exemplo, variáveis que seguem a distribuição normal ou gaussiana:

valores da hemoglobina em pacientes sadios, pressão arterial sistólica, temperatura corporal, altura, medidas de testes psicológicos, tempo de vida útil de um dispositivo eletrônico, etc.

2- Podemos utilizá-la para aproximar várias distribuições de probabilidade discretas.

3- Ela oferece a base para a inferência estatística clássica, devido à sua afinidade com o teorema do limite central (será estudado mais a frente).

4- Outra razão da importância do modelo normal é que as distribuições amostrais de estatísticas como médias e proporções, podem ser aproximadas pela distribuição normal, isto é muito importante para o estudo de inferência estatística.

PRINCIPAIS CARACTERÍSTICAS DA DISTRIBUIÇÃO NORMAL

A média, mediana e a moda são iguais e localizadas no pico da distribuição. A curva normal tem formato de sino, é unimodal no centro exato da distribuição e é simétrica em

relação a sua média. Ela é assintótica – a curva aproxima-se cada vez mais do eixo x, à medida que se afasta da média em

ambos os lados, mas nunca toca efetivamente o eixo. A variável pode assumir qualquer valor real.

PSICOLOGIA – ESTATÍSTICA INFERENCIAL – 1/2013 Página 9

Page 10: 5 - Distribuicoes

A área total sob a curva vale 100% ou 1, onde 50% da área está à abaixo da média e 50% acima da média.

Os valores maiores e menores que a média ocorrem com igual probabilidade, isto é, ambas as probabilidades são iguais a 0,5. Escrevemos: P(X > média) = P(X < média) = 0,5

Os valores centrais são mais freqüentes e os valores extremos mais raros. Ou seja, devido à forma da curva, há poucos resultados muito baixos e poucos resultados muito elevados (a curva cai nos extremos esquerdo e direito, o que se deve às baixas freqüências encontradas), enquanto a maioria dos resultados encontra-se junto à média.

Figura 1 – Características de uma Distribuição Normal

As distribuições normais foram descobertas no século XVII, pelo matemático francês Abraham De Moivre, quando deu seqüência aos trabalhos dos matemáticos suíços Jacob Bernoulli (Lei dos grandes números) e de seu sobrinho Nicolaus Bernoulli. Em 1783, outro matemático, Laplace, utilizou a idéia para descrever a distribuição dos erros, e Gauss a empregou para analisar dados astronômicos, em 1809. Gauss e outros cientistas observaram que mensurações repetidas de uma mesma quantidade (como a distância da Lua ou a massa de um objeto) tendiam a variar, e quando se coletava grande número dessas mensurações, dispondo-as numa distribuição de freqüência, elas se apresentavam repetidamente com forma análoga à Figura 2. E como essa forma gráfica vinha associada aos erros de mensuração, esta distribuição começou a ser conhecida como distribuição normal dos erros, ou simplesmente distribuição normal.

Figura 2 – Distribuição normalA CURVA NORMAL

Se X for uma variável aleatória contínua e tiver uma distribuição normal com

Média = (lê-se mi) e Desvio padrão = (lê-se sigma),

pode-se construir o gráfico de uma curva normal usando a seguinte função, chamada função densidade de probabilidade – f.d.p:

PSICOLOGIA – ESTATÍSTICA INFERENCIAL – 1/2013 Página 10

Page 11: 5 - Distribuicoes

(I)

onde,

= média da distribuição (valor esperado) = desvio padrão π = (PI) = 3,1416 .... = 2,7182 ....

Observe que, como o exponencial = 2,7182 .... e π = (pi) são constantes, uma curva normal depende completamente dos parâmetros e . Ou seja, cada distribuição normal fica determinado pelos seus parâmetros média e desvio padrão, respectivamente. A notação de uma distribuição normal é expressa da seguinte maneira:

Lê-se: “a variável aleatória X tem distribuição normal com média e desvio padrão ”.

Figura 3 – Curva de uma distribuição normal

Uma distribuição normal pode ter qualquer média e qualquer desvio padrão. Podem ter médias diferentes (Figura 4), desvios padrão diferentes (Figura 5) ou ambas as coisas. Isso acontece porque a curva normal trabalha diretamente com as variáveis originais X e os seus parâmetros da distribuição.

Figura 4 – Populações normais com médias diferentes e mesmo desvio padrão

PSICOLOGIA – ESTATÍSTICA INFERENCIAL – 1/2013 Página 11

2

2

1

2

1)(

x

eXf

X ~ N(;)X ~ N(;)

Page 12: 5 - Distribuicoes

Figura 5 – Populações normais com desvios padrão diferentes e mesma média.

Assim, cada par de parâmetros (μ, σ) define uma distribuição normal distinta, determinando completamente o aspecto da curva normal. A média dá a localização do eixo de simetria e o desvio padrão descreve quanto os dados se espalham em torno da média. Portanto, a cada mudança em pelo menos um dos parâmetros, temos outra distribuição

Exemplo 1 - A figura mostra as curvas de densidade para alturas de mulheres e homens adultos nos EUA.

PROBABILIDADE DE UMA VARIÁVEL ALEATÓRIA SOB A CURVA NORMAL

Quando temos em mãos uma variável aleatória com distribuição normal, nosso principal interesse é obter a probabilidade dessa variável aleatória assumir um valor em um determinado intervalo, por exemplo, no intervalo (a, b), isto é

P(a < X < b)

Exemplo 2 - Seja X a variável aleatória que representa os QI,s de candidatos a uma vaga de emprego. Vamos supor que essa variável tenha distribuição normal com média μ = 100 e desvio padrão σ = 12.

PSICOLOGIA – ESTATÍSTICA INFERENCIAL – 1/2013 Página 12

Page 13: 5 - Distribuicoes

Pode haver interesse em conhecer a probabilidade de um candidato escolhido ao acaso ter um QI com valor entre

70 e 115 P(a < X < b) = P(70 < X < 115) ou maior que 115 P(X > b) = P(X > 115) ou menor que 70 P(X < a) = P(X < 70) 100 e 115 P(a < X < b) = P(100 < X < 115) 70 e 100 P(a < X < b) = P(70 < X < 100) 110 e 140 P(a < X < b) = P(110 < X < 140) Etc.

Na prática, interessam-nos probabilidades associadas a intervalos e não probabilidades associadas a pontos individuais, como estudamos em probabilidade para variáveis discretas, já que estamos trabalhando com variáveis que podem assumir qualquer valor real.

O modelo probabilístico para a distribuição de probabilidade de uma variável aleatória contínua envolve a escolha de uma curva normal, denominada função densidade de probabilidade (f.d.p) (Função I). As densidades de probabilidade se caracterizam pelo fato de que:

A área sob a curva entre dois valores quaisquer a e b, dá a probabilidade de uma variável aleatória assumir um valor no intervalo que vai de a até b.

Vejamos como calcular esta probabilidade.

CÁLCULO DA PROBABILIDADE PARA A VARIÁVEL ALEATÓRIA X

A probabilidade de uma variável aleatória, com essa distribuição contínua, assumir um valor no intervalo de a a b, isto é, P(a < X < b), é calculado pela f.d.p f(x). Mas aqui surgi um problema:

O cálculo direto dessa probabilidade pela f.d.p exige um conhecimento de matemática mais avançado do que aquele que dispomos aqui. Mais precisamente, o conhecimento de Cálculo Diferencial e Integral, que geralmente é estudado em cursos de Ciências Exatas (Matemática, Física, Engenharias, etc). Sendo assim, a utilização da f.d.p para cálculo de probabilidade não é recomendado.

A fim de ultrapassar este inconveniente, Gauss inicialmente estudou esta função de distribuição e desenvolveu uma metodologia que reduz qualquer caso a um caso único, de qualquer que seja a função de distribuição normal, caracterizada por μ e σ. Esta estandardização da variável aleatória X transforma qualquer função de distribuição normal N (μ, σ) numa única função de distribuição normal, chamada distribuição normal padrão.

DISTRIBUIÇÃO NORMAL PADRÃO

Esta transformação de qualquer função de distribuição normal N(μ,σ) numa única função de distribuição normal é caracterizada por ter sempre

média μ = 0 e desvio padrão σ = 1,

Gauss padronizou qualquer variável aleatória X, com distribuição Normal, construindo uma nova escala de medidas para as variáveis aleatórias X através da transformação linear:

PSICOLOGIA – ESTATÍSTICA INFERENCIAL – 1/2013 Página 13

Page 14: 5 - Distribuicoes

Ou seja, Gauss conseguiu, com a fórmula acima, uma mudança de variável, transformando a v.a X na v.a Z.

Portanto, se X ~ N( ; ) então

definindo assim a função de distribuição normal reduzida ou padronizada. A letra Z representa a variável X padronizada.

Assim, a

P(a < X < b) = P( < Z < )onde

é a variável normal padronizada referente a x = a, e é a variável normal padronizada referente a x = b.

A vantagem de se trabalhar com esta curva normal padronizada está no fato de que alguns parâmetros já estão automaticamente definidos para qualquer escala de medida que se utiliza, pois a média é sempre zero e a variância é sempre 1. Além disso, existem tabelas construídas para essa curva que mostram quanto por cento da população se encontra dentro da faixa z, não havendo necessidade de serem calculadas.

A escala reduzida, escala Z ou escore Z, mede o afastamento das variáveis em relação à média em número de desvios-padrão.

USO DE TABELAS DE DISTRIBUIÇÃO NORMAL PADRÃO

Como mencionado anteriormente, as probabilidades associadas à distribuição normal padronizadas são encontradas em tabelas, não havendo necessidade de serem calculadas.

Há vários tipos de tabelas que traz as probabilidades sob a curva normal padrão. O tipo mais comum é a Tabela de Faixa Central, que fornece a probabilidade de uma variável está entre a média e qualquer outro valor, acima da média, como a Tabela I, na última página desta apostila. Consultando alguns livros você poder outras tabelas.

A Tabela I é uma tabela de distribuição normal reduzida que nos dá a probabilidade de Z tomar qualquer valor entre a média μ = 0 e um dado valor positivo Z, isto é

P(0 < Z < )

PSICOLOGIA – ESTATÍSTICA INFERENCIAL – 1/2013 Página 14

X

Z

Z ~ N(;)Z ~ N(;)

Page 15: 5 - Distribuicoes

A simetria em torno de μ = 0 permite obter a probabilidade entre quaisquer valores de Z (negativos ou positivos)

Exemplo 3 - Considere o exemplo 2, dado anteriormente, onde X é a variável aleatória que representa os QI,s de candidatos a uma vaga de emprego, com média μ = 100 e desvio padrão σ = 12.

Vamos calcular a probabilidade de um candidato escolhido ao acaso ter um QI

(A)Entre 100 e 115, isto é, P(100 < X < 115)

1º PASSO – Padronizar as variáveis aleatórias X = 100 e X = 115.

Para X = 100

Para X = 115

Logo, a P(100 < X < 115) = P(0 < Z < 1,25).

Um valor de Z = 1,25 indica que o valor X = 115 está localizado a 1,25 desvios padrão acima da média μ = 100.

2º PASSO – Verificar na Tabela I o valor da probabilidade para Z = 1,25.

Na 1ª coluna encontramos o valor 1,2. Em seguida, encontramos na 1ª linha, o valor 0,05, que corresponde ao último valor de 1,25. Na interseção da linha e coluna correspondentes encontramos o valor 0,3944.

Logo, P(0 < Z < 1,25) = 0,3944

Assim, a probabilidade de um candidato escolhido ao acaso ter QI entre 100 e115 é 0,3844 ou 39,44%, ou seja,

P(100 < X < 115) = 0,3844 ou 39,44%

(B) maior que 115, isto é, P(X > 115)

1º PASSO – Padronizar a variável aleatória X = 115.

A variável X = 115 já foi padronizada no item (a). Vale Z = 1,25.

PSICOLOGIA – ESTATÍSTICA INFERENCIAL – 1/2013 Página 15

Page 16: 5 - Distribuicoes

Logo, a P(X > 115) = P(Z > 1,25).

2º PASSO – Verificar na tabela I o valor da probabilidade para Z = 1,25.

Aqui uma observação importante na leitura da Tabela de distribuição normal padronizada. A tabela I fornece a probabilidade entre a média μ = 0 e qualquer valor Z positivo, como no item (a). Mas aqui, queremos uma probabilidade acima deste valor Z positivo, ou seja, acima de Z = 1,25, como no gráfico acima. A tabela I não fornece este valor. Mas, voltando nas principais características da distribuição normal, temos que:

A área total sob a curva vale 100% ou 1, onde 50% da área está à abaixo da média μ = 0 e 50% acima da média μ = 0.

Portanto, a probabilidade de Z ser maior que zero é 0,5, ou seja, P(Z > 0) = 0,5.

Assim, podemos subtrair a probabilidade para Z entre 0 e 1,25 (calculado no item (a)) de 0,5, e obtemos assim a probabilidade para Z maior que 1,25. Ou seja:

P(Z > 1,25) = P(Z > 0) - P(0 < Z < 1,25) P(Z > 1,25) = 0,5 – 0,3944 P(Z > 1,25) = 0,1056

Assim, a probabilidade de um candidato escolhido ao acaso ter QI acima de 115 é 0,1056 ou 10,56%.

(C)Entre 70 e 100, ou seja, P(70 < X < 100).

1º PASSO – Padronizar as variáveis aleatórias X = 70 e X = 100.

Para X = 100 Z = 0, padronizada no item (a).

Para X = 70

Logo, a P(70 < X < 100) = P(-2,5 < Z < 0). Um valor de Z = -2,5 indica que o valor X = 70 está localizado a 2,5 desvios padrão abaixo da média μ

= 100.

2º PASSO – Verificar na tabela I o valor da probabilidade para Z = -2,5.

Aqui mais uma observação importante na leitura da Tabela de distribuição normal padronizada. A tabela I fornece a probabilidade entre a média μ = 0 e qualquer valor Z positivo. Mas aqui, temos um valor de Z

PSICOLOGIA – ESTATÍSTICA INFERENCIAL – 1/2013 Página 16

Page 17: 5 - Distribuicoes

negativo. Mas, como mencionado anteriormente, a simetria em torno de μ = 0 permite obter a probabilidade entre quaisquer valores de Z negativos ou positivos. Sendo assim, por essa simetria, o valor da probabilidade para quaisquer valores de Z entre -2,5 e a média μ = 0 é a mesma entre a média μ = 0 e Z = 2,5, ou seja,

P(-2,5 < Z < 0) = P(0 < Z < 2,5)

Logo, na 1ª coluna encontramos o valor 2,5. Em seguida, encontramos na 1ª linha, o valor 0,00. Na interseção da linha e coluna correspondentes encontramos o valor 0,4938. Ou seja,

P(-2,5 < Z < 0) = 0,4938

Assim, a probabilidade de um candidato escolhido ao acaso ter QI entre 70 e 100 é 0,4938 ou 49,38%, isto é,

P(70 < X < 100) = 0,4938 ou 49,38%

(D)menor que 70, ou seja, P(X < 70)

1º PASSO – Padronizar a variável aleatória X = 70.

Padronizada no item (c). Vale Z = -2,5.

Logo, a P(X < 70) = P(Z < -2,5)2º PASSO – Verificar na tabela I o valor da probabilidade para Z = -2,5.

Aqui temos que proceder como nos itens (b) e (c), pois a Tabela I fornece a probabilidade para Z entre -2,5 e média μ = 0 (por simetria, entre μ = 0 e 2,5) e aqui queremos a probabilidade para Z menor que -2,5 (por simetria, maior que 2,5).

Assim, temos que subtrair a probabilidade para Z entre 0 e 2,5 (calculado no item (c)) e 0,5, e obtemos assim a probabilidade para Z maior que 2,5. Por simetria, obtemos para Z menor que -0,25.

P(Z < -2,5) = P(Z > 2,5) = P(Z > 0) - P(0 < Z < 2,5) P(Z < -2,5) = P(Z > 2,5) = 0,5 - 0,4938 P(Z < -2,5) = P(Z > 2,5) = 0,0062

Assim, a probabilidade de um candidato escolhido ao acaso ter QI abaixo de 70 é de 0,0062 ou 0,62%, isto é,

P(X < 70) = 0,0062 ou 0,62%

(E) Entre 70 e 115, ou seja, P(70 < X < 115)

Pelos itens anteriores, as variáveis aleatórias X = 70 e X = 115 já estão padronizadas. Assim,

P(70 < X < 115) = P(-2,5 < Z < 1,25)

PSICOLOGIA – ESTATÍSTICA INFERENCIAL – 1/2013 Página 17

Page 18: 5 - Distribuicoes

Observe que aqui estamos somando as probabilidades de duas regiões:

A região entre 70 e 100 e a região entre 100 e 115.

P(70 < X < 115) = P(70 < X < 100) + P(100 < X < 115)

Como já calculamos estas probabilidades nos itens anteriores, temos o seguinte:

P(-2,5 < Z < 1,25) = P(-2,5 < Z < 0) + P(0 < Z < 1,25) P(-2,5 < Z < 1,25) = 0,4938 + 0,3944 P(-2,5 < Z < 1,25) = 0,8882

Assim, a probabilidade de um candidato escolhido ao acaso ter QI entre70 e 115 é de 0,8882 ou 88,82%, isto é,

P(70 < X < 115) = 0,8882 ou 88,82%

(F) Entre 110 e 130, ou seja, P(110 < X < 140)

1º PASSO – Padronizar as variáveis aleatórias X = 110 e X = 140.

Para X = 110

Para X = 130

Logo, a P(110 < X < 140) = P(0,83 < Z < 3,33).

Temos:

P(0,83 < Z < 3,33) = P(0 < Z < 3,33) - P(0 < Z < 0,83)

2º PASSO – Verificar na Tabela I o valor da probabilidade para Z = 0,83 e Z = 3,33.

Para Z = 0,83 temos 0,2967. Para Z = 3,33 temos 0,4996.

Portanto, P(0,83 < Z < 3,33) = P(0 < Z < 3,33) - P(0 < Z < 0,83) P(0,83 < Z < 3,33) = 0,4996 - 0,2967 P(0,83 < Z < 3,33) = 0,2029

Assim, a probabilidade de um candidato escolhido ao acaso ter QI entre110 e 140 é de 0,2029 ou 20,29%, isto é,

PSICOLOGIA – ESTATÍSTICA INFERENCIAL – 1/2013 Página 18

Page 19: 5 - Distribuicoes

P(110 < X < 140) = 0,2029 ou 20,29%

EXERCÍCIOS

1- Sendo Z uma variável aleatória com distribuição normal padronizada, calcule as probabilidades abaixo, desenhando suas curvas.

(a) P(0 < Z < 1,44) = 0.9251 – 0,5 = 0,4251

(b) P(-0,85 < Z < 0) = 0,8023 – 0,5 = 0.3023

(c) P(-1,48 < Z < 2,05) = 0,9798 - 0,0694 = 0,9104

(d) P(0,72 < Z < 1,89) = 0.9706-0.7642 = 0.2064

(e) P(Z > -2,03) = 0,9788

(f) P(Z > 1,08) = 0,1401

(g) P(Z < -0,66) = 0,2546

(h) P(Z < 0,60) = 0,7258

Respostas(a) 0,4251 (c) 0,9104 (e) 0,9788 (g) 0,2546(b) 0,3023 (d) 0,2064 (f) 0,1401 (h) 0,7258

2- Um teste padronizado de escolaridade tem distribuição normal com média μ = 100 e desvio padrão 10. Determine a probabilidade de um indivíduo submetido ao teste ter nota:

(a) Maior que 120.

Para X = 120

Maior que 120 P(X > 120) = P(Z > 2) Logo, P(Z > 2) = 0,47725

P(Z > 2) = P(Z > 0) - P(0 < Z < 2) P(Z > 1,25) = 0,5 – 0,47725 P(Z > 1,25) = 0,0228

(b) Maior que 80.

Para X = 80

Maior que 80 P(X > 80) = P(Z > -2) P(Z > -2) = P (Z < 2) = 0,9772

(c) Entre 85 e 115.

Para X = 85

Para X = 115

P(-1,5 < Z < 1,5) = 0,8664

(d) Maior que 100.

PSICOLOGIA – ESTATÍSTICA INFERENCIAL – 1/2013 Página 19

Page 20: 5 - Distribuicoes

Para X = 100

P(Z > 0) = 0,5

Respostas(a) 0,0228 (b) 0,9772 (c) 0,8664 (d) 0,5

3- Suponha que entre pacientes o nível de colesterol tenha uma distribuição aproximadamente Normal de média 105 mg por 100 ml e um desvio padrão 9 mg por 100 ml. Qual a proporção de diabéticos que tem níveis entre 90 e 125 mg por 100 ml? Resposta: 0,9393

P (-1,67 < Z < 2,23) = P(-1,67 < Z < 0) + P(0 < Z < 2,23) = P(0 < Z < 1,67) + P(0 < Z < 2,23) = 0,4525 + 0,4868 = 0,9393

4- Uma distribuição normal tem desvio padrão igual a 5 e é tal que 43,94% dos valores estão abaixo de 35. Determine sua média. Resposta: 27,25

5- Os pesos de pessoas em determinada faixa etária são normalmente distribuídos com uma média de 72 Kg e um desvio padrão de 6 Kg. Encontre o peso X abaixo do qual se encontram 10% das pessoas mais leves (abaixo da média). Resposta: 64,32 Kg

6- Uma universidade decidiu introduzir novo sistema de classificar os resultados: Os alunos que obtiverem uma nota abaixo de 40 serão REPROVADOS, De 40 a 60 serão APROVADOS, e Acima de 60 serão classificados como APROVADOS COM LOUVOR.

Todas as notas vão de 0 a 100.Dado que se sabe que a nota média dos alunos em determinada unidade foi de 54 com desvio padrão de 8, encontre:

(a) A proporção de alunos que se pode esperar que alcance cada uma das notas possíveis.(b) A nota que se espera que 5% de alunos mais fracos obtenham.

7- As alturas dos alunos de determinada escola são normalmente distribuídas com média 1,60 m e desvio padrão de 0,30 m. Encontre a probabilidade de um aluno medir:

(a) Entre 1,50 e 1,80 m.(b) Mais de 1,75 m.(c) Menos de 1,48 m.(d) Qual deve ser a altura mínima para escolhermos 10% dos mais altos (acima da média) ?

Respostas(a) 0,3779 (b) 0,3085 (c) 0,3446 (g) 1,98 m

8- Numa fábrica foram instaladas 1000 lâmpadas novas. Sabe-se que a duração média das lâmpadas é de 800 horas e desvio padrão de 100 horas, com distribuição normal. Determinar a quantidade de lâmpadas que durarão: (a) Menos de 500 horas. (b) Mais de 700 horas. (c) Entre 516 e 814 horas.

Respostas: (a) 1,4 (b) 841,3 (c) 120,8

PSICOLOGIA – ESTATÍSTICA INFERENCIAL – 1/2013 Página 20

Page 21: 5 - Distribuicoes

9- Seja um teste de inteligência aplicado a um grupo de 1000 alunos de uma escola superior. Obteve-se uma distribuição normal, com média de 32 e desvio padrão de 4. Pergunta-se.

(a) Qual o número de alunos com notas superiores a 38? (b) Qual o número de alunos com notas inferiores a 35? (c) Qual o número de alunos com notas compreendidas entre 27 e 31?

Respostas: (a) 67 (b) 773 (c) 296

10 - A renda anual média de uma grande comunidade pode ser aproximada por uma distribuição normal com média de R$ 7.000,00 e desvio padrão de R$ 3.000,00. (a) Que porcentagem da população terá renda superior a R$ 13.000,00? (b) Abaixo de qual renda temos 15% da população?

Respostas: (a) 2,28 % (b) R$ 3880

11- Os resultados de um concurso de habilitação tiveram distribuição normal com média 50 e desvio padrão 10. Os candidatos serão classificados conforme o seguinte critério decrescente:

A - 10 % das notas B - 15 % das notas C - 50 % das notas D - 15 % das notas E - 10 % das notas.

Determine as notas limites para a classificação dos candidatos.

Resposta: A - acima de 62,8 B - entre 56,7 e 62,8 C - entre 43,3 e 56,7 D - entre 37,2 e 43,3 F - abaixo de 37,2

12- Suponhamos que o nível educacional de adultos de certo pais apresenta distribuição normal com média de 11 anos e desvio padrão de 2 anos. Determine:

(a) a probabilidade de que um adulto, escolhido aleatoriamente, tenha entre 9 e 14 anos de tempo de estudo.(b) a probabilidade de que um adulto tenha mais de 18 anos de estudo.(c) o numero de adultos que se espera que tenham menos de 7 anos, considerando uma amostra de 500 adultos.Resposta (a) 0,7745; (b) 0; (c) 11,40.

13- O tempo que os alunos gastam para fazer uma prova é normalmente distribuído com média de 72 minutos e desvio-padrão de 5 minutos. Determine a probabilidade de um aluno gastar:

(a) mais de 84 minutos;(b) mais de 48 minutos;(c) entre 70 e 84 minutos;(d) entre 60 e 70 minutos..Resposta (a) 0,0082; (b) 1; (c) 0,6472; (d) 0,3364.

14- O salário dos funcionários de uma empresa é normalmente distribuído com média de 500 reais e desvio-padrão de 10 reais. Determine a percentagem de funcionários cujo salário situa-se:

(a) acima de 510 reais;(b) abaixo de 495 reais;(c) entre 480 e 520 reais;(d) abaixo de 525,8 reais;(e) exatamente em 520 reais.

PSICOLOGIA – ESTATÍSTICA INFERENCIAL – 1/2013 Página 21

Page 22: 5 - Distribuicoes

Resposta (a) 15,87%; (b) 30,85%; (c) 95,44%; (d)99,51%; (e) 0.

15- Para as famílias de certo status sócio-econômico, a despesa com alimentação é normalmente distribuída com média de 1400 unidades monetárias, com desvio-padrão de 180 unidades monetárias. Considerando um total de 16000 famílias desta classe social, determine o numero de famílias em que o gasto com alimentação seja:

(a) maior que 1600 unidades monetárias;(b) menor que 1700 unidades monetárias.

Resposta (a) 2136; (b) 15240.

16- 0 conteúdo liquido das garrafas de 300 ml de um refrigerante é normalmente distribuído com média de 300 ml e desvio-padrão de 2 ml.

(a) Determine o percentual de garrafas cujo conteúdo seja inferior a 302 ml.(b) Entre 200 garrafas, quantas deverão ter menos de300 ml?Resposta (a) 99,86%; (b) 100.

17- O peso de 600 estudantes é normalmente distribuído com média de 65,3 kg e desvio padrão de 5,5 kg. Determine o numero de estudantes que pesam:

(a) entre 60 e 70 kg;(b) mais de 63,2 kg;(c) menos de 68 kg.

Resposta (a) 380; (b) 389; (c) 413.

Tabela I – Distribuição Normal Padrão - Área sob a curva normal de 0 a P(0 < Z < )

Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09

0,00,1

0,00000 0,00399 0,00798 0,01197 0,01595 0,01994 0,02392 0,02790 0,03188 0,03586 0,03983 0,04380 0,04776 0,05172 0,05567 0,05962 0,06356 0,06749 0,07142 0,07535

PSICOLOGIA – ESTATÍSTICA INFERENCIAL – 1/2013 Página 22

Page 23: 5 - Distribuicoes

0,20,30,40,50,60,70,80,91,01,11,21,31,41,51,61,71,81,92,02,12,22,32,42,52,62,72,82,93,03,13,23,33,43,53,63,73,83,94,0

0,07926 0,08317 0,08706 0,09095 0,09483 0,09871 0,10257 0,10642 0,11026 0,11409 0,11791 0,12172 0,12552 0,12930 0,13307 0,13683 0,14058 0,14431 0,14803 0,15173 0,15542 0,15910 0,16276 0,16640 0,17003 0,17364 0,17724 0,18082 0,18439 0,18793 0,19146 0,19497 0,19847 0,20194 0,20540 0,20884 0,21226 0,21566 0,21904 0,22240 0,22575 0,22907 0,23237 0,23565 0,23891 0,24215 0,24537 0,24857 0,25175 0,25490 0,25804 0,26115 0,26424 0,26730 0,27035 0,27337 0,27637 0,27935 0,28230 0,28524 0,28814 0,29103 0,29389 0,29673 0,29955 0,30234 0,30511 0,30785 0,31057 0,31327 0,31594 0,31859 0,32121 0,32381 0,32639 0,32894 0,33147 0,33398 0,33646 0,33891 0,34134 0,34375 0,34614 0,34849 0,35083 0,35314 0,35543 0,35769 0,35993 0,36214 0,36433 0,36650 0,36864 0,37076 0,37286 0,37493 0,37698 0,37900 0,38100 0,38298 0,38493 0,38686 0,38877 0,39065 0,39251 0,39435 0,39617 0,39796 0,39973 0,40147 0,40320 0,40490 0,40658 0,40824 0,40988 0,41149 0,41308 0,41466 0,41621 0,41774 0,41924 0,42073 0,42220 0,42364 0,42507 0,42647 0,42785 0,42922 0,43056 0,43189 0,43319 0,43448 0,43574 0,43699 0,43822 0,43943 0,44062 0,44179 0,44295 0,44408 0,44520 0,44630 0,44738 0,44845 0,44950 0,45053 0,45154 0,45254 0,45352 0,45449 0,45543 0,45637 0,45728 0,45818 0,45907 0,45994 0,46080 0,46164 0,46246 0,46327 0,46407 0,46485 0,46562 0,46638 0,46712 0,46784 0,46856 0,46926 0,46995 0,47062 0,47128 0,47193 0,47257 0,47320 0,47381 0,47441 0,47500 0,47558 0,47615 0,47670 0,47725 0,47778 0,47831 0,47882 0,47932 0,47982 0,48030 0,48077 0,48124 0,48169 0,48214 0,48257 0,48300 0,48341 0,48382 0,48422 0,48461 0,48500 0,48537 0,48574 0,48610 0,48645 0,48679 0,48713 0,48745 0,48778 0,48809 0,48840 0,48870 0,48899 0,48928 0,48956 0,48983 0,49010 0,49036 0,49061 0,49086 0,49111 0,49134 0,49158 0,49180 0,49202 0,49224 0,49245 0,49266 0,49286 0,49305 0,49324 0,49343 0,49361 0,49379 0,49396 0,49413 0,49430 0,49446 0,49461 0,49477 0,49492 0,49506 0,49520 0,49534 0,49547 0,49560 0,49573 0,49585 0,49598 0,49609 0,49621 0,49632 0,49643 0,49653 0,49664 0,49674 0,49683 0,49693 0,49702 0,49711 0,49720 0,49728 0,49736 0,49744 0,49752 0,49760 0,49767 0,49774 0,49781 0,49788 0,49795 0,49801 0,49807 0,49813 0,49819 0,49825 0,49831 0,49836 0,49841 0,49846 0,49851 0,49856 0,49861 0,49865 0,49869 0,49874 0,49878 0,49882 0,49886 0,49889 0,49893 0,49896 0,49900 0,49903 0,49906 0,49910 0,49913 0,49916 0,49918 0,49921 0,49924 0,49926 0,49929 0,49931 0,49934 0,49936 0,49938 0,49940 0,49942 0,49944 0,49946 0,49948 0,49950 0,49952 0,49953 0,49955 0,49957 0,49958 0,49960 0,49961 0,49962 0,49964 0,49965 0,49966 0,49968 0,49969 0,49970 0,49971 0,49972 0,49973 0,49974 0,49975 0,49976 0,49977 0,49978 0,49978 0,49979 0,49980 0,49981 0,49981 0,49982 0,49983 0,49983 0,49984 0,49985 0,49985 0,49986 0,49986 0,49987 0,49987 0,49988 0,49988 0,49989 0,49989 0,49990 0,49990 0,49990 0,49991 0,49991 0,49992 0,49992 0,49992 0,49992 0,49993 0,49993 0,49993 0,49994 0,49994 0,49994 0,49994 0,49995 0,49995 0,49995 0,49995 0,49995 0,49996 0,49996 0,49996 0,49996 0,49996 0,49996 0,49997 0,49997 0,49997 0,49997 0,49997 0,49997 0,49997 0,49997 0,49998 0,49998 0,49998 0,49998

PSICOLOGIA – ESTATÍSTICA INFERENCIAL – 1/2013 Página 23