apost estatÍstica basica puc

103
PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo 1 REVISÃO DE ESTATÍSTICA ESTATÍSTICA: significa uma coleção de dados numéricos ou ainda o ramo da matemática que analisa dados estatísticos. AMOSTRA: grupo de elementos extraídos da população, utilizados para estimar propriedades da mesma. POPULAÇÃO: conjunto de todos os elementos de que necessitamos para análise. O termo população se refere a todos os indivíduos ou a todos os objetos do grupo que estamos interessados em estudar. Exemplo: População: 25 sabores de sorvete de uma confeitaria Amostra: 5 sabores testados para saber se a confeitaria vende sorvetes de boa qualidade. Porque estudar amostras em vez de populações? Resposta: O custo excessivo ou a dificuldade de se estudar toda a população nos impede de estudá-la como um todo, porisso utilizados uma amostra que seja a mais representativa possível da população. Quanto maior o número de elementos da amostra e sendo a coleta a mais aleatória possível mais nos aproximamos de uma medida aceitável. Como podemos dizer se uma determinada amostra representa adequadamente a população? Não há maneira de saber com certeza se a amostra representa adequadamente uma população sem fazer um censo sobre toda a população. Podemos, no entanto utilizar os métodos de Inferência Estatística para estimar se a amostra é representativa da população. IMPORTANTE: A Inferência Estatística (objetivo do nosso estudo) consiste em estimar propriedades de uma grande população a partir de observações feitas em uma amostra extraída da mesma população. É necessário saber como usar a Inferência Estatística para conhecer a natureza de um Processo Desconhecido. Para se entender a Inferência Estatística é necessário entender vários conceitos de PROBABILIDADES. Na Probabilidade, sabemos como um processo funciona e queremos predizer quais serão os resultados de tal processo. Na Estatística, não sabemos como um processo funciona, mas podemos observar os seus resultados.

Upload: viperng

Post on 11-Jun-2015

1.458 views

Category:

Documents


1 download

DESCRIPTION

basic statistics portuguese

TRANSCRIPT

Page 1: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

1

REVISÃO DE ESTATÍSTICA ESTATÍSTICA: significa uma coleção de dados numéricos ou ainda o ramo da matemática que analisa dados estatísticos. AMOSTRA: grupo de elementos extraídos da população, utilizados para estimar propriedades da mesma. POPULAÇÃO: conjunto de todos os elementos de que necessitamos para análise. O termo população se refere a todos os indivíduos ou a todos os objetos do grupo que estamos interessados em estudar. Exemplo: População: 25 sabores de sorvete de uma confeitaria Amostra: 5 sabores testados para saber se a confeitaria vende sorvetes de boa qualidade. Porque estudar amostras em vez de populações? Resposta: O custo excessivo ou a dificuldade de se estudar toda a população nos impede de estudá-la como um todo, porisso utilizados uma amostra que seja a mais representativa possível da população. Quanto maior o número de elementos da amostra e sendo a coleta a mais aleatória possível mais nos aproximamos de uma medida aceitável. Como podemos dizer se uma determinada amostra representa adequadamente a população? Não há maneira de saber com certeza se a amostra representa adequadamente uma população sem fazer um censo sobre toda a população. Podemos, no entanto utilizar os métodos de Inferência Estatística para estimar se a amostra é representativa da população.

IMPORTANTE: A Inferência Estatística (objetivo do nosso estudo) consiste em estimar propriedades de uma grande população a partir de observações feitas em uma amostra extraída da mesma população. É necessário saber como usar a Inferência Estatística para conhecer a natureza de um Processo Desconhecido. Para se entender a Inferência Estatística é necessário entender vários conceitos de PROBABILIDADES.

Na Probabilidade, sabemos como um processo funciona e queremos predizer quais serão os resultados de tal processo. Na Estatística, não sabemos como um processo funciona, mas podemos observar os seus resultados.

Page 2: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

2

Considere que você está participando de um experimento em que os elementos são divididos em dois grupos: um grupo experimental e um grupo de controle. Então: Porque devem os grupos ser tão semelhantes quanto possível? Se os dois grupos forem muito diferentes o experimentador observa resultados experimentais diferentes. As pessoas devem saber em que grupo estão? Se as pessoas souberem em que grupo estão, poderão ter reações diferentes, prejudicando a observação do experimentador. Qual o melhor sistema de repartir os indivíduos pelos dois grupos? Da maneira a mais aleatória possível.

Page 3: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

3

DIAGRAMAS DE FREQUÊNCIAS E HISTOGRAMA

Exercício1: Numa Mesa de Operações trabalham 5 operadores em bolsa de valores. Desejamos saber o volume de operações fechadas por um determinado operador. Para isso escolhemos uma amostra de 30 dias de operações fechadas nos últimos 6 meses. Considerando essa amostra significativa, observe os dados e responda os ítens abaixo: Amostra

22 23 21 25 23 26 24 24 25 28 24 24 25 25 25 24 25 23 27 24 23 27 26 25 26 22 22 25 25 24

Conclusões: número mínimo de operações fechadas = número máximo de operações fechadas = intervalo das operações fechadas =

1. DISTRIBUIÇÕES DE FREQUÊNCIAS ABSOLUTAS.

Número de Oper FrequênciasFechadas por dia Absolutas

Conclusões: • Frequência do número máximo de operações fechadas= • Frequência do número mínimo de operações fechadas=

Page 4: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

4

Oper Fechadas Freq. Abs.

21 1 22 3 23 4 24 7 25 9 26 3 27 2 28 1

2. DISTRIBUIÇÕES DE FREQUÊNCIAS RELATIVAS.

Número de Oper Frequências FrequênciasFechadas por dia Absolutas Relativas

TOTAL Da amostra de 30 dias acima, concluímos: • O operador fechou 22 operações em ..............% dos 30 dias. • O operador fechou 23 operações em ................% dos 30 dias. • Durante ................% dos 30 dias, o operador fechou 28

operações.

Oper Fechadas Freq. Abs. Freq. Relativas

Page 5: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

5

21 1 3,33% 22 3 10,00% 23 4 13,33% 24 7 23,33% 25 9 30,00% 26 3 10,00% 27 2 6,67% 28 1 3,33%

TOTAL 30 100,00%

3. DISTRIBUIÇÕES DE FREQUÊNCIAS ACUMULADAS.

Número de Oper Frequência AcumuladaFechadas por dia Absoluta Relativa

TOTAL Da amostra de 30 dias acima, concluímos: • Em .....................% dos dias amostrados, o operador fechou 25

ou mais operações. • Em .....................% dos dias amostrados, o operador fechou 23

ou menos operações. • Em ........................% dos dias amostrados, o operador fechou

entre 22 e 25 operações.

Page 6: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

6

Frequência Acumulada Frequência Acumulada Oper Fechadas Absoluta Relativa

21 1 3,33% 22 4 13,33% 23 8 26,67% 24 15 50,00% 25 24 80,00% 26 27 90,00% 27 29 96,67% 28 30 100,00%

TOTAL

4. DISTRIBUIÇÕES DE FREQUÊNCIAS COM DADOS CONTÍNUOS.

Exercício 2: Considere a tabela abaixo, que mostra as vendas diárias de uma determinada loja.

DIA VENDAS DIÁRIAS DIA VENDAS DIÁRIAS1 R$ 22 000,00 15 R$ 32 000,002 R$ 20 000,00 16 R$ 36 000,003 R$ 18 000,00 17 R$ 34 000,004 R$ 16 000,00 18 R$ 36 000,005 R$ 18 000,00 19 R$ 33 000,006 R$ 25 000,00 20 R$ 32 000,007 R$ 28 000,00 21 R$ 33 000,008 R$ 26 000,00 22 R$ 36 000,009 R$ 16 000,00 23 R$ 35 000,0010 R$ 25 000,00 24 R$ 33 000,0011 R$ 27 000,00 25 R$ 32 000,0012 R$ 29 000,0013 R$ 32 000,0014 R$ 30 000,00

Como definir o número de classes? Calcule a raíz quadrada do número de observações, então, divida a tabela acima em 5 classes.

Page 7: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

7

Classe Frequência Frequência Absoluta Relativa

Total

PERCENTIL n é o número total de observações da série x é a ordem de uma determinada observação p é o percentil em porcentos dessa observação. 100% p 0% 1 x n

100% - 0% p - 0 = n - 1 x - 1 x - 1 p = x 100 % n – 1

Page 8: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

8

Exercício 3: Considere as 11 observações da tabela. Ordene-as de forma crescente e calcule o percentil de todas as observações. Calcule a posição dos percentís 30% e 80%. 52 48 49 47 44 42 46 38 33 25 29 Solução: Série 25 29 33 38 42 44 46 47 48 49 52 Ordem 1 2 3 4 5 6 7 8 9 10 11 Série 25 29 33 38 42 44 46 47 48 49 52 Percentil 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% Quando dividimos as observações ordenadas da série em quatro quartos correspondente a 25% percentís cada um obtemos os Quartís.

Page 9: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

9

Exercício 4: Considere a tabela de rentabilidades mensais do Mercado Financeiro, durante o mês X. APLICAÇÃO RENTABILIDADE % A M Ouro.....................................0,12%

Inflação.................................0,56% Dólar Paralelo.......................0,65% FIF Curto Prazo....................1,25% Caderneta Poupança............1,38%

CDB (aplic < $5 mil)..............1,78% FIF 30 dias............................1,82%

FIF 60 dias............................1,94% CDB (aplic>$100 mil)............2,08% Bolsa RJ................................3,56% Bolsa SP................................3,87% a) Estabelecer a ordem e o percentil de cada uma das observações . b) Calcule o percentil para a rentabilidade de 1,58%.

Ordem 1 2 3 4 5 6 7 8 9 10 11 Série Percentil 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%

Page 10: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

10

MEDIDAS DE POSIÇÃO

MEDIANA É chamada de Medida de Tendência Central. É o ponto ou elemento a meio caminho dos dados, ou seja, a metade dos números está acima dela e a outra metade está abaixo. No exemplo abaixo, calcular a Mediana. 52 48 49 47 44 42 46 38 33 25 29 Solução: (11+1)/2= 6 (sexto elemento que é 42). Obs: Quando o número da série for par, somamos os dois termos centrais equidistantes dos extremos e dividimos por 2. MODA

A moda é o valor que ocorre com maior frequência. Então, a mudança de valor de um elemento da série em geral, não afeta a moda.

MÉDIA

• Média da População é a soma de todos os elementos da série, dividida pelo número de elementos.

N

µx = Σ x i / N i=1 ou ainda,

N

µx = 1 / N Σ x i i=1

Page 11: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

11

• Média da Amostra é a soma de todos os elementos da amostra dividida pelo número de elementos da mesma.

n

x = 1 / n Σ x i i=1

Exemplo: Calcular a Média da população abaixo: 52 48 49 47 44 42 46 38 33 25 29

Exercício 5: Numa Mesa de Operações trabalham 5 operadores em bolsa de valores. Desejamos saber o volume de operações fechadas por um determinado operador. Para isso escolhemos uma amostra de 30 dias de operações fechadas nos últimos 6 meses. Considerando essa amostra significativa, observe os dados e responda os ítens abaixo: Amostra

22 23 21 25 23 26 24 24 25 28 24 24 25 25 25 24 25 23 27 24 23 27 26 25 26 22 22 25 25 24

Calcule a Média de Operações fechadas por esse operador.

Page 12: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

12

NÚM OPER FREQ FECH POR DIA ABSOLUTA

O objetivo é analisar como os dados da Amostra se dispersam em relação à média. Essas dispersões são chamadas de DESVIO PADRÃO.

MÉDIA PONDERADA

O valor da Média Ponderada é dada pela expressão: N

Σ p i . x i i=1

µx = ONDE, N

Σ p i i=1

onde x i, representa o valor do dado repetido, e p j representa o peso ou a frequência.

Page 13: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

13

Exercício 6: O capital de uma empresa é formado por três acionistas, de acordo com a tabela abaixo.

Capital Participação %Acionista A 750.000,00R$ 25%Acionista B 1.800.000,00R$ 60%Acionista C 450.000,00R$ 15%

Calcule a Média Ponderada em relação ao capital:

Page 14: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

14

Exercício 7: Considere a tabela de lucro para as empresas abaixo. Calcule a Média, a Moda e a Mediana. EMPRESA LUCRO EM MILHÕES Empresa A R$ 820 Empresa B R$ 570 Empresa C R$ 450 Empresa D R$ 380 Empresa E R$ 330 Empresa F R$ 320 Empresa G R$ 260 Empresa H R$ 210 Empresa I R$ 180 Empresa J R$ 155 Empresa K R$ 205 Empresa L R$ 190 Empresa M R$ 170 Empresa N R$ 155 Empresa O R$ 175 Empresa P R$ 195 Empresa Q R$ 145 Empresa R R$ 125 Empresa S R$ 178 Empresa T R$ 148

Page 15: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

15

Page 16: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

16

PROPRIEDADES DA MÉDIA

Exercício 8: Considere a amostra abaixo. a) Calcule a média µ. b) Calcule os desvios em relação à média, de acordo com a tabela. c) Calcule a soma dos quadrados dos desvios em relação à média. d) Calcule a soma dos quadrados dos desvios para os valores

diferentes da média.

Amostra Desvio ( x - µ)

Desvio ( x -µ)2

Desvio ( x - 18)2

Desvio ( x -22)2

8 10

12 20

50 SOMA

Responda: a) O valor da média da tabela acima é: b) A soma dos desvios em relação à média é: c) O que você pode concluir a respeito da soma dos quadrados dos

desvios para valores diferentes da média?

Page 17: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

17

VARIÂNCIA Utilizaremos o termo dispersão para indicar o grau de afastamento de um conjunto de números em relação à sua média. Uma forma de medir a dispersão consiste em tomar a diferença entre o maior e o menor valor. Essa grandeza é chamada de AMPLITUDE. O desvio médio absoluto ( DMA ) é uma boa medida de dispersão porque dá a distância média de cada número em relação à média. N

Σ xi - µ i = 1 DMA =

N onde xi é um elemento da amostra e µ a média dos elementos da amostra.

Page 18: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

18

Exercício 9: Dada a amostra abaixo, calcule o DMA.

52 48 49 47 44 42 46 38 33 25 29 x x - µ x - µ 52 48 49 47 44 42 46 38 33 25 29

SOMA

µ = DMA = Note que o DMA não contribui no sentido de uma análise mais precisa em relação a dispersão dos dados em torno da média. Logo, é mais conveniente elevar ao quadrado cada desvio e tomar a média de todos esses quadrados. Essa grandeza é chamada de VARIÂNCIA.

• Variância Para Populações

Page 19: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

19

n

Σ (xi - µ)2 i = 1

Var (x)= σ2x =

n • Variância Para Amostras

n

Σ (xi –x )2 i = 1

Var (x)= S2x =

n - 1 Logo, a VARIÂNCIA é a média dos quadrados dos DESVIOS. No cálculo da VARIÂNCIA DA AMOSTRA dividimos por ( n – 1 ) para que Valor Esperado de S2 represente o melhor estimador de σ2. É difícil interpretar o valor numérico da Variância.

Exercício 10:

Page 20: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

20

Dada a tabela abaixo, calcule a Variância para a Amostra e População.

52 48 49 47 44 42 46 38 33 25 29 x x - µ (x - µ)2

52 48 49 47 44 42 46 38 33 25 29

SOMA

Var (x)= σ2x =

Var (x)= S2x =

Page 21: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

21

Exercício 11: Um determinado observador coletou os seguintes valores de vendas de pizzas de calabresa durante um período de 9 dias:

X 40 56 38 38 63 59 52 49 46 a) Calcule a média de vendas b) Calcule a mediana para esses números c) Calcule a distância média d) Calcule o desvio médio absoluto e) Calcule a Variância

X X - µ X - µ ( X - µ )2 40 56 38 38 63 59 52 49 46

SOMA

Mediana = µ = DMA =

Page 22: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

22

Var (x)= σ2

x =

Var (x)= S2x =

Page 23: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

23

DESVIO PADRÃO A variância é medida em uma unidade que é o quadrado da unidade de medida dos elementos da amostra. Em geral, é mais conveniente calcular a raíz quadrada positiva da Variância que representa uma medida mais precisa para a dispersão dos dados. Essa raíz quadrada positiva da Variância chamamos de DESVIO PADRÃO.

PARA POPULAÇÕES:

DP ( X) = σx = √ σ 2x

σx = √ Σni =1 (xi - µ)2

n

PARA AMOSTRAS:

DP ( X) = S x = √ S 2x

Sx = √ Σni =1 (xi –x )2

n - 1 O Desvio Padrão é uma medida que serve para avaliarmos a Dispersão dos Dados da Amostra (representativa da População).

Page 24: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

24

Exercício 12: Um determinado observador coletou os seguintes valores de vendas de pizzas de calabresa durante um período de 9 dias:

X 40 56 38 38 63 59 52 49 46 Calcule o Desvio Padrão para Amostra

X X - µ ( X - µ )2 40 56 38 38 63 59 52 49 46

SOMA

Sx=

Page 25: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

25

Suponhamos que queiramos saber a respeito da venda de pizzas calabresas para todo um ano. Como temos as vendas para apenas 9 dias, escolhidos aleatoriamente, admitimos que a média da amostra esteja próxima do valor da média populacional, assim como o Desvio Padrão da Amostra esteja próximo do Desvio Padrão Populacional. É importante salientar que: a) Para qualquer lista de dados é sempre verdade que pelo menos

75% dos números estarão a dois desvios padrões da média. (vide exemplo da Venda de Pizzas de Calabresas, onde, com uma média de 49 e um desvio padrão de 8,731 temos que dois desvios padrão abaixo da média correspondem a 49 – 2 x 8,731 = 31,538 e dois desvios padrão acima da média correspondem a 49 + 2 x 8,731 = 66,462. Logo, ao menos 75% da venda diária de pizzas tipo calabresa devem estar entre 32,538 e 66,462. O que se nota é que 100% dos valores da amostra estão dentro desse intervalo.

b) Se duas séries tem a mesma média e desvios padrões diferentes, então a série de números com desvio padrão maior tem uma distribuição de frequência mais aberta que a série com desvio padrão menor.

c) O Desvio Padrão, por ser uma medida absoluta, considera que os elementos da série se distribuem homogeneamente ao redor do Valor da Média, ou seja, o que importa é analisar como os valores se distribuem em torno da média.

d) Em aplicações no Mercado Financeiro o que importa é estabelecer um Valor Médio de Rentabilidade. Os desvios entre o Valor Médio e os possíveis valores das rentabilidades que constituem esse valor médio estabelecem o Risco da Aplicação. O Risco da Aplicação é medido pelo Desvio Padrão dos desvios das rentabilidades. O investidor deve ter cautela com os Desvios Negativos (abaixo da média). Os Desvios Positivos correspondem aos valores maiores que a Média, constituindo porisso um Retorno superior às expectativas de Rentabilidade.

Page 26: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

26

Se queremos saber se a dispersão dos elementos da Amostra é muito grande em relação à Média, calculamos uma estatística conhecida como COEFICIENTE DE VARIAÇÃO, que dá como resultado o número de desvios padrões por unidade da Média (normalmente medido de forma porcentual). COEFICIENTE DE VARIAÇÃO POPULACIONAL:

DESVIO PADRÃO σ

CV= = MÉDIA

POP µ

COEFICIENTE DE VARIAÇÃO AMOSTRAL:

DESVIO PADRÃO s

CV= = MÉDIA AMOSTRA X Para o exercício anterior, o Coeficiente de Variação, é dado por 8,731/49 = 0,178 ou 17,8%.

Page 27: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

27

Exercício 13: Considere duas carteiras de Aplicações no Mercado Financeiro, por um prazo de 6 meses. a) Calcule a rentabilidade média de cada carteira. b) Calcule o Desvio Padrão Populacional. c) Calcule o Desvio Padrão Amostral. d) Calcule o Coeficiente de Variação para a População. e) Calcule o Coeficiente de Variação para a Amostra. f) Calcule qual das duas carteiras tem maior

dispersão, aplicando o Coeficiente de Variação.

A B5% 6%9% 7%15% 9%12% 7%9% 6%6% 8%

SOLUÇÃO

µA = =

µB = =

Page 28: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

28

XA XA- µ (XA- µ)2 XB XB - µ (XB - µ)2

5% 6% 9% 7% 15% 9% 12% 7% 9% 6% 6% 8%

SOMA SOMA DESVIO PADRÃO POPULACIONAL

σA =

σB =

Page 29: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

29

DESVIO PADRÃO AMOSTRAL

SA=

SB= COEFICIENTE DE VARIAÇÃO POPULACIONAL

COEFICIENTE DE VARIAÇÃO AMOSTRAL RESPOSTA:

Page 30: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

30

A B µ 9,33% 7,17%

σ 3,40% 1,07%

s 3,72% 1,17% C V popul 0,36 0,15 C V amos 0,40 0,16

A carteira A tem maior Risco que a carteira B. Risco de A ou Desvio de A = 40% Risco de B ou Desvio de B = 16%

Page 31: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

31

Exercício 14: As rentabilidades anuais durante os últimos 5 anos das ações X e Y estão expressas na tabela abaixo. Qual das duas ações tem maior dispersão? Calcule os Coeficientes de Variação de X e Y.

X Y12% 12%15% 16%12% 15%11% 9%14% 13%

Page 32: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

32

Page 33: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

33

Exercício 15: Considere a tabela abaixo, como uma amostra representativa das taxa de juros de financiamentos cobradas por duas grandes lojas durante os últimos 6 meses. Calcule a Média, a Variância, o Desvio Padrão das taxas de juros, e o Coeficiente de Variação para ambas as lojas, e verifique a loja que apresenta financiamentos mais caros.

Tx Jr A 6 % 6,85% 7,20% 7,50% 8,60% 8,80% Tx Jr B 5,40% 5,90% 6,95% 7,40% 8,60% 9,20%

Page 34: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

34

Page 35: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

35

EXERCÍCIOS DE REVISÃO - LISTA 1 1. Considere a amostra abaixo:

62 58 59 57 54 52 56 48 43 35 39 a) Calcule a média da amostra. b) Calcule a variância da amostra c) Calcule o Desvio Padrão da Amostra d) Calcule o Coeficiente de Variação Amostra 2. Considere duas carteiras de Aplicações no Mercado Financeiro por um

prazo de 6 meses:

X Y5,20% 6,50%8,60% 7,20%

12,50% 9,60%14% 8,90%

9,80% 7,60%6,50% 9,50%

a) Calcule a média da carteira. b) Calcule o Desvio Padrão para cada carteira. c) Calcule o Coeficiente de Variação para cada carteira. d) Qual das duas carteiras tem maior dispersão? 3. Considere a tabela abaixo, como uma amostra representativa das taxa de juros de financiamentos cobradas por duas grandes lojas durante os últimos 6 meses. Calcule a Média, a Variância, o Desvio Padrão das taxas de juros, e o Coeficiente de Variação para ambas as lojas, e verifique a loja que apresenta financiamentos mais caros.

Tx Jr A 5,60% 6,45% 7,50% 7,80% 8,20% 8,40% Tx Jr B 5,30% 5,60% 6,70% 7,20% 8,40% 9,40%

Page 36: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

36

PROBABILIDADE

Definimos Probabilidade como sendo o estudo dos fenômenos aleatórios, ou ainda “uma estimativa do que um indivíduo pensa que seja a viabilidade de ocorrência de um evento” – sendo que dois indivíduos podem estimar diferentemente uma probabilidade. Costuma-se ainda interpretar a Probabilidade como “Frequência Relativa”, embora essa definição também esteja sujeita a crítica. Porisso, o termo Probabilidade, na abordagem matemática permanece sem definição. Iniciaremos o estudo da Probabilidade analisando o ato de jogar uma moeda. Quando lançamos uma moeda o resultado será cara (K) ou coroa (C). Embora a jogada de uma moeda constitua um bom exemplo de um evento aleatório, não dispomos de uma maneira precisa para predizermos o resultado de nossa jogada, quando jogamos uma vez. No entanto, se efetuarmos diversas jogadas já podemos predizer alguns resultados. Se jogarmos uma moeda duas vezes, teremos quatro possibilidades de resultado.

KK, KC, CK, CC Note que a nossa melhor aposta é a de que aparecerá uma cara (K) nas duas jogadas, mas temos ainda 50% de chance de errar. O que verificamos é que temos muito mais chance de acertar – quando predizemos uma cara pelo menos – do que se apostássemos em zero cara ou em duas caras. De um modo geral, jogando uma moeda “n” vezes ( sendo “n” um número grande) é de se esperar que o número de “caras” (K) esteja próximo de “n/2” e que seria extremamente improvável obtermos “n” caras (K) em sequência.

Page 37: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

37

Consideremos a jogada de uma moeda três vezes. Há oito resultados possíveis:

KKK, KKC, KCK, KCC,

CKK, CKC, CCK, CCC No estudo da Probabilidade devemos adotar alguns passos: Primeiro Passo: contar quantos resultados possíveis há. Segundo Passo: quantos desses resultados nos levam ao evento que nos interessa. Terceiro Passo: Calcular a Probabilidade de ocorrência desse evento. A PROBABILIDADE DE OCORRÊNCIA DE UM EVENTO É IGUAL AO NÚMERO DE MANEIRAS DE OCORRÊNCIA DO EVENTO DIVIDIDO PELO NÚMERO TOTAL DE RESULTADOS POSSÍVEIS. Vejamos no caso do lançamento de uma moeda três vezes.

Evento de Interesse

Resultados Número de Resultados

Probabilidadedo evento

0 cara CCC 1 1/8 1 cara KCC,CKC,CCK 3 3/8 2 caras KKC,KCK,CKK 3 3/8 3 caras KKK 1 1/8 JOGANDO-SE UMA MOEDA “n” VEZES TEREMOS “2 n” RESULTADOS POSSÍVEIS. No exemplo acima temos 2 3 = 8. O que observamos se jogarmos uma moeda 4 vezes, 5 vezes, e assim por diante – sendo essa moeda equilibrada - é que a probabilidade de se obter “h” caras é dada pela Combinação de “n” jogadas com “h” possibilidades, dividido pelo total de resultados possíveis (2n).

Page 38: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

38

Assim, escrevemos a fórmula: n ! h ! (n – h) ! 2 n Vejamos o número de combinações e as probabilidades para o exemplo anterior.

Evento de Interesse

Número de Combinações com “h” Caras

Probabilidadedo evento

0 cara 3 ! = 1 CCC 0! 3!

1/8 = 0,125

1 cara 3 ! = 3 KCC, CKC,CCK 1! 2!

3/8 = 0,375

2 caras 3 ! = 3 KKC,KCK,CKK 2! 1!

3/8 = 0,375

3 caras 3 ! = 1 KKK 3! 0!

1/8 = 0,125

Page 39: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

39

TESTES DE HIPÓTESES

Nos exemplos acima, admitimos que a moeda seja equilibrada, ou seja, que em qualquer jogada havia uma chance de 50% de obter cara e 50% de obter coroa. Como podemos ter certeza de que a moeda é equilibrada? Se “p” representa a probabilidade de a moeda apresentar “cara” como sabemos que p = ½ ? Se a moeda apresentar duas caras, então “p = 1” Se a moeda apresentar duas coroas então “p = 0” Jogando a moeda apenas uma vez, não temos condições de afirmar se ela é ou não equilibrada. Porisso estudamos os Testes de Hipóteses. A hipótese que vai ser testada é chamada de HIPÓTESE NULA. A outra única possibilidade é que a Hipótese Nula seja falsa, daí temos a HIPÓTESE ALTERNATIVA. No nosso exemplo acima a Hipótese Alternativa é de que a moeda Não seja Equilibrada ( p ≠ ½). A questão é: Aceitamos a Hipótese Nula e dizemos que a moeda é equilibrada, ou rejeitamos a Hipótese Nula e afirmamos que a moeda Não é Equilibrada?

Sabemos que ao jogar uma moeda “n” vezes podemos obter um número de caras próximo de n/2. Então surge a pergunta: Quão diferente de n/2 o resultado deve ser para que possamos dizer que a moeda não é equilibrada? O processo de teste consiste em escolher um número “c” e afirmar:

Page 40: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

40

• Se o número de caras “h” está entre ( n/2 - c ) e ( n/2 + c) aceitamos a

Hipótese Nula e concluímos que a moeda é equilibrada. Essa zona que fica entre (n/2 – c) e ( n/2 + c) é chamada ZONA DE ACEITAÇÃO.

• Se o número de caras “h” não está entre ( n/2 – c) e ( n/2 + c) rejeitamos a

Hipótese Nula, aceitando a Hipótese Alternativa que afirma que a moeda Não é equilibrada. Essa zona que fica à esquerda de (n/2- c) e à direita de (n/2+c) é chamada de REGIÃO DE REJEIÇÃO OU REGIÃO CRÍTICA.

Precisamos então, determinar o tamanho de “c”. Podemos , no entanto, incorrer em dois tipos de erros: ERRO TIPO 1 : afirmar que a Hipótese Nula é falsa, quando é verdadeira. ERRO TIPO 2 : afirmar que a Hipótese Nula é verdadeira, quando é falsa. O que se costuma fazer em estatística é fixar um limite superior para a probabilidade de cometer um ERRO TIPO 1, fixando-se esse limite em 10% ou 5%. Quando decidimos por um teste de 10% , isto significa que há apenas 10% de chance de que nosso processo de teste afirme que a moeda é desequilibrada quando é na realidade honesta. Aumentando o número de jogadas podemos não só obter maior precisão na medida, como verificar com mais chance de acerto se a moeda é ou não desequilibrada.

Page 41: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

41

Como exemplo, vamos jogar uma moeda 20 vezes e montar a tabela de Probabilidades, através da fórmula: n ! h ! (n – h) ! 2 n h Prob (x=h) H Prob (x=h) 1 0,00002 11 0,160 2 0,0002 12 0,120 3 0,001 13 0,074 4 0,005 14 0,037 5 0,015 15 0,015 6 0,037 16 0,005 7 0,074 17 0,001 8 0,120 18 0,0002 9 0,160 19 0,00002

10 0,176 20 0,000001 Se estabelecemos como ZONA DE ACEITAÇÃO o intervalo que nos permite obter de 4 a 16 caras, então a chance de cometer um ERRO TIPO 1é de 1,2%. Reduzindo a região de aceitação para o intervalo 8 a 12 a chance de cometer um ERRO TIPO 1 aumenta para 26,4%. Nosso interesse então está centrado em conjuntos que contenham todos os resultados possíveis de um experimento. A esses conjuntos chamamos de ESPAÇO AMOSTRAL ( ou Espaço de Probabilidades). O Espaço Amostral de jogar um dado é { 1,2,3,4,5,6 }. Na Abordagem Clássica de Probabilidade todos os resultados são encarados como tendo a mesma Probabilidade.

Page 42: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

42

Chamando de: “s” o Espaço Amostral N (A) o número de resultados de um evento A Pr (A) a Probabilidade de ocorrência deA , escrevemos:

N (A) Pr(A) = s

Exemplo 1: Qual a Probabilidade de obter uma cara em três jogadas de uma

moeda? Há 2 3 = 8 resultados possíveis, sendo “s = 8”. Temos três

resultados que dão cara (KCC, CKC, CCK), sendo N(A) = 3. Logo:

N (A) 3 Pr(A) = =

s 8 Exemplo 2: Qual é a Probabilidade de se obter o total 5 na jogada de dois

dados? Há 6 2 = 36 resultados possíveis, sendo “s = 36”. O evento que

consiste em obter 5 nos dados, apresenta os resultados: { (1, 4) , (2,3), (3,2), (4,1) }, sendo N(A) = 4. Logo:

N (A) 4 Pr(A) = =

s 36

Page 43: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

43

PROBABILIDADE DE NÃO-OCORRÊNCIA DE UM EVENTO

As vezes interessa-nos saber a Probabilidade de Não-Ocorrência de um evento. Por exemplo, no jogo de dois dados, estamos interessados em Não obter a soma 7. Se há um chance de 1/6 de obter soma 7, então há 5/6 de chance de Não-Obter soma 7. De modo geral, se “p” é a Probabilidade de ocorrência de um evento A, então “1 – p” é a Probabilidade de Não-Ocorrência daquele evento. O conjunto de todos os resultados que não estão em A chamamos de Complemento de A, e escrevemos Ac. Logo: Pr (Ac ) = 1 - Pr (A)

PROBABILIDADE DE UM A UNIÃO Vamos considerar agora, que nos interesse o total 5 ou o total 7 na jogada de dois dados.

Número de resultados para se obter 7.

{ (1, 6) , (2,5), (3,4), (4,3), (5,2), (6,1)}, sendo N(A) = 6, Pr (A) = 6/36. Número de resultados para se obter 5. { (1, 4) , (2,3), (3,2), (4,1) }, sendo N(B) = 4, Pr(B) = 4/36. Número de resultados para se obter 5 ou 7. { (1, 6) , (2,5), (3,4), (4,3), (5,2), (6,1), (1, 4) , (2,3), (3,2), (4,1)} sendo N(C) = 10. Logo, Pr(C) = 10/36

Page 44: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

44

Note no exemplo acima, que poderíamos escrever Pr (C) = 6/36 + 4/36 = 10/36 ou ainda uma fórmula geral : Pr (C) = Pr (A) + Pr (B) Esse resultado só é válido quando NÃO há possibilidade dos eventos A e B ocorrerem simultaneamente, ou seja, são MUTUAMENTE EXCLUDENTES. No lançamento de uma moeda três vezes seguidas, calcule a probabilidade de obter apenas uma cara (K). Espaço Amostral: A 1 = KKK A 5 = CKK A 2 = KKC A 6 = CKC A 3 = KCK A 7 = CCK A 4 = KCC A 8 = CCC De acordo com os resultados acima 3/8 é a resposta. No entanto, poderíamos escrever: Pr(A4) = 1/8 Pr(A6) = 1/8 Pr(A7) = 1/8 Pr(A4) + Pr(A6) + Pr(A7) = 1/8 + 1/8 + 1/8 = 3/8 Observe para o caso acima, que a Probabilidade de se obter duas ou mais cara, com o lançamento de uma moeda três vezes é de 4/8 ou 50%.

Page 45: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

45

PROBABILIDADE DE UM A INTERSECÇÃO

Qual a Probabilidade de se obter ao menos um “seis” na jogada de dois dados? E1 = { (6, 1) , (6,2), (6,3), (6,4), (6,5), (6,6)} Pr (E1) = 6/36 = 1/6 E2 = { (1, 6) , (2,6), (3,6), (4,6), (5,6), (6,6)} Pr (E2) = 6/36 = 1/6 Pr (E1 ∩ E2) = 1/36 Pr (E1 ∪ E2) = Pr (E1) + Pr (E2) - Pr (E1 ∩ E2) Pr (E1 ∪ E2) = 1/6 + 1/6 - 1/36 = 11/36 Logo, se A e B são mutuamente excludentes: Pr (A ∪ B) = Pr (A) + Pr (B) - Pr (A ∩ B)

Page 46: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

46

PRINCÍPIO DA MULTIPLICAÇÃO

Suponha que queiramos adquirir um carro de uma das quatro cores: vermelho, azul, verde ou branco, e com um dos tipos de carroceria: 4 portas, 2 portas, perua. Quantos tipos de carro devemos considerar ao todo? 4 cores x 3 tipos = 12 tipos possíveis. PROBABILIDADE CONDICIONAL

É a Probabilidade de ocorrência de um determinado evento, quando se sabe que outro evento ocorreu. A Probabilidade condicional de ocorrência de A, dado que B ocorreu, se escreve: Pr (A ⏐B) , sendo que a barra vertical significa “dado que”. A Probabilidade de o evento A ocorrer, dado que B ocorreu é dado pela fórmula: Pr ( A ∩ B) Pr (A ⏐B) = Pr (B) Exemplo: Seja A o evento “obter o total 8 com um par de dados” Seja B o evento “obter 5 na primeira jogada” Pr (B) = 1/6 Calcular Pr (A ⏐B). A ∩ B = evento “obter 5 na primeira jogada e o total 8” 1/36 Então Pr (A ∩ B) = 1/36 e Pr (A ⏐B) = = 1/6 1/6

Page 47: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

47

REGRA DO PRODUTO

Se a Probabilidade de um evento não depende do conhecimento de ter acontecido um outro evento, os eventos são definidos como Independentes. Dois eventos independentes não se afetam um ao outro. O fato de sabermos que um dos eventos ocorreu nada nos diz sobre se o outro ocorrerá ou não. Para se calcular a Probabilidade de ocorrência conjunta de dois eventos independentes, basta multiplicarmos as respectivas Probabilidades. Assim:

Pr (A e B) = Pr (A) x Pr (B)

Calcular a Probabilidade de se obter três caras no lançamento de 3 moedas. A Probabilidade de cada evento é igual a ½. Logo: Pr (A e B e C) = Pr (A) x Pr (B) x Pr (C) = ½ x ½ x ½ = 1/8 = Pr (A e B e C) = 0,125 EXERCÍCIO 16: Calcule a Probabilidade do número de “caras”que aparecerão jogando-se uma moeda honesta 12 vezes. Monte uma tabela e determine a amplitude da Zona de Aceitação necessária para que a chance de se cometer um ERRO TIPO 1, seja inferior a 5%.

Page 48: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

48

EXERCÍCIO 17: Qual a Probabilidade de se obter soma 7 ou a soma 11 na jogada de dois dados?

Page 49: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

49

EXERCÍCIO 18: Jogando-se uma moeda “n” vezes, qual a Probabilidade de obter-se ao menos uma cara? EXERCÍCIO 19: Suponha que você tenha 40% de chance de receber uma oferta de emprego da firma de sua primeira escolha, 40% de chance de receber uma oferta da firma de sua segunda escolha e 16% de chance de receber uma oferta de ambas as firmas. Qual é a probabilidade de receber uma oferta de qualquer uma das firmas?

Page 50: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

50

EXERCÍCIO 20: Suponha que você remova todas as cartas de ouro de um baralho de 52 cartas, devolva ao baralho o ás de ouro, baralhe as 40 cartas restantes e tire uma ao acaso. Se a carta tirada é um ás, qual a probabilidade de ser o ás de ouro?

Page 51: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

51

VARIÁVEIS ALEATÓRIAS - VALOR ESPERADO Representaremos as variáveis aleatórias por letras maiúsculas. Quando jogamos um dado e anotamos o número Y que aparece, estamos fazendo uma “medida” ou “observação” do valor de Y. Um evento aleatório é algo que não sabemos ao certo se ocorrerá, mas cuja probabilidade de ocorrência podemos calcular. Podemos sempre calcular a Probabilidade de tomar determinado valor quando tratamos uma variável aleatória. Por exemplo, o número Y na jogada de um dado só pode assumir os valores 1,2,3,4,5,ou 6. Portanto, as variáveis aleatórias que só podem assumir valores isolados são chamadas VARIÁVEIS ALEATÓRIAS DISCRETAS. As variáveis aleatórias discretas não precisam assumir valores em números inteiros. Se desejamos saber a média de dois números que aparecem na jogada de dois dados, os valores poderão ser: 1; 1,5; 2; 2,5; 3; 3,5; 4; 4,5; 5; 5,5; 6. O QUE É PRECISO SABER A RESPEITO DE VARIÁVEIS ALEATÓRIAS? Primeiro: devemos saber qual a relação dos valores possíveis, e quais não o são. Segundo: devemos saber quão viável é cada um desses diversos valores. No caso da jogada de um dado, temos:

Pr (Y=1) = 1/6 Pr (Y=2) = 1/6 Pr (Y=3) = 1/6 Pr (Y=4) = 1/6 Pr (Y=5) = 1/6 Pr (Y=6) = 1/6

Page 52: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

52

Podemos ainda fazer a relação das Probabilidades para a Variável aleatória X definida como o número de “caras” em três jogadas de uma moeda.

Pr (X=O) = 1/8 Pr (X=1) = 3/8 Pr (X=2) = 3/8 Pr (X=3) = 1/8

FUNÇÃO DE DENSIDADE DE PROBABILIDADE DE UMA VARIÁVEL ALEATÓRIA DISCRETA

• É a função que dá a Probabilidade de a variável aleatória tomar um

determinado valor. Por exemplo, se x1, x2, .... xn são os valores possíveis de uma variável aleatória X e f(x) é a função de Probabilidade então:

f(x1) = Pr (X = x1), f(x2) = Pr (X = x2), f(xn) = Pr (X = xn)

Logo, a Função de Probabilidade é dada por:

f (a) = Pr ( X = a ) • Ao fazermos um diagrama de frequência da jogada de um dado 6 000

vezes, observamos que o diagrama de frequência tem aproximadamente a mesma forma que a FUNÇÃO DE PROBABILIDADE.

• A Função de Probabilidade é sempre um número do tipo:

0 ≤ f(a) ≤ 1

• Portanto, para que uma função “f” seja uma Função de Probabilidade válida para uma variável aleatória, a soma de seus valores possíveis deve ser 1. Assim:

f (a1) + f (a2) + f (a3) + ... + f (an) = 1

Page 53: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

53

Como exemplo, as Probabilidades que aparecem em três jogadas de uma moeda é dada por:

Pr (X=O) = 1/8 Pr (X=1) = 3/8 Pr (X=2) = 3/8 Pr (X=3) = 1/8

Veja que 1/8 + 3/8 + 3/8 + 1/8 = 1

FUNÇÃO DE DISTRIBUIÇÃO ACUMULADA A Função de Distribuição Acumulada F(a) dá as probabilidades de a variável aleatória ser no máximo igual a um valor particular: F ( a ) = Pr ( X ≤ a) Por exemplo, a Probabilidade de a variável aleatória Y ser no máximo igual a 3, na jogada de um dado é obtida pela soma das Probabilidades: Pr (X=1) + Pr (X=2) + Pr (X=3) = 1/6 + 1/6 + 1/6 = 3/6 = 1/2

O gráfico de uma função acumulada F (a) permanece plano por algum tempo até atingir um dos valores possíveis, quando aumenta de um salto ( por patamares). Veja o exemplo de distribuição acumulada para o número de “caras” X, que aparecem em três jogadas de uma moeda:

• F (a) = 0 se a < 0 • F (a) = 1/8 se 0 ≤ a < 1 • F (a) = 1/2 se 1 ≤ a < 2 ⇒ 1/8 + 3/8 = 4/8 = 1/2 • F (a) = 7/8 se 2 ≤ a < 3 ⇒ 1/8 + 3/8 + 3/8 = 7/8 • F (a) = 1 se 3 ≤ a ⇒ 1/8 + 3/8 + 3/8 + 1/8 = 8/8 = 1

Page 54: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

54

ESPERANÇA ... E (X) • A Esperança de uma variável aleatória nos dá a média de todos os

valores que esperaríamos obter se medíssemos a variável aleatória um número muito grande de vezes.

E (X) = f (a1) . a1 + f (a2) . a2 + f (a3) . a3 + ... + f (an) . an

n

E ( X ) = Σ f ( a i) . a i = µ i = 1

onde a1, a2, ... a n são todos os valores possíveis da variável aleatória X.

• A Esperança de X é uma média ponderada de todos os valores possíveis

de X. O peso, ou ponderação, de cada valor é igual à Probabilidade de X tomar esse valor.

• A Esperança – E (X) – chamada Esperança de X, é também chamada

média de X, ou média da distribuição de X, representada também pela letra µ . Logo, E (X) é uma constante.

EXEMPLO: Vamos calcular a Esperança do número X aparecer na jogada de um dado.

Page 55: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

55

X f (a) = Prob (X=a) ai . f (ai) 1 1/6 1/6 2 1/6 2/6 3 1/6 3/6 4 1/6 4/6 5 1/6 5/6 6 1/6 6/6

1 + 2 + 3 + 4 + 5 + 6

µ = = 3,5 6

E (X) = f (a1) . a1 + f (a2) . a2 + f (a3) . a3 + ... + f (an) . an E (X) = f (1) . 1 + f (2) .2 + f (3) . 3 + f (4) . 4 + f (5) . 5 + f (6) .6 E (X) = 1/6 x 1 + 1/6 x 2 + 1/6 x 3 + 1/6 x 4 + 1/6 x 5 + 1/6 x 6

E (X) = 21/6 = 3,5

Logo, a Esperança E (X) de uma variável aleatória nos dá a Média de todos os valores que esperaríamos obter se medíssemos a variável aleatória um número muito grande de vezes.

µ = E ( X ) = 3,5

PROPRIEDADES DA ESPERANÇA E (X) • Se “c” é uma constante então:

E (c X) = c . E (X)

Page 56: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

56

Exemplo: Suponhamos que ao jogar um dado, você ganhe R$ 100,00 vezes cada número obtido. Se “X” é a variável aleatória que representa o número obtido, e “G” representa seu ganho, temos: E(G) = E (100 X) = 100 E (X) = 100 x 3,5 = 350 O Ganho Esperado será de R$ 350,00.

• Sendo Z = X2 , então E (Z) = E (X2). Podemos também escrever assim:

n

E ( X2 ) = Σ f ( x i) . x2 i i = 1

Exemplo: Consideremos X como o número de “caras” que aparecem em três jogadas de uma moeda. Então:

E (X2) = 0 x 1/8 + 1x 3/8 + 4 x 3/8 + 9 x 1/8 = E (X2) = 24/8 = 3

VARIÂNCIA ... Var (X) Poderíamos estar interessados em saber quão distante da média cada valor possível de X está, e determinássemos então o Valor Esperado da distância em relação a E(X), como segue: (média da imprevisibilidade) = E [ a – E(X)]. Poderíamos utilizar o valor absoluto (módulo das distâncias) mas é mais interessante tomar o quadrado das distâncias de cada valor em relação a E(X)= µ . Assim:

Page 57: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

57

Var (X) = E ((X - µ )2) sabemos que µ = E (X) Var (X) = E ( X2 – 2 X µ + µ 2 ) Var (X) = E (X2 ) – E ( 2 X µ) + E (µ 2) Var (X) = E (X2 ) – 2 E ( X) . E (X) + E2 (X) Var (X) = E (X2 ) – 2 E2 ( X) + E2 (X)

Var (X) = E (X2 ) – E2 ( X) EXERCÍCIO PRÁTICO: Calcule a Variância do número que aparece na jogada de um dado: a) de acordo com a definição: n

Σ ( X - µ )2

i =1 Var (X) = n b) de acordo com a fórmula: Var (X) = E (X2 ) – E2 ( X) Sendo: n n

E (X) = Σ f (xi) . xi e E (X2) = Σ f (xi) . x2i

i =1 i=1

Page 58: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

58

X X - µ ( X - µ ) 21 2,50 6,25 2 1,50 2,25 3 0,50 0,25 4 0,50 0,25 5 1,50 2,25 6 2,50 6,25

SOMA 17,50 1 + 2 + 3 + 4 + 5 + 6 µ = = 3,5 Var (X) = 17,50/6 = 2,9167 6

X f (x)= Prob (X=x) f (xi) . xi X2 X2. f (x) 1 1/6 1/6 1 1/6 2 1/6 2/6 4 4/6 3 1/6 3/6 9 9/6 4 1/6 4/6 16 16/6 5 1/6 5/6 25 25/6 6 1/6 6/6 36 36/6 Σ E (X)= 21/6 E(X2) = 91/6

Var (X) = E (X2 ) – E2 ( X) = 91/6 – (21/6)2 = Var (X) = 91/6 – 441/36 = (546-441)/36= 2,9167

Page 59: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

59

Exercício 21: Em uma determinada Corretora de Valores os analistas definiram os possíveis cenários da rentabilidade do mercado de ações para os próximos 6 meses: Ruim, Regular, Bom e Excelente. Pelo consenso do grupo de analistas, as rentabilidades e suas probabilidades associadas para cada cenário estão na tabela abaixo:

Rentabilidade ProbabilidadeRuim -10% 10%

Regular 0% 20%Bom 12% 40%

Excelente 25% 30%

a) Calcular o Valor Esperado b) Calcular a Variância

xi p(xi) xi * p(xi) x2i x2i. p (xi) Ruim -0,10 0,10 -0,01 0,0100 0,001000

Regular 0,00 0,20 0 0,0000 0,000000Bom 0,12 0,40 0,048 0,0144 0,005760

Excelente 0,25 0,30 0,075 0,0625 0,018750E(X) 0,1130 0,025510

E(X) = 11,30% Var (X) = E (X2 ) – E2 ( X) = 0,025510 – (0,1130)2 = 0,0127 Qual é o significado do Valor Esperado igual a 11,30? Significa que se o experimento aleatório for repetido um número muito grande de vezes, então a média de todos os resultados será igual a 11,30. Porisso chamamos o Valor Esperado de Média de Longo Prazo.

Page 60: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

60

EXERCÍCIO 22: Nas tabelas abaixo, dá-se a Função de Densidade para uma variável aleatória X. Calcule a Esperança e a Variância dessa variável aleatória. a)

X f (X) 1 0,250 2 0,250 3 0,250 4 0,250

Page 61: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

61

b) X f (X) 10 0,500 20 0,250 30 0,125 40 0,125

Page 62: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

62

EXERCÍCIOS DE REVISÃO - LISTA 2 1. Qual a probabilidade de se obter soma 8 ou soma 6 na jogada de dois

dados? 2. Jogando-se uma moeda cinco vezes, qual a probabilidade de obter-se

cara, na primeira, ou na segunda ou na terceira jogada? 3. Jogando-se um dado três vezes, qual a probabilidade de aparecer face 1

pelo menos uma vez? 4. Suponha que 70% das famílias de uma cidade tenham filhos. Dessas

famílias, 30% tem filhos com menos de 6 anos e 60% tem filhos com 6 anos ou mais. Quantas famílias tem filhos simultaneamente com mais de 6 e menos de 6 anos?

5. Na tabela abaixo, dá-se a Função de Densidade para uma variável aleatória X.

X Prob(X)3 0,064 0,145 0,246 0,287 0,208 0,08

a) Calcule a Esperança dessa variável aleatória. b) Calcule a Variância dessa variável aleatória. 6. Um vendedor determinou as probabilidades de fazer determinados

números de vendas por dia, visitando 8 possíveis compradores. As probabilidades são apresentadas na tabela abaixo:

Dias de Vendas 1 2 3 4 5 6 7 8 Probabilidades 0,04 0,15 0,20 0,25 0,19 0,10 0,05 0,02 a) Calcule o número Esperado de Vendas por dia. b) Calcule o Desvio Padrão em relação as vendas.

Page 63: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

63

COVARIÂNCIA E COEFICIENTE DE CORRELAÇÃO

Aqui estudamos medidas numéricas relacionadas com duas séries de dados tomadas ao mesmo tempo. Como construir uma medida para aferir o grau de relacionamento entre duas variáveis, ou seja, medir o grau de correlação entre elas?

Exemplo : A tabela abaixo registra as rentabilidades anuais das ações A e B negociadas na Bolsa de Valores. Calcular os valores das médias, desvios padrões e coeficientes de variação dessas duas ações.

Ação A Ação B 1 991 9,00% 12,00% 1 992 10,00% 10,50% 1 993 12,00% 9,50% 1 994 10,50% 11,00% 1 995 9,50% 12,50% Média 10,20% 11,10%

DP 1,15% 1,19% CV 0,1129 0,1075

8%9%

10%11%12%13%

8% 9% 10% 11% 12% 13%

Ação A

Açã

o B 1991

199319921994

1995

O diagrama de dispersão das rentabilidades das duas ações acima mostra que as rentabilidades das duas ações A e B são parecidas, porém com tendências opostas. Uma forma de medir a relação entre as duas séries de observações é com as medidas estatísticas de: COVARIÂNCIA E COEFICIENTE DE CORRELAÇÃO.

Page 64: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

64

COVARIÂNCIA: é a média de uma nova série cujos elementos estão formados pelo produto dos desvios das observações de cada variável com relação a sua própria média.

COVARIÂNCIA DA POPULAÇÃO

n

Σ ( Xi - µx ) . (Yi - µy) i =1

Cov (X,Y) = σx,y = n

COVARIÂNCIA DA AMOSTRA

n

Σ ( Xi - x ) . (Yi - y) i =1

Cov (X,Y) = Sx,y = n - 1 Observe que quando X = Y obtemos a fórmula de Variância.

Page 65: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

65

Para facilitar a interpretação do valor da covariância e eliminar a unidade de medida, foi definido o COEFICIENTE DE CORRELAÇÃO r com a seguintes características:

• Seus valores estão limitados entre -1 e + 1 . • O Coeficiente de Correlação padroniza a Covariância.

O Coeficiente de Correlação rxy de duas séries de dados X e Y, é um valor único definido pela expressão:

Cov ( X,Y) rxy= σx . σy

Ação A Ação B X - µx Y - µy (X - µx ) . ( Y - µy ) 1991 9,00% 12,00% -1,20% 0,90% -1,0800 1992 10,00% 10,50% -0,20% -0,60% 0,1200 1993 12,00% 9,50% 1,80% -1,60% -2,8800 1994 10,50% 11,00% 0,30% -0,10% -0,0300 1995 9,50% 12,50% -0,70% 1,40% -0,9800

Média 10,20% 11,10% DP 1,15% 1,19%

SOMA -4,8500 COV -0,00012125

r xy = -0,8824

O Coeficiente de Correlação mostra que existe uma correlação forte e negativa entre as ações A e B, ou seja, quando a rentabilidade da ação A sobe a da Ação B desce, e vice-versa.

Page 66: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

66

VALORES E SIGNIFICADOS DO

COEFICIENTE DE CORRELAÇÃO r = + 1 .... perfeita correlação positiva.

r próximo de + 1 ..... forte correlação positiva.

r próximo de + 0 ..... fraca correlação positiva.

r = 0 não existe nenhuma relação.

r próximo de - 0 ..... fraca correlação negativa.

r próximo de - 1 ..... forte correlação negativa.

r = - 1 .... perfeita correlação negativa.

Page 67: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

67

Exercício 23: Considere 5 vendedores de empresa, que efetuam visitas a seus clientes de acordo com a tabela abaixo, sendo respectivamente o número de produtos vendidos de acordo com o número de visitas. Calcule a Média, o Desvio Padrão, a Covariância e o Coeficiente de Correlação entre as visitas e o número de produtos vendidos.

VISITAS Produtos Vendidos

A 42 140 B 105 330 C 66 190 D 87 350 E 50 110

VIS Pr Vend

X - µx Y - µy (X - µx)2 (X - µy)2

(X- µx).(Y-µy ) A 42 140 B 105 330 C 66 190 D 87 350 E 50 110 Soma Média DPs COVs

r xy =

Page 68: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

68

Page 69: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

69

Resposta:

VISITAS Produtos Vendidos

X - µx Y - µy (X - µx ) . ( Y - µy ) A 42 140 - 28 - 84 2 352 B 105 330 35 106 3 710 C 66 190 - 4 - 34 136 D 87 350 17 126 2 142 E 50 110 - 20 - 114 2 280

Média 70 224 DPS 26,04 109,91

SOMA 10 620 COV 2 655

r xy = 0,93

Conclusão: Existe uma forte relação entre o número de visitas e o número de produtos vendidos.

AMOSTRAGEM Até agora estudamos a Estatística descritiva onde analisamos os dados amostrais da sua distribuição de frequências ou probabilidades. No entanto o nosso objetivo é fazer Inferência Estatística sobre a população a partir dos dados amostrais. Nossa grande questão é: Como se comporta a população a partir de dados que analisamos e dos resultados que obtivemos na amostra. Como exemplo: se uma amostra indicar que a altura média da população é de 1,65 m, o que podemos inferir a respeito da população? Nossa hipótese é de que o fenômeno estudado obedece um determinado modelo matemático. Verifique que quando aumentamos o número de observações, a distribuição de probabilidades obedece a uma curva chamada curva de Gauss.

Page 70: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

70

DISTRIBUIÇÃO NORMAL A função de probabilidade da Distribuição Normal, tem a forma de um sino. Muitas populações seguem a distribuição normal, como exemplo citamos:

• A altura, o peso ou o QI de uma população • O total que aparece quando vários dados são jogados simultaneamente • O número de clientes mensais em muitos negócios

Uma variável aleatória normal não é uma variável aleatória discreta, e sim uma variável aleatória contínua. Como exemplo de variável aleatória contínua citamos:

• O intervalo de tempo da vida de uma lâmpada • A duração da vida de uma pessoa

Uma variável aleatória contínua pode tomar qualquer valor numérico real em determinado intervalo, podendo assumir infinitos valores. Nesses casos as probabilidades são dadas por intervalos.

FUNÇÃO CONTÍNUA DE DENSIDADE DE PROBABILIDADE

Vamos determinar a probabilidade de uma variável Y ser exatamente igual a 2. Qualquer número entre 0 e 3 tem a mesma chance de ser escolhido. Sabemos que existem infinitos valores de 0 até 3, e que P(Y=2) = 1/N, com N tendendo para o infinito, logo a relação 1/N é igual a zero, e surge a seguinte propriedade:

A probabilidade de qualquer variável aleatória contínua tomar qualquer valor específico é zero.

Page 71: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

71

Logo, enunciamos o seguinte princípio:

• P (X = a) = 0

• P (a < x < b) = área sob a curva de Gauss. A área sob a função entre dois valores é a probabilidade de a variável “x” estar entre esses valores. A função f(x) é uma função de densidade para a variável aleatória X se satisfaz a propriedade de que a área sob a curva f(x) à esquerda da reta x=b , à direita da reta x=a, e acima do eixo “x” é igual a Pr ( a < x < b ). É importante lembrar que a área total sob a função f(x) deve ser igual a 1. Logo, para calcular a probabilidade de uma variável aleatória contínua estar entre dois números, é necessário calcular a área sob a função de densidade entre esses números. O cálculo da área sob uma curva exige uma técnica de cálculo chamada “integração”. Identificamos uma DISTRIBUIÇÃO NORMAL especificando dois números:

• A média (que está localizada no pico da distribuição) • A Variância (ou o Desvio Padrão) – que define a forma de

distribuição (se é dispersa ou se a maior parte da área se concentra na proximidade do pico).

A figura abaixo mostra quatro distribuições normais com a MESMA VARIÂNCIA mas com MÉDIAS DIFERENTES.

Page 72: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

72

A figura abaixo mostra quatro distribuições normais com a MESMA MÉDIA e VARIÂNCIAS DIFERENTES.

O gráfico da função de densidade de uma variável aleatória normal tem a forma de um sino, com o pico localizado na média “µ”. A variância ( σ2 ) determina a forma da curva; sendo que um valor maior da variância significa maior dispersão da curva. Como a distribuição é simétrica, a área total sob a curva e acima da média é a mesma que a área total abaixo da média. No nosso exemplo abaixo, a probabilidade de X ser maior do que 20 é 0,5.

Page 73: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

73

DISTRIBUIÇÃO NORMAL PADRONIZADA O modelo teórico mais utilizado é o da Distribuição Normal de Probabilidades. Como é básicamente impossível elaborar uma tabela para cada Distribuição Normal, com todos os valores possíveis da média e da variância, utilizamos uma Tabela de Distribuição Normal com média µ = 0 e variância σ2 = 1. A Distribuição Normal com média µ = 0 e variância σ2 = 1 é chamada de DISTRIBUIÇÃO NORMAL PADRONIZADA. Na figura abaixo, se quisermos achar a Probabilidade de Z estar entre 0 e 1, devemos calcular a área sob a curva entre 0 e 1. Portanto, associamos às diferentes distribuições uma curva normal padronizada Z com média µ = 0 e variância σ2 = 1 através da equação:

X - µ

Z = dado X σ encontramos Z ou seja,

Prob ( a < Z < b ) = φ (b) - φ (a) φ (a) = Pr ( Z < a) e φ (b) = Pr ( Z < b) ou seja φ (b) é a função de distribuição acumulada de Z.

Page 74: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

74

Afirmamos acima que φ (0) = 0,5. Pela tabela, vemos que φ (1) = 0,8413. Logo, a Probabilidade de Z estar entre “0” e “1” é 0,8413 – 0,5 = 0,3413. A variável aleatória Z tem uma distribuição normal padronizada se sua função 1 2 f (Z) = . e -(1/2) z

√ 2π tem as seguintes propriedades:

• E (Z) = 0 • Var (Z) = 1 • f (Z) → 0 quando Z → + ∞ ou - ∞ • A curva é simétrica ao redor da média. A área total sob a curva é

definida como 100%; cada metade da curva tem 50% da área total.

Page 75: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

75

Exemplo: A série de observações X tem média igual a 40 e desvio padrão igual a 10. Se retirarmos uma observação dessa série, qual é a probabilidade que seu valor seja igual ou menor que 52,4? Solução: O primeiro passo é calcular o valor de Z. X - µ 52,4 - 40 Z = = = + 1,24 σ 10

Z=1,24

De acordo com a tabela da Distribuição Normal Z, obtemos a probabilidade igual a 89,25%, ou seja, se retiramos uma observação da série X, a probabilidade que seu valor seja igual ou menor que 52,4 é igual a 89,25%.

ESTENDENDO O USO DA DISTRIBUIÇÃO NORMAL Ao operar com Distribuições Normais devemos sempre:

• Calcular o valor da probabilidade a partir do conhecimento dos dados.

• Calcular um dos parâmetros (Z) a partir de um valor de probabilidade e dos restantes dos dados.

Page 76: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

76

Page 77: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

77

Page 78: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

78

Page 79: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

79

Exemplo: Um vendedor afirma ter vendido $ 1 350 000 durante um ano. Com isso afirma estar entre os 5% dos vendedores que mais venderam na empresa. Considerando que as vendas realizadas tem distribuição normal com média igual a $ 1 250 000 e desvio padrão igual a $ 100 000, verifique se a afirmação do vendedor é verdadeira. Solução: Se consultarmos a tabela de Distribuição Normal veremos que a probabilidade de 0,95 está situada entre Z = 1,64 (com probabilidade igual a 0,9495) e Z= 1,65 (com probabilidade igual a 0,9505). Interpolando encontramos Z= 1,645 ( com probabilidade de 0,95). X - µ X - 1 250 000 Z = = = + 1,645 σ 100 000 Portanto, o valor de vendas procurado é: X= 1,645 *100 000 + 1 250 000 = $ 1 414 500 Ou seja, os 5% dos vendedores da empresa que mais venderam, venderam pelo menos $ 1 414 500. Logo o vendedor acima não pertence aos 5% dos que mais venderam. Salientamos que a variável aleatória Z, tem Distribuição Normal Padronizada, e que a função φ (a) é a função de Distribuição Acumulada de Z, tal que:

Page 80: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

80

φ (a) = Pr (Z < a ) verificando as seguintes propriedades:

• φ (0) = Pr (Z < 0 ) = 0,5

• φ ( - a) = Pr (Z < - a ) = 1 - φ (a) • Pr (Z > b ) = 1 - φ (b) • Pr ( a < Z < b ) = φ (b) - φ (a)

Page 81: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

81

EXERCÍCIO 24: A série de observações X tem média igual a 40 e desvio padrão igual a 10. Se retirarmos uma observação dessa série, qual é a probabilidade que seu valor seja igual ou menor que 35?

Page 82: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

82

EXERCÍCIO 25: A série de observações X tem média igual a 40 e desvio padrão igual a 10. Se retirarmos uma observação dessa série, qual é a probabilidade que seu valor seja igual ou menor que 60 e maior ou igual a 25?

Page 83: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

83

EXERCÍCIO 26: Sendo Z uma Distribuição Normal Padronizada, calcule: a) Pr (Z > 1 ) b) Pr ( Z < - 1) c) Pr ( 1 < Z < 1,5 ) d) Pr ( - 1 < Z < 2 )

Page 84: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

84

Page 85: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

85

EXERCÍCIO 27: Os depósitos efetuados em um determinado Banco durante um determinado mês, são distribuídos normalmente, com média de R$ 10 000,00 e desvio padrão de R$ 1 500,00. Se um depósito é selecionado ao acaso, encontre a probabilidade de que o depósito seja: a) igual ou menor que R$ 10 000,00 b) um valor entre R$ 12 000,00 e R$ 15 000,00 c) maior que R$ 20 000,00

Page 86: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

86

EXERCÍCIO 28: Em um exame final de Métodos Quantitativos, a média foi de 75 o desvio padrão de 15. Calcule a probabilidade de um estudante: a) obter uma nota superior a 70 b) obter nota superior a 70 e inferior a 80.

Page 87: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

87

Page 88: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

88

EXERCÍCIOS DE REVISÃO - LISTA 3

1. A tabela abaixo registra as rentabilidades mensais das ações A e B negociadas na Bolsa de Valores. Calcular os valores das médias, desvios padrões e coeficientes de variação dessas duas ações.

Ação A Ação B Mês 1 6,00% 7,30% Mês 2 7,20% 6,80% Mês 3 6,80% 6,40% Mês 4 6,40% 8,20% Mês 5 6,20% 8,70% Média

DP CV

2. Considere 5 vendedores de empresa, que efetuam visitas a seus clientes de acordo com a tabela abaixo, sendo respectivamente o número de produtos vendidos de acordo com o número de visitas. Calcule a Média, o Desvio Padrão, a Covariância e o Coeficiente de Correlação entre as visitas e o número de produtos vendidos.

VISITAS Produtos Vendidos

A 60 200 B 120 420 C 80 250 D 65 140 E 72 150

3. Sendo Z uma Distribuição Normal Padronizada, calcule: a) Pr (Z < 1 ) b) Pr ( Z > - 1) c) Pr ( 1 < Z < 1,2 ) d) Pr ( 1< Z < 2 )

Page 89: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

89

4.O processo de empacotamento de arroz foi ajustado de maneira que uma média µ = 13 kg é colocada em cada saco. O desvio padrão do peso líquido é de σ = 0,1 kg e sabe-se que a distribuição dos pesos segue uma distribuição normal. Calcule a probabilidade de que um saco escolhido aleatoriamente contenha entre 12,9 e 13,2 kg de arroz. Calcule ainda a probabilidade de que o peso esteja entre 13,1 e 13,2 kg.

5. Os resultados de um concurso público apresentam a média µ = 50 com um desvio

padrão igual a σ = 10 . Os resultados tem uma distribuição aproximadamente normal. Qual a probabilidade de que a nota obtida por um candidato escolhido aleatoriamente esteja:

a) entre 50 e 65? b) entre 45 e 60? 6. A vida útil de uma certa marca de pneus tem uma distribuição normal com µ= 38 000 km e σ = 3 000 km.

a) Qual a probabilidade de que um pneu escolhido aleatoraiamente tenha uma vida útil de no mínimo 35 000 km?

b) Qual a probabilidade de que ele dure mais do que 45 000 km? 7. Suponha que você é gerente de um Banco onde os montantes diários de depósitos e

de retiradas são dados por variáveis aleatórias independentes com distribuições normais. Para os depósitos a média é de $ 12 000 e o desvio padrão de $ 4 000; para as retiradas a média é de $ 10 000 e desvio padrão de $ 5 000. Calcule a probabilidade de cada um dos eventos abaixo em um determinado dia: a) Depósitos superiores a $ 13 000. b) Retiradas superiores a $ 13 000.

8. O tempo necessário para o atendimento de uma pessoa em um guichê de um banco

tem distribuição aproximadamente normal com µ = 130 segundos e σ = 45 segundos. a) Qual a probabilidade um indivíduo aleatoriamente selecionado requeira menos

de 100 segundos para terminar suas transações? b) Gaste entre 2 e 3 minutos no guichê? c) Qual o tempo mínimo necessário para os 5% de indivíduos com as transações

mais complicadas?

Page 90: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

90

INTERVALOS DE CONFIANÇA É um intervalo baseado em observações de uma amostra e construído de maneira que haja uma probabilidade especificada de o intervalo conter o verdadeiro valor desconhecido de um parâmetro. Em geral calculamos intervalos de confiança que tenham uma chance de 95% de conter o verdadeiro valor. Sabemos que para uma amostra, a sua média x se aproxima da média da população µ. Surge a pergunta: Quão próximo de µ estará x ? A resposta a esta pergunta nos obriga a buscar um valor “c” de tal maneira que µ esteja contido no intervalo ( ⎯x - c) e (⎯x + c). O procedimento estatístico consiste em fixarmos um valor de 95% para a Probabilidade do número estar contido nesse intervalo. Logo, precisamos determinar a amplitude do intervalo para que haja 95% de chance de ele conter o verdadeiro valor. Vamos então calcular o valor de “c” que verifica a equação: Pr (⎯x – c < µ < ⎯x + c) = 0,95 Ou ainda: Pr ( - c < ⎯x - µ < + c ) = 0,95 A solução consiste em criar uma nova variável “Z” tal que: ⎯x - µ ⎯x - µ Z = = √ n √ σ2 / n σ Na tabela que fornece a Probabilidade para a Distribuição Normal Padronizada, sendo (-z < Z < z ) verificamos que uma probabilidade igual a 0,95 tem como correspondência z = 1,96. Portanto afirmamos que (-1,96 < Z < 1,96). Observe que ao substituirmos (⎯x - µ ) por “+ c” e “ – c” obtemos c √ n 1,96 σ = 1,96 ou seja : c = σ √ n

Page 91: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

91

Logo, há 95% de chance de ⎯x - c < µ < ⎯x + c que é o mesmo que: ⎯x – 1,96 σ/√n e ⎯x + 1,96 σ/√n EXEMPLO: De uma determinada população retiramos uma amostra com 100 elementos onde a média amostral é igual a 7 e o Desvio Padrão igual a 40. Determine o intervalo de confiança para a média da população (µ) considerando um nível de confiança igual a 95%. Sabemos que: 1,96 σ c = e que ⎯ √ n ⎯x – 1,96 σ/ √n < µ < ⎯x + 1,96 σ/ √n = ⎯x - c < µ < ⎯x + c logo: 1,96 x 40 = c = 7,84 portanto: 7 – 7,84 < µ < 7 + 7,84 ou ainda √ 100 - 0,84 < µ < 14,84 Conclusão: Há 95% de chance de que média populacional µ esteja entre 0,84 e 14,84. Concluímos então, que se X tem uma Distribuição Normal, então a média amostral ⎯x terá uma Distribuição Normal com média µ e variância σ2/ n . No estudo da Distribuição Normal fixamos um intervalo e calculamos a Probabilidade da Média Amostral cair nesse intervalo. No estudo de Intervalo de Confiança, fixamos uma Probabilidade e calculamos os limites desse intervalo que atenda aquela Probabilidade esperada.

Page 92: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

92

TESTES DE HIPÓTESES Ao trabalharmos com Teste de Hipóteses, elegemos um “valor hipotético” como parâmetro da população que está sendo estudada. Depois coletamos uma amostra a mais aleatória possível e comparamos a estatística hipotética com o parâmetro suposto. Por exemplo, calculamos a média amostral ⎯x e comparamos com a média da população - µ - ( eleita como parâmetro). A seguir, ou aceitamos ou rejeitamos o valor hipotético como sendo correto. O processo consiste em calcular então uma grandeza específica chamada “estatística de teste” que é construída de forma que a hipótese nula seja verdadeira. (Lembramos que Hipótese Nula é a hipótese que vai ser testada, e que a hipótese que afirma que a Hipótese Nula é falsa é chamada Hipótese Alternativa). Consideremos o fato de estarmos testando uma Hipótese Nula com o auxílio de uma estatística de teste “Z” e que “Z” tem uma Distribuição Normal Padronizada. Existe, como vimos anteriormente, um número “c” tal que : ⏐ Z ⏐ < c ⇒ Z é interior a “c” ( Zona de Aceitação) ⏐ Z ⏐ > c ⇒ Z é exterior a “c” (Zona Crítica ou Zona de Rejeição) - c + c Zona Zona de Zona Crítica Aceitação Crítica Quando afirmamos que o nível de significância é de 5%, estamos afirmando que há uma chance de 95% de Z estar na “Zona de Aceitação” que corresponde ao número 1,96 (de acordo com a Tabela de Distribuição Normal Padronizada – página 75 da Apostila ).

Page 93: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

93

De acordo com a figura abaixo, vemos que: Prob [ ( Z > 1,96 ) ou ( Z < - 1,96 ) ] = 0,025 + 0,025 = 0,05 Note que, se o valor observado da estatística de teste é exterior a 1,96 , dizemos que a hipótese é rejeitada ao nível de significância de 5%.

TESTE DO VALOR DA MÉDIA Consideremos uma sequência de números extraídos de uma Distribuição Normal, onde conhecemos a Variância mas não conhecemos a média da Distribuição. Vamos então testar a hipótese de que a média µ é igual a um valor particular µ *, ou seja: H0 : µ = µ* EXEMPLO: Consideremos os pesos de 27 pessoas coletadas como amostra de uma população de 500 pessoas, de acordo com a tabela abaixo ( em kg)

80 92,5 117,5 104 85 82,5 102 90 102,5 107,5 92,5 94 90 110 110 110,5 102,5 117,5 112,5 95 90 102,5 125 105 115 105 109 Queremos testar a hipótese de que esses pesos foram extraídos de uma Distribuição Normal com média 110. (Note que a média amostral é igual a 102,2 e desvio padrão amostral igual a 11,05). Sabemos que se a hipótese nula µ = 110 é verdadeira, então a estatística de teste

x - µ

t = √ n s

terá Distribuição t com ( n - 1 ) graus de liberdade.

Page 94: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

94

102,2 - 110

t = √ 27 = - 3,67 11,05 Se a hipótese é verdadeira, então “t” tem Distribuição “t” com 26 graus de liberdade. Ao consultarmos a tabela abaixo verificamos que o valor crítico para um teste de 1% é 2,779 , ou seja, podemos rejeitar a Hipótese Nula ao nível de 1% quando o valor da estatística de teste é exterior a 2,779. No caso, ( - 3,67 ) é exterior e estamos na Região Crítica ou de Rejeição. Rejeitamos então a hipótese de que a amostra tenha sido selecionada de uma população com média igual a 110 kg. Processo geral para testar a hipótese µ = µ * , com base em “n “ valores selecionados de uma Distribuição Normal. MÉTODO 1: Usado quando conhecemos a variância ( σ2 ) da Distribuição. 1. Calcular a média amostral ⎯x. 2. Calcular a estatística de teste “Z” √ n ( ⎯x - µ * ) Z = σ 3. Para fazer o teste ao nível de significância de 5%, aceitar a hipótese

µ = µ * se Z está entre - 1,96 e 1,96; rejeitá-la em caso contrário. 4. Para testar a hipótese a um outro nível de significância, procurar na

Tabela de Distribuição Normal Padronizada o valor crítico de “Z”. MÉTODO 2: Usado quando “não” conhecemos a variância ( σ2 ) da Distribuição. 1. Calcular a média amostral ⎯x. 2. Calcular a Variância Amostral “s” ( X1 - ⎯x ) 2 + ( X2 - ⎯x ) 2 + ... + ( Xn - ⎯x ) 2S = n - 1

Page 95: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

95

3. Calcular a estatística de teste “t” √ n ( ⎯x - µ * ) t = s 4. A estatística “t” tem Distribuição “t” com ( n- 1 ) graus de liberdade.

Procurar na Tabela de Distribuição “t” o valor crítico para a Distribuição “t” com o número adequado de graus de liberdade.

Page 96: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

96

APÊNDICE

DISTRIBUIÇÃO BINOMIAL A Distribuição Binomial é uma distribuição discreta de probabilidade, aplicável quando um experimento é realizado “n” vezes, cada prova tendo uma probabilidade de sucesso “p” e sendo independente de qualquer outra prova anterior. Consideremos um experimento com dois resultados possíveis: sucesso ou falha. A probabilidade de sucesso em cada prova é “p” e a probabilidade de falha é “1 – p”. Se um experimento é realizado duas vezes, qual é a probabilidade de ambas as provas resultarem em sucesso? Consideremos:

• Pr(A) = p sucesso na primeira prova • Pr(B) = p sucesso na Segunda prova

O evento, sucesso em ambas é dado por: Pr (A ∩ B) = Pr (A) . Pr (B) = p . p = p2

Assim, a Probabilidade de sucesso tanto na primeira como na Segunda prova é “p2”. Logo, a Probabilidade de sucesso em todas as 10 provas é “p10”. Se p= 0,8 então a probabilidade de 10 sucessos é “0,8 10” . Podemos afirmar igualmente que a chance de falha nas 10 provas é dado por “(1 – p) 10”. Ou seja, se p= 0,8 então a chance de 10 falhas é de “0,2 10”. Qual é a probabilidade de ocorrerem um sucesso e nove falhas? Para responder essa pergunta, vamos antes responder a seguinte pergunta: Qual a probabilidade de sucesso na primeira prova e falha nas outras nove provas? Esta probabilidade é de 0,8 x 0,2 9 = 4,096 x 10 –7. Agora vamos responder às perguntas: • Qual a probabilidade de sucesso apenas na primeira prova? • Qual a probabilidade de sucesso exatamente em uma das 10 provas? A resposta é Pr (um sucesso) = 10 x 0,8 x 0,2 9 = 4,096 x 10 –6.

Page 97: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

97

Logo a probabilidade dos dois primeiros sucessos e oito falhas subsequentes é: 0,82 x 0,2 8 = 1,638 x 10 -6Veja você quantas maneiras há de escolher 2 entre 10 posições possíveis: 10 10 ! 2 = = 45 2 ! ( 10 – 2 ) ! A probabilidade de exatamente dois sucessos é: 10 2 x 0,8 2 x 0,2 8 = 7,373 x 10 -5 A Distribuição Binomial se aplica a qualquer situação em que se realizam várias provas independentes, cada uma das quais comporta apenas um dentre dois resultados possíveis. Esses dois resultados chamam-se “sucesso”e “falha”. Considere agora, que o experimento seja realizado “n” vezes. Seja “X” o número de sucessos. Se a probabilidade de sucesso de cada prova é “p”, então a probabilidade de “i sucessos” é dado por: Prob ( X = i ) = n i . p i . ( 1 – p ) n - i É importante recordar que: “Um experimento que apresenta apenas dois resultados: “sucesso” ou “falha” é chamado de Prova de Bernoulli. Se E(A) = p então Var (A) = p. (1 – p ) Vejamos a demonstração, para o fato da variável aleatória Z ser igual ao número de sucessos em um determinado dia. Então Z tem apenas dois valores possíveis :

Page 98: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

98

Pr ( Z = 1 ) = p Pr ( Z = 0 ) = 1 – p Vamos então calcular a Variância Var (Z = X)

x Prob x . p(x) x2 x2. p (x) 0 1 – p 0 0 0 1 p p 1 P E (x) = p E (x2) = p

• Var (X) = E (x2) – E2 (x) = p – p2 = p ( 1 – p ) Logo, tratando-se de uma Distribuição Binomial temos: E(X) = E (A1) + E (A2) + E (A3) + ... E (An) = n p Var (X) = Var (A1) + Var (A2) + Var (A3) + ... + Var (An) = n p ( 1 – p ) Exemplo: Um exame de múltipla escolha comporta 20 questões. Cada questão tem quatro respostas possíveis (com apenas uma certa). Há, assim, 0,25 de probabilidade de responder a uma questão corretamente, “por palpite”. Qual a probabilidade de acertar ao menos 10 questões nessas condições? Sabemos então que n = 20 e p = 0,25 Prob ( X = i ) = n i . p i . ( 1 – p ) n - i Prob ( X = k ) = 20 k . 0,25 k. ( 0,75 ) 20 - k

Page 99: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

99

k Pr ( X = k ) k Pr ( X = k ) 0 0,003 6 0,168 1 0,021 7 0,112 2 0,067 8 0,060 3 0,133 9 0,027 4 0,189 10 0,009 5 0,202 11 0,003

A probabilidade de acertar pelo menos 10 questões é igual a 1 – ( 0,021 + 0,067 + ... + 0,009) = 0,012. EXERCÍCIO 30: Calcule a probabilidade de em uma família de quatro crianças (admitindo uma probabilidade de ½ no nascimento de um filho homem ou mulher) haver: a) pelo menos um menino b) pelo menos uma menina e um menino Prob(1 menino) = 4 1 . ( ½) 1 ( 1/2) 4 – 1 = 1/4 Prob(2 meninos)= 4 2 . ( ½) 2 ( 1/2) 4 - 2 = 3/8 Prob(3 meninos)= 4 3 . ( ½) 3 ( 1/2) 4 - 3 = 1/4 Prob(4 meninos)= 4 4 . ( ½) 4 ( 1/2) 4 - 4 = 1/16

Page 100: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

100

Prob (pelo menos 1 menino) = Prob (1 menino) + Prob ( 2 meninos) + Prob (3 meninos) + Prob ( 4 meninos) = Prob (pelo menos 1 menino) = 1/ 4 + 3/8 + 1/4 + 1/16 = 15/16 Prob (pelo menos 1 menino) = 1 - Prob (nenhum menino)= = 1 - ( 1/2 ) 4 = 15/16

Page 101: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

101

TAMANHO DA AMOSTRA

Quando afirmamos que o valor da média amostral não coincide com a média da população, estamos estimando essa média amostral com uma certa margem de erro. Daí a necessidade de trabalhar com Intervalos de Confiança. Quando fixamos a Probabilidade de ( µ ) estar no intervalo, por exemplo, 90%, estamos afirmando que há uma margem de 10% do valor desconhecido não estar no intervalo. Então, ao estabelecer a Probabilidade de acerto estamos automaticamente estabelecendo a Probabilidade de erro. Sendo o erro, por exemplo, igual a 10%, é fácil verificar que as duas caudas da curva de Gauss, para a Distribuição Normal, conterão valores porcentuais que guardam uma simetria, ou seja cada cauda terá um erro de 5%. Chamando então o erro de ( α ) cada cauda terá um erro igual a α/2, sendo o Desvio Padrão Normal Padronizado denominado de Z α/2. Quando trabalhamos com amostras cada vez maiores estamos variando o valor do desvio padrão amostral. Nesse caso podemos afirmar que: x - µ ⎯x - µ Z α/2 = = √ n √ S2 / n S ou ainda: Sx Sx

x - Z α/2 . < µ < x + Z α/2

√ n √ n onde, Sx

Z α/2 = e (erro de estimativa) √ n Da expressão acima podemos tirar o tamanho da amostra que é dado por: 2 Z α/2 . Sx n = e

Page 102: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

102

EXEMPLO: Calcular o tamanho de uma amostra com nível de confiança igual a 95% sabendo que o erro de estimativa é igual a 0,50 e o desvio padrão igual a 2,45. (Observe na tabela que para um nível de confiança igual a 95% temos Z α/2 = 1,96). Então: n = ( 1,96 x 2,45/ 0,50)2 = 92,24 Conclusão: O tamanho da amostra é de 93. (pois “n” é inteiro). EXERCÍCIO 31: Considere uma amostra de 64 elementos cujo desvio padrão é igual a 16. Se o valor da média amostral é igual a 50, estime a média da população ( µ ) considerando um intervalo de confiança com nível de confiança igual a 95%. (Sendo a amostra suficientemente grande, a distribuição é normal e a probabilidade de 95% ao redor da média – de acordo com a tabela – estabelece os valores de desvios padrões normalizados iguais a Z = - 1,96 e Z = + 1,96) x - µ Z α/2 = =

√ S2 / n µx = x + Z α/2 S / √ n µx = 50 + 1,96. 16 / √ 64 µx = 50 + 3,92 Esse resultado nos permite afirmar que estamos 95% seguros que a Média da População se situa entre 46,08 e 53,92.

Page 103: APOST ESTATÍSTICA BASICA PUC

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Curso de Estatística- prof. Dr. José Nicolau Pompeo

103

Bibliografia Consultada:

• Bussab, Wilton O. , Morettin, Pedro A. • Estatística Básica, Atual Editora S A, 2004

• Downing, D. & Clark, J.

• Estatística Aplicada, Ed. Saraiva, 2000

• Kazmier, Leonard J. • Estatística Aplicada à Economia e Administração,

Ed. Mc Graw Hill, 1982

• Spiegel, Murray R. • Estatística, Ed. McGraw Hill do Brasil, 1981

• Wonnacott, Thomas H. • Estatística Aplicada à Economia e Administração

Livros Técnicos e Científicos Editora S A , 1981

• Hoel, Paul G. • Estatística Elementar, Ed. Atlas, 1977

• Lapponi, Juan C.

• Estatística, Laponi Treinamento e Editora, 1977