apostila de estatística - shiguti

110

Click here to load reader

Upload: alexandra-pontes

Post on 26-Jan-2016

132 views

Category:

Documents


74 download

DESCRIPTION

Apostila de estatistica

TRANSCRIPT

Page 1: Apostila de Estatística - Shiguti

Apostila

De

Estatística

Professores: Wanderley Akira Shiguti

Valéria da S. C. Shiguti

Brasília 2003

Page 2: Apostila de Estatística - Shiguti

ÍNDICE INTRODUÇÃO................................................................................................................ 01

UNIDADE I – Conceitos Iniciais em Estatística.............................................................. 05

UNIDADE II – Normas para Construção de Tabelas....................................................... 15

UNIDADE III – Normas para Construção de Gráficos..................................................... 25

UNIDADE IV – Distribuição de Freqüências....................................................................34

UNIDADE V – Medidas de Posição e Separatrizes......................................................... 42

UNIDADE VI – Medidas de Dispersão............................................................................ 56

UNIDADE VII – Medidas de Assimetria e Curtose......................................................... 62

UNIDADE VIII – Introdução à Teoria da Probabilidade................................................. 65

UNIDADE IX – Variáveis Aleatórias............................................................................... 71

UNIDADE X – Distribuições Discretas............................................................................ 85

UNIDADE XI – Distribuição Contínuas........................................................................... 90

UNIDADE XII – Estimação.............................................................................................. 94

UNIDADE XIII – Testes de Significância......................................................................... 97

UNIDADE XIV – Regressão Linear e Correlação.............................................................101

UNIDADE XV – Aplicações no Excel............................................................................. 109

Page 3: Apostila de Estatística - Shiguti

1

INTRODUÇÃO

1.1. PANORAMA HISTÓRICO

• Toda Ciência tem suas raízes na história do homem;

• A Matemática que é considerada “A Ciência que une a clareza do raciocínio à síntese da linguagem”, originou-se do convívio social, das trocas, da contagem, com caracter prático, utilitário e empírico;

• A Estatística é um ramo da Matemática que teve origem semelhante;

• Desde a antigüidade vários povos já registravam o número de habitantes, de nascimento, de óbitos, faziam estimativas de riquezas individuais e sociais, etc;

• Na idade média colhiam-se informações, geralmente com a finalidade tributária;

• A partir do século XVI começaram a surgir as primeiras análises de fatos sociais, como batizados, casamentos, funerais, originando as primeiras tábuas e tabelas e os primeiros números relativos;

• No século XVII o estudo de tais fatos foi adquirindo proporções verdadeiramente científicas;

• Godofredo Achenwall, batizou a nova ciência (ou método) com o nome de ESTATÍSTICA, determinando assim o seu objetivo e suas relações com a ciência.

1.2. MÉTODO

Existem várias definições para métodos, Lakatos e Marconi (1982:39-40) mencionaram diversas definições, entre elas:

• Método é o “caminho pelo qual se chega a um determinado resultado...” (Hegemberg, 1976:II-115)

• Método é “um procedimento regular, explícito e passível de ser repetido para conseguirmos alguma coisa, seja material ou conceitual” (Bunge 1980: 19)

1.3. A ESTATÍSTICA

A definição de estatística não é única, a estatística abrange muito mais do que um simples traçado de gráficos e cálculos de medidas. Uma definição seria:

A estatística é uma coleção de métodos para planejar experimentos, obter dados e organizá-los, resumi-lo, analisá-los interpretá-los e deles extrair conclusões.

1.4. O MÉTODO ESTATÍSTICO

Dois métodos científicos podem destacar o método Experimental e o Método Estatístico.

O método experimental consiste em manter constante todas as causas (fatores) menos uma e variar esta causa de modo que o pesquisador possa descobrir seus efeitos caso existam.

O método estatístico diante da impossibilidade de se manter causas constantes, admite todas essas causas presentes variando-as registrando essa variação e procurando determinar no resultado final que influências cabem a cada uma delas.

Page 4: Apostila de Estatística - Shiguti

2

RESUMO DA PROFISSÃO

O Estatístico promove o levantamento de pesquisas estatísticas em suas aplicações técnicas e científicas, investigando, elaborando e testando métodos matemáticos e sistema de amostragem, bem como coletando, analisando e interpretando os dados relacionados com os fenômenos estatísticos, e ainda estudando e renovando a metodologia estatística a fim de estabelecer a sua evolução e desenvolvimento

ALGUMAS ESPECIALIZAÇÕES

Vinculam-se aos campos profissionais que exigem ou permitem o exercício do estatístico. Resultam da prática profissional e decorrem quase sempre da demanda decorrente no mercado de trabalho.

Demografia

Bioestatística

Estatístico Matemático

Estatístico de Estatística Aplicada, Etc.

CARGOS PROCURADOS

Estatístico

Estatístico Matemático

Estatístico de Estatística Aplicada

1.5. A NATURZA DA ESTATÍSTICA

Podemos descrever duas variáveis para um estudo:

VARIÁVEL QUALITATIVA – (ou dados categóricos) podem ser separados em diferentes categorias, atributos, que se distinguem por alguma característica não numérica.

VARIÁVEL QUANTITATIVA – consistem em números que representam contagens ou medidias. Dividem-se em:

VARIÁVEIS QUANT. DISCRETAS – resultam de um conjunto finito, enumerável de valores possíveis. Ex: número de filhos.

VARIÁVEIS QUANT. CONTÍNUAS – resultam de números infinitos de valores possíveis que podem ser associados a pontos em uma escala contínua. Ex: peso, altura.

Medida de Desobediência

Como coletar dados sobre algo que não se apresente mensurável, como o nível de desobediência do povo? O psicólogo Stanley Milgran planejou o seguinte experimento: Um pesquisador determinou que um voluntário acionasse um painel de controle que dava choques elétricos crescentemente dolorosos em uma terceira pessoa. Na realidade, não eram dados choques e a terceira pessoa era um ator. O voluntário começou com 15 volts e foi orientado a aumentar os choques de 15 em 15 volts. O nível de desobediência era o ponto em que a pessoa se recusava a aumentar a voltagem. Surpreendentemente, dois terços dos voluntários obedeceram às ordens mesmo que o ator gritasse e simulasse um ataque cardíaco.

Page 5: Apostila de Estatística - Shiguti

3

Texto extraído do livro: Tiola, Mario F. . Introdução à Estatística. 7ª ed. Rio de Janeiro – RJ. LTC. 1999.

1.6. USOS E ABUSOS DA ESTATÍSTICA

USOS DA ESTATÍSTICA

As Aplicações da estatística se desenvolveram de tal forma que, hoje, praticamente todo o campo de estudo se beneficia da utilização de métodos estatísticos. Os fabricantes fornecem melhores produtos a custos menores através de técnicas de controle de qualidade. Controlam-se doenças com o auxilio de análises que antecipam epidemias. Espécies ameaçadas são protegidas por regulamentos e leis que reagem a estimativas estatísticas de modificação de tamanho da população. Visando reduzir as taxas de casos fatais, os legisladores têm melhor justificativas para leis como as que regem a poluição atmosférica, inspeções de automóveis, utilização de cinto de segurança, etc.

ABUSOS DA ESTATÍSTICA

Não é de hoje que ocorrem abusos com a estatística. Assim é que , há cerca de um século, o estadista Benjamin Disraeli disse: “Há três tipos de mentiras: as mentiras, as mentiras sérias e as estatísticas”. Já se disse também que “os números não mentem; mas os mentirosos forjam os números” (Figures don’t lie; liars figure) e que “se torturarmos os dados por bastante tempo, eles acabam por admitir qualquer coisa”. O historiador Andrew Lang disse que algumas pessoas usam a estatística “como um bêbado utiliza um poste de iluminação – para servir de apoio e não para iluminar”. Todas essa afirmações se referem aos abusos da estatística quando os dados são apresentados de forma enganosa. Eis alguns exemplos das diversas maneiras como os dados podem ser distorcidos.

Pequenas amostras

Números imprecisos

Estimativas por suposição

Porcentagens distorcidas

Cifras parciais

Distorções deliberadas

Perguntas tendenciosas

Gráficos enganosos

Pressão do pesquisador

Más amostras

Os motoristas mais Idosos são mais Seguros do que os mais Moços?

A American Association of Retired People – AARP (Associação Americana de Aposentados) alega que os motoristas mais idosos se envolvem em menor número de acidentes do que os mais jovens. Nos últimos anos, os motoristas com 16-19 anos de idades causaram cerca de 1,5 milhões de acidentes em comparação com apenas 540.000 causados por motoristas com 70 anos ou mais, de forma que a alegação da AARP parece válida. Acontece, entretanto que os motoristas mais idosos não dirigem tanto quanto os mais jovens. Em lugar de considerar apenas o número de acidentes, devemos examinar também as taxas de acidentes. Eis as taxas de acidentes por 100 milhões de milhas percorridas: 8,6 para motoristas com idade de 16 a 19, 4,6 para os com idade de 75 a 79, 8,9 para os com idade 80 a 84 e 20,3 para os motoristas com 85 anos de idade ou mais. Embora os motoristas mais jovens tenham de fato o maior número de acidentes, os mais velhos apresentam as

Page 6: Apostila de Estatística - Shiguti

4

mais altas taxas de acidente.

Texto extraído do livro: Tiola, Mario F. . Introdução à Estatística. 7ª ed. Rio de Janeiro – RJ. LTC. 1999.

1.7. ESTATÍSTICA DEDUTIVA E INDUTIVA

A estatística dedutiva também conhecida como Descritiva se encarrega de descrever o conjunto de dados desde a elaboração da pesquisa até o cálculo de determinada medida.

A estatística Indutiva ou inferencial está relacionada a incerteza. Inicia-se no cálculo das Probabilidades e se desenvolve por todo a área da inferência.

Page 7: Apostila de Estatística - Shiguti

5

UNIDADE I – CONCEITOS INICIAIS EM ESTATÍSTICA DEFINIÇÕES:

POPULAÇÃO: É um conjunto de indivíduos ou objetos que apresentam pelo menos uma característica em comum.

CENSO – é a coleção de dados relativos a todos os elementos da população.

AMOSTRA: Considerando a impossibilidade, na maioria das vezes do tratamento de todos os elementos da população, necessitaremos de uma parte representativa da mesma. A esta porção da população chamaremos de amostra.

ESTATÍSTICA: é a medida numérica que descreve uma característica da amostra.

PARÂMETRO – é a medida numérica que descreve uma característica da população.

RAMOS DA ESTATÍSTICA

A estatística possui três ramos principais:

ESTATÍSTICA DESCRITIVA: envolve a organização e sumarização dos dados através de metodologias simples;

TEORIA DA PROBABILIDADE: que proporciona uma base racional para lidar com situações influenciadas por fatores que envolvem o acaso.

TEORIA DA INFERÊNCIA: que envolve a análise e interpretações da amostra.

ESTATÍSTICA DESCRITIVA

A Estatística Descritiva pode ser resumida no diagrama a seguir:

Coleta de dados

Crítica dos dados

Apresentação dos dados

Tabelas

Gráficos

Análise

Page 8: Apostila de Estatística - Shiguti

6

COLETA DOS DADOS:

Após a definição do problema a ser estudado e o estabelecimento do planejamento da pesquisa (forma pela qual os dados serão coletados; cronograma das atividades; custos envolvidos; exame das informações disponíveis; delineamento da amostra, etc.), o passo seguinte é a coleta dos dados, que consiste na busca ou compilação dos dados das variáveis, componentes do fenômeno a ser estudado.

A coleta dos dados é direta quando os dados são obtidos diretamente da fonte originária, como no caso da empresa que realiza uma pesquisa para saber a preferência dos consumidores pela sua marca.

A coleta dos dados é indireta quando é inferida a partir dos elementos conseguidos pela coleta direta.

CRÍTICA DOS DADOS

A revisão crítica dos dados procede com a finalidade de suprimir os valores estranhos ao levantamento, os quais são capazes de provocar futuros enganos.

APRESENTAÇÃO DOS DADOS

Convém organizarmos o conjunto de dados de maneira prática e racional. Tal organização denomina-se Série Estatística (que será abordado na próxima unidade). Sua apresentação pode ocorrer por meio de Tabelas e/ou Gráficos.

TÉCNICAS DE AMOSTRAGEM

As regras de Amostragem podem ser classificadas em duas categorias gerais:

PROBABILÍSTICA - São amostragem em que a seleção é aleatória de tal forma que cada elemento tem igual probabilidade de ser sorteado para a amostra.

NÃO-PROBABILISTICAS OU INTENCIONADAS - São amostragem em que há uma escolha deliberada dos elementos da amostra.

TIPOS DE AMOSTRAGEM

AMOSTRAGEM ALEATÓRIA SIMPLES

Também conhecida por amostragem ocasional, acidental, casual, randômica, etc. A amostragem simples ao acaso destaca-se por ser um processo de seleção bastante fácil e muito usado. Neste processo, todos os elementos da população têm igual probabilidade de serem escolhidos, desde o início até completo processo de coleta.

Page 9: Apostila de Estatística - Shiguti

7

PROCEDIMENTO

1. Devemos enumerar todos os elementos da população

2. Devemos efetuar sucessivos sorteios com reposição até completar o tamanho da amostra (n)

Para realizarmos este sorteio devemos fazer uso das “tábuas de números aleatórios” (veja página seguinte). Estas apresentam os dígitos de 0 a 9 distribuídos aleatoriamente.

EXEMPLO:

Supor que nós tenhamos uma população com 1.000 elementos, que numeramos de 000 a 999, para selecionarmos uma amostra aleatória, de 200 elementos, basta escolhermos uma posição de qualquer linha e extrairmos conjuntos de três algarismos, até completarmos os 200 elementos da amostra. O processo termina quando for sorteado o elemento 200. Se o número sorteado não existia na população simplesmente não o consideramos, e prosseguimos com o processo.

AMOSTRAGEM SISTEMÁTICA

Trata-se de uma variação da amostragem simples ao acaso, muito conveniente quando a população está naturalmente ordenada, como fichas em um fichário, listas telefônicas etc. Requer uma lista dos itens da população, e , assim, padece das mesmas restrições já mencionadas na aleatória ao acaso. Se os itens da lista não se apresentarem numa ordem determinada a amostragem Sistemática pode dar uma amostra realmente aleatória.

PROCEDIMENTO

Sejam os seguintes elementos:

N: tamanho da população;

n: tamanho da amostra.

Então, calcula-se o intervalo de amostragem através da razão nNa = (onde a é o inteiro mais próximo).

Sorteia-se, utilizando a tábua de números aleatórios, um número x entre 1 e a formando-se a amostra dos elementos correspondentes ao conjunto de números:

x; x+a;x+2a;...; x+(n-1)a.

EXEMPLO: Seja N = 500, n = 50. Então 1050500 ==a

Sorteia-se um número de 1 a 10. Seja 3 (x = 3) o número sorteado. Logo, os elementos numerados por 3;13;23;33;... serão os componentes da amostra.

AMOSTRAGEM ESTRATIFICADA

No caso de possuir uma população com uma certa característica heterogênea, na qual podemos distinguir subpopulações mais ou menos homogêneas, denominadas de estratos, podemos usar a amostragem estratificada.

Estratificar uma população em L subpopulações denominada estratos, tais que:

Page 10: Apostila de Estatística - Shiguti

8

n1 + n2 + ... + nL = n

onde os estratos são mutuamente exclusivos.

Após a determinação dos estratos, seleciona-se uma amostra aleatória de cada sub-população.

Se as diversas sub-amostras tiverem tamanhos proporcionais ao respectivo número de elementos nos estratos, teremos a estratificação proporcional.

Page 11: Apostila de Estatística - Shiguti

9

Stevenson, William J. Estatística aplicada à administração. Harper & Row do Brasil, São Paulo, 1986, p.165

Page 12: Apostila de Estatística - Shiguti

10

EXERCÍCIOS

1. População ou universo é: a) Um conjunto de pessoas; b) Um conjunto de elementos quaisquer c) Um conjunto de pessoas com uma característica comum; d) Um conjunto de elementos com pelo menos uma característica em comum; e) Um conjunto de indivíduo de um mesmo município, estado ou país.

2. Uma parte da população retirada para analisá-la denomina-se:

a) Universo; b) Parte; c) Pedaço; d) Dados Brutos; e) Amostra.

3. A parte da estatística que se preocupa somente com a descrição de determinadas características de um

grupo, sem tirar conclusões sobre um grupo maior denomina-se: a) Estatística de População; b) Estatística de Amostra; c) Estatística Inferencial d) Estatística Descritiva; e) Estatística Grupal.

4. Diga qual tipo de variáveis estamos trabalhando nos casos abaixo:

a. No. de inscrições no Seguro Social

b. No. de passageiros no ônibus da linha Rio-São Paulo

c. Escolaridade

d. Peso Médio dos Recém Nascidos

e. Altitude acima do nível do mar

f. Uma pesquisa efetuada com 1015 pessoas indica que 40 delas são assinantes de um serviço de

computador on-line

g. Cada cigarro Camel tem 16,13mg de alcatrão

h. O radar indique que Nolan Ryan rebateu a ultima bola a 82,3mi/h

i. O tempo gasta para uma pessoa fazer uma viagem de carro de Brasília até Belo Horizonte é de

aproximadamente 8:00h a uma velocidade média de 93,75km/hs

5. Classifique as seguintes variáveis:

a) Cor dos olhos i) Qualitativa; ii) Qualitativa discreta; iii) Quantitativa contínua; iv) Quantitativa discreta; v) Qualitativa contínua.

Page 13: Apostila de Estatística - Shiguti

11

b) Número de filhos de um casal:

i) Qualitativa; ii) Qualitativa discreta; iii) Quantitativa contínua; iv) Quantitativa discreta; v) Qualitativa contínua.

c) Peso de um indivíduo:

i) Qualitativa; ii) Qualitativa discreta; iii) Quantitativa contínua; iv) Quantitativa discreta; v) Qualitativa contínua.

d) Altura de um indivíduo:

i) Qualitativa; ii) Qualitativa discreta; iii) Quantitativa contínua; iv) Quantitativa discreta; v) Qualitativa contínua.

e) Número de alunos de uma escola:

i) Qualitativa; ii) Qualitativa discreta; iii) Quantitativa contínua; iv) Quantitativa discreta; v) Qualitativa contínua.

f) Tipo sangüíneo:

i) Qualitativa; ii) Qualitativa discreta; iii) Quantitativa contínua; iv) Quantitativa discreta; v) Qualitativa contínua.

g) Fator RH:

i) Qualitativa; ii) Qualitativa discreta; iii) Quantitativa contínua; iv) Quantitativa discreta; v) Qualitativa contínua.

h) Valor obtido na face superior de um dado:

i) Qualitativa; ii) Qualitativa discreta; iii) Quantitativa contínua; iv) Quantitativa discreta; v) Qualitativa contínua.

i) Sexo:

i) Qualitativa; ii) Qualitativa discreta; iii) Quantitativa contínua; iv) Quantitativa discreta; v) Qualitativa contínua.

Page 14: Apostila de Estatística - Shiguti

12

j) Resultado da extração da loteria Federal:

i) Qualitativa; ii) Qualitativa discreta; iii) Quantitativa contínua; iv) Quantitativa discreta; v) Qualitativa contínua.

k) Comprimento de um seguimento de reta:

i) Qualitativa; ii) Qualitativa discreta; iii) Quantitativa contínua; iv) Quantitativa discreta; v) Qualitativa contínua.

l) Área de um Círculo:

i) Qualitativa; ii) Qualitativa discreta; iii) Quantitativa contínua; iv) Quantitativa discreta; v) Qualitativa contínua.

m) Raça:

i) Qualitativa; ii) Qualitativa discreta; iii) Quantitativa contínua; iv) Quantitativa discreta; v) Qualitativa contínua.

n) Quantidade de livro de uma biblioteca:

i) Qualitativa; ii) Qualitativa discreta; iii) Quantitativa contínua; iv) Quantitativa discreta; v) Qualitativa contínua.

o) Religião:

i) Qualitativa; ii) Qualitativa discreta; iii) Quantitativa contínua; iv) Quantitativa discreta; v) Qualitativa contínua.

p) Salário dos Empregados de uma empresa:

i) Qualitativa; ii) Qualitativa discreta; iii) Quantitativa contínua; iv) Quantitativa discreta; v) Qualitativa contínua.

q) Estado Civil:

i) Qualitativa; ii) Qualitativa discreta; iii) Quantitativa contínua; iv) Quantitativa discreta; v) Qualitativa contínua.

Page 15: Apostila de Estatística - Shiguti

13

r) Profissão:

i) Qualitativa; ii) Qualitativa discreta; iii) Quantitativa contínua; iv) Quantitativa discreta; v) Qualitativa contínua.

s) Volume de água contido numa piscina:

i) Qualitativa; ii) Qualitativa discreta; iii) Quantitativa contínua; iv) Quantitativa discreta; v) Qualitativa contínua.

6. Suponha que existem N = 1.000 fichas de pacientes das quais uma amostra aleatória de n = 20 deve ser

selecionada. Determine que fichas devem ser escolhidas na amostra de tamanho n = 20. Diga que tipo de amostragem foi feito e como foram selecionadas as fichas.

7. Suponha que uma pesquisa de opinião pública deve ser realizada em um estado que tem duas grandes

cidades e uma zona rural. Os elementos na população de interesse são todos os homens e mulheres do estado com idade acima de 21 anos. Diga que tipo de amostragem utilizaremos?

8. Serviço florestal do estado está conduzindo um estudo das pessoas que usam as estruturas de um camping

operado por ele. O estado tem duas áreas de camping, uma localizada nas montanhas e outra localizada ao longo da costa. O serviço florestal deseja estimar o número médio de pessoas por acampamento e a proporção de acampamento ocupada por pessoas de fora do estado, durante o fim de semana em particular, quando se espera que todos os acampamentos estejam ocupados. Sugira um plano amostral e explique rapidamente como devem ser feitos.

9. Um médico está interessado em obter informação sobre o número médio de vezes em que 15.000

especialistas prescreveram certa droga no ano anterior (N = 15.000). Deseja-se obter n = 1.600. Que tipo de amostragem você sugeriria e por que?

10. Um hematologista deseja fazer uma nova verificação de uma amostra de n = 10 dos 854 espécimes de

sangue analisados por um laboratório médico em um determinado mês. Que tipo de amostragem você sugeriria e por que?

11. Um repórter da revista Business Week obtém uma relação numerada de 1.000 empresas com maiores de

cotações de ações na bolsa. Ele entrevistará 100 gerentes gerais das empresas correspondentes a esta amostra. Que tipo de amostragem você sugeriria e por que?

12. Comente rapidamente sobre a pesquisa abaixo

“Um relatório patrocinado pela Flórida Citrus Comission concluiu que os níveis de colesterol podem ser

reduzidos mediante ingestão de produtos cítricos.”

Por que razão a conclusão poderia ser suspeita

13. Dada uma população com seis elementos, A, B, C, D, E e F, explique como você faria para obter, dessa

população, uma amostra aleatória simples com três elementos.

Page 16: Apostila de Estatística - Shiguti

14

14. Descreva uma forma de se obter uma amostra sistemática com 10 elementos de uma população com

tamanho 100.

15. Explique a forma de se obter uma amostragem estratificada dos empregados de uma firma, considerando

que existem empregados de escritório, de oficina e representantes da mesma.

16. Imagine que se pretenda fazer um levantamento de opinião pública para verificar se as pessoas são contra ou

a favor do uso gratuito de ônibus pelos idosos. Pense em três maneiras distintas de elaborar uma pergunta

que induza a resposta positiva, outra que induza a resposta negativa e uma outra que não ocorra nenhum tipo

de tendência na resposta.

17. Identifique o tipo de amostragem utilizado para cada uma das situações abaixo:

a. Quando escreveu Woman in Love: A Cultural Revolution, a autora Shere Hite baseou suas

conclusões em 4.500 respostas a 100.000 questionários distribuídos a mulheres.

b. Uma psicóloga da Universidade de Nova York faz uma pesquisa sobre alguns alunos

selecionados aleatoriamente de todas as 20 turmas que participaram desta pesquisa.

c. Um sociólogo da Universidade Charleston seleciona 12 homens e 12 mulheres de cada uma de

quatro turmas de inglês.

d. A empresa Sony seleciona cada 200o CD de sua linha de produção e faz um teste de qualidade

rigoroso.

e. Um cabo eleitoral escreve o nome de cada senador dos EUA em cartões separados, mistura-os

e extrai 10 nomes.

f. Gerente comercial da America OnLine testa uma nova estratégia de vendas selecionando

aleatoriamente 250 consumidores com renda inferior a US$50.000,00 e 250 consumidores com

renda de ao menos de US$50.000,00.

g. O programa Planned Parenthood (Planejamento Familiar) pesquisa 500 homens e 500

mulheres sobre seus pontos de vista sobre o uso de anticoncepcionais.

h. Um repórter da revista Business Week Entrevista todo o 50o gerente geral constante da relação

das 1.000 empresas com maior cotação de suas ações.

i. Um repórter da revista Business Week obtém uma relação numerada das 1.000 empresas com

maior cotação de ações na bolsa, utiliza um computador para gerar 20 números aleatórios e

então entrevista gerentes gerais das empresas correspondentes aos números extraídos.

Page 17: Apostila de Estatística - Shiguti

15

UNIDADE II - NORMAS PARA CONSTRUÇÃO DE TABELAS

TABELAS ESTATÍSTICAS

Um dos objetivos da estatística é sintetizar os valores que uma ou mais variáveis podem assumir, para que tenhamos uma visão global da variação das mesmas.

Tabela é uma maneira de apresentar de forma resumida um conjunto de dados.

ELEMENTOS DE UMA TABELA

A tabela se apresenta da seguinte forma:

TÍTULO DA TABELA

CORPO

DA

TABELA

RODAPÉ

Page 18: Apostila de Estatística - Shiguti

16

EXEMPLO:

Tabela 1 – Produção de Café Brasil – 1991 a 1995

Anos Produção (1.000 t)

1991 2.535 1992 2.666 1993 2.122 1994 3.750 1995 2.007

Fonte: IBGE TÍTULO DA TABELA:

Conjunto de informações, as mais completas possíveis, respondendo às perguntas: O que?, Quando? e Onde?, localizado no topo da tabela, além de conter a palavra “TABELA” e sua respectiva numeração.

CORPO DA TABELA:

É o conjunto de Linhas e Colunas que contém informações sobre a variável em estudo.

a) Cabeçalho da Coluna – Parte superior da tabela que especifica o conteúdo das colunas;

b) Coluna Indicadora – Parte da tabela que especifica o conteúdo das linhas;

c) Linhas – retas imaginárias que facilitam a leitura, no sentido horizontal, de dados que se inscrevem nos seus cruzamentos com as linhas;

d) Casa ou Célula – espaço destinado a um só número;

e) Total – deve ser SEMPRE destacado de alguma forma;

f) Laterais da tabela – não devem ser fechadas. Caso as feche, passa a ser chamada de “QUADRO”.

g) Número – preferencialmente utilizar separador de 1000 (por exemplo: 1.854.985 ao invés de 1854985).

Há ainda a considerar os elementos complementares da tabela, que são a fonte, as notas, e as chamadas, localizadas, de preferência, no rodapé.

a) Fonte – identifica o responsável (pessoa física ou jurídica) ou responsável pelos dados numéricos;

b) Notas – é o texto que irá esclarecer o conteúdo estudado, que poderá ser de caráter geral ou específico de uma tabela;

c) Chamadas – símbolo remissivo atribuído a algum elemento de uma tabela que necessita de uma nota específica.

SINAL CONVENCIONAL:

A substituição de uma informação da tabela, poderá ser feita pelos sinais abaixo:

a) - dado numérico igual a zero;

b) ... quando não temos os dados;

c) ? quando temos dúvida na informação;

d) 0 quando o valor for muito pequeno.

Page 19: Apostila de Estatística - Shiguti

17

SÉRIES ESTATÍSTICAS

Introdução

Uma vez que os dados foram coletados, muitas vezes o conjunto de valores é extenso e desorganizado, e seu exame requer atenção, pois há o risco de se perder a visão global do fenômeno analisado. Para que isto não ocorra faz-se necessário reunir os valores em tabelas convenientes, facilitando sua compreensão.

Além da apresentação do conjunto de valores na forma tabulada, tem-se também a forma gráfica, que por sua vez, representa uma forma mais útil e elegante de representar o conjunto dos valores.

Qualquer que seja a forma de representação do conjunto de valores, desde de que não haja alterações em seus valores iniciais, quer seja o de caracterização de um conjunto, ou de comparação com outros semelhantes ou ainda o de previsão de valores possíveis, facilitará sua compreensão de qualquer estudo. É o caso da série estatística.

Definição de Série Estatística

Uma série estatística define-se como toda e qualquer coleção de dados estatísticos referidos a uma mesma ordem de classificação: QUANTITATIVA. Em um sentido mais amplo, SÉRIE é uma seqüência de números que se refere a uma certa variável.

Caso estes números expressem dados estatísticos a série é chamada de série estatística. Em um sentido mais restrito, diz-se que uma série estatística é uma sucessão de dados estatísticos referidos a caracteres quantitativos.

Para diferenciar uma série estatística de outra, temos que levar em consideração três fatores:

◊ A ÉPOCA (fator temporal ou cronológico) a que se refere o fenômeno analisado;

◊ O LOCAL (fator espacial ou geográfico) onde o fenômeno acontece;

◊ O FENÔMENO (espécie do fator ou fator específico) que é descrito.

Tipos de Séries Estatísticas

São quatro os tipos de séries estatísticas conforme a variação de um dos fatores:

SÉRIE TEMPORAL

A série temporal, igualmente chamada série cronológica, histórica, evolutiva ou marcha, identifica-se pelo caráter variável do fator cronológico. Assim deve-se ter:

VARIÁVEL: a época

FIXO: o local e o fenômeno

SÉRIE GEOGRÁFICA

Também denominada série territorial, espacial ou de localização, esta série apresenta como elemento ou caráter variável somente o fator local. Assim:

Page 20: Apostila de Estatística - Shiguti

18

VARIÁVEL: o local

FIXO: a época e o fenômeno

SÉRIE ESPECÍFICA

A série específica recebe também outras denominações tais como série categórica ou série por categoria. Agora o caráter variável é o fenômeno.

VARIÁVEL: o fenômeno

FIXO: a época e o local

DISTRIBUIÇÃO DE FREQÜÊNCIA

Neste caso todos os elementos (época, local e fenômeno) são fixos. Embora fixo, o fenômeno apresenta-se agora através de graduações, isto é, os dados referentes ao fenômeno que se está representando são reunidos de acordo com a sua magnitude. Normalmente os problemas de tabulação são enquadrados neste tipo de série, que iremos estudar com maior detalhe mais adiante neste curso.

Proporção, Porcentagem e Razão

Introdução

Do ponto de vista estatístico, estas podem ser consideradas como medidas muito simples que permitem estabelecer comparações entre diversos grupos.

Proporção

Considere um número de empregados que foi distribuído em quatro repartições de uma certa empresa de acordo com sua função. Estas repartições são mutuamente exclusivas (cada pessoa somente poderá ser alocada em uma única repartição) e exaustivas (todas as pessoas deverão ser alocadas).

Em termos simbólicos podemos escrever:

N1 = número de pessoas alocadas na repartição 1

N2 = número de pessoas alocadas na repartição 2

N3 = número de pessoas alocadas na repartição 3

N4 = número de pessoas alocadas na repartição 4

N = N1 + N2 + N3 + N4 = número total de empregados

Neste caso, a proporção de empregados pertencentes à primeira repartição é determinada

mediante o cálculo do quociente NN

1 ; para as demais repartições segue o mesmo procedimento: NN

2 , NN

3 e

NN

4 .

Note que o valor de uma proporção não pode exceder a unidade, e que a soma de todas as proporções será sempre igual à unidade. Assim,

NN

NN

NN

NN

NN

1 2 3 4 1+ + + = =

Page 21: Apostila de Estatística - Shiguti

19

Exemplo:

Tabela 01. Número de empregados contratados (consultores) e com carteira assinada em dois órgãos públicos

EMPREGADO ÓRGÃO PÚBLICO 1 ÓRGÃO PÚBLICO 2CONSULTOR:

TEMPO INTEGRAL 580 680 MEIO EXPEDIENTE 430 1.369

CARTEIRA ASSINADA 4.810 10.811 TOTAL 5.820 12.860

FONTE: Departamento de Recursos Humanos destes Órgãos Públicos

Não é simples raciocinar em termos absolutos e dizer qual dos dois órgãos públicos conta com maior número de empregados consultores em suas duas modalidades de expedientes porque o número total de empregados difere muito entre si. Por outro lado, a comparação direta pode ser estabelecida rapidamente, se os dados forem expressos em proporções.

A proporção de consultores com tempo integral no órgão público 1 é:

NN

1 5805 820

0 099 0 1= = ≅.

, ,

E no órgão público 2, seguindo o mesmo raciocínio temos:

NN

1 68012 860

0 0528 0 053= = ≅.

, ,

Note que, em números absolutos, estes valores são muito próximos (580 e 680). Entretanto, o órgão público 2 apresenta uma proporção inferior de consultores com tempo integral.

Analogamente, fazendo os cálculos para ambos os órgãos públicos, têm:

◊ ÓRGÃO PÚBLICO 1

◊ Consultores com ½ expediente: NN

2 4305 820

0 0738 0 074= = ≅.

, ,

◊ Carteira assinada: NN

3 4 8105 820

0 8264 0 826= = ≅..

, ,

◊ ÓRGÃO PÚBLICO 2

◊ Consultores com ½ expediente: NN

2 136912 860

0 1064 0 106= = ≅..

, ,

◊ Carteira assinada: NN

3 10 81112860

0 8406 0 841= = ≅. , ,

Assim, temos a seguinte tabela de proporções:

Tabela 02. Proporção de empregados contratados (consultores) e com carteira assinada em dois órgãos públicos

Page 22: Apostila de Estatística - Shiguti

20

EMPREGADO ÓRGÃO PÚBLICO 1 ÓRGÃO PÚBLICO 2CONSULTOR:

TEMPO INTEGRAL 0,100 0,053 MEIO EXPEDIENTE 0,074 0,106

CARTEIRA ASSINADA 0,826 0,841 TOTAL 1 1

FONTE: Departamento de Recursos Humanos destes Órgãos Públicos

Porcentagem

As porcentagens são obtidas a partir do cálculo das proporções, simplesmente multiplicando-se o quociente obtido por 100. A palavra porcentagem significa, portanto, “por cem”. Uma vez que a soma das proporções é igual a 1, a soma das porcentagens é igual a 100, a menos que as categorias não sejam mutuamente exclusivas e exaustivas.

Exemplo: Utilizando os dados do exemplo anterior e multiplicando as proporções por 100 teremos a seguinte tabela:

Tabela 03. Percentual de empregados contratados (consultores) e com carteira assinada em dois órgãos públicos

EMPREGADO ÓRGÃO PÚBLICO 1 ÓRGÃO PÚBLICO 2ABSOLUTO RELATIVO (%) ABSOLUTO RELATIVO (%)

CONSULTOR:TEMPO INTEGRAL 580 10,0 680 5,3 MEIO EXPEDIENTE 430 7,4 1.369 10,6

CARTEIRA ASSINADA 4.810 82,6 10.811 84,1 TOTAL 5.820 100 12.860 100

FONTE: Departamento de Recursos Humanos destes Órgãos Públicos

As porcentagens e proporções, em Estatística, têm como principal finalidade estabelecer comparações relativas. Como um outro exemplo, as vendas de duas empresas foram as seguintes em dois anos consecutivos:

Tabela 4. Faturamento anual das Empresas A e B em 1994 e 1995 dado em números absoluto e relativo

(%)

EMPRESA FATURAMENTO (por 1.000 reais) CRESCIMENTO CRESCIMENTO

1994 1995 ABSOLUTO RELATIVO (%)

A 2.000 3.000 1.000 50

B 20.000 25.000 5.000 25

FONTE: Departamento de Finanças das Empresas A e B

Em valores absolutos, a empresa B teve um crescimento no faturamento maior que a empresa A. Contudo, na realidade, comparando estes valores em termos percentuais, a empresa A foi a que apresentou um desempenho superior (crescimento de 50% na empresa A e de 25% na empresa B).

Razão

A razão de um número A em relação a outro número B define-se como “A dividido por B” A quantidade precedente é posta no numerador e a seguinte, no denominador.

Page 23: Apostila de Estatística - Shiguti

21

Exemplo: Através de uma pesquisa realizada em uma certa cidade, descobriu-se que, das pessoas entrevistadas, 300 se manifestaram a favor a uma determinada medida adotada pela prefeitura local, 400 contra e 70 eram indiferentes. Neste caso, a razão daquelas pessoas contra a medida para aquelas a favor foi de:

400300

43

4 3 1 33 1 ou ou ou para : ,

E a razão daquelas a favor e contra para aquelas indiferentes foi de:

( )400 30070

707

7 1+

ou ou 70 ou 10 para :

EXERCÍCIOS

1. Uma série estatística é denominada evolutiva quando? a) O elemento variável é o tempo; b) O elemento variável é o local; c) O elemento variável é a espécie; d) É o resultado da combinação de séries estatísticas de tipos diferentes; e) Os dados são agrupados em subintervalos do intervalo observado.

2. Uma série estatística é denominada espacial quando? f) O elemento variável é o tempo; g) O elemento variável é o local; h) O elemento variável é a espécie; i) É o resultado da combinação de séries estatísticas de tipos diferentes; j) Os dados são agrupados em subintervalos do intervalo observado.

3. Uma série estatística é denominada cronológica quando?

a) O elemento variável é o tempo; b) O elemento variável é o local; c) O elemento variável é a espécie; d) É o resultado da combinação de séries estatísticas de tipos diferentes; e) Os dados são agrupados em subintervalos do intervalo observado.

4. Uma série estatística é denominada categórica quando?

a) O elemento variável é o tempo; b) O elemento variável é o local; c) O elemento variável é a espécie; d) É o resultado da combinação de séries estatísticas de tipos diferentes; e) Os dados são agrupados em subintervalos do intervalo observado.

5. Uma série estatística é denominada marcha quando?

a) O elemento variável é o tempo; b) O elemento variável é o local; c) O elemento variável é a espécie; d) É o resultado da combinação de séries estatísticas de tipos diferentes; e) Os dados são agrupados em subintervalos do intervalo observado.

6. Uma série estatística é denominada geográfica quando?

a) O elemento variável é o tempo; b) O elemento variável é o local; c) O elemento variável é a espécie; d) É o resultado da combinação de séries estatísticas de tipos diferentes; e) Os dados são agrupados em subintervalos do intervalo observado.

7. Uma série estatística é denominada composta quando?

a) O elemento variável é o tempo;

Page 24: Apostila de Estatística - Shiguti

22

b) O elemento variável é o local; c) O elemento variável é a espécie; d) É o resultado da combinação de séries estatísticas de tipos diferentes; e) Os dados são agrupados em subintervalos do intervalo observado.

8. Uma série estatística é denominada qualitativa quando?

a) O elemento variável é o tempo; b) O elemento variável é o local; c) O elemento variável é a espécie; d) É o resultado da combinação de séries estatísticas de tipos diferentes; e) Os dados são agrupados em subintervalos do intervalo observado.

9. Uma série estatística é denominada específica quando?

a) O elemento variável é o tempo; b) O elemento variável é o local; c) O elemento variável é a espécie; d) É o resultado da combinação de séries estatísticas de tipos diferentes; e) Os dados são agrupados em subintervalos do intervalo observado.

10. Uma série estatística é denominada mista quando?

a) O elemento variável é o tempo; b) O elemento variável é o local; c) O elemento variável é a espécie; d) É o resultado da combinação de séries estatísticas de tipos diferentes; e) Os dados são agrupados em subintervalos do intervalo observado.

11. Uma série estatística é denominada Temporal quando?

a) O elemento variável é o tempo; b) O elemento variável é o local; c) O elemento variável é a espécie; d) É o resultado da combinação de séries estatísticas de tipos diferentes; e) Os dados são agrupados em subintervalos do intervalo observado.

12. A representação tabular de dados no Brasil obedece as normas

a) Da SUNAB; b) Da Receita Federal; c) Do IBGE; d) Do Governo Federal; e) Da Secretaria Municipal de Estatística.

13. De acordo com as normas para representação tabular de dados, quando o valor de um dado é zero, deve-se colocar na célula correspondente:

a) Zero (0); b) Três pontos (...); c) Um traço horizontal (-) d) Um ponto de interrogação (?); e) Um ponto de exclamação (!).

14. De acordo com as normas para representação tabular de dados, quando o valor de um dado é não está disponível, deve-se colocar na célula correspondente.

a) Zero (0); b) Três pontos (...); c) Um traço horizontal (-) d) Um ponto de interrogação (?); e) Um ponto de exclamação (!).

Page 25: Apostila de Estatística - Shiguti

23

15. De acordo com as normas para representação tabular de dados, quando o valor de um dado é muito pequeno, para ser expresso com o número de casa decimais utilizadas ou com a unidade de medida utilizada, deve-se colocar na célula correspondente.

a) Zero (0); b) Três pontos (...); c) Um traço horizontal (-) d) Um ponto de interrogação (?); e) Um ponto de exclamação (!).

16. De acordo com as normas para representação tabular de dados, quando há dúvida, na exatidão do valor de um dado, deve-se colocar na célula correspondente.

a) Zero (0); b) Três pontos (...); c) Um traço horizontal (-) d) Um ponto de interrogação (?); e) Um ponto de exclamação (!).

17. Assinale a alternativa verdadeira

a) Tanto a nota quanto a chamada são usadas para esclarecimento geral sobre um quadro e uma tabela. b) Tanto a nota quanto a chamada são usadas para esclarecer detalhes em relação a casa, linhas ou colunas

de um quadro ou uma tabela. c) A nota é usada para esclarecer detalhes em relação a casas, linhas ou colunas enquanto a chamada é

usada para um esclarecimento geral sobre um quadro ou uma tabela. d) A nota é usada para esclarecimento geral sobre um quadro ou tabela enquanto a chamada é usada para

esclarecer detalhes em relação a casas, linhas ou colunas. e) Todas as afirmativas anteriores são falsas.

18. Para cada tabela abaixo, calcule a proporção e a porcentagem e responda às perguntas:

Tabela 01. Quociente de Inteligência (QI) de uma certa faculdade brasileira

QI No. DE ALUNOS PROPORÇÃO PORCENTAGEM

092 |- 107 31

107 |- 122 39

122 |- 137 21

137 |- 152 12

152 |- 167 4

TOTAL 107 a) Qual o nível de QI que possui a maior proporção/percentual? E a menor?

b) Calcule e interprete as seguintes razões:

i) Alunos com QI entre 92 e 122 (exclusive) para aqueles com QI entre 137 e 152 (exclusive).

ii) Alunos com QI entre 107 e 152 (exclusive) para os demais.

iii) Alunos com QI entre 92 e 107 (exclusive) para aqueles com QI entre 152 e 167 (exclusive).

iv) Alunos com QI inferior a 122 para aqueles com QI maior ou igual a 137.

Page 26: Apostila de Estatística - Shiguti

24

Tabela 02. Notas de candidatos de um certo concurso público realizada em uma cidade

NOTAS FREQUÊNCIA PROPORÇÃO PORCENTAGEM

00|-20 20

20|-40 65

40|-60 230

60|-80 160

80|-100 25

TOTAL 500 a) Dado que a nota de corte seja de 60 pontos, qual a proporção/percentual dos candidatos que foram

aprovados?

b) Calcule e interprete as seguintes razões:

i) Candidatos com nota menor que 20 para aqueles com nota de 40 a 60 (exclusive).

ii) Candidatos com nota menor que 40 para aqueles com nota mínima de 60.

iii) Candidatos com nota de 40 a 60 (exclusive) para aqueles com nota igual ou superior a 80.

iv) Candidatos com nota máxima de 40 para aqueles com nota maior ou igual a 60.

v) Candidatos com nota de 20 a 60 (exclusive) para os demais.

Tabela 03. Área das Regiões Brasileiras

REGIÃO ÁREA PROPORÇÃO PORCENTAGEM

NORTE 3.581.180

NORDESTE 1.546.672

SUDESTE 924.935

SUL 577.723

C.OESTE 1.879.455

TOTAL 8.509.965 a) Qual a região que ocupa a maior área do Brasil e qual é a sua proporção/porcentagem?

b) Calcule e interprete as seguintes razões:

i) Área da região Norte para a da região Nordeste.

ii) Área das regiões Norte e Nordeste para o da região Centro-Oeste.

iii) Área da região Sudeste para o das regiões Sul e Centro-Oeste.

iv) Área da região Norte para as demais.

Page 27: Apostila de Estatística - Shiguti

25

UNIDADE III - NORMAS PARA CONSTRUÇÃO DE GRÁFICOS Introdução

Tem como finalidade:

Representar os resultados de forma simples, clara e verdadeira

Demonstrar a evolução do fenômeno em estudo

Observar a relação dos valores da série

Normas para construção de gráficos

A disposição dos elementos é idêntica à das tabelas:

CABEÇALHO DO GRÁFICO

CORPO DO GRÁFICO

RODAPÉ

Page 28: Apostila de Estatística - Shiguti

26

TIPOS DE GRÁFICOS

GRÁFICO EM COLUNAS

❖ Conjunto de retângulos dispostos verticalmente separados por um espaço.

Tabela 01. Efetivo do CBMDF em Cinco Regiões Administrativas do DF - 1998

FONTE: Banco de Dados do Distrito Federal – 1998 NOTAS: Os efetivos especializados (emergência médica, incêndio florestal e guarda e

segurança) estão alocados nas regiões administrativas.

Gráfico 01. Efetivo do CBMDF em algumas Regiões Administrativas do DF - 1998

Fonte: Tabela 01

GRÁFICOS EM BARRAS

❖ Semelhante ao gráfico em colunas, porém os retângulos são dispostos horizontalmente.

Região EfetivoAdministrativaRA I - Brasília 867 RA III - Taguatinga 443 RA V - Sobradinho 116 RA XIII - Santa Maria 77 RA XVIII - Lago Norte 203 Total 1.706

0

100

200

300

400

500

600

700

800

900

1.000

RA I - Brasília RA III - Taguatinga RA V - Sobradinho RA XIII - Santa Maria RA XVIII - Lago Norte

Região Administrativa

Efet

ivo

Page 29: Apostila de Estatística - Shiguti

27

Tabela 02. Efetivo do CBMDF em Cinco Regiões Administrativas do DF - 1998

FONTE: Banco de Dados do Distrito Federal – 1998 NOTAS: Os efetivos especializados (emergência médica, incêndio florestal e guarda e

segurança) estão alocados nas regiões administrativas.

Gráfico 02. Efetivo do CBMDF em algumas Regiões Administrativas do DF - 1998

Fonte: Tabela 02

0 100 200 300 400 500 600 700 800 900 1.000

RA I - Brasília

RA III - Taguatinga

RA V - Sobradinho

RA XIII - Santa Maria

RA XVIII - Lago Norte

Reg

ião

Adm

inis

trat

iva

Efetivo

Região EfetivoAdministrativaRA I - Brasília 867 RA III - Taguatinga 443 RA V - Sobradinho 116 RA XIII - Santa Maria 77 RA XVIII - Lago Norte 203 Total 1.706

Page 30: Apostila de Estatística - Shiguti

28

GRÁFICO EM SETORES

É a representação através de um círculo, por meio de setores.

Muito utilizado quando pretendemos comparar cada valor da série com o total - proporção.

Forma de cálculo:

Tabela 03. Efetivo (valores absoluto e relativo) do CBMDF em Cinco Regiões Administrativas do DF - 1998 FONTE: Banco de Dados do Distrito Federal – 1998

NOTAS: Os efetivos especializados (emergência médica, incêndio florestal e guarda e segurança) estão alocados nas regiões administrativas.

Total 360o

parte xo

Efetivo xo

RA I - Brasília 867 183,0 RA III - Taguatinga 443 93,5 RA V - Sobradinho 116 24,5 RA XIII - Santa Maria 77 16,2 RA XVIII - Lago Norte 203 42,8 Total 1.706 360,0

RegiãoAdministrativa Absoluto Relativo (%)RA I - Brasília 867 50,82 RA III - Taguatinga 443 25,97 RA V - Sobradinho 116 6,80 RA XIII - Santa Maria 77 4,51 RA XVIII - Lago Norte 203 11,90 Total 1.706 100,00

Efetivo

Page 31: Apostila de Estatística - Shiguti

29

Gráfico 03.a. Comparativo (percentual) do Efetivo do CBMDF em Cinco Regiões Administrativas do DF – 1998

FONTE: Tabela 03

Gráfico 03.b. Comparativo (percentual) do Efetivo do CBMDF em Cinco Regiões Administrativas do DF – 1998

FONTE: Tabela 03

RA I - Brasília50,82%

RA III - Taguatinga25,97%

RA V - Sobradinho6,80%

RA XIII - Santa Maria 4,51%

RA XVIII - Lago Norte

11,90%

RA I - Brasília50,82%

RA III - Taguatinga25,97%

RA V - Sobradinho6,80%

RA XIII - Santa Maria 4,51%

RA XVIII - Lago Norte

11,90%

Page 32: Apostila de Estatística - Shiguti

30

GRÁFICO EM CURVAS / LINHAS

Muito utilizado para representar dados temporais.

Tabela 04. População da RA XIV – São Sebastião – 1991 a 1995

FONTE: Censo Demográfico de 1991 – IBGE Estimativas para 1992 a 1995 - CODEPLAN

Gráfico 04. População da RA XIV – São Sebastião – 1991 a 1995

FONTE: Tabela 04

Gráfico 05. População da RA XIV – São Sebastião – 1991 a 1995

Ano População1991 17.3991992 20.9711993 25.2711994 30.4571995 36.703

15.000

20.000

25.000

30.000

35.000

40.000

1990 1991 1992 1993 1994 1995 1996

Ano

Popu

laçã

o

0

10.000

20.000

30.000

40.000

50.000

60.000

1990 1991 1992 1993 1994 1995 1996

Ano

Popu

laçã

o

FONTE: Tabela 04

Page 33: Apostila de Estatística - Shiguti

31

GRÁFICO POLAR / RADAR Representação por meio de um polígono Geralmente presta-se para apresentação de séries temporais

Gráfico 05. População da RA XIV – São Sebastião – 1991 a 1995

FONTE: Tabela 04

0

10.000

20.000

30.000

40.0001991

1992

19931994

1995

Page 34: Apostila de Estatística - Shiguti

32

EXERCÍCIOS 1. Assinale a afirmativa verdadeira:

a) Um gráfico de barras ou colunas é aquele em que os retângulos que o compõem estão dispostos horizontalmente.

b) Um gráfico de barras ou colunas é aquele em que os retângulos que o compõem estão dispostos verticalmente.

c) Um gráfico de barras é aquele em que os retângulos que o compõem estão dispostos verticalmente e um gráfico de colunas, horizontalmente.

d) Um gráfico de barras é aquele em que os retângulos que o compõem estão dispostos horizontalmente e um gráfico de colunas, verticalmente.

e) Todas as alternativas anteriores são falsas. 2. O gráfico mais comumente utilizado quando se deseja evidenciar a participação de um dado em relação ao total é denominado:

a) Gráfico em barras; b) Gráficos em colunas; c) Gráfico em setores; d) Gráfico pictórico ou pictograma; e) Gráfico decorativo.

3. Uma representação gráfica comumente encontrada em jornais e revistas que inclui figuras de modo a torná-las mais atraente é denominada:

a) Gráfico em barras; b) Gráficos em colunas; c) Gráfico em setores; d) Gráfico pictórico ou pictograma; e) Gráfico decorativo.

4. A tabela abaixo mostra o consumo de determinada bebida durante um baile de carnaval:

Bebida Consumo (l) Vinho 100 Suco de Frutas 200 Água Mineral 400 Refrigerante 700 Cerveja 1600

Foi construído um gráfico em setores para melhor representar o fenômeno acima. a) Qual o ângulo do setor correspondente ao vinho?

i) 6° ii) 10° iii) 12° iv) 24° v) 100°

b) Qual o ângulo do setor correspondente ao suco de frutas?

i) 12° ii) 20° iii) 24° iv) 48° v) 200°

c) Qual o ângulo do setor correspondente à água mineral?

Page 35: Apostila de Estatística - Shiguti

33

i) 24° ii) 40° iii) 48° iv) 84° v) 100°

d) Qual o ângulo do setor correspondente aos refrigerantes? i) 42° ii) 70° iii) 84° iv) 192° v) 700°

e) Qual o ângulo do setor correspondente às cervejas?

i) 12° ii) 96° iii) 160° iv) 192° v) 1600°

Page 36: Apostila de Estatística - Shiguti

34

UNIDADE IV - DISTRIBUIÇÃO DE FREQÜÊNCIA

REPRESENTAÇÃO DA AMOSTRA:

Podemos observar que a estatística tem como objetivo encontrar leis de comportamento para todo o conjunto, por meio da sintetização dos dados numéricos, sob a forma de tabelas, gráficos e medidas.

PROCEDIMENTO COMUM PARA A REPRESENTAÇÃO DAS DISTRIBUIÇÕES DE FREQÜÊNCIA (MANEIRA DE SUMARIZAR OS DADOS)

1) DADOS BRUTOS: O conjunto dos dados numéricos obtidos após a crítica dos valores coletados constitui-se nos dados brutos. Assim:

24 23 22 28 35 21 23 23 33 34 24 21 25 36 26 22 30 32 25 26 33 34 21 31 25 31 26 25 35 33

4) ROL: É o arranjo dos dados brutos em ordem de freqüências crescente ou decrescente: Assim:

21 21 21 22 22 23 23 23 24 24 25 25 25 25 26 26 26 28 30 31 31 32 33 33 33 34 34 35 35 36

3) AMPLITUDE TOTAL OU RANGE “ R” : É a diferença entre o maior e o menor valor observado.

No exemplo: R = 36 - 21 = 15

4) FREQÜÊNCIA ABSOLUTA (Fi): É o número de vezes que o elemento aparece na amostra, ou o número de elementos pertencentes a uma classe. No exemplo F(21) = 3.

5) DISTRIBUIÇÃO DE FREQÜÊNCIA: É o arranjo dos valores e suas respectivas freqüências. Assim, a distribuição de freqüência para o exemplo será:

Xi Fi 21 3 22 2 23 3 24 2 25 4 26 3 28 1 30 1 31 2 32 1 33 3 34 2 35 2 36 1 ∑ 30

Page 37: Apostila de Estatística - Shiguti

35

Para a variável contínua: Seja Xi peso de 100 indivíduos:

CLASSE Fi 45 |- 55 15 55 |- 65 30 65 |- 75 35 75 |- 85 15 85 |- 95 5

∑ 100

6) NUMERO DE CLASSES (K) : Não há fórmula exata para o número de classes (arredondar para o inteiro mais próximo). Soluções:

<=

25 n se ,n

25n se 5,K

• Fórmula de Sturges: K= 1 + 3,32 log(n)

onde: n = tamanho da amostra.

EXEMPLO:

Considere o exemplo apresentada no ROL:

( ) 6K5,9K30log3,321K =⇒=⇒⋅+=

Portanto, a tabela irá conter 6 classes.

7) AMPLITUDE DA CLASSE (h): KRh = (aproximar para o maior inteiro).

EXEMPLO:

Considere novamente o exemplo apresentada no ROL:

3h5,2h6

15h =⇒=⇒=

8) LIMITE DE CLASSES: Representado por

10 |-| 12: valores entre 10 e 12;

10 -| 12 : valores de 10 a 12, excluindo o 10;

10 |- 12 : valores de 10 a 12, excluindo o 12.

Obs.: Neste curso iremos utilizar a última representação.

Page 38: Apostila de Estatística - Shiguti

36

EXEMPLO:

Considere o exemplo apresentada no ROL:

9) PONTO MÉDIO DA CLASSE (xi) :É a média aritmética entre o limite superior (Li) e o inferior da classe (li).

2Llx ii

i+

=

EXEMPLO:

Da tabela acima:

10) FREQÜÊNCIA ABSOLUTA ACUMULADA (Fac): É a soma das freqüências dos valores inferiores ou iguais ao valor dado.

Exemplo:

Classe Fi

21 |- 24 8 24 |- 27 9 27 |- 30 1 30 |- 33 4 33 |- 36 7 36 |- 39 1

TOTAL 30

Classe Fi xi

21 |- 24 8 22,524 |- 27 9 25,527 |- 30 1 28,530 |- 33 4 31,533 |- 36 7 34,536 |- 39 1 37,5

TOTAL 30 -

Classe Fi xi Fac

21 |- 24 8 22,5 8 24 |- 27 9 25,5 17 27 |- 30 1 28,5 18 30 |- 33 4 31,5 22 33 |- 36 7 34,5 29 36 |- 39 1 37,5 30

TOTAL 30 - -

Page 39: Apostila de Estatística - Shiguti

37

11) FREQÜÊNCIA RELATIVA SIMPLES ( fi ): A freqüência relativa de um valor é dada por, ∑

=i

ii F

Ff , ou

será a percentagem daquele valor na amostra caso multiplique por 100.

Exemplo:

12) FREQÜÊNCIA RELATIVA ACUMULADA (fac): É a soma das freqüências relativas dos valores inferiores ou iguais ao valor dado.

Exemplo:

13) HISTOGRAMA: É a representação gráfica de uma distribuição de FREQÜÊNCIA por meio de retângulos justapostos (veja exemplo a seguir).

14) POLÍGONO DE FREQÜÊNCIA: É a representação gráfica de uma distribuição por meio de um polígono.

Exemplo:

HISTOGRAMA E POLÍGONO DE FREQUÊNCIA SIMPLES DA TABELA ACIMA

Classe Fi xi Fac fi

21 |- 24 8 22,5 8 0,267 24 |- 27 9 25,5 17 0,300 27 |- 30 1 28,5 18 0,033 30 |- 33 4 31,5 22 0,133 33 |- 36 7 34,5 29 0,233 36 |- 39 1 37,5 30 0,033

TOTAL 30 - - 1,000

Classe Fi xi Fac fi fac

21 |- 24 8 22,5 8 0,267 0,26724 |- 27 9 25,5 17 0,300 0,56727 |- 30 1 28,5 18 0,033 0,60030 |- 33 4 31,5 22 0,133 0,73333 |- 36 7 34,5 29 0,233 0,96636 |- 39 1 37,5 30 0,033 1,000

TOTAL 30 - - 1,000 -

0123456789

10

Classes

Fi

21 24 27 30 33 36 39

Page 40: Apostila de Estatística - Shiguti

38

15) POLÍGONO DE FREQÜÊNCIA ACUMULADA:

Exemplo: POLÍGONO DE FREQUÊNCIA ACUMULADA DA TABELA ACIMA

0

5

10

15

20

25

30

Classes

Fac

21 24 27 30 33 36 39

Page 41: Apostila de Estatística - Shiguti

39

EXERCÍCIOS 1. Um dado foi lançado 50 vezes e foram registrados os seguintes resultados

5 4 6 1 2 5 3 1 3 3 4 4 1 5 5 6 1 2 5 1 3 4 5 1 1 6 6 2 1 1 4 4 4 3 4 3 2 2 2 3 6 6 3 2 4 2 6 6 2 1

Construa uma distribuição de freqüência sem intervalo de classe e determine:

a) A Amplitude Total i) 5 ii) 6 iii) 7 iv) 10 v) 50

b) A freqüência total

i) 5 ii) 6 iii) 7 iv) 10 v) 50

c) A freqüência simples absoluta do primeiro elemento:

i) 10% ii) 20% iii) 1 iv) 10 v) 20

d) A freqüência simples relativa do primeiro elemento: i) 10% ii) 20% iii) 1 iv) 10 v) 20

e) A freqüência acumulada do primeiro elemento:

i) 10% ii) 20% iii) 1 iv) 10 v) 20

f) A freqüência acumulada relativa do primeiro elemento:

i) 10% ii) 20% iii) 1 iv) 10 v) 20

g) A freqüência simples absoluta do segundo elemento:

i) 19 ii) 9 iii) 2 iv) 38%

Page 42: Apostila de Estatística - Shiguti

40

v) 18%

h) A freqüência simples relativa do quinto elemento: i) 12% ii) 84% iii) 5 iv) 6 v) 42

i) A freqüência acumulada relativa do sexto elemento:

i) 50 ii) 8 iii) 6 iv) 100% v) 16%

3. Dado o rol de medidas das alturas (dadas em cm) de uma amostra de 100 indivíduos de uma faculdade:

151 152 154 155 158 159 159 160 161 161161 162 163 163 163 164 165 165 165 166166 166 166 167 167 167 167 167 168 168168 168 168 168 168 168 168 168 169 169169 169 169 169 169 170 170 170 170 170170 170 171 171 171 171 172 172 172 173173 173 174 174 174 175 175 175 175 176176 176 176 177 177 177 177 178 178 178179 179 180 180 180 180 181 181 181 182182 182 183 184 185 186 187 188 190 190

calcule:

a) a amplitude amostral;

b) o número de classes;

c) a amplitude de classes;

d) os limites de classes;

e) as freqüências absolutas das classes;

f) as freqüências relativas;

g) os pontos médios das classes;

h) as freqüências acumuladas;

i) o histograma e o polígono de freqüência;

j) o polígono de freqüência acumulada;

k) faça um breve comentário sobre os valores das alturas desta amostra através da distribuição de frequência.

4. Os dados seguintes representam 20 observações relativas ao índice pluviométrico em determinado município do Estado:

Milímetros de chuva

a) Determinar o número de classes pela regra de Sturges; b) Construir a tabela de freqüências absolutas simples;

144 152 159 160160 151 157 146154 145 151 150142 146 142 141141 150 143 158

Page 43: Apostila de Estatística - Shiguti

41

c) Determinar as freqüências absolutas acumuladas; d) Determinar as freqüências simples relativas; 5. Considere a seguinte distribuição de frequência correspondente aos diferentes preços de um determinado produto em vinte lojas pesquisadas.

a) Quantas lojas apresentaram um preço de R$52,00? b) Construa uma tabela de freqüências simples relativas. c) Construa uma tabela de freqüências absolutas acumuladas. d) Quantas lojas apresentaram um preço de até R$52,00 (inclusive)? e) Qual o percentual de lojas com preço maior de que R$51,00 e menor de que R$54,00? 6. O quadro seguinte representa as alturas (em cm) de 40 alunos de uma classe.

a) Calcular a amplitude total. b) Admitindo-se 6 classes, qual a amplitude do intervalo de classe? c) Construir uma tabela de frequência das alturas dos alunos. d) Determinar os pontos médios das classes. 7. Vinte alunos foram submetidos a um teste de aproveitamento cujos resultados são.

Pede-se agrupar tais resultados em uma distribuição de freqüências:

Preços No. De lojas50 251 552 653 654 1

Total 20

162 163 148 166 169 154 170 166164 165 159 175 155 163 171 172170 157 176 157 157 165 158 158160 158 163 165 164 178 150 168166 169 152 170 172 165 162 164

26 28 24 13 1818 25 18 25 2420 21 15 28 1727 22 13 19 28

Page 44: Apostila de Estatística - Shiguti

42

UNIDADE V - MEDIDAS DE POSIÇÃO E SEPARATRIZES

MEDIDAS DE POSIÇÃO

As medidas de posição, também chamada de medidas de tendência central, possuem três formas

diferentes para três situações distintas:

MÉDIA ARITMÉTICA

Existem duas médias:

POPULACIONAL, representada letra grega µ

AMOSTRAL, representada por x

1a SITUAÇÃO: Dados não agrupados

Sejam os elementos x1, x2, x3,...,xn de uma amostra, portanto “n” valores da variável X. A média aritmética da variável aleatória de X é definida por,

n

xx 1

i∑==

n

i ou simplesmente, n

xx ∑=

onde n é o número de elementos do conjunto.

Exemplo:

Suponha o conjunto de tempo de serviço de cinco funcionários: 3, 7, 8, 10 e 11. Determinar a média aritmética simples deste conjunto de dados.

8,75

395

1110873x ==++++

=

Interpretação: o tempo médio de serviço deste grupo de funcionários é de 7,8 anos.

2a SITUAÇÃO: Dados agrupados em uma distribuição de frequência por valores simples

Quando os dados estiverem agrupados numa distribuição de freqüência usaremos a média aritmética dos valores x1, x2, x3,...,xn, ponderados pelas respectivas freqüências absolutas: F1, F2, F3, ... , Fn. Assim

n

Fxx 1

ii∑==

n

i

Exemplo:

Em um determinado dia foi registrado o número de veículos negociados por uma amostra de 10 vendedores de uma agência de automóveis obtendo a seguinte tabela:

Page 45: Apostila de Estatística - Shiguti

43

Portanto:

6,21026x ==

Interpretação: em média, cada vendedor negociou 2,6 veículos.

3a SITUAÇÃO: Dados agrupados em uma distribuição de frequência por classes

Quando os dados estiverem agrupados numa distribuição de freqüência usaremos a média aritmética dos pontos médios x1, x2, x3,...,xn de cada classe, ponderados pelas respectivas freqüências absolutas: F1, F2, F3, ... , Fn. Desta forma, o cálculo da média passa a ser igual ao da 2a situação. Assim

n

Fxx 1

ii∑==

n

i

Exemplo:

A tabela abaixo representa os escores obtidos por um grupo de 58 alunos matriculados em uma determinada disciplina:

Portanto,

62,24 = 58

3610x =

Interpretação: o desempenho médio deste grupo de alunos foi de 62,24 pontos nesta disciplina.

ESCORES ALUNOS xi xi Fi

(Fi)35 |- 45 5 40 200 45 |- 55 12 50 600 55 |- 65 18 60 1.080 65 |- 75 14 70 980 75 |- 85 6 80 480 85 |- 95 3 90 270

TOTAL 58 - 3.610

veículos número denegociados vendedores xi Fi

(xi) (Fi)1 1 1 2 3 6 3 5 15 4 1 4

TOTAL 10 26

Page 46: Apostila de Estatística - Shiguti

44

MODA - Mo

Dentre as principais medidas de posição, destaca-se a moda. É o valor mais freqüente da distribuição.

1a SITUAÇÃO: Dados não agrupados

Sejam os elementos x1, x2, x3,...,xn de uma amostra, o valor da moda para este tipo de conjunto de dados é simplesmente o valor com maior frequência.

Exemplo 1:

Suponha o conjunto de tempo de serviço de cinco funcionários: 3, 7, 8, 8 e 11. Determinar a moda deste conjunto de dados.

⇒= 8Mo distribuição unimodal ou modal Interpretação: o tempo de serviço com maior frequência é de 8 anos.

Exemplo 2:

Suponha o conjunto de tempo de serviço de cinco funcionários: 3, 3, 7, 8, 8 e 11. Determinar a moda deste conjunto de dados.

==

8Mo3Mo

distribuição bimodal

Interpretação: os tempos de serviço com maior frequência foram de 3 e 8 anos.

Exemplo 3:

Suponha o conjunto de tempo de serviço de cinco funcionários: 3, 7, 8, 10 e 11. Determinar a moda deste conjunto de dados.

⇒Mo existe não distribuição amodal Interpretação: não existe o tempo de serviço com maior frequência.

2a SITUAÇÃO: Dados agrupados em uma distribuição de frequência por valores simples

Para este tipo de distribuição, a identificação da moda é facilitada pela simples observação do elemento que apresenta maior freqüência. Assim, para a distribuição

Exemplo:

Em um determinado dia foi registrado o número de veículos negociados por uma amostra de 10 vendedor de uma agência de automóveis obtendo a seguinte tabela:

veículos número denegociados vendedores

(xi) (Fi)1 1 2 3 3 5 4 1

TOTAL 10

Page 47: Apostila de Estatística - Shiguti

45

Portanto, se a maior frequência é Fi = 5, logo Mo = 3.

Interpretação: A quantidade de veículos comercializados no dia com maior frequência foi de 3 veículos.

3a SITUAÇÃO: Dados agrupados em uma distribuição de frequência por classes

Para dados agrupados em classes, temos diversas fórmulas para o cálculo da moda. A utilizada será:

Fórmula de Czuber

Procedimento:

a) Identifica-se a classe modal (aquela que possuir maior freqüência) – CLASSE(Mo).

b) Utiliza-se a fórmula:

h∆ + ∆

∆ + lMo

21

1i ⋅=

em que:

modal classe da amplitude h

FF FF

modal classe dainferior limite l

posti,i2

anti,i1

i

=

−=∆

−=∆=

Exemplo:

A tabela abaixo representa os escores obtidos por um grupo de 58 alunos matriculados em uma determinada disciplina:

( )

4141861218

:

61Mo6551046

655Mo

65|55MoCLASSE

2

1

=−=∆=−=∆

=⇒+=⋅+

+=

−⇒

onde

Interpretação: O escore com maior frequência entre o grupo de 58 alunos foi de 61 pontos.

ESCORES ALUNOSFi

35 |- 45 5 45 |- 55 12 55 |- 65 18 65 |- 75 14 75 |- 85 6 85 |- 95 3

TOTAL 58

Page 48: Apostila de Estatística - Shiguti

46

MEDIANA - Md

Construído o ROL, o valor da mediana é o elemento que ocupa a posição central, ou seja, é o elemento que divide a distribuição em 50% de cada lado:

1a SITUAÇÃO: Dados não agrupados

Sejam os elementos x1, x2, x3,...,xn de uma amostra, portanto “n” valores da variável X. A mediana da variável aleatória de X é definida por,

+

+

=

21n posição na localizado valor o será mediana da valor o então ímpar,

21n posição à adjacentes sobservaçõe duas das média a será mediana da valor o então par,

n se

Exemplo 1:

Suponha o conjunto de tempo de serviço de cinco funcionários: 3, 7, 8, 10 e 11. Determinar a mediana deste conjunto de dados.

Como 32

15 posição na localizado estará mediana da valor o então 5,n =+

= . Portanto,

8Md =

Interpretação: 50% dos funcionários possuem até 8 anos de tempo de serviço, ou, 50% dos funcionários possuem no mínimo 8 anos de tempo de serviço.

Exemplo 2:

Suponha o conjunto de tempo de serviço de cinco funcionários: 3, 7, 8, 10, 11 e 13. Determinar a mediana deste conjunto de dados.

Como 5,32

16 posição na localizado estará mediana da valor o então 6,n =+

= . Portanto,

92108

=+

=Md

Interpretação: 50% dos funcionários possuem até 9 anos de tempo de serviço, ou, 50% dos funcionários possuem no mínimo 9 anos de tempo de serviço.

2a SITUAÇÃO: Dados agrupados em uma distribuição de frequência por valores simples

Quando os dados estiverem agrupados numa distribuição de freqüência identificaremos a mediana dos

valores x1, x2, x3,...,xn pela posição da mediana ( )2nMdPOS = através da frequência absoluta acumulada - Fac,

100%50%0%

Md

Page 49: Apostila de Estatística - Shiguti

47

Exemplo:

Em um determinado dia foi registrado o número de veículos negociados por uma amostra de 10 vendedor de uma agência de automóveis obtendo a seguinte tabela:

Portanto:

( ) 3Md52

10MdPOS =⇒==

Interpretação: 50% dos vendedores comercializaram no máximo 3 veículos, ou então, metade dos vendedores comercializou pelo menos 3 veículos.

3a SITUAÇÃO: Dados agrupados em uma distribuição de frequência por classes

Procedimento:

1. Calcula-se a posição da mediana: ( )2nMdPOS =

2. Pela Fac identifica-se a classe que contém o valor da mediana - CLASSE(Md)

3. Utiliza-se a fórmula: ( )h

FF - MdPOS

+ l = Mdi

antac,i ⋅

onde:

li = Limite inferior da classe mediana

n = Tamanho da amostra ou número de elementos

Fac,ant = Frequência acumulada anterior à classe mediana

h = Amplitude da classe mediana

Fi = Freqüência absoluta simples da classe mediana

Exemplo:

A tabela abaixo representa os escores obtidos por um grupo de 58 alunos matriculados em uma determinada disciplina:

veículos número denegociados vendedores Fac

(xi) (Fi)1 1 1 2 3 4 3 5 9 4 1 10

TOTAL 10 -

Page 50: Apostila de Estatística - Shiguti

48

Portanto,

61,67Md67,6551018

17-2955Md .3

65|55CLASSE(Md) .2

292

58POS(Md) .1

=⇒+=⋅+=

−=

==

Interpretação: 50% dos alunos obtiveram escore máximo de 61,67 pontos, ou então, metade dos alunos obtiveram escore maior que 61,67 pontos..

SEPARATRIZES

QUARTIS

Os quartis dividem um conjunto de dados em quatro partes iguais.

Assim:

Onde: Q1 = 1° quartil, deixa 25% dos elementos

Q2 = 2° quartil, coincide com a mediana, deixa 50% dos elementos

Q3 = 3° quartil, deixa 75% dos elementos

Procedimento:

1. Calcula-se a posição do quartil: ( )

1,2,3i :onde

i4nQPOS i

=

⋅=

2. Pela Fac identifica-se a classe que contém o valor do quartil - CLASSE(Qi)

100%

Q1 Q2 = Md Q3

0% 25% 50% 75%

ESCORES ALUNOS Fac(Fi)

35 |- 45 5 5 45 |- 55 12 17 55 |- 65 18 35 65 |- 75 14 49 75 |- 85 6 55 85 |- 95 3 58

TOTAL 58 -

Page 51: Apostila de Estatística - Shiguti

49

3. Utiliza-se a fórmula: ( )h

FF - QPOS

+ l = Qi

antac,iii ⋅

onde:

li = Limite inferior da classe quartílica

n = Tamanho da amostra ou número de elementos

Fac,ant = Frequência acumulada anterior à classe quartílica

h = Amplitude da classe quartílica

Fi = Freqüência absoluta simples da classe quartílica

Exemplo:

A tabela abaixo representa os escores obtidos por um grupo de 58 alunos matriculados em uma determinada

disciplina. Calcule o primeiro e o terceiro quartil.

Portanto,

2,925Q92,7451012

5-14,554Q .3

55|45)CLASSE(Q .2

5,1414

58)POS(Q .1

11

1

1

=⇒+=⋅+=

−=

=⋅=

Interpretação: 25% dos alunos obtiveram escore máximo de 52,92 pontos, ou então, 75% dos alunos obtiveram escore maior que 52,92 pontos.

07,71Q07,6651014

35-43,556Q .3

75|65)CLASSE(Q .2

5,4334

58)POS(Q .1

33

1

3

=⇒+=⋅+=

−=

=⋅=

Interpretação: 75% dos alunos obtiveram escore menor que 71,07 pontos, ou então, 25% dos alunos obtiveram escore de pelo menos 71,07 pontos.

ESCORES ALUNOS Fac(Fi)

35 |- 45 5 5 45 |- 55 12 17 55 |- 65 18 35 65 |- 75 14 49 75 |- 85 6 55 85 |- 95 3 58

TOTAL 58 -

Page 52: Apostila de Estatística - Shiguti

50

DECIS

São valores que divide a série em dez partes.

Procedimento:

1. Calcula-se a posição da medida: ( )

6,7,8,91,2,3,4,5,i :onde

i10nPOS i

=

⋅=D

2. Pela Fac identifica-se a classe que contém o valor do decil - CLASSE(Di)

3. Utiliza-se a fórmula: ( )h

FF - DPOS

+ l = Di

antac,iii ⋅

onde:

li = Limite inferior da classe do decil

n = Tamanho da amostra ou número de elementos

Fac,ant = Frequência acumulada anterior à classe do decil

h = Amplitude da classe do decil

Fi = Freqüência absoluta simples da classe do decil

Exemplo:

A tabela abaixo representa os escores obtidos por um grupo de 58 alunos matriculados em uma determinada disciplina. Calcule o sexto decil.

Portanto,

ESCORES ALUNOS Fac(Fi)

35 |- 45 5 5 45 |- 55 12 17 55 |- 65 18 35 65 |- 75 14 49 75 |- 85 6 55 85 |- 95 3 58

TOTAL 58 -

D8 D9D2 D3 D4 D5 D6 D7

90% 100%0%

D1

50% 60% 70% 80%10% 20% 30% 40%

Page 53: Apostila de Estatística - Shiguti

51

89,64D89,9551018

17-34,855D .3

65|55)CLASSE(D .2

8,3461058)POS(D .1

66

6

6

=⇒+=⋅+=

−=

=⋅=

Interpretação: 60% dos alunos obtiveram escore inferior a 64,89 pontos, ou então, 40% dos alunos obtiveram escore mínimo de 64,89 pontos.

PERCENTIS

São as medidas que dividem a amostra em 100 parte iguais. A fórmula será:

Procedimento:

1. Calcula-se a posição da medida: ( )

98,991,2,3,...,i :onde

i100

nPOS i

=

⋅=P

2. Pela Fac identifica-se a classe que contém o valor do percentil - CLASSE(Pi)

3. Utiliza-se a fórmula: ( )h

FF - PPOS

+ l = Pi

antac,iii ⋅

onde:

li = Limite inferior da classe do percentil

n = Tamanho da amostra ou número de elementos

Fac,ant = Frequência acumulada anterior à classe do percentil

h = Amplitude da classe do percentil

Fi = Freqüência absoluta simples da classe do percentil

Exemplo:

A tabela abaixo representa os escores obtidos por um grupo de 58 alunos matriculados em uma determinada disciplina. Calcule o percentil de ordem 23.

.. .

.30%..

.P80 .. .P90 ...P20 .. .P30 .. .P40 .. .P50 .. .P60 .. .P70 ..

.90%.. .100% 0%..

.P10 ..

.50%.. .60%.. .70%.. .80%...10%.. .20%.. .40%..

ESCORES ALUNOS Fac(Fi)

35 |- 45 5 5 45 |- 55 12 17 55 |- 65 18 35 65 |- 75 14 49 75 |- 85 6 55 85 |- 95 3 58

TOTAL 58 -

Page 54: Apostila de Estatística - Shiguti

52

Portanto,

95,51P95,6451012

5-13,3454P .3

55|45)CLASSE(P .2

34,132310058)POS(P .1

2323

23

23

=⇒+=⋅+=

−=

=⋅=

Interpretação: 23% dos alunos com os menores escores obtiveram pontuação inferior a 51,95 pontos, ou então, 77% dos alunos obtiveram escore maior que 51,95 pontos.

Page 55: Apostila de Estatística - Shiguti

53

EXERCÍCIOS

1. Construa uma tabela para mostrar que, em determinado curso, o número de alunos matriculados nas 1ª , 2ª e 3ª séries era, respectivamente, 40, 35 e 29 em 1997 e 42, 36 e 32 em 1998. 2. Construa uma tabela para mostrar que, de acordo com a Pesquisa Nacional por Amostra de Domicílios, PNAD, em 1992 havia no Brasil 73,1 milhões de pessoas com renda familiar mensal até 330 reais (pobres e miseráveis), 45 milhões de pessoas com renda familiar mensal de 330 reais até 1300 reais (emergentes) e 13,6 milhões de pessoas com renda familiar mensal acima de 1300 reais (classe média e rica). Apresente, também, percentuais. 3. Faça um gráfico de linhas para apresentar o crescimento em altura de crianças do sexo masculino. Os dados estão na tabela a seguir.

4. Dado o rol do número de erros de impressão da primeira página de um jornal durante 50 dias, obteve-se os seguintes resultados:

5 5 5 6 6 6 7 7 7 7

7 8 8 8 8 8 8 8 9 9

10 10 10 10 10 11 11 11 11 12

12 12 12 12 12 12 12 12 13 14

14 14 14 14 14 14 15 16 19 22

a) Complete a tabela de distribuição de frequência:

Classe Fi xi Fac f i05 |- 08 08 |- 11 11 |- 14 14 |- 17 17 |- 20 20 |- 23

Total - -

Segundo nos mostra a tabela acima responda: i) Qual a amplitude total (r) ? ii) Qual o valor de k (número de classe) ? iii) Qual o intervalo de cada classe (h) ? 5. Complete a tabela a seguir:

Idades Altura Média (cm)7 119,78 124,49 129,310 134,111 139,212 143,2

Classes f P.M. Fi fr0,02

1262 - 65 0,06

66,5 84126

36225

0,15300

Total - -

Page 56: Apostila de Estatística - Shiguti

54

6. Considere a seguinte tabela:

Fi2,75 |- 2,80 22,80 |- 2,85 32,85 |- 2,90 102,90 |- 2,95 112,95 |- 3,00 243,00 |- 3,05 143,05 |- 3,10 93,10 |- 3,15 83,15 |- 3,20 63,20 |- 3,25 3

90

classes

Total Identificar os seguintes elementos da tabela:

a) Frequência simples absoluta da quinta classe. b) Frequência total. c) Limite inferior da sexta classe. d) Limite superior da quarta classe. e) Amplitude do intervalo de classe. f) Amplitude total. g) Ponto médio da terceira classe. h) Número total de classe. i) Frequência absoluta acumulada além da sexta classe. j) Porcentagem de valores iguais ou maiores que 3,20.

7. Responda as questões abaixo: I) Média, Mediana e Moda são medidas de : a) ( ) Dispersão b) ( ) posição c) ( ) assimetria d) ( ) curtose II) Na série 10, 20, 40, 50, 70, 80 a mediana será: a) ( ) 30 b) ( ) 35 c) ( ) 40 d) ( ) 45 III) 50% dos dados da distribuição situa-se: a) ( ) abaixo da média c) ( ) abaixo da moda b) ( ) acima da mediana d) ( ) acima da média 8. Calcule para cada caso abaixo a respectiva média.

a) 7, 8, 9, 12, 14

b) Xi 3 4 7 8 12Fi 2 5 8 4 3

c) Classes 68 - 72 72 - 76 76 - 80 80 - 84

Fi 8 20 35 40

9. Calcule o valor da mediana. a) 82, 86, 88, 84, 91, 93

b) Xi 73 75 77 79 81Fi 2 10 12 5 2

Page 57: Apostila de Estatística - Shiguti

55

c) Classes 1 - 3 3 - 5 5 - 7 7 - 9 9 - 11 11 - 13Fi 3 5 8 6 4 3

10. Calcule a moda a) 3, 4, 7, 7, 7, 8, 9, 10

b) Xi 2,5 3,5 4,5 6,5Fi 7 17 10 5

c) Classes 10 - 20 20 - 30 30 - 40 40 - 50

Fi 7 19 28 32 11. Para a distribuição abaixo calcular D2, P4 Q3

a) Classes 20 - 30 30 - 40 40 - 50 50 - 60 60 - 70

Fi 3 8 18 22 24

Page 58: Apostila de Estatística - Shiguti

56

UNIDADE VI - MEDIDAS DE DISPERSÃO

MEDIDA DE DISPERSÃO As medidas de dispersão indicam se os valores estão relativamente próximos um dos outros, ou separados em torno de uma medida de posição: a média. Consideraremos quatro medidas de dispersão: Desvio-médio, Variância, Desvio Padrão e Coeficiente de Variação.

DESVIO-MÉDIO

O desvio-médio analisa a média dos desvios em torno da média.

1a SITUAÇÃO: Dados não agrupados

Sejam os elementos x1, x2, x3,...,xn de uma amostra, portanto “n” valores da variável X, com média igual a x . O desvio-médio da variável aleatória de X é,

nxx

DM i∑ −=

onde n é o número de elementos do conjunto.

Exemplo:

Suponha o conjunto de tempo de serviço de cinco funcionários: 3, 7, 8, 10 e 11. Determinar o desvio-médio deste conjunto de dados.

2,24DM5

2,115

8,7118,7108,788,777,8-3DM então

8,7x como

=⇒=−+−+−+−+

=

=

Interpretação: em média, o tempo de serviço deste grupo de funcionários se desvio em 2,24 anos em torno dos 7,8 anos de tempo médio de serviço.

2a SITUAÇÃO: Dados agrupados em uma distribuição de frequência por valores simples

Quando os dados estiverem agrupados numa distribuição de freqüência usaremos o desvio-médio dos valores x1, x2, x3,...,xn, ponderados pelas respectivas freqüências absolutas: F1, F2, F3, ... , Fn, como no cálculo da média aritmética. Assim

nFxx

DM ii ⋅−= ∑

Exemplo:

Em um determinado dia foi registrado o número de veículos negociados por uma amostra de 10 vendedores de uma agência de automóveis como mostra a tabela abaixo. O cálculo do desvio-médio será:

Page 59: Apostila de Estatística - Shiguti

57

68,010

8,6DM então

2,6xcomo

==

=

Interpretação: em média, a quantidade de veículos negociado de cada vendedor possuiu uma distância de 0,68 em torno dos 2,6 veículos comercializados em média por vendedor.

3a SITUAÇÃO: Dados agrupados em uma distribuição de frequência por classes

Quando os dados estiverem agrupados numa distribuição de freqüência usaremos o desvio-médio dos pontos médios x1, x2, x3,...,xn de cada classe, ponderados pelas respectivas freqüências absolutas: F1, F2, F3, ... , Fn. Desta forma, o cálculo do desvio-médio passa a ser igual ao da 2a situação. Assim

nFxx

DM ii ⋅−= ∑

Exemplo:

A tabela abaixo representa os escores obtidos por um grupo de 58 alunos matriculados em uma determinada disciplina. O cálculo do desvio-médio será:

Portanto,

29,1058

597DM então

62,24=xcomo

==

veículos número denegociados vendedores |xi-média| |xi-média|*Fi

(xi) (Fi)1 1 1,60 1,602 3 0,60 1,803 5 0,40 2,004 1 1,40 1,40

TOTAL 10 4,00 6,80

ESCORES ALUNOSFi xi |xi-média| |xi-média|*Fi

35 |- 45 5 40 22 111 45 |- 55 12 50 12 147 55 |- 65 18 60 2 40 65 |- 75 14 70 8 109 75 |- 85 6 80 18 107 85 |- 95 3 90 28 83

TOTAL 58 - - 597

Page 60: Apostila de Estatística - Shiguti

58

Interpretação: Em média, a nota de cada aluno deste grupo teve um distanciamento de 10,29pontos em torno do desempenho médio deste grupo de alunos foi de 62,24 pontos nesta disciplina.

VARIÂNCIA E DESVIO-PADRÃO

A variância de um conjunto de dados é a média dos quadrados dos desvios dos valores a contar da média. A fórmula da variância poderá ser calculada de duas formas:

POPULACIONAL, representada letra grega σ2

AMOSTRAL, representada por s2

1a SITUAÇÃO: Dados não agrupados

Sejam os elementos x1, x2, x3,...,xn, portanto “n” valores da variável X, com média igual a x . A variância da variável aleatória de X é,

( ) ( )

( ) ( )

−⋅=

−=

−⋅=

−=

∑ ∑∑

∑ ∑∑

nx

x1-n

11-n

xxS

ou

Nx

xN1

Nµx

σ

2i2

i

2i2

2i2

i

2i2

Obs.: A Segunda fórmula é chamada de “Fórmula Desenvolvida”.

Exemplo:

Suponha o conjunto de tempo de serviço de cinco funcionários: 3, 7, 8, 10 e 11. Determinar o desvio-padrão deste conjunto de dados.

( ) ( ) ( ) ( ) ( ) 2222222

2 anos7,9S4

8,3815

8,7118,7108,788,777,8-3S então

8,7x como

=⇒=−

−+−+−+−+=

=

Interpretação: encontramos então uma variância para o tempo de serviço de 9,7anos2 . Para eliminarmos o quadrado da unidade de medida, extraímos a raiz quadrada do resultado da variância, que chegamos a uma terceira medida de dispersão, chamada de DESVIO-PADRÃO:

POPULACIONAL, representada letra grega 2σσ =

AMOSTRAL, representada por 2SS =

Portanto, o desvio-padrão do exemplo foi de 3,11anos. Ou seja, se calcularmos um intervalo utilizando um desvio-padrão em torno da média, encontraremos a concentração da maioria dos dados.

2a SITUAÇÃO: Dados agrupados em uma distribuição de frequência por valores simples

Quando os dados estiverem agrupados numa distribuição de freqüência usaremos a variância dos valores x1, x2, x3,...,xn, ponderados pelas respectivas freqüências absolutas: F1, F2, F3, ... , Fn. Assim

Page 61: Apostila de Estatística - Shiguti

59

( ) ( )

( ) ( )

⋅−⋅⋅=

⋅−=

⋅−⋅⋅=

⋅−=

∑ ∑∑

∑ ∑∑

nFx

Fx1-n

11-n

FxxS

ou

NFx

FxN1

NFµx

σ

2ii

i2i

i2

i2

2ii

i2i

i2

i2

Exemplo:

Em um determinado dia foi registrado o número de veículos negociados por uma amostra de 10 vendedores de uma agência de automóveis como mostra a tabela abaixo. O cálculo do desvio-médio será:

veículos84,0os0,71veículS

veículos71,094,6S então

2,6x como

2

22

==⇒

==

=

veículos84,0os0,71veículS

veículos71,0102674

91S

2

22

2

==⇒

=

−⋅=

Interpretação: Portanto, o desvio-padrão do exemplo foi de 0,84 veículos. Ou seja, se calcularmos um intervalo utilizando um desvio-padrão em torno da média, encontraremos a concentração da maioria dos veículos negociados por vendedor.

3a SITUAÇÃO: Dados agrupados em uma distribuição de frequência por classes

Quando os dados estiverem agrupados numa distribuição de freqüência usaremos a variância dos pontos médios x1, x2, x3,...,xn de cada classe, ponderados pelas respectivas freqüências absolutas: F1, F2, F3, ... , Fn. Desta forma, o cálculo da variância passa a ser igual ao da 2a situação. Assim

( ) ( )

( ) ( )

⋅−⋅⋅=

⋅−=

⋅−⋅⋅=

⋅−=

∑ ∑∑

∑ ∑∑

nFx

Fx1-n

11-n

FxxS

ou

NFx

FxN1

NFµx

σ

2ii

i2i

i2

i2

2ii

i2i

i2

i2

veículos número de veículos número denegociados vendedores (xi-média)2 (xi-média)2*Fi negociados vendedores xi*Fi xi2*Fi

(xi) (Fi) (xi) (Fi)1 1 2,56 2,56 1 1 1 1 2 3 0,36 1,08 OU 2 3 6 12 3 5 0,16 0,80 3 5 15 45 4 1 1,96 1,96 4 1 4 16

TOTAL 10 5,04 6,40 TOTAL 10 26 74

Page 62: Apostila de Estatística - Shiguti

60

Exemplo:

A tabela abaixo representa os escores obtidos por um grupo de 58 alunos matriculados em uma determinada disciplina. O cálculo do desvio-médio será:

pontos85,12pontos1,165S

pontos1,16557409.9S então

24,26x como

2

22

==⇒

==

=

pontos85,12pontos1,165S

pontos1,16558610.3100.234

571S

2

22

==⇒

=

−⋅=

Interpretação: Portanto, o desvio-padrão do exemplo foi de 12,85 pontos. Ou seja, se calcularmos um intervalo utilizando um desvio-padrão em torno do escore médio de 62,24 ponots, encontraremos a concentração da maioria dos alunos dentro deste intervalo de pontuação.

COEFICIENTE DE VARIAÇÃO

Trata-se de uma média relativa à dispersão, útil para a comparação e observação em termos relativos do grau de concentração em torno da média de séries distintas. É dada por:

100xSCV OU 100

µσCV ⋅=⋅=

Classificação da distribuição quanto à dispersão:

DISPERSÇÃO BAIXA: CV ≤ 15%

DISPERSÇÃO MÉDIA: 15% < CV < 30%

DISPERSÇÃO ALTA: CV ≥ 30%

ESCORES ALUNOS ESCORES ALUNOSFi xi (xi-média)2 (xi-média)2*Fi Fi xi xi*Fi xi2*Fi

35 |- 45 5 40 495 2.473 35 |- 45 5 40 200 8.000 45 |- 55 12 50 150 1.798 45 |- 55 12 50 600 30.000 55 |- 65 18 60 5 90 OU 55 |- 65 18 60 1.080 64.800 65 |- 75 14 70 60 843 65 |- 75 14 70 980 68.600 75 |- 85 6 80 315 1.893 75 |- 85 6 80 480 38.400 85 |- 95 3 90 771 2.312 85 |- 95 3 90 270 24.300

TOTAL 58 - - 9.409 TOTAL 58 - 3.610 234.100

Page 63: Apostila de Estatística - Shiguti

61

Exemplo:

Numa empresa o salário médio dos funcionários do sexo masculino é de R$ 4.000,00, com um desvio padrão de R$ 1.500,00, e os funcionários do sexo feminino é em média de R$ 3.000,00, com um desvio padrão de R$ 1.200,00. Então:

%4010030001200CV :feminino Sexo

%5,3710040001500CV :masculino Sexo

=⋅=

=⋅=

Interpretação: Logo, podemos concluir que o salário das mulheres apresenta maior dispersão relativa que a dos homens. Para obtermos o resultado de C.V basta multiplicarmos por 100.

EXERCÍCIOS

1. Desvio Médio para o conjunto de dados abaixo será:

xi Fi5 27 38 59 411 2

a) ( ) 1,28 c) ( ) 1,00 b) ( ) 1,20 d) ( ) 0,83 2. O Desvio Padrão de um conjunto de dados é 9. A variância é: a) ( ) 3 c) ( ) 81 b) ( ) 36 d) ( ) 18 3. Na distribuição de valores iguais, o Desvio padrão é: a) ( ) negativo c) ( ) zero b) ( ) a unidade d) ( ) positivo 4. O calculo da variância supõe o conhecimento da: a) ( ) Fac c) ( ) mediana b) ( ) média d) ( ) moda 5. A variância do conjunto de dados tabelados abaixo será:

Classes Fi03 |- 08 508 |- 13 1513 |- 18 2018 |- 23 10

a) ( ) 1,36 c) ( ) 4,54 b) ( ) 18,35 d) ( ) 20,66

Page 64: Apostila de Estatística - Shiguti

62

UNIDADE VII - MEDIDAS DE ASSIMETRIA E DE CURTOSE

MEDIDAS DE ASSIMETRIA DEFINIÇÃO: grau de deformação de uma distribuição em relação ao eixo de simetria.

Podemos observar os tipos de assimetria abaixo:

a)

MoMdx ==⇒

b)

MoMdx <<⇒

c)

xMdMo <<⇒

Existem várias coeficientes com o objetivo de quantificar tais assimetrias. Estudaremos dois destes coeficientes que veremos a seguir:

COEFICIENTE DE PEARSON

O coeficiente de Pearson é apresentado pela seguinte fórmula:

SMoxAsou

σMoµAs −

=−

=

Classificação do coeficiente de Pearson:

0As = DISTRIBUIÇÃO SIMÉTRICA

1As0 << DISTRIBUIÇÃO ASSIMÉTRICA POSITIVA FRACA

1As ≥ DISTRIBUIÇÃO ASSIMÉTRICA POSITIVA FORTE

0As1- << DISTRIBUIÇÃO ASSIMÉTRICA NEGATIVA FRACA

-1As ≤ DISTRIBUIÇÃO ASSIMÉTRICA NEGATIVA FORTE

Page 65: Apostila de Estatística - Shiguti

63

COEFICENTE DE BOWLEY

13

13

QQMd2QQ

As−

⋅−+=

Classificação do coeficiente de Bowley: 0As = DISTRIBUIÇÃO SIMÉTRICA

1,0As0 ≤< DISTRIBUIÇÃO ASSIMÉTRICA POSITIVA FRACA

0,3As0,1 << DISTRIBUIÇÃO ASSIMÉTRICA POSITIVA MODERADA

1As0,3 ≤≤ DISTRIBUIÇÃO ASSIMÉTRICA POSITIVA FORTE

0As0,1- <≤ DISTRIBUIÇÃO ASSIMÉTRICA NEGATIVA FRACA

0,1As0,3- −<< DISTRIBUIÇÃO ASSIMÉTRICA NEGATIVA MODERADA

-0,3As1- ≤≤ DISTRIBUIÇÃO ASSIMÉTRICA NEGATIVA FORTE

MEDIDA DE CURTOSE

Entende-se por curtose o grau de achatamento de uma distribuição. Podemos ter:

⇒ CURVA PLATICÚRTICA

⇒ CURVA MESOCÚRTICA

⇒ CURVA LEPTOCÚRTICA

Page 66: Apostila de Estatística - Shiguti

64

Para medir o grau de curtose utilizaremos o coeficiente

( )1090

13

P - P2Q - Q

=K ⋅

Classificação do coeficiente de Curtose: 0,263K = CURVA MESOCÚRTICA

0,263K > CURVA PLATICÚRTICA

0,263K < CURVA LEPTOCÚRTICA

EXERCÍCIOS 1. Analisando as curvas abaixo marque a resposta correta.

(I) (II) (III) a) a curva I é simétrica - x > med > mo ; b) a curva II é assimétrica positiva - mo > > x 2σ ; c) a curva I é simétrica x = med = mo ; d) a curva III é simétrica positiva x = med = mo ; 2. Para as distribuições abaixo foram calculados Distrib. A Distrib. B Distrib. C

x = 12KgMed = 12Kg Mo = 12Kg S = 4,42Kg

x = 12,9KgMed = 13,5Kg Mo = 16Kg S = 4,20Kg

x = 11,1KgMed = 10,5Kg Mo = 8Kg S = 4,20Kg

Marque a alternativa correta: a) a distribuição I é assimétrica negativa; b) a distribuição II é assimétrica positiva; c) a distribuição III é assimétrica negativa moderada. d) a distribuição I é simétrica; 3. Sabe-se que uma distribuição apresentou as seguintes medidas: Q1 = 24,4cm Q3 = 41,2cm P10=20,2cm P90 = 49.5cm, com tais medidas a curtose é : a) ( ) Leptocúrtica c) ( ) Mesocúrtica b) ( ) Platicúrtica d) ( ) Assimétrica.

Classes Fi Classes Fi Classes Fi02 |- 06 6 02 |- 06 6 02 |- 06 606 |- 10 12 06 |- 10 12 06 |- 10 3010 |- 14 24 10 |- 14 24 10 |- 14 2414 |- 18 12 14 |- 18 30 14 |- 18 1218 |- 22 6 18 |- 22 6 18 |- 22 6

Page 67: Apostila de Estatística - Shiguti

65

UNIDADE VIII – INTRODUÇÃO À TEORIA DA PROBABILIDADE

EXPERIMENTO ALEATÓRIO OU NÃO DETERMINISTICO - E

Definição:

1. É o processo de observação ou medida de um determinado fenômeno em estudo.

2. É o experimento que repetido sob as mesmas condições, conduz a resultados, em geral, distintos.

Exemplos:

E1 – lançamento de um dado e observar o número na face superior.

E2 – lançamento de uma moeda e observar o valor na face superior.

E3 – lançamento de um dado e uma moeda, nesta seqüência, observar os valores nas faces superiores.

E4 – um casal deseja ter três filhos e observar o sexo, de acordo com a ordem de nascimentos das crianças.

ESPAÇO AMOSTRAL - S

Definição:

Um espaço amostral é um conjunto de todas as ocorrências possíveis de um determinado experimento aleatório E.

Exemplos: Considere os experimentos aleatórios apresentados anteriormente:

No E1 - S={1, 2, 3, 4, 5, 6}

No E2 - S={k, c}, onde k=cara, C=coroa

No E3 - S={1k, 2k, 3k, 4k, 5k, 6k, 1c, 2c, 3c, 4c, 5c, 6c}

No E4 - S={MMM, MMF, MFM, MFF, FMM, FMF, FFM, FFF}

EVENTOS – (qualquer letra maiúscula do alfabeto)

Definição :

Um evento é qualquer subconjunto de ocorrências de um determinado espaço amostral S.

Exemplo: Considere o experimento aleatório E3, com seu respectivo espaço amostral S:

S={1k, 2k, 3k, 4k, 5k, 6k, 1c, 2c, 3c, 4c, 5c, 6c}

Determine os seguintes eventos:

A = ocorrência de valor cara (K)

B = ocorrência de valor par

C = ocorrência de valor coroa (C)

D = ocorrência de valor ímpar

E = ocorrência de número primo

F = ocorrência de valor maior que 4

G = ocorrência de valor menor ou igual a 3

H = ocorrência de valor par ou cara (K)

I = ocorrência de valor par ou ímpar

Page 68: Apostila de Estatística - Shiguti

66

J = ocorrência de valor par e cara (K)

K = ocorrência de valor par e ímpar

L = ocorrência de valor maior que 7

TIPOS DE EVENTOS

• EVENTO CERTO

Definição:

É aquele evento que se igual ao espaço amostral S.

Exemplo: O evento I acima é um evento certo.

EVENTO IMPOSSÍVEL

Definição:

É aquele evento que não possui elemento algum.

Exemplo: Os eventos K e L acima são eventos impossíveis.

EVENTOS MUTUAMENTES EXCLUSIVOS

Definição:

Dois eventos A e B quaisquer são chamados de mutuamente exclusivos, se eles não podem ocorrer simultaneamente, isto é,

A∩B = ∅

Exemplo: Considere os eventos descritos acima:

Os eventos A e C são mutuamente exclusivos pois A∩C = ∅.

Os eventos B e D são mutuamente exclusivos pois B∩D = ∅.

Os eventos C e J são mutuamente exclusivos pois C∩J = ∅.

Os eventos H e J não são mutuamente exclusivos pois H∩J ≠ ∅.

EVENTOS COMPLEMENTARES

Definição:

Dois eventos A e B quaisquer são chamados de complementares se:

A∩B = ∅

A∪B = S Exemplo: Considere os eventos descritos no exemplo acima:

Os eventos A e C são complementares pois A∩C = ∅ e A∪C = S.

Os eventos B e D são complementares pois B∩D = ∅ e B∪D = S.

Os eventos H e J não são complementares pois H∩J ≠ ∅ e H∪J ≠ S.

Os eventos F e K não são complementares pois F∩K ≠ ∅ apesar de F∪K = S.

Os eventos C e J não são complementares pois C∪J ≠ S apesar de C∩J = ∅.

Page 69: Apostila de Estatística - Shiguti

67

PROBABILIDADE:

Enfoque Teórico

A probabilidade de ocorrência de um evento A, P(A), é um número real que satisfaz as seguintes condições:

a) 0 ≤ P(A) ≤ 1

b) P(S) = 1

c) Se A e B são eventos mutuamente exclusivos então P(A∪B) = P(A) + P(B)

d) Se A1, A2, ...,A , ... são mutuamente exclusivos, dois a dois, então:

Principais teoremas :

I) P( A ) = 1 - P(A)

II) Se A é um evento impossível de ocorrer (A=∅), então P(A) = P(∅) =0

III) Se A e B são eventos quaisquer, então: P(A∪B) = P(A) + P(B) - P(B∩A).

CÁLCULO DA PROBABILIDADE

A probabilidade deverá ser calculada a partir da fórmula: P(A) = n(S)n(A)

Exemplo:

Seja o Experimento E o lançamento de um dado e o seu espaço amostral dado por: S = {1, 2, 3, 4, 5, 6}. Qual a probabilidade do evento A – Números maiores e iguais a 2?

O Evento A pode ser descrito na forma: A ={2, 3, 4, 5, 6}

n(A) = 5 e n(S) = 6. Logo a probabilidade do evento A é P(A) = n(S)n(A) = 5/6.

PROBABILIDADE CONDICIONAL

Ilustração:

Seja o experimento aleatório E: lançar um dado e o evento A = {sair o número 3}. Então:

P(A) = 61

Seja o evento B = {sair o número impar} = {1, 3, 5}

Podemos estar interessados em avaliar a probabilidade do evento A estar condicionado à ocorrência do evento B, designado por P(A|B), onde o evento A é o evento condicionado e o evento B o condicionante.

Assim P(A|B) = 31

Formalmente a probabilidade condicionada é definida por:

“Dado dois eventos quaisquer A e B, denotaremos P(A|B), por

Page 70: Apostila de Estatística - Shiguti

68

( ) ( )( )

( )( )Bn

BAnBP

BAPBAP ∩=

∩= ,

com P(B)≠0, pois B já ocorreu.

TEOREMA DO PRODUTO

A probabilidade da ocorrência simultânea de dois eventos quaisquer A e B, do mesmo espaço amostra, é igual ao produto da probabilidade de ocorrência do primeiro deles pela probabilidade condicional do outro, dado que o primeiro ocorreu.

Assim:

( ) ( )( ) ( ) ( ) ( )BAPBPBAP BP

BAPBAP ⋅=∩⇒∩

=

INDEPENDÊNCIA ESTATÍSTICA

Um evento A é considerado independente de um outro evento B se a probabilidade de A é igual à probabilidade condicional de A dado B, isto é, se:

( ) ( )BAPAP =

Considerando o teorema do produto podemos afirmar que:

( ) ( ) ( )BPAPBAP ⋅=∩ TEOREMA DE BAYES

Suponha que os eventos A1, A2, ...,An formam uma partição de um espaço amostral S; ou seja, os eventos Ai são mutuamente exclusivos e sua união é S. Seja B outro evento qualquer. Então: B = S∩B = (A1∪A2∪...∪An) ∩B = (A1∩B) ∪ (A2∩B) ∪... ∪(An∩B) Onde os Ai∩B são também mutuamente exclusivos.

Consequentemente, P(B) = P(A1∩B) + P(A2∩B) +... +P(An∩B) Assim pelo teorema da multiplicação, P(B) = P(A1)P(B\ A1)+ P(A2)P(B\ A2)+...+ P(AN)P(B\ AN) Por outro lado, para qualquer i, a probabilidade condicional de Ai dado B é definida como

Page 71: Apostila de Estatística - Shiguti

69

P(Ai\B) = P(B)

B)P(Ai ∩

Nesta equação, usamos (1) para substituir P(B) e P(Ai∩B) = P(Ai)P(B\ Ai) para substituir P(Ai∩B), obtendo assim o: Teorema de Bayes: Suponha A1, A2, ...,An ser uma partição de S e B, um evento qualquer. Então, para qualquer i,

)A\)P(BP(A...)A\)P(BP(A)A\)P(BP(A)A\)P(BP(AB)\P(A

nn2211

iii +++

=

Exemplos: Três máquinas, A, B e C produzem 50%, 30% e 20%, respectivamente do total de peças de uma fábrica. As percentagens de produção defeituosa destas máquinas são 3%, 4% e 5%. Se uma peça é selecionada aleatoriamente, ache a probabilidade de ela ser defeituosa. Suponha agora que uma peça selecionada aleatoriamente seja defeituosa. Encontre a probabilidade de ela ter sido produzida pela máquina A EXERCÍCIOS 1. Lance um dado e uma moeda um após o outro nesta seqüência. a) Construa o espaço amostral b) Enumere os resultados seguintes

I A ={coroa marcada por par} II B = {cara marcada por ímpar} III C = {Múltiplo de 3}

c) Expresse os eventos I B complementar II A ou B ocorrem III B ou C ocorrem IV A ou B complementar

c) Calcule as probabilidades abaixo: P(A), P(B), P(C), P( A ),P( B ), P(A ∪B) e P(B∪C) 2. Um revendedor de carros tem dois carros, corsas 1996, na sua loja para serem vendidos, interessa-nos saber quanto cada um dos dois vendedores venderá ao final de uma semana. Como representar “ o primeiro vendedor não vende nenhum carro” e depois “ o segundo vendedor vende ao menos um dos carros”. 3. Se A é o evento “Um estudante fica em casa para estudar”. E B é o evento “ o estudante vai ao cinema”, P(A) = 0,64 e P(B) = 0,21. Determine:

P(Ac), P(Bc), P(B/A) 4. Se P(A) = ½ ; P(B) = ¼ e A e B são mutuamente exclusivos então: a) P(Ac) b) P(Bc) c) P(A∩B) 5. Se P(A) = ½; P(B) = 1/3 e P(A∩B) = ¼ calcule P(AUB). 6. Quantas comissões de três pessoas podem formar com um grupo de 10 pessoas?

Page 72: Apostila de Estatística - Shiguti

70

7. A probabilidade de três jogadores acertarem um pênalti, são respectivamente 2/3, 4/5 e 7/10. Se cada um cobrar 1 única vez, qual a probabilidade de : a) Todos acertarem b) Ao menos um acertar c) Nenhum acertar 8. Qual a probabilidade de duas pessoas aniversariarem no mesmo dia da semana? 9. Sr Ray Moon Dee, ao dirigir-se ao trabalho, usa um ônibus ou o metrô com probabilidade de 0,2 e 0,8, nessa

ordem. Quando toma o ônibus, chega atrasado 30% das vezes. Quando toma o metrô, atrasa-se 20% dos dias. Se o Sr Ray Moon Dee Chegar atrasado ao trabalho em determinado dia, qual a probabilidade dele haver tomado um ônibus?

10. Em certo colégio, 5% dos homens e 2% das mulheres tem mais que 1,80m de altura. Por outro lado, 60%

dos estudantes são homens. Se um estudante é selecionado aleatoriamente e tem mais de 1,80m de altura, qual a probabilidade de que o estudante seja mulher?

Page 73: Apostila de Estatística - Shiguti

71

UNIDADE IX - VARIÁVEIS ALEATÓRIAS CONCEITOS Seja X um valor numérico que depende um resultado de uma experiência; como X associa um resultado a um número, X é uma função cujo domínio é o conjunto de resultados e a imagem é o conjunto dos números reais. Essa função X é conhecida como Variável Aleatória. O que Eqüivale a descrever os resultados de um experimento aleatório por meio de números em vez de palavras, possibilitando um tratamento Estatístico. As v.a. podem ser Unidimensional Discreta ou Contínua e Bidimensional Discreta e Contínua. VARIÁVEIS ALEATÓRIAS UNIDIMENSIONAIS DISCRETAS As v.a. unid. Discretas são aquelas que fazem uso de uma única variável no estudo, e como são discretas trabalham com valores inteiros. FUNÇÃO DE PROBABILIDADE Quando utilizamos uma v.a. x para transformar os valores de um espaço amostral S em um novo espaço amostral constituído de números reais, em geral modificamos também a função de probabilidade associada a este espaço amostral. A função de probabilidade será representada por p(X=x) ou p(x). Onde: Σp(x) = 1 e p(x) poderá ser expresse por uma tabela, gráfico ou fórmula: EXEMPLO: E – lançamento de duas moedas X – número de caras obtidas S = {(c,c) (c,k) (k,c) (k,k)} A TABELA:

O GRÁFICO

xi 0 1 2p(xi) 0,25 0,5 0,25

Page 74: Apostila de Estatística - Shiguti

72

A FÓRMULA

p(x) =

x2

41 , para x = 0, 1, 2

OBS: Qualquer função de uma v.a. é também uma v.a. isto é se x é uma v.a., então y =ϕ(x) também será. EXEMPLO:

x – v.a. pontos de um dado; y = x + x – v.a. soma dos pontos de dois lançamento; z = max{(x1, x2)} onde (x1, x2) pontos de dois dados. A distribuição de probabilidade de x será:

A distribuição de y será:

( ) ( ) ( )( ) ( ) ( )( ) ( ) ( )

( ) ( ) ( )

=

6,6 ... 2,6 6,1

3,6 ... 2,3 3,12,6 ... 2,2 2,11,6 ... 2,1 1,1

SM

yi 2 3 4 5 6 7 8 9 10 11 12

p(yi) 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36 A de z será:

zi 1 2 3 4 5 6 p(zi) 1/36 3/36 5/36 7/36 9/36 11/36

Exemplo:

No lançamento de dois dados a v.a. x anota a diferença dos pontos das faces superiores. Determine os valores de x e a função de probabilidade associada. EXERCÍCIO

A urna A contém 3 bolas brancas e 2 bolas pretas. A urna B contém 5 bolas brancas e 1 bola preta. Uma bola é retirada ao acaso de cada urna e a v.a. x anota o número de bolas brancas obtidas. Determine os valores de x e a função de probabilidade.

xi 1 2 3 4 5 6p(xi) 1/6 1/6 1/6 1/6 1/6 1/6

Page 75: Apostila de Estatística - Shiguti

73

MEDIDAS DE POSIÇÃO E VARIABILIDADE DA V. ALEATÓRIA UNIDIMENSIONAL DISCRETA. O VALOR ESPERADO DA V.A. . A v.a. será utilizada para estabelecer modelos teóricos de prob. Com a finalidade de descrever populações. A média, a variância, o desvio padrão, representarão parâmetros destas populações e serão denotados por µ, σ2(x) e σ(x), respectivamente. Se x é uma v.a. dada por:

xi x1 x2 x3 ... xn p(xi) p(x1) p(x2) p(x3) ... p(xn)

µ = Σxi * p(xi) também conhecido como E(x) A VARIÂNCIA DA V.A. VAI SER: σ2(x) = Σ (xi - µ)2* p(xi) ou σ2(x) = E(x2) – [E(x)]2 E O DESVIO PADRÃO: ____ σ(x) = √σ2(x) Exemplo: No lançamento de uma moeda, a v.a. anota o no. de caras obtidos. Calcule a média a variância e o desvio padrão da v.a. x. EXERCÍCIO: Calcule a média a variância e o desvio padrão da v.a. x dada abaixo.

xi 2 5 8 10 p(xi) 0,3 0,4 0,2 0,1

VARIÁVEL ALEATÓRIA UNIDIMENSIONAL CONTÍNUA Se uma v.a. assume todos os valores de um intervalo real, então x é denominada uma v.a. contínua. Essas v.a. surgem de processos definidos a partir de medidas. Ex: Considere o intervalo real de [2,10] e a função que associa a cada ponto deste intervalo sua distância ao ponto 2. A v.a. x assumirá valores no intervalo[0,8] sendo portanto uma v.a. contínua. FUNÇÃO DENSIDADE DE PROBABILIDADE (F.D.P.) Quando definimos a v.a. discreta associamos a cada ponto xi do espaço amostral um valor real p(xi) com:

Page 76: Apostila de Estatística - Shiguti

74

1. 0 ≤ p(xi) ≤ 1 2. Σp(xi) = 1

Para a v.a. contínua não poderemos usar tal processo pois não existe uma função que associa cada ponto

p de um intervalo um valor real. Para a v.a. contínua definiremos: 1. f(xi) ≥0 2. A área da região compreendida sobre o gráfico da função e o eixo ox é igual a 1.

MEDIDAS DE POSIÇÃO E DE VARIABILIDADE DE UMA V.A. UNIDIMENSIONAL CONTÍNUA. VALOR ESPERADO:

E(x) = ∫∞

∞−

⋅ f(x)dxx E(x2) = ∫∞

∞−

⋅ f(x)dxx 2

VARIÂNCIA E DESVIO PADRÃO

( ) ( )[ ]222 xE)E(xx −=σ e o D.P. = ( ) ( )xx 2σσ =

VARIÁVEL ALEATÓRIA BIDIMENSIONAL Exemplo: Considere E, que consiste no lançamento de dois dados. Seja x a v. a. que anota o número de pontos da face superior do primeiro dado, e seja y a v.a. que anota o número de pontos da face superior do segundo dado.

YX

1 (1 1) (1 2) ... (1 6)23 ...4 ...56 (6 1 ) ... (6 6)

1 2 3 4 5 6

Page 77: Apostila de Estatística - Shiguti

75

A tabela de Probabilidade é:

Logo a função de probabilidade conjunta é: P(X = xi, Y = yj) satisfazendo as condições.

Discreta

Contínua

1. p(xi,yj) ≥ 0 1. f(x,y) ≥ 0

2. ∑∑∞

=

=

=1 1

ji 1)y,p(xi j

2. 1y)dxdyf(x, =∫ ∫∞

∞−

∞−

A DISTRIBUIÇÃO MARGINAL DE PROBABILIDADE Dada uma v.a. bidimensional e sua distribuição conjunta pode-se determinar a distribuição de X sem considerar Y, ou vice-versa. São as chamadas distribuições marginais. Se (X,Y) discreta; então:

Distribuição Marginal de X:

==

∞<<−∞===

∑j

jii

i

yxPxXPou

yxXPxXP

),()(

,()(

YX

1 1/36 ... 1/362 1/363 ...4 ...56 1/36 ... 1/36

5 61 2 3 4

Page 78: Apostila de Estatística - Shiguti

76

Distribuição Marginal de X:

==

∞<<−∞===

∑i

jij

ji

yxPyYPou

xyYPyYP

),()(

,()(

Exemplo: anterior

YX

1 1/36 ... 1/36 1/62 1/36 ...3456 1/36 ... 1/36 1/6

p(x) 1/6 1/6 1

p(y)3 4 5 61 2

VARIÁVEL ALEATÓRIA INDEPENDENTES

Seja (X,Y) uma v.a. discreta bidimensional. Diz-se que X e Y são independentes se, e somente se , p(xi,yj) = p(xi)p(yj) para quaisquer i e j. Seja (X,Y) uma v.a. aleatória contínua bidimensional. Diz-se que X e Y são independentes se e somente se, f(x,y)=g(x)h(y) para todo (x,y). Obs: g(x) distribuição marginal de x da v.a. contínua e h(x) da v. a. de y

Page 79: Apostila de Estatística - Shiguti

77

EXEMPLO: Dada a distribuição de probabilidade conjunta de (X,Y) pela tabela abaixo. Verificar se X e Y são independentes.

Solução: Para todo i, j; i=0, 1, 2 e j=0, 1, 2

P(xi,yj) = p(xi)p(yj) Para o par (0,0) tem-se : P(0,0) = 0,10 e p(x=0) . P(y=0) = 0,2 . 0,5 = 0,10 Para o par (0,1) tem-se : P(0,1) = 0,04 e p(x=0) . P(y=1) = 0,2 . 0,2 = 0,04 Continuando todos os cálculos se verificará que todos serão satisfeitos e por isso concluímos que X e Y são independentes.

y\x 0 1 2 p(yj)0 0,1 0,2 0,2 0,51 0,04 0,08 0,08 0,22 0,06 0,12 0,12 0,3

p(xi) 0,2 0,4 0,4 1

Page 80: Apostila de Estatística - Shiguti

78

MEDIDAS DE POSIÇÃO E DE VARIABILIDADE DE UMA V.A. BIDIMENSIONAL DISCRETA E CONTÍNUA. A média ou esperança matemática deve ser calculada usando as fórmulas:

( ) ( )

( ) ( )

( ) ( )∑ ∫∫∑∫∑

==

==

==

dxdy )y x(y xxyE )yp(xyxxyE

dy )y(yyE )p(yyyE

dx )x(xxE )p(xxxE

jijjiji

jjj

iii

f

f

f

i

j

i

A variância, o desvio padrão, a covariância e o coeficiente de correlação serão calculados a partir das fórmulas abaixo.

( ) [ ]( ) [ ]( ) ( ) ( ) }( ) ( ) ( )} tesindependen foremy e x Quando yxyx

quaisquer foremy e x que em caso o Para )xycov(2yxyx

contínuo e discreto caso o Para E(y)-)E(yy

E(x)-)E(xx

222

222

222

222

σσσ

σσσ

σ

σ

+=±

−+=±

=

=

( ) ( )xx 2σσ =

E(y)E(x) - E(xy) Cov(xy) ⋅=

( ) ( )yxcov(xy)(xy)

σσρ

Exercícios Resolvidos. 1. Uma carta é retirada aleatoriamente de um baralho comum de 52 cartas, e a v.a. X anota o número de damas obtidos nessa retirada. Determinar os valores de X e a função de probabilidade associada. Solução Seja S o espaço amostral da retirada de uma carta do baralho S = { AO, 2O, ..., 10O, ..., JO, DO, KO, AP, 2P, ..., 10P, ..., JP, DP, KP, AE, 2E, ..., 10E, ..., JE, DE, KE, AC, 2C, ..., 10C, ..., JC, DC, KC} Onde: AO é a carta Ás de Ouro 2O é a carta 2 de Ouro e assim sucessivamente A v.a. X anota o número de damas obtido, veja que aqui não foi mencionado o naipe, logo estamos interessados somente se sai (1) ou não (0) uma carta de damas. As probabilidades bem como os valores que a v.a. X pode assumir estão discriminados na distribuição de probabilidade abaixo.

X 0 1 p(x) 48/52 4/52

2. A tabela a seguir dá as probabilidades de um oficial de justiça receber 0, 1, 2, 3, 4 ou 5, relatórios de violação de liberdade condicional em um dia qualquer.

X 0 1 2 3 4 5 p(x) 0,15 0,25 0,36 0,18 0,04 0,02

Page 81: Apostila de Estatística - Shiguti

79

a) Encontre a média e o desvio padrão de X. Solução A média pode ser denotada por E(x) ou por µ, assim: E(x) = ∑xi.p(xi) = 0.(0,15) + 1.(0,25) + 2.(0,36) + 3.(0,18) + 4.(0,04) + 5.(0,02) = 1,77 Para calcularmos o Desvio padrão, que será denotado por D.P. ou por σ(x), deveremos antes encontra a variância que será: Var(x) = σ2

(x) = E(x2) – [E(x)]2 Onde E(x2) = ∑ xi

2.p(xi) = 02.(0,15) + 12.(0,25) + 22.(0,36) + 32.(0,18) + 42.(0,04) + 52.(0,02) = 4,45 Assim a variância de x será: σ2

(x) = E(x2) – [E(x)]2 = 4,45 – [1,77]2 = 1,32 Como estamos interessados no desvio padrão teremos que tirar a raiz quadrada da variância . Logo: σ(x) = 1,14 3. A tabela abaixo fornece a probabilidade de que um sistema de computação fique fora de operação um dado período por dia durante a fase inicial de instalação do sistema. Calcular:

a) o número esperado de vezes que o computados fique fora de operação por dia b) O desvio padrão desta distribuição de probabilidade.

Solução

a) E(x) = 6,78 b) σ2

(x) = E(x2) – [E(x)]2 = 47 – [6,78]2 = 1,032 σ(x) = 1,016

4. O trem do metrô para no meio de um túnel. O defeito pode ser na antena receptora ou no painel de controle. Se o defeito for na antena, o conserto poderá ser feito em 5 minutos. Se o defeito for no painel, o conserto poderá ser feito em 15 minutos. O encarregado da manutenção acredita que a probabilidade de o defeito ser no painel é de 60%. Qual é a expectativa do tempo de concerto? Solução Se o defeito for na antena o conserto deverá ser feito em 5 minutos. Se o defeito for no painel estima-se um conserto em 15 minutos. Logo a distribuição de probabilidade será:

X 5 15 p(x) 0,4 0,6

E(x) = 5.(0,4) + 15.(0,6) = 11 minutos é a expectativa do tempo de conserto 5. Uma v.a. assume os valores 2, 3, 5, com probabilidades de 0,3, 0,5 e 0,2 respectivamente. Calcule o valor esperado e o desvio padrão da v.a. Y = 2x + 5. Solução

Número de período X 4 5 6 7 8 9Probabilidade p(x) 0,01 0,08 0,29 0,42 0,14 0,06

Número de período X 4 5 6 7 8 9 TotalProbabilidade p(x) 0,01 0,08 0,29 0,42 0,14 0,06 1

x.p(x) 0,04 0,4 1,74 2,94 1,12 0,54 6,78x^2.p(x) 0,16 2 10,44 20,58 8,96 4,86 47

Page 82: Apostila de Estatística - Shiguti

80

Y = 2x + 5 E(y) = E(2x) + E(5) =

E(y) = 2E(x) + 5 = ? Calculando a esperança de x e a esperança de x2 teremos:

X 2 3 5 p(x) 0,3 0,5 0,2

E(x) = 2.(0,3) + 3.(0,5) + 5.(0,2) = 3,1 Logo E(y) = 2(3,1) + 5 = 11,2 Descubra como encontrar a Var(Y)!!!!!!!

6. Seja ( ) ( )

,0

1 x 0 , 123 2

≤≤−

=contráriocaso

xxf

a) f(x) é uma legitima Função Densidade de Probabilidade (f.d.p)? b) Encontre a média e o Desvio padrão da v.a. X

Solução Para que uma função f(x) seja uma legitima f.d.p. ela deverá satisfazer as seguintes condições:

1. f(x) ≥ 0

2. a 1)(1

0

=∫ dxxf

Observe que a função foi definida no intervalo de [0,1] e recebe o valor 0 para qualquer outro intervalo. Logo a 1ª condição já foi verdadeira. Para provar a Segunda deveremos resolver a integral:

( ) ( ) 1 32

23

3x -

23 1

23 11

23

1

0

31

0

1

0

21

0

2 =

=

=−==− ∫∫ xdxxdxx

Logo f(x) é uma legítima f.d.p. Para achar a Média faremos:

E(x) = 1)( . 1

0

=∫ dxxfx = ( ) ( )83

41

23

4x -

223

23 11

23 .

1

0

41

0

21

0

31

0

2 =

=

=−==

− ∫∫

xdxxxdxxx

E(x2) =

1)( . 1

0

2 =∫ dxxfx = ( ) ( )51

153

152

23

5x -

323

23 11

23 .

1

0

51

0

31

0

421

0

22 ==

=

=−==

− ∫∫

xdxxxdxxx

Logo a variância será: σ2

(x) = E(x2) – [E(x)]2 = 1/5 – [3/8]2 = 19/320 = 0,0594 7. Considere a seguinte distribuição conjunta de probabilidade. Encontre as marginais de X e Y e verifique se X e Y são independentes. Solução

O cálculo das marginais de X e Y é feito da seguinte forma:

xy

1 0,05 0,08 0,053 0,2 0,15 0,055 0,25 0,07 0,1

p(x)

2 4 6 p(y)

Page 83: Apostila de Estatística - Shiguti

81

Para saber se X e Y são independentes devemos verificar para todos os casos se P(X=xi,Y = yj) = P(X=xi).P(Y = yj), então:

1. (x = 2 e y = 1) ⇒ 0,05 ≠ 0,5 . 0,18 2. (x = 2 e y = 3) ⇒ 0,2 = 0,5 . 0,4 3. (x = 2 e y = 5) ⇒ 0,25 ≠ 0,5 . 0,42 4. (x = 4 e y = 1) ⇒ 0,08 ≠ 0,3 . 0,4 ...

E assim sucessivamente. Podemos ver que como a condição P(X=xi,Y = yj) = P(X=xi).P(Y = yj) não foi satisfeita para todos i e j diremos que X e Y não são independentes. 8. Considere a seguinte distribuição conjunta de X e Y .

a) achar as distribuições marginais de X e Y; b) Calcular E(x), E(y) e E(x,y); c) Calcular a covariância de X e Y; d) Calcular a correlação de X e Y. e) X e Y são independentes?

Solução

XY

1 0,05 0,08 0,05 0,05+0,08+0,05=0,18 P(Y=1)3 0,2 0,15 0,05 0,45 0,25 0,07 0,1 0,42

p(x) 0,5 0,3 0,2 1

P(X=2)

2 4 6 p(y)

Probabilidade Conjunta de X e Y

XY Probabilidade

1 0,05 0,08 0,05 0,05+0,08+0,05=0,18 P(Y=1) Marginal 3 0,2 0,15 0,05 0,4 de Y quando yj = 15 0,25 0,07 0,1 0,42

p(x) 0,5 0,3 0,2 1

Probabilidade P(X=2) Marginal

de X quando xi = 2

p(y)

P(X = 2 , Y = 1)

2 4 6

XY

1 0,1 0,2 0 0,32 0,2 0,1 0,1 0

p(x)

5 p(y)-2 -1 4

X Y

1 0,1 0,2 0 0,3 0,62 0,2 0,1 0,1 0 0,4

p(x) 0,3 0,3 0,1 0,3 1

Distribuição y 1 2 Totalde Probabilidade p(y) 0,6 0,4 1 A variância de y é :

de X e sua Marginal y.p(y) 0,6 0,8 1,4 E(y) Var(y) = E(y y ) - [E(y)]2

y^2.p(y) 0,6 1,6 2,2 E(y2) Var(y) = 2,2 - (1,4)2 = 0,24D.P. = 0,49

Distribuição x -2 -1 4 5 Total A variância de x é :de Probabilidade p(x) 0,3 0,3 0,1 0,3 1 Var(x) = E(x 2 ) - [E(x)]2

de Y e sua Marginal x.p(x) -0,6 -0,3 0,4 1,5 1 E(x) Var(x) = 10,6 - (1)2 =9,6x^2.p(x) 1,2 0,3 1,6 7,5 10,6 E(x2) D.P. = 3,09

5 p(y)-2 -1 4

Page 84: Apostila de Estatística - Shiguti

82

A E(x,y) = ∑ xi.yj. p(xi , yj) E(x,y) = (-2) . (1) . (0,1) + (-2) . (2) . (0,2) + ... +(5) . (2) . (0) = 0,9 A Covariância é dada por Cov(x,y) = E(x,y) – E(x) . E(y) = 0,9 – [1,4 . 1] = - 0,5

A Correlação será: ( ) ( )( ) ( )y x σ . σ

yx,Cov yx,ρ = = 0,3- 3,09 . 49,05,0

=−

Se utilizarmos P(X=xi,Y = yj) = P(X=xi).P(Y = yj) verificaremos que em alguns caso ela não será satisfeita para algum i e j, logo X e Y não são independentes.

Page 85: Apostila de Estatística - Shiguti

83

Exercícios 1. Sabe-se que a chegada de clientes a uma loja de material computacional, durante intervalos aleatoriamente

escolhidos de 10 minutos, segue uma distribuição de probabilidade dada na tabela abaixo. Calcule o número esperado de chegada de clientes por intervalo de 10 minutos, e calcule também o desvio padrão das chegadas.

2. As vendas de uma revista mensal em uma banca segue uma distribuição de probabilidade dada na tabela

abaixo. Calcule o valor esperado e a variância.

3. Um vendedor determinou as probabilidades referentes a vendas diárias visitando 10 possíveis compradores,

as probabilidades estão apresentadas na tabela abaixo. Calcule o número esperado de vendas e o desvio padrão

4. Dada a v.a.

Calcule a média e o desvio padrão da v.a. Y = 3 - 34 x

5. Uma v.a. discreta tem distribuição de probabilidade dada por:

P(x) = 7 5, 3, 1, x para ,xK

=

a) Calcule o valor de K b) Calcule P(x = 5)

6. Verifique se a função abaixo é uma legítima f.d.p.

≤≤

=contrário caso 0,

1 x 0 se ,21

)(x

xf

Número de chegadas X 0 1 2 3 4 5Probabilidade p(x) 0,15 0,25 0,25 0,2 0,1 0,05

Respostas E(x) = 2 e Var(x)= 1,9

Número de revistas emMilhares X probabilidade de X 0,05 0,1 0,25 0,3 0,2 0,1

Respostas E(x) = 17,8 e Var(x)= 1,66

18 201915 16 17

Número de vendas X 1 2 3 4 5 6 7 8Probabilidade p(x) 0,04 0,15 0,2 0,25 0,19 0,1 0,05 0,02

Respostas E(x) = 4 e Var(x)= 2,52

x -1 2 5 8p(x) 0,2 0,3 0,4 0,1

Page 86: Apostila de Estatística - Shiguti

84

7. Verifique se X e Y são independentes para a distribuição conjunta de probabilidade dada abaixo.

8. Sejam M e N duas v.a. aleatórias independentes com as seguintes distribuições de probabilidade

a) Achar a distribuição conjunta de probabilidade de M e N; b) Calcular E(m) e E(n) c) Calcule a covariância de M e N d) Encontre a correlação de M e N

9. As v.a. X e Y admitem a seguinte distribuição conjunta de probabilidade.

Encontre a e b para que as v.a. X e Y sejam independentes. 10. Utilizando a Função Densidade de Probabilidade do exercício % encontre a média e a variância. 11. Suponha que X e Y tenha distribuição conjunta dada pela tabela abaixo.

a) Encontre a cov(X,Y) b) Ache a Correlação de X e Y c) Verifique se x e Y são independentes.

XY

0 0,1 0,2 0,21 0,04 0,08 0,082 0,06 0,12 0,12

p(x)

0 1 2 p(y)

M 1 3 N 5 10 12p(m) 0,6 0,4 p(n) 0,3 0,5 0,2

XY

4 0,2 0,15 b5 a 0,15 0,15

p(x)

1 2 3 p(y)

XY

-1 0 1/5 00 1/5 1/5 1/51 0 1/5 0

1-1 0

Page 87: Apostila de Estatística - Shiguti

85

UNIDADE X – DISTRIBUIÇÃO DISCRETA

INTRODUÇÃO – VARIÁVEIS ALEATÓRIAS

Quando na prática desejamos investigar algum fenômeno, estamos na realidade interessados em estudar a distribuição de uma ou mais variáveis. Do ponto de vista prático, é desejável que se defina uma variável aleatória (v.a.) associada a uma amostra ou experimento, de tal modo que seus resultados possíveis sejam numéricos. Por exemplo, a jogada de uma moeda tem dois resultados - cara (k) ou coroa (c) - que não são numéricos. Poderíamos então considerar como nossa variável aleatória o “número de caras numa jogada”, que tem os valores numéricos possíveis 0 e 1. Para uma moeda jogada duas vezes, nossa variável aleatória poderia ser “número de caras em duas jogadas”, como os valores numéricos 0, 1 e 2. Outro exemplo de variável aleatória seria o número de fregueses que entram numa grande loja num intervalo de 20 minutos: 0, 1, 2, .... Ainda outro exemplo de variável aleatória seria a altura dos estudantes numa sala de aula de uma universidade, com um âmbito contínuo que iria, digamos, de 1,5 a 2,0m.

Para todos os exemplos aqui descritos, atribuímos a um ponto amostral um único valor real, conhecido como variável aleatória unidimensional. Porém, na maioria das vezes, há interesse em atribuir, para um mesmo ponto amostral, duas ou mais características numéricas. Assim, por exemplo, podemos estar interessados em investigar, ao mesmo tempo, a altura (h) e o peso (p) de uma pessoa em uma certa população. Neste caso, temos o par (h, p), que é dito como variável aleatória bidimensional.

As varáveis aleatórias podem ser do tipo:

◊ Discreta: uma variável aleatória é considerada discreta se toma valores que podem ser contadas. Exemplos de variáveis aleatórias discretas são

◊ número de acidentes de carro por semana;

◊ número de defeitos em sapatos produzidos;

◊ número de terremotos;

◊ número de livros em uma estante.

◊ Contínua1: uma variável aleatória é considerada contínua quando pode tomar qualquer valor de um determinado intervalo. Alguns exemplos de v.a. contínua são apresentados a seguir:

◊ pesos de caixas de laranja;

◊ alturas de árvore;

◊ duração de uma conversa telefônica.

DISTRIBUIÇÕES DISCRETAS

PROVAS INDEPENDENTES. FÓRMULA DE BERNOULLI.

A fórmula de Bernoulli é designada através dos ensaios de Bernoulli, que na realidade são ensaios independentes repetidos, cada um deles com apenas dois resultados possíveis e cujas probabilidades permanecem constantes durante toda a realização dos ensaios. É usual denotarmos as duas probabilidades por p e por q = 1-p, e nos referimos ao resultado que tem probabilidade p como um sucesso S e q como um fracasso F.

1 Este tipo de variável será abordado na próxima unidade.

Page 88: Apostila de Estatística - Shiguti

86

Obviamente p e q ≥ 0 e que p+q = 1. O espaço amostral associado a cada ensaio individualmente é formado por um dos dois pontos.

EXEMPLO:

Suponhamos o lançamento de uma moeda (honesta), ocorre “sucesso” quando aparecer “cara”. Então o espaço amostral será S ou F, para um lançamento.

( ) ( )( ) ( )

==−==⇒===⇒

=FPqp10xP (F) coroa""lor ocorrer va se , 0

SPp1xP (S) cara""lor ocorrer va se , 1X

então:

( ) ( ) x1x p1pxXP −−⋅==

para x = 0, 1, que é conhecida como Distribuição de Bernoulli, com parâmetros 1 e p:

Xi ~ Bernoulli(1,p)

Sabemos que:

◊ Esperança matemática: E(x) = p

◊ Variância: Var(x) = p(1-p) = pq.

Suponhamos agora n ensaios de Bernoulli. O espaço amostral associado contém 2n pontos ou sucessão de n símbolos S ou F, cada um deles representando um resultado possível do experimento. Como os ensaios são independentes, suas probabilidades se multiplicam. Em outras palavras, a probabilidade de qualquer seqüência especificada é o produto obtido quando substituímos os símbolos S ou F por p e q, respectivamente. Dessa forma:

P(SSFSFF...FS) = ppqpqq...qp.

EXEMPLO 1:

Suponhamos o lançamento de uma moeda honesta 3 vezes, onde a ocorrência de cara, corresponde ao sucesso. Então o número de elementos do espaço amostral será 23 = 8. Abaixo está indicado o espaço amostral com suas respectivas probabilidades:

→→→→→→→→

=

32

22

22

23

qFFFpqSFFpqFFSqpSFSpqFSFqpSSF

qpFSSpSSS

tralEspaçoAmos

Page 89: Apostila de Estatística - Shiguti

87

EXEMPLO 2:

Supor que em certa comunidade a probabilidade de uma pessoa ter problemas de psicose seja igual a 0.01. Se definimos:

=contrário caso se , 0

psicose temcomunidade da pessoa certa uma se , 1Y

Teremos então que Y é uma v.a de Bernoulli e sua distribuição é dada por:

y 0 1

P(Y=y) 0,99 0,01

DISTRIBUIÇÃO BINOMIAL

Vamos supor que estamos interessados em calcular a probabilidade de se obter exatamente duas faces 4 em três lançamento de um dado.

È possível descrever este procedimento através das seguintes combinações:

(4∩4∩N) ou (4∩N∩4) ou (N∩4∩4)

em termos de probabilidade ficaria:

P[(4∩4∩N) ∪ (4∩N∩4) ∪ (N∩4∩4)]

Como esses três eventos são mutuamente exclusivos, então:

P[(4∩4∩N) ∪ (4∩N∩4) ∪ (N∩4∩4)] = P(4∩4∩N) + P(4∩N∩4) + P(N∩4∩4)]=(65

61

61

61

65

61

61

61

65

⋅⋅+⋅⋅+⋅⋅ )

As probabilidades destes três casos são iguais podendo ser escritas da seguinte forma:

=3232

65

61 −

⋅ onde o número 3 também poderá ser escrito como a

( ) ( ) !3!23!3

x!!x-n!n3

2 −==C

Quando observamos uma sucessão de n ensaios de Bernoulli, estamos interessados apenas no número total de sucessos e não na ordem em que eles ocorrem. O número de sucessos poderá ser qualquer um dos números 0, 1, 2, 3,..., k. Em n ensaios há ocorrência de n-k fracassos. E isto pode acontecer de tantas

maneiras quantas são as formas de distribuirmos as k letras S em n posições, ou seja, nk maneiras diferentes de

ocorrer k sucessos, a cada maneira associarmos a probabilidade pkqn-k. Considerando o exemplo anterior, para k=2 (sucessos):

maneiras 323

kn

2k3n

qpFSSqpSFSqpSSF

2

2

2

=

=

=

==

⇒→→→

Page 90: Apostila de Estatística - Shiguti

88

Daí,

( ) 1212 323

2 qpqpxP ⋅⋅=⋅⋅

==

n ..., 3, 2, 1, i ondeensaio ésimo-i no falhaocorrer se , 0

ensaio ésimo-i no sucessoocorrer se , 1Xi

=

=

Se Xi ~ Bernoulli(1,p), então a seqüência (X1, X2, ..., Xn) poderá obter 2n resultados do tipo (0,0,1,1,...,0), (0,0,...,1,1), (1,1,...,1).

Se X =∑ Xi, então X = número de sucessos nos “n” ensaios, daí,

( )

( )

( ) knk

1n1

0n0

qpkn

kxP

qp1n

1xP

qp0n

0xP

⋅⋅

==

⋅⋅

==

⋅⋅

==

K

para k = 0, 1, 2, ... , n.

Neste caso dizemos que:

X ~ Binomial(n,p)

Se x = x1+ x2+ ... + xn, onde cada xi ~ Bernoulli(1,p) apresenta, respectivamente, uma esperança matemática e variância E(xi) =p e Var(xi) =p(1-p), então, para a distribuição binomial teremos:

◊ Esperança matemática: E(x) = np

◊ Variância: Var(x) = p(1-p) = npq.

CARACTERÍSTICAS DA DISTRIBUIÇÃO BINOMIAL

1) As repetições do experimento são independentes,

2) É uma soma de Bernoulli,

3) A v.a X, conta o número de sucessos nas n repetições do experimento. (ensaios de Bernoulli),

4) Existe P(Sucesso) = “p” constante e consequentemente q = P(F) = 1-p, também constante.

Em particular a probabilidade de que não ocorra sucesso é:

( ) ( ) nn0 qp1p0xP =−⋅==

Page 91: Apostila de Estatística - Shiguti

89

E a probabilidade de que ocorra pelo menos um sucesso é:

( ) ( ) ( ) nq10xP11xP11xP −==−=<−=≥

EXEMPLO 1:

Em oito lançamentos de uma moeda, qual será a probabilidade de ocorrerem pelo menos duas caras?

Definindo a v.a aleatória X = número de caras nos oito lançamentos, verificamos de imediato que X~Binomial(8,1/2). Assim:

( ) ( ) ( ) ( )[ ]1xP0xP12xPcaras duas menos peloP =+=−=≥=

Exercícios 1. A probabilidade de um atirador acertar o alvo é de 25%. Se ele atirar cinco vezes, qual a probabilidade dele acertar dois tiros. 2. Suponha que 1% dos programas que dão entrada no guichê de atendimento ao aluno, no CPD da UCB, não são executados devido a erros. Se em um dado dia 500 programas dão entrada no referido guichê, calcule:

a) A probabilidade de que todo a os programas tenham sido executados b) O número esperado de programas não executados devido a erro de impressão.

3. Os registros de uma pequena companhia indicam que 40% das faturas por ela emitidas são pagas após o vencimento. De 14 faturas expedidas, determine a probabilidade de:

a) Nenhuma ser paga com atraso. b) No máximo 2 serem pagas com atraso. c) Ao menos 3serem pagas com atraso.

Page 92: Apostila de Estatística - Shiguti

90

UNIDADE XI – DISTRIBUIÇÃO CONTÍNUA

DISTRIBUIÇÃO NORMAL

É uma das mais importantes distribuições de probabilidades, sendo aplicada em inúmeros fenômenos e constantemente utilizada para o desenvolvimento teórico da inferência estatística. É também conhecida como distribuição de Gauss, Laplace ou Laplace-Gauss.

Seja X uma v.a. (variável aleatória) contínua. X terá distribuição normal se:

( )f x e xX

=⋅

⋅ − ∞ < < ∞−

1

2

12

2

σ

µσ

Π ,

onde os parâmetros µ e σ2 são respectivamente a Média e a Variância.

A notação utilizada é:

X ~ N ( µ , σ2 )

que é lida da seguinte forma: a v.a. X se aproxima a uma distribuição normal com média µ e variância σ2 .

Para o cálculo das probabilidades, surgem dois grandes problemas: primeiro, para a integração de f(x) , pois para o cálculo é necessário o desenvolvimento em série; segundo, seria a elaboração de uma tabela de probabilidades, pois f(x) depende de dois parâmetros, fato este que acarretaria um grande trabalho para tabelar essas probabilidades considerando-se as várias combinações de µ e σ2 .

Os problemas foram solucionados por meio de uma mudança de variável obtendo-se, assim, a distribuição normal padronizada ou reduzida.

VARIÁVEL NORMAL PADRONIZADA

A variável Z é dada por:

σµ−X

onde X é uma variável normal de Média µ e variância σ2 .

Então a esperança matemática e a variância de Z será respectivamente:

E[z] = 0

Var[z] = 1

Então sua função será:

( )ϕ z ez

=⋅

⋅−1

2

12

2

Π

A notação utilizada é:

X ~ N ( 0 , 1 )

que é lida da seguinte forma: a v.a. X se aproxima a uma distribuição normal padronizada com média 0 e variância 1. As probabilidades, isto é, as áreas sob esta curva estão tabeladas.

Page 93: Apostila de Estatística - Shiguti

91

PROPRIEDADES DA CURVA NORMAL

O gráfico da função densidade de uma variável normal tem a forma de um sino e é simétrico em relação à média µ . Fixando-se a média, verificamos que o “achatamento” está diretamente ligado ao valor de σ . Ou seja,

Analisando os gráficos da distribuição normal padrão, poderemos destacar as seguintes propriedades:

1. f(x) é simétrica em relação à origem X= µ ou ϕ (z) é simétrica em relação à origem z=0;

2. f(x) possui um ponto de máximo para x = µ ou ϕ (z) possui um ponto de máximo para z=0 e, neste caso, sua

ordenada vale 1

20 39

⋅≅

Π, .

3. f(x) tende a zero quando x tende para ± ∞ ou ϕ (z) tende a zero quando z tende para ± ∞;

4. f(x) tem dois pontos de inflexão cujas abcissas valem µ + σ e µ - σ ou ϕ (z) tem dois pontos de inflexão cujas abcissas valem -1 e +1.

Page 94: Apostila de Estatística - Shiguti

92

Stevenson, William J. Estatística aplicada à administração. Harper & Row do Brasil, São Paulo, 1986, p.461

Page 95: Apostila de Estatística - Shiguti

93

Exemplos:

1. Para cada item abaixo monte a curva normal, pinte a área e encontre a probabilidade.

a) P(0 < z < 1)

b) P(-2,25 < z < 1,2)

c) P(z > 1,93)

2. As alturas dos alunos de determinada escola são normalmente distribuídas com média 1,60m e desvio padrão de 0,30m. Encontre a probabilidade de um aluno medir:

a) Entre 1,5 e 1,8m

b) Mais de 1,75

c) Menos de 1,48

d) Qual deve ser a medida mínima para escolhermos 10% dos mais altos?

Page 96: Apostila de Estatística - Shiguti

94

UNIDADE XII – ESTIMAÇÃO INTRODUÇÃO O processo de estimação tem por finalidade avaliar parâmetros de uma distribuição. Podemos utilizar um único número real para avaliar um parâmetro. Neste caso estamos procedendo a uma estimação pontual. O valor da média amostral é uma estimação por ponto. Da mesma forma o valor da variância, desvio padrão e proporção amostrais são estimativas por ponto dos parâmetros variância, desvio padrão e proporção populacionais, respectivamente.

Estimador Estimativa por ponto Parâmetro x x = 20 µ

s2(x) s2(x) = 5 ( )xσ 2 s(x) s(X) = 2 ( )xσ

p p = 0,3 p

Fazendo uso da estimativa por ponto encontramos uma dificuldade a de que amostras diferentes conduzem normalmente a estimativas diferentes. A variabilidade não pode ser controlada neste processo. O controle estatístico desta variabilidade nos leva então a fixar a estimação através de um intervalo. INTERVALO DE CONFIANÇA É um intervalo real, centrado na estimativa pontual que deverá conter o parâmetro com determinada probabilidade. Esta probabilidade será conhecida como nível de confiança associado ao intervalo. A notação mais usual para o nível de confiança é 1-α . Se pensarmos em uma diferença entre o valor estimado e o parâmetro, já que diferentes amostras conduzem a valores diferentes de estimadores, estaremos calculando o erro-padrão de estimativa. e = |estimativa – parâmetro | O controle da precisão se resumirá na determinação do erro-padrão da estimativa. DISTRIBUIÇÃO AMOSTRAL DAS MÉDIAS Considere a seguinte população x={2, 3, 4, 5}. Esta população apresenta ( ) ( ) 12,1xσ 25,1xσ 3,5 µ 2 === Se nós considerarmos todas as amostras de tamanho n=2 que podemos obter com reposição teremos: A1 = (2,2) A6 = (3,4) A2 = (2,3) A7 = (3,5) A3 = (2,4) A8 = (4,4) A4 = (2,5) A9 = (4,5) A5 = (3,3) A10 = (5,5) Cada uma destas amostras possui um valor médio: 2 x1 = 3,5 x 6 =

2,5 x 2 = 4 x 7 =

3 x 3 = 4 x8 =

3,5 x 4 = 4,5 x 9 =

Page 97: Apostila de Estatística - Shiguti

95

3 x 5 = 5 x10 = Podemos calcular a médias das médias bem como a sua variância e o seu desvio-padrão, assim: ( ) ( ) 87,0xσ 75,0xσ 3,5 x 2 === Note que: A média das médias é igual a média populacional : µ x = ; A variância das médias amostrais mantém com a variância populacional a seguinte relação :

( ) ( )n

xσxσ2

2 =

No exemplo: ( ) ( )n

xσxσ2

2 = = 75,02

1,25=

Estes resultados são conclusões gerais dos seguintes teoremas:

1. Se a variável aleatória x admite distribuição Normal de probabilidade com média µ e desvio padrão

( )xσ , então a distribuição amostral das médias é também normal com média µ x = e desvio padrão

( ) ( )n

xσxσ2

2 = ;

2. Se uma variável aleatória x tem média µ e desvio padrão ( )xσ , então distribuição amostral das

médias se aproxima de uma distribuição normal com média µ x = e com desvio-padrão

( ) ( )n

xσxσ2

2 = , a medida que o número n de elementos tende a infinito.

EXEMPLO: 1. Uma v.a. x tem distribuição normal com média 20 e desvio-padrão de 3. Calcule a probabilidade de que uma amostra de 20 elementos selecionada ao acaso tenha média maior que 21. O INTERVALO DE CONFIANÇA PARA A MÉDIA POPULACIONAL Como já foi estudado para se transformar uma distribuição Normal x em uma distribuição Normal z

utilizamos a mudança de variável ( )xσµ -x z =

A transformação da distribuição x na distribuição z , é por analogia: ( )xσ

x - x z = como foi visto

anteriormente µ x = e ( ) ( )n

xσxσ2

2 = , logo: ( )nxσµ - x z = .

Em termos de distribuição normal z o nível de confiança é a probabilidade de o intervalo conter o

Page 98: Apostila de Estatística - Shiguti

96

parâmetro estimado, isto representa a área central sob a curva normal entre os pontos 2α

2α z e z- ,

Observe que a área total sob a curva normal é unitária. Se a área central é 1-α ., a notação

z-2α representa o valor de z que deixa a sua esquerda

2α , e a notação

2αz representa o valor de z que deixa a

sua direita a área 2α . Desta forma:

P( z-

2α < z <

2αz ) = 1-α

Se substituirmos o valor de z por ( )nxσµ - x z = e utilizando alguns cálculos matemáticos encontraremos a

expressão final do Intervalo de Confiança para a estimativa da média populacional.

( ) ( ) α1 nxσz x µ

nxσz - xp

2α −=

⋅+<<⋅

Para calcular esta expressão deveremos pressupor o conhecimento do desvio-padrão populacional, e que a

amostragem foi obtida com reposição. Além disso é importante salientar que ( )nxσz

2α ⋅ representa o erro-padrão

de estimativa, e que os limites são estabelecidos pelos valores (estimativa – erro, estimativa +erro) EXEMPLO: 1. O departamento de recursos humanos de uma grande empresa informa que o tempo de execução de tarefas

que envolvem participação manual varia de tarefa para tarefa, mas que o desvio padrão permanece aproximadamente constante , em 3 minutos.Uma nova tarefa está sendo implantada na empresa. Uma amostra aleatória do tempo de execução de 50 destas novas tarefas forneceu o valor médio de 15 minutos. Determine um intervalo de confiança de 95% para o tempo médio de execução desta nova tarefa.

Page 99: Apostila de Estatística - Shiguti

97

UNIDADE XIII – TESTES DE SIGNIFICÂNCIA INTRODUÇÃO Como vimos toda avaliação feita sobre um parâmetro populacional, o qual não possuímos nenhuma informação, pode ser resultado do processo de estimação feito através do Intervalo de Confiança. Se já possuímos alguma informação, podemos testá-la no sentido de aceitá-la como verdadeira ou rejeitá-la. Os Teste de Significância tem por finalidade, a partir da elaboração de uma Hipótese Nula H0 e de uma Hipótese Alternativa Ha, verificar a aceitabilidade ou não da informação. Por isso ser conhecida como uma Regra de Decisão. Para sermos mais claro, isto significa que a partir de uma amostra de uma determinada população iremos confirmar ou não o valor do parâmetro através da análise de decisão sobre aceitar H0 ou rejeitar H0. Quando nos propuser utilizar tal procedimento devemos ter em mente que estamos sujeitos a erros e acertos na decisão. De um modo geral, em qualquer tipo de decisão, os acertos e os erros podem ser dispostos segundo o quadro abaixo:

Estado da Natureza Decisão H0 é verdadeira H0 é falsa

Aceita-se H0 Decisão Correta Erro tipo II Rejeita-se H0 Erro tipo I Decisão Correta

Erro Tipo I - Consiste em rejeitar H0 quando H0 é verdadeira Erro Tipo II - Consiste em aceitar H0 quando H0 é falsa Nível de Significância do Teste - é a probabilidade de se cometer o erro Tipo I, ou seja, rejeitar uma Hipótese verdadeira. O Nível de significância será denotado por α . A probabilidade do erro Tipo II não possui um nome em especial mais será conhecida como erro β . A fixação da Hipótese alternativa é que diferencia os vários tipos de Teste. EXEMPLOS 1. Julgamento do Réu

Estado da Natureza Decisão Inocente Culpado Inocente Decisão Correta Erro tipo II Culpado Erro tipo I Decisão Correta

O erro Tipo I, no caso, seria julgar o réu culpado, quando na verdade ele é inocente. O erro Tipo II, seria julgar o réu inocente , quando na verdade ele é culpado. 2. Decisão de um médico sobre uma cirurgia

Estado da Natureza Decisão Precisa Operar Não Precisa Operar Opera Decisão Correta Erro tipo II

Não Opera Erro tipo I Decisão Correta

O erro Tipo I seria não operar, quando na verdade o paciente precisa ser operado O erro Tipo II seria operar, quando o paciente não precisa ser operado. Na realização dos testes, controlaremos o erro tipo I, procurando diminuir a probabilidade de sua ocorrência Quando controlarmos os níveis β e α , estaremos realizando um Teste de Hipótese.

Page 100: Apostila de Estatística - Shiguti

98

TIPOS DE TESTES.

1º Tipo -

>

=

rparâmetro:H

rparâmetro:H

a

0 2º Tipo -

<

=

rparâmetro:H

rparâmetro:H

a

0 3º Tipo -

=

rparâmetro:H

rparâmetro:H

a

0

A realização de um Teste Compreende as seguintes etapas

1. Identificar H0; 2. Identificar Ha ( atenção, pois Ha define o tipo de teste a ser empregado) 3. Construir a região crítica para o teste escolhido; 4. Calcular o estimador e verificar se ele se situa na região de aceitação ou na região de rejeição da hipótese

H0. 5. Decisão do teste – Se o estimador estiver na região de aceitação Aceita-se H0

Se o estimador estiver na região de rejeição, Rejeita-se H0 TESTE DE SIGNIFICÂNCIA PARA A MÉDIA

O melhor estimador para µ e x . A distribuição amostral das médias é normal, com: ( )nxσµ - x z =

1º Teste -

>=

b µ :Hb µ :H

a

0 A região crítica (de Rejeição – RR) é: ( )

nxσµ - x z =

2º Teste –

<=

b µ :Hb µ :H

a

0 A região crítica (de Rejeição – RR) é:

( )nxσµ - x z =

3º Teste –

≠=

b µ :Hb µ :H

a

0 A região crítica (de Rejeição – RR) é: ( )

nxσµ - x z =

Page 101: Apostila de Estatística - Shiguti

99

EXEMPLO 1. Uma amostra Aleatória de 40 elementos retirados de uma população normal com desvio padrão igual a 3 apresentou um valor médio igual a 60. Teste, ao nível de significância de 5%, a hipótese de que a média populacional seja igual a 59, supondo a hipótese alternativa µ >59. Solução:

>=

59 µ :H59 µ :H

a

0

Ao nível de 5% de significância, a região crítica para a hipótese nula é:

O valor de zt = 1,64 é proveniente da tabela normal onde no corpo podemos procurar o valor de 0,5 - 0,05. O valor de zc é dado por:

( )nxσµ - x zc = =

403

59 - 60 = 2,11

Como o valor de zc = 2,11 está na região de rejeição para a hipótese H0. Não temos motivos para aceitar H0. 2. Uma amostra aleatória de 20 elementos selecionados de uma população normal com variância 3 apresentou média 53. Teste ao nível de significância de 5% a hipótese µ =50. Solução

≠=

50 µ :H50 µ :H

a

0

Ao nível de 10% de significância, a região crítica para a hipótese nula é:

O valor de zc é dado por:

( )nxσµ - x zc = =

201,73

50 - 53 = 7,755

Como o valor de zc = 7,755 está na região de rejeição para a hipótese H0. Não temos motivos para aceitar H0.

Page 102: Apostila de Estatística - Shiguti

100

Exercícios 1. Uma agência de empregos alega que os candidatos por elas colocados nos últimos 6 meses têm salários de

R$9.000,00 anuais, em média. Uma agência governamental extraiu uma amostra aleatória daquele grupo, encontrando um salário médio de R8.000,00, com desvio-padrão de R$1.000,00 com base em 50 empregados. Teste a afirmação da agência, contra a alternativa de que o salário médio é inferior a R$9.000,00, ao nível de significância de 0,05.

2. A DeBug Company vende um repelente de insetos que alega ser eficiente pelo prazo de 400 horas no mínimo. Uma análise de nove itens escolhidos aleatoriamente acusou uma média de eficiência de 380 horas. Teste a alegação da companhia, contra a alternativa que a duração é inferior a 400 horas, ao nível de 0,01, se o desvio-padrão é 90 horas.

Page 103: Apostila de Estatística - Shiguti

101

UNIDADE XIV – REGRESSÃO LINEAR E CORRELAÇÃO INTRODUÇÃO

A análise de Regressão Linear e de Correlação compreende análise de dados amostrais para saber se e como duas ou mais variáveis estão relacionadas uma com as outras em uma população. O objetivo nesse item é o estudo de situações de duas variáveis. A análise de regressão linear apresenta como resultado uma equação matemática que descreve um determinado relacionamento. A equação pode ser usada para estimar, ou predizer, valores de uma variável quando se conhecem ou se supõe conhecidos valores de outra variável. A análise de correlação fornece um número que resume o grau de relacionamento entre duas variáveis. Ela é útil em um trabalho exploratório, quando um pesquisador ou analista procura determinar quais variáveis são potencialmente importantes e o interesse está no grau ou na força desse relacionamento. Por exemplo, quando uma variável aumenta de valor, de que maneira é influenciada a outra variável? ALGUNS CASO DE RELACIONAMENTO DE VARIÁVEIS:

1. A idade e a resistência física? 2. Pessoas de maior renda tendem a apresentar maior escolaridade? 3. O sucesso em um emprego pode ser predito com base no resultado de testes? 4. A temperatura parece influenciar a taxa de criminalidade?

Dois tipos de pesquisas são avaliados quando se pretende estudar um conjunto de dado. A pesquisa

Experimental e a pesquisa de um estudo de relacionamento. A primeira, manipula-se uma variável e medem-se as mudanças conseqüentes em uma outra variável, enquanto que o segundo tipo de pesquisa, medem-se ambas variáveis, procurando relacionar as mudanças que ocorrem naturalmente em uma variável – por exemplo, a rapidez na leitura – com as mudanças que ocorrem naturalmente com a outra variável – por exemplo, a inteligência. Para tal medem-se os QI’s e a rapidez em uma grande amostra de pessoas e depois analisam-se os dados, para verificar se as pessoas de elevado QI tendem também a Ter melhores velocidades, e as pessoas de baixo QI, piores. Um modo de apresentar os resultados é através de um diagrama de dispersão:

REGRESSÃO LINEAR Há diversas maneira de se utilizarem as equações de regressão. Uma é em situações em que as duas variáveis medem aproximadamente a mesma situação, mais uma delas é mais difícil de se trabalhar, enquanto a outra não. Por exemplo a resistência e a dureza de um metal podem estar inter-relacionadas, de modo que conhecendo a dureza pode-se estimar a resistência. Assim sendo, a finalidade de uma equação de regressão seria estimar valores de uma variável com base em valores conhecidos da outra variável.

0

2

4

6

8

10

12

90 100 110 120 130 140

QI

Rap

ide

z

Page 104: Apostila de Estatística - Shiguti

102

Outra utilização das equações de regressão é explicar valores de uma variável em termos da outra variável, isto é, pode-se suspeitar de uma relação de causa e efeito entre duas variáveis. Por exemplo, um Psicólogo pode tentar explicar as variações de comportamento em função de uma pessoa estar ou não empregada. A EQUAÇÃO DA RETA Embora tais relações possam assumir uma grande diversidade de formas, nos limitaremos a estudar as Equações Lineares. Duas grandes características da equação linear são:

1. a inclinação da reta ( o coeficiente angular) e 2. a ordenada da reta (valor de y) em determinado ponto (quando x=0)

Uma equação linear tem a forma y = a +bx

onde a e b são valores que se determinam com base nos dados amostrais; a é a ordenada da reta em x=0, e b é o coeficiente angular. Exemplo: Considere a equação linear y = 5 + 3x. A reta intercepta o eixo y quando x=0 no ponto y = 5. O coeficiente angular da reta é 3, o que significa que a cada unidade de variação de x correspondem 3 unidade de y.

DETERMINAÇÃO DA EQUAÇÃO MATEMÁTICA Considere a maneira de determinar a equação de uma reta que melhor descreva um conjunto de observações.. por exemplo suponha que se queira determinar se há alguma relação entre o desempenho de um aluno em uma disciplina e a renda familiar. Na linguagem de regressão a variável independente será a renda familiar, e a variável dependente será o desempenho escolar utilizaremos a variável x para determinar a variável independente e y para a variável dependente.

Os valores da tabela 1 resultam no diagrama de dispersão abaixo:

Aluno Desempenho Renda familiar1 5 102 4 153 4 124 4 185 6 86 7 107 8 58 2 309 3 25

05

1015202530354045

0 2 4 6 8 10 12 14X

Y

Page 105: Apostila de Estatística - Shiguti

103

MÉTODO DE MÍNIMOS QUADRADOS O método Mínimos Quadrado é usado para ajustar uma linha reta a um conjunto de pontos é conhecido como a técnica dos mínimos quadrados, cuja a reta realmente tem duas características importantes:

1. a soma dos desvios verticais dos pontos em relação a reta é zero; 2. a soma dos quadrados desses desvios é mínima (isto é, nenhuma outra reta daria menor soma de

quadrados de tais desvios) Simbolicamente, o valor que é minimizado é:

( )∑=

−n

i 1

2ci yy

onde yi é o valor observado de y e yc é o valor calculado de y utilizando-se a soma de mínimos quadrados com os valores de x correspondente a y.

Os valores de a e b para a reta y c = a + bx que minimizam a soma dos quadrados dos desvios são as soluções das chamadas Equações Normais da Reta de Regressão:

+⋅= ∑∑

==

nn

i 1ii

1i xbany

+

=⋅ ∑∑ ∑

== =

n

1i

2i

1

n

1iiii xbxayx

n

i

Com o desenvolvimento de tais equações chegaremos em:

( ) ( )( )( ) ( )22 xxn

yxxynb

∑∑∑∑∑

−=

e

Equação da reta

0

2

4

6

8

10

0 5 10 15 20 25 30 35

Renda Familiar

Des

empe

nho

Page 106: Apostila de Estatística - Shiguti

104

n

xb-ya ∑ ∑=

EXEMPLO: 1. determinar os somatórios

2. levar esses resultados numéricos às expressões de a e b, com n =9

b = -0,2076 a = 7,846

3. Escrever a Equação da reta

y c= 7,846 – 0,2076x

Aluno Desempenho Renda familiar x2 XY1 5 10 100 502 4 15 225 603 4 12 144 484 4 18 324 725 6 8 64 486 7 10 100 707 8 5 25 408 2 30 900 609 3 25 625 75

Soma Σ x = 43 Σ y = 133 Σ x2 = 2507 Σ xy = 523

Page 107: Apostila de Estatística - Shiguti

105

USANDO O EXCEL

Passo 1: coloque os valores em duas colunas, conforme a figura anterior

x y2 3,53 5,75 9,98 16,3

10 19,312 25,714 28,215 32,6

Page 108: Apostila de Estatística - Shiguti

106

Passo 2: no Excel, vá ao “Assistente de Função” e escolha as funções: INCLINNAÇÃO para se determinar o valor de b e a função INTERCEPÇÃO* para se determinar o valor de a.

Em “val_conhecido_y”, devem ser digitadas a primeira e a última célula, separadas por dois pontos, dos valores de y; de modo semelhante, em “val_conhecidos_x”, devem ser digitadas a primeira e a última célula, separadas por dois pontos, dos valores de x. Para os valores da tabela anterior encontramos b = 2,16 e a =-0.985.

Page 109: Apostila de Estatística - Shiguti

107

CORRELAÇÃO O objetivo do estudo da correlação é determinar a força do relacionamento entre duas observações emparelhadas. EXEMPLO:

É razoável pensar que os estudantes obtenham na universidade aproximadamente o mesmo desempenho obtido no ensino médio. Sendo assim forma observadas 15 universitários escolhidos aleatoriamente em uma universidade, comparadas as suas médias na universidade e no ensino médio, chegou-se aos valores que constam na tabela abaixo:

Graficamente o desempenho dos estudantes foi:

Para o cálculo do coeficiente de correlação de Pearson faremos::

r = ( )( )( )( ) ( )( )n/YYn/XX

n/YX-XY2222 ∑∑∑∑

∑ ∑∑−⋅−

Desempenho Desempenho Estudantes no ensino médio na universidade

1 80 812 82 813 84 82,14 85 81,45 87 82,16 88 81,77 88 828 89 83,59 90 83,1

10 91 82,411 91 82,712 92 8313 94 83,914 96 83,615 98 84

80,581

81,582

82,583

83,584

84,5

80 82 84 86 88 90 92 94 96 98 100

Ensino médio

Uni

vers

idad

e

Page 110: Apostila de Estatística - Shiguti

108

USANDO O EXCEL