estatistica - djalma

189

Click here to load reader

Upload: lisleikestering

Post on 27-Jun-2015

5.493 views

Category:

Documents


178 download

TRANSCRIPT

Page 1: ESTATISTICA - DJALMA
Page 2: ESTATISTICA - DJALMA

Estatística para os cursos de:

Economia Administração e Ciências Contábeis

BPDEA -w SEA w A

Associação Bras~leim para a Proteçao dos Direitos

Editoriais e Automis

R E S P E I T E O A U T O R N AO F A Ç A C ~ P I A -

Page 3: ESTATISTICA - DJALMA

EDITORA ATLAS S.A. Rua Conselheiro Nébias, 1384 (Campos Elísios)

01203-904 São Paulo (SP) Tel.: (O 11) 3357-9144

Page 4: ESTATISTICA - DJALMA

Ermes da Silva Elio da Silva

Walter Gonçalves Afrânio Carlos Murolo

Estatística para os cursos de:

Economia Administração e

Ciências Contábeis

Volume 1

PAULO EDITORA ATLAS S.A. -- 1999

André e Vilmara
Pencil
André e Vilmara
Pencil
André e Vilmara
Cross-Out
Page 5: ESTATISTICA - DJALMA

1 994 by EDITORA ATLAS S.A.

ed. 1995; 2. ed. 1996; 3. ed. 1999;

Capa: Aldo

Composição: Formato Serviços de Editoração Ltda.

Dados Internacionais de Catalogação na Publicação (CIP) (Câmara Brasileira do Livro, SP, Brasil)

Estatística Ermes da Silva ... let - 3. ed. São Paulo: Atlas, 1999.

Outros autores: Walter Gonçalves, Elio da Silva, Afrânio Carlos Murolo.

ISBN 85-224-2236-2

Estatística I. Silva, Ermes Medeiros. Gonçalves, Walter, 1942- 111. Silva, Elio da. Murolo, Afrânio Carlos. V. Título.

94-41 77 CDD-519.5

índice para catálogo sistemático:

1. Estatística 51 9.5

TODOS OS DIREITOS RESERVADOS - É proibida a reprodução total ou parcial, de qualquer forma ou por qualquer meio. A violação dos direitos de autor (Lei

9.61 0198) é crime estabelecido pelo artigo 184 do Código Penal.

Depósito legal na Biblioteca Nacional conforme Decreto de 20 de dezembro de 1907.

Impresso no ín Brazíl

Page 6: ESTATISTICA - DJALMA

Sumário

t CONCEITOS BASICOS, 11

1.1 Introdução, 11

1.2 Conceitos Fundamentais, 12

1.2.1 Objetivo, 12

1.2.2 População e Amostra, 12

1.3 Processos Estatísticos de Abordagem, 12

1.4 Dados Estatísticos, 14

1.5 Estatística Descritiva, 14

1.6 Dados Brutos, 15

1.7 Rol, 16

1.8 Exercícios Propostos, 17

SÉRIES ESTAT~STICAS, I 8 2.1 Apresentação de Dados Estatísticos, 18

2.2 Distribuição de Frequência - Variável Discreta, 18

2.3 Distribuição de Frequência - Variável Contínua, 19

2.4 Construção da Variável Discreta, 20

2.5 Construção da Variável Contínua, 21

2.6 Exercícios Propostos, 26

2.7 Distribuição de Frequências - Variável Discreta, 29

2.7.1 Frequência Relativa de um Elemento da Série - fr, 29 2.7.2 Frequência Acumulada de um Elemento da Série - Fi, 30

2.7.3 Frequência Acumulada Relativa de um Elemento da Série - FR,, 31

2.8 Distribuição de Frequências - Variável Contínua, 32

2.8.1 Frequência Relativa de uma Classe - fh 32

2.8.2 Frequência Acumulada de uma Classe - Fi, 33

2.8.3 Frequência Acumulada Relativa de uma Classe - FR, 34

2.9 Exercícios Propostos, 35

Page 7: ESTATISTICA - DJALMA

6 Sumário

2.1 0 Representação Gráfica de Séries Estatísticas, 38

2.1 0.1 Histograma - Variável Discreta, 39

2.1 0.2 Histograma - Variável Contínua, 40

2.1 1 Exercícios Propostos, 42

3 MEDIDAS DE TENDÊNCIA CENTRAL, 46

3.1 Introdução, 46

3.2 Somatório - Notação Sigma (C ), 46

3.3 Exercícios Propostos, 51

3.4 . Médias, 54

3.4.1 Média Aritmética Simples, 54

3.4.2 Média Aritmética Ponderada, 54

3.4.3 Média Geométrica Simples, 55

3.4.4 Média Geométrica Ponderada, 55

3.4.5 Média Harrnônica Simples, 55

3.4.6 Média Harmônica Ponderada, 56

3.5 Cálculo da Média Aritmética, 57

3.6 Exercícios Propostos, 60

3.7 Mediana, 66

3.8 Cálculo da Mediana, 66

3.9 Exercícios Propostos, 71

3.1 0 Moda, 74

3.11 Cálculo da Moda, 74

3.12 Utilização das Medidas de Tendência Central, 83

3.1 3 Exercícios Propostos, 85

4 MEDIDAS SEPARATRIZES, 89

4.1 Conceitos, 89

4.2 Cálculo das ~edidasseparatrizes, 90

4.3 Exercícios Propostos, 95

5 MEDIDAS DE DISPERSÃO, 100

5.1 Introdução, 100

5.2 Medidas de Dispersão Absoluta, 101

5.3 Amplitude Total, 101

5.4 Cálculo da Amplitude Total, 101

5.5 Exercícios Propostos, 102

5.6 Desvio Médio Simples, 103

Page 8: ESTATISTICA - DJALMA

Sumário 7

5.7 Cálculo do Desvio Médio Simples, 103

5.8 Exercícios Propostos, 108

5.9 Variância e Desvio Padrão, 109

5.1 0 Cálculo da Variância e Desvio Padrão, 110

5.11 Interpretação do Desvio Padrão, 116

5.1 2 Exercícios Propostos, 11 8

5.1 3 Medidas de Dispersão Relativa, 121

5.1 4 Exercícios Propostos, 122

i MEDIDAS DE ASSIMETRIA E CURTOSE, 124

6.1 Introdução, 124

6.2 Medidas de Assimetria, 125

6.2.1 Coeficiente de Pearson, 125

6.2.2 Coeficiente de Bowley, 125

6.3 Medida de Curtose, 126

6.4 Exercícios Propostos, 132

- PROBABILIDADES, 143

7.1 Introdução, 143

7.1.1 Fenômenos Aleatórios, 143

7.2 Teoria das Probabilidades - Espaço Amostral, 145

7.3 Eventos, 147

7.4 Operações com Eventos, 148

7.5 Exercícios Propostos, 149

7.6 Função de Probabilidade, 151

7.7 Definição de Probabilidade, 151

7.8 Exercícios Propostos, 155

7.9 Probabilidade de um Evento, 158

7.1 0 Exercícios Propos'tos, 159

7.11 Axiomas de Probabilidade, 162

i CÁLCULO DE PROBABILIDADES, 163

8.1 Teoremas Fundamentais, 163

8.1.1 Probabilidade do Conjunto Vazio, 163

8.1 -2 Probabilidade do Complementar, 163

8.1.3 Probabilidade da Reunião, 163

8.1.4 Exercícios Propostos, 1 65

8.1.5 Probabilidade Condicional, 165

Page 9: ESTATISTICA - DJALMA

8 Sumário

8.1.6 Exercícios Propostos, 170

8.1.7 Teorema da Probabilidade Total, 172

8.1.8 Exercícios Propostos, 174

8.1.9 Teorema de Bayes, 176

8.1.1 0 Exercícios Propostos, 178

8.2 Exercícios Gerais, 179

Bibliografia, 189

Page 10: ESTATISTICA - DJALMA

Prefácio

Estamos colocando a disposição dos colegas professores e aos inte- ?ssados em estatística de modo geral uma coleção de livros da qual este é o

primeiro volume. O conteúdo deste volume apresenta os conceitos básicos iniciais de um curso de estatística, isto é, enfoca a estatística descritiva, as medidas sobre uma distribuição, e coloca os principais estimadores necessá- rios ao desenvolvimento posterior de inferência estatística. Encerra o volume o estudo do cálculo de probabilidades. Este conteúdo foi escolhido por alguns motivos. A nossa experiência ao desenvolver cursos nesta área nos conven-

zu de que este conteúdo pode ser desenvolvido com bom aproveitamento um curso anual de 72 horas ou em curso semestral equivalente. Além disso, conteúdo está adequado ao novo currículo dos cursos de administração de

empresa que estão sendo implantados nas diversas faculdades.

Entretanto, o que nos parece mais importante é a maneira como o assunto foi desenvolvido. Uma crítica frequente de professores e alunos com respeito aos textos de estatística é que eles apresentam os conceitos estatísti- cos do ponto de vista matemático, com ênfase nos cálculos das medidas. A conseqüência deste enfoque é que os estudantes, embora possam desenvol- ver os cálculos necessários a solução de problemas não são capazes de realizar o que nos parece fundamental em estatística, que é o conhecimento e as possíveis interpretações do fenômeno estatístico envolvido.

Para atingir este objetivo procuramos desenvolver os conceitos dando anfase a interpretação das medidas sobre o fenômeno estatístico. Desta for-

ia, a apresentação de cada conceito é seguida de sua interpretação específi- a, completada por questões teóricas e práticas que fixem esse conhecimen-

,a. A idéia é que fique claro o que o conceito significa do ponto de vista estatístico e quais são as possíveis utilidades que ele pode ter, principalmente no campo da Administração.

Tendo em vista este objetivo, muitas vezes restringimos a abrangência do conceito com a finalidade de torná-lo acessível ao estudante. Desta forma, os professores da área certamente notarão alguns conceitos particularizados ou pouco abrangentes. Achamos necessária esta restrição para não desviar o enfoque do significado do conceito e sua interpretação.

Page 11: ESTATISTICA - DJALMA

10 Prefácio

Acreditamos que a medida que o estudante for adquirindo experiência nesta área, a generalização dos conceitos ocorrerá de maneira natural.

Com a finalidade de fixar os conceitos elaboramos grande quantidade de exercícios. O leitor deverá notar que tivemos o cuidado de apresentar problemas enfocando a aplicação da estatística a diversas áreas da adminis- tração de empresas; cumprindo desta forma uma de suas finalidades que é de disciplina de apoio as áreas profissionais deste campo.

Esperamos que este texto e os demais que o seguirão sejam de utili- dade para professores e estudantes que necessitam de estatística em sua vida profissional.

Gostaríamos de receber sugestões e críticas dos colegas. Essa aten- ção para com nosso trabalho nos farão agradecidos e certamente colaborarão para a correção de rumo, aumentando a adequação, utilidade e competência desta obra.

São Paulo, outubro de 94.

Os Autores

Page 12: ESTATISTICA - DJALMA

1/ Conceitos Básicos

1 .I Introdução

O termo Estatística provém da palavra Estado e foi utilizado original- mente para denominar levantamentos de dados, cuja finalidade era orientar o Estado em suas decisões.

Neste sentido foi utilizado em épocas remotas para determinar o valor dos impostos cobrados dos cidadãos, para determinar a estratégia de uma nova batalha em guerras que se caracterizavam por uma sucessão de bata- lhas. (Era fundamental aos comandantes saber de quantos homens, armas, cavalos etc. dispunham após a última batalha.)

Atualmente, a estatística é definida da seguinte forma:

Estatística é um conjunto de métodos e processos quantitativos que serve para estudar e medir os fe- nômenos coletivos.

A estatística teve acelerado desenvolvimento a partir do século XVII, com os estudos de BERNOULLI, FERMAT, PASCAL, LAPLACE, GAUSS, GALTON, PEARSON, FISHER, POISSON e outros que estabeleceram suas características atuais.

Ela não alcançou ainda um estado definitivo. Continua a progredir na razão direta do desejo de investigação dos fenômenos coletivos.

A Estatística é considerada por alguns autores como Ciência no senti- do do estudo de uma população. É considerada como método quando utiliza- da como instrumento por outra Ciência.

A Estatística mantém com a Matemática uma relação de dependência, solicitando-lhe auxílio, sem o qual não poderia desenvolver-se.

Com as outras Ciências mantém a relação de complemento, quando utilizada como instrumento de pesquisa.

Page 13: ESTATISTICA - DJALMA

12 Estatística 1

Em especial esta última é a relação que a Estatística mantém com a Administração, Economia, Ciências Contábeis, servindo como instrumento au- xiliar na tomada de decisões.

1.2 Conceitos Fundamentais

1.2.1 OBJETIVO

Estatística tem como objetivo o estudo dos fenômenos coletivos.

1.2.2 POPULAÇAO E AMOSTRA

Conceituaremos População como sendo o conjunto de todos os itens (pessoas, coisas, objetos) que interessam ao estudo de um fenômeno coletivo segundo alguma característica.

Entenderemos por Amostra, qualquer subconjunto não vazio de uma população.

Uma característica numérica estabelecida para toda uma população é denominada parâmetro.

Uma característica numérica estabelecida para uma amostra é deno- minada estimador.

Por exemplo: no fenômeno coletivo eleição para governador no Estado de São Paulo, a população é o conjunto de todos os eleitores habilitados no Estado de São Paulo. Um parâmetro é a proporção de votos do candidato A. Uma amostra ,é um grupo de 1000 eleitores selecionados em todo o Estado. Um estimador é a proporção de votos do candidato A obtida na amostra.

Em aplicações efetivas, o número de elementos componentes de uma amostra é bastante reduzido em relação ao número de elementos componen- tes da população.

1.3 Processos Estatísticos de Abordagem

Quando solicitados a estudar um fenômeno coletivo podemos optar entre os seguintes processos estatísticos:

a) Estimação.

b) Censo.

Page 14: ESTATISTICA - DJALMA

Conceitos Básicos 13

Censo: é uma avaliação direta de um parâmetro, utilizando-se todos 9s componentes da população.

Estimação: é uma avaliação indireta de um parâmetro, com base em IJm estimador através do cálculo de probabilidades.

Propriedades Principais do Censo:

i Admite erro processual zero e tem confiabilidade 100%.

i É caro.

i É lento.

É quase sempre desatualizado.

i Nem sempre é viável.

Propriedades Principais da Estimação:

i Admite erro processual positivo e tem confiabilidade menor que 100%.

i É barata.

i É rápida.

i É atualizada.

i É sempre viável.

COMENTÁRIO: estatisticamente, a precisão de um valor numérico é avalia- da através do binômio: confiança e erro processual.

Se admitirmos que podemos retirar do Censo todo tipo de erro de natureza humana (erro de cálculo de avaliação, de anotação etc.), restará apenas outro tipo de erro devido ao procedimento empregado.

Este erro é chamado erro processual. No caso de um Censo, o erro processual é zero, pois avaliamos um por um, todos os elementos componen- tes da População.

Como o erro processual na avaliação é zero, a confiabilidade no parâ- metro obtido é 100%. A precisão, no Censo é total.

Na estimação, como avaliamos apenas parte e não todos os elemen- tos que compõem a população, admitimos um erro processual positivo na avaliação do valor numérico e por conseqüência uma confiabilidade menor que 100%, sendo, portanto, menos precisa que o Censo.

Como o número de elementos que compõem uma amostra é conside- ravelmente menor que o número de elementos que compõem uma População, a Estimação é sempre bem mais barata que o Censo, é concluída mais rapidamente que o Censo e, portanto, mais atualizada.

Page 15: ESTATISTICA - DJALMA

14 Estatística 1

Se a maneira de avaliar um elemento é um teste destrutivo, o Censo se torna um processo inviável, pois destruiria a população objeto do estudo.

Entretanto, na maioria das vezes em que o Censo é considerado inviá- vel é por razões econômicas e de tempo.

Na sociedade moderna, a maioria dos problemas exigem decisões de curto prazo. Por isso, as informações estatísticas úteis a resolução destes problemas devem ser obtidas rapidamente.

Pela rapidez e facilidade da obtenção destas informações, a estimação tem sido cada vez mais utilizada como procedimento estatístico.

1.4 Dados Estatísticos

Normalmente, no trabalho estatístico o pesquisador se vê obrigado a lidar com grande quantidade de valores numéricos resultantes de um Censo ou de uma estimação.

Estes valores numéricos são chamados dados estatisticos.

No sentido de disciplina, a Estatística ensina métodos racionais para a obtenção de informações a respeito de um fenômeno coletivo, além de obter conclusões válidas para o fenômeno e também permitir tomada de decisões, através de dados estatisticos observados.

Desta forma, a estatística pode ser dividida em duas áreas:

a) Estatística Descritiva - é a parte da Estatística que tem por obje- to descrever os dados observados.

b) Estatística Indutiva - é a parte da Estatística que tem por objetivo obter e generalizar conclusões para a população a partir de uma amostra, através do cálculo de probabilidade.

O cálculo de probabilidade é que viabiliza a inferência estatística.

1.5 Estatística Descritiva

A Estatística Descritiva, na sua função de descrição dos dados, tem as seguintes atribuições:

a) A obtenção dos dados estatísticos. b) A organização dos dados.

c) A redução dos dados.

d) A representação dos dados.

Page 16: ESTATISTICA - DJALMA

Conceitos Básicos 15

e) A obtenção de algumas informações que auxiliam a descrição do fenômeno observado.

i A obtenção ou coleta de dados é normalmente feita através de gm questionário ou de observação direta de uma população ou amostra.

i A organização dos dados consiste na ordenação e crítica quanto a correção dos valores observados, falhas humanas, omissões, abandono de dados duvidosos etc.

i Redução dos dados - O entendimento e compreensão de grande quantidade de dados através da simples leitura de seus valores individuais é uma tarefa extremamente árdua e difícil mesmo para o mais experimentado pesquisador.

A Estatística descritiva apresenta duas formas básicas para a redução do número de dados com os quais devemos trabalhar, chamadas variável discreta e variável contínua.

i A representação dos dados - 0 s dados estatísticos podem ser mais facilmente compreendidos quando apresentados através de uma repre- sentação gráfica, o que permite uma visualização instantânea de todos os dados.

Os gráficos, quando bem representativos, tornam-se importantes ins- trumentos de trabalho.

É ainda atributo da Estatística Descritiva a obtenção de algumas infor- mações como médias, proporções, dispersões, tendências, índices, taxas, coeficientes, que facilitam a descrição dos fenômenos observados. Isto encer- ra as atribuições da Estatística Descritiva.

Completando o processamento estatístico, no caso de uma Estimação, a Estatística Indutiva estabelece parâmetros a partir de estimadores usando o cálculo de probabilidade. Esta última etapa será desenvolvida posteriormente.

1.6 Dados Brutos

Quando fazemos n observações diretas em um fenômeno coletivo ou observamos as respostas a uma pergunta em uma coleção de n questioná- rios, obtemos uma sequência de n valores numéricos.

Tal sequência é denominada dados brutos.

Page 17: ESTATISTICA - DJALMA

16 Estatística 1

Representando por X a característica observada no fenômeno coletivo ou na pergunta dos questionários, então x, representa o valor da característi- ca obtida na primeira observação do fenômeno coletivo ou o valor da caracte- rística observado no primeiro questionário; x2 representa o valor da caracterís- tica X na segunda observação do fenômeno coletivo ou o valor da característi- ca Xobservada no segundo questionário e assim sucessivamente.

Desta forma, os dados brutos podem ser representados por X: x,, x2, x3, ..., X".

Esta sequência de valores assim obtida apresenta-se completamente desordenada. De modo geral, podemos afirmar que:

Dados brutos é uma. sequência de valores numéri- cos não organizados, obtidos diretamente da obser- vação de um fenômeno coletivo.

1.7 Rol

Quando ordenamos na forma crescente ou decrescente, os Dados Brutos passam a se chamar Rol.

Portanto:

Rol é uma sequência ordenada dos Dados Brutos.

Exemplo: No final do ano letivo, um aluno obteve as seguintes notas bimestrais em Matemática: 4; 8; 7,5; 6,5.

Neste exemplo, X representa nota bimestral e pode ser apresentada na forma:

X 4;, 8; 7,5; 6,5. (Dados Brutos) OU

X 4; 6,5; 7,5; 8. (Rol)

OBSERVAÇÃO: Após uma atenta leitura desta parte inicial, o interessado deve responder as seguintes questões:

Page 18: ESTATISTICA - DJALMA

Conceitos Básicos 17

1.8 Exercícios Propostos

'. O que é Estatística?

2. O que é População?

. O que é Amostra ?

. O que é Parâmetro?

5. O que é Estimador?

3. Quais são os processos estatísticos de abordagem para o estudo de um fenôme- no coletivo?

: O que é Censo?

2. O que é Estimação?

3. Explique as propriedades principais do Censo.

' O . Explique as propriedades principais da Amostragem.

1. O que é Dado Estatístico? '2. O que é Estatística Descritiva e quais são suas tarefas?

'3. O que é Estatística Indutiva?

'4 . O que são Dados Brutos?

'5. O que é Rol?

'6. Construa o Rol para sequência de dados brutos:

a) X :2 4, 12, 7, 8, 15, 21, 20.

b) Y:3, 5, 8, 5, 12, 14, 13, 12, 18.

c) Z: 12,2; 13,9; 14,7; 21,8; 12,2; 14,7.

d) W:8, 7,8, 7,8, 7, 9.

RESPOSTAS

Page 19: ESTATISTICA - DJALMA

?f Séries Esta tis ficas

2.1 Apresentação de Dados Estatísticos

Quando lidamos com poucos valores numéricos, o trabalho estatístico fica sensivelmente reduzido. No entanto, normalmente teremos que trabalhar com grande quantidade de dados.

Um dos objetivos da Estatística Descritiva neste caso, é obter uma significativa redução na quantidade de dados com os quais devemos operar diretamente. Isto pode ser conseguido modificando-se a forma de apresenta- ção destes dados.

Suponha que observamos as notas de 30 alunos em uma prova e obtivemos os seguintes valores:

Se entendermos como frequência simples de um elemento o número de vezes que este elemento figura no conjunto de dados, podemos reduzir significativamente o número de elementos com os quais devemos trabalhar.

Para isto organiza-se o conjunto de dados na forma de uma série estatística chamada variável discreta.

2.2 Distribuição de Frequência - Variável Discreta

É uma representação tabular de um conjunto de valores em que colo- camos na primeira coluna em ordem crescente apenas os valores distintos da série e na segunda coluna colocamos os valores das frequências simples correspondentes.

Se usarmos f para representar frequência simples, a sequência (1) pode ser representada pela tabela:

Page 20: ESTATISTICA - DJALMA

Séries Estatísticas 19

OBSERVAÇOES: (1) Note que a colocação de um índice i para x e para f tem a finalidade de referência. Deste modo, x, repre- senta o primeiro valor distinto da série, x2 representa o segundo valor distinto da série, f, representa a fre- quência simples do primeiro valor distinto da série, f2 representa a frequência simples do 2Qalor distinto da série e assim sucessivamente.

(2) Note que conseguimos reduzir de 30 elementos que constituíam a série original para apenas 12 elementos.

(3) Note também que a variável discreta só é uma forma eficiente de redução dos dados, quando o número de elementos distintos da série for pequeno.

Devemos optar por uma variável discreta na repre- sentação de uma série de valores quando o número de elementos distintos da série for pequeno.

2.3 Distribuição de Frequência - Variável Contínua

Suponha que a observação das notas de 30 alunos em uma prova nos :3nduzisse aos seguintes valores:

Observando estes valores notamos grande número de elementos dis- ??tos, O que significa que neste caso a variável discreta não é aconselhável -a redução de dados.

Page 21: ESTATISTICA - DJALMA

20 Estatística 1

Nesta situação é conveniente agrupar os dados por faixas de valores, ficando a série com a seguinte apresentação:

Esta apresentação da série de valores é denominada variável contí- nua.

Devemos optar por uma variável contínua na repre- sentação de uma série de valores quando o número de elementos distintos da série for grande.

fi 4

12 10 4

Classe

1 2 3 4

2.4 Construção da Variável Discreta

Notas

2 1 4 4 1 6 6 1 8 8 1 1 O

A construção de uma variável discreta é bastante simples. Basta ob- servar quais são os elementos distintos da sequência, ordená-los, e colocá-los na primeira coluna da tabela. Em seguida computar a frequência simples de cada elemento distinto e colocá-la na segunda coluna da tabela.

Exemplo de construção de uma variável discreta: A sequência abaixo representa a observação do numero de acidentes por dia, em uma rodovia, durante 20 dias.

x: 0,2,0,1,1,0,0,0,3,2

1,0,1,2,0,1,3,2,2,0.

Os valores distintos da sequência são: O, 1, 2, 3.

As frequências simples respectivas são: 8, 5, 5, 2.

Portanto, a variável discreta representativa desta sequência é:

Page 22: ESTATISTICA - DJALMA

Séries Estatísticas 21

.5 Construção da Variável Contínua

A construção da variável contínua requer o conhecimento de alguns ~nceitos que vamos estabelecer aproveitando a tabela abaixo como exempli- :ação:

1. AMPLITUDE TOTAL DE UMA SEQUÊNCIA é a diferença entre o riaior e o menor elemento de uma sequência.

Classe

Representando a amplitude total por A,, o maior elemento da sequên- cia Xpor XmA, e o menor elemento por Xmín, a amplitude total é denotada por:

No exemplo da sequência que deu origem a tabela (2), Xmáx = 9,5 e Xmín = 2, portanto:

Intervalo de classe

A amplitude total representa o comprimento total da sequência e é dada na mesma unidade de medida dos dados da sequência.

fi

2. INTERVALO DE CLASSE é qualquer subdivisão da amplitude to- tal de uma série estatística.

No exemplo da tabela (2) subdividimos a amplitude total em quatro classes, obtendo os intervalos de classe 2 1- 4, 4 1- 6, 6 1- 8, 8 1- 10.

Note que na realidade não trabalhamos com a At = 7,5 e sim com a amplitude total ajustada para 8 como justificaremos adiante.

3. LIMITE DE CLASSE: cada intervalo de classe fica caracterizado 9or dois números reais. O menor valor é chamado limite inferior da classe e será indicado por I. O maior valor é chamado limite superior da classe e será Indicado por L. Por exemplo, na Classe 2 1- 4, I = 2 e L = 4.

Page 23: ESTATISTICA - DJALMA

22 Estatística 1

4. AMPLITUDE DO INTERVALO DE CLASSE é a diferença entre o limite superior e o limite inferior da classe. Se usarmos h para representar a amplitude do intervalo de classe podemos estabelecer:

OBSERVAÇOES: (1) Na realidade, as classes não precisam necessariamen- te ter a mesma amplitude como no exemplo acima. Porém, sempre que possível, devemos trabalhar com classes de mesma-amplitude. Isto facilita sobremaneira os cálculos posteriores.

(2) Note que usamos para representar as classes, interva- los reais semiabertos a direita. Isto significa que o in- tervalo contém o limite inferior, masnão contém o limi- te superior, ou seja, o intervalo de classe 2 1- 4 con- tém os valores reais maiores ou iguais a 2 e menores que 4.

Desta forma, o último intervalo da série que é 8 1- 10 não contém o valor 10. É por isso que não utilizamos a amplitude 7,5, pois se isto fosse feito, o limite superior da última classe seria 9,5 e como o limite superior não deve pertencer a classe, o elemento 9,5 da sequência estatística original ficaria sem classificação.

Como vamos utilizar este critério, precisaremos ajustar sempre o valor máximo da série ao definir a amplitude total.

Outros critérios poderiam ser adotados como o interva- . lo real semiaberto a esquerda ou mesmo o intervalo real aberto, mas nenhum destes critérios é melhor que o critério adotado.

5. NÚMERO DE CLASSES: o número de classes a ser utilizado depende muito da experiência do pesquisador e das questões que ele preten- de responder com a variável contínua.

Isto pode ser verificado facilmente pelo próprio interessado ao longo desta exposição.

Para efeito de nossos exemplos, utilizaremos o critério da raiz para a determinação do número de classes.

Page 24: ESTATISTICA - DJALMA

Séries Estatísticas 23

) CRITÉRIO DA RAIZ

Se a sequência estatística contém n elementos e se indicarmos por K número de classes a ser utilizado, então pelo critério da raiz:

Como o número K de classes deve ser necessariamente um número iteiro e como dificilmente 6, é um número inteiro, deixaremos como opção ara o valor de K o valor inteiro mais próximo de fi, uma unidade a menos ou mais que este valor.

. No exemplo da tabela (2), n = 30 e conseqüentemente k = 1130 = ,477, portanto o valor inteiro mais próximo de v% é 5. As opções para k ntão são: 4 ou 5 ou 6.

A amplitude do intervalo de classe que designamos por h é determina- da da seguinte forma:

8 o portanto h = - = 2.

4 observe que a opção por quatro classes, foi feita em função de um

valor de h mais fácil de se operar.

Se tivéssemos optado por cinco classes, o valor de h seria 8/5 = 1,6; se véssemos optado por seis classes, o valor de h seria 8/6 = 1,3333 ...

Veja que o melhor valor para se trabalhar em cálculos é o h = 2. Foi ?or isto que optamos por quatro classes.

Conhecendo-se o valor Xmin = 2 e a amplitude de classe h = 2, conclui- 70s que o limite superior da primeira classe é 4. Portanto, a primeira classe é r! intervalo 2 1- 4. O limite inferior da segunda classe é 4. Somando-se a zrnplitude de classe obteremos 6. Portanto, a segunda classe é 4 1- 6. A :srceira classe por analogia é 6 1- 8 e a quarta classe é 8 1- 10.

6. FREQUÊNCIA SIMPLES DE UMA CLASSE fi: chama-se frequên- ::a simples de uma classe ao número de elementos da sequência que são ai ores ou iguais ao limite inferior desta classe e menores que o limite supe- -3r desta classe.

Page 25: ESTATISTICA - DJALMA

24 Estatística 1

No exemplo 2, a frequência simples da primeira classe é o número de elementos da sequência que são maiores ou iguais a 2 e menores que 4.

Note que os valores da sequência nestas condições são os valores 3, 2,5, 2, 3,5.

Portanto, a frequência simples da primeira classe é 4.

Da mesma forma determinamos as frequências simples das demais classes, completando o quadro representativo da variável contínua.

COMENTÁRIO: Existem outros critérios para a determinação do número de classes, como por exemplo a fórmula de STURGES.

Segundo STURGES, O número Kde classes é dado por:

Para valores de n muito grandes, esta fórmula apresenta mais vanta- gens que o critério da raiz, embora apresente o mesmo problema de aproxi- mação do valor de K.

Como acreditamos que na prática a experiência do pesquisador é que na verdade vai determinar o número de classes, optamos pelo método mais simples que é o critério da Raiz.

EXEMPLO DE CONSTRUÇÃO DE UMA VARIÁ VEL CONT~NUA

Um teste para aferir o Quociente de Inteligência em determinada clas- se de alunos de uma Faculdade deu origem a sequência de valores

Para a construção da variável contínua, devemos determinar o número de elementos da sequência. Verificamos que a sequência possui n = 70 ele- mentos.

Page 26: ESTATISTICA - DJALMA

Séries Estatísticas 25

Pelo critério da raiz K = fi. No caso, K = .\170 = 8,37. O valor inteiro iis próximo é 8. Portanto, temos opção para construir a variável contínua m 7 ou 8 ou 9 classes.

O maior valor da sequência é X,,, = 139 e o menor valor da sequên- [ é Xmí, =61.

Portanto, a amplitude total da sequência é At = 139 - 61 = 78. No tanto, sabemos que pelo fato de o critério adotado do intervalo de classe r semi-aberto a direita, devemos ajustar o valor X,,. Se ajustássemos

'máx para 140, a amplitude ajustada passaria a ser At = 140 - 61 = 79. Este !alar não é divisível de forma inteira nem por 7 nem por 8 e nem por 9, que áo nossas opções de classes.

Nesta situação devemos ajustar Xmáx para 141 obtendo a At = 141 - 31 = 80 que é divisível exatamente por 8, obtendo-se ama amplitude do -itervalo de classe h dada por:

Observe que o ajuste do valor Xmáx foi de duas unidades, passando de '39 para 141.

A experiência do pesquisador, nesta situa~ão, o levaria a distribuir este srro de duas unidades, iniciando a representação da série em 60 e terminan- 29 em 140. A amplitude total ajustada para a série é: At = 140 - 60 = 80.

O comprimento do intervalo de classe é h = 10 e o número de classes i K = 8 .

Computando as frequências simples de cada classe, construímos a :ariável contínua representativa desta série.

A variável contínua é conceituada como uma representação tabular em x e colocamos na primeira coluna os intervalos de classe e na segunda zz~luna os valores das frequências simples correspondentes.

Classe

1 2 3 4 5 6 7 8

Intervalo de classe

60 1 70 70 1 80 80 1 90 90 1 1 O0

100 1 110 110 1 120 120 1 130 130 1 140

fi

1 5 6

10 12 19 14 3

Page 27: ESTATISTICA - DJALMA

26 Estatística 1

A coluna "classe" tem a finalidade apenas de facilitar a referência as classes, não fazendo parte da variável contínua.

O quadro final tanto da variável discreta como da variável contínua recebe o nome de distribuição de frequência.

2.6 Exercícios Propostos

1. Qual é o objetivo de agrupar os dados por frequência? 2. O que é uma variável discreta?

3. Qual é a característica de um conjunto de dados que indique o uso de uma variável discreta ao se agrupar os dados por frequência?

4. O que é uma variável contínua?

5. Qual é a característica de um conjunto de dados que indique o uso de uma variável contínua ao se agrupar os dados por frequência?

6, Uma pesquisa sobre a idade, em anos de uma classe de calouros de uma faculda- de, revelou os seguintes valores:

18, 17, 18, 20, 21, 19, 20, 18, 17, 19

20, 18, 19, 18, 19, 21, 18, 19, 18, 18

19, 19, 21, 20, 17, 19, 19, 18, 18, 19

18, 21, 18, 19, 19, 20, 19, 18, 19, 20

18, 19, 19, 18, 20, 20, 18, 19, 18, 18

Agrupe, por frequência, estes dados.

7. Uma auditoria em uma grande empresa observou o valor de 50 notas fiscais emitidas durante um mês. Esta amostra apresentou os seguintes valores em dóla- res:

15.315,OO 23.440,OO 6.551,OO 13.253,OO 25.312,OO

35.780,OO 42.320,OO 34.782,OO 27.435,OO 17.661,OO

20.4 14,OO 23.3 13,OO 26.432,OO 30.5 15,OO 27.6 1 O, O0

8.598,OO 12.417,OO 22.300,OO 25.400,OO 21.200,OO

16.820,OO 38.000,00 40.300,OO 15.800,OO 18.300,OO

21.780,OO 32.414,OO 32.000,OO 18.700,OO 19.600,00

22.540,OO 22.010,OO 30.000,OO 21.380,OO 24.780,OO

29.000,OO 30.400,OO 12.3 19,OO 36.728,OO 36.483,OO

27.312,OO 35.318,OO 18.620,OO 38.661,OO 40.681,OO

19.302,OO 23.300,OO 21.350,OO 28.412,OO 21.313,OO

Agrupe, por frequência, estes dados. 8. Uma empresa automobilística selecionou ao acaso, uma amostra de 40 revende-

dores autorizados em todo o Brasil e anotou em determinado mês o número dc unidades adquiridas por estes revendedores. Obteve os seguintes dados:

Page 28: ESTATISTICA - DJALMA

Séries Estatísticas 27

10 15 25 21 6 23 15 21 26 32

9 14 19 20 32 18 16 26 24 20

7 18 17 28 35 22 19 39 18 21

15 18 22 20 25 28 30 16 12 20

Agrupe, por frequência, estes dados.

9. Uma indústria embala peças em caixas com 100 unidades. O controle de qualida- de selecionou 48 caixas na linha de produção e anotou em cada caixa o número de peças defeituosas. Obteve os seguintes dados:

2 0 0 4 3 0 0 1 0 0

1 1 2 1 1 1 1 1 1 0

o 0 3 0 0 0 2 0 0 1

1 2 0 2 0 0 0 0 0 0

o 0 0 0 0 0 1 0

Agrupe, por frequência, estes dados. 10. Um banco selecionou ao acaso 25 contas de pessoas físicas em uma agência, em

determinado dia, obtendo os seguintes saldos em dólares: 52.500,OO 18.300,OO 35.700,00 43.800,OO 22.150,OO

6.830,OO 3.250,OO 1 7.603,OO 35.600,OO 7.800,OO

16.323,OO 42.130,OO 27.606,OO 18.350,OO 12.521,OO

25.300,OO 3 1.452,OO 39.6 1 O, O0 22.450,OO 7.380,OO 28.000,OO 21.000,OO 14.751,OO 39.512,OO 17.319,OO

Agrupe, por frequência, estes dados.

'. Uma solução com uma margem de erro mínima é:

I (anos) xi 17 18 19 20 21

Número de alunos fl

3 18 17 8 4

Classe

1 2 3 4 5 6 7

Valor da nota US$

6.551 ,O0 1- 1 1.661 ,O0 11.661 ,O0 1- 16.771 ,O0 16.771 ,O0 1- 21.881 ,O0 21 .E81 ,O0 1- 26.991 ,O0 26.991 ,O0 1- 32.101 ,O0 32.1 O1 ,O0 1- 37.21 1 ,O0 37.21 1 ,O0 1- 42.321 ,O0

Número de notas r, 2 5

13 1 O 9 6 5

Page 29: ESTATISTICA - DJALMA

28 Estatística 1

A, = 42.320,OO - 6.55 1,00 = 35.769,OO

A, ajustada = 42.321.00 - 6.551,00 = 35.770,OO

K = v% 7 A melhor opção para dividir 35.770 é 7 * A = 5.110 t 8. Uma solução com uma margem de erro mínima é:

A,=39-6=33

A, ajustada = 40 - 6 = 34, o que não é exatamente divisível por 6, nem por 7, nem por 8.

Ajustamos a amplitude para 40 - 5 = 35 para distribuir o erro. Assim, A, ajustada é 35.

Podemos optar por 5 ou por 7 classes. Obviamente, a melhor opção é por sete classes.

Classe

1 2 3 4 5 6 7

Classe Número de contas

3.249,,00 I- 15.562,OO 2 15.562,OO I- 27.875,OO 10 3 27.875,OO 1- 40.1 88,OO 4 40.188.00 1- 52.501 ,O0 3

Número de carros

5 1- 1 o 10 1- 15 15 1- 20 20 1- 25 25 1- 30 30 1- 35 35 1- 40

Número de peças defeituosas por caixa

x/ O . 1 2 3 4

A, ajustada 52.501 - 3.250 = 49.251, que não é divisível por forma inteira nem por 4, nem por 5 e nem por 6. Neste caso, consideramos a A, ajustada 52.501 - 3.249, para distribuir o erro. Assim:

Número de revendedores f/

3 3

12 11 6 3 2

Número de caixas fi

28 12 5 2 1

Page 30: ESTATISTICA - DJALMA

Séries Estatísticas 29

2.7 Distribuição de Frequências - Variável Discreta

Uma vez que o interessado tenha colocado os dados na forma de uma distribuição de frequência, ele poderá rapidamente obter algumas informações adicionais e úteis para a compreensão da série, se considerar os seguintes conceitos:

2.7.1 FREQUÊNCIA RELATIVA DE UM ELEMENTO DA SÉRIE - f,

É a divisão da frequência simples deste elemento pelo número total de elementos da série.

Exemplo: Considere a variável discreta:

O total de elementos desta série é 25. Portanto, a frequência relativa 30 primeiro elemento distinto da série, que é 2, vale:

A frequência relativa do segundo elemento distinto, que é 3, vale:

Da mesma forma determinamos a frequência relativa dos elementos seguintes da série:

Page 31: ESTATISTICA - DJALMA

30 Estatística 1

Note que estes valores representam a participação percentual de cada elemento distinto na série. Assim, podemos fazer a interpretação: 12% dos valores da série são iguais a 2; 28% dos valores da série são iguais a 3; 32% dos valores da série são iguais a 4; 24% dos valores da série são iguais a 6; e 4% dos valores da série são iguais a 7.

É a soma da frequência simples deste elementocom as frequências simples dos elementos que o antecedem.

Desta forma, a frequência acumulada para os elementos 2, 3, 4, 6 e 7 valem respectivamente:

Estes valores podem ser interpretados da seguinte forma:

- 3 elementos componentes da série são valores menores ou iguais a 2.

- 10 elementos componentes da série são valores menores ou iguais a 3.

- 18 elementos componentes da série são valores menores ou iguais a 4.

Page 32: ESTATISTICA - DJALMA

Séries Estatísticas 31

- 24 elementos componentes da série são valores menores ou iguais a 6.

- 25 elementos componentes da série são valores menores ou iguais a 7.

7.3 FREQUÊNCIA ACUMULADA RELATIVA DE UM ELEMENTO DA SÉRIE - FR.

I

É a divisão da frequência acumulada deste elemento, pelo número al de elementos da série:

Assim, a frequência acumulada relativa dos elementos 2, 3, 4, 6 e 7 Aem respectivamente:

Estes valores podem ser interpretados da seguinte forma:

- 12% dos valores da série são menores ou iguais a 2.

- 40% dos valores da série são menores ou iguais a 3.

- 72% dos valores da série são menores ou iguais a 4.

- 96% dos valores da série são menores ou iguais a 6.

- 100% dos valores da série são menores ou iguais a 7.

Quando acrescentamos estes valores a tabela original, esta passa a :e chamar distribui~áo de frequências. Para o exemplo estabelecido, a distri- I - S o de frequências é:

Page 33: ESTATISTICA - DJALMA

32 Estatística 1

2.8 Distribuição de Frequências - Variável Contínua

No caso da variável contínua, pelo fato de termos utilizado intervalos de classe, semi-aberto a direita, as interpretações são diferentes. Portanto, redefiniremos estes tipos de frequência.

2.8.1 FREQDÊNCIA RELATIVA DE UMA CLASSE - f , I

É a divisão da frequência simples desta classe pelo número total de elementos da série.

Exemplo: Considere a distribuição de frequência:

O total de elementos desta série é 40.

Portanto, a frequência relativa da primeira classe é:

Classe

1 2 3 4

Int. cl.

2 1 4 41 6 6 1 8 8 1 1 O

fi 6

18 10

6

Page 34: ESTATISTICA - DJALMA

Séries Estatísticas 33

A frequência relativa da segunda classe é:

A frequência relativa da terceira classe é:

f3 10 f = - = - = 0,25 ou 25% e a frequência relativa da quarta classe

é: r3 n 40

Observe que estes valores representam a participação percentual dos elementos por classe. A interpretação para estes valores é:

- 15% dos valores da série são maiores ou iguais a 2 e menores que 4.

- 45% dos valores da série são maiores ou iguais a 4 e menores que 6.

- 25% dos valores da série são maiores ou iguais a 6 e menores que 8.

- 15% dos valores da série são maiores ou iguais a 8 e menores que 10.

2.8.2 FREQUÊNCIA ACUMULADA DE UMA CLASSE - Fj

É a soma da frequência simples desta classe com as frequências simples das classes anteriores.

Desta forma, as frequências acumuladas para estas classes são:

Page 35: ESTATISTICA - DJALMA

34 Estatística 1

Estes valores podem ser interpretados da seguinte forma, lembrando que são todos maiores ou iguais a 2.

- 6 elementos da série são valores menores que 4.

- 24 elementos da série são valores menores que 6.

- 34 elementos da série são valores menores que 8.

- 40 elementos da série são valores menores que 10.

2.8.3 FREQUÊNCIA ACUMULADA RELATIVA DE UMA CLASSE - FR. I

É a divisão da frequência acumulada desta classe pelo número total de elementos da série:

Deste modo, a frequência acumulada relativa para cada classe é:

Estes valores podem ser interpretados da seguinte forma, lembrando que são todos maiores ou iguais a 2:

- 15% dos valores da série são menores que 4.

- 60% dos valores da série são menores que 6.

- 85% dos valores da série são menores que 8.

- 100% dos valores da série são menores que 10.

Quando acrescentamos estes valores a tabela original, esta passa a se chamar distribui~ão de frequências. Para o exemplo estabelecido, a distri- buição de frequências é:

Page 36: ESTATISTICA - DJALMA

Séries Estatísticas 35

~ - ~ p

Exercícios Propostos

O que é amplitude total de uma sequência de dados?

O que é limite inferior de uma classe? O que é frequência simples de um elemento?

O que é frequência relativa de um elemento? O que é frequência acumulada de um elemento?

O que é frequência acumulada relativa de um elemento? O que é frequência simples de uma classe? O que é frequência relativa de uma classe?

O que é frequência acumulada de uma classe? O que é frequência acumulada relativa de uma classe?

Construa a distribuição de frequências para a série representativa da idade de 50 unos do primeiro ano de uma Faculdade.

F % Ri

15 60 85

1 O0

Classe

1 2 3 4

I --cprefe os valores colocados na 3Vinha da distribui~ão de frequências do i --Yema anterior.

- - - - - 1 molete o quadro.

fi

6 18 10 6

Int. cl.

2 1 4 4 1 6 6 1 8 8 1 10

idade (anos) Xi

17 18 19 20 2 1

Número de alunos fi

3 18 17 8 4

f % ' i

15 45 25 15

5

6 24 34 40

Page 37: ESTATISTICA - DJALMA

36 Estatística 1

15. Interprete todos os valores da segunda linha da distribuição de frequências do problema anterior.

16. Construa a distribuição de frequências para a série abaixo que representa uma amostra dos salários de 25 funcionários selecionados em uma empresa.

Número de acidentes por dia

xi

O 1 2 3 4

Número de dias

fi

30 5 3 1 1

17. Interprete os valores obtidos na quarta linha da distribuição de frequências do problema anterior.

18. Construa a distribuição de frequências para a série abaixo que representa o saldo de 25 contas de pessoas fíçicas em uma agência em determinado dia.

Classe

1 2 3 4 5

Classe Número de funcionlrios

o I- 10.000,00 10.000,00 1- 20.000,00

3 20.000,OO 1- 30.000,OO 4 30.000,OO 1- 40.000,OO 2

19. Interprete os valores da terceira linha da distribuição de frequências do problema anterior.

20. Complete o quadro de distribuição de frequências.

Salários US$

1.000,00 1- 1.200,oo 1.200,OO 1- 1.400,OO 1.400,OO 1- 1.600,OO 1.600,OO 1- 1.800,OO 1.800,OO 1- 2.000,OO

Número de funcionários fi

2 6

1 O 5 2

Classe

1 2 3 4 5

Int. cl.

6 1- 10 10 1- 14 14 1- 18 18 1- 22 22 1- 26

fi

1

2

f, YO

25

Fi

14

FR %

90

Page 38: ESTATISTICA - DJALMA

Séries Estatísticas 37

'2. Interpretações: 19 - Há alunos nesta classe com 19 anos.

17 - Há 17 alunos nesta classe com 19 anos.

34 - 34% dos alunos desta classe têm 19 anos. 38 - Nesta classe há 38 alunos com 19 anos ou menos. 76 - 76% dos alunos desta classe têm 19 anos ou menos.

'3.

Idade (anos) xi 17 18 19 20 2 1

frl %

6 36 34 16 8

Número de alunos fl

3 18 17 8 4

40 $5. Interpretações:

1 - Há dias em que ocorre um acidente por dia neste cruzamento.

5 - Em cinco dias dos 40 observados, ocorreu um acidente por dia. 12,5 - 12,5% dos dias observados ocorreu um acidente por dia. 35 - Em 35 dias dos 40 observados ocorrereu um ou nenhum acidente por dia neste cruzamento. 87,5 - 87,5 % dos dias observados ocorreram um ou nenhum acidente por dia neste cruzamento.

' 6.

Número de acidentes por dia: xl -

O 1 2 3 4

FI

3 21 38 46 50

FRI %

6 42 76 92

1 O0

Número de dias fl

30 5 3 I 1

FRl %

8 32 72 92

1 O0

Classe

1 2 3 4 5

frl %

75 12,5 7 3 2,s 2.5

Salários US$

1.000,OO 1- 1.200,OO 1.200,OO 1- 1.400,OO 1.400,OO 1- 1.600,OO 1.600,OO I- 1.800,OO 1.800,OO 1- 2.000,OO

FI

30 35 38 39 40

FRi %

75 87,5 95 97,5

1 O0

Número de funcionários

fi

2 6

1 O 5 2

frl %

8 24 40 20 8

FI

2 8

18 23 25

Page 39: ESTATISTICA - DJALMA

38 Estatística 1

17. Interpretações:

4 - Estamos enfocando na ordem crescente a quarta classe de salários desta empresa.

1.600,00 1- 1.800.00 - 0 s salários desta classe são maiores ou iguais a US$ 1.600,00 e menores que US$1.800,00.

5 - Há cinco funcionários com salários maiores ou iguais a US$ 1.600,00 e menores que US$ 1.800,OO.

20 - 20% dos funcionários selecionados têm salários maiores ou iguais a US$1.600,00 e menores que US$ 1.800,OO.

23 - Há 23 funcionários entre os selecionados com salários menores que US$1.800,00.

92 - 92% dos funcionários selecionados têm salários menores que US$ 1.800,OO.

18.

19. Interpretações:

3 - Estamos enfocando, na ordem crescente, a terceira faixa de saldos nas contas das pessoas físicas.

20.000,OO 1- 30.000,OO - Os valores desta faixa compreendem valores maiores ou iguais a US$ 20.000,OO e menores que US$30.000,00.

8 - Há oito contas entre as pesquisadas com saldos maiores ou iguais a US$20.000,00 e menores que US$30.000,00.

32 - 32% das contas pesquisadas têm saldos maiores ou iguais a US$20.000,00 e menores que US$ 30.000,OO.

Classe

1 2 3 4

23 - Há 23 contas entre as pesquisadas com saldos menores que US$30.000,00.

92 - 92% das contas pesquisadas têm saldos menores que US$30.000,00.

Número de contas

f,

5 1 O

8 2

Saldos US$

o I- 1 o.ooo,oo 10.000,OO 1- 20.000,OO 20.000,OO 1- 30.000,OO 30.000,OO 1- 40.000,OO

Int. cl.

10 1- 3 14 1- 18 8 40 4 18 1- 22 4 20 5 22 1- 26 2 1 O

2.1 0 Representação Gráfica de Séries Estatísticas

Existem muitas formas de se representar graficamente uma série es- tatística.

Podemos citar entre elas: gráfico em linhas; em colunas; em barras, em setores; em porcentagens complementares; gráficos polares; gráficos pictóri- cos, cartogramas etc.

FRi %

20 60 92

1 O0

fr, %

20 40 32 8

FI

5 15 23 25

Page 40: ESTATISTICA - DJALMA

Séries Estatísticas 39

-10 entanto, a maioria deles são simplesmente gráficos de apresenta- cão, que o interessado com pequeno esforço poderá facilmente compreender.

Nosso interesse estará completamente voltado para os gráficos de análise da série estatística que são: Histograma, Polígono de frequência e a curva polida de frequência.

Estas representações gráficas assumem aspectos diferenciados para variável discreta e variável contínua.

É um conjunto de hastes, representadas em um sistema de coordena- das cartesianas que tem por base os valores distintos da série (xi) e por altura, valores proporcionais as frequências simples correspondentes destes elemen- tos (fí).

Exemplo: Se considerarmos a série:

então o histograma assume a forma:

fi t

Page 41: ESTATISTICA - DJALMA

40 Estatística 1

É um conjunto de retângulos justapostos, representados em um siste- ma de coordenadas cartesianas, cujas bases são os intervalos de classe e cujas alturas são valores proporcionais as frequências simples corresponden- tes.

Exemplo: Se considerarmos a série:

então o histograma assume a forma:

' i f

Classe

1 2 3 4 5

i Observe que não colocamos o zero no eixo horizontal na origem do sistema por uma questão de clareza da representação gráfica.

Deixamos, intencionalmente, um espaço igual a um intervalo de classe no início e no final da representação gráfica.

Int. cl.

o 1 2 2 1 4 4 1 6 6 1 8 8 1 1 O

Se considerarmos este espaçamento inicial e final como sendo classes fictícias com frequência zero e unirmos os pontos médios das bases supe- riores destes retângulos, obtemos uma nova figura chamada polígono de frequência.

f,. 3 6 8 5 2

Page 42: ESTATISTICA - DJALMA

Séries Estatísticas 41

fi t

0 2 4 6 8 1 0 lnt. cl.

i Observe que a área do polígono de frequência é a mesma área do -,i~tograma.

i Quando estamos lidando com um censo, o histograma representa !;retamente a distribuição de frequência da população, mas quando estamos dando com uma amostra, a histograma representa apenas a distribuição de -equência da amostra e não da população.

No entanto, se imaginarmos o número n de elementos da amostra iumentando progressivamente, o número de classes iria aumentando pro- :ressivamente e a amplitude do intervalo de classe iria diminuindo, o que -ansformaria o polígono de frequência praticamente em uma figura polida, :+amada curva polida de frequência.

Esta figura nos dará uma noção da distribuição de frequência da popu- 3920.

0 2 4 6 8 1 0 lnt. cl.

Page 43: ESTATISTICA - DJALMA

42 Estatística 1

2.1 1 Exercícios Propostos

1. Conceitue histograma para uma variável discreta.

2. Conceitue histograma para uma variável contínua.

3. Quando a série representa uma amostra qual é o principal objetivo da construção do histograma ?

4. Construa um histograma para a distribuição de frequência:

5. Construa um histograma para a série representativa da idade de 50 alunos do primeiro ano de uma Faculdade:

6. Construa um histograma para a série representativa do número de acidentes por dia observados em determinado cruzamento, durante 40 dias:

Idade (anos) Xl

17 18 19 20 21

Número de alunos fl

3 18 17 8 4

7. Construa um histograma para a série representativa de uma amostra dos salários de 25 funcionários selecionados em uma empresa.

Número de acidentes por dia

Xl

O 1 2 3 4

Número de dias fi

30 5 3 1 1

8. Construa o polígono de frequência para a distribuição do problema anterior.

Classe

1 2 3 4 5

Salários US$

1.000,oo 1- 1.200,oo 1.200,OO 1- 1.400,OO 1.400,OO 1- 1.600,OO 1.600,OO 1- 1.800,OO 1.800,OO 1- 2.000,OO

Número de funclon~rios fl

2 6

10 5 2

Page 44: ESTATISTICA - DJALMA

Séries Estatísticas 43

Construa um histograma para a série representativa do saldo de 25 contas de pessoas físicas em uma agência em determinado dia.

Classe Número de contas

o I- 1 o.ooo,oo 10.000,00 1- 20.000,00 20.000,OO 1- 30.000,OO

4 30.000,OO 1- 40.000,OO 2

- 7 Construa o polígono de frequência para a distribuição do problema anterior.

Page 45: ESTATISTICA - DJALMA

44 Estatística 1

I .ooo,oo I .200,00 I .400,00 I .600,00 I .aoo,oo 2.000,00 Salários

I .I oo,oo 1.300,oo 1.500,oo 1.700,oo 1.900,oo Salários

Page 46: ESTATISTICA - DJALMA

Séries Estatísticas 45

o I o.ooo,oo 20.oo0,oo 30.000,OO 40.000,OO Saldos

Page 47: ESTATISTICA - DJALMA

3f Medidas de Tendência Central

3.1 Introdução

No estudo de uma série estatística é conveniente o cálculo de algumas medidas que a caracterizam.

Estas medidas, quando bem interpretadas, podem fornecer-nos infor- mações muito valiosas com respeito a série estatística.

Em suma, podemos reduzi-la a alguns valores, cuja interpretação for- nece-nos uma compreensão bastante precisa da série.

Um destes valores é a medida de tendência central. É um valor intermediário da série, ou seja, um valor compreendido

entre o menor e o maior valor da série. É também um valor em torno do qual os elementos da série estão distribuídos e a posiciona em relação ao eixo horizontal.

Em resumo, a medida de tendência central procura estabelecer um número no eixo horizontal em torno do qual a série se concentra.

As principais medidas de tendência central são: média, mediana e moda.

No cálculo de várias medidas estatísticas, vamos utilizar somas de um grande número de parcelas.

Para facilitar a representação destas somas, introduziremos o conceito de somatório.

3.2 Somatório - Notação Sigma (C )

Quando queremos representar uma soma de n valores do tipo x, + x2 + ... + x,, podemos codificá-la através da expressão:

Page 48: ESTATISTICA - DJALMA

Medidas de Tendência Central 47

1 ide:

X - é utilizada para representar as operações de adição entre as parcelas.

xi - é a parcela genérica

A parcela genérica é obtida tomando-se os termos constantes em -:das as parcelas, no caso x. Para representar a parte variável em cada zsrcela, no caso os índices, utilizamos a letra i e indicamos a variação de i. 'do exemplo i varia, segundo números inteiros consecutivos de 1 até n.)

n

A expressão C xi deve ser lida "soma dos valores xi, para i varian- ) de 1 até n." i= 1

Para que uma soma possa ser representada por esta notação é funda- ~ e n t a l que i assuma todos os valores inteiros consecutivos entre dois valores 2sdos. Assim, a soma:

4

X, + X2 + X4 # C Xi

i= 1

Exemplos:

Page 49: ESTATISTICA - DJALMA

48 Estatística 1

Da mesma forma que codificamos a soma através da notação Sigma, podemos decodificar obtendo as parcelas componentes.

4

Para obter a primeira parcela da soma: C (3xJ

i = 2

basta substituir na parcela genérica 3x, a variável i pela valor indicado no extremo inferior, i = 2.

A primeira parcela da soma é 3x2.

Para obter a segunda parcela, basta substituir na parcela genérica 3x, a variável i por 3. A segunda parcela vale 3x3. A última parcela da soma é obtida quando substituímos na parcela genérica 3xi o valor de i por 4, que é o valor indicado no extremo superior.

A última parcela é 3x4. 4

Portanto, C (3x> = 3x2 + 3x3 + 3x4.

i = 2

Exemplos:

3 3 3

3. C (x, b) = (x, - b) + (x2 - b13 + (x3 - b13 , i = 1

Apesar de ser apenas um código e não uma operação, a notação Sigma tem algumas propriedades que podem simplificar operações. Entre elas destacamos:

Page 50: ESTATISTICA - DJALMA

Medidas de Tendência Central 49

1. O somatório de uma soma é a soma dos somatórios.

n

De fato, se desenvolvermos C (xi + yi) obtemos:

i= 1 n

2. O somatório de uma diferença é a diferença dos somatórios.

A demonstração é análoga a anterior.

3. O somatório do produto de uma constante por uma variável é o produto da constante pelo somatório da variável.

n

Considerando a um número real qualquer e desenvolvendo ( a . x,), obtemos: i= I

Page 51: ESTATISTICA - DJALMA

50 Estatística 1

n

C ( a . x i ) = ax, +ax2+ax3+ ... +axn =

i = 1 n

= a . (x1 +x2+x3+. . . + x n ) = a . C xi i= 1

4, O somatório da divisão de uma variável por uma constante é a divisão do somatório da variável pela constante.

n

De fato, desenvolvendo

Um caso particular da notação Sigma é a representação de uma soma cujas parcelas são todas iguais.

Neste caso, as parcelas são constituídas por valores constantes e a variável iserá utilizada apenas para estabelecer o número de parcelas.

O número de parcelas é determinado pela diferença entre o valor de i indicado no extremo superior e o valor indicado no extremo inferior, adicionan- do-se uma unidade.

Assim, a soma 15 + 15 + 15 + 15 pode ser representado por: 4 5 6

15 oupor C 15 o u x 15 i = 1 i = 2 -- i = 3

1 Notéque em todos os casos a diferença entre o valor de i indicado no extremo superior e o valor de i indicado no extremo inferior, acrescida de uma

I unidade conduz a 4, que é o número de parcelas.

Page 52: ESTATISTICA - DJALMA

Medidas de Tendência Central 51

Desta forma, 3 é constituída de (7 - 2) + 1 = 6 parcelas. Portan- to: i = 2

i Nas aplicações estatísticas estaremos sempre interessados na soma de todos os valores da série. Portanto, i varia sempre de 1 a n e conseqüentemente não precisaremos indicar na notação sigma a variação de i.

Desta forma, identificaremos:

Isto facilita a apresentação das fórmulas de cálculos.

3.3 Exercícios Propostos

I . Escreva na notação Sigma, as somas:

a) x l+x2+x3+x4+x5

6) x3+x4+x5+xs

c) (x, + 2) + (x* + 2) + (x3 + 2)

d) (x,- 10)+(x2- 10)+(x3- 10)+(x4- 10)

e) (xI - 3)2 + (x2 - 312 + (x3 - 3)' (x,-15ff,+(x2-15ff2+(x3-15ff3

2. Escreva as parcelas da soma indicada.

Page 53: ESTATISTICA - DJALMA

52 Estatística 1

3. Calcule para a tabela abaixo, o valor numérico das somas indicadas:

I 4. Usando as propriedades do somatório, desenvolva:

5. Usando a tabela do problema 3, verifique que:

Page 54: ESTATISTICA - DJALMA

Medidas de Tendência Central 53

SESPOSTAS

3. a) C xi f i = 60 C xi C f i = 252. Portanto, xi f i # C xi f i

c) C 4 = 125 (C x$ = 441. Portanto, 4 + (C xj2

Page 55: ESTATISTICA - DJALMA

54 Estatística 1

3.4 Médias

Do ponto de vista teórico, vários tipos de média podem ser calculados para uma massa de dados.

Focalizaremos neste estudo as médias aritméticas geométricas e har- mônicas.

3.4.1 MÉDIA ARITMETICA SIMPLES

Para uma sequência numérica X x,, x2, ......, x,, a média aritmética simples, que designaremos por X é definida por:

2 + 0 + 5 + 3 Exemplo: Se X 2, 0, 5, 3, então X = - 4

Para uma sequência numérica X x,, x2: ...... , xn afetados de pesos p,, p2, ......., pn, respectivamente, a média aritmetica ponderada, que designare- mos por X, é definida por:

Exemplo: Se X: 2, 4, 5, com pesos 1, 3, 2 respectivamente, então:

Page 56: ESTATISTICA - DJALMA

Medidas de Tendência Central 55

3.4.3 MÉDIA GEOMÉTRICA SIMPLES

Para uma sequência numérica X xl, x2, ......, xn, a média geométrica simples, que designaremos por % é definida por:

Exemplo: Se X: 2, 4, 6, 9, então:

3.4.4 MÉDIA GEOMÉTRICA PONDERADA

Para uma sequência numérica X: xl,x2, ..., X, afetados de pesos pl, c)2,..2 pn respectivamente, a média geométrica ponderada que designaremos por Xg é definida por:

Exemplo: Se X: 1, 2,5 com pesos 3, 3, 1 respectivamente, então:

3.4.5 MÉDIA HARMONICA SIMPLES

Para uma sequência numérica de elementos não nulos X: x,, x2, ..., x,, a média harmônica simples, que designaremos por %, é definida por:

Page 57: ESTATISTICA - DJALMA

Note que a média harmônica é o inverso da média aritmética dos inversos dos elementos.

Exemplo: Se X: 2, 5, 10, então:

3.4.6 MÉDIA HARMONICA PONDERADA

Para uma sequência numérica de elementos não nulos X: xl, x2, ..., xn afetados de pesos pl, p2, ... p,,, respectivamente, a média harmônica pondera-

. . da que designaremos por xh é definida por:

Page 58: ESTATISTICA - DJALMA

Medidas de Tendência Central 57

Exemplo: Se X: 2, 4, 12 com pesos 3, 2,2 respectivamente, então:

Observando-se que:

1. A média harmônica aplica-se naturalmente quando se quer a ob- tenção de uma média cuja unidade de medida seja o inverso da unidade de medida dos componentes da sequência original.

2. A média geométrica só é indicada para representar uma série de valores aproximadamente em progressão geométrica.

3. Os casos anteriores não são muito frequentes nas aplicações. Va- mos restringir o desenvolvimento de médias ao caso de média aritmética, que é a média mais utilizada nas aplicações.

3.5 Cálculo da Média Aritmética I

fTaso - DADOS BRUTOS OU ROL

Neste caso, devemos utilizar uma média aritmética simples:

Exemplo: Calcule a média da variável X: 3, 5, 8, 12, 7, 12, 15, 18, 20,

Interpretagão: O valor médio desta série é 12, ou seja, os valores desta série concentram-se em torno do valor 12.

Page 59: ESTATISTICA - DJALMA

58 Estatística 1

2Taso - VARIÁVEL DISCRETA

Se os dados estão apresentados na forma de uma variável discreta, utilizaremos a média aritmética ponderada, considerando as frequências sim- ples fi como sendo as ponderações dos elementos xi correspondentes.

C x, P, A fórmula de cálculo de Xque originalmente era 2 = 7 rn passa a

ser escrita como: L ri

Exemplo: Determinar a média da distribuição:

Solução: Inicialmente devemos somar a coluna de frequências simples para obter o número total de elementos da série: C f i = 10 elementos.

Em seguida, utilizamos a própria disposição da tabela para efetuar os produtos xi f , acrescentando estes valores dispostos em uma nova coluna. Em seguida somamos os valores desta coluna.

Na sequência substituímos estes valores na expressão Xobtendo:

Page 60: ESTATISTICA - DJALMA

Medidas de Tendência Central 59

Interpreta~ão: O valor médio da série é 5,6, isto é, 5,6 é o ponto de ::~centração dos valores da série.

F Caso - VARIÁVEL CONT~NUA

Se os dados estão apresentados na forma de uma variável continua, -:-izaremos a média aritmética ponderada, considerando as frequências sim- : ss das classes como sendo as ponderações dos pontos médios destas : asses.

O ponto médio, de cada classe é definido por:

2 Xi Pi A fórmula de cálculo de Rque originalmente era 2 = - passa a

s r escrita como: L Pi

Exemplo: Determinar a média da distribuição:

Solu~ão: Inicialmente, devemos somar a coluna das frequências sim- ples, obtendo f j . = 20.

Classe

1 2 3 4

Na sequência, calculamos os pontos médios de classe: o ponto médio da primeira classe é = 3,5; O ponto médio da segunda classe é

= 6,5; o ponto médio da terceira classe é = 9,5 e o ponto médio da 2

11+14 - quarta classe é 2- - 12,5.

Int. cl.

2 1 5 5 1 8 8 1 11

11 I 14

fi 1

10 8 1

Page 61: ESTATISTICA - DJALMA

60 Estatística 1

Estes valores serão dispostos em uma nova coluna na tabela. Como no caso anterior, usaremos a própria tabela para a sequência de cálculos.

- xj fi -

C f i 157 - 7,85 Portanto, X = - - - - 20

Classe

1 2 3 4

Interpretação: O valor médio desta série é 7,85, isto é, 7,85 é o valor em torno do qual os elementos desta série se concentram.

COMENTÁRIO: Quando agrupamos os dados na disposição de uma variável contínua, passamos a trabalhar com os dados sem conhecimento de seus valores individuais.

Note no exemplo acima, que o máximo que podemos afirmar com respeito ao menor valor desta série é que ele é um valor maior ou igual a 2 e menor que 5. Mas não conhecemos seu valor individualizado.

O mesmo ocorre com todos os outros valores da série.

Este fato é que nos leva a substituir as classes pelos seus pontos médios ao calcular a média da série.

3.6 Exercícios Propostos

Int. cl.

2 1 5 5 1 8 8 1 11

11 I 14

1. Calcule a média aritmética da série:

(a)X: 1,2,8, 10, 12, 16,21,30.

(b) Y: 5, 6, 6, 10, 11, 11, 20.

(c) Z: 3,4; 7,8; 9,23; 12,15.

2. Um produto é acondicionado em lotes contendo cada um deles 10 unidades. O lote só é aprovado se apresentar um peso superior a 40 quilos.

Se as unidades que compõem determinado lote pesam: 3; 4; 3,5; 5,O; 3,5; 4; 5; 5,5; 4; 5, este lote será aprovado? Qual o peso médio do produto?

3. Calcule a média geométrica para as séries:

X: 1, 2, 4, 7, 16

Y: 81, 26, 10, 3, 1

fi 1

10 8 1

xi 3,5 6,5 9,5

12,5

xi fi 3,5 65 76 12,5

Page 62: ESTATISTICA - DJALMA

Medidas de Tendência Central 61

2 Calcule a média harmônica da série:

I Um produto é vendido em três supermercados por $ 13,00/kg, $ 13,20/kg e $ 13,50/kg. Determine quantos $/kg se paga em média pelo produto.

I Um produto é vendido em três supermercados por $ 130/kg, $ 132/kg e $ 135/kg. Determine, em média quantos quilos do produto se compra com $1,00.

- Calcule a média harmônica da série 130, 132, 135.

? Calcr~le a média aritmética da série: I

. Calcule a média geométrica da série anterior.

' :. Calcule a média harmônica da série anterior.

- Verifique pelos cálculos anteriores qual relação é válida entre estas médias.

'2. Uma loja vende cinco produtos básicos A, B, C, D, E. O lucro por unidade comer- cializada destes produtos vale respectivamente $200,00; $300,00; $500,00; $ 1.000,OO; $ 5.000,OO. A loja vendeu em determinado mês 20; 30; 20; 10; 5 unidades respectivamente. Qual foi o lucro médio por unidade comercializada por esta loja?

-3. Um caminhão cujo peso vazio é 3.000 kg será carregado com 480 caixas de 10 kg cada, 350 caixas de 8 kg cada, 500 caixas de 4 kg cada e 800 caixas de 5 kg cada. O motorista do caminhão pesa 80 kg e a lona de cobertura da carga pesa 50 kg. (a) Se este caminhão tem que passar por uma balança que só permite passa- gens a caminhões com peso máximo de 15 toneladas, este caminhão passará pela balança? (b) Qual o peso médio das caixas carregadas no caminhão?

1 I ' 2 . Calcule a idade média dos alunos de uma classe de primeiro ano de determinada

Faculdade, em anos.

Page 63: ESTATISTICA - DJALMA

7-

62 Estatística 1

15. Calcule o número médio de acidentes por dia em uma determinada esquina.

Idade (anos) Xl

17 18 19 20 2 1

NQ de alunos fl

3 18 17 8 4

16. O salário de 40 funcionários de um escritório está distribuído segundo o quadro abaixo. Calcule o salário médio destes funcionários.

N q e acidentes por dia: x,

O 1 2 3 4

NQ de dias fr

30 5 3 1 1

17. Uma imobiliária gerencia o aluguel de residências particulares, segundo o quadro abaixo:

Classe

1 2 3 4 5 6

Calcule o aluguel,médio para estas residências.

Salários $

400,OO 1- 500,OO 500,OO 1- 600,OO 600,OO 1- 700,OO 700,OO 1- 800,OO 800,OO 1- 900,OO 900,OO 1- 1.000,OO

Classe

1 2 3 4 5

18. Uma empresa de aviação observou em seus registros recentes, o tempo de mão- de-obra gasto na revisão completa de um motor de jato.

NQ de funcionhrios r,

12 15 8 3 1 1

O seguinte quadro foi obtido:

Aluguel $

O I- 200,OO 200,OO 1- 400,OO 400,OO 1- 600,OO 600,OO 1- 800,OO 800,OO 1- 1 .OOO,OO

NQ de casas fl

30 52 28 7 3

Classe

1 2 3 4 5

Tempo de mão-de-obra (horas)

o I- 4 4 1- 8 8 I- 12

12 1- 16 16 1- 20

No de motores f~

1 5

1 O 12 4

Page 64: ESTATISTICA - DJALMA

Medidas de Tendência Central 63

a) Determine o número médio de horas de mão-de-obra necessário para a revi- são de cada motor.

b) Com base nesta informação, qual deve ser o tempo total de mão-de-obra para a revisão de dez motores que aguardam revisão?

c) Se a empresa dispõe no momento de dois homens trabalhando 12 horas por dia nestas revisões conseguirá provavelmente revisar estes dez motores em quatro dias?

?. Uma empresa de âmbito nacional, fornecedora de supermercados, fez um levanta- mento do consumo de seu principal produto em vários supermercados obtendo em determinado mês, a tabela:

Determine o consumo médio deste produto'por supermercado pesquisado.

Classe

1 2 3 4 5 6

13. Uma pesquisa para determinar a eficiência de uma nova ração para animais, em termos de ganho de peso, mostrou que após um mês em que a ração normal foi substituída pela nova ração, os animais apresentaram um aumento de peso se- gundo a tabela:

Número de unidades consumidas

O I- 1.000 1.000 1- 2.000 2.000 1- 3.000 3.000 1- 4.000 4.000 1- 5.000 5.000 I- 6.000

a) Calcular o aumento médio de peso por animal.

b) Se a ração antiga proporcionava em iguais circunstâncias um aumento médio de peso de 3.100 kg/animal, esta nova ração pode a princípio ser considerada mais eficiente?

No de supermercados fi

1 o 50

200 320 150 30

1'. Refaça o problema anterior acrescentando a todos os limites de classe mais 2 kg.

Compare a média com a média anterior,

Ng de animais fi

1 5

35 37 28

Classe

1 2

- 1 =xercicios Especiais

Aumento de peso em kg

o 1- 1 1 I- 2

2. Prove que se X: x,, x2 ,,.., xn e a E R, então x + a = X + a

13. Prove que se X: x,, x2 ,..., xn e a E R, então x - a = x - a

22. Prove que se X: x,, x2 ,..., xn e a E R, então CX = a . F 25. Prove que se X: x,, x2 ,..., xn , a E R e a # 0, então = 'Ya

2 I- 3 3 1- 4 4 1- 5

Page 65: ESTATISTICA - DJALMA

64 Estatística 1

n 26. Mostre que a média geométrica simples X = 4 x, x2 . . . xn também pode ser

calculada por 9

Z ln x - i - X = e n

9 C f i 27. Mostre que a média geométrica ponderada kg = 4 x, '1 x,% . . . xnfn também

pode ser calculada por: Z ( f , ln X )

- X = e "'i

9 z xifi 28. Mostre que a média ponderada 2 = - pode também ser calculada no caso

de uma variável continua pela fórmula: ' fi

onde: xo é o ponto médio de classe de uma classe qualquer escolhida. I ai são valores de uma nova variável obtidos pela transformação ai = - h

Esta fórmula é chamada Processo Breve do Cálculo da Média. 29. Calcule a média da tabela do problema 16, usando o Processo Breve. 30. Calcule a média da tabela do problema 17, usando o Processo Breve.

RESPOSTAS

1. a) 12,5 b) 9,857 c) 8,145

2. Sim. = 4,25 3. a) 3,8946 b) 9,1225 4. a) 9,6 b) 3,36

5. 13,33/kg 6. O, 0075585 kg/$ 7. 132,3015kg

8. 3,6 9. 3,478 1 O. 3,352

17. d 12. 682,35/peça 13. a) Não b) 6,385 kg 14. 18,84 anos/aluno 15. 0,45 ac/dia 1 6. $572,5/f

17. $335/res

18. a)11,625h b) 116,25h C) não 19. 3.342,l unid.

20. a) 3.37 7 kg b) Sim.

21. a) 5,311 kg. A m6dia da nova série é a média da série antiga acrescida de duas unidades. b) Sim.

Page 66: ESTATISTICA - DJALMA

Medidas de Tendência Central 65

L xi na C xi - - - + - = - + a = F + a n n n

Da mesma forma demonstram-se, usando propriedades do somatório, os próximos exercícios.

- n X = 4 xl 3 . . . x, . Portanto,

- 1 In Xg = In (x, 3 . . . x,) n . Usando as propriedades do logaritmo:

1 ln Xg = - (ln x,+In % + . . . + h x,) n

- C l n x i I n X =-

n . Aplicando a operação antilogaritmo, obtemos:

- C' i - - . x = 4 x, '1 3% ... xntn . portanto, 9

- ln Xg = ln (x, '1 $5 . . . x,'n)q . Usando as propriedades do logaritmo:

- 1 f ln X = - ln ( x l f i ~ 5 ... x,n) =

g C' i - 1 f f

In X g = - ( I n x, l+In x22+ ...+ Inx,'n)= C 'i

- 1 ln X = - (f, In x, f, + In x2 + ... + f, ln x,) =

g C f , - C f i I n x j

I n X =- . Aplicando a operação antilogaritmo obtemos: g C ' i

- Z a, 5 xj - xo 23. X = xo + - . h . Como q = -

h , substituindo-se, obtém-se:

L r; 1

- [ f x O C ~ + - C ( x j - x J f , h X = x o +

h . h = h C f , C f ,

Page 67: ESTATISTICA - DJALMA

66 Estatística 1

3.7 Mediana

É um valor real que separa o rol em duas partes deixando a sua esquerda o mesmo número de elementos que a sua direita. Portanto, a me- diana é um valor que ocupa a posição central em uma série.

Notação: A mediana será denotada por md

3.8 Cálculo da Mediana

1" Caso - DADOS BRUTOS OU ROL

Inicialmente devemos ordenar os elementos caso sejam dados bru- tos, obtendo o Rol.

Em seguida determinamos o número n de elementos do Rol.

1.1. Se n é impar - O Rol admite apenas um termo central que ocupa a posição " + ' Y 0 valor do elemento que ocupa esta posição é a mediana. ( 7 1

Exemplo: Determinar a mediana do conjunto:

Solução: Ordenando estes elementos obtemos o rol. X: 2, 8, 12, 12, 20, 20,23.

O número de elementos é n = 7 (ímpar), a posição do termo central é [F] 0 = 40.

A mediana é o quarto elemento do Rol: md = 12.

O valor 12 deixa a sua esquerda e à sua direita o mesmo número de elementos, sendo, portanto, o elemento central da série.

Quando lidamos com sériss com urn grailde número de elementos, a quantidade de elementos à esquerda é â direita é aproximadamente 50% do total de elementos, o que conduz a veguinie interpreta~ão genérica para a mediana: "50% dos valores da série são valores menores ou iguais a 12 e 50% dçzs valores da série são valor?s maiores ou iguais a 12".

1.2. Se n é par - Neste caso, o rol admite dois termos centrais que ocupam as posições ("/2)O e ("/2 + l)O. A mediana é convencionada como sendo a média dos valores que ocupam estas posições centrais.

Page 68: ESTATISTICA - DJALMA

Medidas de Tendência Central 67.

Exemplo: Determinar a mediana da série:

X:7, 21, 13, 15, 10, 8, 9, 13.

Solução: Ordenando estes elementos, obtemos o rol: X 7, 8, 9, 10, 13, -3, 15,21:

O número de elementos é n = 8 (par).

As posições dos termos centrais são: (8/2)" 44" e (8/2 + 1)" s5" O elemento que ocupa a quarta posição na série é 10 e o elemento

z.ie ocupa a quinta posição é 13. Portanto,

Interpretação: 50% dos valores do rol são valores menores ou iguais a -: ,5 e 50% dos valores do rol são valores maiores ou iguais a 11,5.

P Caso - VARIÁVEL DISCRETA

Se os dados estão apresentados na forma de uma variável discreta, 5'ss já estão naturalmente ordenados.

Assim, basta verificar se o número de elementos da série é ímpar ou i z r e aplicar o mesmo raciocínio do caso anterior.

Para facilitar a localização dos termos centrais, construímos a frequên- s acumulada da série.

Exemplo 1: Determinar a mediana da série:

Solução: O número de elementos da série é n = C fi = 23 (ímpar).

Portanto, a série admite apenas um termo central que ocupa a posição 3 4 1 o -)- = 129. 2

Construindo a frequência acumulada podemos localizar com facilidade : décimo segundo elemento da série.

Page 69: ESTATISTICA - DJALMA

68 Estatística 1

Note que o elemento que ocupa a primeira posição na série é 2. Em seguida aparecem quatro elementos iguais a 5. Estes elementos ocupam na série as posições de segundo a quinto. Depois aparecem mais dez elementos iguais a 8 que ocupam na série as posições de sexto a décimo quinto.

Conseqüentemente, o elemento que ocupa a décima segunda posição vale 8, e podemos afirmar que md= 8.

Interpretação: 50% dos valores da série são menores'ou iguais a 8 e 50% dos valores da série são maiores ou iguais a 8.

Exemplo 2: Calcular a mediana da série:

Solução: O número de elementos da série é 32 (par) e a série admite dois termos centrais que ocupam as posições: (32/2)" leO e (32/2 + l)o = 17°.. Para localizar estes elementos, construímos a frequência acumulada da série.

Page 70: ESTATISTICA - DJALMA

Medidas de Tendência Central 69

As três primeiras posições da série são ocupadas por elementos iguais 2 3.

Da quarta a oitava posição os elementos são iguais a 1. Da nona a :+cima sexta posição os elementos são iguais a 2. Da décima sétima a

- lésima sexta posição os elementos valem 3.

Portanto, o elemento que ocupa a décima sexta posição é 2 e o ele- -rnto que ocupa a décima sétima posição é 3 e, consequentemente, a me- : m a é:

Interpreta@o: 50% dos valores da série são valoreqmenores ou iguais i e 50% dos valores da série são valores maiores ou i&ais a 2,5.

F Caso - VARIÁVEL CONT~NUA

Se a dados são apresentados na forma de uma variável contínua, o ~ciocínio anterior não pode ser utilizado, uma vez que mesmo identificada a zzsição da mediana na série, o valor do elemento da série que ocupa esta i x i ção não é identificável.

Utilizaremos um exemplo, para generalizar a fórmula de cálculo da -ediana.

Considere a distribuição de frequência:

O número de elementos da série é n = Ç fí = 19.

A mediana, por definição, separa o número de elementos da série em dois grupos, contendo cada um deles 50% dos elementos.

Portanto, a posição da mediana na série é "/2. No exemplo (I%)" 9,5".,

O valor decimal 9,5 indica que a mediana é um elemento posicionado rntre o nono e o décimo elemento da série.

Classe

1 2 3 4 5

Int. cl.

3 1 6 6 1 9 9 1 12

12 1 15 15 1 18

f j 2 5 8 3 1

Page 71: ESTATISTICA - DJALMA

70 Estatística 1

Construiremos a frequência acumulada para identificar em qual classe estão situados o nono e o décimo elemento da série.

Note que o nono e o décimo elementos estão posicionados na terceira classe, o que indica que a mediana é um valor compreendido entre 9 e 12. A classe que contém a mediana será identificada como classe mediana.

Este intervalo de três unidades contém oito elementos. Supondo que eles estão uniformemente distribuídos neste intervalo, então poderemos dividir este intervalo de modo proporcional a posição da mediana na série.

15- 7 9,5-7 - Ou seja: - - - 3

. Simplificando: X

Classe

1 2 3 4 5

Portanto:

m d = 9 + x

fi 2 5 8 3 1

Int. cl.

3 1 6 6 1 9 9 1 12

12 1 15 15 1 18

Observando na fórmula em destaque acima que:

fA 2 7

15 18 19

- 9 é o limite inferior da classe mediana.

- 9,5 é a metade dos elementos da série, isto é, "/2. - 7 é a frequência acumulada da classe anterior a classe mediana.

- 8 é a frequência simples da classe mediana.

Page 72: ESTATISTICA - DJALMA

Medidas de Tendência Central 71

- 3 é a amplitude do intervalo de classe, poderemos generalizar a fórmula de cálculo da mediana para variável contínua:

Im, - limite inferior da classe mediana.

n - número de elementos da série.

Fant- Frequência acumulada da classe anterior a classe mediana.

fmd - frequência simples da classe mediana.

h - amplitude do intervalo de classe.

COMENTÁRIO: Devido as condições impostas na obtenção da fórmu- a da mediana, fica evidente que o valor obtido pela fórmula é um valor zproximado do verdadeiro valor da mediana da série.

De modo geral, todas as medidas calculadas para uma variável contí- lua serão valores aproximados para estas medidas, uma vez que ao agrupar- 70s os dados segundo uma variável contínua, há perda de informações quan- :3 a identidade dos dados.

3.9 Exercícios Propostos

. Calcule a mediana da sequência:

a) X:2,5,8, 10, 12, 15,8,5, 12

b) Y:3,4;5,2;4,7;6;8,4;9,3;2,1;4,8

2. Interprete os valores obtidos no exercício anterior.

3. Calcule a mediana da distribuição.

Page 73: ESTATISTICA - DJALMA

72 Estatística 1

4. Calcule a mediana da distribuição do número de acidentes por dia, observados em determinado cruzamento, durante 40 dias.

por dia de dias

4 1

5. Interprete o valor da mediana obtida no problema anterior:

6. Calcule a mediana para a série representativa da idade de 50 alunos de uma classe do primeiro ano de uma Faculdade.

7. Inferprete o valor obtido para a mediana no problema anterior.

8. Uma máquina produz peças que são embaladas em caixas contendo 48 unidades. Uma pesquisa realizada com 59 caixas, revelou a existência de peças defeituosas seguindo a tabela:

Determine o valor mediano da série.

NQ de peças defeituosas por caixa

o 1 2 3 4 5

9. Interprete o valor obtido no problema anterior.

Número de caixas

20 15 12

6 4 2

10. Determine o valor mediano da distribuição a seguir que representa os salários de 25 funcionários selecionados em uma empresa.

Page 74: ESTATISTICA - DJALMA

I

Medidas de Tendência Central 73

Classe Salários $ NP de funcionários

1 .ooo,oo 1- 1.200,oo 1.200,OO 1- 1.400,OO 0 1.400,OO 1- 1.600,OO 10

4 1.600,OO 1- 1.800,OO 5 5 1.800,OO 1- 2.000,OO 2

' '. Interprete o valor mediano obtido no problema anterior.

-2. Uma loja de departamentos, selecionou um grupo de 54 notas fiscais, durante um dia, e obteve o seguinte quadro:

Determine o valor mediano da série.

- 3. Interprete o valor obtido.

No de notas

1 O 28 12 2 1 1

Classe

1 2 3 4 5 6

-4 O departamento de recursos humanos de uma empresa, tendo em vista o aumen- to de produtividade de seus vendedores, resolveu, premiar com um aumento de 5% no salário, a metade de seus vendedores mais eficientes. Para isto, fez um levantamento de vendas semanais, por vendedor, obtendo a tabela:

Consumo por nota $

O I- 50 50 1- 1 O0

100 1- 150 150 1- 200 200 1- 250 250 1- 300

Classe Vendas $ NP de vendedores

10.000 10.000 1- 20.000

3 20.000 1- 30.000 27 4 30.000 1- 40.000 31 5 40.000 1- 50.000 1 O

A partir de qual volume de vendas o vendedor será premiado? - - 2. O consumo de energia elétrica verificado em 250 residências de famílias da classe

média, com dois filhos, revelou a distribuição:

Calcule a mediana da distribuição.

' 3. Interprete o valor obtido.

Classe

1 2 3 4 5 6 7

Consumo kwh

O I- 50 50 1- 1 O0

100 1- 150 150 1- 200 200 1- 250 250 1- 300 300 1- 350

NQ de familias

2 15 32 47 50 80 24

Page 75: ESTATISTICA - DJALMA

74 Estatística 1

RESPOSTAS

1. a)m,=8 b)m,=5

2. a) 50% dos valores da série são menores ou iguais a 8 e 50% são valores maiores ou iguais a 8.

b) 50% dos valores da série são menores ou iguais a 5 e 50% dos valores da série são maiores ou iguais a 5.

3. m, = 5.

4. md= O

5. Em 50% dos dias observados não ocorreu acidente e em 50% dos dias observados ocorre O ou mais acidentes por dia.

6. md=19.

7. 50% dos alunos desta sala tem 19 anos ou menos e 50% têm 79 anos ou mais.

9. 50% das caixas contêm uma ou nenhuma peça defeituosa e 50% contêm uma ou mais peças defeitu- osas.

10. md=$ 1.490.

11. 50% dos funcionários desta empresa recebem $1.490 ou menos e 50% recebem $1.490 ou mais.

12. m, = $80,36.

13. 50% das notas apresentavam consumo menor ou igual a $ 80, 36 e 50% apresentavam consumo maior ou igual a $80,36.

14. md=$30.161,29

15. md = 229 Kwh.

16. 50% das residências da classe m6dia com dois filhos consomem 229 kwh ou menos e 50% consomem 229 kwh ou mais.

3.10 Moda

É o valor de maior frequência em um conjunto de dados.

Nota~ão: A moda será denotada por m,.

3.1 1 Cálculo da Moda

1" Caso - DADOS BRUTOS OU ROL

Basta identificar o elemento de maior frequência.

Exemplos:

1. X:2,8,3,5,4,5,3,5,5,1

O elemento de maior frequência é 5. Portanto, m, 5. É uma sequência unimodal.

Page 76: ESTATISTICA - DJALMA

Medidas de Tendência Central 75

Esta sequência apresenta o elemento 6 e o elemento 10 como ele- - o~ tos de maior frequência. Portanto, mo = 6 e mo = 10. É uma sequência : -odal.

Poderemos encontrar sequências trimodais, tetramodais e assim 'su- --e -,=sivamente. Estas sequências serão chamadas de forma genérica por se- :: 3ncias polimodais.

Observe que todos os elementos da série apresentam a mesma fre- 113ncia.

Nesta situação, não há um elemento que se destaque pela maior --lquência, e diremos que a série é amodal.

P Caso - VARIÁVEL DISCRETA

Este caso é ainda mais simples. Note que na apresentação da variável 1 screta, as frequências já estão computadas na segunda coluna. Basta identi- ' x r o elemento de maior frequência.

Exemplos:

A maior frequência observada na segunda coluna é 8 e corresponde 20 elemento 3 da série. Portanto é, uma série unimodal com mo = 3.

2.

Page 77: ESTATISTICA - DJALMA

76 Estatística 1

A maior frequência observada na segunda coluna é 5 e corresponde aos valores 2 e 4. Portanto, é uma série bimodal com mo = 2 e mo= 4.

Observe que todos os elementos da série possuem a mesma frequên- cia. Portanto, a série é amodal.

Para determinar a moda de uma variável contínua, podemos optar por vários processos. Daremos destaque para a moda de Pearson, a moda de King e a moda de Czuber.

1" Processo: MODA DE PEARSON

Segundo PEARSON, a moda de uma variável contínua pode ser obtida através do valor da média e da mediana:

Classe Int. cl. fj

1 o 1 1 o 1 2 10 1 20 3 3 20 1 30 6 4 30 1 40 2

Page 78: ESTATISTICA - DJALMA

Medidas de Tendência Central 77

Solupão:

Cálculo da média:

Cálculo da mediana:

Classe

1 2 3 4

A mediana corresponde ao sexto elemento da série. o sexto elemento i a série está na terceira classe. Esta é a classe mediana. A mediana vale:

Int. cl.

0 1 10 10 1 20 20 1 30 30 1 40

Classe

1 2 3 4

xi f j 5

45 150 70

fi 1 3 6 2

xi 5

15 25 35

Int. cl.

o 1 10 10 1 20 20 1 30 30 1 40

fi 1 3 6 2

Fi 1 4

1 O 12

Page 79: ESTATISTICA - DJALMA

78 Estatística 1

Conseqüentemente:

Note que a moda está situada na terceira classe que é a classe de maior frequência da série.

A classe de maior frequência será chamada de classe modal.

2" Processo: MODA DE KING

KING levou em consideração, em sua fórmula, a frequência simples da classe anterior e a frequência simples da classe posterior a classe modal.

onde:

Imo - limite inferior da classe modal.

fpost - frequência simples da classe posterior a classe modal.

fant - frequência simples da classe anterior a classe modal.

h - amplitude do intervalo de classe.

Exemplo: Calcule a moda de King para a distribuição:

Solução: A classe modal é a de maior frequência portanto é a terceira classe e a moda vale:

2 mo = 20 + - . I 0 = 24

3 + 2

Classe 1 2 3 4

~ Interpretação: 24 é o valor mais frequente nesta distribuição.

Int. cl. o 1 1 o

10 1 20 20 1 30 30 1 40

f j 1 3 6 2

Page 80: ESTATISTICA - DJALMA

Medidas de Tendência Central 79

3" Processo: MODA DE CZUBER

CZUBER levou em consideração, em sua fórmula a frequência simples da classe anterior, a frequência simples da classe posterior, além da frequên- cia simples da classe modal.

É, portanto, uma fórmula mais completa que a fórmula de King.

onde:

Imo - limite inferior da classe modal.

fmo - frequência simples da classe modal.

fant - frequência simples da classe anterior a classe modal.

fpost - frequência simples da classe posterior a classe modal.

h - amplitude do intervalo de classe.

Exemplo: Calcule a moda de Czuber para a distribuição:

Soluqão: A classe modal é a terceira classe, portanto, a moda vale:

Classe

1 2 3 4

Interpreta~áo: 24,29 é o valor mais frequente nesta distribuição.

COMENTÁRIO: A fórmula de Pearson tem normalmente interesse teó- rico. Se não dispusermos da média e da mediana da distribuição, a fórmula de Pearson é a mais trabalhosa.

A fórmula de King é a mais simples delas, mas não é a mais precisa.

A fórmula de Czuber é mais precisa que a fórmula de King, pois leva também em consideração a frequência da classe modal.

Int. cl.

o 1 10 10 1 20 20 1 30 30 1 40

f j 1 3 6 2

Page 81: ESTATISTICA - DJALMA

80 Estatística 1

Observe que no exemplo utilizado o cálculo da moda pelos três pro- cessos determinou três valores diferentes.

É claro que os três valores obtidos são valores aproximados do verda- deiro valor da moda.

Normalmente o mais confiável é o valor da moda de Czuber.

As fórmulas de King e Czuber podem ser justificadas, de modo seme- lhante, com o histograma da distribuição.

a) Fórmula de King

Identifica-se a classe modal como sendo a de maior altura (frequência) e caracteriza-se a seu limite inferior I e seu limite superior L

mo mo'

Projeta-se a frequência da classe posterior na reta representativa da frequência da classe anterior obtendo-se o ponto A. Em seguida projeta-se a partir do L no sentido vertical, uma distância igual a frequência da classe

mo' anterior obtendo o ponto B.

O segmento de reta unindo os pontos A e B intercepta o eixo horizontal no-ponto P, que identifica-se como sendo a moda da distribuição.

A amplitude do intervalo de classe é h e está dividida em duas partes. Se chamarmos a prime.ira parte de x, então a segunda parte será h - x.

Page 82: ESTATISTICA - DJALMA

Medidas de Tendência Central 81

Assim, observando a figura concluímos que:

Como os triângulos ACP e PDB são semelhantes (A, A, A), os lados 530 proporcionais.

Então,

AC -

X

DB h - x '

Usando propriedade das proporções, podemos afirmar:

de onde conclui-se que:

Lembrando que AC = fpOst e que DB = Gnt, obtém-se

X = fpoçt . h

fant + fpoçt

Substituindo o valor de x na expressão mo = I + x obtém-se: mo

Page 83: ESTATISTICA - DJALMA

82 Estatística 1

Imo M Lmo Int. cl.

Identifica-se a classe modal e caracteriza-se o seu limite inferior I e o seu limite superior L . mo

mn Unindo-se os pontos A e D e os pontos B e C, os segmentos de reta

determinados se interceptam no ponto P.

Em seguida projeta-se verticalmente este ponto no eixo horizontal ob- tendo o ponto M, que identifica-se como sendo a moda da distribuição.

A amplitude do intervalo de classe é h e está dividida em duas partes. Se chamarmos a primeira parte de x, então a segunda parte será h - x.

Estes valores correspondem as alturas dos triângulos ABP e CDP respectivamente. *

Como estes triângulos são semelhantes (A, A, A), os lados e as alturas são proporcionais. Então:

AB - X

CD h - x '

Usando a propriedade das proporções, podemos afirmar:

Page 84: ESTATISTICA - DJALMA

Medidas de Tendência Central 83

1 3 onde se conclui que:

Lembrando que AB = A E - BE = f - fant e que CD = CF - DF = - fp, , obtém-se: mo

I fmo - fant - fant

I x = h = mo . h fmo - fant+ fmo - fpost *fmo - (hn t+ $os>

Como a moda é identificada como sendo o ponto M da figura, pode- rios afirmar que:

Substituindo o valor de x obtido anteriormente nesta expressão, a moda fica escrita:

m = I, fmo - ( fant + fpost)

OBSERVAÇÃO: Se a classe modal for a primeira classe, então fant = O e se a classe modal for a última então fpost = 0.

3.12 Utilização das Medidas de Tendência Central

Na maioria das situações, não necessitamos calcular as três medidas de tendência central.

Normalmente precisamos de apenas uma das medidas para caracteri- zar o centro da série.

Surge, então, a questão: qual medida deve ser utilizada?

Page 85: ESTATISTICA - DJALMA

84 Estatística 1

A medida ideal em cada caso é aquela que melhor representa a maio- ria dos dados da série.

Quando todos os dados de uma série estatística são iguais, a média, a mediana e a moda coincidirão com este valor e, portanto qualquer uma delas representará bem a série. No entanto, este caso dificilmente ocorrerá na prática.

Na maioria das vezes, teremos valores diferenciados para a série e conseqüentemente a medida irá representar bem, apenas os dados da série que se situam próximos a este valor. Os dados muito afastados em relação ao valor da medida não serão bem representados por ela.

Desta forma, se uma série apresenta forte concentração de dados em sua área central, a média, a mediana e a moda ficam também situadas em sua área central representando bem a série como na figura a). Como a mais conhecida é a média, optamos por esta medida de tendência central. Con- cluindo, devemos optar pela média, quando houver forte concentração de dados na área central da série.

Se uma série apresenta forte concentração de dados em seu início, a mediana e a moda estarão posicionadas mais no início da série, repre- sentando bem esta concentração. A média que é fortemente afetada por al- guns valores posicionados no final da série se deslocará para a direita desta concentração não a representando bem.

Como a mais conhecida entre mediana e moda é a mediana, esta será a medida indicada neste caso.

i A mesma situação ocorre se a série apresenta forte concentração de dados em seu final.

Concluindo, devemos optar pela mediana, quando houver forte con- centração de dados no início ou no final da série.

A moda deve ser a opção como medida de tendência central apenas em séries que apresentam um elemento típico, isto é, um valor cuja frequên- cia é muito superior a frequência dos outros elementos da série.

Page 86: ESTATISTICA - DJALMA

Medidas de Tendência Central 85

3.1 3 Exercícios Propostos

. Calcule a moda das séries abaixo:

a) X:2,3,5,4,5,2,5,7

b) Y:4, 12,5, 9, 12,4, 3

c) J: 7, 7, 7, 7, 7

d) Z:4,5,6,6, 6, 7,8,8,8,9, 10, 10, 10, 11

e) t : 2 5, 9, 8, 10, 12. 2. Interprete os valores obtidos na 1 "uestão.

3. Calcule a moda da distribuição:

4. Interprete o valor obtido no problema anterior:

5. Calcule a moda da série:

6. Calcule a moda da distribuição do número de acidentes diários, observados em um cruzam-ento, durante 40 dias:

7. Interprete o valor obtido no problema anterior.

8. Calcule a moda da série representativa da idade de 50 alunos de uma classe de primeiro ano de uma Faculdade:

NQ de acidentes por dia

O 1 2 3 4

Idade (anos) NQ de alunos

20

NQ de dlas

30 5 3 1 1

9. Interprete o valor obtido no problema anterior.

Page 87: ESTATISTICA - DJALMA

86 Estatística 1

10. Calcule a moda de King para a distribuição representativa dos salários de 25 funcionários selecionados em uma empresa.

Classe Salários $ NQde funcionários

1 .ooo,oo 1- 1.200,oo 1.200,OO 1- 1.400,OO 1.400,OO 1- 1.600,OO 1 O

4 1.600,OO 1- 1.800.00 5 5 1.800,OO 1- 2.000,OO 2

11. Calcule a moda de Czuberpara a tabela do problema anterior.

12. Interprete o valor da moda obtida no problema anterior.

13. Calcule a moda de King para a distribuição de valores de 54 notas fiscais emitidas na mesma data, selecionadas em uma loja de departamentos:

14. Calcule a moda de Czuber para a tabela do problema anterior.

Classe

1 2 3 4 5 6

15. Interprete o valor obtido no problema anterior.

16. Calcule a moda de Czuber para a distribuição abaixo que representa a nota de 60 alunos em uma prova de Matemática:

Consumo por nota $

O 1- 50 50 1- 1 O0

100 1- 150 150 1- 200 200 1- 250 250 1- 300

Classe Notas NQ de alunos

4 1- 4 6 1- 20

8 1- 1 O 3

No de notas

10 28 12 2 1 1

17. Interprete a moda de Czuber do problema anterior.

18. A distribuição abaixo representa o número de acidentes de trabalho, por dia, em uma indústria Petroquímica, verificados durante um mês. Calcule a Moda de Czu- ber para a distribuição.

19. Interprete o valor obtido no problema anterior.

Classe

1

NQde acidentes

o I- 2

NQ de dias

20 2 1- 4 4 1- 6

4 1 6, 8

6 3 1

Page 88: ESTATISTICA - DJALMA

Medidas de Tendência Central 87

20. A distribuição abaixo representa as alturas de 70 alunos de uma classe. Calcule a moda de Czuber para esta distribuição:

21. Interprete o valor obtido no problema anterior.

22. A distribuição abaixo representa o consumo, em kg, de um produto colocado em oferta em um supermercado, que limitou o consumo máximo por cliente em 5 kg. Calcule a Moda de King.

N" de clientes

2 1- 4 3 1- 32 5 4 1- 54

NQ de alunos

2 15 18 18 16 1

Classe

1 2 3 4 5 6

23. Calcule a Moda de Czuber para a tabela do problema anterior.

Alturas (cm)

150 1- 160 160 1- 170 170 1- 180 180 1- 190 190 1- 200 200 1- 21 O

24. Interprete o valor obtido no problema anterior.

25. Qual é a medida de tendência central que melhor representa a série do problema 5?

26. Qual é a medida de tendência central que melhor representa a série do problema 6?

27. Qual é a medida de tendência central que melhor representa a série do problema 13?

28. Qual é a medida de tendência central que melhor representa a série do problema 16?

29. Qual é a medida de tendência central que melhor representa a série do problema 10?

'30. Qual é a medida de tendência central que melhor representa a série do problema 20?

RESPOSTAS

1.

a) mo =5

b) mo = 4; mo = 12

C) mo= 7

d) m,=6;m0=8;m0=10

e) Amodal.

Page 89: ESTATISTICA - DJALMA

88 Estatística 1

2. a) O valor rnais frequente da série X é 5. b) Os valores mais frequentes da série Y são: 4 e 12. c) O valor mais frequentes da série W é 7. d) Os valores mais frequentes da série Zsão: 6, 8 e 10.

e) A série não admite um elemento mais repetitivo. 3. mo = 3 4. O valor mais frequente da série é 3. 5. mo =5;mo = 6

6. mo=O 7. O número de acidentes mais frequente neste cruzamento é zero.

8. m0=18

9. A idade mais frequente nesta sala é 18 anos.

10. mo = $ 1.490,91. 11. mo=$ 1.488,89.

12. O salário mais frequente entre os funcionários selecionados é $ 1.488,89. 13. mo = $77,27.

14. mo=$76,47. 15. O consumo, por nota, mais frequente é $76,47. 16. m0=3,30;m0=6,64.

17. As notas mais frequentes nesta prova foram 3,30 e 6,64. 18. mo= 1,18.

19. O número de acidentes mais frequente por dia nesta indústria é 1,18.

20. mo = 180. 21. A altura mais frequente nesta sala é 180 cm. 22. mo = 4.

23. mo = 4,29. 24. O consumo rnais frequente por cliente é 4,29 kg. 25. Média.

26. Moda. 27. Mediana.

28. Média. 29. Média.

30. Média.

Page 90: ESTATISTICA - DJALMA

4/ Medidas Separa trizes

4.1 Conceitos

São números reais que dividem a sequência ordenada de dados em =.artes que contêm a mesma quantidade de elementos da série.

Desta forma, a mediana que divide a sequência ordenada em dois grupos, cada um deles contendo 50% dos valores da sequência, é também Jma medida separatriz.

Além da mediana, as outras medidas separatrizes que destacaremos são: quartis, quintis, decis e percentis.

Se dividirmos a série ordenada em quatro partes, cada uma ficará com 35% de seus elementos.

Os elementos que separam estes grupos são chamados quartis.

Assim, o primeiio quartil, que indicaremos por Q1, separa a sequência ~denada deixando 25% de seus valores a esquerda e 75 % de seus valores a jireita.

O segundo quartil, que indicaremos por Q2, separa a sequência orde- iada, deixando 50% de seus valores a esquerda e 50% de seus valores a direita.

Note que o Q2 é a mediana da série.

O terceiro quartil, que indicaremos por Q3, separa a sequência ordena- da deixando a sua esquerda 75% de seus elementos e 25% de seus elemen- tos a direita.

Se dividirmos a sequência ordenada em cinco partes, cada uma ficará com 20% de seus elementos.

0 s elementos que separam estes grupos são chamados quintis.

Assim, o primeiro quintil, que indicaremos por K1, separa a sequência ordenada, deixando a sua esquerda 20% de seus valores e a sua direita 80% de seus valores.

De modo análogo são definidos os outros quintis.

Page 91: ESTATISTICA - DJALMA

90 Estatística 1

Se dividirmos a sequência ordenada em dez partes, cada uma fic2-E com 10% de seus valores.

Os elementos que separam estes grupos são chamados decis.

Assim, o primeiro decil, que indicaremos por D1 separa a sequênc'r ordenada, deixando a sua esquerda 10% de seus valores e 90% de sec: valores a direita.

De modo análogo são definidos os outros decis.

Se dividirmos a sequência ordenada em 100 partes, cada uma ficar? com 1 % de seus elementos.

Os elementos que separam estes grupos são chamados centis OL

percentis.

Assim, o primeiro percentil, que indicaremos por P1, separa a sequên- cia ordenada deixando a sua esquerda 1% de seus valores e 99% de seus valores a direita.

De modo análogo são definidos os outros percentis.

Note que o Q4, K5, DI.? Plo0 são elementos que deixam a sua esquer- da 100% dos valores da sequencia ordenada e correspondem diretamente ao último valor da sequência.

Se observarmos que os quartis, quintis e decis são múltiplos dos per- centis, então basta estabelecer a fórmula de cálculo de percentis. Todas as outras medidas podem ser identificadas como percentis.

Desta forma:

4.2 Cálculo das Medidas Separatrizes

12 Caso - DADOS BRUTOS OU ROL

Devemos ordenar os elementos, caso sejam Dados Brutos obtendo o Rol.

Page 92: ESTATISTICA - DJALMA

1 Medidas Separatrizes 91

Identificamos a medida que queremos obter com o percentil correspon- :ente, Pi.

Calculamos i % de n, ou seja, para localizar a posição do percentil i ?o Rol.

Em seguida, identificamos o elemento que ocupa esta posição.

Note que se for um número inteiro, então Pi que estamos procuran- 3'0 identificar é um dos elementos da sequência ordenada.

Se não for um número inteiro, isto significa que o Pi é um elemento 100

itermediário entre os elementos que ocupam as posições aproximadas por 'alta e por excesso do valor S. Neste caso, o Pi é definido como sendo a nédia dos valores que ocupam estas posições aproximadas.

Exemplo 1. Calcule o Q1 da sequência X: 2, 5, 8, 5, 5, 10, 1, 12, 12, 11, 13, 15.

Solução: Ordenando a seqüência, obtemos o Rol:

X 1,2, 5, 5,5, 8, 10, 11, 12, 12, 13, 15.

Identificamos Q1 = P25. Calculamos 25% de 12 que é o número de elementos da série obten-

do:

Este valor indica a posição do P25 no Rol, isto é, o P25 é O terceiro elemento do Rol. Observando o terceiro elemento do Rol obtém-se 5.

Portanto, Q1 = PZ5 = 5.

Interpretação: 25% dos valores desta sequência são valores menores ou iguais a 5 e 75 % dos valores desta sequência são valores maiores ou iguais a 5.

Exemplo 2. Calcule o KJ da sequência X: 2; 8; 7,5; 6; 10; 12; 2; 9.

Solução: Ordenando a seqüência. obtemos: X: 2; 2; 6; 7,5; 8; 9; 10; 12.

Identificamos K3 = PC0. Calculamos 60% de 8, que é o número de elementos da série, obten-

do:

Este valor não-inteiro indica que o P60 é um valor situado entre o quarto e o quinto elemento da sequência.

Page 93: ESTATISTICA - DJALMA

92 Estatistica 1

Observando diretamente no Rol, os elementos que ocupam a quarta e a quinta posição obtemos 7,5 e 8. Portanto,

Interpretação: 60% dos valores da sequência são valores menores ou iguais a 7,75 e 40% dos valores da sequência são valores maiores ou iguais a 7,75.

Note que se o número de elementos da sequência for menor que 100? alguns percentis podem coincidir em valores tornando estas interpretações não totalmente verdadeiras.

2Waso - VARIÁVEL DISCRETA

Se os dados estão apresentados na forma de uma variável discreta, eles já estão naturalmente ordenados.

Identifica-se a medida que queremos obter com o percentil correspon- dente: P,

I

i x n Calcula-se i% de n ou seja, -

1 O0 para localizar a posição do percentil i

na série.

Em seguida utilizamos a frequência acumulada da série para localizar o elemento que ocupa esta posição.

O valor deste elemento é o Pi.

Exemplo I. Calcule o D4 para a série:

Solução: O número de elementos da série é Z fi = 24

Identificamos D4 = P40 e calculamos 40% de 24, ou seja,

Page 94: ESTATISTICA - DJALMA

Medidas Separatrizes 93

I Esta posição não-inteira significa que o P40 é um valor compreendido i-tre o nono e o décimo elemento da série. I

Construindo a frequência acumulada:

zbservamos que o nono elemento é 5, e o décimo elemento também é 5.

5 + 5 Assim, D4 = P40 = - = 5.

2

Interpretação: 40% dos valores desta série são valores menores ou guais a 5 e 60% dos valores desta série são valores maiores ou iguais a 5.

3" Caso - VARIÁVEL CONT~NUA

Se os dados estão apresentados na forma de uma variável contínua, eles já estão naturalmente ordenados e o número de elementos da série é n = E$.

Para se obter uma fórmula geral para o cálculo dos percentis, vamos generalizar a fórmula da mediana:

Identificando md = P50, podemos obter uma fórmula particular para o

'50-

Note que a classe que contém a mediana é a mesma classe que contém o P50.

Portanto, identificamos o limite inferior da classe que contém a Media- na (I ) com o limite inferior da classe que contém o PS0 (I5&.

md

Page 95: ESTATISTICA - DJALMA

94 Estatística 1

n 50 x n O termo - pode ser representado na linguagem do PS0 como -

2 100 '

A frequência simples da classe mediana (f ) é a mesma frequênc 2

simples da classe que contém o P50 (f50). md

A frequência acumulada da classe anterior a classe mediana (F,,,) é F frequência acumulada da classe anterior a classe que contém o PS0. ES'F termo não se modifica, assim como h, que é a amplitude do intervalo c: classe.

Assim, a fórmula da mediana, adaptada para a linguagem do P50 podc ser escrita:

Substituindo-se 50 pelo índice i, generalizamos a fórmula para o cálcu- lo de qualquer percentil:

onde:

Pi - Percentil i ( i= 1 , 2, 3, ... ,99).

li - limite inferior da classe que contém o percentil i.

n - número de elementos da série.

Fant - frequência acumulada da classe anterior a classe que contém o Pi.

f i - frequência simples da classe que contém o percentil i.

h - amplitude do intervalo de classe.

Exemplo: Calcule o Q3 da série:

fi 16 18 24 35 12

Classe 1 2 3 4 5

Int. cl.

0 1- 10 10 1- 20 20 1- 30 30 I--- 40 40 1- 50

Page 96: ESTATISTICA - DJALMA

Medidas Separatrizes 95

O número de elementos da série é dado por C fi= 105. Identificamos

i x n -

Iniciamos o cálculo do valor P75 lembrando que neste caso i = 75 e x e :

i x n 75x105 - - - 1 O0 1 O0

= 78,75.

Isto nos dá a posição do P75 na série.

Construindo a frequência acumulada da série obtemos:

A classe que contém o elemento que ocupa a posição 78,75 na série é 3 quarta classe. Esta é a classe que contém o P75.

Substituindo os valores indicados na fórmula, obtém-se:

Classe

1 2 3 4 5

Portanto Q3 = P75 = 35,93

Interpretação: 75% dos valores da série são menores ou iguais a 35,93 e 25% dos valores da série são maiores ou iguais a 35,93.

4.3 Exercícios Propostos

Fi 16 34 58 93

105

Int. cl.

O I- 10 10 1- 20 20 I- 30 30 I- 40 40 1- 50

I. Em uma série ordenada, qual é o percentual de elementos que ficam a esquerda de cada uma das medianas separatrizes:

a) 0, b) Q, c) K, d) D2 e) K3

) os S) K4 h) Q2 0 D8 P70

fi 16 18 24 35 12

Page 97: ESTATISTICA - DJALMA

96 Estatistica 1 1 2. Em uma série ordenada, qual é o percentual de elementos que ficam a direita

cada uma das medidas separatrizes:

a) D4 b, ' 80 c) Q3 d) K2

e) p20 f) D5 g) Q1 h) p2 3. Qual é o percentual de elementos de uma série ordenada que se situam entre:

a) Ql eQ3

b, P10eP90

C) D2 e D6

d' Q1eK3

e) D3e K4

0 K2eDg

9) K3 e Q3

4. Se uma série ordenada possui 180 elementos, dê o número aproximado de ele mentos que se situam:

a) Acima do PZo

b) abaixo do K3

c) acima do Q3

d) abaixo do Pgo

e) entre o Pl o e o PBO

f ) entreoQ1eQ3

g) entre o Q3 e PBo

h) entre o PgO e Pg2

5. Dada a série X: 3, 15, 6, 9, 10, 4, 12, 15, 17, 20, 29, calcule:

a) Q1 b, K2 c) O4 4 Q3 e) ' 9 0

6. A distribuição de frequência abaixo representa idade de 50 alunos de uma classe de primeiro ano de uma Faculdade.

Idade (anos) Ng de alunos

20 21

Calcule:

a) Ql b) K3

Page 98: ESTATISTICA - DJALMA

Medidas Separatrizes 97

7. A distribuição de frequência abaixo representa o consumo por nota de 54 notas fiscais emitidas durante um dia em uma loja de departamentos.

Calcule:

Classe

1 2 3 4 5

' 6

a) Q, 6) K, c) 0 3

d) Q3 e) D7 0 "98

8. Interprete os valores obtidos no problema anterior.

9. Tomando como amostra a tabela do problema ne 7, o gerente desta loja de departamentos decidiu premiar a nível promocional com um brinde, 10% dos fregueses que mais consumirem, nos próximos 30 dias. A partir de qual valor de consumo da nota fiscal os clientes seriam premiados?

Consumo por nota US$

O I- 50 50 1- 1 O0

1 O0 1- 150 150 1- 200 200 1- 250 250 1- 300

10. Uma empresa estabelece o salário de seus vendedores com base na produtivida- de. Desta forma, 10% é fixo e 90% são comissões sobre venda. Uma amostra de salários mensais nesta empresa revelou o quadro abaixo. Se a empresa decidir; a nível de incentivo, fornecer uma cesta básica para 5% dos vendedores que pior desempenho tiveram durante o próximo mês com base nesta amostra, qual será o maior salário que receberá esta cesta básica?

No de notas

1 O 28 12 2 1 1

1 I. A tabela abaixo representa a venda de livros didáticos em uma editora na primeira semana de março.

No de vendedores

8 28 54 32 12

6

Classe

1 2 3 4 5 6

Determine:

a) Q1 b) Q3 C) "90 4 P1O

12. Interprete os valores obtidos no problema anterior.

Salários US$

70 1- 120 120 1- 170 170 1- 220 220 1- 270 270 1- 320 320 1- 370

NQde livros comercializados

4.000 13.500 25.600 43.240 26.800

1.750

Classe

1 2 3 4 5 6

Preço unitário US$

O 1- 1 O 10 1- 20 20 1- 30 30 1- 40 40 1- 50 50 1- 60

Page 99: ESTATISTICA - DJALMA

98 Estatística 1

13. A tabela abaixo representa o número de faltas anuais dos funcionários de u r r empresa.

Determine:

a) D3 b) K3 C) ' 90

d) Q3 e) Q1 PIO 14. Interprete os valores obtidos no problema anterior.

NQ de faltas

o 1 2 3 4 5 6 7 8

15. Uma amostra do tempo de vida útil de uma peça forneceu a seguinte distribuição:

NQ de empregados

20 42 53

125 84 40 14 3 2

Se o produtor deseja estabelecer uma garantia mínima para o múmero de horas de vida útil de uma peça, trocando a peça que não apresentar este número mínimo de horas, qual é a garantia, se ele está disposto a trocar 8% das peças?

NQ de horas (vida útil)

O I- 1 O0 1 O0 1- 200 200 1- 300 300 1- 400 400 1- 500 500 1- 600

RESPOSTAS

NQ de peças

6 42 86

127 64 8

a) 10% b) 25% c) 20% d) 20% e) 60%

f) 75% g) 80% h) 50% i) 80% j) 70%

a) 60% b) 20% c) 25% d) 60%

e) 80% f ) 50% g) 75% h) 98%

a) 50% b) 80% c) 40% d) 35%

e) 50% f) 40% g) 15%

a) 144 b) 108 c) 45 d) 162

e) 126 f ) 90 9) 9 h) 4

a) 5 b) 9,5 C) 9,5 d) 16 e) 18,5 a) 18 b) 19 c) 18 d) 19 e) 21

a) 56,25 b) 70,71 c) 61,07

d) 1 1442 e) 99,64 f ) 246

a) 25% das notas indicavam consumo menor ou igual a US$56,25 e 75% indicavam consumo maior ou igual a US$56,25.

Page 100: ESTATISTICA - DJALMA

7

i Medidas Separatrizes 99

j 3 b) 40% das notas indicavam consumo menor ou igual a US$70,71 e 60% indicavam consumo maior

ou igual a US$70,71. c c) 30% das notas indicavam consumo menor ou igual a US$61,07 e 70% indicavam consumo maior

ou igual a US$61,07.

d) 75% das notas indicavam consumo menor ou igual a US$ 110,42 e 25% indicavam consumo maior ou igual a US$ 1 10,42.

e) 70% das notas indicavam consumo menor ou igual a US$99,64 e 30% indicavam consumo maior ou igual a US$99,64.

f ) 98% das notas indicavam consumo menor ou igual a US$246,00 e 2% indicavam consumo maior ou igual a US$246,00.

. US$ 144,17. .O. US$113,75. * I . a)US$24,38 b)US$39,96

c) US$46,37 d) US$15,55 72. a) 25% dos livros vendidos tinham preço unitário menor ou igual a US$ 24,38 e 75% dos livros

vendidos tinha preço unitário maior ou igual a US$24,38.

b) 75% dos livros vendidos tinham preço unitário menor ou igual a US$ 39,96 e 25% dos livros vendidos tinham preço unitário maior ou igual a US$39,96.

c) 90% dos livros vendidos tinham preço unitário menor ou igual a US$ 46,37 e 10% dos livros vendidos tinham preço unitário maior ou igual a US$46,37.

d) 10% dos livros vendidos tinham preço unitário menor ou igual a US$ 15,55 e 90% dos livros vendidos tinham preço unitário maior ou igual a US$ 15,55.

13. a) 2 b) 3 c) 5

d) 4 e) 2 0 7 14. a) 30% dos empregados tiveram um número de faltas anuais menor ou igual a 2 e 70% dos

empregados tiveram um número de faltas anuais maior ou igual a 2.

b) 60% dos empregados tiveram um número de faltas anuais menor ou igual a 3 e 40% dos empregados tiveram um número de faltas anuais maior ou igual a 3.

I c) 90% dos empregados tiveram um número de faltas anuais menor ou igual a 5 e 10% dos empregados tiveram um número de faltas anuais maior ou igual a 5.

d) 75% dos empregados tiveram um número de faltas anuais menor ou igual a 4 e 25% dos empregados tiveram um número de faltas anuais maior ou igual a 4.

e) 25% dos empregados tiveram um número de faltas anuais menor ou igual a 2 e 75% dos empregados tiveram um número de faltas anuais maiores ou iguais a 2.

f ) 10% dos empregados tiveram um número de faltas anuais menor ou igual a 1 e 90% dos empregados tiveram um número de faltas anuais maior ou igual a I .

15. 149.14 horas.

Page 101: ESTATISTICA - DJALMA

5/ Medidas de Dispersão

5.1 Introdução

Uma breve reflexão sobre as medidas de tendência central permite nos concluir que elas não são 'suficientes para caracterizar totalmente u r r ~ sequência numérica.

Se observarmos as sequências:

concluiremos que todas possuem a mesma média 13. No entanto, são sequências completamente distintas do ponto de vistz

da variabilidade de dados.

Na sequência Znão h á variabilidade de dados.

A média 13 representa bem qualquer valor da série.

Na sequência Y, a média 13 representa bem a série, mas existem elementos da série levemente diferenciados da média 13.

Na sequência X existem muitos elementos bastante diferenciados da média 13.

Concluímos que a média 13 representa otimamente a sequência Z, representa bem a sequência Y, mas não representa bem a sequência X.

O nosso objetivo é construir medidas que avaliem a representatividade da média. Para isto usaremos as medidas de dispersão.

Observe que na sequência Z os dados estão totalmente concentrados sobre a média 13.

Não h á dispersão de dados. Na sequência Y h á forte concentração dos dados sobre a média 13, mas h á fraca dispersão de dados. Já na série X h á fraca concentração de dados em torno da média 13 e forte dispersão de dados em relação a média 13.

Page 102: ESTATISTICA - DJALMA

Medidas de Dispersão 101

f .2 Medidas de Dispersão Absoluta

-As principais medidas de dispersão absolutas são: amplitude total, : :wio médio simples, variância e desvio padrão.

5.3 Amplitude Total

É a diferença entre o maior e o menor valor da sequência.

3.4 Cálculo da Amplitude Total

'- Caso - DADOS BRUTOS OU ROL

Basta identificar o maior e o menor valor da sequência e efetuar a iferença entre estes valores.

Exemplo: Determine a amplitude total da sequência X: 11, 12, 9, 10, :O, 15.

Solução: O maior valor desta sequência é 15 e o menor valor é 9. =ortanto, a amplitude total da sequência é A, = 15 - 9 = 6 unidades.

2" Caso - VARIÁVEL DISCRETA

Como os valores já se apresentam ordenados, a amplitude total é a diferença entre o último e o primeiro elemento da série.

Exemplo: Determine a amplitude total da série.

1 Solução: O maior valor da série é 7 e o menor valor da série é 2. Portanto, a amplitude total da série é A, = 7 - 2 = 5 unidades.

Page 103: ESTATISTICA - DJALMA

r

102 Estatística 1

Nesta situação, por desconhecer o maior e o menor valor da r i ~ devemos fazer um cálculo aproximado da amplitude total da série.

Consideraremos como maior valor da série o ponto médio da i classe e como menor valor da série o ponto médio da primeira class amplitude total é a diferença entre estes valores.

I

I Exemplo: Determine a amplitude total da série:

Solução: O ponto médio da última classe é 11 e o ponto médio rr primeira classe é 3. Portanto, At = 11 - 3 = 8 unidades.

COMENTÁRIO: Apesar da facilidade de obtenção da amplitude tots esta medida apresenta a inconveniência de depender apenas de dois valor~s da série. É possível modificar completamente a dispersão ou a concentra@: dos elementos em torno da média, sem alterar a amplitude total da série. f uma medida que tem pouca sensibilidade estatística.

Classe

1 2 3 4 5

5.5 Exercícios Propostos

1. Calcule a amplitude total da série:

X: 2, 8, 10, 15, 20; 22, 30.

2. Calcule a amplitude total da série:

V: 12,9, 15, 40,22, 34, 8.

3. Calcule a amplitude total da série:

Int. cl.

2 1- 4 4 1- 6 6 1- 8 8 1- 1 O

10 1- 12

fi 5

10 20 7 2

Page 104: ESTATISTICA - DJALMA

Medidas de Dispersão 103

- Zalcule a amplitude total da série:

Classe SalBrlos US$ NP de vendedores

1 70 1- 120 8 2 120 1- 170 28 3 170 1- 220 54 4 220 1- 270 32 5 270 I- 320 12 6 320 1- 370 6

- Considerando as série X e Y da 1" e 2Questões, qual delas apresenta maior dispersão absoluta?

I A, = 28 unidades.

i A, = 32 unidades.

I A, = 17 unidades.

I A, = US$250.

A série Y, pois A, da série Y é maior que A, da série X.

5.6 Desvio Médio Simples

O conceito estatístico de desvio corresponde ao conceito matemático de distância.

A dispersão dos dados em relação a média de uma sequência pode ser avaliada através dos desvios de cada elemento da sequência em relação a nédia da sequência.

O desvio médio simples que indicaremos por DMS é definido como sendo uma média aritmética dos desvios de cada elemento da série para a média da série.

5.7 Cálculo do Desvio Médio Simples

1" Caso - DADOS BRUTOS OU ROL

Calculamos inicialmente a média da sequência. Em seguida identifica- mos a distância de cada elemento da sequência para sua média. Finalmente, calculamos a média destas distâncias.

Page 105: ESTATISTICA - DJALMA

104 Estatística 1

Se a sequência for representada por X x,, x2, ..., x,, então o DMS admite como fórmula de cálculo:

Exemplo: Calcule o DMS para a sequência:

X 2, 8, 5, 6.

Solução: Determinamos inicialmente a média da série:

em seguida determinamos as distâncias de cada elemento da série para c. média da série:

O DMS é a média aritmética simples destes valores.

3,25 + 2,75 + 0,25 + 0,75 7 DMS = - -

4 - 4 = 1,75

Interpretação: Em média, cada elemento da sequência está afastado do valor 5,25 por 1,75 unidades.

2? Caso - VARIÁVEL DISCRETA

No caso da apresentação de uma variável discreta, lembramos que a frequência simples de cada elemento representa o número de vezes que este valor figura na série. Conseqüentemente, haverá repetições de distâncias iguais de cada elemento distinto da série para a média da série. Assim, a média indicada para estas distâncias é uma média aritmética ponderada.

Page 106: ESTATISTICA - DJALMA

Medidas de Dispersão 105

A fórmula para o cálculo do DMS é:

xixi - x i fi DMS =

Exemplo: Determine o DMS para a série:

Solu$ío: O número de elementos da série é n = C f i = 10.

A média da série é:

Usaremos a disposição da tabela, acrescentando novas colunas para 3 resolução dos cálculos.

A média da série é:

O DMS é dado por:

C lx: - Xl f: DMS =

I I

C f j

Page 107: ESTATISTICA - DJALMA

106 Estatística 1

Incluiremos outra coluna para efetuar estes cálculos:

O desvio médio simples é:

XIx i -XI f i . 8 DMS = - - -

10 = 0,8 unidades.

C f i Interpretação: Em média, cada elemento da série está afastado c:

valor 3 por 0,8 unidade.

3" Caso - VARIÁVEL CONT~NUA

Nesta situação, por desconhecer os valores individuais dos elementos componentes da série, substituiremos estes valores X , pelos pontos médios de classe.

Desta forma, o desvio médio simples tem por cálculo a fórmula:

Xixi - X I fj DMS =

onde Xj é o ponto médio da classe i.

Exemplo: Determine o DMS para a série.

Classe

1 2 3 4

Int. cl.

2 1- 4 4 1- 6 6 1- 8 8 1- 10

fi 5

1 O 4 1

Page 108: ESTATISTICA - DJALMA

Medidas de Dispersão 107

Soluçáo: O número de elementos da série é n = C t;. = 20.

Usaremos a disposição da tabela acrescentando as colunas necessá- -3s para a resolução dos cálculos.

Inicialmente acrescentamos a coluna dos pontos médios das classes:

ç xi 4 Em seguida, calculamos a média da série: X = -

C f;.

c fi= 20 C xit;.= 102

Classe Int. cl. fi

1 2 I- 4 5 2 4 1- 6 10 3 6 1- 8 4 4 8 1- 10 1

xi 3 5 7 9

I A média da série é:

Classe Int. cl. fi xi xjfi lxi -Xl f j

1 2 I- 4 5 3 15 10,50 2 4 1- 6 10 5 50 1 ,O0 3 6 I- 8 4 7 28 7,60 4 8 I- 10 1 9 9 3,90

Classe

1 2 3 4

ç lxi - x i fi O DMS = - - - 23 = 1,15 unidades.

C fi 20

fi 5

1 O 4 1

Int. cl.

2 1- 4 4 I- 6 6 1- 8 8 1- 10

xi 3 5 7 9

xifi 15 50 28 9

Page 109: ESTATISTICA - DJALMA

108 Estatística 1

Interpretagão: Em média, cada elemento da série está afastado de 5.- por 1,15 unidades.

COMENTÁRIO: O desvio médio simples depende de cada componer- te da série. Se mudarmos .o valor de um único elemento da série, mudamcr também o DMS. Portanto, o desvio médio simples tem perfeita sensibilidad~ estatística. A maior dificuldade desta medida é envolver módulos, cujas prc- priedades, em geral não são suficientemente conhecidas pelos estagiárics que normalmente desenvolvem estes cálculos.

5.8 Exercícios Propostos

1. Calcule o DMS da série:

X: 3, 8, 12, 3, 9, 7.

2. Interprete o valor obtido na 1 Wuestão.

3. Calcule o DMS da série:

Y: 2; 2,5; 3,5; 7; 10; 14,5; 20.

4. Interprete o valor obtido na 3" Questão.

5. Calcule o DMS da série:

6. Interprete o valor obtido na 5Wuestão.

7, Calcule o DMS da série:

8. Interprete o valor obtido na 7Wuestão.

9. Responda, justificando: Qual das série X e Y da 1% e3" questões possui maior dispersão absoluta?

10. Qual das variáveis da 5% 7" questões possui maior dispersão absoluta?

N V e vendedores

8 28 54 32 12 6

Classe

1 2 3 4 5 6

Salários US$

70 1- 120 120 1- 170 170 1- 220 220 1- 270 270 1- 320 320 1- 370

Page 110: ESTATISTICA - DJALMA

Medidas de Dispersão 109

RESPOSTAS

- DMS = 2,67.

. Os valores da série estão afastados de 7, em média, por 2, 67 unidades.

i. DMS = 5,43.

. Os valores da série estão afastados de 8,5, em média, por 5,43 unidades.

. DMS = 1,13.

. Em média, os valores da série estão afastados de 5 por 1.13 unidades.

.. DMS = US5 45,20.

. Em média, os salários dos vendedores estão afastados de US$205,71 por US$45,20.

. A série Y, pois o DMS da série Y é maior que o DMS da série X.

'O. A variável contínua, pois o DMS da variável contínua 6 maior que o DMS da variável discreta.

5.9 Variância e Desvio Padrão

Introdução: Observamos no item anterior que a dificuldade em se operar com o DMS se deve a presença do módulo, para que as diferenças xi - 2 possam ser interpretadas como distâncias.

Outra forma de se conseguir que as diferenças xi - 2 se tornem sem- pre positivas ou nulas é considerar o quadrado destas diferenças, isto é: (x, - x ) ~ .

Se substituirmos, nas fórmulas do DMS a expressão Ix, - 21 por (x, - x)', obteremos nova medida de dispersão chamada variância.

Portanto, variância é uma média aritmética calculada a partir dos qua- drados dos desvios obtidos entre os elementos da série e a sua média.

O desvio padrão é a raiz quadrada positiva da variância.

Em particular, para estas medidas levaremos em consideração o fato de a sequência de dados representar toda uma população ou apenas uma amostra de uma população.

No final desta secção justificaremos esta necessidade.

Notações: Quando a sequência de dados representa uma Popula- ção a variância será denotada por 02(x) e o desvio padrão correspondente por W ) .

Quando a sequência de dados representa uma amostra, a variância será denotada por z(x) e o desvio padrão correspondente por s(x).

Page 111: ESTATISTICA - DJALMA

110 Estatística 1

5.1 0 Calculo da Variância e Desvio Padrão

1Waso - DADOS BRUTOS OU ROL

a) Se a sequência representa uma População, a variância é calcu'z- da pela fórmula:

Exemplo: Calcule a variância e o desvio padrão da sequência: X: 4, 5. 8, 5.

A sequência contém n = 4 elementos e tem por média:

0 s quadrados das diferenças (xi - x ) ~ valem:

Somando-se estes valores obtem-se: Z (x, - x ) ~ = 9.

Substituindo esses valores na fórmula da variância, teremos:

2 z ( x , - ~ ) ~ g o (x) = - - - 4

= 2,25. n

Como o desvio padrão é a raiz quadrada positiva da variância,

G(X) = d z = i/Zi5 = 1,5 unidades.

b) Se a sequência anterior representasse apenas uma amostra, a variância seria denotada por s2(x) e o desvio padrão por s(x).

Page 112: ESTATISTICA - DJALMA

Medidas de Dispersão 111

Neste caso,

Note que a Única diferença entre a fórmula de 02(x) (indicado para Populações) e z (x ) (indicado para amostras) é o denominador.

Assim,

Z ( X , - X ) ~ g ?(x) = - - - = 3 e o desvio padrão s(x) = 6 = 1,73.

n- 1 3

2" Caso - VARIÁVEL DISCRETA

Como há repetições de elementos na série, definimos a variância como sendo uma média aritmética ponderada dos quadrados dos desvios dos elementos da série para a média da série.

a) Se a variável discreta é representativa de uma População, então a variância é dada por:

e o desvio padrão é:

Page 113: ESTATISTICA - DJALMA

11 2 Estatística 1

b) Se a variável discreta é representativa de uma amostra, então = variância é:

e o desvio padrão é:

Exemplo 1: Calcule a variância da série abaixo, representativa de uma população.

Solução: O número de elemento da série é n = C fi= 20.

z xi 5 A média desta série é 2 = - z 4

- C X i $ - A média da série é X = - - - 73 - - 3,65 c f j 20

Page 114: ESTATISTICA - DJALMA

Medidas de Dispersão 11 3

Como estamos trabalhando com uma População a variância é dada 3or:

2 (xi- fi o (x) = 2 fi

Desenvolvendo nova coluna para estes cálculos, obtém-se:

A variância é:

e o desvio padrão correspondente é o(* = = 0,963. Exemplo 2: Se a variável discreta fosse representativa de uma amos-

tra, a variância seria indicada por $(x) e seria calculada por:

O desvio padrão seria calculado por s(x) = 110,9763= 0,988.

Novamente, por desconhecer os particulares valores xi da série, subs- tituiremos nas fórmulas anteriores estes valores pelos pontos médios de classe.

A fórmula da variância para uma variável contínua representativa de uma população é: 71 o (x) =

2 fi

onde xi é o ponto médio da classe i.

Page 115: ESTATISTICA - DJALMA

114 Estatística 1

Se a variável contínua representa uma amostra então a variâncici - deriotada por s2(x) e sua fórmula de cálculo é:

Exemplo I: Calcule a variância e o desvio padrão para a série reprF sentativa de uma População:

Solugão: O número de elementos da série é n = C f i = 10.

Classe

1 2 3 4

C xi 5 A média da série é 2 = - onde xi são os pontos médios de

classe. C fi

Int. cl.

o 1- 4 4 1- 8 8 1- 12

12 1- 16

A média da série é:

fi 1 3 5 1

Classe

1 2 3 4

Como a variável contínua é representativa de uma população, então a variância é dada por:

2 x (xi - x)* fi o (x) =

C fi

Int. cl.

o 1- 4 4 1- 8 8 I- 12

12 1- 16

fi 1 3 5 1

xi 2 6

1 O 14

xifi 2

18 50 14

Page 116: ESTATISTICA - DJALMA

r-

Medidas de Dispersão 11 5

A variância é, portanto:

Classe

1 2 3 4

2 z ( x i - x ) * f j 102,4 o (x) = - 10

- 10,24 C fi

e o desvio padrão é: o(x) = = 3,2.

Int. cl. O I- 4 4 I- 8 8 1- 12

12 1- 16

Exemplo 2: Se a variável contínua fosse representativa de uma amos- tra, a variância seria indicada por 2 ( x ) e sua fórmula de cálculo seria:

- 11,38 e o desvio padrão seria Desta forma, Z(X) = - - s(x) = m= 3,373.

9

fi 1 3 5 1

1. No cálculo da variância, quando elevamos ao quadrado a diferen- ça (xi- i), a unidade de medida da série fica também elevada ao quadrado.

Portanto, a variância é dada sempre no quadrado da unidade de medi- da da série.

Se os dados são expressos em metros, a variância é expressa em metros quadrados.

Em algumas situações, a unidade de medida da variância nem faz sentido.

É o caso, por exemplo, em que os dados são expressos em litros. A variância será expressa em litros quadrados.

xi 2 6 1 O 14

Portanto, o valor da variância não pode ser comparado diretamente com os dados da série, ou seja: variância não tem interpretação.

2. Exatamente para suprir esta deficiência da variância é que se define o desvio padrão.

xifi 2

18 50 14

(x , -E)* fi 40,96 17,28 12,80 31.36

Page 117: ESTATISTICA - DJALMA

11 6 Estatística 1

Como o desvio padrão é a raiz quadrada da variância, o desvio padr2: terá sempre a mesma unidade de medida da série e portanto admite interprc- tação.

5.11 Interpretação do Desvio Padrão

O desvio padrão é, sem duvida, a mais importante das medidas d f dispersão.

É fundamental que o interessado consiga relacionar o valor obtido dr desvio padrão com os dados da série.

Quando uma curva de frequência representativa da série é perfeita- mente simétrica como a curva abaixo, podemos afirmar que o intervalc p- o, ?+ o] contém aproximadamente 68% dos valores da série.

O intervalo p- 20, %+ 201 contém aproximadamente 95% dos valores da série.

Page 118: ESTATISTICA - DJALMA

Medidas de Dispersão 11 7

O intervalo E- 30, X+ 301 contém aproximadamente 99% dos valores ?a série.

Estes percentuais 68%, 95% e 99% que citamos na interpretação po- derão mais tarde ser comprovados, com maior precisão, no estudo da distri- Suição normal de probabilidades.

Para uma compreensão inicial do desvio padrão, estas noções são suficientes.

Quando a distribuição não é perfeitamente simétrica estes percentuais apresentam pequenas variações para mais ou para menos, segundo o caso.

De modo que, quando se afirma que uma série apresenta média x = 100 e desvio padrão o(x) = 5, podemos interpretar estes valores da seguinte forma:

1. Os valores da série estão concentrados em torno de 100.

2. O intervalo [95, 1051 contém aproximadamente, 68% dos valores da série.

O intervalo [90, 1101 contém aproximadamente 95% dos valores da série.

O intervalo [85, 1151 contém aproximadamente 99% dos valores da série.

É importante que se tenha percebido que, ao aumentar o tamanho do intervalo, aumenta-se o percentual de elementos contido no intervalo.

Adiante verificaremos que é possível controlar o tamanho do intervalo de modo que contenha exatamente o percentual que queremos.

3. As medidas de dispersão vistas até agora são medidas absolutas e portanto avaliam a dispersão absoluta da série. Todas elas são diretamente proporcionais a dispersão absoluta.

Page 119: ESTATISTICA - DJALMA

F-

11 8 Estatística 1

Assim, se a série Xapresenta x = 20 e o(x) = 3 e se a série Y apreser- 1 ta y= 22 e o(y) = 2, podemos afirmar, comparando os desvios padrão, que ? ,: série Xapresenta maior dispersão absoluta. I:

1:

4. Para justificar que o denominador da variância amostra1 d e v ~ ser n - 1 e não n, usaremos o seguinte argumento:

O modelo matemático que calcula a variância de uma amostra nãc pode ser

2 z (xi- x)*

o (x) = n '

pois caso isto fosse verdadeiro, este modelo deveria determinar a variância para qualquer tamanho de amostra.

Suponha uma amostra constituída de um único elemento X,.

O valor médio da amostra também é xl.

Calculando a variância pelo modelo acima, teremos:

2 C (xi - X J ~ o (x) = 1

= o.

Seríarnos induzidos a afirmar que a dispersão da população de onde provém a amostra é zero, isto é, a população é constituída em sua totalidade por elementos idênticos. O que é, em geral, uma afirmação falsa.

I

t Para corrigir o modelo matemático, basta colocar no denominador n - 1 . O modelo é escrito então:

Observe que agora o modelo é coerente. Mesmo quando a amostra

I tiver apenas um elemento xl, o cálculo de s2(x) leva-nos a uma indetermina- çáo do tipo i. O que significa que a variância existe, mas não está determina- da.

Significa também que amostras de apenas um elemento não nos for- nece informações sobre a variância da série.

5.1 2 Exercícios Propostos

1. Calcule a variância e o desvio padrão da População:

X:2, 3, 7, 9, 11, 13.

Page 120: ESTATISTICA - DJALMA

Medidas de Dispersão 1 19

2. Calcule a variância e o desvio padrão da População:

Y: 5, 12, 4, 20, 13, 17.

3. Calcule a variância e o desvio padrão da amostra:

Z: 15, 16, 17, 20, 21.

4. Calcule a variância e o desvio padrão da amostra:

T:6, 5, 10, 12, 19.

5. Calcule a variância e o desvio padrão da população:

Idade (anos) No de alunos

20 2 1

6. Calcule a variância e o desvio padrão para o número de acidentes diários, obser- vados em um cruzamento, durante 40 dias. (Amostra.)

NQ de acidentes N V e por dia dias

3 1 4 1

7. Calcule a variância e o desvio padrão para a distribuição de valores de 54 notas fiscais emitidas na mesma data, selecionadas em uma loja de departamentos. (Amostra.)

8. Calcule a variância e o desvio padrão para as alturas de 70 alunos de uma classe (Amostra.)

NQ de notas

1 O 28 12 2 1 1

Classe

1 2 3 4 5 6

9. Interprete os valores obtidos na Questão 6.

10. Interprete os valores obtidos na Questão 7.

Consumo por nota US$

O I- 50 50 1- 1 O0

100 1- 150 150 1- 200 200 1- 250 250 1- 300

Classe

1 2 3 4 5 6

Alturas (cm)

150 1- 160 160 1- 170 170 1- 180 180 1- 190 190 1- 200 200 1- 21 O

NQ de alunos

2 15 18 18 16 1

Page 121: ESTATISTICA - DJALMA

120 Estatística 1

1 I . Interprete os valores obtidos na Questão 8.

12. Uma série estatística X simétrica apresenta: k = 1 0, d(x) = 4 e o(x) = 2.

Interprete estes valores.

13. Uma série estatística Y simétrica apresenta: y = 20, = 6,25 e o(y) = 2,5.

Interprete estes valores.

RESPOSTAS

d(x) = 1592 3 e o(x) = 3,99 u d(y) = 33,81 2 e o ~ ) = 5,sl u ?(z) = 6,70 4 e s(z) = 2,59 u

s2(0 = 31,30 3 e $0 = 5,59 u d(x) = 1,05 a2 e o(x) = 1,03 a $(x) = 0,87 ( a ~ ) ~ e s(x) = 0,93 ac ?(x) = 2.446,72 (us$)~ e ç(x) = US$49,46 &x)=141,28cn? e s(x)=11,89cm a) variancia não tem interpretação. b) desvio padrão:

Aproximadamente 68% dos dias ocorrem entre O e 1,38 acidYdia Aproximadamente 95% dos dias ocorrem entre O e 2,31 acid/da Aproximadamente 99% dos dias ocorrem entre O e 3,24 acid/dia As aproximações neste caso não são razoáveis, pois a série é muito assimétrica.

a) variância não tem interpretação b) desvio padrão:

Aproximadamente 68% das notas têm valor entre US$37,58 e US$136,50 Aproximadamente 95% das notas têm valor entre US$ O e US$185,96

Aproximadamente 99% das notas tem valor entre US$ O e US$235,42 As aproximações neste caso são apenas razoáveis, pois a série é assimétrica.

a) variância não tem interpretação b) desvio padráo:

Aproximadamente 68% dos alunos têm altura entre 167,97 cm e 191,75 cm. Aproximadamente 95% dos alunos têm altura entre 156,08 cm e 203,64 cm. Aproximadamente 99% dos alunos têm altura entre 144,19 cm e 215,53 cm. As aproximações neste caso são bem razoáveis, pois a curva é praticamente simétrica. -

a) X = 10. Os valores da série estatistica X estão concentrados em torno de 10 unidades.

b) $(x) = 4. Varíãncia não tem interpretação. C) 6(X) = 2:

68% dos valores da sbrie estão compreendidos entre 8 e 12 unidades. 95% dos valores da s6rie estão compreendidos entre 6 e 14 unidades. 99% dos valores da s6rie estão compreendidos entre 4 e 16 unidades. -

a) Y = 20.0s valores da série estatística Y estão concentrados em torno de 20 unidades.

b) d (y ) = 6.25. Variância não tem interpretação. C) o(y) = 2,5:

68% dos valores da série estão compreendidos entre 17,5 e 22,s unidades. 95% dos valores da série estão compreendidos entre 15 e 25 unidades. 99% dos valores da série estão compreendidos entre 12,5 e 27,5 unidades.

Page 122: ESTATISTICA - DJALMA

Medidas de Dispersão 121

5.1 3 Medidas de dispersão relativa

Introdução: Se uma série X apresenta X = 10 e o(x) = 2 e uma série Y apresenta y= 100 e o(y) = 5, do ponto de vista da dispersão absoluta, a série Y apresenta maior dispersão que a série X.

No entanto, se levarmos em consideração as médias das séries, o desvio padrão de Y que é 5 em relação a 100 é um valor menos significativo que o desvio padrão de Xque é 2 em relação a 10.

Isto nos leva a definir as medidas de dispersão relativas: coeficiente de variação e variância relativa.

O coeficiente de variação de uma série X é indicado por C?,) definido por:

A variância relativa de uma série X é indicada por V(x) e definida por:

Note que o coeficiente de variação, como é uma divisão de elementos de mesma unidade, é um número puro. Portanto, pode ser expresso em percentual.

Este fato justifica a utilização do denominador ( x ) ~ na definição de V(x).

Deste modo, se calcularmos o coeficiente de variação da série Xcitada no início obteremos:

Calculando o coeficiente de variação da série Y obteremos:

Comparando os valores destes dois coeficientes concluímos que a série X admite maior dispersão relativa.

Como a medida de dispersão relativa leva em consideração a medida de dispersão absoluta e a média da série, é uma medida mais completa que a medida de dispersão absoluta.

Page 123: ESTATISTICA - DJALMA

122 Estatística 1

Portanto, a medida de dispersão relativa prevalece sobre a medida r i dispersão absoluta. Podemos afirmar que a série que tem a maior disperss: relativa, tem de modo geral a maior dispersão.

Concluindo o exemplo anterior:

A série Y apresenta maior dispersão absoluta. A série Xapresenta maior dispersão relativa.

Portanto, a série Xapresenta maior dispersão.

5.1 4 Exercícios Propostos

Responda, justificando em cada caso, as questões abaixo:

a) Qual das séries apresenta maior dispersão absoluta? b) Qual das séries apresenta maior dispersão relativa? c) Qual das séries apresenta maior dispersão?

RESPOSTAS

1. A série B possui maior dispersão absoluta, pois apresenta maior desvio padrão. A série B possui maior dispersão relativa, pois apresenta maior coeficiente de variação. A série B possui maior dispersão, pois a dispersão relativa prevalece sobre a dispersão absoluta.

2. A série B apresenta maior dispersão absoluta, pois apresenta maior desvio padrão. A série A apresenta maior dispersão relativa, pois apresenta maior coeficiente de variação. A série A apresenta maior dispersão, pois a dispersão relativa prevalece sobre a dispersão absoluta.

Page 124: ESTATISTICA - DJALMA

Medidas de Dispersão 123

3. A série B apresenta maior dispersão absoluta, pois apresenta maior desvio padrão. A série A apresenta maior dispersão relativa, pois apresenta maior coeficiente de variação. A série A apresenta maior dispersão, pois a dispersão relativa prevalece sobre a dispersão absoluta.

4. A série A apresenta maior dispersão absoluta, pois apresenta o maior desvio padrão. A série A apresenta maior dispersão relativa, pois apresenta maior coeficiente de variação. A série A apresenta maior dispersão, pois a dispersão relativa prevalece sobre a dispersão absoluta.

5. As duas séries apresentam a mesma dispersão absoluta, pois os desvios padrão são iguais. A s6rie A apresenta maior dispersáo relativa, pois apresenta maior coeficiente de variação. A série A apresenta maior dispersão, pois a dispersão absoluta prevalece sobre a dispersão relativa.

6. A série B apresenta maior dispersão absoluta, pois apresenta maior desvio padrão. As séries A e B apresentam mesma dispersão relativa, pois apresentam mesmo coeficiente de varia- ção. As séries A e B apresentam a mesma dispersão, pois a dispersão relativa prevalece sobre a dispersão absoluta.

Page 125: ESTATISTICA - DJALMA

Medidas de Assimetria e Curtose

6.1 Introdução Para conceituar assimetria, obviamente precisamos conceituar sime-

tria. Diremos que uma distribuição é simétrica quando k = Md = M, Se isto de fato ocorrer, a curva de frequência tem a seguinte caracte-

rística gráfica:

Se uma distribuição não for simétrica, será classificada como assimé- trica.

Existem duas alternativas para uma distribuição assimétrica:

No caso (a) A distribuição é classificada de assimétrica positiva. No caso (b) A distribuição é classificada de assimétrica negativa.

Page 126: ESTATISTICA - DJALMA

Medidas de Assimetria e Curtose 125

:.2 Medidas de Assimetria

-2.1 COEFICIENTE DE PEARSON

Se A, = O então a distribuição é simétrica.

Se A, < O então a distribuição é assimétrica negativa.

Se A, > O então a distribuição é assimétrica positiva.

Segundo este critério, as distribuições são classificadas da seguinte Irma:

Se A, 5 -1 : assimétrica negativa forte.

Se -1 < A, < O : assimétrica negativa fraca.

Se A,=O : simétrica.

Se O c A, < 1 : assimétrica positiva fraca.

Se A,> 1 : assimétrica positiva forte.

6.2.2 COEFICIENTE DE BOWLEY

Se A, = O então a distribuição é simétrica.

Se A, < O então a distribuição é assimétrica negativa.

Se A, > O então a distribuição é assimétrica positiva.

O coeficiente de Bowley é um valor que varia de -1 a 1. Por este critério, as distribuições são classificadas da seguinte forma:

-1 5 A, < -0,3 assimétrica negativa forte.

-0,3 < A, < -0,l assimétrica negativa moderada.

-0,l I A, < O assimétrica negativa fraca.

Page 127: ESTATISTICA - DJALMA

r 126 Estatística 1

A,=O simétrica.

O < A, I 0, l assimétrica positiva fraca.

0,l < A, < 0,3 assimétrica positiva moderada. 0,3 5 A, I I assimétrica positiva forte.

6.3 Medida de Curtose

Observando a concentração dos valores de uma série em torno de scz moda, podemos observar três situações especiais.

1"aso - Os dados estão fortemente concentrados em torno da modc. o que faria a curva de frequência ser bastante afilada, como na figura:

2 9 a s o - Os dados estão razoavelmente concentrados em torno da moda, o que faria a curva de frequência ser razoavelmente afilada, como na figura:

3Qaso - Os dados estão fracamente concentrados em torno da moda, o que faria a curva de frequência ser fracamente afilada, como na figura:

Page 128: ESTATISTICA - DJALMA

Medidas de Assimetria e Curtose 127

I I

I *

Mo X (curva achatada no centro)

A medida de curtose procura classificar estes tipos de curvas com respeito ao afilamento ou achatamento de sua área central.

Para isto, padroniza-se a curva do 2"aso. Este tipo de curva é classificada como mesocúrtica. A curva do 1%aso, bastante afilada em sua área central, é denomina-

da leptocúrtica, e a curva do 3" caso, bastante achatada em sua área central, é denominada platicúrtica.

Para classificar uma distribuição quanto a sua curtose, podemos utili- zar o coeficiente de curtose dado por:

Se K= O a distribuição é mesocúrtica.

Se K > O a distribuição é leptocúrtica.

Se K < O a distribuição é platicúrtica.

OBSERVAÇÃO: 1) O valor 3, que figura na fórmula de K, representa o valor da curtose para uma distribuição teórica de pro- babilidades chamada distribuição normal padrão, que caracteriza a distribuição mesocúrtica. Esta distribuição será estudada na sequência do curso.

Se uma distribuição apresenta,

C (xi- x14 4

ela é mesocúrtica e conseqüentemente K = O.

Page 129: ESTATISTICA - DJALMA

128 Estatística 1

2) A medida de curtose tem a finalidade de complemeri-z a caracterização da dispersão em uma distribuição.

Exemplos:

1. Classifique, quanto a assimetria, a distribuição abaixo, segundo : Coeficiente de Pearson.

Cálculo de %

Cálculo da M,: Mo = 2

Page 130: ESTATISTICA - DJALMA

Cálculo de o(x):

Medidas de Assimetria e Curtose 129

Substituindo-se estes valores obtém-se:

É uma distribuição assimétrica positiva fraca.

2. Classifique, quanto a assimetria a distribuição abaixo segundo o coeficiente de Bowley.

Cálculo de Q3: 75 x 35

1 O0 - %nt 26,25 - 19 Q3 = P75 = G5 + . h = 6 +

15 . 2 = 6,97

f75

Classe

1 2 3 4 5

Int. cl.

o 1- 2 2 1- 4 4 1- 6 6 1- 8 8 1- 10

fi 2 5

12 15 1

Page 131: ESTATISTICA - DJALMA

130 Estatística 1

Cálculo de Q,: 25 x 35

1 O0 - 'ant 8,75 - 7 Q, = P2, = I,, + h = 4 +

12 . 2 = 4,29

$5

Cálculo de M; 50 x 35 -

Substituindo-se estes valores, obtém-se:

É uma distribuição assimétrica negativa fraca.

3. Classifique, quanto a curtose, a distribuição abaixo:

População

Solução:

Classe

1 2 3 4 5

Cálculo de k

Int. cl.

3 1- 5 5 1- 7 7 1- 9 9 1- 11

11 I- 13

f j 1 2

13 3 1

Page 132: ESTATISTICA - DJALMA

Medidas de Assimetria e Curtose 131

Z ( X ~ - X ) ~ 5 Cálculo de: - 591 ,914 = 29,5957

c f; - 20

sse

!

2 3 4 5

I

z ( ~ ~ - k ) ~ f j 51,8 Cálculo de: 04(x): 02(x) = - - -

- 20 - 2,59 z fi

Substituindo-se estes valores, obtém-se:

Int. cl.

3 I- 5 5 I- 7 71--9 9 1- 11

' 1 3 11 I-

Como K > O a distribuição é leptocúrtica.

4. Suponha que a tabela do exemplo 1 representasse apenas uma amostra de uma população.

Neste caso, não conhecemos o desvio padrão populacional o(*.

Devemos substituir o(x) por s(x) nas fórmulas que dependem de o(x).

Desta forma, o coeficiente de Pearson para amostras é escrito:

f; 1 2

13 3 1

e o coeficiente de curtose para amostras é escrito:

x; 4 6 8 10 12

xifj 4

12 104 30 12

- 4 (x ; -X ) f;

282,5761 38,8962 0,001 3

39,0963 231,3441

- 2 ( x í - X ) f;

16,81 8,82 0,13

10,83 15,21

Page 133: ESTATISTICA - DJALMA

132 Estatística 1

Com estas considerações, para o exemplo 1

z (x,. - x ) ~ fi 2 ( x ) = -

x f i - 1 38'64 - 1,61 e s(x) = jr;61 = 1,27 25-1

O coeficiente de Pearson é:

A distribuição é assimétrica positiva fraca. Quanto ao exemplo 3, se a tabela representa apenas uma amostra da

população, então:

Portanto,

O coeficiente de curtose vale:

Como K > O, a distribuição é leptocúrtica.

6.4 Exercícios Propostos 1. Classifique, quanto a assimetria, a distribuição abaixo, segundo o coeficiente de

Pearson. População

Page 134: ESTATISTICA - DJALMA

Medidas de Assimetria e Curtose 133

2. Classifique, quanto a curtose a distribuição do problema anterior. 3. Classifique, quanto a assimetria, a distribuição abaixo, segundo o coeficiente de

Bo wley

Amostra

10

1 o 11

4. Classifique, quanto a curtose, a distribuição do problema anterior.

5. Classifique, quanto a assimetria, a distribuição abaixo, segundo o coeficiente de Pearson.

Amostra

classe I Int. cl. I f;

6. Classifique, quanto a curtose, a distribuição do problema anterior.

7. Classifique, quanto a assimetria, a distribuição abaixo, segundo o coeficiente de Bowley

Amostra

Classe Int. cl.

7 1- 4 9 1- 11 19 5 11 1- 13 17

8. Classifique quanto a curtose, a distribuição do problema anterior.

RESPOSTAS - 5 - 5

1. x = 5: Mo = 5; o(x) = 1,53. A, = - = O. Distribuição simétrica. 133

- E (xi-i)4 464 2. x = 5; --- - 34 - 13,6471; o(x) = 153; 04(x) = 5,4798. K = -0,51. Distribuição platicúriica.

L 'i

8+6,5-14 3. Q3=8;Q,=6,5;Md=7;A,= = 0,33. Distribuição assimétrica positiva forte.

8 - 6,5

Page 135: ESTATISTICA - DJALMA

134 Estatística 1

- 6,35 - 5,43 5. x = 6,35; Mo = 5,43; s2(x) = 15,87; ~ ( x ) = 3,98; A, =

3,98 = 0,23. Distribuição assimétrica pos? ?

fraca.

A distribuição é leptocúrtica. 7. Q, = 10,58; Q, = 5,875; M, = 8,33. A, = -0,044. Curva assimétrica negativa fraca.

Exercícios Gerais

1. Uma empresa produz caixas de papelão para embalagens e afirma que o númer de defeitos por caixa se distribui conforme a tabela: População

Pede-se: 1.1. O número médio de defeitos por caixa.

1.2. A distribuição de frequências.

1.3. A porcentagem de caixas com dois defeitos. 1.4. A porcentagem de caixas com menos que três defeitos. 1.5. A porcentagem de caixas com mais que três defeitos. 1.6. O histograma. 1.7. O número mediano de defeitos por caixa. 1.8. A moda.

1.9. A amplitude .total da série. 1.10. O desvio médio simples. 1.1 1. A variância. 1.12. O desvio padrão. 1.13. O coeficiente de variação,

1.14. A variância relativa.

1.15. Q,.

1.16. Q3.

1.17. PIO. 1.18. D6.

Page 136: ESTATISTICA - DJALMA

Medidas de Assimetria e Curtose 135

1.19. Pgo.

1.20. K4. 1.21. O percentual de elementos da série situados entre Q1 e K4.

1.22. O número aproximado de caixas entre o Plo e Q3.

1.23. Classifique, quanto a assimetria, a distribuição segundo o coeficiente de Pearson.

1.24. Classifique, quanto a assimetria, a distribuição segundo o coeficiente de Bo wley

1.25, Classifique, quanto a curtose, a distribuição.

2. Uma amostra aleatória de 250 residências de famílias, classe média, com dois filhos, revelou a seguinte distribuição do consumo mensal de energia elétrica.

Pede-se: 2.1. O consumo médio por residência.

2.2. A distribuição de frequências.

2.3. A porcentagem de famílias com consumo mensal maior ou igual a 200 e menor que 250 kwh.

2.4. A porcentagem de famílias com consumo mensal menor que 200 kwh.

2.5. A porcentagem de famílias com consumo maior ou igual a 250 kwh.

2.6. O histograma e o polígono de frequência.

2.7. O consumo mediano.

2.8. A moda.

2.9. A amplitude total da série. e 2.10. O desvio médio simples.

2.11. A variância.

2.12. O desvio padrão.

2.13. O coeficiente de variação.

2.14. A variância relativa.

2.15. Q,.

2.16. Q3.

2.17. P,,.

2.18. D6.

2.19. Pgo.

NQ de famíiias

2 15 32 47 50 80 24

Classe

1 2 3 4 5 6 7

Consumo mensal (kwh)

O I- 50 50 1- 1 O0

100 1- 150 150 1- 200 200 1- 250 250 1- 300 300 1- 350

Page 137: ESTATISTICA - DJALMA

136 Estatlstica 1

2.20. K4. 2.21. O percentual de famílias classificadas entre Q1 e K4. 2.22. O número aproximado de famílias classificadas entre PIO e Q3.

2.23. Classifique, quanto a assimetria, a distribuição segundo o coeficiente de Pearson.

2.24. Classifique, quanto a assimetria, a distribuição segundo o coeficiente de Bowley

2.25, Classifique, quanto a curtose, a distribuição.

3.1. O número médio de televisores vendidos por dia.

Uma rede de lojas afirma que as vendas diárias de televisores obedecem a se- guinte distribuição:

População

3.2. A distribuição de frequências.

3.3. A porcentagem de dias em que a venda de televisores é maior ou igual a 60 e menor que 80.

N V e dias

5 25 40 15 1 O 5

Classe

1 2 3 4 5 6

3.4. A porcentagem de dias em que a venda de televisores é menor que 60.

Pede-se:

NQe televiçoresldia

o I- 20 20 1- 40 40 1- 60 60 1- 80 80 1- 1 O0

1 O0 1- 120

3.5. A porcentagem de dias em que a venda de televisores é maior ou igual a 80.

3.6. O histograma e o polígono de frequência.

3.7. O número mediano de televisores vendidos. 3.8. A moda.

3.9. A amplitude total da série.

3.10. O desvio médio simples.

3.11. A variância.

3.12. O desvio padrão.

3.13. O coeficiente de variação.

3.14. A variância relativa.

3.15. Q,.

3.16. Q3.

3.1 7. Pl ,. 3.18. D,. 3.19. P,,.

3.20. K4. 3.21, O percentual de dias entre Ql e K4.

Page 138: ESTATISTICA - DJALMA

Medidas de Assimetria e Curtose 137

3.22. O número aproximado de dias entre P1 e Q3.

3.23. Classifique, quanto a assimetria, a distribuição segundo o coeficiente de Pearson.

3.24. Classifique, quanto a assimetria, a distribuição segundo o coeficiente de i30 wley

3.25. Classifique a distribuição, quanto a curfose.

4. Uma auditoria em uma grande empresa observou o valor de 50 notas fiscais emitidas durante um mês. Esta amostra apresentou a seguinte distribuição:

Pede-se:

Classe

1 2 3 4 5 6 7

4.1. O valor médio das notas.

4.2. A distribuição de frequências.

Valor da nota io3 $

7 1- 12 12 1- 17 17 1- 22 22 1- 27 27 1- 32 32 1- 37 37 1- 42

4.3. A porcentagem de notas com valor maior ou igual a $ 17.000 e menor que $22.000

NWe notas

2 5

13 10 9 6 5

4.4. A porcentagem de notas com valor menor que $32.000.

4.5. A porcentagem de notas com valor maior ou igual a $32.000.

4.6. O histograma e o polígono de frequência.

4.7. O valor mediano das notas.

4.8. A moda.

4.9. A amplitude da série.

4.10. O desvio médio simples.

4.11. A variância.

, 4.12. O desvio padrão.

4.13. O coeficiente de variação.

4.14. A variância relativa.

4.15. Q,. 4.16. Q3.

4.17. PIO.

4.18. D6'

4.19. Pgo.

4.20. K4.

4.21. O percentual de notas entre Q1 e K4.

Page 139: ESTATISTICA - DJALMA

138 Estatística 1 i

4.22. O número aproximado de notas entre PIO e Q3. 1

4.23. Classifique, quanto a assimetria, a distribuição segundo o coeficiente dc I

Pearson. I

4.24. Classifique, quanto a assimetria, a distribuição segundo o coeficiente c-r I Bo wley

4.25. Classifique a distribuição quanto a curtose.

RESPOSTAS -

1.1. x = 1 1.2.

1.7. Md= 1

1.8. M,=O

1.9. A, = 5

1.70. DMS = 0,81

1.1 1. C?(* = 1,29

1.12. o(* = 1,14

1.13. Cyii>= 1,14

1.14. V(X) = 1.29

1.15. Q, =O

1.16. Q3= 1

1.17. P,, =O

Fr, 'Yo

32/79 40,51 60/79 75,95 71/79 a9,87 75/79 94,93 78/79 98,73 79/79 I 00

Xl

O 1 2 3 4 5

fl

32 28 11 4 3 1

fr! 'Yo

32/79 40,51 28/79 35,44 I 1/79 13,92 4/79 5,06 3/79 3,80 1/79 1,27

Fl 32 60 71 75 78 79

Page 140: ESTATISTICA - DJALMA

Medidas de Assimetria e Curtose 139

1.18. D, = 1 1.19. P9,=2,5 1.20. K, = 2 1.21. 55% 1.22. 52 1.23 A, = 0,88. Assimétrica positiva fraca. 1.24. A, = -1. Assimétrica negativa forte. 1.25. K = 1,54. Leptocurtica. 2.1. 217,8 2.2.

XI

1 2 3 4 5 6 7

Int. CI.

O I- 50 50 1- 100

100 1- 150 150 1- 200 200 1- 250 250 1- 300 300 1- 350

fl

2 15 32 47 50 80 24

f.; 70

21250 0,80 151250 6,OO 321250 12.80 471250 18,80 501250 20,OO 801250 32,OO 241250 9,60

FI 2

17 49 96

146 226 250

FR, 70 21250 0,80

171250 6,80 491250 19,60 961250 38,40

1461250 58,40 2261250 90,40 2501250 100,OO

Page 141: ESTATISTICA - DJALMA

140 Estatística 1

2.17. 112,5 2.18. 252,5

2.19. 299,38 2.20. 283,75

2.21. 55%

2.22. 163 2.23. - 0,69. Assimétrica negativa fraca. 2.24. - 0,159. Assimétrica negativa moderada. 2.25. - 0,65. Platicúrtica. 3.1. 53

3.2.

Classe

1 2 3 4 5 6

FI

5 30 70 85 95 100

No de televisores1 dia

O I- 20 201- 40 40 1- 60 601- 80 80 1- 100 100 1- 120

F., Yo

51100 5 301100 30 701100 70 851100 85 951100 95 1001100 100

N9de dias

2 25 40 15 10 5

f., Yo

511 O0 5 251100 25 401100 40 15l100 15 101100 10 511 O0 5

Page 142: ESTATISTICA - DJALMA

Medidas de Assimetria e Curtose 141

66,67 24 55 90

73,33 55% 65

0,23. Assimétrica positiva fraca. 0,087. Assimétrica positiva fraca. - O, 03 1. Platicúrtica. $25.200

Classe Valor da nota Ne de fr, 'XO F~ F ~ i % 103 $ notas

1 7 1- 12 2 2/50 4 2 2/50 4 2 121- 17 5 5/50 10 7 7/50 14 3 171- 22 13 13/50 26 20 20150 40 4 22 1- 27 10 10/50 20 30 30150 60 5 27 1- 32 9 9150 18 39 39/50 78 6 32 1- 37 6 6/50 12 45 45/50 90 7 371- 42 5 5/50 10 50 50150 100

Page 143: ESTATISTICA - DJALMA

142 Estatística 1

4.13. 32% 4.14. 10,29%

4.15. $ 19.115,38

4.16. $31.166,67

4.17. $ 15.000,OO

4.18. $27.000,00

4.19. $37.000,00

4.20. $32.833,33

4.21 55%

4.22. 33 4.23. 0,56. Assimétrica positiva fraca.

4.24. 0,106. Assimétrica positiva moderada.

4.25. - 0.85. Platicúrtica.

Page 144: ESTATISTICA - DJALMA

7.1 Introdução

Quando solicitados a estudar um fenômeno coletivo, verificamos a necessidade de descrever tal fenômeno por um modelo matemático que per- mita explicar da melhor forma possível este fenômeno.

A teoria das probabilidades permite construir modelos matemáticos que explicam um grande número de fenômenos coletivos e fornecem estraté- gias para a tomada de decisões.

Iniciaremos o estudo da teoria das probabilidades enfocando o objeto de estudo do cálculo de probabilidades.

Entendemos por fenômeno qualquer acontecimento natural.

Se observarmos os fenômenos com respeito a seus possíveis resulta- dos, podemos classificá-los em dois tipos:

a) determinísticos;

b) aleatórios.

a) Fenômenos determinísticos - são aqueles que repetidos sob mesmas condições iniciais conduzem sempre a um só resultado. As condi- ções iniciais determinam o único resultado possível do fenômeno.

b) Fenômenos aleatórios - são aqueles que repetidos sob mesmas condições iniciais podem conduzir a mais que um resultado. As condições iniciais não determinam o resultado do fenômeno.

COMENTÁRIO: Embora teoricamente tenhamos exigido as repetições, nas mesmas condições iniciais, isto na prática dificilmente ocorre. Mesmo quando procuramos manter as mesmas condições iniciais, pequenas varia- ções certamente ocorrerão. Isto provocará alterações no resultado final.

Page 145: ESTATISTICA - DJALMA

144 Estatística 1

i Se estas alterações forem mínimas, para a maioria das aplicações práticas elas poderão ser desprezadas. Poderemos afirmar que c resultado final é único, e classificar o fenômeno como determinísti- CO.

i Se estas alterações forem significativas, então o fenômeno será classificado de aleatório.

Exemplos:

1. Se deixarmos uma massa M cair em queda livre de uma altura de 1 metro sobre uma superfície, poderemos anotar o tempo t, de queda livre.

Ao tentarmos repetir o fenômeno, dificilmente conseguiremos as mes- mas condições iniciais. Certamente repetiremos o fenômeno em condições muito próximas das iniciais.

Estas pequenas alterações nas condições iniciais provocarão peque- nas alterações no tempo de queda. Para a maioria das aplicações, estas pequenas alterações no tempo de queda podem ser desprezadas e afirma- mos que o resultado é único. O fenômeno é classificado como determinístico.

2. Se lançarmos um dado sobre uma superfície, podemos anotar o número de pontos da face superior do dado.

Da mesma forma que no exemplo anterior, dificilmente conseguiremos repetir o lançamento nas mesmas condições anteriores.

Estas pequenas variações que certamente ocorrerão na repetição do lançamento podem provocar substanciais mudanças no número de pontos apresentados na face superior do dado.

Estas mudanças não podem em geral ser desprezadas e consequen- temente o fenômeno admitirá, por repetição, mais que um resultado. Desta forma, este fenômeno é classificado como aleatório.

Quando um fenômeno é determinístico, a teoria das probabilidades não fornece um modelo adequado para a explicação do fenômeno.

A teoria das probabilidades só é útil e deve ser aplicada quando lidar- mos com um fenômeno aleatório.

Portanto, o objeto de estudo da teoria das probabilidades são os fenô- menos aleatórios.

Para facilitar o desenvolvimento da teoria sem usar recursos matemáti- cos mais sofisticados, vamos restringir nosso estudo a uma classe de fenôme- nos aleatórios chamados experimentos.

Os experimentos são fenômenos aleatórios que possuem as seguintes características:

Page 146: ESTATISTICA - DJALMA

Probabilidades 145

a) repetitividade;

b) regularidade.

a) Repetitividade: é a característica de um fenômeno de poder ser repetido quantas vezes quisermos.

Se por algum motivo não pudermos repetir sistematicamente o fenô- meno, ele não será classificado como experimento.

b) Regularidade: é a característica que diz respeito a possibilidade da ocorrência dos resultados do fenômeno. A avaliação numérica da possibili- dade de ocorrência destes resultados dará origem as probabilidades.

7.2 Teoria das Probabilidades - Espaço Amostral

Como o objeto de nosso estudo são os experimentos e eles admitem mais do que um resultado, faz sentido definir o conjunto de todos os possíveis resultados do experimento.

Este conjunto será denotado por S e denominado espaço amostral do experimento.

Exemplos: O experimento consiste em:

1. Lançar uma moeda e anotar a face superior.

Se representamos cara com a letra c e coroa com a letra k, então o espaço amostral do experimento é S = {c, k}

OBSERVAÇÃO: Para evitar complicações, recomendamos que o inte- ressado sempre raciocine em termos de materiais ideais.

A moeda que utilizamos no caso anterior deve ser imaginada como duas calotas coladas adequadamente com as faces cara e coroa convencio- nadas por duas cores distintas. O material, é claro, deve ser homogêneo.

O dado idealizado, com o qual trabalharemos no próximo exemplo, deve ser um cubo perfeito com o número de pontos convencionado por cores.

2. Lançar um dado e anotar o número de pontos da face superior.

O espaço amostral é: S = (1, 2, 3, 4, 5, 6).

3. Retirar uma carta de um baralho comum de 52 cartas e anotar o naipe da carta selecionada.

O espaço amostral é: S = {paus, copas, ouros, espadas}

Page 147: ESTATISTICA - DJALMA

146 Estatística 1

4. Lançar duas moedas e observar as faces superiores. 1 O espaço amostral é: S = {cc, ck, kc, kk}. I 5. Lançar uma moeda sucessivamente, até que se obtenha a primei-

ra face cara. Anota-se como resultado do experimento a sequência de caras e coroas do primeiro ao último lançamento.

O espaço amostral é: S = {c, kc, kkc, kkkc, ...}.

6. Escolher um ponto P ao acaso no intervalo [3, 121 e anotar a distância do ponto escolhido P ao ponto 5.

O espaço amostral é: S = {d E R I O I d á 7). Os espaços amostrais podem ser finitos ou infinitos.

Os exemplos 1, 2, 3 e 4 apresentam espaços amostrais finitos.

Os exemplos 5 e 6 apresentam espaços amostrais infinitos.

Para evitar recursos matemáticos mais sofisticados, vamos estudar apenas os espaços amostrais finitos.

Uma excelente técnica para não omitirmos resultados do experimento na construção de seu espaço amostral está baseada no princípio fundamental da contagem, que estabelece:

Se um procedimento A pode ser realizado de n maneiras diferentes e um procedimento B pode ser realizado de rn maneiras diferentes, então o encadeamento dos procedimentos A e B pode ser feito de n.m maneiras diferentes.

Isto sugere uma disposição gráfica chamada diagrama de árvore.

O espaço amostral do exemplo 4, lançamento de duas moedas e observação das faces superiores, pode ser obtido utilizando-se esta técnica.

Para efeito da observação das faces superiores, lançar simultanea- mente duas moedas é o mesmo que-lançar uma moeda duas vezes.

No primeiro lançamento há duas ocorrências possíveis. No segundo lançamento há também duas ocorrências possíveis. A sequência dos dois lançamentos terá 2.2 = 4 ocorrências possíveis, que podem ser representadas na forma do diagrama de árvore:

l Q lançamento ZQ lançamento

Page 148: ESTATISTICA - DJALMA

Probabilidades 147

0 s possíveis resultados estão estabelecidos em cada ramo da árvore: S = {cc, ck, kc, kk}.

7.3 Eventos

Evento é qualquer subconjunto do espaço amostral do experimento.

Exemplo: Se considerarmos o lançamento de um dado e a observação l a face superior, então o espaço amostral do experimento é: S = (1, 2, 3, 4, 5 , 5).

Note que A = {I , 2); B = (2, 4, 6); C = { j; S são subconjuntos de S e ~ortanto são eventos.

Os eventos podem ser enunciados na linguagem usual. Assim, enun- ciaremos A como: sair face 1 ou face 2 no lançamento de um dado.

Há, normalmente, várias maneiras equivalentes de se enunciar um mesmo evento.

O evento A também poderia ser enunciado como: sair face menor que 3 no lançamento de um dado.

O evento B é enunciado como: sair face 2 ou face 4 ou face 6 no lançamento de um dado. Isto é equivalente a afirmar: sair face par no lança- mento de um dado.

Para enunciar o evento C, basta usar qualquer propriedade que não caracterize nenhum dos valores de S.

Deste modo, C pode ser enunciado como: sair face 8 no lançamento de um dado.

Note que cada elemento que constitui o evento é um possível resulta- do do experimento.

Assim sendo, quando realizamos o experimento uma só vez, apenas um dos elementos do espaço amostral irá ocorrer não ocorrendo os demais.

Diremos então que um evento A ocorre quando ocorrer, como resulta- do do experimento, um dos elementos de A.

De modo resumido, podemos afirmar que um evento A ocorre quando ocorrer um de seus pontos.

No exemplo inicial, se lançarmos o dado e sair face 4, diremos que: não ocorreu o evento A; ocorreu o evento B; não ocorreu o evento C; ocorreu o evento S.

O conjunto vazio é subconjunto de qualquer conjunto. Portanto, em qualquer espaço amostral C = { } é sempre um evento.

Page 149: ESTATISTICA - DJALMA

148 Estatística 1

Observe que o evento C = { ) não possui elementos, portanto este evento nunca ocorrerá. Neste sentido, C é denominado evento impossível.

Note também que todo conjunto é subconjunto de si próprio.

Desta forma, o próprio espaço amostra1 S é sempre um evento.

Como S contém todos os possíveis resultados do experimento, S cer- tamente ocorrerá.

Neste sentido, S é denominado evento certo.

7.4 Operações com Eventos

Como eventos são conjuntos, podemos usar as operações de conjun- tos para os eventos.

Assim:

Exemplo: Se considerarmos o lançamento de um dado e a observação da face superior, então S = { I , 2, 3, 4, 5, 6}.

Se A = {I, 2, 3); B = {2,3 ,6); C = {2, 3, 4) então:

A U B = { l , 2, 3, 6)

A n C={2, 3)

CA = (4, 5, 6)

CB= {I, 4,s)

C(A u B) = (4,s)

Quando um evento possui apenas um elemento, ele é chamado even- to simples.

Eventos com mais de um elemento são chamados eventos compostos.

Se considerarmos o lançamento de um dado e a observação da face superior, então S = { I , 2, 3, 4, 5, 6). A = (21, B = (51, C = {3} são exemplos de eventos simples.

Os eventos D = { 2, 31, E = (4, 61, F = {2, 3, 4, 5) são exemplos de eventos compostos.

Observando os eventos D = (2, 3} e B = (5) notamos que eles não possuem elemento comum, isto é, D n B = { }.

Page 150: ESTATISTICA - DJALMA

Probabilidades 149

Portanto, se D ocorre, B não pode ocorrer ao mesmo tempo; e. se B ocorrer, D não pode ocorrer ao mesmo tempo.

Dizemos então que a ocorrência de D exclui a possibilidade de ocor- rência de A e a ocorrência de A exclui a possibilidade de ocorrência de B. Eles se excluem mutuamente. Portanto, são mutuamente exclusivos.

De modo geral, se A e B são eventos quaisquer, diremos que:

A e B são mutuamente exclusivos se A n B = 0

7.5 Exercícios Propostos

1. Considere o espaço amostral do lançamento de um dado e a observação da face superior. Descreva, por seus elementos, os seguintes eventos:

a) A: sair face par.

b) 9: sair face primo.

c) C: sair face maior que 3.

d) D: sair face maior que 6. e) E: sair face múltipla de 3.

f) F: sair face menor ou igual a 4.

2. Considere o espaço amostral S = {I, 2, 3, 4, 5, 6, 7, 8, 9, 10) e os seguintes eventos:

A = 12, 3, 4)

B = {I, 3, 5, 7, 9)

c = {5}

D = {1, 2, 3)

E = 12, 4, 6)

Determine:

a) A u B

b) A n B

C) CA d) CB e) C (A u B)

f) A n C

3. Dos eventos A, B, C, D e E do problema anterior, quais são mutuamente exclusi- vos ?

4. O experimento consiste em lançar dois dados e observar a soma dos pontos das faces superiores. Determine o espaço amostral (Sugestão: use o diagrama de árvore).

Page 151: ESTATISTICA - DJALMA

150 Estatística 1

5. O experimento consiste em lançar dois dados e observar a diferença dos pontos I das faces superiores. Determine o espaço amostral do experimento. (Sugestão: use o diagrama de árvore).

6. O experimento consiste em lançar dois dados e observar o produto dos pontos das faces superiores. Determine o espaço amostral do experimento. (Sugestão: use o diagrama de árvore).

7. O experimento consiste em lançar dois dados e observar, em módulo, a diferença dos pontos das faces superiores. Determine o espaço amostral do experimento. (Sugestão: use o diagrama de árvore).

8. O experimento consiste em lançar três moedas e observar a diferença entre o número de caras e o número de coroas obtidos neste lançamento. (Sugestão: use o diagrama de árvore).

9. O experimento consiste em retirar duas cartas de um baralho comum e anotar ordenadamente os naipes destas cartas. Determine o espaço amostral do experi- mento, (Sugestão: use o diagrama de árvore).

10. Uma urna contém duas peças defeituosas e três peças boas. Uma a uma as peças serão retiradas sem reposição, e analisadas. O experimento será encerrado quando as peças defeituosas forem identificadas. Anota-se como resultado do experimento a sequência de peças boas e defei- tuosas analisadas. Determine o espaço amostral do experimento (Sugestão: use o diagrama de árvore).

RESPOSTAS I 1. a) A={2,4,6)

b) B = (2, 3, 5)

C) C = {4, 5, 6)

d) D = { ) e) E = (3, 6)

i ) F={1, 2,3,4)

2. a) AuB={1,2,3,4,5,6,7,9)

b) A v B = {3) C) CA = {I, 5, 6, 7, 8, 9, 10)

d) Cs={2,4, 6,8, 10).

e) C ( A U B ) = { ~ , ~ , 10)

i ) A v C = { )

3. AeC;BeE;CeD;CeE.

4. S={2, 3, 4,5, 6, 7, 8, 9, 10, 11, 12)

5. S={-5,-4,-3,-2,-1,0,1,2,3,4,5)

6. S={ l ,2 , 3,4,5,8, 9, 10, 12, 15, 16, 18,20,24,25, 30,361

7. S={O, 1,2,3,4,5}

8. S={-3,-1, 1.3)

9. Espadas = E, Paus = F! Ouros = O, Copas = C; S = {CC, CE, CF: CO, PC, PE, PF: PO, EC, EE, EF: EO, oc , OF: OE, 0 0 )

10. S = {BBB, BBDB, BBDD, BDBB, BDBD, BD4 DBBB, DBBD, DBD, DO)

Page 152: ESTATISTICA - DJALMA

Probabilidades 151

7.6 Função de Probabilidade

Uma vez identificado o espaço amostral S = {a,, a2, ..., a,} de um expe- rimento, podemos associar a cada elemento a,, a2, ..., a, sua possibilidade de ocorrência.

Do ponto de vista matemático, esta associação é uma função chamada função de probabilidade, que definiremos da seguinte forma:

Função de probabilidade é uma função definida no espaço amostral S 1 do experimento, assumindo valores reais, com as seguintes propriedades:

COMENTÁRIO: O valor p(aJ é denominado probabilidade de ocorrên- cia do resultado ai.

É evidente que quando um elemento não tem possibilidade de ocorrer, dizemos que sua probabilidade de ocorrer é zero. E quando um elemento ocorrerá certamente, dizemos que sua probabilidade de ocorrência é 100% ou 1.

Por outro lado, quando somarmos as probabilidades de ocorrências de todos os elementos do espaço amostral, isto deve corresponder a prob- abilidade máxima possível, que é 100%.

Veja na sequência como determinar os valores p(aJ.

1 7.7 Definição de Probabilidade 1

Existem três formas de se definir probabilidade. A escolha da forma

1 depende da natureza da situação.

Aplica-se as situações em que os resultados que compõem o espaço amostral ocorrem com mesma regularidade, ou seja, os resultados são equi- prováveis.

Deste modo definimos:

Page 153: ESTATISTICA - DJALMA

152 Estatística 1

onde:

n(ai) é o número de casos favoráveis a realização de a,

n é o número total de casos possíveis.

I

2" Forma: PROBABILIDADE FREQUENCIALISTA I

Deve ser aplicada quando não se conhece a regularidade dos resulta- dos.

Este processo baseia-se na evolução da frequência relativa do resulta- do a, a medida que o número de repetições do experimento cresce. Matemati- camente:

P(aJ = lim (fr (ai)) r - 7 38 Forma: PROBABILIDADE PERSONALISTA

Há situações em que os resultados do experimento não ocorrem com mesma regularidade e não há possibilidade de se repetir sucessivamente o experimento, ou seja, não podemos aplicar nem a forma clássica e nem a forma frequencialista de probabilidades.

Nesta situação, devemos socorrer-nos de um especialista neste tipo de experimento, para que ele nos dê sua opinião pessoal a respeito do valor da probabilidade de cada resultado.

Este é um processo subjetivo de avaliação de probabilidades.

Exemplos:

1. O experimento consiste no lançamento de uma moeda e na obser- vação da face superipr. Determine o espaço amostral do experimento e a função de probabilidades.

Solu~ão: O espaço amostral é S = {c, k}.

Os elementos c e k que compõem o espaço amostral são equiprová- veis.

Usando o conceito clássico de probabilidades, avaliamos:

Page 154: ESTATISTICA - DJALMA

Probabilidades 153

Portanto, a função de probabilidade neste caso é:

2. O experimento consiste no lançamento de um dado e na observa- ção da face superior. Determine o espaço amostral do experimento e a função de probabilidade.

Solução: O espaço amostral é S = { I , 2, 3, 4, 5, 6). Os elementos que compõem o espaço amostral são equiprováveis.

Usando o conceito clássico de probabilidades, avaliamos:

A função de probabilidade neste caso tem a apresentação:

3. O experimento consiste no lançamento de duas moedas e na ob- servação do número de caras obtidas neste lançamento. Determine o espaço amostral e a função de probabilidade.

Solução: O espaço amostral do experimento é S = {O, 1,2}. O resultado O (zero) caras só ocorre quando ocorrer (k, k) no lança-

mento das moedas. O resultado 2 só ocorre quando ocorrer (c, c) no lançamento das moedas.

O resultado 1 ocorre quando ocorrer (c, k) ou (k, c) no lançamento das moedas.

Portanto, o resultado 1 tem o dobro de possibilidade de ocorrer que o resultado 2 ou o resultado zero.

Page 155: ESTATISTICA - DJALMA

154 Estatística 1

A função de probabilidade neste caso é:

S R

1 ~ ( 0 ) = '4 (k, k)

2 ~(1)='/2 (c,k)(k,c)

3 p(2)='4 (c,c)

4. O experimento consiste no lançamento de dois dados e na obser- vação da soma dos pontos das faces superiores. Determine o espaço amos- tral do experimento e a função de probabilidade.

Solução: O espaço amostral do experimento é S = (2, 3, 4, 5, 6, 7, 8, 9, 10,11,12}.

Estes resultados não são equiprováveis, pois há várias combinações que conduzem a soma 6, enquanto apenas uma combinação conduz a soma 2.

A função de probabilidade é:

5. O experimento consiste em selecionar ao acaso uma família e observar o número de filhos do casal. Determine o espaço amostral do experi- mento e a função de probabilidade.

Solução: O espaço amostral do experimento é S = {O, 1, 2, 3, ..., n}. Estes resultados não são equiprováveis e, embora haja regularidade

dos resultados, esta regularidade não pode ser avaliada pelo processo clássi- co.

Como o experimento pode ser facilmente repetido, recorremos ao con- ceito frequencialista de probabilidades.

Page 156: ESTATISTICA - DJALMA

I Probabilidades 155

Vejamos como calcular a probabilidade do primeiro resultado. Os de- mais podem ser obtidos exatamente da mesma maneira.

Selecionamos inicialmente 10 famílias e verificamos a frequência relati- va de famílias com zero filho.

Aumentamos o número de famílias para 20 e novamente calculamos a frequência relativa de famílias com zero filho.

Aumentamos sucessivamente o número de famílias para 30, 40, 50, 100, sempre recalculando a frequência relativa de famílias com zero filho.

Com isto, obtemos uma sequência de valores para a frequência relati- va de famílias com zero filho que convergirá rapidamente para um valor real c, isto é,

lim fqO) = c n+-

I Diremos então que P(0) = c.

Este procedimento pode ser adotado em todos os casos onde o con- ceito clássico de probabilidades é aplicado. No entanto, é um processo mais caro, mais demorado e mais trabalhoso.

6. O experimento consiste em verificar o resultado da tramitação de um projeto de lei na Câmara dos Deputados. Determine o espaço amostral e a função de probabilidade associada.

Solução: O espaço amostral do experimento é S = {aprovado, reprova- do).

A regularidade destes resultados não pode ser avaliada pelo conceito clássico de probabilidade.

A repetição do experimento neste caso não é um processo eficiente devido a diferença entre as naturezas dos projetos julgados.

Só nos resta a possibilidade de usar o processo personalista de pro- babilidade. Devemos consultar um especialista neste tipo de assunto que irá avaliar a probabilidade de o projeto ser aprovado ou rejeitado.

7.8 Exercícios Propostos

1. Considere o seguinte espaço amostral de um experimento: S = 12, 3, 5, 8). Verifi- que se a função:

Page 157: ESTATISTICA - DJALMA

156 Estatística 1

S- P R

2- p(2) = 0,25

3- p(3) = 0,25

5- p(5) = O, 15

8- p(8) = 0,05

pode ser uma função de probabilidade associada a este espaço amostral.

2. Considere o seguinte espaço amostral de um experimento: S = { I , 2, 4, 7, 8). Verifique se a função: S ~ R

1- ~ ( 1 ) = o, 1

2- ~ ( 2 ) = 0 2

4- ~ ( 4 ) = 0 4

7- ~ ( 7 ) = o, 7

8- ~ ( 8 ) = Ora pode ser uma função de probabilidade associada, a este espaço amostral.

3. Considere o seguinte espaço amostral de um experimento: S = {O, 2, 4, 5) Verifique se a função:

S ~ R o- ~ ( 0 ) = 0,3

2- ~ ( 2 ) = 0 2

4- ~ ( 4 ) = 0,3

5- ~ ( 5 ) = 0 2

pode ser uma função de probabilidade associada a este espaço amostral.

4. O experimento consiste em lançar dois dados e observar o dobro da soma dos pontos das faces superiores. Determine a função de probabilidade.

5. O experimento consiste em lançar dois dados e observar a diferença dos pontos das faces superiores. Determine a função de probabilidade.

6. O experimento consisfe em lançar dois dados e observar, em módulo, a diferença dos pontos das faces superiores. Determine a função de probabilidades.

7. O experimento consiste em lançar dois dados e observar o produto dos pontos das faces superiores. Determine a função de probabilidade.

8. O experimento consiste em lançar três moedas e observar a diferença entre o número de caras e o número de coroas obtidos neste lançamento. Determine a função de probabilidade.

9. O experimento consiste em retirar ao acaso uma bola de uma urna que contém 20 bolas iguais em peso e volume; sendo 5 bolas brancas, 8 bolas pretas e 7 bolas amarelas, e anotar sua cor. Determine a função de probabilidade.

10. O espaço amostral de um experimento é S = {1, 2, 7, 10). Se as probabilidades de ocorrência destes valores são diretamente proporcionais aos respectivos valores, determine a função de probabilidade associado a este espaço amostral.

Page 158: ESTATISTICA - DJALMA

Probabilidades 157

RESPOSTAS

1. Não, pois L p(aJ + 1 2. Não, pois L p(aJ # 1 3. Sim, pois as condições (1) O l p(aJ S 1 e (2) L p(aJ = 1 estão satisfeitas.

Page 159: ESTATISTICA - DJALMA

158 Estatística 1

7.9 Probabilidade de um Evento

A probabilidade de ocorrência de um evento A, que indicaremos por p(A), é a soma das probabilidades dos elementos que pertencem a A.

Exemplo: O experimento consiste no lançamento de um dado e na observação da face superior. Determine a probabilidade de cada um dos eventos abaixo:

a) Sair face 2 ou face 3. b) Sair face ímpar.

c) Sair face maior que 1. d) Sair face 5.

e) Sair face 1 ou 2 ou 3 ou 4 ou 5 ou 6.

f) Sair face múltiplo de 9.

Solução: Inicialmente, determinaremos o espaço amostral e a função de probabilidade.

O espaço amostral é S = {I , 2, 3, 4,5, 6).

A função de probabilidade é dada por:

Page 160: ESTATISTICA - DJALMA

Probabilidades 159

a) A = (2, 3). Segundo a definição de probabilidade de um evento, P(A) = ~ ( 2 ) + ~ ( 3 ) .

1 1 A função de probabilidade estabelece que p(2) = - e p(3) = -. 6 6

Desta forma,

b) B = (1, 3, 5) e p(B) = p(1) + p(3) + p(5). Portanto:

7.1 0 Exercícios Propostos

1. No lançamento de dois dados e na observação da soma dos pontos das faces superiores, determine a probabilidade de cada um dos eventos seguintes:

1.1. A-Asomaserpar.

1.2. B - A soma ser ímpar.

1.3. C - A soma ser múltiplo de 3.

1.4. D - A soma ser número primo.

1.5. E - A soma ser maior ou igual a 7.

1.6. F - A soma ser maior que 12.

Page 161: ESTATISTICA - DJALMA

160 Estatística 1

2. No lançamento de dois dados e na obsen/ação do produto dos pontos das face: superiores determine a probabilidade dos seguintes eventos:

2.1. A - O produto ser menor que 10.

2.2. B - O produto ser um número de 5 a 12. 2.3. C - O produto ser um número entre 5 e 12.

2.4. D - O produto ser menor ou igual a 10.

2.5. E - O produto ser no máximo 20.

2.6. F - O produto ser múltiplo de 4.

3. O quadro abaixo representa a classificação por sexo e por estado civil, de u r conjunto de 50 deputados presentes em uma reunião.

Uma pessoa é sorteada ao acaso. Determine a probabilidade dos eventos:

3.1. A - Ser um homem. 3.2. B - Ser uma mulher.

3.3. C - Ser uma pessoa casada.

3.4. D - Ser uma pessoa solteira.

3.5. E - Ser uma pessoa desquitada. 3.6. F - Ser uma pessoa divorciada.

4. O quadro abaixo representa a classificação de um grupo de 30 mulheres, segundo o estado civil e a cor dos cabelos:

Casado Solteiro Desquitado Divorciado

Uma mulher é sorteada neste grupo. Determine a probabilidade dos eventos:

4.1. A - Ser casada. 4.2. B - Não ser loira. 4.3. C - Não ser morena nem ruiva.

4.4. D - Ser viúva.

4.5. E - Ser solteira ou casada. 4.6. F- Ser loira e casada. 4.7. G - Ser morena e solteira.

4.8. H - Ser viúva e ruiva.

H

1 O 5 7 8

M

8 3 5 4

Cor dos cabelos Loira Morena

8 4 1 1

Casada Solteira Viúva Divorciada

Ruiva

3 1 1 1

5 2 O 3

Page 162: ESTATISTICA - DJALMA

Probabilidades 161

5. Um experimento consiste em sortear um aluno em uma classe pela lista de cha- mada (I a 20).

Determine a probabilidade dos seguintes eventos:

5.1. A - Ser sorteado um número par.

5.2. B - Não ser sorteado múltiplo de 5.

5.3. C - Ser sorteado um número maior que 12 e múltiplo de 3.

5.4. D - Ser sorteado um número menor que 7 e múltiplo de 4.

5.5. E - Ser sorteado um número menor que 13, maior que 8 e múltiplo de 7.

5.6. F - Ser sorteado um número real.

RESPOSTAS

Page 163: ESTATISTICA - DJALMA

162 Estatística 1

7.1 1 Axiomas de Probabilidade

O cálculo de probabilidades pode ser desenvolvido a partir de três axiomas que o interessado aceitará facilmente, tendo em vista o que foi ex- posto anteriormente.

1) O I P ( A ) I 1

2) P(S) = 1

3) Se A e B são eventos mutuamente exclusivos, então, P ( A u B) = P(A) + P(B).

Page 164: ESTATISTICA - DJALMA

Cálculo de Probabilidades

8.1 Teoremas Fundamentais

8.1.1 1 P(0) = O I PROBABILIDADE DO CONJUNTO VAZIO

Prova: De fato, como o conjunto 0 não possui elementos, S u 0 = S.

Eventos iguais possuem os mesmos elementos e portanto a mesma probabilidade de ocorrência. Portanto, P(S u 0) = P(S).

Com relação ao primeiro membro da igualdade, S e 0 são eventos mutuamente exclusivos, e pelo axioma (3), P(S u 0 ) = P(S) + P(0).

Substituindo na expressão anterior, obtemos:

8.1.2 1 HCA) = 1 - H A ) I PROBABILIDADE DO COMPLEMENTAR

Prova: A u CA = S. Eventos iguais possuem os mesmos elementos e portanto a mesma probabilidade de ocorrência: P(A u CA) = P(S). Com relação ao primeiro membro da igualdade, A e CA são eventos mutuamente

. exclusivos, portanto, pelo axioma (3), P(A u CA) = P(A) + P(CA). Com relação ao segundo membro, pelo axioma (2), P(S) = 1. Substituindo estes valores, obtém-se:

P(A) + P(CA) = 1

P(CA) = I - P(A)

8.1.3 PROBABILIDADE DA REUNIÁO

Se A e B são eventos quaisquer, então:

Page 165: ESTATISTICA - DJALMA

164 Estatística 1

Prova: observando o diagrama

verificamos que: A u B = (A - B) u 9. Eventos iguais possuem os mesmos elementos e portanto a mesma probabilidade de ocorrência:

Com relação ao segundo membro, A - B e B são eventos mutuamente exclusivos e, pelo axioma (3),

Substituindo este valor na expressão anterior obtém-se:

Por outro lado, (A - B) u (A n B) = A. Eventos iguais possuem os mesmos elementos e portanto a mesma probabilidade de ocorrência:

q ( A - B) u (A n B)] = P(A).

Com relação ao primeiro membro, A - B e A n B são eventos mutua- mente exclusivos e, pelo axioma (3),

q ( A - B) u (A n B)] = P(A - B) + P(A n B)

Substituindo-se este valor na expressão anterior obtém-se:

P(A - B) + P(A n B) = P(A). Então:

P(A - B) = P(A) - P(A n B)

Page 166: ESTATISTICA - DJALMA

Cálculo de Probabilidades 165

Portanto, P(A u B) = P(A) - P(A n B) + P(5)

P(A u 5) = P(A) + P(B) - P(A n 5)

8.1.4 EXERC~CIOS PROPOSTOS

1. Se P(A) = 0,3, P(B) = 0,5 e P(A n B) = 0,1, determine P(A u B).

2. Se P(A) = 0,5, P(A n B) = 0,2 e P(A u B) = 0,9, determine P(B).

3. Se P(A u B) = 0,8, P(A) = 0,6 e P(B) = 0,5, determine P(A n 13).

4. Se P(A u B) = 0,8, P(A) = 0,7 e P(B) = 0,4, os eventos A e B são mutuamente exclusivos ?

5. Se P(A u B) = 0,9, P(A) = 0,4, P(B) = 0,5, os eventos A e B são mutuamente exclusivos ?

6. Se P(A u B) = 0,7 e P(A) = 0,2, determine P(B), sendo A e B eventos mutuamente exclusivos.

7. Se a probabilidade de não chover em determinada data é 0,25, qual é a probabili- dade de chover nesta mesma data?

8. Uma caixa contém 15 peças defeituosas em um total de 40 peças. Qual é a probabilidade de se selecionar ao acaso uma peça não defeituosa desta caixa?

9. Qual é a probabilidade de sair face 4 ou 5 em um lançamento de um dado?

10. Qual é a probabilidade de não sair face 4 ou 5 em um lançamento de um dado?

Respostas

1. 70%

2. 60%

3. 30%

4. Não. 5. Sim.

6. 50%

7. 75%

a 8. 5/8

9. 1/3

10. 213

8.5 Probabilidade Condicional

Introdução: Considere o lançamento de um dado e a observação da face superior.

O espaço amostra1 do experimento é S = (1, 2,3, 4,5, 6) e a função de probabilidade é:

Page 167: ESTATISTICA - DJALMA

168 Estatística 1

Os valores Pfb/,) = I/' no primeiro exemplo e P(TA) = 2/4 no segundo exemplo poderiam ser obtidos mais facilmente, sem a necessidade de reduzir o espaço amostral nem redefinir a função de probabilidade.

Podemos usar so o espaço amostral original e a função de probabili- dade original se considerarmos a seguinte definição:

Se P(A) z 0:

Assim, no primeiro exemplo, A = (2, 3, 5, 6) e B = (1, 2}

As probabilidades simples de A e B são: P(A) = 4/6 e P(B) = */6.

A intersecção de A e B é A n B = {2} e P(A n B) =

A probabilidade condicional de B em relação a A é:

No segundo exemplo, A = (2, 3, 4, 5) e B = (1, 3, 4)

As probabilidades simples de A e B são: P(A) = 9 6 e P(B) = 76.

A intersecção de A e B é A n B = (3, 4) e P(A n B) = 2/6.

A probabilidade condicional de B em relação a A é:

Da expressão

podemos obter a fórmula de cálculo da probabilidade para a intersecção de eventos:

Page 168: ESTATISTICA - DJALMA

Cálculo de Probabilidades 169

R A B) = RB/~) -44

Esta fórmula pode ser generalizada para vários eventos segundo uma regra baseada na associatividade de eventos:

Em particular, se A e B são eventos independentes, então P(B/A) = P(B), e substituindo-se o valor na fórmula de P(A n B), obtém-se:

Se A B, C e D são eventos independentes, então:

EXERC~CIOS RESOLVIDOS

1. Os estudantes de um colégio, presentes em uma reunião, foram classifica- dos por sexo e por opção da área de formação segundo o quadro abaixo:

Calcular as probabilidade de que:

a) Alunas optem por Administração.

b) Aluno opte por Economia.

c) Seja aluno sabendo-se que optou por Ciências Contábeis.

d) Aluno opte por Ciências Contábeis

F

8 5 4

M

ADM CC EC

10 6 8

Page 169: ESTATISTICA - DJALMA

M F

ADM 10 8 18 CC 6 5 11 EC 8 4 12

2. Uma rifa composta por 15 números irá definir o ganhador de dois prêmios sorteados um de cada vez. Se você adquiriu três números, qual é a prob- abilidade de ganhar os dois prêmios?

Soluçáo:

G, : Ganhar o primeiro prêmio G2: Ganhar o segundo prêmio

8.1.6 EXERC~CICIS PROPOSTOS

I. Duas bolas são retiradas, sem reposição, de uma urna que contém duas bolas brancas, três bolas pretas e cinco bolas vermelhas. Determine a probabilidade de que:

a) ambas sejam pretas

b) ambas sejam vermelhas

c) ambas sejam da mesma cor

d) ambas sejam de cores diferentes.

2. Resolva o problema anterior considerando as retiradas com reposição.

Page 170: ESTATISTICA - DJALMA

Cálculo de Probabilidades 171

3. Se P(A) = 0,3, P(B) = 0,5 e P(A n B) = 0,1, os eventos A e B são independentes?

4. Se P(A u B) = 0,8 e P(A) = 0,5, determine P(B) sendo A e B independentes.

5. Se P(A u B) = 0,8, P(A) = 0,6 e P(B) = 0,5, os eventos A e B são independentes?

6. Uma empresa garante, na embalagem de seu produto, que apenas 2% das peças produzidas por ela são defeituosas. Se adquirirmos uma caixa contendo 12 peças produzidas por esta empresa, qual é a probabilidade de que as duas primeiras peças selecionadas ao acaso desta caixa sejam defeituosas?

7. Um projeto para ser transformado em lei deve ser aprovado pela Câmara dos Deputados e pelo Senado. A probabilidade de ser aprovado pela Câmara dos Deputados é de 40%. Caso seja aprovado na Câmara dos Deputados, a probabili- dade de ser aprovado no Senado é 80%. Calcule a probabilidade deste projeto ser transformado em lei.

8. As pesquisas de opinião apontam que 20% da população é constituída por mulhe- res que votam no partido X. Sabendo-se que 56% da população são mulheres, qual é a probabilidade de que uma mulher selecionada ao acaso na população vote no partido X?

9. Uma empresa avalia em 60% a sua probabilidade de ganhar uma concorrência para o recolhimento do lixo em um bairro A da capital. Se ganhar a concorrência no bairro A, acredita que tem 90% de probabilidade de ganhar outra concorrência para o recolhimento do lixo em um bairro B próximo a A.

Determine a probabilidade de a empresa ganhar ambas as concorrências.

10. No primeiro ano de uma faculdade, 25% dos estudantes são reprovados em Matemática, 15% são reprovados em Estatística e 10% são reprovados em am- bas.

Um estudante é selecionado ao acaso, nesta faculdade. Calcule a probabilidade de que:

a) Ele seja reprovado em Matemática, sabendo-se que foi reprovado em Estatísti- ca.

b) Ele não seja reprovado em Estatística, sabendo-se que foi reprovado em Matemática.

RESPOSTAS

1. (a) l/15 fb) % 2. (a) %OO (b) V4 3. Não 4. 0,6

5. Sim

6. 0,0004

7. 0,32

a. 5/14

9. 0,54

10. (a) 9 3 (b) 0,6

(C) '%5 (4 31/45 (c) 38/100 (d) 62/100

Page 171: ESTATISTICA - DJALMA

172 Estatística 1

8.1.7 TEOREMA DA PROBABILIDADE TOTAL

Introdução: Suponha que o espaço amostral S de um experimento seja dividido em três eventos RI, R2, R3 de modo que:

R, n R2 = 0 R2 n R3 = 0

RI n R3 = 0

R, u R2 u R, = S

e considere um evento B qualquer. O evento B pode ser escrito como:

B = B n S.

Como S = RI u R2 u R3, então B = B n (R, u R2 u R3) ou

P(B) = P [ ( B n R,) u ( B n R2) u ( B n R,)]

Pelo fato de (B n R,), (B n R2), ( B n R3) serem eventos mutuamente excIusivos,

P(B) = P ( B n R,) + P ( B n R2) + P ( B n R3).

As intersecções do 2Wembro podem ser desenvolvidas segundo a fórmula P(A n B) = P(A/s) . P(B).

Assim:

Nesta dedução, dividimos o espaço amostral S em três partes, R,, R2 e R,.

O resultado final P(B) independe do número de divisões do espaço amostral.

Page 172: ESTATISTICA - DJALMA

Cálculo de Probabilidades 173

Assim, se tivéssemos dividido S em duas regiões apenas, R, e R2, então P(B) seria dado por:

Se tivéssemos dividido S em quatro regiões R,, R2, R3 e R4, então P(B) seria dado por:

O teorema da probabilidade total pode ser escrito de forma geral:

Exemplos:

1. Um piloto de Fórmula Um tem 50% de probabilidade de vencer determinada corrida, quando esta se realiza sob chuva. Caso não chova durante a corrida, sua probabilidade de vitória é de 25%. Se o serviço de Meteorologia estimar em 30% a probabilidade de que chova durante a corrida, qual é a probabilidade deste piloto ganhar esta corrida?

Solugáo: Definindo os eventos:

G: o piloto ganhar a corrida

Ch: chover durante a corrida

NCh: não chover durante a corrida

Então:

2. A experiência com testes psicotécnicos para habilitação de moto- ristas indica que 90% dos candidatos a habilitação aprovados no primeiro leste tornam-se excelentes motoristas.

70% dos candidatos reprovados no primeiro teste tornam-se péssimos 'motoristas. Admitindo-se a classificação dos motoristas apenas em excelentes ou péssimos, responda:

Page 173: ESTATISTICA - DJALMA

174 Estatística 1

a) Um candidato acaba de ser reprovado em seu primeiro teste psico- técnico. Qual é a probabilidade de que se torne um excelente motorista?

b) Um candidato acaba de ser aprovado em seu primeiro teste psico- técnico. Qual é a probabilidade de que se torne um péssimo moto- rista?

c) Um indivíduo acaba de fazer um teste psicotécnico. Se 80% dos candidatos são aprovados neste teste, qual é a probabilidade de que se torne um excelente motorista?

Solução: Definindo os eventos:

A: o candidato ser aprovado no primeiro teste

R: o candidato ser reprovado no primeiro teste

E: o candidato tornar-se excelente motorista

P: o candidato tornar-se péssimo motorista

Então:

a) P(VR) = 1 - -(?R) = 1 - 0,70 = 0,30 OU 30%

b) P(qA) = 1 - P(VA) = 1 - 0,90 = 0,10 OU 10%

C) P(E) = P(%) . P(A) + P(%) . P(R)

P(E) = 0,90 . 0,80 + 0,30 . 0,20

P(E) = 0,78 ou 78%

8.1.8 EXERC~CIOS PROPOSTOS

1. As máquinas A e B são responsáveis por 70% e 30% respectivamente da produ- ção de uma empresa.

A máquina A produz 2% de peças defeituosas e a máquina B produz 8% de peças defeituosas.

Calcule o percentual de peças defeituosas na produção desta empresa.

2. Um aluno propõe-se a resolver uma questão de um trabalho.

A probabilidade de que consiga resolver a questão sem necessidade de uma pesquisa é de 40%. Caso faça a pesquisa, a probabilidade de que consiga resol- ver a questão é de 70%.

Se a probabilidade do aluno fazer a pesquisa é de 80%, calcule a probabilidade de que consiga resolver a questão.

Page 174: ESTATISTICA - DJALMA

Cálculo de Probabilidades 175

3. Uma junta apuradora de votos recebe 50 urnas. Sabe-se que cinco urnas são de bairros habitados por indivíduos da classe A, 15 urnas de bairros habitados por indivíduos da classe B e 30 urnas são de bairros habitados por indivíduos da classe C. A última pesquisa realizada mostrou o quadro de intenções de votos:

Intenção de votos por bairros (%)

Candidato BAIRRO A BAIRRO B BAIRRO C

Ventarola

I Calcule a probabilidade de que:

I a) O primeiro voto anunciado seja do candidato Ventarola. ~ b) O primeiro voto anunciado não seja do candidato H. C,

4. Um pesquisador desenvolve sementes de quatro tipos de plantas, P,, P2, P3 e P4. Plantados canteiros-pilotos destas sementes, a probabilidade de todas germi- narem é de 40% para P1, 30% para P2, 25% para P3 e 50% para P4.

Um canteiro-piloto é selecionado ao acaso. Qual é a probabilidade de que todas as sementes ali plantadas tenham germinado?

5. Um médico plantonista está examinando uma vítima de envenenamento que acaba de dar entrada no hospital. Um rápido exame preliminar leva o médico a concluir que o envenenamento é devido a ingestão de uma das drogas A ou B ou C. Ele dispõe de dois tipos de medicamentos com o seguinte quadro de eficácia:

Medicamento

Qual é o medicamento que o plantonista deve ministrar, se a urgência da situação não lhe permite outras opções?

Droga ingerida

A B C

I I RESPOSTAS

Eficácia específica (%)

1. 3,8% 2. 64%

3. a) 5,5%

b) 72%

4. 36,25%

5. O medicamento M2'

Mi

70 40 80

MP

50 90 60

Page 175: ESTATISTICA - DJALMA

176 Estatística 1

8.1.9 TEOREMA DE BAYES

Note que no caso da determinação de P(B) através da utilização do teorema da probabilidade total

P(B) = P(B/R,).P(R1) + P('/R~).P(R~) +-..+ P(B/RJ.P(R~),

precisamos obviamente conhecer as probabilidades condicionais P(B/n), P(B/n,),..., P(B/~), que representaremos de modo genérico por P ( 9 , para i = 1, 2 ,..., n.

Se desejarmos avaliar uma probabilidade condicional do tipo P(Ri/&, devemos utilizar o teorema 4. Assim,

A expressão do numerador P(Ri n B) pode ser desenvolvida para:

e a expressão do denominador P(B) pode ser desenvolvida pelo teorema 5.

Substituindo-se estes valores, obtém-se:

Esta particular combinação dos teoremas 4 e 5 é denominada teore- ma de Bayes.

EXERC~CIOS RESOLVIDOS

1. As máquinas A e B são responsáveis por 60% e 40% respectivamente, da produção de uma empresa.

Os índices de peças defeituosas na produção destas máquinas valem 3% e 7% respectivamente. Se uma peça defeituosa foi selecionada da produ- ção desta empresa, qual é a probabilidade de que tenha sido produzida pela máquina B3

Page 176: ESTATISTICA - DJALMA

Cálculo de Probabilidades 177

Solução: Definidos os eventos:

A: a peça ter sido produzida pela máquina A. B: a peça ter sido produzida pela máquina B.

d a peça ser defeituosa.

Então:

Uma empresa de material cerâmico está desenvolvendo um modelo de caneca para chope e deverá lançá-la numa tradicional festa do chope em Santa Catarina. Esta empresa sabe que uma concorrente está desenvol- vendo um projeto similar com as mesmas intenções e acredita que a probabilidade de o concorrente lançar o produto ainda este ano é de 40%.

Um fornecedor comum se oferece para bisbilhotar a concorrente para saber ao certo se o lançamento será ou não efetuado este ano. A empresa acredita que se ele confirmar o fato, há 60% de probabilidade dele estar correto. Caso o fornecedor não confirme o lançamento, a probabilidade de estar correto é de 90%. Avalie a nova expectativa da empresa:

a) No caso de o fornecedor confirmar o evento.

b) No caso de o fornecedor negar o evento. Solução: Definindo os eventos:

L: A empresa concorrente lançar o produto este ano.

NL: A empresa concorrente não lançar o produto este ano.

DS: O fornecedor dizer que a concorrente lançará o produto este ano.

DM O fornecedor dizer que a concorrente não lançará o produto este ano.

Page 177: ESTATISTICA - DJALMA

178 Estatística 1

8.1.1 0 EXERC~CIOS PROPOSTOS

I. Em uma agência bancária, 30% das contas são de clientes que possuem cheque especial, O histórico do banco mostra que 3% dos cheques apresentados são devolvidos por insuficiência de fundos e que dos cheques especiais, 1% são devolvidos por insuficiência de fundos. Calcule a probabilidade de que:

a) Um cheque não especial que acaba de ser apresentado ao caixa seja de- volvido.

b) um cheque seja especial, sabendo-se que acaba de ser devolvido. 2. A associação das seguradoras de veículos afirma que 40% dos veículos em

circulação possuem seguro e que dos veículos sinistrados 45% possuem seguro.

O Departamento de Trânsito informa que 8% dos veículos sofrem algum tipo de sinistro durante um ano. Calcule a probabilidade de que um veículo segurado não sofra um sinistro durante um ano.

3. Um pesquisador desenvolve sementes de quatro tipos de plantas, P,, P2, P3 e Pq. Plantados canteiros-pilotos destas sementes, a probabilidade de todas germr- narem é de 40% para P,, 30% para P2, 25% para P3 e 50% para P,.

a) Escolhido um canteiro ao acaso, verificou-se que nem todas as sementes haviam germinado. Calcule a probabilidade de que o canteiro escolhido seja o de sementes de P,.

b) Escolhido um canteiro ao acaso, verificou-se que todas as sementes haviam germinado. Calcule a probabilidade de que o canteiro escolhido seja o de sementes de P,.

4. Um candidato e seus correligionários têm uma expectativa de 90% de que gan- harão as próximas eleições. Um auxiliar de campanha resolveu por conta própria fazer uma pesquisa sobre o fato, entrevistando indivíduos do comitê do candidato e de pessoas que lá compareciam para pedir favores em troca de votos.

Se o resultado desta pesquisa confirmar o fato, nada se altera ou seja, a probabili- dade de a pesquisa acertar o resultado é de 90%.

Se o resultado não confirmar a expectativa, o ambiente se modifica, já que nestas circunstâncias, a pesquisa tem credibilidade quase total. Considerando estes fatos, ele atribui a pesquisa uma probabilidade de 98% de acertar, se concluir pela derrota nas eleições., Se este fato ocorrer, qual é a nova expectativa do candidato?

5. O encarregado de uma agência de detetives comenta com uma cliente: Se chegar- mos a conclusão de que seu marido é infiel, pode acreditar, pois nossa margem de erro é de apenas 5%. Entretanto, se as provas que conseguirmos não forem convincentes, diremos que ele é fiel. Neste caso, nossa margem de erro é 30%. A cliente diz ter quase certeza de que o marido é infiel, isto é, acha que a prob- abilidade disto ocorrer é de 90%.

a) Se a investigação concluir que o marido é infiel, qual é a nova expectativa da cliente ?

b) E se a investigação concluir que não?

Page 178: ESTATISTICA - DJALMA

Cálculo de Probabilidades 179

RESPOSTAS

8.2 Exercícios Gerais

Os funcionários de uma empresa foram classificados de acordo com seu grau de escolaridade e nível salarial segundo o quadro abaixo:

- -

Nível l

Nível II

Nível III

Nível IV

lo Grau 3" Grau

Um funcionário é escolhido ao acaso. Determine a probabilidade de que:

1. Tenha somente o primeiro grau.

2. Tenha o segundo grau.

3. Tenha somente o segundo grau. 4. Tenha nível salarial I1 e 2"grau.

5. Tenha nível salarial 111 sabendo-se que tem 3"grau.

6. Tenha 2"grau sabendo-se que tem nível salarial 111.

7. Tenha 3" grau e nível salarial I.

8. Tenha nível salarial 111 ou 2" grau.

9. Tenha nível salarial menor que 111. 10. Tenha 1" ou 2Qrau sabendo-se que tem nível salarial maior que 11.

I I. Uma empresa produz 4% de peças defeituosas. O controle de qualidade da empresa é realizado em duas etapas independentes. A primeira etapa acusa uma peça defeituosa com 80% de probabilidade de acerto. A segunda etapa acusa uma peça defeituosa com 90% de probabilidade.

Calcule a probabilidade de que:

a) Uma peça defeituosa passe pelo controle de qualidade.

b) Ao adquirir uma peça produzida por esta empresa, ela seja defeituosa.

Page 179: ESTATISTICA - DJALMA

180 Estatística 1

12. Uma pesquisa realizada sobre a preferência dos consumidores por três categorias de veículos A, B e C de uma indústria automobilística revelou que dos 500 entre- vistados,

2 10 preferiam o veículo A

230 preferiam o veículo B

160 preferiam o veículo C

90 preferiam o veículo A e B

90 preferiam os veículos A e C

70 preferiam os veículos B e C.

120 dos entrevistados não preferiam nenhuma das três categorias.

Um consumidor é selecionado ao acaso entre os entrevistados. Calcule a proba-bi- lidade de que:

a) Ele prefira as três categorias.

b) Ele prefira somente uma das categorias.

c) Ele prefira pelo menos duas categorias. 13. As fábricas A, B e C são responsáveis por 50%, 30% e 20% do total de peças

produzidas por uma companhia. Os percentuais de peças defeituosas na produção destas fábricas valem respectivamente 1%, 2% e 5%. Uma peça produzida por esta companhia é adquirida em um ponto de venda. Determine a probabilidade de que:

a) A peça seja defeituosa.

b) A peça tenha sido produzida pela fábrica C, sabendo-se que é defeituosa.

c) Não tenha sido produzida pela fábrica A se ela é boa. 14. Uma pessoa compra três bilhetes de uma rifa de 100 bilhetes, que dá vários

prêmios. Calcule a probabilidade de que esta pessoa:

a) ganhe o prêmio do primeiro sorteio.

b) ganhe o prêmio do segundo sorteio, se ela não ganhou o prêmio do primeiro sorteio.

c) ganhe os prêmios do primeiro e do segundo sorteios.

d) não ganhe nenhum dos prêmios dos cinco sorteios realizados.

e) ganhe pelo menos um prêmio nos cinco sorteios realizados. 15. Uma máquina produz parafusos e sabe-se que o percentual de parafusos defeituo-

sos produzidos é de 0,5%. Sabendo-se que a fabricação constitui um processo independente, calcule a probabilidade de:

a) Aparecer dois parafusos defeituosos em sequência.

b) Aparecer um parafuso defeituoso e um parafuso perfeito, em sequência nesta ordem.

c) Aparecer um parafuso perfeito e um parafuso defeituoso em sequência.

d) Aparecer três parafusos perfeitos em sequência.

Page 180: ESTATISTICA - DJALMA

Cálculo de Probabilidades 181

16. Uma junta apuradora de votos recebe 50 urnas, dos quais 5 vindas de bairro classe A, 15 de bairros classe B e 30 de bairros classe C, A última pesquisa realizada mostrou o quadro de intenções de votos:

Intenção de votos por bairros (%)

Candidato BAIRRO A BAIRRO B BAIRRO C

Ventarola

O primeiro voto anunciado foi do candidato HC. Um partidário de LALÚ disse que o voto é de um indivíduo da classe A. Qual a probabilidade de ele estar certo?

1 7. Uma pesquisa realizada entre 200 clientes de uma agência de automóveis mos- trou que 150 preferem carros nacionais, 100 preferem carros populares e 80 preferem carros populares nacionais. Calcule a probabilidade de que o próximo cliente a ser atendido nesta agência:

a) solicite um carro nacional

b) não solicite um carro popular

c) solicite um carro popular ou nacional 18. No dapartamento de métodos quantitativos de uma Faculdade, 60% dos professo-

res lecionam Matemática, 30% lecionam Estatística e 20% dos professores de Matemática também lecionam Estatística. Calcule a probabilidade de que um pro- fessor selecionado ao acaso no Departamento:

a) lecione Matemática e Estatística

b) lecione Matemática e não lecione Estatística

c) lecione Estatística e não Matemática d) lecione Matemática ou Estatística

e) não lecione Matemática, sabendo-se que leciona Estatística. 19. O departamento de desenvolvimento de projetos de uma empresa emprega cinco

engenheiros. O encarregado deste departamento foi informado da presença de um espião industrial entre eles, e organizou um teste que identifica o espião. Se o teste for aplicado mais que duas vezes, por problemas de intercomunicação, ele perde 80% de sua eficácia a cada vez que é aplicado. Calcule a probabilidade de que:

a) O espião seja identificado no máximo no segundo teste

b) O espião seja identificado somente no terceiro teste

c) O espião não seja identificado pelo teste. 20. A probabilidade de que um carro apresente problemas de carburação é de 40%, e

de distribuição é de 30%. Se o problema for de carburação, a probabilidade de conserto no local é de 80%. Se o problema for de distribuição, a probabilidade de conserto no local é de 60%. Se o problema for de outra natureza, a probabilidade de conserto no local é d e 10%.

Page 181: ESTATISTICA - DJALMA

182 Estatística 1

Um carro acaba de apresentar problemas. Calcule a probabilidade de que seja concertado no local.

21. Uma pessoa deseja fazer sua barba de manhã.

Ele possui para isto apenas um barbeador elétrico que funciona com um conversar ligado a rede elétrica, ou com duas pilhas.

A probabilidade de que não haja problemas de energia elétrica no momento é de 90%.

Caso haja problemas de energia elétrica, ele possui duas pilhas usadas, cuja probabilidade individual de funcionamento é de 40%.

Calcule a probabilidade de que esta pessoa consiga fazer sua barba de manhã.

22. Uma empresa está desenvolvendo três projetos. Uma avaliação no estágio atual de desenvolvimento dos projetos resultou na tabela abaixo:

Qual é a probabilidade de a empresa terminar pelo menos dois projetos no prazo, se:

Probabilidade de terminar no prazo

- Otimista - Probabilidade de terminar no prazo

- Pessimista -

a) O avaliador é otimista

b) O avaliador é pessimista

A

80%

40%

23. Em determinada corrida, a chance de um piloto vencer é, segundo os especialis- tas, de "3 para 2".

Calcule a probabilidade de que:

B

70%

20%

a) o piloto vença a corrida

C

50%

5%

b) o piloto não vença a corrida, se um defeito inesperado reduzir sua chance para "40 para 100".

24. Um defeito na fabricação produziu um dado cuja probabilidade de apresentar face par em um lançamento é o dobro da probabilidade de apresentar face ímpar. Efetua-se um lançamento deste dado e observa-se o número de pontos da face superior.

a) Defina a função de probabilidade associada ao espaço amostra1 do experi- mento.

b) Calcule a probabilidade de se obter um número primo.

c) Calcule a probabilidade de em dois lançamentos deste dado obtermos a soma dos pontos observados maior que 9.

d) Calcule a probabilidade de que em dois lançamentos destes dados a soma dos pontos seja ímpar, sabendo-se que o número de pontos no primeiro lançamento é superior a 4.

Page 182: ESTATISTICA - DJALMA

Cálculo de Probabilidades 183

25. Uma peça é processada em três máquinas A, B e C. A probabilidade de cada uma delas acarretar defeitos na peça é de 1 %, 2% e 3% independentemente. Calcule a probabilidade de que:

a) Uma peça seja processada sem defeitos

b) Exatamente duas peças entre três processadas apresentem defeito

c) Apenas uma em mil peças processadas em um dia seja defeituosa. 26. Uma fábrica de bonecas tem três linhas de produção. Um levantamento no final do

dia forneceu as informações:

Linha Produção N q e peças defeituosas

Calcule a probabilidade de que uma boneca escolhida ao acaso:

a) Não apresente defeitos

b) Apresentando defeitos, seja proveniente da linha A. 27. Os jogadores A e B jogam 12 partidas de xadrez. A vence seis, B vence quatro e

duas terminam empatadas. Eles irão disputar mais três partidas constantes de um torneio. Qual é a probabilidade de:

a) A vencer as três partidas. 6) Duas partidas terminarem empatadas.

c) B vencer pelo menos uma partida. 28. Uma pessoa foi contactada por uma agência de turismo afirmando que ela havia

sido sorteada e ganho uma viagem de graça para a cidade de Natal. A pessoa acredita que haja uma probabilidade de 70% de a proposta ser séria. Consultando um amigo familiarizado com estas promoções, ele afirmou que a proposta era séria. A expectativa de que o amigo acerte um caso afirmativo é de 90% e em caso negativo é de 50%. Qual é a nova confiança da pessoa na lisura da propos- ta ?

29. Uma empresa de consultoria, especialista em solucionar problemas relativos a lançamentos de produtos, classifica os problemas apresentados em três catego- rias A, B e C.

50% dos problemas são classificados na categoria A, 40% na categoria B e o restante na categoria C.

A capacidade histórica de resolver problemas das diversas categorias é de 80% se o problema for da categoria A, 90% se for da B e 10% se for da C. Calcule a probabilidade de que:

a) A empresa consiga solucionar o primeiro problema a dar entrada no dia de hoje.

b) A empresa consiga solucionar os três problemas que entraram no dia de hoje.

c) Um dos problemas que entraram hoje, acaba de ser resolvido. Qual é a probabilidade que seja da categoria C?

Page 183: ESTATISTICA - DJALMA

184 Estatística 1

30. Uma imobiliária trabalha com os vendedores A e B.

A probabilidade de A vender um imóvel é de 5% e a de B vender é de 8%. Operando normalmente, qual é a probabilidade de que:

a) um deles venda um imóvel

b) apenas um deles venda um imóvel c) nsnhum deles venda

31. Dois homens e três mulheres disputam um torneio de pôquer. As pessoas do mesmo sexo são igualmente hábeis porém sabe-se que historicamente a probabili- dade de um homem ganhar o torneio é o dobro da probabilidade de uma mulher ganhar. Calcule a probabilidade de que:

a) Uma mulher vença o torneio.

b) Se existe entre os participantes apenas um homem solteiro e uma mulher solteira, uma pessoa solteira ganhe o torneio.

32. Uma urna contém dois cartões vermelhos numerados 1 e 2 e dois cartões pretos também numerados 1 e 2. Os cartões são idênticos, exceto na cor e no índice anotado. Dois cartões são selecionados ao acaso sem reposição.

a) Determine o espaço amostra1 do experimento.

b) Determine a função de probabilidade associada.

c) Determine a probabilidade de que ambos sejam vermelhos.

d) Determine a probabilidade de cores e índices diferentes.

e) Determine a probabilidade de que ambos sejam vermelhos, sabendo-se que o primeiro é vermelho.

f) Determine a probabilidade de que ambos tenham o mesmo índice, dado que têm a mesma cor.

33. Um grupo de 150 modelos disputam um concurso de beleza. Elas foram classifica- das por estatura e cor dos cabelos.

Média Baixa

Cabelos

Loira Morena Ruiva 20

A ordem de entrada das concorrentes para o desfile é feita por um sorteio executa- do pelo apresentador.

Calcule a probabilidade de que:

a) A próxima concorrente a desfilar seja loira.

b) Se a próxima concorrente a desfilar for ruiva, ter estatura baixa.

c) A próxima concorrente a desfilar seja alta e que tenha cabelos morenos ou ruivos.

34. Se os eventos A e B são tais que: P(A) = 0,3, P(B) = 0,6, calcule:

Page 184: ESTATISTICA - DJALMA

Cálculo de Probabilidades 185

a) P(A n B) se A e B são independentes,

b) P(A u B) se A e B são mutuamente exclusivos.

C) P(%) se P(A n B) = 0,2.

d) P(A u B) se P(A n B) = 0,2. 35. No lançamento de um dado e na observação do número de pontos da face

superior, os eventos:

A = 12, 3, 4, 51

B = 13, 6)

a) são mutuamente exclusivos?

b) são independentes?

36. No lançamento de dois dados e na observação do número de pontos ,das faces superiores, determine a probabilidade de que:

a) O número de pontos de uma face supere a outra em mais que duas unidades.

b) O número de pontos de uma face seja o dobro do número de pontos da outra face.

37. O espaço amostral de um experimento é S = {2,4,3, 71 e a probabilidade de cada elemento é diretamente proporciona/ ao valor destes elementos.

a) Determine a função de probabilidade associada ao espaço amostral.

b) Se A = {2, 31, determine P(A). c) determine P(CA)

d) Se B = 12, 71, determine P(A u B).

38. Se A e B são eventos, com P(A) = 0,2 e P(B) = 0,3, e A e B são independentes, calcule:

a) P(CA)

b) P(CB)

C) P(A U S)

d) P( B / ~ )

39. Numa igreja, 60% dos fiéis são mulheres. Das mulheres, 30% são iniciantes. Entre os homens, 80% são veteranos. Levando-se em conta esta classificação, o pastor sorteia grupos de duas pessoas, para diretoria e tesouraria de uma quermesse.

a) Qual é o espaço amostral deste experimento em função da classificaçáo?

b) Qual é a probabilidade de que um casal sorteado ao acaso tenha dois vetera- nos?

c) Qual é a probabilidade de que um grupo sorteado ao acaso tenha dois inician- tes?

40. Um par é escolhido ao acaso do produto cartesiano A x B, onde:

A = { 1 , 2, 3) e B = { I , 2, 3, 4). Descreva os eventos:

a) E, = { ( x , y ) ~ A x B I x = y )

b) E,={(x,y)~ A x B l x + y = 4 }

Page 185: ESTATISTICA - DJALMA

186 Estatística 1

Se os pares ordenados do produto cartesiano A x B são igualmente prováveis, determine a probabilidade do seguinte evento: C) E, = { ( x , ~ ) Q A x B I ~ = ) ? }

RESPOSTAS

Page 186: ESTATISTICA - DJALMA

Cálculo de Probabilidades 187

21. 91.60% 22. a) 75%

b) 10,2% 23. a) 60%

b) 28,57% 24. a) P(l) = (P3) = P(5) = 1/9

P(2) = P(4) = P(6) = 24

b) 4/9 c) 17/81

d) 4/27 25. a) 94,11%

b) 0,98% c) zero

26. a) 87.5%

b) 60% 27. a) 1/8

b) 5/72 c) 19/27

28. 80,77% 29. a) 77% ~ b) 45,65%

C) 1,30% I 30. a) 12,60%

I b) 12,20% I C) 87,4%

31. a) 3/7

6) 3/7

32. a) V1V2, VIP,, V,P,, V,Vl, V2Pl, V2P2

PlV1, P1V2, PlP2, p2v7, p2v* P2P,

b) P(Vl V,) = P(VIPl) = ... = P(P2P,) = 1/12 C) 1/6 d) 7/3 e) 1/6

33. a) 30%

b) 37,5% C) 14.67%

34. a) 18% b) 90%

C) 1/3

d) 0,7 , 35. a) Não " b) Não -' . 36. a) 1/3

b) 1/6 37. a) P(2) = 2/16, P(4) = 4/16, P(3) = 3/16, P(7) = 7/16

b) 5/16 C) 11/!6 d) 75%

38. a) 80% b) 70%

Page 187: ESTATISTICA - DJALMA

188 Estatística 1

Page 188: ESTATISTICA - DJALMA

Bibliografia

BUSSAB, W. O., MORETIN, F? A. Estatística básica. 3. ed. São Paulo : Atual, 1986.

CHACON, P. E. Curso breve de estatística. 2. ed. Universidad de Duesto, 1965.

CLARKE, A. B., DISNEY, R. L. Probabilidade e processos estatísticos. Rio de Janeiro : LTC, 1979.

COSTA NETO, F? L. O. Estatística. São Paulo : Edgard Blucher, 1977.

FONSECA, J. S., MARTINS, G. A. Curso de estatística. 3. ed. São Paulo : Atlas, 1984.

GATTÁS, R. R. Elementos de probabilidades e inferência. São Paulo : Atlas, 1978.

GÓES, L. A. C. Estatística: uma abordagem decisorial. São Paulo : Saraiva, 1980. v. 1.

GUERRA, J. G., DONAIRE, D. Estatística indutiva. 4. ed. São Paulo : LCTE, 1990.

KARMEL, F? H., POLASEK, M. Estatística geral e aplicada a economia. 2. ed. São Paulo : Atlas, 1976.

MARTINS, G. A., DONAIRES, D. Princ@ios de estatística. São Paulo : Atlas, 1979.

MEYER, P. L. Probabilidade: aplicações a estatística. Rio de Janeiro : LTC, 1 969.

SPIEGEL, M. R. Estatística. 2. ed. São Paulo : McGraw-Hill, 1985.

STEVENSON, W. J. Estatktica aplicada a administração. São Paulo : Harbra, 1981.

WONNACOTT, T. H., WONNACOTT, R. J. Estatística aplicada a economia e administração. Rio de Janeiro : LTC, 1981.

Page 189: ESTATISTICA - DJALMA