liead401probabilidade e estatistica completo

155
Universidade Federal de Roraima Núcleo de Educação a Distância Pró-Reitoria de Ensino e Graduação Centro de Ciências e Tecnologia Departamento de Ciência da Computação Curso de Licenciatura em Informática a Distância Sebastião A. Carneiro PROBABILIDADE E ESTATÍSTICA

Upload: tiago-flach-de-lima

Post on 21-Jan-2016

406 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: LIEaD401Probabilidade e Estatistica COMPLETO

Universidade Federal de Roraima

Núcleo de Educação a DistânciaPró-Reitoria de Ensino e Graduação

Centro de Ciências e TecnologiaDepartamento de Ciência da Computação

Curso de Licenciatura em Informática a Distância

Sebastião A. Carneiro

PROBABILIDADE E ESTATÍSTICA

Page 2: LIEaD401Probabilidade e Estatistica COMPLETO

Governo Federal

Ministro de Educação

Fernando Haddad

Ifes – Instituto Federal do Espírito Santo

Reitor

Denio Rebello Arantes

Pró-Reitora de Ensino

Cristiane Tenan Schllittler dos Santos

Diretora do CEAD – Centro de Educação a Distância

Yvina Pavan Baldo

Coordenadoras da UAB – Universidade Aberta do Brasil

Elton Siqueira MouraDanielli Veiga Carneiro Sondermann

Curso de Licenciatura em Informática

Coordenação de Curso

Jonathan Toczek

Designer Instrucional

Edmundo Rodrigues Júnior

Professor Especialista/Autor

Sebastião A. Carneiro

Catalogação na fonte: Renata Lorencini Rizzi - CRB 6/685

C289p Carneiro, Sebastião Alves

Probabilidade e estatística / Sebastião Alves Carneiro. Vitória: Ifes, 2010.

155 p. : il.

1. Probabilidades. 2. Es t a t í t i c Tecnologia do Espírito Santo. II. Título.

CDD 519.86

DIREITOS RESERVADOS

IFES – Centro Federal de Educação Tecnológica do Espírito Santo

Avenida Rio Branco, nº 50 Santa Lúcia - CEP. 29056-255 – Vitória – ES - Telefone: 3227-5564

Créditos de autoria da editoração

Capa: Juliana Cristina da SilvaProjeto grá� co: Juliana Cristina e Nelson Torres

Iconogra� a: Nelson TorresEditoração eletrônica: Duo Translations

Revisão de texto: Esther Ortlibe Faria de Almeida

COPYRIGHT – É proibida a reprodução, mesmo que parcial, por qualquer meio, sem autorização escrita dos autores e do detentor dos direitos autorais.

a. I. Instituto Federal de Educação, Ciência e

Page 3: LIEaD401Probabilidade e Estatistica COMPLETO

Olá, Aluno(a)!

É um prazer tê-lo conosco.

O Ifes oferece a você, em parceria com as Prefeituras e com o Governo Federal, o Curso de Licenciatura em Informática, na modalidade à distância.

Apesar de este curso ser ofertado à distância, esperamos que haja proximi-dade entre nós, pois, hoje, graças aos recursos da tecnologia da informação (e-mails, chat, videoconferênca, etc.), podemos manter uma comunicação efetiva.

É importante que você conheça toda a equipe envolvida neste curso: coordenadores,

professores especialistas, tutores à distância e tutores presenciais.

Assim, quando precisar de algum tipo de ajuda, saberá a quem recorrer.

Na EaD - Educação a Distância - você é o grande responsável pelo sucesso da aprendizagem. Por isso é necessário que se organize para os estudos e para a realização de todas as atividades, nos prazos estabelecidos, conforme

orientação dos Professores Especialistas e Tutores.

Fique atento às orientações de estudo que se encontram no Manual do Aluno!

A EaD, pela sua característica de amplitude e pelo uso de tecnologias mo-dernas, representa uma nova forma de aprender, respeitando, sempre, o seu tempo.

Desejamos a você sucesso e dedicação!

Equipe do Ifes

Page 4: LIEaD401Probabilidade e Estatistica COMPLETO

Fala do Professor

Conceitos importantes. Fique atento!

Atividades que devem ser elaboradas por você, após a leitura dos textos.

Indicação de leituras complemtares, referentes ao conteúdo estudado.

Destaque de algo importante, referente ao conteúdo apresentado. Atenção!

Re� exão/questionamento sobre algo impor-tante referente ao conteúdo apresentado.

ICONOGRAFIA

Veja, abaixo, alguns símbolos utilizados neste material para guiá-lo em seus estudos

Espaço reservado para as anotações que você julgar necessárias.

LICINF_4P_ProbEsta_DIAGRAMACAO.indd 4LICINF_4P_ProbEsta_DIAGRAMACAO.indd 4 21/12/2010 17:30:4521/12/2010 17:30:45

Page 5: LIEaD401Probabilidade e Estatistica COMPLETO

PROBABILIDADE E ESTATÍSTICA

Cap. 1 - AMOSTRAGEM 11

1.2. Histórico 11

1.3. Método estatístico 11

1.4. Fases do método estatístico 12

1.5 Conceitos básicos 13

1.5.1 População 13

1.5.2 Amostras 14

1.5.3 Variável 15

1.6. Amostragem 16

1.6.1 Amostragem casual ou aleatória simples 17

1.6.2 Amostragem sistemática 18

1.6.3 Amostragem proporcional estratificada 19

2.1 Série estatística 23

Cap. 2 - SÉRIES E CONSTRUÇÃO DE GRÁFICOS 23

2.1.1 Série temporal 24

2.1.2 Série geográfica 24

2.1.3 Série específica 25

2.1.4 Séries conjugadas 25

2.2.1 Diagramas 26

2.3 Uso indevido de gráficos 34

3.1 Distribuição de frequência 37

Cap. 3 - MÉTODOS GRÁFICOS 37

3.1.1 Tabela primitiva ou tabela de dados brutos 37

3.1.2 ROL 39

3.1.3 Distribuição de frequência sem intervalos de classe 39

3.1.4 Distribuição de frequência com intervalos de classe 41

3.1.5 Polígono de frequência 48

3.1.6 Curva de frequência (curva polida): 50

4.1 Medidas de posição 55

Cap. 4 - MEDIDAS DE ORDENAMENTO E DE POSIÇÃO 55

4.2 Média de população e de amostras 55

4.3 Representação dos valores de uma série de valores 56

LICINF_4P_ProbEsta_DIAGRAMACAO.indd 5LICINF_4P_ProbEsta_DIAGRAMACAO.indd 5 21/12/2010 17:30:4521/12/2010 17:30:45

Page 6: LIEaD401Probabilidade e Estatistica COMPLETO

4.4 Média aritmética ( x ) 56

4.4.1 Média Aritmética para dados não-agrupados: 57

4.4.2 Desvio em relação à média 57

4.4.3 Propriedades da média 58

4.5 Moda (Mo) 63

4.5.1 Moda quando os dados não estão agrupados 64

4.5.2 Moda quando os dados estão agrupados 64

4.6 Mediana (MD) 67

4.6.1 Mediana para série com número ímpar de termos 67

4.6.2 Mediana para série com número par de termos: 67

4.6.3 Mediana para série com dados agrupados 68

4.7 Assimetria 73

4.8 Separatrizes 74

4.8.1 Quartis 74

4.8.2 Decis 79

4.8.3 Percentil ou Centil 80

5.1 Medidas de dispersão 84

Cap. 5 - MEDIDAS DE VARIABILIDADE 83

5.2 Medidas de dispersão absoluta 85

5.2.1 Amplitude total (AT): 85

5.2.2 Variância 86

5.2.3 Desvio padrão – S 93

5.2.4 Coeficiente de variação de Pearson - CVP 96

6.1 Experimento aleatório 99

Cap. 6 - PROBABILIDADE 99

6.2 Espaço amostral 100

6.3 Eventos 101

6.4 Conceito de probabilidade 103

6.4.1 Eventos complementares 105

6.4.2 Combinações dos eventos 105

6.5 Técnicas de contagem em probabilidade 111

6.5.1 Permutação sem repetições 111

6.5.2 Permutação com repetições 112

6.5.3 Arranjo 112

6.5.4 Combinação 114

Cap. 7 - VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÕES DISCRETAS 119

7.1 Variável aleatória 119

7.2 Distribuição de probabilidade 120

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec2:6LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec2:6 21/12/2010 17:30:4521/12/2010 17:30:45

Page 7: LIEaD401Probabilidade e Estatistica COMPLETO

7.3 Valor esperado (esperança matemática) 123

7.4 Distribuição binomial 125

7.5 DISTRIBUIÇÃO DE POISSON 128

Cap. 8 - VARIÁVEIS CONTÍNUAS E DISTRIBUIÇÕES CONTÍNUAS 133

8.1 Variável aleatória contínua 133

8.2 Função densidade de probabilidade (FDP) 133

8.3 Distribuição uniforme 137

8.4 Distribuição normal (GAUSS) 140

8.4.1 Vantagem da distribuição normal 141

8.4.2 A probabilidade dentro do intervalo (a,b) 142

8.4.3 Influência dos parâmetros na forma da distribuição

normal 143

8.5 Distribuição normal reduzida – Z 143

8.5.1 Utilização da tabela Z 144

REFERÊNCIAS BIBLIOGRÁFICAS 151

ANEXOS 153

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:7LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:7 21/12/2010 17:30:4621/12/2010 17:30:46

Page 8: LIEaD401Probabilidade e Estatistica COMPLETO
Page 9: LIEaD401Probabilidade e Estatistica COMPLETO

APRESENTAÇÃO

Olá, Aluno (a)!

Seja bem-vindo (a) ao nosso curso de Probabilidade e Estatística!

Sou o professor Sebastião Alves Carneiro, responsável pela gerência e pro-dução de material dessa disciplina, no curso de Curso de Licenciatura em Informatica, na modalidade a distancia.

Sou formado em Engenharia Elétrica e tenho Mestrado em Controle de Sistemas pela Universidade Federal do Espírito Santo - UFES. Atualmen-te, ocupo o cargo de Diretor Adjunto, no Campus Serra. Já lecionei a disci-plina de Probabilidade e Estatística no curso de Análise e Desenvolvimen-to de Sistemas, no Campus Serra.

Acredito que, com tecnologia na sala de aula, o papel do educador muda de detentor do conhecimento para guia das investigações dos alunos. O novo professor tem que estar preparado para deixar de ser o que apenas fornece informações para ser um orientador, aquele que ajuda a selecionar informações e fazer articulações. Nós aprendemos uns com os outros, a toda hora, a qualquer momento.

A disciplina de Probabilidade e Estatística é importante para sua forma-ção, pois é uma área do conhecimento que utiliza teorias probabilísticas para explicação de eventos, estudos e experimentos. Tem por objetivo ob-ter, organizar e analisar dados, determinar as correlações que apresentem, irando delas suas consequências para descrição e explicação do que passou e previsão e organização do futuro. Portanto, serão estudados neste curso-tanto os conceitos fundamentais, como as técnicas formais da estatística.

Nosso curso será dividido em oito capítulos:no primeiro, faremos a in-trodução de nossos estudos; no segundo, estudaremos a construção de grá� cos, bem como suas propriedades e aplicações; no terceiro, veremos métodos grá� cos; no quarto estudaremos medidas de ordenamento e posi-ção; no quinto, estudaremos medidas de dispersão; no sexto, estudaremos probabilidade; no sétimo, estudaremos variáveis aleatórias e distribuições discretas. Por � m, estudaremos, no oitavo capítulo, variáveis contínuas e distribuições contínuas.

Um curso de Probabilidade e Estatística requer um tempo diário de estudo e dedicação. Por isso é muito importante que você faça todas as atividades propostas, tanto neste material como na sua sala de aula virtual.

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:9LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:9 21/12/2010 17:30:4621/12/2010 17:30:46

Page 10: LIEaD401Probabilidade e Estatistica COMPLETO

• Leia os textos com bastante atenção, sempre com espírito questionador e investigativo.

• Personalize o seu estudo. Dê novos títulos e subtítulos, reorganizando a divisão do texto. Assim, você o verá por uma nova ótica e será mais fácil reter as informações por partes.

• Crie perguntas e tente respondê-las sem pesquisar. Depois, con� ra as respostas.

• Sintetize com suas palavras o que foi estudado. Faça resumos: destaque o tema central, as de� nições essenciais, os exemplos, os casos particulares, as observações.

• Leia bem os enunciados das questões propostas e interprete o que se pede. Comece, então, a responder com atenção, sempre pesquisando no livro texto ou em outros meios que facilitem sua resposta. Veri� que se todas estão corretas, revendo o que foi feito.

• Interesse-se, participe e discuta com o professor e com seus colegas.

• Faça análise dos exercícios resolvidos que se encontram ao longo deste fascículo e, se houver dúvidas, entre em contato com o seu tutor a distância.

Você logo perceberá que o sucesso neste curso é questão de tempo!

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:10LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:10 21/12/2010 17:30:4621/12/2010 17:30:46

Page 11: LIEaD401Probabilidade e Estatistica COMPLETO

1.1. Introdução

Olá, Aluno (a)!,

O objetivo fundamental da Introdução é dar uma visão inicial da estatística. Neste capítulo, veremos históricos da estatística, método estatístico, de� nições básicas da estatística e iniciaremos amostragem.

A estatística é uma área do conhecimento que utiliza teorias proba-bilísticas para explicação de eventos, estudos e experimentos. Tem por objetivo obter, organizar e analisar dados; bem como determi-nar suas correlações, tirando delas suas conseqüências, explicar o que passou e prever o que ocorrerá no futuro.

Bons estudos!

Prof. Sebastião A. Carneiro

1.2. Histórico

Faremos um breve histórico para expor o modo como a estatística surgiu.

• ANTIGUIDADE: os povos na antiguidade registravam o número de habitantes, nascimentos, óbitos. Já faziam “estatísticas”.

• IDADE MÉDIA: as informações na Idade Média eram tabuladas com � nalidades tributárias e bélicas.

• SÉCULO XVI: no século XVI surgem as primeiras análises sistemá-ticas, as primeiras tabelas e os números relativos.

• SÉCULO XVIII: no século XVIII a estatística surge com notação cientí� ca a qual é adotada pelo acadêmico alemão GODOFREDO ACHENWALL. As tabelas � cam mais completas, surgindo as pri-meiras representações grá� cas e os cálculos de probabilidades. A estatística deixa de ser uma simples tabulação de dados numéricos para se tornar o estudo de como se chegar à conclusão sobre uma população, partindo de observação de partes dessa população.

1.3. Método estatístico

O método estatístico se aplica ao estudo dos fenômenos aleatórios. Um fenômeno é considerado aleatório se seus resultados variarem, a cada repetição, nas mesmas condições.

AMOSTRAGEM

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:11LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:11 21/12/2010 17:30:4621/12/2010 17:30:46

Page 12: LIEaD401Probabilidade e Estatistica COMPLETO

12

Curso de Licenciatura em Informática

MÉTODO: é um meio mais e� caz para atingir determinada meta.

MÉTODO CIENTÍFICO: é um conjunto de regras básicas para desenvolver uma experiência a � m de produzir novo conhecimen-to, bem como corrigir e integrar conhecimentos pré-existentes.Destacamos o método experimental e o método estatístico.

MÉTODO EXPERIMENTAL: consiste em manter constantes todas as causas, menos uma, que é a que sofre variação para se observarem seus efeitos.

Exemplos: Estudos da Química, da Física, etc.

MÉTODO ESTATÍSTICO: é um processo para obter, apresentar e analisar características ou valores numéricos para uma melhor tomada de decisão em situações de incerteza.

Exemplo: Quais as causas que de� nem o preço de uma mercado-ria quando a sua oferta diminui?

Comentário: Seria impossível, no momento da pesquisa, manter constantes a uniformidade dos salários, o gosto dos consumido-res, o nível geral de preços de outros produtos, etc.

1.4. Fases do método estatístico

É importante conhecer todas as fases do método estatístico, pois você deverá segui-las quando desejar fazer uma pesquisa.

Vendas

Duplicatas a Pagar

Despesa de Salários

Contas a Receber

Despesas de Juros

Receitas de Serviços

Despesas de Aluguel

Prejuízos Acumulados

50.000

6.000

10.000

8.000

2.000

17.000

3.000

4.000

Apresentaçãodos dados

Definiçãodo

problema

Coleta dedados

Apuraçãodos dados

Planejamento

Comentando as fases do método estatístico:

a1 – DEFINIÇÃO DO PROBLEMA: Saber exatamente o que se quer

pesquisar é o mesmo que def nir corretamente o problema.a2 – PLANEJAMENTO: Como levantar informações? Que dados de-

verão ser obtidos? Qual o levantamento a ser utilizado: censitário, por

amostragem? E o cronograma de atividades? Os custos envolvidos?

Capítulo 1

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:12LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:12 21/12/2010 17:30:4621/12/2010 17:30:46

Page 13: LIEaD401Probabilidade e Estatistica COMPLETO

13

Probabilidade e Estatística

Amostragem

a3 – COLETA DE DADOS: Fase operacional. É o registro sistemático

de dados, com um objetivo determinado.

4º – APURAÇÃO DOS DADOS: Resumo dos dados por meio de

sua contagem e de seu agrupamento. É a condensação e tabulação de

dados.

5º – APRESENTAÇÃO DOS DADOS: Há duas formas de apresenta-

ção, que não se excluem mutuamente. A apresentação tabular é uma

apresentação numérica dos dados em linhas e colunas distribuídas de

modo ordenado, segundo regras práticas f xadas pelo Conselho Nacio-

nal de Estatística. A apresentação gráf ca dos dados numéricos constitui

uma apresentação geométrica que permite uma visão rápida e clara do

fenômeno.

6º – ANÁLISE E INTERPRETAÇÃO DOS DADOS: A última fase do

trabalho estatístico é a mais importante e delicada. Está ligada essen-

cialmente ao cálculo de medidas e coef cientes, cuja f nalidade princi-

pal é descrever o fenômeno (estatística descritiva).

ATIVIDADE 1: Responda a questão a seguir:

Em que fase do método estatístico devemos:

a) ter uma visão rápida e clara do fenômeno?b) fazer o registro sistemático de dados?;c) fazer a condensação e tabulação de dados? d) ser mais cuidadosos, pois é a fase mais importante e delicada do método?e) fazer o cronograma de atividades?f) de� nir corretamente o problema?

1.5 Conceitos básicos

Muitas vezes, apesar dos recursos computacionais e da boa vontade, não é possível estudar todo um conjunto de dados de interesse, pois � ca caro e leva muito tempo. Assim, normalmente, se trabalha com partes da população denominadas de amostras.

1.5.1 População

População é o conjunto total de elementos portadores de, pelo menos, uma característica comum.

Note-se que o termo população é usado num sentido amplo e não signi-� ca, em geral, conjunto de pessoas.o

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:13LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:13 21/12/2010 17:30:4721/12/2010 17:30:47

Page 14: LIEaD401Probabilidade e Estatistica COMPLETO

14

Curso de Licenciatura em Informática

Capítulo 1

Exemplos:

a) o conjunto das rendas de todos os habitantes do Espírito Santo;b) o conjunto de todas as notas dos alunos de Estatística;c) o conjunto das alturas de todos os alunos da Universidade; etc.

Um levantamento efetuado sobre toda uma população é denominado de levantamento censitário ou Censo.

1.5.2 Amostras

Amostras são parcelas representativas de uma população, examinada com o propósito de se tirarem conclusões sobre essa população.

Exemplos:

a) antes da eleição diversos órgãos de pesquisa e imprensa ouvem um conjunto selecionado de eleitores para ter uma idéia do desempenho dos vários candidatos nas futuras eleições;

b) uma empresa metal-mecânica toma uma amostra do produto fabri-cado em intervalos de tempo especi� cados para veri� car se o pro-cesso está sob controle e evitar a fabricação de itens defeituosos;

c) o IBGE faz levantamentos periódicos sobre emprego, desemprego, in� ação, etc;

d) redes de rádio e TV se utilizam constantemente dos índices de po-pularidade dos programas para � xar valores da propaganda, ou en-tão, modi� car ou eliminar programas com audiência insatisfatória;

e) biólogos marcam pássaros, peixes, etc, para tentar prever e estudar seus hábitos.

ATIVIDADE 1:

1) Estabeleça a população, a amostra e o tipo de fonte de dados em cada caso:

a) Numa escola de primeiro grau com 560 alunos matriculados, foram sorteados 100 alunos que responderam a um questionário sobre preferência por refrigerantes.

b) Um administrador fez uma pesquisa para analisar o crescimen-to da população urbana de 1980 a 2000. Para obter os dados, re-correu ao anuário do IBGE (Instituto Brasileiro de Geogra� a e Estatística).

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:14LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:14 21/12/2010 17:30:4821/12/2010 17:30:48

Page 15: LIEaD401Probabilidade e Estatistica COMPLETO

15

Probabilidade e Estatística

Amostragem

2) Pretende-se fazer um estudo sobre o número de irmãos dos

alunos do 10º ano de escolaridade de uma Escola Secundária. Para isso, efetuou-se um questionário, ao qual responderam 60 alunos.

Indique:

a) a população em estudo;

b) a amostra escolhida;

c) a variável em estudo e classi� que-a.

1.5.3 Variável

• Variável é, convencionalmente, o conjunto de resultados possíveis de um fenômeno.

• Variável qualitativa: quando seus valores são expressos por atribu-tos: Exemplo: sexo, cor da pele, etc.

• Variável quantitativa: quando os dados são de caráter nitidamente quantitativo, e o conjunto dos resultados possui uma estrutura nu-mérica. Divide-se em:a) Variável discreta: seus valores são expressos geralmente por núme-

ros inteiros não negativos. Resulta normalmente de contagens. Exemplo:

a) número de computadores vendidos no mês (231);b) quantidade de placa mãe em estoque (346).

b) Variável contínua: resulta normalmente de uma mensuração, e a escala

numérica de seus possíveis valores corresponde ao conjunto R dos

números Reais, ou seja, pode assumir, teoricamente, qualquer valor

entre dois limites.

Exemplo:a) quando se mede a temperatura do corpo de alguém com um

termômetro de mercúrio, o que ocorre é o seguinte: o � lete de mercúrio, ao dilatar-se, passa por todas as temperaturas intermediárias até chegar à temperatura do corpo no mo-mento da medição (37,6oC).

b) diâmetro de um furo(23,456mm);c) peso de um objeto(12,2345kg).

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:15LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:15 21/12/2010 17:30:4821/12/2010 17:30:48

Page 16: LIEaD401Probabilidade e Estatistica COMPLETO

16

Curso de Licenciatura em Informática

Capítulo 1

ATIVIDADE 2:

1) Classi� que as variáveis abaixo em qualitativas ou quantitativas:

• cor dos olhos dos alunos;• índice de liquidez nas indústrias capixabas;.• produção de café no Brasil;• número de defeitos em aparelhos de TV;. • comprimento dos pregos produzidos por uma empresa; • pontuação obtida em cada jogada de um dado.

2) Para os seguintes valores, indique as variáveis discretas (D) e as contínuas (C):

(a) peso do conteúdo de um pacote de DVD virgem; (b) diâmetro de um CD; (c) número de artigos defeituosos produzidos; (d) número de indivíduos, em uma área geográ� ca, que recebem

seguro- desemprego; (e) número médio de clientes potenciais visitados por vendedores

de uma empresa durante o último mês; (f) temperatura interna de um computador; (g) número de unidades estocadas de um artigo; (h) razão entre o ativo circulante e o passivo exigível; (i) total de toneladas embarcadas; (j) quantidade embarcada de computadores;(k) volume de tráfego de um posto de pedágio; (l) número de comparecimento ao encontro anual de uma

companhia.

3) Em uma empresa de informática, a produção é medida de duas maneiras: por quantidade de itens vendidos ou por lucro obtido. Essas duas variáveis são:

a) ( ) ambas discretas.b) ( ) ambas continuas.c) ( ) contínua e discreta, respectivamente.d) ( ) discreta e continua, respectivamente.

1.6. Amostragem

O processo de escolha de uma amostra da população é denominado de amostragem.

Quando a amostra é tendenciosa, não podemos extrapolar os resultados

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:16LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:16 21/12/2010 17:30:4821/12/2010 17:30:48

Page 17: LIEaD401Probabilidade e Estatistica COMPLETO

17

Probabilidade e Estatística

Amostragem

obtidos para o universo da população. É o caso da amostragem por con-veniência, que ocorre quando a participação é voluntária ou os elemen-tos da amostra são escolhidos por uma questão de conveniência (mui-tas vezes, os amigos e os amigos dos amigos). Deste modo, o processo amostral não garante que a amostra seja representativa.

A melhor forma de conseguir este objetivo é obter uma amostra alea-tória de uma população bem de� nida. Existem técnicas de amostragem a que devemos recorrer para assegurar que a amostra forneça uma boa estimativa dos parâmetros populacionais.

Há vários métodos de amostragem: aleatória simples, (cada elemento da população tem igual probabilidade de ser escolhido para caracterizar a amostra); amostragem sistemática (depois de ordenada a população, seleciona-se a amostra probabilística);amostragem estrati� cada, etc.

1.6.1 Amostragem casual ou aleatória simples

A amostragem casual ou aleatória simples é o processo mais elementar e frequentemente utilizado na coleta de dados. Todos os elementos da população têm que ter a mesma probabilidade de pertencerem à amos-tra. Equivale a um sorteio lotérico. Pode ser realizada numerando-se a população de 1 a n e sorteando-se, a seguir, por meio de um dispositivo aleatório qualquer, x números dessa sequência, os quais corresponderão aos elementos pertencentes à amostra.

Exemplo 1:

Vamos obter uma amostra, de 10%, representativa para a pesquisa da estatura de 90 alunos de uma escola:1º passo – Numeramos os alunos de 1 a 90.2º passo – Escrevemos os números dos alunos, de 1 a 90, em pedaços iguais de

papel, colocamos em uma urna e, após mistura, retiramos, um a um, os nove

números que formarão a amostra.

Resultado obtido = { aluno 20, aluno 27, aluno 15, aluno 56, aluno 81, aluno 12, aluno 66, aluno 54, aluno 72).

Exemplo 2:

Uma cidade turística tem 30 hotéis de três estrelas. Pretende-se conhe-cer o custo médio da diária para apartamento de casal. Os valores popu-lacionais consistem nos seguintes preços diários: 125, 120, 135, 121, 122, 124, 125, 130, 138, 124, 120, 120, 125, 120, 119, 125, 123, 124, 128, 124, 124, 122, 128, 126, 123, 125, 122, 127, 125, 123.

Extraia uma amostra aleatória simples de tamanho 5 desta população

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:17LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:17 21/12/2010 17:30:4821/12/2010 17:30:48

Page 18: LIEaD401Probabilidade e Estatistica COMPLETO

18

Curso de Licenciatura em Informática

Capítulo 1

por sorteio.

R: Escrevemos os valores em papéis, então os colocamos em uma urna, misturamos e sorteamos a amostra de n = 5.

Resultado obtido: n = (120, 124, 122, 128, 123)

Obs.: Quando o número de elementos da amostra é muito grande, esse tipo de sorteio torna-se muito trabalhoso. Nesse caso, utiliza-se uma tabela de números aleatórios ou isso é feito por meio de so ware que gera esses números.

1.6.2 Amostragem sistemática

Amostra sistemática é constituída de elementos retirados da população, segundo um sistema preestabelecido.

É conveniente quando a população está naturalmente ordenada, como � chas em um � chário, listas telefônicas, etc.

Exemplo 1:

Suponha que uma empresa de telefonia � xa deseja saber o grau da sa-tisfação de seus usuários com os serviços prestados. O número de assi-nantes é da ordem de 50.000 e nós desejamos selecionar uma amostra aleatória de 1.000 assinantes com o intuito de obter a avaliação sobre os serviços.

Um modo alternativo de seleção é a seleção de 1 assinante a cada 50. O procedimento será selecionar aleatoriamente um assinante entre os pri-meiros 50, digamos que o vigésimo assinante(20) fosse selecionado. O próximo selecionado seria o de ordem 70 (20+50), o seguinte de ordem 120 (70+50) e assim por diante, ou seja: 20, 70, 120, 170, 220 ....... . Com esse método são economizados recursos físicos e � nanceiros.

A amostra sistemática é frequentemente utilizada em pesquisas nas quais o tamanho da população é grande ou que a pesquisa seja feita por pessoas que não estão familiarizadas com tabelas de números aleatórios ou com uso de so ware.

No caso da seleção de amostra aleatória simples de assinantes, seria ne-cessário que tivéssemos os assinantes numerados, sequencialmente, de 1 a 50.000 e seriam selecionados os 1.000 assinantes. A seleção poderia ser feita com o uso de uma tabela de números aleatórios ou de so ware

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:18LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:18 21/12/2010 17:30:4821/12/2010 17:30:48

Page 19: LIEaD401Probabilidade e Estatistica COMPLETO

19

Probabilidade e Estatística

Amostragem

que gerasse esses números.

Exemplo 2:

É dada uma população constituída pelas 12 primeiras letras do alfabe-to. Explique o que você faria para obter uma amostra sistemática de 3 elementos.

Resolução:

Dividindo 12 por 3 obtém-se 4. Sorteie então uma das quatro primeiras letras do alfabeto. Essa letra sorteada será a primeira da amostra. De-pois, a partir dessa letra, conte quatro e retire a quarta letra para a amos-tra. Repita o procedimento e retire mais uma letra de forma sucessiva.

Exemplo: Se a letra sorteada for B, então a amostra será C, G e K.

As amostras sistemáticas são suscetíveis a erros induzidos por perio-dicidade naturais da população, permitindo ao investigador prever e, possivelmente, manipular quem entrará na amostra.

1.6.3 Amostragem proporcional estratificada

Quando a população se divide em estratos (subpopulações), convém que o sorteio dos elementos da amostra os leve em consideração. Desse modo, obtemos os elementos da amostra proporcionalmente ao núme-ro de elementos desses estratos.

Exemplo:

Vamos obter uma amostra proporcional estrati� cada, de 10%, do exem-plo anterior, supondo que, dos 90 alunos, 54 sejam meninos e 36 sejam meninas. São, portanto, dois estratos (sexo masculino e sexo feminino). Logo, temos:

SEXO POPULACÃO 10 % AMOSTRAMASC. 54 5,4 5FEMIN. 36 3,6 4

Total 90 9,0 9

Numeramos, então, os alunos de 01 a 90 (de 01 a 54 para os meninos e de 55 a 90 para as meninas) e procedemos ao sorteio.

Tabela 1.1 Amostra proporcional estrati�cada

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:19LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:19 21/12/2010 17:30:4821/12/2010 17:30:48

Page 20: LIEaD401Probabilidade e Estatistica COMPLETO

20

Curso de Licenciatura em Informática

Capítulo 1

Exemplo:

Em determinada região, a população com cursos superiores é composta por 40% de homens e 60% de mulheres. Deseja-se fazer uma pesquisa com 50 pessoas com cursos superiores.

Neste caso, seleciona, os dois grupos (homens e mulheres) e sorteiam-se 20 homens e 30 mulheres.

Homens = 40% de 50 = 20;Mulheres = 60% de 50 = 30.

Na realidade, a amostragem proporcional estrati� cada leva em consideração as diferenças que há dentro de uma população e é mais democrática.

Riscos da amostragem.

O processo de amostragem envolve riscos, pois toma-se decisões so-bre toda a população com base em apenas uma parte dela. A teoria da probabilidade, que veremos neste curso, pode ser utilizada para fornecer uma idéia do risco envolvido, ou seja, do erro cometido ao utilizar uma amostra ao invés de toda a população.

ATIVIDADE 3:

1) Imagine que você tem 500 cadastros arquivados em sua empre-sa, dos quais você quer uma amostra de 2%. Como você procede-ria para obter uma amostra sistemática e uma amostra aleatória?

2) Uma população se encontra dividida em quatro estratos, com tamanhos N1 = 90, N2 = 120, N3 = 60 e N4 = 480. Ao se realizar uma amostra, doze elementos da amostra foram retirados do pri-meiro estrato. Qual o número de elementos de cada estrato?

3) Com o objetivo de fazer testes de qualidade com determinados produtos de uma empresa de informática, optou-se por realizar um levantamento por amostragem. A população é constituída por:

Produto A: A1, A2, A3, A4, A5, A6, A7, A8, A9, A10;

Produto B: B1, B2, B3, B4, B5, B6, B7, B8, B9, B10;

Produto C: C1, C2, C3, C4, C5, C6, C7, C8, C9, C10, C11, C12, C13, C14,C15,C16, C17, C18, C19, C20, C21, C22, C23, C24, C25, C26, C27, C28, C29, C30.

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:20LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:20 21/12/2010 17:30:4821/12/2010 17:30:48

TIAGO FLACH
Highlight
Page 21: LIEaD401Probabilidade e Estatistica COMPLETO

21

Probabilidade e Estatística

Amostragem

Como você faria para obter uma amostra global, de tamanho 10?

4) Uma escola possui 120 alunos, sendo 32 na quinta série, 24 na sexta série, 26 na sétima série e 38 na oitava série. Em uma amos-tra de 15 alunos, quantos de cada série farão parte dessa amostra, nessa mesma ordem de séries?

a) 4, 2, 3 e 6 alunosb) 4, 3, 4 e 4 alunosc) 5, 2, 3 e 5 alunosd) 4, 3, 3 e 5 alunos

______________________________________________________________________________________________________

______________________________________________________________________________________________________

__________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:21LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:21 21/12/2010 17:30:4821/12/2010 17:30:48

Page 22: LIEaD401Probabilidade e Estatistica COMPLETO

22

Curso de Licenciatura em Informática

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:22LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:22 21/12/2010 17:30:4821/12/2010 17:30:48

Page 23: LIEaD401Probabilidade e Estatistica COMPLETO

SÉRIES E CONSTRUÇÃO DE GRÁFICOS

Olá, Aluno(a)!

Neste capítulo, estudaremos séries e construção de grá� cos. As ta-belas, os grá� cos e as � guras são elementos grá� cos que apresen-tam dados ou informações com a � nalidade de facilitar sua leitura e compreensão.

Bons estudos!

Prof. Sebastião A. Carneiro

2.1 Série estatística

Qualquer tabela que apresente a distribuição de um conjunto de dados estatísticos em função da época, do local ou da espécie é uma série estatística.

Os trabalhos técnico-cientí� cos utilizam-se, em geral, de tabe-las estatísticas para apresentar dados. Elas podem ser de� nidas como conjuntos de dados estatísticos associados a um fenômeno, dispostos numa determinada ordem de classi� cação. Expressam, pois, as variações qualitativas e quantitativas de um fenômeno.

TABELA é um quadro que resume um conjunto de dados dispos-tos em linhas e colunas de maneira sistemática.

De acordo com a Resolução 886, do IBGE, nas casas ou células da tabela, devem-se inserir:

• um traço horizontal (-) quando o valor é zero;

• três pontos (...), quando não se têm os dados;

• zero (0),quando o valor é muito pequeno para ser expresso pela unidade utilizada;

• um ponto de interrogação (?),quando há dúvidas quanto à exatidão de determinado valor.

Obs.: o lado direito e o esquerdo de uma tabela o� cial devem ser abertos.

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:23LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:23 21/12/2010 17:30:4821/12/2010 17:30:48

Page 24: LIEaD401Probabilidade e Estatistica COMPLETO

24

Curso de Licenciatura em Informática

Capítulo 2

2.1.1 Série temporal

Também chamada de histórica ou evolutiva, a série temporal identi� ca-se pelo caráter variável do fator cronológico (tempo). O local e a espécie (fenômeno) são elementos � xos.

Exemplo:

Ano Evolução das reservas brasileiras (em bilhões de dólares)

2000 322001 362002 372003 492004 522005 532006 852007 1802008 190

Fonte: Revista Veja - edição 2050

Observar que a Evolução das reservas brasileiras (em bilhões de dóla-res) variou com o tempo (de 2000 a 2008).

2.1.2 Série geográfica

Também chamada de espacial, territorial ou de localização, a série geo-grá� ca apresenta como elemento variável o fator geográ� co. A época e o fato (espécie) são elementos � xos.

Exemplo:

FILIAIS COMPUTADORESSão Paulo VENDIDOS

Rio de Janeiro 12.645Minas Gerais 15.765Espírito Santo 13.410

TOTAL 8.546

Tabela 2.1 Evolução das reservas brasileiras

Tabela 2.2 Vendas em 2007 da empresa ABC Informática Ltda.

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:24LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:24 21/12/2010 17:30:4821/12/2010 17:30:48

Page 25: LIEaD401Probabilidade e Estatistica COMPLETO

25

Probabilidade e Estatística

Séries e Construção de Gráficos

Observar como as vendas de computadores da empresa ABC Infor-mática Ltda. variaram em 2007 nos estados da região Sudeste; ou seja, houve variação geográ� ca.

2.1.3 Série específica

Também chamada de categórica, a série especí� ca tem como caráter va-riável apenas o fato ou espécie.

Exemplo:

Setores Vendas (milhões de dólares) Comunicação 56.927,70

Hardware 20.488,20 Serviços de So ware 7.300,40

Serviços 5.603,50 So ware 2.419,10

Distribuição 1.380,40 Internet 657,40

Fonte: Info Exame – ago. 2007.

Observar que houve variação por setores de empresas de tecnologia do Brasil e não há informação quanto à variação no tempo ou por região.De uma forma geral, se a série simples não for temporal ou geográ� ca, você pode considerá-la especí� ca.

2.1.4 Séries conjugadas

Também chamadas de tabelas de dupla entrada, as séries conjugadas são apropriadas à apresentação de duas ou mais séries de maneira conjuga-da, com duas ordens de classi� cação: uma horizontal e outra vertical. O exemplo abaixo é o de uma série geográfi co-temporal.

Exemplo:

FILIAIS Janeiro Fevereiro Março Abril Maio JunhoSão Paulo 1200 1280 1360 1440 1520 1600Rio de Janeiro 1350 1390 1430 1470 1510 1550Minas Gerais 1410 1670 1930 2190 2450 2710Espírito Santo 1046 1099 1152 1205 1258 1311TOTAL 5006 5439 5872 6305 6738 7171

Tabela 2.3 Vendas por setor em 2006 das 200 maiores empresas de tecnologia do Brasil.

Tabela 2.4 Vendas no 1º bimestre de 2007 da empresa ABC Informática Ltda.

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:25LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:25 21/12/2010 17:30:4821/12/2010 17:30:48

Page 26: LIEaD401Probabilidade e Estatistica COMPLETO

26

Curso de Licenciatura em Informática

Capítulo 2

Observar que as vendas de computadores variam nos estados da região Sudeste, de janeiro a junho de 2007, caracterizando, assim, a série con-jugada geográ� co-temporal.

ATIVIDADE 1:

1) Que tipo de série está representado nesta tabela?

TERMINAIS TELEFÔNICOS EM SERVIÇO 1992-1993

REGIÕES 1992 Fevereiro 1993Norte 375.658 1280 403.494Nordeste 1.379.101 1390 1.486.649Sudeste 6.729.467 1670 7.231.634Sul 1.608.989 1099 1.746.232Centro-oeste 778.925 5439 884.822

Fonte: Ministério das Comunicações.

2) Qual a origem dos dados para a elaboração da tabela?

3) Procure identi� car em jornais ou em revistas exemplos das séries apresentadas.

2.2 Gráficos estatísticosg

Grá� cos estatísticos são representações visuais dos dados estatísti-cos. Não substituem as tabelas estatísticas apenas fornecem uma representação mais imediata dos dados.

Os grá� cos estatísticos têm como características a simplicidade, a clare-za e a veracidade. Fazem uso de escalas e do sistema de coordenadas e possibilitam uma compreensão mais imediata dos dados.

Veremos a seguir os tipos de grá� cos mais utilizados

2.2.1 Diagramas

Diagramas são grá� cos geométricos dispostos em duas dimensões. São os mais usados na representação de séries estatísticas, por esse motivo não abordaremos os outros tipos de grá� cos. Os diagramas podem ser:

a) Gráfi cos Em Linhas Ou Lineares

Grá� cos em linhas ou lineares são os frequentemente usados para re-presentação de séries cronológicas com um grande número de perío-dos de tempo. As linhas são mais e� cientes do que as colunas quando

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:26LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:26 21/12/2010 17:30:4821/12/2010 17:30:48

Page 27: LIEaD401Probabilidade e Estatistica COMPLETO

27

Probabilidade e Estatística

Séries e Construção de Gráficos

existem intensas � utuações nas séries ou quando há necessidade de se representarem várias séries em um mesmo grá� co.

Exemplo:

Ano Evolução das reservas brasileiras (em bilhões de dólares)

2000 322001 362002 372003 492004 522005 532006 852007 1802008 190

Fonte: Revista Veja - edição 2050

0

20

40

60

80

100

120

140

160

180

200

1998 2000 2002 2004 2006 2008 2010

Figura 1: Grá�co Evolução das reservas brasileiras

Observe que as reservas brasileiras dispararam depois de 2005. O grá� co retrata isso mais facilmente!

b) Gráfi cos em Barras horizontais

Quando as legendas não são breves, usam-se de preferência, os grá� cos em barras horizontais. Neles, os retângulos têm a mesma altura e as ba-ses são proporcionais aos respectivos dados.

Exemplo :

Tabela 2.5 Evolução das reservas

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:27LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:27 21/12/2010 17:30:4821/12/2010 17:30:48

Page 28: LIEaD401Probabilidade e Estatistica COMPLETO

28

Curso de Licenciatura em Informática

Capítulo 2

Empresas FuncionáriosATENTO BRASIL (Serviços) 54.415CONTAX (Serviços) 49.397DEDIC (Serviços) 14.903EMBRATEL (Comunicação) 14.268TELEFUTURA (Serviços) 11.174CSU CARDSYSTEM (Serviços) 10.153TIM (Comunicação) 9.972SERPRO (Serviços de So ware) 9.960CTBC (Comunicação) 8.734EDS (Serviços) 8.239Fonte: Info Exame, ago. 2007

ATENTO BRASIL (Serviços)

0 10.000 20.000 30.000 40.000 50.000 60.000

CONTAX (Serviços)

DEDIC (Serviços)

EMBRATEL (Comunicação)

TELEFUTURA (Serviços)

CSU CARDSYSTEM (Seviços)

TIM (Comunicação)

SERPRO (Serviços de Software)

CTBC (Counicação)

EDS (Serviços)

Figura 2 - Grá�co Empresas com maior número de funcionários entre as maiores empresas de tecnologia do Brasil.

ATIVIDADE 2: Reproduza os dois tipos de grá� cos anteriores usando uma planilha eletrônica, buscando novos dados em jor-nais ou em revistas, e, a seguir, compare os resultados: lembre-se de que o resultado deverá ser o mesmo.

c) Gráfi cos em barras verticais (colunas)

Quando as legendas não são breves, usam-se, de preferência, os grá� cos em barras verticais. Nesses grá� cos, os retângulos têm a mesma base e as alturas são proporcionais aos respectivos dados.

Exemplo:

A tabela a seguir mostra alguns resultados das empresas com maior crescimen-to de vendas - em % - entre as 200 maiores empresas de tecnologia do Brasil.

Tabela 2.6 Empresas com maior número de funcionários entre as maiores empresas de tecnologia do Brasil

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:28LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:28 21/12/2010 17:30:4921/12/2010 17:30:49

Page 29: LIEaD401Probabilidade e Estatistica COMPLETO

29

Probabilidade e Estatística

Séries e Construção de Gráficos

Empresas Vendas (%)VIATELECOM (Comunicação) 181,80NEXTSYS (So ware) 156,90PROVIDER (Serviços) 85,30TEELAP (Distribuição) 84,10POSITIVO (Hardware) 77,60HOLDI TI (Serviços) 74,40SYNTAX (Hardware) 71,10TIVIT (Serviços) 70,90NEXTEL (Comunicação) 67,10WITTEL (So ware) 65,00Fonte: Info Exame, ago. 2007.

Figura 3: Gráfico Empresas com maior crescimento de vendas entre as 200 maiores

empresas de tecnologia do Brasil.

d) Gráfi cos em colunas superpostas

Os grá� cos em colunas superpostas diferem dos grá� cos em barras ou colunas convencionais apenas pelo fato de apresentarem cada barra ou coluna segmentada em partes por componentes. Servem para represen-tar comparativamente dois ou mais atributos.

Exemplo:

Construção de um diagrama em colunas superpostas que retrate os lucros retidos e os dividendos da Empresa de Aço Steel Corporation , 1969-74, em milhões de dólares.

Tabela 2.7 Empresas com maior crescimento de vendas entre as 200 maiores empre-sas de tecnologia do Brasil.

0,00

20,00

40,00

60,00

80,00

100,00

120,00

140,00

160,00

180,00

200,00

VIATELECOM NEXTSYS

(Comunicação) (Serviços de

PROVIDER TEELAP POSITIVO HOLDI TI SYNTAX TIVIT (Serviços) NEXTEL WITTEL (Serviços

(Serviços) (Distribuição) (Hardware) (Serviços) (Hardware) (Comunicação)

Software)

de Software)

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:29LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:29 21/12/2010 17:30:4921/12/2010 17:30:49

Page 30: LIEaD401Probabilidade e Estatistica COMPLETO

30

Curso de Licenciatura em Informática

Capítulo 2

Ano Lucros Dividendos Lucros Retidos1969 217 130 871970 148 130 181971 154 98 561972 157 87 701973 326 87 2391974 635 119 516

Fonte: Fictícia

Figura 4: Grá�co lucros retidos e os dividendos da Steel Corporation, 1969-74.

ATIVIDADE 2.3

Reproduza os dois tipos de grá� cos anteriores, usando uma plani-lha eletrônica, buscando também novos dados em jornais ou em revistas. A seguir, compare os resultados; lembrando-se de que este deverá ser o mesmo.

e) Gráfi cos em Setores (pizza)

Os grá� cos em setores são construídos com base em um círculo e são empregados sempre que desejamos ressaltar a participação do dado no total. O total é representado pelo círculo, que � ca dividido em tantos setores quantas são as partes. Os setores são tais que suas áreas são res-pectivamente proporcionais aos dados da série. O grá� co em setores só deve ser empregado quando há, no máximo, sete dados para não sobre-carregar sua partição.

Exemplo:

Tabela 2.8 lucros retidos e os dividendos da Steel Corporation, 1969-74.

0

100

200

300

400

500

600

700

1969 1970 1971 1972 1973 1974

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:30LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:30 21/12/2010 17:30:4921/12/2010 17:30:49

Page 31: LIEaD401Probabilidade e Estatistica COMPLETO

31

Probabilidade e Estatística

Séries e Construção de Gráficos

Construção de um diagrama em setores que retrate a participação no mercado mundial das empresas de smartphones.

Empresas Participação no mercado mundial (%)

Symbian 71,7Linux 14,3Windows Mobile 6,9Blackberry 4,7Palm OS 2,3Outros 0,1Fonte: Info Exame, ago. 2007

Figura 5: Grá�co Participação no mercado mundial dos fabricantes de smartphones.

Observe que, atualmente, a empresa Symbian domina o mercado de smartphones!

f ) Gráfi co Polar (RADAR)

O grá� co polar é o ideal para representar séries temporais cíclicas, isto é, séries ideais que apresentem em seu desenvolvimento determinada periodicidade, como a ocorrência de chuvas no ano numa determinada região, a variação da temperatura ao longo do dia, a venda de monitores da � lial 1 durante a semana, o consumo de energia elétrica durante o mês ou ano, o número de passageiros de uma linha de ônibus ao longo da semana, etc.

O grá� co polar faz uso do sistema de coordenadas polares.

Exemplo:

Tabela 2.9 Participação no mercado mundial dos fabricantes de smartphones.

Symbian71,7%

Linux14,3%

Windows Mobile6,9%

Blackberry4,7% Outros

0,1%

Palm OS2,3%

Symbian

Linux

Windows Mobile

Blackberry

Palm OS

Outros

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:31LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:31 21/12/2010 17:30:4921/12/2010 17:30:49

Page 32: LIEaD401Probabilidade e Estatistica COMPLETO

32

Curso de Licenciatura em Informática

Capítulo 2

Dada a série: número de ocorrências de manutenção efetuadas nos com-putadores da companhia InfoWay em 2007.

MESES OCORRÊNCIASJaneiro 148Fevereiro 164Março 152Abril 188Maio 160Junho 176Julho 164Agosto 184Setembro 164Outubro 219Novembro 211Dezembro 140FONTE: Sindan.

1. traçamos uma circunferência de raio arbitrário (em particular, da-mos preferência ao raio de comprimento proporcional à média dos valores da série);

6. construímos uma semi-reta (de preferência, na horizontal) partindo de O (polo) e com uma escala (eixo polar);

7. dividimos a circunferência em tantos arcos quantas forem as unida-des temporais;

8. traçamos, a partir do centro O (polo), semirreta passando pelos pontos de divisão;

9. marcamos os valores correspondentes das ocorrências de manuten-ção, iniciando pela semi-reta horizontal (eixo polar);

10. ligamos os pontos encontrados com segmentos de reta;

11. se pretendermos fechar a poligonal obtida, empregamos uma linha interrompida.

Tabela 2.10 Número de ocorrências de manutenção

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:32LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:32 21/12/2010 17:30:4921/12/2010 17:30:49

Page 33: LIEaD401Probabilidade e Estatistica COMPLETO

33

Probabilidade e Estatística

Séries e Construção de Gráficos

Figura 6: Grá�co número de ocorrências efetuadas nos computadores em 2007

Pelo grá� co, percebemos que os meses em que houve mais ocorrên-cias efetuadas nos computadores foram outubro e novembro; com essa informação, podemos nos planejar para esses meses, contratan-do mais funcionários, etc. Observe quanto uma informação como essa é importante em sua vida pro� ssional!

Exemplo 2:

Comparar os itens mais vendidos de uma empresa de informática, por meio de grá� co polar, nos meses de janeiro e fevereiro de 2010.

Itens mais Vendidos Janeiro FevereiroPlacas-mãe 280 250Teclados 350 400Mouses 400 320Impressoras 180 220Fontes 203 150Gabinetes 281 260Processadores 98 130

Tabela 2.11 Itens mais vendidos de uma empresa de informática.

Janeiro

Fevereiro

Março

Abril

Maio

Junho

Julho

Agosto

Setembro

Outubro

Novembro

Dezembro300

200

100

0

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:33LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:33 21/12/2010 17:30:4921/12/2010 17:30:49

Page 34: LIEaD401Probabilidade e Estatistica COMPLETO

34

Curso de Licenciatura em Informática

Figura 7 – Gráfico itens mais vendidos de uma empresa de informática____ Vendas em janeiro - - - - Vendas em fevereiro

Análise:

Observando o grá� co polar, veri� camos que houve queda de vendas em Placas-mãe, mouses, fontes e gabinetes, enquanto as vendas aumen-taram para teclados, impressoras e processadores.

2.3 Uso indevido de gráficos

Muitas vezes, o uso indevido dos grá� cos pode trazer uma interpretação falsa dos dados que estão sendo analisados, chegando mesmo a con-fundir o leitor. Vejamos, através de um exemplo, como esse fato pode ocorrer. Os dois grá� cos apresentados a seguir representam os mesmos dados, e a primeira impressão é a de que os dois representam dados nitidamente diferentes.

No grá� co (a), as � utuações das vendas aparecem nitidamente, já no grá� co(b), tem-se a impressão de que a � utuação das vendas não mani-festa praticamente tendência alguma, exceto leve � utuação.

Trata-se, na realidade, de um problema de construção de escalas. En-quanto o grá� co(a) apresenta-se com uma escala mais ou menos con-vencional, o grá� co(b) revela proporções consideravelmente diferentes para as escalas em que foram divididos os dois eixos.

Capítulo 2

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:34LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:34 21/12/2010 17:30:5021/12/2010 17:30:50

Page 35: LIEaD401Probabilidade e Estatistica COMPLETO

35

Probabilidade e Estatística

Séries e Construção de Gráficos

Vendas de computadores no ano de 2009 da empresa ABC informática.

Figura 8 – Grá�co A – Visão real dos dados

0

1000

2000

3000

4000

Jan Fev Mar Abr Mai Jun Jul Ago Set Out Nov Dez

Figura 9 – Grá�co B - Visão distorcida dos dados

Veja os dados reais de vendas de computadores no ano de 2009 da em-presa ABC informática:

Mês VendasJan 2401Fev 2520Mar 1900Abr 2610Mai 1940Jun 2750Jul 2200

Ago 2970Set 2980Out 3180Nov 3420Dez 3800

Tabela 2.12 Vendas de computadores no ano de 2009 da empresa ABC informática

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:35LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:35 21/12/2010 17:30:5021/12/2010 17:30:50

Page 36: LIEaD401Probabilidade e Estatistica COMPLETO

36

Curso de Licenciatura em Informática

ATIVIDADE 2.4

1) Reproduza os grá� cos anteriores, manualmente e usando uma planilha eletrônica, buscando novos dados em jornais ou em re-vistas, e, a seguir, compare os resultados; lembrando-se de que o resultado deverá ser o mesmo.

2) Monte um grá� co do tipo barras verticais das empresas que apresentaram maior lucro, em milhões de reais, entre as empresas de tecnologia:

Empresas Lucro (em Milhões de Reais)Empresa 1 150,50Empresa 2 95,70Empresa 3 47,30Empresa 4 42,90Empresa 5 37,50Empresa 6 33,60Empresa 7 27,30Empresa 8 19,10Empresa 9 9,30Empresa 10 7,90

3) Numa empresa de manutenção em informática, 60% dos fun-cionários vão fazer manutenção em monitores, 24 % em mouses e teclados, 8% em fontes e 8% nas demais peças do computador. O grá� co que melhor representa essa situação é o de:

e) ( ) Linha

f) ( ) Barras

g) ( ) Setores

h) ( ) Colunas superpostas

Chegamos ao � nal de mais um capítulo; nele, vimos as diversas for-mas de organizar e analisar os dados de uma série de observações, as tabelas de frequências e os métodos grá� cos. É importante que esses conceitos estejam bem compreendidos; caso contrário, faça uma revisão, pois eles serão necessários nos próximos capítulos.

Vamos para o capítulo 3!

Capítulo 2

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:36LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:36 21/12/2010 17:30:5021/12/2010 17:30:50

Page 37: LIEaD401Probabilidade e Estatistica COMPLETO

MÉTODOS GRÁFICOS

Olá, Aluno (a)!

Neste capítulo, estudaremos métodos grá� cos, que são os histogra-mas que servirão de base para a compreensão dos capítulos seguin-tes. Entender esse conteúdo, então, é de fundamental importância, pois a análise grá� ca em estatística é feita com base nele.

Bons estudos!

Prof. Sebastião A. Carneiro

3.1 Distribuição de frequência

Distribuição de frequência é um tipo de tabela que condensa uma cole-ção de dados conforme as frequências (repetições de seus valores).

Distribuição de frequências é uma técnica para apresentar uma coleção de objetos classi� cados de modo a mostrar a quantida-de existente em cada classe. Será muito utilizada em frequências de probabilidades. Resumidamente, signi� ca agrupar os dados repetidos.

Olá, Turma!

Acompanhe atentamente os passos seguintes, pois vamos usar um exemplo para deixar bem clara cada etapa.

Prof. Sebastião A. Carneiro

3.1.1 Tabela primitiva ou tabela de dados brutos

É a tabela inicial de coleta de dados, os elementos não são numerica-mente organizados. É difícil formar uma ideia exata do comportamento da pesquisa efetuada.

Exemplo:

Foram tomados os preços de 20 monitores de 15 polegadas, LCD, em 20 empresas de informática.

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:37LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:37 21/12/2010 17:30:5021/12/2010 17:30:50

Page 38: LIEaD401Probabilidade e Estatistica COMPLETO

38

Curso de Licenciatura em Informática

Capítulo 3

Figura 10: Monitores LCD

Empresas Valor do monitorEmpresa 1 R$ 418,0Empresa 2 R$ 420,0Empresa 3 R$ 418,0Empresa 4 R$ 410,0Empresa 5 R$ 413,0Empresa 6 R$ 430,0Empresa 7 R$ 420,0Empresa 8 R$ 430,0Empresa 9 R$ 416,0Empresa 10 R$ 418,0Empresa 11 R$ 418,0Empresa 12 R$ 420,0Empresa 13 R$ 417,0Empresa 14 R$ 418,0Empresa 15 R$ 420,0Empresa 16 R$ 430,0Empresa 17 R$ 418,0Empresa 18 R$ 430,0Empresa 19 R$ 415,0Empresa 20 R$ 418,0

Como podemos ver, não é possível identi� car, de imediato, quem tem o menor ou o maior preço.

Tabela 3.1 Preços de 20 monitores LCD

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:38LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:38 21/12/2010 17:30:5021/12/2010 17:30:50

Page 39: LIEaD401Probabilidade e Estatistica COMPLETO

39

Probabilidade e Estatística

Métodos Gráficos

3.1.2 ROL

É a tabela obtida após a ordenação dos dados (crescente ou decrescente).

Vamos continuar utilizando o exemplo anterior para construir nos-sa tabela ROL.

Exemplo

Empresas Valor do monitorEmpresa 4 R$ 410,0Empresa 5 R$ 413,0Empresa 19 R$ 415,0Empresa 9 R$ 416,0Empresa 13 R$ 417,0Empresa 1 R$ 418,0Empresa 3 R$ 418,0Empresa 10 R$ 418,0Empresa 11 R$ 418,0Empresa 14 R$ 418,0Empresa 17 R$ 418,0Empresa 20 R$ 418,0Empresa 2 R$ 420,0Empresa 7 R$ 420,0Empresa 12 R$ 420,0Empresa 15 R$ 420,0Empresa 6 R$ 430,0Empresa 8 R$ 430,0Empresa 16 R$ 430,0Empresa 18 R$ 430,0

Observou!? Agora temos, de imediato, a empresa que vende mais barato, a que vende mais caro...

3.1.3 Distribuição de frequência sem intervalos de classe

A distribuição de frequência sem intervalos de classe é a simples con-densação dos dados, conforme as repetições de seus valores; ou seja, é a ocorrência que o valor repete. É usada para diminuir o tamanho da série.

Tabela 3.2 Ordenação dos preços dos monitores

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:39LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:39 21/12/2010 17:30:5121/12/2010 17:30:51

Page 40: LIEaD401Probabilidade e Estatistica COMPLETO

40

Curso de Licenciatura em Informática

Capítulo 3

Exemplo:

Vamos continuar utilizando o exemplo anterior para construir a distri-buição de frequência sem intervalos de classe.

Valor do monitor Número de empresas com o mesmo preço

R$ 410,0 1R$ 413,0 1R$ 415,0 1R$ 416,0 1R$ 417,0 1R$ 418,0 7R$ 420,0 4R$ 430,0 2

Total 20

Notou!? O tamanho da tabela foi reduzido; as informações continu-aram as mesmas.

a) Diagrama de uma distribuição de frequência

Uma distribuição de frequência sem intervalos de classe é representada gra� camente por um diagrama, em que cada valor da variável é repre-sentado por um segmento de reta vertical e de comprimento proporcio-nal à respectiva frequência.

0

1

2

3

4

5

6

7

8

R$ 405,0 R$ 410,0 R$ 415,0 R$ 420,0 R$ 425,0 R$ 430,0 R$ 435,0

Valor do monitor

mero

de e

mp

resas

Figura 11: Diagrama de uma distribuição de frequência.

Tabela 3.3 Valor do monitor e número de empresas com o mesmo preço

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:40LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:40 21/12/2010 17:30:5121/12/2010 17:30:51

Page 41: LIEaD401Probabilidade e Estatistica COMPLETO

41

Probabilidade e Estatística

Métodos Gráficos

A partir de agora, chamaremos o número de repetições de “frequên-cia de ocorrência” ou simplesmente de “frequência”.

Número de repetições = frequência de ocorrência = frequência.

3.1.4 Distribuição de frequência com intervalos de classe

Quando a amostra é grande, a tabela também tende a ser grande; nesse caso, é mais racional efetuar o grupamento dos valores em vários inter-valos de classe.

Exemplo:

Ao acaso, foram pesquisados os preços de 200 monitores LCD, de um mesmo modelo, em 200 empresas de informática. Veja os valores no anexo da apostila e observe que, após o ordenamento dos preços em ordem crescente (ROL), o valor mínimo encontrado é R$ 412,0 e o va-lor máximo é R$ 440,0. Com os preços ordenados, montamos a tabela a seguir:

Valor do monitor(R$)

Frequências

412 |------- 415 10415 |------- 418 15418 |------- 421 20421 |------- 424 25424 |------- 427 30427 |------- 430 30430 |------- 433 28433 |------- 436 22436 |------- 439 12439 |------- 442* 8 Total 200

*Se você está com dúvida sobre o modo como a tabela foi monta-da, não se preocupe, pois o objetivo deste capítulo é exatamente esse. Fique atento e não perca os próximos passos da matéria.A partir de agora, iremos chamar a primeira coluna de “classe”.

Tabela 3.4 Preços de 200 monitores LCD em 200 empresas de informática

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:41LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:41 21/12/2010 17:30:5121/12/2010 17:30:51

Page 42: LIEaD401Probabilidade e Estatistica COMPLETO

42

Curso de Licenciatura em Informática

Capítulo 3

a) Elementos de uma distribuição de frequência com intervalos de classe

Antes de iniciarmos a construção de uma distribuição de frequência com intervalos de classe, vamos ver alguns conceitos importantes.

a) Classe

Classe é o intervalo de variação da variável, simbolizada por i. O núme-ro total de classes é simbolizado por k.

Exemplo: Na tabela anterior, temos: k=10 e para 415 |------- 418 a classe é 2 (i =2).

b) Limites de classe:

São os extremos de cada classe. O menor número é o limite inferior de classe (li) e o maior número é o limite superior de classe (Li).

Exemplo: Em 427 |------- 430 Limite inferior l6= 427 e limite superior L6= 430

O símbolo |------ representa um intervalo fechado à esquerda e aberto à direita. O dado 427 do ROL, não pertence à classe 5, e sim, classe 6, representada por 427 |----- 430.

c) Amplitude de intervalo de classe

É a diferença entre o limite superior e o inferior da classe. É simbolizada por hi = Li - li.

Exemplo: Na tabela anterior, hi= 427 – 424 = 3.

Obs.: Na distribuição de frequência com classe, o hi será igual em todas as classes.

d) Amplitude total da distribuição

É a diferença entre o limite superior da última classe e o limite inferior da primeira classe.

AT = L(max) - l(min).

Exemplo: Na tabela anterior, AT = 442 - 412= 30.

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:42LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:42 21/12/2010 17:30:5121/12/2010 17:30:51

Petim
Highlight
Page 43: LIEaD401Probabilidade e Estatistica COMPLETO

43

Probabilidade e Estatística

Métodos Gráficos

e) Amplitude total da amostra

É a diferença entre o valor máximo e o valor mínimo da amostra.

Em que:AA = Xmax - Xmin. Xmax = 440 (máximo valor real encontrado do monitor)Xmin = 412 (mínimo valor real encontrado do monitor)Em nosso exemplo, AA = 440 - 412 = 28.

Observe que: AT sempre será maior que AA. Você tem que estar con-vencido dessa a� rmação.

f) Ponto médio de classe:

É o ponto que divide o intervalo de classe em duas partes iguais.

Exemplo:Em 418 |------- 421 o ponto médio x3 = (418+421)/2 = 419,5, ou seja, x3=(l3+L3)/2.

Veja como � ca a distribuição de frequência de preços de 200 monitores anterior:

Classes Frequênciasi=1 (Primeira Classe) 412 |------- 415 10i=2 (Primeira Classe) 415 |------- 418 15i=3 (Primeira Classe) 418 |------- 421 20i=4 (Primeira Classe) 421 |------- 424 25i=5 (Primeira Classe) 424 |------- 427 30i=6 (Primeira Classe) 427 |------- 430 30i=7 (Primeira Classe) 430 |------- 433 28i=8 (Primeira Classe) 433 |------- 436 22i=9 (Primeira Classe) 436 |------- 439 12

i=10 (Primeira Classe) 439 |------- 442* 8Total 200

Tabela 3.5 Classe Frequência de preços de 200 monitores

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:43LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:43 21/12/2010 17:30:5121/12/2010 17:30:51

Page 44: LIEaD401Probabilidade e Estatistica COMPLETO

44

Curso de Licenciatura em Informática

Capítulo 3

ATIVIDADE 3.3

1) Determine a amplitude da amostra -1, -2 , 3, 4, 5.

2) Dada a distribuição de frequência a seguir, que representa os diâmetro de furos encontrados em gabinetes de computadores:

Diâmetros de Furos (mm)

Computa-dores

10 |------- 13 513|------- 16 1516|------- 19 2519|------- 22 3522|------- 25 4525|------- 28 3028|------- 31 2831|------- 34 2234|------- 37 1237|------- 40 8

Total 225

Determine:

a) o limite superior da sexta classe;b) o limite inferior da segunda classe;c) a Amplitude total da distribuição;d) o Ponto médio da quinta classe;e) o intervalo de classe;f) quantos computadores apresentaram diâmetros de furos

entre 28 a 31 mm;g) quantos computadores apresentaram diâmetros de furos

superiores a 22 mm;h) percentualmente, quantos computadores apresentaram

diâmetros de furos entre 16 e 28 mm.

b) Método prático para construção de uma distribuição de frequência

Vamos mostrar um método prático para construção de uma dis-

tribuição de frequência.

Depois de feita a pesquisa de campo, siga os seguintes passos:

(Vamos utilizar o exemplo dos preços de 200 monitores LCD levantados em 200 empresas de informática).

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:44LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:44 21/12/2010 17:30:5121/12/2010 17:30:51

Page 45: LIEaD401Probabilidade e Estatistica COMPLETO

45

Probabilidade e Estatística

Métodos Gráficos

1º - Organize os dados brutos em um ROL;2º - Calcule a amplitude amostral AA;

No nosso exemplo: AA =440 - 412 =28.

3º - Calcule o número de classes por meio da “Regra de Sturges”;

A Regra de Sturges é uma fórmula que compacta os dados e esta-belecerá o número de classes que a distribuição de frequência terá. Ela é dada conforme a fórmula seguir:

i =1 + 3,3 . log n

Em que:

i = número de classes (valor inteiro mais próximo);

n = número de amostra da nossa pesquisa.

Obs.: Qualquer regra para determinação do número de classes da distribuição de frequência (o número de linhas que terá a tabela) não nos leva a uma decisão � nal; isso pois esta vai depender de um julgamento pessoal, que deve estar ligado à natureza dos da-dos e à clareza que se deseja obter na distribuição de frequência.

Existem outras opções à regra de Sturges, como:1/2i = n

No caso do nosso exemplo dos 200 monitores:

n = 200 amostrasi =1 + 3,3 . log 200i = 8,6 , adotamos i = 9

Observe que, efetivamente no nosso exemplo, i = 10.

Veremos em breve o motivo.

4º - Calcule a amplitude do intervalo de classe h = AA/i.;

No nosso exemplo: AA/i = 28/9 = 3,11.

Obs.: Adotaremos neste caso h = 3 para termos intervalos de classe va-lores inteiros e assim obter uma melhor visualização na tabela.

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:45LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:45 21/12/2010 17:30:5221/12/2010 17:30:52

Page 46: LIEaD401Probabilidade e Estatistica COMPLETO

46

Curso de Licenciatura em Informática

Capítulo 3

5º - Monte a tabela da seguinte forma:

ℓi |------- Li= ℓi + h

Exemplo:

ℓ |------- L = ℓ + h1 1 1

412 |------- 415

Em que:

ℓ1 é o menor número inteiro da amostra.

Obs.: ℓ1 deve ser preferencialmente um valor inteiro menor ou igual a Xmin e

L1 deve ser preferencialmente um valor inteiro maior ou igual a ℓ + h.1

No nosso exemplo: o menor número da amostra é 412. Assim, teremos: L1= ℓ + 1 h = 412+3 = 415, logo, a primeira classe será representada por 412 |------- 415.

O primeiro elemento das classes seguintes sempre serão formados pelo último elemento da classe anterior.

Assim a segunda classe � ca:

ℓ = L e L = ( ℓ + h )2 1 2 2

ℓ |------- L = ( ℓ + h )2 2 2

ℓ = 415 e L = 415 + 3 = 4182 2

415 |------- 418 Observe que confere com a tabela 3.6.

As classes seguintes respeitarão o mesmo procedimento.

Ao � nal da montagem da tabela, percebemos que a última classe é 10 e não 9, conforme estabelecia a regra de sturges. Isso ocorre porque a regra de sturges fornece a orientação do número de classe, mas preferimos utilizar números inteiros nos limites inferiores e su-periores de classe para melhorar a apresentação da tabela, com isto, a classe passou de 9 para 10.

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:46LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:46 21/12/2010 17:30:5221/12/2010 17:30:52

Page 47: LIEaD401Probabilidade e Estatistica COMPLETO

47

Probabilidade e Estatística

Métodos Gráficos

c) Representação gráfi ca de uma distribuição

Em todos os grá� cos acima, utilizamos o primeiro quadrante do sistema de eixos coordenados cartesianos ortogonais. Na linha horizontal (eixo das abscissas), colocamos os valores da variável e, na linha vertical (eixo das ordenadas), as frequências.

Histograma: é formado por um conjunto de retângulos justapos-tos, cujas bases se localizam sobre o eixo horizontal, de tal modo que seus pontos médios coincidam com os pontos médios dos in-tervalos de classe. A área de um histograma é proporcional à soma das frequências simples ou absolutas.

Exemplo: Vamos montar o histograma da distribuição de frequência anterior:

Valor do monitor (R$)

Frequências

412|------- 415 10415|------- 418 15418|------- 421 20421|------- 424 25424|------- 427 30427|------- 430 30430|------- 433 28433|------- 436 22436|------- 439 12439|------- 442 8

Total 200

Histograma da distribuição de freqüência

30

25

20

15

10

5

0412 415 418 421 424 427 430 433 436 439 442

f

Tabela 3.6 Valores dos monitores

Figura 12: Histograma da distribuição de frequência

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:47LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:47 21/12/2010 17:30:5221/12/2010 17:30:52

Page 48: LIEaD401Probabilidade e Estatistica COMPLETO

48

Curso de Licenciatura em Informática

Capítulo 3

Quem estiver utilizando a planilha eletrônica Excel deve instalar esse recurso em Ferramentas/Suplementos/Ferramentas de Análi-se; caso contrário, pode-se utilizar as ferramentas de desenho dos aplicativos.

3.1.5 Polígono de frequência

É um grá� co em linha, sendo as frequências marcadas sobre perpendi-culares ao eixo horizontal, levantadas pelos pontos médios dos interva-los de classe. Fornece, na realidade, o contorno, ou seja, a envoltória, em vez de retângulos paralelos.

Exemplo de polígono de frequência:

30

25

20

15

10

5

0412 415 418 421 424 427 430 433 436 439 442

f

Figura 13: Exemplo de Polígono de frequência da distribuição de dados

a) Frequências simples ou absolutas

São os valores que realmente representam o número de dados de cada classe. A soma das frequências simples é igual ao número total dos da-dos da distribuição. Veja exemplo a seguir.

b) Frequências relativas

São os valores das razões entre as frequências absolutas de cada classe e a frequência total da distribuição. A soma das frequências relativas é igual a 1 (100 %).

Exemplo de frequências relativas fri (%)

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:48LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:48 21/12/2010 17:30:5221/12/2010 17:30:52

Page 49: LIEaD401Probabilidade e Estatistica COMPLETO

49

Probabilidade e Estatística

Métodos Gráficos

classe � fri (%)412|------- 415 10 5,0%415|------- 418 15 7,5%418|------- 421 20 10,0%421|------- 424 25 12,5%424|------- 427 30 15,0%427|------- 430 30 15,0%430|------- 433 28 14,0%433|------- 436 22 11,0%436|------- 439 12 6,0%439|------- 442 8 4,0%

Total 200 100%

c) Frequência simples acumulada de uma classe – Fi

É o total das frequências de todos os valores inferiores ao limite superior do intervalo de uma determinada classe.

classe � fri (%) Fi412|------- 415 10 5,0% 10415|------- 418 15 7,5% 25418|------- 421 20 10,0% 45421|------- 424 25 12,5% 70424|------- 427 30 15,0% 100427|------- 430 30 15,0% 130430|------- 433 28 14,0% 158433|------- 436 22 11,0% 180436|------- 439 12 6,0% 192439|------- 442 8 4,0% 200

Total 200 100%

d) Frequência relativa acumulada de uma classe – Fri

É a frequência acumulada da classe, dividida pela frequência total da distribuição.

Tabela 3.7 Exemplo de frequências relativas fri

Tabela 3.8 Exemplo de frequências relativas fri e acumulada Fri

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:49LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:49 21/12/2010 17:30:5321/12/2010 17:30:53

Page 50: LIEaD401Probabilidade e Estatistica COMPLETO

50

Curso de Licenciatura em Informática

classe � fri (%) Fi Fri (%)412|------- 415 10 5,0% 10 5,0%415|------- 418 15 7,5% 25 12,5%418|------- 421 20 10,0% 45 22,5% 421|------- 424 25 12,5% 70 35,0%424|------- 427 30 15,0% 100 50,0%427|------- 430 30 15,0% 130 65,0%430|------- 433 28 14,0% 158 79,0%433|------- 436 22 11,0% 180 90,0%436|------- 439 12 6,0% 192 96,0%439|------- 442 8 4,0% 200 100,0%

Total 200 1

Observar que temos o valor acumulativo em percentagens. Como exemplo, podemos ver da tabela anterior que o preço do monitor até R$ 436,00 está entre os 90% dos monitores pesquisados, ou seja, apenas 10% dos monitores custam mais do que R$ 436,00

3.1.6 Curva de frequência (curva polida):

Enquanto o polígono de frequência nos dá a imagem real do fenôme-no estudado, a curva de frequência nos dá a imagem tendencial; ou seja, mostra o comportamento dos dados segundo um grá� co de linha já estudado. O polimento, do ponto de vista geométrico, corresponde à eliminação dos vértices da linha poligonal de um polígono de frequên-cia. Para conseguir o polimento, vamos utilizar uma fórmula bastante simples, apresentada a seguir:

A fci (frequência calculada da classe ou frequência polida) é, na realidade, uma média ponderada das frequências em torno da fre-quência a ser polida.

Em que:

fci = frequência calculada da classe considerada (frequência polida).� = frequência simples da classe a ser polida.fant = frequência simples da classe anterior a ser polida.fpost = frequência simples da classe posterior a ser polida.

Capítulo 3

Tabela 3.9 Exemplo de frequências relativas fri e acumulada Fri

4

.2 fpostfifantfci

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:50LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:50 21/12/2010 17:30:5321/12/2010 17:30:53

Page 51: LIEaD401Probabilidade e Estatistica COMPLETO

51

Probabilidade e Estatística

Métodos Gráficos

30

25

20

15

10

5

0412 415 418 421 424 427 430 433 436 439 442

f

Figura 14 - Curva de Frequência ou Curva polida da distribuição de dados

ATIVIDADE 3.5

1) A tabela a seguir apresenta as velocidades dos Links de Inter-net de 400 computadores conectados a uma grande empresa.

KbytesQuantidade de com-putadores conectados

300|------- 400 14400|------- 500 46500|------- 600 58600|------- 700 76700|------- 800 68800|------- 900 62900|------- 1000 48

1000 |-------1100 221100 |-------1200 6439|------- 442 8

Total 200

Com relação a essa tabela, determine:

a) a frequência da quarta classe;b) a frequência relativa da sexta classe;c) a frequência acumulada da quinta classe;d) o número de computadores cuja velocidade do link não

atinge 700 kbites;e) o número de computadores cuja velocidade do link atinge e

ultrapassa 800 kbites;f) a percentagem de computadores cuja velocidade do link

não atinge 600 kbites;g) a percentagem de computadores cuja velocidade do link

seja maior ou igual a 900 kbites;h) a percentagem de computadores cuja velocidade do link

seja maior ou igual a 500 kbites e inferior a 1000 kbites;i) a classe dos 72º computadores mais rápidos no link.

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:51LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:51 21/12/2010 17:30:5321/12/2010 17:30:53

Page 52: LIEaD401Probabilidade e Estatistica COMPLETO

52

Curso de Licenciatura em Informática

Capítulo 3

2) Os dados a seguir, obtidos em uma pesquisa realizada no co-mércio local, apresentam as diferenças encontradas nos preços de 100 placas-mãe. Com base nisso:

a) forme com esses dados uma distribuição de frequência com intervalo de classe;

b) confeccione o histograma e o polígono de frequência correspondentes.

3,9 7,4 10.0 11,8 2,3 4,5 10,5 8,4 15,6 7,618,8 2,9 2,3 0,4 5 9 5,5 9,2 12,4 8,74,5 4,4 10,6 5,6 8,5 2,4 17,8 11,6 0,8 4,47,1 3.2 2,7 9,5 2,7 9,5 13,1 3,8 6,3 7,94,8 5,3 12,9 6,9 6,3 7,5 2,6 3,3 4,6 163,9 7,4 10.0 11,8 2,3 4,5 10,5 8,4 15,6 7,618,8 2,9 2,3 0,4 5 9 5,5 9,2 12,4 8,74,5 4,4 10,6 5,6 8,5 2,4 17,8 11,6 0,8 4,47,1 3.2 2,7 9,5 2,7 9,5 13,1 3,8 6,3 7,94,8 5,3 12,9 6,9 6,3 7,5 2,6 3,3 4,6 16

3) Examinando o histograma abaixo, que corresponde às notas re-lativas à aplicação de um teste de inteligência a um grupo de alu-nos do curso de análise e desenvolvimento de sistema, responda:

a) Qual é o intervalo de notas que apresentou maior frequência?b) Qual a amplitude total da distribuição?c) Qual o número total de alunos?d) Qual é a frequência do intervalo de classe 14 |– 15? e) Quantos alunos receberam notas entre 9 e 16?f) Quantos alunos receberam notas não-inferiores a 12?

25

20

15

10

5

1

4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:52LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:52 21/12/2010 17:30:5321/12/2010 17:30:53

Page 53: LIEaD401Probabilidade e Estatistica COMPLETO

53

Probabilidade e Estatística

Métodos Gráficos

Olá, Aluno(a)!

Chegamos ao � nal do terceiro capítulo, em que foram apresenta-das diversas formas de organizar e analisar os dados de uma série de observações, as tabelas de frequências e os métodos grá� cos. É importante que esses conteúdos estejam bem compreendidos; caso contrário, faça uma revisão, pois eles serão necessários nos próximos capítulos.

Sigamos adiante!

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:53LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:53 21/12/2010 17:30:5321/12/2010 17:30:53

Page 54: LIEaD401Probabilidade e Estatistica COMPLETO

54

Curso de Licenciatura em Informática

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:54LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:54 21/12/2010 17:30:5421/12/2010 17:30:54

Page 55: LIEaD401Probabilidade e Estatistica COMPLETO

MEDIDAS DE ORDENAMENTO E DE POSIÇÃO

Olá, Aluno(a)!

Neste capítulo, estudaremos as medidas de ordenamento e de po-sição, denominadas também de medidas de tendência central, tais como média, moda, mediana e separatrizes, as quais nos permitirão resumir e analisar uma série de dados.

Bons estudos!

Prof. Sebastião A. Carneiro

4.1 Medidas de posição

As mais importantes medidas de posição são as medidas de tendência central, pois se veri� ca uma tendência dos dados observados a se agru-parem em torno dos valores centrais.

As medidas de tendência central mais utilizadas são: média aritmética, moda e mediana. Outras medidas de tendência central menos utiliza-das, que não estudaremos neste curso, são as médias: geométrica, har-mônica, quadrática, cúbica e bi quadrática.

Outras medidas de posição são as separatrizes, que englobam: a própria mediana, os decis, os quartis e os percentis.

4.2 Média de população e de amostras

Em estatística, o conceito de média também pode ser usado para descre-ver um conjunto de observações. Quando o conjunto das observações é uma população, é chamado de média da população e representaremos por µ. Quando o conjunto das observações é uma amostra estatística, é chamado de média amostral e representaremos por X . Na prática, ao lidar com grandes populações, é quase sempre impossível achar o va-lor exato da média da população, devido ao tempo, ao custo e a outras restrições de recursos. Por esse motivo, estudaremos somente a média amostral que será chamada de média, simplesmente.

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:55LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:55 21/12/2010 17:30:5421/12/2010 17:30:54

Page 56: LIEaD401Probabilidade e Estatistica COMPLETO

56

Curso de Licenciatura em Informática

Capítulo 4

4.3 Representação dos valores de uma série de valores

Os valores de uma série de valores serão representados por uma letra maiúscula, normalmente X, e a sua posição na série, por uma letra mi-núscula, normalmente i. A quantidade total de valores na série será re-presentada por n.

Na série X: 4, 8, 12, 20 e 50, temos: X1= 4; X2= 8; X3=12; X4=12; X5=50 e n=5.

Em um conjunto de dados, podemos def nir vários tipos de mé-

dias. Porém, em nossos estudos, vamos nos limitar ao mais im-

portante: a média aritmética.

4.4 Média aritmética ( x )

É igual ao quociente da soma dos valores do conjunto e o número total dos valores.

A média sempre será indicada por uma letra maiúscula com um traço superior.

Exemplo 1:Calcular a média dos valores anteriores:4, 8, 12, 20 e 50.

Exemplo 2:Calcular a média dos valores a seguir:2; - 4; 0; 11; 1; 20; 30.

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:56LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:56 21/12/2010 17:30:5421/12/2010 17:30:54

Petim
Highlight
Page 57: LIEaD401Probabilidade e Estatistica COMPLETO

57

Probabilidade e Estatística

Medidas de Ordenamento e de Posição

4.4.1 Média Aritmética para dados não-agrupados:

Quando desejamos conhecer a média dos dados não-agrupados em ta-belas de frequências, determinamos a média aritmética simples, con-forme já visto no item anterior.

Exemplo:

A venda diária de memória RAM 1 GB , durante uma semana, foi de 100, 140, 130, 150, 160, 180 e 120 unidades; então, a venda média diária de memória RAM foi:

Figura 15: Memória RAM

X = (100 + 140 + 130 + 150 + 160 + 180 + 120) / 7 = 140 unidades

O resultado obtido, 140, representa o valor diário de venda de me-mórias RAM. Ou seja, 140 representa os 7 valores.

4.4.2 Desvio em relação à média

É a diferença entre cada elemento da série de valores e a média aritmética, ou seja: di = Xi – X

No exemplo anterior, temos sete desvios:

d1 = 100 - 140 = - 40, d2 = 140 - 140 = 0, d3 = 130 - 140 = -10, d4 = 150 - 140 = 10, d5 = 160 - 140 = 20, d6 = 180 - 140 = 40 e d7 = 120 - 140 = - 20.

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:57LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:57 21/12/2010 17:30:5421/12/2010 17:30:54

Page 58: LIEaD401Probabilidade e Estatistica COMPLETO

58

Curso de Licenciatura em Informática

4.4.3 Propriedades da média

1ª propriedade: A soma algébrica dos desvios em relação à média é sempre nula.

No exemplo anterior: d1 + d2 + d3 + d4 + d5 + d6 + d7 = 0

2ª propriedade: Somando-se (ou subtraindo-se) uma constante (c) a todos os valores de uma variável, a média do conjunto � ca maior (ou menor) dessa constante.

Se no exemplo original somarmos a constante 2 a cada um dos valores da variável, teremos:

Y = 102+142+132+152+162+182+122 / 7 = 142 unidades ou

Y + 2 = 140 +2 = 142 unidades

3ª propriedade: Multiplicando-se (ou dividindo-se) todos os va-

lores de uma variável por uma constante (c), a média do conjunto

f ca multiplicada (ou dividida) por essa constante.

Se no exemplo original multiplicarmos a constante 3 a cada um dos valores da variável, teremos:

a) Z = 300 + 420 + 390 + 450 + 480 + 540 + 360 / 7 = 420 unidades

Z = X x 3 = 140 x 3 = 420 unidades

ATIVIDADE 4.1

1) Marque a opção correta. Na tabela primitiva: {6, 2, 7, 6, 5, 4} a soma dos desvios em relação à média aritmética é igual:

( ) ao número - 4

( ) ao número 8

( ) ao número 0

( ) ao número 25

( ) ao número 4

2) Numa empresa de informática, a média de vendas é de 130 computadores. A empresa faz uma promoção e a quantidade de unidades vendidas aumenta em 20%. Assim, qual a média de ven-

Capítulo 4

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:58LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:58 21/12/2010 17:30:5621/12/2010 17:30:56

Page 59: LIEaD401Probabilidade e Estatistica COMPLETO

59

Probabilidade e Estatística

Medidas de Ordenamento e de Posição

das no período da promoção?

3) Marque a opção correta. um professor, após veri� car que toda a classe obteve nota baixa, eliminou as questões a que os alunos não responderam. Com isso, as notas de todos os alunos foram aumentadas de 3 pontos. Então:

a) ( ) a média aritmética � cou alterada de 3, assim como a soma dos desvios;

b) ( ) a média aritmética diminui de 3;

c) ( ) não houve alteração nem na média nem nos desvios;

d) ( ) a média aritmética aumentou de 3.

4) Considerando que você tem série aritmética, na qual o primei-ro termo é -3, a razão é -5 e o número de elementos é 389, pede-se: qual a soma dos desvios da série considerada?

5) Qual a soma dos desvios da média da série considerada a seguir?

33 28 23 18 13 812 33 54 75 96 117-9 38 85 132 179 226-30 43 116 189 262 335-51 48 147 246 345 444-72 53 178 303 428 553-93 58 209 360 511 662

b) Média Aritmética para dados agrupados:

b1) Sem intervalos de classe

Numa rede, trafega um � uxo diário de dados, conforme a tabela a se-guir. Qual a média diária de dados que trafega na rede?

Fluxo de dados Duração (h)128 MB 2256 MB 6350 MB 8380 MB 5400 MB 3

Total 24

Tabela 4.1 Tráfego de �uxo diário de dados na rede

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:59LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:59 21/12/2010 17:30:5721/12/2010 17:30:57

Page 60: LIEaD401Probabilidade e Estatistica COMPLETO

60

Curso de Licenciatura em Informática

Capítulo 4

O � uxo de dados será representado pela variável Xi, a duração com que os dados trafegam na rede, representaremos por � .

Xi fi 128 MB 2256 MB 6350 MB 8380 MB 5400 MB 3

Total 24Como a duração são números indicadores da intensidade de cada valor da variável, as frequências funcionam como fatores de ponderação, o que nos leva a calcular a média aritmética ponderada da seguinte forma:

Devemos observar que a média ponderada não é uma nova fórmula para o cálculo da média. Na realidade, há um agrupamento dos valores repetidos

Devemos, assim, montar uma nova coluna (Xi.� ) na tabela:

Xi � Xi.�

128 MB 2 128 . 2 = 256256 MB 6 256 . 6 = 1536350 MB 8 350 . 8 = 2800380 MB 5 380 . 5 = 1900400 MB 3 400 . 3 = 1200

Total Σ � = 24 Σ Xi.� = 7692

Tabela 4.2 Tráfego de �uxo diário de dados na rede representada por Xi �.

Tabela 4.3 Ocorrência de tráfego de �uxo diário (Xi x �)

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:60LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:60 21/12/2010 17:30:5721/12/2010 17:30:57

Page 61: LIEaD401Probabilidade e Estatistica COMPLETO

61

Probabilidade e Estatística

Medidas de Ordenamento e de Posição

Calcular a média conforme a fórmula a seguir:

Ou seja, a quantidade média de dados que trafegam na rede é de 320,5 MB.

ATIVIDADE 4.2

1) Marque a alternativa correta:

Em uma prova de Estatística, 3 alunos obtiveram a nota 8,2; ou-tros 3 obtiveram a nota 9,0; 5 obtiveram a nota 8,6; 1 obteve a nota 7,0 e 1, a nota 8,9. A média aritmética é:

a) ( ) uma média aritmética simples com valor 8,0;

b) ( ) uma média aritmética simples com valor 8,7;

c) ( ) uma média aritmética ponderada com valor 8,0;

d) ( ) uma média aritmética ponderada com valor 8,5;

e) ( ) nenhuma das respostas anteriores.

2) Em uma classe de 50 alunos, as notas obtidas foram as seguintes:

Notas Número de alunos

4 35 86 127 128 89 5

10 2

Qual a nota média da turma?

3) Suponha que adicionamos 100 a cada um dos valores de uma amostra. O que acontece com a média?

b2) Com intervalos de classe

No caso de média aritmética para dados agrupados com intervalos de classe, convencionamos que todos os valores incluídos em um determi-nado intervalo de classe coincidem com o seu ponto médio, e de� nimos a média da mesma maneira como calculamos a média aritmética para dados agrupados sem intervalos de classe.

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:61LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:61 21/12/2010 17:30:5721/12/2010 17:30:57

Page 62: LIEaD401Probabilidade e Estatistica COMPLETO

62

Curso de Licenciatura em Informática

Xi =(Li +li)/2

Em que:

Xi – Ponto médio da classe;Li – Limite superior da classe;Li - Limite inferior da classe.

Exemplo:

Vamos usar o exemplo da pesquisa dos preços de 200 monitores LCD da marca AOC, em 200 empresas de informática, para calcular a média de preços.

Valor do monitor (R$) Frequências

412 |------- 415 10415|------- 418 15418|------- 421 20421|------- 424 25424|------- 427 30427|------- 430 30430|------- 433 28433|------- 436 22436|------- 439 12439|------- 442 8

Total 200

Calculando os valores de Xi. � , teremos:

Classe Fi Xi Xi. fi 412|------- 415 10 413,5 4135415|------- 418 15 416,5 6247,5418|------- 421 20 419,5 8390421|------- 424 25 422,5 10562,5424|------- 427 30 425,5 12765427|------- 430 30 428,5 12855430|------- 433 28 431,5 12082433|------- 436 22 434,5 9559

Capítulo 4

Tabela 4.4 Preços de 200 monitores LCD da marca AOC em 200 empresas de informática.

Tabela 4.5 Ocorrências de Preços de 200 monitores LCD da marca AOC, em 200 empresas de informática (Xi. �)

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:62LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:62 21/12/2010 17:30:5821/12/2010 17:30:58

Page 63: LIEaD401Probabilidade e Estatistica COMPLETO

63

Probabilidade e Estatística

Medidas de Ordenamento e de Posição

436|------- 439 12 437,5 5250439|------- 442 8 440,5 3524Total 200 85370

Logo, a média será:

ATIVIDADE 4.3

1) Calcule o valor médio da placa-mãe (mainboard ou motherbo-ard), cujos valores estão distribuídos a seguir:

Tipo de placa-mãe Valor R$ QuantidadeTipo 1 300|------- 305 14Tipo 2 305|------- 310 46Tipo 3 310|------- 315 58Tipo 4 315|------- 320 76Tipo 5 320|------- 325 68Tipo 6 325|------- 330 62Tipo 7 330|------- 335 48Tipo 8 335|------- 340 22

2) Marque a opção correta: Um aluno faz três provas com pesos 2, 2 e 3. Se ele tirou 2 e 7 nas duas primeiras, quanto precisa tirar na terceira prova para � car com média maior ou igual a 6?

a) ( ) pelo menos 5

b) ( ) pelo menos 6

c) ( ) pelo menos 7

d) ( ) pelo menos 8

4.5 Moda (Mo)

A moda é utilizada quando desejamos obter uma medida rápida e apro-ximada de posição. Já a média aritmética é a medida de posição que possui a maior estabilidade.

É especialmente útil para reduzir a informação de um conjunto de da-dos qualitativos, apresentado sob a forma de nomes ou categorias, para os quais não se pode calcular a média.

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:63LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:63 21/12/2010 17:30:5821/12/2010 17:30:58

Page 64: LIEaD401Probabilidade e Estatistica COMPLETO

64

Curso de Licenciatura em Informática

Capítulo 4

É o valor que ocorre com maior frequência em uma série de valores.

Desse modo, o salário modal dos empregados de uma fábrica é o salá-rio mais comum, isto é, o recebido pelo maior número de empregados dessa fábrica.

4.5.1 Moda quando os dados não estão agrupados

A moda é facilmente reconhecida, basta, de acordo com a de� nição, procurar o valor que mais se repete.

Exemplo:

Na série {7 , 8 , 9 , 10 , 10 , 10 , 11 , 12}, a moda é 10.

Há séries nas quais não existe o valor modal, isto é, não há repetições de valores.

Exemplo:

A série {3 , 5 , 8 , 10 , 12} não apresenta moda. Ela é amodal.

.Em outros casos, pode haver dois ou mais valores de concentração. Di-zemos, então, que a série tem dois ou mais valores modais.

Exemplo:

A série {2 , 3 , 4 , 4 , 4 , 5 , 6 , 7 , 7 , 7 , 8 , 9} apresenta duas modas: 4 e 7. Ela é bimodal.

4.5.2 Moda quando os dados estão agrupados

a) Sem intervalos de classe

Uma vez agrupados os dados, é possível determinar imediatamen-te a moda: basta � xar o valor da variável de maior frequência.

Exemplo: Na medição de temperatura durante o mês de junho de 2005, na cidade de Curitiba, qual a mais recorrente?

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:64LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:64 21/12/2010 17:30:5821/12/2010 17:30:58

Page 65: LIEaD401Probabilidade e Estatistica COMPLETO

65

Probabilidade e Estatística

Medidas de Ordenamento e de Posição

Temperaturas Frequência0º C 31º C 92º C 123º C 6

Resposta: 2º C é a temperatura modal, pois é a de maior frequência.

a) Com intervalos de classe

A classe que apresenta a maior frequência é denominada classe modal. Pela de� nição, podemos a� rmar que a moda, nesse caso, é o valor dominante que está compreendido entre os limites inferior e superior da classe modal. O método mais simples para o cálculo da moda consiste em tomar o ponto médio da classe modal. Da-mos a esse valor a denominação de moda bruta.

Mo = (ℓ* + L* ) / 2

Em que:

ℓ* = limite inferior da classe modal e,

L*= limite superior da classe modal.

Exemplo:

Calcule o preço modal dos pendrives de 4Gb, os preços estão dispostos na tabela a seguir:

Figura 16: Pendrive de 4Gb

Preço R$ Frequência54|------ 58 958|------ 62 1162|------ 66 866|------ 70 5

Tabela 4.6 Ocorrências de temperaturas em junho de 2005, na cidade de Curitiba.

Tabela 4.7 Distribuição de Frequência dos preços dos pendrives

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:65LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:65 21/12/2010 17:30:5821/12/2010 17:30:58

Page 66: LIEaD401Probabilidade e Estatistica COMPLETO

66

Curso de Licenciatura em Informática

Capítulo 4

Resposta: a classe modal é 58|-------- 62, pois é a de maior frequência. ℓ*=58

e L*=62

Mo = (58+62) / 2 = R$ 60 (esse valor é estimado, pois não conhecemos o valor real da moda).

O cálculo da moda também pode ser feito pela fórmula de CZU-BER. Vale a pena pesquisá-lo

ATIVIDADE 4.4

1) Calcule o tipo modal dos mouses ópticos a seguir:

Mouse QuantidadesTipo 1 344Tipo 2 234Tipo 3 656Tipo 4 125Tipo 5 111Tipo 6 256

2) Calcule o valor modal da placa-mãe (mainboard ou mother-board), cujos valores estão distribuídos na tabela a seguir:

Tipo de placa-mãe Valor R$ QuantidadeTipo 1 300 |------- 305 14Tipo 2 305 |------- 310 46Tipo 3 310 |------- 315 58Tipo 4 315 |------- 320 76Tipo 5 320 |------- 325 68Tipo 6 325 |------- 330 62Tipo 7 330 |------- 335 48Tipo 8 335 |------- 340 22

3) quando queremos veri� car que tipo de monitor apresentou maior número de defeitos, utilizamos:

a) ( ) moda;

b) ( ) mediana;

c) ( ) média;

d) ( ) qualquer das anteriores.

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:66LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:66 21/12/2010 17:30:5821/12/2010 17:30:58

Page 67: LIEaD401Probabilidade e Estatistica COMPLETO

67

Probabilidade e Estatística

Medidas de Ordenamento e de Posição

4.6 Mediana (MD)

Ordenados os elementos da série de dados, a mediana é o valor (perten-cente ou não à série) que a divide ao meio, isto é, 50% dos elementos da série são menores ou iguais à mediana e os outros 50% são maiores ou iguais à mediana.

Emprego da Mediana

• Quando desejamos obter o ponto que divide a distribuição em duas partes iguais.

• Quando há valores extremos que afetam de maneira acentuada a média aritmética

4.6.1 Mediana para série com número ímpar de termos

Dada uma série de valores, por exemplo: {5, 2, 6, 13, 9, 15, 10}.

De acordo com a de� nição de mediana, o primeiro passo a ser dado é o da ordenação (crescente ou decrescente) dos valores: {2, 5, 6, 9, 10, 13, 15}

Temos n=7 (ímpar).

O valor que divide a série acima em duas partes iguais é 9; logo, a Md = 9.

Exemplo:

Cálculo da mediana da série {1, 3, 0, 0, 2, 4, 1, 2, 5}:

1º - Ordenar a série {0, 0, 1, 1, 2, 2, 3, 4, 5};

n = 9; logo, o 5º elemento da série ordenada será a mediana;

5º elemento = 2

4.6.2 Mediana para série com número par de termos:

A mediana é obtida pela média dos dois elementos centrais da série

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:67LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:67 21/12/2010 17:30:5821/12/2010 17:30:58

Page 68: LIEaD401Probabilidade e Estatistica COMPLETO

68

Curso de Licenciatura em Informática

Capítulo 4

Exemplo: Cálculo da mediana da série {1, 3, 0, 0, 2, 4, 1, 3, 5, 6}:

1º - Ordenar a série {0, 0, 1, 1, 2, 3, 3, 4, 5, 6};

Para dividir a série, o valor tem que estar entre os valores centrais 2 e 3;

5º Termo = 2

6º Termo = 3

A mediana será = (2+3) / 2, ou seja, Md = 2,5 . A mediana, no exemplo, é a média aritmética do 5º e 6º termos da série.

Notas:

• Quando o número de elementos da série estatística for ímpar, haverá coincidência da mediana com um dos elementos da série.

• Em uma série a mediana, a média e a moda não têm, necessa-riamente, o mesmo valor.

• A mediana depende da posição e não dos valores dos elemen-tos na série ordenada. Essa é uma das diferenças marcantes entre mediana e média (que se deixa infl uenciar, e muito, pelos valores extremos). Vejamos:

Em {5, 7, 10, 13, 15}, a média = 10 e a mediana = 10;

Em {5, 7, 10, 13, 65}, a média = 20 e a mediana = 10;

A média do segundo conjunto de valores é maior do que a do

primeiro por inf uência dos valores extremos, ao passo que a me-

diana permanece a mesma.

4.6.3 Mediana para série com dados agrupados

a) Sem intervalos de classe:

No caso da mediana para série com dados agrupados sem inter-valos de classe, é o bastante, identi� car a frequência acumulada imediatamente superior à metade da soma das frequências. A mediana será o valor da variável que corresponde a tal frequência acumulada.

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:68LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:68 21/12/2010 17:30:5921/12/2010 17:30:59

Page 69: LIEaD401Probabilidade e Estatistica COMPLETO

69

Probabilidade e Estatística

Medidas de Ordenamento e de Posição

Exemplo:

Calcule a mediana da tabela abaixo:

Variável Xi

Frequência Fi

Frequência acumulada F

0 2 21 6 82 9 173 13 304 5 35

total 35

Como o somatório das frequências é 35, a fórmula f cará: (35+1) / 2 =

18º (30 é o valor imediatamente superior a 18); logo, a mediana

será igual a 3.

No caso de existir uma frequência acumulada (Fi), tal que:

a mediana será dada por:

Exemplo:

Calcule a mediana da tabela abaixo:

Variável Xi Frequência F Frequência acumulada F12 1 114 2 315 1 416 2 617 1 720 1 8

total 8

Tabela 4.8 Distribuição de Frequência

Tabela 4.9 Distribuição de Frequência

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:69LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:69 21/12/2010 17:30:5921/12/2010 17:30:59

Page 70: LIEaD401Probabilidade e Estatistica COMPLETO

70

Curso de Licenciatura em Informática

Capítulo 4

Como temos = 8/2=4

Aplicando a fórmula acima, teremos:

Md= [X(8/2)+ X(8/2+1)]/2

Md= (3º termo + 4º termo) / 2 = (15 + 16) / 2 = 15,5

Md=15,5

b) Com intervalos de classe

Desejamos calcular a mediana da tabela abaixo, que representa os pesos de 40 alunos.

Pesos (kg) fi50 |------ 54 454 |------ 58 958 |------ 62 1162 |------ 66 866 |------ 70 570 |------ 74 3

Total 40

Devemos seguir estes passos:

1º) Determinamos as frequências acumuladas;

2º) Calculamos ;

3º) Marcamos a classe correspondente à frequência acumu-lada imediatamente superior à . Tal classe será a classe mediana;

4º) Calculamos a mediana pela seguinte fórmula:..

Em que:

ℓ* é o limite inferior da classe mediana;

Tabela 4.10 Pesos de 40 alunos

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:70LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:70 21/12/2010 17:30:5921/12/2010 17:30:59

Page 71: LIEaD401Probabilidade e Estatistica COMPLETO

71

Probabilidade e Estatística

Medidas de Ordenamento e de Posição

F(ant) é a frequência acumulada da classe anterior à classe mediana;

f* é a frequência simples da classe mediana;

h* é a amplitude do intervalo da classe mediana.

Primeiramente, vamos incluir a frequência acumulada na Tabela.

Classes fi Frequência acumulada F50 |------ 54 4 454 |------ 58 9 1358 |------ 62 11 2462 |------ 66 8 3266 |------ 70 5 3770 |------ 74 3 40

Total 40

Temos:

Logo, a classe mediana será 58 |----- 62, pois 24, correspondente a frequência

acumulada imediatamente superior 20, veja na tabela anterior.

Assim:

ℓ* = 58 (limite inferior do intervalo)

F(ant) = 13 (frequência acumulada inferior a 20)

f* = 11 (frequência simples do intervalo 58 |----- 62)

h* = 4 (intervalo de classe, observef qxuoe e é i gual a 4)

Portanto, a mediana será:

Md= 60,54 kg

Interpretação: Md = 60,54 kg

50% dos alunos, ou seja, 20 alunos, pesam menos ou igual a 60,54 kg.

Tabela 4.11 Pesos de 40 alunos

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:71LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:71 21/12/2010 17:30:5921/12/2010 17:30:59

Page 72: LIEaD401Probabilidade e Estatistica COMPLETO

72

Curso de Licenciatura em Informática

Capítulo 4

ATIVIDADE 4.5

1) Calcule a marca mediana dos mouses ópticos a seguir:

Mouse QuantidadesTipo 1 344Tipo 2 234Tipo 3 656Tipo 4 125Tipo 5 111Tipo 6 256

2) medida que tem o mesmo número de valores, abaixo e acima dela, é:

a) ( ) a moda.

b) ( ) a média.

c) ( ) a mediana.

d) ( ) o lugar mediano.

3) Calcule a marca mediana dos teclados:

Teclados QuantidadesFabricante A 344Fabricante B 234Fabricante C 656Fabricante D 125Fabricante E 111

4) Calcule o tipo mediano da placa-mãe (mainboard ou motherbo-ard), cujos valores estão distribuídos abaixo:

Tipo de placa-mãe Valor R$ QuantidadeTipo 1 300 |------- 305 14Tipo 2 305 |------- 310 46Tipo 3 310 |------- 315 58Tipo 4 315 |------- 320 76Tipo 5 320 |------- 325 68Tipo 6 325 |------- 330 62Tipo 7 330 |------- 335 48Tipo 8 335 |------- 340 22

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:72LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:72 21/12/2010 17:30:5921/12/2010 17:30:59

Page 73: LIEaD401Probabilidade e Estatistica COMPLETO

73

Probabilidade e Estatística

Medidas de Ordenamento e de Posição

4.7 Assimetria

As medidas de assimetria mostram o quanto a curva de frequência se desvia ou afasta da posição simétrica (área do lado esquerdo igual a área lado direito do grá� co de distribuição de frequência).

Simetria: uma distribuição de frequência é simétrica quando a média, a mediana e a moda são iguais, ou seja, apresentam um mesmo valor ou, ainda, coincidem num mesmo ponto. Neste caso, temos o lado esquerdo igual ao lado direito.

Assimetria: uma distribuição de frequência é assimétrica quan-do a média, a mediana e a moda recaem em pontos diferentes da distribuição, isto é, apresentam valores diferentes, sendo que o deslocamento desses pontos pode ser para a direita ou para a esquerda. Quanto ao grau de deformação, as curvas de frequência podem ser:

Simétrica Média = Moda

Assimétrica Positiva Média > Moda

Assimétrica Negativa Média < Moda

A Figura 17 a seguir ilustra os tipos de assimetria:

f

Simétrica

x = Md = Mo x

moda

mediana

média

f

xMo < Md < x x < Md < Mo

Assimétrica Positiva Assimétrica Negartiva

Figura 17: Tipos de assimetria

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:73LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:73 21/12/2010 17:30:5921/12/2010 17:30:59

Page 74: LIEaD401Probabilidade e Estatistica COMPLETO

74

Curso de Licenciatura em Informática

Capítulo 4

ATIVIDADE 4.6

a) Determine o tipo de assimetria das séries a seguir:

1. Série A

Estatura(m) frequência fi 2 |----- 6 6

6 |----- 10 1210|----- 14 2414|----- 18 1218|----- 22 6

Total 60

2. Série B

Estatura(m) frequência fi 2 |----- 6 6

6 |----- 10 1210|----- 14 2414|----- 18 3018|----- 22 6

Total 78

3. Série C

Estatura(m) frequência fi 2 |----- 6 6

6 |----- 10 3010|----- 14 2414|----- 18 1218|----- 22 6

Total 78

4.8 Separatrizes

As medidas separatrizes são medidas de posição e têm por f nalidade dividir

uma série de dados. As medidas separatrizes são: mediana, quartil, decil e

percentil.

4.8.1 Quartis

Denominamos quartis os três valores que separam a série em 4 partes iguais.

Q Q = Md Q1 2 3

25%0% 75%50% 100%

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:74LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:74 21/12/2010 17:30:5921/12/2010 17:30:59

Page 75: LIEaD401Probabilidade e Estatistica COMPLETO

75

Probabilidade e Estatística

Medidas de Ordenamento e de Posição

• Q1 – Primeiro quartil, valor que representa os primeiros 25% dos elementos da série;

• Q2 – Segundo quartil (mediana) , valor que representa os primeiros 50% dos elementos da série;

• Q3 – Terceiro e último quartil, valor que representa os primeiros 75% dos elementos da série;

a) Quartis em dados não agrupados

Deve-se utilizar o mesmo princípio do cálculo da mediana para os 3 quartis. Efetivamente, serão calculadas “3 medianas” na mesma série.

Exemplo1:

Calcule os quartis da série {5, 2, 6, 9, 10, 13, 15}.

O primeiro passo a ser dado é o da ordenação (crescente ou decrescen-te) dos valores:

{2, 5, 6, 9, 10, 13, 15}.

O valor que divide a série acima em duas partes iguais é 9; logo, a Md = 9, que será = Q .2

Observe que temos agora {2, 5, 6} e {10, 13, 15} como os dois grupos de valores iguais proporcionados pela mediana (quartil 2). Para o cálculo dos quartis 1 e 3, basta calcular as medianas das partes iguais provenien-tes da verdadeira Mediana da série (quartil 2).

Logo, em {2, 5, 6} a mediana é = 5. Ou seja: o quartil 1;

em {10, 13, 15} a mediana é =13. Ou seja: o quartil 3.

Exemplo 2:

Calcule os quartis da série {1, 1, 2, 3, 5, 5, 6, 7, 9, 9, 10, 13}.

A série já está ordenada, então calcularemos o Quartil 2 = Md = (5+6)/2 = 5,5.

O quartil 1 será a mediana da série à esquerda de Md: {1, 1, 2, 3, 5, 5}

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:75LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:75 21/12/2010 17:31:0021/12/2010 17:31:00

Page 76: LIEaD401Probabilidade e Estatistica COMPLETO

76

Curso de Licenciatura em Informática

Capítulo 4

Q = (2+3)/2 = 2,51

O quartil 3 será a mediana da série à direita de Md: {6, 7, 9, 9, 10, 13}

Q = (9+9)/2 = 93

b) Quartis para dados agrupados em classes

Usamos a mesma técnica do cálculo da mediana, bastando subs

tituir, na fórmula da mediana, por .

Para determinar os quartis, devemos seguir estes passos:

1º) determinamos as frequências acumuladas;

2º) calculamos ,

Sendo k o número de ordem do quartil;

3º) calculamos a Mediana pela seguinte fórmula:..

Em que:

ℓ* é o limite inferior da classe mediana.

F(ant) é a frequência acumulada da classe anterior à classe mediana.

f* é a frequência simples da classe mediana.

h* é a amplitude do intervalo da classe mediana.

Exemplo 3:

Calcule os quartis da tabela abaixo, que representa os pesos de 40 alunos.

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:76LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:76 21/12/2010 17:31:0021/12/2010 17:31:00

Page 77: LIEaD401Probabilidade e Estatistica COMPLETO

77

Probabilidade e Estatística

Medidas de Ordenamento e de Posição

Pesos (kg) fi50 |------ 54 454 |------ 58 958 |------ 62 1162 |------ 66 866 |------ 70 570 |------ 74 3

Total 40

Vamos calcular o primeiro quartil (Q ).1

Primeiramente, vamos incluir a frequência acumulada na Tabela.

Pesos (kg) fi F50 |------ 54 4 454 |------ 58 9 1358 |------ 62 11 2462 |------ 66 8 3266 |------ 70 5 3770 |------ 74 3 40

Total 40

Temos k=1 para o primeiro quartil

Calculamos

Procuramos na tabela anterior à frequência acumulada, imediatamente, superior a 10; neste caso, temos o valor 13.

Pesos (kg) fi F50 |------ 54 4 454 |------ 58 9 13 Valor imediatamente superior a 1058 |------ 62 11 24

Logo, a classe do primeiro quartil é 54 |------ 58,

Assim:

ℓ* = 54.

F(ant) = 4

f* = 9

h* = 4

Tabela 4.12 Pesos de 40 alunos

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:77LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:77 21/12/2010 17:31:0021/12/2010 17:31:00

Page 78: LIEaD401Probabilidade e Estatistica COMPLETO

78

Curso de Licenciatura em Informática

Capítulo 4

Logo, o primeiro quartil será:

Q = 56,66 kg1

Interpretação: Q = 56,66 kg1

25% dos alunos pesam menos ou igual a 56,66 kg.

Ou ainda, podemos a� rmar que 75% dos alunos pesam mais que 56,66 kg.

Vamos calcular o terceiro quartil (Q ):3

Temos k=3

Calculamos

Logo,.a classe do terceiro quartil é 62 |------ 66

Assim:ℓ* = 62

F(ant) = 24

f* = 8

h* = 4

Logo, o terceiro quartil (Q3) será:

Q = 65 kg3

Interpretação: Q = 65 kg3

75% dos alunos pesam menos ou igual a 65kg.

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:78LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:78 21/12/2010 17:31:0121/12/2010 17:31:01

Page 79: LIEaD401Probabilidade e Estatistica COMPLETO

79

Probabilidade e Estatística

Medidas de Ordenamento e de Posição

ATIVIDADE 4.7

Calcule os 3 quartis das séries a seguir:

a) Teclados:

Teclados QuantidadesTipo 1 344Tipo 2 234Tipo 3 656Tipo 4 125Tipo 5 111

b) Tipos de placa-mãe:

Tipos de placa-mãe Quantidades QuantidadeTipo 1 300 |------- 305 14Tipo 2 300 |------- 310 46Tipo 3 300 |------- 315 58Tipo 4 300 |------- 320 76Tipo 5 300 |------- 325 68Tipo 6 300 |------- 330 62Tipo 7 300 |------- 335 48Tipo 8 300 |------- 345 22

4.8.2 Decis

Denominamos decis os nove valores que separam uma série em 10 par-tes iguais.

D1

10%0% 50% 100%20% 30% 40% 60% 70% 80% 90%

D2 D3 D4 D5=Md D6 D7 D8 D9

D1 – Primeiro decil, valor que representa os primeiros 10% dos elemen-tos da série;

D2 – Segundo decil, valor que representa os primeiros 20% dos elemen-tos da série;

D5 – Quinto decil (mediana), valor que representa os primeiros 50% dos elementos da série;

D9– Nono e último decil, valor que representa os primeiros 20% dos elementos da série;

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:79LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:79 21/12/2010 17:31:0121/12/2010 17:31:01

Page 80: LIEaD401Probabilidade e Estatistica COMPLETO

80

Curso de Licenciatura em Informática

Para o cálculo dos percentis, usaremos a mesma técnica do cálculo

dos quartis, bastando substituir, na fórmula, por .

4.8.3 Percentil ou Centil

Denominamos percentis ou centis os noventa e nove valores que sepa-ram uma série em 100 partes iguais.

D1

10%0% 50% 100%20% 30% 40% 60% 70% 80% 90%

D2 D3 D4 D5=Md D6 D7 D8 D9

Indicamos: P , P , ... , P . 1 2 99

É evidente que P = Md ; P = Q e P = Q .50 25 1 75 3

Os percentis, normalmente, são usados para grandes séries de dados.

Para o cálculo dos percentis, usaremos a mesma técnica do cálculo

dos quartis, bastando substituir, na fórmula,

por .

Exemplo:

Vamos calcular o 8º percentil (P8) da tabela abaixo, que representa os pesos de 40 alunos:

Pesos (kg) fi50 |------ 54 454 |------ 58 958 |------ 62 1162 |------ 66 866 |------ 70 570 |------ 74 3

Total 40

Capítulo 4

Tabela 4.13 Pesos de 40 alunos

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:80LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:80 21/12/2010 17:31:0121/12/2010 17:31:01

Page 81: LIEaD401Probabilidade e Estatistica COMPLETO

81

Probabilidade e Estatística

Medidas de Ordenamento e de Posição

Novamente, vamos incluir a frequência acumulada na Tabela.

Pesos (kg) fi F50 |------ 54 4 454 |------ 58 9 1358 |------ 62 11 2462 |------ 66 8 3266 |------ 70 5 3770 |------ 74 3 40

Total 40

Temos k=8

Calculamos

Logo,.a classe do 8º percentil é 50 |------ 54

Assim:

ℓ* = 50

f* = 4

h* = 4

Logo, o 8º percentil (P ) será:8

P = 53,2 kg8

Interpretação: P = 53,2 kg8

8% das pessoas pesam menos ou igual a 53,2kg.

F(ant) = 0

ATIVIDADE 4.8

1) Calcule o 16o, o 29o e o 73o percentis das séries a seguir:

a) Teclados:

Teclados QuantidadesTipo 1 344Tipo 2 234Tipo 3 656Tipo 4 125Tipo 5 111

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:81LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:81 21/12/2010 17:31:0221/12/2010 17:31:02

Page 82: LIEaD401Probabilidade e Estatistica COMPLETO

82

Curso de Licenciatura em Informática

Capítulo 4

b) Tipos de placa-mãe:

Tipos de placa-mãe Valor R$ QuantidadeTipo 1 300 |------- 305 14Tipo 2 305 |------- 310 46Tipo 3 310 |------- 315 58Tipo 4 315 |------- 320 76Tipo 5 320 |------- 325 68Tipo 6 325 |------- 330 62Tipo 7 330 |------- 335 48Tipo 8 335 |------- 340 22

Cuidado! Sempre a frequência acumulada anterior da primeira classe será zero.

ATIVIDADE 4.8

Após construir o histograma e a curva polida do seu trabalho prá-tico, calcule a média, a mediana, o primeiro, o segundo e o terceiro quartis, além dos percentis (P ,P ,P ,P ,P15 25 35 50 75 e P80), determinando também o tipo de assimetria que o histograma apresenta.

Chegamos ao � nal deste capítulo, no qual aprendemos a calcular as medidas de ordenamento e posição. É importante que esse conteúdo esteja bem compreendido; caso contrário, faça uma revisão, pois ele será necessário para entender os próximos conteúdos.

Vamos para o capítulo 5!

Prof. Sebastião A. Carneiro

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:82LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:82 21/12/2010 17:31:0221/12/2010 17:31:02

Page 83: LIEaD401Probabilidade e Estatistica COMPLETO

MEDIDAS DE VARIABILIDADE

Olá, Turma!

Neste capítulo, veremos que a média não é su� ciente para identi� car uma série de dados. Devemos encontrar uma medida que nos mos-tre a forma como os elementos da série se distribuem, dispersam-se ou variam em torno da média.

Bons estudos!

Prof. Sebastião A. Carneiro

Será que a média é uma medida su� ciente para caracterizar uma série de dados?

Veja o exemplo a seguir:

Exemplo 1:

Observe o tráfego de dados numa rede de computadores: em uma hora há tráfego de dados  a  49 Mbps(rápida) e na próxima hora há trá-fego de dados  a 51 Mbps(rápida também), enquanto que em outra rede uma hora o tráfego de dados é 1 Mbps (muito lenta) e na próxima hora o tráfego de dados é  99 Mbps(muito rápida).

49Mbps49Mbps

01:00h

51Mbps51Mbps

02:00h

Figura 18: Dois computadores se comunicando a 49 Mbps e 51 Mbps

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:83LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:83 21/12/2010 17:31:0321/12/2010 17:31:03

Page 84: LIEaD401Probabilidade e Estatistica COMPLETO

84

Curso de Licenciatura em Informática

Capítulo 5

1Mbps1Mbps

01:00h

99Mbps99Mbps

02:00h

Figura 19 Dois computadores se comunicando a 1 Mbps e 99 Mbps

As duas redes têm a mesma média de comunicação de dados nas 2 horas de comunicação, 50 Mbps, mas em condições diferentes: observe que a primeira rede é mais estável que a segunda.

Portanto, temos a mesma média, mas em condições diferentes.

Por esse motivo, vamos estudar o conceito de variabilidade, pois, se alguém pedisse para você escolher, qual você escolheria?Embora a média de tráfego das duas redes de computadores seja 50 Mbps. A responda, com certeza, seria uma rede mais estável (Figura 5.1), pois varia menos. Assim, veremos a seguir como quanti� car as va-riações das séries em torno da média.

5.1 Medidas de dispersão

Dispersão ou Variabilidade:

É a maior ou a menor diversi� cação dos valores de uma variável em torno de um valor de tendência central (média ou mediana) tomado como ponto de comparação.

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:84LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:84 21/12/2010 17:31:0521/12/2010 17:31:05

Page 85: LIEaD401Probabilidade e Estatistica COMPLETO

85

Probabilidade e Estatística

Medidas de Variabilidade

A média é o valor que melhor representa uma série de valores, mas ela, por si só, não pode destacar o grau de homogeneidade ou heteroge-neidade existente entre os valores que compõem o conjunto. Por esse motivo, precisamos de mais elementos que concretizem bem uma série de valores.

Consideremos os seguintes conjuntos de valores das variáveis X, Y e Z:

X = { 5, 5, 5, 5, 5 } X = 5

Y = { 3, 4, 5, 6, 7 } Y = 5

Z = { 0, 1, 5, 9, 10 } Z = 5

Observe que os três conjuntos apresentam a mesma média aritmética (25/5 = 5). Entretanto, é fácil notar que o conjunto X é mais homogêneo que os conjuntos Y e Z. O conjunto Y, por sua vez, é mais homogêneo que o conjunto Z.

5.2 Medidas de dispersão absoluta

5.2.1 Amplitude total (AT):

a) Para uma série de dados, a amplitude total é a diferença entre o maior e o

menor valor observado:

AT = X máximo - X mínimo.

Exemplo:

Para os valores 4, 5, 8, 2 e 17 a amplitude total será: AT = 17 - 14 = 13

b) Para uma série de dados, mesmo quando os dados estão agrupados sem

intervalos de classe, ainda temos:

AT = X máximo - X mínimo

Exemplo:

Para os dados seguintes, agrupados sem intervalos, a amplitude total será:

Xi Fi10 1111 613 514 13

AT = 14 - 10 = 4

Tabela 5.1 dados agrupados sem intervalos

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:85LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:85 21/12/2010 17:31:0821/12/2010 17:31:08

Page 86: LIEaD401Probabilidade e Estatistica COMPLETO

86

Curso de Licenciatura em Informática

Capítulo 5

c) Para uma série de dados com intervalos de classe, a amplitude total será o limite superior da última classe e o limite inferior da primeira classe. Logo:

AT = L máximo – l mínimo

Exemplo:

Para os dados agrupados em intervalos de classe conforme a seguir, a amplitude total será:

Classes fi10 |------ 16 416 |------ 22 5 22|-------26 2

AT = 26 - 10 = 16

A amplitude total tem o inconveniente de só levar em conta os dois valores extremos da série.

É a única medida de dispersão que não tem na média o ponto de

referência.

5.2.2 Variância

Variância é a medida que considera a totalidade dos valores da variável em estudo. Baseia-se nos desvios em torno da média.

a) VARIÂNCIA 2 DA POPULAÇÃO ( )

A variância de uma população, que representaremos por , é a média aritmética dos quadrados dos desvios absolutos.

Sabemos que:

d= xi –

Em que:

– Média aritmética da população, representada por uma série x i,

em que i = 1, 2, ....,n

Tabela 5.2 – Dados agrupados em intervalos de classe.

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:86LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:86 21/12/2010 17:31:0921/12/2010 17:31:09

Page 87: LIEaD401Probabilidade e Estatistica COMPLETO

87

Probabilidade e Estatística

Medidas de Variabilidade

Logo:

Também pode ser representada deste modo:

b) VARIÂNCIA DA AMOSTRA 2 (s )

Se o conjunto das observações é uma amostra estatística, teremos, neste caso, a variância amostral e a representaremos por 2s ; sua média é repre-sentada por X .

A variância de uma amostra, que representaremos por 2s , é dada conforme indicação a seguir:

Sabemos que:

d= xi – x

Em que:

x – Média aritmética da amostra, representada por uma série xi ,, em que i = 1, 2, ....,n

Logo:

Também pode ser representada deste modo:

No cálculo da variância de uma amostra, devemos dividir a soma dos desvios quadráticos por (n-1) e não n, para que o valor es-perado da variância seja o melhor estimador da variabilidade do conjunto de dados.

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:87LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:87 21/12/2010 17:31:0921/12/2010 17:31:09

Page 88: LIEaD401Probabilidade e Estatistica COMPLETO

88

Curso de Licenciatura em Informática

Capítulo 5

c) VARIÂNCIA PARA SÉRIE DE DADOS SIMPLES

Exemplo:

Cálculo da variância da amostra representada por - 2 cm , -1 cm, 0 cm , 1 cm , 4 cm.

Primeiramente, devemos calcular a média:

O passo seguinte é calcular os desvios e seus quadrados. Acompanhe a tabela a seguir:

Xi x d = xi − x 2d = (xi x 2)- 2 0,4 - 2,4 5,76- 1 0,4 - 1,4 1,960 0,4 - 0,4 0,161 0,4 0,6 0,364 0,4 3,6 12,96

∑ = (xi − x 2) = 21,12

Tabela 5.3 Desvios e seus quadrados de uma série de dados.

Temos n = 5,  a variância � ca:

Propriedades:

PROPRIEDADE 1

Quando somamos ou subtraímos uma constante (k) a todos os valores de uma variável, a sua variância � ca inalterada, pois a va-riância de uma constante é igual a zero.

PROPRIEDADE 2

Quando multiplicamos ou dividimos todos os valores de uma va-riável por uma constante (k), a sua variância � ca multiplicada ou dividida pelo quadrado da constante.

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:88LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:88 21/12/2010 17:31:1021/12/2010 17:31:10

Page 89: LIEaD401Probabilidade e Estatistica COMPLETO

89

Probabilidade e Estatística

Medidas de Variabilidade

ATIVIDADE 5.1

1) Marque a opção correta: Para a série amostral de valores 0, -1, -2, 5, 4, -3, -7, 2, -4 e 6:

a) ( ) a média é 3,4 e a variância, 17,8.

b) ( ) a média é zero e a variância, 16.

c) ( ) a média é 3,4 e a variância, 4.

d) ( ) a média é zero e a variância, 17,8.

e) ( ) a média é zero, mas é impossível calcular a variância.

2) Faça uma análise visual e observe qual série é mais dispersa:

X: 10,11,12,13 e

Y: 1, 110, 120, 130

Agora, comprove a sua a� rmação.

3) Calcule a variância da série amostral: 3 kg, 4kg e 7kg, indican-do o valor correto dentre as opções a seguir:

a) ( ) 4,3 kg

b) ( ) 2,9 kg2c) ( ) 2,9 kg2d) ( ) 4,3 kg

4) Calcule a variância, considerando os dois casos, população e a mostra, da série 31 Kbytes, 38 Kbytes , 19 Kbytes , 27 Kbytes , 24 Kbytes, 42 Kbytes , 32 Kbytes , 18 Kbytes , 43 Kbytes , 15 Kbytes, 39 Kbytes, indicando o valor correto dentre as opções a seguir:

2a) ( ) S = 90,7 Kbytes e 2 = 99,8 Kbytes

2 2b) ( ) S = 90,7 Kbytes e 2 2 = 99,8 Kbytes

2c) ( ) S = 90,7 e 2 = 99,8

2 2d) ( ) S = 99,8 Kbytes e 2 2 = 90,7 Kbytes

5) Suponha que adicionamos 500 a cada um dos valores de uma amostra. O que acontece com a média, desvio médio e a variância?

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:89LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:89 21/12/2010 17:31:1021/12/2010 17:31:10

Page 90: LIEaD401Probabilidade e Estatistica COMPLETO

90

Curso de Licenciatura em Informática

Capítulo 5

2d) VARIÂNCIA PARA DISTRIBUIÇÃO DE FREQUÊNCIA -σ

Quando os dados estiverem agrupados em intervalos de frequen-cia, a variância é calculada conforme a seguir:

Exemplo:

Cálculo da variância da série a seguir, que representa a variação interna ode computadores em C:

X: 0,0,1,1,1,1,1,1,2,2,2,2,2,2,2,2,2,2,2,2,3,3,3,3,3,3,3,4,4,4

Considerar os dados como populacional

Inicialmente, montar a DF:

Xi f i0 21 62 123 74 3

Em seguida, calcular a média:

xi f i xi . f i0 2 01 6 62 12 243 7 214 3 12

� = 30 xi . � = 63

2,1°C

Tabela 5.4 Distribuição de frequência

Tabela 5.5 Distribuição de frequência com Xi Fi

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:90LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:90 21/12/2010 17:31:1021/12/2010 17:31:10

Page 91: LIEaD401Probabilidade e Estatistica COMPLETO

91

Probabilidade e Estatística

Medidas de Variabilidade

Montar a tabela a seguir para facilitar os cálculos:

Xi f i xi − x (xi − x 2) (x−i x 2) fi 0 2 -2,1 4,41 8,821 6 -1,1 1,21 7,262 12 -0,1 0,01 0,123 7 0,9 0,81 5,674 3 1,9 3,61 10,83

� = 30 32,7Tabela 5.6 – Distribuição de frequência com 2(xi – x) . f i

Usamos a fórmula a seguir para calcular a variância:

Outra maneira de calcular a variância populacional é desenvolver o

somatório:

Tente resolver essa igualdade!

Assim, a variância para dados não agrupados � ca:

E para dados agrupados, a variância na população � ca:

ou

Para calcular a variância de dados agrupados amostrais, bastar

substituir o denominador n por (n-1) ou i por i-1

Uma das vantagens de calcular a variância dessa forma é o fato

de não usar a média, pois a média em alguns casos tem que ser

arredondada, o que gera erros de arredondamento. Nos casos

em que a média não é arredondada, as duas fórmulas fornecem

o mesmo resultado.

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:91LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:91 21/12/2010 17:31:1021/12/2010 17:31:10

Page 92: LIEaD401Probabilidade e Estatistica COMPLETO

92

Curso de Licenciatura em Informática

Capítulo 5

Exemplo:

Resolução do exemplo anterior, usando a segunda maneira de calcular a variância:

Montar a tabela a seguir:

2 2xi xi f i xi . f i xi . f i0 0 2 0 01 1 6 6 62 4 12 24 483 9 7 21 634 16 3 12 48Total � =30 xi . � = 63 2 xi . f i = 165

Calcular a variância:

Observou? Como não houve arredondamento na média, os dois va-lores da variância são idênticos, como já era esperado.

ATIVIDADE 5.2

1) Calcule a variância populacional das distâncias a seguir:

2m 13m 15m 20m2m 13m 15m 20m2m 13m 15m 20m2m 13m 15m 20m2m 13m 15m 20m2m 13m 15m 20m2m 13m 15m 20m2m 13m 15m 20m2m 13m 15m2m 13m 15m2m 13m 15m

13m 15m13m 15m13m 15m

Tabela 5.7 Distribuição de frequência com 2xi f i

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:92LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:92 21/12/2010 17:31:1121/12/2010 17:31:11

Page 93: LIEaD401Probabilidade e Estatistica COMPLETO

93

Probabilidade e Estatística

Medidas de Variabilidade

13m 15m13m 15m13m 15m13m 15m13m13m

Observe que a unidade da série está elevada ao quadrado (o 2C) , o que, sob o ponto de vista prático, é um inconveniente. Por esse motivo, imaginou-se uma nova medida com utilidade e interpre-tação prática.

A variância, na verdade, é uma medida que tem pouca utilidade como estatística descritiva pois ampli� ca os desvios, além de apre-sentar sua unidade ao quadrado; porém, é extremamente impor-tante na inferência estatística, além de ser base para o conceito de desvio padrão.

5.2.3 Desvio padrão – S

O desvio padrão, que é representado por s, é a medida de dispersão mais empregada no cálculo de variabilidade, pois elimina a ampli� cação dos desvios e sua unidade é a mesma da série de dados.

O desvio padrão por de� nição é simplesmente a raiz quadrada positiva da variância.

Assim, todas as fórmulas de variância são utilizadas no cálculo de desvio padrão; basta, é claro, tirar a raiz quadrada positiva das fórmulas da variância.

Exemplo:

Cálculo do desvio padrão populacional da série seguinte, que represen-ta a variação interna de computadores em oC:

X: 0,0,1,1,1,1,1,1,2,2,2,2,2,2,2,2,2,2,2,2,3,3,3,3,3,3,3,4,4,4

Como já calculada no exemplo anterior, a variância da série é s2 =1,09 (oC)2

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:93LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:93 21/12/2010 17:31:1221/12/2010 17:31:12

Page 94: LIEaD401Probabilidade e Estatistica COMPLETO

94

Curso de Licenciatura em Informática

Capítulo 5

O desvio padrão é a raiz quadrada de so 2 2 1,09 ( C)= , ou seja:

o1,04 C

O desvio padrão possui algumas propriedades, dentre as quais destacamos:

PROPRIEDADE 1

Se somarmos, ou subtrairmos, uma constante a todos os valores da série, o desvio padrão não se altera.

yi = xi ± c sy = sx

PROPRIEDADE 2

Se multiplicarmos, ou dividirmos, todos os valores da série por uma constante (diferente de zero), o desvio padrão � ca multipli-cado, ou dividido, por essa constante.

yi = xi . c sy = sx . c

ATIVIDADE 5.3

1) Marque a opção correta: Dados os conjuntos de números: A = {-2, -1, 0, 1, 2} e B = {220, 225, 230, 235, 240}.

Podemos a� rmar, de acordo com as propriedades do desvio pa-drão, que o desvio padrão de B é igual:

a) ( ) ao desvio padrão de A;

b) ( ) ao desvio padrão de A, multiplicado pela constante 5;

c) ( ) ao desvio padrão de A, multiplicado pela constante 5;

d) ( ) ao desvio padrão de A mais a constante 230.

2) Considere os seguintes conjuntos de números:

A = {10, 20, 30, 40, 50}

B = {100, 200, 300, 400, 500}

Que relação existe entre os desvios padrões dos dois conjuntos de números?

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:94LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:94 21/12/2010 17:31:1221/12/2010 17:31:12

Page 95: LIEaD401Probabilidade e Estatistica COMPLETO

95

Probabilidade e Estatística

Medidas de Variabilidade

3) Dados os conjuntos de números:

A = {220, 230, 240, 250, 260}

B = {20, 30, 40, 50, 60}

Que relação existe entre os desvios padrões dos dois conjuntos de números?

4) Suponha que adicionamos 100 a cada um dos valores de uma amostra. O que acontece com a média, desvio médio, variância e o desvio padrão?

5) Marque a opção correta: O desvio padrão de um conjunto de dados é 9. A variância será:

a) ( ) 3;

b) ( ) 18;

c) ( ) 36;

d) ( ) 81.

6) Marque a opção correta: A variância de um conjunto de dados é 9. desvio padrão será:

a) ( ) 3;

b) ( ) 18;

c) ( ) 36;

d) ( ) 81.

Na estatística descritiva, o desvio padrão por si só tem limitações. Veja o exemplo:

Um desvio padrão de 2 unidades pode ser considerado pequeno para uma série de valores cujo valor médio é 200; no entanto, se a média for igual a 20, o mesmo não pode ser dito. Além disso, o fato do desvio padrão ser expresso na mesma unidade dos dados limita o seu emprego quando desejamos comparar duas ou mais séries de valores, expressas em unidades diferentes.

Veja outro exemplo:

O desvio padrão da temperatura interna de computadores é 2,5 oC, enquanto o desvio padrão dos preços desses computadores é de R$ 30,00. A pergunta em relação à variabilidade é, quem variou mais a temperatura interna dos computadores ou os preços?

Para contornar essas di� culdades e limitações, iremos de� nir a se-guir o Coefi ciente de Variação de Pearson - CVP.

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:95LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:95 21/12/2010 17:31:1221/12/2010 17:31:12

Page 96: LIEaD401Probabilidade e Estatistica COMPLETO

96

Curso de Licenciatura em Informática

Capítulo 5

5.2.4 Coeficiente de variação de Pearson - CVP

O coe� ciente de variação de Pearson contorna as limitações de compa-ração de séries diferentes do desvio padrão.

O Coe� ciente de Variação de Pearson é a razão entre o desvio pa-drão e a média referente a dados de uma mesma série:

Exemplo:

Vamos tomar os resultados das estaturas e dos pesos de um grupo de indivíduos:

DISCRIMINAÇÃO MÉDIA DESVIO PADRÃOESTATURAS 175 cm 5,0 cm

PESOS 68 kg 2,0 kg

Qual das duas medidas, estatura ou peso, apresenta maior variabilidade?

Resposta:

Observe que não podemos compará-las, pois são séries diferentes; para resolver o problema, basta calcular o CVP da estatura e o CVP do peso. O resultado maior será o mais heterogêneo (maior dispersão ou variabilidade).

CVP estatura = ( 5 / 175 ) x 100 = 2,86 %

CVP peso = ( 2 / 68 ) x 100 = 2,94 %.

Logo, nesse grupo de alunos, os pesos apresentam maior grau de disper-são que as estaturas.

(Se tomássemos somente o desvio padrão para responder a pergunta, teríamos, com certeza, uma resposta errada).

Tabela 5.8 Estaturas e pesos de um grupo de alunos

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:96LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:96 21/12/2010 17:31:1221/12/2010 17:31:12

Page 97: LIEaD401Probabilidade e Estatistica COMPLETO

97

Probabilidade e Estatística

Medidas de Variabilidade

Observe! A série estatura apresenta maior desvio padrão; mesmo assim, é mais homogênea que a série peso, que apresenta menor desvio padrão.

ATIVIDADE 5.4

1) A renda média mensal na localidade A é R$ 1.750,00 e na lo-calidade B é R$ 1.500,00. Os desvios padrões são R$ 100,00 e R$ 80,00. Faça uma análise comparativa quanto ao grau de homoge-neidade da renda nessas duas localidades.

2) Um grupo de 95 moças tem estatura média de 160,6 cm, com um desvio padrão igual a 5,97 cm. Outro grupo de 128 moças tem uma estatura média de 161,9 cm, com um desvio padrão igual a 6,01 cm. Qual é o coe� ciente de variação de cada um dos grupos? Qual o grupo mais homogêneo?

3) Um grupo de 200 famílias tem renda média de R$ 1.063,8, com um coe� ciente de variação de 4,3%. Qual o desvio padrão da renda desse grupo?

4) Uma distribuição apresenta as seguintes estatísticas: S = 2,6 e CVP = 1,9%. Determine a média dessa distribuição.

5) Numa pequena cidade, 165 famílias têm a renda média de R$ 1.350,98, com um desvio padrão de R$ 55,98. Qual a variabilidade relativa das famílias?

ATIVIDADE 5.5

Após construir o histograma e a curva polida do seu trabalho prá-tico, calcule a média, a mediana e o primeiro, o segundo e o ter-ceiro quartis; calcule também os percentis (P15,P25,P35,P50,P75 e P80) e o coe� ciente de variação de Pearson.

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:97LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:97 21/12/2010 17:31:1221/12/2010 17:31:12

Page 98: LIEaD401Probabilidade e Estatistica COMPLETO

98

Curso de Licenciatura em Informática

Capítulo 5

Chegamos ao � nal deste capítulo, em que aprendemos a calcular as medidas de variabilidade. Observe, no exemplo mostrado no início do capítulo, envolvendo os tráfegos de dados de duas redes de com-putadores, que temos:

Primeiro caso:

2 computadores que se comunicam a 49 Mbps e 51 Mbps

Velocidade média = 50 Mbps e desvio padrão = 1 Mbps

Segundo caso:

2 computadores que se comunicam a 1 Mbps e 99 Mbps

Velocidade média = 50 Mbps e desvio padrão = 49 Mbps

Ou seja, no primeiro caso teremos uma média de 50 Mbps com uma pequena variação de velocidade (desvio padrão = 1Mbps), enquan-to que no segundo caso temos também a mesma média de 50 Mbps, só que neste caso com uma grande variação de velocidade (desvio padrão = 49 Mbps). Embora já no início, intuitivamente, você tenha percebido o conceito de variabilidade, para esse exemplo simples, o desvio padrão na realidade quanti� ca a variabilidade para qual-quer série de dados, e aí sim você poderá comparar os dados.

Concluindo, a média não é uma medida su� ciente por si só, necessi-ta-se de mais informações para se representar uma série de dados.

Vamos adiante!

Prof. Sebastião A. Carneiro

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:98LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:98 21/12/2010 17:31:1321/12/2010 17:31:13

Page 99: LIEaD401Probabilidade e Estatistica COMPLETO

PROBABILIDADE

Prezado(a) Aluno(a)!

Neste capítulo, estudaremos o cálculo das probabilidades, pois a maioria dos fenômenos de que trata a Estatística é de natureza ale-atória ou probabilística; na informática, também é assim. Veja o exemplo:

Quando ocorre um problema de comunicação de dados no sistema de uma empresa, surge logo a pergunta: “Qual a probabilidade de recuperação de dados?”

Bons estudos!

Prof. Sebastião A. Carneiro

Antes de entramos em probabilidade, temos que entender alguns con-ceitos importantes.

6.1 Experimento aleatório

Experimentos aleatórios são fenômenos que, mesmo repetindo-se várias vezes sob condições semelhantes, apresentam resultados imprevisíveis. Ou seja o resultado � nal depende do acaso.

Exemplo:

Da a� rmação “é provável que o meu time ganhe a partida hoje”, pode resultar:

• que ele ganhe;

• que ele perca;

• que ele empate.

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:99LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:99 21/12/2010 17:31:1321/12/2010 17:31:13

Page 100: LIEaD401Probabilidade e Estatistica COMPLETO

100

Curso de Licenciatura em Informática

Capítulo 6

6.2 Espaço amostral

Espaço amostral é o conjunto universo ou o conjunto de resulta-dos possíveis de um experimento aleatório.

Exemplos:

a) No experimento aleatório “lançamento de uma moeda” temos o espa-ço amostral {cara, coroa}.

Figura 20 - Moeda

b) No experimento aleatório “lançamento de um dado” temos o espaço amostral {1, 2, 3, 4, 5, 6}. 

Figura 21 - Dado

c) No experimento aleatório “dois lançamentos sucessivos de uma moe-da” temos o espaço amostral {(ca, ca), (co, co), (ca, co), (co, ca)}.

Obs.: Cada elemento do espaço amostral que corresponde a um resultado recebe o nome de ponto amostral. No primeiro exem-plo, cara pertence ao espaço amostral {cara, coroa}.

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:100LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:100 21/12/2010 17:31:1321/12/2010 17:31:13

Page 101: LIEaD401Probabilidade e Estatistica COMPLETO

101

Probabilidade e Estatística

Probabilidade

1) Conhecendo o baralho!

Espaço amostral do baralho de 52 cartas:

Cartas pretas = 26

Paus = 13 (Ás, 2, 3, 4, 5, 6, 7, 8, 9, 10, valete, dama, rei)

Espadas = 13 (Ás, 2, 3, 4, 5, 6, 7, 8, 9, 10, valete, dama, rei)

Cartas vermelhas = 26

• Ouros = 13 (Ás, 2, 3, 4, 5, 6, 7, 8, 9, 10, valete, dama, rei)

• Copas = 13 (Ás, 2, 3, 4, 5, 6, 7, 8, 9, 10, valete, dama, rei)

Observar que temos cartas comuns (Ás, 2, ...rei) por tipo de nai-pe (paus, espada, ouro e copa); esta observação será importante quando estudarmos eventos não mutuamente excludentes.

Naipe é o nome dado às “famílias” ou tipos das cartas de um baralho.

2) O Espaço amostral no lançamento de 2 dados é 36.

1 1 2 1 3 1 4 1 5 1 6 11 2 2 2 3 2 4 2 5 2 6 21 3 2 3 3 3 4 3 5 3 6 31 4 2 4 3 4 4 4 5 4 6 41 5 2 5 3 5 4 5 5 5 6 51 6 2 6 3 6 4 6 5 6 6 6

6.3 Eventos

Evento é qualquer subconjunto do espaço amostral.

Se considerarmos S como espaço amostral e E como evento: as-sim, qualquer que seja E, se E S (E está contido em S), então E é um evento de S.

1) Se E = S, E é chamado de evento certo.

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:101LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:101 21/12/2010 17:31:1421/12/2010 17:31:14

Page 102: LIEaD401Probabilidade e Estatistica COMPLETO

102

Curso de Licenciatura em Informática

Capítulo 6

Exemplo:

No lançamento de um dado.

Evento obter um número menor que 6.

2) Se E for unitário, E é chamado de evento elementar.

Exemplo:

No lançamento de um dado.

Evento obter um número igual a 6.

3) Se E = Ø, E é chamado de evento impossível.

Exemplo:

No lançamento de um dado.

Evento obter um número igual a 7.

ATIVIDADE 6.1

1) No lançamento de duas moedas (uma de 10 centavos e outra de 5 centavos) responda:

a) qual é o espaço amostral?

b) formule os eventos de� nidos pelas sentenças:

• obter só cara;

• obter pelo menos uma cara;

• obter apenas um cara;

• obter no máximo duas caras;

• obter uma cara e uma coroa;

• obter uma cara ou uma coroa.

2- No lançamento de dois dados, responda:

a) qual é o espaço amostral?

b) Formule os eventos de� nidos pelas sentenças:

• obter a soma dos dados inferior a 8;

• obter a soma dos dados superior a 8;

• obter a soma dos dados exatamente 5;

• obter um dado ímpar outro par;

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:102LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:102 21/12/2010 17:31:1421/12/2010 17:31:14

Page 103: LIEaD401Probabilidade e Estatistica COMPLETO

103

Probabilidade e Estatística

Probabilidade

6.4 Conceito de probabilidade

A de� nição clássica de probabilidade de um evento A, denotada por P(A), para eventos equiprováveis é:

P (A) =

Probabilidade é um número real que satisfaz aos seguintes axiomas:

I) 0 P(A) 1

II) P(S) = 1

III) Se A e B forem eventos mutuamente excludentes {AB}= ,

então P(AB) = P(A) + P(B)

Os 3 axiomas devem ser bem entendidos, por isso vamos comentá-los.

O primeiro axioma 0 ≤ P(A) ≤ 1 indica que a menor probabilida-

de de um evento ocorrer é zero e a maior probabilidade é 1.

Exemplo 1:

P(A)=0 indica que a probabilidade de um evento ocorrer é 0 (evento impossível).

No lançamento de um dado, qual a probabilidade de ocorrer 5,5? A resposta é probabilidade igual zero, pois P(A)=0/6=0.

Exemplo 2:

P(A)=1 indica que a maior probabilidade de um evento ocorrer é 1(evento certo).

No lançamento de um dado, qual a probabilidade de ocorrer um número menor ou igual a 6? A resposta é qualquer resultado é pos-sível, logo P(A) = 6/6=1. Com isso, esclarecemos também o segundo axioma P(S)=1.

Veremos o terceiro axioma mais adiante, quando estudarmos even-tos mutuamente excludentes.

nº. de vezes que o evento A pode ocorrernº. de vezes que o espaço amostral S ocorre

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:103LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:103 21/12/2010 17:31:1421/12/2010 17:31:14

Page 104: LIEaD401Probabilidade e Estatistica COMPLETO

104

Curso de Licenciatura em Informática

Capítulo 6

Obs.: Quando todos os elementos do espaço amostral têm a mes-ma chance de acontecer, o espaço amostral é chamado de conjun-to equiprovável.

Exemplo:

No lançamento de um dado, todos os 6 números têm a mesma chance

de acontecer.

Exemplos:

1) No lançamento de uma moeda, qual a probabilidade de se obter cara em um evento A?

S = {ca, co } = 2 A = {ca} = 1 P(A) = 1/2 = 0,5 = 50%

2) No lançamento de um dado, qual a probabilidade de se obter um número par em um evento A?

S = {1,2,3,4,5,6 } = 6 A = {2,4,6 } = 3 P(A) = 3/6 = 0,5 = 50%

3) No lançamento de um dado, qual a probabilidade de se obter um número menor ou igual a 6 em um evento A?

S = {1,2,3,4,5,6 } = 6 A = {1,2,3,4,5,6 } = 6 P(A) = 6/6 = 1,0 = 100%

A probabilidade de todo evento certo é 1 ou 100%.

4) No lançamento de um dado, qual a probabilidade de se obter um número maior que 6 em um evento A?

S = {1,2,3,4,5,6 } = 6 A = { >6 } = 0 P(A) = 0/6 = 0 = 0%

A probabilidade de todo evento impossível é 0 ou 0%.

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:104LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:104 21/12/2010 17:31:1521/12/2010 17:31:15

Page 105: LIEaD401Probabilidade e Estatistica COMPLETO

105

Probabilidade e Estatística

Probabilidade

6.4.1 Eventos complementares

Sabemos que um evento pode ocorrer ou não. Sendo p a probabi-lidade de que ele ocorra (sucesso) e q a probabilidade de que ele não ocorra (insucesso), para um mesmo evento existe sempre a relação:

p + q = 1

Exemplo:

Sabemos que a probabilidade de tirar o nº. 4 no lançamento de um dado é p =1/6. Logo, a probabilidade de não se tirar o nº. 4 no lançamento de um dado é q = 5/6.

Assim, temos: p+q = 1/6 + 5/6 = 1

6.4.2 Combinações dos eventos

Muitas aplicações da estatística exigem a determinação da probabilidade de combinações dos eventos. Há duas características de combinações: pode ser necessário determinar a probabilidade de ambos os eventos acontecerem P(A e B) ou a probabilidade de ocorrer apenas um deles, A ou B, ou seja, P(A ou B).

Veja o exemplo a seguir:

Em uma empresa de informática com 2 elevadores, poderíamos per-guntar: qual a probabilidade de ambos elevadores estarem em serviço? Ou então: qual a probabilidade de um(A) ou outro(B) elevador estar em serviço?

Observe que:

a) ambos implica P(A e B);

b) um ou outro implica P(A ou B).

a) EVENTOS INDEPENDENTES

Eventos são independentes quando a ocorrência de um não interfere na ocorrência de outro.

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:105LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:105 21/12/2010 17:31:1521/12/2010 17:31:15

Page 106: LIEaD401Probabilidade e Estatistica COMPLETO

106

Curso de Licenciatura em Informática

Capítulo 6

Exemplo 1:

Quando lançamos dois dados, o resultado obtido em um deles indepen-de do resultado obtido no outro.

Exemplo 2:

Agora, se eu retiro uma carta do baralho, sem reposição, a probabili-dade de retirar outra carta do mesmo baralho é afetada pela retirada da primeira; logo, a retirada de cartas de um baralho, sem reposição, não são eventos independentes.

Probabilidade de retirada da primeira carta de um baralho de 52 cartas é 1/52.

Probabilidade de retirada da segunda carta do baralho, sem reposição, é 1/51.

Exemplo 3:

Agora, se eu retiro uma carta do baralho, com reposição, a probabilida-de de retirar outra carta do mesmo baralho não é afetada pela retirada da primeira; logo, a retirada de cartas de um baralho, com reposição, são eventos independentes.

Probabilidade de retirada da primeira carta de um baralho de 52 cartas é 1/52.

Probabilidade de retirada da segunda carta do baralho, com reposição, é 1/52.

b) REGRA DO PRODUTO (regra do “e”)

A probabilidade de ocorrência simultânea de dois ou mais eventos in-dependentes é igual ao produto das probabilidades de ocorrências em separado; ou seja, a probabilidade de que tais eventos se realizem simul-taneamente é dada pelo princípio multiplicativo:

Ptotal = P(A e B) = P(A) x P(B)  

Exemplo:

No lançamento de dois dados, qual a probabilidade de obtenção de 2 no primeiro dado e de 5 no segundo dado?

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:106LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:106 21/12/2010 17:31:1521/12/2010 17:31:15

Page 107: LIEaD401Probabilidade e Estatistica COMPLETO

107

Probabilidade e Estatística

Probabilidade

P1 (X=2)=1/6 e P2(X=5)=1/6

Assim:

P total = P (X=2) x P (X=5) = 1/6 x 1/6 = 1/36

Assim, a probabilidade de obtenção de 2 no primeiro dado e de 5 no segundo dado é 1/36.

c) EVENTOS MUTUAMENTE EXCLUSIVOS

Dois ou mais eventos são mutuamente exclusivos quando a realização de um exclui a realização do outro.

Exemplo 1:

Assim, no lançamento de uma moeda, o evento “tirar cara” e o evento “tirar coroa” são mutuamente exclusivos, já que, ao se realizar um deles, o outro não se realiza.

Exemplo 2:

Uma mulher grávida ter um menino de olhos castanhos ou uma meni-na de olhos azuis são mutuamente exclusivos, já que, ao se realizar um deles, o outro não se realiza.

Exemplo 3:

Numa partida de futebol, um time tem as seguintes chances: vencer, empatar ou perder. Estas chances são eventos mutuamente exclusivos, já que, ao se realizar um deles, o outro não se realiza.

d) PRINCÍPIO DA ADIÇÃO (regra do ou)

Se dois eventos são mutuamente exclusivos, quando a realização de um exclui a realização do outro, a probabilidade de que um ou outro se rea-lize é igual à soma das probabilidades de que cada um deles se realize.

Ptotal = P(1 ou 2) = P(1) + P(2)

A palavra-chave aqui é a conjunção OU

• Na realidade é o OU inclusive, que signi� ca um, ou outro, ou ambos.

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:107LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:107 21/12/2010 17:31:1521/12/2010 17:31:15

Page 108: LIEaD401Probabilidade e Estatistica COMPLETO

108

Curso de Licenciatura em Informática

Capítulo 6

Exemplo 1:

Qual a probabilidade de sair face ímpar no arremesso de um dado?P (1 ou 3 ou 5) = P(1) + P(3) + P(5);

Exemplo 2:

Qual a probabilidade de sair face ímpar OU superior a 5 no arremesso de um dado?

P ([ímpar] ou [6] ) = ?

P ([1 ou 3 ou 5] ou[6] ) = P(1) + P(3) + P(5) + P(6)

P (A ou B) = P (ocorrência de A, ou de B, ou de ambos)

No lançamento de um dado, qual a probabilidade de se tirar o nº. 3 ou

o nº. 4?

Os dois eventos são mutuamente exclusivos, então: P = 1/6 + 1/6 = 2/6 = 1/3

Exemplo 3:

Sabendo que a probabilidade de uma mulher grávida ter um menino de olhos castanhos é 3/8 ou uma menina de olhos azuis é de 1/8, pede-se: qual a probabilidade de uma mulher grávida ter um menino de olhos castanhos ou uma menina de olhos azuis?

P(A) = P(menino de olhos castanhos) = 3/8

P(B) = P(meninas de olhos azuis) = 1/8

P(A U B) = P(A) + P(B)= 3/8 + 1/8 = 1/2 

e) EVENTOS NÃO MUTUAMENTE EXCLUDENTES

Dois ou mais eventos são não mutuamente excludentes quando há ele-mentos comuns entre os eventos. Assim, num baralho, o evento “tirar ÁS” e o evento “tirar COPAS” são não mutuamente excludentes, pois temos uma carta de ÁS que também é copa.

Na probabilidade da união de dois eventos, A e B, quando há elementos comuns, devemos excluir as probabilidades dos elementos comuns a A e B para não serem computadas duas vezes. Assim:

Ptotal= P(A) + P(B) - P(A e B)

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:108LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:108 21/12/2010 17:31:1521/12/2010 17:31:15

Page 109: LIEaD401Probabilidade e Estatistica COMPLETO

109

Probabilidade e Estatística

Probabilidade

Exemplo:

Retirando-se uma carta de um baralho de 52 cartas, qual a probabilida-de de a carta retirada ser um ÁS ou uma carta de COPAS?

Copas = 13 (Ás, 2, 3, 4, 5, 6, 7, 8, 9, 10, valete, dama, rei)

P(ÁS)= 4/52 (Ás de paus, Ás de ouro, Ás de espada e Ás de copas)

P(Copas)= 13/52 (Ás, 2, 3, 4, 5, 6, 7, 8, 9, 10, valete, dama, rei)

Observar que o “Ás de copas” repetiu 2 vezes e, na realidade, só temos uma carta, daí a necessidade de retirá-la uma vez da fórmula de adição.

P(ÁS e Copas) = P(ÁS) + P(Copas) - P(ÁS e Copas) = 4/52 + 13/52 - 1/52 =

16/52

ATIVIDADE 6.2

Responda as questões a seguir:

1) Qual a probabilidade de sair o ÁS de ouros quando retiramos uma carta de um baralho de 52 cartas?

2) Qual a probabilidade de sair um REI quando retiramos uma carta de um baralho de 52 cartas?

3) Em um lote de 12 peças, 4 são defeituosas. Sendo retirada uma peça, calcule:

a) a probabilidade de essa peça ser defeituosa;

b) a probabilidade de essa peça não ser defeituosa.

4) De dois baralhos de 52 cartas retiram-se, simultaneamente, uma carta do primeiro baralho e uma do segundo. Qual a proba-bilidade de a carta do primeiro baralho ser um REI e a do segun-do ser o 5 de paus?

5) Uma urna A contém: 3 bolas brancas, 4 pretas, 2 verdes; uma urna B contém: 5 bolas brancas, 2 pretas, 1 verde; uma urna C contém: 2 bolas brancas, 3 pretas, 4 verdes. Uma bola é retirada de cada urna. Qual é a probabilidade de as três bolas retiradas da 1ª, 2ª e 3ª urnas serem, respectivamente, branca, preta e verde?

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:109LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:109 21/12/2010 17:31:1521/12/2010 17:31:15

Page 110: LIEaD401Probabilidade e Estatistica COMPLETO

110

Curso de Licenciatura em Informática

Capítulo 6

6) De um baralho de 52 cartas retiram-se, ao acaso, duas cartas sem reposição. Qual é a probabilidade de a primeira carta ser o ÁS de paus e a segunda ser o REI de paus?

7) Qual a probabilidade de sair uma � gura (rei, dama ou valete) quando retiramos uma carta de um baralho de 52 cartas?

8) São dados dois baralhos de 52 cartas. Tiramos, ao mesmo tem-po, uma carta do primeiro baralho e uma carta do segundo. Qual a probabilidade de tirarmos uma DAMA e um REI, não necessa-riamente nessa ordem?

9) Duas cartas são retiradas de um baralho sem haver reposição. Qual a probabilidade de ambas serem COPAS ou ESPADAS?

10) Duas bolas são retiradas (sem reposição) de uma urna que contém 2 bolas brancas e 3 bolas pretas. Qual a probabilidade d e que a 1ª seja branca e a 2ª seja preta?

11) Duas bolas são retiradas (com reposição) de uma urna que contém 2 bolas brancas e 3 bolas pretas. Qual a probabilidade de que a 1ª seja branca e a 2ª seja preta?

12) Duas bolas são retiradas (sem reposição) de uma urna que contém 2 bolas brancas, 3 bolas pretas e 5 bolas verdes, pede-se:

a) Qual a probabilidade de que ambas sejam verdes?

b) Qual a probabilidade de que ambas sejam da mesma cor?

13) Jogam-se três dados. Qual a probabilidade de que a soma dos pontos obtidos seja superior a 14?

14) Um baralho de 52 cartas é subdividido em 4 naipes: copas, espadas, ouros e paus.

a) Retirando-se uma carta ao acaso, qual a probabilidade de que ela seja de ouros ou de copas?

b) Retirando-se duas cartas ao acaso com reposição da primeira carta, qual a probabilidade de ser a primeira de ouros e a segunda de copas? E se não houver reposição da primeira carta, qual a pro-babilidade de ser a primeira de ouros e a segunda de copas?

c) Havendo reposição, qual a probabilidade de sair à primeira car-ta de ouros ou a segunda de copas?

15) Uma urna contém 7 bolas gravadas com as letras A ,A ,A ,C, C, R, R. Extraindo-se as bolas uma por uma, qual a probabilidade de se obter a palavra CARCARÁ?

16) Uma urna contém 3 bolas brancas e 4 bolas pretas. Extraindo-se, simultaneamente, 3 bolas da urna, calcule a probabilidade de que:

a) Pelo menos duas sejam brancas;

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:110LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:110 21/12/2010 17:31:1621/12/2010 17:31:16

Page 111: LIEaD401Probabilidade e Estatistica COMPLETO

111

Probabilidade e Estatística

Probabilidade

b) Pelo menos uma seja preta.

17) Uma caixa contém 5 bolas brancas e 3 bolas pretas. Duas bo-las são retiradas simultaneamente ao acaso e substituídas por três bolas azuis. Em seguida, duas novas bolas são retiradas ao acaso da caixa, pede-se:

a) Calcule a probabilidade de que essas duas últimas bolas sejam da mesma cor.

b) Se as duas últimas bolas retiradas forem uma branca e uma pre-ta, calcule a probabilidade de que, na primeira extração, tenham saído duas bolas brancas

Para utilizar o método clássico de probabilidade, é necessário co-nhecer o número total de resultados possíveis de um experimento; ou seja, seu espaço amostral. Em geral, isso não é tão simples; nesse caso, empregam-se técnicas de contagem para calcular esse número. É o que veremos a seguir.

6.5 Técnicas de contagem em probabilidade

As técnicas de contagem fazem uso de fórmulas de análise combinató-ria para o cálculo do número de casos favoráveis e do número de casos possíveis.

Figura 22: Cadeado com segredo

6.5.1 Permutação sem repetições

Permutação é a análise de todas as trocas de posições entre todas as variáveis envolvidas.

Exemplo: Todas as combinações possíveis das variáveis X,Y e Z. ( n=3)

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:111LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:111 21/12/2010 17:31:1621/12/2010 17:31:16

Page 112: LIEaD401Probabilidade e Estatistica COMPLETO

112

Curso de Licenciatura em Informática

Capítulo 6

1ª possibilidade X Y Z2ª possibilidade X Z Y3ª possibilidade Y X Z4ª possibilidade Y Z X5ª possibilidade Z Y X6ª possibilidade Z X Y

p = 3!

Por observação, temos: P = 6= 3.2.1= 3!3

Portanto, analisando o exemplo anterior, podemos concluir que, para permutações sem repetições, temos:

P = n!n

Lembre-se de que:

O símbolo n! é lido “n fatorial”;

1! =1;

0!=1

6.5.2 Permutação com repetições

Permutação com repetições das variáveis envolvidas está disponível na sala virtual.

X,X,Y,YY,Z,Z,Z,Z

6.5.3 Arranjo

Arranjo simples é o tipo de agrupamento sem repetição em que um grupo é diferente de outro pela ordem ou pela natureza dos elementos componentes.

Exemplo 1:

As duas (p=2) combinações possíveis das variáveis X,Y e Z (n=3)

1 X Y Z

Tabela 6.1 Permutações possíveis de 3 variáveis X,Y e Z

Tabela 6.2 Possibilidades de agrupamento de 3 variáveis X,Y,Z em 2 posições.

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:112LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:112 21/12/2010 17:31:1621/12/2010 17:31:16

Page 113: LIEaD401Probabilidade e Estatistica COMPLETO

113

Probabilidade e Estatística

Probabilidade

2 X Z Y3 Y X Z4 Y Z X5 Z Y X6 Z X Y

p = 2

Ou seja: A = 6 3,2

Em que:

6 = 3! / 1 em que: 1 = (3-2)! = 1! =1

Exemplo 2:

Todas as combinações possíveis das variáveis X,Y e Z , usando-se somente

uma posição.

1 X2 X3 Y

p = 1

Ou seja: A = 33,1

Em que:

3! / 2 em que: 2 = (3-1)! = 2! =2

Exemplo 3:

As duas (p=2) combinações possíveis das variáveis X,Y, Z e H. (n = 4)

1 X Y2 X Z3 X H4 Y X5 Y Z6 Y H7 Z X8 Z Y9 Z H10 H X

Tabela 6.3 Possibilidades de agrupamento de 3 variáveis X,Y,Z em 1 posição.

Tabela 6.4 Possibilidades de agrupamento de 4 variáveis X,Y,Z em 2 posições

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:113LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:113 21/12/2010 17:31:1721/12/2010 17:31:17

Page 114: LIEaD401Probabilidade e Estatistica COMPLETO

114

Curso de Licenciatura em Informática

Capítulo 6

11 H Y12 H Z

p = 2

Ou seja: A = 12 4,2

Em que:

4! = 24

4! / 2 em que: 2 = (4-2)! = 2! =2

Portanto, analisando os exemplos anteriores, podemos concluir que, para arranjo, temos:

6.5.4 Combinação

Combinação tem o mesmo conceito de arranjo, só que as inversões de posições não devem ser consideradas (A B = B A); ou seja, a combina-ção das naturezas das variáveis é que importa.

Combinação = Arranjo pela natureza, a posição não importa.

Exemplo 1: As duas (p=2) combinações possíveis das variáveis X,Y e Z (n=3).

Arranjo Combinação Combinação1 X Y 1 X Y 1 X Y2 X Z 2 X Z 2 X Z3 Y X 3 Y X4 Y Z 4 Y Z 3 Y Z5 Z Y 5 Z Y6 Z X 6 Z XA p = 2 C p = 2 C p = 23,2 3,2 3,2

Ou seja: C = 33,2

Em que:

C = A / 2 3,2 3,2

Tabela 6.5 Possibilidades de agrupamento de 2 variáveis X,Y em 2 posições.

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:114LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:114 21/12/2010 17:31:1721/12/2010 17:31:17

Page 115: LIEaD401Probabilidade e Estatistica COMPLETO

115

Probabilidade e Estatística

Probabilidade

2 = 2! =2 Observar: p = 2.

Assim, temos:

C = A / 2 = A / 3,2 3,2 3,2

Exemplo 2:

Todas as combinações possíveis das variáveis X, Y e Z , usando somente uma posição.

Arranjo Combinação1 X 1 X2 Y 2 Y3 Z 3 ZA = 33,1 p = 1 C = 33,1 p = 1

Ou seja: C = 33,1

Em que:

C = A / 13,1 3,1

1 = 1! =1 Observar: p = 1.

Assim, temos:

C = A / 1 = A / p3,1 3,1 3,1

Exemplo 3:

As duas (p = 2) combinações possíveis das variáveis X, Y, Z e H (n = 4).

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:115LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:115 21/12/2010 17:31:1721/12/2010 17:31:17

Page 116: LIEaD401Probabilidade e Estatistica COMPLETO

116

Curso de Licenciatura em Informática

Capítulo 6

Arranjo Combinação Combinação1 X Y 1 X Y 1 X Y2 X Z 2 X Z 2 X Z3 X H 3 X H 3 X H4 Y X 4 Y X5 Y Z 5 Y Z 4 Y Z6 Y H 6 Y H 5 Y H7 Z X 7 Z X8 Z Y 8 Z Y9 Z H 9 Z H 6 Z H10 H X 10 H X11 H Y 11 H Y12 H Z 12 H Zp = 2 p = 2 p = 2A = 12 C = 64,2 4,2

Ou seja: C = 64,2

Em que:

C = A / 23,1 4,2

2 = 2! =2.1 Observar: p = 2.

Assim, temos:

C = A / 2 = A / p4,2 4,2 4,2

Portanto, analisando os exemplos anteriores, podemos concluir que, para combinações, temos:

ATIVIDADE 6.3

Responda as questões a seguir:

1) Dispondo de seis cores, de quantas formas distintas podemos pintar uma bandeira com três listras verticais de cores diferentes?

2) Numa classe de 20 alunos, o professor deseja montar grupos de cinco para trabalhar no laboratório. Quantos grupos distintos ele poderá formar?

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:116LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:116 21/12/2010 17:31:1821/12/2010 17:31:18

Page 117: LIEaD401Probabilidade e Estatistica COMPLETO

117

Probabilidade e Estatística

Probabilidade

3) Quantos subconjuntos de quatro elementos possuem um con-junto de oito elementos?

4) Um baralho comum possui 52 cartas. De quantas formas dis-tintas um jogador pode receber cinco cartas?

5) Existem 5 estradas que ligam as cidades A e B e 6 estradas que ligam B e C. De quantas formas distintas é possível ir de A até C passando por B?

6) Numa prova classi� catória para as olimpíadas, 10 atletas dis-putam os 800 metros. Sabendo-se que apenas os quatro primei-ros serão classi� cados para as � nais, quantos resultados possíveis existem para os quatro primeiros lugares?

07) Com os algarismos 1, 2, 3, 4, 5, 6, 7, 8 e 9:

Quantos números de quatro algarismos podem ser formados?

Quantos números pares de três algarismos distintos podem ser escritos?

08) Quantas chapas de carro com três letras e três algarismos é possível formar, considerando que temos 26 letras no alfabeto?

09) Quantos números de telefone com sete algarismos e pre� xos 237 podem ser formados, considerando que temos 26 letras no alfabeto?

10) Será feita uma prova contendo 10 perguntas, às quais se deve responder com V (verdadeiro) ou F (falso). É obrigatório respon-der a todas. De quantas maneiras distintas isso poderá ser feito?

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:117LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:117 21/12/2010 17:31:1821/12/2010 17:31:18

Page 118: LIEaD401Probabilidade e Estatistica COMPLETO

118

Curso de Licenciatura em Informática

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:118LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:118 21/12/2010 17:31:1821/12/2010 17:31:18

Page 119: LIEaD401Probabilidade e Estatistica COMPLETO

VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÕES DISCRETAS

Prezado(a) aluno(a)!

Apresentaremos, neste capítulo, modelos de distribuição de proba-bilidade, o que permitirá a solução de grande número de problemas práticos.

Bons estudos!

Prof. Sebastião A. Carneiro

7.1 Variável aleatória

Suponha um espaço amostral S e atribuímos um número a cada ponto amostral. Fica de� nida, então, uma função chamada variável aleatória. Muitas vezes, não estamos interessados propriamente no resultado de um experimento aleatório, mas sim em alguma característica numérica a ele associada. Essa característica associada, a qual será chamada vari-ável aleatória.

Assim, se o espaço amostral relativo ao “lançamento simultâneo de duas moedas” é S = {(ca,ca), (ca,co), (co,ca), (co,co)} e se X representa o “nú-mero de caras” que aparece, a cada ponto amostral podemos associar um número para X, de acordo com a tabela abaixo:

Ponto Amostral Variável aleatória (X)(ca,ca) 2(ca,co) 1(co,ca) 1(co,co) 0

Tabela 7.1 Variável aleatória associada ao número de caras

Lembre-se de que a variável aleatória nesse exemplo está asso-ciada ao número de caras; nesse caso, para a condição (ca,ca) = (cara, cara) X=2 (ou seja, 2 caras) e (ca,co) = (cara, coroa)X=1 (ou seja, 1 cara) e assim por diante.

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:119LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:119 21/12/2010 17:31:1821/12/2010 17:31:18

Page 120: LIEaD401Probabilidade e Estatistica COMPLETO

120

Curso de Licenciatura em Informática

Capítulo 7

7.2 Distribuição de probabilidade

Seja X uma variável aleatória que pode assumir os valores X , X , 1 2

X3, ..., Xn. A cada valor X i correspondem pontos do espaço amos-tral. Associamos, então, a cada valor Xi a probabilidade Pi de ocor-rência de tais pontos no espaço amostral.

Assim, temos:

Os valores X , X1 2, ..., Xn e seus correspondentes P , P1 2, ..., Pn de� -nem uma distribuição de probabilidade.

Para estabelecer a distribuição de probabilidade, acompanhe os passos da tabela a seguir:

Ponto Amostral

Variável Aleatória (X) Comentário

Possibilidade ou frequência de X ocorrer

(ca,ca) 2 2 caras 1 vez(ca,co) 1 1 cara

2 vezes(co,ca) 1 1 cara(co,co) 0 Zero cara 1 vez

Observe que, no lançamento simultâneo de duas moedas, 2 caras só podem ocorrer uma vez; já uma cara pode ocorrer duas vezes e ne-nhuma cara, só uma vez. Assim, o espaço amostral do lançamento simultâneo de duas moedas é 2 caras, 1 cara e nenhuma cara.

Número de caras (X) Frequência Probabilidade (X)2 1 1/41 2 2/40 1 1/4Total 4 4/4 = 1

Tabela 7.2 Possibilidade da Variável Aleatória ocorrer.

Tabela 7.3 Probabilidade da Variável Aleatória X ocorrer.

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:120LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:120 21/12/2010 17:31:1921/12/2010 17:31:19

Page 121: LIEaD401Probabilidade e Estatistica COMPLETO

121

Probabilidade e Estatística

Variáveis Aleatórias e Distribuições Discretas

Assim, � nalmente podemos escrever a distribuição de probabilidade:

Número de caras (X) Probabilidade (X)2 1/41 2/40 1/4

Total 4/4 = 1

Ao de� nir a distribuição de probabilidade, estabelecemos uma cor-respondência unívoca entre os valores da variável aleatória X e os valores da variável P (probabilidade). Essa correspondência de� ne uma função em que os valores xi formam o domínio da função e os valores pi, o seu conjunto imagem.

Exemplo 1:

Determine a distribuição de probabilidade considerando a distribuição de frequências relativa ao número de acidentes diários na Rodovia do Sol, durante o mês de novembro/2005.

Número de Acidentes Frequência0 221 52 23 1

Podemos então, escrever a tabela de distribuição de probabilidade:

Número de Acidentes (X) Probabilidade (X)0 22/30 = 0,7331 5/30 = 0,1672 2/30 = 0,073 1/30 = 0,03

Total 30/30 = 1,00

Foi construída uma tabela em que aparecem os valores de uma variável aleatória X e as probabilidades de X ocorrer, é a tabela de distribuição de probabilidades.

Tabela 7.4 Distribuição de Probabilidade da Variável Aleatória X.

Tabela 7.5 Número de acidentes diários na rodovia do SOL.

Tabela 7.6 Distribuição de probabilidade do número de acidentes diários na rodovia do Sol

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:121LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:121 21/12/2010 17:31:1921/12/2010 17:31:19

Page 122: LIEaD401Probabilidade e Estatistica COMPLETO

122

Curso de Licenciatura em Informática

Capítulo 7

Repare que:

• ao operar com variáveis aleatórias, estamos trabalhando com distribuições de frequências relativas;

• a VA, do Exemplo 1, foi obtida com base em uma população conhecida.

Existem situações nas quais a variável aleatória pode ser gerada com base em cenários de� nidos pela opinião de um grupo de pesso-as acerca de um determinado assunto; por exemplo, a rentabilidade do mercado de ações nos próximos 12 meses.

ATIVIDADE 7.1

Responda as questões a seguir:

1) Na tabela a seguir está registrado o número de atendimentos para manutenção em computadores, prestados por uma empresa de informática, durante um período de 50 dias.

Manutenção Dias3 34 75 126 147 108 4

Pedem-se: a distribuição de probabilidade e o histograma de probabilidade.

Prezado(a) aluno(a)!

Você pode estar se perguntando agora: “Tudo bem, estou estudan-do distribuição de probabilidade, mas onde eu realmente vou usar isso?” Vou tentar exempli� car rapidamente sua utilidade.

No caso do exemplo da Rodovia do Sol, alguém poderia perguntar: qual o número de acidentes esperado para hoje?

O conceito a ser dado no item seguinte utilizará o conhecimento de distribuição de probabilidade para responder a essa pergunta. En-tão, não perca o próximo item e a resposta deste questionamento.

Bons estudos!

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:122LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:122 21/12/2010 17:31:1921/12/2010 17:31:19

Page 123: LIEaD401Probabilidade e Estatistica COMPLETO

123

Probabilidade e Estatística

Variáveis Aleatórias e Distribuições Discretas

7.3 Valor esperado (esperança matemática)

O valor esperado de uma variável aleatória ou de uma função de variável aleatória corresponde à média ponderada dos valores que essa variável aleatória ou essa função assume, usando-se como pesos para ponderação as probabilidades correspondentes a cada valor.

Para o caso de uma variável aleatória discreta “x”, podemos escrever:

Como sempre ∑ pi = 1, teremos:

E (x) = ∑ ( xi . pi )

Exemplo 7.2:

Uma instituição vende bilhetes de rifas por R$ 5,00 cada um. Há 10 prêmios no valor de R$ 25,00 e um prêmio maior no valor de R$ 100,00. Se forem vendidos 200 bilhetes, e você comprar um deles, qual a sua expectativa em relação ao sorteio?

Prêmios pago (xi) Probabilidade de ocorrer o prêmio

Valor esperado xi . p(xi)

0 189/200 025 10/200 250/200100 1/200 100/200

∑ p(xi)=1 ∑xi. p(xi)=1,75

Tabela 7.7 Distribuição de probabilidade rateio dos prêmios

O valor esperado é E(x)=1,75.

Como interpretar a resposta valor esperado E(x)=1,75?

Em longo prazo, haverá um retorno para você de R$ 1,75; ou seja, dos R$ 5,00 que você jogou, retornará para você só R$ 1,75. O que a institui-ção irá ganhar a longo prazo é R$ 5,00 – 1,75 = R$ 3,25.

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:123LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:123 21/12/2010 17:31:2021/12/2010 17:31:20

Page 124: LIEaD401Probabilidade e Estatistica COMPLETO

124

Curso de Licenciatura em Informática

Capítulo 7

Observe que, a longo prazo, signi� ca: se você participar de novas rifas nesta mesma condição, mesmo que você ganhe na primeira o melhor prêmio, R$ 100,00 (Sortudo! você terá um lucro de R$ 95,00), na média de todas as jogadas você irá receber R$ 1,75, en-quanto que você sempre gastou R$ 5,00. É por esse motivo que todo viciado em jogo vai à falência. A estatística prova isso por meio do valor esperado.

O que signi� ca “a longo prazo” ?

Deve-se considerar longo prazo um número de tentativas superior a 30 (n≥30). Para valores inferiores a esse, � ca por conta do acaso, e como os eventos são aleatórios, qualquer resultado é possível.

Exemplo 2:

Em 12 lançamentos de uma moeda, saíram 9 caras. É razoável aceitar esse resultado?

A resposta é sim, pois como não temos a condição de longo prazo (12 < 30), qualquer resultado é possível.

Exemplo 3:

Numa empresa de informática, as previsões de despesas para o próximo ano foram calculadas em R$ 9, 10, 11, 12 e 13 bilhões, com as seguintes probabilidades de ocorrências 30%, 20%, 25%, 5% e 20%. Pede-se:

a) Qual é a distribuição de probabilidades de despesas para o próximo ano.

b) Qual é o valor esperado das despesas para o próximo ano.

Despesas (xi) Bilhões de R$

Probabilidades de ocor-rer às despesas p(xi)

9 0,3010 0,2011 0,2512 0,0513 0,20

total = 1,00

Resposta para o item a):

Tabela 7.8 Distribuição de Probabilidades de despesas

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:124LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:124 21/12/2010 17:31:2021/12/2010 17:31:20

Page 125: LIEaD401Probabilidade e Estatistica COMPLETO

125

Probabilidade e Estatística

Variáveis Aleatórias e Distribuições Discretas

Despesas (xi)Bilhões de R$

Probabilidades de ocorrer as despesas p(xi)

Valor espera-do xi .p (xi)

9 0,30 2,7010 0,20 2,0011 0,25 2,7512 0,05 0,6013 0,20 2,60

Valor Esperado E(X) = 10,65

Resposta para o item b):

Assim, a despesa esperada para o próximo ano é R$ 10,65 bilhões. 

Observe a importância dessa informação. Com ela, a empresa pode se planejar para o ano seguinte!

ATIVIDADE 7.2

Responda as questões a seguir:

1) Suponhamos que, após 10 lançamentos de uma moeda, saíram 7 caras. É razoável aceitar esse resultado?

2) Suponhamos que, após 1000 lançamentos de uma moeda, saí-ram 700 caras. É razoável aceitar esse resultado?

3) Um jogo consiste no lançamento de 3 moedas (não viciada). Se der tudo cara ou tudo coroa, o ganho é de R$ 5,00; mas, se der uma ou duas caras, a perda é de R$ 3,00. Qual o resultado esperado para o jogo em reais?

7.4 Distribuição binomial

Vamos imaginar fenômenos cujos resultados só podem ser de dois ti-pos: de sucesso e de insucesso. O fenômeno imaginado pode ser repeti-do tantas vezes quantas se queiram (n vezes) nas mesmas condições. As provas repetidas devem ser independentes, isto é, o resultado de uma não deve afetar os resultados das outras. No decorrer do experimento, a probabilidade do sucesso (p) e a probabilidade do insucesso (q) manter-

Tabela 7.9 Valor Esperado das Despesas

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:125LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:125 21/12/2010 17:31:2021/12/2010 17:31:20

Page 126: LIEaD401Probabilidade e Estatistica COMPLETO

126

Curso de Licenciatura em Informática

Capítulo 7

se-ão constantes. Nessas condições, X é uma variável aleatória discreta que segue uma distribuição binomial.

O nome binomial é devido à fórmula, pois representa o termo geral do desenvolvimento do binômio de Newton para o qual só há duas possibilidades nominais (verdadeiro ou falso, cara ou coroa, sucesso ou insucesso, liga ou desliga, ganha ou perde, etc.).

Distribuição Binomial

Se em n experiências acontecem x sucessos com probabilidade p, a distribuição binomial de probabilidades é dada pela expressão:

Em que:

• x = 0,1,2,...,n

C, como já foi visto, é combinação.

Para entender a fórmula, vamos observar os exemplos seguintes:

Exemplo 1:

Lançando uma moeda 5 vezes, qual a probabilidade de ocorrência de 3 caras?

Temos:

p indica a ocorrência de cara;q indica a não ocorrência de cara.

Vamos montar a tabela de possibilidades para o lançamento de uma moeda 5 vezes, ocorrendo 3 caras (p):

1pªossibilidade p p p q q2ª possibilidade p p q p q3ª possibilidade p q p p q 4pªossibilidade q p p p q5ª possibilidade p p q q p6ª possibilidade p q q p p

Tabela 7.10 Possibilidades no lançando de uma moeda 5 vezes

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:126LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:126 21/12/2010 17:31:2021/12/2010 17:31:20

Page 127: LIEaD401Probabilidade e Estatistica COMPLETO

127

Probabilidade e Estatística

Variáveis Aleatórias e Distribuições Discretas

7ª possibilidade q q p p p8ª possibilidade q p q p p9ª possibilidade q p p q p10ª possibilidade p q p q p

Observe que, independente da linha da tabela, temos: p3 .q2 possibili-dades de ocorrências de cara e temos que a quantidade total de possibi-lidades é 10 p3 .q2.

Assim, intuitivamente a� rmamos que :

Desse modo, de uma forma geral, temos:

Exemplo 2:

Dois times de futebol, A e B, jogam entre si 6 vezes. Encontre a probabi-lidade de o time A ganhar 4 jogos.

Temos:

p =1/3 indica a probabilidade de o time A ganhar;q = 2/3 indica a probabilidade de o time B não ganhar (perder ou empatar).

ATIVIDADE

Responda as questões a seguir:

1) Determine a probabilidade de obtenção de 3 caras em 6 lances de uma moeda.

2) Jogando-se um dado três vezes, determine a probabilidade de obtenção de um múltiplo de 3 duas vezes.

3) Dois times de futebol, A e B, jogam entre si 6 vezes. Encontre a probabilidade de o time A:

a) ganhar dois ou três jogos;

b) ganhar pelo menos um jogo.

4) A probabilidade de um atirador acertar o alvo é 2/3. Se ele ati-rar 5 vezes, qual a probabilidade de acertar 2 tiros?

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:127LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:127 21/12/2010 17:31:2021/12/2010 17:31:20

Page 128: LIEaD401Probabilidade e Estatistica COMPLETO

128

Curso de Licenciatura em Informática

Capítulo 7

5) Seis computadores são escolhidos ao acaso da linha de produ-ção que apresenta 10% de peças defeituosas. Qual a probabilidade de serem defeituosos dois deles?

7.5 DISTRIBUIÇÃO DE POISSON

A Distribuição de Poisson pode ser usada para determinar a probabi-lidade de um dado número de sucessos quando os eventos ocorrem em bases de tempo ou espaço. Esse processo é chamado de processo de Poisson. Supõe-se que os eventos são independentes e que o processo é estacionário (constante).

Vejamos o motivo de estudar a Distribuição de Poisson.

Situações em que Distribuição de Poisson é utilizada:

a) usuários de computador ligados à Internet;b) as chamadas em uma central telefônica;c) clientes chegando ao caixa de um supermercado;d) acidentes com automóveis em uma determinada estrada;e) número de carros que chegam a um posto de gasolina;f) número de falhas em componentes por unidade de tempo;g) número de requisições para um servidor em um intervalo de tempo t;h) número de peças defeituosas substituídas num veículo durante o primeiro ano de vida;i) problemas com a bagagem de passageiros em viaja de avião;

j) número de chamadas telefônicas para a polícia por hora;

k) número de acidentes de tráfego num cruzamento por semana.

Na distribuição de Poisson somente um valor é necessário para determi-

nar a probabilidade de um dado número de sucessos: o número médio

de sucessos para a específ ca dimensão de tempo ou espaço de interes-

se. Esse número médio é geralmente representado por λ (letra grega

“lambda”) ou por μ. A fórmula para se determinar a probabilidade de

um dado número X de sucessos em uma distribuição de Poisson é:

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:128LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:128 21/12/2010 17:31:2121/12/2010 17:31:21

Page 129: LIEaD401Probabilidade e Estatistica COMPLETO

129

Probabilidade e Estatística

Variáveis Aleatórias e Distribuições Discretas

Em que:

é a média da distribuição;

e – representa o número de Euler que é uma constante de valor igual a  2,718;

x! é o fatorial de x

Na matemática, número de Euler, assim chamado em homena-gem ao matemático suíço Leonhard Euler, é a base dos logaritmos naturais.

Lembre-se de que:

0 ! = 1;

0x = 1, qualquer número elevado a zero é igual a 1.

Exemplo 1:

Um departamento de manutenção de informática recebe uma média de cinco chamadas por hora. A probabilidade de que, em uma hora selecio-nada aleatoriamente, sejam recebidas três chamadas é:

Solução:

Exemplo 2:

Um departamento de polícia recebe em média 5 solicitações por hora. Qual a probabilidade de receber 2 solicitações numa hora selecionada aleatoriamente?

Solução:

X = número designado de sucessos = 2

λ = o número médio de sucessos num intervalo especí� co (uma hora) = 5

Exemplo 3:

Um departamento de manutenção de computadores recebe uma média

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:129LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:129 21/12/2010 17:31:2121/12/2010 17:31:21

Page 130: LIEaD401Probabilidade e Estatistica COMPLETO

130

Curso de Licenciatura em Informática

Capítulo 7

de cinco chamadas por hora. Qual a probabilidade de menos de três cha-madas serem recebidas durante uma hora aleatoriamente escolhida?

Solução:

Lembrar que receber menos de 3 chamadas (X < 3), na verdade ele pode receber 2 ou 1 ou nenhuma chamada (X ≤ 2); assim:

P(X < 3) = P(X ≤ 2) = P(X = 0) + P(X = 1) + P(X = 2)

0,0067 + 0,0337 + 0,0842 = 0,1246

Exemplo 4:

Na média, 12 pessoas por hora consultam um especialista em informá-tica. Qual a probabilidade de

que três ou mais pessoas consultem o especialista durante um período de dez minutos?

Solução:

Observe que o problema fornece a média por hora – 12 - e solicita a pro-babilidade de que três ou mais pessoas consultem o especialista em um período de dez minutos. Devemos, então, converter a média por hora para o período de dez minutos. Assim:

média por hora = 12

Para achar a média por 10 minutos, basta usar a regra de três:

1h = 60 min ------------------------12

10 min ------------------------µ

µ = 2

Ou seja, em média, 2 pessoas consultam um especialista em informática no período de 10 minutos.

Assim, temos:

P(X ≥ 3) = P(X = 3) + P(X = 4 ) + P(X = 5 ) + ...

= 0,1804 + 0,0902 + 0,0120 + 0,0034 + 0,0009 + 0,0002 = 0,3232

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:130LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:130 21/12/2010 17:31:2121/12/2010 17:31:21

Page 131: LIEaD401Probabilidade e Estatistica COMPLETO

131

Probabilidade e Estatística

Variáveis Aleatórias e Distribuições Discretas

ATIVIDADE 7.3

Responda as questões a seguir:

1) Se o número de peixes pescados por hora em certo pesqueiro é uma variável que segue a distribuição de Poisson com média igual a 1,8, ache a probabilidade de que um pescador, trabalhando durante uma hora:

a) não pegue nenhum peixe;

b) pegue exatamente 2 peixes;

c) pegue no máximo 4 peixes;

d) pegue pelo menos dois peixes.

2) Se 4% de passageiros de avião têm problemas com a bagagem, qual a probabilidade de que, entre 150 passageiros, até dois te-nham problemas com suas bagagens?

3) A experiência indica que um número médio de 6 clientes por hora pára, para colocar gasolina numa bomba. Pede-se:

a) qual é a probabilidade de 3 clientes pararem qualquer hora?

b) qual é a probabilidade de 3 clientes ou menos pararem em qual-quer hora?

4) Um processo de produção produz 10 itens defeituosos por hora. Encontre a probabilidade que 4 ou menos itens sejam defei-tuosos numa retirada aleatória por hora.

5) Na média, 10 pessoas por hora consultam um especialista em in-formática. Qual a probabilidade de que 4 ou mais pessoas consultem o especialista durante um período de quinze minutos?

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:131LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:131 21/12/2010 17:31:2221/12/2010 17:31:22

Page 132: LIEaD401Probabilidade e Estatistica COMPLETO

132

Curso de Licenciatura em Informática

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:132LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:132 21/12/2010 17:31:2221/12/2010 17:31:22

Page 133: LIEaD401Probabilidade e Estatistica COMPLETO

VARIÁVEIS CONTÍNUAS E DISTRIBUIÇÕES CONTÍNUAS

Prezado(a) aluno(a)!

Este é o último capítulo do nosso curso. Nele, veremos as distribui-ções contínuas de probabilidade, que normalmente ocorrem, nas medidas de situações físicas (peso, altura, tamanho, etc.) e sociais (distribuição de renda, padrões de consumo, etc.). O Conteúdo des-te capítulo é fundamental para a inferência estatística (importante ramo da Estatística que tem por objetivo fazer a� rmações a partir de amostras sobre um universo estudado (população).

Bons estudos!

Prof. Sebastião A. Carneiro

8.1 Variável aleatória contínua

Quando a variável aleatória pode assumir qualquer valor do conjunto dos números, é denominada variável aleatória contínua. Por exemplo: os salários dos empregados de uma determinada categoria, as rentabi-lidades mensais das ações, etc. Como o número de possíveis valores de uma variável aleatória contínua X é muito grande, não é possível regis-trar todos os valores em uma lista, uma tabela ou um histograma.

Para os alunos que não gostam de trabalhar com integral, ou para aqueles que desejam reforçar os conceitos de função densidade de probabilidade (fdp), na sala virtual, há a mesma abordagem, só que envolvendo conceitos de áreas.

8.2 Função densidade de probabilidade (FDP)

A distribuição de uma variável aleatória contínua é dada por uma curva contínua e não por pontos discretos. Essa curva, ou função matemática ƒ(x), é denominada função densidade de probabili-dade (fdp).

A área total sob a curva da distribuição ƒ(x) é considerada igual a 1 ou 100%.

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:133LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:133 21/12/2010 17:31:2221/12/2010 17:31:22

Page 134: LIEaD401Probabilidade e Estatistica COMPLETO

134

Curso de Licenciatura em Informática

Capítulo 8

Para os valores de x da variável aleatória X, existe uma função matemá-tica ƒ(x) que estabelece os valores de probabilidade para cada valor de x. As condições são estabelecidas pelas seguintes premissas:

1) A função probabilidade ƒ(x) é sempre positiva:

f(x)

2) A área sob a função de probabilidade ƒ(x) entre os limites menos in� nito e mais in� nito da variável X é igual a 1 ou a 100%.

Essa equação deve � car bem entendida para que os conceitos a se-guir sejam perfeitamente assimilados. A equação mostra que toda a área da função f(x) indicada pela integral deve ser igual a 1.

f(x)

x

1).( dxxf

Figura 23: Área total sob a função de probabilidade ƒ(x)

O valor de probabilidade da variável aleatória contínua X é dado pela área de� nida pela função ƒ(x) entre os limites a e b, conforme a expressão:

Como:

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:134LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:134 21/12/2010 17:31:2221/12/2010 17:31:22

Page 135: LIEaD401Probabilidade e Estatistica COMPLETO

135

Probabilidade e Estatística

Variáveis Contínuas e Distribuições Contínuas

Assim:

O desenvolvimento anterior indica que a probabilidade da área compreendida entre a e b é a relação entre a área compreendida entre a e b e toda a área da função f(x) que é igual a 1. Assim, a probabilidade de estarmos entre o intervalo a e b é a própria área compreendida entre a e b.

f(x)

xa b x

b

dxa

xfbxap ).()(

Figura 24: Área p(a ≤ x ≤ b) sob a função de probabilidade ƒ(x).

Exemplo 8.1:

Veri� car se a função (x) = 2x2 + 3 para (2 ≥ x > 0 ) f(x) = 0 para (0 > x ou x > 2)

È uma função distribuição de probabilidade (fdp).

Logo, a função não é uma distribuição de probabilidade (fdp).

Exemplo 8.2:

Veri� car se a função

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:135LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:135 21/12/2010 17:31:2221/12/2010 17:31:22

Page 136: LIEaD401Probabilidade e Estatistica COMPLETO

136

Curso de Licenciatura em Informática

Capítulo 8

para (3 ≥ x > 1)f(x) = 0 para (1 > x ou x > 3)

É uma função distribuição de probabilidade.

Logo, a função é uma distribuição de probabilidade.

Exemplo 8.3:

Em relação ao exemplo anterior, calcular P (1,5 ≤ X ≤ 2,5).

Como já foi visto no exemplo anterior, a f(x) satisfaz a condição de dis-tribuição de probabilidade.

Assim,

ATIVIDADE 8.1

Responda as questões a seguir:

1) Seja a função f(x) = kx para 1x 0

f(x) = 0 para 0x ou x 1

Determine:

a) k para que f(x) seja uma função distribuição de probabilidade;

b) o grá� co f (x);

c) P(1/2 x 0).

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:136LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:136 21/12/2010 17:31:2321/12/2010 17:31:23

Page 137: LIEaD401Probabilidade e Estatistica COMPLETO

137

Probabilidade e Estatística

Variáveis Contínuas e Distribuições Contínuas

2) O diâmetro X de um cabo elétrico é uma variável aleatória contínua com fdp dada por:

2f (x) = K (2x – x ) para 0 x 1

f(x) = 0 para x < 0 ou x > 1

a) determine K;

b) calcule P (0X 1/2).

3) Uma variável aleatória contínua X tem sua fdp dada pelo grá� co:

a) determine k;

b) calcule P (0 X 2).

8.3 Distribuição uniforme

Uma distribuição de variável contínua é a distribuição uniforme que apresenta uma função densidade de probabilidade constante dentro de um intervalo de valores da variável aleatória X.

A variável aleatória X tem uma distribuição uniforme de probabi-lidades entre os valores a e b, se sua função de probabilidade ƒ(x) é:

Em que: b ≥ a e a ≤ x ≤ b,

A representação grá� ca da distribuição uniforme é um retângulo cuja base está de� nida por dois valores, que estabelecem os limites dos valores possíveis da variável aleatória X. Veja a Figura 17, a seguir:

K

11 4

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:137LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:137 21/12/2010 17:31:2321/12/2010 17:31:23

Page 138: LIEaD401Probabilidade e Estatistica COMPLETO

138

Curso de Licenciatura em Informática

Capítulo 8

1

b - a

a b x

f(x)

Figura 25: Distribuição Uniforme

Perceba que a base do retângulo é igual a b-a, em que b>a, e a altura do retângulo é igual a 1/(b-a); portanto, a área do retângulo é igual a 1, satisfazendo, assim, a condição de que f(x) seja uma função distribuição de probabilidade.

A probabilidade de que a variável aleatória X seja igual ou maior que c, ou igual ou menor que d, sendo que c e d estão dentro do intervalo (a- b), será obtida pela razão de áreas dada pela expressão:

Ao mesmo tempo, representada na Figura 18 a seguir:

1

b - a

a b x

f(x)

c d

Figura 26 - Área de uma Distribuição Uniforme

A probabilidade p(c ≤ x ≤ d) também pode ser visualizada como uma relação de áreas, conforme a Figura 19 a seguir:

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:138LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:138 21/12/2010 17:31:2421/12/2010 17:31:24

Page 139: LIEaD401Probabilidade e Estatistica COMPLETO

139

Probabilidade e Estatística

Variáveis Contínuas e Distribuições Contínuas

Figura 27: Relação de áreas de uma Distribuição Uniforme

Exemplo 8.4:

A variável aleatória contínua X tem distribuição uniforme entre os va-lores 100 e 200.

Pede-se calcular a probabilidade de que o valor da variável X se encontre entre 120 e 170.

A média e a variância de uma variável aleatória X com distribui-ção uniforme de probabilidade entre os valores a e b são iguais a:

Exemplo 8.5:

A variável aleatória contínua X tem distribuição uniforme entre os valo-res 100 e 200. Calcule os valores da média e do desvio padrão e a proba-bilidade de que o valor da variável X se encontre entre 120 e 170.

Média:

A variância

a b

c dp ( c x d )=

5,0100200

120170)170120(

xp 50%

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:139LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:139 21/12/2010 17:31:2421/12/2010 17:31:24

Page 140: LIEaD401Probabilidade e Estatistica COMPLETO

140

Curso de Licenciatura em Informática

Capítulo 8

Portanto, o desvio padrão é igual a:

Cálculo

ATIVIDADE 8.2

Responda as questões a seguir:

1) Foi retirada uma amostra da população X que tem distribuição uniforme e valores máximo e mínimo iguais a 35 e 125, respec-tivamente. Pede-se calcular a probabilidade de que um elemento da amostra:

a) seja maior que 50;

b) seja menor que 65 ou igual a esse valor;

c) esteja entre 55 e 105.

2) As vendas de computadores num depósito de atacado acusam a média de 40.000 computadores diários, com um mínimo de 30.000 computadores. Supondo adequada distribuição uniforme, responda:

qual a venda diária máxima?

qual a percentagem do número de dias em que a venda excede 34.000 computadores?

8.4 Distribuição normal (GAUSS)

A distribuição normal é uma das mais importantes distribuições da estatística, também chamada de Distribuição de Gauss. A distribuição apresenta-se em formato de sino, unimodal, simétrica em relação a sua média

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:140LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:140 21/12/2010 17:31:2521/12/2010 17:31:25

Page 141: LIEaD401Probabilidade e Estatistica COMPLETO

141

Probabilidade e Estatística

Variáveis Contínuas e Distribuições Contínuas

f(x)

x x

Figura 28: Curva Normal (Gauss)

A distribuição normal foi desenvolvida pelo matemático francês Abraham de Moivre e é de� nida conforme expressão a seguir:

Em que:

μ – média;σ - desvio padrão

• Seu formato é sinuoso (curva em forma de sino);

• A curva normal é assintótica em relação ao eixo das abscissas, isto é, aproxima-se inde� nidamente do eixo das abscissas sem, contudo, alcançá-lo;

• A curva é simétrica em torno da média e a probabilidade de ocorrer valor maior que a média é igual à probabilidade de ocorrer valor menor que a média, isto é, ambas as probabilidades são iguais a 0,5 ou 50%.

Se você estranhou a fórmula ou mesmo se assustou com ela, não se preocupe, pois a mesma não é utilizada nos cálculos; será utilizada uma maneira reduzida e tabelada. Muitos estudiosos da estatística já tiveram essa di� culdade e trataram de facilitar nossos cálculos.

8.4.1 Vantagem da distribuição normal

A grande vantagem da distribuição normal é que, com o conhecimen-to da média e do desvio padrão, é possível calcular qualquer valor de probabilidade.

2

2

1

2

1)

(

x

exf

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:141LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:141 21/12/2010 17:31:2521/12/2010 17:31:25

Page 142: LIEaD401Probabilidade e Estatistica COMPLETO

142

Curso de Licenciatura em Informática

Capítulo 8

Transpondo tudo isso para o dia a dia, os valores de x correspondem aos valores numéricos dos dados experimentais, enquanto os valores de y ou f(x) referem-se às frequências com que cada valor de x apa-rece no experimento.

8.4.2 A probabilidade dentro do intervalo (a,b)

Considerando a probabilidade de ocorrência, a área sob sua curva soma 100%. Isso quer dizer que a probabilidade de uma observação assumir um valor entre dois pontos quaisquer é igual à área compreendida entre esses dois pontos.

• A probabilidade p(a ≤X ≤b) de que a variável aleatória X tenha seus valores dentro do intervalo (a,b), é obtida da área sob a curva entre os valores a e b.

f(x)

-2

f(x) f(x)

-1 μ=0 1 2 3a b

-2 -1 μ=0 1 2 3a b

-2 -1 μ=0 1 2 3a b

Figura 29: P(a ≤X ≤b) sob a curva normal

• Quanto mais afastado do centro da curva normal, mais área com-preendida abaixo da curva haverá.

Característica Importante da curva normal:

A um desvio padrão da média, temos 68,26% das observações contidas.

A dois desvios padrões da média, possuímos 95,44% dos dados compreendidos;

A três desvios, da média temos 99,73% das observações contidas.

68%

95%

99,7%

μ-3σ μ-2σ μ-σ μ+σ μ+2σ μ+ 3σμ

Podemos concluir que, quanto maior a variabilidade dos dados em rela-ção à média, maior a probabilidade de encontrarmos o valor que busca-mos embaixo da normal.

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:142LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:142 21/12/2010 17:31:3421/12/2010 17:31:34

Page 143: LIEaD401Probabilidade e Estatistica COMPLETO

143

Probabilidade e Estatística

Variáveis Contínuas e Distribuições Contínuas

8.4.3 Influência dos parâmetros na forma da distribuição normal

Vamos analisar a in� uência da média e do desvio padrão na forma da curva da distribuição normal, observando os três casos seguintes:

a) mantendo constante o valor do desvio padrão e variando o valor da média, temos o comportamento mostrado na � gura 8.7, a) a seguir; ou seja, a curva se desloca segundo o eixo X;

b) Mantendo constante o valor da média e variando o valor do desvio padrão, temos o comportamento mostrado na � gura 8.7, b) a seguir; ou seja, mantém a posição, mas o formato varia. Para um desvio padrão menor temos uma curva mais estreita e mais alta, para um desvio pa-drão maior temos uma curva mais larga e mais baixa,

c) Variando a média e o desvio padrão, temos o comportamento mos-trado na � gura 8.7, c) a seguir; ou seja, muda a posição como o formato também varia.

S = 10 S = 10

X = 10 X = 20

(a)

(c)

(b)

S = 1,5

S = 10

X = 10S = 10S = 15

X = 7 X = 10

Figura 30: In�uência da média e do desvio padrão na forma da curva da distribuição normal

Calcular a probabilidade usando a fórmula de distribuição normal não é tão simples. Para facilitar os cálculos, precisamos encontrar uma maneira mais simples. É o que veremos no item seguinte.

8.5 Distribuição normal reduzida – Z

Curvas normais, com qualquer μ e σ, podem ser transformadas em uma normal muito especial que tem média 0 (x= 0) e desvio padrão 1 (s = 1). Esta curva normal, com média 0 e desvio padrão 1 é conhecida como curva normal reduzida. Suas probabilidades já foram calculadas e são apresentadas em tabelas de fácil utilização. Como a curva normal é si-métrica, os livros de estatísticas apresentam somente as probabilidades

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:143LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:143 21/12/2010 17:31:3421/12/2010 17:31:34

Page 144: LIEaD401Probabilidade e Estatistica COMPLETO

144

Curso de Licenciatura em Informática

Capítulo 8

da metade direita da curva. A probabilidade de um intervalo qualquer da metade esquerda é igual à probabilidade do intervalo equivalente na metade direita.

Como o cálculo da probabilidade usando o cálculo direto não é tão sim-ples, para contornar esse problema deve ser feita uma mudança de vari-ável, chamada z (x z), em que:

Assim, toda distribuição normal com média x e desvio padrão s pode se convertida numa distribuição normal reduzida, com média zero e desvio padrão igual a 1. (Isso não será demonstrado, pois não é objetivo deste curso fazê-lo).

As probabilidades associadas à distribuição normal reduzida são en-contradas na tabela em anexo, não havendo necessidade de serem calculadas.

8.5.1 Utilização da tabela Z

A intersecção entre linha e coluna indica o valor de z. Na primeira colu-na, é dado o valor de z com uma casa decimal. Já na primeira linha, são encontrados os valores centesimais de z; assim, o valor de z correspon-de à intersecção entre linha e coluna encontradas.

Exemplo 8.6

Encontrar na tabela Z o valor de z = 1,25.

z 0 1 2 3 4 5 6 7 8 90,000000 0,003989 0,007978 0,011967 0,015953 0,019939 0,023922 0,027903 0,031881 0,0358560,00,039828 0,043795 0,047758 0,051717 0,055670 0,059618 0,063559 0,067495 0,071424 0,0753450,10,079260 0,083166 0,087064 0,090954 0,094835 0,098706 0,102568 0,106420 0,110261 0,1140920,20,117911 0,121719 0,125516 0,129300 0,133072 0,136831 0,140576 0,144309 0,148027 0,1517320,30,155422 0,159097 0,162757 0,166402 0,170031 0,173645 0,177242 0,180822 0,184386 0,1879330,40,191462 0,194974 0,198468 0,201944 0,205402 0,208840 0,212260 0,215661 0,219043 0,2224050,50,225747 0,229069 0,232371 0,235653 0,238914 0,242154 0,245373 0,248571 0,251748 0,2549030,60,258036 0,261148 0,264238 0,267305 0,270350 0,273373 0,276373 0,279350 0,282305 0,2852360,70,288145 0,291030 0,293892 0,296731 0,299546 0,302338 0,305106 0,307850 0,310570 0,3132670,80,315940 0,318589 0,321214 0,323814 0,326391 0,328944 0,331472 0,333977 0,336457 0,3389130,90,341345 0,343752 0,346136 0,348495 0,350830 0,353141 0,355428 0,357690 0,359929 0,3621431,00,364334 0,366500 0,368643 0,370762 0,372857 0,374928 0,376976 0,378999 0,381000 0,3829771,10,384930 0,386860 0,388767 0,390651 0,392512 0,394350 0,396165 0,397958 0,399727 0,4014751,2

Z = 1,25

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:144LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:144 21/12/2010 17:31:3421/12/2010 17:31:34

Page 145: LIEaD401Probabilidade e Estatistica COMPLETO

145

Probabilidade e Estatística

Variáveis Contínuas e Distribuições Contínuas

Na primeira coluna, encontramos o valor até uma casa decimal = 1,2. Em seguida, na primeira linha, o valor 5, que corresponde ao último algarismo do número 1,25. Na intersecção da linha e coluna correspon-dentes, encontramos o valor 0,3944, o que nos permite escrever:

P(0 < z < 1,05) = 0,3944

Após utilizar a distribuição normal reduzida, devemos retornar para o nosso problema de origem, fazendo uma nova conversão de variáv e l z x.

Veja como proceder à conversão, por meio de um exemplo a seguir:

Exemplo 8.7:

Seja X, a variável aleatória que representa os diâmetros dos parafusos de � xação do HD, nos computadores produzidos por certa máquina; vamos supor que essa variável tenha distribuição normal com média = 2 cm e desvio padrão = 0,04 cm. Qual a probabilidade de um parafuso ter o diâmetro com valor entre 2 e 2,05 cm?

Na realidade, queremos P (2 ≤X ≤ 2,05).

Com o auxílio da distribuição normal reduzida, isto é, a distribuição normal de média = 0 e desvio padrão = 1, o problema é resolvido por meio da variável z.

Utilizaremos também a tabela normal reduzida:

P (2 ≤X ≤ 2,05)= P (0 ≤z ≤ 1,25)

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:145LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:145 21/12/2010 17:31:3421/12/2010 17:31:34

Page 146: LIEaD401Probabilidade e Estatistica COMPLETO

146

Curso de Licenciatura em Informática

Capítulo 8

ATIVIDADE 8.3

Responda as questões a seguir:

1) Determine as probabilidades:

a) P(-1,25 < Z < 0) =

b) P(-0,5 < Z < 1,48) =

c) P(0,8 < Z < 1,23) =

d) P(-1,25 < Z < -1,20) =

e) P( Z < 0,92) =

f) P(Z > 0,6) =

2) Os salários dos analistas de sistema são distribuídos normal-mente em torno da média de R$ 10.000,00, com desvio padrão de R$ 800,00. Calcule a probabilidade de um analista ter o salário situado entre R$ 9.800,00 e R$ 10.400,00.

3) Um teste padronizado de escolaridade tem distribuição normal com média = 100 e desvio padrão = 10. Determine a probabilida-de de um aluno submetido ao teste ter nota:

a) maior que 120;

b) maior que 80;

c) entre 85 e 115;

d) maior que 100.

4) Seja uma série de observações X com distribuição normal, mé-dia igual a 50 e desvio padrão igual a 10. Se retirarmos uma ob-servação dessa série, qual é a probabilidade de seu valor ser igual ou menor que 60?

5) Uma série de observações tem média de 300 e desvio padrão de 20. Sabendo que essa série tem uma distribuição normal, cal-cule a probabilidade de que um elemento da série, escolhido ale-atoriamente, tenha um valor compreendido dentro de um desvio padrão (20) ao redor da média.

8.5.2 Exemplo prático para entendimento da curva normal

Como saber, na prática, se os dados obtidos é uma distribuição normal ou não?

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:146LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:146 21/12/2010 17:31:3521/12/2010 17:31:35

Page 147: LIEaD401Probabilidade e Estatistica COMPLETO

147

Probabilidade e Estatística

Variáveis Contínuas e Distribuições Contínuas

Por exemplo: Uma empresa de informática fez o levantamento das ven-das de computadores em suas � liais,conforme tabela a seguir. Como analisar esses dados ?

Preços dos computadores Quantidade vendidas500 5600 15700 22800 25900 38

1.000 501.100 751.200 1101.300 1301.400 1501.500 1601.600 1501.700 1301.800 1101.900 752.000 502.100 382.200 252.300 222.400 152.500 5

o1 passo: fazer o histograma das vendas de computadores e veri� car visualmente se ela é, de fato, normal.

Venda de computadores

Qu

an

tid

ad

e v

en

did

a

180

160

140

120

100

80

60

40

20

0

500

600

700

800

900

1000

1100

1200

1300

1400

1500

1600

1700

1800

1900

2000

2100

2200

2300 R$

Figura 31: Histograma das vendas de computadores com aproximação normal.

Tabela 8.1 levantamento das vendas de computadores

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:147LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:147 21/12/2010 17:31:3521/12/2010 17:31:35

Page 148: LIEaD401Probabilidade e Estatistica COMPLETO

148

Curso de Licenciatura em Informática

Capítulo 8

Neste caso, podemos observar que o formato é bem semelhante à curva normal.

o2 passo: calcular o preço médio dos computadores e o desvio padrão.

Preços dos computadores

Quantidade vendidas Xi . fi Xi2 . fi

500 5 2.500 1.250.000600 15 9.000 5.400.000700 22 15.400 10.780.000800 25 20.000 16.000.000900 38 34.200 30.780.000

1.000 50 50.000 50.000.0001.100 75 82.500 90.750.0001.200 110 132.000 158.400.0001.300 130 169.000 219.700.0001.400 150 210.000 294.000.0001.500 160 240.000 360.000.0001.600 150 240.000 384.000.0001.700 130 221.000 375.700.0001.800 110 198.000 356.400.0001.900 75 142.500 270.750.0002.000 50 100.000 200.000.0002.100 38 79.800 167.580.0002.200 25 55.000 121.000.0002.300 22 50.600 116.380.0002.400 15 36.000 86.400.0002.500 5 12.500 31.250.000

1400 2.100.000 3.346.520.000

Calcula o preço médio dos computadores:

= R$ 1500,00

Caso tenha dúvida, volte ao capítulo 4 para recordar.

Calcula a variância:

= 140.371 R$2

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:148LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:148 21/12/2010 17:31:3521/12/2010 17:31:35

Page 149: LIEaD401Probabilidade e Estatistica COMPLETO

149

Probabilidade e Estatística

Variáveis Contínuas e Distribuições Contínuas

Calcula o desvio padrão:

= R$ 375

Variação do desvio padrão em torno da média

Quantidade de compu-tadores no intervalo

Quantidade de computadores

em %

Média + s = R$ 1.8751015 73%

Média - s = R$ 1.125Média + 2s = R$ 2.249

1316 94%Média - 2s = R$ 751Média + 3s = R$ 2.624

1400 100%Média - 3s = R$ 376

Conclusão:

Os dados do exemplo se aproximam muito de uma distribuição normal, pois visualmente têm o formato sinuoso, conforme mostra o histogra-ma, e a um desvio padrão da média, deveríamos ter 68,26% das obser-vações contidas e o obtido foi 73% e a dois desvios padrões, deveríamos ter 95,44% dos dados compreendidos e o obtido foi 94% e � nalmente a três desvios, deveríamos ter 99,73% das observações contidas e o obtido foi 100%, valores estes bem próximos do teórico.

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:149LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:149 21/12/2010 17:31:3521/12/2010 17:31:35

Page 150: LIEaD401Probabilidade e Estatistica COMPLETO

150

Curso de Licenciatura em Informática

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:150LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:150 21/12/2010 17:31:3521/12/2010 17:31:35

Page 151: LIEaD401Probabilidade e Estatistica COMPLETO

CRESPO, Antônio Arnot. Estatística fácil. 18. ed. São Paulo: Saraiva, 2006.

LAPPONI, Juan Carlos. Estatística usando Excel 5 e 7. São Paulo: Lapponi Treina-mento e Editora, 1997.

REGGIANI, Lucia. A TI dos Bilhões: o faturamento das 200 maiores empresas de tecnologia do Brasil crava 95 bilhões de dólares. Info Exame, São Paulo, n. 257, p. 82-86, ago. 2007.

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:151LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:151 21/12/2010 17:31:3621/12/2010 17:31:36

Page 152: LIEaD401Probabilidade e Estatistica COMPLETO

152

Curso de Licenciatura em Informática

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:152LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:152 21/12/2010 17:31:3621/12/2010 17:31:36

Page 153: LIEaD401Probabilidade e Estatistica COMPLETO

Resultado da pesquisa de campo referente aos preços (R$) de 200 monito-res LCD de uma determinada marca em 200 empresas de informática

431,3 431,3 431,3 432,0 413,0 413,0 413,0 414,0 414,0 414,0422,0 422,5 422,5 422,5 422,8 416,0 416,0 417,0 417,0 417,0425,5 425,5 426,0 426,0 426,0 419,0 419,0 419,0 420,0 420,0421,0 421,0 421,0 421,0 421,0 422,0 422,0 422,0 422,0 422,0424,0 424,0 424,0 424,0 424,0 424,0 424,5 424,5 424,5 424,5427,0 427,0 427,0 427,0 427,0 427,0 427,5 427,5 427,5 427,5430,0 430,0 430,0 430,0 430,0 430,0 430,6 430,6 430,6 430,6433,0 433,0 433,0 433,0 433,0 434,0 434,0 434,0 434,0 434,0436,0 436,0 436,0 436,0 437,0 437,0 437,0 437,0 438,0 438,0439,0 439,0 439,0 440,0 440,0 440,0 440,0 440,0 417,0 438,0420,0 420,0 420,3 420,3 420,3 420,3 420,7 420,7 420,7 420,7418,0 418,0 418,0 418,0 419,0 422,8 422,8 422,8 423,0 423,0424,5 424,5 425,0 425,0 425,0 425,0 425,5 425,5 425,5 425,5427,5 427,5 428,0 428,0 428,0 428,0 428,5 428,5 428,5 428,5430,6 430,6 431,0 431,0 431,0 431,0 431,0 431,3 431,3 431,3434,0 434,0 435,0 435,0 435,0 435,0 435,0 435,0 435,0 435,0417,8 417,8 417,8 417,8 438,0 435,0 435,0 423,0 423,0 423,5415,0 415,0 415,0 415,0 416,0 426,0 426,0 426,3 423,5 423,5428,5 428,5 429,0 429,0 429,0 429,0 429,0 429,8 429,8 429,8412,0 412,0 412,5 412,5 432,0 432,0 432,0 432,0 426,3 426,3

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:153LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:153 21/12/2010 17:31:3621/12/2010 17:31:36

Page 154: LIEaD401Probabilidade e Estatistica COMPLETO

154

Curso de Licenciatura em Informática

Anexo

z 0 1 2 3 4 5 6 7 8 90,000000 0,003989 0,007978 0,011967 0,015953 0,019939 0,023922 0,027903 0,031881 0,0358560,00,039828 0,043795 0,047758 0,051717 0,055670 0,059618 0,063559 0,067495 0,071424 0,0753450,10,079260 0,083166 0,087064 0,090954 0,094835 0,098706 0,102568 0,106420 0,110261 0,1140920,20,117911 0,121719 0,125516 0,129300 0,133072 0,136831 0,140576 0,144309 0,148027 0,1517320,30,155422 0,159097 0,162757 0,166402 0,170031 0,173645 0,177242 0,180822 0,184386 0,1879330,40,191462 0,194974 0,198468 0,201944 0,205402 0,208840 0,212260 0,215661 0,219043 0,2224050,50,225747 0,229069 0,232371 0,235653 0,238914 0,242154 0,245373 0,248571 0,251748 0,2549030,60,258036 0,261148 0,264238 0,267305 0,270350 0,273373 0,276373 0,279350 0,282305 0,2852360,70,288145 0,291030 0,293892 0,296731 0,299546 0,302338 0,305106 0,307850 0,310570 0,3132670,80,315940 0,318589 0,321214 0,323814 0,326391 0,328944 0,331472 0,333977 0,336457 0,3389130,90,341345 0,343752 0,346136 0,348495 0,350830 0,353141 0,355428 0,357690 0,359929 0,3621431,00,364334 0,366500 0,368643 0,370762 0,372857 0,374928 0,376976 0,378999 0,381000 0,3829771,10,384930 0,386860 0,388767 0,390651 0,392512 0,394350 0,396165 0,397958 0,399727 0,4014751,20,403199 0,404902 0,406582 0,408241 0,409877 0,411492 0,413085 0,414656 0,416207 0,4177361,30,419243 0,420730 0,422196 0,423641 0,425066 0,426471 0,427855 0,429219 0,430563 0,4318881,40,433193 0,434478 0,435744 0,436992 0,438220 0,439429 0,440620 0,441792 0,442947 0,4440831,50,445201 0,446301 0,447384 0,448449 0,449497 0,450529 0,451543 0,452540 0,453521 0,4544861,60,455435 0,456367 0,457284 0,458185 0,459071 0,459941 0,460796 0,461636 0,462462 0,4632731,70,464070 0,464852 0,465621 0,466375 0,467116 0,467843 0,468557 0,469258 0,469946 0,4706211,80,471284 0,471933 0,472571 0,473197 0,473810 0,474412 0,475002 0,475581 0,476148 0,4767051,90,477250 0,477784 0,478308 0,478822 0,479325 0,479818 0,480301 0,480774 0,481237 0,4816912,00,482136 0,482571 0,482997 0,483414 0,483823 0,484222 0,484614 0,484997 0,485371 0,4857382,10,486097 0,486447 0,486791 0,487126 0,487455 0,487776 0,488089 0,488396 0,488696 0,4889892,20,489276 0,489556 0,489830 0,490097 0,490358 0,490613 0,490863 0,491106 0,491344 0,4915762,30,491802 0,492024 0,492240 0,492451 0,492656 0,492857 0,493053 0,493244 0,493431 0,4936132,40,493790 0,493963 0,494132 0,494297 0,494457 0,494614 0,494766 0,494915 0,495060 0,4952012,50,495339 0,495473 0,495603 0,495731 0,495855 0,495975 0,496093 0,496207 0,496319 0,4964272,60,496533 0,496636 0,496736 0,496833 0,496928 0,497020 0,497110 0,497197 0,497282 0,4973652,70,497445 0,497523 0,497599 0,497673 0,497744 0,497814 0,497882 0,497948 0,498012 0,4980742,80,498134 0,498193 0,498250 0,498305 0,498359 0,498411 0,498462 0,498511 0,498559 0,4986052,90,498650 0,498694 0,498736 0,498777 0,498817 0,498856 0,498893 0,498930 0,498965 0,4989993,00,499032 0,499065 0,499096 0,499126 0,499155 0,499184 0,499211 0,499238 0,499264 0,4992893,10,499313 0,499336 0,499359 0,499381 0,499402 0,499423 0,499443 0,499462 0,499481 0,4994993,20,499517 0,499533 0,499550 0,499566 0,499581 0,499596 0,499610 0,499624 0,499638 0,4996503,30,499663 0,499675 0,499687 0,499698 0,499709 0,499720 0,499730 0,499740 0,499749 0,4997583,40,499767 0,499776 0,499784 0,499792 0,499800 0,499807 0,499815 0,499821 0,499828 0,4998353,50,499841 0,499847 0,499853 0,499858 0,499864 0,499869 0,499874 0,499879 0,499883 0,4998883,60,499892 0,499896 0,499900 0,499904 0,499908 0,499912 0,499915 0,499918 0,499922 0,4999253,70,499928 0,499930 0,499933 0,499936 0,499938 0,499941 0,499943 0,499946 0,499948 0,4999503,80,499952 0,499954 0,499956 0,499958 0,499959 0,499961 0,499963 0,499964 0,499966 0,4999673,90,499968 0,499970 0,499971 0,499972 0,499973 0,499974 0,499975 0,499976 0,499977 0,4999784,0

Tabela: Distribuição Normal Reduzida - Z:N(0,1)

LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:154LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:154 21/12/2010 17:31:3621/12/2010 17:31:36

Page 155: LIEaD401Probabilidade e Estatistica COMPLETO

.Uiramutã

.Pacaraima.Normandia

.Bonfim

.Cantá

.Boa Vista

.Amajari

.Mucajaí

.Caracaraí

.Rorainópolis.São João da Baliza