liead401probabilidade e estatistica completo
TRANSCRIPT
Universidade Federal de Roraima
Núcleo de Educação a DistânciaPró-Reitoria de Ensino e Graduação
Centro de Ciências e TecnologiaDepartamento de Ciência da Computação
Curso de Licenciatura em Informática a Distância
Sebastião A. Carneiro
PROBABILIDADE E ESTATÍSTICA
Governo Federal
Ministro de Educação
Fernando Haddad
Ifes – Instituto Federal do Espírito Santo
Reitor
Denio Rebello Arantes
Pró-Reitora de Ensino
Cristiane Tenan Schllittler dos Santos
Diretora do CEAD – Centro de Educação a Distância
Yvina Pavan Baldo
Coordenadoras da UAB – Universidade Aberta do Brasil
Elton Siqueira MouraDanielli Veiga Carneiro Sondermann
Curso de Licenciatura em Informática
Coordenação de Curso
Jonathan Toczek
Designer Instrucional
Edmundo Rodrigues Júnior
Professor Especialista/Autor
Sebastião A. Carneiro
Catalogação na fonte: Renata Lorencini Rizzi - CRB 6/685
C289p Carneiro, Sebastião Alves
Probabilidade e estatística / Sebastião Alves Carneiro. Vitória: Ifes, 2010.
155 p. : il.
1. Probabilidades. 2. Es t a t í t i c Tecnologia do Espírito Santo. II. Título.
CDD 519.86
DIREITOS RESERVADOS
IFES – Centro Federal de Educação Tecnológica do Espírito Santo
Avenida Rio Branco, nº 50 Santa Lúcia - CEP. 29056-255 – Vitória – ES - Telefone: 3227-5564
Créditos de autoria da editoração
Capa: Juliana Cristina da SilvaProjeto grá� co: Juliana Cristina e Nelson Torres
Iconogra� a: Nelson TorresEditoração eletrônica: Duo Translations
Revisão de texto: Esther Ortlibe Faria de Almeida
COPYRIGHT – É proibida a reprodução, mesmo que parcial, por qualquer meio, sem autorização escrita dos autores e do detentor dos direitos autorais.
a. I. Instituto Federal de Educação, Ciência e
Olá, Aluno(a)!
É um prazer tê-lo conosco.
O Ifes oferece a você, em parceria com as Prefeituras e com o Governo Federal, o Curso de Licenciatura em Informática, na modalidade à distância.
Apesar de este curso ser ofertado à distância, esperamos que haja proximi-dade entre nós, pois, hoje, graças aos recursos da tecnologia da informação (e-mails, chat, videoconferênca, etc.), podemos manter uma comunicação efetiva.
É importante que você conheça toda a equipe envolvida neste curso: coordenadores,
professores especialistas, tutores à distância e tutores presenciais.
Assim, quando precisar de algum tipo de ajuda, saberá a quem recorrer.
Na EaD - Educação a Distância - você é o grande responsável pelo sucesso da aprendizagem. Por isso é necessário que se organize para os estudos e para a realização de todas as atividades, nos prazos estabelecidos, conforme
orientação dos Professores Especialistas e Tutores.
Fique atento às orientações de estudo que se encontram no Manual do Aluno!
A EaD, pela sua característica de amplitude e pelo uso de tecnologias mo-dernas, representa uma nova forma de aprender, respeitando, sempre, o seu tempo.
Desejamos a você sucesso e dedicação!
Equipe do Ifes
Fala do Professor
Conceitos importantes. Fique atento!
Atividades que devem ser elaboradas por você, após a leitura dos textos.
Indicação de leituras complemtares, referentes ao conteúdo estudado.
Destaque de algo importante, referente ao conteúdo apresentado. Atenção!
Re� exão/questionamento sobre algo impor-tante referente ao conteúdo apresentado.
ICONOGRAFIA
Veja, abaixo, alguns símbolos utilizados neste material para guiá-lo em seus estudos
Espaço reservado para as anotações que você julgar necessárias.
LICINF_4P_ProbEsta_DIAGRAMACAO.indd 4LICINF_4P_ProbEsta_DIAGRAMACAO.indd 4 21/12/2010 17:30:4521/12/2010 17:30:45
PROBABILIDADE E ESTATÍSTICA
Cap. 1 - AMOSTRAGEM 11
1.2. Histórico 11
1.3. Método estatístico 11
1.4. Fases do método estatístico 12
1.5 Conceitos básicos 13
1.5.1 População 13
1.5.2 Amostras 14
1.5.3 Variável 15
1.6. Amostragem 16
1.6.1 Amostragem casual ou aleatória simples 17
1.6.2 Amostragem sistemática 18
1.6.3 Amostragem proporcional estratificada 19
2.1 Série estatística 23
Cap. 2 - SÉRIES E CONSTRUÇÃO DE GRÁFICOS 23
2.1.1 Série temporal 24
2.1.2 Série geográfica 24
2.1.3 Série específica 25
2.1.4 Séries conjugadas 25
2.2.1 Diagramas 26
2.3 Uso indevido de gráficos 34
3.1 Distribuição de frequência 37
Cap. 3 - MÉTODOS GRÁFICOS 37
3.1.1 Tabela primitiva ou tabela de dados brutos 37
3.1.2 ROL 39
3.1.3 Distribuição de frequência sem intervalos de classe 39
3.1.4 Distribuição de frequência com intervalos de classe 41
3.1.5 Polígono de frequência 48
3.1.6 Curva de frequência (curva polida): 50
4.1 Medidas de posição 55
Cap. 4 - MEDIDAS DE ORDENAMENTO E DE POSIÇÃO 55
4.2 Média de população e de amostras 55
4.3 Representação dos valores de uma série de valores 56
LICINF_4P_ProbEsta_DIAGRAMACAO.indd 5LICINF_4P_ProbEsta_DIAGRAMACAO.indd 5 21/12/2010 17:30:4521/12/2010 17:30:45
4.4 Média aritmética ( x ) 56
4.4.1 Média Aritmética para dados não-agrupados: 57
4.4.2 Desvio em relação à média 57
4.4.3 Propriedades da média 58
4.5 Moda (Mo) 63
4.5.1 Moda quando os dados não estão agrupados 64
4.5.2 Moda quando os dados estão agrupados 64
4.6 Mediana (MD) 67
4.6.1 Mediana para série com número ímpar de termos 67
4.6.2 Mediana para série com número par de termos: 67
4.6.3 Mediana para série com dados agrupados 68
4.7 Assimetria 73
4.8 Separatrizes 74
4.8.1 Quartis 74
4.8.2 Decis 79
4.8.3 Percentil ou Centil 80
5.1 Medidas de dispersão 84
Cap. 5 - MEDIDAS DE VARIABILIDADE 83
5.2 Medidas de dispersão absoluta 85
5.2.1 Amplitude total (AT): 85
5.2.2 Variância 86
5.2.3 Desvio padrão – S 93
5.2.4 Coeficiente de variação de Pearson - CVP 96
6.1 Experimento aleatório 99
Cap. 6 - PROBABILIDADE 99
6.2 Espaço amostral 100
6.3 Eventos 101
6.4 Conceito de probabilidade 103
6.4.1 Eventos complementares 105
6.4.2 Combinações dos eventos 105
6.5 Técnicas de contagem em probabilidade 111
6.5.1 Permutação sem repetições 111
6.5.2 Permutação com repetições 112
6.5.3 Arranjo 112
6.5.4 Combinação 114
Cap. 7 - VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÕES DISCRETAS 119
7.1 Variável aleatória 119
7.2 Distribuição de probabilidade 120
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec2:6LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec2:6 21/12/2010 17:30:4521/12/2010 17:30:45
7.3 Valor esperado (esperança matemática) 123
7.4 Distribuição binomial 125
7.5 DISTRIBUIÇÃO DE POISSON 128
Cap. 8 - VARIÁVEIS CONTÍNUAS E DISTRIBUIÇÕES CONTÍNUAS 133
8.1 Variável aleatória contínua 133
8.2 Função densidade de probabilidade (FDP) 133
8.3 Distribuição uniforme 137
8.4 Distribuição normal (GAUSS) 140
8.4.1 Vantagem da distribuição normal 141
8.4.2 A probabilidade dentro do intervalo (a,b) 142
8.4.3 Influência dos parâmetros na forma da distribuição
normal 143
8.5 Distribuição normal reduzida – Z 143
8.5.1 Utilização da tabela Z 144
REFERÊNCIAS BIBLIOGRÁFICAS 151
ANEXOS 153
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:7LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:7 21/12/2010 17:30:4621/12/2010 17:30:46
APRESENTAÇÃO
Olá, Aluno (a)!
Seja bem-vindo (a) ao nosso curso de Probabilidade e Estatística!
Sou o professor Sebastião Alves Carneiro, responsável pela gerência e pro-dução de material dessa disciplina, no curso de Curso de Licenciatura em Informatica, na modalidade a distancia.
Sou formado em Engenharia Elétrica e tenho Mestrado em Controle de Sistemas pela Universidade Federal do Espírito Santo - UFES. Atualmen-te, ocupo o cargo de Diretor Adjunto, no Campus Serra. Já lecionei a disci-plina de Probabilidade e Estatística no curso de Análise e Desenvolvimen-to de Sistemas, no Campus Serra.
Acredito que, com tecnologia na sala de aula, o papel do educador muda de detentor do conhecimento para guia das investigações dos alunos. O novo professor tem que estar preparado para deixar de ser o que apenas fornece informações para ser um orientador, aquele que ajuda a selecionar informações e fazer articulações. Nós aprendemos uns com os outros, a toda hora, a qualquer momento.
A disciplina de Probabilidade e Estatística é importante para sua forma-ção, pois é uma área do conhecimento que utiliza teorias probabilísticas para explicação de eventos, estudos e experimentos. Tem por objetivo ob-ter, organizar e analisar dados, determinar as correlações que apresentem, irando delas suas consequências para descrição e explicação do que passou e previsão e organização do futuro. Portanto, serão estudados neste curso-tanto os conceitos fundamentais, como as técnicas formais da estatística.
Nosso curso será dividido em oito capítulos:no primeiro, faremos a in-trodução de nossos estudos; no segundo, estudaremos a construção de grá� cos, bem como suas propriedades e aplicações; no terceiro, veremos métodos grá� cos; no quarto estudaremos medidas de ordenamento e posi-ção; no quinto, estudaremos medidas de dispersão; no sexto, estudaremos probabilidade; no sétimo, estudaremos variáveis aleatórias e distribuições discretas. Por � m, estudaremos, no oitavo capítulo, variáveis contínuas e distribuições contínuas.
Um curso de Probabilidade e Estatística requer um tempo diário de estudo e dedicação. Por isso é muito importante que você faça todas as atividades propostas, tanto neste material como na sua sala de aula virtual.
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:9LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:9 21/12/2010 17:30:4621/12/2010 17:30:46
• Leia os textos com bastante atenção, sempre com espírito questionador e investigativo.
• Personalize o seu estudo. Dê novos títulos e subtítulos, reorganizando a divisão do texto. Assim, você o verá por uma nova ótica e será mais fácil reter as informações por partes.
• Crie perguntas e tente respondê-las sem pesquisar. Depois, con� ra as respostas.
• Sintetize com suas palavras o que foi estudado. Faça resumos: destaque o tema central, as de� nições essenciais, os exemplos, os casos particulares, as observações.
• Leia bem os enunciados das questões propostas e interprete o que se pede. Comece, então, a responder com atenção, sempre pesquisando no livro texto ou em outros meios que facilitem sua resposta. Veri� que se todas estão corretas, revendo o que foi feito.
• Interesse-se, participe e discuta com o professor e com seus colegas.
• Faça análise dos exercícios resolvidos que se encontram ao longo deste fascículo e, se houver dúvidas, entre em contato com o seu tutor a distância.
Você logo perceberá que o sucesso neste curso é questão de tempo!
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:10LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:10 21/12/2010 17:30:4621/12/2010 17:30:46
1.1. Introdução
Olá, Aluno (a)!,
O objetivo fundamental da Introdução é dar uma visão inicial da estatística. Neste capítulo, veremos históricos da estatística, método estatístico, de� nições básicas da estatística e iniciaremos amostragem.
A estatística é uma área do conhecimento que utiliza teorias proba-bilísticas para explicação de eventos, estudos e experimentos. Tem por objetivo obter, organizar e analisar dados; bem como determi-nar suas correlações, tirando delas suas conseqüências, explicar o que passou e prever o que ocorrerá no futuro.
Bons estudos!
Prof. Sebastião A. Carneiro
1.2. Histórico
Faremos um breve histórico para expor o modo como a estatística surgiu.
• ANTIGUIDADE: os povos na antiguidade registravam o número de habitantes, nascimentos, óbitos. Já faziam “estatísticas”.
• IDADE MÉDIA: as informações na Idade Média eram tabuladas com � nalidades tributárias e bélicas.
• SÉCULO XVI: no século XVI surgem as primeiras análises sistemá-ticas, as primeiras tabelas e os números relativos.
• SÉCULO XVIII: no século XVIII a estatística surge com notação cientí� ca a qual é adotada pelo acadêmico alemão GODOFREDO ACHENWALL. As tabelas � cam mais completas, surgindo as pri-meiras representações grá� cas e os cálculos de probabilidades. A estatística deixa de ser uma simples tabulação de dados numéricos para se tornar o estudo de como se chegar à conclusão sobre uma população, partindo de observação de partes dessa população.
1.3. Método estatístico
O método estatístico se aplica ao estudo dos fenômenos aleatórios. Um fenômeno é considerado aleatório se seus resultados variarem, a cada repetição, nas mesmas condições.
AMOSTRAGEM
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:11LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:11 21/12/2010 17:30:4621/12/2010 17:30:46
12
Curso de Licenciatura em Informática
MÉTODO: é um meio mais e� caz para atingir determinada meta.
MÉTODO CIENTÍFICO: é um conjunto de regras básicas para desenvolver uma experiência a � m de produzir novo conhecimen-to, bem como corrigir e integrar conhecimentos pré-existentes.Destacamos o método experimental e o método estatístico.
MÉTODO EXPERIMENTAL: consiste em manter constantes todas as causas, menos uma, que é a que sofre variação para se observarem seus efeitos.
Exemplos: Estudos da Química, da Física, etc.
MÉTODO ESTATÍSTICO: é um processo para obter, apresentar e analisar características ou valores numéricos para uma melhor tomada de decisão em situações de incerteza.
Exemplo: Quais as causas que de� nem o preço de uma mercado-ria quando a sua oferta diminui?
Comentário: Seria impossível, no momento da pesquisa, manter constantes a uniformidade dos salários, o gosto dos consumido-res, o nível geral de preços de outros produtos, etc.
1.4. Fases do método estatístico
É importante conhecer todas as fases do método estatístico, pois você deverá segui-las quando desejar fazer uma pesquisa.
Vendas
Duplicatas a Pagar
Despesa de Salários
Contas a Receber
Despesas de Juros
Receitas de Serviços
Despesas de Aluguel
Prejuízos Acumulados
50.000
6.000
10.000
8.000
2.000
17.000
3.000
4.000
Apresentaçãodos dados
Definiçãodo
problema
Coleta dedados
Apuraçãodos dados
Planejamento
Comentando as fases do método estatístico:
a1 – DEFINIÇÃO DO PROBLEMA: Saber exatamente o que se quer
pesquisar é o mesmo que def nir corretamente o problema.a2 – PLANEJAMENTO: Como levantar informações? Que dados de-
verão ser obtidos? Qual o levantamento a ser utilizado: censitário, por
amostragem? E o cronograma de atividades? Os custos envolvidos?
Capítulo 1
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:12LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:12 21/12/2010 17:30:4621/12/2010 17:30:46
13
Probabilidade e Estatística
Amostragem
a3 – COLETA DE DADOS: Fase operacional. É o registro sistemático
de dados, com um objetivo determinado.
4º – APURAÇÃO DOS DADOS: Resumo dos dados por meio de
sua contagem e de seu agrupamento. É a condensação e tabulação de
dados.
5º – APRESENTAÇÃO DOS DADOS: Há duas formas de apresenta-
ção, que não se excluem mutuamente. A apresentação tabular é uma
apresentação numérica dos dados em linhas e colunas distribuídas de
modo ordenado, segundo regras práticas f xadas pelo Conselho Nacio-
nal de Estatística. A apresentação gráf ca dos dados numéricos constitui
uma apresentação geométrica que permite uma visão rápida e clara do
fenômeno.
6º – ANÁLISE E INTERPRETAÇÃO DOS DADOS: A última fase do
trabalho estatístico é a mais importante e delicada. Está ligada essen-
cialmente ao cálculo de medidas e coef cientes, cuja f nalidade princi-
pal é descrever o fenômeno (estatística descritiva).
ATIVIDADE 1: Responda a questão a seguir:
Em que fase do método estatístico devemos:
a) ter uma visão rápida e clara do fenômeno?b) fazer o registro sistemático de dados?;c) fazer a condensação e tabulação de dados? d) ser mais cuidadosos, pois é a fase mais importante e delicada do método?e) fazer o cronograma de atividades?f) de� nir corretamente o problema?
1.5 Conceitos básicos
Muitas vezes, apesar dos recursos computacionais e da boa vontade, não é possível estudar todo um conjunto de dados de interesse, pois � ca caro e leva muito tempo. Assim, normalmente, se trabalha com partes da população denominadas de amostras.
1.5.1 População
População é o conjunto total de elementos portadores de, pelo menos, uma característica comum.
Note-se que o termo população é usado num sentido amplo e não signi-� ca, em geral, conjunto de pessoas.o
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:13LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:13 21/12/2010 17:30:4721/12/2010 17:30:47
14
Curso de Licenciatura em Informática
Capítulo 1
Exemplos:
a) o conjunto das rendas de todos os habitantes do Espírito Santo;b) o conjunto de todas as notas dos alunos de Estatística;c) o conjunto das alturas de todos os alunos da Universidade; etc.
Um levantamento efetuado sobre toda uma população é denominado de levantamento censitário ou Censo.
1.5.2 Amostras
Amostras são parcelas representativas de uma população, examinada com o propósito de se tirarem conclusões sobre essa população.
Exemplos:
a) antes da eleição diversos órgãos de pesquisa e imprensa ouvem um conjunto selecionado de eleitores para ter uma idéia do desempenho dos vários candidatos nas futuras eleições;
b) uma empresa metal-mecânica toma uma amostra do produto fabri-cado em intervalos de tempo especi� cados para veri� car se o pro-cesso está sob controle e evitar a fabricação de itens defeituosos;
c) o IBGE faz levantamentos periódicos sobre emprego, desemprego, in� ação, etc;
d) redes de rádio e TV se utilizam constantemente dos índices de po-pularidade dos programas para � xar valores da propaganda, ou en-tão, modi� car ou eliminar programas com audiência insatisfatória;
e) biólogos marcam pássaros, peixes, etc, para tentar prever e estudar seus hábitos.
ATIVIDADE 1:
1) Estabeleça a população, a amostra e o tipo de fonte de dados em cada caso:
a) Numa escola de primeiro grau com 560 alunos matriculados, foram sorteados 100 alunos que responderam a um questionário sobre preferência por refrigerantes.
b) Um administrador fez uma pesquisa para analisar o crescimen-to da população urbana de 1980 a 2000. Para obter os dados, re-correu ao anuário do IBGE (Instituto Brasileiro de Geogra� a e Estatística).
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:14LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:14 21/12/2010 17:30:4821/12/2010 17:30:48
15
Probabilidade e Estatística
Amostragem
2) Pretende-se fazer um estudo sobre o número de irmãos dos
alunos do 10º ano de escolaridade de uma Escola Secundária. Para isso, efetuou-se um questionário, ao qual responderam 60 alunos.
Indique:
a) a população em estudo;
b) a amostra escolhida;
c) a variável em estudo e classi� que-a.
1.5.3 Variável
• Variável é, convencionalmente, o conjunto de resultados possíveis de um fenômeno.
• Variável qualitativa: quando seus valores são expressos por atribu-tos: Exemplo: sexo, cor da pele, etc.
• Variável quantitativa: quando os dados são de caráter nitidamente quantitativo, e o conjunto dos resultados possui uma estrutura nu-mérica. Divide-se em:a) Variável discreta: seus valores são expressos geralmente por núme-
ros inteiros não negativos. Resulta normalmente de contagens. Exemplo:
a) número de computadores vendidos no mês (231);b) quantidade de placa mãe em estoque (346).
b) Variável contínua: resulta normalmente de uma mensuração, e a escala
numérica de seus possíveis valores corresponde ao conjunto R dos
números Reais, ou seja, pode assumir, teoricamente, qualquer valor
entre dois limites.
Exemplo:a) quando se mede a temperatura do corpo de alguém com um
termômetro de mercúrio, o que ocorre é o seguinte: o � lete de mercúrio, ao dilatar-se, passa por todas as temperaturas intermediárias até chegar à temperatura do corpo no mo-mento da medição (37,6oC).
b) diâmetro de um furo(23,456mm);c) peso de um objeto(12,2345kg).
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:15LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:15 21/12/2010 17:30:4821/12/2010 17:30:48
16
Curso de Licenciatura em Informática
Capítulo 1
ATIVIDADE 2:
1) Classi� que as variáveis abaixo em qualitativas ou quantitativas:
• cor dos olhos dos alunos;• índice de liquidez nas indústrias capixabas;.• produção de café no Brasil;• número de defeitos em aparelhos de TV;. • comprimento dos pregos produzidos por uma empresa; • pontuação obtida em cada jogada de um dado.
2) Para os seguintes valores, indique as variáveis discretas (D) e as contínuas (C):
(a) peso do conteúdo de um pacote de DVD virgem; (b) diâmetro de um CD; (c) número de artigos defeituosos produzidos; (d) número de indivíduos, em uma área geográ� ca, que recebem
seguro- desemprego; (e) número médio de clientes potenciais visitados por vendedores
de uma empresa durante o último mês; (f) temperatura interna de um computador; (g) número de unidades estocadas de um artigo; (h) razão entre o ativo circulante e o passivo exigível; (i) total de toneladas embarcadas; (j) quantidade embarcada de computadores;(k) volume de tráfego de um posto de pedágio; (l) número de comparecimento ao encontro anual de uma
companhia.
3) Em uma empresa de informática, a produção é medida de duas maneiras: por quantidade de itens vendidos ou por lucro obtido. Essas duas variáveis são:
a) ( ) ambas discretas.b) ( ) ambas continuas.c) ( ) contínua e discreta, respectivamente.d) ( ) discreta e continua, respectivamente.
1.6. Amostragem
O processo de escolha de uma amostra da população é denominado de amostragem.
Quando a amostra é tendenciosa, não podemos extrapolar os resultados
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:16LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:16 21/12/2010 17:30:4821/12/2010 17:30:48
17
Probabilidade e Estatística
Amostragem
obtidos para o universo da população. É o caso da amostragem por con-veniência, que ocorre quando a participação é voluntária ou os elemen-tos da amostra são escolhidos por uma questão de conveniência (mui-tas vezes, os amigos e os amigos dos amigos). Deste modo, o processo amostral não garante que a amostra seja representativa.
A melhor forma de conseguir este objetivo é obter uma amostra alea-tória de uma população bem de� nida. Existem técnicas de amostragem a que devemos recorrer para assegurar que a amostra forneça uma boa estimativa dos parâmetros populacionais.
Há vários métodos de amostragem: aleatória simples, (cada elemento da população tem igual probabilidade de ser escolhido para caracterizar a amostra); amostragem sistemática (depois de ordenada a população, seleciona-se a amostra probabilística);amostragem estrati� cada, etc.
1.6.1 Amostragem casual ou aleatória simples
A amostragem casual ou aleatória simples é o processo mais elementar e frequentemente utilizado na coleta de dados. Todos os elementos da população têm que ter a mesma probabilidade de pertencerem à amos-tra. Equivale a um sorteio lotérico. Pode ser realizada numerando-se a população de 1 a n e sorteando-se, a seguir, por meio de um dispositivo aleatório qualquer, x números dessa sequência, os quais corresponderão aos elementos pertencentes à amostra.
Exemplo 1:
Vamos obter uma amostra, de 10%, representativa para a pesquisa da estatura de 90 alunos de uma escola:1º passo – Numeramos os alunos de 1 a 90.2º passo – Escrevemos os números dos alunos, de 1 a 90, em pedaços iguais de
papel, colocamos em uma urna e, após mistura, retiramos, um a um, os nove
números que formarão a amostra.
Resultado obtido = { aluno 20, aluno 27, aluno 15, aluno 56, aluno 81, aluno 12, aluno 66, aluno 54, aluno 72).
Exemplo 2:
Uma cidade turística tem 30 hotéis de três estrelas. Pretende-se conhe-cer o custo médio da diária para apartamento de casal. Os valores popu-lacionais consistem nos seguintes preços diários: 125, 120, 135, 121, 122, 124, 125, 130, 138, 124, 120, 120, 125, 120, 119, 125, 123, 124, 128, 124, 124, 122, 128, 126, 123, 125, 122, 127, 125, 123.
Extraia uma amostra aleatória simples de tamanho 5 desta população
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:17LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:17 21/12/2010 17:30:4821/12/2010 17:30:48
18
Curso de Licenciatura em Informática
Capítulo 1
por sorteio.
R: Escrevemos os valores em papéis, então os colocamos em uma urna, misturamos e sorteamos a amostra de n = 5.
Resultado obtido: n = (120, 124, 122, 128, 123)
Obs.: Quando o número de elementos da amostra é muito grande, esse tipo de sorteio torna-se muito trabalhoso. Nesse caso, utiliza-se uma tabela de números aleatórios ou isso é feito por meio de so ware que gera esses números.
1.6.2 Amostragem sistemática
Amostra sistemática é constituída de elementos retirados da população, segundo um sistema preestabelecido.
É conveniente quando a população está naturalmente ordenada, como � chas em um � chário, listas telefônicas, etc.
Exemplo 1:
Suponha que uma empresa de telefonia � xa deseja saber o grau da sa-tisfação de seus usuários com os serviços prestados. O número de assi-nantes é da ordem de 50.000 e nós desejamos selecionar uma amostra aleatória de 1.000 assinantes com o intuito de obter a avaliação sobre os serviços.
Um modo alternativo de seleção é a seleção de 1 assinante a cada 50. O procedimento será selecionar aleatoriamente um assinante entre os pri-meiros 50, digamos que o vigésimo assinante(20) fosse selecionado. O próximo selecionado seria o de ordem 70 (20+50), o seguinte de ordem 120 (70+50) e assim por diante, ou seja: 20, 70, 120, 170, 220 ....... . Com esse método são economizados recursos físicos e � nanceiros.
A amostra sistemática é frequentemente utilizada em pesquisas nas quais o tamanho da população é grande ou que a pesquisa seja feita por pessoas que não estão familiarizadas com tabelas de números aleatórios ou com uso de so ware.
No caso da seleção de amostra aleatória simples de assinantes, seria ne-cessário que tivéssemos os assinantes numerados, sequencialmente, de 1 a 50.000 e seriam selecionados os 1.000 assinantes. A seleção poderia ser feita com o uso de uma tabela de números aleatórios ou de so ware
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:18LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:18 21/12/2010 17:30:4821/12/2010 17:30:48
19
Probabilidade e Estatística
Amostragem
que gerasse esses números.
Exemplo 2:
É dada uma população constituída pelas 12 primeiras letras do alfabe-to. Explique o que você faria para obter uma amostra sistemática de 3 elementos.
Resolução:
Dividindo 12 por 3 obtém-se 4. Sorteie então uma das quatro primeiras letras do alfabeto. Essa letra sorteada será a primeira da amostra. De-pois, a partir dessa letra, conte quatro e retire a quarta letra para a amos-tra. Repita o procedimento e retire mais uma letra de forma sucessiva.
Exemplo: Se a letra sorteada for B, então a amostra será C, G e K.
As amostras sistemáticas são suscetíveis a erros induzidos por perio-dicidade naturais da população, permitindo ao investigador prever e, possivelmente, manipular quem entrará na amostra.
1.6.3 Amostragem proporcional estratificada
Quando a população se divide em estratos (subpopulações), convém que o sorteio dos elementos da amostra os leve em consideração. Desse modo, obtemos os elementos da amostra proporcionalmente ao núme-ro de elementos desses estratos.
Exemplo:
Vamos obter uma amostra proporcional estrati� cada, de 10%, do exem-plo anterior, supondo que, dos 90 alunos, 54 sejam meninos e 36 sejam meninas. São, portanto, dois estratos (sexo masculino e sexo feminino). Logo, temos:
SEXO POPULACÃO 10 % AMOSTRAMASC. 54 5,4 5FEMIN. 36 3,6 4
Total 90 9,0 9
Numeramos, então, os alunos de 01 a 90 (de 01 a 54 para os meninos e de 55 a 90 para as meninas) e procedemos ao sorteio.
Tabela 1.1 Amostra proporcional estrati�cada
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:19LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:19 21/12/2010 17:30:4821/12/2010 17:30:48
20
Curso de Licenciatura em Informática
Capítulo 1
Exemplo:
Em determinada região, a população com cursos superiores é composta por 40% de homens e 60% de mulheres. Deseja-se fazer uma pesquisa com 50 pessoas com cursos superiores.
Neste caso, seleciona, os dois grupos (homens e mulheres) e sorteiam-se 20 homens e 30 mulheres.
Homens = 40% de 50 = 20;Mulheres = 60% de 50 = 30.
Na realidade, a amostragem proporcional estrati� cada leva em consideração as diferenças que há dentro de uma população e é mais democrática.
Riscos da amostragem.
O processo de amostragem envolve riscos, pois toma-se decisões so-bre toda a população com base em apenas uma parte dela. A teoria da probabilidade, que veremos neste curso, pode ser utilizada para fornecer uma idéia do risco envolvido, ou seja, do erro cometido ao utilizar uma amostra ao invés de toda a população.
ATIVIDADE 3:
1) Imagine que você tem 500 cadastros arquivados em sua empre-sa, dos quais você quer uma amostra de 2%. Como você procede-ria para obter uma amostra sistemática e uma amostra aleatória?
2) Uma população se encontra dividida em quatro estratos, com tamanhos N1 = 90, N2 = 120, N3 = 60 e N4 = 480. Ao se realizar uma amostra, doze elementos da amostra foram retirados do pri-meiro estrato. Qual o número de elementos de cada estrato?
3) Com o objetivo de fazer testes de qualidade com determinados produtos de uma empresa de informática, optou-se por realizar um levantamento por amostragem. A população é constituída por:
Produto A: A1, A2, A3, A4, A5, A6, A7, A8, A9, A10;
Produto B: B1, B2, B3, B4, B5, B6, B7, B8, B9, B10;
Produto C: C1, C2, C3, C4, C5, C6, C7, C8, C9, C10, C11, C12, C13, C14,C15,C16, C17, C18, C19, C20, C21, C22, C23, C24, C25, C26, C27, C28, C29, C30.
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:20LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:20 21/12/2010 17:30:4821/12/2010 17:30:48
21
Probabilidade e Estatística
Amostragem
Como você faria para obter uma amostra global, de tamanho 10?
4) Uma escola possui 120 alunos, sendo 32 na quinta série, 24 na sexta série, 26 na sétima série e 38 na oitava série. Em uma amos-tra de 15 alunos, quantos de cada série farão parte dessa amostra, nessa mesma ordem de séries?
a) 4, 2, 3 e 6 alunosb) 4, 3, 4 e 4 alunosc) 5, 2, 3 e 5 alunosd) 4, 3, 3 e 5 alunos
______________________________________________________________________________________________________
______________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:21LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:21 21/12/2010 17:30:4821/12/2010 17:30:48
22
Curso de Licenciatura em Informática
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:22LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:22 21/12/2010 17:30:4821/12/2010 17:30:48
SÉRIES E CONSTRUÇÃO DE GRÁFICOS
Olá, Aluno(a)!
Neste capítulo, estudaremos séries e construção de grá� cos. As ta-belas, os grá� cos e as � guras são elementos grá� cos que apresen-tam dados ou informações com a � nalidade de facilitar sua leitura e compreensão.
Bons estudos!
Prof. Sebastião A. Carneiro
2.1 Série estatística
Qualquer tabela que apresente a distribuição de um conjunto de dados estatísticos em função da época, do local ou da espécie é uma série estatística.
Os trabalhos técnico-cientí� cos utilizam-se, em geral, de tabe-las estatísticas para apresentar dados. Elas podem ser de� nidas como conjuntos de dados estatísticos associados a um fenômeno, dispostos numa determinada ordem de classi� cação. Expressam, pois, as variações qualitativas e quantitativas de um fenômeno.
TABELA é um quadro que resume um conjunto de dados dispos-tos em linhas e colunas de maneira sistemática.
De acordo com a Resolução 886, do IBGE, nas casas ou células da tabela, devem-se inserir:
• um traço horizontal (-) quando o valor é zero;
• três pontos (...), quando não se têm os dados;
• zero (0),quando o valor é muito pequeno para ser expresso pela unidade utilizada;
• um ponto de interrogação (?),quando há dúvidas quanto à exatidão de determinado valor.
Obs.: o lado direito e o esquerdo de uma tabela o� cial devem ser abertos.
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:23LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:23 21/12/2010 17:30:4821/12/2010 17:30:48
24
Curso de Licenciatura em Informática
Capítulo 2
2.1.1 Série temporal
Também chamada de histórica ou evolutiva, a série temporal identi� ca-se pelo caráter variável do fator cronológico (tempo). O local e a espécie (fenômeno) são elementos � xos.
Exemplo:
Ano Evolução das reservas brasileiras (em bilhões de dólares)
2000 322001 362002 372003 492004 522005 532006 852007 1802008 190
Fonte: Revista Veja - edição 2050
Observar que a Evolução das reservas brasileiras (em bilhões de dóla-res) variou com o tempo (de 2000 a 2008).
2.1.2 Série geográfica
Também chamada de espacial, territorial ou de localização, a série geo-grá� ca apresenta como elemento variável o fator geográ� co. A época e o fato (espécie) são elementos � xos.
Exemplo:
FILIAIS COMPUTADORESSão Paulo VENDIDOS
Rio de Janeiro 12.645Minas Gerais 15.765Espírito Santo 13.410
TOTAL 8.546
Tabela 2.1 Evolução das reservas brasileiras
Tabela 2.2 Vendas em 2007 da empresa ABC Informática Ltda.
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:24LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:24 21/12/2010 17:30:4821/12/2010 17:30:48
25
Probabilidade e Estatística
Séries e Construção de Gráficos
Observar como as vendas de computadores da empresa ABC Infor-mática Ltda. variaram em 2007 nos estados da região Sudeste; ou seja, houve variação geográ� ca.
2.1.3 Série específica
Também chamada de categórica, a série especí� ca tem como caráter va-riável apenas o fato ou espécie.
Exemplo:
Setores Vendas (milhões de dólares) Comunicação 56.927,70
Hardware 20.488,20 Serviços de So ware 7.300,40
Serviços 5.603,50 So ware 2.419,10
Distribuição 1.380,40 Internet 657,40
Fonte: Info Exame – ago. 2007.
Observar que houve variação por setores de empresas de tecnologia do Brasil e não há informação quanto à variação no tempo ou por região.De uma forma geral, se a série simples não for temporal ou geográ� ca, você pode considerá-la especí� ca.
2.1.4 Séries conjugadas
Também chamadas de tabelas de dupla entrada, as séries conjugadas são apropriadas à apresentação de duas ou mais séries de maneira conjuga-da, com duas ordens de classi� cação: uma horizontal e outra vertical. O exemplo abaixo é o de uma série geográfi co-temporal.
Exemplo:
FILIAIS Janeiro Fevereiro Março Abril Maio JunhoSão Paulo 1200 1280 1360 1440 1520 1600Rio de Janeiro 1350 1390 1430 1470 1510 1550Minas Gerais 1410 1670 1930 2190 2450 2710Espírito Santo 1046 1099 1152 1205 1258 1311TOTAL 5006 5439 5872 6305 6738 7171
Tabela 2.3 Vendas por setor em 2006 das 200 maiores empresas de tecnologia do Brasil.
Tabela 2.4 Vendas no 1º bimestre de 2007 da empresa ABC Informática Ltda.
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:25LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:25 21/12/2010 17:30:4821/12/2010 17:30:48
26
Curso de Licenciatura em Informática
Capítulo 2
Observar que as vendas de computadores variam nos estados da região Sudeste, de janeiro a junho de 2007, caracterizando, assim, a série con-jugada geográ� co-temporal.
ATIVIDADE 1:
1) Que tipo de série está representado nesta tabela?
TERMINAIS TELEFÔNICOS EM SERVIÇO 1992-1993
REGIÕES 1992 Fevereiro 1993Norte 375.658 1280 403.494Nordeste 1.379.101 1390 1.486.649Sudeste 6.729.467 1670 7.231.634Sul 1.608.989 1099 1.746.232Centro-oeste 778.925 5439 884.822
Fonte: Ministério das Comunicações.
2) Qual a origem dos dados para a elaboração da tabela?
3) Procure identi� car em jornais ou em revistas exemplos das séries apresentadas.
2.2 Gráficos estatísticosg
Grá� cos estatísticos são representações visuais dos dados estatísti-cos. Não substituem as tabelas estatísticas apenas fornecem uma representação mais imediata dos dados.
Os grá� cos estatísticos têm como características a simplicidade, a clare-za e a veracidade. Fazem uso de escalas e do sistema de coordenadas e possibilitam uma compreensão mais imediata dos dados.
Veremos a seguir os tipos de grá� cos mais utilizados
2.2.1 Diagramas
Diagramas são grá� cos geométricos dispostos em duas dimensões. São os mais usados na representação de séries estatísticas, por esse motivo não abordaremos os outros tipos de grá� cos. Os diagramas podem ser:
a) Gráfi cos Em Linhas Ou Lineares
Grá� cos em linhas ou lineares são os frequentemente usados para re-presentação de séries cronológicas com um grande número de perío-dos de tempo. As linhas são mais e� cientes do que as colunas quando
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:26LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:26 21/12/2010 17:30:4821/12/2010 17:30:48
27
Probabilidade e Estatística
Séries e Construção de Gráficos
existem intensas � utuações nas séries ou quando há necessidade de se representarem várias séries em um mesmo grá� co.
Exemplo:
Ano Evolução das reservas brasileiras (em bilhões de dólares)
2000 322001 362002 372003 492004 522005 532006 852007 1802008 190
Fonte: Revista Veja - edição 2050
0
20
40
60
80
100
120
140
160
180
200
1998 2000 2002 2004 2006 2008 2010
Figura 1: Grá�co Evolução das reservas brasileiras
Observe que as reservas brasileiras dispararam depois de 2005. O grá� co retrata isso mais facilmente!
b) Gráfi cos em Barras horizontais
Quando as legendas não são breves, usam-se de preferência, os grá� cos em barras horizontais. Neles, os retângulos têm a mesma altura e as ba-ses são proporcionais aos respectivos dados.
Exemplo :
Tabela 2.5 Evolução das reservas
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:27LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:27 21/12/2010 17:30:4821/12/2010 17:30:48
28
Curso de Licenciatura em Informática
Capítulo 2
Empresas FuncionáriosATENTO BRASIL (Serviços) 54.415CONTAX (Serviços) 49.397DEDIC (Serviços) 14.903EMBRATEL (Comunicação) 14.268TELEFUTURA (Serviços) 11.174CSU CARDSYSTEM (Serviços) 10.153TIM (Comunicação) 9.972SERPRO (Serviços de So ware) 9.960CTBC (Comunicação) 8.734EDS (Serviços) 8.239Fonte: Info Exame, ago. 2007
ATENTO BRASIL (Serviços)
0 10.000 20.000 30.000 40.000 50.000 60.000
CONTAX (Serviços)
DEDIC (Serviços)
EMBRATEL (Comunicação)
TELEFUTURA (Serviços)
CSU CARDSYSTEM (Seviços)
TIM (Comunicação)
SERPRO (Serviços de Software)
CTBC (Counicação)
EDS (Serviços)
Figura 2 - Grá�co Empresas com maior número de funcionários entre as maiores empresas de tecnologia do Brasil.
ATIVIDADE 2: Reproduza os dois tipos de grá� cos anteriores usando uma planilha eletrônica, buscando novos dados em jor-nais ou em revistas, e, a seguir, compare os resultados: lembre-se de que o resultado deverá ser o mesmo.
c) Gráfi cos em barras verticais (colunas)
Quando as legendas não são breves, usam-se, de preferência, os grá� cos em barras verticais. Nesses grá� cos, os retângulos têm a mesma base e as alturas são proporcionais aos respectivos dados.
Exemplo:
A tabela a seguir mostra alguns resultados das empresas com maior crescimen-to de vendas - em % - entre as 200 maiores empresas de tecnologia do Brasil.
Tabela 2.6 Empresas com maior número de funcionários entre as maiores empresas de tecnologia do Brasil
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:28LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:28 21/12/2010 17:30:4921/12/2010 17:30:49
29
Probabilidade e Estatística
Séries e Construção de Gráficos
Empresas Vendas (%)VIATELECOM (Comunicação) 181,80NEXTSYS (So ware) 156,90PROVIDER (Serviços) 85,30TEELAP (Distribuição) 84,10POSITIVO (Hardware) 77,60HOLDI TI (Serviços) 74,40SYNTAX (Hardware) 71,10TIVIT (Serviços) 70,90NEXTEL (Comunicação) 67,10WITTEL (So ware) 65,00Fonte: Info Exame, ago. 2007.
Figura 3: Gráfico Empresas com maior crescimento de vendas entre as 200 maiores
empresas de tecnologia do Brasil.
d) Gráfi cos em colunas superpostas
Os grá� cos em colunas superpostas diferem dos grá� cos em barras ou colunas convencionais apenas pelo fato de apresentarem cada barra ou coluna segmentada em partes por componentes. Servem para represen-tar comparativamente dois ou mais atributos.
Exemplo:
Construção de um diagrama em colunas superpostas que retrate os lucros retidos e os dividendos da Empresa de Aço Steel Corporation , 1969-74, em milhões de dólares.
Tabela 2.7 Empresas com maior crescimento de vendas entre as 200 maiores empre-sas de tecnologia do Brasil.
0,00
20,00
40,00
60,00
80,00
100,00
120,00
140,00
160,00
180,00
200,00
VIATELECOM NEXTSYS
(Comunicação) (Serviços de
PROVIDER TEELAP POSITIVO HOLDI TI SYNTAX TIVIT (Serviços) NEXTEL WITTEL (Serviços
(Serviços) (Distribuição) (Hardware) (Serviços) (Hardware) (Comunicação)
Software)
de Software)
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:29LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:29 21/12/2010 17:30:4921/12/2010 17:30:49
30
Curso de Licenciatura em Informática
Capítulo 2
Ano Lucros Dividendos Lucros Retidos1969 217 130 871970 148 130 181971 154 98 561972 157 87 701973 326 87 2391974 635 119 516
Fonte: Fictícia
Figura 4: Grá�co lucros retidos e os dividendos da Steel Corporation, 1969-74.
ATIVIDADE 2.3
Reproduza os dois tipos de grá� cos anteriores, usando uma plani-lha eletrônica, buscando também novos dados em jornais ou em revistas. A seguir, compare os resultados; lembrando-se de que este deverá ser o mesmo.
e) Gráfi cos em Setores (pizza)
Os grá� cos em setores são construídos com base em um círculo e são empregados sempre que desejamos ressaltar a participação do dado no total. O total é representado pelo círculo, que � ca dividido em tantos setores quantas são as partes. Os setores são tais que suas áreas são res-pectivamente proporcionais aos dados da série. O grá� co em setores só deve ser empregado quando há, no máximo, sete dados para não sobre-carregar sua partição.
Exemplo:
Tabela 2.8 lucros retidos e os dividendos da Steel Corporation, 1969-74.
0
100
200
300
400
500
600
700
1969 1970 1971 1972 1973 1974
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:30LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:30 21/12/2010 17:30:4921/12/2010 17:30:49
31
Probabilidade e Estatística
Séries e Construção de Gráficos
Construção de um diagrama em setores que retrate a participação no mercado mundial das empresas de smartphones.
Empresas Participação no mercado mundial (%)
Symbian 71,7Linux 14,3Windows Mobile 6,9Blackberry 4,7Palm OS 2,3Outros 0,1Fonte: Info Exame, ago. 2007
Figura 5: Grá�co Participação no mercado mundial dos fabricantes de smartphones.
Observe que, atualmente, a empresa Symbian domina o mercado de smartphones!
f ) Gráfi co Polar (RADAR)
O grá� co polar é o ideal para representar séries temporais cíclicas, isto é, séries ideais que apresentem em seu desenvolvimento determinada periodicidade, como a ocorrência de chuvas no ano numa determinada região, a variação da temperatura ao longo do dia, a venda de monitores da � lial 1 durante a semana, o consumo de energia elétrica durante o mês ou ano, o número de passageiros de uma linha de ônibus ao longo da semana, etc.
O grá� co polar faz uso do sistema de coordenadas polares.
Exemplo:
Tabela 2.9 Participação no mercado mundial dos fabricantes de smartphones.
Symbian71,7%
Linux14,3%
Windows Mobile6,9%
Blackberry4,7% Outros
0,1%
Palm OS2,3%
Symbian
Linux
Windows Mobile
Blackberry
Palm OS
Outros
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:31LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:31 21/12/2010 17:30:4921/12/2010 17:30:49
32
Curso de Licenciatura em Informática
Capítulo 2
Dada a série: número de ocorrências de manutenção efetuadas nos com-putadores da companhia InfoWay em 2007.
MESES OCORRÊNCIASJaneiro 148Fevereiro 164Março 152Abril 188Maio 160Junho 176Julho 164Agosto 184Setembro 164Outubro 219Novembro 211Dezembro 140FONTE: Sindan.
1. traçamos uma circunferência de raio arbitrário (em particular, da-mos preferência ao raio de comprimento proporcional à média dos valores da série);
6. construímos uma semi-reta (de preferência, na horizontal) partindo de O (polo) e com uma escala (eixo polar);
7. dividimos a circunferência em tantos arcos quantas forem as unida-des temporais;
8. traçamos, a partir do centro O (polo), semirreta passando pelos pontos de divisão;
9. marcamos os valores correspondentes das ocorrências de manuten-ção, iniciando pela semi-reta horizontal (eixo polar);
10. ligamos os pontos encontrados com segmentos de reta;
11. se pretendermos fechar a poligonal obtida, empregamos uma linha interrompida.
Tabela 2.10 Número de ocorrências de manutenção
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:32LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:32 21/12/2010 17:30:4921/12/2010 17:30:49
33
Probabilidade e Estatística
Séries e Construção de Gráficos
Figura 6: Grá�co número de ocorrências efetuadas nos computadores em 2007
Pelo grá� co, percebemos que os meses em que houve mais ocorrên-cias efetuadas nos computadores foram outubro e novembro; com essa informação, podemos nos planejar para esses meses, contratan-do mais funcionários, etc. Observe quanto uma informação como essa é importante em sua vida pro� ssional!
Exemplo 2:
Comparar os itens mais vendidos de uma empresa de informática, por meio de grá� co polar, nos meses de janeiro e fevereiro de 2010.
Itens mais Vendidos Janeiro FevereiroPlacas-mãe 280 250Teclados 350 400Mouses 400 320Impressoras 180 220Fontes 203 150Gabinetes 281 260Processadores 98 130
Tabela 2.11 Itens mais vendidos de uma empresa de informática.
Janeiro
Fevereiro
Março
Abril
Maio
Junho
Julho
Agosto
Setembro
Outubro
Novembro
Dezembro300
200
100
0
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:33LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:33 21/12/2010 17:30:4921/12/2010 17:30:49
34
Curso de Licenciatura em Informática
Figura 7 – Gráfico itens mais vendidos de uma empresa de informática____ Vendas em janeiro - - - - Vendas em fevereiro
Análise:
Observando o grá� co polar, veri� camos que houve queda de vendas em Placas-mãe, mouses, fontes e gabinetes, enquanto as vendas aumen-taram para teclados, impressoras e processadores.
2.3 Uso indevido de gráficos
Muitas vezes, o uso indevido dos grá� cos pode trazer uma interpretação falsa dos dados que estão sendo analisados, chegando mesmo a con-fundir o leitor. Vejamos, através de um exemplo, como esse fato pode ocorrer. Os dois grá� cos apresentados a seguir representam os mesmos dados, e a primeira impressão é a de que os dois representam dados nitidamente diferentes.
No grá� co (a), as � utuações das vendas aparecem nitidamente, já no grá� co(b), tem-se a impressão de que a � utuação das vendas não mani-festa praticamente tendência alguma, exceto leve � utuação.
Trata-se, na realidade, de um problema de construção de escalas. En-quanto o grá� co(a) apresenta-se com uma escala mais ou menos con-vencional, o grá� co(b) revela proporções consideravelmente diferentes para as escalas em que foram divididos os dois eixos.
Capítulo 2
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:34LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:34 21/12/2010 17:30:5021/12/2010 17:30:50
35
Probabilidade e Estatística
Séries e Construção de Gráficos
Vendas de computadores no ano de 2009 da empresa ABC informática.
Figura 8 – Grá�co A – Visão real dos dados
0
1000
2000
3000
4000
Jan Fev Mar Abr Mai Jun Jul Ago Set Out Nov Dez
Figura 9 – Grá�co B - Visão distorcida dos dados
Veja os dados reais de vendas de computadores no ano de 2009 da em-presa ABC informática:
Mês VendasJan 2401Fev 2520Mar 1900Abr 2610Mai 1940Jun 2750Jul 2200
Ago 2970Set 2980Out 3180Nov 3420Dez 3800
Tabela 2.12 Vendas de computadores no ano de 2009 da empresa ABC informática
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:35LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:35 21/12/2010 17:30:5021/12/2010 17:30:50
36
Curso de Licenciatura em Informática
ATIVIDADE 2.4
1) Reproduza os grá� cos anteriores, manualmente e usando uma planilha eletrônica, buscando novos dados em jornais ou em re-vistas, e, a seguir, compare os resultados; lembrando-se de que o resultado deverá ser o mesmo.
2) Monte um grá� co do tipo barras verticais das empresas que apresentaram maior lucro, em milhões de reais, entre as empresas de tecnologia:
Empresas Lucro (em Milhões de Reais)Empresa 1 150,50Empresa 2 95,70Empresa 3 47,30Empresa 4 42,90Empresa 5 37,50Empresa 6 33,60Empresa 7 27,30Empresa 8 19,10Empresa 9 9,30Empresa 10 7,90
3) Numa empresa de manutenção em informática, 60% dos fun-cionários vão fazer manutenção em monitores, 24 % em mouses e teclados, 8% em fontes e 8% nas demais peças do computador. O grá� co que melhor representa essa situação é o de:
e) ( ) Linha
f) ( ) Barras
g) ( ) Setores
h) ( ) Colunas superpostas
Chegamos ao � nal de mais um capítulo; nele, vimos as diversas for-mas de organizar e analisar os dados de uma série de observações, as tabelas de frequências e os métodos grá� cos. É importante que esses conceitos estejam bem compreendidos; caso contrário, faça uma revisão, pois eles serão necessários nos próximos capítulos.
Vamos para o capítulo 3!
Capítulo 2
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:36LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:36 21/12/2010 17:30:5021/12/2010 17:30:50
MÉTODOS GRÁFICOS
Olá, Aluno (a)!
Neste capítulo, estudaremos métodos grá� cos, que são os histogra-mas que servirão de base para a compreensão dos capítulos seguin-tes. Entender esse conteúdo, então, é de fundamental importância, pois a análise grá� ca em estatística é feita com base nele.
Bons estudos!
Prof. Sebastião A. Carneiro
3.1 Distribuição de frequência
Distribuição de frequência é um tipo de tabela que condensa uma cole-ção de dados conforme as frequências (repetições de seus valores).
Distribuição de frequências é uma técnica para apresentar uma coleção de objetos classi� cados de modo a mostrar a quantida-de existente em cada classe. Será muito utilizada em frequências de probabilidades. Resumidamente, signi� ca agrupar os dados repetidos.
Olá, Turma!
Acompanhe atentamente os passos seguintes, pois vamos usar um exemplo para deixar bem clara cada etapa.
Prof. Sebastião A. Carneiro
3.1.1 Tabela primitiva ou tabela de dados brutos
É a tabela inicial de coleta de dados, os elementos não são numerica-mente organizados. É difícil formar uma ideia exata do comportamento da pesquisa efetuada.
Exemplo:
Foram tomados os preços de 20 monitores de 15 polegadas, LCD, em 20 empresas de informática.
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:37LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:37 21/12/2010 17:30:5021/12/2010 17:30:50
38
Curso de Licenciatura em Informática
Capítulo 3
Figura 10: Monitores LCD
Empresas Valor do monitorEmpresa 1 R$ 418,0Empresa 2 R$ 420,0Empresa 3 R$ 418,0Empresa 4 R$ 410,0Empresa 5 R$ 413,0Empresa 6 R$ 430,0Empresa 7 R$ 420,0Empresa 8 R$ 430,0Empresa 9 R$ 416,0Empresa 10 R$ 418,0Empresa 11 R$ 418,0Empresa 12 R$ 420,0Empresa 13 R$ 417,0Empresa 14 R$ 418,0Empresa 15 R$ 420,0Empresa 16 R$ 430,0Empresa 17 R$ 418,0Empresa 18 R$ 430,0Empresa 19 R$ 415,0Empresa 20 R$ 418,0
Como podemos ver, não é possível identi� car, de imediato, quem tem o menor ou o maior preço.
Tabela 3.1 Preços de 20 monitores LCD
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:38LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:38 21/12/2010 17:30:5021/12/2010 17:30:50
39
Probabilidade e Estatística
Métodos Gráficos
3.1.2 ROL
É a tabela obtida após a ordenação dos dados (crescente ou decrescente).
Vamos continuar utilizando o exemplo anterior para construir nos-sa tabela ROL.
Exemplo
Empresas Valor do monitorEmpresa 4 R$ 410,0Empresa 5 R$ 413,0Empresa 19 R$ 415,0Empresa 9 R$ 416,0Empresa 13 R$ 417,0Empresa 1 R$ 418,0Empresa 3 R$ 418,0Empresa 10 R$ 418,0Empresa 11 R$ 418,0Empresa 14 R$ 418,0Empresa 17 R$ 418,0Empresa 20 R$ 418,0Empresa 2 R$ 420,0Empresa 7 R$ 420,0Empresa 12 R$ 420,0Empresa 15 R$ 420,0Empresa 6 R$ 430,0Empresa 8 R$ 430,0Empresa 16 R$ 430,0Empresa 18 R$ 430,0
Observou!? Agora temos, de imediato, a empresa que vende mais barato, a que vende mais caro...
3.1.3 Distribuição de frequência sem intervalos de classe
A distribuição de frequência sem intervalos de classe é a simples con-densação dos dados, conforme as repetições de seus valores; ou seja, é a ocorrência que o valor repete. É usada para diminuir o tamanho da série.
Tabela 3.2 Ordenação dos preços dos monitores
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:39LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:39 21/12/2010 17:30:5121/12/2010 17:30:51
40
Curso de Licenciatura em Informática
Capítulo 3
Exemplo:
Vamos continuar utilizando o exemplo anterior para construir a distri-buição de frequência sem intervalos de classe.
Valor do monitor Número de empresas com o mesmo preço
R$ 410,0 1R$ 413,0 1R$ 415,0 1R$ 416,0 1R$ 417,0 1R$ 418,0 7R$ 420,0 4R$ 430,0 2
Total 20
Notou!? O tamanho da tabela foi reduzido; as informações continu-aram as mesmas.
a) Diagrama de uma distribuição de frequência
Uma distribuição de frequência sem intervalos de classe é representada gra� camente por um diagrama, em que cada valor da variável é repre-sentado por um segmento de reta vertical e de comprimento proporcio-nal à respectiva frequência.
0
1
2
3
4
5
6
7
8
R$ 405,0 R$ 410,0 R$ 415,0 R$ 420,0 R$ 425,0 R$ 430,0 R$ 435,0
Valor do monitor
Nú
mero
de e
mp
resas
Figura 11: Diagrama de uma distribuição de frequência.
Tabela 3.3 Valor do monitor e número de empresas com o mesmo preço
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:40LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:40 21/12/2010 17:30:5121/12/2010 17:30:51
41
Probabilidade e Estatística
Métodos Gráficos
A partir de agora, chamaremos o número de repetições de “frequên-cia de ocorrência” ou simplesmente de “frequência”.
Número de repetições = frequência de ocorrência = frequência.
3.1.4 Distribuição de frequência com intervalos de classe
Quando a amostra é grande, a tabela também tende a ser grande; nesse caso, é mais racional efetuar o grupamento dos valores em vários inter-valos de classe.
Exemplo:
Ao acaso, foram pesquisados os preços de 200 monitores LCD, de um mesmo modelo, em 200 empresas de informática. Veja os valores no anexo da apostila e observe que, após o ordenamento dos preços em ordem crescente (ROL), o valor mínimo encontrado é R$ 412,0 e o va-lor máximo é R$ 440,0. Com os preços ordenados, montamos a tabela a seguir:
Valor do monitor(R$)
Frequências
412 |------- 415 10415 |------- 418 15418 |------- 421 20421 |------- 424 25424 |------- 427 30427 |------- 430 30430 |------- 433 28433 |------- 436 22436 |------- 439 12439 |------- 442* 8 Total 200
*Se você está com dúvida sobre o modo como a tabela foi monta-da, não se preocupe, pois o objetivo deste capítulo é exatamente esse. Fique atento e não perca os próximos passos da matéria.A partir de agora, iremos chamar a primeira coluna de “classe”.
Tabela 3.4 Preços de 200 monitores LCD em 200 empresas de informática
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:41LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:41 21/12/2010 17:30:5121/12/2010 17:30:51
42
Curso de Licenciatura em Informática
Capítulo 3
a) Elementos de uma distribuição de frequência com intervalos de classe
Antes de iniciarmos a construção de uma distribuição de frequência com intervalos de classe, vamos ver alguns conceitos importantes.
a) Classe
Classe é o intervalo de variação da variável, simbolizada por i. O núme-ro total de classes é simbolizado por k.
Exemplo: Na tabela anterior, temos: k=10 e para 415 |------- 418 a classe é 2 (i =2).
b) Limites de classe:
São os extremos de cada classe. O menor número é o limite inferior de classe (li) e o maior número é o limite superior de classe (Li).
Exemplo: Em 427 |------- 430 Limite inferior l6= 427 e limite superior L6= 430
O símbolo |------ representa um intervalo fechado à esquerda e aberto à direita. O dado 427 do ROL, não pertence à classe 5, e sim, classe 6, representada por 427 |----- 430.
c) Amplitude de intervalo de classe
É a diferença entre o limite superior e o inferior da classe. É simbolizada por hi = Li - li.
Exemplo: Na tabela anterior, hi= 427 – 424 = 3.
Obs.: Na distribuição de frequência com classe, o hi será igual em todas as classes.
d) Amplitude total da distribuição
É a diferença entre o limite superior da última classe e o limite inferior da primeira classe.
AT = L(max) - l(min).
Exemplo: Na tabela anterior, AT = 442 - 412= 30.
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:42LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:42 21/12/2010 17:30:5121/12/2010 17:30:51
43
Probabilidade e Estatística
Métodos Gráficos
e) Amplitude total da amostra
É a diferença entre o valor máximo e o valor mínimo da amostra.
Em que:AA = Xmax - Xmin. Xmax = 440 (máximo valor real encontrado do monitor)Xmin = 412 (mínimo valor real encontrado do monitor)Em nosso exemplo, AA = 440 - 412 = 28.
Observe que: AT sempre será maior que AA. Você tem que estar con-vencido dessa a� rmação.
f) Ponto médio de classe:
É o ponto que divide o intervalo de classe em duas partes iguais.
Exemplo:Em 418 |------- 421 o ponto médio x3 = (418+421)/2 = 419,5, ou seja, x3=(l3+L3)/2.
Veja como � ca a distribuição de frequência de preços de 200 monitores anterior:
Classes Frequênciasi=1 (Primeira Classe) 412 |------- 415 10i=2 (Primeira Classe) 415 |------- 418 15i=3 (Primeira Classe) 418 |------- 421 20i=4 (Primeira Classe) 421 |------- 424 25i=5 (Primeira Classe) 424 |------- 427 30i=6 (Primeira Classe) 427 |------- 430 30i=7 (Primeira Classe) 430 |------- 433 28i=8 (Primeira Classe) 433 |------- 436 22i=9 (Primeira Classe) 436 |------- 439 12
i=10 (Primeira Classe) 439 |------- 442* 8Total 200
Tabela 3.5 Classe Frequência de preços de 200 monitores
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:43LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:43 21/12/2010 17:30:5121/12/2010 17:30:51
44
Curso de Licenciatura em Informática
Capítulo 3
ATIVIDADE 3.3
1) Determine a amplitude da amostra -1, -2 , 3, 4, 5.
2) Dada a distribuição de frequência a seguir, que representa os diâmetro de furos encontrados em gabinetes de computadores:
Diâmetros de Furos (mm)
Computa-dores
10 |------- 13 513|------- 16 1516|------- 19 2519|------- 22 3522|------- 25 4525|------- 28 3028|------- 31 2831|------- 34 2234|------- 37 1237|------- 40 8
Total 225
Determine:
a) o limite superior da sexta classe;b) o limite inferior da segunda classe;c) a Amplitude total da distribuição;d) o Ponto médio da quinta classe;e) o intervalo de classe;f) quantos computadores apresentaram diâmetros de furos
entre 28 a 31 mm;g) quantos computadores apresentaram diâmetros de furos
superiores a 22 mm;h) percentualmente, quantos computadores apresentaram
diâmetros de furos entre 16 e 28 mm.
b) Método prático para construção de uma distribuição de frequência
Vamos mostrar um método prático para construção de uma dis-
tribuição de frequência.
Depois de feita a pesquisa de campo, siga os seguintes passos:
(Vamos utilizar o exemplo dos preços de 200 monitores LCD levantados em 200 empresas de informática).
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:44LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:44 21/12/2010 17:30:5121/12/2010 17:30:51
45
Probabilidade e Estatística
Métodos Gráficos
1º - Organize os dados brutos em um ROL;2º - Calcule a amplitude amostral AA;
No nosso exemplo: AA =440 - 412 =28.
3º - Calcule o número de classes por meio da “Regra de Sturges”;
A Regra de Sturges é uma fórmula que compacta os dados e esta-belecerá o número de classes que a distribuição de frequência terá. Ela é dada conforme a fórmula seguir:
i =1 + 3,3 . log n
Em que:
i = número de classes (valor inteiro mais próximo);
n = número de amostra da nossa pesquisa.
Obs.: Qualquer regra para determinação do número de classes da distribuição de frequência (o número de linhas que terá a tabela) não nos leva a uma decisão � nal; isso pois esta vai depender de um julgamento pessoal, que deve estar ligado à natureza dos da-dos e à clareza que se deseja obter na distribuição de frequência.
Existem outras opções à regra de Sturges, como:1/2i = n
No caso do nosso exemplo dos 200 monitores:
n = 200 amostrasi =1 + 3,3 . log 200i = 8,6 , adotamos i = 9
Observe que, efetivamente no nosso exemplo, i = 10.
Veremos em breve o motivo.
4º - Calcule a amplitude do intervalo de classe h = AA/i.;
No nosso exemplo: AA/i = 28/9 = 3,11.
Obs.: Adotaremos neste caso h = 3 para termos intervalos de classe va-lores inteiros e assim obter uma melhor visualização na tabela.
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:45LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:45 21/12/2010 17:30:5221/12/2010 17:30:52
46
Curso de Licenciatura em Informática
Capítulo 3
5º - Monte a tabela da seguinte forma:
ℓi |------- Li= ℓi + h
Exemplo:
ℓ |------- L = ℓ + h1 1 1
412 |------- 415
Em que:
ℓ1 é o menor número inteiro da amostra.
Obs.: ℓ1 deve ser preferencialmente um valor inteiro menor ou igual a Xmin e
L1 deve ser preferencialmente um valor inteiro maior ou igual a ℓ + h.1
No nosso exemplo: o menor número da amostra é 412. Assim, teremos: L1= ℓ + 1 h = 412+3 = 415, logo, a primeira classe será representada por 412 |------- 415.
O primeiro elemento das classes seguintes sempre serão formados pelo último elemento da classe anterior.
Assim a segunda classe � ca:
ℓ = L e L = ( ℓ + h )2 1 2 2
ℓ |------- L = ( ℓ + h )2 2 2
ℓ = 415 e L = 415 + 3 = 4182 2
415 |------- 418 Observe que confere com a tabela 3.6.
As classes seguintes respeitarão o mesmo procedimento.
Ao � nal da montagem da tabela, percebemos que a última classe é 10 e não 9, conforme estabelecia a regra de sturges. Isso ocorre porque a regra de sturges fornece a orientação do número de classe, mas preferimos utilizar números inteiros nos limites inferiores e su-periores de classe para melhorar a apresentação da tabela, com isto, a classe passou de 9 para 10.
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:46LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:46 21/12/2010 17:30:5221/12/2010 17:30:52
47
Probabilidade e Estatística
Métodos Gráficos
c) Representação gráfi ca de uma distribuição
Em todos os grá� cos acima, utilizamos o primeiro quadrante do sistema de eixos coordenados cartesianos ortogonais. Na linha horizontal (eixo das abscissas), colocamos os valores da variável e, na linha vertical (eixo das ordenadas), as frequências.
Histograma: é formado por um conjunto de retângulos justapos-tos, cujas bases se localizam sobre o eixo horizontal, de tal modo que seus pontos médios coincidam com os pontos médios dos in-tervalos de classe. A área de um histograma é proporcional à soma das frequências simples ou absolutas.
Exemplo: Vamos montar o histograma da distribuição de frequência anterior:
Valor do monitor (R$)
Frequências
412|------- 415 10415|------- 418 15418|------- 421 20421|------- 424 25424|------- 427 30427|------- 430 30430|------- 433 28433|------- 436 22436|------- 439 12439|------- 442 8
Total 200
Histograma da distribuição de freqüência
30
25
20
15
10
5
0412 415 418 421 424 427 430 433 436 439 442
f
Tabela 3.6 Valores dos monitores
Figura 12: Histograma da distribuição de frequência
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:47LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:47 21/12/2010 17:30:5221/12/2010 17:30:52
48
Curso de Licenciatura em Informática
Capítulo 3
Quem estiver utilizando a planilha eletrônica Excel deve instalar esse recurso em Ferramentas/Suplementos/Ferramentas de Análi-se; caso contrário, pode-se utilizar as ferramentas de desenho dos aplicativos.
3.1.5 Polígono de frequência
É um grá� co em linha, sendo as frequências marcadas sobre perpendi-culares ao eixo horizontal, levantadas pelos pontos médios dos interva-los de classe. Fornece, na realidade, o contorno, ou seja, a envoltória, em vez de retângulos paralelos.
Exemplo de polígono de frequência:
30
25
20
15
10
5
0412 415 418 421 424 427 430 433 436 439 442
f
Figura 13: Exemplo de Polígono de frequência da distribuição de dados
a) Frequências simples ou absolutas
São os valores que realmente representam o número de dados de cada classe. A soma das frequências simples é igual ao número total dos da-dos da distribuição. Veja exemplo a seguir.
b) Frequências relativas
São os valores das razões entre as frequências absolutas de cada classe e a frequência total da distribuição. A soma das frequências relativas é igual a 1 (100 %).
Exemplo de frequências relativas fri (%)
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:48LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:48 21/12/2010 17:30:5221/12/2010 17:30:52
49
Probabilidade e Estatística
Métodos Gráficos
classe � fri (%)412|------- 415 10 5,0%415|------- 418 15 7,5%418|------- 421 20 10,0%421|------- 424 25 12,5%424|------- 427 30 15,0%427|------- 430 30 15,0%430|------- 433 28 14,0%433|------- 436 22 11,0%436|------- 439 12 6,0%439|------- 442 8 4,0%
Total 200 100%
c) Frequência simples acumulada de uma classe – Fi
É o total das frequências de todos os valores inferiores ao limite superior do intervalo de uma determinada classe.
classe � fri (%) Fi412|------- 415 10 5,0% 10415|------- 418 15 7,5% 25418|------- 421 20 10,0% 45421|------- 424 25 12,5% 70424|------- 427 30 15,0% 100427|------- 430 30 15,0% 130430|------- 433 28 14,0% 158433|------- 436 22 11,0% 180436|------- 439 12 6,0% 192439|------- 442 8 4,0% 200
Total 200 100%
d) Frequência relativa acumulada de uma classe – Fri
É a frequência acumulada da classe, dividida pela frequência total da distribuição.
Tabela 3.7 Exemplo de frequências relativas fri
Tabela 3.8 Exemplo de frequências relativas fri e acumulada Fri
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:49LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:49 21/12/2010 17:30:5321/12/2010 17:30:53
50
Curso de Licenciatura em Informática
classe � fri (%) Fi Fri (%)412|------- 415 10 5,0% 10 5,0%415|------- 418 15 7,5% 25 12,5%418|------- 421 20 10,0% 45 22,5% 421|------- 424 25 12,5% 70 35,0%424|------- 427 30 15,0% 100 50,0%427|------- 430 30 15,0% 130 65,0%430|------- 433 28 14,0% 158 79,0%433|------- 436 22 11,0% 180 90,0%436|------- 439 12 6,0% 192 96,0%439|------- 442 8 4,0% 200 100,0%
Total 200 1
Observar que temos o valor acumulativo em percentagens. Como exemplo, podemos ver da tabela anterior que o preço do monitor até R$ 436,00 está entre os 90% dos monitores pesquisados, ou seja, apenas 10% dos monitores custam mais do que R$ 436,00
3.1.6 Curva de frequência (curva polida):
Enquanto o polígono de frequência nos dá a imagem real do fenôme-no estudado, a curva de frequência nos dá a imagem tendencial; ou seja, mostra o comportamento dos dados segundo um grá� co de linha já estudado. O polimento, do ponto de vista geométrico, corresponde à eliminação dos vértices da linha poligonal de um polígono de frequên-cia. Para conseguir o polimento, vamos utilizar uma fórmula bastante simples, apresentada a seguir:
A fci (frequência calculada da classe ou frequência polida) é, na realidade, uma média ponderada das frequências em torno da fre-quência a ser polida.
Em que:
fci = frequência calculada da classe considerada (frequência polida).� = frequência simples da classe a ser polida.fant = frequência simples da classe anterior a ser polida.fpost = frequência simples da classe posterior a ser polida.
Capítulo 3
Tabela 3.9 Exemplo de frequências relativas fri e acumulada Fri
4
.2 fpostfifantfci
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:50LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:50 21/12/2010 17:30:5321/12/2010 17:30:53
51
Probabilidade e Estatística
Métodos Gráficos
30
25
20
15
10
5
0412 415 418 421 424 427 430 433 436 439 442
f
Figura 14 - Curva de Frequência ou Curva polida da distribuição de dados
ATIVIDADE 3.5
1) A tabela a seguir apresenta as velocidades dos Links de Inter-net de 400 computadores conectados a uma grande empresa.
KbytesQuantidade de com-putadores conectados
300|------- 400 14400|------- 500 46500|------- 600 58600|------- 700 76700|------- 800 68800|------- 900 62900|------- 1000 48
1000 |-------1100 221100 |-------1200 6439|------- 442 8
Total 200
Com relação a essa tabela, determine:
a) a frequência da quarta classe;b) a frequência relativa da sexta classe;c) a frequência acumulada da quinta classe;d) o número de computadores cuja velocidade do link não
atinge 700 kbites;e) o número de computadores cuja velocidade do link atinge e
ultrapassa 800 kbites;f) a percentagem de computadores cuja velocidade do link
não atinge 600 kbites;g) a percentagem de computadores cuja velocidade do link
seja maior ou igual a 900 kbites;h) a percentagem de computadores cuja velocidade do link
seja maior ou igual a 500 kbites e inferior a 1000 kbites;i) a classe dos 72º computadores mais rápidos no link.
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:51LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:51 21/12/2010 17:30:5321/12/2010 17:30:53
52
Curso de Licenciatura em Informática
Capítulo 3
2) Os dados a seguir, obtidos em uma pesquisa realizada no co-mércio local, apresentam as diferenças encontradas nos preços de 100 placas-mãe. Com base nisso:
a) forme com esses dados uma distribuição de frequência com intervalo de classe;
b) confeccione o histograma e o polígono de frequência correspondentes.
3,9 7,4 10.0 11,8 2,3 4,5 10,5 8,4 15,6 7,618,8 2,9 2,3 0,4 5 9 5,5 9,2 12,4 8,74,5 4,4 10,6 5,6 8,5 2,4 17,8 11,6 0,8 4,47,1 3.2 2,7 9,5 2,7 9,5 13,1 3,8 6,3 7,94,8 5,3 12,9 6,9 6,3 7,5 2,6 3,3 4,6 163,9 7,4 10.0 11,8 2,3 4,5 10,5 8,4 15,6 7,618,8 2,9 2,3 0,4 5 9 5,5 9,2 12,4 8,74,5 4,4 10,6 5,6 8,5 2,4 17,8 11,6 0,8 4,47,1 3.2 2,7 9,5 2,7 9,5 13,1 3,8 6,3 7,94,8 5,3 12,9 6,9 6,3 7,5 2,6 3,3 4,6 16
3) Examinando o histograma abaixo, que corresponde às notas re-lativas à aplicação de um teste de inteligência a um grupo de alu-nos do curso de análise e desenvolvimento de sistema, responda:
a) Qual é o intervalo de notas que apresentou maior frequência?b) Qual a amplitude total da distribuição?c) Qual o número total de alunos?d) Qual é a frequência do intervalo de classe 14 |– 15? e) Quantos alunos receberam notas entre 9 e 16?f) Quantos alunos receberam notas não-inferiores a 12?
25
20
15
10
5
1
4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:52LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:52 21/12/2010 17:30:5321/12/2010 17:30:53
53
Probabilidade e Estatística
Métodos Gráficos
Olá, Aluno(a)!
Chegamos ao � nal do terceiro capítulo, em que foram apresenta-das diversas formas de organizar e analisar os dados de uma série de observações, as tabelas de frequências e os métodos grá� cos. É importante que esses conteúdos estejam bem compreendidos; caso contrário, faça uma revisão, pois eles serão necessários nos próximos capítulos.
Sigamos adiante!
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:53LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:53 21/12/2010 17:30:5321/12/2010 17:30:53
54
Curso de Licenciatura em Informática
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:54LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:54 21/12/2010 17:30:5421/12/2010 17:30:54
MEDIDAS DE ORDENAMENTO E DE POSIÇÃO
Olá, Aluno(a)!
Neste capítulo, estudaremos as medidas de ordenamento e de po-sição, denominadas também de medidas de tendência central, tais como média, moda, mediana e separatrizes, as quais nos permitirão resumir e analisar uma série de dados.
Bons estudos!
Prof. Sebastião A. Carneiro
4.1 Medidas de posição
As mais importantes medidas de posição são as medidas de tendência central, pois se veri� ca uma tendência dos dados observados a se agru-parem em torno dos valores centrais.
As medidas de tendência central mais utilizadas são: média aritmética, moda e mediana. Outras medidas de tendência central menos utiliza-das, que não estudaremos neste curso, são as médias: geométrica, har-mônica, quadrática, cúbica e bi quadrática.
Outras medidas de posição são as separatrizes, que englobam: a própria mediana, os decis, os quartis e os percentis.
4.2 Média de população e de amostras
Em estatística, o conceito de média também pode ser usado para descre-ver um conjunto de observações. Quando o conjunto das observações é uma população, é chamado de média da população e representaremos por µ. Quando o conjunto das observações é uma amostra estatística, é chamado de média amostral e representaremos por X . Na prática, ao lidar com grandes populações, é quase sempre impossível achar o va-lor exato da média da população, devido ao tempo, ao custo e a outras restrições de recursos. Por esse motivo, estudaremos somente a média amostral que será chamada de média, simplesmente.
—
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:55LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:55 21/12/2010 17:30:5421/12/2010 17:30:54
56
Curso de Licenciatura em Informática
Capítulo 4
4.3 Representação dos valores de uma série de valores
Os valores de uma série de valores serão representados por uma letra maiúscula, normalmente X, e a sua posição na série, por uma letra mi-núscula, normalmente i. A quantidade total de valores na série será re-presentada por n.
Na série X: 4, 8, 12, 20 e 50, temos: X1= 4; X2= 8; X3=12; X4=12; X5=50 e n=5.
Em um conjunto de dados, podemos def nir vários tipos de mé-
dias. Porém, em nossos estudos, vamos nos limitar ao mais im-
portante: a média aritmética.
4.4 Média aritmética ( x )
É igual ao quociente da soma dos valores do conjunto e o número total dos valores.
A média sempre será indicada por uma letra maiúscula com um traço superior.
Exemplo 1:Calcular a média dos valores anteriores:4, 8, 12, 20 e 50.
Exemplo 2:Calcular a média dos valores a seguir:2; - 4; 0; 11; 1; 20; 30.
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:56LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:56 21/12/2010 17:30:5421/12/2010 17:30:54
57
Probabilidade e Estatística
Medidas de Ordenamento e de Posição
4.4.1 Média Aritmética para dados não-agrupados:
Quando desejamos conhecer a média dos dados não-agrupados em ta-belas de frequências, determinamos a média aritmética simples, con-forme já visto no item anterior.
Exemplo:
A venda diária de memória RAM 1 GB , durante uma semana, foi de 100, 140, 130, 150, 160, 180 e 120 unidades; então, a venda média diária de memória RAM foi:
Figura 15: Memória RAM
X = (100 + 140 + 130 + 150 + 160 + 180 + 120) / 7 = 140 unidades
O resultado obtido, 140, representa o valor diário de venda de me-mórias RAM. Ou seja, 140 representa os 7 valores.
4.4.2 Desvio em relação à média
É a diferença entre cada elemento da série de valores e a média aritmética, ou seja: di = Xi – X
No exemplo anterior, temos sete desvios:
d1 = 100 - 140 = - 40, d2 = 140 - 140 = 0, d3 = 130 - 140 = -10, d4 = 150 - 140 = 10, d5 = 160 - 140 = 20, d6 = 180 - 140 = 40 e d7 = 120 - 140 = - 20.
—
—
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:57LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:57 21/12/2010 17:30:5421/12/2010 17:30:54
58
Curso de Licenciatura em Informática
4.4.3 Propriedades da média
1ª propriedade: A soma algébrica dos desvios em relação à média é sempre nula.
No exemplo anterior: d1 + d2 + d3 + d4 + d5 + d6 + d7 = 0
2ª propriedade: Somando-se (ou subtraindo-se) uma constante (c) a todos os valores de uma variável, a média do conjunto � ca maior (ou menor) dessa constante.
Se no exemplo original somarmos a constante 2 a cada um dos valores da variável, teremos:
Y = 102+142+132+152+162+182+122 / 7 = 142 unidades ou
Y + 2 = 140 +2 = 142 unidades
3ª propriedade: Multiplicando-se (ou dividindo-se) todos os va-
lores de uma variável por uma constante (c), a média do conjunto
f ca multiplicada (ou dividida) por essa constante.
Se no exemplo original multiplicarmos a constante 3 a cada um dos valores da variável, teremos:
a) Z = 300 + 420 + 390 + 450 + 480 + 540 + 360 / 7 = 420 unidades
Z = X x 3 = 140 x 3 = 420 unidades
ATIVIDADE 4.1
1) Marque a opção correta. Na tabela primitiva: {6, 2, 7, 6, 5, 4} a soma dos desvios em relação à média aritmética é igual:
( ) ao número - 4
( ) ao número 8
( ) ao número 0
( ) ao número 25
( ) ao número 4
2) Numa empresa de informática, a média de vendas é de 130 computadores. A empresa faz uma promoção e a quantidade de unidades vendidas aumenta em 20%. Assim, qual a média de ven-
—
—
—
Capítulo 4
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:58LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:58 21/12/2010 17:30:5621/12/2010 17:30:56
59
Probabilidade e Estatística
Medidas de Ordenamento e de Posição
das no período da promoção?
3) Marque a opção correta. um professor, após veri� car que toda a classe obteve nota baixa, eliminou as questões a que os alunos não responderam. Com isso, as notas de todos os alunos foram aumentadas de 3 pontos. Então:
a) ( ) a média aritmética � cou alterada de 3, assim como a soma dos desvios;
b) ( ) a média aritmética diminui de 3;
c) ( ) não houve alteração nem na média nem nos desvios;
d) ( ) a média aritmética aumentou de 3.
4) Considerando que você tem série aritmética, na qual o primei-ro termo é -3, a razão é -5 e o número de elementos é 389, pede-se: qual a soma dos desvios da série considerada?
5) Qual a soma dos desvios da média da série considerada a seguir?
33 28 23 18 13 812 33 54 75 96 117-9 38 85 132 179 226-30 43 116 189 262 335-51 48 147 246 345 444-72 53 178 303 428 553-93 58 209 360 511 662
b) Média Aritmética para dados agrupados:
b1) Sem intervalos de classe
Numa rede, trafega um � uxo diário de dados, conforme a tabela a se-guir. Qual a média diária de dados que trafega na rede?
Fluxo de dados Duração (h)128 MB 2256 MB 6350 MB 8380 MB 5400 MB 3
Total 24
Tabela 4.1 Tráfego de �uxo diário de dados na rede
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:59LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:59 21/12/2010 17:30:5721/12/2010 17:30:57
60
Curso de Licenciatura em Informática
Capítulo 4
O � uxo de dados será representado pela variável Xi, a duração com que os dados trafegam na rede, representaremos por � .
Xi fi 128 MB 2256 MB 6350 MB 8380 MB 5400 MB 3
Total 24Como a duração são números indicadores da intensidade de cada valor da variável, as frequências funcionam como fatores de ponderação, o que nos leva a calcular a média aritmética ponderada da seguinte forma:
Devemos observar que a média ponderada não é uma nova fórmula para o cálculo da média. Na realidade, há um agrupamento dos valores repetidos
Devemos, assim, montar uma nova coluna (Xi.� ) na tabela:
Xi � Xi.�
128 MB 2 128 . 2 = 256256 MB 6 256 . 6 = 1536350 MB 8 350 . 8 = 2800380 MB 5 380 . 5 = 1900400 MB 3 400 . 3 = 1200
Total Σ � = 24 Σ Xi.� = 7692
Tabela 4.2 Tráfego de �uxo diário de dados na rede representada por Xi �.
Tabela 4.3 Ocorrência de tráfego de �uxo diário (Xi x �)
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:60LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:60 21/12/2010 17:30:5721/12/2010 17:30:57
61
Probabilidade e Estatística
Medidas de Ordenamento e de Posição
Calcular a média conforme a fórmula a seguir:
Ou seja, a quantidade média de dados que trafegam na rede é de 320,5 MB.
ATIVIDADE 4.2
1) Marque a alternativa correta:
Em uma prova de Estatística, 3 alunos obtiveram a nota 8,2; ou-tros 3 obtiveram a nota 9,0; 5 obtiveram a nota 8,6; 1 obteve a nota 7,0 e 1, a nota 8,9. A média aritmética é:
a) ( ) uma média aritmética simples com valor 8,0;
b) ( ) uma média aritmética simples com valor 8,7;
c) ( ) uma média aritmética ponderada com valor 8,0;
d) ( ) uma média aritmética ponderada com valor 8,5;
e) ( ) nenhuma das respostas anteriores.
2) Em uma classe de 50 alunos, as notas obtidas foram as seguintes:
Notas Número de alunos
4 35 86 127 128 89 5
10 2
Qual a nota média da turma?
3) Suponha que adicionamos 100 a cada um dos valores de uma amostra. O que acontece com a média?
b2) Com intervalos de classe
No caso de média aritmética para dados agrupados com intervalos de classe, convencionamos que todos os valores incluídos em um determi-nado intervalo de classe coincidem com o seu ponto médio, e de� nimos a média da mesma maneira como calculamos a média aritmética para dados agrupados sem intervalos de classe.
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:61LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:61 21/12/2010 17:30:5721/12/2010 17:30:57
62
Curso de Licenciatura em Informática
Xi =(Li +li)/2
Em que:
Xi – Ponto médio da classe;Li – Limite superior da classe;Li - Limite inferior da classe.
Exemplo:
Vamos usar o exemplo da pesquisa dos preços de 200 monitores LCD da marca AOC, em 200 empresas de informática, para calcular a média de preços.
Valor do monitor (R$) Frequências
412 |------- 415 10415|------- 418 15418|------- 421 20421|------- 424 25424|------- 427 30427|------- 430 30430|------- 433 28433|------- 436 22436|------- 439 12439|------- 442 8
Total 200
Calculando os valores de Xi. � , teremos:
Classe Fi Xi Xi. fi 412|------- 415 10 413,5 4135415|------- 418 15 416,5 6247,5418|------- 421 20 419,5 8390421|------- 424 25 422,5 10562,5424|------- 427 30 425,5 12765427|------- 430 30 428,5 12855430|------- 433 28 431,5 12082433|------- 436 22 434,5 9559
Capítulo 4
Tabela 4.4 Preços de 200 monitores LCD da marca AOC em 200 empresas de informática.
Tabela 4.5 Ocorrências de Preços de 200 monitores LCD da marca AOC, em 200 empresas de informática (Xi. �)
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:62LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:62 21/12/2010 17:30:5821/12/2010 17:30:58
63
Probabilidade e Estatística
Medidas de Ordenamento e de Posição
436|------- 439 12 437,5 5250439|------- 442 8 440,5 3524Total 200 85370
Logo, a média será:
ATIVIDADE 4.3
1) Calcule o valor médio da placa-mãe (mainboard ou motherbo-ard), cujos valores estão distribuídos a seguir:
Tipo de placa-mãe Valor R$ QuantidadeTipo 1 300|------- 305 14Tipo 2 305|------- 310 46Tipo 3 310|------- 315 58Tipo 4 315|------- 320 76Tipo 5 320|------- 325 68Tipo 6 325|------- 330 62Tipo 7 330|------- 335 48Tipo 8 335|------- 340 22
2) Marque a opção correta: Um aluno faz três provas com pesos 2, 2 e 3. Se ele tirou 2 e 7 nas duas primeiras, quanto precisa tirar na terceira prova para � car com média maior ou igual a 6?
a) ( ) pelo menos 5
b) ( ) pelo menos 6
c) ( ) pelo menos 7
d) ( ) pelo menos 8
4.5 Moda (Mo)
A moda é utilizada quando desejamos obter uma medida rápida e apro-ximada de posição. Já a média aritmética é a medida de posição que possui a maior estabilidade.
É especialmente útil para reduzir a informação de um conjunto de da-dos qualitativos, apresentado sob a forma de nomes ou categorias, para os quais não se pode calcular a média.
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:63LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:63 21/12/2010 17:30:5821/12/2010 17:30:58
64
Curso de Licenciatura em Informática
Capítulo 4
É o valor que ocorre com maior frequência em uma série de valores.
Desse modo, o salário modal dos empregados de uma fábrica é o salá-rio mais comum, isto é, o recebido pelo maior número de empregados dessa fábrica.
4.5.1 Moda quando os dados não estão agrupados
A moda é facilmente reconhecida, basta, de acordo com a de� nição, procurar o valor que mais se repete.
Exemplo:
Na série {7 , 8 , 9 , 10 , 10 , 10 , 11 , 12}, a moda é 10.
Há séries nas quais não existe o valor modal, isto é, não há repetições de valores.
Exemplo:
A série {3 , 5 , 8 , 10 , 12} não apresenta moda. Ela é amodal.
.Em outros casos, pode haver dois ou mais valores de concentração. Di-zemos, então, que a série tem dois ou mais valores modais.
Exemplo:
A série {2 , 3 , 4 , 4 , 4 , 5 , 6 , 7 , 7 , 7 , 8 , 9} apresenta duas modas: 4 e 7. Ela é bimodal.
4.5.2 Moda quando os dados estão agrupados
a) Sem intervalos de classe
Uma vez agrupados os dados, é possível determinar imediatamen-te a moda: basta � xar o valor da variável de maior frequência.
Exemplo: Na medição de temperatura durante o mês de junho de 2005, na cidade de Curitiba, qual a mais recorrente?
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:64LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:64 21/12/2010 17:30:5821/12/2010 17:30:58
65
Probabilidade e Estatística
Medidas de Ordenamento e de Posição
Temperaturas Frequência0º C 31º C 92º C 123º C 6
Resposta: 2º C é a temperatura modal, pois é a de maior frequência.
a) Com intervalos de classe
A classe que apresenta a maior frequência é denominada classe modal. Pela de� nição, podemos a� rmar que a moda, nesse caso, é o valor dominante que está compreendido entre os limites inferior e superior da classe modal. O método mais simples para o cálculo da moda consiste em tomar o ponto médio da classe modal. Da-mos a esse valor a denominação de moda bruta.
Mo = (ℓ* + L* ) / 2
Em que:
ℓ* = limite inferior da classe modal e,
L*= limite superior da classe modal.
Exemplo:
Calcule o preço modal dos pendrives de 4Gb, os preços estão dispostos na tabela a seguir:
Figura 16: Pendrive de 4Gb
Preço R$ Frequência54|------ 58 958|------ 62 1162|------ 66 866|------ 70 5
Tabela 4.6 Ocorrências de temperaturas em junho de 2005, na cidade de Curitiba.
Tabela 4.7 Distribuição de Frequência dos preços dos pendrives
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:65LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:65 21/12/2010 17:30:5821/12/2010 17:30:58
66
Curso de Licenciatura em Informática
Capítulo 4
Resposta: a classe modal é 58|-------- 62, pois é a de maior frequência. ℓ*=58
e L*=62
Mo = (58+62) / 2 = R$ 60 (esse valor é estimado, pois não conhecemos o valor real da moda).
O cálculo da moda também pode ser feito pela fórmula de CZU-BER. Vale a pena pesquisá-lo
ATIVIDADE 4.4
1) Calcule o tipo modal dos mouses ópticos a seguir:
Mouse QuantidadesTipo 1 344Tipo 2 234Tipo 3 656Tipo 4 125Tipo 5 111Tipo 6 256
2) Calcule o valor modal da placa-mãe (mainboard ou mother-board), cujos valores estão distribuídos na tabela a seguir:
Tipo de placa-mãe Valor R$ QuantidadeTipo 1 300 |------- 305 14Tipo 2 305 |------- 310 46Tipo 3 310 |------- 315 58Tipo 4 315 |------- 320 76Tipo 5 320 |------- 325 68Tipo 6 325 |------- 330 62Tipo 7 330 |------- 335 48Tipo 8 335 |------- 340 22
3) quando queremos veri� car que tipo de monitor apresentou maior número de defeitos, utilizamos:
a) ( ) moda;
b) ( ) mediana;
c) ( ) média;
d) ( ) qualquer das anteriores.
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:66LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:66 21/12/2010 17:30:5821/12/2010 17:30:58
67
Probabilidade e Estatística
Medidas de Ordenamento e de Posição
4.6 Mediana (MD)
Ordenados os elementos da série de dados, a mediana é o valor (perten-cente ou não à série) que a divide ao meio, isto é, 50% dos elementos da série são menores ou iguais à mediana e os outros 50% são maiores ou iguais à mediana.
Emprego da Mediana
• Quando desejamos obter o ponto que divide a distribuição em duas partes iguais.
• Quando há valores extremos que afetam de maneira acentuada a média aritmética
4.6.1 Mediana para série com número ímpar de termos
Dada uma série de valores, por exemplo: {5, 2, 6, 13, 9, 15, 10}.
De acordo com a de� nição de mediana, o primeiro passo a ser dado é o da ordenação (crescente ou decrescente) dos valores: {2, 5, 6, 9, 10, 13, 15}
Temos n=7 (ímpar).
O valor que divide a série acima em duas partes iguais é 9; logo, a Md = 9.
Exemplo:
Cálculo da mediana da série {1, 3, 0, 0, 2, 4, 1, 2, 5}:
1º - Ordenar a série {0, 0, 1, 1, 2, 2, 3, 4, 5};
n = 9; logo, o 5º elemento da série ordenada será a mediana;
5º elemento = 2
4.6.2 Mediana para série com número par de termos:
A mediana é obtida pela média dos dois elementos centrais da série
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:67LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:67 21/12/2010 17:30:5821/12/2010 17:30:58
68
Curso de Licenciatura em Informática
Capítulo 4
Exemplo: Cálculo da mediana da série {1, 3, 0, 0, 2, 4, 1, 3, 5, 6}:
1º - Ordenar a série {0, 0, 1, 1, 2, 3, 3, 4, 5, 6};
Para dividir a série, o valor tem que estar entre os valores centrais 2 e 3;
5º Termo = 2
6º Termo = 3
A mediana será = (2+3) / 2, ou seja, Md = 2,5 . A mediana, no exemplo, é a média aritmética do 5º e 6º termos da série.
Notas:
• Quando o número de elementos da série estatística for ímpar, haverá coincidência da mediana com um dos elementos da série.
• Em uma série a mediana, a média e a moda não têm, necessa-riamente, o mesmo valor.
• A mediana depende da posição e não dos valores dos elemen-tos na série ordenada. Essa é uma das diferenças marcantes entre mediana e média (que se deixa infl uenciar, e muito, pelos valores extremos). Vejamos:
Em {5, 7, 10, 13, 15}, a média = 10 e a mediana = 10;
Em {5, 7, 10, 13, 65}, a média = 20 e a mediana = 10;
A média do segundo conjunto de valores é maior do que a do
primeiro por inf uência dos valores extremos, ao passo que a me-
diana permanece a mesma.
4.6.3 Mediana para série com dados agrupados
a) Sem intervalos de classe:
No caso da mediana para série com dados agrupados sem inter-valos de classe, é o bastante, identi� car a frequência acumulada imediatamente superior à metade da soma das frequências. A mediana será o valor da variável que corresponde a tal frequência acumulada.
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:68LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:68 21/12/2010 17:30:5921/12/2010 17:30:59
69
Probabilidade e Estatística
Medidas de Ordenamento e de Posição
Exemplo:
Calcule a mediana da tabela abaixo:
Variável Xi
Frequência Fi
Frequência acumulada F
0 2 21 6 82 9 173 13 304 5 35
total 35
Como o somatório das frequências é 35, a fórmula f cará: (35+1) / 2 =
18º (30 é o valor imediatamente superior a 18); logo, a mediana
será igual a 3.
No caso de existir uma frequência acumulada (Fi), tal que:
a mediana será dada por:
Exemplo:
Calcule a mediana da tabela abaixo:
Variável Xi Frequência F Frequência acumulada F12 1 114 2 315 1 416 2 617 1 720 1 8
total 8
Tabela 4.8 Distribuição de Frequência
Tabela 4.9 Distribuição de Frequência
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:69LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:69 21/12/2010 17:30:5921/12/2010 17:30:59
70
Curso de Licenciatura em Informática
Capítulo 4
Como temos = 8/2=4
Aplicando a fórmula acima, teremos:
Md= [X(8/2)+ X(8/2+1)]/2
Md= (3º termo + 4º termo) / 2 = (15 + 16) / 2 = 15,5
Md=15,5
b) Com intervalos de classe
Desejamos calcular a mediana da tabela abaixo, que representa os pesos de 40 alunos.
Pesos (kg) fi50 |------ 54 454 |------ 58 958 |------ 62 1162 |------ 66 866 |------ 70 570 |------ 74 3
Total 40
Devemos seguir estes passos:
1º) Determinamos as frequências acumuladas;
2º) Calculamos ;
3º) Marcamos a classe correspondente à frequência acumu-lada imediatamente superior à . Tal classe será a classe mediana;
4º) Calculamos a mediana pela seguinte fórmula:..
Em que:
ℓ* é o limite inferior da classe mediana;
Tabela 4.10 Pesos de 40 alunos
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:70LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:70 21/12/2010 17:30:5921/12/2010 17:30:59
71
Probabilidade e Estatística
Medidas de Ordenamento e de Posição
F(ant) é a frequência acumulada da classe anterior à classe mediana;
f* é a frequência simples da classe mediana;
h* é a amplitude do intervalo da classe mediana.
Primeiramente, vamos incluir a frequência acumulada na Tabela.
Classes fi Frequência acumulada F50 |------ 54 4 454 |------ 58 9 1358 |------ 62 11 2462 |------ 66 8 3266 |------ 70 5 3770 |------ 74 3 40
Total 40
Temos:
Logo, a classe mediana será 58 |----- 62, pois 24, correspondente a frequência
acumulada imediatamente superior 20, veja na tabela anterior.
Assim:
ℓ* = 58 (limite inferior do intervalo)
F(ant) = 13 (frequência acumulada inferior a 20)
f* = 11 (frequência simples do intervalo 58 |----- 62)
h* = 4 (intervalo de classe, observef qxuoe e é i gual a 4)
Portanto, a mediana será:
Md= 60,54 kg
Interpretação: Md = 60,54 kg
50% dos alunos, ou seja, 20 alunos, pesam menos ou igual a 60,54 kg.
Tabela 4.11 Pesos de 40 alunos
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:71LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:71 21/12/2010 17:30:5921/12/2010 17:30:59
72
Curso de Licenciatura em Informática
Capítulo 4
ATIVIDADE 4.5
1) Calcule a marca mediana dos mouses ópticos a seguir:
Mouse QuantidadesTipo 1 344Tipo 2 234Tipo 3 656Tipo 4 125Tipo 5 111Tipo 6 256
2) medida que tem o mesmo número de valores, abaixo e acima dela, é:
a) ( ) a moda.
b) ( ) a média.
c) ( ) a mediana.
d) ( ) o lugar mediano.
3) Calcule a marca mediana dos teclados:
Teclados QuantidadesFabricante A 344Fabricante B 234Fabricante C 656Fabricante D 125Fabricante E 111
4) Calcule o tipo mediano da placa-mãe (mainboard ou motherbo-ard), cujos valores estão distribuídos abaixo:
Tipo de placa-mãe Valor R$ QuantidadeTipo 1 300 |------- 305 14Tipo 2 305 |------- 310 46Tipo 3 310 |------- 315 58Tipo 4 315 |------- 320 76Tipo 5 320 |------- 325 68Tipo 6 325 |------- 330 62Tipo 7 330 |------- 335 48Tipo 8 335 |------- 340 22
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:72LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:72 21/12/2010 17:30:5921/12/2010 17:30:59
73
Probabilidade e Estatística
Medidas de Ordenamento e de Posição
4.7 Assimetria
As medidas de assimetria mostram o quanto a curva de frequência se desvia ou afasta da posição simétrica (área do lado esquerdo igual a área lado direito do grá� co de distribuição de frequência).
Simetria: uma distribuição de frequência é simétrica quando a média, a mediana e a moda são iguais, ou seja, apresentam um mesmo valor ou, ainda, coincidem num mesmo ponto. Neste caso, temos o lado esquerdo igual ao lado direito.
Assimetria: uma distribuição de frequência é assimétrica quan-do a média, a mediana e a moda recaem em pontos diferentes da distribuição, isto é, apresentam valores diferentes, sendo que o deslocamento desses pontos pode ser para a direita ou para a esquerda. Quanto ao grau de deformação, as curvas de frequência podem ser:
Simétrica Média = Moda
Assimétrica Positiva Média > Moda
Assimétrica Negativa Média < Moda
A Figura 17 a seguir ilustra os tipos de assimetria:
f
Simétrica
x = Md = Mo x
moda
mediana
média
f
xMo < Md < x x < Md < Mo
Assimétrica Positiva Assimétrica Negartiva
Figura 17: Tipos de assimetria
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:73LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:73 21/12/2010 17:30:5921/12/2010 17:30:59
74
Curso de Licenciatura em Informática
Capítulo 4
ATIVIDADE 4.6
a) Determine o tipo de assimetria das séries a seguir:
1. Série A
Estatura(m) frequência fi 2 |----- 6 6
6 |----- 10 1210|----- 14 2414|----- 18 1218|----- 22 6
Total 60
2. Série B
Estatura(m) frequência fi 2 |----- 6 6
6 |----- 10 1210|----- 14 2414|----- 18 3018|----- 22 6
Total 78
3. Série C
Estatura(m) frequência fi 2 |----- 6 6
6 |----- 10 3010|----- 14 2414|----- 18 1218|----- 22 6
Total 78
4.8 Separatrizes
As medidas separatrizes são medidas de posição e têm por f nalidade dividir
uma série de dados. As medidas separatrizes são: mediana, quartil, decil e
percentil.
4.8.1 Quartis
Denominamos quartis os três valores que separam a série em 4 partes iguais.
Q Q = Md Q1 2 3
25%0% 75%50% 100%
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:74LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:74 21/12/2010 17:30:5921/12/2010 17:30:59
75
Probabilidade e Estatística
Medidas de Ordenamento e de Posição
• Q1 – Primeiro quartil, valor que representa os primeiros 25% dos elementos da série;
• Q2 – Segundo quartil (mediana) , valor que representa os primeiros 50% dos elementos da série;
• Q3 – Terceiro e último quartil, valor que representa os primeiros 75% dos elementos da série;
a) Quartis em dados não agrupados
Deve-se utilizar o mesmo princípio do cálculo da mediana para os 3 quartis. Efetivamente, serão calculadas “3 medianas” na mesma série.
Exemplo1:
Calcule os quartis da série {5, 2, 6, 9, 10, 13, 15}.
O primeiro passo a ser dado é o da ordenação (crescente ou decrescen-te) dos valores:
{2, 5, 6, 9, 10, 13, 15}.
O valor que divide a série acima em duas partes iguais é 9; logo, a Md = 9, que será = Q .2
Observe que temos agora {2, 5, 6} e {10, 13, 15} como os dois grupos de valores iguais proporcionados pela mediana (quartil 2). Para o cálculo dos quartis 1 e 3, basta calcular as medianas das partes iguais provenien-tes da verdadeira Mediana da série (quartil 2).
Logo, em {2, 5, 6} a mediana é = 5. Ou seja: o quartil 1;
em {10, 13, 15} a mediana é =13. Ou seja: o quartil 3.
Exemplo 2:
Calcule os quartis da série {1, 1, 2, 3, 5, 5, 6, 7, 9, 9, 10, 13}.
A série já está ordenada, então calcularemos o Quartil 2 = Md = (5+6)/2 = 5,5.
O quartil 1 será a mediana da série à esquerda de Md: {1, 1, 2, 3, 5, 5}
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:75LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:75 21/12/2010 17:31:0021/12/2010 17:31:00
76
Curso de Licenciatura em Informática
Capítulo 4
Q = (2+3)/2 = 2,51
O quartil 3 será a mediana da série à direita de Md: {6, 7, 9, 9, 10, 13}
Q = (9+9)/2 = 93
b) Quartis para dados agrupados em classes
Usamos a mesma técnica do cálculo da mediana, bastando subs
tituir, na fórmula da mediana, por .
Para determinar os quartis, devemos seguir estes passos:
1º) determinamos as frequências acumuladas;
2º) calculamos ,
Sendo k o número de ordem do quartil;
3º) calculamos a Mediana pela seguinte fórmula:..
Em que:
ℓ* é o limite inferior da classe mediana.
F(ant) é a frequência acumulada da classe anterior à classe mediana.
f* é a frequência simples da classe mediana.
h* é a amplitude do intervalo da classe mediana.
Exemplo 3:
Calcule os quartis da tabela abaixo, que representa os pesos de 40 alunos.
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:76LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:76 21/12/2010 17:31:0021/12/2010 17:31:00
77
Probabilidade e Estatística
Medidas de Ordenamento e de Posição
Pesos (kg) fi50 |------ 54 454 |------ 58 958 |------ 62 1162 |------ 66 866 |------ 70 570 |------ 74 3
Total 40
Vamos calcular o primeiro quartil (Q ).1
Primeiramente, vamos incluir a frequência acumulada na Tabela.
Pesos (kg) fi F50 |------ 54 4 454 |------ 58 9 1358 |------ 62 11 2462 |------ 66 8 3266 |------ 70 5 3770 |------ 74 3 40
Total 40
Temos k=1 para o primeiro quartil
Calculamos
Procuramos na tabela anterior à frequência acumulada, imediatamente, superior a 10; neste caso, temos o valor 13.
Pesos (kg) fi F50 |------ 54 4 454 |------ 58 9 13 Valor imediatamente superior a 1058 |------ 62 11 24
Logo, a classe do primeiro quartil é 54 |------ 58,
Assim:
ℓ* = 54.
F(ant) = 4
f* = 9
h* = 4
Tabela 4.12 Pesos de 40 alunos
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:77LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:77 21/12/2010 17:31:0021/12/2010 17:31:00
78
Curso de Licenciatura em Informática
Capítulo 4
Logo, o primeiro quartil será:
Q = 56,66 kg1
Interpretação: Q = 56,66 kg1
25% dos alunos pesam menos ou igual a 56,66 kg.
Ou ainda, podemos a� rmar que 75% dos alunos pesam mais que 56,66 kg.
Vamos calcular o terceiro quartil (Q ):3
Temos k=3
Calculamos
Logo,.a classe do terceiro quartil é 62 |------ 66
Assim:ℓ* = 62
F(ant) = 24
f* = 8
h* = 4
Logo, o terceiro quartil (Q3) será:
Q = 65 kg3
Interpretação: Q = 65 kg3
75% dos alunos pesam menos ou igual a 65kg.
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:78LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:78 21/12/2010 17:31:0121/12/2010 17:31:01
79
Probabilidade e Estatística
Medidas de Ordenamento e de Posição
ATIVIDADE 4.7
Calcule os 3 quartis das séries a seguir:
a) Teclados:
Teclados QuantidadesTipo 1 344Tipo 2 234Tipo 3 656Tipo 4 125Tipo 5 111
b) Tipos de placa-mãe:
Tipos de placa-mãe Quantidades QuantidadeTipo 1 300 |------- 305 14Tipo 2 300 |------- 310 46Tipo 3 300 |------- 315 58Tipo 4 300 |------- 320 76Tipo 5 300 |------- 325 68Tipo 6 300 |------- 330 62Tipo 7 300 |------- 335 48Tipo 8 300 |------- 345 22
4.8.2 Decis
Denominamos decis os nove valores que separam uma série em 10 par-tes iguais.
D1
10%0% 50% 100%20% 30% 40% 60% 70% 80% 90%
D2 D3 D4 D5=Md D6 D7 D8 D9
D1 – Primeiro decil, valor que representa os primeiros 10% dos elemen-tos da série;
D2 – Segundo decil, valor que representa os primeiros 20% dos elemen-tos da série;
D5 – Quinto decil (mediana), valor que representa os primeiros 50% dos elementos da série;
D9– Nono e último decil, valor que representa os primeiros 20% dos elementos da série;
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:79LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:79 21/12/2010 17:31:0121/12/2010 17:31:01
80
Curso de Licenciatura em Informática
Para o cálculo dos percentis, usaremos a mesma técnica do cálculo
dos quartis, bastando substituir, na fórmula, por .
4.8.3 Percentil ou Centil
Denominamos percentis ou centis os noventa e nove valores que sepa-ram uma série em 100 partes iguais.
D1
10%0% 50% 100%20% 30% 40% 60% 70% 80% 90%
D2 D3 D4 D5=Md D6 D7 D8 D9
Indicamos: P , P , ... , P . 1 2 99
É evidente que P = Md ; P = Q e P = Q .50 25 1 75 3
Os percentis, normalmente, são usados para grandes séries de dados.
Para o cálculo dos percentis, usaremos a mesma técnica do cálculo
dos quartis, bastando substituir, na fórmula,
por .
Exemplo:
Vamos calcular o 8º percentil (P8) da tabela abaixo, que representa os pesos de 40 alunos:
Pesos (kg) fi50 |------ 54 454 |------ 58 958 |------ 62 1162 |------ 66 866 |------ 70 570 |------ 74 3
Total 40
Capítulo 4
Tabela 4.13 Pesos de 40 alunos
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:80LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:80 21/12/2010 17:31:0121/12/2010 17:31:01
81
Probabilidade e Estatística
Medidas de Ordenamento e de Posição
Novamente, vamos incluir a frequência acumulada na Tabela.
Pesos (kg) fi F50 |------ 54 4 454 |------ 58 9 1358 |------ 62 11 2462 |------ 66 8 3266 |------ 70 5 3770 |------ 74 3 40
Total 40
Temos k=8
Calculamos
Logo,.a classe do 8º percentil é 50 |------ 54
Assim:
ℓ* = 50
f* = 4
h* = 4
Logo, o 8º percentil (P ) será:8
P = 53,2 kg8
Interpretação: P = 53,2 kg8
8% das pessoas pesam menos ou igual a 53,2kg.
F(ant) = 0
ATIVIDADE 4.8
1) Calcule o 16o, o 29o e o 73o percentis das séries a seguir:
a) Teclados:
Teclados QuantidadesTipo 1 344Tipo 2 234Tipo 3 656Tipo 4 125Tipo 5 111
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:81LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:81 21/12/2010 17:31:0221/12/2010 17:31:02
82
Curso de Licenciatura em Informática
Capítulo 4
b) Tipos de placa-mãe:
Tipos de placa-mãe Valor R$ QuantidadeTipo 1 300 |------- 305 14Tipo 2 305 |------- 310 46Tipo 3 310 |------- 315 58Tipo 4 315 |------- 320 76Tipo 5 320 |------- 325 68Tipo 6 325 |------- 330 62Tipo 7 330 |------- 335 48Tipo 8 335 |------- 340 22
Cuidado! Sempre a frequência acumulada anterior da primeira classe será zero.
ATIVIDADE 4.8
Após construir o histograma e a curva polida do seu trabalho prá-tico, calcule a média, a mediana, o primeiro, o segundo e o terceiro quartis, além dos percentis (P ,P ,P ,P ,P15 25 35 50 75 e P80), determinando também o tipo de assimetria que o histograma apresenta.
Chegamos ao � nal deste capítulo, no qual aprendemos a calcular as medidas de ordenamento e posição. É importante que esse conteúdo esteja bem compreendido; caso contrário, faça uma revisão, pois ele será necessário para entender os próximos conteúdos.
Vamos para o capítulo 5!
Prof. Sebastião A. Carneiro
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:82LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:82 21/12/2010 17:31:0221/12/2010 17:31:02
MEDIDAS DE VARIABILIDADE
Olá, Turma!
Neste capítulo, veremos que a média não é su� ciente para identi� car uma série de dados. Devemos encontrar uma medida que nos mos-tre a forma como os elementos da série se distribuem, dispersam-se ou variam em torno da média.
Bons estudos!
Prof. Sebastião A. Carneiro
Será que a média é uma medida su� ciente para caracterizar uma série de dados?
Veja o exemplo a seguir:
Exemplo 1:
Observe o tráfego de dados numa rede de computadores: em uma hora há tráfego de dados a 49 Mbps(rápida) e na próxima hora há trá-fego de dados a 51 Mbps(rápida também), enquanto que em outra rede uma hora o tráfego de dados é 1 Mbps (muito lenta) e na próxima hora o tráfego de dados é 99 Mbps(muito rápida).
49Mbps49Mbps
01:00h
51Mbps51Mbps
02:00h
Figura 18: Dois computadores se comunicando a 49 Mbps e 51 Mbps
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:83LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:83 21/12/2010 17:31:0321/12/2010 17:31:03
84
Curso de Licenciatura em Informática
Capítulo 5
1Mbps1Mbps
01:00h
99Mbps99Mbps
02:00h
Figura 19 Dois computadores se comunicando a 1 Mbps e 99 Mbps
As duas redes têm a mesma média de comunicação de dados nas 2 horas de comunicação, 50 Mbps, mas em condições diferentes: observe que a primeira rede é mais estável que a segunda.
Portanto, temos a mesma média, mas em condições diferentes.
Por esse motivo, vamos estudar o conceito de variabilidade, pois, se alguém pedisse para você escolher, qual você escolheria?Embora a média de tráfego das duas redes de computadores seja 50 Mbps. A responda, com certeza, seria uma rede mais estável (Figura 5.1), pois varia menos. Assim, veremos a seguir como quanti� car as va-riações das séries em torno da média.
5.1 Medidas de dispersão
Dispersão ou Variabilidade:
É a maior ou a menor diversi� cação dos valores de uma variável em torno de um valor de tendência central (média ou mediana) tomado como ponto de comparação.
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:84LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:84 21/12/2010 17:31:0521/12/2010 17:31:05
85
Probabilidade e Estatística
Medidas de Variabilidade
A média é o valor que melhor representa uma série de valores, mas ela, por si só, não pode destacar o grau de homogeneidade ou heteroge-neidade existente entre os valores que compõem o conjunto. Por esse motivo, precisamos de mais elementos que concretizem bem uma série de valores.
Consideremos os seguintes conjuntos de valores das variáveis X, Y e Z:
X = { 5, 5, 5, 5, 5 } X = 5
Y = { 3, 4, 5, 6, 7 } Y = 5
Z = { 0, 1, 5, 9, 10 } Z = 5
Observe que os três conjuntos apresentam a mesma média aritmética (25/5 = 5). Entretanto, é fácil notar que o conjunto X é mais homogêneo que os conjuntos Y e Z. O conjunto Y, por sua vez, é mais homogêneo que o conjunto Z.
5.2 Medidas de dispersão absoluta
5.2.1 Amplitude total (AT):
a) Para uma série de dados, a amplitude total é a diferença entre o maior e o
menor valor observado:
AT = X máximo - X mínimo.
Exemplo:
Para os valores 4, 5, 8, 2 e 17 a amplitude total será: AT = 17 - 14 = 13
b) Para uma série de dados, mesmo quando os dados estão agrupados sem
intervalos de classe, ainda temos:
AT = X máximo - X mínimo
Exemplo:
Para os dados seguintes, agrupados sem intervalos, a amplitude total será:
Xi Fi10 1111 613 514 13
AT = 14 - 10 = 4
Tabela 5.1 dados agrupados sem intervalos
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:85LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:85 21/12/2010 17:31:0821/12/2010 17:31:08
86
Curso de Licenciatura em Informática
Capítulo 5
c) Para uma série de dados com intervalos de classe, a amplitude total será o limite superior da última classe e o limite inferior da primeira classe. Logo:
AT = L máximo – l mínimo
Exemplo:
Para os dados agrupados em intervalos de classe conforme a seguir, a amplitude total será:
Classes fi10 |------ 16 416 |------ 22 5 22|-------26 2
AT = 26 - 10 = 16
A amplitude total tem o inconveniente de só levar em conta os dois valores extremos da série.
É a única medida de dispersão que não tem na média o ponto de
referência.
5.2.2 Variância
Variância é a medida que considera a totalidade dos valores da variável em estudo. Baseia-se nos desvios em torno da média.
a) VARIÂNCIA 2 DA POPULAÇÃO ( )
A variância de uma população, que representaremos por , é a média aritmética dos quadrados dos desvios absolutos.
Sabemos que:
d= xi –
Em que:
– Média aritmética da população, representada por uma série x i,
em que i = 1, 2, ....,n
Tabela 5.2 – Dados agrupados em intervalos de classe.
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:86LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:86 21/12/2010 17:31:0921/12/2010 17:31:09
87
Probabilidade e Estatística
Medidas de Variabilidade
Logo:
Também pode ser representada deste modo:
b) VARIÂNCIA DA AMOSTRA 2 (s )
Se o conjunto das observações é uma amostra estatística, teremos, neste caso, a variância amostral e a representaremos por 2s ; sua média é repre-sentada por X .
A variância de uma amostra, que representaremos por 2s , é dada conforme indicação a seguir:
Sabemos que:
d= xi – x
Em que:
x – Média aritmética da amostra, representada por uma série xi ,, em que i = 1, 2, ....,n
Logo:
Também pode ser representada deste modo:
No cálculo da variância de uma amostra, devemos dividir a soma dos desvios quadráticos por (n-1) e não n, para que o valor es-perado da variância seja o melhor estimador da variabilidade do conjunto de dados.
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:87LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:87 21/12/2010 17:31:0921/12/2010 17:31:09
88
Curso de Licenciatura em Informática
Capítulo 5
c) VARIÂNCIA PARA SÉRIE DE DADOS SIMPLES
Exemplo:
Cálculo da variância da amostra representada por - 2 cm , -1 cm, 0 cm , 1 cm , 4 cm.
Primeiramente, devemos calcular a média:
O passo seguinte é calcular os desvios e seus quadrados. Acompanhe a tabela a seguir:
Xi x d = xi − x 2d = (xi x 2)- 2 0,4 - 2,4 5,76- 1 0,4 - 1,4 1,960 0,4 - 0,4 0,161 0,4 0,6 0,364 0,4 3,6 12,96
∑ = (xi − x 2) = 21,12
Tabela 5.3 Desvios e seus quadrados de uma série de dados.
Temos n = 5, a variância � ca:
Propriedades:
PROPRIEDADE 1
Quando somamos ou subtraímos uma constante (k) a todos os valores de uma variável, a sua variância � ca inalterada, pois a va-riância de uma constante é igual a zero.
PROPRIEDADE 2
Quando multiplicamos ou dividimos todos os valores de uma va-riável por uma constante (k), a sua variância � ca multiplicada ou dividida pelo quadrado da constante.
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:88LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:88 21/12/2010 17:31:1021/12/2010 17:31:10
89
Probabilidade e Estatística
Medidas de Variabilidade
ATIVIDADE 5.1
1) Marque a opção correta: Para a série amostral de valores 0, -1, -2, 5, 4, -3, -7, 2, -4 e 6:
a) ( ) a média é 3,4 e a variância, 17,8.
b) ( ) a média é zero e a variância, 16.
c) ( ) a média é 3,4 e a variância, 4.
d) ( ) a média é zero e a variância, 17,8.
e) ( ) a média é zero, mas é impossível calcular a variância.
2) Faça uma análise visual e observe qual série é mais dispersa:
X: 10,11,12,13 e
Y: 1, 110, 120, 130
Agora, comprove a sua a� rmação.
3) Calcule a variância da série amostral: 3 kg, 4kg e 7kg, indican-do o valor correto dentre as opções a seguir:
a) ( ) 4,3 kg
b) ( ) 2,9 kg2c) ( ) 2,9 kg2d) ( ) 4,3 kg
4) Calcule a variância, considerando os dois casos, população e a mostra, da série 31 Kbytes, 38 Kbytes , 19 Kbytes , 27 Kbytes , 24 Kbytes, 42 Kbytes , 32 Kbytes , 18 Kbytes , 43 Kbytes , 15 Kbytes, 39 Kbytes, indicando o valor correto dentre as opções a seguir:
2a) ( ) S = 90,7 Kbytes e 2 = 99,8 Kbytes
2 2b) ( ) S = 90,7 Kbytes e 2 2 = 99,8 Kbytes
2c) ( ) S = 90,7 e 2 = 99,8
2 2d) ( ) S = 99,8 Kbytes e 2 2 = 90,7 Kbytes
5) Suponha que adicionamos 500 a cada um dos valores de uma amostra. O que acontece com a média, desvio médio e a variância?
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:89LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:89 21/12/2010 17:31:1021/12/2010 17:31:10
90
Curso de Licenciatura em Informática
Capítulo 5
2d) VARIÂNCIA PARA DISTRIBUIÇÃO DE FREQUÊNCIA -σ
Quando os dados estiverem agrupados em intervalos de frequen-cia, a variância é calculada conforme a seguir:
Exemplo:
Cálculo da variância da série a seguir, que representa a variação interna ode computadores em C:
X: 0,0,1,1,1,1,1,1,2,2,2,2,2,2,2,2,2,2,2,2,3,3,3,3,3,3,3,4,4,4
Considerar os dados como populacional
Inicialmente, montar a DF:
Xi f i0 21 62 123 74 3
Em seguida, calcular a média:
xi f i xi . f i0 2 01 6 62 12 243 7 214 3 12
� = 30 xi . � = 63
2,1°C
Tabela 5.4 Distribuição de frequência
Tabela 5.5 Distribuição de frequência com Xi Fi
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:90LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:90 21/12/2010 17:31:1021/12/2010 17:31:10
91
Probabilidade e Estatística
Medidas de Variabilidade
Montar a tabela a seguir para facilitar os cálculos:
Xi f i xi − x (xi − x 2) (x−i x 2) fi 0 2 -2,1 4,41 8,821 6 -1,1 1,21 7,262 12 -0,1 0,01 0,123 7 0,9 0,81 5,674 3 1,9 3,61 10,83
� = 30 32,7Tabela 5.6 – Distribuição de frequência com 2(xi – x) . f i
Usamos a fórmula a seguir para calcular a variância:
Outra maneira de calcular a variância populacional é desenvolver o
somatório:
Tente resolver essa igualdade!
Assim, a variância para dados não agrupados � ca:
E para dados agrupados, a variância na população � ca:
ou
Para calcular a variância de dados agrupados amostrais, bastar
substituir o denominador n por (n-1) ou i por i-1
Uma das vantagens de calcular a variância dessa forma é o fato
de não usar a média, pois a média em alguns casos tem que ser
arredondada, o que gera erros de arredondamento. Nos casos
em que a média não é arredondada, as duas fórmulas fornecem
o mesmo resultado.
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:91LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:91 21/12/2010 17:31:1021/12/2010 17:31:10
92
Curso de Licenciatura em Informática
Capítulo 5
Exemplo:
Resolução do exemplo anterior, usando a segunda maneira de calcular a variância:
Montar a tabela a seguir:
2 2xi xi f i xi . f i xi . f i0 0 2 0 01 1 6 6 62 4 12 24 483 9 7 21 634 16 3 12 48Total � =30 xi . � = 63 2 xi . f i = 165
Calcular a variância:
Observou? Como não houve arredondamento na média, os dois va-lores da variância são idênticos, como já era esperado.
ATIVIDADE 5.2
1) Calcule a variância populacional das distâncias a seguir:
2m 13m 15m 20m2m 13m 15m 20m2m 13m 15m 20m2m 13m 15m 20m2m 13m 15m 20m2m 13m 15m 20m2m 13m 15m 20m2m 13m 15m 20m2m 13m 15m2m 13m 15m2m 13m 15m
13m 15m13m 15m13m 15m
Tabela 5.7 Distribuição de frequência com 2xi f i
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:92LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:92 21/12/2010 17:31:1121/12/2010 17:31:11
93
Probabilidade e Estatística
Medidas de Variabilidade
13m 15m13m 15m13m 15m13m 15m13m13m
Observe que a unidade da série está elevada ao quadrado (o 2C) , o que, sob o ponto de vista prático, é um inconveniente. Por esse motivo, imaginou-se uma nova medida com utilidade e interpre-tação prática.
A variância, na verdade, é uma medida que tem pouca utilidade como estatística descritiva pois ampli� ca os desvios, além de apre-sentar sua unidade ao quadrado; porém, é extremamente impor-tante na inferência estatística, além de ser base para o conceito de desvio padrão.
5.2.3 Desvio padrão – S
O desvio padrão, que é representado por s, é a medida de dispersão mais empregada no cálculo de variabilidade, pois elimina a ampli� cação dos desvios e sua unidade é a mesma da série de dados.
O desvio padrão por de� nição é simplesmente a raiz quadrada positiva da variância.
Assim, todas as fórmulas de variância são utilizadas no cálculo de desvio padrão; basta, é claro, tirar a raiz quadrada positiva das fórmulas da variância.
Exemplo:
Cálculo do desvio padrão populacional da série seguinte, que represen-ta a variação interna de computadores em oC:
X: 0,0,1,1,1,1,1,1,2,2,2,2,2,2,2,2,2,2,2,2,3,3,3,3,3,3,3,4,4,4
Como já calculada no exemplo anterior, a variância da série é s2 =1,09 (oC)2
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:93LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:93 21/12/2010 17:31:1221/12/2010 17:31:12
94
Curso de Licenciatura em Informática
Capítulo 5
O desvio padrão é a raiz quadrada de so 2 2 1,09 ( C)= , ou seja:
o1,04 C
O desvio padrão possui algumas propriedades, dentre as quais destacamos:
PROPRIEDADE 1
Se somarmos, ou subtrairmos, uma constante a todos os valores da série, o desvio padrão não se altera.
yi = xi ± c sy = sx
PROPRIEDADE 2
Se multiplicarmos, ou dividirmos, todos os valores da série por uma constante (diferente de zero), o desvio padrão � ca multipli-cado, ou dividido, por essa constante.
yi = xi . c sy = sx . c
ATIVIDADE 5.3
1) Marque a opção correta: Dados os conjuntos de números: A = {-2, -1, 0, 1, 2} e B = {220, 225, 230, 235, 240}.
Podemos a� rmar, de acordo com as propriedades do desvio pa-drão, que o desvio padrão de B é igual:
a) ( ) ao desvio padrão de A;
b) ( ) ao desvio padrão de A, multiplicado pela constante 5;
c) ( ) ao desvio padrão de A, multiplicado pela constante 5;
d) ( ) ao desvio padrão de A mais a constante 230.
2) Considere os seguintes conjuntos de números:
A = {10, 20, 30, 40, 50}
B = {100, 200, 300, 400, 500}
Que relação existe entre os desvios padrões dos dois conjuntos de números?
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:94LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:94 21/12/2010 17:31:1221/12/2010 17:31:12
95
Probabilidade e Estatística
Medidas de Variabilidade
3) Dados os conjuntos de números:
A = {220, 230, 240, 250, 260}
B = {20, 30, 40, 50, 60}
Que relação existe entre os desvios padrões dos dois conjuntos de números?
4) Suponha que adicionamos 100 a cada um dos valores de uma amostra. O que acontece com a média, desvio médio, variância e o desvio padrão?
5) Marque a opção correta: O desvio padrão de um conjunto de dados é 9. A variância será:
a) ( ) 3;
b) ( ) 18;
c) ( ) 36;
d) ( ) 81.
6) Marque a opção correta: A variância de um conjunto de dados é 9. desvio padrão será:
a) ( ) 3;
b) ( ) 18;
c) ( ) 36;
d) ( ) 81.
Na estatística descritiva, o desvio padrão por si só tem limitações. Veja o exemplo:
Um desvio padrão de 2 unidades pode ser considerado pequeno para uma série de valores cujo valor médio é 200; no entanto, se a média for igual a 20, o mesmo não pode ser dito. Além disso, o fato do desvio padrão ser expresso na mesma unidade dos dados limita o seu emprego quando desejamos comparar duas ou mais séries de valores, expressas em unidades diferentes.
Veja outro exemplo:
O desvio padrão da temperatura interna de computadores é 2,5 oC, enquanto o desvio padrão dos preços desses computadores é de R$ 30,00. A pergunta em relação à variabilidade é, quem variou mais a temperatura interna dos computadores ou os preços?
Para contornar essas di� culdades e limitações, iremos de� nir a se-guir o Coefi ciente de Variação de Pearson - CVP.
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:95LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:95 21/12/2010 17:31:1221/12/2010 17:31:12
96
Curso de Licenciatura em Informática
Capítulo 5
5.2.4 Coeficiente de variação de Pearson - CVP
O coe� ciente de variação de Pearson contorna as limitações de compa-ração de séries diferentes do desvio padrão.
O Coe� ciente de Variação de Pearson é a razão entre o desvio pa-drão e a média referente a dados de uma mesma série:
Exemplo:
Vamos tomar os resultados das estaturas e dos pesos de um grupo de indivíduos:
DISCRIMINAÇÃO MÉDIA DESVIO PADRÃOESTATURAS 175 cm 5,0 cm
PESOS 68 kg 2,0 kg
Qual das duas medidas, estatura ou peso, apresenta maior variabilidade?
Resposta:
Observe que não podemos compará-las, pois são séries diferentes; para resolver o problema, basta calcular o CVP da estatura e o CVP do peso. O resultado maior será o mais heterogêneo (maior dispersão ou variabilidade).
CVP estatura = ( 5 / 175 ) x 100 = 2,86 %
CVP peso = ( 2 / 68 ) x 100 = 2,94 %.
Logo, nesse grupo de alunos, os pesos apresentam maior grau de disper-são que as estaturas.
(Se tomássemos somente o desvio padrão para responder a pergunta, teríamos, com certeza, uma resposta errada).
Tabela 5.8 Estaturas e pesos de um grupo de alunos
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:96LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:96 21/12/2010 17:31:1221/12/2010 17:31:12
97
Probabilidade e Estatística
Medidas de Variabilidade
Observe! A série estatura apresenta maior desvio padrão; mesmo assim, é mais homogênea que a série peso, que apresenta menor desvio padrão.
ATIVIDADE 5.4
1) A renda média mensal na localidade A é R$ 1.750,00 e na lo-calidade B é R$ 1.500,00. Os desvios padrões são R$ 100,00 e R$ 80,00. Faça uma análise comparativa quanto ao grau de homoge-neidade da renda nessas duas localidades.
2) Um grupo de 95 moças tem estatura média de 160,6 cm, com um desvio padrão igual a 5,97 cm. Outro grupo de 128 moças tem uma estatura média de 161,9 cm, com um desvio padrão igual a 6,01 cm. Qual é o coe� ciente de variação de cada um dos grupos? Qual o grupo mais homogêneo?
3) Um grupo de 200 famílias tem renda média de R$ 1.063,8, com um coe� ciente de variação de 4,3%. Qual o desvio padrão da renda desse grupo?
4) Uma distribuição apresenta as seguintes estatísticas: S = 2,6 e CVP = 1,9%. Determine a média dessa distribuição.
5) Numa pequena cidade, 165 famílias têm a renda média de R$ 1.350,98, com um desvio padrão de R$ 55,98. Qual a variabilidade relativa das famílias?
ATIVIDADE 5.5
Após construir o histograma e a curva polida do seu trabalho prá-tico, calcule a média, a mediana e o primeiro, o segundo e o ter-ceiro quartis; calcule também os percentis (P15,P25,P35,P50,P75 e P80) e o coe� ciente de variação de Pearson.
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:97LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:97 21/12/2010 17:31:1221/12/2010 17:31:12
98
Curso de Licenciatura em Informática
Capítulo 5
Chegamos ao � nal deste capítulo, em que aprendemos a calcular as medidas de variabilidade. Observe, no exemplo mostrado no início do capítulo, envolvendo os tráfegos de dados de duas redes de com-putadores, que temos:
Primeiro caso:
2 computadores que se comunicam a 49 Mbps e 51 Mbps
Velocidade média = 50 Mbps e desvio padrão = 1 Mbps
Segundo caso:
2 computadores que se comunicam a 1 Mbps e 99 Mbps
Velocidade média = 50 Mbps e desvio padrão = 49 Mbps
Ou seja, no primeiro caso teremos uma média de 50 Mbps com uma pequena variação de velocidade (desvio padrão = 1Mbps), enquan-to que no segundo caso temos também a mesma média de 50 Mbps, só que neste caso com uma grande variação de velocidade (desvio padrão = 49 Mbps). Embora já no início, intuitivamente, você tenha percebido o conceito de variabilidade, para esse exemplo simples, o desvio padrão na realidade quanti� ca a variabilidade para qual-quer série de dados, e aí sim você poderá comparar os dados.
Concluindo, a média não é uma medida su� ciente por si só, necessi-ta-se de mais informações para se representar uma série de dados.
Vamos adiante!
Prof. Sebastião A. Carneiro
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:98LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:98 21/12/2010 17:31:1321/12/2010 17:31:13
PROBABILIDADE
Prezado(a) Aluno(a)!
Neste capítulo, estudaremos o cálculo das probabilidades, pois a maioria dos fenômenos de que trata a Estatística é de natureza ale-atória ou probabilística; na informática, também é assim. Veja o exemplo:
Quando ocorre um problema de comunicação de dados no sistema de uma empresa, surge logo a pergunta: “Qual a probabilidade de recuperação de dados?”
Bons estudos!
Prof. Sebastião A. Carneiro
Antes de entramos em probabilidade, temos que entender alguns con-ceitos importantes.
6.1 Experimento aleatório
Experimentos aleatórios são fenômenos que, mesmo repetindo-se várias vezes sob condições semelhantes, apresentam resultados imprevisíveis. Ou seja o resultado � nal depende do acaso.
Exemplo:
Da a� rmação “é provável que o meu time ganhe a partida hoje”, pode resultar:
• que ele ganhe;
• que ele perca;
• que ele empate.
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:99LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:99 21/12/2010 17:31:1321/12/2010 17:31:13
100
Curso de Licenciatura em Informática
Capítulo 6
6.2 Espaço amostral
Espaço amostral é o conjunto universo ou o conjunto de resulta-dos possíveis de um experimento aleatório.
Exemplos:
a) No experimento aleatório “lançamento de uma moeda” temos o espa-ço amostral {cara, coroa}.
Figura 20 - Moeda
b) No experimento aleatório “lançamento de um dado” temos o espaço amostral {1, 2, 3, 4, 5, 6}.
Figura 21 - Dado
c) No experimento aleatório “dois lançamentos sucessivos de uma moe-da” temos o espaço amostral {(ca, ca), (co, co), (ca, co), (co, ca)}.
Obs.: Cada elemento do espaço amostral que corresponde a um resultado recebe o nome de ponto amostral. No primeiro exem-plo, cara pertence ao espaço amostral {cara, coroa}.
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:100LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:100 21/12/2010 17:31:1321/12/2010 17:31:13
101
Probabilidade e Estatística
Probabilidade
1) Conhecendo o baralho!
Espaço amostral do baralho de 52 cartas:
Cartas pretas = 26
Paus = 13 (Ás, 2, 3, 4, 5, 6, 7, 8, 9, 10, valete, dama, rei)
Espadas = 13 (Ás, 2, 3, 4, 5, 6, 7, 8, 9, 10, valete, dama, rei)
Cartas vermelhas = 26
• Ouros = 13 (Ás, 2, 3, 4, 5, 6, 7, 8, 9, 10, valete, dama, rei)
• Copas = 13 (Ás, 2, 3, 4, 5, 6, 7, 8, 9, 10, valete, dama, rei)
Observar que temos cartas comuns (Ás, 2, ...rei) por tipo de nai-pe (paus, espada, ouro e copa); esta observação será importante quando estudarmos eventos não mutuamente excludentes.
Naipe é o nome dado às “famílias” ou tipos das cartas de um baralho.
2) O Espaço amostral no lançamento de 2 dados é 36.
1 1 2 1 3 1 4 1 5 1 6 11 2 2 2 3 2 4 2 5 2 6 21 3 2 3 3 3 4 3 5 3 6 31 4 2 4 3 4 4 4 5 4 6 41 5 2 5 3 5 4 5 5 5 6 51 6 2 6 3 6 4 6 5 6 6 6
6.3 Eventos
Evento é qualquer subconjunto do espaço amostral.
Se considerarmos S como espaço amostral e E como evento: as-sim, qualquer que seja E, se E S (E está contido em S), então E é um evento de S.
1) Se E = S, E é chamado de evento certo.
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:101LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:101 21/12/2010 17:31:1421/12/2010 17:31:14
102
Curso de Licenciatura em Informática
Capítulo 6
Exemplo:
No lançamento de um dado.
Evento obter um número menor que 6.
2) Se E for unitário, E é chamado de evento elementar.
Exemplo:
No lançamento de um dado.
Evento obter um número igual a 6.
3) Se E = Ø, E é chamado de evento impossível.
Exemplo:
No lançamento de um dado.
Evento obter um número igual a 7.
ATIVIDADE 6.1
1) No lançamento de duas moedas (uma de 10 centavos e outra de 5 centavos) responda:
a) qual é o espaço amostral?
b) formule os eventos de� nidos pelas sentenças:
• obter só cara;
• obter pelo menos uma cara;
• obter apenas um cara;
• obter no máximo duas caras;
• obter uma cara e uma coroa;
• obter uma cara ou uma coroa.
2- No lançamento de dois dados, responda:
a) qual é o espaço amostral?
b) Formule os eventos de� nidos pelas sentenças:
• obter a soma dos dados inferior a 8;
• obter a soma dos dados superior a 8;
• obter a soma dos dados exatamente 5;
• obter um dado ímpar outro par;
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:102LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:102 21/12/2010 17:31:1421/12/2010 17:31:14
103
Probabilidade e Estatística
Probabilidade
6.4 Conceito de probabilidade
A de� nição clássica de probabilidade de um evento A, denotada por P(A), para eventos equiprováveis é:
P (A) =
Probabilidade é um número real que satisfaz aos seguintes axiomas:
I) 0 P(A) 1
II) P(S) = 1
III) Se A e B forem eventos mutuamente excludentes {AB}= ,
então P(AB) = P(A) + P(B)
Os 3 axiomas devem ser bem entendidos, por isso vamos comentá-los.
O primeiro axioma 0 ≤ P(A) ≤ 1 indica que a menor probabilida-
de de um evento ocorrer é zero e a maior probabilidade é 1.
Exemplo 1:
P(A)=0 indica que a probabilidade de um evento ocorrer é 0 (evento impossível).
No lançamento de um dado, qual a probabilidade de ocorrer 5,5? A resposta é probabilidade igual zero, pois P(A)=0/6=0.
Exemplo 2:
P(A)=1 indica que a maior probabilidade de um evento ocorrer é 1(evento certo).
No lançamento de um dado, qual a probabilidade de ocorrer um número menor ou igual a 6? A resposta é qualquer resultado é pos-sível, logo P(A) = 6/6=1. Com isso, esclarecemos também o segundo axioma P(S)=1.
Veremos o terceiro axioma mais adiante, quando estudarmos even-tos mutuamente excludentes.
nº. de vezes que o evento A pode ocorrernº. de vezes que o espaço amostral S ocorre
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:103LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:103 21/12/2010 17:31:1421/12/2010 17:31:14
104
Curso de Licenciatura em Informática
Capítulo 6
Obs.: Quando todos os elementos do espaço amostral têm a mes-ma chance de acontecer, o espaço amostral é chamado de conjun-to equiprovável.
Exemplo:
No lançamento de um dado, todos os 6 números têm a mesma chance
de acontecer.
Exemplos:
1) No lançamento de uma moeda, qual a probabilidade de se obter cara em um evento A?
S = {ca, co } = 2 A = {ca} = 1 P(A) = 1/2 = 0,5 = 50%
2) No lançamento de um dado, qual a probabilidade de se obter um número par em um evento A?
S = {1,2,3,4,5,6 } = 6 A = {2,4,6 } = 3 P(A) = 3/6 = 0,5 = 50%
3) No lançamento de um dado, qual a probabilidade de se obter um número menor ou igual a 6 em um evento A?
S = {1,2,3,4,5,6 } = 6 A = {1,2,3,4,5,6 } = 6 P(A) = 6/6 = 1,0 = 100%
A probabilidade de todo evento certo é 1 ou 100%.
4) No lançamento de um dado, qual a probabilidade de se obter um número maior que 6 em um evento A?
S = {1,2,3,4,5,6 } = 6 A = { >6 } = 0 P(A) = 0/6 = 0 = 0%
A probabilidade de todo evento impossível é 0 ou 0%.
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:104LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:104 21/12/2010 17:31:1521/12/2010 17:31:15
105
Probabilidade e Estatística
Probabilidade
6.4.1 Eventos complementares
Sabemos que um evento pode ocorrer ou não. Sendo p a probabi-lidade de que ele ocorra (sucesso) e q a probabilidade de que ele não ocorra (insucesso), para um mesmo evento existe sempre a relação:
p + q = 1
Exemplo:
Sabemos que a probabilidade de tirar o nº. 4 no lançamento de um dado é p =1/6. Logo, a probabilidade de não se tirar o nº. 4 no lançamento de um dado é q = 5/6.
Assim, temos: p+q = 1/6 + 5/6 = 1
6.4.2 Combinações dos eventos
Muitas aplicações da estatística exigem a determinação da probabilidade de combinações dos eventos. Há duas características de combinações: pode ser necessário determinar a probabilidade de ambos os eventos acontecerem P(A e B) ou a probabilidade de ocorrer apenas um deles, A ou B, ou seja, P(A ou B).
Veja o exemplo a seguir:
Em uma empresa de informática com 2 elevadores, poderíamos per-guntar: qual a probabilidade de ambos elevadores estarem em serviço? Ou então: qual a probabilidade de um(A) ou outro(B) elevador estar em serviço?
Observe que:
a) ambos implica P(A e B);
b) um ou outro implica P(A ou B).
a) EVENTOS INDEPENDENTES
Eventos são independentes quando a ocorrência de um não interfere na ocorrência de outro.
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:105LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:105 21/12/2010 17:31:1521/12/2010 17:31:15
106
Curso de Licenciatura em Informática
Capítulo 6
Exemplo 1:
Quando lançamos dois dados, o resultado obtido em um deles indepen-de do resultado obtido no outro.
Exemplo 2:
Agora, se eu retiro uma carta do baralho, sem reposição, a probabili-dade de retirar outra carta do mesmo baralho é afetada pela retirada da primeira; logo, a retirada de cartas de um baralho, sem reposição, não são eventos independentes.
Probabilidade de retirada da primeira carta de um baralho de 52 cartas é 1/52.
Probabilidade de retirada da segunda carta do baralho, sem reposição, é 1/51.
Exemplo 3:
Agora, se eu retiro uma carta do baralho, com reposição, a probabilida-de de retirar outra carta do mesmo baralho não é afetada pela retirada da primeira; logo, a retirada de cartas de um baralho, com reposição, são eventos independentes.
Probabilidade de retirada da primeira carta de um baralho de 52 cartas é 1/52.
Probabilidade de retirada da segunda carta do baralho, com reposição, é 1/52.
b) REGRA DO PRODUTO (regra do “e”)
A probabilidade de ocorrência simultânea de dois ou mais eventos in-dependentes é igual ao produto das probabilidades de ocorrências em separado; ou seja, a probabilidade de que tais eventos se realizem simul-taneamente é dada pelo princípio multiplicativo:
Ptotal = P(A e B) = P(A) x P(B)
Exemplo:
No lançamento de dois dados, qual a probabilidade de obtenção de 2 no primeiro dado e de 5 no segundo dado?
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:106LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:106 21/12/2010 17:31:1521/12/2010 17:31:15
107
Probabilidade e Estatística
Probabilidade
P1 (X=2)=1/6 e P2(X=5)=1/6
Assim:
P total = P (X=2) x P (X=5) = 1/6 x 1/6 = 1/36
Assim, a probabilidade de obtenção de 2 no primeiro dado e de 5 no segundo dado é 1/36.
c) EVENTOS MUTUAMENTE EXCLUSIVOS
Dois ou mais eventos são mutuamente exclusivos quando a realização de um exclui a realização do outro.
Exemplo 1:
Assim, no lançamento de uma moeda, o evento “tirar cara” e o evento “tirar coroa” são mutuamente exclusivos, já que, ao se realizar um deles, o outro não se realiza.
Exemplo 2:
Uma mulher grávida ter um menino de olhos castanhos ou uma meni-na de olhos azuis são mutuamente exclusivos, já que, ao se realizar um deles, o outro não se realiza.
Exemplo 3:
Numa partida de futebol, um time tem as seguintes chances: vencer, empatar ou perder. Estas chances são eventos mutuamente exclusivos, já que, ao se realizar um deles, o outro não se realiza.
d) PRINCÍPIO DA ADIÇÃO (regra do ou)
Se dois eventos são mutuamente exclusivos, quando a realização de um exclui a realização do outro, a probabilidade de que um ou outro se rea-lize é igual à soma das probabilidades de que cada um deles se realize.
Ptotal = P(1 ou 2) = P(1) + P(2)
A palavra-chave aqui é a conjunção OU
• Na realidade é o OU inclusive, que signi� ca um, ou outro, ou ambos.
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:107LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:107 21/12/2010 17:31:1521/12/2010 17:31:15
108
Curso de Licenciatura em Informática
Capítulo 6
Exemplo 1:
Qual a probabilidade de sair face ímpar no arremesso de um dado?P (1 ou 3 ou 5) = P(1) + P(3) + P(5);
Exemplo 2:
Qual a probabilidade de sair face ímpar OU superior a 5 no arremesso de um dado?
P ([ímpar] ou [6] ) = ?
P ([1 ou 3 ou 5] ou[6] ) = P(1) + P(3) + P(5) + P(6)
P (A ou B) = P (ocorrência de A, ou de B, ou de ambos)
No lançamento de um dado, qual a probabilidade de se tirar o nº. 3 ou
o nº. 4?
Os dois eventos são mutuamente exclusivos, então: P = 1/6 + 1/6 = 2/6 = 1/3
Exemplo 3:
Sabendo que a probabilidade de uma mulher grávida ter um menino de olhos castanhos é 3/8 ou uma menina de olhos azuis é de 1/8, pede-se: qual a probabilidade de uma mulher grávida ter um menino de olhos castanhos ou uma menina de olhos azuis?
P(A) = P(menino de olhos castanhos) = 3/8
P(B) = P(meninas de olhos azuis) = 1/8
P(A U B) = P(A) + P(B)= 3/8 + 1/8 = 1/2
e) EVENTOS NÃO MUTUAMENTE EXCLUDENTES
Dois ou mais eventos são não mutuamente excludentes quando há ele-mentos comuns entre os eventos. Assim, num baralho, o evento “tirar ÁS” e o evento “tirar COPAS” são não mutuamente excludentes, pois temos uma carta de ÁS que também é copa.
Na probabilidade da união de dois eventos, A e B, quando há elementos comuns, devemos excluir as probabilidades dos elementos comuns a A e B para não serem computadas duas vezes. Assim:
Ptotal= P(A) + P(B) - P(A e B)
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:108LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:108 21/12/2010 17:31:1521/12/2010 17:31:15
109
Probabilidade e Estatística
Probabilidade
Exemplo:
Retirando-se uma carta de um baralho de 52 cartas, qual a probabilida-de de a carta retirada ser um ÁS ou uma carta de COPAS?
Copas = 13 (Ás, 2, 3, 4, 5, 6, 7, 8, 9, 10, valete, dama, rei)
P(ÁS)= 4/52 (Ás de paus, Ás de ouro, Ás de espada e Ás de copas)
P(Copas)= 13/52 (Ás, 2, 3, 4, 5, 6, 7, 8, 9, 10, valete, dama, rei)
Observar que o “Ás de copas” repetiu 2 vezes e, na realidade, só temos uma carta, daí a necessidade de retirá-la uma vez da fórmula de adição.
P(ÁS e Copas) = P(ÁS) + P(Copas) - P(ÁS e Copas) = 4/52 + 13/52 - 1/52 =
16/52
ATIVIDADE 6.2
Responda as questões a seguir:
1) Qual a probabilidade de sair o ÁS de ouros quando retiramos uma carta de um baralho de 52 cartas?
2) Qual a probabilidade de sair um REI quando retiramos uma carta de um baralho de 52 cartas?
3) Em um lote de 12 peças, 4 são defeituosas. Sendo retirada uma peça, calcule:
a) a probabilidade de essa peça ser defeituosa;
b) a probabilidade de essa peça não ser defeituosa.
4) De dois baralhos de 52 cartas retiram-se, simultaneamente, uma carta do primeiro baralho e uma do segundo. Qual a proba-bilidade de a carta do primeiro baralho ser um REI e a do segun-do ser o 5 de paus?
5) Uma urna A contém: 3 bolas brancas, 4 pretas, 2 verdes; uma urna B contém: 5 bolas brancas, 2 pretas, 1 verde; uma urna C contém: 2 bolas brancas, 3 pretas, 4 verdes. Uma bola é retirada de cada urna. Qual é a probabilidade de as três bolas retiradas da 1ª, 2ª e 3ª urnas serem, respectivamente, branca, preta e verde?
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:109LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:109 21/12/2010 17:31:1521/12/2010 17:31:15
110
Curso de Licenciatura em Informática
Capítulo 6
6) De um baralho de 52 cartas retiram-se, ao acaso, duas cartas sem reposição. Qual é a probabilidade de a primeira carta ser o ÁS de paus e a segunda ser o REI de paus?
7) Qual a probabilidade de sair uma � gura (rei, dama ou valete) quando retiramos uma carta de um baralho de 52 cartas?
8) São dados dois baralhos de 52 cartas. Tiramos, ao mesmo tem-po, uma carta do primeiro baralho e uma carta do segundo. Qual a probabilidade de tirarmos uma DAMA e um REI, não necessa-riamente nessa ordem?
9) Duas cartas são retiradas de um baralho sem haver reposição. Qual a probabilidade de ambas serem COPAS ou ESPADAS?
10) Duas bolas são retiradas (sem reposição) de uma urna que contém 2 bolas brancas e 3 bolas pretas. Qual a probabilidade d e que a 1ª seja branca e a 2ª seja preta?
11) Duas bolas são retiradas (com reposição) de uma urna que contém 2 bolas brancas e 3 bolas pretas. Qual a probabilidade de que a 1ª seja branca e a 2ª seja preta?
12) Duas bolas são retiradas (sem reposição) de uma urna que contém 2 bolas brancas, 3 bolas pretas e 5 bolas verdes, pede-se:
a) Qual a probabilidade de que ambas sejam verdes?
b) Qual a probabilidade de que ambas sejam da mesma cor?
13) Jogam-se três dados. Qual a probabilidade de que a soma dos pontos obtidos seja superior a 14?
14) Um baralho de 52 cartas é subdividido em 4 naipes: copas, espadas, ouros e paus.
a) Retirando-se uma carta ao acaso, qual a probabilidade de que ela seja de ouros ou de copas?
b) Retirando-se duas cartas ao acaso com reposição da primeira carta, qual a probabilidade de ser a primeira de ouros e a segunda de copas? E se não houver reposição da primeira carta, qual a pro-babilidade de ser a primeira de ouros e a segunda de copas?
c) Havendo reposição, qual a probabilidade de sair à primeira car-ta de ouros ou a segunda de copas?
15) Uma urna contém 7 bolas gravadas com as letras A ,A ,A ,C, C, R, R. Extraindo-se as bolas uma por uma, qual a probabilidade de se obter a palavra CARCARÁ?
16) Uma urna contém 3 bolas brancas e 4 bolas pretas. Extraindo-se, simultaneamente, 3 bolas da urna, calcule a probabilidade de que:
a) Pelo menos duas sejam brancas;
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:110LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:110 21/12/2010 17:31:1621/12/2010 17:31:16
111
Probabilidade e Estatística
Probabilidade
b) Pelo menos uma seja preta.
17) Uma caixa contém 5 bolas brancas e 3 bolas pretas. Duas bo-las são retiradas simultaneamente ao acaso e substituídas por três bolas azuis. Em seguida, duas novas bolas são retiradas ao acaso da caixa, pede-se:
a) Calcule a probabilidade de que essas duas últimas bolas sejam da mesma cor.
b) Se as duas últimas bolas retiradas forem uma branca e uma pre-ta, calcule a probabilidade de que, na primeira extração, tenham saído duas bolas brancas
Para utilizar o método clássico de probabilidade, é necessário co-nhecer o número total de resultados possíveis de um experimento; ou seja, seu espaço amostral. Em geral, isso não é tão simples; nesse caso, empregam-se técnicas de contagem para calcular esse número. É o que veremos a seguir.
6.5 Técnicas de contagem em probabilidade
As técnicas de contagem fazem uso de fórmulas de análise combinató-ria para o cálculo do número de casos favoráveis e do número de casos possíveis.
Figura 22: Cadeado com segredo
6.5.1 Permutação sem repetições
Permutação é a análise de todas as trocas de posições entre todas as variáveis envolvidas.
Exemplo: Todas as combinações possíveis das variáveis X,Y e Z. ( n=3)
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:111LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:111 21/12/2010 17:31:1621/12/2010 17:31:16
112
Curso de Licenciatura em Informática
Capítulo 6
1ª possibilidade X Y Z2ª possibilidade X Z Y3ª possibilidade Y X Z4ª possibilidade Y Z X5ª possibilidade Z Y X6ª possibilidade Z X Y
p = 3!
Por observação, temos: P = 6= 3.2.1= 3!3
Portanto, analisando o exemplo anterior, podemos concluir que, para permutações sem repetições, temos:
P = n!n
Lembre-se de que:
O símbolo n! é lido “n fatorial”;
1! =1;
0!=1
6.5.2 Permutação com repetições
Permutação com repetições das variáveis envolvidas está disponível na sala virtual.
X,X,Y,YY,Z,Z,Z,Z
6.5.3 Arranjo
Arranjo simples é o tipo de agrupamento sem repetição em que um grupo é diferente de outro pela ordem ou pela natureza dos elementos componentes.
Exemplo 1:
As duas (p=2) combinações possíveis das variáveis X,Y e Z (n=3)
1 X Y Z
Tabela 6.1 Permutações possíveis de 3 variáveis X,Y e Z
Tabela 6.2 Possibilidades de agrupamento de 3 variáveis X,Y,Z em 2 posições.
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:112LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:112 21/12/2010 17:31:1621/12/2010 17:31:16
113
Probabilidade e Estatística
Probabilidade
2 X Z Y3 Y X Z4 Y Z X5 Z Y X6 Z X Y
p = 2
Ou seja: A = 6 3,2
Em que:
6 = 3! / 1 em que: 1 = (3-2)! = 1! =1
Exemplo 2:
Todas as combinações possíveis das variáveis X,Y e Z , usando-se somente
uma posição.
1 X2 X3 Y
p = 1
Ou seja: A = 33,1
Em que:
3! / 2 em que: 2 = (3-1)! = 2! =2
Exemplo 3:
As duas (p=2) combinações possíveis das variáveis X,Y, Z e H. (n = 4)
1 X Y2 X Z3 X H4 Y X5 Y Z6 Y H7 Z X8 Z Y9 Z H10 H X
Tabela 6.3 Possibilidades de agrupamento de 3 variáveis X,Y,Z em 1 posição.
Tabela 6.4 Possibilidades de agrupamento de 4 variáveis X,Y,Z em 2 posições
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:113LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:113 21/12/2010 17:31:1721/12/2010 17:31:17
114
Curso de Licenciatura em Informática
Capítulo 6
11 H Y12 H Z
p = 2
Ou seja: A = 12 4,2
Em que:
4! = 24
4! / 2 em que: 2 = (4-2)! = 2! =2
Portanto, analisando os exemplos anteriores, podemos concluir que, para arranjo, temos:
6.5.4 Combinação
Combinação tem o mesmo conceito de arranjo, só que as inversões de posições não devem ser consideradas (A B = B A); ou seja, a combina-ção das naturezas das variáveis é que importa.
Combinação = Arranjo pela natureza, a posição não importa.
Exemplo 1: As duas (p=2) combinações possíveis das variáveis X,Y e Z (n=3).
Arranjo Combinação Combinação1 X Y 1 X Y 1 X Y2 X Z 2 X Z 2 X Z3 Y X 3 Y X4 Y Z 4 Y Z 3 Y Z5 Z Y 5 Z Y6 Z X 6 Z XA p = 2 C p = 2 C p = 23,2 3,2 3,2
Ou seja: C = 33,2
Em que:
C = A / 2 3,2 3,2
Tabela 6.5 Possibilidades de agrupamento de 2 variáveis X,Y em 2 posições.
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:114LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:114 21/12/2010 17:31:1721/12/2010 17:31:17
115
Probabilidade e Estatística
Probabilidade
2 = 2! =2 Observar: p = 2.
Assim, temos:
C = A / 2 = A / 3,2 3,2 3,2
Exemplo 2:
Todas as combinações possíveis das variáveis X, Y e Z , usando somente uma posição.
Arranjo Combinação1 X 1 X2 Y 2 Y3 Z 3 ZA = 33,1 p = 1 C = 33,1 p = 1
Ou seja: C = 33,1
Em que:
C = A / 13,1 3,1
1 = 1! =1 Observar: p = 1.
Assim, temos:
C = A / 1 = A / p3,1 3,1 3,1
Exemplo 3:
As duas (p = 2) combinações possíveis das variáveis X, Y, Z e H (n = 4).
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:115LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:115 21/12/2010 17:31:1721/12/2010 17:31:17
116
Curso de Licenciatura em Informática
Capítulo 6
Arranjo Combinação Combinação1 X Y 1 X Y 1 X Y2 X Z 2 X Z 2 X Z3 X H 3 X H 3 X H4 Y X 4 Y X5 Y Z 5 Y Z 4 Y Z6 Y H 6 Y H 5 Y H7 Z X 7 Z X8 Z Y 8 Z Y9 Z H 9 Z H 6 Z H10 H X 10 H X11 H Y 11 H Y12 H Z 12 H Zp = 2 p = 2 p = 2A = 12 C = 64,2 4,2
Ou seja: C = 64,2
Em que:
C = A / 23,1 4,2
2 = 2! =2.1 Observar: p = 2.
Assim, temos:
C = A / 2 = A / p4,2 4,2 4,2
Portanto, analisando os exemplos anteriores, podemos concluir que, para combinações, temos:
ATIVIDADE 6.3
Responda as questões a seguir:
1) Dispondo de seis cores, de quantas formas distintas podemos pintar uma bandeira com três listras verticais de cores diferentes?
2) Numa classe de 20 alunos, o professor deseja montar grupos de cinco para trabalhar no laboratório. Quantos grupos distintos ele poderá formar?
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:116LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:116 21/12/2010 17:31:1821/12/2010 17:31:18
117
Probabilidade e Estatística
Probabilidade
3) Quantos subconjuntos de quatro elementos possuem um con-junto de oito elementos?
4) Um baralho comum possui 52 cartas. De quantas formas dis-tintas um jogador pode receber cinco cartas?
5) Existem 5 estradas que ligam as cidades A e B e 6 estradas que ligam B e C. De quantas formas distintas é possível ir de A até C passando por B?
6) Numa prova classi� catória para as olimpíadas, 10 atletas dis-putam os 800 metros. Sabendo-se que apenas os quatro primei-ros serão classi� cados para as � nais, quantos resultados possíveis existem para os quatro primeiros lugares?
07) Com os algarismos 1, 2, 3, 4, 5, 6, 7, 8 e 9:
Quantos números de quatro algarismos podem ser formados?
Quantos números pares de três algarismos distintos podem ser escritos?
08) Quantas chapas de carro com três letras e três algarismos é possível formar, considerando que temos 26 letras no alfabeto?
09) Quantos números de telefone com sete algarismos e pre� xos 237 podem ser formados, considerando que temos 26 letras no alfabeto?
10) Será feita uma prova contendo 10 perguntas, às quais se deve responder com V (verdadeiro) ou F (falso). É obrigatório respon-der a todas. De quantas maneiras distintas isso poderá ser feito?
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:117LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:117 21/12/2010 17:31:1821/12/2010 17:31:18
118
Curso de Licenciatura em Informática
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:118LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:118 21/12/2010 17:31:1821/12/2010 17:31:18
VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÕES DISCRETAS
Prezado(a) aluno(a)!
Apresentaremos, neste capítulo, modelos de distribuição de proba-bilidade, o que permitirá a solução de grande número de problemas práticos.
Bons estudos!
Prof. Sebastião A. Carneiro
7.1 Variável aleatória
Suponha um espaço amostral S e atribuímos um número a cada ponto amostral. Fica de� nida, então, uma função chamada variável aleatória. Muitas vezes, não estamos interessados propriamente no resultado de um experimento aleatório, mas sim em alguma característica numérica a ele associada. Essa característica associada, a qual será chamada vari-ável aleatória.
Assim, se o espaço amostral relativo ao “lançamento simultâneo de duas moedas” é S = {(ca,ca), (ca,co), (co,ca), (co,co)} e se X representa o “nú-mero de caras” que aparece, a cada ponto amostral podemos associar um número para X, de acordo com a tabela abaixo:
Ponto Amostral Variável aleatória (X)(ca,ca) 2(ca,co) 1(co,ca) 1(co,co) 0
Tabela 7.1 Variável aleatória associada ao número de caras
Lembre-se de que a variável aleatória nesse exemplo está asso-ciada ao número de caras; nesse caso, para a condição (ca,ca) = (cara, cara) X=2 (ou seja, 2 caras) e (ca,co) = (cara, coroa)X=1 (ou seja, 1 cara) e assim por diante.
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:119LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:119 21/12/2010 17:31:1821/12/2010 17:31:18
120
Curso de Licenciatura em Informática
Capítulo 7
7.2 Distribuição de probabilidade
Seja X uma variável aleatória que pode assumir os valores X , X , 1 2
X3, ..., Xn. A cada valor X i correspondem pontos do espaço amos-tral. Associamos, então, a cada valor Xi a probabilidade Pi de ocor-rência de tais pontos no espaço amostral.
Assim, temos:
Os valores X , X1 2, ..., Xn e seus correspondentes P , P1 2, ..., Pn de� -nem uma distribuição de probabilidade.
Para estabelecer a distribuição de probabilidade, acompanhe os passos da tabela a seguir:
Ponto Amostral
Variável Aleatória (X) Comentário
Possibilidade ou frequência de X ocorrer
(ca,ca) 2 2 caras 1 vez(ca,co) 1 1 cara
2 vezes(co,ca) 1 1 cara(co,co) 0 Zero cara 1 vez
Observe que, no lançamento simultâneo de duas moedas, 2 caras só podem ocorrer uma vez; já uma cara pode ocorrer duas vezes e ne-nhuma cara, só uma vez. Assim, o espaço amostral do lançamento simultâneo de duas moedas é 2 caras, 1 cara e nenhuma cara.
Número de caras (X) Frequência Probabilidade (X)2 1 1/41 2 2/40 1 1/4Total 4 4/4 = 1
Tabela 7.2 Possibilidade da Variável Aleatória ocorrer.
Tabela 7.3 Probabilidade da Variável Aleatória X ocorrer.
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:120LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:120 21/12/2010 17:31:1921/12/2010 17:31:19
121
Probabilidade e Estatística
Variáveis Aleatórias e Distribuições Discretas
Assim, � nalmente podemos escrever a distribuição de probabilidade:
Número de caras (X) Probabilidade (X)2 1/41 2/40 1/4
Total 4/4 = 1
Ao de� nir a distribuição de probabilidade, estabelecemos uma cor-respondência unívoca entre os valores da variável aleatória X e os valores da variável P (probabilidade). Essa correspondência de� ne uma função em que os valores xi formam o domínio da função e os valores pi, o seu conjunto imagem.
Exemplo 1:
Determine a distribuição de probabilidade considerando a distribuição de frequências relativa ao número de acidentes diários na Rodovia do Sol, durante o mês de novembro/2005.
Número de Acidentes Frequência0 221 52 23 1
Podemos então, escrever a tabela de distribuição de probabilidade:
Número de Acidentes (X) Probabilidade (X)0 22/30 = 0,7331 5/30 = 0,1672 2/30 = 0,073 1/30 = 0,03
Total 30/30 = 1,00
Foi construída uma tabela em que aparecem os valores de uma variável aleatória X e as probabilidades de X ocorrer, é a tabela de distribuição de probabilidades.
Tabela 7.4 Distribuição de Probabilidade da Variável Aleatória X.
Tabela 7.5 Número de acidentes diários na rodovia do SOL.
Tabela 7.6 Distribuição de probabilidade do número de acidentes diários na rodovia do Sol
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:121LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:121 21/12/2010 17:31:1921/12/2010 17:31:19
122
Curso de Licenciatura em Informática
Capítulo 7
Repare que:
• ao operar com variáveis aleatórias, estamos trabalhando com distribuições de frequências relativas;
• a VA, do Exemplo 1, foi obtida com base em uma população conhecida.
Existem situações nas quais a variável aleatória pode ser gerada com base em cenários de� nidos pela opinião de um grupo de pesso-as acerca de um determinado assunto; por exemplo, a rentabilidade do mercado de ações nos próximos 12 meses.
ATIVIDADE 7.1
Responda as questões a seguir:
1) Na tabela a seguir está registrado o número de atendimentos para manutenção em computadores, prestados por uma empresa de informática, durante um período de 50 dias.
Manutenção Dias3 34 75 126 147 108 4
Pedem-se: a distribuição de probabilidade e o histograma de probabilidade.
Prezado(a) aluno(a)!
Você pode estar se perguntando agora: “Tudo bem, estou estudan-do distribuição de probabilidade, mas onde eu realmente vou usar isso?” Vou tentar exempli� car rapidamente sua utilidade.
No caso do exemplo da Rodovia do Sol, alguém poderia perguntar: qual o número de acidentes esperado para hoje?
O conceito a ser dado no item seguinte utilizará o conhecimento de distribuição de probabilidade para responder a essa pergunta. En-tão, não perca o próximo item e a resposta deste questionamento.
Bons estudos!
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:122LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:122 21/12/2010 17:31:1921/12/2010 17:31:19
123
Probabilidade e Estatística
Variáveis Aleatórias e Distribuições Discretas
7.3 Valor esperado (esperança matemática)
O valor esperado de uma variável aleatória ou de uma função de variável aleatória corresponde à média ponderada dos valores que essa variável aleatória ou essa função assume, usando-se como pesos para ponderação as probabilidades correspondentes a cada valor.
Para o caso de uma variável aleatória discreta “x”, podemos escrever:
Como sempre ∑ pi = 1, teremos:
E (x) = ∑ ( xi . pi )
Exemplo 7.2:
Uma instituição vende bilhetes de rifas por R$ 5,00 cada um. Há 10 prêmios no valor de R$ 25,00 e um prêmio maior no valor de R$ 100,00. Se forem vendidos 200 bilhetes, e você comprar um deles, qual a sua expectativa em relação ao sorteio?
Prêmios pago (xi) Probabilidade de ocorrer o prêmio
Valor esperado xi . p(xi)
0 189/200 025 10/200 250/200100 1/200 100/200
∑ p(xi)=1 ∑xi. p(xi)=1,75
Tabela 7.7 Distribuição de probabilidade rateio dos prêmios
O valor esperado é E(x)=1,75.
Como interpretar a resposta valor esperado E(x)=1,75?
Em longo prazo, haverá um retorno para você de R$ 1,75; ou seja, dos R$ 5,00 que você jogou, retornará para você só R$ 1,75. O que a institui-ção irá ganhar a longo prazo é R$ 5,00 – 1,75 = R$ 3,25.
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:123LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:123 21/12/2010 17:31:2021/12/2010 17:31:20
124
Curso de Licenciatura em Informática
Capítulo 7
Observe que, a longo prazo, signi� ca: se você participar de novas rifas nesta mesma condição, mesmo que você ganhe na primeira o melhor prêmio, R$ 100,00 (Sortudo! você terá um lucro de R$ 95,00), na média de todas as jogadas você irá receber R$ 1,75, en-quanto que você sempre gastou R$ 5,00. É por esse motivo que todo viciado em jogo vai à falência. A estatística prova isso por meio do valor esperado.
O que signi� ca “a longo prazo” ?
Deve-se considerar longo prazo um número de tentativas superior a 30 (n≥30). Para valores inferiores a esse, � ca por conta do acaso, e como os eventos são aleatórios, qualquer resultado é possível.
Exemplo 2:
Em 12 lançamentos de uma moeda, saíram 9 caras. É razoável aceitar esse resultado?
A resposta é sim, pois como não temos a condição de longo prazo (12 < 30), qualquer resultado é possível.
Exemplo 3:
Numa empresa de informática, as previsões de despesas para o próximo ano foram calculadas em R$ 9, 10, 11, 12 e 13 bilhões, com as seguintes probabilidades de ocorrências 30%, 20%, 25%, 5% e 20%. Pede-se:
a) Qual é a distribuição de probabilidades de despesas para o próximo ano.
b) Qual é o valor esperado das despesas para o próximo ano.
Despesas (xi) Bilhões de R$
Probabilidades de ocor-rer às despesas p(xi)
9 0,3010 0,2011 0,2512 0,0513 0,20
total = 1,00
Resposta para o item a):
Tabela 7.8 Distribuição de Probabilidades de despesas
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:124LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:124 21/12/2010 17:31:2021/12/2010 17:31:20
125
Probabilidade e Estatística
Variáveis Aleatórias e Distribuições Discretas
Despesas (xi)Bilhões de R$
Probabilidades de ocorrer as despesas p(xi)
Valor espera-do xi .p (xi)
9 0,30 2,7010 0,20 2,0011 0,25 2,7512 0,05 0,6013 0,20 2,60
Valor Esperado E(X) = 10,65
Resposta para o item b):
Assim, a despesa esperada para o próximo ano é R$ 10,65 bilhões.
Observe a importância dessa informação. Com ela, a empresa pode se planejar para o ano seguinte!
ATIVIDADE 7.2
Responda as questões a seguir:
1) Suponhamos que, após 10 lançamentos de uma moeda, saíram 7 caras. É razoável aceitar esse resultado?
2) Suponhamos que, após 1000 lançamentos de uma moeda, saí-ram 700 caras. É razoável aceitar esse resultado?
3) Um jogo consiste no lançamento de 3 moedas (não viciada). Se der tudo cara ou tudo coroa, o ganho é de R$ 5,00; mas, se der uma ou duas caras, a perda é de R$ 3,00. Qual o resultado esperado para o jogo em reais?
7.4 Distribuição binomial
Vamos imaginar fenômenos cujos resultados só podem ser de dois ti-pos: de sucesso e de insucesso. O fenômeno imaginado pode ser repeti-do tantas vezes quantas se queiram (n vezes) nas mesmas condições. As provas repetidas devem ser independentes, isto é, o resultado de uma não deve afetar os resultados das outras. No decorrer do experimento, a probabilidade do sucesso (p) e a probabilidade do insucesso (q) manter-
Tabela 7.9 Valor Esperado das Despesas
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:125LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:125 21/12/2010 17:31:2021/12/2010 17:31:20
126
Curso de Licenciatura em Informática
Capítulo 7
se-ão constantes. Nessas condições, X é uma variável aleatória discreta que segue uma distribuição binomial.
O nome binomial é devido à fórmula, pois representa o termo geral do desenvolvimento do binômio de Newton para o qual só há duas possibilidades nominais (verdadeiro ou falso, cara ou coroa, sucesso ou insucesso, liga ou desliga, ganha ou perde, etc.).
Distribuição Binomial
Se em n experiências acontecem x sucessos com probabilidade p, a distribuição binomial de probabilidades é dada pela expressão:
Em que:
• x = 0,1,2,...,n
•
C, como já foi visto, é combinação.
Para entender a fórmula, vamos observar os exemplos seguintes:
Exemplo 1:
Lançando uma moeda 5 vezes, qual a probabilidade de ocorrência de 3 caras?
Temos:
p indica a ocorrência de cara;q indica a não ocorrência de cara.
Vamos montar a tabela de possibilidades para o lançamento de uma moeda 5 vezes, ocorrendo 3 caras (p):
1pªossibilidade p p p q q2ª possibilidade p p q p q3ª possibilidade p q p p q 4pªossibilidade q p p p q5ª possibilidade p p q q p6ª possibilidade p q q p p
Tabela 7.10 Possibilidades no lançando de uma moeda 5 vezes
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:126LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:126 21/12/2010 17:31:2021/12/2010 17:31:20
127
Probabilidade e Estatística
Variáveis Aleatórias e Distribuições Discretas
7ª possibilidade q q p p p8ª possibilidade q p q p p9ª possibilidade q p p q p10ª possibilidade p q p q p
Observe que, independente da linha da tabela, temos: p3 .q2 possibili-dades de ocorrências de cara e temos que a quantidade total de possibi-lidades é 10 p3 .q2.
Assim, intuitivamente a� rmamos que :
Desse modo, de uma forma geral, temos:
Exemplo 2:
Dois times de futebol, A e B, jogam entre si 6 vezes. Encontre a probabi-lidade de o time A ganhar 4 jogos.
Temos:
p =1/3 indica a probabilidade de o time A ganhar;q = 2/3 indica a probabilidade de o time B não ganhar (perder ou empatar).
ATIVIDADE
Responda as questões a seguir:
1) Determine a probabilidade de obtenção de 3 caras em 6 lances de uma moeda.
2) Jogando-se um dado três vezes, determine a probabilidade de obtenção de um múltiplo de 3 duas vezes.
3) Dois times de futebol, A e B, jogam entre si 6 vezes. Encontre a probabilidade de o time A:
a) ganhar dois ou três jogos;
b) ganhar pelo menos um jogo.
4) A probabilidade de um atirador acertar o alvo é 2/3. Se ele ati-rar 5 vezes, qual a probabilidade de acertar 2 tiros?
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:127LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:127 21/12/2010 17:31:2021/12/2010 17:31:20
128
Curso de Licenciatura em Informática
Capítulo 7
5) Seis computadores são escolhidos ao acaso da linha de produ-ção que apresenta 10% de peças defeituosas. Qual a probabilidade de serem defeituosos dois deles?
7.5 DISTRIBUIÇÃO DE POISSON
A Distribuição de Poisson pode ser usada para determinar a probabi-lidade de um dado número de sucessos quando os eventos ocorrem em bases de tempo ou espaço. Esse processo é chamado de processo de Poisson. Supõe-se que os eventos são independentes e que o processo é estacionário (constante).
Vejamos o motivo de estudar a Distribuição de Poisson.
Situações em que Distribuição de Poisson é utilizada:
a) usuários de computador ligados à Internet;b) as chamadas em uma central telefônica;c) clientes chegando ao caixa de um supermercado;d) acidentes com automóveis em uma determinada estrada;e) número de carros que chegam a um posto de gasolina;f) número de falhas em componentes por unidade de tempo;g) número de requisições para um servidor em um intervalo de tempo t;h) número de peças defeituosas substituídas num veículo durante o primeiro ano de vida;i) problemas com a bagagem de passageiros em viaja de avião;
j) número de chamadas telefônicas para a polícia por hora;
k) número de acidentes de tráfego num cruzamento por semana.
Na distribuição de Poisson somente um valor é necessário para determi-
nar a probabilidade de um dado número de sucessos: o número médio
de sucessos para a específ ca dimensão de tempo ou espaço de interes-
se. Esse número médio é geralmente representado por λ (letra grega
“lambda”) ou por μ. A fórmula para se determinar a probabilidade de
um dado número X de sucessos em uma distribuição de Poisson é:
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:128LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:128 21/12/2010 17:31:2121/12/2010 17:31:21
129
Probabilidade e Estatística
Variáveis Aleatórias e Distribuições Discretas
Em que:
é a média da distribuição;
e – representa o número de Euler que é uma constante de valor igual a 2,718;
x! é o fatorial de x
Na matemática, número de Euler, assim chamado em homena-gem ao matemático suíço Leonhard Euler, é a base dos logaritmos naturais.
Lembre-se de que:
0 ! = 1;
0x = 1, qualquer número elevado a zero é igual a 1.
Exemplo 1:
Um departamento de manutenção de informática recebe uma média de cinco chamadas por hora. A probabilidade de que, em uma hora selecio-nada aleatoriamente, sejam recebidas três chamadas é:
Solução:
Exemplo 2:
Um departamento de polícia recebe em média 5 solicitações por hora. Qual a probabilidade de receber 2 solicitações numa hora selecionada aleatoriamente?
Solução:
X = número designado de sucessos = 2
λ = o número médio de sucessos num intervalo especí� co (uma hora) = 5
Exemplo 3:
Um departamento de manutenção de computadores recebe uma média
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:129LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:129 21/12/2010 17:31:2121/12/2010 17:31:21
130
Curso de Licenciatura em Informática
Capítulo 7
de cinco chamadas por hora. Qual a probabilidade de menos de três cha-madas serem recebidas durante uma hora aleatoriamente escolhida?
Solução:
Lembrar que receber menos de 3 chamadas (X < 3), na verdade ele pode receber 2 ou 1 ou nenhuma chamada (X ≤ 2); assim:
P(X < 3) = P(X ≤ 2) = P(X = 0) + P(X = 1) + P(X = 2)
0,0067 + 0,0337 + 0,0842 = 0,1246
Exemplo 4:
Na média, 12 pessoas por hora consultam um especialista em informá-tica. Qual a probabilidade de
que três ou mais pessoas consultem o especialista durante um período de dez minutos?
Solução:
Observe que o problema fornece a média por hora – 12 - e solicita a pro-babilidade de que três ou mais pessoas consultem o especialista em um período de dez minutos. Devemos, então, converter a média por hora para o período de dez minutos. Assim:
média por hora = 12
Para achar a média por 10 minutos, basta usar a regra de três:
1h = 60 min ------------------------12
10 min ------------------------µ
µ = 2
Ou seja, em média, 2 pessoas consultam um especialista em informática no período de 10 minutos.
Assim, temos:
P(X ≥ 3) = P(X = 3) + P(X = 4 ) + P(X = 5 ) + ...
= 0,1804 + 0,0902 + 0,0120 + 0,0034 + 0,0009 + 0,0002 = 0,3232
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:130LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:130 21/12/2010 17:31:2121/12/2010 17:31:21
131
Probabilidade e Estatística
Variáveis Aleatórias e Distribuições Discretas
ATIVIDADE 7.3
Responda as questões a seguir:
1) Se o número de peixes pescados por hora em certo pesqueiro é uma variável que segue a distribuição de Poisson com média igual a 1,8, ache a probabilidade de que um pescador, trabalhando durante uma hora:
a) não pegue nenhum peixe;
b) pegue exatamente 2 peixes;
c) pegue no máximo 4 peixes;
d) pegue pelo menos dois peixes.
2) Se 4% de passageiros de avião têm problemas com a bagagem, qual a probabilidade de que, entre 150 passageiros, até dois te-nham problemas com suas bagagens?
3) A experiência indica que um número médio de 6 clientes por hora pára, para colocar gasolina numa bomba. Pede-se:
a) qual é a probabilidade de 3 clientes pararem qualquer hora?
b) qual é a probabilidade de 3 clientes ou menos pararem em qual-quer hora?
4) Um processo de produção produz 10 itens defeituosos por hora. Encontre a probabilidade que 4 ou menos itens sejam defei-tuosos numa retirada aleatória por hora.
5) Na média, 10 pessoas por hora consultam um especialista em in-formática. Qual a probabilidade de que 4 ou mais pessoas consultem o especialista durante um período de quinze minutos?
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:131LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:131 21/12/2010 17:31:2221/12/2010 17:31:22
132
Curso de Licenciatura em Informática
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:132LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:132 21/12/2010 17:31:2221/12/2010 17:31:22
VARIÁVEIS CONTÍNUAS E DISTRIBUIÇÕES CONTÍNUAS
Prezado(a) aluno(a)!
Este é o último capítulo do nosso curso. Nele, veremos as distribui-ções contínuas de probabilidade, que normalmente ocorrem, nas medidas de situações físicas (peso, altura, tamanho, etc.) e sociais (distribuição de renda, padrões de consumo, etc.). O Conteúdo des-te capítulo é fundamental para a inferência estatística (importante ramo da Estatística que tem por objetivo fazer a� rmações a partir de amostras sobre um universo estudado (população).
Bons estudos!
Prof. Sebastião A. Carneiro
8.1 Variável aleatória contínua
Quando a variável aleatória pode assumir qualquer valor do conjunto dos números, é denominada variável aleatória contínua. Por exemplo: os salários dos empregados de uma determinada categoria, as rentabi-lidades mensais das ações, etc. Como o número de possíveis valores de uma variável aleatória contínua X é muito grande, não é possível regis-trar todos os valores em uma lista, uma tabela ou um histograma.
Para os alunos que não gostam de trabalhar com integral, ou para aqueles que desejam reforçar os conceitos de função densidade de probabilidade (fdp), na sala virtual, há a mesma abordagem, só que envolvendo conceitos de áreas.
8.2 Função densidade de probabilidade (FDP)
A distribuição de uma variável aleatória contínua é dada por uma curva contínua e não por pontos discretos. Essa curva, ou função matemática ƒ(x), é denominada função densidade de probabili-dade (fdp).
A área total sob a curva da distribuição ƒ(x) é considerada igual a 1 ou 100%.
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:133LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:133 21/12/2010 17:31:2221/12/2010 17:31:22
134
Curso de Licenciatura em Informática
Capítulo 8
Para os valores de x da variável aleatória X, existe uma função matemá-tica ƒ(x) que estabelece os valores de probabilidade para cada valor de x. As condições são estabelecidas pelas seguintes premissas:
1) A função probabilidade ƒ(x) é sempre positiva:
f(x)
2) A área sob a função de probabilidade ƒ(x) entre os limites menos in� nito e mais in� nito da variável X é igual a 1 ou a 100%.
Essa equação deve � car bem entendida para que os conceitos a se-guir sejam perfeitamente assimilados. A equação mostra que toda a área da função f(x) indicada pela integral deve ser igual a 1.
f(x)
x
1).( dxxf
Figura 23: Área total sob a função de probabilidade ƒ(x)
O valor de probabilidade da variável aleatória contínua X é dado pela área de� nida pela função ƒ(x) entre os limites a e b, conforme a expressão:
Como:
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:134LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:134 21/12/2010 17:31:2221/12/2010 17:31:22
135
Probabilidade e Estatística
Variáveis Contínuas e Distribuições Contínuas
Assim:
O desenvolvimento anterior indica que a probabilidade da área compreendida entre a e b é a relação entre a área compreendida entre a e b e toda a área da função f(x) que é igual a 1. Assim, a probabilidade de estarmos entre o intervalo a e b é a própria área compreendida entre a e b.
f(x)
xa b x
b
dxa
xfbxap ).()(
Figura 24: Área p(a ≤ x ≤ b) sob a função de probabilidade ƒ(x).
Exemplo 8.1:
Veri� car se a função (x) = 2x2 + 3 para (2 ≥ x > 0 ) f(x) = 0 para (0 > x ou x > 2)
È uma função distribuição de probabilidade (fdp).
Logo, a função não é uma distribuição de probabilidade (fdp).
Exemplo 8.2:
Veri� car se a função
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:135LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:135 21/12/2010 17:31:2221/12/2010 17:31:22
136
Curso de Licenciatura em Informática
Capítulo 8
para (3 ≥ x > 1)f(x) = 0 para (1 > x ou x > 3)
É uma função distribuição de probabilidade.
Logo, a função é uma distribuição de probabilidade.
Exemplo 8.3:
Em relação ao exemplo anterior, calcular P (1,5 ≤ X ≤ 2,5).
Como já foi visto no exemplo anterior, a f(x) satisfaz a condição de dis-tribuição de probabilidade.
Assim,
ATIVIDADE 8.1
Responda as questões a seguir:
1) Seja a função f(x) = kx para 1x 0
f(x) = 0 para 0x ou x 1
Determine:
a) k para que f(x) seja uma função distribuição de probabilidade;
b) o grá� co f (x);
c) P(1/2 x 0).
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:136LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:136 21/12/2010 17:31:2321/12/2010 17:31:23
137
Probabilidade e Estatística
Variáveis Contínuas e Distribuições Contínuas
2) O diâmetro X de um cabo elétrico é uma variável aleatória contínua com fdp dada por:
2f (x) = K (2x – x ) para 0 x 1
f(x) = 0 para x < 0 ou x > 1
a) determine K;
b) calcule P (0X 1/2).
3) Uma variável aleatória contínua X tem sua fdp dada pelo grá� co:
a) determine k;
b) calcule P (0 X 2).
8.3 Distribuição uniforme
Uma distribuição de variável contínua é a distribuição uniforme que apresenta uma função densidade de probabilidade constante dentro de um intervalo de valores da variável aleatória X.
A variável aleatória X tem uma distribuição uniforme de probabi-lidades entre os valores a e b, se sua função de probabilidade ƒ(x) é:
Em que: b ≥ a e a ≤ x ≤ b,
A representação grá� ca da distribuição uniforme é um retângulo cuja base está de� nida por dois valores, que estabelecem os limites dos valores possíveis da variável aleatória X. Veja a Figura 17, a seguir:
K
11 4
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:137LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:137 21/12/2010 17:31:2321/12/2010 17:31:23
138
Curso de Licenciatura em Informática
Capítulo 8
1
b - a
a b x
f(x)
Figura 25: Distribuição Uniforme
Perceba que a base do retângulo é igual a b-a, em que b>a, e a altura do retângulo é igual a 1/(b-a); portanto, a área do retângulo é igual a 1, satisfazendo, assim, a condição de que f(x) seja uma função distribuição de probabilidade.
A probabilidade de que a variável aleatória X seja igual ou maior que c, ou igual ou menor que d, sendo que c e d estão dentro do intervalo (a- b), será obtida pela razão de áreas dada pela expressão:
Ao mesmo tempo, representada na Figura 18 a seguir:
1
b - a
a b x
f(x)
c d
Figura 26 - Área de uma Distribuição Uniforme
A probabilidade p(c ≤ x ≤ d) também pode ser visualizada como uma relação de áreas, conforme a Figura 19 a seguir:
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:138LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:138 21/12/2010 17:31:2421/12/2010 17:31:24
139
Probabilidade e Estatística
Variáveis Contínuas e Distribuições Contínuas
Figura 27: Relação de áreas de uma Distribuição Uniforme
Exemplo 8.4:
A variável aleatória contínua X tem distribuição uniforme entre os va-lores 100 e 200.
Pede-se calcular a probabilidade de que o valor da variável X se encontre entre 120 e 170.
A média e a variância de uma variável aleatória X com distribui-ção uniforme de probabilidade entre os valores a e b são iguais a:
Exemplo 8.5:
A variável aleatória contínua X tem distribuição uniforme entre os valo-res 100 e 200. Calcule os valores da média e do desvio padrão e a proba-bilidade de que o valor da variável X se encontre entre 120 e 170.
Média:
A variância
a b
c dp ( c x d )=
5,0100200
120170)170120(
xp 50%
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:139LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:139 21/12/2010 17:31:2421/12/2010 17:31:24
140
Curso de Licenciatura em Informática
Capítulo 8
Portanto, o desvio padrão é igual a:
Cálculo
ATIVIDADE 8.2
Responda as questões a seguir:
1) Foi retirada uma amostra da população X que tem distribuição uniforme e valores máximo e mínimo iguais a 35 e 125, respec-tivamente. Pede-se calcular a probabilidade de que um elemento da amostra:
a) seja maior que 50;
b) seja menor que 65 ou igual a esse valor;
c) esteja entre 55 e 105.
2) As vendas de computadores num depósito de atacado acusam a média de 40.000 computadores diários, com um mínimo de 30.000 computadores. Supondo adequada distribuição uniforme, responda:
qual a venda diária máxima?
qual a percentagem do número de dias em que a venda excede 34.000 computadores?
8.4 Distribuição normal (GAUSS)
A distribuição normal é uma das mais importantes distribuições da estatística, também chamada de Distribuição de Gauss. A distribuição apresenta-se em formato de sino, unimodal, simétrica em relação a sua média
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:140LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:140 21/12/2010 17:31:2521/12/2010 17:31:25
141
Probabilidade e Estatística
Variáveis Contínuas e Distribuições Contínuas
f(x)
x x
Figura 28: Curva Normal (Gauss)
A distribuição normal foi desenvolvida pelo matemático francês Abraham de Moivre e é de� nida conforme expressão a seguir:
Em que:
μ – média;σ - desvio padrão
• Seu formato é sinuoso (curva em forma de sino);
• A curva normal é assintótica em relação ao eixo das abscissas, isto é, aproxima-se inde� nidamente do eixo das abscissas sem, contudo, alcançá-lo;
• A curva é simétrica em torno da média e a probabilidade de ocorrer valor maior que a média é igual à probabilidade de ocorrer valor menor que a média, isto é, ambas as probabilidades são iguais a 0,5 ou 50%.
Se você estranhou a fórmula ou mesmo se assustou com ela, não se preocupe, pois a mesma não é utilizada nos cálculos; será utilizada uma maneira reduzida e tabelada. Muitos estudiosos da estatística já tiveram essa di� culdade e trataram de facilitar nossos cálculos.
8.4.1 Vantagem da distribuição normal
A grande vantagem da distribuição normal é que, com o conhecimen-to da média e do desvio padrão, é possível calcular qualquer valor de probabilidade.
2
2
1
2
1)
(
x
exf
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:141LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:141 21/12/2010 17:31:2521/12/2010 17:31:25
142
Curso de Licenciatura em Informática
Capítulo 8
Transpondo tudo isso para o dia a dia, os valores de x correspondem aos valores numéricos dos dados experimentais, enquanto os valores de y ou f(x) referem-se às frequências com que cada valor de x apa-rece no experimento.
8.4.2 A probabilidade dentro do intervalo (a,b)
Considerando a probabilidade de ocorrência, a área sob sua curva soma 100%. Isso quer dizer que a probabilidade de uma observação assumir um valor entre dois pontos quaisquer é igual à área compreendida entre esses dois pontos.
• A probabilidade p(a ≤X ≤b) de que a variável aleatória X tenha seus valores dentro do intervalo (a,b), é obtida da área sob a curva entre os valores a e b.
f(x)
-2
f(x) f(x)
-1 μ=0 1 2 3a b
-2 -1 μ=0 1 2 3a b
-2 -1 μ=0 1 2 3a b
Figura 29: P(a ≤X ≤b) sob a curva normal
• Quanto mais afastado do centro da curva normal, mais área com-preendida abaixo da curva haverá.
Característica Importante da curva normal:
A um desvio padrão da média, temos 68,26% das observações contidas.
A dois desvios padrões da média, possuímos 95,44% dos dados compreendidos;
A três desvios, da média temos 99,73% das observações contidas.
68%
95%
99,7%
μ-3σ μ-2σ μ-σ μ+σ μ+2σ μ+ 3σμ
Podemos concluir que, quanto maior a variabilidade dos dados em rela-ção à média, maior a probabilidade de encontrarmos o valor que busca-mos embaixo da normal.
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:142LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:142 21/12/2010 17:31:3421/12/2010 17:31:34
143
Probabilidade e Estatística
Variáveis Contínuas e Distribuições Contínuas
8.4.3 Influência dos parâmetros na forma da distribuição normal
Vamos analisar a in� uência da média e do desvio padrão na forma da curva da distribuição normal, observando os três casos seguintes:
a) mantendo constante o valor do desvio padrão e variando o valor da média, temos o comportamento mostrado na � gura 8.7, a) a seguir; ou seja, a curva se desloca segundo o eixo X;
b) Mantendo constante o valor da média e variando o valor do desvio padrão, temos o comportamento mostrado na � gura 8.7, b) a seguir; ou seja, mantém a posição, mas o formato varia. Para um desvio padrão menor temos uma curva mais estreita e mais alta, para um desvio pa-drão maior temos uma curva mais larga e mais baixa,
c) Variando a média e o desvio padrão, temos o comportamento mos-trado na � gura 8.7, c) a seguir; ou seja, muda a posição como o formato também varia.
S = 10 S = 10
X = 10 X = 20
(a)
(c)
(b)
S = 1,5
S = 10
X = 10S = 10S = 15
X = 7 X = 10
Figura 30: In�uência da média e do desvio padrão na forma da curva da distribuição normal
Calcular a probabilidade usando a fórmula de distribuição normal não é tão simples. Para facilitar os cálculos, precisamos encontrar uma maneira mais simples. É o que veremos no item seguinte.
8.5 Distribuição normal reduzida – Z
Curvas normais, com qualquer μ e σ, podem ser transformadas em uma normal muito especial que tem média 0 (x= 0) e desvio padrão 1 (s = 1). Esta curva normal, com média 0 e desvio padrão 1 é conhecida como curva normal reduzida. Suas probabilidades já foram calculadas e são apresentadas em tabelas de fácil utilização. Como a curva normal é si-métrica, os livros de estatísticas apresentam somente as probabilidades
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:143LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:143 21/12/2010 17:31:3421/12/2010 17:31:34
144
Curso de Licenciatura em Informática
Capítulo 8
da metade direita da curva. A probabilidade de um intervalo qualquer da metade esquerda é igual à probabilidade do intervalo equivalente na metade direita.
Como o cálculo da probabilidade usando o cálculo direto não é tão sim-ples, para contornar esse problema deve ser feita uma mudança de vari-ável, chamada z (x z), em que:
Assim, toda distribuição normal com média x e desvio padrão s pode se convertida numa distribuição normal reduzida, com média zero e desvio padrão igual a 1. (Isso não será demonstrado, pois não é objetivo deste curso fazê-lo).
As probabilidades associadas à distribuição normal reduzida são en-contradas na tabela em anexo, não havendo necessidade de serem calculadas.
8.5.1 Utilização da tabela Z
A intersecção entre linha e coluna indica o valor de z. Na primeira colu-na, é dado o valor de z com uma casa decimal. Já na primeira linha, são encontrados os valores centesimais de z; assim, o valor de z correspon-de à intersecção entre linha e coluna encontradas.
Exemplo 8.6
Encontrar na tabela Z o valor de z = 1,25.
z 0 1 2 3 4 5 6 7 8 90,000000 0,003989 0,007978 0,011967 0,015953 0,019939 0,023922 0,027903 0,031881 0,0358560,00,039828 0,043795 0,047758 0,051717 0,055670 0,059618 0,063559 0,067495 0,071424 0,0753450,10,079260 0,083166 0,087064 0,090954 0,094835 0,098706 0,102568 0,106420 0,110261 0,1140920,20,117911 0,121719 0,125516 0,129300 0,133072 0,136831 0,140576 0,144309 0,148027 0,1517320,30,155422 0,159097 0,162757 0,166402 0,170031 0,173645 0,177242 0,180822 0,184386 0,1879330,40,191462 0,194974 0,198468 0,201944 0,205402 0,208840 0,212260 0,215661 0,219043 0,2224050,50,225747 0,229069 0,232371 0,235653 0,238914 0,242154 0,245373 0,248571 0,251748 0,2549030,60,258036 0,261148 0,264238 0,267305 0,270350 0,273373 0,276373 0,279350 0,282305 0,2852360,70,288145 0,291030 0,293892 0,296731 0,299546 0,302338 0,305106 0,307850 0,310570 0,3132670,80,315940 0,318589 0,321214 0,323814 0,326391 0,328944 0,331472 0,333977 0,336457 0,3389130,90,341345 0,343752 0,346136 0,348495 0,350830 0,353141 0,355428 0,357690 0,359929 0,3621431,00,364334 0,366500 0,368643 0,370762 0,372857 0,374928 0,376976 0,378999 0,381000 0,3829771,10,384930 0,386860 0,388767 0,390651 0,392512 0,394350 0,396165 0,397958 0,399727 0,4014751,2
Z = 1,25
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:144LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:144 21/12/2010 17:31:3421/12/2010 17:31:34
145
Probabilidade e Estatística
Variáveis Contínuas e Distribuições Contínuas
Na primeira coluna, encontramos o valor até uma casa decimal = 1,2. Em seguida, na primeira linha, o valor 5, que corresponde ao último algarismo do número 1,25. Na intersecção da linha e coluna correspon-dentes, encontramos o valor 0,3944, o que nos permite escrever:
P(0 < z < 1,05) = 0,3944
Após utilizar a distribuição normal reduzida, devemos retornar para o nosso problema de origem, fazendo uma nova conversão de variáv e l z x.
Veja como proceder à conversão, por meio de um exemplo a seguir:
Exemplo 8.7:
Seja X, a variável aleatória que representa os diâmetros dos parafusos de � xação do HD, nos computadores produzidos por certa máquina; vamos supor que essa variável tenha distribuição normal com média = 2 cm e desvio padrão = 0,04 cm. Qual a probabilidade de um parafuso ter o diâmetro com valor entre 2 e 2,05 cm?
Na realidade, queremos P (2 ≤X ≤ 2,05).
Com o auxílio da distribuição normal reduzida, isto é, a distribuição normal de média = 0 e desvio padrão = 1, o problema é resolvido por meio da variável z.
Utilizaremos também a tabela normal reduzida:
P (2 ≤X ≤ 2,05)= P (0 ≤z ≤ 1,25)
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:145LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:145 21/12/2010 17:31:3421/12/2010 17:31:34
146
Curso de Licenciatura em Informática
Capítulo 8
ATIVIDADE 8.3
Responda as questões a seguir:
1) Determine as probabilidades:
a) P(-1,25 < Z < 0) =
b) P(-0,5 < Z < 1,48) =
c) P(0,8 < Z < 1,23) =
d) P(-1,25 < Z < -1,20) =
e) P( Z < 0,92) =
f) P(Z > 0,6) =
2) Os salários dos analistas de sistema são distribuídos normal-mente em torno da média de R$ 10.000,00, com desvio padrão de R$ 800,00. Calcule a probabilidade de um analista ter o salário situado entre R$ 9.800,00 e R$ 10.400,00.
3) Um teste padronizado de escolaridade tem distribuição normal com média = 100 e desvio padrão = 10. Determine a probabilida-de de um aluno submetido ao teste ter nota:
a) maior que 120;
b) maior que 80;
c) entre 85 e 115;
d) maior que 100.
4) Seja uma série de observações X com distribuição normal, mé-dia igual a 50 e desvio padrão igual a 10. Se retirarmos uma ob-servação dessa série, qual é a probabilidade de seu valor ser igual ou menor que 60?
5) Uma série de observações tem média de 300 e desvio padrão de 20. Sabendo que essa série tem uma distribuição normal, cal-cule a probabilidade de que um elemento da série, escolhido ale-atoriamente, tenha um valor compreendido dentro de um desvio padrão (20) ao redor da média.
8.5.2 Exemplo prático para entendimento da curva normal
Como saber, na prática, se os dados obtidos é uma distribuição normal ou não?
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:146LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:146 21/12/2010 17:31:3521/12/2010 17:31:35
147
Probabilidade e Estatística
Variáveis Contínuas e Distribuições Contínuas
Por exemplo: Uma empresa de informática fez o levantamento das ven-das de computadores em suas � liais,conforme tabela a seguir. Como analisar esses dados ?
Preços dos computadores Quantidade vendidas500 5600 15700 22800 25900 38
1.000 501.100 751.200 1101.300 1301.400 1501.500 1601.600 1501.700 1301.800 1101.900 752.000 502.100 382.200 252.300 222.400 152.500 5
o1 passo: fazer o histograma das vendas de computadores e veri� car visualmente se ela é, de fato, normal.
Venda de computadores
Qu
an
tid
ad
e v
en
did
a
180
160
140
120
100
80
60
40
20
0
500
600
700
800
900
1000
1100
1200
1300
1400
1500
1600
1700
1800
1900
2000
2100
2200
2300 R$
Figura 31: Histograma das vendas de computadores com aproximação normal.
Tabela 8.1 levantamento das vendas de computadores
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:147LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:147 21/12/2010 17:31:3521/12/2010 17:31:35
148
Curso de Licenciatura em Informática
Capítulo 8
Neste caso, podemos observar que o formato é bem semelhante à curva normal.
o2 passo: calcular o preço médio dos computadores e o desvio padrão.
Preços dos computadores
Quantidade vendidas Xi . fi Xi2 . fi
500 5 2.500 1.250.000600 15 9.000 5.400.000700 22 15.400 10.780.000800 25 20.000 16.000.000900 38 34.200 30.780.000
1.000 50 50.000 50.000.0001.100 75 82.500 90.750.0001.200 110 132.000 158.400.0001.300 130 169.000 219.700.0001.400 150 210.000 294.000.0001.500 160 240.000 360.000.0001.600 150 240.000 384.000.0001.700 130 221.000 375.700.0001.800 110 198.000 356.400.0001.900 75 142.500 270.750.0002.000 50 100.000 200.000.0002.100 38 79.800 167.580.0002.200 25 55.000 121.000.0002.300 22 50.600 116.380.0002.400 15 36.000 86.400.0002.500 5 12.500 31.250.000
1400 2.100.000 3.346.520.000
Calcula o preço médio dos computadores:
= R$ 1500,00
Caso tenha dúvida, volte ao capítulo 4 para recordar.
Calcula a variância:
= 140.371 R$2
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:148LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:148 21/12/2010 17:31:3521/12/2010 17:31:35
149
Probabilidade e Estatística
Variáveis Contínuas e Distribuições Contínuas
Calcula o desvio padrão:
= R$ 375
Variação do desvio padrão em torno da média
Quantidade de compu-tadores no intervalo
Quantidade de computadores
em %
Média + s = R$ 1.8751015 73%
Média - s = R$ 1.125Média + 2s = R$ 2.249
1316 94%Média - 2s = R$ 751Média + 3s = R$ 2.624
1400 100%Média - 3s = R$ 376
Conclusão:
Os dados do exemplo se aproximam muito de uma distribuição normal, pois visualmente têm o formato sinuoso, conforme mostra o histogra-ma, e a um desvio padrão da média, deveríamos ter 68,26% das obser-vações contidas e o obtido foi 73% e a dois desvios padrões, deveríamos ter 95,44% dos dados compreendidos e o obtido foi 94% e � nalmente a três desvios, deveríamos ter 99,73% das observações contidas e o obtido foi 100%, valores estes bem próximos do teórico.
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:149LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:149 21/12/2010 17:31:3521/12/2010 17:31:35
150
Curso de Licenciatura em Informática
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:150LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:150 21/12/2010 17:31:3521/12/2010 17:31:35
CRESPO, Antônio Arnot. Estatística fácil. 18. ed. São Paulo: Saraiva, 2006.
LAPPONI, Juan Carlos. Estatística usando Excel 5 e 7. São Paulo: Lapponi Treina-mento e Editora, 1997.
REGGIANI, Lucia. A TI dos Bilhões: o faturamento das 200 maiores empresas de tecnologia do Brasil crava 95 bilhões de dólares. Info Exame, São Paulo, n. 257, p. 82-86, ago. 2007.
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:151LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:151 21/12/2010 17:31:3621/12/2010 17:31:36
152
Curso de Licenciatura em Informática
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:152LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:152 21/12/2010 17:31:3621/12/2010 17:31:36
Resultado da pesquisa de campo referente aos preços (R$) de 200 monito-res LCD de uma determinada marca em 200 empresas de informática
431,3 431,3 431,3 432,0 413,0 413,0 413,0 414,0 414,0 414,0422,0 422,5 422,5 422,5 422,8 416,0 416,0 417,0 417,0 417,0425,5 425,5 426,0 426,0 426,0 419,0 419,0 419,0 420,0 420,0421,0 421,0 421,0 421,0 421,0 422,0 422,0 422,0 422,0 422,0424,0 424,0 424,0 424,0 424,0 424,0 424,5 424,5 424,5 424,5427,0 427,0 427,0 427,0 427,0 427,0 427,5 427,5 427,5 427,5430,0 430,0 430,0 430,0 430,0 430,0 430,6 430,6 430,6 430,6433,0 433,0 433,0 433,0 433,0 434,0 434,0 434,0 434,0 434,0436,0 436,0 436,0 436,0 437,0 437,0 437,0 437,0 438,0 438,0439,0 439,0 439,0 440,0 440,0 440,0 440,0 440,0 417,0 438,0420,0 420,0 420,3 420,3 420,3 420,3 420,7 420,7 420,7 420,7418,0 418,0 418,0 418,0 419,0 422,8 422,8 422,8 423,0 423,0424,5 424,5 425,0 425,0 425,0 425,0 425,5 425,5 425,5 425,5427,5 427,5 428,0 428,0 428,0 428,0 428,5 428,5 428,5 428,5430,6 430,6 431,0 431,0 431,0 431,0 431,0 431,3 431,3 431,3434,0 434,0 435,0 435,0 435,0 435,0 435,0 435,0 435,0 435,0417,8 417,8 417,8 417,8 438,0 435,0 435,0 423,0 423,0 423,5415,0 415,0 415,0 415,0 416,0 426,0 426,0 426,3 423,5 423,5428,5 428,5 429,0 429,0 429,0 429,0 429,0 429,8 429,8 429,8412,0 412,0 412,5 412,5 432,0 432,0 432,0 432,0 426,3 426,3
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:153LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:153 21/12/2010 17:31:3621/12/2010 17:31:36
154
Curso de Licenciatura em Informática
Anexo
z 0 1 2 3 4 5 6 7 8 90,000000 0,003989 0,007978 0,011967 0,015953 0,019939 0,023922 0,027903 0,031881 0,0358560,00,039828 0,043795 0,047758 0,051717 0,055670 0,059618 0,063559 0,067495 0,071424 0,0753450,10,079260 0,083166 0,087064 0,090954 0,094835 0,098706 0,102568 0,106420 0,110261 0,1140920,20,117911 0,121719 0,125516 0,129300 0,133072 0,136831 0,140576 0,144309 0,148027 0,1517320,30,155422 0,159097 0,162757 0,166402 0,170031 0,173645 0,177242 0,180822 0,184386 0,1879330,40,191462 0,194974 0,198468 0,201944 0,205402 0,208840 0,212260 0,215661 0,219043 0,2224050,50,225747 0,229069 0,232371 0,235653 0,238914 0,242154 0,245373 0,248571 0,251748 0,2549030,60,258036 0,261148 0,264238 0,267305 0,270350 0,273373 0,276373 0,279350 0,282305 0,2852360,70,288145 0,291030 0,293892 0,296731 0,299546 0,302338 0,305106 0,307850 0,310570 0,3132670,80,315940 0,318589 0,321214 0,323814 0,326391 0,328944 0,331472 0,333977 0,336457 0,3389130,90,341345 0,343752 0,346136 0,348495 0,350830 0,353141 0,355428 0,357690 0,359929 0,3621431,00,364334 0,366500 0,368643 0,370762 0,372857 0,374928 0,376976 0,378999 0,381000 0,3829771,10,384930 0,386860 0,388767 0,390651 0,392512 0,394350 0,396165 0,397958 0,399727 0,4014751,20,403199 0,404902 0,406582 0,408241 0,409877 0,411492 0,413085 0,414656 0,416207 0,4177361,30,419243 0,420730 0,422196 0,423641 0,425066 0,426471 0,427855 0,429219 0,430563 0,4318881,40,433193 0,434478 0,435744 0,436992 0,438220 0,439429 0,440620 0,441792 0,442947 0,4440831,50,445201 0,446301 0,447384 0,448449 0,449497 0,450529 0,451543 0,452540 0,453521 0,4544861,60,455435 0,456367 0,457284 0,458185 0,459071 0,459941 0,460796 0,461636 0,462462 0,4632731,70,464070 0,464852 0,465621 0,466375 0,467116 0,467843 0,468557 0,469258 0,469946 0,4706211,80,471284 0,471933 0,472571 0,473197 0,473810 0,474412 0,475002 0,475581 0,476148 0,4767051,90,477250 0,477784 0,478308 0,478822 0,479325 0,479818 0,480301 0,480774 0,481237 0,4816912,00,482136 0,482571 0,482997 0,483414 0,483823 0,484222 0,484614 0,484997 0,485371 0,4857382,10,486097 0,486447 0,486791 0,487126 0,487455 0,487776 0,488089 0,488396 0,488696 0,4889892,20,489276 0,489556 0,489830 0,490097 0,490358 0,490613 0,490863 0,491106 0,491344 0,4915762,30,491802 0,492024 0,492240 0,492451 0,492656 0,492857 0,493053 0,493244 0,493431 0,4936132,40,493790 0,493963 0,494132 0,494297 0,494457 0,494614 0,494766 0,494915 0,495060 0,4952012,50,495339 0,495473 0,495603 0,495731 0,495855 0,495975 0,496093 0,496207 0,496319 0,4964272,60,496533 0,496636 0,496736 0,496833 0,496928 0,497020 0,497110 0,497197 0,497282 0,4973652,70,497445 0,497523 0,497599 0,497673 0,497744 0,497814 0,497882 0,497948 0,498012 0,4980742,80,498134 0,498193 0,498250 0,498305 0,498359 0,498411 0,498462 0,498511 0,498559 0,4986052,90,498650 0,498694 0,498736 0,498777 0,498817 0,498856 0,498893 0,498930 0,498965 0,4989993,00,499032 0,499065 0,499096 0,499126 0,499155 0,499184 0,499211 0,499238 0,499264 0,4992893,10,499313 0,499336 0,499359 0,499381 0,499402 0,499423 0,499443 0,499462 0,499481 0,4994993,20,499517 0,499533 0,499550 0,499566 0,499581 0,499596 0,499610 0,499624 0,499638 0,4996503,30,499663 0,499675 0,499687 0,499698 0,499709 0,499720 0,499730 0,499740 0,499749 0,4997583,40,499767 0,499776 0,499784 0,499792 0,499800 0,499807 0,499815 0,499821 0,499828 0,4998353,50,499841 0,499847 0,499853 0,499858 0,499864 0,499869 0,499874 0,499879 0,499883 0,4998883,60,499892 0,499896 0,499900 0,499904 0,499908 0,499912 0,499915 0,499918 0,499922 0,4999253,70,499928 0,499930 0,499933 0,499936 0,499938 0,499941 0,499943 0,499946 0,499948 0,4999503,80,499952 0,499954 0,499956 0,499958 0,499959 0,499961 0,499963 0,499964 0,499966 0,4999673,90,499968 0,499970 0,499971 0,499972 0,499973 0,499974 0,499975 0,499976 0,499977 0,4999784,0
Tabela: Distribuição Normal Reduzida - Z:N(0,1)
LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:154LICINF_4P_ProbEsta_DIAGRAMACAO.indd Sec1:154 21/12/2010 17:31:3621/12/2010 17:31:36
.Uiramutã
.Pacaraima.Normandia
.Bonfim
.Cantá
.Boa Vista
.Amajari
.Mucajaí
.Caracaraí
.Rorainópolis.São João da Baliza