51188715 apostila de estatistica versao 4

84
1 UNIVERSIDADE SÃO FRANCISCO DISCIPLINA DE PROBABILIDADE E ESTATÍSTICA Adalberto Nobiato Crespo 2009 Versão 4.0

Upload: frior

Post on 04-Aug-2015

101 views

Category:

Documents


6 download

TRANSCRIPT

Page 1: 51188715 Apostila de Estatistica Versao 4

1

UNIVERSIDADE SÃO FRANCISCO

DISCIPLINA

DE

PROBABILIDADE E

ESTATÍSTICA

Adalberto Nobiato Crespo 2009 Versão 4.0

Page 2: 51188715 Apostila de Estatistica Versao 4

2

Sumário

1 - A Estatística ............................................................................................................................... 4

1.1 - Fases do Método Estatístico ................................................................................................ 4

1.2 - Definições Básicas da Estatística ......................................................................................... 5

2 - Amostragem .............................................................................................................................. 8

3 - Séries Estatísticas ..................................................................................................................... 12

4 - Gráficos Estatísticos................................................................................................................. 14

5 - Distribuição de Freqüência ....................................................................................................... 18

5.1 - Elementos de Uma Distribuição de Frequência .................................................................. 19

5.2 - Método Prático para Construção de Distribuição de Freqüências ....................................... 20

5.3 - Representação Gráfica de uma Distribuição de Freqüência ................................................ 21

6 - Medidas de Posição ................................................................................................................. 26

6.1 - Média Aritmética .............................................................................................................. 26

6.2 - Média Geométrica ............................................................................................................. 29

6.3 - Média Quadrática .............................................................................................................. 31

6.4 - Moda................................................................................................................................. 32

6.5 - Mediana ............................................................................................................................ 34

6.6 – Separatrizes – Quartis, Decis e Percentis .......................................................................... 38

7 – Medidas de Dispersão ou Variabilidade: .................................................................................. 41

7.1 - Medidas de Dispersão Absoluta ........................................................................................ 41

7.1.1 - Amplitude Total ......................................................................................................... 41

7.1.2 - Desvio Médio Absoluto .............................................................................................. 42

7.1.3 - Desvio Padrão ............................................................................................................ 44

7.1.4 - Variância .................................................................................................................... 46

7.2 - Medidas de Dispersão Relativa.......................................................................................... 47

Page 3: 51188715 Apostila de Estatistica Versao 4

3

8 - Probabilidade ........................................................................................................................... 56

8.1 - Experimento Aleatório - E ................................................................................................. 56

8.2 - Espaço Amostral - S .......................................................................................................... 56

8.3 - Eventos ............................................................................................................................. 57

8.4 – Evento União: ∪ .............................................................................................................. 57

8.5 – Evento Intersecção: ∩ ...................................................................................................... 58

8.6 – Eventos Mutuamente Exclusivos ...................................................................................... 58

8.6 – Eventos Complementares ................................................................................................. 58

8.7 - Conceito de Probabilidade ................................................................................................. 59

8.7.1 - Propriedades ............................................................................................................... 60

8.7.2 - Teoremas Fundamentais ............................................................................................. 60

8.8 - Eventos Independentes ...................................................................................................... 61

8.9 - Probabilidade Condicional ................................................................................................ 62

9 - Distribuição de Probabilidades ................................................................................................. 68

9.1 - Distribuição Binomial ....................................................................................................... 70

9.2 - Distribuição de Poisson ..................................................................................................... 75

9.3 - Distribuição Normal .......................................................................................................... 78

9.3.1 - Propriedades da Distribuição Normal ......................................................................... 78

9.3.2 - A Distribuição Normal Padronizada ........................................................................... 79

9.3.3 - Utilização da Tabela Z ............................................................................................... 80

Page 4: 51188715 Apostila de Estatistica Versao 4

4

PROBABILIDADE E ESTATÍSTICA

1 - A Estatística

É uma parte da matemática aplicada que fornece métodos para coleta, organização, descrição, análise e interpretação de dados e para a utilização dos mesmos na tomada de decisões.

A coleta, a organização, a descrição dos dados, o cálculo e a interpretação de coeficientes pertencem à ESTATÍSTICA DESCRITIVA, enquanto a análise e a interpretação dos dados, associado a uma margem de incerteza, ficam a cargo da ESTATÍSTICA INDUTIVA ou INFERENCIAL, também chamada como a medida da incerteza ou métodos que se fundamentam na teoria da probabilidade.

1.1 - Fases do Método Estatístico

1º - DEFINIÇÃO DO PROBLEMA: Definir exatamente aquilo que se pretende pesquisar é o mesmo que definir corretamente o problema.

2º - PLANEJAMENTO: Como levantar informações? Que dados deverão ser obtidos? Qual levantamento a ser utilizado? Censitário? Por amostragem? E o cronograma de atividades? Os custos envolvidos?, etc.

3º - COLETA DE DADOS: É a fase operacional, ou seja, é o registro sistemático de dados com um objetivo determinado.

Dados primários: quando são publicados pela própria pessoa ou organização que coletou. Ex: tabelas do censo demográfico do IBGE.

Dados secundários: quando são publicados por outra organização. Ex: quando determinado jornal publica estatísticas referentes ao censo demográfico extraídas do IBGE.

OBS: É mais seguro trabalhar com fontes primárias. O uso da fonte secundária traz o grande risco de erros de transcrição.

Coleta Direta: quando é obtida diretamente da fonte. Ex: Empresa que realiza uma pesquisa para saber a preferência dos consumidores pela sua marca.

A coleta direta pode ser:

Contínua: registros de nascimento, óbitos, casamentos, etc.

Page 5: 51188715 Apostila de Estatistica Versao 4

5

Periódica: recenseamento demográfico, censo industrial; pesquisa mensal de empregos, etc.

Ocasional: registro de casos de dengue.

Coleta Indireta: É feita por deduções a partir dos elementos conseguidos pela coleta direta, por analogia, por avaliação, indícios ou proporcionalização.

Exemplo: Pesquisa sobre mortalidade infantil que é feita através de dados colhidos por uma coleta direta.

4º - APURAÇÃO DOS DADOS: É o resumo dos dados através de sua contagem e agrupamento. É a condensação e tabulação de dados.

5º - APRESENTAÇÃO DOS DADOS: Há duas formas de apresentação, que não se excluem mutuamente.

Apresentação Tabular: é uma apresentação numérica dos dados em linhas e colunas distribuídas de modo ordenado, segundo regras práticas fixadas pelo Conselho Nacional de Estatística.

Apresentação Gráfica: constitui uma apresentação geométrica permitindo uma visão rápida e clara do fenômeno.

6º - ANÁLISE E INTERPRETAÇÃO DOS DADOS: É a última fase do trabalho estatístico é a mais importante e delicada. Está ligada essencialmente ao cálculo de medidas e coeficientes, cuja finalidade principal é descrever o fenômeno (estatística descritiva). Na estatística indutiva a interpretação dos dados se fundamenta na teoria da probabilidade.

1.2 - Definições Básicas da Estatística

FENÔMENO ESTATÍSTICO: é qualquer evento que se pretenda analisar cujo estudo seja possível da aplicação do método estatístico. São divididos em três grupos:

Fenômenos de massa ou coletivo: são aqueles que não podem ser definidos por uma simples observação. A estatística dedica-se ao estudo desses fenômenos. Ex: A natalidade na Grande São Paulo, O preço médio da cerveja em Campinas, etc.

Fenômenos individuais: são aqueles que irão compor os fenômenos de massa. Ex: cada nascimento na Grande São Paulo, cada preço de cerveja em Campinas, etc.

DADO ESTATÍSTICO: é um dado numérico, considerado a matéria-prima sobre a qual se aplicam os métodos estatísticos.

Page 6: 51188715 Apostila de Estatistica Versao 4

6

POPULAÇÃO: é o conjunto total de elementos portadores de pelo menos uma característica comum.

AMOSTRA: é uma parcela representativa da população que é examinada com o propósito de tirar conclusões sobre a população.

PARÂMETROS: São valores singulares que existem na população e que servem para caracterizá-la. Para se definir um parâmetro deve-se examinar toda a população.

Exemplo: Os alunos do 4º semestre da USF têm em média 1,70 metros de estatura.

ESTIMATIVA: é um valor aproximado do parâmetro; é calculado com o uso da amostra.

ATRIBUTO: quando os dados estatísticos apresentam um caráter qualitativo, o levantamento e os estudos necessários ao tratamento desses dados são designados genericamente de estatística de atributo.

Exemplo: Classificação dicotômica do atributo: A classificação dos alunos da USF quanto ao sexo.

VARIÁVEL: É o conjunto de resultados possíveis de um fenômeno.

VARIÁVEL QUALITATIVA: Quando seus valores são expressos por atributos. Exemplo: sexo, cor da pele, cor dos olhos, estado civil, etc.

VARIÁVEL QUANTITATIVA: Quando seus valores são expressos em números.

Exemplo: salário, altura, peso, idade, etc.

As variáveis contínuas podem ser: Discreta ou Contínuas.

VARIÁVEL DISCRETA: Seus valores são expressos geralmente através de números inteiros não negativos. Resulta normalmente de contagens.

Exemplo: Nº de alunos presentes às aulas.

VARIÁVEL CONTÍNUA: podem assumir, teoricamente, qualquer valor entre dois limites.

Exemplo: Quando você vai medir a temperatura de seu corpo com um termômetro de mercúrio o que ocorre é o seguinte: O filete de mercúrio, ao dilatar-se, passará por todas as temperaturas intermediárias até chegar à temperatura atual do seu corpo.

Page 7: 51188715 Apostila de Estatistica Versao 4

7

EXERCÍCIO - Classifique as variáveis em ou quantitativas (contínuas ou discretas):

• Cor dos olhos das alunas... Resp:qualitativa • Índice de liquidez nas índústrias capixaba... Resp:quantitativa contínua • Produção de café no Brasil... Resp:quantitativa contínua • Número de defeitos em aparelhos de TV... Resp:quantitativa discreta • Comprimento dos pregos produzidos por uma empresa... Resp:quantitativa contínua • O ponto obtido em cada jogada de um dado... Resp:quantitativa discreta

Page 8: 51188715 Apostila de Estatistica Versao 4

8

2 - Amostragem

População ou Universo

População ou Universo: é o conjunto de todos os elementos que possuem pelo menos uma característica em comum.

Exemplo:

- O conjunto de todas as pessoas que são alunos da USF. - O conjunto de todas as pessoas portadoras de AIDES. - O conjunto de todas as pessoas moradoras de uma cidade.

Amostra

Amostra: é um subconjunto da população utilizado para se fazer uma análise sobre toda a população.

Esquematicamente tem-se:

Métodos Probabilísticos

Exige que cada elemento da população possua determinada probabilidade de ser selecionado. Normalmente possuem a mesma probabilidade. Assim, se N for o tamanho da população, a probabilidade de cada elemento ser selecionado numa pesquisa será 1/N. trata-se do método que garante cientificamente a aplicação das técnicas estatísticas de inferências. Somente com base em amostragens probabilísticas é que se podem realizar inferências ou induções sobre a população a partir do conhecimento da amostra.

É uma técnica especial para recolher amostras, que garantem, tanto quanto possível, o acaso na escolha.

Amostragem Aleatória Simples:

É o processo mais elementar e frequentemente utilizado. É equivalente a um sorteio lotérico. Pode ser realizada numerando-se a população de 1 a n e sorteando-se, a seguir, por meio de um dispositivo aleatório qualquer, x números dessa seqüência, os quais corresponderão aos elementos pertencentes à amostra.

População Amostra

Page 9: 51188715 Apostila de Estatistica Versao 4

9

Exemplo: Obter uma amostra de 10% representativa para a pesquisa da estatura de 90 alunos de uma escola:

1º - enumeram-se os alunos de 1 a 90.

2º - escrevem-se os números dos alunos, de 1 a 90, em pedaços iguais de papel, coloca-se numa urna e após misturar retiram-se, um a um, nove números que formarão a amostra.

Amostragem Proporcional Estratificada:

Quando a população se divide em estratos (subpopulações), convém que o sorteio dos elementos da amostra leve em consideração tais estratos, daí obtem-se os elementos da amostra proporcional ao número de elementos desses estratos.

Exemplo: Obter uma amostra proporcional estratificada de 10% do exemplo anterior, supondo, que, dos 90 alunos, 54 sejam meninos e 36 sejam meninas. São, portanto, dois estratos (sexo masculino e sexo feminino). Logo, tem-se:

Sexo População 10 % Amostra

Masculino 54 5,4 5

Feminino 36 3,6 4

Total 90 9,0 9

Enumeram-se então os alunos de 01 a 90, sendo 01 a 54 meninos e 55 a 90, meninas e procede-se ao sorteio casual.

Amostragem Sistemática:

Quando os elementos da população já se acham ordenados, não há necessidade de construir o sistema de referência. São exemplos os prontuários médicos de um hospital, os prédios de uma rua, etc. Nestes casos, a seleção dos elementos que constituirão a amostra pode ser feita por um sistema imposto pelo pesquisador. Exemplo: Supõem-se uma rua com 900 casas, das quais se deseja obter uma amostra

formada por 50 casas para uma pesquisa de opinião. Pode-se, neste caso, usar o seguinte procedimento: como 900/50 = 18, escolhe-se por sorteio casual um número de 01 a 18, o qual indicaria o primeiro elemento sorteado para a amostra; os demais elementos seriam periodicamente considerados de 18 em 18. Supondo que o número sorteado fosse 4 a amostra seria: 4ª casa, 22ª casa, 40ª casa, 58ª casa, 76ª casa, etc.

Amostragem por Conglomerados (ou Agrupamentos)

Algumas populações não permitem, ou tornam extremamente difícil que se identifiquem seus elementos. Não obstante, isso pode ser relativamente fácil identificar alguns

Page 10: 51188715 Apostila de Estatistica Versao 4

10

subgrupos da população. Em tais casos, uma amostra aleatória simples desses subgrupos (conglomerados) pode se colhida, e uma contagem completa deve ser feita para o conglomerado sorteado. Agrupamentos típicos são quarteirões, famílias, organizações, agências, edifícios etc. Exemplo: Num levantamento da população de determinada cidade, pode-se dispor do

mapa indicando cada quarteirão e não dispor de uma relação atualizada dos seus moradores. Pode-se, então, colher uma amostra dos quarteirões e fazer a contagem completa de todos os que residem naqueles quarteirões sorteados.

Métodos não Probabilísitcos

São amostragens em que há uma escolha deliberada dos elementos da amostra. Não é possível generalizar os resultados das pesquisas para a população, pois as amostras não-probabilísticas não garantem a representatividade da população.

Amostragem Acidental

Trata-se de uma amostra formada por aqueles elementos que vão aparecendo, que são possíveis de se obter até completar o número de elementos da amostra. Geralmente utilizada em pesquisas de opinião, em que os entrevistados são acidentalmente escolhidos. Exemplos: Pesquisas de opinião em praças públicas, ruas movimentadas de grandes cidades etc.

Amostragem Intencional

De acordo com determinado critério, é escolhido intencionalmente um grupo de elementos que irão compor a amostra. O investigador se dirige intencionalmente a grupos de elementos dos quais deseja saber a opinião. Exemplo: Numa pesquisa sobre preferência por determinado cosmético, o pesquisador se dirige a um grande salão de beleza e entrevista as pessoas que ali se encontram. Exercícios: 1 - Uma escola de 1º grau abriga 124 alunos. Obtenha uma amostra representativa

correspondente a 15% da população, utilizando a partir do início da 5ª linha da Tabela de números aleatórios.

2 - Tenho 80 lâmpadas numeradas numa caixa. Como se obtem uma amostra de 12 lâmpadas?

Page 11: 51188715 Apostila de Estatistica Versao 4

11

3 - Uma população encontra-se dividida em três estratos, com tamanhos, respectivamente, n1= 40, n2= 100 e n3= 60. Sabendo que, ao realizar uma amostragem estratificada proporcional, 9 elementos da amostra foram retirados do 3º estrato, determine o número de elementos da amostra.

4 - Mostre como seria possível retirar uma amostra de 32 elementos de uma população

ordenada formada por 2.432 elementos. Na ordenação geral, qual dos elementos abaixo seria escolhido para pertencer à amostra, sabendo-se que o elemento 1.420º a ela pertence? 1.648º, 290º, 725º, 2.025º ou 1.120º

Page 12: 51188715 Apostila de Estatistica Versao 4

12

3 - Séries Estatísticas

TABELA: É um quadro que resume um conjunto de dados dispostos segundo linhas e colunas de maneira sistemática.

Obs: O lado direito e esquerdo de uma tabela oficial deve ser aberto..

Série Estatística: É qualquer tabela que apresenta a distribuição de um conjunto de dados estatísticos em função da época, do local ou da espécie.

Séries Homógrafas: são aquelas em que a variável descrita apresenta variação discreta. Podem ser do tipo temporal, geográfica ou específica.

a) Série Temporal: Identifica-se pelo caráter variável do fator cronológico. O local e a espécie (fenômeno) são elementos fixos. Esta série também é chamada de histórica ou evolutiva.

ABC VEÍCLULOS LTDA. Vendas no 1º bimestre de 1996 (em mil unidades)

Período Unidades vendidas

Janeiro 2 0

Fevereiro 1 0

Total 3 0

.b) Série Geográfica: Apresenta como elemento variável o fator geográfico. A época e o fato (espécie) são elementos fixos. Também é chamada de espacial, territorial ou de localização.

ABC VEÍCLULOS LTDA. Vendas no 1º bimestre de 1996 (em mil unidades)

Filiais Unidades Vendidas

São Paulo 1 3

Rio de Janeiro 1 7

TOTAL 3 0

Page 13: 51188715 Apostila de Estatistica Versao 4

13

c) Série Específica: O caráter variável é apenas o fato ou espécie. Também é chamada de série categórica.

ABC VEÍCLULOS LTDA. Vendas no 1º bimestre de 1996 (em mil unidades)

Marca Unidades Vendidas

Fiat 1 8

Gm 1 2

Total 3 0

d) Séries Conjugadas: Também chamadas de tabelas de dupla entrada. São apropriadas para a apresentação de duas ou mais séries de maneira conjugada, havendo duas ordens de classificação: uma horizontal e outra vertical. O exemplo seguinte é de uma série geográfica-temporal.

ABC VEÍCLULOS LTDA. Vendas no 1º bimestre de 1996 ( em mil unidades)

Filiais Janeiro Fevereiro

São Paulo 1 0 3

Rio de Janeiro 1 2 5

TOTAL 2 2 8

Page 14: 51188715 Apostila de Estatistica Versao 4

14

4 - Gráficos Estatísticos

São representações visuais dos dados estatísticos que devem corresponder, mas nunca substituir, as tabelas estatísticas.

Características:

Uso de escalas, sistema de coordenadas, simplicidade, clareza e veracidade.

Gráficos de Informação: São gráficos destinados principalmente ao público em geral, objetivando proporcionar uma visualização rápida e clara. São gráficos tipicamente expositivos, dispensando comentários explicativos adicionais. As legendas podem ser omitidas, desde que as informações desejadas estejam presentes.

Gráficos de Análise: São gráficos que se prestam melhor ao trabalho estatístico, fornecendo elementos úteis à fase de análise dos dados, sem deixar de ser também informativos. Os gráficos de análise frequentemente vêm acompanhados de uma tabela estatística. Inclui-se, muitas vezes um texto explicativo, chamando a atenção do leitor para os pontos principais revelados pelo gráfico.

Classificação dos gráficos: Diagramas, Estereogramas, Pictogramas e Cartogramas.

.1 - Diagramas:

São gráficos geométricos dispostos em duas dimensões. São os mais usados na representação de séries estatísticas.

Os diagramas podem ser:

1.1 - Gráficos em barras horizontais.

Número de Acidentes numa Rodovia

0 10 20 30 40 50 60 70 80 90 100

1° Trim

2° Trim

3° Trim

4° Trim

Page 15: 51188715 Apostila de Estatistica Versao 4

15

1.2 - Gráficos em barras verticais.

Número de Acidentes numa Rodovia

0

20

40

60

80

100

1° Trim 2° Trim 3° Trim 4° Trim

1.3 - Gráficos em barras compostas.

Número de Acidentes em Rodovias

0

20

40

60

80

100

1° Trim 2° Trim 3° Trim 4° Trim

Bandeirantes D. Pedro

1.4 - Gráficos em linhas.

São frequentemente usados para representação de séries cronológicas com um grande número de períodos de tempo. As linhas são mais eficientes do que as colunas, quando existem intensas flutuações nas séries ou quando há necessidade de se representarem várias séries em um mesmo gráfico.

Page 16: 51188715 Apostila de Estatistica Versao 4

16

Número de Acidentes em Rodovias

0

20

40

60

80

100

1° Trim 2° Trim 3° Trim 4° Trim

Bandeirantes D. Pedro

1.5 - Gráficos em setores.

Este gráfico é construído com base em um círculo, e é empregado sempre que se deseja ressaltar a participação do dado no total. O total é representado pelo círculo, que fica dividido em tantos setores quantas são as partes. Os setores são tais que suas áreas são respectivamente proporcionais aos dados da série. O gráfico em setores só deve ser empregado quando há, no máximo, sete dados.

Obs: As séries temporais geralmente não são representadas por este tipo de gráfico.

Número de Acidentes numa Rodovia

1° Trim; 20,4

2° Trim; 27,4

3° Trim; 90

4° Trim; 20,4

.2 - Estereogramas:

São gráficos geométricos dispostos em três dimensões, pois representam volume. São usados nas representações gráficas das tabelas de dupla entrada. Em alguns casos este tipo de gráfico fica difícil de ser interpretado dada a pequena precisão que oferecem.

Page 17: 51188715 Apostila de Estatistica Versao 4

17

0

20

40

60

80

100

1° Trim 2° Trim 3° Trim 4° Trim

Número de Acidentes em Rodovias

Bandeirantes D. Pedro

3 - Pictogramas:

São construídos a partir de figuras representativas da intensidade do fenômeno. Este tipo de gráfico tem a vantagem de despertar a atenção do público leigo, pois sua forma é atraente e sugestiva. Os símbolos devem ser auto-explicativos. A desvantagem dos pictogramas é que apenas mostram uma visão geral do fenômeno, e não de detalhes minuciosos. Veja o exemplo abaixo:

4- Cartogramas:

São ilustrações relativas a cartas geográficas (mapas). O objetivo desse gráfico é o de figurar os dados estatísticos diretamente relacionados com áreas geográficas ou políticas.

Page 18: 51188715 Apostila de Estatistica Versao 4

18

5 - Distribuição de Freqüência

É um tipo de tabela que condensa uma coleção de dados conforme as freqüências (repetições de seus valores).

Tabela Primitiva ou Dados Brutos: É uma tabela ou relação de elementos que não foram numericamente organizados. É difícil formar uma idéia exata do comportamento do grupo como um todo, a partir de dados não ordenados.

Ex : 45, 41, 42, 41, 42 43, 44, 41 ,50, 46, 50, 46, 60, 54, 52, 58, 57, 58, 60, 51

ROL: É a tabela obtida após a ordenação dos dados (ordem crescente ou decrescente).

Ex : 41, 41, 41, 42, 42 43, 44, 45 ,46, 46, 50, 50, 51, 52, 54, 57, 58, 58, 60, 60

Distribuição de freqüência sem intervalos de classe: É a simples condensação dos dados conforme as repetições de seus valores. Para um ROL de tamanho razoável esta distribuição de freqüência é inconveniente, já que exige muito espaço.

Exemplo:

Dados Frequência

41 3

42 2

43 1

44 1

45 1

46 2

50 2

51 1

52 1

54 1

57 1

58 2

60 2

Total 20

Distribuição de freqüência com intervalos de classe: Quando o tamanho da amostra é elevado é mais racional efetuar o agrupamento dos valores em vários intervalos de classe.

Page 19: 51188715 Apostila de Estatistica Versao 4

19

Exemplo:

Classes Freqüências

41 |------- 45 7

45 |------- 49 3

49 |------- 53 4

53 |------- 57 1

57 |------- 61 5

Total 20

5.1 - Elementos de Uma Distribuição de Frequência

Com intervalos de classe:

Classe: são os intervalos de variação da variável e é simbolizada por i. O número total de classes é simbolizado por k.

Ex: na tabela anterior k = 5 e 49 |------- 53 é a 3ª classe, onde i=3.

Limites de Classe: são os extremos de cada classe. O menor número é o limite inferior de classe (li) e o maior número, limite superior de classe (Li).

Ex: em 49 |------- 53... l3= 49 e L3= 53. O símbolo |------- representa um intervalo fechado à esquerda e aberto à direita. O dado 53 do ROL não pertence a classe 3 e sim a classe 4 representada por 53 |------- 57.

Amplitude do Intervalo de Classe: é obtida através da diferença entre o limite superior e inferior da classe e é simbolizada por hi = Li - li.

Ex: na tabela anterior hi = 53 - 49 = 4.

Obs.: Na distribuição de freqüência com classe o hi será igual em todas as classes.

Amplitude Total da Distribuição: é a diferença entre o limite superior da última classe e o limite inferior da primeira classe. AT = L(max) - l(min).

Ex: na tabela anterior AT = 61 - 41= 20.

Amplitude Total da Amostra (Rol): é a diferença entre o valor máximo e o valor mínimo da amostra (ROL). Onde AA = Xmax - Xmin. Neste exemplo AA = 60 - 41 = 19.

Obs: AT sempre será maior que AA.

Page 20: 51188715 Apostila de Estatistica Versao 4

20

PONTO MÉDIO DE CLASSE: é o ponto que divide o intervalo de classe em duas partes iguais. Ex: em 49 |------- 53 o ponto médio x3 = (53+49)/2 = 51, ou seja x3=(l3+L3)/2.

5.2 - Método Prático para Construção de Distribuição de Freqüências

Com Classe:

1º - Organize os dados brutos em um ROL.

2º - Calcule a amplitude amostral AA.

Nesse exemplo: AA =60 - 41 =19

3º - Calcule o número de classes através da "Regra de Sturges": k = 1+3,3.log(n)

Onde: k é o numero de classes na tabela.

n é o número total de dados a serem tabulados.

Obs: Qualquer regra para determinação do nº de classes da tabela não leva a uma decisão final; esta vai depender na realidade de um julgamento pessoal, que deve estar ligado à natureza dos dados.

No exemplo: n = 20 dados, então, a princípio, a regra sugere a adoção de 5 classes.

k = 1+3,3*log(20) = 5,29. Arredonda-se para 5.

4º - Decidido o nº de classes, calcule então a amplitude do intervalo de classe h > AA/k.

Nesse exemplo: AA/k = 19/5 = 3,8.

Obs: Como h > AA/k pega-se um valor ligeiramente superior para haver folga na última classe. Utiliza-se então h = 4.

5º - Tem-se então o menor nº. da amostra, o nº. de classes e a amplitude do intervalo. Pode-se montar a tabela, com o cuidado para não aparecer classes com freqüência 0 (zero).

No exemplo: o menor nº. da amostra = 41 + h = 45, logo a primeira classe será representada por..41|------- 45. As classes seguintes respeitarão o mesmo procedimento.

O primeiro elemento das classes seguintes sempre será formado pelo último elemento da classe anterior.

Page 21: 51188715 Apostila de Estatistica Versao 4

21

Exemplo:

Classes Freqüências

41 |------- 45 7

45 |------- 49 3

49 |------- 53 4

53 |------- 57 1

57 |------- 61 5

Total 20

5.3 - Representação Gráfica de uma Distribuição de Freqüência

.Histograma, Polígono de freqüência e Polígono de freqüência acumulada.

Em todos os gráficos anteriores se utilizou o primeiro quadrante do sistema de eixos coordenados cartesianos ortogonais. Na linha horizontal (eixo das abscissas) colocaram-se os valores da variável e na linha vertical (eixo das ordenadas), as freqüências.

Histograma: é formado por um conjunto de retângulos justapostos, cujas bases se localizam sobre o eixo horizontal, de tal modo que seus pontos médios coincidam com os pontos médios dos intervalos de classe. A área de um histograma é proporcional à soma das freqüências simples ou absolutas.

Freqüências simples ou absolutas: são os valores que realmente representam o número de dados de cada classe. A soma das freqüências simples é igual ao número total dos dados da distribuição.

Freqüências relativas: são os valores das razões entre as freqüências absolutas de cada classe e a freqüência total da distribuição. A soma das freqüências relativas é igual a 1 (100 %).

Polígono de Freqüência: é um gráfico em linha, sendo as freqüências marcadas sobre perpendiculares ao eixo horizontal, levantadas pelos pontos médios dos intervalos de classe. Para realmente obtermos um polígono (linha fechada), deve-se completar a figura, ligando os extremos da linha obtida aos pontos médios da classe anterior à primeira e da posterior à última, da distribuição.

.Polígono de Freqüência Acumulada: é traçado marcando-se as freqüências acumuladas sobre perpendiculares ao eixo horizontal, levantadas nos pontos correspondentes aos limites superiores dos intervalos de classe.

Page 22: 51188715 Apostila de Estatistica Versao 4

22

Freqüência simples acumulada de uma classe: é o total das freqüências de todos os valores inferiores ao limite superior do intervalo de uma determina classe.

Freqüência relativa acumulada de uma classe: é a freqüência acumulada da classe, dividida pela freqüência total da distribuição.

...Classe.. ......fi..... .....xi..... .....fri..... .....Fi..... ......Fri..... 50 |-------- 54 4 52 0,100 4 0,100

54 |-------- 58 9 56 0,225 13 0,325

58 |-------- 62 11 60 0,275 24 0,600

62 |-------- 66 8 64 0,200 32 0,800

66 |-------- 70 5 68 0,125 37 0,925

70 |-------- 74 3 72 0,075 40 1,000

Total 40 1,000

Onde:

fi= freqüência simples;

xi= ponto médio de classe i;

fri= freqüência relativa da classe i;

Fi= freqüência simples acumulada até a classe i;

Fri= freqüência relativa acumulada até a classe i.

Frequência Absoluta

0

2

4

6

8

10

12

50|---54 54|---58 58|---62 62|---66 66|---70 70|---74

Page 23: 51188715 Apostila de Estatistica Versao 4

23

Polígono de Frequência Absoluta

0

2

4

6

8

10

12

50|---54 54|---58 58|---62 62|---66 66|---70 70|---74

Frequência Absoluta Acumulada

0

10

20

30

40

50

50|---54 54|---58 58|---62 62|---66 66|---70 70|---74

Poígono de Frequência Absoluta Acumulada

0

10

20

30

40

50

50|---54 54|---58 58|---62 62|---66 66|---70 70|---74

Observação: Os mesmo gráficos podem ser obtidos com as Freqüências Relativas Simples e Freqüências Relativas Acumuladas.

.

Page 24: 51188715 Apostila de Estatistica Versao 4

24

PRIMEIRA LISTA DE EXERCÍCIOS DE ESTATÍSTICA – Distribuição de Freqüências

1 – A tabela abaixo representa os salários pagos a 100 operários da empresa XPTO & Cia.

No. Se salários Mínimos

No. De Operários

0 |--- 2 2 |--- 4 4 |--- 6 6 |--- 8

8 |--- 10

40 30 10 15 5

Total 100

a) Determine a freqüência absoluta acumulada, a freqüência relativa e a freqüência relativa acumulada.

b) Quantos operários ganham até dois salários mínimos? c) Quantos operários ganham menos que 6 salários mínimos? d) Qual a porcentagem de operários com salário entre 6 e 8 salários mínimos? e) Qual a porcentagem de operários com salário inferior a 4 salários mínimos? f) Construa o histograma e o polígono de freqüências.

2 – Os dados seguintes representam 20 observações relativas ao índice pluviométrico em determinados municípios do estado.

Milímetros de chuva: 144 152 159 160 160 151 157 146 154 145 141 150 142 146 142 141 141 150 143 158

a) Construa uma tabela de freqüência absoluta. b) Determine as freqüências absolutas acumuladas c) Determine as freqüências relativas d) Determine as freqüências relativas acumuladas e) Construa o histograma e o polígono de freqüências

3 - Imagine que foi obtida a opinião de 1.000 pessoas a respeito da liberação de determinado filme

para exibição em televisão. Dessas 1.000 pessoas, 432 mostravam-se favoráveis, 322 eram contrárias, 122 não quiseram declarar a opinião e as restantes disseram não Ter opinião. Mostre esses dados numa tabela.

4 - Imagine que, das 1.000 pessoas entrevistadas cujas respostas foram apresentadas no exercício

anterior, 500 eram homens e 500 eram mulheres. Do total de homens, 289 mostravam-se favoráveis, 120 eram contrários, 78 não quiseram declarar a opinião e os restantes disseram não ter opinião. Construa uma tabela para apresentar a distribuição das respostas segundo o sexo.

5 – Os números abaixo representam a distribuição das espessuras de 100 folhas de tabaco. 2,01 2,08 1,96 3,04 2,01 3,18 1,94 2,19 2,24 2,18 2,59 1,96 2,29 3,18 2,09 1,96 2,06 2,18 2,05 2,04 2,43 1,56 1,94 3,15 2,35 2,08 2,56 2,17 1,96 1,59 2,22 2,34 2,24 1,95 2,01 3,12 3,03 3,12 2,04 1,66 1,87 2,49 3,12 2,24 1,76 3,20 2,38 1,58 1,89 1,98 1,89 1,71 2,42 1,62 1,97 2,18 1,69 3,14 2,18 3,06 2,40 1,96 3,01 2,19 2,25 1,45 1,93 2,06 1,83 1,84 1,91 2,11 1,78 2,36 2,33 3,17 2,03 1,87 3,11 2,17 1,72 1,62 1,99 1,64 1,54 2,26 1,86 2,09 1,74 1,92 2,36 1,82 2,02 2,25 1,75 3,15 3,18 1,99 1,76 2,51

Page 25: 51188715 Apostila de Estatistica Versao 4

25

a) Construa uma distribuição de freqüências com 9 classes de amplitude 0,2 sendo que o limite inferior da primeira classe é igual a 1,40.

b) Construa uma tabela de freqüência absoluta. c) Determine as freqüências absolutas acumuladas d) Determine as freqüências relativas e) Determine as freqüências relativas acumuladas f) Construa o histograma e o polígono de freqüências 6 – Considere a seguinte tabela de dados:

Classes Freq. Absoluta 2,75 |---- 2,80 2,80 |---- 2,85 2,85 |---- 2,90 2,90 |---- 2,95 2,95 |---- 3,00 3,00 |---- 3,05 3,05 |---- 3,10 3,10 |---- 3,15 3,15 |---- 3,20 3,20 |---- 3,25

2 3 10 11 24 14 9 8 6 3

T O T A L 90 a) Determine as freqüências absolutas acumuladas. b) Determine as freqüências relativas. c) Determine as freqüências relativas acumuladas.

Page 26: 51188715 Apostila de Estatistica Versao 4

26

6 - Medidas de Posição

São as estatísticas que representam uma série de dados que orientam quanto à posição da distribuição em relação ao eixo horizontal do gráfico da curva de freqüência.

As medidas de posições mais importantes são as medidas de tendência central ou promédias.

As medidas de tendência central mais utilizadas são: • Média Aritmética • Moda • Mediana

Outras medidas de tendência central menos utilizadas são: • Média Geométrica • Média Harmônica • Média Quadrática

As outras medidas de posição são as separatrizes, que englobam: • Mediana • Decis • Quartis • Percentis.

6.1 - Média Aritmética

É representada por: X___

ou µ

É igual ao quociente entre a soma dos elementos do conjunto e o número total dos elementos.

n

xn

ii

X∑

= =1___

.onde xi são os valores da variável e n o número de elementos da amostra. Ou

n

xn

ii∑

= =1µ .onde xi são os valores da variável e n o número de elementos da população.

.Dados não-agrupados:

Quando se deseja conhecer a média dos dados não-agrupados em tabelas de freqüências, determina-se a média aritmética simples.

Exemplo: Sabendo-se que a venda diária de arroz tipo A, durante uma semana, foi de 10, 14, 13, 15, 16, 18 e 12 kilos, então a venda média diária na semana é:

X___

.= (10+14+13+15+16+18+12) / 7 = 14 kilos

Page 27: 51188715 Apostila de Estatistica Versao 4

27

Desvio em relação à média: é a diferença entre cada elemento de um conjunto de

valores e a média aritmética, ou seja:.. di = xi - X___

No exemplo anterior têm-se sete desvios:...

d1 = 10 - 14 = -4 d3 = 13 - 14 = -1 d5 = 16 - 14 = 2 d7 = 12 - 14 = -2 d2 = 14 - 14 = 0 d4 = 15 - 14 = 1 d6 = 18 - 14 = 4

Propriedades da Média

1ª propriedade: A soma algébrica dos desvios em relação à média é nula.

No exemplo anterior: d1+d2+d3+d4+d5+d6+d7 = 0

2ª propriedade: Somando-se (ou subtraindo-se) uma constante (c) a todos os valores de uma variável, a média do conjunto fica aumentada (ou diminuída) dessa constante.

Se no exemplo original for somado a constante c = 2 a cada um dos valores da variável tem-se:

Y = [12+16+15+17+18+20+14] / 7 = 16 kilos ou Y = .+ 2 = 14 +2 = 16 kilos

3ª propriedade: Multiplicando-se (ou dividindo-se) todos os valores de uma variável por uma constante (c), a média do conjunto fica multiplicada (ou dividida) por essa constante.

Se no exemplo original for multiplicado a constante c = 3 nos valores da variável tem-se:

Y = [30+42+39+45+48+54+36] / 7 = 42 kilos ou Y = x 3 = 14 x 3 = 42 kilos

Dados agrupados:

Sem intervalos de classe

Considere-se a distribuição relativa a 34 famílias de quatro filhos, tomando para variável o número de filhos do sexo masculino. Pretende-se calcular a quantidade média de meninos por família:

Nº. de meninos Freqüência fi

0 2

1 6

2 10

3 12

4 4

Total 34

Page 28: 51188715 Apostila de Estatistica Versao 4

28

Como as freqüências são números indicadores da intensidade de cada valor da variável, elas funcionam como fatores de ponderação, o que nos leva a calcular a média

aritmética ponderada, dada pela fórmula: ∑

∑=

=

=

n

ii

i

n

ii

f

fx

X1

1___

.

.xi. ..fi. ..xi.fi . 0 2 0

1 6 6

2 10 20

3 12 36

4 4 16

total 34 78

Onde 78 / 34 = 2,3 meninos por família.

Com intervalos de classe

Neste caso, convenciona-se que todos os valores incluídos em um determinado intervalo de classe coincidem com o seu ponto médio, e determina-se a média aritmética ponderada por meio da fórmula:

∑=

=

=

n

ii

i

n

ii

f

fx

X1

1___

..onde Xi é o ponto médio da classe.

Exemplo: Calcular a estatura média de bebês conforme a tabela seguinte:

Estaturas (cm) Freqüência = fi Ponto médio = xi ..xi.fi. 50 |------------ 54 4 52 208

54 |------------ 58 9 56 504

58 |------------ 62 11 60 660

62 |------------ 66 8 64 512

66 |------------ 70 5 68 340

70 |------------ 74 3 72 216

Total 40 2.440

Aplicando a fórmula acima se tem: 2.440 / 40.= 61. logo... = 61 cm

Page 29: 51188715 Apostila de Estatistica Versao 4

29

6.2 - Média Geométrica

É a raiz n-ésima do produto de todos os elementos.

Média Geométrica Simples: nnxxxXg ...21

____

= ou nnxxxXg

1

21

____

)...(=

Exemplo - Calcular a média geométrica dos seguintes conjuntos de números: E

a) { 10, 60, 360 }........ no excel : =(10*60*360)^(1/3) ....R: 60 b) { 2, 2, 2 }........ no excel : =(2*2*2)^(1/3) ....R: 2 c) { 1, 4, 16, 64 }........ no excel : =(1*4*16*64)^(1/4) ....R: 8

.Média Geométrica Ponderada: ∑= i nf f

n

ffxxxXg ...21

21

____

ou ∑= inff

n

ffxxxXg

1

21

____

)...( 21

Exemplo - Calcular a média geométrica dos valores da tabela abaixo:

...xi... ...fi...

1 2

3 4

9 2

27 1

total 9

Isto é: 8296,3)27.9.3.1(9 1242__

==gX

.Propriedades da Média Geométrica

1ª propriedade: O produto dos quocientes entre cada valor de um conjunto de números e a média geométrica do conjunto é = 1.

Exemplo: Comprovar a 1ª propriedade da média geométrica com os dados {10, 60, 360}.

g = 60... onde... 10/60 x 60/60 x 360/60 = 1

.2ª propriedade: Séries que apresentam o mesmo número de elementos com o mesmo produto têm a mesma média geométrica.

Exemplo: Comprovar a 2ª propriedade da média geométrica com os dados:

a) {8 ; 12,5}.. ga = 10.. b) {2 ; 50}... gb = 10

Page 30: 51188715 Apostila de Estatistica Versao 4

30

3ª propriedade: A média geométrica é menor ou igual a média aritmética.

A desigualdade g < ..sempre se verifica, quando os valores da série forem positivos e nem todos iguais. Se entre eles houver um ou mais zeros, a média geométrica será nula.

A igualdade g = ..só ocorrerá quando todos os valores da série forem iguais.

.4ª propriedade: Quanto maior a diferença entre os valores originais maior será diferença entre as médias aritmética e geométrica. Veja na próxima tabela:

conjunto média aritmética média geométrica

X = {2, 2} 2 2

Y = {14, 16} 15 14,97

W = {8, 12} 10 9,8

Z = {2, 50} 26 10

.Aplicações da Média Geométrica.

a) Média de Relações

Empresa Capital líquido Dívida Capital líquido/Dívida

A 2.500 1.000 2,5

B 1.000 2.000 0,5

g = (2,5*0,5)^(1/2)........R: 1,1180

Obs: Se, para uma determinada empresa, se deseja estabelecer uma relação do tipo capital/dívida que seja independente da dívida ou do capital das diferentes empresas envolvidas, é recomendável o uso da média geométrica.

Se o que se deseja saber é a relação capital/dívida de certo número de empresas, após a consolidação, a cifra correta será obtida através da média aritmética.

b) Média em distribuições assimétricas ( Será visto mais adiante )

c) Média de taxas de variação

Exemplo: Supõe-se que um indivíduo tenha aplicado um capital de R$ 500,00 em 1995. Após um ano de aplicação, essa importância chegou a R$ 650,00. Reaplicando essa última quantia, ao final de mais um ano seu montante situava-se em R$ 910,00. Qual a taxa média de aumento de capital?

Page 31: 51188715 Apostila de Estatistica Versao 4

31

Período Taxa

1995 a 1996 650/500 = 1,3

1996 a 1997 910/650 = 1,4

A taxa média será (no excel)..=(1,3*1,4)^(1/2) ou a raiz quadrada do produto de 1,3 e 1,4.

Resposta: 1,3491

6.3 - Média Quadrática

É a raiz quadrada da média aritmética dos quadrados

Média Quadrática Simples: (para dados não agrupados)

n

xxx nXq22

221

___ ...++=

Exemplo: Calcular a média quadrática simples do seguinte conjunto de números:

A = { 2 , 3 , 4 , 5 } ....Resp: 3,67

.Média Quadrática Ponderada: Quando os valores da variável estiverem dispostos em uma tabela de freqüências, a média quadrática será determinada pela seguinte expressão:

∑∑

=i

ii

f

fxpXq

2___

Exemplo: Calcular a média quadrática dos valores da tabela abaixo:

classes ....fi.... ....xi.... .. (xi)2.. ... (xi)

2. fi

2 |--------- 4 5 3 9 45

4 |--------- 6 10 5 25 250

6 |--------- 8 12 7 49 588

8 |-------- 10 10 9 81 810

10 |-------- 12 5 11 121 605

total 42 2298

Aplica-se a raiz quadrada sobre (2298)/42

...Resp: 7,40

Page 32: 51188715 Apostila de Estatistica Versao 4

32

OBS:

• Sempre que os valores de X forem positivos e pelo menos um dado diferente é

válida a seguinte relação: q > > g

• A igualdade entre as médias acima se verifica quando os valores da variável forem todos iguais.

• A média quadrática é largamente utilizada em Estatística, principalmente quando se pretende calcular a média de desvios ( x - .) , em vez de a média dos valores originais. Neste caso, a média quadrática é denominada desvio-padrão, que é uma importante medida de dispersão.

6.4 - Moda

É o valor que ocorre com maior freqüência em uma série de valores.

A Moda é representada pelo símbolo: Mo

Desse modo, o salário modal dos empregados de uma fábrica é o salário mais comum, isto é, o salário recebido pelo maior número de empregados dessa fábrica.

.A Moda para dados não agrupados.

• A moda é facilmente reconhecida: basta, de acordo com definição, procurar o valor que mais se repete.

Exemplo: Na série { 7 , 8 , 9 , 10 , 10 , 10 , 11 , 12 } a moda é igual a 10.

• Há séries nas quais não existe valor modal, isto é, nas quais nenhum valor aparece mais vezes que outros.

Exemplo: { 3 , 5 , 8 , 10 , 12 } não apresenta moda. A série é amodal.

• .Em outros casos, pode haver dois ou mais valores de concentração. Diz-se, então, que a série tem dois ou mais valores modais.

Exemplo: { 2 , 3 , 4 , 4 , 4 , 5 , 6 , 7 , 7 , 7 , 8 , 9 } apresenta duas modas: 4 e 7. A série é bimodal.

.A Moda para dados agrupados.

a) Sem intervalos de classe

Uma vez agrupados os dados, é possível determinar imediatamente a moda: basta fixar o valor da variável de maior freqüência.

Page 33: 51188715 Apostila de Estatistica Versao 4

33

Exemplo: Qual a temperatura mais comum medida no mês abaixo:

Temperaturas Freqüência

0º C 3

1º C 9

2º C 12

3º C 6

Resp: 2º C é a temperatura modal, pois é a de maior freqüência.

.b) Com intervalos de classe.

A classe que apresenta a maior freqüência é denominada classe modal. Pela definição, pode-se afirmar que a moda, neste caso, é o valor dominante que está compreendido entre os limites da classe modal.

O método mais simples para o cálculo da moda consiste em tomar o ponto médio da classe modal. Da-se a esse valor a denominação de moda bruta.

Mo = ( l* + L* ) / 2

Onde l* = limite inferior da classe modal e L*= limite superior da classe modal.

Exemplo: Calcule a estatura modal conforme a tabela abaixo.

Classes (em cm) Freqüência

54 |------------ 58 9

58 |------------ 62 11

62 |------------ 66 8

66 |------------ 70 5

Resp: a classe modal é 58|-------- 62, pois é a de maior freqüência. l*=58 e L*=62

Mo = (58+62)/2 = 60 cm (este valor é estimado, pois não se conhece o valor real da moda).

.Método mais elaborado pela fórmula de CZUBER: *

21

1*h

DD

DlMo

++=

l*= limite inferior da classe modal... D1= (freqüência da classe modal) – (freqüência da classe anterior à classe modal) D2= (freqüência da classe modal) – (freqüência da classe posterior à classe modal) h*= amplitude da classe modal

Page 34: 51188715 Apostila de Estatistica Versao 4

34

Exemplo: Calculo da Moda na tabela anterior

D1 = 11 - 9=2 D2 = 11 – 8 = 3 h = 4 Mo = 58 + [2/(2+3)]x4 = 58 + 8/5 = 58 + 1,6 = 59,6 Mo = 59,6

Obs: A moda é utilizada quando se deseja obter uma medida rápida e aproximada de posição ou quando a medida de posição deva ser o valor mais típico da distribuição.

Já a média aritmética é a medida de posição que possui a maior estabilidade.

6.5 - Mediana

A mediana de um conjunto de valores, dispostos segundo uma ordem (crescente ou decrescente), é o valor situado de tal forma no conjunto que o separa em dois subconjuntos com o mesmo número de elementos.

Símbolo da mediana: Md

Mediana para dados não agrupados

Dada uma série de valores: { 5, 2, 6, 13, 9, 15, 10 }

Valore em ordem crescente: { 2, 5, 6, 9, 10, 13, 15 }

O valor que divide a série acima em duas partes iguais é igual a 9, logo a Md = 9.

.Método prático para o cálculo da Mediana

a) Se a série dada tiver número ímpar de termos:

O valor mediano será o termo de ordem dado pela fórmula: 2

1+=

nMd

Exemplo: Calcule a mediana da série { 1, 3, 0, 0, 2, 4, 1, 2, 5 }

1º - ordenar a série { 0, 0, 1, 1, 2, 2, 3, 4, 5 } n = 9. Então (n + 1)/2 é dado por (9 + 1) / 2 = 5, ou seja, o 5º elemento da série ordenada será a mediana A mediana será o 5º elemento, ou seja, Md = 2.

Page 35: 51188715 Apostila de Estatistica Versao 4

35

b) Se a série dada tiver número par de termos:

O valor mediano será o termo de ordem dado pela fórmula: 2

)12

(2

++

=

nn

Md

Obs: n/2 e (n/2 + 1) serão termos de ordem e devem ser substituídos pelos valores correspondentes.

Exemplo: Calcule a mediana da série { 1, 3, 0, 0, 2, 4, 1, 3, 5, 6 }

Ordenar a série { 0, 0, 1, 1, 2, 3, 3, 4, 5, 6 } n = 10. Logo a fórmula ficará: [( 10/2 ) + (10/2 + 1)] / 2 [( 5 + 6)] / 2 será na realidade (5º termo+ 6º termo) / 2 5º termo = 2 e 6º termo = 3 A mediana será = (2+3) / 2 ou seja, Md = 2,5 . A mediana no exemplo será a média aritmética do 5º e 6º termos da série.

Notas:

• Quando o número de elementos da série estatística for ímpar, haverá coincidência da mediana com um dos elementos da série.

• Quando o número de elementos da série estatística for par, nunca haverá coincidência da mediana com um dos elementos da série. A mediana será sempre a média aritmética dos 2 elementos centrais da série.

• Em uma série a mediana, a média e a moda não têm, necessariamente, o mesmo valor.

• A mediana depende da posição e não dos valores dos elementos na série ordenada. Essa é uma da diferenças marcantes entre mediana e média ( que se deixa influenciar, e muito, pelos valores extremos).

Exemplo: Em { 5, 7, 10, 13, 15 } a média = 10 e a mediana = 10

Em { 5, 7, 10, 13, 65 } a média = 20 e a mediana = 10 Isto é, a média do segundo conjunto de valores é maior do que a do primeiro, por influência dos valores extremos, ao passo que a mediana permanece a mesma.

Mediana para dados agrupados

a) Sem intervalos de classe

Neste caso, basta identificar a freqüência acumulada imediatamente superior à metade da soma das freqüências. A mediana será aquele valor da variável que corresponde a tal freqüência acumulada.

Page 36: 51188715 Apostila de Estatistica Versao 4

36

Exemplo:

Variável xi Freqüência fi Freqüência Acumulada

0 2 2

1 6 8

2 9 17

3 13 30

4 5 35

total 35

Quando o somatório das freqüências for ímpar o valor mediano será o termo de ordem

dado pela fórmula:.2

1∑ += if

Md

Como o somatório das freqüências = 35 a fórmula ficará: ( 35+1 ) / 2 = 18º termo = 3 Quando o somatório das freqüências for par o valor mediano será o termo de ordem

dado pela fórmula:.2

122

++

=

∑∑ ii ff

Md

Exemplo - Calcule a Mediana dos dados na seguinte tabela:

Variável xi Freqüência fi Freqüência Acumulada

12 1 1

14 2 3

15 1 4

16 2 6

17 1 7

20 1 8

total 8

Aplicando a fórmula acima tem-se:

[(8/2)+ (8/2+1)]/2 = (4º termo + 5º termo) / 2 = (15 + 16) / 2 = 15,5

Page 37: 51188715 Apostila de Estatistica Versao 4

37

b) Com intervalos de classe

Devem-se seguir os seguintes passos:

1º) Determinam-se as freqüências acumuladas;

2º) Calcular: 2∑ if ;

3º) Marcar a classe correspondente à freqüência acumulada imediatamente superior à

2∑ if . Tal classe será a classe mediana;

4º) Calcular a Mediana pela seguinte fórmula: *

*

*2

f

hFaaf

lMd

i

+=

Onde: l*: é o limite inferior da classe mediana. Faa: é a freqüência acumulada da classe anterior à classe mediana. f* : é a freqüência simples da classe mediana. h*: é a amplitude do intervalo da classe mediana.

Exemplo:

Classes Freqüência = fi Freqüência Acumulada

50 |------------ 54 4 4

54 |------------ 58 9 13

58 |------------ 62 11 24

62 |------------ 66 8 32

66 |------------ 70 5 37

70 |------------ 74 3 40

Total 40

2∑ if = 40 / 2 =.20...logo.a classe mediana será 58 |------ 62, l*=58.

Faa = 13,.... f* = 11,.. h*= 4. Substituindo esses valores na fórmula, obtem-se:

Md = 58 + [ (20 - 13) x 4] / 11 = 58 + 28/11 = 60,54

OBS: Esta mediana é estimada, pois não se tem os 40 valores da distribuição.

Emprego da Mediana

• Quando se deseja obter o ponto que divide a distribuição em duas partes iguais. • Quando há valores extremos que afetam de maneira acentuada a média aritmética. • Quando a variável em estudo é salário.

Page 38: 51188715 Apostila de Estatistica Versao 4

38

6.6 – Separatrizes – Quartis, Decis e Percentis

Além das medidas de posição estudadas, há outras que consideradas individualmente, não são medidas de tendência central, mas estão ligadas à mediana relativamente à sua característica de separar a série em duas partes que apresentam o mesmo número de valores.

As medidas - os quartis, os decis e os percentis - são, juntamente com a mediana, conhecidas pelo nome genérico de separatrizes.

QUARTIS

Denominam-se quartis os valores de uma série que a dividem em quatro partes iguais. Precisa-se, portanto de 3 quartis (Q1, Q2 e Q3 ) para dividir a série em quatro partes iguais. Obs: O quartil 2 ( Q2 ) é igual a mediana da série.

Quartis para dados não agrupados

O método mais prático é utilizar o princípio do cálculo da mediana para os 3 quartis. Na realidade serão calculadas "3 medianas " em uma mesma série.

Exemplo1: Calcule os quartis da série: { 5, 2, 6, 9, 10, 13, 15 }

O primeiro passo a ser dado é o da ordenação (crescente ou decrescente) dos valores: { 2, 5, 6, 9, 10, 13, 15 } O valor que divide a série acima em duas partes iguais é o 9, logo a Md = 9. Que será = Q2. Tem-se agora {2, 5, 6 } e {10, 13, 15 } como sendo os dois grupos de valores iguais proporcionados pela mediana ( quartil 2). Para o cálculo do quartil 1 e quartil 3 (Q1 e Q3) basta calcular as medianas das partes iguais provenientes da verdadeira Mediana da série (quartil 2). Logo em { 2, 5, 6 } a mediana é = 5 . Ou seja: será o quartil 1 (Q1) Em {10, 13, 15 } a mediana é =13 . Ou seja: será o quartil 3 (Q3)

Exemplo2: Calcule os quartis da série: { 1, 1, 2, 3, 5, 5, 6, 7, 9, 9, 10, 13 }

A série já está ordenada, então se calcula o Quartil 2 = Md = (5+6)/2 = 5,5 O quartil 1 (Q1) será a mediana da série à esquerda de Md : { 1, 1, 2, 3, 5, 5 } Q1 = (2+3)/2 = 2,5 O quartil 3 (Q3) será a mediana da série à direita de Md : {6, 7, 9, 9, 10, 13 } Q3 = (9+9)/2 = 9

Page 39: 51188715 Apostila de Estatistica Versao 4

39

Quartis para dados agrupados

Uitliza-se a mesma técnica do cálculo da mediana, bastando substituir, na fórmula da

mediana, 2∑ if .... por ..

4*∑ if

k . onde k é o número de ordem do quartil.

Assim, tem-se:

**

*4

1f

hFaaf

lQ

i

+=

*

*

*4

2

2f

hFaaf

lQ

i

+=

*

*

*4

3

3f

hFaaf

lQ

i

+=

Q1 – Primeiro quartil: valor situado de tal modo na série que uma quarta parte (25%) dos dados é menor que ele e as três quartas partes restantes (75%) são maiores.

Q2 – Segundo quartil (mediana): valor situado de tal modo na série que a metade (50%) dos dados é menor que ele e a metade restante (50%) são maiores.

Q3 – Terceiro quartil: valor situado de tal modo na série que as três quartas partes (75%) dos dados são menores que ele e uma quarta parte (25%) é maior.

Exemplo3 - Calcule os quartis da tabela abaixo:

Classes Freqüência = fi Freqüência Acumulada

50 |------------ 54 4 4

54 |------------ 58 9 13 <--- Q1

58 |------------ 62 11 24 <--- Q2

62 |------------ 66 8 32 <--- Q3

66 |------------ 70 5 37

70 |------------ 74 3 40

Total 40

O quartil 2 = Q2 = Md , logo:

2∑ if = 40 / 2 =.20........... Assim, a classe mediana será 58 |---------- 62

l* = 58........... F** = 13........... f* = 11........... h* = 4 Substituindo esses valores na fórmula, obtem-se: Q2 = Md = 58 + [ (20 - 13) x 4] / 11 = 58 + 28/11 = 60,54

O quartil 1 : 4∑ if = 10

Q1 = 54 + [ (10 - 4) x 4] / 9 = 54 + 2,66 = 56,66

.O quartil 3 : 4

*3 ∑ if = 30

Q3 = 62 + [ (30 -24) x 4] / 8 = 62 + 3 = 65

Page 40: 51188715 Apostila de Estatistica Versao 4

40

DECIS

A definição dos decis obedece o mesmo princípio dos quartis, com a modificação da porcentagem de valores que ficam aquém e além do decil que se pretende calcular.

A fómula básica será : 10

*∑ ifk onde k é o número de ordem do decil a ser calculado.

Indicam-se os decis : D1, D2, ... , D9. Deste modo precisa-se de 9 decis para dividir uma série em 10 partes iguais.

De especial interesse é o quinto decil, que divide o conjunto em duas partes iguais. Assim sendo, o quinto decil é igual ao segundo quartil, que por sua vez é igual à mediana.

Para D5 tem-se: 10

*5 ∑ if = 2∑ if

Exemplo: Calcule o 3º decil da tabela anterior com classes.

k= 3 onde 10

*3 ∑ if = 3x40/10 = 12. Este resultado corresponde a 2ª classe.

D3 = 54 + [ (12 - 4) x 4] / 9 = 54 + 3,55 = 57,55

PERCENTIL ou CENTIL

Denomina-se percentis ou centis como sendo os noventa e nove valores que separam uma série em 100 partes iguais.

Indica-se: P1, P2, ... , P99. É evidente que P50 = Md ; P25 = Q1 e P75 = Q3.

O cálculo de um centil segue a mesma técnica do cálculo da mediana, porém a fórmula

será: 100

*∑ ifk onde k é o número de ordem do percentil a ser calculado.

Exemplo: Calcule o 8º percentil da tabela anterior com classes.

k= 8 onde 100

*8 ∑ if = 8x40/100 = 3,2. Este resultado corresponde a 1ª classe.

P8 = 50 + [ (3,2 -0) x 4] / 4 = 50 + 3,2 = 53,2

Page 41: 51188715 Apostila de Estatistica Versao 4

41

7 – Medidas de Dispersão ou Variabilidade:

Mede a dispersão dos valores de uma variável em torno de um valor de tendência central (média ou mediana) tomado como ponto de comparação.

A média - ainda que considerada como um número para representar uma série de valores - não consegue destacar o grau de homogeneidade ou heterogeneidade que existe entre os valores que compõem o conjunto.

Considere os seguintes conjuntos de valores das variáveis X, Y e Z:

X = { 70, 70, 70, 70, 70 } Y = { 68, 69, 70 ,71 ,72 } Z = { 5, 15, 50, 120, 160 }

Observa-se que os três conjuntos apresentam a mesma média aritmética = 350/5 = 70

Entretanto, é fácil notar que o conjunto X é mais homogêneo que os conjuntos Y e Z, já que todos os valores são iguais à média.

O conjunto Y, por sua vez, é mais homogêneo que o conjunto Z, pois há menor dispersão entre cada um de seus valores comparado com a média.

Conclui-se então que o conjunto X apresenta dispersão nula e que o conjunto Y apresenta uma dispersão menor que o conjunto Z.

7.1 - Medidas de Dispersão Absoluta

7.1.1 - Amplitude Total

Amplitude total – AT é a única medida de dispersão que não tem a média como ponto de

referência.

Quando os dados não estão agrupados a amplitude total é a diferença entre o maior e o

menor valor observado:

AT = (valor máximo - valor mínimo).

Exemplo: Para os valores 40, 45, 48, 62 e 70 a amplitude total será: AT = 70 - 40 = 30

Quando os dados estão agrupados sem intervalos de classe ainda tem-se: AT = (valor máximo - valor mínimo).

Page 42: 51188715 Apostila de Estatistica Versao 4

42

Exemplo:

xi fi

0 2

1 6

3 5

4 3

AT = 4 - 0 = 4

Com intervalos de classe a amplitude total é a diferença entre o limite superior da última classe e o limite inferior da primeira classe.

Então AT = L máximo - l mínimo

Exemplo:

Classes fi

4 |------------- 6 6

6 |------------- 8 2

8 |------------- 10 3

AT = 10 - 4 = 6

A amplitude total tem o inconveniente de só levar em conta os dois valores extremos da série, não considerando os valores intermediários.

Faz-se uso da amplitude total quando se quer determinar a amplitude da temperatura em um dia, no controle de qualidade ou como uma medida de cálculo rápido sem muita exatidão.

7.1.2 - Desvio Médio Absoluto

Desvio Médio Absoluto para dados não agrupados

É a média aritmética dos valores absolutos dos desvios tomados em relação a uma das seguintes medidas de tendência central: média ou mediana. Símbolo = Dm

Fórmula: para a Média:n

Xx

Dmi∑ −

=

___

Fórmula: para a Mediana: n

MdxDm

i∑ −=

As barras verticais indicam que são tomados os valores absolutos dos desvios.

Page 43: 51188715 Apostila de Estatistica Versao 4

43

Exemplo: Calcular o desvio médio do conjunto de números { - 4 , - 3 , - 2 , 3 , 5 }

= - 0, 2 e Md = - 2

Tabela auxiliar para cálculo do desvio médio

Desvio em Relação à Média Desvio em Relação à Mediana

Xi Xi - | Xi - | Xi - Md | Xi - Md |

- 4 (- 4) - (-0,2) = -3,8 3,8 (- 4) - (-2) = - 2 2

- 3 (- 3) - (-0,2) = -2,8 2,8 (- 3) - (-2) = - 1 1

- 2 (- 2) - (-0,2) = -1,8 1,8 (- 2) - (-2) = 0 0

3 3 - (-0,2) = 3,2 3,2 3 - (-2) = 5 5

5 5 - (-0,2) = 5,2 5,2 5 - (-2) = 7 7

∑ = 16,8 ∑ = 15

Pela Média: Dm = 16,8 / 5 = 3,36 Pela Mediana : Dm = 15 / 5 = 3

Desvio médio para Dados Agrupados

Se os valores vierem dispostos em uma tabela de freqüências, agrupados ou não em classes, serão usadas as seguintes fórmulas:

Cálculo pela média: ∑

∑ −

=i

ii

f

fXx

Dm

*___

Cálculo pela mediana: ∑

∑ −=

i

ii

f

fMdxDm

*

Exemplo de cálculo pela média:

Xi f i Xi . f i Xi - | Xi - | | Xi - | . f i

3 2 6 4,7 - 1,7 1,7 3,4

4 2 8 4,7 - 0,7 0,7 1,4

5 3 15 4,7 0,3 0,3 0,9

6 3 18 4,7 1,3 1,3 3,9

∑ = 10 47 ∑ = 9,6

Dm = 9,6 / 10 = 0,96

Page 44: 51188715 Apostila de Estatistica Versao 4

44

Exemplo de cálculo pela mediana:

Xi f i Md Xi - Md | Xi - Md | | Xi - Md | . f i

3 2 5 - 2 2 4

4 2 5 - 1 1 2

5 3 5 0 0 0

6 3 5 1 1 1

∑ = 10 ∑ = 7

Dm = 7 / 10 = 0,70

Obs: Apesar de o desvio médio expressar aceitavelmente a dispersão de uma amostra, não é tão frequentemente empregado como o desvio-padrão. O desvio médio despreza o fato de alguns desvios serem negativos e outros positivos, pois essa medida os trata como se fossem todos positivos. Todavia será preferido o uso do desvio médio em lugar do desvio-padrão, quando esse for indevidamente influenciado pelos desvios extremos.

7.1.3 - Desvio Padrão

É a medida de dispersão mais geralmente empregada, pois leva em consideração a totalidade dos valores da variável em estudo. É um indicador de variabilidade bastante estável. O desvio padrão baseia-se nos desvios em torno da média aritmética e a sua fórmula básica pode ser traduzida como: a raiz quadrada da média aritmética dos quadrados dos desvios e é representada por S ou σσσσ .

Desvio Padrão de uma amostra: 1

)( 2__

−=∑

n

XxS

i

Desvio Padrão de uma população: n

Xxi∑ −=

2__

)(σ

A fórmula acima é empregada quando se trata de uma população de dados não-agrupados.

Page 45: 51188715 Apostila de Estatistica Versao 4

45

Exemplo: Calcular o desvio padrão da população representada por: - 4 , -3 , -2 , 3 , 5

Xi

- 4 - 0,2 - 3,8 14,44

- 3 - 0,2 - 2,8 7,84

- 2 - 0,2 - 1,8 3,24

3 - 0,2 3,2 10,24

5 - 0,2 5,2 27,04

∑ = 62,8

Sabe-se que n = 5 e 62,8 / 5 = 12,56.

A raiz quadrada de 12,56 é o desvio padrão: σσσσ = 3,54

Obs: Quando o interesse se restringe à descrição dos dados da amostra visando tirar inferências válidas para toda a população, efetua-se uma modificação que consiste em usar o divisor n - 1 em lugar de n.

O desvio padrão de uma amostra é calculado pela fórmula: 1

)( 2__

−=∑

n

XxS

i

Se os dados - 4, -3, -2, 3, 5 representassem uma amostra o desvio padrão amostral seria a raiz quadrada de 62,8 / (5 -1) = 3,96, ou seja: S = 3,96.

Propriedades do Desvio padrão:

1ª - Somando-se (ou subtraindo-se) uma constante a todos os valores de uma variável, o desvio padrão não se altera.

2ª - Multiplicando-se (ou dividindo-se) todos os valores de uma variável por uma constante (diferente de zero), o desvio padrão fica multiplicado ( ou dividido) por essa constante.

Quando os dados estão agrupados em classes a fórmula do desvio padrão é:

Para os dados de uma população: ∑

=i

ii

f

fXx2

__

)(σ

Para os dados de uma amostra: 1

)( 2__

=∑

i

ii

f

fXx

S

Page 46: 51188715 Apostila de Estatistica Versao 4

46

Exemplo: Calcule o desvio padrão populacional da tabela abaixo:

ix if ii fx __

X )(__

Xxi − 2__

)( Xxi − ii fXx

2__

)( −

0 2 0 2,1 -2,1 4,41 8,82

1 6 6 2,1 -1,1 1,21 7,26

2 12 24 2,1 -0,1 0,01 0,12

3 7 21 2,1 0,9 0,81 5,67

4 3 12 2,1 1,9 3,61 10,83

Total 30 63 ∑= 32,70

Sabe-se que ∑fi = 30 e 32,7 / 30 = 1,09.

A raiz quadrada de 1,09 é 1,044. Logo σσσσ = 1,044.

Se considerar os dados como sendo de uma amostra o desvio padrão será:

A raiz quadrada de 32,7 / (30 -1) = 1,062. Logo S = 1,062.

Obs: Nas tabelas de freqüências com intervalos de classe a fórmula a ser utilizada é a mesma do exemplo anterior.

7.1.4 - Variância

É o desvio padrão elevado ao quadrado e é represejntado por S2 ou σσσσ2

A variância é uma medida que tem pouca utilidade como estatística descritiva, porém é extremamente importante na inferência estatística e em combinações de amostras.

A variância é o quadrado do desvio padrão.

Variância da população: n

Xxi∑ −=

2__

2 )(σ

Variância da amostra: 1

)( 2__

2

−=∑

n

XxS

i

EXERCÍCIOS

1 - Considere os seguintes conjuntos de números:

A = { 10, 20, 30, 40, 50 } B = { 100, 200, 300, 400, 500 }

Que relação existe entre os desvios padrões dos dois conjuntos de números?

Page 47: 51188715 Apostila de Estatistica Versao 4

47

2 - Dados os conjuntos de números:

A = { 220, 230, 240, 250, 260 } B = { 20, 30, 40, 50, 60 }

Que relação existe entre os desvios padrões dos dois conjuntos de números?

3 - Dados os conjuntos de números: A = {-2, -1, 0, 1, 2} B = {220, 225, 230, 235, 240}.

De acordo com as propriedades do desvio padrão, pode-se afirmar que o desvio padrão de B é igual ao:

a) desvio padrão de A; b) desvio padrão de A, multiplicado pela constante 5; c) desvio padrão de A, multiplicado pela constante 5, e esse resultado somado a 230; d) desvio padrão de A mais a constante 230.

7.2 - Medidas de Dispersão Relativa

CV: Coeficiente de Variação

Na estatística descritiva o desvio padrão por si só tem grandes limitações. Assim, um desvio padrão de 2 unidades pode ser considerado pequeno para uma série de valores cujo valor médio é 200; no entanto, se a média for igual a 20, o mesmo não pode ser dito.

Além disso, o fato do desvio padrão ser expresso na mesma unidade dos dados limita o seu emprego quando se deseja comparar duas ou mais séries de valores, relativamente à sua dispersão ou variabilidade, quando expressas em unidades diferentes.

Para contornar essas dificuldades e limitações, pode-se caracterizar a dispersão ou variabilidade dos dados em termos relativos ao seu valor médio.

Medida essa denominada de CV: Coeficiente de Variação

O coeficiente de variação é a razão entre o desvio padrão e a média.

A fórmula do 100.__

=

X

SCV

O resultado neste caso é expresso em percentual, entretanto pode ser expresso também através de um fator decimal, desprezando assim o valor 100 da fórmula.

Page 48: 51188715 Apostila de Estatistica Versao 4

48

Exemplo: Tomam-se os resultados das estaturas e dos pesos de um mesmo grupo de indivíduos:

Discriminação M É D I A DESVIO PADRÃO

ESTATURAS 175 cm 5,0 cm

PESOS 68 kg 2,0 kg

Qual das medidas (Estatura ou Peso) possui maior homogeneidade?

Resposta: Tem-se que calcular o CV da Estatura e o CV do Peso.

O CV menor será o de maior homogeneidade (menor dispersão ou variabilidade).

CVestatura = ( 5 / 175 ) x 100 = 2,85 %

CVpeso = ( 2 / 68 ) x 100 = 2,94 %.

Logo, nesse grupo de indivíduos, as estaturas apresentam menor grau de dispersão que os pesos.

Exercícios:

1 – O salário médio mensal em Hortolândia é de R$ 750,00 e em Cosmópolis é de R$ 500,00. Os desvios padrões são R$ 100,00 e R$ 80,00. Faça uma análise comparativa quanto ao grau de homogeneidade do salário nestas duas localidades:

2 - O risco de uma ação de uma empresa pode ser devidamente avaliado através da variabilidade dos retornos esperados. Portanto, a comparação das distribuições probabilísticas dos retornos, relativas a cada ação individual, possibilita a quem toma decisões perceber os diferentes graus de risco. Analise, abaixo, os dados estatísticos relativos aos retornos de 5 ações e diga qual é a menos arriscada :

Discriminação Ação A Ação B Ação C Ação D Ação E

Valor esperado 15 % 12 % 5 % 10 % 4 %

Desvio padrão 6 % 6,6 % 2,5 % 3 % 2,6 %

Coeficiente de variação 0,40 0,55 0,50 0,30 0,65

3 - Um grupo de 85 moças tem estatura média 160,6 cm, com um desvio padrão igual a 5,97 cm. Outro grupo de 125 moças tem uma estatura média de 161,9 cm, sendo o desvio padrão igual a 6,01 cm. Qual é o coeficiente de variação de cada um dos grupos? Qual o grupo mais homogêneo?

4 - Um grupo de 196 famílias tem renda média de 163,8 dólares, com um coeficiente de variação de 3,3%. Qual o desvio padrão da renda desse grupo?

Page 49: 51188715 Apostila de Estatistica Versao 4

49

5 - Uma distribuição apresenta as seguintes estatísticas: S = 1,5 e CV = 2,9 % . Determine a média da distribuição.

6 - Numa pequena cidade, 65 famílias têm a renda média de 57,5 dólares e o desvio padrão de 5,98 dólares. A variabilidade relativa das famílias foi de:

a) 0,104 dólares b) 10,4 dólares c) 0,104 % d) 10,4 % e) 0,104 famílias

Page 50: 51188715 Apostila de Estatistica Versao 4

50

SEGUNDA LISTA DE EXERCÍCIOS DE ESTATÍSTICA População, amostra, média desvio padrão, variança, etc.

1 - Classifique as variáveis em qualitativas ou quantitativas (contínuas ou discretas):

a) Universo: alunos de uma escola. Variável: cor dos cabelos. - b) Universo: casais residentes em uma cidade. Variável: número de filhos. - c) Universo: peças produzidas por certa máquina. Variável: número de peças produzidas por hora- d) Universo: peças produzidas por certa máquina. Variável: diâmetro externo. -

2 - Nos exercícios abaixo, identifique cada número como discreto ou contínuo:

a) Cada cigarro Camel tem 16,13 mg de alcatrão. b) Uma pesquisa efetuada com 1015 pessoas indica que 40 delas são assinantes da internet. c) De 1000 consumidores pesquisados, 930 reconheceram a marca de sopa Campbell. d) Ao completar um programa de treinamento, Shaquille O’Neal pesava 12,44 lb menos do que

no início do treinamento. 3 - Responda e explique o porque de cada uma das questões abaixo.

a) O desvio padrão de um conjunto de dados pode ser zero ? b) O desvio padrão de um conjunto de dados pode se negativo ? c) O desvio médio absoluto de um conjunto de dados pode ser zero ? d) O desvio médio absoluto de um conjunto de dados pode ser negativo ?

4 - Determine a média e a mediana para cada um dos conjuntos de dados:

a) 7; 9; 2; l; 5; 4,5; 7,5; 6,2 b) 90, 87, 92, 81, 78, 85, 95, 80 c) 0,011; 0,032; 0,027; 0,035; 0,042

5 - Qual seria o efeito sobre a média de um conjunto de números se fosse adicionado l0 unidades:

a) A apenas um dos números do conjunto? b) A cada um dos números do conjunto?

6 - Calcule a média, a variância e o desvio padrão do seguinte conjunto de dados: 83, 92, 100, 57, 85, 88, 84, 82, 94, 93, 91, 95, supondo que:

a) O conjunto representa toda a população. b) O conjunto representa uma amostra da população.

7 -Calcule a média a mediana e a moda do número de clientes que aguardam nas filas de 12 caixas

da matriz de um grande banco: l, 3, 4, 3, 4, 2, 4, l, 2, 2, 1, 0 8 - Se cada um dos dados de um conjunto de números fosse duplicado, qual seria o efeito:

a) Sobre a média b) Sobre o desvio padrão.

9 - Considere os seguintes dados correspondentes a preços (em reais) de propostas: 26,50; 27,50; 25,50; 26,00; 27,00; 23,40; 25,10; 26,20; 26,80

a) Calcule o Intervalo b) Determine o Desvio Médio Absoluto c) Calcule a Variância d) Calcule o Desvio Padrão.

10 – A tabela abaixo representa os salários pagos a 100 operários da empresa XPTO & Cia.

Page 51: 51188715 Apostila de Estatistica Versao 4

51

No. Se salários

Mínimos No. De

Operários 0 |--- 2 2 |--- 4 4 |--- 6 6 |--- 8

8 |--- 10

40 30 10 15 5

Total 100

a) Determine a classe modal e a moda dos salários b) Calcule a média e a mediana dos salários c) Calcule o desvio padrão dos salários

11 – Os dados seguintes representam 20 observações relativas ao índice pluviométrico em

determinados municípios do estado. Milímetros de chuva: 144 152 159 160 160 151 157 146 154 145 141 150

142 146 142 141 141 150 143 158

a) Determine o índice pluviométrico que esteve em moda. b) Ache a mediana, a média e o desvio padrão dos índices pluviométricos

12 - Utilize os resultados da tabela construída no exercício 2 da primeira lista de exercícios

c) Determine o índice pluviométrico que esteve em moda. d) Ache a mediana, a média e o desvio padrão dos índices pluviométricos e) Compare os resultados

13 – Os números abaixo representam a distribuição das espessuras de 100 folhas de tabaco. 2,01 2,08 1,96 3,04 2,01 3,18 1,94 2,19 2,24 2,18 2,59 1,96 2,29 3,18 2,09 1,96 2,06 2,18 2,05 2,04 2,43 1,56 1,94 3,15 2,35 2,08 2,56 2,17 1,96 1,59 2,22 2,34 2,24 1,95 2,01 3,12 3,03 3,12 2,04 1,66 1,87 2,49 3,12 2,24 1,76 3,20 2,38 1,58 1,89 1,98 1,89 1,71 2,42 1,62 1,97 2,18 1,69 3,14 2,18 3,06 2,40 1,96 3,01 2,19 2,25 1,45 1,93 2,06 1,83 1,84 1,91 2,11 1,78 2,36 2,33 3,17 2,03 1,87 3,11 2,17 1,72 1,62 1,99 1,64 1,54 2,26 1,86 2,09 1,74 1,92 2,36 1,82 2,02 2,25 1,75 3,15 3,18 1,99 1,76 2,51

a) Determine a espessura que esteve em moda. b) Ache a mediana, a média e o desvio padrão das espessuras.

14 - Utilize os resultados da tabela construída no exercício 5 da primeira lista de exercícios

c) Determine a espessura que esteve em moda. d) Ache a mediana, a média e o desvio padrão das espessuras. e) Compare os resultados

Page 52: 51188715 Apostila de Estatistica Versao 4

52

15 – Considere a seguinte tabela de dados:

Classes Freq. Absoluta 2,75 |---- 2,80 2,80 |---- 2,85 2,85 |---- 2,90 2,90 |---- 2,95 3,95 |---- 3,00 3,00 |---- 3,05 3,05 |---- 3,10 3,10 |---- 3,15 3,15 |---- 3,20 3,20 |---- 3,25

2 3 10 11 24 14 9 8 6 3

T O T A L 90

a) Determine a classe modal e a moda dos dados. b) Calcule a mediana, a média e o desvio padrão dos dados

Page 53: 51188715 Apostila de Estatistica Versao 4

53

TERCEIRA LISTA DE EXERCÍCIOS DE ESTATÍSTICA Teste sobre média mediana, etc.

Marque a questão correta :

A - Em uma prova de Estatística, 3 alunos obtiveram a nota 8,2 ; outros 3 obtiveram a nota 9,0 ; 5 obtiveram a nota 8,6 ; 1 obteve a nota 7,0 e 1 a nota 8,9. A nota média dos alunos será:

1. Uma média aritmética simples com valor 8,0 ; 2. Uma média aritmética simples com valor 8,7 ; 3. Uma média aritmética ponderada com valor 8,0 ; 4. Uma média aritmética ponderada com valor 8,5 ; 5. Uma média aritmética ponderada com valor 8,6, pois é o de maior frequência.

B - Um professor, após verificar que toda a classe obteve nota baixa, eliminou as questões que não foram respondidas pelos alunos. Com isso, as notas de todos os alunos foram aumentadas de 3 pontos. Então pode-se afirmar que:

1. A média aritmética ficou alterada, assim como a mediana. 2. Apenas a média aritmética ficou alterada. 3. Apenas a mediana ficou alterada. 4. Não houve alteração nem na média nem na mediana. 5. Nada podemos afirmar sem conhecer o número total de alunos.

C - Na tabela primitiva : { 6, 2, 7, 6, 5, 4 } a soma dos desvios em relação à média aritmética é igual a :

1. Ao número - 4 2. Ao número 8 3. Ao número 0 4. Ao número 25 5. Ao número 4

D - A mediana da série { 1, 3, 8, 15, 10, 12, 7 } é :

1. Igual a 15 2. Igual a 10 3. Igual a 8 4. Igual a 3,5 5. Não há mediana, pois não existe repetição de valores.

E - Numa pesquisa de opinião, 80 pessoas são favoráveis ao divórcio, 50 são desfavoráveis, 30 são indiferentes e 20 ainda não têm opinião formada a respeito do assunto. Então a média aritmética será:

1. Igual a 180, porque todos opinaram somente uma vez. 2. Igual a 40, porque é a média entre os valores 50 e 30. 3. Igual a 45. 4. Igual a 1, porque todos opinaram somente uma vez. 5. Não há média aritmética.

Page 54: 51188715 Apostila de Estatistica Versao 4

54

F- Segundo o site de VEJA na internet 28% da população brasileira é de origem africana, 32% de origem portuguesa, 20% de origem italiana e 20% de outras origens. Qual é a moda quanto a origem?

1. 32% 2. 20% 3. 32% da população. 4. Origem portuguesa. 5. Não podemos identificar a moda por falta de dados.

G- Numa determinada Escola com 300 alunos 34% deles completam o 2º grau em 3 anos e 66% em 4 anos. Qual o tempo médio de conclusão do 2º grau na referida Escola.

1. 7 anos. 2. 3 e 4 anos. 3. 3,66 anos. 4. 3 ou 4 anos. 5. 3,5 anos.

H - Na série estatística formada por { -1 , -2 , 3 , 4 }:

1. A mediana está entre -2 e 3. 2. A mediana é 0,5. 3. A questão 1 e 2 estão corretas. 4. A mediana é 2. 5. não existe mediana, pois não há dados repetidos.

I - Na série estatística formada por { 3 , 1 , 2 , 3 , 6 }:

1. Mediana > Moda > Média. 2. Moda < Média < Mediana. 3. Moda = Mediana = Média. 4. Mediana = Média e não há Moda. 5. Média > Mediana e não há Moda.

J - Na série estatística formada por { 3 , 1 , 2 , 3 , 4 } se for alterado o valor máximo:

1. A média poderá ser alterada ou não. 2. A mediana não vai ser alterada. 3. A moda não será alterada. 4. A média não será alterada. 5. A mediana vai ser alterada.

K- Quando a medida de posição deve ser o valor mais típico da distribuição utilizamos:

1. A média. 2. A mediana. 3. A moda. 4. A média, a moda e mediana. 5. A moda ou a média.

Page 55: 51188715 Apostila de Estatistica Versao 4

55

L - Quando desejamos o ponto médio exato de uma distribuição de frequência, basta calcular:

1. O desvio médio. 2. A média. 3. A moda. 4. A mediana. 5. Qualquer medida de posição.

M- Considere uma série estatística com 2351 elementos. A posição da mediana é representada pelo:

1. 1175º elemento. 2. 1176º elemento. 3. Ponto médio entre o 1175º e o 1176º elemento. 4. 1175,5º elemento. 5. Impossível resolução, pois não há identificação dos elementos.

N- Dados os conjuntos de números B = { 0 , 1 , 2 , 3 , 4 , 5 } e A = { 220, 225, 230, 235, 240, 245}, podemos afirmar, de acordo com as propriedades da média, que a média de A:

1. É igual à constante 220 somada ao produto da média de B por 5. 2. É igual à média de B mais a constante 220. 3. É igual à média de B multiplicada por uma constante arbitrária. 4. É igual à média de B mais a constante 220 e esse último resultado multiplicado por 5. 5. É igual à média de B multiplicada pela constante 94.

Page 56: 51188715 Apostila de Estatistica Versao 4

56

8 - Probabilidade

Introdução:

O cálculo das probabilidades pertence ao campo da Matemática, entretanto a maioria dos fenômenos de que trata a Estatística são de natureza aleatória ou probabilística. O conhecimento dos aspectos fundamentais do cálculo das probabilidades é uma necessidade essencial para o estudo da Estatística Indutiva ou Inferencial.

8.1 - Experimento Aleatório - E

São fenômenos que, mesmo repetido várias vezes sob condições semelhantes, apresentam resultados imprevisíveis. O resultado final depende do acaso.

Representa-se um evento com a letra: E

Exemplos de eventos:

1 - Da afirmação: "é provável que o meu time ganhe a partida hoje" pode resultar: - que ele ganhe - que ele perca - que ele empate

Este evento tem três possibilidades. 2 – Lançar um dado e observar o n úmero ocorrido na face superior. 3 – Selecionar ao acaso um aluno da USF e verificar seu semestre no curso. 4 – Jogar uma moeda 4 vezes e observar a seqüência de “caras” obtidas. 5 – Escolher uma pessoa ao acaso e verificar sua idade.

8.2 - Espaço Amostral - S

É o conjunto universo ou o conjunto de todos os resultados possíveis de um experimento aleatório.

Representa-se o espaço amostral coma letra: S

Exemplos de espaço amostral:

1 - No experimento aleatório "lançamento de uma moeda" tem-se o espaço amostral: S = {cara, coroa}.

2 - No experimento aleatório "lançamento de um dado" tem-se o espaço amostral: S = {1, 2, 3, 4, 5, 6}.

3 - No experimento aleatório "dois lançamentos sucessivos de uma moeda" tem-se o espaço amostral: S = {(ca,ca) , (co,co) , (ca,co) , (co,ca)}

4 – No lançamento de dois dados ao mesmo tempo tem-se o espaço amostral S = {(1,1), (1,2),...(1,6), (2,1), (2,2),...(2,6), ...(6,1), (6,2),...(6,6)}. Tem-se um espaço amostral com 36 resultados.

Page 57: 51188715 Apostila de Estatistica Versao 4

57

Obs: Cada elemento do espaço amostral que corresponde a um resultado recebe o nome de ponto amostral. No primeiro exemplo: cara pertence ao espaço amostral S = {cara, coroa}.

8.3 - Eventos

Sejam “E” um experimento e “S” o espaço amostral.

Um evento é qualquer subconjunto do espaço amostral S de um experimento aleatório E.

Assim, qualquer que seja o evento A, se A ⊂ S (A está contido em S), então A é um evento de S.

Se A = S , A é chamado de evento certo. Se A ⊂ S e A é um conjunto unitário então A é chamado de evento elementar. Se A = Ø , A é chamado de evento impossível.

Exercícios:

1 - No lançamento de um dado tem-se S = {1, 2, 3, 4, 5, 6}. Formule os eventos definidos pelas sentenças:

a) Obter um número par na face superior do dado: A = {2, 4, 6} onde A ⊂ S. b) Obter um número menor ou igual a 6 na face superior: B = {1, 2, 3, 4, 5, 6}, onde

B = S, logo B é um evento certo de S. c) Obter o número 4 na face superior: C = {4}, logo C é um evento elementar de S. d) Obter um número maior que 6 na face superior: D = Ø, logo D é um evento

impossível de S.

2 - No lançamento de duas moedas (uma de 10 centavos e outra de 5 centavos), pergunta-se:

a) Qual é o espaço amostral? b) Formule os eventos definidos pelas sentenças:

• Obter uma cara • Obter pelo menos uma cara • Obter apenas um cara • Obter no máximo duas caras • Obter uma cara e uma coroa • Obter uma coroa ou uma cara

8.4 – Evento União: ∪∪∪∪ E: um experimento Sejam: S: o espaço amostral A ⊂ S B ⊂ S

Page 58: 51188715 Apostila de Estatistica Versao 4

58

Os eventos A e B, contidos no mesmo espaço amostral S. O evento A∪B ocorre se ocorre o evento A ou ocorre o evento B. A∪B = { x/ x∈A ou x∈B }

Exemplo: A = {1} e B = {2} A∪B = {1, 2}, ocorre {1} ou ocorre {2}.

8.5 – Evento Intersecção: ∩∩∩∩ E: um experimento Sejam: S: o espaço amostral A ⊂ S B ⊂ S

Os eventos A e B, contidos no mesmo espaço amostral S.

O evento A∩B ocorre se ocorre o evento A e ocorre o evento B.

A∩B = { x/ x∈A e x∈B }

Exemplo: A = {1, 3} e B = {1, 2, 3} A∩B = {1, 3}.

8.6 – Eventos Mutuamente Exclusivos E: um experimento Sejam: S: o espaço amostral A ⊂ S B ⊂ S Os eventos A e B são mutuamente exclusivos se A ∩B = ∅ Exemplos: 1 - Sejam S = {1, 2, 3, 4, 5, 6} A = {1, 2} e B = {4, 5} Os eventos A e B são mutuamente exclusivos. 2 - Sejam S = {Cara, Coroa} A = {Cara} e B = {Coroa} Os eventos A e B são mutuamente exclusivos.

8.6 – Eventos Complementares E: um experimento Sejam: S: o espaço amostral A ⊂ S B ⊂ S Os eventos A e B são complementares se A∪B = S A ∩B = ∅

Page 59: 51188715 Apostila de Estatistica Versao 4

59

Exemplos: 1 - Sejam S = {1, 2, 3, 4, 5, 6} A = {1, 6} e B = {2, 3, 4, 5} A∪B = S e A ∩B = ∅ Os eventos A e B são complementares. 2 - Sejam S = {Cara, Coroa} A = {Cara} e B = {Coroa} A∪B = S A ∩B = ∅ Os eventos A e B são complementares. Obs.: Os eventos complementares são também mutuamente exclusivos.

8.7 - Conceito de Probabilidade

Seja “E” um experimento aleatório e seja “S” o espaço amostral.

A cada evento A do espaço amostral associa-se um número real representado por P(A), denominado probabilidade de ocorrência do evento A.

Ou seja: Chama-se probabilidade de um evento A o número real definido como: P(A).

Ao realizar um experimento e observar o evento A, calcula-se P(A) como:

P(A): número de vezes que ocorreu o evento A dividido pelo número total de casos.

OBS: Quando todos os elementos do Espaço amostral têm a mesma chance de acontecer, o espaço amostral é chamado de conjunto equiprovável.

Exemplos:

1 - No lançamento de uma moeda qual a probabilidade de obter cara? Evento A: ocorrência de cara (ca) no lançamento de uma moeda.

S = {ca, co} = 2 A = {ca} = 1 P(A) = 1/2 = 0,5 = 50% 2 - No lançamento de um dado qual a probabilidade de obter um número par?

Evento A: ocorrência dos números 2, 4 ou 6. S = { 1, 2, 3, 4, 5, 6 } = 6 A = { 2, 4, 6 } = 3 P(A) = 3/6 = 0,5 = 50%

3 - No lançamento de um dado qual a probabilidade de obter um número menor ou igual a 6?

Evento A: ocorrência dos números 1, 2, 3, 4, 5 ou 6. S = { 1, 2, 3, 4, 5, 6 } = 6 A = { 1, 2, 3, 4, 5, 6 } = 6 P(A) = 6/6 = 1,0 = 100%

Obs.: a probabilidade de todo evento certo é 1 ou 100%.

Page 60: 51188715 Apostila de Estatistica Versao 4

60

4 - No lançamento de um dado qual a probabilidade de obter um número maior que 6? Evento A: ocorrência de um número maior que 6. S = { 1, 2, 3, 4, 5, 6 } = 6 A = ∅ P(A) = 0/6 = 0 = 0% Obs.: a probabilidade de todo evento impossível é 0 ou 0%

5 – Extrai-se uma única carta de baralho de 52 cartas. Acha a probabilidade de: a) Sair um valete E: extrair uma carta do baralho S: conjunto formado por 52 cartas

A: sair um valete A = {valete de paus, valete de copas, valete de ouro, valete de espada} Logo P(A) = 4/52 = 0,076.

b) Sair uma carta vermelha E: extrair uma carta do baralho S: conjunto formado por 52 cartas

A: sair uma carta vermelha A = {26 cartas} Logo P(A) = 26/52 = 0,5.

8.7.1 - Propriedades

1 – 0 ≤ P(A) ≤ 1. 2 – P(S) = 1. 3 – Se A e B são eventos mutuamente exclusivos então P(A∪B) = P(A) + P(B).

Obs: no caso de eventos complementares, sabe-se que um evento pode ocorrer ou não.

1 - Sendo p a probabilidade de que o evento ocorra (sucesso) e q a probabilidade de que o evento não ocorra (insucesso), para um mesmo evento existe sempre a relação:

p + q = 1

2 - Numa distribuição de probabilidades o somatório das probabilidades atribuídas a cada evento elementar é igual a 1 onde p1 + p2 + p3 + ... + pn = 1.

8.7.2 - Teoremas Fundamentais

Teorema 1 – Se A = ∅, for o evento vazio então: P(A) = 0.

Teorema 2 – S e __

A é o evento complementar de A então: P(A) = 1 – P(__

A ).

Teorema 3 – Se A e B são dois eventos quaisquer, então:

P(A∪B) = P(A) + P(B) – P(A∩B).

Page 61: 51188715 Apostila de Estatistica Versao 4

61

Teorema 4 – Se A, B, C são três eventos quaisquer, então:

P(A∪B∪C) = P(A) + P(B) + P(C) – PA∩B) – P(A∩C) – P(B∩C) + P(A∩B∩C).

Teorema 5 – Se A ⊂ B então P(A) ≤ P(B).

Exemplos:

1 – Sabe-se que a probabilidade de tirar o nº 4 no lançamento de um dado é p = 1/6. Logo, a probabilidade de não tirar o nº 4 no lançamento de um dado: q = 1 - p ou q = 1 - 1/6 = 5/6.

2 - Calcular a probabilidade de um piloto de automóvel vencer uma dada corrida, onde as suas "chances", segundo os entendidos, são de "3 para 2". Calcule também a probabilidade dele perder:

O termo "3 para 2" significa: De cada 5 corridas ele ganha 3 e perde 2. Então p = 3/5 (ganhar) e q = 2/5 (perder).

3 - Um dado foi fabricado de tal forma que num lançamento a probabilidade de ocorrer um número par é o dobro da probabilidade de ocorrer número ímpar na face superior, sendo que os três números pares ocorrem com igual probabilidade, bem como os três números ímpares. Determine a probabilidade de ocorrência de cada evento elementar.

4 - Seja S = {a, b, c, d} . Considere a seguinte distribuição de probabilidades: P(a) = 1/8 ; P(b) = 1/8 ; P(c) = 1/4 e P(d) = x . Calcule o valor de x.

5 - As chances de um time de futebol T ganhar o campeonato que está disputando são de "5 para 2". Determinar a probabilidade de T ganhar e a probabilidade de T perder:

6 - Três cavalos C1, C2 e C3 disputam um páreo, onde só se premiará o vencedor. Um conhecedor dos 3 cavalos afirma que as "chances" de C1 vencer são o dobro das de C2, e que C2 tem o triplo das "chances" de C3. Calcule as probabilidades de cada cavalo vencer o páreo.

8.8 - Eventos Independentes E: um experimento Sejam: S: o espaço amostral A ⊂ S B ⊂ S Os eventos A e B são independentes se P(A∩B) = P(A) . P(B)

Page 62: 51188715 Apostila de Estatistica Versao 4

62

Quando a realização ou não realização de um dos eventos não afeta a probabilidade da realização do outro e vice-versa.

Exemplo: Quando se lança dois dados, o resultado obtido em um deles independe do resultado obtido no outro. Então qual seria a probabilidade de obter, simultaneamente, o nº 4 no primeiro dado e o nº 3 no segundo dado?

P1 = P(4 dado1) = 1/6 P2 = P(3 dado2) = 1/6 P total = P (4 dado1) x P (3 dado2) = 1/6 x 1/6 = 1/36

8.9 - Probabilidade Condicional

Sejam A e B dois eventos de um experimento E.

Denota-se por P(A/B) a probabilidade condicional do evento A dado que ocorreu o evento B.

Analogamente, P(B/A) a probabilidade condicional do evento B dado que ocorreu o evento A.

Calcula-se a probabilidade condicional como:

)(

)()/(

BP

BAPBAP

∩= se P(B) > 0 logo P(A∩B) = P(B).P(A/B)

)(

)()/(

AP

BAPABP

∩= se P(A) > 0 Logo P(A∩B) = P(A).P(B/A)

Nota: Se A e B são evento independentes então:

P(A/B) = P(A) e P(B/A) = P(B).

Exemplo: Duas cartas são retiradas de um baralho sem haver reposição. Qual a probabilidade de ambas serem COPAS?

P(Copas1 e Copas2) = P(Copas1) x P(Copas2/Copas1) = 13/52 x 12/51 = 0,0588 = 5,88 % P(Copas1) = 13/52 P(Copas2/Copas1) = 12/51

Obs: No exemplo anterior se a 1ª carta retirada voltasse ao baralho o experimento seria do tipo com reposição e seria um evento independente. O resultado seria:

P(Copas1) x P(Copas2) = 13/52 x 13/52 = 0,0625 = 6,25 %

Page 63: 51188715 Apostila de Estatistica Versao 4

63

Espaço amostral do baralho de 52 cartas:

Cartas pretas = 26

Páus = 13 (ás, 2, 3, 4, 5, 6, 7, 8, 9, 10, valete, dama, rei)

Espadas = 13 (ás, 2, 3, 4, 5, 6, 7, 8, 9, 10, valete, dama, rei)

Cartas vermelhas = 26

Ouros = 13 (ás, 2, 3, 4, 5, 6, 7, 8, 9, 10, valete, dama, rei)

Copas = 13 (ás, 2, 3, 4, 5, 6, 7, 8, 9, 10, valete, dama, rei)

Exercícios:

1 - Qual a probabilidade de sair o ÁS de ouros quando retiramos 1 carta de um baralho de 52 cartas?

2 - Qual a probabilidade de sair o um REI quando retiramos 1 carta de um baralho de 52 cartas?

3 - Em um lote de 12 peças, 4 são defeituosas. Sendo retirada uma peça, calcule:

a) a probabilidade de essa peça ser defeituosa.

b) a probabilidade de essa peça não ser defeituosa.

4 - De dois baralhos de 52 cartas retiram-se, simultaneamente, uma carta do primeiro baralho e uma carta do segundo. Qual a probabilidade de a carta do primeiro baralho ser um REI e a do segundo ser o 5 de paus?

5 - Uma urna A contém: 3 bolas brancas, 4 pretas, 2 verdes; uma urna B contém: 5 nolas brancas, 2 pretas, 1 verde; uma urna C contém: 2 bolas brancas, 3 pretas, 4 verdes. Uma bola é retirada de cada urna. Qual é a probabilidade de as três bolas retiradas da 1ª, 2ª e 3ª urnas serem, respectivamente, branca, preta e verde?

6 - De um baralho de 52 cartas retiram-se, ao acaso, duas cartas sem reposição. Qual é a probabilidade de a primeira carta ser o ÁS de paus e a segunda ser o REI de paus?

7 - Qual a probabilidade de sair uma figura (rei ou dama ou valete) quando se retira uma carta de um baralho de 52 cartas?

8 - São dados dois baralhos de 52 cartas. Tira-se, ao mesmo tempo, uma carta do primeiro baralho e uma carta do segundo. Qual a probabilidade de tirarmos uma DAMA e um REI, não necessariamente nessa ordem?

Page 64: 51188715 Apostila de Estatistica Versao 4

64

9 - Duas cartas são retiradas de um baralho sem haver reposição. Qual a probabilidade de ambas serem COPAS ou ESPADAS?

10 - Duas bolas são retiradas (sem reposição) de uma urna que contém 2 bolas brancas e 3 bolas pretas. Qual a probabilidade de que a 1ª seja branca e a 2ª seja preta?

11 - Duas bolas são retiradas (com reposição) de uma urna que contém 2 bolas brancas e 3 bolas pretas. Qual a probabilidade de que a 1ª seja branca e a 2ª seja preta?

12 - Duas bolas são retiradas (sem reposição) de uma urna que contém 2 bolas brancas e 3 bolas pretas e 5 bolas verdes.

a) Qual a probabilidade de que ambas sejam verdes?

b) Qual a probabilidade de que ambas sejam da mesma cor?

Page 65: 51188715 Apostila de Estatistica Versao 4

65

QUARTA LISTA DE EXERCÍCIOS DE ESTATÍSTICA Probabilidades

1 - Um grupo de 100 pessoas foi observado quanto ao sexo e cor dos olhos, obtendo-se os seguintes

resultados: 51 homens. 68 pessoas de olhos azuis. 34 homens de olhos azuis. Sendo os eventos A= {homens} e B={pessoas de olhos azuis}, determina as probabilidades dos seguintes eventos:

a) A b) B c) B d) A∩B e) A B∩ f) A B∩ g) A B∩

h) A∪B i) A B∪ j) A B∪ k) A/B l) A B/ m) A B/ n) B/A o) B A/ p) A B/

Sugestão:

Utilize uma das lei de Morgan: =∪ BA BA ∩ ou =∪ BA BA∩ 2 - Suponha que a probabilidade de uma criança em idade escolar já ter sido vacinada contra a

poliomielite seja 0,98. Três crianças foram escolhidas ao acaso em uma escola, sendo: A1 = { a criança 1 foi vacinada } A2 = { a criança 2 foi vacinada } A3 = { a criança 3 foi vacinada }

Calcule a probabilidade de apenas uma criança ter sido vacinada.

3 - Se P(A) =1/2 ; P(B) =1/3 e P(A∩B) =1/4. Calcule o valor de:

a) P(A∪B) b) P(A/B) c) P(B/A)

d) P( A B/ ) e) P( B A/ ) Sugestão:

Utilize uma das lei de Morgan: =∪ BA BA ∩ ou =∪ BA BA∩ 4 - Uma pessoa joga um dado equilibrado duas vezes. Sejam os eventos:

A1 = {o resultado da 1a jogada é 1 ou 2 } A2 = { o resultado da 2a jogada é 1 ou 3 } B1 = { a soma dos resultados é 7 } B2 = { a soma dos resultados é 3 } Verifique quais das proposições abaixo são verdadeiras: i) os eventos A1 e A2 são mutuamente exclusivos. ii) B1 e B2 são independentes iii) B2 ⊂ (A1 ∪A2)

5 - Dentre 100 estudantes de uma mesma turma, 58 são homens e 30 deles passaram no vestibular

na 1a opção. Um estudante desta turma foi selecionado ao acaso. Sejam os eventos: A = { o estudante é homem } B = { o estudante passou na 1a opção }

Page 66: 51188715 Apostila de Estatistica Versao 4

66

Calcule: a) P(A∩B) b) P( A B∩ ) c) P(A/B) d) P( A B/ ) e)P(A∪B) f) P( A B∩ ) 6 - Uma caixa contém bolas pretas e bolas brancas.

Seja o experimento E: retirar sucessivamente três bolas da caixa a) Determine o espaço amostral do experimento E Determine o conjunto dos elementos que correspondem aos seguintes eventos: b) "as três bolas têm a mesma cor" c) "a 1a bola retirada é uma bola branca" d) "pelo menos duas bolas são brancas" e) "o número de bolas brancas é igual ao número de bolas pretas" f) "pelo menos duas bolas da mesma cor"

7 - No lançamento simultâneo de dois dados, determinar a probabilidade de se obter:

a) "soma dos números iguais a 8" b) "pares de números iguais" c) "soma dos números iguais a 4"

8 - Sorteando-se ao acaso um número do conjunto V = { l, 2, 3, 4, 5, 6, 7, 8, 9,10, 11, 12} qual é a

probabilidade de ser um múltiplo de 3 dado que o número sorteado é um número ímpar ? 9 - Um casal pretende ter três filhos do mesmo sexo. A probabilidade de que isto ocorra é: a) 1/2 b) 1/4 c) 1/8 d) 40% 10 - Um grupo de 20 pessoas apresenta a seguinte composição: 15 brasileiros e 5 estrangeiros 10 homens e 10 mulheres 18 casados e 2 solteiros

A probabilidade de uma pessoa escolhida ao acaso seja um homem solteiro e estrangeiro é: a)1/4 b) 12,5% c)1/16 d)1,25%

11- Suponha uma caixa contendo duas urnas: URNA Y e URNA Z

Cada URNA contém bolas Verdes e bolas Brancas conforme a figura indica. Cada URNA tem a mesma probabilidade de ser selecionada. Seja o experimento E: Selecionar uma bola da caixa. Calcule as seguintes probabilidades Bolas Bolas a) P(bola V / URNA Y) b) P(bola V / URNA Z) 8 V 5 V c) P(bola B / URNA Y) 2 B 5 B d) P(bola B / URNA Z) e) P(bola V e URNA Z) f) P(bola V e URNA Y) g) Qual é a probabilidade de sair uma Branca da caixa ?

URNA URNA

Page 67: 51188715 Apostila de Estatistica Versao 4

67

12 - De 100 pessoas que solicitaram emprego de programador de computador, durante o ano

passado numa empresa, 40 possuíam experiência anterior e 30 possuíam um certificado profissional. Vinte dos candidatos possuíam tanto experiência anterior como certificado profissional. Qual é a probabilidade de que um candidato selecionado tenha experiência ou certificado ?

13 - Em geral, a probabilidade de que um possível cliente faça uma compra quando procurado por

um vendedor é 0,4. Se um vendedor seleciona 3 clientes e faz o contato com os mesmos, qual é a probabilidade de que os 3 façam compras ?

14 - De um total de 500 empregados, 200 participam de um plano de participação de lucros da

empresa, 400 contam com cobertura de seguro médico e 200 empregados participam de ambos os programas. Qual é a probabilidade de um determinado empregado participar de um ou outro programa ?

15 - A probabilidade de que uma nova política de mercado tenha sucesso foi estimada em 0,6. A

probabilidade de que a despesa para o desenvolvimento da estratégia seja mantida dentro dos limites do orçamento previsto é de 0,5. A probabilidade de que ambos os objetivos sejam alcançados é 0,3. Qual é a probabilidade de que um ou outro objetivo seja alcançado ?

16 - A proporção global de itens defeituosos em um processo de produção contínuo é de 10%.

Se forem escolhidos 3 itens qual a probabilidade de que: a) todos tenham defeitos b) nenhum tenha defeito

17 - Uma fábrica de louças tem um processo de inspeção com quatro etapas. A probabilidade de ma

peça defeituosa passar uma etapa de inspeção sem ser detectada é de aproximadamente 20%. Com base nesta cifra, determine: a) A probabilidade de uma peça defeituosa passar por todas as quatro etapas de inspeção sem ser detectada; b) Qual seria sua resposta se fosse acrescentada uma Quinta etapa de inspeção, com 50% de probabilidade de detectar peças defeituosas

18 – Uma firma exploradora de petróleo perfura um poço quando acha que há pelo menos 25% de

chance de encontrar petróleo. A firma perfura 4 poços: A, B, C, e D e estima, respectivamente, as probabilidades 0,3; 0,4; 0,7; e 0,8 de encontrar petróleo. a) Determine a probabilidade de nenhum dos poços produzirem petróleo, com base nas

estimativas da firma. b) Determine a probabilidade de os quatro poços produzirem petróleo. c) Qual é a probabilidade de que somente os poços A e C produzem petróleo ?

Page 68: 51188715 Apostila de Estatistica Versao 4

68

9 - Distribuição de Probabilidades

Variável Aleatória

Qualquer função X que associa um número real a todo elemento do espaço amostral S é denominada variável aleatória.

Muitas vezes não se está interessado propriamente no resultado de um experimento aleatório, mas em alguma característica numérica a ele associada. Essa característica será chamada variável aleatória.

Assim, se o espaço amostral relativo ao "lançamento simultâneo de duas moedas" é S = {(ca,ca), (ca,co), (co,ca), (co,co)} e se X representa o "número de caras" que aparecem, a cada ponto amostral pode-se associar um número para X, de acordo com a tabela abaixo ( X é a variável aleatória associada ao número de caras observado):

Ponto Amostral X

(ca, ca) 2

(ca, co) 1

(co, ca) 1

(co, co) 0

Logo se pode escrever:

Número de caras (X) Probabilidade (X)

2 1/4

1 2/4

0 1/4

Total 4/4 = 1

Exemplo: Considere-se a distribuição de freqüências relativa ao número de acidentes diários na Rodovia Bandeirantes durante o mês de novembro de 1997:

Número de Acidentes Frequência

0 22

1 5

2 2

3 1

Total 30

Page 69: 51188715 Apostila de Estatistica Versao 4

69

Pode-se então escrever a tabela de distribuição de probabilidade:

Número de Acidentes (X) Probabilidade (X)

0 0,73

1 0,17

2 0,07

3 0,03

Total 1,00

A tabela apresenta os valores de uma variável aleatória X e as probabilidades de X ocorrer, ou seja, a tabela de distribuição de probabilidades.

Assim, tem-se que: P(X = 0) + P(X = 1) + P(X = 2) + P(X = 3) = 1 Generalizando tem-se que: ∑ P(X = xi) = 1 Funções de probabilidades: f(x) = P(X= xi)

Ao definir a distribuição de probabilidade, estabelece-se uma correspondência unívoca entre os valores x1, x2, x3, ..., xn da variável aleatória X e os valores das probabilidades: p1 = P(X = x1), p2 = P(X = x2), p3 = P(X = x3), ... pn = P(X = xn).

Esta correspondência define uma função onde os valores xi formam o domínio da função e os valores pi o seu conjunto imagem.

Assim, ao lançar um dado, a variável aleatória X, definida por "pontos de um dado", pode tomar os valores 1, 2, 3, 4, 5 e 6.

Então resulta na seguinte distribuição de probabilidade:

x1

x2 x3 . . xn

p1

p2 p3 . . pn

Domínio Conjunto Imagem f(xi) = pi

Page 70: 51188715 Apostila de Estatistica Versao 4

70

X = xi P (X=xi)

1 1/6

2 1/6

3 1/6

4 1/6

5 1/6

6 1/6

T o t a l 6/6 = 1

9.1 - Distribuição Binomial

Imagine fenômenos cujos resultados só podem ser de dois tipos, um dos quais é considerado como sucesso e o outro como insucesso. Este fenômeno pode ser repetido tantas vezes quanto se queira (n vezes), nas mesmas condições. As provas repetidas devem ser independentes, isto é, o resultado de uma não deve afetar os resultados das sucessivas. No decorrer do experimento, a probabilidade p do sucesso e a probabilidade q do insucesso manter-se-ão constantes (q = 1 - p) . Nessas condições X é uma variável aleatória discreta que segue uma distribuição Binomial, com a seguinte distribuição de probabilidades:

( ) )(..)()( xnxn

x qpxPxXP−===

Onde:

( ))!(!

!

xnx

nn

x−

=

P(x) = é a probabilidade de que o evento se realize x vezes em n provas.

p = é a probabilidade de que o evento se realize em uma só prova = sucesso.

q = é a probabilidade de que o evento não se realize no decurso dessa prova = insucesso.

OBS: O nome Binomial é devido à fórmula, pois representa o termo geral do desenvolvimento do Binômio de Newton.

Parâmetros da Distribuição Binomial

Média: pnX .__

= Desvio padrão: qpn ..=σ Variância: qpn ..2 =σ

Page 71: 51188715 Apostila de Estatistica Versao 4

71

Restrições sobre o uso da distribuição Binomial

1 – Haja “n” repetições idênticas do experimento.

2 – Cada experimento tem sempre dois resultados possíveis, um chamado “sucesso” e outro chamado “falha” ou insucesso.

3 – As probabilidades p de sucesso e 1-p de falha permanecem constantes em todas as realizações do experimento.

4 – Os resultados das realizações do experimento são independentes um do outro.

Exemplos:

1 – Dos estudantes da USF, 40% fumam cigarro. Escolhe-se 6 estudantes ao acaso para darem sua opinião sobre o fumo.

a) Ache a probabilidade de nenhum dos 6 estudantes ser fumante.

( ) )(..)( knkn

k qpkXP−== n = 6 ; p = 0,4 ; q = 1 – p = 0,6

( ) 046,0)6,0.(1.)!06(!0

!6)6,0.()4,0.()0( 6)06(06

0 =−

=== −XP

b) Ache a probabilidade de todos serem fumantes.

( ) 004,01.)4,0.()!66(!6

!6)6,0.()4,0.()6( 6)66(66

6 =−

=== −XP

c) Ache a probabilidade de pelo menos a metade ser fumante.

P( X ≥ 3) = P(X = 3) + P(X = 4) + P(X = 5) + P(X = 6) ou

P( X ≥ 3) = 1 – P(X < 3) = 1 – [P(X = 0) + P(X = 1) + P(X = 2)]

2 – Um fabricante de mesa de bilhar suspeita que 2% de seu produto apresenta algum defeito. Se existe essa suspeita, determine a probabilidade de que numa amostra de 9 mesas:

a) Haja pelo menos uma mesa defeituosa.

n = 9 p = 0,02

q = 1 – p = 0,98

( ) 166,0)98,0.()02,0.(1)0(1)1(1)1( 9090 =−==−=<−=≥ XPXPXP

Page 72: 51188715 Apostila de Estatistica Versao 4

72

b) Não haja nenhuma mesa defeituosa.

( ) 83,0)98,0.()02,0.()0( 9090 ===XP

3 – Os registros de uma pequena empresa indicam que 40% das faturas emitidas são pagas após o vencimento. De 14 faturas expedidas, determine a probabilidade de:

a) Nenhuma fatura ser paga com atraso.

n = 14; p = 0,4; q = 1 – p = 0,6 ( ) 00078,0)6,0.()4,0.()0( 140140 ===XP

b) No máximo 2 faturas serem pagas com atraso.

036,0029,0,0007,000078,0)2()1()0()2( =++==+=+==≤ XPXPXPXP

c) Pelo menos 3 serem pagas com atraso.

964,0036,01)2(1)3( =−=≤−=≥ XPXP

Exercícios:

1 - Uma moeda é lançada por 5 vezes seguidas e independentes. Calcule a probabilidade de serem obtidas 3 caras nessas 5 provas.

2 - Dois times de futebol, A e B, jogam entre si 6 vezes. Encontre a probabilidade do time A ganhar 4 jogos.

3 - Determine a probabilidade de se obter exatamente 3 caras em 6 lances de uma moeda.

4 - Jogando-se um dado três vezes, determine a probabilidade de se obter um múltiplo de 3 duas vezes.

5 - Dois times de futebol, A e B, jogam entre si 6 vezes. Encontre a probabilidade de o time A :

a) - ganhar dois ou três jogos;

b) - ganhar pelo menos um jogo;

6 - A probabilidade de um atirador acertar o alvo é 2/3. Se ele atirar 5 vezes, qual a probabilidade de acertar exatamente 2 tiros?

7 - Seis parafusos são escolhidos ao acaso da produção de certa máquina, que apresenta 10% de peças defeituosas. Qual a probabilidade de serem defeituosos dois deles?

Page 73: 51188715 Apostila de Estatistica Versao 4

73

QUINTA LISTA DE EXERCÍCIOS DE ESTATÍSTICA Distribuição Binomial

1. Uma moeda é lançada 5 vezes seguida e independente. Calcule a probabilidade de serem obtidas

3 caras nessas 5 provas. 2. A probabilidade de um atirador acertar o alvo é 1/2. Se ele atirar 5 vezes qual a probabilidade de

acertar exatamente 2 tiros? 3. Seis parafusos são escolhidos ao acaso da produção de certa máquina, que apresenta 10% de

peças defeituosas. Qual a probabilidade de dois parafusos serem defeituosos ? 4. Um time A tem 2/3 de probabilidade de vitória sempre que joga. Se A jogar 4 partidas, encontre a

probabilidade de A vencer: a) Exatamente 2 partidas; b) Pelo menos I partida; c) Mais que a metade das partidas.

5. Em 10.000 famílias com 8 filhos cada uma, quantas se esperaria que tivessem:

a) Exatamente 2 meninos; b) Nenhum menino; c) Três meninos.

6. Num hospital 5 pacientes devem Submeter-se a um tipo de operação, da qual 80% sobrevivem.

Qual a probabilidade de que: a) Todos sobrevivam; b) Pelo menos 2 sobrevivam; c) No máximo 3 não consigam sobreviver.

7. Se 3% das canetas de certa marca são defeituosas, achar a probabilidade de que numa amostra de 10 canetas, escolhidas ao acaso, desta mesma marca, tenham: a) Nenhuma defeituosa; b) Pelo menos 2 defeituosas; c) No máximo 3 defeituosas.

8. Se a probabilidade de ocorrência de uma peça defeituosa é 0,2 determine a média e o desvio padrão da distribuição de peças defeituosas em um total de 600.

9. Uma amostra de 15 peças é extraída com reposição de um lote que contém 10% de peças

defeituosas. Calcule a probabilidade de que: a) O lote não contenha peça defeituosa; b) O lote contenha exatamente três peças defeituosas; c) O lote contenta pelo menos uma peça defeituosa; d) O lote contenha entre 3 e 6 peças defeituosas; e) O lote contenha de 3 a 6 peças defeituosas.

10. Calcule o valor esperado e o desvio padrão para o número de peças defeituosas na amostra do

problema anterior.

Page 74: 51188715 Apostila de Estatistica Versao 4

74

11. Uma confecção de roupa infantil suspeita que 30% de sua produção apresenta algum defeito. Se

tal suspeita é correta, determine a probabilidade de que, numa amostra de quatro peças, sejam encontradas: a) No mínimo duas peças com defeito; b) Menos que três peças boas.

12. Um vendedor programa 6 visitas e acredita que a probabilidade de ele ser recebido pelo

encarregado de compras das empresas visitadas é de 80%. a) Qual a probabilidade de ele completar pelo menos quatro visitas? b) Qual a probabilidade de ele ser recebido por todos os encarregados de compra? c) Se ele acredita que completando uma visita suas despesas do dia estão cobertas, qual a probabilidade de ele ter prejuízo nesse dia?

Page 75: 51188715 Apostila de Estatistica Versao 4

75

9.2 - Distribuição de Poisson

Diz-se que uma variável aleatória tem distribuição de Poisson quando a freqüência de ocorrência dessa variável aleatória segue a distribuição de Poisson.

A distribuição de Poisson é útil para descrever as probabilidades do número de ocorrência num intervalo contínuo, geralmente o tempo ou espaço.

Exemplos:

1 – Número de defeitos por metro quadrado. 2 – Número de acidentes por dia. 3 – Número de clientes por hora. 4 – Número de chamadas telefônicas por minuto.

Restrições sobre o uso da distribuição e Poisson

1 – A probabilidade de ocorrência é a mesma em todo o campo de observação.

2 – A probabilidade de mais de uma ocorrência num único ponto é zero.

3 – O número de ocorrências em qualquer intervalo é independente do número de ocorrências em outros intervalos.

A distribuição de Poisson é muito usada como aproximação para a distribuição Binomial.

A distribuição de probabilidade de Poisson tem a seguinte fórmula:

!

.)()(

k

etkXP

tk λλ −

==

Onde:

λ: é a taxa média de ocorrência do evento, por unidade. e: é uma constante que representa o valor igual a 2,718. t: número de unidades. k: número de ocorrências µ = λt é o número médio de ocorrências no intervalo t. É a média da distribuição.

Ou seja: !

.)(

k

ekXP

k µµ −

==

Page 76: 51188715 Apostila de Estatistica Versao 4

76

OBS: Pode acontecer experimento com uma distribuição Binomial com um “p” (sucesso) muito pequeno de tal modo que se tem um “n” muito grande para que o sucesso ocorra. Nestes casos, pode-se simplificar os cálculos usando a distribuição de Poisson como aproximação para a distribuição Binomial.

Para que os resultados aproximados pela distribuição de Poisson sejam satisfatórios só se deve fazer a substituição da distribuição Binomial pela distribuição de Poisson quando “n” for maior ou igual a 50 e “p” menor ou igual a 0,1 ou “p” maior ou igual a 0,9 (“p” próximo de 0 ou próximo de 1).

Exemplos:

1 – Um processo mecânico produz tecidos para tapetes com uma média de dois defeitos por metro. Determine a probabilidade de um metro quadrado ter exatamente:

a) Um defeito t = 1 metro λ = 2 µ = λt = 2

P(X = 1) = (e-2.21)/1! = 0,27

b) Dois defeitos

P(X = 2) = (e-2.22)/2! = 0,27

c) Três defeitos

P(X = 3) = (e-2.23)/3! = 0,18

d) Nenhum defeito

P(X = 0) = (e-2.20)/0! = 0,13

2 – Em média, 2 pessoas por minuto utilizam os serviços de um caixa automático de um banco durante as horas de maior movimento. Qual é a probabilidade de:

a) Nenhuma pessoa utilizar os caixas. λ = 2; t = 1; µ = λt = 2.1 = 2 P(X = 0) = (e-2.20)/0! = 0,13

b) Duas pessoas utilizar os caixas.

P(X = 2) = (e-2.22)/2! = 0,27

c) Menos de duas pessoas utilizarem os caixas.

P(X < 2) = P(X = 0) + P(X = 1) = 0,4

Page 77: 51188715 Apostila de Estatistica Versao 4

77

Exercícios

1 – Se 2% dos fusíveis são defeituosos. Qual a probabilidade de que uma amostra de 400 fusíveis exatamente 6 sejam defeituosos?

p = 0,02 n = 400 µ = n . p = (400).(0,02) = 8

P (x = 6) = 0,1222 ou 12,24%

2 – Se o número de peixes pescados por hora em certo pesqueiro é uma variável que segue a distribuição de Poisson com média igual a 1,8, achar a probabilidade de que um pescador, pescando durante uma hora:

a) Não pegue nenhum peixe.

b) Pegue exatamente 2 peixes.

c) Pegue no máximo 4 peixes.

d) Pegue pelo menos dois peixes.

3 - Se 4% de passageiros de avião tem problemas com a bagagem, qual a probabilidade de que entre 150 passageiros até 2 passageiros tenham problemas com suas bagagens?

Page 78: 51188715 Apostila de Estatistica Versao 4

78

µ

a µ b

9.3 - Distribuição Normal

Entre as distribuições teóricas de variável aleatória contínua, uma das mais empregadas é a distribuição Normal. A distribuição Normal tem a sua importância na estatística porque permite representar as freqüências observadas de muitos fenômenos naturais.

Muitas das variáveis analisadas na pesquisa sócio-econômica correspondem à distribuição normal ou se aproximam a uma distribuição normal.

9.3.1 - Propriedades da Distribuição Normal

1 – A curva da distribuição Normal tem a forma de um sino

2 – A distribuição Normal é simétrica em relação a média µ.

3 – A distribuição Normal assume qualquer valor real.

4 – Cada distribuição Normal fica especificada pela sua média µ e seu desvio padrão σ.

5 – A área total sob a curva Normal é 1 (ou 100%).

6 – A área sob a curva entre dois pontos é a probabilidade de uma variável aleatória com distribuição Normal assumir os valores entre esses dois pontos.

Isto é, P( a ≤ X ≤ b) = a área da curva entre os valores “a” e “b”.

7 – P(X = k) = 0.

Page 79: 51188715 Apostila de Estatistica Versao 4

79

-3σ -2σ -σ µ σ 2σ 3σ 68%

95,5% 99,7%

A probabilidade da variável aleatória X assumir os valores entre “a” e “b” é calculada como:

−−

=<<b

a

x

dxebXaP

2

2

1

2

1)( σ

µ

σπ

Para qualquer distribuição Norma tem-se:

Quando se tem uma variável aleatória com distribuição normal o principal interesse está em obter a probabilidade dessa variável aleatória assumir um valor em um determinado intervalo.

Exemplo: Seja X a variável aleatória que representa os diâmetros dos parafusos produzidos por certa máquina. Supondo que essa variável tenha uma distribuição normal com média 2 cm e desvio padrão 0,04 cm. Qual a probabilidade de um parafuso ter o diâmetro com valor entre 2 e 2,05 cm ?

Deseja-se calcular: P ( 2 < X < 2,05)

9.3.2 - A Distribuição Normal Padronizada

Seja X uma variável aleatória com distribuição Normal de média µ e desvio padrão σ.

Isto é: X ∼ N(µ, σ).

Fazendo σ

µ−=

XZ , então a variável Z tem uma distribuição Normal com média µ=0 e

desvio padrão σ = 1.

Isto é: Z ∼ N(0, 1).

Page 80: 51188715 Apostila de Estatistica Versao 4

80

Utiliza-se uma tabela da distribuição Normal padronizada, que dá a probabilidade de z tomar qualquer valor entre a média 0 e um dado valor z, isto é: P ( 0 < Z < z).

Tem-se então que: ( )zZPxX

PxXP <=

−<

−=<

σ

µ

σ

µ)( ,

Onde Z é uma variável com distribuição normal de média 0 e desvio padrão 1.

No exemplo anterior deseja-se calcular P(2 < X < 2,05), onde µ = 2 e σ = 0,04.

Para obter essa probabilidade, precisa-se transformar a variável para Z.

Isto é: ( )25,1004,0

25,2

04,0

225,22)5,22( <<=

−<<

−=

−<

−<

−=<< ZPZP

XPXP

σ

µ

σ

µ

σ

µ

9.3.3 - Utilização da Tabela Z

Procura-se na tabela Z o valor de z = 1,25

Na primeira coluna encontra-se o valor até uma casa decimal 1,2. Em seguida, encontra-se, na primeira linha, o valor 5, que corresponde ao último algarismo do número 1,25. Na intersecção da linha e coluna correspondentes encontra-se o valor 0,3944, o que permite escrever:

P (0 < Z < 1,25 ) = 0,3944 ou 39,44 %.

Assim a probabilidade de um certo parafuso apresentar um diâmetro entre 2cm e 2,05 cm é de 39,44 %.

Exemplos:

1 – Seja X ∼ N(3, 8), ou seja, X é uma distribuição Normal com média µ = 3 e desvio padrão σ = 8. Calcule P(X < 5).

( ) 5987,00987,05,025,08

35

8

3)5( =+=<=

−<

−=< ZP

XPXP

µ 2,5

Page 81: 51188715 Apostila de Estatistica Versao 4

81

0,2254

2 - 1 – Seja X ∼ N(3, 8), ou seja, X é uma distribuição Normal com média µ = 3 e desvio padrão σ = 8. Calcule P(10 < X < 15).

⇒<<=

<<=

−<

−<

−=<< )5,187,0(

8

12

8

7

8

315

8

3

8

310)1510( ZPZP

XPXP

2254,03078,04332,0)87,0()5,1()5,187,0( =−=<−<=<< ZPZPZP

3 – Seja X ∼ N(5, 6), ou seja, X é uma distribuição Normal com média µ = 5 e desvio padrão σ = 6. Calcule P(X > 2).

( ) 6915,01915,05,05,06

52

6

5)2( =+=−>=

−>

−=> ZP

XPXP

0 0,87 1,5

- 0,5 0

0,1915 0,5

Page 82: 51188715 Apostila de Estatistica Versao 4

82

Exercícios:

1- Determine as probabilidades:

a) P(-1,25 < Z < 0) b) P(-0,5 < Z < 1,48) c) P(0,8 < Z < 1,23) d) P(-1,25 < Z < -1,20) e) P( Z < 0,92) f) P(Z > 0,6)

2 - Os salários dos bancários são distribuídos normalmente, em torno da média R$ 10.000,00, com desvio padrão de R$ 800,00. Calcule a probabilidade de um bancário ter o salário situado entre R$ 9.800,00 e R$ 10.400,00.

Deve-se inicialmente calcular os valores z1 e z2,

z1 = (9800 - 10000) / 800 = -0,25 e z2 = (10400 - 10000) / 800 = 0,5

P( 9800 < X < 10400) = P(-0,25 < Z < 0,5) =

P(-0,25 < Z < 0) + P(0 < Z < 0,5) = 0,0987 +0,1915 = 0,2902 ou 29,02 %

3 - Um teste padronizado de escolaridade tem distribuição normal com média = 100 e desvio padrão = 10. Determine a probabilidade de um aluno submetido ao teste ter nota :

a) Maior que 120 b) Maior que 80 c) Entre 85 e 115 d) Maior que 100

Page 83: 51188715 Apostila de Estatistica Versao 4

83

SEXTA LISTA DE EXERCÍCIOS DE ESTATÍSTICA Distribuição Normal

1. Um processo de fabricação produz peças com comprimento médio de 500 mm e desvio padrão de

10 mm. Qual a porcentagem de peças que se situam: a) Acima de 510 mm. (15,87%) b) Entre 470 e 530 mm. (99,72%) c) Abaixo de 525,8 mm. (99,51%)

2. Um fabricante de baterias, sabe por experiência passada, que as baterias de sua fabricação têm

vida média de 600 dias e desvio padrão de 100 dias, sendo que a duração tem aproximadamente distribuição normal. Oferece uma garantia de 312 dias, isto é, troca as baterias que apresentarem falhas nesse período. Fabrica 10.000 baterias mensalmente.

Quantas deverão trocar pelo uso da garantia, mensalmente? (19,88 aproximadamente 20 baterias) 3. Uma fábrica de canos sabe que os motores de sua fabricação têm duração normal, com média de

I50.000 km e desvio padrão de 5.000 km. Qual a probabilidade de que um carro, escolhido ao acaso, dos fabricados por essa firma, tenha um motor que dure: a) Menos de 170.000 km? (0,999968) b) Entre 140.000 km e 165.000 km? c) Se a fábrica substitui o motor que apresenta duração inferior à garantia, qual deve ser esta

garantia, para que a porcentagem de motores substituídos seja inferior a 0,2%? 4. Uma peça é aceita num controle de qualidade com dimensões entre 299 e 301 mm. Verifica se

que l0% das peças são rejeitadas como grandes e 20% como pequenas. Calcular a porcentagem de rejeição, no caso da especificação ser ampliada para 298,5 e 301,5 mm. 8,53% como pequenos; 3,51% como grandes.

5. Levantamento do custo unitário de produção de um item da empresa revelou que sua

distribuição é normal com média 50 e desvio padrão 4. Se o preço de venda unitário desse produto é 60, qual a probabilidade de uma unidade desse item, escolhido ao acaso, ocasionar prejuízo à empresa? (0,621%)

6. Os balancetes semanais realizados em uma empresa mostraram que o lucro realizado distribui-se

normalmente com média 48.000 u.m. e desvio padrão 8.000 u.m.. Qual a probabilidade de que: a) Na próxima semana o lucro seja maior que 50.000 u.m.? (40,129%) b) Na próxima semana o lucro esteja entre 40.000 u.m. e 45.000 u.m.? (19,33%) c) Na próxima semana haja prejuízo? (0%)

7. Os resultados de um concurso de habilitação tiveram distribuição normal com média 50 e desvio

padrão 10. Os candidatos serão classificados conforme o seguinte critério decrescente: A=10% das notas mais altas; B=15% das próximas notas; C=50% das notas; D=15% das notas; E=10% das notas mais baixas. Determine as notas limites para a classificação dos candidatos. A>62,8; 56,7< B<62,8; 43,3<C<56,7; 37,2<D<43,3; E<37,2.

8. Dois estudantes foram informados de que alcançaram as variáveis reduzidas de z1=0,8 e z2=0,4,

respectivamente, em um exame de múltipla escolha de inglês. Se suas notas foram 8,8 e 6,4, respectivamente, determinar a média e o desvio padrão das notas do exame. (µ=7,2; e σ=2).

Page 84: 51188715 Apostila de Estatistica Versao 4

84

Tabela 1. Área sob a Curva Normal Padronizada Compreendida entre os Valores 0 e Z

Z 0 1 2 3 4 5 6 7 8 9 0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359 0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753 0.2 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141 0.3 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.1480 0.1517 0.4 0.1554 0.1591 0.1628 0.1664 0.1700 0.1736 0.1772 0.1808 0.1844 0.1879 0.5 0.1915 0.1950 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.2190 0.2224 0.6 0.2257 0.2291 0.2324 0.2357 0.2389 0.2422 0.2454 0.2486 0.2517 0.2549 0.7 0.2580 0.2611 0.2642 0.2673 0.2704 0.2734 0.2764 0.2794 0.2823 0.2852 0.8 0.2881 0.2910 0.2939 0.2967 0.2995 0.3023 0.3051 0.3078 0.3106 0.3133 0.9 0.3159 0.3186 0.3212 0.3238 0.3264 0.3289 0.3315 0.3340 0.3365 0.3389 1.0 0.3413 0.3438 0.3461 0.3485 0.3508 0.3531 0.3554 0.3577 0.3599 0.3621 1.1 0.3643 0.3665 0.3686 0.3708 0.3729 0.3749 0.3770 0.3790 0.3810 0.3830 1.2 0.3849 0.3869 0.3888 0.3907 0.3925 0.3944 0.3962 0.3980 0.3997 0.4015 1.3 0.4032 0.4049 0.4066 0.4082 0.4099 0.4115 0.4131 0.4147 0.4162 0.4177 1.4 0.4192 0.4207 0.4222 0.4236 0.4251 0.4265 0.4279 0.4292 0.4306 0.4319 1.5 0.4332 0.4345 0.4357 0.4370 0.4382 0.4394 0.4406 0.4418 0.4429 0.4441 1.6 0.4452 0.4463 0.4474 0.4484 0.4495 0.4505 0.4515 0.4525 0.4535 0.4545 1.7 0.4554 0.4564 0.4573 0.4582 0.4591 0.4599 0.4608 0.4616 0.4625 0.4633 1.8 0.4641 0.4649 0.4656 0.4664 0.4671 0.4678 0.4686 0.4693 0.4699 0.4706 1.9 0.4713 0.4719 0.4726 0.4732 0.4738 0.4744 0.4750 0.4756 0.4761 0.4767 2.0 0.4772 0.4778 0.4783 0.4788 0.4793 0.4798 0.4803 0.4808 0.4812 0.4817 2.1 0.4821 0.4826 0.4830 0.4834 0.4838 0.4842 0.4846 0.4850 0.4854 0.4857 2.2 0.4861 0.4864 0.4868 0.4871 0.4875 0.4878 0.4881 0.4884 0.4887 0.4890 2.3 0.4893 0.4896 0.4898 0.4901 0.4904 0.4906 0.4909 0.4911 0.4913 0.4916 2.4 0.4918 0.4920 0.4922 0.4925 0.4927 0.4929 0.4931 0.4932 0.4934 0.4936 2.5 0.4938 0.4940 0.4941 0.4943 0.4945 0.4946 0.4948 0.4949 0.4951 0.4952 2.6 0.4953 0.4955 0.4956 0.4957 0.4959 0.4960 0.4961 0.4962 0.4963 0.4964 2.7 0.4965 0.4966 0.4967 0.4968 0.4969 0.4970 0.4971 0.4972 0.4973 0.4974 2.8 0.4974 0.4975 0.4976 0.4977 0.4977 0.4978 0.4979 0.4979 0.4980 0.4981 2.9 0.4981 0.4982 0.4982 0.4983 0.4984 0.4984 0.4985 0.4985 0.4986 0.4986 3.0 0.4987 0.4987 0.4987 0.4988 0.4988 0.4989 0.4989 0.4989 0.4990 0.4990 3.1 0.4990 0.4991 0.4991 0.4991 0.4992 0.4992 0.4992 0.4992 0.4993 0.4993 3.2 0.4993 0.4993 0.4994 0.4994 0.4994 0.4994 0.4994 0.4995 0.4995 0.4995 3.3 0.4995 0.4995 0.4995 0.4996 0.4996 0.4996 0.4996 0.4996 0.4996 0.4997 3.4 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4998 3.5 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 3.6 0.4998 0.4998 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 3.7 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 3.8 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 3.9 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000

0 z