apostila estatistica

63
Estatística Cursos: Engenharia Civil UMC Villa Lobos Prof. Fábio Conte Correia São Paulo 2011

Upload: wiltonws

Post on 11-Aug-2015

37 views

Category:

Documents


2 download

TRANSCRIPT

Page 1: Apostila estatistica

Estatística

Cursos: Engenharia Civil

UMC – Villa Lobos

Prof. Fábio Conte Correia

São Paulo 2011

Page 2: Apostila estatistica

Sumário

1 O que é estatística ................................................................................................... 3

1.1 Definições: .......................................................................................................... 3

1.2 Métodos Científicos ............................................................................................ 4

1.3 População e Amostra ......................................................................................... 5

1.4 Amostragem ....................................................................................................... 5

1.4.1 Variáveis ..................................................................................................... 6

2 Tabelas .................................................................................................................... 7

2.1 Séries estatísticas ............................................................................................... 8

2.1.1 Séries históricas, cronológicas, temporais ou marchas .............................. 8

2.1.2 Séries geográficas, espaciais, territoriais ou de localização ....................... 8

2.1.3 Séries específicas ou categóricas ............................................................... 9

2.1.4 Séries conjugadas – Tabela de dupla entrada ............................................ 9

2.1.5 Distribuição de freqüência ......................................................................... 10

3 Distribuição de freqüência ..................................................................................... 11

3.1 Tabela primitiva ou dados brutos ...................................................................... 11

3.2 ROL .................................................................................................................. 11

3.3 Distribuição de freqüência sem intervalo de classes ........................................ 11

3.4 Distribuição de freqüência com intervalo de classes ........................................ 12

3.4.1 Elementos de uma distribuição de frequências com intervalos de classe . 13

3.4.1.1 Etapas: Distribuição de Freqüências c/ classe .................................... 14

3.5 Gráficos ............................................................................................................ 15

3.5.1 Histogramas .............................................................................................. 15

3.5.2 Polígonos de freqüências .......................................................................... 16

3.5.3 Polígonos de freqüência acumulada ou ogivas ......................................... 17

4 Medidas posição .................................................................................................... 18

4.1 Medidas de tendência central para dados não agrupados ............................... 18

4.1.1 Média Aritmética Simples .......................................................................... 18

4.1.2 Moda ......................................................................................................... 19

4.1.3 Mediana .................................................................................................... 19

4.2 Medidas de tendência central para dados agrupados ...................................... 20

4.2.1 Média Aritmética Ponderada ..................................................................... 20

4.2.1.1 Sem intervalo de classes ..................................................................... 20

Page 3: Apostila estatistica

1

4.2.1.2 Com intervalo de classes ..................................................................... 20

4.2.2 Moda ......................................................................................................... 22

4.2.2.1 Sem intervalo de classes ..................................................................... 22

4.2.2.2 Com intervalo de classes ..................................................................... 22

4.2.3 Mediana .................................................................................................... 23

4.2.3.1 Sem intervalo de classes ..................................................................... 23

4.2.3.2 Com intervalo de classes ..................................................................... 23

4.3 Relação entre a média, a mediana e a moda ................................................... 25

4.4 Exercícios. ........................................................................................................ 26

4.5 Separatrizes...................................................................................................... 29

4.5.1 Quartis, Decis e Percentis ......................................................................... 29

4.5.1.1 Calculo para dados não agrupados ..................................................... 29

4.5.1.2 Cálculo para dados agrupados ............................................................ 30

5 Mediadas de dispersão ou de variabilidade ........................................................... 32

5.1 Amplitude Total ................................................................................................. 32

5.2 Variância e desvio padrão ................................................................................ 33

5.2.1 Dados não agrupados ............................................................................... 34

5.2.2 Dados agrupados sem intervalo de classes .............................................. 35

5.2.3 Dados agrupados com intervalo de classes .............................................. 35

5.3 Coeficiente de variação .................................................................................... 36

6 Correlação e Regressão ........................................................................................ 39

6.1 Correlação linear entre duas variáveis ............................................................. 39

6.1.1 Coeficiente de correlação linear ................................................................ 41

6.2 Regressão Linear ............................................................................................. 44

7 Fatorial ....................................................................... Erro! Indicador não definido.

7.1 Números Binomiais ........................................................................................... 53

8 Probabilidade ......................................................................................................... 54

8.1 Experimentos ou fenômenos aleatórios ............................................................ 54

8.2 Espaço amostral ............................................................................................... 54

8.3 Eventos ............................................................................................................. 55

8.4 Função Probabilidade ....................................................................................... 55

8.5 Eventos complementares ................................................................................. 56

8.6 Eventos independentes .................................................................................... 56

Page 4: Apostila estatistica

2

8.7 Eventos mutuamente exclusivos ...................................................................... 57

8.8 Exercícios ......................................................................................................... 57

9 Distribuição Binomial ............................................................................................. 60

Page 5: Apostila estatistica

3

1 O que é estatística

1. É a ciência da tomada de decisão perante incertezas;

2. Coleta, análise e interpretação de dados;

3. É um “kit” de ferramentas que ajuda a resolver problemas;

4. Base para a maior parte das decisões tomadas quanto ao controle de qualidade,

assim como em quase todas as outras áreas da atividade humana moderna.

Vista dessa forma, a Estatística não deve ser confundida como uma disciplina

isolada, e sim, compreendida como uma ferramenta ou conjunto de ferramentas,

disponível para a solução de problemas em diversas áreas do conhecimento.

1.1 Definições:

Processo: é qualquer combinação específica de máquinas, ferramentas,

métodos, materiais e/ou pessoas empregadas para atingir qualidades

específicas num produto ou serviço. Estas qualidades são chamadas de

“características de qualidade”.

Controle: é o ciclo de feedback (realimentação) através da qual medimos o

desempenho real, comparando-o com o padrão, e agimos sobre a diferença.

Controle Estatístico do processo (CEP): aplicação de técnicas estatísticas para

medir e analisar a variação nos processos.

Controle Estatístico da Qualidade (CEQ): aplicação de técnicas estatísticas para

medir e aprimorar a qualidade dos processos. CEQ inclui CEP, ferramentas de

diagnósticos, planos de amostragem e outras técnicas estatísticas.

Estatística Descritiva: sua função é observar fenômenos de mesma natureza, coletar

dados numéricos referente a esses fenômenos, organizar e classificar esses dados

observados, além da sua apresentação por meio de tabelas, diagramas e gráficos.

Etapas básicas:

Definição do problema;

Planejamento;

Coleta de dados;

Apuração dos dados;

Page 6: Apostila estatistica

4

Apresentação dos dados;

Análise e interpretação dos dados.

Estatística Indutiva: é um processo de generalização a partir de resultados obtidos

particulares, isto é, a inferência de propriedades para o todo com base na parte do

particular. O processo de generalização que é característico do método indutivo está

associado a uma margem de erro e para minimizar este grau de incerteza a teoria de

probabilidades será fundamental para o desenvolvimento da estatística aplicada.

Estatística nas empresas

Neste mundo globalizado, a empresa é uma das vigas mestras da Economia dos

povos e a Estatística tem colaborado com os gerentes porque permitem a construção

de ferramentas que dão oportunidades a tomada de decisões e estimativas, e ainda,

facilitam o tríplice trabalho do Administrador de organizar, dirigir e controlar a empresa.

Aplicação na Engenharia e na Administração

Uma firma que está se preparando para lançar um novo produto precisa

conhecer as preferências do consumidor no mercado de interesse. Deve-se fazer

pesquisa de mercado entrevistando um número de residências escolhidas

aleatoriamente. Assim, os resultados podem ser usados para estimar as preferências

da população.

É possível que em uma comunidade, o consumo de sorvete dependa do:

- preço do produto;

- renda média local;

- número de crianças na comunidade;

- temperatura média;

Através da análise de regressão podem-se determinar quais fatores têm efeitos

mais importantes.

1.2 Métodos Científicos

Método é um conjunto de meios dispostos convenientemente para se chegar a

um fim que se deseja.

Page 7: Apostila estatistica

5

• Método Experimental: consiste em manter constantes todas as causas (fatores),

menos uma, e variar esta causa de modo que o pesquisador possa descobrir

seus efeitos, caso existam.

• Método Estatístico: Admite todas essas causas presentes variando-as,

registrando essas variações e procurando determinar, no resultado final, que

influências cabem a cada uma delas.

1.3 População e Amostra

Ao conjunto de entes portadores de, pelo menos, uma característica comum

denominamos população estatística, universo estatístico ou simplesmente

POPULAÇÃO.

Como em qualquer estudo estatístico, temos em mente pesquisar uma ou mais

características dos elementos de alguma população, esta característica deve estar

perfeitamente definida. Isso possibilita que afirmemos, sem ambiguidade, se um

elemento pertence ou não à população.

Na maioria das vezes, por impossibilidade ou inviabilidade econômica ou

temporal, limitamos as observações referentes a uma determinada pesquisa a apenas

uma parte da população. A essa parte proveniente da população em estudo

denominamos amostra.

Uma amostra é um subconjunto finito de uma população.

Para as inferências serem corretas, é necessário garantir que a amostra seja

representativa da população, isto é, a amostra deve possuir as mesmas características

básicas da população, no que diz respeito ao fenômeno que desejamos pesquisar.

1.4 Amostragem

A amostragem é uma técnica especial, que garante, tanto quanto possível o

acaso da escolha da amostra.

Dessa forma, cada elemento da população passa a ter a mesma chance de ser

escolhido, o que garante à amostra caráter de representatividade.

Amostragem casual ou aleatória simples

Page 8: Apostila estatistica

6

Esse tipo de amostragem é equivalente a um sorteio lotérico.

Na prática, a amostragem casual ou aleatória simples pode ser realizada

enumerando-se a população de 1 a n e sorteando-se por meio de um dispositivo

aleatório qualquer, k números dessa seqüência, os quais corresponderão aos

elementos pertencentes à amostra.

Amostragem proporcional estratificada

Muitas vezes a população se divide em subpopulações -- estratos.

Como é possível que a variável em estudo apresente, de estrato em estrato, um

comportamento heterogêneo e, dentro de cada estrato, um comportamento

homogêneo, convém que o sorteio dos elementos da amostra leve em consideração

tais estratos.

Amostragem sistemática

Quando os elementos da população já se acham ordenados, não há

necessidade de construir o sistema de referência. São exemplos os prontuários

médicos de um hospital, os prédios de uma rua, etc...

Nesses casos, a seleção dos elementos que constituirão a amostra pode ser

feita por um sistema imposto pelo pesquisador. A esse tipo de amostragem

denominamos sistemática.

1.4.1 Variáveis

Variável é convencionalmente, o conjunto de resultados possíveis de um

fenômeno e cada fenômeno corresponde um número de resultados possíveis.

Alguns exemplos:

Para o fenômeno “sexo”, são dois o resultados possíveis: sexo masculino e sexo

feminino;

Para o fenômeno “número de filhos” há um número de resultados possíveis

expresso através dos números naturais: 0, 1, 2, 3, ..., n.

Page 9: Apostila estatistica

7

Uma variável pode ser:

Qualitativa são as características que não possuem valores quantitativos, mas,

ao contrário, são definidas por várias categorias, ou seja, representam uma

classificação dos indivíduos.

Nominal quando seus valores são expressos por atributos: sexo, cor

da pele, etc.

Ordinal existe uma ordenação entre as categorias. Ex: escolaridade

(1º, 2º, 3º graus), estágio da obra (inicial, intermediário, terminal), mês de

observação (janeiro, fevereiro...).

Quantitativas – são as características que podem ser medidas em uma escala

quantitativa, ou seja, apresentam valores numéricos.

Contínua características mensuráveis que assumem valores em uma

escala contínua (na reta real), para as quais valores fracionais.

Usualmente devem ser medidas através de algum instrumento.

Exemplos: peso (balança), altura (régua), tempo (relógio), pressão

arterial, idade

Discreta características mensuráveis que podem assumir apenas um

número finito ou infinito contável de valores e, assim, somente valores

inteiros. Geralmente é o resultado de contagens. Exemplos: número de

filhos, número de pilares, vigas, número de cigarros fumados por dia.

De modo geral, as medições dão origem a variáveis contínuas e as contagens

ou enumerações dão origem a variáveis discretas.

2 Tabelas

Um dos objetivos da Estatística é sintetizar os valores que uma ou mais

variáveis podem assumir, para que tenhamos uma visão global da variação dessa ou

dessas variáveis.

Tabela é um quadro que resume um conjunto de observações.

Page 10: Apostila estatistica

8

2.1 Séries estatísticas

Denominamos série estatística toda tabela que apresenta a distribuição de um

conjunto de dados estatísticos em função da época, do local ou da espécie.

Daí, podemos inferir que numa série estatística observamos a existência de três

elementos ou fatores: o tempo, o espaço e a espécie.

2.1.1 Séries históricas, cronológicas, temporais ou marchas

Descrevem os valores da variável, em determinado local, discriminados segundo

intervalos de tempo variáveis. Exemplo:

2.1.2 Séries geográficas, espaciais, territoriais ou de localização

Descrevem os valores da variável, em determinado instante, discriminados

segundo regiões. Exemplo:

Page 11: Apostila estatistica

9

2.1.3 Séries específicas ou categóricas

Descrevem os valores da variável, em determinado tempo e local, discriminados

segundo especificações ou categorias. Exemplo:

2.1.4 Séries conjugadas – Tabela de dupla entrada

Muitas vezes temos necessidade de apresentar em uma única tabela, a variação

de valores de mais de uma variável, isto é, fazer uma conjugação de duas ou mais

séries.

Page 12: Apostila estatistica

10

Conjugando duas séries em uma única tabela, obtemos uma tabela de dupla

entrada. Em uma tabela desse tipo ficam criadas duas ordens de classificação: uma

horizontal (linha) e uma vertical (coluna). Exemplo:

2.1.5 Distribuição de freqüência

Por se tratar de um conceito estatístico de suma importância, merecerá um

tratamento especial. Exemplo:

Page 13: Apostila estatistica

11

3 Distribuição de freqüência

Quando da análise de dados, é comum procurar conferir certa ordem aos

números tornando-os visualmente mais amigáveis. O procedimento mais comum é o de

divisão por classes ou categorias, verificando-se o número de indivíduos pertencentes

a cada classe. É um tipo de tabela que condensa uma coleção de dados conforme as

freqüências (repetições de seus valores).

3.1 Tabela primitiva ou dados brutos

É uma tabela ou relação de elementos que não foram numericamente

organizados. É difícil formarmos uma idéia exata do comportamento do grupo como um

todo, a partir de dados não ordenados.

Ex : 45, 41, 42, 41, 42 43, 44, 41 ,50, 46, 50, 46, 60, 54, 52, 58, 57, 58, 60, 51

3.2 ROL

É a tabela obtida após a ordenação dos dados (crescente ou decrescente).

Ex : 41, 41, 41, 42, 42 43, 44, 45 ,46, 46, 50, 50, 51, 52, 54, 57, 58, 58, 60, 60

3.3 Distribuição de freqüência sem intervalo de classes

É a simples condensação dos dados conforme as repetições de seus valores.

Para um ROL de tamanho razoável esta distribuição de freqüência é inconveniente, já

que exige muito espaço. Veja exemplo abaixo:

Ex1. Um dado foi lançado 15 vezes, obtendo-se os seguintes pontos: 2, 5, 6, 6,

1, 4, 2, 6, 5, 1, 3, 3, 2, 4, 6. Construa uma tabela de distribuição de freqüências

absolutas, acumuladas e relativas.

Dados (xi)

Frequência absoluta

(fi)

Freq. absoluta acumulada

(fac)

Freq. Relativa (fr)%

Freq. Relativa acumulada

(fr ac)%

1 2 2 13,33% 13,33% 2 3 5 20,00% 33,33% 3 2 7 13,33% 46,66% 4 2 9 13,33% 59,99% 5 2 11 13,33% 73,32% 6 4 15 26,68% 100%

Total 15

100%

Page 14: Apostila estatistica

12

Frequência absoluta Número de vezes que a variável xi se repete

Frequência absoluta acumulada É a frequência atual somada às frequências

anteriores

Frequência Relativa É a relação entre a frequência absoluta e o numero de

elementos da população estatística.

Ex2. Um condomínio possui 25 apartamentos, sendo que esses apartamentos

possuem áreas (m2) diferentes. Seguem os valores das áreas dos apartamentos: 50,

65, 59, 62, 68, 72, 53, 60, 59, 65, 70, 75, 50, 53, 60, 70, 50, 50, 59, 53, 65, 68, 50, 53,

75. Construa uma tabela de distribuição de freqüências absolutas, acumuladas e

relativas.

xi fi fac fr fr% fr ac fr ac%

50 5 5 0,20 20% 0,20 20%

53 4 9 0,16 16% 0,36 36%

59 3 12 0,12 12% 0,48 48%

60 2 14 0,08 8% 0,56 56%

62 1 15 0,04 4% 0,60 60%

65 3 18 0,12 12% 0,72 72%

68 2 20 0,08 8% 0,80 80%

70 2 22 0,08 8% 0,88 88%

72 1 23 0,04 4% 0,92 92%

75 2 25 0,08 8% 1,00 100%

Total 25

1,00 100%

3.4 Distribuição de freqüência com intervalo de classes

Quando o tamanho da amostra é elevado, é mais racional efetuar o

agrupamento dos valores em vários intervalos de classe.

Ex3. O tempo de cura em minutos de um determinado cimento foi de 45, 41, 42,

41, 42 43, 44, 41, 50, 46, 50, 46, 60, 54, 52, 58, 57, 58, 60, 51, construa a tabela de

distribuição de frequências.

Page 15: Apostila estatistica

13

Dados (xi)

Frequência absoluta

(fi)

Freq. absoluta acumulada

(fac)

Freq. Relativa (fr)%

Freq. Relativa acumulada

(fr)% 41 3 3 15% 15% 42 2 5 10% 25% 43 1 6 5% 30% 44 1 7 5% 35% 45 1 8 5% 40% 46 2 10 10% 50% 50 2 12 10% 60% 51 1 13 5% 65% 52 1 14 5% 70% 54 1 15 5% 75% 57 1 16 5% 80% 58 2 18 10% 90% 60 2 20 10% 100%

Total 20 100%

3.4.1 Elementos de uma distribuição de frequências com intervalos de classe

Classes Freqüências 41 |------- 45 7 45 |------- 49 3 49 |------- 53 4 53 |------- 57 1 57 |------- 61 5 Total 20

Classe: são os intervalos de variação da variável e é simbolizada por i e o

número total de classes simbolizada por k.

Ex: na tabela anterior k = 5 e 49 |------- 53 são a 3ª classe, onde i = 3.

Limites de classe: são os extremos de cada classe. O menor número é o limite

inferior de classe (li) e o maior número, limite superior de classe ( Li ).

Ex: em 49 |------- 53,... l3 = 49 e L3 = 53.

O símbolo |------- representa um intervalo fechado à esquerda e aberto à direita.

O dado 53 do ROL não pertence à classe 3 e sim à classe 4 representada por

53 |------- 57.

Page 16: Apostila estatistica

14

Amplitude do intervalo de classe: é obtida através da diferença entre o limite

superior e inferior da classe e é simbolizada por hi = Li - li. Ex: na tabela

anterior hi = 53 - 49 = 4. Obs: Na distribuição de freqüências c/ classe o hi

poderá ser igual em todas as classes.

Amplitude total da distribuição: é a diferença entre o limite superior da última

classe e o limite inferior da primeira classe. AT = L(max) - l(min). Ex: na tabela

anterior AT = 61 - 41= 20.

Amplitude total da amostra (rol): é a diferença entre o valor máximo e o valor

mínimo da amostra (ROL). Onde AA = Xmax - Xmin. Em nosso exemplo AA =

60 - 41 = 19.

Obs: AT sempre será maior que AA.

Ponto médio de classe ( i ): é o ponto que divide o intervalo de classe em

duas partes iguais.

Ex: em 49 |------- 53 o ponto médio x3 = (53+49)/2 = 51, ou seja x3=( l3 + L3 )/2.

3.4.1.1 Etapas: Distribuição de Freqüências c/ classe

1º - Organize os dados brutos em um ROL.

2º - Calcule a amplitude amostral AA No nosso exemplo: AA = 60 - 41 = 19

3º - Calcule o número de classes através da "Regra de Sturges" K 1 +

3,3*log n. Onde K é o número de classes e n o número total de dados, ou pelo Critério

da Raiz

Obs: Qualquer regra para determinação do nº de classes da tabela não nos

levam a uma decisão final; esta vai depender, na realidade, de um julgamento pessoal,

que deve estar ligado à natureza dos dados.

No nosso exemplo: n = 20 dados, então a regra sugere a adoção de 5 classes.

4º - Decidido o nº de classes, calcule então a amplitude do intervalo de

classe h > AA / k. No nosso exemplo: AA/k = 19/5 = 3,8 . Obs: Como h > AA/k um valor

ligeiramente superior para haver folga na última classe. Utilizaremos então h = 4

Page 17: Apostila estatistica

15

5º - Temos então o menor nº da amostra, o nº de classes e a amplitude do

intervalo. Podemos montar a tabela, com o cuidado para não aparecer classes com

freqüência = 0 (zero).

No nosso exemplo: o menor nº da amostra = 41 + h = 45, logo a primeira classe

será representada por

41 |------- 45. As classes seguintes respeitarão o mesmo procedimento.

A classe seguinte sempre terá como primeiro elemento o limite superior da

classe anterior.

Ex4. Utilizando os dados do exercício 3 (45, 41, 42, 41, 42 43, 44, 41, 50, 46, 50,

46, 60, 54, 52, 58, 57, 58, 60, 51) Construa a tabela de distribuição de frequências com

intervalo de classes.

Tempo de cura do cimento X

Classes xi fi fac fr fr% frac frac%

41ǀ---45 43 7 7 0,35 35 0,35 35

45ǀ---49 47 3 10 0,15 15 0,5 50

49ǀ---53 51 4 14 0,2 20 0,7 70

53ǀ---57 55 1 15 0,05 5 0,75 75

57ǀ---61 59 5 20 0,25 25 1 100

3.5 Gráficos

Os principais gráficos utilizados na representação de distribuição de freqüências

são:

histograma e polígono de freqüência;

ogiva ou polígono de freqüência acumulada.

3.5.1 Histogramas

É um conjunto de retângulos com bases sobre um eixo dividido de acordo com

os tamanhos de classe, centro nos pontos médio das classes e áreas proporcionais às

freqüências.

Utilizando os dados do obtidos no EX4 montamos o histograma abaixo.

Page 18: Apostila estatistica

16

3.5.2 Polígonos de freqüências

É um gráfico que se obtém unindo por uma poligonal os pontos correspondentes

às freqüências das diversas classes, centradas nos respectivos pontos médios (xi).

Para obter as interseções do polígono com o eixo, cria-se em cada extremo do

histograma uma classe com freqüência nula.

Utilizando os dados do obtidos no EX4 montamos o polígono de freqüência.

0

1

2

3

4

5

6

7

8 Tempo de cura do cimento X

41 45 49 53 57 61

0

1

2

3

4

5

6

7

8

39 41 43 45 47 49 51 53 55 57 59 61 63

Fre

qu

ên

cia

Tempo de cura (min)

Fre

qu

ên

cia

Tempo de cura (min)

Tempo de cura do cimento X

Page 19: Apostila estatistica

17

3.5.3 Polígonos de freqüência acumulada ou ogivas

É o gráfico representativo de uma distribuição acumulada de freqüências. É uma

poligonal ascendente. No eixo horizontal colocam-se as extremidades de classe e no

eixo vertical as freqüências acumuladas.

Note que a freqüência acumulada relacionada com o limite inferior da primeira

classe é sempre zero.

Ao contrário do polígono de freqüência, a ogiva de freqüências acumuladas

utiliza os pontos extremos

Utilizando os dados do obtidos no EX4 montamos o polígono de freqüência

acumulada.

0

5

10

15

20

25

39 41 43 45 47 49 51 53 55 57 59 61 63

Fre

qu

ên

cia

Tempo de cura (min)

Tempo de cura do cimento X

Page 20: Apostila estatistica

18

4 Medidas posição

São as estatísticas que representam uma série de dados orientando-nos quanto

à posição da distribuição em relação ao eixo horizontal do gráfico da curva de

freqüência. As medidas de posição mais importantes são:

Medidas de tendência central

Verifica-se uma tendência dos dados observados a se agruparem em torno dos

valores centrais.

As medidas de tendência central mais utilizadas são: média aritmética, moda e

mediana. Outros menos usados são as médias: geométrica, harmônica, quadrática,

cúbica e biquadrática.

Separatrizes

Que englobam: a própria mediana, os decis, os quartis e os percentis.

4.1 Medidas de tendência central para dados não agrupados

4.1.1 Média Aritmética Simples

A média aritmética simples ( x ) dos valores x1, x2, x3,....xn é o quociente entre a

soma desses valores e o seu número total (N):

x = N

xn

i

i1

ou seja: x =N

xxx n...21

Ex5: Uma loja de materiais de construção vendeu as seguintes quantidades de

caixas de pisos durante certa semana. Calcule a média dessas vendas

2ª. feira 3ª. feira 4ª. feira 5ª. feira 6ª. feira sábado

22 23 22 27 25 13

x = 6

132527222322 x =

6

132 x = 22

Page 21: Apostila estatistica

19

4.1.2 Moda

Moda de um conjunto de valores é o valor que aparece o maior número de

vezes, ou seja a característica com maior freqüência absoluta.

Na seqüência anterior 28, 37, 37, 37, 40,41, 41,43, 44, 45 a moda será o número

37.

4.1.3 Mediana

É o valor que ocupa a posição central de um conjunto de valores, colocados em

ordem crescente ou decrescente de grandeza. Devemos, portanto, considerar duas

situações: o número de valores é par ou, o número de valores é impar.

O número de dados é impar

Md = xp onde pn

1

2 (p = posição) ou

EX7. As nove classes de 1º Ano de engenharia têm respectivamente: 37, 28,

40,41,45,37,37, 41 e 44 alunos. Calcule a mediana.

pn

1

2 p

2

19 = 5

Portanto a mediana ocupará a 5ª posição = 40.

28, 37, 37, 37, 40, 41, 41, 44, 45

O número de dados é par

Mx x

d

p p

1

2 onde p

n

2.

Neste caso a mediana é a Média Aritmética dos dois termos centrais.

Page 22: Apostila estatistica

20

Ex8. As dez classes de 1º. Ano de engenharia têm respectivamente: 37, 28,

40,41,45,37,37, 41, 43 e 44 alunos. Calcule a mediana.

Ordenando aos dados temos: 28, 37, 37, 37, 40, 41, 41,43, 44, 45

pn

2

= 10/2 = 5

Md=

2

)( 155 xx

2

4140Md

Md= 40,5

4.2 Medidas de tendência central para dados agrupados

4.2.1 Média Aritmética Ponderada

4.2.1.1 Sem intervalo de classes

A média aritmética Ponderada difere da Média Aritmética Simples, pois alguns

dos valores x1, x2, x3,..., xn se repetem como podemos ver no exemplo abaixo.

EX6. A Tabela abaixo representa o número de falhas em um determinado

processo em uma indústria química.

xi fi

0 2

1 6

2 10

3 12

4 4

∑ 34

3,234

78.

i

ii

f

fxx

4.2.1.2 Com intervalo de classes

Neste caso, convencionamos que todos os valores incluídos em um determinado

intervalo de classe coincidem com o seu ponto médio ( ix ), e determinamos a média

aritmética ponderada por meio da fórmula:

Page 23: Apostila estatistica

21

i

ii

f

fx .

ou seja n

nn

fff

fxfxfxx

...

....

21

221.1

Ex7. O quadro de distribuição de freqüências representa os salários mensais de

40 empregados de uma firma. Calcule o salário médio mensal desses empregados.

Classe em Reais X10

Ponto Médio da classe

( ix )

Freq. (fi)

[180,200[ 190 4

[200,220[ 210 18

[220,240[ 230 10

[240,260[ 250 5

[260,280[ 270 3

40

810175023003780760 x

40

8900x x = 222,50 x = 222,50 x 10 = R$2.225,00

Ex8. Calcular a altura média de uma série de pilares de uma obra, conforme a

tabela abaixo.

Altura (cm) - xi Freqüência - fi Ponto médio i xi . fi

50 |------------ 54 4 52 208

54 |------------ 58 9 56 504

58 |------------ 62 11 60 660

62 |------------ 66 8 64 512

66 |------------ 70 5 68 340

70 |------------ 74 3 72 216

Total 40 2.440

Aplicando a fórmula acima temos: 2.440 / 40.= 61, logo... = 61 cm

3510184

270.3250.5230.10210.18190.4

x

Page 24: Apostila estatistica

22

4.2.2 Moda

4.2.2.1 Sem intervalo de classes

Neste caso basto fixar o valor da variável de maior frequência

Temperaturas °C xi fi

0 3

1 9

2 12

3 6

4 5

∑ 34

2° C é temperatura modal, pois é a de maior frequência.

4.2.2.2 Com intervalo de classes

Neste caso o modo mais simples é achar a classe modal e calcular o ponto

médio dessa classe.

Classe fi

54 |------------ 58 9

58 |------------ 62 11

62 |------------ 66 8

66 |------------ 70 5

Total 33

A classe Modal é 58 |------------ 62, pois é a classe de maior frequência, e o ponto

médio dessa classe é (58+62)/2 60

Há também um método mais elaborado no qual utiliza a seguinte formula:

Page 25: Apostila estatistica

23

4.2.3 Mediana

4.2.3.1 Sem intervalo de classes

Impar

Temperaturas °C xi fi fac

0 2 2

1 6 8

2 9 17

3 13 30

4 5 35

∑ 35

2

1

npimparn

=(35+1)/2 18° termo equivale a 3°

Par

Temperaturas °C xi fi fac

0 2 2

1 6 8

2 9 17

3 13 30

4 4 34

∑ 34

2

1pp

d

xxM

p

n

2 Md=

2

)( 11717 xx

Nesse caso então serão a média entre os valores da posição 17° e 18°, 2 e 3

respectivamente 5,22

32

4.2.3.2 Com intervalo de classes

Nesse caso devemos seguir os seguintes passos:

1º) Determinamos as freqüências acumuladas;

2º) Calculamos ∑fi/2 ;

3º) Marcamos a classe correspondente à freqüência acumulada imediatamente

superior à ∑fi/2 . Tal classe será a classe mediana;

Page 26: Apostila estatistica

24

4º) Calculamos a Mediana pela seguinte fórmula:

onde: li é o limite inferior da classe mediana.

F(ant) é a freqüência acumulada da classe anterior a classe mediana

h é a amplitude do intervalo da classe mediana

fi é a freqüência do intervalo da classe mediana

classes freqüência = fi Freqüência acumulada

50 |------------ 54 4 4

54 |------------ 58 9 13

58 |------------ 62 11 24

62 |------------ 66 8 32

66 |------------ 70 5 37

70 |------------ 74 3 40

total 40

=

, logo.a classe mediana será 58 |------ 62.

li = 58 ; F(ant) =13 ; fi = 11 e h = 4 , Substituindo esses valores na fórmula, obtemos:

No caso de

acontecer, a mediana será o limite superior da classe correspondente

EX9. Calcule a mediana

8

18

29

45

58

63

64

Page 27: Apostila estatistica

25

=

, logo.a classe mediana será 750 |------ 850.

li = 750 ; F(ant) =29 ; fi = 16 e h = 100 , Substituindo esses valores na fórmula, obtemos:

No caso de

acontecer, a mediana será o limite superior da classe correspondente

4.3 Relação entre a média, a mediana e a moda

Para os dados agrupados representados por uma curva de freqüência, as

diferenças entre os valores da média, da mediana e da moda são indicadores da forma

da curva em termos de assimetria. Para uma distribuição unimodal simétrica, a média,

a mediana e a moda são, todas, coincidentes em valor Para uma distribuição

positivamente assimétrica, a média apresenta o valor mais elevado, enquanto a

mediana é maior do que a moda, mas menor do que a média. Para uma distribuição

negativamente assimétrica, a média apresenta o menor valor e a mediana se encontra

abaixo da moda, mas acima da média.

Moda Média

Mediana

Moda

(a) Simétrica (b) Positivamente assimétrica

(c) Negativamente assimétrica

Page 28: Apostila estatistica

26

4.4 Exercícios.

1) Calcular a média a moda e a mediana dos seguintes valores:

27,27,30,30,30,30,30,32,32,32.

x = 30

Md=2

)( 155 xx

2

)( 155 xx =

2

3030 = 30

Mo= 30

2) Calcular a média a moda e a mediana dos seguintes valores: 13,5; 13,5; 17,23;

35,003; 45,72; 63,601; 37,13; 13,5; 52,13

x = 32,368

Md - Organizar os dados em ordem crescente

Md= xp onde pn

1

2 (p = posição) p=5 Md= 35,003; Mo= 13,500

Posição

(p)

Valores

(xi)

1 13,500

2 13,500

3 13,500

4 17,230

5 35,003

6 37,130

7 45,720

8 52,130

9 63,601

3) A tabela nos dá uma distribuição de freqüências. Calcule a média dessa

distribuição. Resp. 22,9

xi fi xi* fi

10 8 80

20 11 220

30 7 210

40 5 200

Total 31 710

Page 29: Apostila estatistica

27

4) Foi feita uma pesquisa para saber o número de acidente que cada um dos 30

operários de uma obra já sofreram, obteve-se o seguinte quadro. Calcule a média, a

mediana e a moda.

0 2 3 2 1 2 2 1 1 2 1 2 0 1 2

0 2 2 3 4 2 3 1 3 2 5 2 4 4 2

Organizando os dados temos:

Número acidentes (xi) Freq.(fi) (xi)*(fi) fac

0 3 0 3

1 6 6 9

2 13 26 22

3 4 12 26

4 3 12 29

5 1 5 30

Total 30 61

x = 61/30= 2,033 acidentes

Md= 2

)( 1615 xx =

2

22 = 2

Mo= 2

5) No quadro abaixo temos as idades dos 20 alunos que estudam na 2ª. Série do

Ensino Médio de uma Escola. Faça um quadro completo de distribuição de freqüências.

Calcule a média dessa seqüência. Resp: x = 15,45

15 15 14 16 16 16 17 16 14 15

15 15 16 16 16 17 16 15 14 15

6) Utilizando os dados do EX2 (50, 65, 59, 62, 68, 72, 53, 60, 59, 65, 70, 75, 50, 53, 60,

70, 50, 50, 59, 53, 65, 68, 50, 53, 75). Construa uma tabela de distribuição de

frequência com intervalo de classes e calcule a média, a moda e a mediana

Page 30: Apostila estatistica

28

1° Calcular a amplitude total AA = 75-50= 25

2° Calcular o numero de classes K= 1+3,3*log25 = 5,6 5

3° Calcular a Amplitude do intervalo Ai = AA/k = 5

Obs confirmar se pode li+( Ai * K) ≥ Ls 50+25 ≥ 75 75 ≥ 75 OK.

4° Calcular os intervalos:

Classes x fi fac fr frac

50 ǀ--- 55 52,50 9 9 0,36 0,36

55 ǀ--- 60 57,50 3 12 0,12 0,48

60 ǀ--- 65 62,50 3 15 0,12 0,60

65 ǀ--- 70 67,50 5 20 0,20 0,80

70 ǀ--- 75 72,50 5 25 0,20 1,00

Total 25

1

5° Calculo da média = 1532,5/25 = 61,3

Classes x fi fac x * fi

50 ǀ--- 55 52,50 9 9 472,5

55 ǀ--- 60 57,50 3 12 172,5

60 ǀ--- 65 62,50 3 15 187,5

65 ǀ--- 70 67,50 5 20 337,5

70 ǀ--- 75 72,50 5 25 362,5

Total 25

1532,5

6° Calculo da mediana

∑fi/2 20/2 = 10

Classe onde a fac é imediatamente superior a ∑fi/2 essa será a classe da

mediana : 55 ǀ--- 60

Usando a formula : Md = li* + [( ∑fi /2 - Fant ) . h*] / fi*

Md= 55 + [( 10 – 9 ) * 5] / 3 = 56,66

Page 31: Apostila estatistica

29

4.5 Separatrizes

4.5.1 Quartis, Decis e Percentis

São valores que ocupam determinados lugares de uma série.

Seus empregos são para análise, assim como a mediana, sendo que esta divide

a distribuição em duas partes iguais, os quartis em 4, os decis em 10 e os percentis em

100 partes iguais. Pode-se então dizer, de modo geral, que são valores de posição de

uma distribuição e que servem para o auxílio de comparação. Os processos de cálculo

de seus valores são idênticos aos da mediana.

4.5.1.1 Calculo para dados não agrupados

EX10. Amostra ordenada: 6, 7, 15, 36, 39, 40, 41, 42, 43, 47, 49

Q1= 1(11+1)/4 = 3° posição = 15

Q2= 2(11+1)/4 = 6° posição = 40

Q3= 3(11+1)/4 = 9° posição = 43

Ex11. Calcular os quartis da seguinte série:

O primeiro quartis (Q1) abrange 25% dos termos da série, o segundo quartil (Q2)

50% = Me o terceiro quartil (Q3) 75%.

Page 32: Apostila estatistica

30

4.5.1.2 Cálculo para dados agrupados

O processo a ser empregado é o mesmo que para o cálculo da mediana,

bastando apenas no cálculo das posições (P) considerarem os denominadores, 4, 10 e

100, respectivamente, para os quartis, decis e percentis.

Sendo k o número de ordem do quartil, do decil ou do percentil

EX12. Calcular os quartis na seguinte série estatística

Page 33: Apostila estatistica

31

EX13. Calcular os quartis na seguinte série estatística

EX13. Calcular o oitavo percentil na seguinte série estatística abaixo.

K=8

, logo a classe do percentil será 1°.

li=150; F(ant) = 0; h=4; fi=4

Page 34: Apostila estatistica

32

5 Mediadas de dispersão ou de variabilidade

Visam descrever os dados no sentido de informar o grau de dispersão ou

afastamento dos valores observados em torno de um valor central (média). Informa se

um conjunto de dados é homogêneo (pouca variabilidade) ou heterogêneo (muita

variabilidade).

Medidas de dispersão então medem o afastamento dos valores observados em

relação a uma medida de tendência central (normalmente em relação a média

aritmética).

Ex 14. Desejamos compara o desempenho de dois grupos, com base em um teste

em uma prova do MEC:

Grupo A { 70; 71; 69; 70; 70 }

Grupo B { 55; 80; 70; 62; 83 }

Calculando a média para cada um dos grupos vamos obter a=70 e b=70

Baseado nestes resultados, diríamos que ambos os grupos apresentam a mesma

performance. Mas, observando mais detalhadamente os dados, notamos que as notas

do grupo A variam apenas de 69 a 71, ao passo que as de B variam de 55 a 83, o que

revela que o desempenho de A é bem mais uniforme que o de B.

Para avalia quantitativamente o grau de variabilidade ou dispersão de um grupo de

valores utilizamos então as medidas de dispersão, onde as principais medidas são: a

amplitude total, a variância, o desvio padrão e o coeficiente de variação de Pearson.

5.1 Amplitude Total

É a diferença entre o maior e o menor valor observado

Sem Intervalo Com intervalo de classes

AT = Xmax – Xmin AT = L(Máx) – l(Mín)

Quanto maior for à amplitude, maior será dispersão ou variabilidade dos valores

da variável

Page 35: Apostila estatistica

33

5.2 Variância e desvio padrão

A variância e o desvio padrão são medidas que levam em consideração a

totalidade dos valores da variável em estudo, o que faz delas índices de variabilidade

bastante estáveis e, por isso mesmo, os mais geralmente utilizados.

A variância baseia-se nos desvios em torno da média aritmética, porém

determinado a média aritmética dos quadrados dos desvios, representamos a variância

por s2.

O desvio padrão é o valor positivo da raiz quadrada da variância absoluta. É

uma medida estatística que representa, em média, os afastamentos, em valores

absolutos, dos elementos observados em relação a respectiva média aritmética. É uma

medida estatística que é dada na unidade da medida utilizada:

Em geral a média aritmética ( ) é um numero fracionário o que torna pouco

prático o calculo das quantidades de .

Podemos simplificar os cálculos fazendo a seguinte igualdade:

Substituindo na formula do desvio padrão temos:

Page 36: Apostila estatistica

34

5.2.1 Dados não agrupados

EX 15.

EX16.

EX17. Com os seguintes valores 8; 10; 11; 15; 16; 18, calcule o desvio padrão:

(Xi) (Xi)2

8 64

10 100

11 121

15 225

16 256

18 324

∑= 78 ∑=1090

Page 37: Apostila estatistica

35

5.2.2 Dados agrupados sem intervalo de classes

EX18.

xi fi xi*fi (xi – ) fi(xi – )2

0 2 0 0 – 2,1 = – 2,1 2*4,41= 8,82

1 6 6 1 – 2,1 = – 1,1 6*1,21= 7,26

2 12 24 2 – 2,1 = – 0,1 12*0,01= 0,12

3 7 21 3 – 2,1= 0,9 7*0,81=5,67

4 3 12 4 – 2,1 = 1,9 3*3,61=10,83

∑= 30 ∑= 63 ∑= 32,70

5.2.3 Dados agrupados com intervalo de classes

EX19.

Altura (cm) - xi fi xi*fi (xi – ) fi(xi – )2

150 |------ 154 4 152 608 152-161 = - 9 4*81

154 |------ 158 9 156 1404 -5 9*25

158 |------ 162 11 160 1760 -1 11*1

162 |------ 166 8 164 1312 3 8*9

166 |------ 170 5 168 840 7 5*49

170 |------ 174 3 172 516 11 3*121

Total 40 6.440 1240

cm

Page 38: Apostila estatistica

36

5.3 Coeficiente de variação

O desvio padrão por si só não nos diz muita coisa. Assim, um desvio padrão de

duas unidades pode ser considerado pequeno para uma série de valores cujo valor

médio é 200; no entanto, se a média for igual a 20, o mesmo não pode ser dito. Além

disso, o fato de o desvio padrão ser expresso na mesma unidade dos dados limita o

seu emprego quando desejamos comparar duas ou mais séries de valores,

relativamente à sua dispersão ou variabilidade, quando expressas em unidades

diferentes. Para contornar essas dificuldades e limitações, podemos caracterizar a

dispersão ou variabilidade dos dados em termos relativos a seu valor médio, medida

essa denominada coeficiente de variação (CV):

EX.20 Tomemos os resultados das medidas das estaturas e dos pesos de um mesmo

grupo de indivíduos:

Temos:

Logo, nesse grupo de indivíduos, os pesos apresentam maior grau de dispersão

que as estaturas.

Ex.21 Para os dados abaixo calcule a variância e o desvio padrão

a) 1,3,5,9

b) 17,9; 22,5; 13,3; 16,8; 15,4; 14,2

c) 26, 14, 15, 19, 21, 22, 20

d) -10, -6, 2, 3, 7, 9, 10

R: a) 2,96; b) 3,016; c) 2,81; d) 7,04

Page 39: Apostila estatistica

37

Ex.22 Calcule o desvio padrão das distribuições abaixo:

(R: a) 1,51; b) 0,159)

EX.23 Dada a distribuição relativa a 100 lançamentos de 5 moedas simultaneamente

calcule o desvio padrão:

(R: 1,13)

EX.24 Calcule o desvio padrão da distribuição:

(R: 4,5)

EX.25 Calcule o desvio padrão das distribuições de freqüência abaixo:

(R: a) 2,43; b) 8,8 cm; c) R$ 229; d) 9,93 kg).

Page 40: Apostila estatistica

38

EX26. Sabendo que um conjunto de dados apresenta para média aritmética e para

desvio padrão, respectivamente, 18,3 e 1,47, calcule o coeficiente de variação.

(R:8,02%).

EX27. Em uma obra A, foram inspecionadas 150 barras de ferro e média foi 7,8 cm e o

desvio padrão, 0,80 cm. Em outra obra B, entretanto, a média foi de 7,3 cm e o desvio

padrão, 0,76. Em qual obra houve uma maior a dispersão?

(R: Obra B)

EX28. Medidas as estaturas de 1.017 indivíduos, obtivemos x = 162,2 cm e s = 8,01

cm. O peso médio desses mesmos indivíduos é 52 kg, com um desvio padrão de 2,3

kg. Esses indivíduos apresentam maior variabilidade em estatura ou em peso?

(R:estatura)

Page 41: Apostila estatistica

39

6 Correlação e Regressão

Nos métodos estatísticos precedentes consideramos sempre a existência de uma

única variável de interesse, porém vários problemas no trabalho estatístico, todavia,

envolvem muitas variáveis. Veremos agora dois métodos estatísticos para lidar com

este tipo de problema. Faremos nosso estudo com o caso mais simples em que temos

apenas duas variáveis de interesse.

6.1 Correlação linear entre duas variáveis

Avaliar se existe associação entre duas características quantitativas é objetivo de

muitos estudos em diversas áreas. Um ecologista pode estar interessado em saber, por

exemplo, se há associação entre a quantidade de chumbo medida na água e o volume

de dejetos despejados em determinado rio; um médico pode querer avaliar se a

pressão arterial está relacionada à idade das pessoas. Quando se pode demonstrar

que existe associação entre duas variáveis quantitativas, isto é, quando se constata

que elas variam juntas, diz-se que as variáveis estão correlacionadas.

Ex29. Consideremos uma amostra aleatória, formada por dez dos 98 alunos de

uma classe da faculdade A e pelas notas obtidas por eles em Matemática e Estatística:

Representando, em um sistema coordenado cartesiano ortogonal, os pares

ordenados (x, y), obtemos uma nuvem de pontos que denominamos diagrama de

Page 42: Apostila estatistica

40

dispersão. Esse diagrama nos fornece uma idéia grosseira, porém útil, da correlação

existente:

Os pontos obtidos, vistos em conjunto, formam uma elipse em diagonal. Podemos

imaginar que, quanto mais fina for a elipse, mais ela se aproximará de uma reta.

Dizemos, então, que a correlação de forma elíptica tem como "imagem" uma reta,

sendo, por isso, denominada correlação linear. É possível verificar que a cada

correlação está associada como "imagem" uma relação funcional. Por esse motivo, as

relações funcionais são chamadas relações perfeitas.

Como a correlação em estudo tem como "imagem" uma reta ascendente, ela é

chamada correlação linear positiva.

Assim, uma correlação é:

a. linear positiva se os pontos do diagrama têm como "imagem" uma reta

ascendente;

b. linear negativa se os pontos têm como "imagem" uma reta descendente;

Page 43: Apostila estatistica

41

c. não-linear se os pontos têm como "imagem" uma curva .

Se os pontos apresentam-se dispersos, não oferecendo uma "imagem" definida,

concluímos que não há relação alguma entre as variáveis em estudo .

Temos, então:

6.1.1 Coeficiente de correlação linear

O instrumento empregado para a medida da correlação linear é o coeficiente de

correlação. Esse coeficiente deve indicar o grau de intensidade da correlação entre

duas variáveis e, ainda, o sentido dessa correlação (positivo ou negativo).

Faremos uso do coeficiente de correlação de Pearson, que é dado por:

Onde n é o número de observações. Os valores limites de r são -1 e + 1, isto é, o

valor de r pertence ao intervalo [-1, +1].

Assim:

se r = + 1, há uma correlação perfeita e positiva entre as variáveis;

se r = -1, há uma correlação perfeita e negativa entre as variáveis;

se r = 0, ou não há correlação entre as variáveis, ou a relação que porventura

exista não é linear.

Page 44: Apostila estatistica

42

Para podermos tirar algumas conclusões significativas sobre o comportamento

simultâneo das variáveis analisadas, é necessário que:

0,6 ≤ I r I ≤ 1

Se 0,3 ≤ I r I ≤ 0,6, há uma correlação relativamente fraca entre as variáveis.

Se 0 < I r I < 0,3, a correlação é muito fraca e, praticamente, nada podemos

concluir sobre a relação entre as variáveis em estudo.

EX29. Vamos, então, calcular o coeficiente de correlação relativo à tabela dada.O

modo mais prático para obtermos r é abrir, na tabela, colunas correspondentes aos

valores de x.y., x2 e y2. Assim:

Resultado que indica uma correlação linear positiva altamente significativa entre as

duas variáveis.

Page 45: Apostila estatistica

43

Ex 30. Calcule o coeficiente de correlação para os valores das variáveis Xi e Yi

abaixo:

A correlação linear entre as variáveis X e Y é positiva, porém fraca.

EX31. Um grupo de pesquisadores fez uma avaliação do peso aparente de alguns

objetos. Com o peso real e a média dos pesos aparentes, dados pelo grupo, obteve-se

a tabela:

Com os dados apresentados calcule o índice de correlação:

Xi Yi Xi*Yi Xi2 Yi

2

18 10 180 324 100

30 23 690 900 529

42 33 1386 1764 1089

62 60 3720 3844 3600

73 91 6643 5329 8281

97 98 9506 9409 9604

120 159 19080 14400 25281

442 474 41205 35970 48484

Xi Yi Xi*Yi Xi2

Yi2

4 12 48 16 144

6 10 60 36 100

8 8 64 64 64

10 12 120 100 144

12 14 168 144 196

40 56 460 360 648

Page 46: Apostila estatistica

44

6.2 Regressão Linear

Sempre que desejamos estudar determinada variável em função de outra,

fazemos uma análise de regressão.

Podemos dizer que a análise de regressão tem por objetivo descrever, através de

um modelo matemático, a relação entre duas variáveis, partindo de n observações das

mesmas.

A variável sobre a qual desejamos fazer uma estimativa recebe o nome de

variável dependente e a outra recebe o nome de variável independente.

Assim, supondo X a variável independente e Y a dependente, vamos procurar

determinar o ajustamento de uma reta à relação entre essas variáveis, ou seja, vamos

obter uma função definida por:

Y = aX + b

Onde os parametros a e b podem ser obtidos pelas formula:

Exemplo: Dada a tabela abaixo:

Page 47: Apostila estatistica

45

Para traçarmos a reta no gráfico basta determinar dois pontos:

X=0 Y=0,89

X=5 Y=5,19

EX32. Com os dados abaixo faça o ajustamento de uma reta.

Xi Yi Xi*Yi Xi2

2 30 60 4

4 25 100 16

6 22 132 36

8 18 144 64

10 15 150 100

12 11 132 144

120 159 19080 14400

56 131 858 560

EX33. A tabela abaixo apresenta a produção de uma indústria:

Calcule:

a. o coeficiente de correlação;

b. a reta ajustada;

c. a produção estimada para 1989.

Page 48: Apostila estatistica

46

Xi Yi Xi*Yi Xi2 Yi

2

0 34 0 0 1156

1 36 36 1 1296

2 36 72 4 1296

3 38 114 9 1444

4 41 164 16 1681

5 42 210 25 1764

6 43 258 36 1849

7 44 308 49 1936

8 46 368 64 2116

36 360 1530 204 14538

c)

a)

b)

Page 49: Apostila estatistica

47

7 Analise combinatória

7.1 Fatorial

Seja n um número natural, tal que n2. Denomina-se fatorial de n e representado

por n! o produto de todos os números naturais de n a 1, ou seja:

Para n N e n 2,

12)...2)(1(! nnnn

Para n=1 e n=0 define-se n!=1, isto é

1!=1 e 0!=1

Na utilização da calculadora podemos observar a existência de uma tecla n!,

para a realização do cálculo fatorial. Vamos analisar alguns exemplos:

a) 12012345!5

b) 40320!567812345678!8

c) 8006283!8910!10

Em probabilidade, muitas vezes devemos calcular expressões como

, e para

calculá-la devemos recorrer a seguinte simplificação:

336678!5

!5678

!5

!8

De um modo geral, podemos escrever:

...)!2)(1()!1(! nnnnnn

Page 50: Apostila estatistica

48

7.2 Princípio fundamental da contagem – PFC

Suponhamos que uma ação seja constituída de duas etapas sucessivas. A

primeira etapa pode ser realizada de p maneiras distintas. Para cada uma dessas

possibilidades, a 2ª etapa pode ser realizada de q maneiras distintas. Então, o número

de possibilidades de se efetuar a ação completa é dado por p x q.

EX1. No Brasil as placas dos veículos são confeccionadas usando-se 3 letras do

alfabeto e 4 algarismos. Qual o número máximo de veículos que poderá ser licenciado?

Imaginemos a seguinte situação: Placa ACD – 2172.

Como o alfabeto possui 26 letras e nosso sistema numérico possui 10 algarismos

(de 0 a 9), podemos concluir que: para a 1ª posição, temos 26 alternativas, e como

pode haver repetição, para a 2ª, e 3ª também teremos 26 alternativas. Com relação

aos algarismos, concluímos facilmente que temos 10 alternativas para cada um dos 4

lugares, portanto:

26 . 26 . 26 . 10 . 10 . 10 . 10 = 175.760.000.

EX2. No sistema antigo utilizavam se 2 letras do alfabeto e 4 algarismos. Qual o

número máximo de veículos que podia ser licenciado neste sistema?

26 . 26 . 10 . 10 . 10 . 10 = 6.760.000.

Concluímos que a inclusão de apenas uma letra faz com que sejam licenciados,

aproximadamente, mais 170.000.000 de veículos.

EX3. Com os algarismos 1, 2, 3, 4, 5 e 6, quantos números de três algarismos

distintos podemos formar?

1ª escolha do algarismo das centenas: são seis possibilidades.

2ª escolha do algarismo das dezenas: como não pode haver repetição de

algarismo, devemos ter um algarismo diferente do algarismo escolhido para a centena.

Assim, há cinco possibilidades.

3ª escolha do algarismo das unidades: devemos ter um algarismo diferente dos

dois algarismos escolhidos para a centena e para a dezena. Assim, há quatro

possibilidades.

Pelo PFC, o resultado é: 6 x 5 x 4 = 120 números

Page 51: Apostila estatistica

49

EX4. Quantos números de três algarismos podemos formar com os algarismos 0,

1, 2, 3, 4, 5, 6 e 7 ?

Algarismo das centenas: com exceção do zero, qualquer um dos algarismos

dados pode ser escolhido, havendo, portanto, sete possibilidades.

Algarismo das dezenas e unidades não há restrição alguma

Logo, pelo PFC: 7 x 8 x 8 = 448.

7.3 Arranjos simples

Dado um conjunto com n elementos distintos, chama-se arranjo dos n elementos,

tomados k a k, a qualquer seqüência ordenada de k elementos distintos escolhidos

entre os n existentes.

Ex5. Dado o conjunto A = (1, 2, 3, 4), vamos escrever todos os arranjos desses

quatro elementos tomados dois a dois. A4,2

(1, 2); (1, 3); (1, 4); (2, 1); (2, 3); (2, 4); (3, 1); (3, 2); (3, 4); (4, 1); (4, 2); (4, 3).

Notamos que (2, 3) ≠ (3, 2), isto é, a troca na ordem dos elementos de um

possível agrupamento gera um agrupamento diferente.

EX6. Um cofre possui um disco marcado com os dígitos 0,1,2,...,9. O segredo do

cofre é marcado por uma seqüência de 3 dígitos distintos. Se uma pessoa tentar abrir o

cofre, quantas tentativas deverá fazer (no máximo) para conseguir abri-lo?

As seqüências serão do tipo xyz. Para a primeira posição teremos 10 alternativas,

para a segunda, 9 e para a terceira, 8. Aplicando a fórmula de arranjos pelo PFC,

chegaremos ao mesmo resultado: 10.9.8 = 720. Observe que 720 = A10,3

7.3.1 Cálculo do número de arranjos

Seja um conjunto de n elementos distintos. Vamos encontrar uma expressão para

o número de arranjos dos n elementos tomados k a k (An,k).

Page 52: Apostila estatistica

50

EX7. O quadrangular de um torneio de futebol é disputado por quatro seleções. De

quantas maneiras distintas podemos ter os três primeiros colocados?

EX8. Usando-se as 26 letras do alfabeto (A,B,C,D,...,Z), quantos arranjos distintos com

3 letras podem ser montados?

EX9. A senha de um cartão de banco é formada por duas letras distintas seguidas por

uma seqüência de três algarismos distintos. Quantas senhas poderiam ser

confeccionadas?

1° As letras A26,2 = 650

2° Os Números A10,3 = 720

Pelo PFC A26,2 x A10,3 = 650 x 720 = 468.000.

7.4 Permutações simples

De outro modo, podemos entender permutação simples como um caso especial de

arranjo, onde n = k.

EX10. Escrever todos os anagramas da palavra SOL. Um anagrama da palavra SOL é

qualquer permutação das letras S, O, L de modo que se forme uma palavra com ou

sem sentido: SOL, SLO, OSL, OLS, LOS, LSO.

Page 53: Apostila estatistica

51

7.4.1 Permutações com elementos repetidos

Se entre os n elementos de um conjunto, existem a elementos repetidos, b

elementos repetidos, c elementos repetidos e assim sucessivamente, o número total de

permutações que podemos formar é dado por:

EX11. Determine o número de anagramas da palavra MATEMÁTICA Temos 10

elementos, com repetições. A letra M está repetida duas vezes, a letra A três, a letra T,

duas vezes. Na fórmula anterior, teremos:

7.5 Combinações simples

Dado um conjunto A com n elementos distintos, chama-se combinação dos n

elementos de A, tomados k a k, a qualquer subconjunto formado por k elementos, isto

é, temos uma combinação quando os agrupamentos conseguidos permanecem iguais

ao se inverter a posição dos seus elementos.

Perceba que se houver cinco pessoas entre as quais desejamos formar grupos de

três, o grupo formado por João, Pedro e Luís é o mesmo grupo formado por Luís,

Pedro e João. Temos, então, uma COMBINAÇÃO de cinco elementos em grupos de

três.

Page 54: Apostila estatistica

52

EX12. Uma turma é formada por 10 alunos. Deseja-se formar uma comissão de

três alunos para representação discente na universidade. De quantas maneiras

podemos fazer tal escolha?

Neste caso tanto faz a posição dos três alunos no conjunto ( A, B, C); (B, A, C) ....

desde que os três sejam os escolhidos

Se fosse importante a ordem deles nos subconjunto usaríamos o Arranjo simples

Mas não nos importa a ordem então utilizaremos a combinação simples.

Ex13. Uma loja de materiais de construção oferece 15 tipos de pisos diferentes

a) De quantas maneiras se pode escolher três tipos desses pisos?

b) Suponha que certo comprador sempre opte por um piso tipo A. Como poderão

ser escolhidos os outros dois pisos?

a) Escolher os pisos {A, B, C} é o mesmo que escolher os Pisos {C, B, A}. Assim,

cada possível escolha é uma combinação dos 15 pisos tomados três a três

b) Como um dos pisos já foi definido, os outros dois serão escolhidos entre os 14

restantes.

Page 55: Apostila estatistica

53

7.6 Números Binomiais

Sejam n e p dois números naturais quaisquer e tais que n p. Denomina-se

número binomial, e indica-se por , o número assim definido:

Onde n,p N e n p, e devemos lembrar que n é o numerador e p é a classe do

número binomial , e lê-se: binomial n classe p.

Vamos calcular o seguinte exemplo, aplicando-se a expressão dada acima:

Existem também os binomiais complementares, que recebem esta

denominação, quando dois números binomiais apresentam o mesmo numerador, e a

soma de suas classes é igual a esse numerador, isto é, se n, p, q N, então:

São complementares se p+q=n.

Vamos analisar os seguintes exemplos:

Observamos que a soma: 6+9=15

Dois números binominais complementares são iguais, se n, p, q N, isto é:

p + q=n

Devemos observar como conseqüência dessa propriedade dos números

binominais complementares, a seguinte relação:

Para n, p N e np

npxoupxp

n

x

n

Page 56: Apostila estatistica

54

8 Probabilidade

A Probabilidade pode ser definida como a possibilidade ou chance de que um

evento venha a ocorrer. O estudo das probabilidades se justifica pelo fato de a maioria

dos fenômenos de que trata a Estatística serem de natureza aleatória ou probabilística.

Fenômenos onde o resultado final depende do acaso são chamados fenômenos

aleatórios ou experimentos aleatórios.

8.1 Experimentos ou fenômenos aleatórios

São aqueles que, mesmo repetidos várias vezes sob condições semelhantes,

apresentam resultados imprevisíveis.

Assim, da afirmação "é provável que o meu time ganhe a partida de hoje" pode

resultar:

a. que, apesar do favoritismo, ele perca;

b. que, como pensamos, ele ganhe;

c. que empate.

8.2 Espaço amostral

A cada experimento correspondem, em geral, vários resultados possíveis. Assim,

ao lançarmos uma moeda, há dois resultados possíveis: ocorrer cara ou ocorrer coroa.

Já ao lançarmos um dado há seis resultados possíveis: 1, 2, 3, 4, 5 ou 6.

Ao conjunto desses resultados possíveis damos o nome de espaço amostral ou

conjunto universo, representado por S.

Os dois experimentos citados anteriormente têm os seguintes espaços amostrais:

lançamento de uma moeda: S = {Ca, Co};

lançamento de um dado: S = {1, 2, 3, 4, 5, 6}.

Se lançarmos duas vezes a moeda teremos:

S = {(Ca, Ca), (Ca, Co), (Co, Ca), (Co, Co)}.

Cada elemento de S que corresponde a um resultado recebe o nome de ponto

amostral.

Page 57: Apostila estatistica

55

8.3 Eventos

Chamamos de evento qualquer subconjunto de espaço amostral S de um

experimento aleatório.

Assim, qualquer que seja E, se E C S (E está contido em S), então E é um evento

de S.

Se E = S, E é chamado evento certo;

Se E C S e E é um conjunto unitário, E é chamado evento elementar. Se

E=conjunto vazio, então é chamado evento impossível.

Ex1.

No lançamento de um dado, onde S = {1,2,3,4,5,6}, temos:

A = {2,4,6} C S; logo, A é um evento de S;

B = {1,2,3,4,5,6} C S; logo, B é um evento certo de S;

C = {4} C S; logo, C é um evento elementar de S;

D = C S; logo, D é um evento impossível de S.

8.4 Função Probabilidade

Dado um experimento aleatório, sendo S o seu espaço amostral, vamos admitir

que todos os elementos de S tenham a mesma chance de acontecer, ou seja, que S é

um conjunto equiprovável.

Chamamos de probabilidade de um evento A (A C S) o número real P(A), tal que:

n(A) é o número de elementos de A;

n(S) é o número de elementos de S.

Ex2:

a) Considerando o lançamento de uma moeda e o evento A "obter cara", temos:

S = {Ca, Co} n(S) = 2

A = {Ca) n(A ) = 1

Sn

AnAP

2

1AP

Page 58: Apostila estatistica

56

O resultado acima nos permite afirmar que, ao lançarmos uma moeda

equilibrada, temos 50% de chance de que apareça cara na face superior.

b) Considerando o lançamento de um dado, vamos calcular:

1° Probabilidade do evento A "obter um número par na face superior".

Temos:

S = {1, 2, 3, 4, 5, 6} n(S) = 6

A = {2, 4, 6} n(A) = 3

2° Probabilidade do evento B "obter um número menor ou igual a 6 na face superior" .

Temos:

S = {1, 2, 3, 4, 5, 6} n(S) = 6

B = {1, 2,3, 4, 5, 6} n(B) = 6

8.5 Eventos complementares

Sabemos que um evento pode ocorrer ou não. Sendo “p” a probabilidade de que

ele ocorra (sucesso) e “q” a probabilidade de que ele não ocorra (fracasso), para um

mesmo evento existe sempre a relação:

p + q = 1 q = 1 – p

Assim, se a probabilidade de se realizar o evento é 5

1p , a probabilidade de que

ele não ocorra é 5

4q .

8.6 Eventos independentes

Dizemos que dois eventos são independentes quando a realização ou a não-

realização de um dos eventos não afeta a probabilidade de realização do outro e vice-

versa.

Por exemplo, quando lançamos dois dados, o resultado obtido em um deles

independe do resultado obtido no outro.

2

1

6

3AP

16

6AP

Page 59: Apostila estatistica

57

Se dois eventos são independentes, a probabilidade de que eles se realizem

simultaneamente é igual ao produto das probabilidades de realização dos dois eventos.

p = p1 * p2

Ex3: Se lançamos dois dados. A probabilidade de obtermos 1 no primeiro e 5 no

segundo é ?

8.7 Eventos mutuamente exclusivos

Dizemos que dois ou mais eventos são mutuamente exclusivos quando a

realização de um exclui a realização do(s) outro(s).

Assim, no lançamento de uma moeda, o evento "tirar cara" e o evento "tirar coroa"

são mutuamente exclusivos, já que, ao se realizar um deles, o outro não se realiza.

Se dois eventos são mutuamente exclusivos, a probabilidade de que um ou outro

se realize é igual à soma das probabilidades de que cada um deles se realize:

p = p1 + p2

Ex4: Lançamos um dado. A probabilidade de se tirar o 3 ou 5 é:

8.8 Exercícios

1) No lançamento de dois dados, calcule a probabilidade de se obter soma igual a 5.

R: O evento é formado pelos elementos (1,4), (2,3), (3,2) e (4,1). Como o número de

elementos de S é 36, temos:

Page 60: Apostila estatistica

58

2) De dois baralhos de 52 cartas retiram-se, simultaneamente, uma carta do primeiro

baralho e uma carta do segundo. Qual a probabilidade de a carta do primeiro baralho

ser um rei e a do segundo ser o 5 de paus?

3)

4)

Page 61: Apostila estatistica

59

5)

6)

a) 14/16 = 7/8

b) 10/16 = 5/8

c)10/16 + 2/16 = 3/4

a) 10/16 * 9/15 = 90/ 240 = 3/8

b) = 7/8

c) 14/16 * 13/15 = 91/120

d) 6/16 * 5/15 = 1/8

Page 62: Apostila estatistica

60

9 Distribuição Binomial

Uma distribuição de probabilidade binomial resulta de um experimento que

satisfaz os seguintes requisitos:

O experimento deve ser repetido, nas mesmas condições, um número finito de

vezes (n);

As tentativas devem ser independentes, ou seja, o resultado de uma não afeta

os resultados das sucessivas;

Cada tentativa deve ter todos os resultados classificados em duas categorias

(sucesso e insucesso);

No decorrer do experimento, a probabilidade p do sucesso e a probabilidade q

(q = 1 – p) do insucesso devem permanecer constantes.

Se um experimento satisfaz esses quatro requisitos, a distribuição da variável

aleatória x é chamada de distribuição de probabilidade binomial ou (distribuição

binomial).

Em uma distribuição binomial, as probabilidades podem ser calculadas através

da fórmula da probabilidade binomial.

Onde: n = número de tentativas

k = número de sucessos em n tentativas

p = probabilidade de sucesso em qualquer tentativa

q = probabilidade de fracasso em qualquer tentativa (q = 1 – p)

Page 63: Apostila estatistica

61

Ex1. Uma moeda é lançada 5 vezes seguidas e independentes. Calcule a

probabilidade de obter 3 caras, nessas 5 provas. Para o exemplo dado temos que:

n= 5

k=3

p =

( probabilidade de obter cara – sucesso)

q =

(probabilidade de obter coroa – insucesso)

Daí:

Ex2. Dois times de futebol, A e B, jogam entre si 6 vezes. Encontre a probabilidade de

o time A ganhar 4 jogos.

n = 6

k = 4

p = 1/3 (Pode ganhar empatar ou perder)

q = 1 – 1/3 = 2/3