estatistica e probabilidade · observação: verifique que diminuímos a quantidade de valores com...

42
Estatística e Probabilidade

Upload: dinhthien

Post on 19-Jan-2019

217 views

Category:

Documents


0 download

TRANSCRIPT

Estatística e Probabilidade

Professor conteudista: Ricardo Vida

SumárioEstatística e ProbabilidadeUnidade I

1 CONCEITOS BÁSICOS .......................................................................................................................................11.1 Conceitos fundamentais ......................................................................................................................21.2 Processos estatísticos de abordagem ..............................................................................................21.3 Dados estatísticos ...................................................................................................................................31.4 Dados brutos .............................................................................................................................................4

1.4.1 Rol ....................................................................................................................................................................4

2 ORGANIZAÇÃO DE DADOS – SÉRIES ESTATÍSTICAS .............................................................................52.1 Apresentação dos dados estatísticos ..............................................................................................52.2 Variável discreta .......................................................................................................................................5

2.2.1 Construção de uma variável discreta ................................................................................................62.3 Variável contínua ....................................................................................................................................7

2.3.1 Construção de uma variável contínua ..............................................................................................7

3 REPRESENTAÇÃO GRÁFICA DAS SÉRIES ESTATÍSTICAS .................................................................... 144 MEDIDAS CENTRAIS ....................................................................................................................................... 17

4.1 Somatório ................................................................................................................................................ 174.2 Médias ....................................................................................................................................................... 184.3 Mediana (md) .......................................................................................................................................... 234.4 Moda ......................................................................................................................................................... 25

5 MEDIDAS E DISPERSÃO ................................................................................................................................ 255.1 Amplitude total ..................................................................................................................................... 255.2 Desvio médio simples ......................................................................................................................... 275.3 Variância e Desvio Padrão ................................................................................................................. 31

Unidade II

6 INTRODUÇÃO À PROBABILIDADE ............................................................................................................. 396.1 Teoria dos conjuntos, espaço amostral e eventos ................................................................... 406.2 Conceito de Probabilidade em espaços amostrais equiprováveis .................................... 536.3 Propriedades da Probabilidade ....................................................................................................... 536.4 Probabilidade Condicionada ............................................................................................................ 546.5 Eventos Independentes ...................................................................................................................... 55

7 DISTRIBUIÇÃO BINOMIAL ............................................................................................................................ 568 DISTRIBUIÇÃO DE POISSON ........................................................................................................................ 589 CORRELAÇÃO LINEAR E REGRESSÃO LINEAR ...................................................................................... 59

9.1 Correlação Linear .................................................................................................................................. 599.2 Regressão Linear ................................................................................................................................... 61

10 ESTIMATIVA DE PARÂMETROS ................................................................................................................. 6310.1 Definições .............................................................................................................................................. 6310.2 Teorema do Limite Central ............................................................................................................. 6310.3 Estimação Pontual ............................................................................................................................. 6410.4 Estimativa por Intervalos ................................................................................................................ 6410.5 Intervalo de Confiança para Médias (amostras grandes, n>30) ..................................... 6410.6 Tabela Normal ..................................................................................................................................... 6410.7 Intervalos de Confiança para Médias (amostras pequenas, n<30) ............................... 6610.8 Tabela t-Student ................................................................................................................................ 6810.9 Intervalo de Confiança para Variância e Desvio Padrão .................................................... 6910.10 Tabela da distribuição qui-quadrado .......................................................................................71

11 TESTE DE HIPÓTESE ....................................................................................................................................... 7311.1 Conceitos ............................................................................................................................................... 7311.2 Definições .............................................................................................................................................. 7411.3 Nível de Significância ....................................................................................................................... 7511.4 Teste de Hipótese para Média de População .......................................................................... 75

11.4.1 Grandes Amostras (n>30) ................................................................................................................. 75

1

ESTATÍSTICA E PROBABILIDADE

Revi

são:

Aile

en -

Dia

gram

ação

: Már

cio

- 10

/02/

11

Unidade I5

10

15

20

25

30

35

1 CONCEITOS BÁSICOS

O termo “estatística” é oriundo da palavra “Estado”, pois era usado na determinação dos dados colhidos com a finalidade de orientar as decisões quanto ao recolhimento de impostos cobrados dos cidadãos, bem como uma nova estratégia em caso de guerra. Era preciso saber o contingente disponível, a quantidade de alimentos para os soldados, assim como a de armas, ou seja, tudo o que necessário para o empreendimento.

Era registrado também o número de habitantes a partir de anotações dos nascimentos, óbitos, casamentos etc., de modo que surgiram as primeiras análises sistemáticas e as primeiras tabelas e os números relativos.

O conceito de estatística teve um desenvolvimento acelerado a partir do século XVII com os estudos de Bernoulli, Fermat, Pascal, Laplace, Gauss e outros. A forma científica se formou com Achenwall, quando surgiram tabelas mais complexas, as primeiras representações gráficas e o cálculo de probabilidades, de forma que deixou de ser uma simples tabulação de dados numéricos para se tornar um estudo direcionado a conclusões sobre um “todo” partindo da observação de apenas uma parte desse “todo”, isto é, uma “amostra”.

A estatística é, portanto, uma parte aplicada da matemática que tem como objetivo o estudo de fenômenos coletivos, a qual fornece métodos para a coleta, a organização, a descrição, a análise e a interpretação de dados de forma a utilizá-los para a tomada de decisões.

2

Unidade I

Revi

são:

Aile

en -

Dia

gram

ação

: Már

cio

- 10

/02/

11

Faz parte da Estatística Descritiva a coleta, a organização e a descrição dos dados, enquanto que a análise, a interpretação dos dados, associada a uma margem de incerteza, compõem a Estatística Indutiva, a qual fundamenta a Teoria da Probabilidade.

1.1 Conceitos fundamentais

• População: conjunto de todos os itens (pessoas ou coisas) que possuem características a serem observadas que sejam de interesse ao estudo de um fenômeno coletivo;

• Amostra: qualquer subconjunto não vazio de uma população;

• Parâmetro: característica numérica adotada para toda a população. Exemplo: verificar a estatura média dos alunos do segundo grau de uma cidade (população) considerando-se duas escolas (amostra) de forma que se considere a predominação da estatura de 1,70 m (parâmetro).

1.2 Processos estatísticos de abordagem

Quando é solicitado o estudo de um fenômeno coletivo podemos optar entre dois processos estatísticos:

1. Censo: avaliação direta de um parâmetro utilizando a coleta de dados de toda a população;

Propriedades:

• Erro processual zero e 100% de confiabilidade;

• Dispendioso;

• Lento;

• Com a demora no processo, ao terminar se torna desatualizado;

• Em cada caso é necessário avaliar sua viabilidade.

3

ESTATÍSTICA E PROBABILIDADE

Revi

são:

Aile

en -

Dia

gram

ação

: Már

cio

- 10

/02/

11

2. Estimação: avaliação indireta de um parâmetro com base em um estimador deduzido por meio do cálculo de probabilidades.

Propriedades:

• Erro processual positivo e confiabilidade inferior a 100%;

• Baixo custo;

• Rápida;

• Dados atualizados ao término do processo em razão de sua rapidez;

• É sempre viável.

1.3 Dados estatísticos

A Estatística descritiva na função da descrição dos dados tem as seguintes atribuições:

• Obtenção ou coleta de dados: realizada em uma fase operacional a partir de questionários, observação direta ou de amostra com um objetivo determinado;

• Organização dos dados obtidos: consiste na ordenação dos valores observados e sua crítica quanto à correção dos valores, das falhas humanas, de omissões e dados duvidosos;

• Redução dos dados: necessária para a compreensão de grande quantidade de dados por meio de simples leitura de valores individuais. A Estatística Descritiva apresenta duas formas básicas de redução do volume de dados: variável discreta e variável contínua.

• Representação dos dados: os dados estatísticos podem ser facilmente compreendidos quando apresentados por meio de gráficos que permitem a

4

Unidade I

Revi

são:

Aile

en -

Dia

gram

ação

: Már

cio

- 10

/02/

11

visualização instantânea e que se tornam importantes ferramentas de trabalho.

1.4 Dados brutos

Quando fazemos observações diretas de um fenômeno coletivo ou coletamos as respostas de um questionário, obtemos uma sequência de valores numéricos. No primeiro momento em que são coletados, estes dados estão completamente desordenados de forma que podemos definir os dados brutos como uma sequência de valores numéricos não organizados, obtidos diretamente da observação de um fenômeno coletivo.

1.4.1 Rol

Depois de coletar os dados que estão totalmente desordenados e ao ordená-los na forma crescente ou decrescente, esses dados passam a se chamar Rol. Portanto podemos definir o Rol como uma sequência ordenada dos dados brutos.

Observação: após os dados brutos serem organizados em um Rol é que serão tabelados na forma de variável discreta ou contínua.

Exemplo:

Foram medidos vários troncos de árvores em um parque e obtidos os seguintes valores em metros:

X: 4,3; 3,8; 3,2; 3,9; 4,5; 5,4 (dados brutos)

ou

X: 3,2; 3,8; 3,9; 4,3; 4,5; 5,4 (Rol)

5

ESTATÍSTICA E PROBABILIDADE

Revi

são:

Aile

en -

Dia

gram

ação

: Már

cio

- 10

/02/

11

2 ORGANIZAÇÃO DE DADOS – SÉRIES ESTATÍSTICAS

2.1 Apresentação dos dados estatísticos

Quando trabalhamos com dados estatísticos, lidamos com uma grande quantidade de dados. Embora um dos objetivos da estatística descritiva seja reduzir significativamente a quantidade dos dados coletados, para fins didáticos trabalharemos com quantidades reduzidas para facilitar o entendimento.

Tomemos como exemplo as notas de uma avaliação em um grupo de 20 alunos.

Os dados brutos são:

X: 3,5; 4,0; 4,5; 5,0; 7,0; 6,5; 8,0; 3,5; 6,5; 8,0 9,0; 4,5; 5,5; 6,5; 7,0; 8,0; 8,0; 4,5; 6,5; 5,0 (dados brutos)

ou

X: 3,5; 3,5; 4,0; 4,5; 4,5; 4,5; 5,0; 5,0; 5,5; 6,5; 6,5; 6,5; 6,5; 7,0; 7,0; 8,0; 8,0; 8,0; 8,0; 9,0 (Rol)

Observe que há poucos valores diferentes apresentados na lista. Desta forma poderemos contar o número de vezes que os números se repetem na lista, fenômeno este chamado frequência simples.

Quando há poucos valores diferentes na lista podemos agrupá-los no que chamamos de variável discreta.

2.2 Variável discreta

É uma representação tabular de um conjunto de valores dos quais são poucos os valores distintos, isto é, são poucos a representar.

6

Unidade I

Revi

são:

Aile

en -

Dia

gram

ação

: Már

cio

- 10

/02/

11

Monta-se uma tabela em que se aponta cada um dos diferentes valores e associado a ele a quantidade de vezes que se repete.

Tomando como exemplo esta distribuição, teremos:

xi 3,5 4,0 4,5 5,0 5,5 6,5 7,0 8,0 9,0

fi 2 1 2 2 1 4 2 3 1

Neste caso, xi é o valor obtido e fi é a quantidade de vezes em que ele aparece.

Importante

Devemos optar por uma distribuição na forma de variável discreta quando o número de elementos distintos da série for pequeno.

2.2.1 Construção de uma variável discreta

É bastante simples. Após construir o Rol da distribuição, coloque em uma coluna os elementos distintos – que denominamos xi – e, em outra coluna, associado ao valor, a quantidade de vezes que esses valores aparecem na sequência – o que denominamos fi.

Exemplo:

Considere o número de peças defeituosas produzidas na linha de montagem de uma indústria metalúrgica durante 20 dias de trabalho, representadas na série a seguir.

X: 0,2,0,1,1,3,0,0,0,0,1,0,1,2,0,3,2,1,2,0

ou

X: 0,0,0,0,0,0,0,0,0,1,1,1,1,1,2,2,2,2,3,3

7

ESTATÍSTICA E PROBABILIDADE

Revi

são:

Aile

en -

Dia

gram

ação

: Már

cio

- 10

/02/

11

Temos nove vezes o valor “0”, cinco vezes o valor “1”, quatro vezes o valor “2” e duas vezes o valor “3”.

xi 0 1 2 3

fi 9 5 4 2

Observação: verifique que diminuímos a quantidade de valores com que trabalharemos, de 20 para 8.

2.3 Variável contínua

É uma representação tabular de um conjunto de valores dentre os quais há muitos valores distintos, de modo que ficará difícil a redução dos valores a representar.

Assim, monta-se uma tabela em que são apontados cada um dos diferentes valores dentro de uma faixa considerada, associando-se a quantidade compreendida nessa faixa.

Exemplo:

Classe Intervalo de classe fi

1 41 |------ 45 5

2 45 |------ 49 1

3 49 |------ 53 6

4 53 |------ 57 19

5 57 |------ 61 12

6 61 |------ 64 10

7 64 |------ 69 3

8 69 |------ 73 4

Σ = 60

2.3.1 Construção de uma variável contínua

Realizar a construção da variável contínua requer o conhecimento de alguns conceitos. Vejamos:

8

Unidade I

Revi

são:

Aile

en -

Dia

gram

ação

: Már

cio

- 10

/02/

11

• Classe: são os intervalos de variação da variável. São numeradas seqüencialmente por números inteiros;

• Limites da classe: são os extremos de classe. O menor número é o limite inferior e o maior é o limite superior. O símbolo “|----“ representa um intervalo fechado à esquerda e um aberto à direita.

• Amplitude: é a amplitude do intervalo da classe. É obtida subtraindo-se o limite superior do limite inferior. Importante saber que na distribuição da frequência a amplitude é igual para todas as classes.

• Temos que considerar também a amplitude total da distribuição, que é a diferença entre o limite superior da última classe e o limite inferior da primeira. A amplitude total da amostra (Rol) é a diferença entre o valor máximo e o mínimo da amostra.

• Ponto médio da classe: é o valor que divide a classe em duas partes iguais. Obtém-se calculando a média aritmética entre os extremos de cada classe.

Importante

Devemos optar por uma distribuição na forma de variável contínua quando for grande o número de elementos distintos da série.

Para montar uma tabela de uma distribuição com variável contínua devemos seguir alguns passos ou critérios.

1. Determinar o número de classes

O número de classes a ser utilizado depende muito do pesquisador e também das questões que pretende responder.

9

ESTATÍSTICA E PROBABILIDADE

Revi

são:

Aile

en -

Dia

gram

ação

: Már

cio

- 10

/02/

11

Para responder essa questão em nossos exemplos utilizaremos o método da raiz. Sendo “n” o número de elementos e “k” o número de classes que será utilizado, o critério da raiz temos:

k n=

Entretanto, o valor obtido para “k” não será necessariamente um número inteiro. Por isso devemos tomar o valor inteiro obtido e também o seu antecessor e sucessor.

Exemplo:

Se tivermos n=30, teremos k = =30 5 477, .

Consideraremos para k os valores 4, 5 e 6. O valor escolhido dependerá de outra análise quando, para isso, considerarmos o intervalo para a amplitude total da distribuição.

2. Determinar a amplitude da classe

Depois de determinarmos “k”, que é a quantidade de classes, devemos determinar “h”, que é a amplitude da classe a qual será definida por

hAk

t=

em que At é a amplitude total da distribuição, valor que é diferente da amplitude total da amostra.

Exemplo: se tivermos uma distribuição cuja At = 8,

para k = 4, h = =84

2

para k = 5, h = =85

16,

para k = 6, h = =86

1333, ...

10

Unidade I

Revi

são:

Aile

en -

Dia

gram

ação

: Már

cio

- 10

/02/

11

Portanto, o valor mais indicado para “k” é o valor “4”, que determinará a amplitude da classe “h” igual a “2”.

Exemplo:

Consideraremos uma distribuição em que são tomadas as medidas, em centímetros, da altura de 28 alunos de uma escola.

Os valores obtidos são:

78 76 84 63 86 81 97

71 73 101 91 88 76 100

78 80 65 78 69 80 102

74 88 90 71 95 81 98

(dados brutos)

ou

63 65 69 71 71 73 74

76 76 78 78 78 80 80

81 81 84 86 88 88 90

91 95 97 98 100 101 102

(Rol)

No primeiro passo fizemos a ordenação dos dados obtidos criando o Rol dos valores. Entretanto isto não é necessário no primeiro momento. Basta localizar o menor e o maior valor da série para determinarmos a amplitude da amostra.

11

ESTATÍSTICA E PROBABILIDADE

Revi

são:

Aile

en -

Dia

gram

ação

: Már

cio

- 10

/02/

11

Sendo n = 28, pois temos setenta medidas, o passo seguinte é determinar a amplitude de cada classe.

Primeiramente necessitamos determinar a quantidade “k” de classes.

n k= → =28 28 5 29,

Isso nos leva às seguintes possibilidades:

k

k

k

===

4

5

6

Isto é, podemos ter 4, 5 ou 6 classes. Precisamos determinar a melhor opção.

A amplitude da amostra é:

Menor valor → x1=63

Maior valor → x28=102

A=x28–x1=102–63=39

A amplitude da classe fica:

hAk

=

Portanto, poderemos ter:

h = =394

9 75,

h = =395

7 8,

h = =396

6 5,

12

Unidade I

Revi

são:

Aile

en -

Dia

gram

ação

: Már

cio

- 10

/02/

11

Como nenhum dos valores apresenta como quociente um valor inteiro, são necessários alguns acertos.

Importante

Podemos acertar a amplitude total da distribuição para um intervalo, sempre maior que a amplitude da amostra, e nunca menor.

A leitura dos valores tem como valor menor “63” e o maior “102”. A diferença entre eles é de “102–63=39”, que não propicia um resultado exato quando dividido pelas três possibilidades do valor adotado para “k”.

Neste momento temos que acertar o limite do intervalo da distribuição atribuindo novos valores para os extremos e respeitando os valores obtidos.

Em suma, devemos considerar para a amplitude da distribuição um valor inferior a “61” e superior a “103”, de modo que nenhum dos valores medidos em campo fique fora dos cálculos posteriores.

Fazendo uma análise aritmética verificamos que, ao adotarmos o valor inferior da distribuição para x1=61 e superior para x28=103, teremos:

At=103–61=42

e as possibilidades para a amplitude da classe:

h = =424

10 5,

h = =425

8 4,

h = =426

7

13

ESTATÍSTICA E PROBABILIDADE

Revi

são:

Aile

en -

Dia

gram

ação

: Már

cio

- 10

/02/

11

Como a classe deve ser um número inteiro, a melhor possibilidade é que tenhamos “h =7”, porque teremos “6” classes distintas no intervalo.

É importante rever os valores obtidos e considerados.

Na apresentação dos valores temos que o menor é “63” e o maior, “102”, com “28” leituras. Isto nos leva à amplitude da amostra A=103–61=42, que não propiciará uma divisão exata quando dividida pelas possibilidades da quantidade de classes, que são “4, 5 e 6”.

Para “acertarmos os intervalos” provocamos uma alteração na amplitude total da amostra (Rol), no intuito de obtermos valores inteiros.

Colocando o valor menor da distribuição em x1=61 e x28=103, a amplitude total será:

At=x28–x1=103–61=42

para n=6 teremos:

h = =426

7

Assim, teremos “6” classes com intervalo “h =7”.

É importante ressaltar que o símbolo “|------“ indica que temos um intervalo fechado à esquerda e aberto à direita. Trocando em miúdos, na segunda classe incluímos o valor “68” e não o “75” que pertence à classe seguinte.

Então, organizando o Rol com os valores desses intervalos, temos:

14

Unidade I

Revi

são:

Aile

en -

Dia

gram

ação

: Már

cio

- 10

/02/

11

Classes

1ª → 63 652ª → 69 71 71 73 743ª → 76 76 78 78 78 80 80 81 814ª → 84 86 88 885ª → 90 91 956ª → 97 98 100 101 102

Temos, então, 2 elementos na primeira classe, 4 na segunda, 9 na terceira e, seguindo assim, teremos 3 na oitava.

Colocando em uma tabela, teremos:

classe Intervalo de classe fi

1 661 |------ 668 2

2 668 |------ 175 5

3 775 |------ 882 9

4 882 |------ 889 4

5 889 |------ 996 3

6 996 |------ 1103 5

Resumindo: com a análise desta tabela, notamos que na primeira classe, onde o intervalo é entre 61 e 68, temos apenas dois elementos. Na segunda classe, onde o intervalo é entre 68 e 75, temos 5 elementos. Na sexta classe, onde há o intervalo de 93 a 103, temos 5 elementos. A quantidade de elemento por classe é a frequência absoluta.

3 REPRESENTAÇÃO GRÁFICA DAS SÉRIES ESTATÍSTICAS

Graficamente podemos representar uma série estatística de varias maneiras. Dentre elas podemos citar o gráfico de linhas, de colunas, de setores etc.

15

ESTATÍSTICA E PROBABILIDADE

Revi

são:

Aile

en -

Dia

gram

ação

: Már

cio

- 10

/02/

11

xi fi

0 4

3 2

4 3

6 8

7 4

8 1

9 2

A partir de uma distribuição como esta, podemos gerar:

• um gráfico de colunas;

109876543210

1 2 3 4 5 6 7 8

xi

fi

• um gráfico de barras;

1

xi

fi

2

3

4

5

6

7

8

0 2 4 6 8 10

16

Unidade I

Revi

são:

Aile

en -

Dia

gram

ação

: Már

cio

- 10

/02/

11

• um gráfico de setores;

1

234

56

xi

No gráfico de setores podemos também indicar o percentual da frequência de cada valor obtido em relação a toda a amostragem.

6

54

3

21

xi

Além desses gráficos, que são os mais comuns, também podemos utilizar várias outras maneiras diferentes de representar séries estatísticas. como gráficos de linhas, bolhas e vários outros, cada um adequado para cada questão.

17

ESTATÍSTICA E PROBABILIDADE

Revi

são:

Aile

en -

Dia

gram

ação

: Már

cio

- 10

/02/

11

4 MEDIDAS CENTRAIS

Quando um conjunto de dados é agrupado definem-se medidas que, através de um só número, apresentam suas características. Algumas descrevem a tendência central, isto é, a tendência que esses dados têm de se agrupar em torno de certos valores. É uma medida que estabelece um número ou valor em torno do qual a série se concentra. Divide a série em duas partes iguais.

4.1 Somatório

Quando somamos varias parcelas que têm a mesma característica, representa-se esta soma de “n” valores de uma série, codificando-as conforme a expressão:

x x x x xn ii

n

1 2 31

+ + + + ==∑...

Nesta expressão, “xi” representa uma parcela genérica (termo que consta de todas as parcelas) e “i” é o índice.

Lê-se: somatório dos valores de “xi”, para “i” variando de “1” até “n”.

Exemplo:

x x x x x xii

1 2 3 4 51

5

+ + + + ==∑

x x x x xii

1 2 3 4

1

4

+ + + ==∑

( ) ( ) ( ) ( )x x x xii

i1

12

23

3

1

3

4 4 4 4− + − + − = −=∑

18

Unidade I

Revi

são:

Aile

en -

Dia

gram

ação

: Már

cio

- 10

/02/

11

Propriedades:

1. ( )x y x yi ii

n

i ii

n

i

n

± = ±= ==∑ ∑∑

1 11

2. k x k xi ii

n

i

n

. .===∑∑

11

3.xk k

x

x

ki

i

ii

n

i

n

i

n

= = =

==

∑∑∑ 1 1

11

Obs.: podemos também encontrar a notação: x xi ii

n

= ∑∑=1

4.2 Médias

É a medida ou valor que se obtém segundo uma regra estabelecida e é equidistante dos valores extremos de uma série estatística. Temos também as médias proporcional e quadrática, mas veremos apenas as que estão a seguir.

Média aritmética simples

É dada pelo quociente entre a soma dos elementos da série pela quantidade de elementos que compõem esta série.

É dada pela fórmula:

x

x

n

ii

n

= =∑

1

para dados brutos ou rol.

19

ESTATÍSTICA E PROBABILIDADE

Revi

são:

Aile

en -

Dia

gram

ação

: Már

cio

- 10

/02/

11

Exemplo:

Dados os valores 3, 0, 4, 6, 8, 9,12, 7:

x

xii= = + + + + + + + = ==∑

1

8

80 3 4 6 7 8 9 12

8498

6 13,

Média aritmética ponderada

É uma média em que a sequência numérica depende dos “pesos” ou da frequência de cada valor na série.

É dada pela fórmula:

x

x f

f

i ii

n

ii

n= =

=

.1

1

Observe que a fórmula é a mesma já vista. Ocorre que, quando termos vários valores que se repetem, a frequência corresponde ao número de vezes que esta repete. Assim, ao multiplicarmos um valor pela sua frequência, estamos fazendo nada mais do que somá-lo pelo número de vezes que se repete. Também o somatório das frequências nada mais é do que a quantidade de elementos da série.

Usa-se tanto para distribuições na forma de variável discreta quanto contínua.

20

Unidade I

Revi

são:

Aile

en -

Dia

gram

ação

: Már

cio

- 10

/02/

11

Exemplo: (variável discreta)

Dada a distribuição:

I xi fi xi.fi

1 0 4 0

2 3 2 6

3 4 3 12

4 6 8 48

5 7 4 28

6 8 1 8

7 9 3 27

8 12 6 72

Σ = 31 Σ = 201

x

x f

f

i ii

ii

= = + + + + + + ++ + +

=

=

.. . . . . . . .1

8

1

80 4 3 2 4 3 6 8 7 4 8 1 9 3 12 6

2 4 3 88 1 3 6 420131

6 48+ + + +

= = ,

Exemplo: (variável contínua)

Quando os dados são apresentados na forma de uma variável contínua, utilizamos a fórmula da média aritmética ponderada considerando as frequências simples das classes. Entretanto, como temos uma faixa de valores, o valor de xi é o ponto médio da classe e determinado pela média aritmética dos extremos de cada classe.

xL L

i =+sup inf

2

21

ESTATÍSTICA E PROBABILIDADE

Revi

são:

Aile

en -

Dia

gram

ação

: Már

cio

- 10

/02/

11

Exemplo:

Considerando a distribuição:

Classe intervalo de classe fi xi xi.fi

1 60 |------ 70 1 65 65

2 70 |------ 80 5 75 375

3 80 |------ 90 6 85 510

4 90 |------ 100 10 95 950

5 100 |------ 110 12 105 1260

6 110 |------ 120 19 115 2185

7 120 |------ 130 14 125 1750

8 130 |------ 140 3 135 405

Σ = 70 Σ = 7500

Temos

x

x f

f

i ii

n

ii

n= =

=

.1

1

Então

x = =750070

107 14,

Importante

Sempre que tivermos uma tabela na forma de variável contínua, o valor de xi deverá ser considerado como o ponto médio do intervalo da classe.

22

Unidade I

Revi

são:

Aile

en -

Dia

gram

ação

: Már

cio

- 10

/02/

11

Média geométrica simples

Em uma sequência numérica simples, a média geométrica simples é definida pela fórmula:

x x x x xg nn= 1 2 3. . ...

Exemplo:

Dados os valores 3, 1, 4, 6, 8, 9,12, 7:

i 1 2 3 4 5 6 7 8

xi 1 3 4 6 8 7 9 12

xg = = =1 3 4 6 7 8 9 12 435456 5 0688 8. . . . . . . ,

Média geométrica ponderada

Em uma sequência numérica na qual há “pesos”, considera-se a frequência com que ocorrem os valores. A média geométrica ponderada é dada por:

x x x xgf f

nfnfi= ∑

11

22. ...

De forma análoga, quando um valor se repete, o produto dele por ele mesmo na frequência que se repete é igual à potência desse valor elevado à sua frequência.

Exemplo: (variável discreta)

Dada a distribuição:

i xi fi

1 1 4

2 3 2

3 4 3

4 6 8

5 8 1

Σfi= 18

23

ESTATÍSTICA E PROBABILIDADE

Revi

são:

Aile

en -

Dia

gram

ação

: Már

cio

- 10

/02/

11

Temos:

xg = =1 3 4 6 8 3 544 2 3 8 118 . . . . ,

Exemplo: (variável contínua)

Dada a distribuição:

classe intervalo de classe fi xi

1 2 |------ 4 1 3

2 4 |------ 6 5 5

3 6 |------ 8 6 7

4 8 |------ 10 4 9

5 10 |------ 12 5 11

6 12 |------ 14 4 13

7 14 |------ 16 3 15

8 16 |------ 18 3 17

Σ fi= 31

xg = =3 5 7 9 11 13 15 17 9 101 5 6 4 5 4 3 331 . . . . . . . ,

4.3 Mediana (md)

A mediana é um elemento da série que a divide em duas partes com a mesma quantidade de elementos.

Cálculo da Mediana

Primeiramente devemos ordenar os elementos da série e obter o Rol. Em seguida, determinar “n”, ou seja, o número de elementos da série.

Se “n” for ímpar, o Rol admite apenas um termo central que ocupa a posição ( )”

n +12

. O valor do elemento que ocupa essa posição é a mediana.

24

Unidade I

Revi

são:

Aile

en -

Dia

gram

ação

: Már

cio

- 10

/02/

11

Exemplo:

X: 3,4,6,7,9,10,12

A série tem 7 elementos. Portanto o termo que ocupa a posição ( )”

7 12+ , isto é, o 4º elemento, é a mediana.

posição 1ª 2ª 3ª 4ª 5ª 6ª 7ª

valor 3 4 6 7 9 10 12

Assim, md = 7

Se “n” for par, o Rol admite dois termos na posição central. Serão os valores que ocuparem as posições ( )“

n2

e ( )“n2

1+ . A mediana é, então, por convenção, a média aritmética (ou o ponto médio) dos valores que ocupam a posição central.

Exemplo:

Dada a distribuição:

X: 6,13,15,18,22,25

Como temos “n = 6” elementos, as posições centrais são:

n2

62

3= = ª e n2

162

1 4+ = + = ª

a3 = 15 e a4 = 18

Portanto,

md = + =15 182

16 5,

25

ESTATÍSTICA E PROBABILIDADE

Revi

são:

Aile

en -

Dia

gram

ação

: Már

cio

- 10

/02/

11

4.4 Moda

A Moda é o valor que aparece com maior frequência no conjunto de dados. Basta identificar o elemento que aparece com maior frequência.

Exemplo:

X: 3, 4, 3, 3, 4, 5, 6, 8

Nesta distribuição, o elemento que aparece o maior número de vezes é o “3”.

Portanto, mo = 3

5 MEDIDAS E DISPERSÃO

São medidas que avaliam a representatividade da média.

As medidas de dispersão absoluta são: amplitude total, desvio médio simples, variância e desvio padrão.

5.1 Amplitude total

É a única medida de dispersão que não tem na média o seu valor de referência. É obtida pela diferença entre o maior e menor valor da sequência.

Dados brutos ou Rol

Basta identificar o maior e o menor valor da série e calcular a diferença.

Exemplo:

X: 7, 8, 10, 12, 15 At = 15 – 7 = 8

26

Unidade I

Revi

são:

Aile

en -

Dia

gram

ação

: Már

cio

- 10

/02/

11

Variável discreta

Como os valores já se apresentam de forma ordenada também basta identificar o primeiro e o último valor da série.

Exemplo:

Dada a distribuição:

i xi fi

1 0 4

2 3 2

3 4 3

4 6 8

5 7 4

6 8 1

7 9 2

Σ= 24

A amplitude total é:

At = x7 – x1 = 9 – 0 = 9

Variável contínua

Nesta situação, embora os elementos já se apresentem em forma ordenada, desconhecemos o menor e maior valores porque estão compreendidos entre o intervalo de cada classe.

Consideramos então os pontos médios dos intervalos de cada classe.

27

ESTATÍSTICA E PROBABILIDADE

Revi

são:

Aile

en -

Dia

gram

ação

: Már

cio

- 10

/02/

11

Exemplo:

Dada a distribuição

classe intervalo de classe fi

1 60 |------ 70 1

2 70 |------ 80 5

3 80 |------ 90 6

4 90 |------ 100 10

5 100 |------ 110 12

6 110 |------ 120 19

7 120 |------ 130 14

8 130 |------ 140 3

Σ = 70

Os pontos médios da primeira e oitava classe são:

Inferior = + =60 702

65 Superior = + =130 1402

135

Portanto, a amplitude total é At=135+65=70

5.2 Desvio médio simples

Está baseado no conceito matemático ligado à distância, isto é, à dispersão dos dados em relação à média de uma sequência. Esta é avaliada por meio dos desvios de cada elemento da sequência, em valor absoluto, em relação ao valor médio da sequência.

O desvio médio simples é definido como a média aritmética entre os desvios de cada elemento em relação à média da série.

DMSx x

ni=−∑

28

Unidade I

Revi

são:

Aile

en -

Dia

gram

ação

: Már

cio

- 10

/02/

11

Dados brutos ou Rol

Calcula-se a média aritmética entre os valores da sequência e em seguida o desvio, em valor absoluto, de cada valor da sequência em relação ao valor obtido.

O passo seguinte é calcular a média aritmética desses valores.

Exemplo:

Dada a sequência

X: 2, 8, 3, 6 ou X: 2, 3, 6, 8 x = + + + = =2 8 3 64

194

4 75,

d1 2 4 75 2 75= − =, ,

d2 3 4 75 175= − =, ,

d3 6 4 75 175= − =, ,

d4 8 4 75 3 25= − =, ,

DMS = + + + = =2 75 175 175 3 254

94

2 25, , , ,

,

Variável discreta

Quando temos uma sequência apresentada na forma de variável discreta, os dados já vêm ordenados e a frequência representa o número de vezes que o elemento figura na série. Portanto temos valores de desvios que se repetem o que nos levará ao cálculo de uma média aritmética ponderada.

29

ESTATÍSTICA E PROBABILIDADE

Revi

são:

Aile

en -

Dia

gram

ação

: Már

cio

- 10

/02/

11

Portanto, calculamos:

DMSx x f

fi i

i=

−∑∑

.

Exemplo:

Dada a distribuição

i xi fi xi.fi

1 0 4 0

2 3 2 6

3 4 3 12

4 6 8 48

5 7 4 28

6 8 1 8

7 9 2 18

Σ = 24 Σ = 120

xx f

fi i

i= = =∑

∑. 120

245

Obs.: x =xm

I xi fi xi.fi |xi – xm| |xi- xm|.fi

1 0 4 0 5 20

2 3 2 6 2 4

3 4 3 12 1 3

4 6 8 48 1 8

5 7 4 28 2 8

6 8 1 8 3 3

7 9 2 18 4 8

Σ = 24 Σ = 120 Σ = 54

30

Unidade I

Revi

são:

Aile

en -

Dia

gram

ação

: Már

cio

- 10

/02/

11

O Desvio médio simples é calculado por:

DMSx x f

fi i

i=

−= =∑

∑.

,5424

2 25

Variável contínua

Do mesmo modo que a variável discreta, os dados já vêm ordenados e a forma para calcular o desvio médio simples obedece aos mesmos critérios. A única diferença é que na variável contínua temos uma faixa de valores para classe, e não um valor definido. Para tanto, devemos, em cada classe, determinar o ponto médio.

Exemplo:

Classe intervalo de classe fi xi xi.fi

1 60 |------ 70 1 65 65

2 70 |------ 80 5 75 375

3 80 |------ 90 6 85 510

4 90 |------ 100 10 95 950

5 100 |------ 110 12 105 1260

6 110 |------ 120 19 115 2185

7 120 |------ 130 14 125 1750

8 130 |------ 140 3 135 405

Σ = 70 Σ = 7500

xx f

fi i

i= = =∑

∑.

,7500

70107 14

31

ESTATÍSTICA E PROBABILIDADE

Revi

são:

Aile

en -

Dia

gram

ação

: Már

cio

- 10

/02/

11

classe intervalo de classe fi xi xi.fi |xi- Xm| |xi- xm|.fi

1 60 |------ 70 1 65 65 42,14 42,14

2 70 |------ 80 5 75 375 32,14 160,7

3 80 |------ 90 6 85 510 22,14 132,84

4 90 |------ 100 10 95 950 12,14 121,4

5 100 |------ 110 12 105 1260 2,14 25,68

6 110 |------ 120 19 115 2185 7,86 149,34

7 120 |------ 130 14 125 1750 17,86 250,04

8 130 |------ 140 3 135 405 27,86 83,58

Σ = 70 Σ = 7500 Σ=965,72

DMSx x f

fi i

i=

−= =∑

∑. ,

,965 72

7013 75

Interpretação: o resultado obtido significa que cada elemento está, em média, 13,75 afastado de 107,14.

5.3 Variância e Desvio Padrão

Quando calculamos o desvio médio simples, utilizamos o módulo da diferença entre o valor de cada termo e a média a fim de interpretarmos a diferença como distância. Entretanto, há outra forma de obtermos as diferenças sempre positivas ou nulas, quando consideramos o quadrado dessas diferenças.

Isto é, em vez de usarmos a diferença

x xi −

usamos

x xi −( )2

32

Unidade I

Revi

são:

Aile

en -

Dia

gram

ação

: Már

cio

- 10

/02/

11

Assim, se substituirmos na fórmula do DMS a expressão x xi −( )2 , obteremos uma nova medida que chamaremos de

variância, que fica:

σ2

2

( )xx x

ni=−( )∑

A raiz desse valor é o que denominamos

σ σ( ) ( )x x= 2

Importante

Quando estivermos trabalhando com uma amostra, o valor da variância será dado por:

s xx x

ni2

2

1( )

( )=

−−

E o desvio padrão será dado por:

s x S x( ) ( )= 2

Dados brutos ou Rol

Como foi visto anteriormente, se tivermos dados brutos, a primeira coisa a fazer é formarmos o Rol.

Obtido o Rol, passamos a determinar o valor médio dos termos que constam no Rol para, em seguida, calcularmos a variância e o desvio padrão.

33

ESTATÍSTICA E PROBABILIDADE

Revi

são:

Aile

en -

Dia

gram

ação

: Már

cio

- 10

/02/

11

Exemplo:

Dada a distribuição

X: 3, 4, 5, 7, 8, 9

Temos que:

x = + + + + + = =3 4 5 7 8 96

366

6

Calculando x xi −( )2

, temos:

x x12 23 6 9−( ) = −( ) =

x x22 24 6 4−( ) = −( ) =

x x32 25 6 1−( ) = −( ) =

x x42 27 6 1−( ) = −( ) =

x x52 28 6 4−( ) = −( ) =

x x62 29 6 9−( ) = −( ) =

Então, a variância é:

σ2 9 4 1 1 4 96

286

4 66( ) ,x = + + + + + = =

34

Unidade I

Revi

são:

Aile

en -

Dia

gram

ação

: Már

cio

- 10

/02/

11

E o desvio padrão é:

σ( ) , ,x = =4 66 2 16

Variável discreta

Inicialmente temos que os dados já vêm ordenados, mas como há elementos que se repetem, definimos a variância como a média aritmética ponderada dos quadrados dos desvios dos elementos da série para com a média.

Se a variável discreta representa uma população, a variância e o desvio padrão são calculados como:

σ22

( )( ) .

xx x f

fi i

i=

−∑∑

e σ σ( ) ( )x x= 2

Se for a representação de uma amostra, então teremos:

s xx x f

fi i

i

22

1( )

( ) .=

−−

∑∑

e s x s x( ) ( )= 2

Exemplo:

I xi fi xi.fi

1 0 4 0

2 3 2 6

3 4 3 12

4 6 8 48

5 7 4 28

6 8 1 8

7 9 2 18

Σ = 24 Σ = 120

x = =12024

5

35

ESTATÍSTICA E PROBABILIDADE

Revi

são:

Aile

en -

Dia

gram

ação

: Már

cio

- 10

/02/

11

I xi fi xi.fi (xi – xm)2 (xi – xm)2.fi

1 0 4 0 25 100

2 3 2 6 4 8

3 4 3 12 1 3

4 6 8 48 1 8

5 7 4 28 4 16

6 8 1 8 9 9

7 9 2 18 16 32

Σ = 24 Σ = 120 Σ = 176

Então:

σ22

17624

7 33( )( ) .

,xx x f

fi i

i=

−= =∑

∑e

σ σ( ) ( ) , ,x x= = =2 7 33 2 70

Considerando a tabela como a representação de uma amostra, temos:

s xx x f

fi i

i

22

117623

7 65( )( ) .

,=−

−= =∑

∑e

s x x( ) ( ) , ,= = =σ2 7 65 2 76

Variável contínua

Novamente, ao desconhecer um valor particular para uma faixa de variação da classe em uma variável contínua, a exemplo

36

Unidade I

Revi

são:

Aile

en -

Dia

gram

ação

: Már

cio

- 10

/02/

11

de situações anteriores, consideramos o valor médio do intervalo de classe.

As fórmulas usadas para o cálculo da variância e do desvio padrão são as mesmas usadas para a variável discreta, levando-se em consideração o que foi dito anteriormente, isto é, para cada classe tomamos o valor médio do seu intervalo.

Exemplo:

Dada a distribuição:

Classe intervalo de classe fi xi xi.fi

1 6 |------ 8 5 7 35

2 8 |------ 10 1 9 9

3 10 |------ 12 6 11 66

4 12 |------ 14 19 13 247

5 14 |------ 16 12 15 180

6 16 |------ 18 10 17 170

7 18 |------ 20 3 19 57

8 20 |------ 22 4 21 84

Σ = 60 Σ = 848

Temos:

xx f

fi i

i= = =∑

∑.

,84860

14 13

classe intervalo de classe fi xi xi.fi (xi – xm)2 (xi – xm)2.fi

1 6 |------ 8 5 7 35 50,84 254,18

2 8 |------ 10 1 9 9 26,32 26,32

3 10 |------ 12 6 11 66 9,80 58,78

4 12 |------ 14 19 13 247 1,28 24,26

5 14 |------ 16 12 15 180 0,76 9,08

6 16 |------ 18 10 17 170 8,24 82,37

7 18 |------ 20 3 19 57 23,72 71,15

8 20 |------ 22 4 21 84 47,20 188,79

Σ = 60 Σ = 884 Σ = 714,93

37

ESTATÍSTICA E PROBABILIDADE

Revi

são:

Aile

en -

Dia

gram

ação

: Már

cio

- 10

/02/

11

Então,

σ22

714 9360

1191( )( ) . ,

,xx x f

fi i

i=

−= =∑

e

σ σ( ) ( ) , ,x x= = =2 1191 3 45

Se a distribuição se tratasse de uma amostra, teríamos:

σ22

1714 93

5912 11( )

( ) . ,,x

x x f

fi i

i=

−−

= =∑∑

e

σ σ( ) ( ) , ,x x= = =2 12 11 3 47

Importante

No cálculo da variância, elevamos ao quadrado a diferença de um valor e a média da distribuição. Portanto, a unidade de medida também deve ser elevada ao quadrado.

O valor da variância não pode ser comparado diretamente com os dados da série, isto é, a variância não tem interpretação.

Para suprir esta deficiência é que se define o desvio padrão.

Interpretação do desvio padrão

O desvio padrão é a mais importante das medidas de dispersão. Quando a curva é perfeitamente simétrica, podemos afirmar que

38

Unidade I

Revi

são:

Aile

en -

Dia

gram

ação

: Már

cio

- 10

/02/

11

o intervalo x x− + σ σ, contém aproximadamente 68% dos valores da série.

XX – σ X + σ

σ σ

x x− + 2 2. , .σ σ contém 95% dos valores.

XX – 2σ X + 2σ

σσσσ

x x− + 3 3. , .σ σ contém 99% dos valores.

XX – 3σ X + 3σ

σσσσ σσ