sumário -...

22
i

Upload: dangnga

Post on 03-Dec-2018

213 views

Category:

Documents


0 download

TRANSCRIPT

i

Sumário

1 Estatística Descritiva 1

1.1 Conceitos Básicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

1.1.1 Definições importantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

1.2 Tabelas Estatísticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2

1.2.1 Série Cronológica ou Temporal . . . . . . . . . . . . . . . . . . . . . . . . 3

1.2.2 Série Geográfica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

1.2.3 Série Específica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

1.3 Distribuição de Frequência . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

1.3.1 Construção de uma distribuição de frequência . . . . . . . . . . . . . . . . . 4

1.4 Gráficos Estatísticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

1.4.1 Histograma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

1.4.2 Polígono de Frequência . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

1.4.3 Gráfico de Linhas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

1.4.4 Gráfico de Colunas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

1.4.5 Gráfico em Barras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

1.4.6 Gráfico de Setores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

1.5 Medidas de Posição . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

1.5.1 Média Aritmética . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

1.5.2 Moda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

1.5.3 Mediana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

1.6 Medidas de Dispersão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

1.6.1 Amplitude . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

1.6.2 Desvio Médio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

1.6.3 Variância . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

1.6.4 Desvio Padrão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

1.6.5 Coeficiente de Variação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

2 Índice Remissivo 19

ii

Capítulo 1

Estatística Descritiva

OBJETIVOS DO CAPÍTULO

Ao final deste capítulo você deverá ser capaz de:

• Conhecer os conceitos básicos da estatística e, principalmente, a diferença entre popu-lação e amostra

• Construir uma tabela estatística

• Conhecer os tipos de variáveis estatísticas

• Construir um histograma

• Identificar e entender o significado dos gráficos estatísticos

• Conhecer e saber calcular as principais medidas de posição

• Conhecer e saber calcular as principais medidas de dispersão

1.1 Conceitos Básicos

A Estatística é a ciência voltada para a construção de técnicas e métodos que permitem tomar decisõesnos mais deferentes setores do conhecimento. O que hoje se conhece por Estatística, é justamenteesse conjunto de ferramentas de pesquisa que envolve, entre outros, o planejamento do experimentoa ser realizado, a coleta qualificada dos dados, os processos de inferência estatística, bem como aanálise e o processamento das informações coletadas.

1.1.1 Definições importantes

Na estatística temos algumas definições importantes:

• População: Qualquer conjunto de informação que tenha entre si uma característica comum quedelimite os elementos pertencentes a ela.

• Amostra: É um subconjunto de elementos pertencentes a uma população.

• Variável: Dados referêntes a uma característica de interesse, coletados a partir de uma amostra.

• Censo: Exame de todos os elementos da população.

1 / 20

images/descritiva/pop-amostra.eps

Figura 1.1: População e Amostra

images/descritiva/variavel.eps

Figura 1.2: Exemplo de variável

Temos dois tipos de variáveis:

Qualitativa

Nominal : sexo, cor dos olhos.

Ordinal : classe social, grau de instrução.

Quantitativa

Discreta : número de filhos.

Continua : altura, peso, salário.

1.2 Tabelas Estatísticas

Na estatística é fundamental aprendermos a representar os dados que serão analisados por meio detabelas.

Uma tabela deve apresentar a seguinte estrutura:

• Cabeçalho;

• Corpo;

• Rodapé.

O cabeçalho deve conter o suficiente para que sejam respondidas as questões:

• O que está representado?

• Onde ocorreu?

• Quando ocorreu?

Além disso, a tabela é um quadro que resume um conjunto de dados dispostos segundo linhas ecolunas de maneira sistemática.

2 / 20

1.2.1 Série Cronológica ou Temporal

Um exemplo muito comum e muito útil de tabela é dado pelas séries temporais. Uma série temporalconsiste em uma sequência numérica cujos valores variam com o tempo.

Abaixo vemos como inserir os dados de uma série temporal em uma tabela:

Vendas da Companhia Alfa: 2007-2009

Anos Vendas em R$ 1.000,002007 11.4252008 18.2582009 15.798

Fonte: Departamento de Marketing.

1.2.2 Série Geográfica

Muitas vezes o dado de interesse pode depender a posição geográfica de onde foram coletados. As-sim, uma série geográfica consiste em uma sequência numérica obtidas em diferentes regiões em umdeterminado instante do tempo.

Empresas Fiscalizadas em 2008

Regiões Número de EmpresasNorte 11.425

Nordeste 18.258Sudeste 28.157

Sul 15.798Centro-Oeste 9.236

Fonte: Mensário Estatístico.

1.2.3 Série Específica

Uma série importante é formada por dados agrupados por alguma espécie ou característica comum.Assim, uma série específica é uma série numérica agrupada por tipo. Temos o exemplo abaixo:

Matrículas na Pós-graduação da UFPB - 2008

Áreas de Ensino MatrículasCiências Biológicas 125

Ciências Exatas e Tecnologia 158Ciências Humanas 128

Fonte: Serviço de Educação e Cultura.

1.3 Distribuição de Frequência

Uma distribuição de frequência é uma tabela que contém um resumo dos dados obtido em uma amos-tra.

3 / 20

A distribuição é organizada em formato de tabela, e cada entrada da tabela contém a frequência dosdados em um determinado intervalo, ou em um grupo.

Abaixo vemos um exemplo simplificado de tabela de distribuição de frequência:

Altura dos Alunos da UFPB - 2008

Alturas em metros Número dos Alunos1,50 |− 1,60 51,60 |− 1,70 151,70 |− 1,80 171,80 |− 1,90 3

Fonte: Serviço de Saúde.

Na próxima subseção aprenderemos a construir uma distribuição de frequência completa.

1.3.1 Construção de uma distribuição de frequência

Para ilustrar como se constrói uma distribuição de frequência, nós vamos considerar um exemploespecífico.

Assim, suponha que uma pesquisa foi feita, e o seguinte conjunto de dados foi obtido:

• Dados Brutos:

24-23-22-28-35-21-23-33-34-24-21-25-36-26-22-30-32-25-26-33-34-21-31-25-31-26-25-35-33-31.

A primeira coisa que fazemos é ordenar os dados do menor para o maior, formando o rol de dados:

• Rol de dados:

21-21-21-22-22-23-23-24-25-25-25-25-26-26-26-28-30-31-31-31-32-33-33-33-34-34-34-35-35-36.

Em seguida, calculamos a amplitude total, ou seja, o maior valor obtido na amostra subtraído domenor valor obtido na amostra:

• Amplitude Total R:

R = 36−21 = 15.

Vamos agora definir as variáveis de interesse, ou seja, para cada valor distinto obtido na amostra,atribuiremos uma variável diferente:

• Variável Xi:

X1 = 21, X2 = 22, X3 = 23, X4 = 24, etc.

O próximo passo é calcular a frequência absoluta das variáveis, ou seja, vamos calcular quantas vezescada valor aparece na sequência. Por exemplo, o valor 21 aparece 3 vezes, o valor 22 aparece 2 vezes,etc.. Assim, obtemos:

• Frequência Absoluta Fi

4 / 20

F1 = 3, F2 = 2, F3 = 2, F4 = 1, etc. Vamos calcular, agora, o tamanho amostral, ou seja, onúmero de observações obtidas na amostra.

Desta forma, temos:

• Tamanho Amostral n:

n = 30.

Queremos, agora, dividir a amostra em uma quantidade de grupos que formarão os intervalos. Cadagrupo é chamado de classe, assim, queremos definir o número de classes a ser considerado na tabelade distribuição de frequência:

• Número de Classes K:

– K = 5 para n≤ 25 e K ≈√

n, para n > 25.

– Fórmula de Sturges K ≈ 1+3,22logn.

Logo, pela primeira regra temos K =√

30 ≈ 5,48 ≈ 6, e pela segunda regra K ≈ 1+ 3,22log30 ≈5,75≈ 6. Desta forma, em ambos os casos temos K = 6, que será o valor considerado.

O próximo passo é saber o comprimento de cada intervalo a ser considerado, ou seja, calcular aamplitude de cada classe. Queremos que todas as classes tenham a mesma amplitude e portanto,temos:

• Amplitude das Classes h:

h =RK.

Daí, para o nosso caso, h = 156 = 2,5≈ 3.

Vamos agora definir os limites das classes. Ou seja, definir os intervalos propriamente ditos. Paratanto, começamos com o menor valor obtido da amostra, ou equivalentemente, o primeiro valor dorol de dados, e vamos somando a amplitude para definir cada limite de intervalo:

• Limites das Classes:

21|−2424|−2727|−3030|−3333|−3636|−39

Em seguida, calculamos os pontos médios das classes, que nada mais é que a média aritmética entreos limites das classes:

• Pontos Médios das Classes pmi:

5 / 20

pm1 =21+24

2= 22,5, pm2 =

24+272

= 25,5, ,etc.

Agora, calculamos as frequências dos dados em cada intervalo e, chamada de frequência absoluta, etambém a frequência acumulada, chamada de frequência absoluta acumulada, que considera a somadas frequências dos intervalos anteriores até o intervalo considerado:

• Frequência Absoluta Acumulada Fac:

Classes pmi Fi Fac21|−24 22,5 7 724|−27 25,5 8 1527|−30 28,5 2 1730|−33 31,5 4 2133|−36 34,5 8 2936|−39 37,5 1 30

Total - 30 -

Em seguida, inclui-se as frequências relativas dos dados, ou seja, para cada intervalo calcula-se fi =Fi/n. A frequência relativa, nos informa a proporção dos dados que pertencem a um determinadointervalo.

• Frequência Relativa fi:

Classes pmi Fi Fac fi21|−24 22,5 7 7 0,2324|−27 25,5 8 15 0,2727|−30 28,5 2 17 0,0730|−33 31,5 4 21 0,1333|−36 34,5 8 29 0,2736|−39 37,5 1 30 0,03

Total - 30 - 1,00

Para finalizar, calculamos a frequência acumulada relativa, ou seja, calculamos para cada intervalofac = Fac/n:

• Frequência Relativa Acumulada fac:

Classes pmi Fi Fac fi fac21|−24 22,5 7 7 0,23 0,2324|−27 25,5 8 15 0,27 0,5027|−30 28,5 2 17 0,07 0,5730|−33 31,5 4 21 0,13 0,7033|−36 34,5 8 29 0,27 0,9736|−39 37,5 1 30 0,03 1,00

Total - 30 - 1,00 -

6 / 20

1.4 Gráficos Estatísticos

1.4.1 Histograma

O histograma é uma representação gráfica da distribuição de frequência. O histograma é formadopor uma justaposição de retângulos de bases com mesmo comprimento. O comprimento da baseé justamente a amplitude do intervalo e a altura do retângulo é dada pela frequência absoluta dointervalo.

Assim, uma vez feita a distribuição de frequência, a construção do histograma é uma tarefa muitosimples.

Abaixo vemos um exemplo de histograma:

images/descritiva/histograma.eps

Figura 1.3: Histograma

1.4.2 Polígono de Frequência

O polígono de frequência é uma representação gráfica obtida após ligar os pontos médios de cadaclasse entre si. Se já tivermos um histograma, basta ligar os pontos médios das bases superiores dosretângulos.

Abaixo vemos um exemplo de polígono de frequência obtido a partir de um histograma:

images/descritiva/poligono-hist.eps

Figura 1.4: Polígono de Frequência Obtido a Partir de um Histograma

Abaixo vemos um exemplo contendo apenas o polígono de frequência:

images/descritiva/poligono.eps

Figura 1.5: Polígono de Frequência Obtido a Partir de um Histograma

1.4.3 Gráfico de Linhas

Suponha que temos duas variáveis, por exemplo, podemos ter os dados de uma série temporal, dondeuma variável seria o valor obtido, e a outra variável seria a data em que o valor foi obtido. Outrapossibilidade seria colocar dados de uma série geográfica, onde uma variável seria formada pelosdados e a outra seria a localização geográfica.

O gráfico de linhas então é formado construindo pontos no plano (a partir das duas variáveis) e, emseguida, estes pontos são ligados por segmentos de retas.

Abaixo vemos um exemplo de gráfico de linhas de uma série temporal

images/descritiva/linha.eps

Figura 1.6: Gráfico de linhas

7 / 20

1.4.4 Gráfico de Colunas

Um gráfico de colunas é formado por uma coleção de colunas, com bases de mesmo comprimento, eigualmente espaçados. O eixo horizontal do gráfico consiste das diferentes categorias consideradas, eo eixo vertical é proporcional ao valor do dado.

Abaixo vemos um exemplo de gráfico de colunas:

images/descritiva/colunas.eps

Figura 1.7: Gráfico de colunas

1.4.5 Gráfico em Barras

O gráfico em barras pode ser entendido como uma variação do gráfico de colunas. De fato, o gráficoem barras é formado por uma coleção de barras, de mesma altura e igualmente espaçadas. Entre-tanto, neste caso o eixo vertical representa as diferentes categorias consideradas e o eixo horizontal éproporcional ao valor dado.

Abaixo vemos um exemplo de gráfico em barras:

images/descritiva/barras.eps

Figura 1.8: Gráfico em barras

1.4.6 Gráfico de Setores

O gráfico de setores, que também é popularmente conhecido como gráfico pizza, é um gráfico emque um círculo é dividido em setores (que podem ser pensados como as fatias da pizza), onde cadasetor representa uma categoria considerada pelo conjunto de dados, e os ângulos dos setores sãoproporcionais aos valores dos dados em cada categoria. Assim, quanto maior o valor obtido, maiorserá o ângulo do setor (e assim, maior será a fatia da pizza).

Abaixo vemos um exemplo de gráfico de setores:

images/descritiva/pizza.eps

Figura 1.9: Gráfico de setores

1.5 Medidas de Posição

As medidas de posição são valores que representam a tendência de concentração dos dados observa-dos.

As mais importantes são as medidas de tendência central. As três medidas de tendência central maisutilizadas são: média aritmética, moda e mediana.

8 / 20

1.5.1 Média Aritmética

É um valor que representa uma característica do conjunto de dados. Essa característica é tal que asoma dos dados é preservada. A média é obtida a partir de todos os elementos da distribuição e dotamanho da amostra n.

Notação: representamos a média de um conjunto de dados por X (lê-se x barra).

Cálculo da Média Aritmética +

• Dados não agrupados (brutos) - média aritmética simples.

No caso de uma lista de dados não-agrupados, calculamos a média aritmética pela fórmula:

X =n

∑i=1

Xi

n.

Exemplo 1.1 Exemplo de cálculo de média aritmética com dados brutosConsidere os dados 2,3,7 e 8. Então, n = 4 e

X =2+3+7+8

4=

204

= 5.

• Dados agrupados - média aritmética ponderada.

No caso em que temos os dados agrupados, ou seja, sabemos a frequência de cada observação, ocálculo da média aritmética pode ser simplificado. Assim, a média aritmética pode ser cálculada pelafórmula:

X =n

∑i=1

Xi ·Fi

n.

Exemplo 1.2 Exemplo de cálculo de média aritmética ponderadaConsidere a seguinte tabela:

Tempo de Serviço (Xi) Fi Xi ·Fi4 3 126 5 308 10 80

Total 18 122

Assim, X = 12218 = 6,78.

• Dados agrupados em intervalos - média aritmética ponderada

No caso em que temos os dados agrupados em intervalos, utilizamos a média aritmética ponderada,onde os pesos são dados pelo ponto médio do intervalo. Assim, a média aritmética é calculada pelafórmula:

X =n

∑i=1

Xi · pmi

n,

9 / 20

Exemplo 1.3 Exemplo de cálculo de médias com dados agrupados em intervalosConsidere a seguinte tabela:

Anos (Xi) Fi pmi Xi · pmi0 ` 4 4 2 84 ` 8 10 6 608 ` 12 7 10 70Total 21 - 138

Assim, X = 13821 = 6,57.

1.5.2 Moda

Definimos a moda de um conjunto de dados como o valor mais frequente deste conjunto.

Notação: representamos a moda de um conjunto de dados por Mo.

Exemplo 1.4 Exemplo de modas

• 1, 2, 4, 5 e 8 - não existe valor mais frequente - não existe moda (Amodal).

• 2, 2, 3, 7 e 8 - Mo = 2 (Unimodal).

• 1, 1, 10, 5, 5, 8, 7, 2 - Mo = 1 e 5 (Bimodal).

• Dados agrupados - Neste caso, a moda é definida como “classe modal”, isto é, a classe com amaior frequencia.

Exemplo 1.5 Exemplo de cálculo de classe modalConsidere a seguinte tabela:

Tempo de Serviço (Xi) Fi4 36 58 10

Total 18Assim, Mo = 8 (F3).

• Dados agrupados em intervalos: Neste caso, utiliza-se a fórmula de Czuber:

Mo = lMo +

[h(FMo−Fant)

2FMo− (Fant +FPos)

],

onde:

• h é a amplitude intervalar,

• FMo é a frequência da classe modal,

• lMo é o limite inferior da classe modal,

• Fant é a frequência da classe anterior à classe modal,

• FPos é a frequência da classe posterior à classe modal.

10 / 20

Exemplo 1.6 Exemplo de cálculo de moda pela fórmula de CzuberConsidere a seguinte tabela:

Anos (Xi) Fi0 ` 4 44 ` 8 10

8 ` 12 7Total 21

Assim, h = 4,FMo = 10, lMo = 4,Fant = 4 e Fpos = 7. Daí

Mo = 4+[

4 · (10−4)2 ·10− (4+7)

]= 6,67.

1.5.3 Mediana

Definimos a mediana de um conjunto de dados como o valor que divide um conjunto de dados (orde-nados) em duas partes com a mesma quantidade de dados.

Notação: representamos a mediana de um conjunto de dados por Md.

O elemento mediano (EMd) aponta o local (nos dados) onde a mediana está localizada. A medianaserá o valor assumido na posição EMd.

• Dados não agrupados (brutos)

– No caso de dados brutos, se o tamanho amostral (n) é ímpar, temos que EMd = (n+1)/2.

– Note que no caso tamanho amostral é par, teremos dois valores possíveis para o elemento medi-ano: n/2 e n/2+1. Neste caso a mediana será a média dos valores assumidos nestas posições.

Exemplo 1.7 Exemplo de cálculo de mediana para dados brutos

• 1, 2, 4, 5 e 8. Como n é ímpar, temos EMd = 3, e Md = 4.

• 2, 2, 3, 7, 8 e 10. Aqui n é par, assim EMd,1 = 6/2= 3 e EMd,2 = 6/2+1= 4. Daí Md= (3+7)/2=5.

• Dados agrupados

Neste caso, olhar a frequência acumulada ajuda a encontrar a médiana.

• Caso 1: n ímpar.

11 / 20

Exemplo 1.8 Exemplo de cálculo de mediana com dados agrupados para n ímparConsidere a seguinte tabela:\vfill

Faltas (Xi) Fi Fac2 1 13 7 84 3 11

Total 11 -

Como n = 11, temos que EMd = (11+ 1)/2 = 6. Daí Md = 3. Note que a frequência acumuladaindica que nas posições de 2 até 8 temos o valor 3.

• Caso 2: n par.

Exemplo 1.9 Exemplo de cálculo de mediana com dados agrupados para n parConsidere a seguinte tabela:

Tempo de Serviço (Xi) Fi Fac4 3 36 5 88 10 18

Total 18

Neste caso n = 18, daí temos EMd,1 = 18/2 = 9 e EMd,2 = 18/2+1 = 10. Portanto Md = (8+8)/2 =8. Note, novamente, que a frequência acumulada indica que nas posições de 9 até 18 temos o valor 8.

• Dados agrupados em intervalos

Neste caso, utilizamos EMd = n/2 independentemente de n ser par ou ímpar.

A classe mediana é a primeira classe tal que Fac ≥ EMd.

Portanto, definimos a mediana pela fórmula

Md = lMd +h ·[

EMd−Fac,ant

FMd

],

onde,

• lMd é o limite inferior da classe mediana,

• h é a amplitude do intervalo,

• Fac,ant é a frequência acumulada da classe anterior à classe mediana,

• FMd é a frequência da classe mediana.

12 / 20

Exemplo 1.10 Exemplo do cálculo da mediana para dados agrupados em intervalosConsidere a seguinte tabela:

Anos (Xi) Fi Fac0 ` 4 4 44 ` 8 10 148 ` 12 7 21Total 21

Assim, EMd = 21/2 = 10,5, e desta forma temos que a segunda classe é a classe mediana. DaílMd = 4,h = 4,Fac,ant = 4 e FMd = 10. Portanto,

Md = 4+4 ·[

10,5−410

]= 6,6.

1.6 Medidas de Dispersão

• As medidas de dispersão medem o grau de variabilidade dos elementos de uma distribuição;

• O valor zero indica ausência de dispersão;

• A dispersão aumenta à medida que aumenta o valor da medida de dispersão.

Exemplo 1.11 Exemplo de motivação para as medidas de dispersãoNotas de alunos em cinco avaliações, UFPB, 2009.

Alunos Notas MédiaAntônio 5 5 5 5 5 5

João 6 4 5 4 6 5José 10 5 5 5 0 5

Pedro 10 10 5 0 0 5

Observa-se que: * As notas de Antônio não variaram;

• As notas de João variaram menos do que as notas de José;

• As notas de Pedro variaram mais do que as notas de todos os outros alunos.

Principais Medidas de Dispersão:

• Amplitude,

• Desvio Médio,

• Variância,

• Desvio Padrão,

• Coeficiente de Variação.

13 / 20

1.6.1 Amplitude

A amplitude nos fornece uma idéia do campo de variação dos elementos. Mais precisamente, elafornece a maior variação possível dos dados.

A amplitude é dada pela fórmulaA = Xmax−Xmin.

Exemplo 1.12 Exemplo de cálculo de amplitudeNo exemplo anterior:

AAntônio = 0; AJoão = 2; AJosé = 10; APedro = 10.

NotaA amplitude não mede bem a dispersão dos dados porque, usam-se apenas os valoresextremos, ao invés de utilizar todos os elementos da distribuição.

1.6.2 Desvio Médio

Desejando-se medir a dispersão dos dados em relação a média, parece interessante a análise dosdesvios em torno da média. Isto é, análise dos desvios:

di = (Xi−X).

Mas a soma de todos os desvios é igual a zero. Isto é:

n

∑i=1

di =n

∑i=1

(Xi−X) = 0.

Logo, será preciso encontrar uma maneira de se trabalhar com os desvios sem que a soma dê zero.Dessa forma, define-se o desvio médio.

• Dados não agrupados (brutos):

Neste caso, calculamos o desvio médio como:

DM =n

∑i=1

|di|n

=n

∑i=1

|Xi−X |n

.

NotaVeja que os desvios foram considerados em módulo, evitando-se assim que a soma fossenula.

• Dados agrupados:

14 / 20

DM =n

∑i=1

|di| ·Fi

n=

n

∑i=1

|Xi−X | ·Fi

n.

NotaXi representa um valor individual, no caso de uma distribuição de frequência simples, ou oponto médio da classe (pmi), no caso de uma distribuição de frequência em classes.

Importante

• O desvio médio é mais vantajoso que a amplitude, visto que leva em consideração todosos valores da distribuição.

• No entanto, não é tão frequentemente empregado, pois não apresenta propriedades ma-temáticas interessantes.

1.6.3 Variância

A variância é a medida de dispersão mais utilizada. É o quociente entre a soma dos quadrados dosdesvios e o número de elementos. Assim, temos a seguinte definição de variância populacional:

• Dados não agrupados - (brutos):

Neste caso, a variância é dada pela fórmula:

σ2 =

N

∑i=1

d2i

N=

N

∑i=1

(Xi−X)2

N.

• Dados agrupados:

Aqui, podemos utilizar a frequência para simplificar a fórmula:

σ2 =

N

∑i=1

d2i ·Fi

N=

N

∑i=1

(Xi−X)2 ·Fi

N.

Notaσ2 indica a variância populacional e lê-se sigma ao quadrado ou sigma dois. Neste caso,X e N da formúla representam a média populacional e o tamanho populacional, respectiva-mente.

Temos ainda a seguinte definição de variância amostral:

• Dados não agrupados - (brutos):

Neste caso, a fórmula é dada por

S2 =n

∑i=1

d2i

n−1=

n

∑i=1

(Xi−X)2

n−1

15 / 20

• Dados agrupados:

Podemos, novamente, utilizar as frequências para simplificar a fórmula:

S2 =n

∑i=1

d2i ·Fi

n−1=

n

∑i=1

(Xi−X)2 ·Fi

n−1.

NotaXi representa um valor individual, no caso de uma distribuição de frequência simples, ou oponto médio da classe (pmi), no caso de uma distribuição de frequência em classes.

ImportanteFórmulas práticas para os cálculos das variâncias são dadas a seguir:

σ2 =

1N

[ N

∑i=1

X2i ·Fi−

(∑Ni=1 Xi ·Fi)

2

N

]ou

S2 =1

n−1

[ n

∑i=1

X2i ·Fi−

(∑ni=1 Xi ·Fi)

2

n

]que foram obtidas por transformações nas respecitivas fórmulas originais.

1.6.4 Desvio Padrão

Temos também outra medida de dispersão, que é a raiz quadrada da variância, chamada de desviopadrão. Assim,

σ =√

σ2 é o desvio desvio padrão populacional

eS =√

S2 é o desvio desvio padrão amostral.

NotaPara o cálculo do desvio padrão deve-se primeiramente determinar o valor da variância e,em seguida, extrair a raiz quadrada desse resultado.

Exemplo 1.13 Exemplo de cálculo das medidas de dispersãoCalcular a amplitude, o desvio médio, a variância e o desvio padrão da seguinte distribuição amostral:

Xi Fi5 27 38 59 4

11 2Total 16

16 / 20

• Cálculo da amplitude:

A = Xmax−Xmin = 11−5 = 6.

• Cálculo do desvio médio:

Primeiramente é preciso do valor da média. Assim,

Xi Fi Xi ·Fi5 2 107 3 218 5 409 4 36

11 2 22Total 16 129

X =n

∑i=1

Xi ·Fi

n=

12916

= 8,06.

Para o cálculo do DM são abertas novas colunas:

Xi Fi Xi ·Fi |Xi−X |= |di| |di| ·Fi5 2 10 |5−8,06|= 3,06 6,127 3 21 |7−8,06|= 1,06 3,188 5 40 |8−8,06|= 0,06 0,309 4 36 |9−8,06|= 0,94 3,76

11 2 22 |11−8,06|= 2,94 5,88Total 16 129 - 19,24

Portanto,

DM =n

∑i=1

|di|n

=19,24

16= 1,20.

• Cálculo do variância amostral:

Observe que o cálculo será facilitado, pois sabe-se que: n = 16; ∑Xi ·Fi = 129. Resta encontrar∑X2

i ·Fi. Para tanto, uma nova coluna é considerada na tabela.

Xi Fi Xi ·Fi X2i ·Fi

5 2 10 507 3 21 1478 5 40 3209 4 36 324

11 2 22 242Total 16 129 1083

Portanto,

S2 =1

n−1

[ n

∑i=1

X2i ·Fi−

(∑ni=1 Xi ·Fi)

2

n

]=

116−1

[1083− (129)2

16

]=

115

[1083− 16641

16

]=

115

[17328−1664116

]=

68715 ·16

= 2,86.

Logo, a variância amostral S2 = 2,86.

17 / 20

• Cálculo do desvio padrão amostral:

Como S =√

S2, logo S =√

2,86 = 1,69.Dessa forma, podemos observar que a distribuição possui média 8,06. Isto é, seus valores estão emtorno de 8,06 e seu grau de concentração é de 1,2, medido pelo desvio médio e de 1,69, medido pelodesvio padrão.

1.6.5 Coeficiente de Variação

Trata-se de uma medida relativa de dispersão útil para a comparação em termos relativos do grau deconcentração em torno da média de séries distintas. É dado por

CV =SX×100.

onde, S é o desvio padrão amostral e X é a média amostral.

O coeficiente de variação é expresso em porcentagens.

Exemplo 1.14 Exemplo de cálculo do coeficiente de variaçãoNuma empresa, o salário médio dos homens é de R$ 4.000,00, com desvio padrão de R$ 1.500,00, eo das mulheres é em média de R$ 3.000,00, com um desvio padrão de R$ 1.200,00. Então:

• Para os homens:

CV =1.5004.000

×100 = 37,5%.

• Para as mulheres:

CV =1.2003.000

×100 = 40%.

Logo, podemos concluir que os salários da mulheres apresenta maior dispersão relativa do que o doshomens.

Diz-se que a distribuição possui pequena variabilidade, ou dispersão, quando o coeficiente der até10%; média dispersão quando estiver acima de 10% até 20%; e grande dispersão quando superar20%. Alguns analistas consideram:

• Baixa dispersão: CV ≤ 15%;

• Média dispersão: 15% <CV < 30%;

18 / 20

Capítulo 2

Índice Remissivo

AAbsoluta

Acumulada, 6Acumulada, 6Amostra, 1Amostral, 15Amplitude, 14Amplitude Total, 4

CCenso, 1Coeficiente de Variação, 18Contínua, 2Cronológica, 3

Dde Colunas, 8de Dispersão, 13de Linhas, 7de Setores, 8de Tendência Central, 8Desvio

Médio, 14Padrão, 16

Discreta, 2Distribuição de Frequência, 3

EElemento Mediano, 11em Barras, 8Específica, 3

FFórmula da Mediana, 12Fórmula de Czuber, 10Frequência

AbsolutaAcumulada, 6

Relativa, 6

Acumulada, 6Frequência Absoluta, 4

GGeográfica, 3Gráfico

de Colunas, 8de Linhas, 7de Setores, 8em Barras, 8Pizza, 8

HHistograma, 7

MMédia, 8Média Aritmética, 9

Ponderada, 9Médio, 14Mediana, 8, 11Medidas

de Dispersão, 13de Tendência Central, 8

Moda, 8, 10

NNominal, 2

OOrdinal, 2

PPadrão, 16Pizza, 8Polígono de Frequência, 7Ponderada, 9População, 1Populacional, 15

19 / 20

QQualitativa

Nominal, 2Ordinal, 2

QuantitativaContínua, 2Discreta, 2

RRelativa, 6

Acumulada, 6Rol de dados, 4

SSérie

Cronológica, 3Específica, 3Geográfica, 3Temporal, 3

TTabelas, 2Tamanho Amostral, 5Temporal, 3

VVariável, 1

QualitativaNominal, 2Ordinal, 2

QuantitativaContínua, 2Discreta, 2

VariânciaAmostral, 15Populacional, 15

20 / 20