Estatísticaamintas paiva
afonso
Quando trabalhamos com grandes conjuntos de dados, muitas vezes é útil organizar e resumir os dados para fornecer informações úteis e facilitar a sua visualização e seu entendimento
DISTRIBUIÇÕES DE FREQÜÊNCIA (EM CLASSE)
Introdução
168 172 170 181 169 173 164 175 182 177
176 173 170 186 183 170 168 166 169 180
175 164 181 179 172 169 174 171 178 166
183 159 168 176 188 165 172 170 166 189
172 185 168 163 188 195 182 176 174 182
Altura (em centímetros) dos atletas de um clube
É um grupamento de dados em classes, exibindo o número ou porcentagem de observações em cada classe. Uma distribuição pode ser apresentada em forma gráfica ou tabular.
ClasseIntervalo de
classeFrequência
(f i)Frequência
(f r)%1 0 |------- 2 1 2,77%2 2 |------- 4 2 5,55,%3 4 |------- 6 10 27,78%4 6 |------- 8 6 17%5 8 |------- 10 17 47,22%
36 100%
Tabela de frequência para as notas de estatística
Total
40
Número de carros
Fre
quên
cia
de r
even
dedo
res
5 10 15 20 25 30
2
4
68
1012
35
Histograma do número de carros vendido para as
revendedoras
Distribuições de frequências (em classe)
Tabelas de Frequência
“Resumo de dados em Tabelas de frequência”
O número de elementos distintos é grande, o que dificulta a análise.
Exemplo: Análise da altura da turma.
Notas (X i) Frequência (f i)0 11 02 13 14 15 96 37 38 69 7
10 4
Tabela de frequência para as notas de estatística
ClasseIntervalo de
classeFrequência
(fi)Frequência percentual
1 0 |------- 2 1 2,77%2 2 |------- 4 2 5,55,%3 4 |------- 6 10 27,78%4 6 |------- 8 6 17%5 8 |------- 10 17 47,22%
36 100%
Tabela de frequência para as notas de estatística
Total
A finalidade é agrupar dados!
Um engenheiro da área de vendas de uma montadora selecionou ao acaso, uma amostra de 40 revendedores autorizados em todo Brasil e anotou o número de unidades adquiridas por estes revendedores no mês de maio. Com estes dados, ele deseja construir um quadro de frequência.
10 15 25 21 6 23 15 21 26 329 14 19 20 32 18 16 26 24 207 18 17 28 35 22 19 39 18 21
15 18 22 20 25 28 30 16 12 20
Unidades adquiridas no mês de maio
1º PASSO: Identifique o valor máximo e o valor mínimo para calcular a amplitude.
R(intervalo total) = Max - Min = 39 - 6 = 33
Passos para a construção de uma Tabela de Frequência
2º PASSO: Escolha do número de classes ou intervalos (k).
- não existe uma regra única para a determinação do tamanho e quantidade de classes. Alguns autores afirmam que ela deve variar entre 5 e 25.
- Adotaremos o seguinte cálculo:32,640 nk
Importante: o valor de k deve ser um valor inteiro. Assim, neste caso pode ser: 6 ou 7.
3º PASSO: Determinação da amplitude do intervalo (h)
kk
Rh
33
Obs.: Como os dados coletados são números inteiros, a amplitude também deve ser um número inteiro.
Passos para a construção de uma Tabela de Frequência
Assim, o valor da amplitude (R) deve ser acrescido de duas unidades para que sua divisão pelo número de classes (k =7) seja um número inteiro.
57
3533
kk
Rh
4º PASSO: Rever os limites de classe preliminares. Aqui, o arredondamento deve ser distribuído igualmente para o limite inferior da primeira classe e o limite superior para a última classe.
ClassesIntervalo de classe
ou número de carros
Número de revendedores ou frequência
Frequência percentual
1 5 |----------- 234567 |-------- 40
Total
Tabela de frequência
10 3 7,5%
40
10 |---------- 15 3 7,5%
15 |---------- 20 11 27,5%
20 |----------25 11 27,5%
25 |----------30 6 15%
30 |----------35 4 10%
35 2 5%
100%
5º PASSO: Montagem da tabela de frequência
Passos para a construção de uma Tabela de Frequência
1 - Dados brutos
10 13 19 17 24 15 18 14 15 18 21 19 16 19 17 14 17 12 18 22
20 23 11 16
3 Proceder a contagem
10 a 13 - /// 13 a 16 - //// 16 a 19 - //// /// 19 a 22 - //// 22 a 25 - ///
4 - Fazer uma tabela de
freqüência
classe nº %
10 a 13 3 12,5 13 a 16 5 20,8 16 a 19 8 33,4 19 a 22 5 20,8 22 a 25 3 12,5
ou
5 - traçar um histograma
Fre
qüên
cia
classes
2 - Fixar intervalos de classe
1 - intervalo total= máx-min
2 -3 - k
totalervalo Amplitude
knk
int
255
Distribuições de Frequência
Exercício:
Montar uma tabela de frequência para o peso dos homens da turma de estatística.
60 58 71 62 85 65 83 6868 66 60 78 80 60 85 6975 69 60 90 68 73 59 7090 73 63 77 68 74 62 80
Tabela de pesos de uma amostra da turma de estatística
1º PASSO: Encontrar o valor máximo e o valor mínimo para calcular a amplitude.
R = Max - Min = 90 - 58 = 32
Tabela de Frequência - Exercício
2º PASSO: Escolha do número de classes ou intervalos (k).
66
3632
kk
Rh
66,532 nk Lembrando que: k deve ter um valor inteiro, este pode ser: 5 ou 6.
3º PASSO: Determinação da amplitude do intervalo (h)
Como os dados são números inteiros valor de h deve ser um valor inteiro. Iremos admitir k = 6 e somaremos 4 unidades na amplitude.
4º PASSO: Rever os limites de classe preliminares. Aqui, o arredondamento deve ser distribuído igualmente para o limite inferior da primeira classe (5856) e para o limite superior da última classe (9092).
Tabela de Frequência - Exercício
5º PASSO: Montagem da tabela de frequência:
Classes IntervalosNúmero de pessoas ou frequência
frequência percentual
(%)1 56 |------ 62 6 18,752 62 |------ 68 5 15,6253 68 |------ 74 10 31,254 74 |------ 80 4 12,55 80 |------ 86 5 15,6256 86 |------ 92 2 6,25
32 100%
Tabela de Frequência
Total
Obs.: Atenção para o cálculo da frequência.
60 58 71 62 85 65 83 6868 66 60 78 80 60 85 6975 69 60 90 68 73 59 7090 73 63 77 68 74 62 80
Tabela de pesos de uma amostra da Turma de estatística
Tabela de Frequência - Exercício
Um engenheiro de produção que atuava numa empresa de manutenção de motores de aviões, observou nos registros da empresa, que o tempo de mão-de-obra gastos na revisão completa de um motor apresentava-se na seguinte tabela de frequência:
ClassesTempo de mão de obra (horas)
Número de motores
1 0 |------ 4 12 4 |------ 8 53 8 |------ 12 104 12 |------ 16 125 16 |------ 20 4
32
Tabela de Frequência da manutenção de motores
Total
Para planejar o orçamento e a data de entrega de 5 motores, ele deseja saber o número médio de horas de mão-de-obra necessário para a revisão de cada motor.
i
ii
f
fxX
Calculando a média pela Tabela de Frequência
1º PASSO: Calcular o ponto médio de cada classe:
ClassesTempo de mão de obra (horas)
Número de motores
1 0 |------ 4 12 4 |------ 8 53 8 |------ 12 104 12 |------ 16 125 16 |------ 20 4
32
Tabela de Frequência da manutenção de motores
Total
2
6
10
14
18
iX
22
041
X
182
16205
X
2º PASSO: Realizar o somatório da multiplicação de cada ponto médio pela frequência:
ClassesTempo de mão de obra (horas)
Número de motores
1 0 |------ 4 12 4 |------ 8 53 8 |------ 12 104 12 |------ 16 125 16 |------ 20 4
32
Tabela de Frequência da manutenção de motores
2
6
10
14
18
iX ii fX
2 X1 =2
6 X5 =30
10X10 =100
14 X12 =168
18x4=72372 ii fX
Calculando a média pela Tabela de Frequência
horasf
fxX
i
ii 625,1132
372
3º PASSO: Realizar o cálculo final do valor médio pela fórmula:
Interpretação do resultado: sabendo que o tempo médio de mão-de-obra para a manutenção de cada motor é 11,625 horas, o engenheiro pode realizar os cálculos do orçamento e do prazo de entrega do serviço.
Exercício:
Uma empresa fez um levantamento da venda de seu produto em vários supermercados da região sudeste obtendo em determinado mês a tabela:
ClassesNúmero de unidades
consumidas
Nº de supermercados
(f i)1 0 |------ 1000 102 1000 |------ 2000 503 2000 |------ 3000 2004 3000 |------ 4000 3205 4000 |------ 5000 1506 5000 |------ 6000 30
Tabela de Frequência de consumo
Determine o consumo médio do produto por supermercado pesquisado.
R: 3.342,1 unidades por supermercado
Calculando a média pela Tabela de Frequência
• As tabelas de frequência serão bem utilizadas quando tivermos uma grande quantidade de dados, bastante distintos.Ex.: Diferentes medidas de eixos num lote de fabricação.
• As tabelas de frequência têm a função de condensar um conjunto de dados e servem como base para a construção de histogramas.
• Pelas tabelas de frequência também é possível calcular as medidas de tendência central e medidas de dispersão.
Conclusões sobre as Tabelas de Frequência
1- HISTOGRAMA - equivalente de uma tabela de frequência
- Gráfico que possui na sua escala horizontal os valores de dados a serem apresentados e na escala vertical, as suas freqüências;
- Utilizado para dados contínuos;
Construindo histogramas a partir de uma tabela de frequência
1º Passo: Construímos os eixos da frequência e intervalos de classe. Obs.: atenção para as escalas.
ClasseIntervalo de
classeFrequência
(fi)Frequência percentual
1 0 |------- 2 1 2,27%2 2 |------- 4 2 5,55,%3 4 |------- 6 10 27,78%4 6 |------- 8 6 17%5 8 |------- 10 17 47,22%
36 100%
Tabela de frequência para as notas de estatística
Total
Formas gráficas de apresentação de dados
Fre
quên
cia
2
4
68
10
17
Notas0 2 4 6 8 10
2º Passo: Dispomos os valores da frequência de cada classe no gráfico.
3º Passo: Dá-se um nome para o histograma
Histograma das notas de estatística
ClasseIntervalo de
classeFrequência
(fi)Frequência percentual
1 0 |------- 2 1 2,27%2 2 |------- 4 2 5,55,%3 4 |------- 6 10 27,78%4 6 |------- 8 6 17%5 8 |------- 10 17 47,22%
36 100%
Tabela de frequência para as notas de estatística
Total
Formas gráficas de apresentação de dados
Exercício: Monte o histograma para a tabela de frequência abaixo.
Número de carrosFre
quên
cia
de r
even
dedo
res
5 10 15 20 25 30
2
4
68
1012
35 40
Histograma do número de carros vendido para as
revendedoras
ClasseIntervalo de classe
ou número de carros
Número de revendedores ou frequência
Frequência percentual
1 5 |----------- 234567 |-------- 40
Total
Tabela de frequência
10 3 7,5%
40
10 |---------- 15 3 7,5%
15 |---------- 20 11 27,5%
20 |----------25 11 27,5%
25 |----------30 6 15%
30 |----------35 4 10%
35 2 5%
100%
Formas gráficas de apresentação de dados
Moda - MO
MEDIDAS DA DISTRIBUIÇÃO DE FREQÜÊNCIA
Determinação da moda num gráfico
freq
üênc
ia
classe modal
Formas gráficas de apresentação de dados
freqüência
classes
POLÍGONO DE FREQÜÊNCIA
Alternativa ao histograma polígono de freqüência
0,30
0,20
0,10
0,00 3 8 13 18 23 28 33
Formas gráficas de apresentação de dados
É um gráfico que se obtém unindo por uma poligonal os pontos correspondentes às frequências das diversas classes, centradas nos respectivos pontos médios. Para obter as interseções do polígono com o eixo, cria-se em cada extremo do histograma uma classe com frequência nula.
Moda - MO
Às vezes há dois ou mais picos de freqüência. Os dados provêm de duas ou mais populações.
Distribuição bimodal
classes modais classes modais
MEDIDAS DA DISTRIBUIÇÃO DE FREQÜÊNCIA
Formas gráficas de apresentação de dados
2 – DIAGRAMA DE PONTOS
O conjunto de dados relativos à resistência de uma argamassa modificada em uma indústria de cimento:16,85 ; 16,4 ; 17,21 ; 16,35 ; 16,52 ; 17,04 ; 16,96 ; 17,15 ; 16,59 e 16,57 .
Veja que o meio dos dados (mediana) é muito próximo de 16,8 e que os valores de resistência caem no intervalo de 16,3 a 17,2 kgf/cm2
argamassa modificada
16,0 16,5 17,0 17,5 18,0 resistência – kgf/cm2
Este diagrama é muito útil para apresentar um pequeno conjunto de dados (até aproximadamente 20 dados)
Este gráfico nos permite rapidamente e facilmente ver a localização ou a tendência central nos dados e a variabilidade
Formas gráficas de apresentação de dados
2 – DIAGRAMA DE PONTOS
É utilizado freqüentemente para comparar dois ou mais conjuntos de dados
Considere o segundo conjunto de dados de resistência de argamassa: 17,50 ; 17,63 ; 18,25 ; 18,00 ; 17,86 ; 17,75 ; 18,22 ; 17,90 ; 17,96 e 18,15 .
argamassa modificadaargamassa não modificada
16,0 16,5 17,0 17,5 18,0 18,5 resistência – kgf/cm2
Imediatamente verifica-se que a argamassa modificada apresenta resultados com valores menores de resistência
A variabilidade dentro (within) dos grupos é praticamente a mesma
Também é possível ver a freqüência dos dados
Formas gráficas de apresentação de dados
3 – DIAGRAMA DE RAMOS E FOLHAS
A tabela de freqüência e o histograma nos dá informações valiosas sobre a natureza da distribuição dos dados, mas geralmente perdemos informações sobre os mesmos
O diagrama de ramos e folhas é uma boa maneira de ter uma informação da natureza da distribuição do conjunto de dados sem perda de informação
Os dados devem conter pelo menos dois dígitos
Exemplo: O dado 257 é dividido em duas partes: a primeira parte 25 chamada de ramo (stem) é constituída pelo primeiro ou primeiro e segundo dígitos e a segunda parte 7 chamada de folha (leaf) é constituído pelo dígito restante.
É usual escolher o número de ramos entre 5 a 20
Formas gráficas apresentação de dados
Considere o conjunto de dados relativos à resistência a compressão de uma liga de alumínio
105 221 183 186 121 181 180 143 97 154 153 174 120 168 167 141 245 228 174 199 181 158 176 110 163 131 154 115 160 208 158 133 207 180 190 193 194 133 156 123 134 178 76 167 184 135 229 146 218 157 101 171 165 172
ramos folhas freqüência7 6 1
10 1 5 2
12 1 0 3 3
9 7 1
11 0 5 2
13 1 3 3 4 5 5 14 1 3 6 3
16 0 3 7 7 8 8 6
18 0 0 1 1 3 4 6 7
22 1 8 9 3
20 8 7 2
15 3 4 4 6 7 8 8 7
17 1 2 4 4 6 8 5
19 0 3 4 9 4
21 8 1
23 024 5 1
Formas gráficas apresentação de dados
4- GRÁFICO DE BARRAS / COLUNAS
• Tipo de gráfico mais utilizado quando os dados consistem em uma contagem e não em mensurações em uma escala contínua;
• São mais usados para mostrar diferenças entre categorias, regiões e etc. Os gráficos de barra também podem mostrar de que forma duas variáveis se relacionam;
Número de Empresas entrevistadas por Estado
0
10
20
30
40
SP SC RJ PE MG RS BA ES AMEstados Brasileiros
Núm
ero d
e em
pre
sas
Formas gráficas de apresentação de dados
4.1- DIAGRAMA OU GRÁFICO DE PARETO
• É um gráfico de barras para dados qualitativos, com as barras ordenadas de acordo com a frequência. A barra mais alta fica à esquerda e as barras menores na extrema direita.
50
100
Qua
ntid
ade
de
defe
itos
Per
cent
agem
A
cum
ulad
a
Revestimento inadequado
Trinca ArranhãoFina ou Grossa
Não acabada Outros
Quantidade 55 41 12 11 5 3
Percentagem 43,3 32,3 9,4 8,7 3,9 2,4Percentagem acumulada
43,3 75,6 85 93,7 97,6 100
20
40
60
80
100Gráfico de Pareto para os defeitos de lentes
Formas gráficas de apresentação de dados
5- GRÁFICO DE SETORES / TORTA OU PIZZA.
• É uma outra alternativa para o gráfico de barras, quando se pretende mostrar a composição de um total;
• O gráfico é construído dividindo os 360º graus de um círculo pela contribuição relativa de cada categoria;
Fonte: Site da Abinee - 2003.
Formas gráficas de apresentação de dados
Uma imagem vale mais do que mil palavras!
Entretanto, ao se construir qualquer tipo de gráfico, é importante:
1) que o gráfico receba um título adequado;
2) que cada um dos eixos seja rotulado e contenha uma escala sensata;
• Histogramas são utilizados para identificar o padrão de variação ao longo de um tempo ou ao longo de um fluxo;
Conclusões
Safra anual de 40 pessegueiros
11,1 12,5 32,4 7,8 21,0 16,4 11,2 22,3
4,4 6,1 27,5 32,8 18,5 16,4 15,1 6,0
10,7 15,8 25,0 18,2 12,2 12,6 4,7 23,5
14,8 22,6 16,0 19,1 7,4 9,2 10,0 26,2
3,5 16,2 14,5 3,2 8,1 12,9 19,1 13,7
O conjunto de dados abaixo, embora pequeno, não permite uma visão global da safra de pêssegos).
A distribuição de freqüência facilitará a visualização e entendimento.
Fazer a tabela de freqüência e o histograma para o conjunto de dados abaixo, onde estão relacionados os dados da safra de 40 pessegueiros.
Exercício Resolvido
Etapas para construção
1 - Determinar o intervalo total dos dados;
2 - Determinar o número K de classes;
3 - Calcular a amplitude da classe;
4 - Estabelecer limites de classes preliminares. Rever os limites, que devem tocar-se mas não intercepta-se;
5 - Relacionar os intervalos e fazer a contagem dos pontos por classe (a contagem total dever ser igual a n);
6 - Construir uma tabela de freqüências e um histograma de freqüências ou um polígono de freqüências.
Exercício Resolvido
1 - Determinar o intervalo dos dados
Maior safra é 32,8 e a menor é 3,2
2 - Determinar o número K de classes
40No caso dos pessegueiros n = 40, logo = 6,32 que pode ser arredondado para 6 ou 7
É aconselhável tomar entre 5 a 25 classes
Regra prática: K = Ajustá-la se for necessárion
adotar k = 6
intervalo é 29,632,8 – 3,2 =
Exercício Resolvido
3 - Calcular a amplitude da classe
Amplitude = intervalo / nº de classes (k)
Amplitude = 29,6 / 6 = 30/6 = 5 Amplitude = 5
Certifique-se que k vezes a amplitude é maior que o intervalo, pois, de outra forma, os valores extremos não serão incluídos;
Houve a necessidade de acrescentar 0,4 ao intervalo para que o valor desse um número inteiro. Esse valor deve ser distribuído para os limites inferiores (- 0,2) e superiores (+ 0,2).
6 * 5 = 3030 > 29,6 - ok
Exercício Resolvido
Exercício Resolvido
4 - Estabelecer limites de classes preliminares. Rever os limites, que devem tocar-se mas não interceptar-se
1ª classe ----------- limite inferior 3 limite superior = 3 + 5 = 8
Começando com o primeiro inteiro logo abaixo do menor valor do conjunto de dados.
2ª classe ----------- limite inferior 8 limite superior = 8 + 5 = 13
3ª classe ----------- limite inferior 13 limite superior = 13 + 5 = 18
6ª classe ----------- limite inferior 28 limite superior = 28 + 5 = 33
5ª classe ----------- limite inferior 23 limite superior = 23 + 5 = 28
4ª classe ----------- limite inferior 18 limite superior = 18 + 5 = 23
É importante que não ocorra lacunas na fixação das classes (deve haver uma classe para cada valor)
Considerar os intervalos como:
3 a < 8 ou 3 8 8 a < 13 ou 8 13
13 a < 18 ou 13 1 8
23 a < 28 ou 23 28
18 a < 23 ou 18 23
28 a < 33 ou 28 33
Comentários adicionais
As classes não devem interceptar-se (um valor deve pertencer a só uma classe
A amplitude é igual para todas as classes
Exercício Resolvido
conjunto de dados ordenados
Intervalo = 29,6min max3,2 32,8
intervalo de classe ou amplitude de classe
5
K classes de dados
K = 6
6*5 = 30
A diferença entre 29,6 e 30 = 0,4 deve ser distribuída entre a extremidades
3,0 8,0 13,0 18,0 23,0 28,0 33,0
DISTRIBUIÇÕES DE FREQÜÊNCIA
Exercício Resolvido
5 – Relacionar os intervalos e fazer a contagem dos pontos por classe (a contagem total deve ser igual a n)
classe contagem
3 a 8
8 a 13
13 a 18
18 a 23
23 a 28
28 a 33
//// ///
//// ////
//// ////
//// //
////
//
8
10
9
7
4
2
Total n = 40
freqüência
Exercício Resolvido
6 – Construir uma tabela de freqüência ou histograma de freqüência
Tabela de freqüência
Número de alqueires Número de árvoresPercentagem de árvores
3 a < 8
8 a < 13
13 a < 18
18 a < 23
23 a < 28
22 a < 33
8
10
9
7
4
2 2/40 = 0,050
7/40 = 0,175
9/40 = 0,225
10/40 = 0,250
8/40 = 0,200
4/40 = 0,100
totais n = 40 1,000
Exercício Resolvido
Distribuição de freqüência relativa (%) para a safra de pêssego.
Poderia ser freqüência absoluta (nº de árvores).
Histograma
freq
üên
cia
classes
0,30
0,20
0,10
0,003 8 13 18 23 28 33
safras
Per
cent
agem
de
árvo
res
Exercício Resolvido
freqüência relativa ou absoluta
classes
Deve-se apenas unir os pontos médios das classes do histograma por segmentos de reta
POLÍGONO DE FREQÜÊNCIA
Alternativa ao histograma polígono de freqüência
0,30
0,20
0,10
0,003 8 13 18 23 28 33
Exercício Resolvido
www.matematiques.com.bramintas paiva
afonso