estatistica aplicada

33
ESTATÍSTICA Estatística é a parte da matemática aplicada que fornece métodos para a coleta, organização, descrição, análise e interpretação de dados e para a utilização dos mesmos na tomada de decisões. A estatística compreende três ramos: - Estatística descritiva - Teoria da probabilidade - Inferência (ou amostragem) A estatística descritiva compreende a organização, o resumo e, em geral, a simplificação de informações que podem ser muito complexas. Portanto, a coleta, a organização e a descrição dos dados estão a cargo de estatística descritiva. Exemplos: 01. Taxa de desemprego 02. Custo de vida 03. Índice pluviométrico 04. As medias dos estudantes A teoria da probabilidade é útil para analisar situações que envolvem o acoso. Como por exemplo: Jogos de dados e cartas,ou lançamento de uma moeda. A inferência (ou amostragem) diz respeito a análise e interpretação de dados amostrais. A amostragem é um exemplo vivo do adágio, não é preciso comer um bolo inteiro para saber se o bolo é gostoso, A ideia básica da amostragem é efetuar determinada mensuração sobre uma parcela pequena, mas típica, de determinada população e utilizar essa informação para fazer inferência sobre a população toda. Exemplos: 01. Mergulhar a ponta do pé na água para avaliar a temperatura da piscina, 02. Folhear um livro. A palavra estatística numa conceituação genérica pode ser considerada como a ciência que se preocupa com a coleta, organização, descrição, análise e interpretação de dados experimentais. O objetivo de reunir dados é o de fornecer informações sobre as características de grupos de pessoas ou coisas. As informações têm por objetivo conhecer o problema e, desta forma, servir de base para a escolha dos procedimentos mais adequados para resolvê-lo. Quando um cardiologista, por exemplo, solicita do seu paciente informações referentes ao seu histórico familiar sobre doenças cardiovasculares, DCV, está levantando um dado que já mostrou, a partir de dados referentes a outros pacientes, apresentar uma possível relação com o seu prognóstico cardiológico. Essa e outras informações, como tipo de alimentação irão auxiliar a compor um quadro dos fatores que podem contribuir para melhorar ou prejudicar a saúde do paciente. Essas informações são de natureza estatística, aplicadas, neste caso, à medicina. Evidentemente, trata-se de fornecer a informação da forma mais legível e completa possível. Desta forma, são utilizados rotinas e meios que permitam um bom entendimento das

Upload: marilia-s-martins

Post on 04-Dec-2015

99 views

Category:

Documents


57 download

DESCRIPTION

ESTATISTICA APLICADA

TRANSCRIPT

Page 1: ESTATISTICA APLICADA

ESTATÍSTICA

Estatística é a parte da matemática aplicada que fornece métodos para a coleta, organização,

descrição, análise e interpretação de dados e para a utilização dos mesmos na tomada de

decisões.

A estatística compreende três ramos:

- Estatística descritiva

- Teoria da probabilidade

- Inferência (ou amostragem)

A estatística descritiva compreende a organização, o resumo e, em geral, a simplificação de

informações que podem ser muito complexas. Portanto, a coleta, a organização e a

descrição dos dados estão a cargo de estatística descritiva.

Exemplos:

01. Taxa de desemprego

02. Custo de vida

03. Índice pluviométrico

04. As medias dos estudantes

A teoria da probabilidade é útil para analisar situações que envolvem o acoso. Como por

exemplo: Jogos de dados e cartas,ou lançamento de uma moeda.

A inferência (ou amostragem) diz respeito a análise e interpretação de dados amostrais. A

amostragem é um exemplo vivo do adágio, não é preciso comer um bolo inteiro para saber se

o bolo é gostoso, A ideia básica da amostragem é efetuar determinada mensuração sobre uma

parcela pequena, mas típica, de determinada população e utilizar essa informação para fazer

inferência sobre a população toda.

Exemplos:

01. Mergulhar a ponta do pé na água para avaliar a temperatura da piscina,

02. Folhear um livro.

A palavra estatística numa conceituação genérica pode ser considerada como a ciência que se

preocupa com a coleta, organização, descrição, análise e interpretação de dados

experimentais.

O objetivo de reunir dados é o de fornecer informações sobre as características de grupos de

pessoas ou coisas. As informações têm por objetivo conhecer o problema e, desta forma, servir

de base para a escolha dos procedimentos mais adequados para resolvê-lo.

Quando um cardiologista, por exemplo, solicita do seu paciente informações referentes ao seu

histórico familiar sobre doenças cardiovasculares, DCV, está levantando um dado que já

mostrou, a partir de dados referentes a outros pacientes, apresentar uma possível relação com

o seu prognóstico cardiológico. Essa e outras informações, como tipo de alimentação irão

auxiliar a compor um quadro dos fatores que podem contribuir para melhorar ou prejudicar a

saúde do paciente. Essas informações são de natureza estatística, aplicadas, neste caso, à

medicina.

Evidentemente, trata-se de fornecer a informação da forma mais legível e completa possível.

Desta forma, são utilizados rotinas e meios que permitam um bom entendimento das

Page 2: ESTATISTICA APLICADA

informações, organizando os dados. A organização de vários grupos de dados dá origem aos

bancos de dados.

Definem-se como primeiro(porém não mais importante) objetivo da estatística tornar a

informação clara e precisa ao receptor, valendo-se do ferramental disponível. Atualmente, os

recursos automáticos e gráficos da computação são ferramentas indispensáveis para o

tratamento da informação e, por extensão, para a estatística.

Nem sempre a estatística é bem vista. Essa má fama deve-se ao fato de ser, muitas vezes, mal

aplicada, pela não compreensão do significado correto de termos.

A estatística geralmente é dividida em duas partes:

Descritiva: encarrega-se de levantamento, organização, classificação e descrição dos

dados em tabelas, gráficos ou outros recursos visuais, além do cálculo de parâmetros

representativos desses dados.

Analítica: trabalha com os dados de forma a estabelecer hipóteses em funções desses

dados, procede a sua comprovação e, posteriormente, elabora conclusões cientificas.

DADOS ESTATÍSTICOS

Os dados estatísticos se obtêm mediante um processo que envolve a observação ou outra

mensuração de itens tais como renda anual numa comunidade, escores de testes, quantidade

de café por xícara servida por uma máquina automática, percentual de açúcar em cereais, etc.

Tais itens chamam-se variáveis, porque originam valores que tendem a exibir certo grau de

variabilidade quando se fazem mensurações sucessivas.

VARIÁVEL

Quando você vai comprar, por exemplo, um aparelho de televisão, você antes de comprar faz,

em princípio, algumas perguntas, tais como: Por quero comprar um aparelho de televisão? Que

marca devo comprar? Qual o tempo de utilização desse aparelho sem que ele vá ao reparo?

De quantas polegadas eu quero a televisão? Devo comprar à vista ou a prazo? E assim por

diante. Quando você faz isto ou algo parecido, você está levantando dados para tomar uma

decisão. Mas, antes de você tomar a decisão, você sempre faz uma analise das informações

obtidas durante o teu processo de solução do problema central: comprar uma televisão.

Assim sendo, aqui temos um problema, as variáveis, alguns dados que poderão ser obtidos,

uma vez que esses dados são buscados nas amostras que estou a consultar. Ou seja,

compreendo estas apurações de dados como um problema de estatística.

Assim, podemos compreender o trabalho estatístico como sendo um processo de pesquisa

estatística, que envolve amostras, levantamento de dados e análise as informações obtidas.

Portanto, variável é qualquer tipo de dado que pode apresentar uma quantidade ou categoria

de interesse no estudo estatístico.

As variáveis podem ser classificadas em:

QUANTITATIVAS: Discretas ou contínuas.

Uma variável é discreta quando só pode assumir certos valores, em geral inteiros.

Page 3: ESTATISTICA APLICADA

Exemplos:

01. Números diários de clientes

02. Números de alunos numa sala de aula

03. Números de defeitos de um carro

04. Números de acidentes

05. Números de praias poluídas

As variáveis contínuas são aquelas que podem assumir virtualmente qualquer valor num

intervalo de valores.

Exemplos:

01. Altura

02. Peso

03. Comprimento

04. Espessura

05. Velocidade

QUALITATIVAS (ou categóricas): Nominal ou ordinal.

As variáveis nominais envolvem categorias tais como:

01. Sexo

02. Cor dos olhos (azuis, castanhos, verdes)

03. Campo de estudo (medicina, enfermagem, administração)

04. Desempenho (excelente, bom, ruim, sofrível)

05. Grupo de fumantes e não fumantes.

As variáveis ordinais consistem de valores relativos atribuídos para denotar ordem:

Exemplos:

01. Hipertensão (leve, moderado, grave)

02. Grupo de fumantes ou não fumantes.

03. Classificação em um concurso.

POPULAÇÃO E AMOSTRA

Normalmente entende-se o termo população como um conjunto de pessoas. Em estatística o

sentido da palavra se torna mais amplo.

Entende-se por população a totalidade dos elementos ou de um atributo dos elementos

referentes a um conjunto determinado.

Exemplos:

01. População de Recife.

02. População de pacientes internados no HR.

03. População de ratos machos.

04. População de seringas descartáveis de um posto de saúde.

A população pode ser:

Finita: quando apresenta um número limitado de indivíduos.

Page 4: ESTATISTICA APLICADA

Exemplos:

01. A população constituída por todos os parafusos produzidos em uma fábrica em um dia.

02. Nascimento de crianças em um dia em Novo Hamburgo.

Infinita: quando o número de observações for infinito.

Exemplo. A população constituída de todos os resultados (cara e coroa) em sucessivos lances

de uma moeda.

A dificuldade de enumerar ou tratar conjuntos completos de dados faz com que se trabalhe

com partes do conjunto original, tidas como representantes do conjunto. Convenciona-se

denominar essas partes amostra. Deste modo, amostra é o conjunto de elementos retirados

da população, suficientemente representativos dessa população. Através da análise dessa

amostra estaremos aptos para analisar os resultados da mesma forma que se estudássemos

toda a população.

A seleção de uma amostra na qual cada membro do conjunto selecionado tenha a mesma

chance de incluído é chamada de amostragem.

Exemplo:

Podemos tirar conclusões sobre as alturas (ou pesos) de 12.000 estudantes adultos

(população), observando 100 estudantes (amostra) selecionados na população.

Obs. A amostra é sempre finita. Quanto maior for a amostra mais significativa é o estudo.

Parâmetro: É uma característica numérica estabelecida para toda uma população.

Estimador: É uma característica numérica estabelecida para uma amostra.

Dado Estatístico: É sempre um número real.

1) Primitivo ou Bruto: É aquele que não sofreu nenhuma transformação matemática.

Número direto.

2) Elaborado ou secundário: É aquele que sofreu transformação matemática. Ex.

porcentagem, média, etc.

FASES DO TRABALHO ESTATÍSTICO

Definição do problema

Planejamento: Consiste em determinar o procedimento necessário para resolver o

problema e, em especial, como levantar informações sobre o assunto objeto de estudo.

Que dados deverão ser obtidos? Como se deve obtê-los?

Coleta de dados: é normalmente feita através de um questionário ou de observação

direta de uma população ou amostra.

Organização dos dados: consiste na ordenação e crítica quanto à correção dos

valores observados, falhas humanas, omissões, abandono de dados duvidosos.

Apresentação dos dados: os dados estatísticos podem ser mais facilmente

compreendidos quando apresentados através de tabelas e gráficos, que permite uma

visualização instantânea de todos os dados.

APRESENTAÇÃO DE DADOS ESTATÍSTICOS

Page 5: ESTATISTICA APLICADA

APRESENTAÇÃO TABULAR

A apresentação de dados estatísticos na forma tabular consiste na reunião ou

grupamento dos dados em tabelas ou quadros com a finalidade de apresenta-los de modo

ordenado, simples e de fácil percepção e com economia de espaço.

Componentes Básicos

Em termos genéricos, uma tabela se compõe dos seguintes elementos básicos:

Exemplo:

Principais Elementos de uma Tabela

Título: Conjunto de informações, as mais completas possíveis, localizado no topo da tabela,

respondendo às perguntas: O quê? Onde? Quando?

Cabeçalho: Parte superior da tabela que especifica o conteúdo das colunas.

Coluna Indicadora: Parte da tabela que especifica o conteúdo das linhas.

Linhas: Retas imaginárias que facilitam a leitura, no sentido horizontal, de dados que se

inscrevem nos seus cruzamentos com as colunas.

Rodapé: são mencionadas a fonte se a série é extraída de alguma publicação e também as

notas ou chamadas que são esclarecimentos gerais ou particulares relativos aos dados.

SÉRIES ESTATÍSTICAS

Page 6: ESTATISTICA APLICADA

É toda tabela que apresenta a distribuição de um conjunto de dados estatísticos em função de

três elementos:

Da época;

Do local;

Da espécie.

Esses elementos determinam o surgimento de quatro tipos fundamentais de séries estatísticas:

Séries Temporais ou Cronológicas: são aquelas nas quais os dados são reunidos segundo o

tempo que varia, permanecendo fixos o local e a espécie.

Exemplo:

Séries Geográficas: são aquelas nas quais os dados são reunidos segundo o local que varia

permanecendo fixos o tempo e a espécie.

Exemplo:

.

Séries Específicas: são aquelas nas quais os dados são reunidos segundo o espécie que varia

permanecendo fixos o tempo e o local.

Exemplo:

Séries Composta ou Mista: é a combinação de dois ou mais fundamentais de séries

estatísticas.

Page 7: ESTATISTICA APLICADA

Exemplo: Geográfica – Temporal.

* Os dados estão em toneladas.

A apresentação tabular de dados estatísticos é normalizada pela resolução nº 886 de 26-10-

1966 do Conselho Nacional de Estatística a fim de uniformizar a apresentação de dados.

Exercício 1: De acordo com o IBGE (1988), em 1986 ocorreram, em acidentes de trânsito,

27306 casos de vítimas fatais, assim distribuídos: 11712 pedestres, 7116 passageiros e 8478

condutores. Faça uma tabela para apresentar esses dados.

Exercício 2: De acordo com o Ministério dos transportes, em 1998, o tamanho das malhas de

transporte no Brasil é, assim distribuído: 320480 km de Rodovias (estradas municipais não

estão incluídas), 29700 km de Ferrovias (inclui as linhas de trens urbanos) e 40000 km de

Hidrovias (desse total, apenas 8000 km estão sendo usados de fato). Faça uma tabela para

apresentar esses dados.

Exercício 3: De acordo com Ministério da Educação a quantidade e alunos matriculados no

ensino de 1º grau no Brasil nos de 1990 a 1996 em milhares de alunos, são: 19.720 – 20.567 –

21.473 – 21.887 – 20.598 – 22.473 – 23.564. Faça uma tabela para apresentar esses dados.

Exercício 4: Estabelecimentos de ensino da região norte do Brasil em 1982. A região norte

subdivide-se em: Rondônia, Acre, Amazonas, Roraima, Pará e Amapá e possuem um total de

29, 13, 78, 4, 10 e 9 estabelecimentos de ensino, respectivamente, segundo o MEC. . Faça

uma tabela para apresentar esses dados.

TIPOS DE GRÁFICOS

Gráfico em linha: é um dos mais importantes gráficos; representa observações feitas ao longo

do tempo. Tais conjuntos de dados constituem as chamadas séries históricas ou temporais.

Page 8: ESTATISTICA APLICADA

Gráfico em setores: É um gráfico construído no círculo, que é dividido em setores

correspondentes aos termos da série e proporcionais aos valores numéricos dos termos da

série. É mais utilizado para séries específicas ou geográficas com pequeno número de termos

e quando se quer salientar a proporção de cada termo em relação ao todo.

Exemplo:

Gráficos em Barras (ou em colunas). É a representação de uma série por meio de

retângulos, dispostos horizontalmente (em barras) ou verticalmente (em colunas).

Quando em barras, os retângulos têm a mesma altura e os comprimentos são proporcionais

aos respectivos dados.

Quando em colunas, os retângulos têm a mesma base e as alturas são proporcionais aos

respectivos dados.

Page 9: ESTATISTICA APLICADA

Cartograma. É representação sobre uma carta geográfica.

Este gráfico é empregado quando o objetivo é o de figurar os dados estatísticos diretamente

relacionados com as áreas geográficas ou políticas.

Pictograma. Constitui um dos processos gráficos que melhor fala ao público, pela sua forma

ao mesmo tempo atraente e sugestiva. A representação gráfica consta de figuras.

Ex.: População Urbana do Brasil em 1980 (x 10)

Fonte: Anuário Estatístico (1984)

TABELA PRIMITIVA – ROL

1) Foram coletados os pesos(kg) de 20 homens entre 20 e 40 anos

80 55 60 65 60 70 75 70 70 90

55 80 70 100 60 70 80 65 55 90

a) Vamos agrupar os dados em ordem crescente

Page 10: ESTATISTICA APLICADA

b) Vamos organizar os dados na tabela a seguir

PESOS (kg) FREQUÊNCIA

FREQUÊNCIA

RELATIVA (%)

55

60

65

70

75

80

90

100

SOMA 20 100%

2) Foi feito uma coleta de dados relativos às estaturas de quarenta alunos de um colégio.

Estatura dos 40 alunos em centímetro

166 160 161 150 162 160 165 167 164 160

162 161 168 163 156 173 160 155 164 168

155 152 163 160 155 169 151 170 164 155

161 154 156 172 153 157 156 158 158 161

A esse tipo de tabela, cujos elementos não foram numericamente organizados, denominamos

tabela primitiva.

Organização dos dados: ordem crescente ou decrescente

Agora podemos saber, com relativa facilidade, qual a menor (150cm) e qual a maior(173 cm)

estatura; que a amplitude da variação foi de 173 – 150 = 23 cm; e, ainda, a ordem que um valor

particular da variável ocupa no conjunto. Analisando um pouco mais, veremos que há uma

concentração maior nas estaturas entre 160 cm e 165 cm e, mais ainda, que há poucos valores

abaixo de 155 cm e acima de 170 cm.

DISTRIBUIÇÃO DE FRENQUÊNCIA

Denomina-se frequência o número de alunos que fica relacionado a um determinado valor da

variável. Obtemos, assim, uma tabela que recebe o nome de distribuição de frequência.

Page 11: ESTATISTICA APLICADA

DADOS AGRUPADOS

Estatura

(cm)

Frequência

absoluta

Frequência

relativa

150

151

152

153

154

155

156

157

Estatura

(cm)

Frequência

absoluta

Frequência

relativa

167

168

169

170

172

173

Veja que este processo pode ser bem demorado, mesmo que os valores da variável (n) seja de

tamanho razoável. Podemos dar uma solução mais aceitável e mais rápida, que consiste em

agruparmos os valores em intervalos de classe ou tabulagem.

A tabulagem dos dados é feita dividindo-se a amplitude total (diferença entre o maior valor e

o menor valor observado) da distribuição pelo número k de classes, previamente fixado.

Geralmente o número de classes varia entre 8 e 12. Entretanto existe uma formula empírica

para se determinar k(número de classes) K = , onde n é o tamanho da amostra.

Voltando ao exemplo anterior (das alturas dos 40 alunos) veja que aplicando a formula para

obtermos o número de classes teremos:

K = , ou seja teremos 6 classes.

Tomando a amplitude total da distribuição 173 – 150 = 23. O quociente da amplitude total pelo

número de classes constitui no intervalo de classes (h)

. Devemos aproximar o intervalo para um número

inteiro. Vamos aproximar para h =4.

Estatura

(cm)

Frequência

absoluta

Frequência

relativa

158

160

161

162

163

164

165

166

Page 12: ESTATISTICA APLICADA

DADOS AGRUPADOS EM INTERVALOS DE CLASSE

ESTATURA (cm) PONTO MÉDIO

DAS CLASSSES

(Xi)

FREQUÊNCIA

DAS CLASSES

(fi)

FREQUÊNCIA

RELATIVA

(fr)

150 154

154 158

158 162

162 166

166 170

170 174

ELEMENTOS DA DISTRIBUIÇÃO EM INTERVALOS DE CLASSE

1) Classe: é cada um dos intervalos em que os dados são agrupados.

2) Limites de classes: são os valores extremos de cada classe.

li = limite inferior de uma classe;

Li = limite superior de uma classe.

3) Amplitude: é a diferença entre o maior valor e o menor valor de certo conjunto de dados.

Pode ser referida ao total de dados ou a uma das classes em particular.

Amplitude Total (At) – é calculada pela seguinte expressão:

At = Max. (rol) – Min.(rol).

Amplitude das classes (h) – é a relação entre a amplitude total e o número de classes,

conforme mostra a expressão a seguir:

n

rolMínrolMáxh

).()( , onde n é o número de intervalos de classe.

4) Ponto médio de classe (xi): é calculado pela seguinte expressão:

2

ii

i

lLx

5) Frequência absoluta (fi): frequência absoluta de uma classe de ordem i, é o número de

dados que pertencem a essa classe.

6) Frequência relativa (fri): frequência relativa de uma classe de ordem i, é o quociente da

frequência absoluta dessa classe (fi), pelo total, ou seja,

Total

ffr i

i

Page 13: ESTATISTICA APLICADA

EXEMPLOS:

01. Admitamos que uma empresa que possui um número muito grande de empregados (20.000

por exemplo) está interessada em mandar confeccionar uniformes (macacões) para seus

empregados. O fornecedor fabrica 8 tamanhos diferentes (números de 1 a 8). A empresa

deseja fazer uma encomenda de 40.000 uniformes. Quantos uniformes deverão ser feitos de

cada tamanho? Abaixo segue uma lista com as alturas de 50 empregados dessa empresa.

168 167 175 166 158 172 176 160 175 187

173 170 159 191 172 187 165 162 167 179

198 173 174 184 173 185 173 177 178 181

176 168 161 162 161 166 181 163 168 177

171 173 164 169 171 180 188 178 183 172

02. Considere os seguintes dados relativos ao número de acidentes diário num grande

estacionamento, durante um período de 50 dias.

6 9 2 7 0 8 2 5 4 2

5 4 4 4 4 2 5 6 3 7

3 8 8 4 4 4 7 7 6 5

4 7 5 3 7 1 3 8 0 6

5 1 2 3 6 0 5 6 6 3

Page 14: ESTATISTICA APLICADA

Vamos montar uma tabela para k = 5

CLASSES (Xi) (fi) (fr)

0

03. Os dados a seguir referem-se ao número de livros adquiridos, no ano passado, pelos

40 alunos da Turma A:

4 2 1 0 3 1 2 0 2 1

0 2 1 1 0 4 3 2 3 5

8 0 1 6 5 3 2 1 6 4

3 4 3 2 1 0 2 1 0 3

Organize os dados em uma tabela adequada.

Qual o percentual de alunos que adquiriram menos do que 3 livros? R: 60%

Qual o percentual de alunos que adquiriram pelo menos 4 livros? R: 22,5%

A partir do item (b), quantos livros foram adquiridos pelos 40 alunos? R: 92

Page 15: ESTATISTICA APLICADA

04. Considere os dados abaixo referentes ao consumo de água, em m3, de 75 contas da

CORSAN:

32 6 22 11 34 40 16 26 23 31 27 10 38 17 13

45 25 50 18 23 35 22 30 14 18 20 13 24 35 29

33 48 20 12 31 39 17 58 19 16 12 21 15 12 20

51 12 19 15 41 29 25 13 23 32 14 27 43 37 21

28 37 26 44 11 53 38 46 17 36 28 49 56 19 11

Organize os dados numa distribuição de frequência com 9 classes de amplitudes iguais.

05. A altura de 60 alunos da FACE-PUC foi registrada abaixo, em cm:

174 170 156 168 176 178 162 182 172 168

166 156 169 168 162 160 163 168 162 172

168 167 170 153 171 166 168 156 160 172

173 163 170 175 176 182 158 176 161 175

173 163 172 167 170 179 179 170 151 175

152 151 172 173 170 174 167 167 158 174

a) Construa uma distribuição de frequência com 8 classes de amplitudes iguais, adotando

como limite inferior da distribuição 150 cm.

b) Qual o percentual de alunos com altura mínima de 166 cm? R: 70%

c) Quantos alunos têm menos de 162 cm? R: 12

d) Qual o percentual de alunos com altura média de 164 cm? Qual a soma total aproximada

das alturas dos 60 alunos? R: 10%, 10.108 cm

Page 16: ESTATISTICA APLICADA

MEDIDADAS DE TENDÊNCIA CENTRAL

Há diversas medidas que possibilitam condensar as informações dentro da fase analítica da

estatística descritiva.

As medidas de tendência central são usadas para indicar um valor que tende a caracterizar, ou

a representar melhor, um conjunto de números. As três medidas mais usadas são: A média, a

moda e a mediana.

Dados agrupados

MEDIAS

O número destinado a resumir uma série de dados diz – se média, designação que significa

que a síntese deve ser um valor intermediário aos valores dados.

Tipos de médias

- Média aritmética simples e ponderada

- Média geométrica

- Média harmônica

Media aritmética simples: média de um conjunto de valores numéricos é calculada somando-

se todos estes valores e dividindo-se o resultado pelo número de elementos somados

Considere uma sequência numérica

Exemplo: Considere os números 2, 5, 7, 9 e 12, a média aritmética simples desses valores é:

Média aritmética ponderada: A média ponderada é calculada através do somatório das

multiplicações entre valores e pesos atribuídos a cada valor divididos pelo somatório dos

pesos.

Exemplo:

Na escola de Gabriel, a média anual de cada matéria é calculada de acordo com os princípios

da média ponderada. Considerando que o peso das notas esteja relacionado ao bimestre em

questão, determine a média anual de Gabriel sabendo que as notas em Matemática foram

iguais a:

1º Bimestre: 7,0 (peso 1)

2º Bimestre: 6,0 (peso 2)

3º Bimestre: 8,0 (peso 3)

4º Bimestre: 7,5 (peso 4)

Page 17: ESTATISTICA APLICADA

Média geométrica

Dados a média geométrica é igual a

EXEMPLOS:

01. Determine a média geométrica de 4, 16 e 8

02. Determine a média geométrica de 2 5 7 10 12

Média harmônica

A média harmônica de n valores de uma variável é o inverso da media aritmética dos

inversos dos valores dados.

Dados , a média harmônica é:

EXEMPLOS:

Calcule a média harmônica nos casos abaixo:

01. 2 e 6

02. 3, 6, 9 e 12

MODA

,

A moda de uma distribuição simples é o valor que ocorre com mais frequência.

Exemplo: Considere os números abaixo.

20 20 10 10 10 50 50 20 60 40

40 50 80 60 60 40 50 50 50 20

Observe que o número que aparece com mais frequência é o 50, logo a moda dessa amostra é

50.

OBSERVAÇÕES:

01. Existem distribuições que não possuem moda.

Exemplo: 2 3 5 6 9 1 0 12 15

Page 18: ESTATISTICA APLICADA

02. Existem distribuições que possuem várias modas (multimodais)

Exemplo:

3 3 3 5 7 7 7 8 10 12 (duas modas:3 e 7) BIMODAL

4 5 5 5 6 7 7 7 9 10 10 10 15 (três modas: 5, 8 e 10) TRIMODAL

MEDIANA

A mediana é outra medida de posição definida como o número que se encontra no centro de

uma série de números organizados em ordem crescente ou decrescente.

Exemplo:

01. Considere a distribuição 10 12 15 16 20 35 40, veja que o termo central é 16, logo a

mediana vale 16.

02. Agora considere essa distribuição 10 12 15 16 20 35 40 80, veja que agora temos

dois termos centrais, 16 e 20, então a mediana será a média aritmética dos dois centrais.

EXERCICIOS

1) Considere a distribuição

N° de meninos fi

0 2

1 6

2 10

3 12

4 4

34

Determine a média, a moda e a mediana da distribuição.

2) Os salários dos funcionários de uma empresa estão distribuídos na tabela abaixo:

Salário Frequência

$400,00 5

$600,00 2

$1.000,00 2

$5.000,00 1

10

Determine o salário médio, o salário mediano e o salário modal.

MÈDIA ARITMÉTICA – DADOS AGRUPADOS EM INTERVALOS DE CLASSES

Page 19: ESTATISTICA APLICADA

Onde: é o ponto médio de cada classe e é a frequência de cada classe

Exemplo:

01. Determine a média aritmética das alturas dos estudantes de uma classe de ensino médio

apresentada na tabela abaixo.

Estaturas(cm) xi fi Xi fi

150 155 6

155 160 9

160 165 16

165 170 5

170 175 3

175 180 1

40 6465

02. Calcule a média aritmética dos dados abaixo

Salários (R$) xi fi Xi fi

500 18

31

900 1100 15

1300 3

1300 1500 1

1700 1

1900 1

70 59000

03. Calcule a média aritmética dos dados abaixo.

Custos (R$) xi fi Xi fi

450 8

10

650 0 11

0 16

0 13

950 1050 5

0 1

64 48300

MEDIANA – DADOS AGRUPADOS EM INTERVALOS DE CLASSES

Neste caso, o problema consiste em determinar o ponto do intervalo em que está

compreendida a mediana.

Para tanto temos que inicialmente determinar a classe na qual se acha a mediana. Tal classe

será aquela correspondente à frequência acumulada imediatamente superior a

.

A fórmula abaixo mostra como calcular a mediana de uma distribuição em intervalos d classes.

Page 20: ESTATISTICA APLICADA

é o limite inferior da classe da mediana

é a frequência acumulada da classe anterior à classe mediana

é a frequência simples da classe mediana

h é a amplitude do intervalo da classe mediana

Exemplos:

01. Calcule a mediana da distribuição abaixo.

Estaturas (cm) fi fa

150 154 4 4

154 158 9 13

158 162 11 24

162 166 8 32

166 170 5 37

170 174 3 40

40

02. Calcule a mediana da distribuição

Custos (R$) fi fa

450 8

10

650 0 11

0 16

0 13

950 1050 5

0 1

64

03. Calcule a mediana da distribuição.

NOTAS fi fa

0 5

2 8

4 14

6 10

8 7

44

Page 21: ESTATISTICA APLICADA

MODA – DADOS AGRUPADOS EM INTERVALOS DE CLASSES

A moda é a media aritmética do limite inferior( com o limite superior da classe

modal(classe que tem maior frequência)

Exemplos:

01. Vamos calcular a moda da distribuição.

Estaturas (cm) fi

150 154 4

154 158 9

158 162 11

162 166 8

166 170 5

170 174 3

40

02 Vamos calcular a moda da distribuição.

Salários (R$) fi

500 18

31

900 1100 15

1300 3

1300 1500 1

1700 1

1900 1

70

MEDIDAS DE DISPERSÃO

As medidas de dispersão de uma distribuição são valores que indicam o grau de afastamento

dos valores da variável em relação à média.

Para qualificar os valores de uma dada variável, ressaltando a maior ou a menor dispersão ou

a variabilidade entre esses valores e a sua medida de posição, a estatística recorre às medidas

de dispersão ou coeficiente de variação.

As principais medidas de dispersão são:

Intervalo (amplitude total)

Desvio médio absoluto

Variância

Desvio padrão

Coeficiente de variação

Page 22: ESTATISTICA APLICADA

INTERVALO (AMPLITUDE TOTAL)

O intervalo de um grupo de números é de um modo geral, a medida mais simples de calcular e

entender. Focalizar o maior e o menor valor no conjunto (valores extremos). O intervalo pode

ser obtido de duas maneiras:

01. A diferença entre o maior e o menor valor (amplitude total).

02. O maior e o menor valor no grupo.

Exemplo: Considere os valores 1, 10, 15, 25. A diferença entre o maior valor e o menor valor é

25 – 1 = 24, que é a amplitude total. Tambem podemos dizer que o intervalo vai de 1 até 25.

DESVIO MÈDIO ABSOLUTO

O desvio médio absoluto (Dm) de uma distribuição é a média aritmética dos módulos dos

desvios (diferença entre o valor da variável e a média).

Dada a distribuição , os desvios são e o desvio

médio é:

ou

OBS.: Para o cálculo do desvio médio são tomados os módulos dos desvios, pois a soma dos

desvios é zero.

EXEMPLOS:

01. Calcule o desvio médio da distribuição 7 10 12 15 16 18 20

Solução

Primeiramente vamos calcular a média aritmética dos dados:

Ma =

Agora vamos calcular o desvio médio.

Page 23: ESTATISTICA APLICADA

02. Determine o desvio médio de 2 4 6 8 10

03. Determine o desvio médio para o conjunto de valores 1 2 3 4 5.

VARIÂNCIA

A variância de uma distribuição é a média aritmética dos quadrados dos desvios. A variância

de uma amostra é representada por S² e constitui uma estimativa da variância da população.

A variância é uma medida que dá o grau de dispersão (ou concentração) de probabilidade em

torno da média.

Assim, se , é uma amostra de n elementos da variável x, então

EXEMPLOS:

01. Determine a variância dos números

7 10 12 15 16 18 20

Solução

Vamos achar a média.

Agora a variância

02. Determine a variância da população 2 4 6 8 10

Page 24: ESTATISTICA APLICADA

03. Determine a variância da amostra 1 3 4 3 4 2 4 1 2 2 1 0

VARIÂNCIA PARA DADOS AGRUPADOS SEM INTERVALO DE CLASSE

EXEMPLOS:

01. Seja a distribuição

0 2

1 6

2 12

3 7

4 3

30

Vamos calcular a variância

02. Calcule a variância da distribuição

1 2

2 5

3 8

4 6

5 3

6 1

25

03. Calcule a variância da distribuição

2 3 4 5 6 7 8

1 3 5 8 5 4 2

VARÂNCIA PARA DADOS AGRUPADOS COM INTERVALO DE CLASSES

Onde é a média da classe

Page 25: ESTATISTICA APLICADA

EXEMPLOS

Calcular a variância das seguintes distribuições

01.

Estaturas (cm) fi

150 154 4

154 158 9

158 162 11

162 166 8

166 170 5

170 174 3

40

Solução

Para o calculo da variância, devemos abrir colunas para as expressões: e

Estaturas (cm)

150 154 152 4 -9 81 324

154 158 156 9 -5 25 225

158 162 160 11 -1 1 11

162 166 164 8 3 9 72

166 170 168 5 7 49 245

170 174 172 3 11 121 363

=161 40 1240

Logo, temos:

02.

Classes

155,5 160,5 3

160,5 165,5 7

165,5 170,5 9

170,5 175,5 13

175,5 180,5 8

180,5 185,5 5

185,5 190,5 3

190,5 195,5 2

50

Page 26: ESTATISTICA APLICADA

DESVIO PADRÃO

É a raiz quadrada da variância.

Representamos o desvio padrão de uma amostra por S.

Desse modo se é uma amostra de n elementos da variável x, então o desvio

padrão é:

Exemplos:

01. Determine o desvio padrão dos valores abaixo

5 10 15 20 25

Solução

Vamos calcula a media

Agora a variância

Agora o desvio padrão, que é a raiz quadrada da variância.

02. Determine o desvio padrão dos números abaixo

1 2 4 8

03. Em uma escola, a direção decidiu observar a quantidade de alunos que apresentam todas

as notas acima da média em todas as disciplinas. Para analisar melhor, a diretora Ana resolveu

montar uma tabela com a quantidade de notas “azuis” em uma amostra de quatro turmas ao

longo de um ano. Observe a seguir a tabela organizada pela diretora:

Page 27: ESTATISTICA APLICADA

Vamos calcular o desvio padrão de cada turma.

04. O dono de uma microempresa pretende saber, em média, quantos produtos são produzidos

por cada funcionário em um dia. O chefe tem conhecimento que nem todos conseguem fazer a

mesma quantidade de peças, mas pede que seus funcionários façam um registro de sua

produção em uma semana de trabalho. Ao fim desse período, chegou-se à seguinte tabela:

Vamos determinar o desvio padrão de cada funcionário

COEFICIENTE DE VARIAÇÃO

É a relação entre o desvio padrão e a média. Geralmente é expresso em porcentagem, o que

facilita a comparação da variabilidade entre variáveis com valores em medidas diferentes.

Os coeficientes de variação podem ser considerados BAIXOS, quando são inferiores a 10%,

MÉDIOS quando de 10 a 20%, ALTOS, quando de 20 a 30% e MUITO ALTOS quando

superiores a 30%.

O coeficiente de variação é dado pela formula:

Exemplos:

01. Determine o coeficiente de variação dos valores abaixo

5 10 15 20 25

Page 28: ESTATISTICA APLICADA

02. Determine o coeficiente de variação dos números

7 10 12 15 16 18 20

EXERCÍCIOS

1) (ENEM) Na tabela, são apresentados dados da cotação mensal do ovo extra branco vendido

no atacado, em Brasília, em reais, por caixa de 30 dúzias de ovos, em alguns meses dos anos

2007 e 2008.

De acordo com esses dados, o valor da mediana das cotações mensais do ovo extra branco

nesse período era igual a:

A) R$ 73,10.

B) R$ 81,50.

C) R$ 82,00.

D) R$ 83,00.

E) R$ 85,30.

2) (ENEM) O quadro seguinte mostra o desempenho de um time de futebol no último

campeonato. A coluna da esquerda mostra o número de gols marcados e a coluna da direita

informa em quantos jogos o time marcou aquele número de gols.

Se X, Y e Z são, respectivamente, a média, a mediana e a moda desta distribuição, então

a) X = Y < Z.

b) Z < X = Y.

c) Y < Z < X.

d) Z < X < Y.

e) Z < Y < X.

Page 29: ESTATISTICA APLICADA

3) Uma equipe de especialistas do centro metrológico de uma cidade mediu a temperatura do

ambiente, sempre no mesmo horário, durante 15 dias intercalados, a partir do primeiro dia de

um mês. Esse tipo de procedimento é frequente, uma vez que os dados coletados servem de

referencia para estudos e verificações de tendências climáticas ao longo dos meses e anos. As

medições ocorridas nesse período estão indicadas no quadro:

Em relação à temperatura, os valores da média, mediana e moda são, respectivamente, iguais

a

a) 17 °C, 17 °C e 13,5 °C.

B 17 °C, 18 °C e 13,5 °C.

C 17 °C, 13,5 °C e 18 °C.

D 17 °C, 18 °C e 21,5 °C.

E 17 °C, 13,5 °C e 21,5 °C.

4) (ENEM) Depois de jogar um dado em forma de cubo e de faces numeradas de 1 a 6, por 10

vezes consecutivas, e anotar o número obtido em cada jogada, construiu-se a seguinte tabela

de distribuição de frequências.

A média, mediana e moda dessa distribuição de frequências são, respectivamente

a) 3, 2 e 1

b) 3, 3 e 1

c) 3, 4 e 2

d) 5, 4 e 2

e) 6, 2 e 4

Page 30: ESTATISTICA APLICADA

5) (UPE SSA 3) Ao término do ano letivo, um professor de química aplicou um simulado com

50 questões, cada uma valendo um ponto, para avaliar estatisticamente o rendimento dos

estudantes de uma turma da escola onde trabalha. Os resultados de cada estudante nessa

avaliação estão descritos a seguir:

Com base nesses resultados, analise as sentenças seguintes:

Está CORRETO o que se afirma, apenas, em

a) I

b) II

c) III

d) I e II

e) II e III

6) (UPE SSA 3) Para controlar o desperdício de alimentos, o gerente do Restaurante Kilobom

anotou o peso dos pratos de 50 clientes no almoço da quarta-feira e obteve uma amostra com

os seguintes resultados aproximados, em gramas:

O valor da amplitude da amostra obtida é de

A) 720

B) 600

C) 420

D) 380

E) 120

7) (UPE SSA 2) Depois dos Estados Unidos, o Brasil é o país com maior número de pessoas

na rede social Facebook, com 49 milhões de usuários. O quadro a seguir mostra, em milhões,

o número de usuários do Facebook, de alguns países.

Page 31: ESTATISTICA APLICADA

De acordo com esses dados, a moda, a média e a mediana de usuários do Facebook em

milhões, nesses países, são, respectivamente,

A) 49, 26 e 31

B) 35, 49 e 26

C) 35, 31 e 26

D) 26, 35 e 31

E) 26, 31 e 35

7) (UPE SSA 1) O quadro a seguir mostra o número de gols feitos na fase de classificação por

cada um dos times que participaram da Copa das Confederações no Brasil.

Considerando o número total de gols de cada país nessa fase, qual o valor da diferença entre a

mediana e a média aritmética do total de gols?

a) 0,15

b) 0,25

c) 0,35

d) 0,50

e) 0,75

8) Os salários dos funcionários de uma empresa estão distribuídos na tabela abaixo:

Salário Freqüência

$400,00 5

$600,00 2

$1.000,00 2

$5.000,00 1

Determine o salário médio, o salário mediano e o salário modal.

9) A tabela adiante apresenta o levantamento das quantidades de peças defeituosas para cada

lote de 100 unidades fabricadas em uma linha de produção de autopeças, durante um período

de 30 dias úteis. Considerando S a série numérica de distribuição de freqüências de peças

defeituosas por lote de 100 unidades, julgue os itens abaixo.

Page 32: ESTATISTICA APLICADA

(1) A moda da série S é 5. ( )

(2) Durante o período de levantamento desses dados, o percentual de peças defeituosas ficou,

em média, abaixo de 3,7%. ( )

(3) Os dados obtidos nos 10 primeiros dias do levantamento geram uma série numérica de

distribuição de freqüências com a mesma mediana da série S. ( )

10) Encontre a média para o salário destes funcionários.

Salários semanais para 100 operários não especializados

Salários semanais fi xi xi.fi

140 |-- 160 7

160 |-- 180 20

180 |-- 200 33

200 |-- 220 25

220 |-- 240 11

240 |-- 260 4

100

11)

Salários semanais para 100 operários não especializados

Salários semanais fi xi (xi- x )2 (xi- x )

2fi

140 |-- 160 7

160 |-- 180 20

180 |-- 200 33

200 |-- 220 25

220 |-- 240 11

240 |-- 260 4

100

Encontre o desvio padrão para o salário destes funcionários.

12) Em conjunto com uma auditoria anual, uma firma de contabilidade pública anota o tempo

necessário para realizar a auditoria de 50 balanços contábeis.

Tempo necessário para a auditoria de balanços contábeis.

Tempo de auditoria.

(min.)

Nº de balanços.

(fi)

10 |-- 20 3

20 |-- 30 5

30 |-- 40 10

40 |-- 50 12

50 |-- 60 20

Total 50

Calcular

a) a média,

b) o desvio padrão, para o tempo de auditoria necessário para esta amostra de registro.

R: a) 43,2; b)12,28.

13) Os salários semanais de 50 funcionários de um hospital, em reais, foram os seguintes:

Page 33: ESTATISTICA APLICADA

100 122 130 140 152 160 164 176 180 188 192 200 216

104 126 134 146 156 160 170 176 184 190 194 200 218

116 128 138 150 156 162 170 178 186 190 196 200

120 128 140 150 156 162 176 180 186 192 196 210

a) Construa uma distribuição de frequências, com h = 20 e limite inferior para a primeira classe

igual a 100.

b) Quantos funcionários tem um salário semanal situado entre R$ 120,00 (inclusive) e R$

160,00 (exclusive)? 17 funcionários

c) Que porcentagem de funcionários tem um salário semanal situado entre R$ 180,00

(inclusive) e R$ 200,00 (exclusive)?26%

d) Qual o salário médio semanal destes funcionários utilizando o item a)?166,4

e) Determine o desvio padrão e o coeficiente de variação da distribuição. 28,76; 17,28%

14) Os 20 alunos de uma turma especial de Estatística obtiveram as notas abaixo.

84 88 78 80 89 94 95 77 81 90

83 87 91 83 92 90 92 77 86 99

Determine:

a) a amplitude total das notas; R. 22

b) o desvio padrão das notas; R. 6,13677

c) a variância absoluta das notas; R. 37,66

d) o coeficiente de variação; R. 0.0707

e) a proporção de alunos com notas maiores que 90; R. 0,3

15) Os dados abaixo foram colhidos de uma amostra de aves de certa espécie, onde estudou-

se o tempo, em dias, que os filhotes levavam para abandonar o ninho:

TEMPO Nº DE FILHOTES

5 10

10 15

15 20

20 25

25 30

14

16

18

15

7

Determine e interprete:

a) o tempo médio; R: 16,43

b) o tempo mediano; R: 16,39

c) o tempo modal. R: 17,5

16) A poluição causada por óleo em mares e oceanos estimula o crescimento de certos tipos

de bactérias. Uma contagem de micro-organismos presentes no petróleo (número de bactérias

por 100 mililitros), em 10 porções de água do mar, indicou as seguintes medidas:

49 70 54 67 59 40 71 67 67 52

a) Determine e interprete a média, mediana e moda. R: 59,6; 63; 67

b) Calcule o desvio padrão. R: 10,48