apostila de estatistica aplicadadavisilva.atwebpages.com/.../apostila_estatistica_aplicada.pdf · a...

38
FACULDADE DE TECNOLOGIA TUPY CURITIBA Rev. 00 MÉTODOS QUANTITATIVOS ESTATÍSTICA APLICADA VAGNER J. NECKEL 2010

Upload: others

Post on 05-Nov-2019

5 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Apostila de Estatistica Aplicadadavisilva.atwebpages.com/.../Apostila_Estatistica_Aplicada.pdf · A Estatística, ramo da Matemática Aplicada, teve origem semelhante. Desde a Antiguidade

FACULDADE DE TECNOLOGIA TUPY CURITIBA

Rev. 00

MÉTODOS QUANTITATIVOS

ESTATÍSTICA APLICADA VAGNER J. NECKEL

2010

Page 2: Apostila de Estatistica Aplicadadavisilva.atwebpages.com/.../Apostila_Estatistica_Aplicada.pdf · A Estatística, ramo da Matemática Aplicada, teve origem semelhante. Desde a Antiguidade

[email protected] 2

SUMÁRIO 1. CONCEITOS GERAIS ....................................................................................................................3

1.1 PANORAMA HISTÓRICO ...............................................................................................................3 1.2 DEFINIÇÃO .................................................................................................................................3 1.3 A ESTATÍSTICA NAS EMPRESAS....................................................................................................4 1.4 APLICAÇÕES ...............................................................................................................................4 1.5 MÉTODO EXPERIMENTAL X MÉTODO ESTATÍSTICO ......................................................................4 1.6 FASES DO MÉTODO ESTATÍSTICO.................................................................................................5

1.6.1 Definição do problema .....................................................................................................5 1.6.2 Coleta de dados................................................................................................................5 1.6.3 Crítica dos dados .............................................................................................................5 1.6.4 Apuração dos dados.........................................................................................................5 1.6.5 Exposição dos resultados .................................................................................................5 1.6.6 Análise dos resultados......................................................................................................6

1.7 POPULAÇÃO E AMOSTRA .............................................................................................................6 1.8 TIPOS DE VARIÁVEIS ...................................................................................................................7

2. DISTRIBUIÇÃO DE FREQUÊNCIA..............................................................................................9 2.1 ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQUÊNCIA ....................................................................9 2.2 SÍNTESE DE DADOS QUALITATIVOS ............................................................................................12 2.3 SÍNTESE DE DADOS QUANTITATIVOS ..........................................................................................13

2.3.1 Distribuição de frequência sem intervalos de classe........................................................13 2.3.2 Distribuição de freqüência com intervalos de classe .......................................................15

3. MEDIDAS DE POSIÇÃO ..............................................................................................................21 3.1 MEDIDAS DE TENDÊNCIA CENTRAL ............................................................................................21

3.1.1 Média.............................................................................................................................21 3.1.2 Mediana.........................................................................................................................25 3.1.3 Moda .............................................................................................................................28

3.2 MEDIDAS SEPARATRIZES ...........................................................................................................30 4. MEDIDAS DE DISPERSÃO..........................................................................................................33

4.1 AMPLITUDE TOTAL ...................................................................................................................33 4.2 VARIÂNCIA E DESVIO PADRÃO ...................................................................................................33

5. COEFICIENTE DE VARIAÇÃO ..................................................................................................37 BIBLIOGRAFIA................................................................................................................................38

Page 3: Apostila de Estatistica Aplicadadavisilva.atwebpages.com/.../Apostila_Estatistica_Aplicada.pdf · A Estatística, ramo da Matemática Aplicada, teve origem semelhante. Desde a Antiguidade

[email protected] 3

ESTATÍSTICA

1. CONCEITOS GERAIS 1.1 Panorama histórico

Todas as ciências têm suas raízes na história do homem. A Matemática, que é considerada “a ciência que une a clareza do raciocínio à síntese da linguagem” originou-se do convívio social, das trocas, da contagem, com caráter prático, utilitário, empírico. A Estatística, ramo da Matemática Aplicada, teve origem semelhante.

Desde a Antiguidade vários povos já registravam o número de habitantes, de nascimentos, de óbitos, faziam estimativas da riqueza individual e social, distribuíam equitativamente terras ao povo, cobravam impostos e realizavam inquéritos quantitativos por processos que hoje chamaríamos “estatísticas”.

Na Idade Média colhiam-se informações, geralmente com finalidades tributárias ou bélicas. A partir do século XVI começaram a surgir as primeiras análises sistemáticas de fatos sociais (batizados, casamentos, funerais) originando as primeiras tábuas e tabelas.

No século XVIII o estudo de tais fatos foi adquirindo uma feição verdadeiramente científica. Godofredo Achenwall batizou a nova ciência com o nome de Estatística, determinando o seu objetivo e suas relações com as ciências. As tabelas tornaram-se mais completas, surgiram as representações gráficas e o cálculo de probabilidades. A Estatística deixa de ser simples catalogação de dados numéricos coletivos para se tornar o estudo de como chegar a conclusões sobre o todo (população) partindo de observações de parte deste todo (amostras). Atualmente, o público leigo (leitor de revistas e jornais) posiciona-se em dois extremos divergentes e igualmente errôneos quanto à validade das conclusões estatísticas: ou crê em sua infalibilidade ou afirma que elas nada provam. Os que assim pensam ignoram os objetivos, o campo e o rigor do método estatístico; ignoram a Estatística, quer teórica quer prática, ou a conhecem muito superficialmente. Na era da energia nuclear, os estudos estatísticos têm avançado rapidamente e, com seus processos e técnicas, têm contribuído para a organização dos negócios e recursos do mundo moderno. 1.2 Definição

A Estatística é uma parte da Matemática Aplicada que fornece métodos para coleta, organização, descrição, análise e interpretação de dados e para a utilização dos mesmos na tomada de decisões. A parte da estatística que trata da coleta, organização e descrição dos dados é denominada Estatística Descritiva; a parte que lida com a análise e interpretação dos dados chama-se Estatística Indutiva ou Inferencial. Em geral, as pessoas, quando se referem ao termo estatística, o fazem no sentido da organização e descrição dos dados (estatística do Ministério de Educação e outras) desconhecendo que o aspecto essencial da Estatística é o de proporcionar métodos inferenciais, que permitam conclusões que transcendam os dados obtidos inicialmente. Assim, a análise e interpretação dos dados estatísticos tornam possível o diagnóstico de uma empresa (ex. escola), o conhecimento de seus problemas (condições

Page 4: Apostila de Estatistica Aplicadadavisilva.atwebpages.com/.../Apostila_Estatistica_Aplicada.pdf · A Estatística, ramo da Matemática Aplicada, teve origem semelhante. Desde a Antiguidade

[email protected] 4

de funcionamento, produtividade), a formulação de soluções apropriadas e um planejamento objetivo de ação. 1.3 A Estatística nas empresas No mundo atual, a empresa é uma das vigas-mestra da Economia dos povos. A direção de uma empresa, de qualquer tipo, incluindo as estatais e governamentais, exige de seu administrador a importante tarefa de tomar decisões, e o conhecimento e o uso da Estatística facilitarão seu tríplice trabalho de organizar, dirigir e controlar a empresa. Por meio de sondagem, de coleta de dados e de recenseamento de opiniões, podemos conhecer a realidade geográfica e social, os recursos naturais, humanos e financeiros disponíveis, as expectativas da comunidade sobre a empresa, e estabelecer suas metas, seus objetivos com maior possibilidade de serem alcançados a curto, médio e longo prazo. A Estatística ajudará em tal trabalho, como também na seleção e organização da estratégia a ser adotada no empreendimento e, ainda, na escolha de técnicas de verificação e avaliação da quantidade e da qualidade do produto e mesmo dos possíveis lucros e perdas. Tudo isso que se pensou, que se planejou, precisa ficar registrado, documentado para evitar esquecimentos, a fim de garantir o bom uso do tempo, da energia e do material e, ainda, para um controle eficiente do trabalho. O esquema do planejamento é o plano, que pode ser resumido, com auxílio da Estatística, em tabelas e gráficos, que facilitarão a compreensão visual dos cálculos matemático-estatísticos que lhes deram origem. O homem de hoje, em suas múltiplas atividades, lança mão de processos e técnicas estatísticas, e só estudando-os evitaremos o erro das generalizações apressadas a respeito de tabelas e gráficos apresentados em jornais, revistas e televisão, frequentemente cometido quando se conhece apenas “por cima” um pouco de Estatística. 1.4 Aplicações Contabilidade: auditorias Finanças: recomendações de investimento Marketing: pesquisa de mercado Produção: controle de qualidade Economia: “previsões” sobre o futuro da economia

Em vista dos tópicos abordados até o presente é importante ter em mente que é importante estudar estatística porque:

O raciocínio estatístico é amplamente utilizado no governo e na administração; A estatística é uma ferramenta para tomada de decisões; O conhecimento de estatística auxilia na leitura crítica de jornais, revistas,

artigos e outros. 1.5 Método Experimental x Método Estatístico Atualmente, quase todo acréscimo de conhecimento resulta da observação e do estudo. Apesar de que muito desse conhecimento pode ter sido observado inicialmente

Page 5: Apostila de Estatistica Aplicadadavisilva.atwebpages.com/.../Apostila_Estatistica_Aplicada.pdf · A Estatística, ramo da Matemática Aplicada, teve origem semelhante. Desde a Antiguidade

[email protected] 5

por acaso, a verdade é que desenvolvemos processos científicos para seu estudo e para adquirirmos tais conhecimentos. Sendo assim, Método é um conjunto de meios dispostos convenientemente para se chegar a um fim.

Dos métodos científicos, vamos destacar o método experimental e o estatístico. O método experimental consiste em manter constantes todas as causas (fatores), menos uma, e variar esta causa de modo que o pesquisador possa descobrir seus efeitos, caso existam. É o método preferido no estudo da Física, da Química. O método estatístico, diante da impossibilidade de manter as causas constantes, admite todas essas causas presentes variando-as, registrando essas variações e procurando determinar no resultado final que influência cabe a cada uma delas. É amplamente aplicado nas Ciências Sociais. Ex.: Determinação das causas que definem o preço de uma mercadoria.

Para aplicarmos o método experimental teríamos que fazer variar a quantidade da mercadoria e verificar se tal fato influenciaria seu preço. Porém, seria necessário que não houvesse alteração nos outros fatores. No método estatístico estes outros fatores (uniformidade dos salários, gosto do consumidor e outros) são levados em conta. 1.6 Fases do Método Estatístico

1.6.1 Definição do problema Determinar o objetivo da pesquisa, a população ou amostra a ser pesquisada e as características mensuráveis que se quer pesquisar.

1.6.2 Coleta de dados Após cuidadoso planejamento e a devida determinação das características mensuráveis do fenômeno coletivo que se quer pesquisar, é iniciada a coleta de dados numéricos necessários à sua descrição. A coleta pode ser direta e indireta.

Coleta direta: informativos de registro obrigatório (nascimentos, casamentos e óbitos, importação e exportação de mercadorias), prontuários de uma escola ou dados obtidos pelo próprio pesquisador (questionários); Coleta indireta: quando é inferida de elementos conhecidos (coleta

direta).

1.6.3 Crítica dos dados Obtidos os dados, eles devem ser cuidadosamente criticados, à procura de possíveis falhas e imperfeições, a fim de não incorrermos em erros grosseiros ou de certo vulto, que possam influir sensivelmente nos resultados.

1.6.4 Apuração dos dados Nada mais é do que a soma e o processamento dos dados obtidos e a disposição mediante critérios de classificação. Pode ser manual, eletromecânica ou eletrônica.

1.6.5 Exposição dos resultados Os dados devem ser apresentados em forma de tabelas ou gráficos, tornando mais fácil o exame daquilo que está sendo objeto de tratamento estatístico e ulterior obtenção de medidas típicas.

Page 6: Apostila de Estatistica Aplicadadavisilva.atwebpages.com/.../Apostila_Estatistica_Aplicada.pdf · A Estatística, ramo da Matemática Aplicada, teve origem semelhante. Desde a Antiguidade

[email protected] 6

1.6.6 Análise dos resultados Tirar conclusões sobre o todo (população) a partir de informações fornecidas por parte representativa do todo (amostra). 1.7 População e amostra

A Estatística tem por objetivo o estudo dos fenômenos coletivos e das relações entre eles. Fenômeno coletivo é aquele que se refere a um grande número de elementos, sejam pessoas ou coisas, os quais denominamos de população ou universo.

Conceito 1: Ao conjunto de entes (pessoas, coisas) portadores de, pelo menos, uma característica comum denominamos população estatística (ou universo estatístico).

Assim, os estudantes, por exemplo, constituem uma população, pois apresentam pelo menos uma característica comum: são os que estudam.

Como em qualquer estudo estatístico temos em mente pesquisar uma ou mais características dos elementos de alguma população, esta característica deve estar perfeitamente definida. E isto se dá quando, considerado um elemento qualquer, podemos afirmar, sem ambigüidade, se esse elemento pertence ou não à população. É necessário, pois, existir um critério de constituição da população, válido para qualquer pessoa, no tempo ou no espaço.

Por isso, quando pretendemos fazer uma pesquisa entre os alunos da Faculdade, precisamos definir quais são os alunos que formam o universo: os que atualmente ocupam as carteiras da escola, ou devemos incluir também os que já passaram pela escola? É claro que a solução do problema vai depender de cada caso particular.

De acordo com o seu tamanho, a população pode ser classificada pode ser classificada como finita ou infinita.

A população finita é aquela que conhecemos o seu número total de elementos. Por ex: estamos analisando o aproveitamento nas aulas de Estatística de uma turma de 50 alunos. Sabemos exatamente quantos alunos estão sendo observados. Logo, a população de alunos é finita.

No entanto, se a população possui um número infinito de elementos, ela é uma população infinita. Por ex: desejamos saber quantas pétalas têm, em média, as rosas que nascem no Brasil. Entretanto, não sabemos exatamente quantas são as rosas que nascem no Brasil. Logo, a população de rosas é infinita.

Em resumo, população é o conjunto de elementos que desejamos observar para obter determinada informação.

Na maioria das vezes, por impossibilidade ou inviabilidade econômica ou temporal, limitamos as observações referentes a uma determinada pesquisa a apenas uma parte da população. A essa parte proveniente da população em estudo denominamos amostra.

Uma amostra é um subconjunto finito de elementos extraídos de uma população.

Exemplo: Uma pesquisa típica de televisão utiliza uma amostra de 4000 lares e, com base nos resultados, formula conclusões acerca da população de todos os 98.750.324 lares da cidade XYZ.

Page 7: Apostila de Estatistica Aplicadadavisilva.atwebpages.com/.../Apostila_Estatistica_Aplicada.pdf · A Estatística, ramo da Matemática Aplicada, teve origem semelhante. Desde a Antiguidade

[email protected] 7

1.8 Tipos de variáveis

Variável é a característica de interesse dos elementos em estudo, sejam estes pessoas ou objetos. Os dados são os fatos e os números que são coletados, analisados e interpretados; são os resultados possíveis para a variável. Exemplos de variáveis são: nome, sexo, cor dos olhos, peso, estatura e outros. Uma variável pode ser:

a) QUALITATIVA – quando seus valores são expressos por atributos: sexo (masculino – feminino), cor da pele (branca, preta, amarela), cargo (supervisor, chefe, gerente, secretária)

As variáveis qualitativas podem ser: Nominais: não tem ordenamento, nem hierarquia. Ex. variável sexo, cor da pele; Ordinais: possuem ordenamento, hierarquia. Ex. variáveis cargo, escolaridade.

b) QUANTITATIVA – quando seus valores são expressos em números: salários

dos funcionários de uma determinada empresa, idade dos alunos de uma escola e outros. As variáveis quantitativas podem ser: Contínuas: podem assumir, teoricamente, qualquer valor entre dois limites.

Associada a medição. Ex. salário, altura, temperatura. Discretas: valores inteiros. Associada a contagem. Ex. número de alunos em

uma sala, quantidade de livros numa biblioteca. Obs: As operações aritméticas comuns só têm significado com dados quantitativos. Exercícios de aplicação: 1. Classifique as variáveis em qualitativas (nominais ou ordinais) e quantitativas (contínuas ou discretas): População: alunos de uma escola Variável: cor dos cabelos População: casais residentes em uma cidade Variável: número de filhos População: as jogadas de um dado. Variável: o ponto obtido em cada jogada População: peças produzidas por certa máquina Variável: número de peças produzidas por hora População: peças produzidas por certa máquina Variável: diâmetro externo População: bibliotecas da cidade de Curitiba Variável: número de volumes 2. Identifique cada número como discreto ou contínuo:

a. Cada cigarro FDB tem 16,13 mg de alcatrão.

Page 8: Apostila de Estatistica Aplicadadavisilva.atwebpages.com/.../Apostila_Estatistica_Aplicada.pdf · A Estatística, ramo da Matemática Aplicada, teve origem semelhante. Desde a Antiguidade

[email protected] 8

b. O altímetro do avião indica uma altitude de 10,54 m. c. Uma pesquisa efetuada com 1015 pessoas indica que 40 delas são assinantes de

um serviço de computador on-line. d. Dos 1000 consumidores pesquisados, 930 reconheceram a marca da sopa

Delícia. Interessante: Índices, coeficientes e taxas Índices são razões entre duas grandezas tais que uma não inclui a outra. Exemplos:

100xlógicaidadeCrono

lidadeMentantelectualQuocienteI

erfíciepopulaçãoemográficaDensidadeDsup

populaçãorendaandapercapt Re

Qual o quociente intelectual (Q.I) de uma pessoa com idade mental de 12 anos e

idade cronológica igual a 34 anos?

Coeficientes são razões entre o número de ocorrências e o número total; taxas são os coeficientes multiplicados por uma potência de 10 para tornar o resultado mais inteligível. Exemplos:

otalpopulaçãotsnascimentoneeNatalidadCoeficient

o

1000exeNatalidadCoeficientlidadeTaxadenata

rículasfinaldeMatnrovadosdealunosApnolartamentoEscedeAproveiCoeficient o

o

100olarxtamentoEscedeAproveiCoeficientEscolarveitamentoTaxadeApro

Calcule a taxa de aprovação de um professor de uma classe de 45 alunos,

sabendo que obtiveram aprovação 36 alunos.

Page 9: Apostila de Estatistica Aplicadadavisilva.atwebpages.com/.../Apostila_Estatistica_Aplicada.pdf · A Estatística, ramo da Matemática Aplicada, teve origem semelhante. Desde a Antiguidade

[email protected] 9

2. DISTRIBUIÇÃO DE FREQUÊNCIA

Uma distribuição de frequência é um sumário tabular de dados que mostra a frequência (ou o número) de observações em cada uma das diversas classes. Por classe entenda o intervalo de variação da variável.

Exemplos de distribuição de frequência: a) Para dados qualitativos Refrigerante Frequência (fi) Coca-Cola (CC) 18 Coca-Cola Light (CCL) 9 Fanta Uva (FU) 5 Pepsi-Cola (PC) 13 Sprite (SP) 5 Total 50 b) Para dados quantitativos Estaturas (cm) Frequência 150 ├154 4 154 ├158 9 158 ├162 11 162 ├166 8 166 ├170 5 170 ├174 3 Total 40 2.1 Elementos de uma distribuição de frequência

São elementos de uma distribuição de frequência: Classes (k) – classes de frequência ou simplesmente classes são

intervalos de variação da variável. Limites de classe – são os extremos de cada classe. Cada classe possui

um limite inferior (Li) e um limite superior (Ls).

Amplitude total da distribuição (AT) – diferença entre o limite superior

da última classe e o limite inferior da primeira classe. 24150174minmax LLAt

Page 10: Apostila de Estatistica Aplicadadavisilva.atwebpages.com/.../Apostila_Estatistica_Aplicada.pdf · A Estatística, ramo da Matemática Aplicada, teve origem semelhante. Desde a Antiguidade

[email protected] 10

Amplitude de um intervalo de classe (h) – diferença entre o limite superior da classe (Ls) e o limite inferior da classe (Li).

4150154 is LLh ou

4624

kAh T

Obs. Todas as classes apresentam a mesma amplitude.

Ponto médio de uma classe – metade da soma dos limites de classe.

Para a primeira classe temos: 1522

1541502

sii

LLx

Frequência simples ou absoluta (fi) – valor que representa o número de

dados de cada classe. Temos sempre que nf i , onde n é o número total de observações.

Frequência relativa (fr) – razão entre a frequência simples e a

frequência total.

nf

fff i

i

ir

Da distribuição acima temos que a frequência relativa da 3a classe é

275,04011

rf .

O propósito das freqüências relativas é o de permitir a análise ou facilitar comparações de dados.

Frequência acumulada (Fi) – total das frequências de todos os valores inferiores ao limite superior do intervalo de uma dada classe:

i 1 2 iF f f ... f A frequência acumulada da 3a classe da distribuição acima ilustrada é Fi= 24

(4+9+11), o que significa que existem 24 alunos com altura inferior a 162 cm (limite superior do intervalo da 3a classe).

Frequência acumulada relativa (Fr) – quociente entre a freqüência acumulada e o total de freqüências.

i

ir f

FF

Assim, para a terceira classe temos que 60,04024

rF

Page 11: Apostila de Estatistica Aplicadadavisilva.atwebpages.com/.../Apostila_Estatistica_Aplicada.pdf · A Estatística, ramo da Matemática Aplicada, teve origem semelhante. Desde a Antiguidade

[email protected] 11

Exercícios de aplicação 1. A tabela abaixo apresenta uma distribuição de frequência das áreas de 370 lotes de uma determinada cidade. Áreas (m2) Número de lotes 300 ├ 400 14 400 ├ 500 16 500 ├ 600 58 600 ├ 700 76 700 ├ 800 68 800 ├ 900 62 900 ├ 1000 48 1000 ├ 1100 22 1100 ├ 1200 6 Total 370 Com referência a essa tabela, determine: a amplitude total; o limite superior da 5a classe; o limite inferior da 8a classe; o ponto médio da 7a classe; a amplitude do intervalo da 2a classe; a frequência da 4a classe; a frequência relativa da 6a classe; a frequência acumulada da 5a classe; o número de lotes cuja área não atinge 700 m2; o número de lotes cuja área atinge e ultrapassa 800 m2; a percentagem dos lotes que não atingem 600 m2; a percentagem dos lotes cuja área é de 500 m2, no mínimo, mas inferior a 1000 m2; a classe do 72o lote. 2. Os valores da distribuição de frequência abaixo se referem aos preços de locação de sobrados de 2 quartos no bairro TYÇ extraídos da Folha do Amanhã no período de 19 a 25/02/01. Preço de locação (em R$) Quantidade de imóveis 130 ├ 185 3 185 ├ 240 7 240 ├ 295 4 295 ├ 350 6 350 ├ 405 9 405 ├ 460 1 Total 30 Responda: Qual a amplitude total da distribuição? Qual a amplitude da 3a classe? Quantos sobrados possuem seu preço de locação entre R$ 240,00 (inclusive) e R$ 405,00? Qual a frequência relativa da 6a classe? Qual a frequência acumulada da 4a classe?

Page 12: Apostila de Estatistica Aplicadadavisilva.atwebpages.com/.../Apostila_Estatistica_Aplicada.pdf · A Estatística, ramo da Matemática Aplicada, teve origem semelhante. Desde a Antiguidade

[email protected] 12

Qual o percentual de sobrados cujo preço de locação está entre R$ 240,00 (inclusive) e R$ 460,00? 3. Uma distribuição de frequência está representada abaixo: Salário dos funcionários da empresa ABC Faixa salarial, em R$ fi fr Fi Fr 0,00 ├ 240,00 4 240,00 ├ 480,00 8 480,00 ├ 720,00 14 720,00 ├ 960,00 28 960,00 ├ 1200,00 21 1200,00 ├ 1440,00 12 1440,00 ├ 1680,00 7 Acima de 1680,00 6 100 a) Complete as lacunas restantes. b) Com base na tabela completa responda: Qual o número de pessoas que recebe menos que R$ 960,00? Qual a porcentagem de pessoas que recebe entre R$ 1200,00 (inclusive) e R$ 1440,00? Qual o número de pessoas que recebe de R$ 720,00 para cima? 2.2 Síntese de dados qualitativos

Exemplo de aplicação: Foram coletados dados relativos a 50 compras de refrigerantes. Os produtos envolvidos na pesquisa foram: Coca-Cola (CC), Coca-Cola Light (CCL), Pepsi-Cola (PC), Fanta Uva (FU) e Sprite (SP). CC CC CC CC CC CC SP CC CC PC CCL FU FU CC CCL CC FU CC CCL CCL PC CCL SP SP CC CC PC CC PC FU CCL PC CC CC SP PC CCL PC PC PC CC PC CCL CCL PC CC PC FU PC SP Elaboração da distribuição de frequência Passo 1: Distribuição das classes e contagem Refrigerante Frequência (fi) Coca-Cola (CC) 18 Coca-Cola Light (CCL) 9 Fanta Uva (FU) 5 Pepsi-Cola (PC) 13 Sprite (SP) 5 Total 50 Passo 2: Cálculo das frequências relativa (fr) e percentual (fp)

Page 13: Apostila de Estatistica Aplicadadavisilva.atwebpages.com/.../Apostila_Estatistica_Aplicada.pdf · A Estatística, ramo da Matemática Aplicada, teve origem semelhante. Desde a Antiguidade

[email protected] 13

Refrigerante Frequência (fi) Frequência relativa (fr)

Frequência acumulada simples (Fi)

Frequência acumulada relativa (Fr)

Coca-Cola 18 Coca-Cola Light 9 Fanta Uva 5 Pepsi Cola 13 Sprite 5 Total 50 Passo 3: Representação gráfica

Distribuição das compras de 50 refrigerantes

0

0,1

0,2

0,3

0,4

1 2 3 4 5 6

Refrigerantes

Freq

uênc

ia re

lativ

a

Exercício de aplicação 1. Foi realizada uma pesquisa para avaliação do restaurante do Zé. Uma das perguntas avaliadas foi: “Qual a sua impressão sobre a qualidade da comida apresentada no restaurante do Zé?” Foram entrevistadas 50 pessoas e as respostas obtidas foram as seguintes (E= excelente, MB= muito bom, B= bom, R= regular, F= fraco): B E B E E R E MB E E MB R R R R MB R B B E MB B B E F E MB E E R E MB R MB E E E B B MB E F E MB MB E E R MB MB a) Construa a distribuição de frequência simples; b) Represente graficamente as distribuições; c) Interprete os resultados obtidos. 2.3 Síntese de dados quantitativos

2.3.1 Distribuição de frequência sem intervalos de classe

Quando se trata de variável quantitativa discreta de variação relativamente pequena, cada valor pode ser tomado como um intervalo de classe e, nesse caso, a distribuição é chamada distribuição sem intervalos de classe, tomando a seguinte forma:

Page 14: Apostila de Estatistica Aplicadadavisilva.atwebpages.com/.../Apostila_Estatistica_Aplicada.pdf · A Estatística, ramo da Matemática Aplicada, teve origem semelhante. Desde a Antiguidade

[email protected] 14

Variável de estudo (xi) Frequência (fi) x1 f1 x2 f2 ... ... xn fn fi = n

Exemplo de aplicação: Uma empresa de prestação de serviços fez uma pesquisa onde seus 30 principais clientes, de um universo de 150 clientes, avaliaram o atendimento dando notas inteiras de valor entre 0 e 10. Os resultados obtidos estão listados na tabela abaixo (tabela primitiva). 5 9 7 4 3 6 2 3 0 3 3 8 7 4 2 2 1 3 2 1 1 3 2 5 4 3 4 1 2 1 Elaboração da distribuição de freqüência sem intervalos de classe

A variável em estudo é nota (valores inteiros de 0 a 10), sendo, para o caso em

questão, uma variável quantitativa discreta. Vamos então construir a distribuição de frequência utilizando dados agrupados sem intervalo de classe. Passo 1: Elaboração do rol (opcional). O rol consiste na ordenação dos dados coletados em ordem crescente. 0 2 3 3 5 1 2 3 4 6 1 2 3 4 7 1 2 3 4 7 1 2 3 4 8 1 2 3 5 9 Passo 2: Distribuição das classes e contagem. Cálculo das frequências relativa (fr) e percentual (fp). Notas Frequência (fi) Frequência relativa

(fr) Frequência percentual (fp)

0 1 0,033 3,3 1 5 0,167 16,7 2 6 0,200 20,0 3 7 0,233 23,3 4 4 0,133 13,3 5 2 0,067 6,7 6 1 0,033 3,3 7 2 0,067 6,7 8 1 0,033 3,3

Page 15: Apostila de Estatistica Aplicadadavisilva.atwebpages.com/.../Apostila_Estatistica_Aplicada.pdf · A Estatística, ramo da Matemática Aplicada, teve origem semelhante. Desde a Antiguidade

[email protected] 15

9 1 0,033 3,3 Total 30 1,000 100 Passo 3: Representação gráfica

Na distribuição de frequência para dados agrupados sem intervalo de classe não há perda de informação.

2.3.2 Distribuição de freqüência com intervalos de classe

Quando se trata de variável quantitativa contínua utiliza-se a distribuição de frequência com intervalos de classe. Esta toma a seguinte forma: Variável de estudo (xi) Frequência (fi) x1 ├ x2 f1 x2 ├ x3 f2 ... ... xm ├ xn fn fi = n

Exemplo de aplicação: Suponha que desejamos realizar um estudo sobre estaturas de alunos de determinado grupo escolar e que este grupo seja composto de 40 alunos. A variável de interesse é quantitativa contínua – peso. Os dados coletados são listados abaixo (valor de altura em cm) e constituem a tabela primitiva. Vamos construir então a distribuição de frequência considerando os dados agrupados com intervalos de classe. 166 160 161 150 162 160 165 167 160 164 162 161 168 163 156 173 160 155 168 164 155 152 163 160 155 155 169 151 164 170 154 161 156 172 153 157 156 158 161 158 Elaboração de distribuição de freqüência com intervalos de classe Passo 1: Após a coleta e listagem dos dados na tabela primitiva o passo seguinte é a elaboração do rol. O rol consiste na ordenação dos dados coletados em ordem crescente.

Page 16: Apostila de Estatistica Aplicadadavisilva.atwebpages.com/.../Apostila_Estatistica_Aplicada.pdf · A Estatística, ramo da Matemática Aplicada, teve origem semelhante. Desde a Antiguidade

[email protected] 16

150 154 155 157 160 161 162 164 166 169 151 155 156 158 160 161 162 164 167 170 152 155 156 158 160 161 163 164 168 172 153 155 156 160 160 161 163 165 168 173 Passo 2: Elaborado o rol determina-se o número de classes da distribuição: Este número pode ser determinado (a) por método empírico, (b) pela regra de Sturges ( nk log3,31 ) ou (c) regra prática nk . Pela regra prática: 640 nk . Inicia-se então a montagem da distribuição de frequência.

Passo 3: Determina-se a amplitude do intervalo de classe 46

150173

kAh T e

definem-se os limites inferiores e superiores de cada classe. Para a primeira classe, temos que o limite inferior Li é 150 e o limite superior é Ls= Li + h= 150 + 4=154. Para determinação dos limites inferior e superior para as classes seguintes o procedimento é o mesmo. Tem-se então: Estaturas (cm) Frequência (fi) 150 ├154 154 ├158 158 ├162 162 ├166 166 ├170 170 ├174 Total Passo 4: Procede-se a contagem dos elementos pertencentes a cada classe para determinar a coluna de frequência simples, frequência relativa e frequência acumulada.

Estaturas (cm)

fi xi fr Fi Fr

150 ├154 4 154 ├ 158 9 158 ├ 162 11 162 ├ 166 8 166 ├ 170 5 170 ├ 174 3 Total 40

Passo 5: Elabora-se o histograma.

Page 17: Apostila de Estatistica Aplicadadavisilva.atwebpages.com/.../Apostila_Estatistica_Aplicada.pdf · A Estatística, ramo da Matemática Aplicada, teve origem semelhante. Desde a Antiguidade

[email protected] 17

Histograma

02468

1012

150┤154

154┤158

158┤162

162┤166

166┤170

170┤174

Estatura dos alunos (em cm)

Freq

uênc

ia

Ao agruparmos os valores da variável desta forma ganhamos em simplicidade, mas perdemos os pormenores. O que pretendemos com a construção dessa distribuição é realçar o que há de essencial nos dados e, também, tornar possível o uso de técnicas analíticas para sua total descrição.

Em resumo, para elaborar uma distribuição de frequência para dados quantitativos os seguintes passos devem ser seguidos:

a. A partir da tabela primitiva, elaborar o rol dos dados; b. Determinar o número de classes (k). Este número pode ser determinado (a) por

método empírico, (b) pela Regra de Sturges ( nk log3,31 ) ou (c) regra prática nk ;

c. Determinar a amplitude do intervalo de classe (AT); d. Determinar os limites inferiores e superiores de cada classe; e. Realizar a contagem dos elementos de cada classe; f. Montar a distribuição de frequência nas formas tabular e gráfica.

Exercícios de aplicação 1. Uma confecção contratou uma empresa para fazer uma pesquisa para saber como varia a estatura das pessoas adultas de determinado bairro da sua cidade, a fim de saber como encaminhar a produção das roupas que produz. A pesquisa, feita com uma amostra de 40 adultos escolhidos ao acaso, revelou os seguintes dados: Estaturas (em m) de 40 pessoas adultas 1,66 1,50 1,62 1,79 1,64 1,85 1,68 1,65 1,61 1,68 1,63 1,61 1,68 1,76 1,70 1,70 1,75 1,62 1,63 1,70 1,58 1,57 1,73 1,82 1,72 1,68 1,70 1,70 1,67 1,67 1,56 1,58 1,69 1,65 1,58 1,65 1,64 1,64 1,64 1,69

a. Qual a variável em questão? Que tipo de variável é esta? b. Elabore uma distribuição de frequência relativa. c. Elabore o histograma de frequência relativa.

2. Os dados para os números de unidades produzidas por um determinado funcionário da área de produção durante vinte dias são apresentados a seguir: 160 170 181 156 176 148 198 179 162 150

Page 18: Apostila de Estatistica Aplicadadavisilva.atwebpages.com/.../Apostila_Estatistica_Aplicada.pdf · A Estatística, ramo da Matemática Aplicada, teve origem semelhante. Desde a Antiguidade

[email protected] 18

162 156 179 178 151 157 154 179 148 156 Sintetize os dados construindo:

a. Uma distribuição de frequência relativa b. Uma distribuição de frequência relativa acumulada c. Os respectivos histogramas para os itens a e b.

3. O diretor de produção de uma grande fábrica de chocolates resolveu fazer uma inspeção surpresa na linha para verificar o peso dos chocolates, os quais deveriam ter 200 1 g. Para tanto, coletou uma amostra com 40 unidades e verificou, um a um, o peso dos chocolates. Os resultados obtidos foram os seguintes: 199,4 198,5 199,7 200,3 197,8 199,2 201,2 200,5 198,2 197,9 199,8 201,4 199,4 199,4 200,1 198,9 197,9 199,2 200,2 200,3 199,7 199,5 197,8 199,5 199,5 199,1 200,4 198,5 198,9 200,3 198,6 199,2 198,6 198,8 200,1 199,1 198,8 201,4 199,8 198,5 Organizar os resultados um uma tabela de frequência acumulada relativa e fazer o respectivo histograma. Como diretor de produção avaliar os seguintes itens:

a. Quantos % do total da amostra pesam menos do que 199 g? b. Quantos % pesam mais do que 201 g? c. Sabendo que o valor admitido é 200 1 g como você avalia a sua produção?

4. O IBOPE realizou levantamento estatístico, a respeito de índices de audiência de um determinado programa “A Hora da Hora” da emissora CCC, durante 50 dias. A tabela abaixo fornece os dados obtidos, através de pesquisa realizada pelo IBOPE, referentes a índices de audiência (de 0 a 100 pontos) para cada um dos 50 dias de acompanhamento. 15.2 14.6 27.9 24.9 20.0 43.5 30.7 30.0 35.7 40.9 23.4 17.8 26.9 30.8 19.9 36.8 33.4 19.8 29.6 38.2 25.1 42.0 35.2 15.6 25.5 29.7 27.8 14.6 22.1 24.3 30.1 30.1 22.1 24.4 28.7 35.0 26.1 28.2 19.4 28.7 28.0 25.3 31.8 31.0 28.3 13.5 32.1 25.4 26.7 36.8

a. Com base nos dados apresentados construa histograma de frequência relativa representando os índices de audiência do programa “A Hora da Hora”.

b. Retire, do histograma obtido, o máximo de informações e conclusões possíveis sobre os índices de audiência do programa.

5. Uma empresa de prestação de serviços fez uma pesquisa onde seus 60 principais clientes de um universo de 1000 clientes avaliaram o atendimento dando notas inteiras de valor entre 0 e 10. Os resultados obtidos se encontram na tabela abaixo. 5 9 7 4 3 6 5 8 2 3 6 2 3 0 3 0 2 1 3 1 3 8 7 4 2 3 2 4 7 3 2 1 3 2 1 0 1 2 2 2 1 3 2 5 4 3 6 2 8 2

Page 19: Apostila de Estatistica Aplicadadavisilva.atwebpages.com/.../Apostila_Estatistica_Aplicada.pdf · A Estatística, ramo da Matemática Aplicada, teve origem semelhante. Desde a Antiguidade

[email protected] 19

3 4 1 2 1 6 1 3 2 1

a. Com base nestes resultados elabore tabelas de freqüência absoluta para dados agrupados sem intervalo de classe e dados agrupados com intervalo de classe.

b. Represente as duas tabelas na forma de histograma. c. Analise seus resultados o obtenha conclusões a respeito desta pesquisa.

6. Ao final de um dia de trabalho a fábrica de camisetas Arara produziu 5000 peças. O chefe da qualidade resolve realizar inspeção para verificar a quantidade de defeitos/ peça. Entre os itens verificados estão acabamento, estampa, costura, existência de rasgo e outros. Foram tomadas 50 camisetas e a quantidade de defeitos/ peça foi assim registrada: 0 1 2 3 2 3 0 1 0 2 1 0 0 1 0 0 1 2 2 3 1 4 1 2 0 2 0 2 1 2 0 0 1 0 0 0 5 2 3 1 1 1 0 2 1 1 2 0 1 0 Construa a tabela de frequência relativa com seu respectivo histograma considerando dados agrupados sem intervalo de classe. Como chefe da qualidade avalie: qual o percentual de zero defeitos/peça obtido? qual o percentual de peças com menos de três defeitos? qual o percentual de peças com 5 defeitos? Sabendo que a norma exige que o percentual máximo admissível de peças com 5 defeitos seja de 1,5% avalie a produção do dia. 7. Para os exercícios abaixo listados: a) elabore distribuição de frequência com fi, fr, Fi e Fr ,b) construa os respectivos histogramas e c) interprete os resultados obtidos. a) Os seguintes dados referem-se à média salarial (em R$) dos funcionários contratados pelas melhores empresas (as que mais se destacaram em 1998), segundo dados da revista Exame. Média salarial (em R$)

1638 1894 756 1398 21692154 1104 1351 1319 28461271 1004 1330 3296 5882415 516 2622 802 31531317 1715 1137 1440 16743957 2000 2634 1230 3500704 780 585 3050 1158

b) As cotações a seguir referem-se às variações do dólar turismo no período de 03/01 a 18/02 do ano corrente.

Page 20: Apostila de Estatistica Aplicadadavisilva.atwebpages.com/.../Apostila_Estatistica_Aplicada.pdf · A Estatística, ramo da Matemática Aplicada, teve origem semelhante. Desde a Antiguidade

[email protected] 20

Cotação do dólar 03/01 a 18/021,78 1,82 1,8 1,79 1,781,73 1,72 1,72 1,77 1,821,81 1,79 1,77 1,73 1,731,72 1,73 1,8 1,82 1,771,77 1,73 1,77 1,74 1,721,77 1,78 1,75 1,73 1,741,73 1,72 1,72 1,72

c) Os valores que seguem referem-se ao preço de locação de sobrados de 2 quartos no bairro Boqueirão, extraídos da Folha do Boqueirão referente ao período de 19 a 26/01/00. Preço de locação imóvel de 2 q. no Boqueirão

300 200 250 270 350450 190 130 300 350170 250 350 350 400200 230 250 300 370180 200 200 350 350220 340 400 330 300

d) Num restaurante os pratos que constavam no cardápio perfaziam um total de 50 itens diferentes para o cliente escolher. Pesquisado o preço dos itens (em R$), obteve-se a seguinte constatação: 12 15 18 26 14 17 16 14 18 19 20 19 16 14 15 16 17 13 24 23 25 17 15 19 22 18 14 15 16 19 14 18 16 15 18 14 16 17 15 16 16 15 17 14 15 19 20 16 14 18 e) Dentre os 40 postos de Saúde da grande Curitiba, os valores abaixo mostram quantas são atendidas em cada um destes postos. 18 24 30 28 26 23 21 29 22 23 22 25 27 29 20 19 22 24 25 27 23 20 23 24 26 28 18 22 24 26 25 21 26 22 30 27 23 20 21 23 f) Os dados sobre a porcentagem de desemprego no município de São Paulo, no período de 92 a 95, foram: 10,6 12,3 13,6 14,5 15,0 15,1 14,6 15,0 15,1 14,5 13,6 13,5 13,4 14,0 14,6 14,7 15,0 14,4 13,7 12,9 12,7 12,1 13,2 12,1 14,1 14,0 12,1 14,3 12,1 13,1 13,5 13,3 12,8 11,9 11,5 11,1 12,8 11,7 12,0 12,6

Page 21: Apostila de Estatistica Aplicadadavisilva.atwebpages.com/.../Apostila_Estatistica_Aplicada.pdf · A Estatística, ramo da Matemática Aplicada, teve origem semelhante. Desde a Antiguidade

[email protected] 21

3. MEDIDAS DE POSIÇÃO

Medidas de posição são estatísticas que representam uma série de dados orientando-nos quanto à posição da distribuição em relação ao eixo horizontal.

As medidas de posição mais importantes são as medidas de tendência central, que recebem tal denominação pelo fato de os dados observados tenderem, em geral, a se agrupar em torno dos valores centrais. Dentre as medidas de tendência central, destacamos a média, a mediana e a moda.

As outras medidas de posição são as separatrizes, que englobam a própria mediana, os quartis e os percentis. 3.1 Medidas de tendência central

3.1.1 Média Média (aritmética), x , para dados não-agrupados

É a medida de tendência central mais utilizada. É a soma dos valores dividida pelo número deles.

nxxx

nx

x ni ...21

Exemplo 1. Determinar a média aritmética dos conjuntos de valores abaixo: 70, 80, 120 5, 8, 10, 12, 15 Exemplo 2. Em uma empresa de componentes eletrônicos, a exportação nos últimos 4 anos, em milhares de dólares, foi U$ 800,00, U$ 760,00, U$ 880,00 e U$ 984,00. Determinar a média das exportações dessa empresa nos últimos 4 anos.

O processo de cálculo da média aritmética é o mesmo, quer se trate de um conjunto de valores que traduzam representações amostrais, quer se trate de todos os valores de uma população. Temos então,

Média amostral n

xx e média populacional

Nx

Propriedades da média

A média de um conjunto de números pode sempre ser calculada. Para um dado conjunto de números, a média é única. A média é sensível a todos os valores do conjunto. Assim, se um valor se

modifica, a média também se modifica. A soma dos desvios dos números a contar da média é zero: 0xxi

Vantagens/ desvantagens da utilização da média Vantagens Desvantagens Fácil de compreender e calcular É afetada por valores extremos Utiliza todos os valores da variável É necessário conhecer todos os valores da

variável

Page 22: Apostila de Estatistica Aplicadadavisilva.atwebpages.com/.../Apostila_Estatistica_Aplicada.pdf · A Estatística, ramo da Matemática Aplicada, teve origem semelhante. Desde a Antiguidade

[email protected] 22

É um valor único Fácil de incluir em equações matemáticas

A média é utilizada quando: Desejamos obter a medida de posição que possui maior estabilidade; Houver necessidade de um tratamento algébrico ulterior.

Exemplo de aplicação: Em controle de qualidade a média é utilizada para determinar se o processo está operando ao redor de um valor esperado, o alvo. Média (aritmética) em distribuições de freqüência a) Dados agrupados sem intervalos de classe

i

ii

ffx

x

onde ii fx é a média aritmética ponderada pela respectiva freqüência absoluta. Exemplo 3: Considere a distribuição relativa de 34 famílias de 4 filhos, tomando para variável o número de filhos do sexo feminino. Número de meninas (xi) Freqüência (fi) xi fi 0 2 1 6 2 10 3 12 4 4 34

Calculando,

i

ii

ffx

x

Sendo x uma variável quantitativa discreta, como interpretar o resultado obtido, 2 meninos e 3 décimos de menino? O valor médio 2,3 meninos sugere, neste caso, que o maior número de famílias tem 2 meninos e 2 meninas, sendo, porém, a tendência geral de uma leve superioridade numérica em relação ao número de meninos. b) Dados agrupados com intervalos de classe

i i

i

x fx

f

onde xi é o ponto médio da classe. Exemplo 4. Considere a distribuição de estaturas de 40 alunos. Estatura (cm) xi fi Pm fi 150 ├ 154 4 154 ├ 158 9

Page 23: Apostila de Estatistica Aplicadadavisilva.atwebpages.com/.../Apostila_Estatistica_Aplicada.pdf · A Estatística, ramo da Matemática Aplicada, teve origem semelhante. Desde a Antiguidade

[email protected] 23

158 ├ 162 11 162 ├ 166 8 166 ├ 170 5 170 ├ 174 3 40

Calculando, i i

i

x fx

f

Exemplo 5. Em uma pesquisa realizada numa determinada Empresa quanto aos salários médios de seus funcionários, verificou-se o seguinte resultado: Salários (R$) xi fi Pm fi 240 ├ 480 15 480 ├ 720 22 720 ├ 960 30 960 ├ 1200 18 1200 ├ 1440 15 100 Com base nestes resultados determine o salário médio desses funcionários. Exercícios de aplicação - Média 1. Um produto é vendido em três supermercados por R$ 13,00/kg, R$ 13,20/kg e R$ 13,50/kg. Determine quantos R$/kg se paga em média pelo produto. 2. Determine a média de cada uma das duas amostragens e compare os dois conjuntos de resultados: a) Tempos de espera de clientes no Banco Jefferson Valley (onde todos os clientes formam uma fila única) e no Banco Providence (onde os clientes entram em três filas de guichês diferentes): Jefferson Valley: 6,5 6,6 6,7 6,8 7,1 7,3 7,4 7,7 7,7 7,7 Providence: 4,2 5,4 5,8 6,2 6,7 7,7 7,7 8,5 9,3 10,0 b) Amostras das idades (em anos) de carros de alunos e carros de professores e funcionários da faculdade, obtidas na faculdade XCV: Alunos: 10 4 5 2 9 7 8 8 16 4 13 12 Professores/funcionários: 7 10 4 13 23 2 7 6 6 3 9 4 3. O salário de 40 funcionários de um escritório está distribuído segundo o quadro abaixo. Calcule o salário médio destes funcionários. Salário (R$)

Número de funcionários fi

400 ├ 500 12 500 ├ 600 15 600 ├ 700 8 700 ├ 800 3

Page 24: Apostila de Estatistica Aplicadadavisilva.atwebpages.com/.../Apostila_Estatistica_Aplicada.pdf · A Estatística, ramo da Matemática Aplicada, teve origem semelhante. Desde a Antiguidade

[email protected] 24

800 ├ 900 1 900 ├ 1000 1 Total 40 4. Uma imobiliária gerencia o aluguel de residências particulares segundo o quadro abaixo. Calcule o valor médio do aluguel por residência. Aluguel (R$)

Número de casas fi

0 ├ 200 30 200 ├ 400 52 400 ├ 600 28 600 ├ 800 7 800 ├ 1000 3 Total 120 5. Calcule o número médio de acidentes por dia em uma determinada esquina. Número de acidentes por dia xi

Número de dias fi

0 30 1 5 2 3 3 1 4 1 Total 50 6. Calcule a média de idade para a série representativa da idade de 50 alunos de uma classe do 1o ano de uma Faculdade. Idade (anos)

Número de alunos fi

17 3 18 18 19 17 20 8 21 4 Total 50 7. Uma loja de departamentos selecionou um grupo de 54 notas fiscais, durante um dia, e obteve o quadro abaixo. Determine o valor médio da série. Consumo por nota (R$)

Número de notas fi

0 ├ 50 10 50 ├100 28 100 ├150 12

Page 25: Apostila de Estatistica Aplicadadavisilva.atwebpages.com/.../Apostila_Estatistica_Aplicada.pdf · A Estatística, ramo da Matemática Aplicada, teve origem semelhante. Desde a Antiguidade

[email protected] 25

150 ├ 200 2 200 ├ 250 1 250 ├ 300 1 Total 54 8. O consumo de energia elétrica, verificado em 250 residências de famílias de classe média, com dois filhos, revelou a seguinte distribuição. Consumo (kWh)

Número de funcionários fi

0 ├ 50 2 50 ├ 100 15 100 ├ 150 32 150 ├ 200 47 200 ├ 250 50 250 ├ 300 80 300 ├ 350 24 Total 250 Calcule a média da distribuição e interprete o valor obtido.

3.1.2 Mediana Mediana (Md) para dados não-agrupados A mediana é definida como o número que se encontra no centro de uma série de números, estando estes dispostos segundo uma ordem. Em outras palavras, a mediana de um conjunto de valores, ordenados segundo uma ordem grandeza, é o valor situado de tal forma no conjunto que o separa em dois subconjuntos de mesmo número de elementos. Para determinar a mediana ordenam-se os valores em ordem crescente (do mais baixo ao mais alto). Se a quantidade de valores n for um número ímpar a mediana será o

valor da variável situado na posição 2

1n ; se a quantidade de valores n for um

número par a mediana será igual ao resultado de dividir por dois a soma dos valores

das posições 2n e 1

2

n .

Exemplo 6. Calcular a mediana dos conjuntos de dados abaixo: 5, 6, 8 7, 8, 9, 10 A mediana é uma medida resistente, pois está relacionada apenas com a ordem dos valores da variável. Em outras palavras, não é sensível a valores extremos. Vantagens/ desvantagens da utilização da mediana Vantagens Desvantagens Fácil de calcular Difícil de incluir em equações matemáticas

Page 26: Apostila de Estatistica Aplicadadavisilva.atwebpages.com/.../Apostila_Estatistica_Aplicada.pdf · A Estatística, ramo da Matemática Aplicada, teve origem semelhante. Desde a Antiguidade

[email protected] 26

Não é afetada pelos valores extremos Não utiliza todos os valores da variável É um valor único Empregamos a mediana quando: Desejamos obter o ponto que divide a distribuição em partes iguais; Há valores extremos que afetam de uma maneira acentuada a média; A variável em estudo é salário, renda anual e valores de bens. Exemplo de aplicação: Se quisermos conhecer o valor típico dos salários, de uma determinada categoria de trabalhadores, utilizaremos a mediana. Exemplo 7. Calcular a média e a mediana a partir da tabela abaixo. Os dados são referentes a 5 funcionários do Depto. Pessoal da Empresa DSF. Funcionário Salário (R$) João 2100 Maria 800 Sebastião 200 José 400 Manoel 500 Mediana em distribuições de freqüência

Se os dados se agrupam em uma distribuição de frequência, o cálculo da mediana se processa de modo muito semelhante àquele dos dados não-agrupados, implicando, porém, a determinação prévia das frequências acumuladas. Ainda aqui, temos que determinar um valor tal que divida a distribuição em dois grupos que contenham o mesmo número de elementos. Para o caso de uma distribuição, porém, a ordem, a partir de qualquer um dos extremos,

é dada por 2if

a) Dados agrupados sem intervalos de classe Neste caso, é o bastante identificar a frequência acumulada imediatamente superior à metade da soma das frequências. A mediana será aquele valor da variável que corresponde a tal frequência acumulada. Exemplo 8. Número de meninas fi Fi 0 2 1 6 2 10 3 12 4 4 34 b) Dados agrupados com intervalos de classe

Page 27: Apostila de Estatistica Aplicadadavisilva.atwebpages.com/.../Apostila_Estatistica_Aplicada.pdf · A Estatística, ramo da Matemática Aplicada, teve origem semelhante. Desde a Antiguidade

[email protected] 27

Neste caso, o problema consiste em determinar o ponto do intervalo em que está

compreendida a mediana. Para tanto, temos inicialmente que determinar a classe na qual se acha a mediana – classe mediana.

Na prática, utiliza-se o seguinte procedimento: a. Determina-se as freqüências acumuladas.

b. Calcula-se iMe

f nP2 2

c. Marca-se a classe correspondente à freqüência acumulada imediatamente superior a MeP - classe mediana – e, em seguida, emprega-se a seguinte equação:

|Me a

d iMe

P F .hM L

f

onde:

iL = limite inferior da classe mediana |

aF = freqüência acumulada da classe anterior à classe mediana

Mef = freqüência simples da classe mediana h = amplitude do intervalo de classes Exemplo 9. Estatura (cm) fi Fi 150 ├ 154 4 154 ├ 158 9 158 ├ 162 11 162 ├ 166 8 166 ├ 170 5 170 ├ 174 3 40 Da equação acima, temos:

MeP =

iL = |

aF =

Mef = h =

Substituindo em |

Me ad i

Me

P F .hM L

f

temos:

Exercícios de aplicação - Mediana Calcular a mediana para todos os exercícios listados na secção 3.1.1 (Média).

Page 28: Apostila de Estatistica Aplicadadavisilva.atwebpages.com/.../Apostila_Estatistica_Aplicada.pdf · A Estatística, ramo da Matemática Aplicada, teve origem semelhante. Desde a Antiguidade

[email protected] 28

3.1.3 Moda Moda - oM , para dados não-agrupados

A moda é o valor que ocorre com maior freqüência num conjunto de dados. Exemplo 10. Calcular a moda dos conjuntos de valores abaixo: 10, 10, 8, 6, 10 3, 5, 6, 7, 9 Vantagens/ desvantagens da utilização da moda: Vantagens Desvantagens Fácil de calcular Pode estar afastada do centro dos valores Não é afetada pelos valores extremos Não utiliza todos os valores da variável É um valor único Difícil de incluir em equações matemáticas A variável pode ter mais de uma moda Algumas variáveis não tem moda

A moda é utilizada quando: Desejamos obter uma medida rápida e aproximada de posição; A medida de posição deve ser o valor mais típico da distribuição.

Exemplo de aplicação: Na distribuição do consumo de um mesmo produto com diferentes apresentações a moda mostra a apresentação mais consumida. Moda em distribuições de frequência a) Dados agrupados sem intervalos de classe Exemplo 11.

Número de meninas fi 0 2 1 6 2 10 3 12 4 4 34

b) Dados agrupados com intervalos de classe A classe que apresenta maior freqüência é denominada classe modal. Calcula-se através da equação:

i So

L LM2

onde: iL = limite inferior da classe modal

SL = limite superior da classe modal

Page 29: Apostila de Estatistica Aplicadadavisilva.atwebpages.com/.../Apostila_Estatistica_Aplicada.pdf · A Estatística, ramo da Matemática Aplicada, teve origem semelhante. Desde a Antiguidade

[email protected] 29

Exemplo 12.

Estatura (cm) fi 150 ├ 154 4 154 ├ 158 9 158 ├ 162 11 162 ├ 166 8 166 ├ 170 5 170 ├ 174 3 40

Exercícios de aplicação – Moda Calcular a moda para todos os exercícios listados na secção 3.1.1 (Média). Em resumo: Média Mediana Moda Dados não-agrupados n

xx i

n ímpar valor da variável situada na posição

21n

n par dividir por 2 a soma dos valores situados nas

posições 2n e

21n

Valor que ocorre com maior frequência.

Dados agrupados sem intervalo de classe

i

ii

ffx

x Determinam-se as freqüências acumuladas;

Calcula-se 2if ;

Marca-se a classe mediana; Verificar valor da variável correspondente.

Identificar a classe modal; Verificar a coluna da variável correspondente.

Dados agrupados com intervalo de classe

i i

i

x fx

f

Determinam-se as freqüências acumuladas; Calcula-

se iMe

f nP2 2

;

Marca-se a classe mediana – e, em seguida, emprega-se a

Identificar a classe modal;

i So

L LM2

Page 30: Apostila de Estatistica Aplicadadavisilva.atwebpages.com/.../Apostila_Estatistica_Aplicada.pdf · A Estatística, ramo da Matemática Aplicada, teve origem semelhante. Desde a Antiguidade

[email protected] 30

seguinte equação:

|Me a

d iMe

P F .hM L

f

3.2 Medidas separatrizes

Quartis Denominamos quartis os valores de uma série que a dividem em quatro partes

iguais. Há, portanto, três quartis: O primeiro quartil (Q1) – valor situado de tal modo na série que uma quarta parte (25%) dos dados é menor do que ele e a três partes restantes (75%) são maiores. O segundo quartil (Q2) – valor situado de tal modo na série que metade (50%) dos dados é menor do que ele e a metade restante (50%) é maior. O segundo quartil coincide com a mediana. O terceiro quartil (Q3) – valor situado de tal modo na série que as três quartas partes (75%) dos dados é menor do que ele e a quarta parte restante (25%) é maior.

Quando os dados são agrupados, para determinar os quartis usamos a mesma técnica do cálculo da mediana, bastando substituir, na fórmula da mediana,

iMe

f nP2 2

, por Qrn.rP4

(onde r é o número de ordem do quartil).

Assim, temos:

Q1n.1P4

|

Q1 a1 i

Q1

P F .hQ L

f

Q2n.2P4

|

Q2 a2 i

Q2

P F .hQ L

f

Q3n.3P4

|

Q3 a3 i

Q3

P F .hQ L

f

Exemplo 13: Dada à distribuição abaixo, calcular Q1, Q2 e Q3. Classes fi 7├ 17 6 17├ 27 15 27├ 37 20 37├ 47 10 47├ 57 5 Total 56

Page 31: Apostila de Estatistica Aplicadadavisilva.atwebpages.com/.../Apostila_Estatistica_Aplicada.pdf · A Estatística, ramo da Matemática Aplicada, teve origem semelhante. Desde a Antiguidade

[email protected] 31

Percentis

Denominamos percentis os noventa e nove valores que separam uma série em 100 partes iguais.

Para determinarmos os percentis usamos a mesma técnica do cálculo da

mediana, bastando substituir, na fórmula da mediana, iMe

f nP2 2

, por Prn.rP

100

(onde r é o número de ordem do percentil).

Assim, para o 27o percentil temos:

P27n.27P100

|

P27 a27 i

P27

P F .hP L

f

Exemplo 14: Calcular o 55º percentil da distribuição do exemplo 13. Exercícios de aplicação – média, mediana, moda; quartis e percentis 1. Calcule a média, a mediana, a moda, o 3º quartil e o 30º percentil para as seguintes distribuições: a) As companhias de seguro pesquisam continuamente as idades na morte e as causas de morte. Os dados se baseiam no estudo levado a efeito pela revista Time sobre as pessoas que morreram vitimadas por armas de fogo durante uma semana. Idade na morte Frequência 16 ├ 26 22 26 ├ 36 10 36 ├ 46 6 46 ├ 56 2 56 ├ 66 4 66 ├ 76 5 76 ├ 86 1 b) Aluguel (x R$ 100) Quantidade de casas 4 ├ 6 18 6 ├ 8 25 8 ├ 10 32 10 ├12 40 12 ├ 14 30 14 ├ 16 18 16 ├18 12 2. Das distribuições abaixo calcule:

a. média, mediana e moda b. primeiro e terceiro quartis c. 10o , 23o e 90o percentis

Elaborar o histograma de frequência simples e localizar as medidas calculadas

Page 32: Apostila de Estatistica Aplicadadavisilva.atwebpages.com/.../Apostila_Estatistica_Aplicada.pdf · A Estatística, ramo da Matemática Aplicada, teve origem semelhante. Desde a Antiguidade

[email protected] 32

a) NOTAS fi 0 ├ 2 5 2 ├ 4 8 4 ├ 6 14 6 ├ 8 10 8 ├10 7 44 b) Estaturas fi 150 ├ 158 5 158 ├ 166 12 166 ├ 174 18 174 ├ 182 27 182 ├ 190 8 70 c) Salários (R$) fi 500 ├ 700 18 700 ├ 900 31 900 ├ 1100 15 1100 ├ 1300 3 1300 ├ 1500 1 1500 ├ 1700 1 1700 ├ 1900 1 70 3. Os seguintes dados referem-se ao salário (em R$) de 40 funcionários da empresa GIS.

1638 2456 1715 1330 1398 1230 3153 1275 2154 704 2000 2622 1319 3050 3502 1154 1271 1894 780 1137 3296 2169 2578 654 2415 1104 756 2634 802 2846 1158 486 1317 516 1351 585 1440 588 1243 1674

a. Qual a variável de estudo? Classifique a variável. b. Se você tivesse de obter dados referentes ao salário dos funcionários de sua

empresa qual a técnica de amostragem você utilizaria. Justifique sua escolha. c. Elabore uma distribuição de freqüência simples (dados agrupados com intervalo

de classe) e seu respectivo histograma. d. Determine para a distribuição obtida: limite inferior da 2ª classe, freqüência

relativa da 3ª classe e limite superior da 4ª classe. e. Calcule para a distribuição obtida: média, mediana e moda. f. Identifique no histograma de freqüência a localização dos valores obtidos de

média, mediana e moda. g. Interprete os resultados obtidos.

Page 33: Apostila de Estatistica Aplicadadavisilva.atwebpages.com/.../Apostila_Estatistica_Aplicada.pdf · A Estatística, ramo da Matemática Aplicada, teve origem semelhante. Desde a Antiguidade

[email protected] 33

4. MEDIDAS DE DISPERSÃO

As medidas de dispersão ou variabilidade indicam o quanto os valores encontrados numa pesquisa estão próximos ou afastados em relação a média. Destacam o grau de homogeneidade ou heterogeneidade que existe entre os valores que compõem o conjunto. São medidas que servem para verificar com que confiança as medidas de tendência central resumem as informações fornecidas pelos dados obtidos em uma pesquisa. Exemplificando, ... duas pessoas se submeteram a um teste... situação a) as duas pessoas tiraram nota 6,0 situação b) uma pessoa tirou 2,0 e a outra 10,0

Nos dois casos a média é igual a 6,0. Todavia, em “a” elas se concentraram sobre a média; em “b” elas se dispersaram em torno da mesma. Isto quer dizer que a média é muito mais significativa em “a” do que em “b”. Ainda, em “a” existe uma homogeneidade nos conhecimentos adquiridos; em “b” heterogeneidade.

As principais medidas de dispersão são: amplitude total variância e desvio padrão 4.1 Amplitude total

É a diferença entre o maior e o menor valor de uma série de dados. Exemplo 1: Calcule o intervalo total dos seguintes dados 4, 6, 8, 9, 12, 17, 25.

O intervalo ou amplitude total é uma medida fácil de calcular. Todavia, é instável. Leva em conta somente os valores externos, não sendo afetada pela dispersão dos valores internos. É apenas uma indicação aproximada da dispersão. 4.2 Variância e desvio padrão Como vimos, a amplitude total é instável, por se deixar influenciar pelos valores extremos, que são, na sua maioria, devidos ao acaso. A variância e o desvio padrão são medidas que fogem a esta falha, pois levam em consideração a totalidade dos valores da variável em estudo, o que faz delas índices de variabilidade bastante estáveis e. por isso mesmo, os mais geralmente empregados. A variância baseia-se nos desvios em torno da média aritmética, porém determinando a média aritmética dos quadrados dos desvios. Assim, representado a variância por s2, temos:

n

xxf

xxs i

i

i

222

Nota: Quando nosso interesse não se restringe à descrição dos dados mas, partindo da amostra, visamos tirar inferências válidas para a respectiva população, convém efetuar uma modificação, que consiste em usar o divisor n-1 em lugar de n.

Page 34: Apostila de Estatistica Aplicadadavisilva.atwebpages.com/.../Apostila_Estatistica_Aplicada.pdf · A Estatística, ramo da Matemática Aplicada, teve origem semelhante. Desde a Antiguidade

[email protected] 34

A variância é uma medida que tem pouca importância como estatística

descritiva, uma vez que sua unidade de medida é o quadrado da unidade de medida dos valores da variável. Todavia, é extremamente importante na inferência estatística e na combinação de amostras.

Por isso mesmo, imaginou-se uma nova medida que tem utilidade e interpretação práticas, denominada desvio padrão, definida como a raiz quadrada positiva da variância. Assim, se a variância de um determinado conjunto de valores for igual a 81, o desvio padrão será igual a 9.

n

xxs i

2

Propriedades da variância e do desvio padrão

- A variância e o desvio padrão são sempre números positivos. - Se os valores de uma variável forem iguais a variância e o desvio padrão serão igual a zero. - A variância e o desvio padrão são afetados pelos valores extremos.

Para fins práticos, a fórmula do desvio padrão pode ser reorganizada da seguinte forma:

22

nx

nx

s ii

Dados não-agrupados

Tomemos, como exemplo, o conjunto de valores da variável x: 40, 45, 48, 52, 54, 62 e 70. Xi xi2 40 45 48 52 54 62 70 s=? Exemplos: 1. Calcule o desvio padrão das vendas diárias (período de uma semana): $8100, $9000, $4580, $5600, $7680, $4800, $10640.

Page 35: Apostila de Estatistica Aplicadadavisilva.atwebpages.com/.../Apostila_Estatistica_Aplicada.pdf · A Estatística, ramo da Matemática Aplicada, teve origem semelhante. Desde a Antiguidade

[email protected] 35

2. Calcule a variância e o desvio padrão para o seguinte conjunto de dados: 83, 92, 100, 57, 85, 88, 84, 82, 94, 93, 91, 95. Dados agrupados a) Sem intervalo de classe

Neste caso temos a presença de frequências e devemos levá-las em consideração:

22

nxf

nxf

s iiii

xi fi fixi fixi

2 0 2 1 6 2 12 3 7 4 3 30 s = ? b) Com intervalo de classe

22i m i m

i i

f P f Ps

f f

Estaturas fi Pm fiPm fiPm2

150 ├154 4 154 ├158 9 158 ├162 11 162 ├166 8 166 ├170 5 170 ├174 3

Exercícios de aplicação – Medidas de dispersão 1. Calcule o desvio padrão dos seguintes conjuntos de dados: 20, 14, 15, 19, 21, 22, 18 17.9, 22.5, 13.3, 16.8, 15.4, 14.2

Page 36: Apostila de Estatistica Aplicadadavisilva.atwebpages.com/.../Apostila_Estatistica_Aplicada.pdf · A Estatística, ramo da Matemática Aplicada, teve origem semelhante. Desde a Antiguidade

[email protected] 36

2. Um departamento de produção usa um procedimento de amostragem para testar a qualidade de itens recém produzidos. O departamento emprega a seguinte regra de decisão em uma estação de inspeção: se uma amostra de 14 tem uma variância de mais que 0,005 a linha de produção precisa ser paralisada para reparos. Suponha que os seguintes dados tenham sido coletados: 3,43 3,45 3,43 3,48 3,52 3,50 3,39 3,48 3,41 3,38 3,49 3,45 3,51 3,51 A linha de produção deveria ser paralisada? Por quê? 3. Os dados abaixo se referem ao número de dias exigido para preencher pedidos de compra para duas empresas distintas A e B: Empresa A – 11, 10, 9, 10, 11, 11, 10, 11, 10, 10 Empresa B – 8, 10, 13, 7, 10, 11, 10, 7, 15, 12 Com base nos valores de desvio-padrão calculados determine qual das empresas fornece tempos de entrega mais constantes e confiáveis. 4. Dada a distribuição relativa a 100 lançamentos de 5 moedas simultaneamente, calcule o desvio padrão. Número de caras Frequência 0 4 1 14 2 34 3 29 4 16 5 3 Total 100 5. Em um levantamento entre os assinantes da revista Fortune a seguinte pergunta foi realizada: “Quantas das últimas quatro edições você leu ou folheou?”. A seguinte distribuição de frequência sintetiza 500 respostas”. Edição lida Frequência 0 15 1 10 2 40 3 85 4 350 Total 500 Qual é o número médio de edições lidas por um assinante da Fortune? Qual é o desvio padrão do número de edições lidas? 6. Calcule o desvio padrão da distribuição: Classes Frequência 2 ├ 6 5 6 ├ 10 12 10 ├ 14 21 14 ├ 18 15 18 ├22 7 Total 60

Page 37: Apostila de Estatistica Aplicadadavisilva.atwebpages.com/.../Apostila_Estatistica_Aplicada.pdf · A Estatística, ramo da Matemática Aplicada, teve origem semelhante. Desde a Antiguidade

[email protected] 37

7. Um posto de gasolina registrou a seguinte distribuição de frequência para o número de litros de gasolina vendidos por carro em uma amostra de 680 carros. Gasolina (litros) Frequência 0 ├ 5 74 5 ├ 10 192 10 ├ 15 280 15 ├ 20 105 20 ├ 25 23 25 ├ 30 6 Total 680 Calcule a média, a variância e o desvio padrão para esses dados agrupados.

8. Calcule o desvio padrão para todos os exercícios da secção 3.1.1 (Média).

5. COEFICIENTE DE VARIAÇÃO

O desvio padrão por si só não nos diz muita coisa. Assim, um desvio padrão de duas unidades pode ser considerado pequeno para uma série de valores cujo valor médio é 200. No entanto, se a média for igual a 20, o mesmo não pode ser dito.

Além disso, o fato do desvio padrão ser expresso na mesma unidade dos dados limita o seu emprego quando desejamos comparar duas ou mais séries de valores, relativamente a sua dispersão, quando expressas em unidades diferentes.

100.xsCV

Exemplo: Média Desvio padrão Estaturas 175 cm 5 cm Pesos 68 kg 2 kg Temos,

%85,2100.175

5100. xsCVE

%94,2100.682100.

xsCVP

Logo, neste grupo de indivíduos, os pesos apresentam maior grau de dispersão

do que as estaturas.

Page 38: Apostila de Estatistica Aplicadadavisilva.atwebpages.com/.../Apostila_Estatistica_Aplicada.pdf · A Estatística, ramo da Matemática Aplicada, teve origem semelhante. Desde a Antiguidade

[email protected] 38

BIBLIOGRAFIA Apostila modificada de SILVA, Guilherme Cunha da. Apostila de Estatística Aplicada. Faculdade Tecnológica Tupy. CRESPO, Antônio Arnot. Estatística Fácil. 17 ed. São Paulo: Saraiva, 1999. LAPPONI, Juan Carlos. Estatística usando Excel. São Paulo: Lapponi Treinamento, 2000. MACEDO, Luiz Roberto Dias de. Dados numéricos na empresa: interpretação e análise. Curitiba: IBPEX, 2004. SILVA, Ermes Medeiros da e outros. Estatística para os cursos de economia, administração e ciências contábeis. 3ª edição. São Paulo: Atlas, 1999. STEVENSON, William J. Estatística Aplicada à Administração. São Paulo: Harper e Row do Brasil, 1981. ANDERSON, David R. Estatística aplicada à administração e economia. 2ª edição. São Paulo: Pioneira Thomson Learning, 2003.