apostila de estatÍstica e probabilidade - engenharia - mÓdulo 1
Post on 25-Jul-2015
200 Views
Preview:
TRANSCRIPT
APOSTILA DE
ESTATÍSTICA E PROBABILIDADE
MÓDULO 1
PROFESSOR: REINALDO CARVALHO DE MORAIS
********************************************CAPÍTULO 1
INTRODUÇÃO À ESTATÍSTICA********************************************
Uma das principais virtudes de um bom profissional passa pela capacidade de tomar boas
decisões de acordo com a situação. Esse tipo de habilidade pode ser construída de várias formas,
dentre elas pela prática do dia-a-dia das empresas. O conhecimento teórico adquirido freqüentando
a faculdade e lendo artigos científicos e revistas de negócios também é uma das formas. O ideal
para a formação talvez seja buscar as diversas possibilidades.
Dentre as várias formas de se tomar decisões, o profissional pode se valer de fatos e
dados. O uso de planilhas eletrônicas e a exploração do máximo de informações possível vêm
aumentando no decorrer dos anos nas organizações. Por exemplo: quando um banco necessita
tomar a decisão sobre conceder ou não um empréstimo pra um determinado cliente, são avaliados
determinados dados desse cliente. Verificam-se, dentre outras informações, o tempo de conta, a
idade, o estado civil, a profissão, etc. Dessa forma torna-se possível avaliar o risco desse cliente
quitar a referida dívida.
As técnicas estatísticas têm sido cada vez mais utilizadas nas empresas e órgãos públicos
para auxiliar os gestores a racionalizar o uso de informações em benefício do processo de tomada de
decisões. Os avanços ocorridos na informática nos últimos anos têm contribuído para aumentar tanto
a quantidade quanto a qualidade dos dados disponíveis.
1.1 – O QUE É ESTATÍSTICA?
A estatística pode ser definida como: a ciência de coletar, organizar e interpretar fatos
numéricos que chamamos de dados. Diariamente somos bombardeados com diversos dados. Pela
mídia, recebemos informações sobre:
Índice de popularidade do presidente da república.
Temperatura média para determinado dia.
Venda de veículos no mês passado, etc.
Outra definição de estatística1: “Estatística se refere ao conjunto de técnicas usadas na
coleção, organização e interpretação de dados. Estes podem ser quantitativos, com valores
expressos numericamente, ou qualitativos, representados por características tais quais as
preferências dos consumidores obtidas em uma pesquisa. A análise estatística é utilizada na
1 KAZMIER, Leonard J. Estatística Aplicada à Administração e Economia – 4ª Edição – 2007, pag 13
2
administração e economia para auxiliar na tomada de decisões mediante a compreensão das fontes
de variação e a identificação de padrões e relacionamentos nos dados.”
Outro autor define estatística da seguinte forma2: A ciência de coletar, analisar,
interpretar e retirar conclusões a partir de dados.
Nos debates públicos sobre economia, educação e políticas sociais, todas as partes
envolvidas utilizam dados em seus argumentos. Você vai ao médico e com base no que é relatado
são solicitados determinados exames. Com base nos dados dos exames determinado tratamento é
indicado. Você vai ao mecânico e relata certo ruído. Com base nisso são testados determinados
equipamentos. Portanto, o uso de informações aumenta a chance de tomar decisões mais eficientes.
1.2 – A IMPORTÂNCIA DA ESTATÍSTICA COMO INSTRUMENTO
A Estatística surge como um rico instrumento para auxiliar o tomador de decisões através
de critérios objetivos. Especificamente utilizando números e raciocínio lógico. Ou seja: não cabem
“achismos”. Administrar envolve a constante tomada de decisões, que podem se dar por critérios
objetivos (conhecimento teórico ou tácito) ou subjetivos.
O objetivo da estatística é obter compreensão a partir dos dados. Para conseguirmos isso,
freqüentemente trabalhamos com um conjunto de números. Os dados não são somente números.
São números dentro de um contexto. Por exemplo: Você ouve dizer que a taxa de desemprego na
região metropolitana de Belo Horizonte foi de 10% no mês passado. E daí? Esse número é grande?
Depende da base de comparação, que pode ser geográfica ou temporal. Depende da instituição que
calculou. A metodologia do IBGE3 é diferente da metodologia dos Centros de pesquisa estaduais.
Empresas, governo e indivíduos tomam decisões com base em determinados indicadores.
Exemplos:
Taxa de desemprego.
Taxa de juros do cartão de crédito.
Taxa de inflação.
Probabilidade de ficar desempregado.
Quando você resolver problemas estatísticos pense no contexto do problema e formule
as conclusões obtidas na situação específica. Lembre-se de que o objetivo da estatística não é o
cálculo em si, mas o ganho de compreensão a partir dos números.
1.3– O SURGIMENTO DA ESTATÍSTICA
Historicamente, as idéias e os métodos estatísticos foram se desenvolvendo aos poucos,
à medida que aumentava o interesse da sociedade em coletar e utilizar dados para um grande
número de propósitos. As origens mais remotas da estatística vinculam-se ao desejo dos
2 WALPOLE (2009).
3 Instituto Brasileiro de Geografia e Estatística
3
governantes de contar o número de habitantes ou medir o valor de terras tributáveis em seus
domínios.
O termo estatística4 surge da expressão em latim statisticum collegium, palestra sobre os
assuntos do Estado, de onde surgiu a palavra em língua italiana statista, que significa "homem de
estado", ou político, e a palavra alemã Statistik, designando a análise de dados sobre o Estado. A
palavra foi proposta pela primeira vez no século XVII, em latim, por Schmeitzel na Universidade de
Jena e adotada pelo acadêmico alemão Godofredo Achenwall. Aparece como vocabulário na
Enciclopédia Britânica em 1797, e adquiriu um significado de coleta e classificação de dados, no
início do século 19.
A Teoria das probabilidades começou a ganhar força a partir do século 17 quando os
cientistas se interessaram em calcular as chances de sucesso nos jogos de azar.
1.4 – APLICAÇÕES DA ESTATÍSTICA EM ÁREAS DO CONHECIMENTO
Uma das principais características da estatística consiste no seu papel de “ciência da
variação” (ou variabilidade). Como existe variabilidade em todos os campos do conhecimento, a
estatística vem sendo utilizada nas mais diversas áreas.
ESTATÍSTICA NA EDUCAÇÃO FÍSICA
O que determina o desempenho dos atletas em determinada prática esportiva?
Certamente várias são as teorias desenvolvidas por pesquisadores acerca do assunto. Para otimizar
a decisão em relação à aceitação ou rejeição de hipóteses sobre o assunto vários foram os modelos
e testes estatísticos desenvolvidos. Como exemplo, suponha que um pesquisador esteja interessado
em determinar qual a melhor combinação de exercícios físicos que determinado atleta deve ter para
maximizar seu desempenho numa determinada modalidade.
Pode-se elaborar um modelo que relacione o desempenho (Y) com outras variáveis (X1,
X2, ... , X8):
Y = Desempenho
X1 - Ingestão diária de carboidratos
X2 - Número de horas de sono diárias
X3 - Tempo de experiência na prática do referido esporte
X4 - Idade em que o atleta iniciou as atividades
X5 - Concentração de colesterol no sangue
X6 - Tipo sanguíneo
X7 - Prática ou não de outras atividades
X8 - Fumante ou não
4 www.wikipedia.com.br
4
ESTATÍSTICA NA MEDICINA
A Estatística aplica-se à área médica em qualquer situação que envolva o planejamento,
coleta e análise de dados. Problemas como testar a eficácia de determinado medicamento em
relação a uma doença, bem como a criação de índices que classifiquem as doenças pelo nível de
gravidade são alguns exemplos. Outro exemplo é a elaboração de políticas de prevenção e combate
a doenças, baseada em dados sobre a população de interesse. Verificar se determinada variável
patológica constitui uma endemia, uma epidemia, ou ainda uma pandemia. Planejamento de saúde
pública para determinada área de abrangência.
ESTATÍSTICA NA ECONOMIA
Otimização de Carteiras de Investimentos: Para investir no mercado de capitais
necessita-se da obtenção da melhor combinação de risco e retorno possível. As melhores estimativas
para tais parâmetros são a chave para a construção de modelos mais realistas.
Finanças governamentais: O governo necessita das melhores projeções possíveis em
relação à arrecadação de impostos para saber quanto terá de dinheiro no próximo ano para realizar
despesas com saúde, educação, segurança, etc.
Indicadores econômicos: Prever com certa precisão o Índice de Inflação, por exemplo,
pode ser de fundamental importância para uma determinada empresa que deseja se expandir. A
compra de máquinas através de financiamento deve considerar a taxa de juros cobrada, assim como
a expectativa inflacionária.
ESTATÍSTICA NA ENGENHARIA
Métodos de Previsão: A compra de determinados insumos utilizados na fabricação de
produtos exige um planejamento eficiente. Adquirir quantidades menores que o necessário pode
resultar em falta de produtos. Por outro lado, comprar muito acima do necessário pode deixar o
capital da empresa ocioso. Assim, uma boa solução para o problema é utilizar métodos de previsão
com base em variáveis que estejam relacionadas à venda do produto.
Controle de estoque: tempo em que as mercadorias levam para serem vendidas. A
empresa deve manter um nível de estoque capaz de atender suas demandas. Se faltar insumos,
pode prejudicar o processo de produção. O acúmulo de estoques envolve custos.
Controle estatístico de processos: Qual a margem de erro no peso de determinado
produto empacotado?
Amostragem: Quantas peças devem ser inspecionadas para sabermos o índice de
defeitos?
Planejamento de experimentos: Qual a melhor temperatura para retirar determinada
peça do forno?
5
1.5– ALGUMAS DEFINIÇÕES
POPULAÇÃO X AMOSTRA
Ao realizar uma pesquisa, na maioria das vezes é inviável consultar todos os elementos
de interesse. Um exemplo clássico nesse sentido é a pesquisa eleitoral. Na época das eleições
deseja-se saber a preferência do eleitorado sobre os candidatos ao pleito. No Brasil, país com quase
200 milhões de habitantes, temos mais de 100 milhões de eleitores. É pouco viável perguntar a
todos esses indivíduos quais as intenções de voto. Para ter uma idéia de como se distribuem os
eleitores por candidato nas pesquisas, faz-se necessário utilizar uma amostra da população de
eleitores. Dessa forma, se o número de eleitores for 100 milhões e a amostra utilizada na pesquisa
for de 2.000 pessoas, qual o tamanho da população e qual o tamanho da amostra?
Na medicina, o uso de amostras é muito claro. Quando uma pessoa fica doente e os
médicos necessitam verificar as características do sangue dela, é impossível pesquisar todo o
sangue da pessoa. O procedimento consiste na simples coleta de uma pequena amostra de sangue.
Avaliando-se essa pequena amostra são tiradas conclusões acerca de todo o sangue do corpo.
Nesse caso a população seria o volume total de sangue.
Quanto maior o tamanho da amostra, maior a probabilidade de ela refletir o tamanho da
população inteira. Por exemplo: suponha que estejamos interessados em pesquisar o perfil dos
alunos dos cursos de Engenharia da faculdade. Se houver 1.000 alunos matriculados, pode ser
inviável entrevistar todos. Nesse contexto faz-se necessário realizar a pesquisa por amostragem
tomando um subconjunto da população. Podemos pesquisar apenas 100 alunos. Alguns cálculos
estatísticos são necessários para medir a precisão da referida pesquisa.
ESTRATÉGIA PEDAGÓGICA
Para efeitos didáticos, a Estatística básica pode ser ensinada em três etapas:
1) Descrição de dados (também conhecida como Análise exploratória de dados),
2) Probabilidade,
3) Inferência (nessa etapa utilizamos dados de amostras para extrair conclusões
acerca da população de interesse.
A Descrição de dados é utilidade quando tomamos um conjunto de dados e resumimos os
mesmos através de gráficos, tabelas, medidas de tendência central, medidas de variabilidade, etc.
A Teoria das Probabilidades nos auxiliar a tomar decisões levando em consideração a
incerteza inerente aos acontecimentos.
A Inferência se utiliza das propriedades probabilísticas para a construção de testes de
hipóteses sobre determinado fenômeno. Por exemplo, suponha que o pesquisador acredite que as
mulheres têm uma tendência maior a votar também em mulheres, em comparação aos homens.
6
Após colher uma amostra, as técnicas de inferência estatística podem ser usadas para concluir que
essa hipótese seja verdadeira ou falsa.
ESTATÍSTICA VERSUS PARÂMETRO
Ao realizar uma pesquisa, se for consultada toda a população de interesse afirmamos que
a pesquisa é censitária. Portanto foi realizado um censo. No Brasil, de 10 em 10 anos esse tipo de
pesquisa é realizada para o levantamento de informações sociais e econômicas da população.
Suponha que estamos interessados em traçar o perfil de todos os estudantes de
Engenharia da Faculdade Pitágoras de Betim. Se forem 2.000 alunos no total, o que caracteriza uma
pesquisa por censo e o que caracteriza uma pesquisa por amostragem? Se consultarmos todos os
2.000 alunos estaremos diante de um censo. Se consultarmos um subconjunto dos 2.000 (100, por
exemplo) estaremos diante de uma pesquisa por amostragem.
Se uma das perguntas do questionário utilizado na pesquisa for “Qual a sua altura?”
podemos calcular a altura média dos alunos dos cursos de engenharia. Se a altura média for extraída
de uma pesquisa com os 1.000 alunos (ou seja, pesquisa censitária), estaremos diante de um
parâmetro. Se a altura média for extraída de uma pesquisa por amostragem (com 100 alunos, por
exemplo), estaremos diante de uma estatística.
TIPOS DE VARIÁVEIS
Quando realizamos uma pesquisa, a mesma geralmente contém um conjunto de
perguntas. A pesquisa realizada com os alunos de estatística contém perguntas sobre altura, peso,
idade, tipo de transporte para a faculdade, etc. Geralmente, cada pergunta feita no questionário
pode ser considerada uma variável. Por exemplo, se for perguntado no questionário qual a cor
preferida, esta pode variar entre azul, vermelho, verde, etc. Se for perguntada a altura do estudante,
a mesma pode variar entre 140 e 210 centímetros, por exemplo.
Temos que fazer a distinção entre os tipos de variáveis. Basicamente as variáveis podem
ser divididas entre VARIÁVEIS QUANTITATIVAS ou VARIÁVEIS QUALITATIVAS (CATEGÓRICAS).
As quantitativas podem ser discretas ou contínuas. As qualitativas podem ser ordinais ou
nominais. Observe a figura abaixo.
7
DISCRETA (Nº de irmãos)
QUANTITATIVA
CONTÍNUA (Altura)
VARIÁVEIS
NOMINAL (Estado Civil)
QUALITATIVA
ORDINAL (Escolaridade)
EXERCÍCIO 1.1
Classifique as seguintes variáveis:
Altura: Quantitativa contínua.
Peso:
Número de irmãos:
Estado Civil:
Escolaridade do pai:
Tipo de transporte para a faculdade:
Conhecimento de Excel:
8
********************************************
CAPÍTULO 2
ANÁLISE EXPLORATÓRIA DE DADOS:
TABELAS, GRÁFICOS E FREQÜÊNCIA
********************************************Para realizar uma pesquisa, uma das etapas consiste no levantamento dos dados. Após
essa etapa, as informações podem ser tabuladas numa planilha. Como exemplo de pesquisa, os
alunos de Estatística de uma determinada turma do curso de Administração responderam a algumas
perguntas conforme o quadro abaixo:
1 – Qual sua data de nascimento ?______________________________________2 – Em média, quantas horas você trabalha por semana?____________________3 – Qual sua altura?__________ 4 – Qual seu peso?___________5 – Em que dia da semana foi (ou será) seu aniversário em 2009?_______________6 – Você nasceu numa capital? ( ) sim ( ) não7 – Qual a distância de sua residência à Faculdade Pitágoras?________________8 – Você gosta de ir ao supermercado? ( ) sim ( ) não9 – Você tem quantos irmãos?_________________________________________10 – Como você vai para a faculdade? ( ) ônibus ( ) carro ( ) a pé ( ) motocicleta ( ) outro11 – Quanto você gostava de Física? ( ) muito ( ) médio ( ) pouco ( ) nada12 – Quanto você gostava de Química? ( ) muito ( ) médio ( ) pouco ( ) nada13 – Quanto você gostava de Matemática? ( ) muito ( ) médio ( ) pouco ( ) nada14 – Quanto você gostava de História? ( ) muito ( ) médio ( ) pouco ( ) nada15 – Quanto você gostava de Geografia? ( ) muito ( ) médio ( ) pouco ( ) nada16 – Quanto você gostava de Língua Portuguesa? ( ) muito ( ) médio ( ) pouco ( ) nada17 – Quanto você gostava de Literatura Brasileira? ( ) muito ( ) médio ( ) pouco ( ) nada18 – Quanto você gostava de Língua Inglesa? ( ) muito ( ) médio ( ) pouco ( ) nada19 – Quanto você gostou de microeconomia? ( ) muito ( ) médio ( ) pouco ( ) nada20 – Quanto você gostou de macroeconomia? ( ) muito ( ) médio ( ) pouco ( ) nada
Foi utilizada uma planilha em Excel para a tabulação dos dados. O quadro abaixo mostra
uma parte da referida planilha:
9
Para a apresentação dos dados num relatório de pesquisa, foi construída a tabela abaixo.
TABELA 2.1: Banco de dados dos alunos de Estatística da Turma de Administração de
2009
Horas Dia da semana DeslocamentoIndivíduo Atlura Peso Gênero Idade trabalhadas em que será o Capital Superm. Irmãos para a Matemática História Microeconomia Macroeconomia
por semana aniversário Faculdade
1 170 69 M 30 50 domingo 1 1 3 2 4 3 4 42 163 65 M 28 48 sexta 0 0 2 2 3 3 3 33 171 78 M 26 44 quarta 1 0 2 2 4 3 4 44 165 55 F 23 0 quarta 0 1 0 2 3 1 3 35 161 51 F 19 0 sábado 1 1 3 1 4 2 3 36 160 47 F 19 20 terça 1 1 1 3 3 4 3 37 165 80 M 25 30 domingo 0 1 1 1 3 2 0 08 165 53 F 25 21 sexta 0 1 2 3 4 4 4 49 170 70 F 36 91 sábado 0 1 4 2 3 4 4 4
10 160 51 M 19 36 quinta 0 1 2 1 3 1 2 211 173 55 F 21 30 sábado 0 1 1 3 3 2 3 312 163 55 F 21 36 sábado 0 1 1 1 4 2 4 413 164 72 F 22 48 quinta 0 1 2 4 3 2 0 014 158 48 F 19 0 quarta 0 1 1 5 4 2 4 415 180 65 M 20 20 terça 0 0 0 2 2 4 2 316 172 80 M 35 40 sábado 1 1 3 1 4 4 4 417 171 69 F 20 43 terça 0 0 3 2 4 2 3 318 158 54 F 29 30 quarta 0 0 2 1 3 4 4 4
Fonte: Dados da pesquisa
Após a obtenção dos dados tabulados, a análise dos mesmos torna-se possível. Para isso,
podemos utilizar o próprio Excel ou algum software estatístico. Geralmente tais softwares são
relativamente caros. Alguns deles são adquiridos somente por grandes empresas ou organizações de
10
pesquisa.
2.1 – APRESENTAÇÃO DOS DADOS
2.1.1 - GRÁFICOS
GRÁFICO DE SETORES
Ao analisarmos os dados dos alunos da turma de 2009 podemos construir a seguinte
tabela relativa à variável “DESLOCAMENTO”.
TABELA 2.2: Distribuição de freqüência da variável DESLOCAMENTO
DESLOCAMENTO FREQÜÊNCIA PORCENTAGEMA PÉ 4 22,2%
CARRO 7 38,9%MOTOCICLETA 1 5,6%
ÔNIBUS 5 27,8%OUTROS 1 5,6%TOTAL 18 100,0%
Fonte: Dados da pesquisa
Outra forma de apresentar os dados acima é através do gráfico de setores – também
conhecido como “gráfico de pizza”:
Formas de deslocamento dos alunos para a faculdade
22,2%
38,9%5,6%
27,8%
5,6%
A PÉ CARRO MOTOCICLETA ÔNIBUS OUTROS
GRÁFICO 2.1: Formas de deslocamento dos alunos de Estatística da Turma de Administração de 2009
11
Observe que o gráfico apresenta valores em porcentagem. O número de alunos (n) é 18.
O gráfico poderia ser construído com valores absolutos. No entanto, fica mais didático com o uso de
porcentagens.
GRÁFICOS DE BARRAS
Para a variável acima, também pode ser utilizado um gráfico de barras. A vantagem é
que ele oferece uma precisão visual um pouco melhor.
Formas de deslocamento dos alunos para a faculdade
4
7
1
5
1
0
1
2
3
4
5
6
7
8
A PÉ CARRO MOTOCICLETA ÔNIBUS OUTROS
GRÁFICO 2.2: Formas de deslocamento dos alunos de Estatística da Turma de Administração de 2009
Cuidado com a escala
É muito importante ter atenção com a escala dos gráficos. Observe a figura abaixo:
TAXA DE DESEMPREGO
10,2%
10,3%
10,4%
10,5%
10,6%
10,7%
10,8%
10,9%
11,0%
11,1%
2003 a 2006 2007 a 2010
TAXA DE DESEMPREGO
10,5%
11,0%
4,0%
5,0%
6,0%
7,0%
8,0%
9,0%
10,0%
11,0%
12,0%
2003 a 2006 2007 a 2010
Qual a diferença entre os dois gráficos?
Observe que os valores para as taxas de desemprego para os dois períodos são as
mesmas. Porém, uma mudança na escala do gráfico no eixo das ordenadas (no caso eixo do
12
percentual de desemprego) distorceu fortemente o aspecto visual da situação.
Gráfico para duas variáveis categóricas
O gráfico mostrado na seção anterior descreve apenas uma variável. Quando estamos
interessados em descrever duas variáveis ao mesmo tempo, podemos construir uma tabela de
dupla entrada (também conhecida como tabela de contingência).
Uma das perguntas feitas na pesquisa com os alunos da turma de 2009 foi: “Você gosta
de supermercado?” Dessa forma a variável aleatória “SUPERMERCADO” pode assumir duas
situações: ou a pessoa gosta de supermercado ou a pessoa não gosta. Quando utilizamos tabelas de
dupla entrada os dados são desagregados, ou seja, podem ser interpretados de forma mais
detalhada. Observe na tabela abaixo que o total de pessoas que gosta de supermercado é 13 e que
não gosta é 5. Além disso, podemos saber que dos 13 que gostam, 4 são homens e 9 são mulheres.
Outra forma de interpretar seria: das 11 mulheres, 2 não gostam de supermercado.
TABELA 2.3: Distribuição da variável SUPERMECADO por GÊNERO
SEXO Gosta Não Gosta TotalMasculino 4 3 7Feminino 9 2 11
Total 13 5 18
SUPERMERCADO
Fonte: Dados da pesquisa
Observe um gráfico feito no Excel para representar os dados acima.
Gosta
Não Gosta
Masculino
Feminino
9
24
3
0
2
4
6
8
10
12
Masculino Feminino
GRÁFICO 2.2: Gosto ou não por supermercado de acordo com o sexo
EXERCÍCIO 2.1(a) Faça um gráfico de barras vertical para o a variável: “IRMÃOS”
13
(b) Faça um gráfico de setores para a mesma variável.
EXERCÍCIO 2.2Construa uma tabela de dupla entrada para as variáveis: capital e supermercado.
Gosta Não gostaCapitalInteriorTOTAL
SUPERMERCADONASCIMENTO TOTAL
Valores versus percentuais
Observe que o gráfico de setores pode ser feito utilizando-se tanto os valores absolutos,
como os percentuais. A escolha dependerá do tipo de estudo e bom senso do analista. O importante
é que o gráfico seja o mais didático possível, para que o leitor consiga entendê-lo.
GRÁFICOS DE LINHAS
Podemos fazer um gráfico de linhas para a variável: DESLOCAMENTO, conforme mostrado
na figura abaixo:
4
7
1
5
1
0
1
2
3
4
5
6
7
8
A PÉ CARRO MOTOCICLETA ÔNIBUS OUTROS
GRÁFICO 2.3: Distribuição da variável DESLOCAMENTO
14
Entretanto, conforme discutido anteriormente, para esse tipo de variável (categórica), os
gráficos de barras e setores são os mais indicados. O gráfico de linhas é bastante utilizado
para o uso de séries temporais. O gráfico abaixo representa a evolução do retorno de três ações
na bolsa de valores.
-4
-3
-2
-1
0
1
2
3
4
5
6
jan/0
4
mar
/04
mai/
04jul
/04
set/0
4
nov/0
4
jan/0
5
mar
/05
mai/
05jul
/05
set/0
5
nov/0
5
jan/0
6
mar
/06
mai/
06jul
/06
set/0
6
nov/0
6
jan/0
7
mar
/07
mai/
07jul
/07
set/0
7
nov/0
7
jan/0
8
mar
/08
mai/
08jul
/08
set/0
8
nov/0
8
A
B
C
Gráfico 2.3: Evolução do retorno dos ativos A, B e C
EXERCÍCIO 2.3
A Tabela abaixo apresenta a evolução do número de pedidos de férias de
funcionários de uma empresa fictícia. Faça um gráfico de linha para representar os dados.
Mês Nº de pedidosJaneiro 10Fevereiro 8Março 5Abril 3Maio 2Junho 4Julho 7Agosto 3Setembro 1Outubro 1Novembro 5Dezembro 7Fonte: Dados da empresa W
Tabela 2.2 - Evolução do número de pedidos de férias dos
funcionários da Empresa W em 2009
Por que colocar os dados num gráfico?
Eles oferecem uma forma resumida de enxergar como os dados se comportam.
15
2.1.2 – DISTRIBUIÇÃO DE FREQÜÊNCIA
O conjunto de dados da turma de Administração apresenta dados relativos à altura dos
alunos. Se eu quiser resumir tais dados? Posso construir uma distribuição de freqüência.
Uma distribuição de freqüência é uma tabela na qual os valores de uma variável são
agrupados em classes e a quantidade de valores observados em cada classe é registrada. Dados
organizados em distribuições de freqüência também são chamados dados agrupados.
Podemos construir distribuições de freqüência tanto pra variáveis quantitativas quanto
qualitativas (ou categóricas). Segue abaixo um exemplo de distribuição de freqüência para a uma
variável qualitativa: DESLOCAMENTO.
FREQÜÊNCIA FREQÜÊNCIA ABSOLUTA RELATIVA
A PÉ 4 22,2%CARRO 7 38,9%
MOTOCICLETA 1 5,6%ÔNIBUS 5 27,8%OUTROS 1 5,6%TOTAL 18 100,0%
DESLOCAMENTO
A seguir, mostraremos os passos para construir uma distribuição de freqüência para uma
variável quantitativa. O quadro abaixo apresenta os dados de altura dos 18 alunos do banco de
dados de referencia.
170 163 171 165 161 160160 173 163 164 158 180165 165 170 172 171 158
PASSOS PARA A CONSTRUÇÃO DE UMA DISTRIBUIÇÃO DE FREQUENCIA
1º PASSO: Ordenar os dados
158 158 160 160 161 163163 164 165 165 165 170170 171 171 172 173 180
2º PASSO: Calcular a amplitude
Amplitude = (maior valor – menor valor): 180 – 158 = 22
3º PASSO: Calcular o número de classes:
Número de classes = (aqui devo sempre arredondar pra cima)
16
4º PASSO: Calcular a amplitude de classes:
Amplitude de classe = Amplitude Número de classes
Observação: O arredondamento no cálculo da amplitude de classe deve ser sempre para
cima, para evitar que alguma observação da amostra fique fora da tabela de distribuição.
5º PASSO: Definir o limite inferior da primeira classe:
158
Observação: O limite inferior da primeira classe deve ser igual ao menor valor observado
da amostra, e o limite superior da última classe deve ser superior ao maior valor observado da
amostra.
6º PASSO: Definir os intervalos (extremos) das classes:
1ª) 158 a 163; 2ª) 163 a 168; 3ª) 168 a 173; 4ª) 173 a 178; 5ª) 178 a 183;
Observação: Os intervalos são definidos somando o limite inferior da primeira classe mais
a amplitude da classe.
7º PASSO: : Contar a freqüência de observações em cada classe (ni) e calcular a freqüência relativa (fi)
8º PASSO: calcular a freqüência acumulada (Ni) e a freqüência relativa acumulada (Fi)
9º PASSO: apresentar a tabela de freqüência.
Altura ni fi Ni Fi158 ├ 163 5 0,28 5 0,28163 ├ 178 6 0,33 11 0,61168 ├ 173 5 0,28 16 0,89173 ├ 178 1 0,06 17 0,94178 ├ 183 1 0,06 18 1,00
TOTAL 18 1,00 18 1,00Fonte: Dados da pesquisa
Significado dos símbolos
17
ni: Freqüência absoluta simples
fi: Freqüência relativa simples
Ni: Freqüência absoluta acumulada
Fi: Freqüência relativa acumulada
Portanto, quais os tipos de freqüência?
Absoluta
Absoluta acumulada
Relativa
Relativa Acumulada
Por que eu preciso disso tudo?
Estamos aprendendo a resumir os dados de uma pesquisa. Uma das formas de fazer isso
é através de distribuições de freqüência. Na vida real a construção de uma distribuição de freqüência
é uma pouco mais simples quando usamos computadores.
Uma forma de visualizar os dados da distribuição de freqüência é através do gráfico
conhecido como HISTOGRAMA. A figura abaixo mostra um histograma construído no EXCEL.
5
6
5
1 1
0
1
2
3
4
5
6
7
158 ├ 163 163 ├ 178 168 ├ 173 173 ├ 178 178 ├ 183
EXERCÍCIO 2.4
18
Construa uma distribuição de freqüência para a variável peso:
1º PASSO: Ordenar os dados
2º PASSO: Calcular a amplitude
3º PASSO: Calcular o número de classes:
4º PASSO: Calcular a amplitude de classes:
5º PASSO: Definir o limite inferior da primeira classe:
6º PASSO: Definir os intervalos (extremos) das classes:
7º PASSO: : Contar a freqüência de observações em cada classe (ni) e calcular a freqüência relativa (fi)
8º passo: calcular a freqüência acumulada (Ni) e a freqüência relativa acumulada (Fi)
9º PASSO: apresentar a tabela de freqüência.
EXERCÍCIO 2.5
19
Construa um histograma utilizando a distribuição de freqüência do exercício anterior.
Qual a diferença entre o histograma e o gráfico de barras?
Os histogramas se parecem bastante com os gráficos de barras. Entretanto existem três
diferenças principais:
(1) As barras podem ser grudadas. (Há situações onde isso não ocorre quando a freqüência for
zero).
(2) É indicado para variáveis quantitativas agrupadas e não para variáveis categóricas.
Posso usá-lo para variáveis categóricas?
Sim, mas para representar categorias o gráfico de barras é mais indicado. O hábito de
fazer a distinção entre os dois tipos de gráfico nos conduz a sempre diferenciar entre variáveis
contínuas e discretas, sob o ponto de vista de distribuições de probabilidades.
EXERCÍCIO 2.6
O quadro abaixo mostra o número de multas aplicadas por um radar numa determinada
avenida nos 30 dias de um mês. Siga os passos abaixo para construir uma distribuição de
freqüência para os dados.
20
2 4 5 5 6 7 7 8 8 810 10 11 11 11 11 12 12 13 1313 13 13 14 14 15 15 16 16 1718 18 19 19 19 21 21 22 25 26
(a) Calcule a amplitude
(b) Calcule o número de classes
(c) Calcule a amplitude de classes
(d) Defina o limite inferior da primeira classe
(e) Defina os intervalos de classes (use a tabela abaixo)
(f) Conte a freqüência de observações em cada classe (ni) e calcule a freqüência relativa (fi) (use a tabela abaixo)
(g) Calcule a freqüência acumulada (Ni) e a freqüência relativa acumulada (Fi) (use a tabela abaixo)
Classes freqüência freqüência Freqüência Freqüência relativaabsoluta (ni) relativa (fi) acumulada (Ni) acumulada (Fi)
Distribuição de Freqüência das notas de estatística
21
********************************************
CAPÍTULO 3
ANÁLISE EXPLORATÓRIA DE DADOS:
MEDIDAS DE POSIÇÃO E DISPERSÃO
********************************************
3.1 – RESUMINDO OS DADOS – MEDIDAS DE TENDÊNCIA CENTRAL
Uma das formas de explorar um conjunto de dados é através do uso de tabelas e gráficos.
Além disso, podemos utilizar algumas medidas estatísticas conhecidas como medidas-resumo, que
se dividem em medidas de tendência central e medidas de dispersão.
MÉDIA ARITMÉTICA SIMPLES
A média aritmética simples é uma das medidas de tendência central mais utilizada no dia-
a-dia. A mesma é calculada conforme a fórmula abaixo:
onde n representa o número de observações ou tamanho da amostra. A média aritmética simples
geralmente é representada pela letra x com uma barra sobre a mesma. No numerador aparece um
símbolo de somatório indicando que todas as unidades observacionais devem ser somadas. O quadro
abaixo mostra cinco valores referentes ao tempo de chegada da viatura em acidentes de trânsito
classificados como graves:
9 10 30 39 50
A média aritmética simples pode ser calculada da seguinte forma:
O resultado da fórmula mostra uma média de 27,6 minutos.
Esse valor pode ser calculado no Excel utilizando a fórmula:
22
EXERCÍCIO 3.1
Calcule o tempo médio de chegada da viatura para os acidentes de gravidade BAIXA.
A média é _____
NÚMERO GRAVIDADE NÚMERO DE DISTÂNCIA TEMPO DEDA DA DIA DURAÇÃO VÍTIMA VEÍCULOS DO MOTORISTA CHEGADA
OCORRÊNCIA OCORRÊNCIA (TEMPO) FATAL ENVOLVIDOS POSTO POLICIAL ALCOOLIZADO DA VIATURA1 ALTA FIM-DE-SEMANA 75 SIM 8 2,5 SIM 102 MÉDIA DURANTE A SEMANA 66 NÃO 5 1,4 SIM 53 BAIXA DURANTE A SEMANA 18 NÃO 3 3,2 NÃO 154 BAIXA DURANTE A SEMANA 19 NÃO 4 5,9 NÃO 265 MÉDIA DURANTE A SEMANA 25 NÃO 2 6,4 NÃO 306 BAIXA FIM-DE-SEMANA 26 NÃO 2 8,3 NÃO 407 MÉDIA FIM-DE-SEMANA 35 NÃO 2 1,3 SIM 68 BAIXA DURANTE A SEMANA 44 NÃO 2 5,5 NÃO 199 BAIXA DURANTE A SEMANA 17 NÃO 3 14,2 NÃO 35
10 MÉDIA DURANTE A SEMANA 29 SIM 2 6,6 SIM 2211 BAIXA DURANTE A SEMANA 30 NÃO 3 7,1 NÃO 1912 BAIXA DURANTE A SEMANA 41 NÃO 2 3,3 NÃO 1213 BAIXA DURANTE A SEMANA 22 NÃO 3 4,1 NÃO 1214 MÉDIA FIM-DE-SEMANA 55 NÃO 5 8,8 SIM 2515 ALTA FIM-DE-SEMANA 80 SIM 3 7,6 SIM 3016 BAIXA DURANTE A SEMANA 24 NÃO 2 8 NÃO 1817 MÉDIA DURANTE A SEMANA 36 NÃO 2 4 NÃO 1618 MÉDIA FIM-DE-SEMANA 75 NÃO 5 5,3 SIM 2219 MÉDIA DURANTE A SEMANA 15 SIM 1 9,3 NÃO 3120 BAIXA DURANTE A SEMANA 22 NÃO 2 4,1 NÃO 1421 ALTA DURANTE A SEMANA 21 SIM 2 13,2 NÃO 5022 MÉDIA FIM-DE-SEMANA 25 NÃO 1 11 SIM 3323 MÉDIA DURANTE A SEMANA 39 NÃO 6 15 SIM 3824 ALTA FIM-DE-SEMANA 61 SIM 2 14,3 SIM 3925 MÉDIA DURANTE A SEMANA 40 NÃO 4 10 NÃO 4026 BAIXA DURANTE A SEMANA 17 NÃO 2 14 NÃO 5127 MÉDIA DURANTE A SEMANA 26 NÃO 2 5 NÃO 1728 ALTA FIM-DE-SEMANA 69 SIM 6 2,5 SIM 929 BAIXA DURANTE A SEMANA 22 NÃO 2 1,9 SIM 630 BAIXA DURANTE A SEMANA 29 NÃO 1 1 NÃO 4
MÉDIA PONDERADA
23
A média ponderada é uma média aritmética na qual cada valor é ponderado de acordo com
sua importância no grupo como um todo.
A fórmula da média ponderada é:
Operacionalmente, cada valor no grupo (X) é multiplicado por um fator de peso apropriado
(w) e o produto é então somado e dividido pela soma dos pesos.
Por exemplo, se eu estiver interessado na nota média do ENEM (Exame Nacional do ensino
médio) para quatro escolas de uma determinada região, é importante ponderar os valores das notas
pelo número de matrículas por escola. A Tabela abaixo apresenta o número de matrículas na rede
estadual em cada estado (valores fictícios):
ESCOLA NOTA Nº DE ALUNOSA 8 200B 9 150C 6 400D 7 250
Fonte: fictícia
Distribuição das notas das escolas num teste de proficiência
A média ponderada para os dados da tabela acima pode ser calculada da seguinte forma:
Para calcular a média ponderada no EXCEL devemos utilizar a função SOMARPRODUTO
para obter o resultado do numerador. Para o denominador, utilizamos a função SOMA. A saída do
EXCEL a seguir resume o procedimento.
24
EXERCÍCIO 3.2Calcule a média ponderada da NOTA para os dados da tabela abaixo:
Companhia NOTA Nº DE MILITARESCompanhia A 80 175Companhia B 77 250Companhia C 91 330Companhia D 85 425
Fonte: fictícia
Nota das Companhias referentes ao Batalhão 10
O RESULTADO É ___________
ACHANDO A MEDIANA
Quando temos um conjunto de dados que apresentam valores discrepantes, podemos
utilizar outra medida para resumir os dados: a MEDIANA.
O cálculo é feito tomando o valor do meio, após os dados terem sido colocados em ordem
crescente.
O quadro abaixo apresenta os valores do TEMPO DE CHEGADA – em minutos – da viatura
para acidentes de gravidade BAIXA.
25
5 6 16 17 22 22 25 30 31 33 38 40
Para calcular a mediana desses dados, devemos inicialmente colocá-los em ordem
crescente.
O próximo passo consiste em encontrar a “posição que divide os dados ao meio”. Se
tivéssemos 3 valores, a posição seria referente ao segundo valor. Se tivéssemos 11 valores a posição
seria referente ao sexto valor. Se tivéssemos 13, a posição seria referente ao 7º valor. Como temos 12
valores, devemos escolher a posição referente ao 6,5º valor. Para isso basta encontrar o “valor do
meio” entre 22 e 25: 23,5.
No Excel, basta utilizar a função:
=MED
Observe:
Portanto, se você tiver, por exemplo, 3 valores, a mediana é o valor que encontra-se na
posição 2. Se tiver 4 valores, a mediana é o valor que se encontra na posição 2,5 (entre os números de
posição 2 e 3). E se você tiver n números?
3 passos para achar a mediana:
1 – Organize os números em ordem crescente
2 – Se você tiver um número ímpar de valores , a mediana é o valor que está no meio.
3 – Se tiver um número par de valores , some 1 ao número de valores e depois divida por
dois. A mediana será o valor correspondente à posição calculada (n+1)/2.
26
EXERCÍCIO 3.3
Calcule a mediana da variável DISTÂNCIA.
O resultado é ___________
MODA
A Moda é simplesmente o valor que mais aparece. Geralmente é mais útil para variáveis
nominais (ou categóricas). A função utilizada no EXCEL para o cálculo da moda é: MODO
EXERCÍCIO 3.4
Qual a MODA da variável “NÚMERO DE VEÍCULOS ENVOLVIDOS”?
O resultado é ___________
Para um pequeno conjunto de dados no qual nenhum dos valores medidos se repetiu, não
existe moda.
Quando dois valores aparecem com a mesma freqüência, a distribuição é descrita como
sendo bimodal. Distribuições de medições com muitas modas são denominadas multimodais.
EXERCÍCIO 3.5
Para uma amostra de 15 estudantes do ensino fundamental numa lanchonete, os seguintes valores
de vendas, agrupados em ordem crescente são observados:
0,10 0,10 0,25 0,25 0,250,35 0,40 0,53 0,90 1,251,35 2,45 2,71 3,09 4,10
Calcule:
[a] Média:
[b] Mediana:
27
[c] Moda
EXERCÍCIO 3.6
O quadro abaixo apresenta uma amostra de 20 operadores de produção de uma companhia, os
quais receberam os seguintes valores líquidos como pagamento após todos os descontos em uma
dada semana, arredondado ao dólar mais próximo e agrupada em ordem crescente:
240 240 265 300240 240 265 305240 240 280 325240 255 280 330240 255 290 340
Calcule:
[a] Média
[b] Mediana
[c] Moda
EXERCÍCIO 3.7
28
Aumento Custo médio por mês percentual (antes do aumento)
Leite 0,10 20Carne moída -0,06 30
Vestuário -0,08 30Gasolina 0,20 50
Item
Use a tabela acima para determinar a variação média percentual através da ponderação das
variações percentuais para cada item, pelo valor mensal gasto com cada item antes da modificação.
(PORTANTO, CALCULE A MÉDIA PONDERADA.
29
********************************************
CAPÍTULO 4
ANÁLISE EXPLORATÓRIA DE DADOS:
MEDIDAS DISPERSÃO
********************************************
4.1 – RESUMINDO OS DADOS – MEDIDAS DE DISPERSÃO
Lembre-se que o nosso propósito ao estudar as medidas-resumo passa por descrever os
dados de forma que os mesmos possam ser interpretados. Ao utilizar a média, mediana ou moda
estamos fornecendo um número que exerce essa função de resumir. No entanto, por serem medidas
de tendência central elas não fornecem uma idéia do grau de espalhamento dos dados. Para isso, faz-
se necessário o estudo das medidas de dispersão ou variabilidade.
A AMPLITUDE
A amplitude consiste na diferença entre o maior e o menor valor num conjunto de dados,
conforme a fórmula abaixo:
Amplitude = Limite superior – Limite inferior
O quadro abaixo apresenta um conjunto de valores relativos a dois conjuntos de dados: A e B.
A B8 89 109 10
10 1010 1010 1011 1011 1012 12
A amplitude dos dois conjuntos de dados é:
Amplitude = 12 – 8 = 4
No entanto, a referida medida apresenta limitações, pois retrata apenas os valores
extremos do conjunto de dados, desconsiderando o que ocorre entre o maior e o menor valor.
30
Podemos ilustrar tal argumento construindo um histograma para cada grupo com base nos dados das
distribuições de freqüência, conforme os quadros a seguir.
VALOR FREQÜÊNCIA8 19 2
10 311 212 1
GRUPO AVALOR FREQÜÊNCIA
8 19 0
10 811 012 1
GRUPO B
1
2
3
2
1
8 a 8,9 9 a 9,9 10 a 10,9 11 a 11,9 12 a 12,9
1
0
8
0
1
8 a 8,9 9 a 9,9 10 a 10,9 11 a 11,9 12 a 12,9
Portanto, a amplitude5 só descreve a largura dos dados e não como eles são dispersos
entre os limites.
Os dois conjuntos de dados acima têm a mesma amplitude, mas os valores são distribuídos
de forma diferente. O segundo conjunto tem valores discrepantes – valores extremos altos e baixos.
Aparentemente, a amplitude pode medir até que ponto os valores estão dispersos, mas é difícil ter
uma idéia real de como os dados são distribuídos.
O PROBLEMA COM VALORES DISCREPANTES6.
A amplitude é uma forma simples de dizer qual é a dispersão de um conjunto de dados,
mas, muitas vezes, não é a melhor maneira de medir como os dados são distribuídos dentro do
conjunto. Se os dados tiverem valores discrepantes, o uso da amplitude para descrever como os
valores são dispersos pode ser bastante enganoso, devido à sensibilidade a tais valores discrepantes.
Suponha que tenhamos um conjunto de dados como a seguir:
5 GRIFFITHS, Dawn, Use a cabeça: estatística. Editoras Altabooks. Rio de Janeiro, 2009, pag.88.6 Adaptado de: GRIFFITHS, Dawn, Use a cabeça: estatística. Editoras Altabooks. Rio de Janeiro, 2009, pag.89.
31
1 1 1 2 2 2 2 3 3 3 3 3 4 4 4 4 5 5 5
Aqui, os números estão razoavelmente distribuídos de forma uniforme entre o limite
inferior e o limite superior, e não há nenhum valor discrepante com que nos preocupamos. Qual a
amplitude desse conjunto de dados?
Amplitude = 5 – 1 = 4
Mas o que acontece se introduzirmos um valor discrepante, como o número 10?
1 1 1 2 2 2 2 3 3 3 3 3 4 4 4 4 5 5 5 10
Amplitude = 10 – 1 = 9
Nosso limite inferior é o mesmo, mas o limite superior aumentou para 10, nos dando uma
nova amplitude igual a 9. A amplitude aumentou em 5, só porque acrescentamos um número extra,
um valor discrepante.
Sem o valor discrepante, os dois conjuntos de dados seriam idênticos; então, por que há
uma diferença tão grande na forma em que descrevemos como os dados estão distribuídos?
Notamos que a amplitude apresenta-se como uma medida de dispersão limitada, uma vez
que reflete apenas os extremos dos dados.
Se ela é tão limitada, por que é tão usada? Pelo fato de ser de fácil entendimento, até de
leigos.
Então qual seria a solução para driblar o problema da limitação da amplitude? Podemos
trabalhar com quartis.
QUARTIS
Os quartis surgem como medidas estatísticas intermediárias. Num conjunto de dados
podemos obter os seguintes valores:
a) O primeiro quartil: Aponta o valor que representa a posição referente a 25% dos dados.
Os 25% menores.
b) Segundo quartil: Aponta o valor que representa a posição referente a 50% dos dados. Os
50% menores. Na verdade esse valor é a própria mediana.
c) Terceiro quartil: Aponta o valor que representa a posição referente a 75% dos dados. Os
75% menores (ou 25% maiores).
Nesse sentido, ao apresentar medidas resumo num conjunto de dados de uma pesquisa,
podemos resumir uma variável com as seguintes informações: mínimo, máximo, média, mediana,
primeiro quartil, terceiro quartil e desvio-padrão.
DESVIO PADRÃO E VARIÂNCIA
32
Uma forma de avaliar como os dados se distribuem em torno da média é a variância. Tal
medida consiste da “média quadrática dos desvios em relação à média”. O motivo do uso da “média
quadrática” é que a média aritmética simples dos desvios sempre dá zero.
Tirar a média dos valores absolutos também é viável, no entanto é uma medida pouco
usada, pois apresenta limitações em termos de propriedades probabilítisticas.
A fórmula da variância é:
Portanto, a variância consiste em subtrair cada valor observado da média, elevá-lo ao
quadrado, somar todos os valores e em seguida dividir pelo tamanho da amostra.
No entanto, para que a medida de variação tenha a mesma dimensão da média, é mais
comum trabalhar com o desvio-padrão, que nada mais é que a RAIZ QUADRADA DA VARIÂNCIA.
EXERCÍCIO 4.1
Calcule a variância e o desvio padrão da variável DISTÂNCIA do banco de dados
fictício para as variáveis de gravidade ALTA.
2,57,6
13,214,32,5
O resultado é:
Variância:_____________
Desvio padrão:_________
Os comandos para o cálculo da variância e desvio padrão são, respectivamente:
VARP
DESVPAD
Confira os cálculos acima no Excel.
RETOMANDO
A primeira etapa da análise de dados consiste no resumo dos mesmos. Uma das formas de
33
fazer isso é através da construção de distribuições de freqüência e pelo uso dos mais diversos tipos de
gráficos.
Além disso, podemos utilizar medidas-resumo. As principais são média, mediana, desvio-
padrão, mínimo, máximo e quartis.
O quadro a seguir apresenta a nota dos alunos de três turmas.
A B C5 3 05 4 16 6 97 8 107 9 10
TURMAS
A nota média das três turmas é a mesma: 6.
Dessa forma podemos notar uma limitação da média: Não fornece informação sobre como
os dados se distribuem. Uma forma de solucionar o problema é através do cálculo do desvio padrão.
Os valores de desvio padrão para os dados do quadro acima são, respectivamente: 0,9;
2,3 e 4,5. Isso significa que, apesar das médias serem iguais, os valores encontram-se mais
espalhados na turma C.
COEFICIENTE DE VARIAÇÃO DE PERSON
Outra medida do grau de dispersão dos dados é o Coeficiente de Variação de Pearson. O
mesmo consiste na razão entre o desvio padrão e a média, conforme a fórmula abaixo:
x 100
EXERCÍCIO 4.2
Considere que você seja o Administrador de uma Fábrica de Biscoitos. Em função do aumento da
demanda pelos produtos surgiu a necessidade de expansão da fábrica. Ao pesquisar sobre a fonte
de financiamento do maquinário, foram obtidos os seguintes dados acerca da taxa de juros cobrada
por dois diferentes bancos nos últimos 12 meses conforme a Tabela abaixo:
34
Banco Alfa Banco Betaset/08 2,1 1,8out/08 2 1,8nov/08 1,9 1,8dez/08 1,8 1,7jan/09 1,8 1,7fev/09 1,7 1,8mar/09 1,6 2,2abr/09 1,7 2,2mai/09 1,8 1,7jun/09 1,9 1,6jul/09 2 1,6
ago/09 2 1,6Fonte: Fictícia
Taxas de juros para empréstimosnos últimos 12 meses
(1) Calcule a Média Aritmética da Taxa de Juros da cada banco nos últimos 12 meses
(2) Mostre que o desvio-médio é igual a zero para o Banco Alfa.
(3) Calcule a variância e desvio-padrão para cada Banco.
(4) Calcule o Coeficiente de Variação para a Taxa de Juros dos Bancos.
(5) Discuta com seus colegas qual o melhor Banco a ser escolhido para fazer o financiamento do maquinário.
EXERCÍCIO 4.3
Um investidor possui R$ 30.000 aplicados no mercado de ações. Os investimentos foram divididos
em: R$ 7.500 no ativo A, R$ 9.000 no ativo B e R$ 13.500 no ativo C. Durante 5 meses, os retornos
respectivos (em percentual) foram:
35
A 1,5 2,0 1,2 1,8 1,0B 2,0 0,5 1,5 1,3 0,7C 1,3 1,0 0,7 0,9 1,1
Considerando que o retorno da carteira de investimentos consiste na média ponderada do retorno
dos ativos, calcule o retorno da carteira (em percentual) no período considerado.
EXERCÍCIO 4.4
O número de carros vendidos por cada um dos vendedores de uma agencia de automóveis durante um determinado mês, agrupado em ordem crescente, é:
2 4 7 10 1010 12 12 14 15
Determine:
[a] Amplitude
[b] Desvio médio absoluto
[c] Média
[d] Mediana
[e] Moda
[f] variância
[g] Desvio-padrão
36
[h] Coeficiente de variação
EXERCÍCIO 4.5
NÚMERO GRAVIDADE NÚMERO DE DISTÂNCIA TEMPO DEDA DA DIA DURAÇÃO VÍTIMA VEÍCULOS DO MOTORISTA CHEGADA
OCORRÊNCIA OCORRÊNCIA (TEMPO) FATAL ENVOLVIDOS POSTO POLICIAL ALCOOLIZADO DA VIATURA1 ALTA FIM-DE-SEMANA 75 SIM 8 2,5 SIM 102 MÉDIA DURANTE A SEMANA 66 NÃO 5 1,4 SIM 53 BAIXA DURANTE A SEMANA 18 NÃO 3 3,2 NÃO 154 BAIXA DURANTE A SEMANA 19 NÃO 4 5,9 NÃO 265 MÉDIA DURANTE A SEMANA 25 NÃO 2 6,4 NÃO 306 BAIXA FIM-DE-SEMANA 26 NÃO 2 8,3 NÃO 407 MÉDIA FIM-DE-SEMANA 35 NÃO 2 1,3 SIM 68 BAIXA DURANTE A SEMANA 44 NÃO 2 5,5 NÃO 199 BAIXA DURANTE A SEMANA 17 NÃO 3 14,2 NÃO 35
10 MÉDIA DURANTE A SEMANA 29 SIM 2 6,6 SIM 2211 BAIXA DURANTE A SEMANA 30 NÃO 3 7,1 NÃO 1912 BAIXA DURANTE A SEMANA 41 NÃO 2 3,3 NÃO 1213 BAIXA DURANTE A SEMANA 22 NÃO 3 4,1 NÃO 1214 MÉDIA FIM-DE-SEMANA 55 NÃO 5 8,8 SIM 2515 ALTA FIM-DE-SEMANA 80 SIM 3 7,6 SIM 3016 BAIXA DURANTE A SEMANA 24 NÃO 2 8 NÃO 1817 MÉDIA DURANTE A SEMANA 36 NÃO 2 4 NÃO 1618 MÉDIA FIM-DE-SEMANA 75 NÃO 5 5,3 SIM 2219 MÉDIA DURANTE A SEMANA 15 SIM 1 9,3 NÃO 3120 BAIXA DURANTE A SEMANA 22 NÃO 2 4,1 NÃO 1421 ALTA DURANTE A SEMANA 21 SIM 2 13,2 NÃO 5022 MÉDIA FIM-DE-SEMANA 25 NÃO 1 11 SIM 3323 MÉDIA DURANTE A SEMANA 39 NÃO 6 15 SIM 3824 ALTA FIM-DE-SEMANA 61 SIM 2 14,3 SIM 3925 MÉDIA DURANTE A SEMANA 40 NÃO 4 10 NÃO 4026 BAIXA DURANTE A SEMANA 17 NÃO 2 14 NÃO 5127 MÉDIA DURANTE A SEMANA 26 NÃO 2 5 NÃO 1728 ALTA FIM-DE-SEMANA 69 SIM 6 2,5 SIM 929 BAIXA DURANTE A SEMANA 22 NÃO 2 1,9 SIM 630 BAIXA DURANTE A SEMANA 29 NÃO 1 1 NÃO 4
Utilizando o banco de dados acima, calcule:
[a] A média do tempo de chegada da viatura nos fins de semana.
[b] A média do tempo de chegada da viatura nos dias de semana.
[c] A variância e desvio padrão do tempo de chegada da viatura nos fins de semana.
37
[d] A variância e desvio padrão do tempo de chegada da viatura nos dias de semana.
[e] O Coeficiente de Variação para fins de semana e dias de semana.
[f] O tempo médio de duração do atendimento para ocorrências de gravidade: ALTA, MÉDIA E BAIXA.
[g] Calcule a variância e desvio padrão para as médias do item anterior.
REFERÊNCIAS BIBLIOGRÁFICAS
GRIFFITHS, Dawn. Use a cabeça! Estatística. Rio de Janeiro: Altabooks, 2009.
MAGALHÃES, Marcos Nascimento, LIMA, Antônio Carlos Pedroso de. Noções de
Probabilidade e Estatística. 6º. Edusp, 2007.
MONTGOMERY, D. C.; RUNGER, G. C. Estatística aplicada e probabilidade para
38
engenheiros. 3.ed. Rio de Janeiro: LTC, 2009.
MOORE, David S. A estatística básica e sua prática. Rio de Janeiro. LTC, 2005.
MOORE, David. S, McCABE, George P., DUCKWORTH, William M., SCLOVE, Stanley
L. A Prática da Estatística Empresarial. Como Usar Dados para Tomar Decisões. Rio de
Janeiro: LTC, 2006.
TRIOLA, Mário F. Introdução à Estatística. LTC. 10a edição 2008. 722p.
WALPOLE, Ronald. E. Probabilidade e estatística para engenharia e ciências. São
Paulo: Pearson Prentice Hall, 2009.
39
top related