estatistica aplicada ao serviço social
DESCRIPTION
estatisticaTRANSCRIPT
Autor: Prof. Alan Rodrigo Navia Colaboradores: Profa. Silmara Maria Machado
Prof. Nonato Assis de Miranda
Estatística
Professor conteudista: Alan Rodrigo Navia
Alan Rodrigo Navia é natural de São Paulo e morador de Taboão da Serra. É graduado em Materiais, Processos e Componentes Eletrônicos pela Fatec-SP. Possui mestrado em Engenharia Eletrônica pela Poli-USP, na área de Circuitos Integrados.
Exerceu as seguintes funções no mercado de trabalho: pesquisador em Engenharia na Swiss Group, analista estatístico na Amcham, especialista em sistemas pleno no Carrefour e atualmente é coordenador de sistemas no Grupo Renac.
Academicamente, lecionou na Fundação Santo André no curso de Engenharia, foi auxiliar docente do curso de Engenharia Eletrônica na Poli-USP e leciona há quase dez anos na Unip. Principais disciplinas de atuação: Estatística, Banco de Dados, Programação de Computadores e Matemática, para diversos cursos de graduação. Este material foi escrito com base nos vários anos de docência em Estatística, para cursos que não são da área de Exatas.
© Todos os direitos reservados. Nenhuma parte desta obra pode ser reproduzida ou transmitida por qualquer forma e/ou quaisquer meios (eletrônico, incluindo fotocópia e gravação) ou arquivada em qualquer sistema ou banco de dados sem permissão escrita da Universidade Paulista.
Dados Internacionais de Catalogação na Publicação (CIP)
F325e Navia, Alan Rodrigo
Estatística / Alan Rodrigo Navia. – São Paulo: Editora Sol, 2012.
132 p., il.
1. Estatística. 2. Pedagogia. 3. Serviço Social. I. Título.
CDU 519.2
Prof. Dr. João Carlos Di GenioReitor
Prof. Fábio Romeu de CarvalhoVice-Reitor de Planejamento, Administração e Finanças
Profa. Melânia Dalla TorreVice-Reitora de Unidades Universitárias
Prof. Dr. Yugo OkidaVice-Reitor de Pós-Graduação e Pesquisa
Profa. Dra. Marília Ancona-LopezVice-Reitora de Graduação
Unip Interativa – EaD
Profa. Elisabete Brihy
Prof. Marcelo Souza
Profa. Melissa Larrabure
Material Didático – EaD
Comissão editorial: Dra. Angélica L. Carlini (UNIP) Dr. Cid Santos Gesteira (UFBA) Dra. Divane Alves da Silva (UNIP) Dr. Ivan Dias da Motta (CESUMAR) Dra. Kátia Mosorov Alonso (UFMT) Dra. Valéria de Carvalho (UNIP)
Apoio: Profa. Cláudia Regina Baptista – EaD Profa. Betisa Malaman – Comissão de Qualificação e Avaliação de Cursos
Projeto gráfico: Prof. Alexandre Ponzetto
Revisão: Juliana Maria Mendes Amanda Casale
SumárioEstatística
APRESENTAçãO ......................................................................................................................................................7INTRODUçãO ...........................................................................................................................................................7
Unidade I
1 CONCEITOS FUNDAMENTAIS .........................................................................................................................91.1 Conceitos iniciais .....................................................................................................................................91.2 Dados ......................................................................................................................................................... 101.3 População x amostra ............................................................................................................................111.4 Amostragem ............................................................................................................................................11
2 DISTRIBUIçãO DE FREQUêNCIAS ............................................................................................................. 142.1 Conceitos básicos ................................................................................................................................. 142.2 Elementos de uma distribuição de frequência ......................................................................... 18
2.2.1 Classe (i) ...................................................................................................................................................... 182.2.2 Limites de classe (li e Li) ....................................................................................................................... 182.2.3 Amplitude de classe (hi) ....................................................................................................................... 182.2.4 Amplitude amostral (AA) ..................................................................................................................... 182.2.5 Ponto médio de classe (xi) ................................................................................................................... 19
2.3 Tipos de frequências ............................................................................................................................ 192.3.1 Frequência absoluta ou simples (fi) ................................................................................................. 192.3.2 Frequência relativa (fri) ........................................................................................................................ 192.3.3 Frequência acumulada (Fi) .................................................................................................................. 20
2.4 Construção de distribuições de frequências ............................................................................. 212.4.1 Distribuição sem intervalo .................................................................................................................. 212.4.2 Distribuição com intervalo .................................................................................................................. 21
2.5 Representações gráficas .................................................................................................................... 242.5.1 Histograma (gráfico de colunas) ...................................................................................................... 242.5.2 Polígono de frequências (gráfico cartesiano) .............................................................................. 24
3 MEDIDAS DE TENDêNCIA ............................................................................................................................. 253.1 Média (x) .................................................................................................................................................. 25
3.1.1 Dados não agrupados ........................................................................................................................... 253.1.2 Distribuição de frequências sem intervalo ................................................................................... 263.1.3 Distribuição de frequências com intervalo .................................................................................. 26
3.2 Moda (Mo) ............................................................................................................................................... 283.2.1 Dados não agrupados ........................................................................................................................... 283.2.2 Distribuição de frequências sem intervalo ................................................................................... 293.2.3 Distribuição de frequências com intervalo .................................................................................. 29
3.3 Mediana (Md) ......................................................................................................................................... 30
3.3.1 Dados não agrupados ........................................................................................................................... 313.3.2 Distribuição de frequências sem intervalo ................................................................................... 313.3.3 Distribuição de frequências com intervalo .................................................................................. 32
4 MEDIDAS DE DISPERSãO ............................................................................................................................. 344.1 Introdução ............................................................................................................................................... 344.2 Variância (s2) ........................................................................................................................................... 35
4.2.1 Dados não agrupados ........................................................................................................................... 354.2.2 Distribuição de frequências sem intervalo ................................................................................... 364.2.3 Distribuição de frequências com intervalo .................................................................................. 37
4.3 Desvio-padrão (s) ................................................................................................................................. 384.3.1 Dados não agrupados ........................................................................................................................... 394.3.2 Distribuição de frequências sem intervalo ................................................................................... 394.3.3 Distribuição de frequências com intervalo .................................................................................. 40
4.4 Coeficiente de variação (CV) ............................................................................................................ 40
Unidade II
5 CONCEITOS BáSICOS DE PROBABILIDADE ............................................................................................ 725.1 Conceitos fundamentais ................................................................................................................... 725.2 Eventos complementares ................................................................................................................. 765.3 Eventos independentes ...................................................................................................................... 775.4 Eventos mutuamente exclusivos ................................................................................................... 78
5.4.1 Exercício resolvido .................................................................................................................................. 80
6 DISTRIBUIçãO NORMAL DE PROBABILIDADES ................................................................................... 826.1 Conceitos fundamentais ................................................................................................................... 82
6.1.1 Exercícios resolvidos .............................................................................................................................. 87
7 CORRELAçãO LINEAR .................................................................................................................................... 927.1 Conceitos e diagrama de dispersão .............................................................................................. 92
8 COEFICIENTE DE PEARSON .......................................................................................................................... 94
7
APREsENtAção
Este livro-texto contempla os temas fundamentais para um curso de Introdução à Estatística, que na maioria das instituições de ensino superior ou técnico tem duração semestral.
A grande quantidade de exercícios de fixação e a preocupação em explicar os métodos de cálculo, passo a passo, sem excesso de texto, são os pontos marcantes deste material, que tem como objetivo ensinar os conceitos básicos de Estatística para um público que não lida diariamente e/ou tem pouca desenvoltura com a Matemática.
O pré-requisito para acompanhar esta obra é somente a Matemática do primeiro grau, atualmente chamado de Ensino Fundamental, o que atende principalmente aos cursos que não são de Exatas, pois nestes a Matemática é exercitada a todo o momento, nas mais diversas disciplinas, tais como Física, Cálculo, Programação de Computadores etc.
Espero que esta obra ajude o leitor a compreender os conceitos básicos de Estatística de maneira mais leve, porém bastante consistente.
INtRodução
Este livro-texto aborda os assuntos fundamentais da Estatística, desde o estudo de uma variável até a introdução ao estudo do comportamento mútuo de duas variáveis.
A Unidade I cobre os conceitos introdutórios, porém importantíssimos para o entendimento do restante do material, a organização de dados em tabelas de frequência, a obtenção de medidas de tendência e posição e a determinação de medidas de dispersão e variabilidade. Esses tópicos fazem parte da Estatística Descritiva (responsável por organizar e descrever os dados coletados).
A Unidade II cobre os conceitos de probabilidade simples (que também são abordados na disciplina Matemática), distribuição normal de probabilidades e a determinação da correlação entre duas variáveis, por meio do diagrama de dispersão e do coeficiente de Pearson.
Cada unidade pode ser ministrada em um bimestre, se o curso introdutório de Estatística for de duas horas-aula semanais. Vale lembrar que o material tem como leitor-alvo o aluno de graduação dos cursos da área de Humanas e Ciências Sociais Aplicadas.
Espero que este livro auxilie o aluno com pouca desenvoltura em Matemática a entender e aplicar os conceitos básicos de Estatística, além de servir como guia para qualquer aluno relembrar Estatística rapidamente.
9
Revi
são:
Jul
iana
- D
iagr
amaç
ão: F
abio
- 1
7-08
-12
ESTATÍSTICA
Unidade I1 CoNCEItos fuNdAmENtAIs
1.1 Conceitos iniciais
A palavra estatística tem origem do vocábulo latino status, que significa estado, e foi utilizada para o levantamento de dados por parte do Estado, visando à tomada de decisões.
Atualmente a Estatística é parte da Matemática Aplicada que se dedica ao estudo e à interpretação de fenômenos coletivos e deles extrai conclusões.
A Estatística fornece métodos para:
• coleta de dados, feita normalmente por meio de um questionário ou da observação direta do fenômeno estudado;
• organização e descrição dos dados;
• análise e interpretação dos dados visando à tomada de decisões.
A Estatística pode ser aplicada às mais diversas áreas do conhecimento, tais como Economia, Física, Medicina, Psicologia, Engenharia, Pedagogia e Serviço Social, para tabular e interpretar os resultados de um experimento, e, mais recentemente, para a geração e a interpretação de indicadores.
Esses indicadores são largamente utilizados na gestão dos mais diversos segmentos do conhecimento.
Para um aluno de qualquer curso superior, a Estatística é muito importante para:
• organizar e analisar os dados de um experimento científico/observação de um fenômeno em qualquer área do conhecimento;
• servir de embasamento para entender, analisar e até criar indicadores relevantes em seu trabalho (entendendo que, muitas vezes, o egresso de um curso superior pode assumir um cargo de gerência no seu segmento de formação).
Podemos citar como exemplos de indicadores: o índice de desenvolvimento humano (IDH) de uma determinada localidade, a taxa de evasão de clientes de uma empresa de telefonia e os vários indicadores de aprendizado utilizados na educação.
10
Unidade I
Revi
são:
Jul
iana
- D
iagr
amaç
ão: F
abio
- 1
7-08
-12
A Estatística pode ser classificada em:
• descritiva: responsável pela coleta, organização e descrição dos dados;
• indutiva: responsável pela análise e interpretação dos dados.
1.2 dados
Dados são informações obtidas a partir de medições, resultados de pesquisas, contagens e levantamentos em geral.
Alguns exemplos de dados são: o número de alunos de uma classe, o número de eleitores que votaram em um determinado candidato em uma eleição, o número de leitos ocupados em um hospital e as notas dos candidatos de um determinado concurso público.
Em Estatística, os dados podem ser classificados como:
• Qualitativos: são dados compostos de qualquer informação não numérica. Exemplos: estado civil (solteiro, casado); cor dos olhos (pretos, castanhos, verdes); time do coração (Corinthians, Palmeiras, São Paulo, Santos); religião praticada (católica, protestante, budista); tipo sanguíneo (A, B, O) etc.
• Quantitativos: são dados compostos de informações numéricas e podem ser subdivididos em:
— Discretos: são compostos somente por números inteiros e enumeráveis (na maioria das vezes, são oriundos de uma contagem). Exemplos: número de filhos, população de um município, número de escolas particulares em um determinado local, número de visitas em um determinado site na internet etc.
— Contínuos: são compostos por números inteiros ou fracionários (na maioria das vezes, são obtidos por meio de uma medição). Exemplos: altura, peso, preço de um determinado produto, área de um terreno, renda mensal de uma família, o tempo gasto em uma viagem nacional, a distância entre dois bairros etc.
Dados Qualitativos
Quantitativos Discretos
Contínuos
Figura 1 – Classificação dos dados em Estatística
11
Revi
são:
Jul
iana
- D
iagr
amaç
ão: F
abio
- 1
7-08
-12
ESTATÍSTICA
observação
A classificação da variável depende do contexto. Por exemplo: para fins cadastrais, a variável idade poderia ser quantitativa discreta; na Pediatria, porém, é contínua, pois a parte fracionária também é considerada.
1.3 População x amostra
População é o conjunto de entes portadores de, no mínimo, uma característica comum; também chamada de universo estatístico. Um exemplo são os estudantes de uma instituição de ensino, pois a característica comum é o fato de estudarem na mesma instituição. Os eleitores de um estado da federação também são um exemplo.
Na maioria das vezes, podemos concluir que é inviável ter acesso a toda a população para a coleta de dados (por limitações monetárias, de tempo etc.). Logo, normalmente é feita a coleta em uma parte, que deve ser muito representativa dessa população. Tal parcela é denominada amostra.
Amostra corresponde ao subconjunto finito e representativo de uma população. Para obtermos uma boa amostra, utilizamos a técnica da amostragem.
1.4 Amostragem
Há diversos tipos de amostragem.
Na amostragem simples (ou aleatória), todos os itens da população têm igual chance de pertencer à amostra (normalmente feita por sorteio).
Sorteio
População
Amostra
Figura 2 – Amostragem simples
Já na amostragem sistemática, os itens encontram-se ordenados e enumerados, e a coleta dos elementos da amostra é feita periodicamente.
População Amostra
8 7 6 5 4 3 2 1 7 4 1
Figura 3 – Amostragem sistemática
12
Unidade I
Revi
são:
Jul
iana
- D
iagr
amaç
ão: F
abio
- 1
7-08
-12
Observação: período de três (elementos coletados, iniciando do primeiro e em seguida coletando de três em três).
Na amostragem estratificada, a população encontra-se dividida em vários estratos, e as amostras são coletadas aleatoriamente de cada estrato.
População
Amostra
Figura 4 – Amostragem estratificada
saiba mais
Após a leitura e a compreensão deste material, você pode aprofundar os estudos em amostragem (para compreender assuntos como tamanho e nível de confiança de amostra), lendo o livro a seguir:
BRUNI, A. L. Estatística aplicada à gestão empresarial. São Paulo: Atlas, 2007.
Exemplos de Aplicação
1. Cite pelo menos dez aplicações da Estatística (pesquise em jornais e sites da internet).________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________
2. Defina os termos amostra e população.________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________
13
Revi
são:
Jul
iana
- D
iagr
amaç
ão: F
abio
- 1
7-08
-12
ESTATÍSTICA
3. O que são dados qualitativos?________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________
4. O que são dados quantitativos discretos e quantitativos contínuos?________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________
5. Dê pelo menos oito exemplos para cada tipo de dado:
a) Qualitativo______________________________________________________________________________________________________________________________________________________________________________________________________________________________________________
b) Quantitativo discreto______________________________________________________________________________________________________________________________________________________________________________________________________________________________________________
c) Quantitativo contínuo______________________________________________________________________________________________________________________________________________________________________________________________________________________________________________
6. Pesquise um exemplo prático para cada tipo de amostragem.________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________
14
Unidade I
Revi
são:
Jul
iana
- D
iagr
amaç
ão: F
abio
- 1
7-08
-12
2 dIstRIbuIção dE fREquêNCIAs
2.1 Conceitos básicos
Para compreender todos os conceitos, será utilizada uma amostra como exemplo. A amostra é de quarenta alunos de uma escola qualquer, e a variável a ser estudada é a estatura deles em centímetros.
Segue a tabela dos valores de estaturas (em cm) coletados:
Tabela 1 – Tabela primitiva das estaturas dos alunos
166 161 162 165 164
162 168 156 160 164
155 163 155 169 170
154 156 153 156 158
160 150 160 167 160
161 163 173 155 168
152 160 155 151 164
161 172 157 158 161
Essa tabela com os dados coletados (dados brutos), sem nenhuma organização, é chamada de tabela primitiva.
Analisando os dados na tabela primitiva, para determinar a maior e a menor estatura, será necessário examinar item a item, o que tende a ser ineficiente, principalmente se o tamanho da amostra for grande. Logo, se os dados da tabela forem organizados em ordem crescente ou decrescente, será obtida uma nova tabela chamada de rol.
Tabela 2 – Rol das estaturas dos alunos
150 155 160 162 166
151 156 160 162 167
152 156 160 163 168
153 156 160 163 168
154 157 161 164 169
155 158 161 164 170
155 158 161 164 172
155 160 161 165 173
Examinando o rol, fica fácil determinar a maior e a menor estatura (173 e 150 cm, respectivamente), o que permite concluir que a faixa de estaturas é de 150 a 173 cm. Outros questionamentos, como: “Qual é a estatura com o maior número de alunos?” (160 cm) e “Qual(is) é(são) a(s) estatura(s) inexistente(s) no
15
Revi
são:
Jul
iana
- D
iagr
amaç
ão: F
abio
- 1
7-08
-12
ESTATÍSTICA
intervalo de 150 a 173 cm?” (159 e 171 cm), podem ser respondidos, porém com uma observação mais cuidadosa do rol.
Para responder ao questionamento anterior com mais agilidade, o rol será alocado em uma tabela, em que cada estatura terá um número correspondente de ocorrências (vindo da contagem do rol).
Tabela 3 – Tabela de ocorrências das estaturas dos alunos
Estatura (cm) Número de ocorrências
150 1
151 1
152 1
153 1
154 1
155 4
156 3
157 1
158 2
159 0
160 5
161 4
162 2
163 2
164 3
165 1
166 1
167 1
168 2
169 1
170 1
171 0
172 1
173 1
Esta tabela de ocorrências para todos os valores das estaturas é chamada de distribuição
de frequências. Nesse caso, como foram exibidos todos os valores de estatura, esta distribuição é classificada como sem intervalo.
16
Unidade I
Revi
são:
Jul
iana
- D
iagr
amaç
ão: F
abio
- 1
7-08
-12
Tabela 4 – Distribuição de frequências sem intervalo para as estaturas dos alunos
Estatura (cm) Fi
150 1
151 1
152 1
153 1
154 1
155 4
156 3
157 1
158 2
159 -
160 5
161 4
162 2
163 2
164 3
165 1
166 1
167 1
168 2
169 1
170 1
171 -
172 1
173 1
∑fi 40
Onde:
fi = frequência (número de ocorrências para cada valor de estatura)
∑fi = n
∑fi = soma das frequências
n = número de elementos da amostra (n = 40)
A amostra das estaturas tem a faixa de estaturas de 23 cm (basta subtrair a maior da menor estatura), que resulta numa tabela com muitas linhas. Se a faixa de estaturas fosse maior, a tabela teria ainda mais linhas, o que prejudicaria a análise rápida dos dados.
Para gerar uma tabela mais enxuta e de fácil análise, é possível agrupar as estaturas em intervalos. No exemplo, as estaturas serão agrupadas de quatro em quatro, gerando intervalos de 4 cm (no momento,
17
Revi
são:
Jul
iana
- D
iagr
amaç
ão: F
abio
- 1
7-08
-12
ESTATÍSTICA
não há a necessidade de preocupar-se com a razão de o agrupamento ser de quatro em quatro, pois adiante será explicado o critério de cálculo utilizado). Essa tabela é chamada de distribuição de frequências com intervalo.
Tabela 5 – Distribuição de frequências com intervalo para as estaturas dos alunos
Estaturas (cm) fi
150├ 154 4
154├ 158 9
158├ 162 11
162├ 166 8
166├ 170 5
170├ 174 3
∑fi 40
Onde:
Não inclui o valor (utiliza-se o anterior)Inclui o valor
é o operador de intervalo.
Figura 5
Exemplo:
O quinto intervalo da tabela anterior que mostra 166├ 170 é para as estaturas de 166 a 169 cm (note que o valor 170 cm é considerado no sexto). Os valores do rol que atendem a esse intervalo são: 166, 167, 168, 168 e 169. Estes cinco valores resultam na frequência igual a 5 para o quinto intervalo.
A etapa da contagem dos valores do rol para a tabela de frequências deve ser feita com o máximo de cuidado, pois um erro na contagem ocasiona análises equivocadas e valores errados de todas as medidas estatísticas feitas a partir dessa tabela.
saiba mais
O modelo de distribuição estudado é o mais utilizado pelos autores, porém existem outros modelos, com outros tipos de intervalo além do ├. Matematicamente um intervalo pode ser representado de diversas maneiras, como (┤,├,├┤ e ─).
Para mais informações sobre esse assunto, leia:
MORETTIN, L. G. Estatística básica. São Paulo: Makron Books, 1999.
18
Unidade I
Revi
são:
Jul
iana
- D
iagr
amaç
ão: F
abio
- 1
7-08
-12
2.2 Elementos de uma distribuição de frequência
Todos os conceitos a seguir serão explicados com base na distribuição de frequências já explicada anteriormente (Tabela 5).
2.2.1 Classe (i)
É cada intervalo, ou cada linha para uma tabela de frequências. O total de classes de uma tabela de frequências é denominado k.
Exemplo: i = 3 (terceira classe: 158├ 162)
k = 6
2.2.2 Limites de classe (li e Li)
São os extremos de cada classe.
Onde li é o limite inferior (extremo a esquerda) e Li é o limite superior (extremo a direita) da classe. O índice i apenas indica qual é a classe abordada.
Exemplo: l2 = limite inferior da segunda classe = 154
L5 = limite superior da quinta classe = 170
2.2.3 Amplitude de classe (hi)
É a medida do intervalo de classe.
hi = Li - li
Exemplo: h3 = amplitude da terceira classe
h3 = L3 -l3 = 162 - 158 = 4cm
observação
Uma distribuição com intervalos sempre terá a mesma amplitude para todas as classes. Note que para todos os intervalos o h é 4.
2.2.4 Amplitude amostral (AA)
É a diferença entre o valor máximo e o valor mínimo da amostra. É obtido por meio do rol (nesse caso, a Tabela 2).
AA = Xmax - xmin
19
Revi
são:
Jul
iana
- D
iagr
amaç
ão: F
abio
- 1
7-08
-12
ESTATÍSTICA
Exemplo: Amplitude amostral para as estaturas dos alunos
AA = 173 - 150 = 23cm
2.2.5 Ponto médio de classe (xi)
É o ponto que divide a classe em duas partes iguais. Será muito utilizado a partir deste ponto.
xili Li= +
2
Exemplo: Ponto médio da segunda classe.
x cm2154 158
2156= + =
2.3 tipos de frequências
2.3.1 Frequência absoluta ou simples (fi)
É o número de ocorrências para cada uma das classes, obtida por meio da contagem no rol.
Exemplo: f3 = 11
2.3.2 Frequência relativa (fri)
É a razão da frequência simples com a soma das frequências da classe. Fornece a participação percentual de cada classe em relação à amostra.
ƒ ƒ
ƒri
ii
=Σ
observação
∑fi = n (a soma das frequências é igual ao número de elementos do rol).
e
∑fri = 1 (a soma das frequências relativas deve ser sempre igual a 1, que indica 100%).
20
Unidade I
Revi
são:
Jul
iana
- D
iagr
amaç
ão: F
abio
- 1
7-08
-12
Exemplo:
ƒ ƒƒ
ri
22 9
400 225= = =
Σ,
Isso significa que 22,5% das estaturas estão na segunda classe.
2.3.3 Frequência acumulada (Fi)
É a soma das frequências até a classe indicada.
Exemplo:
F2 = frequência acumulada da segunda classe = soma das frequências simples até a segunda classe.
F2 = 4 + 9 = 13
Finalmente temos a distribuição com as frequências e os pontos médios calculados.
Tabela 6 – Distribuição de frequências com intervalo para as estaturas dos alunos, com as frequências calculadas
I Estaturas (cm) fi xi fri Fi
1 150├ 154 4 152 0,100 4
2 154├ 158 9 156 0,225 13
3 158├ 162 11 160 0,275 24
4 162├ 166 8 164 0,200 32
5 166├ 170 5 168 0,125 37
6 170├ 174 3 172 0,075 40
∑ 40 1,000
• Para a coluna fi, contar cuidadosamente os elementos do rol, lembrando-se da notação de intervalo e considerando as repetições.
• Para facilitar a determinação da coluna xi, basta calcular o ponto médio, a primeira classe (152) e somar a amplitude de classe (4), intervalo por intervalo.
• Não é obrigatório, mas é altamente recomendável utilizar duas ou três casas após a vírgula para os valores de fri, visando sempre a um percentual preciso por classe.
• Note que o último valor de Fi é sempre a soma das frequências (∑fi).
21
Revi
são:
Jul
iana
- D
iagr
amaç
ão: F
abio
- 1
7-08
-12
ESTATÍSTICA
2.4 Construção de distribuições de frequências
2.4.1 Distribuição sem intervalo
Dado o rol de uma pesquisa referente ao número de carros por residência em um determinado bairro de SP (n = 20).
Tabela 7 – Rol do número de carros por residência
0 1 1 2 3
0 1 1 2 3
1 1 1 2 4
1 1 2 2 4
Análise: este rol apresenta poucas possibilidades de valores para a variável, mais precisamente de 0 a 4 carros, e isso permite concluir que a distribuição sem intervalos é a mais indicada.
Logo, para construir a distribuição de frequências sem intervalos, não existe nenhum cálculo. A partir do rol, basta colocar em cada classe um dos valores da variável e contar o número de ocorrências para cada classe.
Tabela 8 – Distribuição de frequências sem intervalo para o rol do número de carros por residência
Nº de carros Fi
0 2
1 9
2 5
3 2
4 2
∑ 20
2.4.2 Distribuição com intervalo
Com base no rol das estaturas dos alunos (n = 40), já mostrado e repetido a seguir para fins didáticos.
Tabela 9 – Repetição do rol das estaturas dos alunos
150 155 160 162 166
151 156 160 162 167
152 156 160 163 168
153 156 160 163 168
154 157 161 164 169
155 158 161 164 170
155 158 161 164 172
155 160 161 165 173
22
Unidade I
Revi
são:
Jul
iana
- D
iagr
amaç
ão: F
abio
- 1
7-08
-12
Análise: este rol apresenta muitas possibilidades de valores para a variável, mais precisamente de 150 a 173 cm (o que resultaria em uma distribuição sem intervalo com muitas linhas), e isso permite concluir que a distribuição com intervalos é a mais indicada.
Logo, para construir a distribuição de frequências com intervalos, é necessário determinar:
• o número de classes da distribuição (k)
k n=
Onde o valor de K deve ser sempre arredondado para inteiro.
Para o rol anterior:
K = =40 6 32, , arredondando para cima temos 4;logo h = 4 (cada uma das classes terá amplitude de 4cm).
• a amplitude de classe (h)
hAAk
=
Em que o valor de h sempre será arredondado para cima.
Para o rol do exemplo:
h = − = =173 1506
336
3 83, , arredondando para cima temos 4;
logo h = 4 (cada umadas classes terá amplitude de 4cm).
De posse das duas informações necessárias para montar uma tabela com intervalo (k = 6 e h = 4), realizamos o seguinte procedimento:
Passo 1: colocar o menor valor do rol no limite inferior da primeira classe.
Passo 2: somar o valor de h calculado e colocar no limite superior da primeira classe. Colocar o sinal de intervalo entre os limites.
Tabela 10 – Início da construção de uma distribuição sem intervalo
I Estaturas (cm)
1 150├ 154
23
Revi
são:
Jul
iana
- D
iagr
amaç
ão: F
abio
- 1
7-08
-12
ESTATÍSTICA
Passo 3: repetir o limite superior da classe em foco na classe abaixo.
Tabela 11 – Andamento da construção de uma distribuição sem intervalo
I Estaturas (cm)
1 150├ 154
2 154
Passo 4: somar o valor de h (h = 4) calculado e colocar no limite superior desta classe. Colocar o sinal de intervalo entre os limites.
Tabela 12 – Andamento da construção de uma distribuição sem intervalo
I Estaturas (cm)
1 150├ 154
2 154├ 158
Passo 5: repetir os passos 3 e 4 até completar o total de intervalos k calculado (k = 6).
Passo 6: determinar as frequências simples (pela contagem no rol) para todas as classes da distribuição. Finalmente, somar as frequências, lembrando que ∑fi deve ser igual a n.
Tabela 13 – Distribuição sem intervalo finalizada
I Estaturas (cm) fi
1 150├ 154 4
2 154├ 158 9
3 158├ 162 11
4 162├ 166 8
5 166├ 170 5
6 170├ 174 3
∑ 40
k = 6
h=4
observação
Esse é um dos critérios existentes para se construir uma distribuição de frequências com intervalo de classe. Existe também o critério de Sturges, que também é bem conhecido. A principal diferença está no cálculo de k, pois nesse caso k é dado por:
K =1+3,3 log n
24
Unidade I
Revi
são:
Jul
iana
- D
iagr
amaç
ão: F
abio
- 1
7-08
-12
2.5 Representações gráficas
Para a distribuição com intervalo, podemos representar os dados utilizando dois tipos de gráfico: o histograma e o polígono de frequências.
2.5.1 Histograma (gráfico de colunas)
• Composição:
— no eixo x (horizontal): os limites das classes da variável em estudo;
— no eixo y (vertical): as frequências para cada uma das classes;
— a altura da barra será proporcional à frequência de cada uma das classes.
f
12
9
6
3
0150 154 158 162 170166 174 estaturas (cm)
Figura 6 – Histograma para uma distribuição com intervalo (Tabela 13)
2.5.2 Polígono de frequências (gráfico cartesiano)
• Composição:
— no eixo x (horizontal): os pontos médios das classes da variável em estudo;
— no eixo y (vertical): as frequências para cada uma das classes;
— ligar os pontos (no cruzamento das coordenadas dos eixos x e y); para fechar o polígono, deve-se:
- subtrair a amplitude de classe (no exemplo, h = 4) do ponto médio da primeira classe (l1) para fechar o polígono pela esquerda (no eixo x);
- somar a amplitude de classe (h = 4) no ponto médio da última classe da distribuição para fechar o polígono pela direita.
25
Revi
são:
Jul
iana
- D
iagr
amaç
ão: F
abio
- 1
7-08
-12
ESTATÍSTICA
f
12
9
6
3
0150 154 158 162 166 174170 Estaturas (cm)
Figura 7 – Polígono de frequências para uma distribuição com intervalo (Tabela 13)
3 mEdIdAs dE tENdêNCIA
Para analisar um conjunto de dados, muitas vezes é necessário obter um único valor que represente toda a amostra em estudo. Esse valor é usualmente obtido pelas medidas de tendência.
As medidas de tendência abordadas serão:
• a média (x);
• a moda (Mo);
• a mediana (Md).
O cálculo de cada uma das medidas de tendência será explicado em três abordagens:
• dados não agrupados (não alocados em tabelas de frequência);
• distribuição de frequência sem intervalo;
• distribuição de frequência com intervalo.
3.1 média (x)
A média de um conjunto de dados é a soma dos dados dividida pelo número de elementos do conjunto.
3.1.1 Dados não agrupados
xxi
n= ∑
Onde: ∑xi é a soma dos valores do conjunto de dados.
n é o número de elementos do conjunto de dados.
26
Unidade I
Revi
são:
Jul
iana
- D
iagr
amaç
ão: F
abio
- 1
7-08
-12
Exemplo: as notas de um aluno em uma determinada disciplina durante o ano foram: 3,5; 5,0; 6,5 e 9,0. A nota média do aluno na disciplina pode ser calculada por:
xn
= + + + = =3 5 5 0 6 5 9 04
246 0
, , , ,,
3.1.2 Distribuição de frequências sem intervalo
xxi fin
= ∑ .
Onde: xi.fi é a multiplicação dos valores das classes com as respectivas frequências, classe por classe.
n é o número de elementos do conjunto de dados que, nesse caso, é determinado pela soma das frequências.
Exemplo: dada a distribuição sem intervalo da Tabela 8, determine o número médio de veículos por residência em um determinado bairro.
Para armazenar os valores de xi.fi, uma coluna é criada. Em seguida, os valores da coluna são somados, gerando ∑xi.fi.
Tabela 14 – Cálculo da média para uma distribuição sem intervalo
Nº de carros fi xi.fi
0 2 0 x 2 = 0
1 9 1 x 9 = 9
2 5 2 x 5 = 10
3 2 3 x 2 = 6
4 2 4 x 2 = 8
∑ 20 ∑xi.fi = 33
x = =3320
165,
Logo, no bairro citado há em média 1,65 carros por residência (para efeito de interpretação, aproximadamente 2 carros por residência).
3.1.3 Distribuição de frequências com intervalo
xxi fin
= ∑ .
Onde: xi.fi é a multiplicação dos pontos médios das classes com as respectivas frequências, classe por classe.
27
Revi
são:
Jul
iana
- D
iagr
amaç
ão: F
abio
- 1
7-08
-12
ESTATÍSTICA
Lembrando que:
xili Li= +
2
n é o número de elementos do conjunto de dados que, nesse caso, é determinado pela soma das frequências.
Exemplo: dada a distribuição com intervalo da Tabela 13, determine a estatura média dos alunos que compõem a amostra.
O procedimento é similar ao da distribuição sem intervalo, apenas com o detalhe de xi, que para uma distribuição com intervalo é o ponto médio da classe.
Tabela 15 – Cálculo da média para uma distribuição com intervalo
I Estaturas (cm) fi xi xi.fi
1 150├ 154 4 (150 + 154)/2 = 152 152 x 4 = 608
2 154├ 158 9 (154 + 158)/2 = 156 156 x 9 = 1404
3 158├ 162 11 (158 + 162)/2 = 160 160 x 11 =1760
4 162├ 166 8 (162 + 166)/2 = 164 164 x 8 = 1312
5 166├ 170 5 (166 + 170)/2 = 168 168 x 5 = 840
6 170├ 174 3 (170 + 174)/2 = 172 172 x 3 = 516
∑ 40 ∑xi.fi = 6440
x cm= =644040
161
Logo, a estatura média para a amostra de alunos é de 161 cm.
observação
Uma análise muito simples é comparar os dados com a média. No exemplo anterior, temos estaturas acima e abaixo da média. Logo, a média pode ser um interessante indicador de classificação.
Exemplos de Aplicação
Compare as vendas mensais com uma média histórica, para indicar o desempenho de cada vendedor.
28
Unidade I
Revi
são:
Jul
iana
- D
iagr
amaç
ão: F
abio
- 1
7-08
-12
observação
Além da média que estudamos, muito utilizada como indicador de tendência, existem outros tipos, como: a média ponderada, que também indica tendência, mas considera os valores da variável com pesos diferentes, e a média móvel em um determinado número de valores (tipicamente de 3 a 12), largamente utilizada no cálculo de previsão.
3.2 moda (mo)
A moda é o valor que ocorre com maior frequência em um conjunto de dados. Serve para indicar as regiões das máximas frequências.
3.2.1 Dados não agrupados
Dados os conjuntos a seguir, a moda será determinada analisando-se as maiores frequências.
Exemplo 1: conjunto 1
20 30 40 80 10 10 20 30 20
O valor 20 se repete mais vezes que os outros (possui maior frequência).
Mo = 20
Exemplo 2: conjunto 2
10 20 30 30 30 40 50 50 50 60
Os valores 30 e 50 se repetem mais vezes que os outros valores do conjunto; logo, existem duas modas (30 e 50).
Mo = 30 e Mo = 50 (conjunto bimodal)
Exemplo 3: conjunto 3
100 110 124 145 101 200 500
Nenhum valor se repete mais vezes que os outros valores do conjunto; logo, não existe valor modal (conjunto amodal).
29
Revi
são:
Jul
iana
- D
iagr
amaç
ão: F
abio
- 1
7-08
-12
ESTATÍSTICA
3.2.2 Distribuição de frequências sem intervalo
Para determinar a moda em uma distribuição sem intervalo, basta identificar a classe com maior frequência simples (classe modal). A moda será o valor da variável da classe modal.
Exemplo: dada a distribuição sem intervalo da Tabela 8, determine o valor modal dos veículos por residência em um determinado bairro.
Tabela 16 – Obtenção da moda para uma distribuição sem intervalo
Nº de carros fi
0 2
1 9
2 5
3 2
4 2
∑ 20
Maior fi na segunda classe (classe modal)
O valor da variável para a classe modal é igual a 1; logo, Mo = 1.
3.2.3 Distribuição de frequências com intervalo
Para determinar a moda em uma distribuição com intervalo, inicialmente é necessária a classe modal (da mesma forma que na distribuição sem intervalo).
Nesse caso, a moda será obtida aplicando-se a fórmula a seguir na classe modal:
Mo ld
d dh= +
+⋅* *
11 2
Onde: l* é o limite inferior da classe modal h* é a amplitude da classe modal
d1 = f* - fant d2 = f* - fpost f* é a frequência simples da classe modal fant é a frequência simples anterior (acima) à classe modal. fpost é a frequência simples posterior (acima) à classe modal.
Existem vários modelos para cálculo da moda. O modelo aqui apresentado é o mais utilizado e chama-se Moda de Czuber.
30
Unidade I
Revi
são:
Jul
iana
- D
iagr
amaç
ão: F
abio
- 1
7-08
-12
Exemplo: dada a distribuição com intervalo da Tabela 13, determine a estatura modal dos alunos que compõem a amostra.
Tabela 17 – Obtenção da moda para uma distribuição com intervalo
I Estaturas (cm) fi
1 150├ 154 4
2 154├ 158 9
3 158├ 162 11
4 162├ 166 8
5 166├ 170 5
6 170├ 174 3
∑ 40
Maior fi na terceira classe (classe modal)
l* = 158h* = 4d1 = 11 - 9 = 2d2 = 11 - 8 = 3
Logo:
Mo
Mo
Mo cm
= ++
⋅
= + = +
=
1582
2 34
15885
158 16
159 6
,
,
observação
Assim como nos dados não agrupados, uma distribuição pode ser bimodal, desde que existam duas maiores frequências. Nesse caso basta calcular as modas para as duas classes modais. Isso vale para mais de duas modas em uma distribuição, ainda que essa ocorrência não seja tão comum.
3.3 mediana (md)
A mediana é o valor que caracteriza o centro de uma distribuição de frequências. Divide um conjunto ordenado de dados em duas partes iguais de 50% (daí o fato de a mediana ser considerada também uma medida de posição).
31
Revi
são:
Jul
iana
- D
iagr
amaç
ão: F
abio
- 1
7-08
-12
ESTATÍSTICA
3.3.1 Dados não agrupados
Dados os conjuntos a seguir, antes de determinar a mediana, é necessário ordenar os dados da amostra.
Exemplo 1: conjunto ordenado 1
20 30 50 80 190 210 300
Esta é uma amostra ímpar, pois possui 7 elementos (n = 7).
Para amostras ímpares, a mediana é o elemento central da série de dados.
20 30 50 80 190 210 300
Logo, Md = 80.
Exemplo 2: conjunto ordenado 2
100 230 300 500 600 800
Esta é uma amostra par, pois possui 6 elementos (n = 6)
Para amostras pares, existem dois elementos centrais na série de dados, então a mediana é a média de ambos.
100 230 300 500 600 800Logo, Md = (300+500) / 2 Md = 800 / 2 Md = 400
3.3.2 Distribuição de frequências sem intervalo
Para determinar a mediana em uma distribuição sem intervalo é necessário:
Passo 1: determinar as frequências acumuladas (Fi) de todas as classes da distribuição.
Passo 2: identificar a classe mediana. Para isso, é necessário calcular uma referência.
∑ ƒi2
Passo 3: comparar o valor da referência com cada uma das frequências acumuladas. Se houver um Fi igual à referência, a classe deste Fi será a classe mediana. Caso contrário, deverá ser escolhido o Fi superior mais próximo da referência para obter a classe mediana.
32
Unidade I
Revi
são:
Jul
iana
- D
iagr
amaç
ão: F
abio
- 1
7-08
-12
Passo 4: a mediana é o valor da variável da classe encontrada (classe mediana).
Exemplo: dada a distribuição sem intervalo da Tabela 8, determine o valor da mediana.
∑ = =ƒi2
202
10 (referência)
Tabela 18 – Obtenção da mediana para uma distribuição sem intervalo
Nº de carros fi Fi
0 2 2
1 9 11
2 5 16
3 2 18
4 2 20
∑ 20
Valor de Fi (11) superior mais próximo da referência (10). Esta é a classe mediana (segunda classe).
O valor da variável para a classe mediana é igual a 1; logo, Md =1
3.3.3 Distribuição de frequências com intervalo
Para determinar a mediana em uma distribuição com intervalo, inicialmente é necessária a classe mediana (da mesma forma que na distribuição sem intervalo, isto é, seguindo os passos 1, 2 e 3).
Nesse caso, a mediana será obtida aplicando-se a fórmula a seguir na classe mediana:
Md l
iFant
h= +
∑ −
⋅*
**
ƒ
ƒ2
Onde: l* é o limite inferior da classe mediana ∑fi/2 é a referência, já calculada anteriormente para a escolha da classe mediana. Fant é a frequência acumulada anterior (acima) à classe mediana. f* é a frequência simples da classe mediana. h* é a amplitude da classe mediana.
Exemplo: dada a distribuição com intervalo da Tabela 13, determine a estatura mediana dos alunos que compõem a amostra.
∑ = =ƒi2
402
20 (referência)
33
Revi
são:
Jul
iana
- D
iagr
amaç
ão: F
abio
- 1
7-08
-12
ESTATÍSTICA
Tabela 19 – Obtenção da mediana para uma distribuição com intervalo
I Estaturas (cm) fi Fi
1 150├ 154 4 4
2 154├ 158 9 13
3 158├ 162 11 24
4 162├ 166 8 32
5 166├ 170 5 37
6 170├ 174 3 40
∑ 40
Valor de Fi (24) superior mais próximo da referência (20). Esta é a classe mediana (terceira classe).
l* = 158∑fi/2 = 20Fant = 13f* = 11h* = 4
Logo:
Md
Md
Md
Md
Md
= +−[ ] ⋅
= + ⋅
= +
= +=
15920 13
114
158711
4
1582811
158 2 55
160
,
,,55 cm
Concluindo: a estatura que divide os 50% mais altos dos 50% mais baixos é de 160,55 cm.
observação
Além da mediana, uma medida tanto de tendência quanto de posição, existem outras também importantes, como o quartil, o decil e o percentil. O método de obtenção é muito parecido com o da mediana, que tem o dois como referência nos cálculos. O quartil, o decil e o percentil, por sua vez, dividem uma série em quatro, dez ou cem partes iguais.
34
Unidade I
Revi
são:
Jul
iana
- D
iagr
amaç
ão: F
abio
- 1
7-08
-12
4 mEdIdAs dE dIsPERsão
4.1 Introdução
As medidas de dispersão têm como finalidade indicar o quanto os dados apresentam-se dispersos em torno de uma região central, isto é, mostram o grau de variação em uma amostra.
As medidas de dispersão abordadas serão:
• a variância (s2);
• o desvio-padrão (s);
• o coeficiente de variação (CV).
observação
Além das medidas de dispersão estudadas, existem modelos mais simplificados, como a amplitude e o desvio médio, que têm sua importância, porém não são tão utilizados como o desvio-padrão.
O cálculo de cada uma das medidas será explicado utilizando-se as três abordagens citadas anteriormente.
Porém, antes de serem apresentadas as fórmulas e os métodos para o cálculo, é interessante acompanhar, por meio de um exemplo, o significado e a importância do cálculo da dispersão.
Exemplo: existem três grupos de pessoas (cada um com oito elementos). A variável em estudo é a idade dessas pessoas.
Grupo 1:
20 20 20 20 20 20 20 20
Grupo 2:
18 18 19 20 20 21 22 22
Grupo 3:
2 5 10 13 20 25 35 50
Desejamos tirar algumas conclusões sobre os três grupos analisando a principal medida de tendência, a média.
35
Revi
são:
Jul
iana
- D
iagr
amaç
ão: F
abio
- 1
7-08
-12
ESTATÍSTICA
x do grupo
x do grupo
120 20 20 20 20 20 20 20
8160
820
218 18
= + + + + + + + = =
= + +119 20 20 21 22 228
1608
20
32 5 10 13 20 25 35 50
+ + + + + = =
= + + + + + + +x do grupo
88160
820= =
Os valores das médias para os três grupos foram iguais, mas percebemos que os grupos são totalmente distintos quanto às idades.
• No grupo 1, todos os valores coincidem com a média, pois não existem diferenças em relação a esta, logo não existe dispersão. É um grupo formado somente por pessoas de 20 anos de idade.
• No grupo 2, os valores não coincidem exatamente com a média, mas também não se afastam muito desta, logo existe uma pequena dispersão. É um grupo formado por pessoas com idades próximas de 20 anos.
• No grupo 3, a maioria dos valores está bem afastada de média, logo existe uma considerável dispersão. É um grupo formado pelas mais diversas idades.
Conclusão: apenas utilizando a média, os três grupos apresentavam um perfil de idades igual. No entanto, considerando também a dispersão das idades (afastamento dos valores em relação à média), podemos indicar as diferenças existentes entre os três grupos.
4.2 Variância (s2)
É a média dos quadrados das diferenças dos valores em relação a sua média.
4.2.1 Dados não agrupados
sxi xn
2 = ∑ −( )
Onde: xi são os valores da variável x é a média do conjunto de valores n é o número de elementos do conjunto de valores
Exemplo: as notas que um aluno tirou em um determinada disciplina durante o ano foram:3,5; 5,0; 6,5; e 9,0. A variância das notas do aluno na disciplina pode ser calculada por:
• Obtenção da média.
x = + + + = =3 5 5 0 6 5 9 04
244
6 0, , , ,
,
36
Unidade I
Revi
são:
Jul
iana
- D
iagr
amaç
ão: F
abio
- 1
7-08
-12
• Obtenção da variância utilizando uma tabela para organizar os cálculos.
Tabela 20 – Tabela para auxiliar na obtenção da variância de dados não agrupados
xi xi - x (xi - x)2
3,5 3,5 - 6 = -2,5 (-2,5)2 = 6,25
5,0 5 - 6 = -1 (-1)2 = 1
6,5 6,5 – 6 = 0,5 (0,5)2 = 0,25
9,0 9 - 6 = 3 (3)2 = 9
24 ∑(xi - x)2 = 16,5
s2 16 54
4 13= =,,
Lembrete
O número elevado ao quadrado é o produto do número por ele mesmo. Para os cálculos deste livro, uma calculadora com operações básicas (+, -, x e /) e raiz quadrada é mais que suficiente.
4.2.2 Distribuição de frequências sem intervalo
sxi x i
n2
2
= ∑ − ⋅( ) ƒ
Onde: xi são os valores da variável para cada classe x é a média dos valores da distribuição fi é a frequência simples de cada classe n é o número de elementos do conjunto de valores
Exemplo: dada a distribuição sem intervalo da Tabela 8, determine a variância de veículos por residência em um determinado bairro.
• Obtenção da média (já vista no item 3.1.2).
x carros= =3320
165,
37
Revi
são:
Jul
iana
- D
iagr
amaç
ão: F
abio
- 1
7-08
-12
ESTATÍSTICA
Tabela 21 – Cálculo da variância para uma distribuição sem intervalo
Nº de carros (xi) fi xi.fi xi - x (xi - x)2 (xi - x)2.fi
0 2 0 x 2 = 0 0 - 1,65 = -1,65 (-1,65)2 = 2,72 2,72 x 2 = 5,44
1 9 1 x 9 = 9 1 - 1,65 =- 0,65 (-0,65)2 = 0,42 0,42 x 9 = 3,78
2 5 2 x 5 = 10 2 - 1,65 = 0,35 (0,35)2 = 0,12 0,12 x 5 = 0,60
3 2 3 x 2 = 6 3 - 1,65 = 1.35 (1,35)2 = 1,82 1,82 x 2 = 3,64
4 2 4 x 2 = 8 4 - 1,65 = 2,35 (2,35)2 = 5,52 5,52 x 2 = 11,04
∑ 20 ∑xi.fi = 33 ∑(xi - x)2.fi = 24,5
Logo:
s carros2 224 520
123= =,,
observação
Um dos problemas do uso direto da variância é que a unidade e o valor estarão elevados ao quadrado.
4.2.3 Distribuição de frequências com intervalo
Considere:
sxi x i
n2
2
= ∑ − ⋅( ) ƒ
Onde:
xi é o ponto médio para cada classe
Lembrando que:
xili Li= +
2
Onde: x é a média dos valores da distribuição fi é a frequência simples de cada classe n é o número de elementos do conjunto de valores
Exemplo: dada a distribuição com intervalo da Tabela 13, determine a variância das estaturas dos alunos que compõem a amostra.
38
Unidade I
Revi
são:
Jul
iana
- D
iagr
amaç
ão: F
abio
- 1
7-08
-12
O procedimento é similar ao da distribuição sem intervalo, apenas com o detalhe de xi, que para uma distribuição com intervalo é o ponto médio da classe.
Tabela 22a-b – Cálculo da variância para uma distribuição com intervalo
a)
I Estaturas (cm) fi Xi xi.fi
1 150├ 154 4 (150 + 154)/2 = 152 152 x 4 = 608
2 154├ 158 9 (154 + 158)/2 = 156 156 x 9 = 1404
3 158├ 162 11 (158 + 162)/2 = 160 160 x 11 =1760
4 162├ 166 8 (162 + 166)/2 = 164 164 x 8 = 1312
5 166├ 170 5 (166 + 170)/2 = 168 168 x 5 = 840
6 170├ 174 3 (170 + 174)/2 = 172 172 x 3 = 516
∑ 40 ∑xi.fi = 6440
x cm= =644040
161
b)
xi - x (xi - x)2 (xi - x)2.fi
152 - 161 = -9 (-9)2 = 81 81 x 4 = 324
156 - 161 = -5 (-5)2 = 25 25 x 9 = 225
160 -161 = -1 (-1)2 = 1 1 x 11 = 11
164 -161 = 3 (3)2 = 9 9 x 8 = 72
168 -161 = 7 (7)2 = 49 49 x 5 = 245
172 - 161 = 11 (11)2 = 121 121 x 3 = 363
∑(xi - x)2.fi = 1240
Logo:
s cm2 2124040
31= =
4.3 desvio-padrão (s)
É a raiz quadrada da variância. É a medida de dispersão mais utilizada, por ter a mesma unidade que a média, possibilitando uma melhor avaliação da dispersão da amostra.
39
Revi
são:
Jul
iana
- D
iagr
amaç
ão: F
abio
- 1
7-08
-12
ESTATÍSTICA
4.3.1 Dados não agrupados
Considere:
sxi x
n= −Σ( )2
Onde: xi são os valores da variável x é a média do conjunto de valores n é o número de elementos do conjunto de valores
Utilizando o mesmo exemplo do item 4.2.1:
s2 16 54
4 13= =,,
Logo:
s = =4 13 2 03, ,
4.3.2 Distribuição de frequências sem intervalo
Considere:
sxi x i
n2
2
= − ⋅Σ( ) ƒ
Onde: xi são os valores da variável para cada classe x é a média dos valores da distribuição fi é a frequência simples de cada classe n é o número de elementos do conjunto de valores
Utilizando o mesmo exemplo do item 4.2.2:
s carros2 224 520
123= =,,
Logo:
s carros= =123 111, ,
40
Unidade I
Revi
são:
Jul
iana
- D
iagr
amaç
ão: F
abio
- 1
7-08
-12
4.3.3 Distribuição de frequências com intervalo
Considere:
sxi x i
n= − ⋅Σ( )2 ƒ
Onde: xi é o ponto médio para cada classe
Lembrando que: xili Li= +
2
x é a média dos valores da distribuiçãofi é a frequência simples de cada classen é o número de elementos do conjunto de valores
Utilizando o mesmo exemplo do item 4.2.3:
s cm2 2124040
31= =
Logo:
s cm= =31 5 57,
4.4 Coeficiente de variação (CV)
É o quociente entre o desvio-padrão e a média. É a medida de dispersão relativa, que indica a variabilidade percentual da amostra em relação à média.
CVs
x= ⋅100
A unidade do coeficiente de variação é uma porcentagem (%).
A fórmula e o método de cálculo são exatamente os mesmos para as três abordagens apresentadas.
Vale ressaltar que quanto maior o CV, maior será a variabilidade dos dados do conjunto, em relação a sua média.
Exemplo: calcular o coeficiente de variação do exemplo abordado no item 4.3.3 (estaturas dos alunos).
41
Revi
são:
Jul
iana
- D
iagr
amaç
ão: F
abio
- 1
7-08
-12
ESTATÍSTICA
Como:
x = 161 cms = 5,57 cm
Logo:
CV = ⋅ = =5 57161
100557161
3 46,
, %
As estaturas têm uma variabilidade de 3,46% em relação à média.
Resumo
Nesta Unidade abordamos inicialmente os principais conceitos teóricos para o estudo dos métodos estatísticos.
Foi apresentada a definição de Estatística bem como a sua divisão em Estatística Descritiva e Indutiva. Neste livro-texto abordaremos a maior parte da Estatística Descritiva e o início da Indutiva. Conceitos como os tipos de dados, que podem ser quantitativos (subdivididos em discretos e contínuos) e qualitativos, foram abordados com uma quantidade significativa de exemplos para a perfeita compreensão.
Vimos ainda as definições de população e amostra, e foi feita uma breve explicação introdutória de amostragem, em que foram exibidos seus principais tipos (aleatória, sistemática e estratificada).
Estudamos as formas de se armazenar dados quantitativos, que anteriormente estavam sob a forma de uma tabela primitiva ou um rol, em distribuições de frequências.
Aprendemos que existem dois tipos de distribuições de frequências: sem intervalo de classe e com intervalo de classe. Abordamos as diferenças e os métodos para a construção de uma tabela de frequências, com ou sem intervalo. Ressaltamos que erros, tanto na montagem da tabela quanto na contagem dos valores do rol, resultam em análise e medidas/indicadores errados.
Na sequência, apresentamos os principais tipos de frequências existentes (simples, relativa e acumulada) e as suas respectivas finalidades. Mostramos também a montagem de gráficos (histograma e polígono de frequências) para distribuições de frequências com intervalo (por serem as mais utilizadas na prática).
42
Unidade I
Revi
são:
Jul
iana
- D
iagr
amaç
ão: F
abio
- 1
7-08
-12
Além disso, estudamos as três principais medidas de tendência: a média, a moda e a mediana. As medidas foram analisadas sob três abordagens distintas (dados não agrupados, distribuição de frequência sem intervalo e distribuição de frequência com intervalo), pois os métodos de obtenção das medidas apresentam significativas diferenças para cada abordagem.
Vimos que a média de dados não agrupados é a média aritmética, muito utilizada academicamente para verificar o aproveitamento do aluno em uma disciplina. Aprendemos ainda que para a obtenção da média para distribuição de frequência, devemos levar em conta tanto a frequência quanto o valor da variável.
Abordamos a moda, que indica a(s) maior(es) frequências em uma série de dados. Foram apresentadas as três abordagens para a obtenção. A mediana, posição que indica o centro de uma série de dados (divide a série em duas partes de 50%) também foi apresentada das três maneiras.
No que se refere às medidas de dispersão, estudamos três das principais, novamente nas três abordagens (dados não agrupados, distribuição sem intervalo e distribuição com intervalo).
Aprendemos que a variância, definida pela média dos quadrados das diferenças dos valores em relação a sua média, é importante, porém não muito utilizada, pelo fato de a unidade da grandeza envolvida no cálculo estar elevada ao quadrado. Vimos, entretanto, que o desvio-padrão, cuja definição é a raiz quadrada da variância, é muitíssimo utilizado em várias áreas do conhecimento, para quantificar a dispersão de uma série de dados.
Para termos uma noção percentual da dispersão em relação à média, foi apresentado o coeficiente de variação, que é uma medida de dispersão derivada do desvio-padrão e da média dos dados analisados.
43
Revi
são:
Jul
iana
- D
iagr
amaç
ão: F
abio
- 1
7-08
-12
ESTATÍSTICA
Exercícios
Questão 01. Considere as notas de um teste de inteligência aplicado a 100 alunos.
Tabela 23 – Notas dos alunos no teste de inteligência
64 78 66 82 74 103 78 86 103 87
73 95 82 89 73 92 85 80 81 90
78 86 78 101 85 98 75 73 90 86
86 84 86 76 76 83 103 86 84 85
76 80 92 102 73 87 70 85 79 93
82 90 83 81 85 72 81 96 81 85
68 96 86 70 72 74 84 99 81 89
71 73 63 105 74 98 78 78 83 96
95 94 88 62 91 83 98 93 83 76
94 75 67 95 108 98 71 92 72 73
Construa uma distribuição de frequência com intervalos. Obtida a distribuição, calcule as frequências relativas e acumuladas.
44
Unidade I
Revi
são:
Jul
iana
- D
iagr
amaç
ão: F
abio
- 1
7-08
-12
Resolução:
Tabela 24 Rol
62 72 74 78 81 84 86 89 94 98
63 72 74 78 81 84 86 90 94 98
64 72 75 78 82 84 86 90 95 99
66 73 75 78 82 85 86 90 95 101
67 73 76 79 82 85 86 91 95 102
68 73 76 80 83 85 86 92 96 103
70 73 76 80 83 85 87 92 96 103
70 73 76 81 83 85 87 92 96 103
71 73 78 81 83 85 88 93 98 105
71 74 78 81 83 86 89 93 98 108
k
h
h
= =
= − =
=
100 10
108 6210
4 6
5
,
Tabela 25
notas fi fri Fi
62 ├ 67 4 0,0400 4
67 ├ 72 6 0,0600 10
72 ├ 77 18 0,1800 28
77 ├ 82 14 0,1400 42
82 ├ 87 24 0,2400 66
87 ├ 92 9 0,0900 75
92 ├ 97 13 0,1300 88
97 ├ 102 6 0,0600 94
102 ├ 107 5 0,0500 99
107 ├ 112 1 0,0100 100
100 1
Questão 02. Os números representam cotações (em US$) de uma determinada ação, durante certo período.
Tabela 26 – Cotações da ação
3,39 3,34 3,99 3,94 3,06
3,00 3,00 3,18 3,05 3,10
3,15 3,17 3,35 3,50 3,45
3,06 3,30 3,75 3,60 3,42
45
Revi
são:
Jul
iana
- D
iagr
amaç
ão: F
abio
- 1
7-08
-12
ESTATÍSTICA
Construa uma distribuição de frequência com intervalos. Obtida a distribuição, calcule as frequências relativas e acumuladas.
Resolução:Tabela 27
Rol3,00 3,06 3,18 3,39 3,60
3,00 3,10 3,30 3,42 3,75
3,05 3,15 3,34 3,45 3,94
3,06 3,17 3,35 3,50 3,99
k
h
h
= = =
= − =
=
20 4 47 4
3 99 3 004
0 2475
0 25
,
, ,,
,Tabela 28
notas fi fri Fi
3,00 ├ 3,25 9 0,4500 4
3,25 ├ 3,50 6 0,3000 10
3,50 ├ 3,75 2 0,1000 28
3,75 ├ 4,00 3 0,1500 42
20 1
46
Unidade I
Revi
são:
Jul
iana
- D
iagr
amaç
ão: F
abio
- 1
7-08
-12
Os exercícios 3 e 4 mostram as seguintes situações:
— A construção de uma distribuição com intervalo de outra maneira.
— Uma distribuição com a configuração diferente das vistas até o momento.
Questão 03. Foi feita uma estatística do número de casamentos realizados por semana numa certa cidade, durante as 52 semanas de um dado ano. O número de casamentos em cada semana está na tabela seguinte.
Tabela 29 – Estatística do número de casamentos
6 4 2 8 18 16 10 6 7 5 12 8 9
12 17 11 9 16 19 18 18 16 14 12 7 10
3 8 7 12 5 9 11 15 9 4 1 6 11
7 11 10 15 3 2 13 9 11 17 13 12 8
Construa uma distribuição de frequências com cinco classes de amplitudes iguais, sendo a primeira de 0 ├ 4. Obtida a distribuição, calcule as frequências relativas e acumuladas.
Resolução:
Tabela 30
1 3 5 7 8 9 9 11 11 12 14 16 18
2 4 6 7 8 9 10 11 12 12 15 16 18
2 4 6 7 8 9 10 11 12 13 15 17 18
3 5 6 7 8 9 10 11 12 13 16 17 19
k = 5 (enunciado)h = 4 (enunciado)
47
Revi
são:
Jul
iana
- D
iagr
amaç
ão: F
abio
- 1
7-08
-12
ESTATÍSTICA
Tabela 31
fi fri Fi
0 ├ 4 5 0,096 5
4 ├ 8 11 0,212 16
8 ├ 12 17 0,327 33
12 ├ 16 10 0,192 43
16 ├ 20 9 0,173 52
52 1
Questão 04. A tabela a seguir mostra uma distribuição de frequências da duração de 400 válvulas de rádio, produzidas por uma determinada fábrica.
Tabela 32 – Duração das válvulas (em horas)
Duração (h) Número de válvulas
300 – 399 14
400 – 499 46
500 – 599 58
600 – 699 76
700 – 799 68
800 – 899 62
900 – 999 48
1000 – 1099 22
1100 – 1199 6
Com referência na tabela, determine:
a) A amplitude amostral.
b) O número de classes da distribuição.
c) O limite superior da quinta classe.
d) O limite inferior da oitava classe.
e) O ponto médio da sétima classe.
f) A amplitude de intervalo da segunda classe.
g) A frequência da quarta classe.
h) A frequência relativa da sexta classe.
i) A frequência acumulada até a terceira classe.
j) A porcentagem das válvulas cuja duração não excede 599 horas.
k) A porcentagem das válvulas de duração maior ou igual a 900 horas.
l) A porcentagem de válvulas cuja duração é de 500 horas no mínimo, mas inferior a 1000 horas.
48
Unidade I
Revi
são:
Jul
iana
- D
iagr
amaç
ão: F
abio
- 1
7-08
-12
Resolução:
Tabela 33
Duração (horas) Número de válvulas fri Fi xi
300 – 399 14 0,04 14 349,5
400 – 499 46 0,12 60 449,5
500 – 599 58 0,15 118 549,5
600 – 699 76 0,19 194 649,5
700 – 799 68 0,17 262 749,5
800 – 899 62 0,16 324 849,5
900 – 999 48 0,12 372 949,5
1000 – 1099 22 0,06 394 1050
1100 – 1199 6 0,02 400 1150
400 1
a) AA = 1.199 - 300 = 899
b) K = 9
c) L5 = 799
d) l8 = 1000
e) x7 = (999 + 900) / 2 = 949,5
f) h2 = 499 - 400 = 99
g) f4 = 76
h) fr6 = 0,16
i) F3 = 118
j) % = 0,04 + 0,12 + 0,15 = 0,31 = 31%
k) % = 0,12 + 0,06 + 0,02 = 0,20 = 20%
l) % = 0,15 + 0,19 + 0,17 + 0,16 + 0,12 = 0,79 = 79%
49
Revi
são:
Jul
iana
- D
iagr
amaç
ão: F
abio
- 1
7-08
-12
ESTATÍSTICA
Questão 05. Dada a distribuição:
Tabela 34 – Distribuição dos lotes de acordo com a área (em metros quadrados)
Áreas (m2) Número de lotes
300├ 400 14
400├ 500 46
500├ 600 58
600├ 700 76
700├ 800 68
800├ 900 62
900├ 1000 48
1000├ 1100 22
1100├ 1200 6
Determine:
a) Os pontos médios.
b) As frequências relativas.
c) As frequências acumuladas.
d) O histograma.
e) O polígono de frequência.
50
Unidade I
Revi
são:
Jul
iana
- D
iagr
amaç
ão: F
abio
- 1
7-08
-12
Resolução:
Tabela 35
Áreas (m2) Número de lotes xi fri Fi
300├ 400 14 350 0,035 14
400├ 500 46 450 0,115 60
500├ 600 58 550 0,145 118
600├ 700 76 650 0,190 194
700├ 800 68 750 0,170 262
800├ 900 62 850 0,155 324
900├ 1000 48 950 0,120 372
1000├ 1100 22 1050 0,055 394
1100├ 1200 6 1150 0,015 400
400 1
Gráficos conforme a definição.
Questão 06. A tabela a seguir apresenta as vendas diárias de um determinado aparelho elétrico, durante um mês, por um estabelecimento comercial:
Tabela 36 – Número de aparelhos vendidos no período
10 12 13 13 14 15
11 12 13 14 14 15
11 12 13 14 14 16
11 12 13 14 14 17
a) Forme uma distribuição de frequências sem intervalos de classes.
b) Determine as frequências relativas e acumuladas.
51
Revi
são:
Jul
iana
- D
iagr
amaç
ão: F
abio
- 1
7-08
-12
ESTATÍSTICA
Resolução:
Tabela 37
10 12 13 13 14 15
11 12 13 14 14 15
11 12 13 14 14 16
11 12 13 14 14 17
Tabela 38
xi fi fri Fi
10 1 0,0417 1
11 3 0,1250 4
12 4 0,1667 8
13 5 0,2083 13
14 7 0,2917 20
15 2 0,0833 22
16 1 0,0417 23
17 1 0,0417 24
24 1
Questão 07. Dada a distribuição:
Tabela 39 – Distribuição para a Questão 07
I Classes fi
1 4├ 8 2
2 8├ 12 5
3 12├ 16 9
4 16├ 20 6
5 20├ 24 2
6 24├ 28 1
Determine:
a) Os pontos médios.
b) As frequências relativas.
c) As frequências acumuladas.
d) O histograma.
52
Unidade I
Revi
são:
Jul
iana
- D
iagr
amaç
ão: F
abio
- 1
7-08
-12
a) O polígono de frequência
Resolução:Tabela 40
i Classes fi xi fri Fi
1 4├ 8 2 6 0,080 2
2 8├ 12 5 10 0,200 7
3 12├ 16 9 14 0,360 16
4 16├ 20 6 18 0,240 22
5 20├ 24 2 22 0,080 24
6 24├ 28 1 26 0,040 25
25 1
Gráficos conforme a definição.
Questão 08. Considerando os conjuntos de dados:
A. 3 5 2 6 5 9 5 2 8 6
B. 20 9 7 2 12 7 20 15 7
C. 51,6 48,7 50,3 49,5 48,9
Determine a média, a mediana e a moda.
______________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________
53
Revi
são:
Jul
iana
- D
iagr
amaç
ão: F
abio
- 1
7-08
-12
ESTATÍSTICA
Resolução:
a)
2 2 3 5 5 5 6 6 8 9
n=10
x = (2+2+3+5+5+5+6+6+8+9)/10 = 51/10=5,1
Md =(5+5)/2=5
Mo=5
b)
2 7 7 7 9 12 15 20 20
n = 9
x = (2 + 7 + 7 + 7 + 9 + 12 + 15 + 20 + 20)/9 = 99/9 = 11
Md = 9
Mo = 7
c)
48,7 48,9 49,5 50,3 51,6
n = 5
x = (48,7 + 48,9 + 49,5 + 50,3 + 51,6)/5 = 249/5=49,8
Md = 49,5
Série amodal.
Questão 09. Considerando a distribuição a seguir:
Tabela 41 – Distribuição referente à Questão 09
Xi 3 4 5 6 7 8
Fi 4 8 11 10 8 3
54
Unidade I
Revi
são:
Jul
iana
- D
iagr
amaç
ão: F
abio
- 1
7-08
-12
Calcule a média, a mediana e a moda.______________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________
Resolução:Tabela 42
Xi fi xi.fi Fi
3 4 12 4
4 8 32 12
5 11 55 23
6 10 60 33
7 8 56 41
8 3 24 44
44 239
x
Mo
i
= =
=
= =∑
23944
5 43
5
2442
22
,
ƒ
Classe mediana = terceira classe
Md = 5
Questão 10. Em uma classe de 50 alunos, as notas obtidas formaram a seguinte distribuição:
Tabela 43 – Distribuição dos alunos de acordo com as respectivas notas
Notas 2 3 4 5 6 7 8 9 10
Nº de alunos 1 3 6 10 13 8 5 3 1
Calcule a nota média, a nota mediana e a nota modal.
________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________
55
Revi
são:
Jul
iana
- D
iagr
amaç
ão: F
abio
- 1
7-08
-12
ESTATÍSTICA
Resolução:Tabela 44
Notas Nº de alunos xi.fi Fi
2 1 2 1
3 3 9 4
4 6 24 10
5 10 50 20
6 13 78 33
7 8 56 41
8 5 40 46
9 3 27 49
10 1 10 50
50 296
x
Mo
i
= =
=
= =∑
29650
5 92
6
2502
25
,
ƒ
Classe mediana = quinta classe
Md = 6
Questão 11. Dadas as distribuições de frequência, calcule a média, a mediana e a moda para cada uma delas:
a)
Tabela 45 – Distribuição de notas
Notas fi
0├2 5
2├4 8
4├6 14
6├8 10
8├10 7
∑=44
56
Unidade I
Revi
são:
Jul
iana
- D
iagr
amaç
ão: F
abio
- 1
7-08
-12
b)
Tabela 46 – Distribuição de estaturas (em centímetros)
Estaturas (cm) fi
150├158 5
158├166 12
166├174 18
174├182 27
182├190 8
∑=70
c)
Tabela 47 – Distribuição de salários (em reais)
Salários (R$) fi
500├700 18
700├900 31
900├1100 15
1100├1300 3
1300├1500 1
1500├1700 1
1700├1900 1
∑=70
d)
Tabela 48 – Distribuição de pesos (em quilogramas)
Pesos (kg) fi
145├151 10
151├157 9
157├163 8
163├169 6
169├175 3
175├181 3
181├187 1
∑=40
_____________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________
57
Revi
são:
Jul
iana
- D
iagr
amaç
ão: F
abio
- 1
7-08
-12
ESTATÍSTICA
Resolução:
a)
Tabela 49
Notas fi xi xi.fi Fi
0├2 5 1 5 5
2├4 8 3 24 13
4├6 14 5 70 27
6├8 10 7 70 37
8├10 7 9 63 44
∑=44 232
x = =23244
5 27,
Classe modal = terceira classe
Mo
i
= ++
⋅ = =
= =∑
46
6 42 4
1210
5 2
2442
22
,
ƒ
Classe mediana = terceira classe
Md = + − ⋅ = + =422 13
142 4
1814
5 29[ ]
,
b)
Tabela 50
Estaturas (cm) fi xi xi.fi Fi
150├158 5 154 770 5
158├166 12 162 1944 17
166├174 18 170 3060 35
174├182 27 178 4806 62
182├190 8 186 1488 70
∑=70 12068
x = =1206870
172 4,
58
Unidade I
Revi
são:
Jul
iana
- D
iagr
amaç
ão: F
abio
- 1
7-08
-12
Classe modal = quarta classe
Mo
i
= ++
⋅ = =
= =∑
1746
9 198 174
7822
176 57
2702
35
,
ƒ
Classe mediana = terceira classe
Md = + − ⋅ = =16635 17
188 166
14418
174[ ]
c)Tabela 51
Salários (R$) fi xi xi.fi Fi
500├700 18 600 10800 18
700├900 31 800 24800 49
900├1100 15 1000 15000 64
1100├1300 3 1200 3600 67
1300├1500 1 1400 1400 68
1500├1700 1 1600 1600 69
1700├1900 1 1800 1800 70
∑=70 59000
x = =5900070
842 86,
Classe modal = segunda classe
Mo
i
= ++
⋅ = + =
= =∑
70013
13 16200 700
260029
789 66
2702
35
,
ƒ
Classe mediana = segunda classe
Md = + − ⋅ = + =70013 18
31200 700
340031
809 68[ ]
,
59
Revi
são:
Jul
iana
- D
iagr
amaç
ão: F
abio
- 1
7-08
-12
ESTATÍSTICA
d)Tabela 52
Pesos (kg) fi xi xi.fi Fi
145├151 10 148 1480 10
151├157 9 154 1386 19
157├163 8 160 1280 27
163├169 6 166 996 33
169├175 3 172 516 36
175├181 3 178 534 39
181├187 1 184 184 40
∑=40 6376
x = =637640
159 4,
Classe modal = primeira classe
Mo
i
= ++
⋅ = + =
= =∑
14510
10 16 145
6011
150 45
2402
20
,
ƒ
Classe mediana = terceira classe
Md = + − ⋅ = + =15720 19
86 157
68
157 75[ ]
,
Questão 12. A empresa Tintas Brasil Ltda. está estudando uma forma de nivelar sua produção durante o ano. O Departamento de Marketing fez uma pesquisa de mercado e descobriu que o setor de tintas é altamente sazonal (muitas famílias resolvem pintar suas residências no quarto trimestre, em razão do período de festas). O gráfico a seguir mostra as previsões de vendas para o próximo ano.
100
504030
1º 2º 3º 4º
Milhares de Galões
Trimestre
Figura 8 – Previsões de vendas
60
Unidade I
Revi
são:
Jul
iana
- D
iagr
amaç
ão: F
abio
- 1
7-08
-12
De quantos milhares de galões deve ser o nível de produção trimestral da empresa para nivelar sua produção?
_______________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________
Resolução:
100
504030
1º 2º 3º 4º
Milhares de Galões
TrimestreFigura 9
Para nivelar a produção basta calcular a média das alturas das barras do gráfico.
x = + + + = =30 50 40 1004
2204
55
Questão 13. Uma empresa produtora de cosméticos vende seus produtos diretamente ao consumidor final de porta em porta, possuindo uma elevada quantidade de vendedoras comissionadas. A empresa precisa alavancar suas vendas e chega à conclusão de que deverá, para tanto, implantar um treinamento específico para as vendedoras menos eficientes. Resolveu também que, por motivo de custos, deveria oferecer esse treinamento apenas a 50% das vendedoras de pior desempenho, relacionado diretamente com as comissões obtidas. O supervisor de treinamento está, nesse momento, redigindo a convocação para o treinamento.
Tabela 53 – Relação de vendedoras e respectivas comissões
Faixas monetárias Comissões recebidas nos últimos seis meses Quantidade de vendedoras comissionadas
I R$ 1.500,00 ├ R$ 3.500,00 15
II R$ 3.500,00 ├ R$ 5.500,00 46
III R$ 5.500,00├ R$ 7.500,00 78
IV R$ 7.500,00 ├ R$ 9.500,00 97
V R$ 9.500,00├ R$ 11.500,00 132
VI R$ 11.500,00├ R$ 13.500,00 154
61
Revi
são:
Jul
iana
- D
iagr
amaç
ão: F
abio
- 1
7-08
-12
ESTATÍSTICA
VII R$ 13.500,00├ R$ 15.500,00 165
VIII R$ 15.500,00├ R$ 17.500,00 123
IX R$ 17.500,00├ R$ 19.500,00 95
X R$ 19.500,00├ R$ 21.500,00 59
XI R$ 21.500,00├ R$ 23.500,00 27
Quais vendedoras ele deve convocar, considerando o quadro anterior, que resume as comissões recebidas nos últimos seis meses?
A) As vendedoras cujas comissões recebidas são inferiores a R$ 13.500,00 aproximadamente.
B) As vendedoras cujas comissões recebidas são superiores a R$ 13.150,00 aproximadamente.
C) As vendedoras cujas comissões recebidas são inferiores a R$ 13.000,00 aproximadamente.
D) As vendedoras cujas comissões recebidas são inferiores a R$ 13.150,00 aproximadamente.
E) As vendedoras cujas comissões recebidas são superiores a R$ 13.000,00 aproximadamente.
Resolução:
Tabela 54
Faixas monetárias Comissões recebidas nos últimos seis meses Quantidade de vendedoras comissionadas Fi
1 R$ 1.500,00 ├ R$ 3.500,00 15 15
2 R$ 3.500,00 ├ R$ 5.500,00 46 61
3 R$ 5.500,00├ R$ 7.500,00 78 139
4 R$ 7.500,00 ├ R$ 9.500,00 97 236
5 R$ 9.500,00├ R$ 11.500,00 132 368
6 R$ 11.500,00├ R$ 13.500,00 154 522
7 R$ 13.500,00├ R$ 15.500,00 165 687
8 R$ 15.500,00├ R$ 17.500,00 123 810
9 R$ 17.500,00├ R$ 19.500,00 95 905
10 R$ 19.500,00├ R$ 21.500,00 59 964
11 R$ 21.500,00├ R$ 23.500,00 27 991
991
Para obter o valor de comissão que identifica 50% das vendedoras de pior desempenho é a mediana.
Logo:
ƒi2
9912
495 5∑ = = ,
62
Unidade I
Revi
são:
Jul
iana
- D
iagr
amaç
ão: F
abio
- 1
7-08
-12
Classe mediana = sexta classe
Md = + − ⋅ = + =11500495 5 368
1542000 11500
255000154
13155 84[ , ]
,
A alternativa correta é a D (As vendedoras cujas comissões recebidas são inferiores a R$ 13.150,00 aproximadamente).
Questão 14. Considerando os conjuntos de dados:
A. 3 5 2 6 5 9 5 2 8 6
B. 20 9 7 2 12 7 20 15 7
C. 51,6 48,7 50,3 49,5 48,9
Calcule o desvio-padrão e o coeficiente de variação para cada um dos conjuntos.
_______________________________________________________________________________________________________________________________________________________________________________________________________________________________________________ ______________________________________________________________________________________________________________________________________________________________________________________________________________________________________
Resolução:
a)
Tabela 55
xi x - x (x - x)2
3 -2,1 4,41
5 -0,1 0,01
2 -3,1 9,61
6 0,9 0,81
5 -0,1 0,01
9 3,9 15,21
5 -0,1 0,01
2 -3,1 9,61
8 2,9 8,41
6 0,9 0,81
51 48,9
63
Revi
são:
Jul
iana
- D
iagr
amaç
ão: F
abio
- 1
7-08
-12
ESTATÍSTICA
x
s
CV
= =
= = =
= ⋅ =
5110
5 1
48 910
4 89 2 21
2 215 1
100 43 33
,
,, ,
,,
, %
b)
Tabela 56
xi x - x (x - x)2
20 9 81
9 -2 4
7 -4 16
2 -9 81
12 1 1
7 -4 16
20 9 81
15 4 16
7 -4 16
99 312
x
s
CV
= =
= = =
= ⋅ =
999
11
3129
34 67 5 89
5 8911
100 53 55
, ,
,, %
c)
Tabela 57
xi x - x (x - x)2
51,6 1,8 3,24
48,7 -1,1 1,21
50,3 0,5 0,25
49,5 0,3 0,09
48,9 -0,9 0,81
249 5,6
64
Unidade I
Revi
são:
Jul
iana
- D
iagr
amaç
ão: F
abio
- 1
7-08
-12
x
s
CV
= =
= = =
= ⋅ =
2495
49 8
5 65
112 1 06
1 0649 08
100 2 13
,
,, ,
,,
, %
Questão 15. Dadas as distribuições de frequência com intervalo:
Tabela 58 – Distribuição de salários (em reais) referente à Questão 15
Salários (R$) fI
500├ 700 18
700├ 900 31
900├ 1100 15
1.100├ 1.300 3
1.300├ 1.500 1
1.500├ 1.700 1
1.700├ 1.900 1
∑=70
Tabela 59 – Distribuição de estaturas (em centímetros) referente à Questão 15
Estaturas (cm) fI
150├ 158 5
158├ 166 12
166├ 174 18
174├182 27
182├190 8
∑=70
Calcule o desvio-padrão e o coeficiente de variação para cada uma delas.
______________________________________________________________________________
______________________________________________________________________________
______________________________________________________________________________
______________________________________________________________________________
________________________________________________________________________________
65
Revi
são:
Jul
iana
- D
iagr
amaç
ão: F
abio
- 1
7-08
-12
ESTATÍSTICA
Resolução:
a)Tabela 60
Salários (R$) fI xi xi . fi x - x (x - x)2 (x - x)2 . fi
500├ 700 18 600 10800 -242,857 58979,59 1061633
700├ 900 31 800 24800 -42,8571 1836,735 56938,78
900├ 1100 15 1000 15000 157,1429 24693,88 370408,2
1.100├ 1.300 3 1200 3600 357,1429 127551 382653,1
1.300├ 1.500 1 1400 1400 557,1429 310408,2 310408,2
1.500├ 1.700 1 1600 1600 757,1429 573265,3 573265,3
1.700├ 1.900 1 1800 1800 957,1429 916122,4 916122,4
∑=70 59000 3671429
x
s
CV
= =
= = =
=
5900070
842 86
367142970
52448 99 229 02
229 02842 86
,
, ,
,,
⋅⋅ =100 27 17, %
b)
Tabela 61
Estaturas fI xi xi . fi x - x (x - x)2 (x - x)2 . fi
150 ├ 158 5 154 770 -18,4 338,56 1692,8
158 ├ 166 12 162 1994 -10,4 108,16 1297,92
166 ├ 174 18 170 3060 -2,4 5,76 103,68
174 ├ 182 27 178 4806 5,6 31,36 846,72
182 ├ 190 8 186 1488 13,6 184,96 1479,68
∑=70 12068 5420,8
x
s
CV
= =
= = =
= ⋅ =
1206870
172 40
5420 870
77 44 8 80
8 80172 40
100 5 1
,
,, ,
,,
, 00%
66
Unidade I
Revi
são:
Jul
iana
- D
iagr
amaç
ão: F
abio
- 1
7-08
-12
Questão 16. Calcule o desvio-padrão e o coeficiente de variação das distribuições a seguir:
Tabela 62 – Distribuição A
xI 2 3 4 5 6 7 8
fI 1 3 5 8 5 4 2
Tabela 63 – Distribuição B
R$ 450├550 550├650 650├750 750├850 850├950 950├1050 1050├1150
fI 8 10 11 16 13 5 1
Tabela 64 – Distribuição C
Classes 30├50 50├70 70├90 90├110 110├130
fI 2 8 12 10 5
______________________________________________________________________________
______________________________________________________________________________
______________________________________________________________________________
______________________________________________________________________________
Resolução:
a)
Tabela 65
xi fI xi . fi x - x (x - x)2 (x - x)2 . fi
2 1 2 -3,18 10,10 10,10
3 3 9 -2,18 4,75 14,24
4 5 20 -1,18 1,39 6,95
5 8 40 -0,18 0,03 0,26
6 5 30 0,82 0,67 3,37
7 4 28 1,82 3,32 13,27
8 2 16 2,82 7,96 15,92
28 145 64,11
x
s
CV
= =
= = =
= ⋅ =
14528
5 18
64 1128
2 29 151
1515 18
100 29 15
,
,, ,
,,
, %
67
Revi
são:
Jul
iana
- D
iagr
amaç
ão: F
abio
- 1
7-08
-12
ESTATÍSTICA
b)Tabela 66
R$ fI xi xi . fi x - x (x - x)2 (x - x)2 . fi
480 ├ 550 8 500 4000 -254,69 64865,72 518925,78
550 ├ 650 10 600 6000 -154,69 23928,22 239282,23
650 ├ 750 11 700 7700 -54,69 2990,72 32897,95
750 ├ 850 16 800 12800 45,31 2053,22 32851,56
850 ├ 950 13 900 11700 145,31 21115,72 274504,39
950 ├ 1050 5 1000 5000 245,31 60178,22 300891,11
1050 ├ 1150 1 1100 1100 345,31 119240,72 119240,72
64 48300 1518593,75
x
s
CV
= =
= = =
=
4830064
754 69
1518593 7564
23728 03 154 04
154 04754
,
,, ,
,,,
, %69
100 20 41⋅ =
c)Tabela 67
Classes fI xi xi . fi x - x (x - x)2 (x - x)2 . fi
30 ├ 50 2 40 80 -44,32 1964,65 3929,29
50 ├ 70 8 60 480 -24,32 591,67 4733,38
70 ├ 90 12 80 960 -4,32 18,70 224,40
90 ├ 110 10 100 1000 15,68 245,73 2457,27
110 ├ 130 5 120 600 35,68 1272,75 6363,77
37 3120 17708,11
x
s
CV
= =
= = =
= ⋅ =
312037
84 32
17708 1137
478 60 2188
218884 32
100 2
,
,, ,
,,
55 95, %
68
Unidade I
Revi
são:
Jul
iana
- D
iagr
amaç
ão: F
abio
- 1
7-08
-12
Questão 17. Dados os resultados das medidas das estaturas e dos pesos de um mesmo grupo de indivíduos:
Tabela 68 – Estaturas e pesos dos indivíduos
Média s
Estaturas 175 cm 5,0 cm
Pesos 68 kg 2,0 kg
Calcule os coeficientes de variação dos pesos e das estaturas.
______________________________________________________________________________
______________________________________________________________________________
______________________________________________________________________________
______________________________________________________________________________
Resolução:
Estaturas:
CV = ⋅ =5175
100 2 86, %
Pesos:
CV = ⋅ =268
100 2 94, %
Questão 18. Medidas as estaturas de 1.017 indivíduos, obtivemos a média de 162,2 cm e o desvio-padrão de 8,01 cm. O peso médio desses mesmos indivíduos é de 52 kg, com s = 2,3 kg. Esses indivíduos apresentam maior variabilidade em estatura ou em peso?
______________________________________________________________________________
______________________________________________________________________________
______________________________________________________________________________
______________________________________________________________________________
Resolução:
Estaturas:
CV = ⋅ =8 01162 2
100 4 94,
,, %
69
Revi
são:
Jul
iana
- D
iagr
amaç
ão: F
abio
- 1
7-08
-12
ESTATÍSTICA
Pesos:
CV = ⋅ =2 352
100 4 42,
, %
A maior variabilidade está na estatura.
Questão 19. Um grupo de 100 estudantes tem uma estatura média de 163,8 cm, com um coeficiente de variação de 3,3%. Qual o desvio-padrão desse grupo?
______________________________________________________________________________
______________________________________________________________________________
______________________________________________________________________________
______________________________________________________________________________
Resolução:
Utilizando a fórmula do CV:
3 3163 8
100
540 24 100
5 40
,,
,
,
= ⋅
= ⋅=
s
s
s
Questão 20. Uma distribuição apresenta as seguintes estatísticas: s = 1,5 e CV = 2,9%. Determine a média da distribuição.
______________________________________________________________________________
______________________________________________________________________________
______________________________________________________________________________
______________________________________________________________________________
Resolução:
Utilizando a fórmula do CV:
2 915
100
2 9150
1505172
,,
,
,
= ⋅
=
= =
x
x
xx
70
Unidade I
Revi
são:
Jul
iana
- D
iagr
amaç
ão: F
abio
- 1
7-08
-12
Questão 21. A distribuição das idades dos alunos de uma classe é dada pelo gráfico a seguir.
25
20
10
5
15 17 19 21
Nº de alunos
Idade (em anos)
Figura 10 – Histograma: idades de alunos da Escola A
Qual das alternativas representa o desvio-padrão das idades dos alunos?
A) 1,72 anos.
B) 3,15 anos.
C) 3,02 anos.
D) 6,74 anos.
E) 1,01 anos.
Resolução:
No eixo x do histograma, os pontos apresentados são os pontos médios das classes.
Tabela 69
fI xi xi . fi x - x (x - x)2 (x - x)2 . fi
10 15 150 -2,83 8,03 80,28
20 17 340 -0,83 0,69 13,89
25 19 475 1,17 1,36 34,03
5 21 105 3,17 10,03 50,14
60 1070 178,33
x
s
= =
= = =
107060
17 83
178 3360
2 97 172
,
,, ,
A resposta correta é a alternativa A.
71
Revi
são:
Jul
iana
- D
iagr
amaç
ão: F
abio
- 1
7-08
-12
ESTATÍSTICA
Questão 22. As decisões financeiras devem ser tomadas considerando-se os retornos e os riscos esperados, bem como o respectivo impacto destes sobre o preço do ativo avaliado. O risco de um ativo individual, uma ação, por exemplo, pode ser devidamente avaliado por meio da maior variabilidade dos retornos esperados. Portanto, a comparação das distribuições probabilísticas dos retornos, relativas a cada ativo individual, possibilita a quem toma decisões perceber os diferentes graus de risco. Analise, a seguir, os dados estatísticos relativos aos retornos de cinco ativos:
Tabela 70 – Retornos dos ativos
Dados estatísticos referentes aos retornos Ativo A Ativo B Ativo C Ativo D Ativo E
Valor esperado 15,0% 12,0% 5,0% 10,0% 4,0%
Desvio-padrão 6,0% 6,6% 2,5% 3,0% 2,6%
O ativo menos arriscado é o:
A) Ativo A.
B) Ativo B.
C) Ativo C.
D) Ativo D.
E) Ativo E.
Resolução: Tabela 71
Dados estatísticos referentes aos retornos Ativo A Ativo B Ativo C Ativo D Ativo E
Valor esperado 15,0% 12,0% 5,0% 10,0% 4,0%
Desvio-padrão 6,0% 6,6% 2,5% 3,0% 2,6%
O valor esperado é o valor médio para cada ativo. Como o risco está associado à variabilidade, serão calculados os coeficientes de variação de todos os ativos. O ativo de menor coeficiente de variação será o menos arriscado.
CVA
CVB
CVC
= = ⋅ =
= ⋅ =
= ⋅ =
615
100 40 00
6 612
100 55 00
2 55
100 50 00
, %
,, %
,, %
CCVD
CVD
= ⋅ =
= ⋅ =
310
100 30 00
2 64
100 65 00
, %
,, %
O ativo menos arriscado é aquele com CV = 30% (alternativa D).