apostila de estatística básica

5
Apostila de Estatística Básica – 3º ano – 2015 – Prof. Alexandre Branco A Estatística é uma parte da Matemática Aplicada que fornece métodos para a coleta, organização, descrição, análise e interpretação de dados e para a utilização dos mesmos na tomada de decisões. Existem dois tipos de estatística: a Descritiva (ou Dedutiva) e a Indutiva (ou Inferência Estatística). A Estatística Descritiva ou Dedutiva tem por objetivo descrever e analisar fatos relacionados a determinado grupo ou população, sem pretender tirar conclusões de caráter mais genérico. A Estatística Indutiva ou Inferência Estatística , baseando-se nos resultados obtidos da análise da amostra de uma população, procura inferir ou estimar as leis de comportamento de toda a população. A nível do Ensino Médio, estuda-se apenas a Estatística Dedutiva. A Estatística Dedutiva tem as seguintes fases: coleta de dados, organização dos dados, análise dos dados, apresentação dos dados e análise dos resultados. 1. CONCEITOS BÁSICOS População: é o conjunto de elementos (pessoas, objetos) que têm em comum uma característica em estudo. Amostra: é o conjunto de elementos retirados da população, suficientemente representativos dessa população. Através da análise dessa amostra estaremos aptos para analisar os resultados da mesma forma que se estudássemos toda a população. Variável: é qualquer característica de um elemento observado (pessoa, objeto). Algumas variáveis, como sexo e estado civil, simplesmente enquadram os indivíduos em categorias. Outras, como altura e salário, tomam valores numéricos com os quais podemos fazer cálculos. Esses exemplos mostram que uma variável pode ser: Variável Qualitativa: quando seus valores são expressos por atributos: sexo (masculino, feminino), cor da pele, estado civil (solteiro, casado, viúvo) Variável Quantitativa: quando seus valores são expressos em números (salários, idade, número de filhos, etc.). Existem dois tipos de variável quantitativa: Variável Contínua: é aquela que tem origem numa medida. O seu valor pode ser um número inteiro ou não. Exemplos: altura, temperatura, etc. Variável Discreta: é aquela que tem origem numa contagem. O seu valor é um número inteiro. Exemplos: número de filhos, número de parafusos numa caixa. Frequência: é o número de vezes que o valor de uma variável aparece na coleta de dados. Podem ser de dois tipos: Frequência absoluta (fa): é a quantidade de vezes que cada valor é observado (repetido). Frequência relativa (fr): é a razão entre a frequência absoluta e o total pesquisado. Geralmente é expressa em porcentagem: fr = , onde n é o total de elementos pesquisados. Quando somamos uma frequência absoluta com as frequências absolutas anteriores, temos a Frequência absoluta acumulada (Fa). Quando somamos uma frequência relativa com as frequências relativas anteriores, temos a Frequência relativa acumulada (Fr). Os dados coletados numa amostra podem ser colocados num gráfico ou numa tabela: Dados Frequência 41 3 42 2 43 1 44 1 45 1 46 2 Total 10

Upload: alexandre-branco

Post on 05-Jan-2016

61 views

Category:

Documents


23 download

DESCRIPTION

Apresentação dos conceitos básicos de estatística.

TRANSCRIPT

Page 1: Apostila de Estatística Básica

Apostila de Estatística Básica – 3º ano – 2015 – Prof. Alexandre Branco

A Estatística é uma parte da Matemática Aplicada que fornece métodos para a coleta, organização, descrição, análise e interpretação de dados e para a utilização dos mesmos na tomada de decisões. Existem dois tipos de estatística: a Descritiva (ou Dedutiva) e a Indutiva (ou Inferência Estatística).

A Estatística Descritiva ou Dedutiva tem por objetivo descrever e analisar fatos relacionados a determinado grupo ou

população, sem pretender tirar conclusões de caráter mais genérico. A Estatística Indutiva ou Inferência Estatística , baseando-se nos resultados obtidos da análise da amostra de uma

população, procura inferir ou estimar as leis de comportamento de toda a população. A nível do Ensino Médio, estuda-se apenas a Estatística Dedutiva.

A Estatística Dedutiva tem as seguintes fases: coleta de dados, organização dos dados, análise dos dados, apresentação

dos dados e análise dos resultados.

1. CONCEITOS BÁSICOS

População: é o conjunto de elementos (pessoas, objetos) que têm em comum uma característica em estudo.

Amostra: é o conjunto de elementos retirados da população, suficientemente representativos dessa população. Através da análise dessa amostra estaremos aptos para analisar os resultados da mesma forma que se estudássemos toda a população.

Variável: é qualquer característica de um elemento observado (pessoa, objeto). Algumas variáveis, como sexo e estado

civil, simplesmente enquadram os indivíduos em categorias. Outras, como altura e salário, tomam valores numéricos com os quais podemos fazer cálculos. Esses exemplos mostram que uma variável pode ser:

Variável Qualitativa: quando seus valores são expressos por atributos: sexo (masculino, feminino), cor da pele, estado civil (solteiro, casado, viúvo)

Variável Quantitativa: quando seus valores são expressos em números (salários, idade, número de filhos,

etc.). Existem dois tipos de variável quantitativa:

Variável Contínua: é aquela que tem origem numa medida. O seu valor pode ser um número inteiro ou não. Exemplos: altura, temperatura, etc.

Variável Discreta: é aquela que tem origem numa contagem. O seu valor é um número

inteiro. Exemplos: número de filhos, número de parafusos numa caixa.

Frequência: é o número de vezes que o valor de uma variável aparece na coleta de dados. Podem ser de dois tipos:

Frequência absoluta (fa): é a quantidade de vezes que cada valor é observado (repetido).

Frequência relativa (fr): é a razão entre a frequência absoluta e o total pesquisado. Geralmente é

expressa em porcentagem: fr = 𝑓𝑎

𝑛 , onde n é o total de elementos pesquisados.

Quando somamos uma frequência absoluta com as frequências absolutas anteriores, temos a Frequência absoluta

acumulada (Fa). Quando somamos uma frequência relativa com as frequências relativas anteriores, temos a Frequência relativa

acumulada (Fr). Os dados coletados numa amostra podem ser colocados num gráfico ou numa tabela:

Dados Frequência

41 3

42 2

43 1

44 1

45 1

46 2

Total 10

Page 2: Apostila de Estatística Básica

2. DISTRIBUIÇÃO DE FREQUÊNCIA É um tipo de tabela que condensa uma coleção de dados conforme as frequências (repetições de seus valores).

Existem dois tipos de tabelas:

Tabela Primitiva ou Dados Brutos: É uma tabela ou relação de elementos que não foram numericamente organizados, tornando difícil a formação de uma idéia exata do comportamento do grupo como um todo, a partir de dados não ordenados. Exemplo: 45, 41, 42, 41, 42 43, 44, 41 ,50, 46, 50, 46, 60, 54, 52, 58, 57, 58, 60, 51

Rol: É a tabela obtida após a ordenação dos dados (crescente ou decrescente). Exemplo: 41, 41, 41, 42, 42, 43, 44, 45, 46, 46, 50, 50, 51, 52, 54, 57, 58, 58, 60, 60 As distribuições de frequências podem ser de dois tipos:

Distribuição de frequência sem intervalos de classe: É a simples condensação dos dados conforme as repetições de seu valores. Para um rol de tamanho razoável, como o exemplo acima, esta distribuição de freqüência é inconveniente, já que exige muito espaço. Veja exemplo abaixo:

Dados Frequência

41 3

42 2

43 1

44 1

45 1

46 2

50 2

51 1

52 1

54 1

57 1

58 2

60 2

Total 20

Distribuição de frequência com intervalos de classe: Quando o tamanho da amostra é elevado, é mais indicado efetuar

o agrupamento dos valores em vários intervalos de classe. No exemplo abaixo, a distribuição foi feita em 5 intervalos de classe.

Classes Frequências 41 ⊢ 45 7 45 ⊢ 49 3 49 ⊢ 53 4 53 ⊢ 57 1 57 ⊢ 61 5

Total 20

3. ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQUÊNCIA COM INTERVALOS DE CLASSE

Classe: é cada um dos intervalos em que os dados são agrupados. As classes são indicadas pela letra i. Na tabela acima, por exemplo, x1 = 41 ⊢ 45 é uma classe. (i = 1 significa que é a 1ª classe da distribuição)

Uma classe é representada pelo símbolo ⊢. Este símbolo indica um intervalo fechado à esquerda e aberto à direita. Na classe 45 ⊢ 49, o valor 45 pertence à classe e o valor 49 não pertence.

Limites de classes: são os valores extremos de cada classe. Os limites de uma classe são:

li ( limite inferior de uma classe): é o extremo esquerdo da classe.

Li ( limite superior de uma classe): é o extremo direito da classe.

Exemplo: Na 3ª classe da tabela acima, 49 ⊢ 53, o valor 49 é o limite inferior (extremo esquerdo) e 53 é o limite

superior (extremo direito). O limite inferior pertence à classe enquanto o limite superior não pertence.

Amplitude do intervalo de classe (h): é a diferença entre o limite superior e o limite inferior. É igual para todos os intervalos de classe. Na tabela acima, a amplitude h de todas as classes é igual a 4.

Page 3: Apostila de Estatística Básica

Amplitude Total da Distribuição (ATD): É a diferença entre o limite superior da última classe e o limite inferior da primeira classe. Exemplo: Na tabela anterior ATD = 61 - 41= 20.

Amplitude Total da Amostra(AA): É a diferença entre o valor máximo e o valor mínimo da amostra (ROL). AA = 60 - 41 = 19. Obs: ATD sempre será maior ou igual que AA.

Amplitude das classes (h) – é a relação entre a amplitude total e o número de classes, conforme mostra a expressão a seguir:

ℎ =𝑚𝑎𝑖𝑜𝑟 𝑣𝑎𝑙𝑜𝑟 𝑑𝑜 𝑟𝑜𝑙 − 𝑚𝑒𝑛𝑜𝑟 𝑣𝑎𝑙𝑜𝑟 𝑑𝑜 𝑟𝑜𝑙

𝑘, onde n é o número de intervalos de classe.

Exemplo: Na tabela anterior, h = 60−41

5=

19

5= 3,8 → 4 (arredondando)

d) Ponto médio de classe (xi) - é calculado pela seguinte expressão:

2

iii

lLx

Exemplo: Na 3ª classe da tabela anterior, 49⊢53, o ponto médio é x3 = 53+49

2 = 51.

4. MÉTODO PRÁTICO PARA CONSTRUÇÃO DE UMA DISTRIBUIÇÃO DE FREQUÊNCIAS COM CLASSES 1º) Organize os dados brutos em um ROL (ordem crescente ou decrescente) 2º) Calcule a amplitude total da amostra (AA).

3º) Calcule o número de classes através da fórmula K = √𝑛, onde n é o número de elementos do rol.

4º) Calcule a amplitude h do intervalo de classe: h ≥ 𝑨𝑨

𝑲. Se o valor encontrado não for um número inteiro,

arredondar para o próximo número inteiro, para haver folga na última classe. 5º) A 1ª classe será formada pelo menor valor do rol mais a amplitude h. O primeiro elemento das classes seguintes

será sempre o último elemento da classe anterior. Exemplo: Abaixo estão relacionados os salários semanais (em Reais) de 60 operários de uma fábrica de sapatos.

Construa uma tabela de distribuição de frequências.

110 120 125 136 145 150 165 172 180 185

110 120 125 140 145 155 165 172 180 190

115 120 130 140 145 158 168 175 180 190

115 120 130 140 147 158 168 175 180 195

117 120 130 140 150 160 170 175 180 195

117 123 135 142 150 163 170 178 185 195

Resolução 1) Observando o conjunto, verifica-se que os valores já estão ordenados. Então, já temos o rol. 2) Vamos calcular agora a amplitude total da amostra. Para isso, pegamos o maior valor, que é 195, e subtraímos o

menor valor, que é 110: 195 – 110 = 85.

3) O rol possui 60 valores. O número de classes será K = √60 ≅ 8 (arredondando para cima). O que isto significa? Significa que a tabela de distribuição de frequências terá 8 intervalos de classe.

4) A amplitude do intervalo de classe será h = 85

8 = 11 (arredondando para cima). Isto quer dizer que cada intervalo

de classe terá tamanho igual a 11. 5) A 1ª classe vai ser formada pelo menor valor do rol, que é 110, somado com a amplitude h = 11. 110 + 11 = 121. Então, a 1ª classe será 110 ˫ 121. (Lembrando que 121 não pertence a esta classe. Ele pertencerá à

classe seguinte).

Page 4: Apostila de Estatística Básica

2ª classe: 121 + 11 = 132 (121 ˫ 132), 3ª classe: 132 + 11 = 143 (132 ˫ 143), 4ª classe: 143 + 11 = 154 (143 ˫ 154), 5ª classe: 154 + 11 = 165 (154 ˫ 165), 6ª classe: 165 + 11 = 176 (165 ˫ 176), 7ª classe: 176 + 11 = 187 (176 ˫ 187) e 8ª classe: 187 + 11 = 198 (187 ˫ 198).

Interpretação das classes

110 ˫ 121 → no rol iremos pegar os salários iguais ou maiores que 110 e menores que 121: 110, 110, 115, 115, 117,

117, 120, 120, 120, 120 e 120, totalizando 11 elementos. Logo, a fa dessa classe é igual a 11. 121 ˫ 132 → no rol iremos pegar os salários iguais ou maiores que 121 e menores que 132: 123, 125, 125, 130, 130 e

130, totalizando 6 elementos. Logo, a fa dessa classe é igual a 6. 132 ˫ 143 → no rol iremos pegar os salários iguais ou maiores que 132 e menores que 143: 135, 136, 140, 140, 140,

140 e 142, totalizando 7 elementos. Logo, a fa dessa classe é igual a 7. 143 ˫ 154 → no rol iremos pegar os salários iguais ou maiores que 143 e menores que 154: 145, 145, 145, 147, 150,

150 e 150, totalizando 7 elementos. Logo, a fa dessa classe é igual a 7. 154 ˫ 165 → no rol iremos pegar os salários iguais ou maiores que 154 e menores que 165: 155, 158, 158, 160 e 163,

totalizando 5 elementos. Logo, a fa dessa classe é igual a 5. 165 ˫ 176 → no rol iremos pegar os salários iguais ou maiores que 165 e menores que 176: 165, 165, 168, 168, 170,

170, 172, 172, 175, 175 e 175, totalizando 11 elementos. Logo, a fa dessa classe é igual a 11. 176 ˫ 187 → no rol iremos pegar os salários iguais ou maiores que 176 e menores que 187: 178, 180, 180, 180, 180,

180, 185 e 185, totalizando 8 elementos. Logo, a fa dessa classe é igual a 8. 187 ˫ 198 → no rol iremos pegar os salários iguais ou maiores que 187 e menores que 198: 190, 190, 195, 195 e 190,

totalizando 5 elementos. Logo, a fa dessa classe é igual a 5.

Classe fa fr fr (%) Fa Fr Fr (%)

110 ˫ 121 11 0,18 18% 11 0,18 18%

121 ˫ 132 6 0,10 10% 17 0,28 28%

132 ˫ 143 7 0,12 12% 24 0,4 40%

143 ˫ 154 7 0,12 12% 31 0,52 52%

154 ˫ 165 5 0,08 8% 36 0,6 60%

165 ˫ 176 11 0,18 18% 47 0,78 78%

176 ˫ 187 8 0,13 13% 55 0,91 91%

187 ˫ 198 5 0,08 8% 60 1 100%

Total 60 1,00 100% Observações: 1) O total da fa é sempre igual ao total de elementos do rol. 2) Os totais fr , fr (%), Fr e Fr (%) serão sempre arredondados para 1 (100%) porque, na maioria das vezes, esses totais,

devido aos arredondamentos feitos, serão um pouco menores ou maiores que 100%.

Exercícios 1) Para facilitar um projeto de ampliação da rede de esgoto de uma certa região de uma cidade, as autoridades tomaram

uma amostra de tamanho 50 dos 270 quarteirões que compõem a região e foram encontrados os seguintes números de casas por quarteirão:

2 14 18 22 26 32 45 59 66 80

2 15 18 23 27 36 46 61 66 89

3 15 20 24 29 42 48 61 68 90

10 16 21 25 29 44 52 61 75 92

13 16 22 25 30 45 58 65 78 97

Construa uma tabela de distribuição de frequências utilizando 6 intervalos de classes.

2) Em um hospital foram coletados os salários (em salários mínimos) de 30 funcionários. Os resultados estão

dispostos na tabela abaixo. 4,00 6,86 8,74 10,53 13,23 16,22 4,56 7,39 8,95 10,76 13,60 16,61

5,25 7,59 9,13 11,06 13,85 17,26

5,73 7,44 9,35 11,59 14,69 18,75

6,26 8,12 9,77 12,00 14,71 19,40

a) Construa a distribuição de frequências utilizando 4 intervalos de classes. b) Qual é a porcentagem dos funcionários que ganham mais de 9 salários mínimos?

Page 5: Apostila de Estatística Básica

3) Um hospital tem o interesse em determinar a altura média dos pacientes de uma determinada área e relacioná-la com a incidência de determinada anomalia ortopédica. Foram selecionados 80 pacientes e as alturas (em cm) podem ser encontradas na tabela abaixo.

172 178 187 186 179 179 183 174 164 162

175 165 175 158 163 177 164 168 166 182

168 180 174 176 174 172 175 189 173 176

172 171 163 181 165 158 163 170 173 157

175 164 173 170 175 156 170 168 168 179

175 171 162 183 172 176 167 182 167 160

167 161 161 167 175 180 170 177 173 177

164 166 174 166 166 179 168 179 169 180

a) Construa uma tabela de distribuição de frequências usando 5 intervalos de classes. b) Qual é a porcentagem de pacientes com altura maior ou igual a 170 cm? 4) A tabela abaixo mostra a distribuição de peso de 30 jogadoras de um time de basquete.

60

49

77

72

71

66

62

48

53

55

56

76

50

61

54

58

58

72

75

56

54

62

65

68

58

74

58

60

52

48

a) Construa a tabela de distribuição de frequências usando 4 intervalos de classes. b) A percentagem de jogadoras com peso maior ou igual a 64 kg.

5) Jovens de até 15 anos foram selecionados para participar de um time de vôlei. As alturas dos jogadores (em

metros) são: 1,82 – 1,77 – 1,79 – 1,74 – 1,73 – 1,81 – 1,82 – 1,69 – 1,71 – 1,78 – 1,78 – 1,88 – 1,72 – 1,65 – 1,75 – 1,78 – 1,73 – 1,82 – 1,84 – 1,74 – 1,76 – 1,79 – 1,83 – 1,76 – 1,70. Construa uma tabela de distribuição de frequências utilizando intervalos de classes com amplitude 5cm. 6) A tabela abaixo mostra as notas obtidas pelos 50 alunos de uma turma:

NOTAS 2 3 4 5 6 7 8 9 10

Nº DE

ALUNOS 1 3 6 10 13 8 5 3 1

a) Construa uma tabela de distribuição de frequências com 4 intervalos de classes começando pela nota 1. b) Qual foi a nota mais obtida? E a menos obtida? c) Qual é a porcentagem dos alunos que tiraram nota maior ou igual a 6? d) Qual é a porcentagem dos alunos que tiraram nota menor ou igual a 5?