introdução a estatística-apostila

19
Introdução a Estatística Básico 1 RENATO FERNANDES 15/11/2010

Upload: natufb

Post on 25-Jun-2015

998 views

Category:

Documents


2 download

TRANSCRIPT

Page 1: Introdução a Estatística-APOSTILA

Introdução a Estatística

Básico 1

RENATO FERNANDES15/11/2010

Page 2: Introdução a Estatística-APOSTILA

SUMÁRIO

Introdução a Estatística 2

Capítulo 1 – Conceitos Fundamentais 2

Capítulo 2 – Freqüências 2

Capítulo 3 - Distribuição de freqüência 5

Capítulo 4 – Representação Gráfica 6

Capítulo 5 – Medidas de tendência central 10

1

Page 3: Introdução a Estatística-APOSTILA

Introdução a Estatística A Estatística trata do conjunto de métodos utilizados para a obtenção de dados, sua organização em tabelas e gráficos e a análise desses dados.

Capítulo 1 – Conceitos FundamentaisPopulação são grupos, geralmente numerosos de mesmas característicasque podem ser estudados estatisticamente.Exemplos: 48 alunos que estudam na 5ª série de uma escola;Clubes campeões paulistas de futebol, etc.

Amostras são partes de grupos de mesmas características, que geralmentesão muito numerosos e que para ser verificado em sua totalidade seriamuito dispendioso.Exemplos: 10 alunos de uma escola com 995 alunos;2000 brasileiros ouvidos para uma pesquisa de opinião política, etc.

Capítulo 2 – FreqüênciasFreqüência absoluta e freqüência absoluta acumulada

Freqüência absoluta (Fi) do valor de Xi é o número de vezes que cadavariável estatística assume o valor de Xi.

Freqüências absolutas acumuladas (F. i. a.) é obtida adicionando a cada freqüência absoluta, os valores das freqüências anteriores.

Exemplo1 - Considerem primeiramente as idades de 15 pessoas de um grupo de alunos num curso de artesanato: 15 18 19 17 17 19 16 19 17 20 16 18 19 15 20Nesse caso temos:População estatística: 15 alunos de um curso de artesanato;Amostras: alguns alunos (3 ou 4) desse grupo de 15 alunos;Variável estatística: as idades desses 15 alunos.

A partir desses conhecimentos, vamos elaborar uma tabela:

2

Page 4: Introdução a Estatística-APOSTILA

Na primeira coluna aparecem os diferentes valores da variável estatística, que representamos por Xi. Na última coluna aparece o número de vezes que cada valor se repete; essa coluna é chamada freqüência absoluta, que representamos por Fi.A distribuição de freqüências absolutas pode ser completada com mais uma coluna, chamada freqüências absolutas acumuladas (F. i. a.), cujos valores são obtidos adicionando a cada freqüências absoluta, os valores das freqüências anteriores. Veja o complemento da tabela anterior:

Pelo quadro e usando a freqüências acumulada, podemos fazer algumas observações como:

a) 9 pessoas possuem menos que 19 anos de idade, ou seja, entre 15 e 18 anos;b) 15 – 9 = 6 pessoas possuem idade acima de 18 anos, ou seja, entre 19 e 20 anos.

Portanto, a freqüência absoluta acumulada permite uma análise mais abrangente na tabela de freqüências, possibilitando visualização globalizada de alguns parâmetros estatísticos.

3

Page 5: Introdução a Estatística-APOSTILA

Exercícios Propostos

1- Em uma escola, o conceito de cada bimestre é representado por letras: A, B, C, D e E. Em um determinado bimestre, os conceitos dos alunos da 6ª série A, em Geografia foram os seguintes:

Nessas condições, elabore um quadro de distribuição de freqüências absolutas e freqüências absolutas acumuladas, sabendo que a nota mais alta é A e a mais baixa é E.Analise também os resultados obtidos em alguns aspectos.

2- Um dado foi lançado 15 vezes, tendo-se obtido os seguintes pontos: 2, 5, 6, 6, 1, 4, 2, 6, 5, 1, 3, 3, 2, 4 e 6. Construa uma tabela de distribuição de freqüências absolutas e freqüências absolutas acumuladas.

3- Os salários mensais, em reais, dos 20 funcionários de uma empresa são:720, 720, 800, 880, 840, 720, 760, 800, 920, 720, 760, 800, 840, 720, 680, 760, 800, 720, 880 e 760. Elabore um, quadro de distribuição de freqüências absolutas e freqüências absolutas acumuladas, analisando em seguida os resultados obtidos, fazendo um comparativo desses salários com a situação atual de nosso país. Sugestão: tome com extremos o menor e o maior salário.

4- Agora vamos fazer uma pesquisa em nossa classe para verificar as idades de todos os alunos, em seguida vamos elaborar uma tabela de distribuição de freqüências absolutas e freqüências absolutas acumuladas e analisar os resultados obtidos.

Freqüência relativa e freqüência relativa acumulada

Chama-se freqüência relativa (fi) do valor Xi da variável, o quociente entre a freqüência absoluta e o número de elementos da população estatística, ou seja:Devemos observar que a freqüência relativa é dada na forma de porcentagem (%), ou seja, vai ser necessário multiplicar o resultado do quociente acima por 100; ela vai nos tornar mais clara a análise de certos dados.Se tomarmos como exemplo o quadro de freqüências das idades das 15 pessoas num curso de artesanato, temos:

f 15 = 2

15 *100 = 13,33% f 17 = 3

15 *100 = 20%

Podemos então, completar o quadro de distribuição de freqüências com mais duas colunas: a coluna das freqüências relativas (f i) e a coluna das freqüências relativas acumuladas (f i a).

4

Page 6: Introdução a Estatística-APOSTILA

Observando essa tabela, podemos dizer que:· 20% dos alunos possuem 17 anos de idade;· 59,99% possuem idade inferior a 19 anos;· 99,99% – 59,99% = 40% possuem idades superior a 18 anos.

Observação: Quando tratarmos com valores dizimais (f.i. e f.i.a.), podemos fazer o

arredondamento utilizando 2 casas decimais, totalizando aproximadamente 100% com margem de erro de 2 décimos, superando-se esse erro o aluno deve rever seus cálculos e melhorar sua aproximação.

Considerando a margem de arredondamento devemos arredondar a freqüência de modo que seu total seja 100%

Exercícios Propostos1- Um dado foi jogado 20 vezes, sendo obtido os seguintes pontos: 1, 5, 6, 5, 2, 2, 2, 4, 6, 5, 2, 3, 3, 1, 6, 6, 5, 5, 4, 2. Elabore um quadro com distribuição de freqüências absolutas, freqüências absolutas acumuladas, freqüências relativas e freqüências relativas acumuladas.

2- Observando a tabela do exercício cima, responda:a) Quantas vezes o número 2 foi obtido no dado?b) Quantas vezes o número obtido no dado foi menor que 5?c) Qual o índice em % em que o número 6 foi obtido no dado?d) Qual o índice em % em que números maiores que 4 foram obtidos no dado?

Capítulo 3 - Distribuição de freqüência

Algumas coletas com muitos dados não favorecem a elaboração de tabelas detalhadas.Nesses casos, é mais interessante agrupar os valores em determinados intervalos que apresentam a mesma amplitude.Exemplo: Em uma olimpíada estudantil, com alunos do ensino fundamental, foi medida a altura de cada um dos participantes, encontrando-se os seguintes valores, em centímetros.

5

Page 7: Introdução a Estatística-APOSTILA

Para fazermos a distribuição de freqüência, procedemos da seguinte forma:

1º passo: Organizamos todas as medidas em ordem crescente ou decrescente.Essa relação, assim organizada, chama-se rol.

2º passo: Notamos que a menor estatura é 150cm e a maior é 179cm.Assim, a variação é de 179cm – 150cm = 29cm. Esse valor é chamado de amplitude total (H).

3º passo: Agrupamos os valores em intervalos de classe. Podemos considerar, por exemplo, a classe de 150 ( inclusive ) à 154 ( exclusive). Em símbolos, é denotada por 150 |----- 154. Nesse caso, 150 é o limite inferior e 154 é o limite superior da classe. A diferença entre o limite inferior e o limite superior é igual à amplitude da classe (h). Adotando-se a amplitude da classe igual a h = 4, teremos oito classes.

Construímos, então, uma tabela de freqüências com classes.

Exercícios Propostos1- O exame de quarenta pacientes de um hospital constatou o seguinte número de leucócitos (glóbulos brancos) por mm3.

6

Page 8: Introdução a Estatística-APOSTILA

Com esses dados, construir uma tabela de freqüências absoluta e relativa, considerando a amplitude da classe igual a 2000 (h = 2000 ).

2- Um comerciante de calçados masculinos pretendendo renovar seu estoque fez um levantamento dos pares vendidos no mês anterior e levando em conta apenas o número do sapato, chegou à seguinte relação:

Estabeleça o rol desses dados, em seguida divida em intervalos de 2 em 2 números e construa uma tabela completa de freqüências, analisando em seguida os resultados obtidos.

Capítulo 4 – Representação GráficaDados estatísticos podem ser representados tanto por tabelas e por quadros de distribuição por freqüência quanto por gráficos. O uso gráfico para representar uma situação estatística pode muitas vezes expor melhor visualmente do que uma tabela estatística, porém o seu uso deve ser feito com bastante cautela, utilizando o gráfico adequado em cada situação, veja alguns casos:

A) Gráfico de Colunas - utilizado para comparar diversos tipos de dados, indica quantidades, porcentagens e de fácil comparação entre suas variáveis.

O gráfico acima mostra o desempenho de 3 alunos durante o ano num determinado curso, pode-se perfeitamente verificar que João teve o melhor desempenho, seguido de Maria e José teve o pior desempenho.

7

Page 9: Introdução a Estatística-APOSTILA

B) Gráfico de Barras – é uma variante do gráfico de colunas, sendo amplamente utilizado em jornais, revistas, empresas, etc.

C) Histograma – Cada classe é representada por uma coluna de altura correspondente a sua freqüência. Trata-se também de um gráfico de área. A área de cada coluna é proporcional à freqüência da classe que representa. Logo, a área de todo histograma é proporcional à soma total das freqüências.

Exercícios propostos

1- Sessenta jurados escolheram as sedes das próximas olimpíadas entre cinco países( A, B, C, D e E). Uma entrevista com esses jurados revelou que nove deles optaram pelo país A, seis por B, 27 por C, três por D e 15 por E.a) Construa uma tabela relacionando os países escolhidos e as freqüências absoluta e relativa.b) Construa o gráfico de colunas para representar os dados dessa tabela.

2- A tabela abaixo representa o salário de famílias de uma pequena comunidade.

Construa com esses dados um histograma e analise os resultados.

8

Page 10: Introdução a Estatística-APOSTILA

D) Setores – Dos gráficos de Estatística, mais importante que a contribuição de Descartes foi a do escocês William Playfair, que trabalhava com estatísticas comerciais. Em 1786 ele começou a inventar maneiras de representar dados numéricos por meio de figuras. Uma de suas criações foram os gráficos de barras ou colunas, como aqueles de João, José e Maria e suas notas bimestrais. Depois de 1801, ele inventou os gráficos de setores, também chamados de “tortas” ou “pizzas”.

O gráfico acima mostra a distribuição populacional nas grandes metrópoles brasileiras e permite um comparativo entre as quantidades de habitantes existentes em cada metrópole, sendo que não confunde o leitor e sim permite uma análise mais ampla da situação no momento. Veja tabela a seguir, geratriz desse gráfico:

Cálculo da disposição de dados no gráfico

Foi feita uma enquete a 1200 alunos de uma escola sobre as atividades esportivas que gostariam de ter na escola. O resultado obtido foi o seguinte:

9

Page 11: Introdução a Estatística-APOSTILA

Com esses dados pode-se construir uma representação gráfica de setores dessa distribuição, em que usaremos um círculo. Lembrando que uma circunferência completa tem 360º, podemos calcular por meio de uma regra de três simples e direta o ângulo central correspondente a cada uma das atividades desejadas pelos alunos.Assim, temos:

Com essas medidas e com a distribuição percentual, poderemos construir com o uso de régua e compasso um gráfico de setores de forma correta, utilizando-se de cores e legenda para representar melhor a opinião dos alunos quanto ao esporte praticado.

Exercício proposto1- Uma pesquisa sobre atividades culturais extraclasse foi feita entre 1000 alunos de uma escola. O resultado está no quadro seguinte:

Usando um gráfico de setores, faça a representação gráfica dessa distribuição. Faça também uma pesquisa na sala sobre a mesma preferência, construa também um gráfico de setores e faça uma análise comparativa entre as duas situações.

Capítulo 5 – Medidas de tendência centralHá certas medidas que são típicas numa distribuição: as de tendência central (médias, medianas) e as de dispersão.

MédiasConsideremos, em ordem crescente, um rol de notas obtidas por alunos de duas turmas (A e B):

10

Page 12: Introdução a Estatística-APOSTILA

Turma A: 2 3 4 4 5 6 7 7 7 7 8Turma B: 2 3 4 4 4 5 6 6 7 8 9Observe que para cada turma:

Observando os resultados, podemos afirmar que a turma A teve melhor que a turma B. Esses três valores caracterizam as distribuições. São chamados valores típicos. Eles tendem a se localizar em um ponto central de um conjunto de dados ordenados segundo suas grandezas, o que significa a denominação medidas de tendência central ou médias.O valor que ocupa a posição central chama-se mediana ( Md ) :Para a turma A, a mediana é 6: Md = 6.Para a turma B, a mediana é 5: Md = 5.O valor que aparece com maior freqüência chama-se moda ( Mo ) :Para a turma A, a moda é 7: Mo = 7.Para a turma B, a moda é 4: Mo = 4.

11

Page 13: Introdução a Estatística-APOSTILA

O quociente da soma pelos valores pela quantidade deles é a média aritmética ( Ma ) :Para a turma A, a média aritmética é Ma = 5,45.Para a turma B, a média aritmética é Ma = 5,36.

PORTANTO, MEDIANA, MODA E MÉDIA ARITMÉTICA SÃO MEDIDAS DE TENDÊNCIA CENTRAL OU MÉDIAS DA DISTRIBUIÇÃO.

Média aritmética simples

A média aritmética (Ma) é a medida de tendência central mais conhecida. Ela é o quociente da soma dos valores (∑x) pela quantidade (n).

Média aritmética ponderada

A média aritmética ponderada é a média dos elementos do conjunto numérico A em relação à adição, onde todos os elementos têm o seu determinado peso.

Onde: p – representa o peso atribuído a uma medida x – representa a medida

Cálculo da média aritmética para dados agrupados em classes

Quando, numa distribuição por freqüência, os dados estão agrupados em classes, são considerados coincidentes com os pontos médios das classes às quais pertencem. Para o

12

Page 14: Introdução a Estatística-APOSTILA

cálculo da Ma, usaremos os produtos dos pontos médios pelas freqüências de cada classe. (Pm . Fi). Acrescentamos, então, à tabela dada a coluna Pm . Fi.

Exemplo 3 – Seja a tabela que nos dá altura (x) dos estudantes de uma classe de primeiro grau:

Queremos, a partir da tabela, calcular a média aritmética ponderadaSolução: completando a tabela, com a coluna Pm . Fi, à direita temos a coluna com os dados em “vermelho” acima:

MedianaMediana é o valor que divide a distribuição ao meio de tal modo que 50% dos dados estejam acima desse valor e os outros 50% abaixo dele.Exemplo 4 – Sejam as nove observações:

Mediana é o número que tem antes e depois de si a mesma quantidade de valores. Quando a quantidade de observações é um número par, a mediana é a média aritmética dos valores centrais.

ModaA moda de um conjunto de números é o valor que ocorre com maior freqüência. A moda pode não existir, e se existir pode não ser única.

Exemplo 6 – O conjunto de números: 2, 2, 5, 7, 9, 9, 9, 10, 11, 12, 18 tem Mo = 9

13

Page 15: Introdução a Estatística-APOSTILA

Exemplo 7 – No conjunto de dados: 3, 5, 7, 9, 10, 11, todos os dados têm a mesma freqüência. Não existe nenhum valor que apresente maior freqüência do que os outros. É um caso em que a moda não existe.

Exemplo 8 – Seja o rol de dados: 3 3 4 4 4 5 6 7 7 7 8 e 9. Os números 4 e 7 apresentam freqüência 3, maior que a os demais. Nessa distribuição há, portanto, duas modas: Mo = 4 e 7.Uma distribuição com duas modas é denominada bimodal.

A rigor, a moda não é uma medida empregada para um pequeno número de observações. Existem fórmulas para o cálculo da moda, mas, na prática, ela é determinada pelo valor ou pela classe que apresenta maior freqüência. Neste último caso, ela é chamada classe modal, que representa uma aproximação da moda.

14