introdução à estatística · pdf fileintrodução...

73
INTRODUÇÃO À ESTATÍSTICA RANILDO LOPES

Upload: vuongtuong

Post on 24-Feb-2018

221 views

Category:

Documents


2 download

TRANSCRIPT

INTRODUÇÃO À ESTATÍSTICA

RANILDO LOPES

VARIÁVEL

• Algumas variáveis, como sexo, nível de escolaridade, estado civil e transporte,

apresentam como resultado uma qualidade, atributo ou preferência da pessoa

entrevistada. Variáveis dessa natureza recebem o nome de variáveis qualitativas.

VARIÁVEL

• Outras variáveis, como idade e renda mensal apresentam como resposta um número, resultante nesse exemplo de mensuração. Variáveis assim definidas são chamadas variáveis quantitativas.

• Cabe ressaltar, que se os pesquisadores tivessem perguntado: “Quantas vezes por semana você costuma ir ao cinema?”, teríamos como objeto de estudo uma variável quantitativa, cujos valores assumidos são resultante de contagem.

VARIÁVEIS: QUADRO RESUMO

VARIÁVEL

QUALITATIVA QUANTITATIVA

DISCRETA(contagem)

CONTÍNUA(mensuração)

• As variáveis qualitativas representam a informação que indica alguma qualidade, categoria ou característica não susceptível de medida, mas de classificação, assumindo várias modalidades.

• As variáveis quantitativas representam a informação resultante de características susceptíveis de serem medidas, apresentando-se com diferentes intensidades, que podem ser de natureza discreta – variáveis discretas – ou contínua – variáveis contínuas.

Resumindo:

• Situação: A direção de um parquecontratou uma equipe de pesquisadores paracoletar algumas informações sobre seusfreqüentadores. Os cem entrevistadosresponderam às seguintes questões: sexo,idade, quantas vezes por semana vão aoparque, período de visita (manhã, tarde ounoite), tempo de permanência e quantiagasta nas dependências do parque. Cada umdesses objetos de estudo corresponde a umavariável. Classifique as variáveis quanto aotipo.

RESOLUÇÃO DO PROBLEMA

• Variáveis qualitativas: sexo e período de visita.

• Variáveis quantitativas

I) Discreta: número de visitas por semana.

II) Contínuas: idade, tempo de permanência e quantia gasta nas dependências do parque.

• De acordo com a Resolução 886 do IBGE, nas casas ou células da tabela devemos colocar :

• um traço horizontal ( - ) quando o valor é zero;

• três pontos ( ... ) quando não temos os dados;

• zero ( 0 ) quando o valor é muito pequeno para ser expresso pela unidade utilizada;

• um ponto de interrogação ( ? ) quando temos dúvida quanto à exatidão de determinado valor.

• Obs: Os lados direito e esquerdo de uma tabela oficial devem ser abertos. “Salientamos que em alguns documentos as tabelas não são abertas devido a limitações de editores como o html".

REPRESENTAÇÃO GRÁFICA

• Dados estatísticos podem ser representados tanto por tabelas quanto por gráficos.

CLASSIFICAÇÃO:

• Diagramas;

• Pictogramas;

• Cartogramas.

Diagramas

• São gráficos geométricos dispostos em duas dimensões. São os mais usados na

representação de séries estatísticas.

I) Gráficos em barras horizontais (gráfico de barras)

• Para sua construção, as freqüências são anotadas no eixo das abscissas, e os

valores da variável, no eixo das ordenadas.

Gráficos em barras horizontais

Gráficos em barras verticais (gráfico de colunas)

• Como o próprio nome indica, nesse tipo de gráfico as freqüências serão representadas por colunas – retângulos com bases de mesma medida, cujas alturas correspondem às freqüências.

Gráfico de colunas 3D

Gráfico de setores (Pizza)

• Este gráfico é construído com base em um círculo, e é empregado sempre que desejamos ressaltar a

participação do dado no total. O total é representado pelo círculo, que fica dividido em

tantos setores quantas são as partes. Os setores são tais que suas áreas são respectivamente

proporcionais aos dados da série. O gráfico em setores só deve ser empregado “quando há, no

máximo, sete dados”.

Gráfico de setores

Gráficos de linhas (poligonal)

• São frequentemente usados para representação de séries cronológicas com um grande número de períodos de tempo.

As linhas são mais eficientes do que as colunas, quando existem intensas flutuações nas séries ou quando há necessidade de se representarem várias séries em um mesmo

gráfico.

Gráficos de linhas

II) PICTOGRAMAS

• São construídos a partir de figuras representativas da intensidade do fenômeno.

Este tipo de gráfico tem a vantagem de despertar a atenção do público leigo, pois

sua forma é atraente e sugestiva. Os símbolos devem ser auto-explicativos. A

desvantagem dos pictogramas é que apenas mostram uma visão geral do fenômeno, e

não de detalhes minuciosos.

PICTOGRAMA

III) CARTOGRAMAS

• São ilustrações relativas a cartas geográficas (mapas). O objetivo desse gráfico é o de figurar os dados estatísticos diretamente relacionados com áreas geográficas ou

políticas.

CARTOGRAMA

CARTOGRAMA

CARTOGRAMA

Observe o gráfico.

análise, rePresentação e reDução De DaDos

Qual é o título

do gráfico?O título responde

às questões: O quê; Quando;

Onde?

O gráfico tem linhas auxiliares? Qual é o papel das linhas auxiliares na elaboração

de um gráfico?

Fica completamente esclarecido com o

gráfico apresentado? Justifique a resposta.

Os gráficos de barras são fáceis de construir

e de ler, por isso são os mais populares.

Apresento quatro tipos de gráficos de barras.

Gráfico de barras

Os gráficos circulares são uma

boa forma de mostrar como um

todo está repartido.

Gráficos circulares

Na construção de um gráfico circular deve-se ter em conta que:

• a amplitude de cada sector éproporcional à frequência

que representa;

• a legenda pode ser dispensada,inscrevendo-se os valores

da variável e as suasfrequências nos respectivos

sectores circulares;

• podem-se usar cores diferentespara os diferentes sectores;

• o gráfico deve ter um títuloadequado.

Não é aconselhável construir um gráfico circular:

• para variáveis que tenham maisde cinco ou seis modalidades;

• para situações em que os sectores resultamaproximadamente com

a mesma amplitude;

• para sectores com amplitudesmuito pequenas.

Não é formalmente correcto apresentar gráficos com forma

de elipse ou com sectores separados.

Indique um valor aproximado

para o número de pessoas que participaram no inquérito.

Pictogramas

O pictograma seguinte refere-se à opinião recolhida,

através de um inquérito, de um grupo de pessoas

que acabou de assistir a um filme.

HistogramaNo caso de uma variável contínua é muito frequente

representar a distribuição através de um

histograma.

Um histograma é um gráfico de barras com as seguintes

características:

• o gráfico deve ter um título adequado;

• os dados estão agrupados em classes (variável contínua ou discreta);

• a área da barra rectangular é proporcional à frequência;

• os diferentes valores da variável estão representados no eixo

horizontal que está dividido numa escala contínua como um eixo

cartesiano;

• no eixo vertical estão representadas as frequências das classes;

• as barras são desenhadas verticalmente e correspondem a cada uma

das classes em que os valores foram agrupados;

• não há espaços entre as barras.

Repare que qualquer dos histogramas

anteriores foi construído marcando no eixo

horizontal os intervalos de classe e no eixo

vertical as respectivas frequências. Como

os intervalos de classe são iguais,

resulta imediatamente que as alturas dos

rectângulos, para além das respectivas

áreas, são proporcionais às respectivas

frequências.

Função cumulativa para dados discretos

As frequências acumuladas são representadas graficamente

pela função cumulativa.

A função cumulativa indica, para cada valor real x , a

frequência absoluta (ou relativa) de observações com

intensidade menor ou igual a x .

função cumulativa

Graficamente a função cumulativa tem o seguinte aspecto:

Polígonos De frequências

A representação gráfica é um diagrama de

barras em que estas têm pouca largura.

Utiliza-se este tipo de gráfico quando o

número de barras é relativamente grande.

À linha a tracejado que une os

extremos das barras chama-se

polígono de frequências.

Polígonos de frequências para dados simples

Polígonos de frequências para dados agrupados em classes

O polígono de frequências para

dados agrupados em classes resulta da

união sucessiva, através de segmentos

de recta, dos pontos médios dos lados

superiores dos diferentes rectângulos

de um histograma.

Para a sua construção, localiza-se o ponto cuja abcissa é igual ao ponto

médio da classe e a ordenada é a correspondente à frequência de classe.

Unem-se os sucessivos pontos formando um polígono.

De modo a obter uma figura fechada, juntam-se classes extras,

uma de cada lado, de frequência zero.

Tempo gasto na resolução de um problema

Diagrama De caule e folhas ou seParaDor De frequências

Esta forma de organização de dados tem a particularidade

de permitir ao observador uma percepção do aspecto global

da distribuição dos dados sem que, ao mesmo tempo, se perca

a informação contida na colecção inicial dos dados.

Consideremos os dados da tabela.

Tomando cada um dos dados, isto é, cada uma das

classificações, separemos o algarismo das dezenas, a que

chamamos tronco, do algarismo das unidades, a que

chamamos folha. Podemos, então, dispor os dados

da seguinte forma:

A observação do separador de frequências permite reconstituir

os dados iniciais.

Para tal, lê-se:

• 7 na 1.ª linha;

• 15 na 2.ª linha;

• 25 e 29 na 3.ª linha;

• 30, 32 e 38 na 4.ª linha;

• 40, 42, 45 e 46 na 5.ª linha;

• 7 na 1.ª linha;

• 15 na 2.ª linha;

• 25 e 29 na 3.ª linha;

• 30, 32 e 38 na 4.ª linha;

• 40, 42, 45 e 46 na 5.ª linha;

Relativamente a outras formas de organização de dados, o separador

de frequências apresenta algumas vantagens, nomeadamente:

• não implica a definição de classes arbitrárias;

• todos os dados observados estão presentes;

• observando o separador de frequências podemos imaginar o gráfico

resultante do grupo de dados.

Curva normal

• A curva normal é um tipo de curva simétrica, suave, cuja forma lembra um sino.

• O aspecto mais marcante dessa curva é a simetria.

• O ponto de freqüência máxima dessa curva está situado no meio da distribuição, em que a média, a mediana e a moda coincidem.

Curva normal

Área sob a curva normal

Área sob a curva normal

Área sob a curva normal

• Podemos concluir, então, que a área total sob a curva normal compreendida

entre e , inclui para efeitos práticos, a totalidade dos dados

sob qualquer curva normal (mais de 99%).

3 3

SITUAÇÃO: Para entendermos melhor essa característica, vamos examinar o que alguns

antropólogos dizem a respeito da diferença de QIs ligadas ao sexo.

• Alguns pesquisadores afirmam que homens e mulheres têm QI médio igual a 100.

Entretanto, esses QIs diferem acentuadamente em termos de variabilidade

em torno da média.

• A distribuição do QIs masculinos contém uma porcentagem maior de

valores extremos – representativos de sujeitos brilhantes e de sujeitos

medíocres – enquanto que a distribuição de QIs femininos contém uma porcentagem maior de valores

localizados próximos à média.

• Em virtude do desvio padrão ser uma medida de variabilidade, essas diferenças ligadas ao sexo deveriam refletir no valor do desvio padrão de cada distribuição de

QIs. Poderíamos, assim, verificar, por exemplo, que para os indivíduos do

sexo masculino e que para os indivíduos do sexo feminino.

105

• Se conhecêssemos o desvio de cada conjunto de valores de QI e

admitíssemos que cada conjunto tivesse distribuição normal,

poderíamos estimar e, em seguida, comparar as porcentagens de

indivíduos do sexo masculino e indivíduos do sexo feminino

localizadas numa dada amplitude de QIs.

Distribuição de QIs masculinos

Distribuição de QIs femininos

CONCLUSÕES

• O desvio padrão e a curva normal nos permite comparar os QIs femininos e

masculinos ao longo de toda a distribuição.

• Por exemplo: se medirmos a linha base da distribuição de QIs masculinos em unidades de desvio padrão, ficaremos sabendo que 68,25% dos valores caem entre -1sigma e + 1sigma. Desse modo, 68,25% dos representantes do sexo masculino terão, nas condições propostas QIs entre 90 e 110.

RESOLUÇÃO DOS EXERCÍCIOS DA APOSTILA DO ANGLO

AULAS 18 E 19 - ESTATÍSTICA

SETOR 1102

PÁGINA 19

Exercício 1: Uma prova de matemática constou de 20 testes apresentando a seguinte distribuição por assunto:

ASSUNTO FREQUÊNCIA PORCENTAGEM

Geometria 6

Álgebra 8

Aritmética 4

Cálculo 2

TOTAL 20

a) Complete a coluna de porcentagem.

b) Represente estes dados num gráfico de barras verticais.

Exercício 1: Resolução (item a)

%101,020

2 :Cálculo

%202,020

4 :Aritmética

%404,020

8 :Álgebra

%303,020

6 :Geometria

Exercício 1: Resolução (item a – continuação)

ASSUNTO FREQUÊNCIA PORCENTAGEM

Geometria 6 30%

Álgebra 8 40%

Aritmética 4 20%

Cálculo 2 10%

TOTAL 20 100%

Exercício 1: Resolução (item b)

Exercício 2: Nas aulas de Educação Física de um colégio são praticados três esportes: vôlei, futebol e basquete. Cada um dos 300 alunos opta por um único esporte. Sabendo que 75 alunos escolheram futebol, responda:

Exercício 2:

a) Quanto mede em graus o ângulo do setor circular que corresponde ao número de alunos que optaram por futebol?

90 x 300

360 . 75 x

75

360300

oo

o

x

Exercício 2:

b) Quantos alunos optaram por basquete, se o ângulo do setor circular correspondente aos alunos que escolheram vôlei mede 120º.

125 Assim,

150

360300

150 36012090

360 basquetevôleifutebol

o

o

oooo

o

x

x

Exercício 3: Foram perguntadas as idades dos 10 primeiros alunos matriculados num determinado curso noturno e obteve-se a seguinte seqüência de idades:

17, 20, 19, 18, 21, 16, 18, 21, 21, 19

Pede-se, obter:

a) Idade médiab) Mediana (Md)c) Moda (Mo)d) Variância (σ2)e) Desvio padrão (σ)

Exercício 3

a) Idade média: Resposta

19

10

21.32019.218.21716x

21) 21, 21, 20, 19, 19, 18, 18, 17, (16, : temosOrdenando,

x

Exercício 3

b) Mediana: Resposta

19

2

1919

:centrais termosdos Média

21) 21, 21, 20, 19, 19, 18, 18, 17, (16, : temosOrdenando,

Md

Md

Exercício 3

c) Moda: Resposta

21

:frequênciamaior com aparece quevalor

21) 21, 21, 20, 19, 19, 18, 18, 17, (16, : temosOrdenando,

Mo

Exercício 3

d) Variância: Resposta

8,2

10

28

10

)1921.(3)1920()1919.(2)1918.(2)1917()1916(

2

2

2222222

Exercício 3

e) Desvio padrão: Resposta

67,1

8,2

8,22

Exercício 4: Dois estudantes, A e B, obtiveram as notas abaixo relativas aos quatro bimestres escolares.

A 6 4 5 5

B 6 6 4 4

a) Calcule a média das notas de cada aluno.

b) Qual aluno teve uma atuação mais regular?

Exercício 4

a) Resposta

54

4466

54

5546

B

A

x

x

Exercício 4 b) Resposta

regular. mais atuação A teve estudante o , Como

1 4

4

4

)54()54()56()56(

2

2

4

2

4

)55()55()54()56(

A

2

22222

2

22222

B

BB

B

AA

A