estatística: conceitos e organização de dados · técnicas apropriadas para o estudo de...

40
Estatística: Conceitos e Organização de Dados Introdução Conceitos Método Estatístico Dados Estatísticos Tabulação de Dados Gráficos Disciplina: Estatística Básica Professor: Fabrício Bueno

Upload: trankien

Post on 01-Dec-2018

219 views

Category:

Documents


0 download

TRANSCRIPT

Estatística: Conceitos e Organização de Dados

IntroduçãoConceitos

Método Estatístico

Dados Estatísticos

Tabulação de Dados

Gráficos

Disciplina: Estatística Básica

Professor: Fabrício Bueno

Introdução

• O que é Estatística?

– É a parte da matemática aplicada que se ocupa em obter conclusões a partir de dados observados

– É uma metodologia ou conjunto de técnicas que utiliza:

• Coleta de dadosColeta de dados

• Classificação de dados Classificação de dados

• Apresentação ou representação dos dadosApresentação ou representação dos dados

• Análise e interpretaçãoAnálise e interpretação

Introdução• Por que estudar?

– Entender grandes volumes de informação (pesquisas de mercado, índices populacionais, acessos a sites)

– Qualidade de processos (CEP)– Previsões confiáveis (projeções financeiras e

populacionais, vida útil de equipamentos)– Planejamento (coleta de dados, definição de

amostras, planos de contingência)

Ramos da Estatística

• Descritiva ou Dedutiva– Descreve e analisa grupos de observações

(amostras)– Uso de medidas e formas de representação

(tabelas, gráficos, curvas, ...)

• Inferencial ou Indutiva

– Processo de generalização a partir da análise e interpretação de dados amostrais

Ramos da Estatística

• Probabilidade

– Parte da Estatística que utiliza métodos e técnicas apropriadas para o estudo de processos com margem de incerteza

Pesquisa Social

• A importância da pesquisa social

– Explicar e predizer o comportamento humano

– Examinar características do comportamento humano chamadas variáveis

➢ Variáveis: características que diferem ou variam de um indivíduo para o outro ou de um instante para o outro no decorrer do tempo

Variáveis

• As variáveis são, basicamente:

– Dependentes (efeito)– Independentes (causa)

• A relação entre variáveis dependentes e independentes se dá por testes de hipóteses

➢ Exemplo: Identificar a relação entre anos de estudo e número de dependentes químicos; Índice de delinquência e número de pais

Variáveis: outras classificações

• Qualitativas ou nominais– valores expressos por atributos não

numéricos (Ex: cor, forma, profissão, ...)

• Quantitativas– Valores expresso por números (Ex:

resistência, peso, idade, ...)

Conceitos

• As variáveis quantitativas se dividem:

– Contínuas – variáveis podem assumir infinitos valores num intervalo (Ex: peso de uma pessoa, tamanho do pé de uma pessoa)

– Discretas – variáveis só podem finitos valores num intervalo (Ex: número de alunos numa sala, tamanho do calçado de uma pessoa)

Formas de Pesquisa

• Experimento– Grau de controle; Manipulação de variáveis

independentes (grupo experimental e de controle)

• Survey– Relatórios verbais; Questionários; Entrevistas; ....

• Análise de conteúdo– Jornais, livros, cartas, desenhos, músicas,

revistas,...

• Observação participativa

• Análise secundária – Dados preexistentes

Etapas do Método Estatístico

• Definição do problema - hipótese passível de teste

• Planejamento - conjunto apropriado de instrumentos

• Coleta de Dados

• Apuração dos Dados

• Apresentação dos Dados

• Análise e interpretação

• Coleta direta– Contínua– Periódica– Ocasional

• Coleta indireta (inferência a partir da coleta direta)

Exemplo: Coleta de média de reprovação do ensino médio a partir da coleta dos

registros diários de frequência

Coleta de dados

Dados Estatísticos

O método estatístico é análogo à lapidação e polimento de pedras preciosas

• Dados brutos numerosos/ matéria bruta com alta rugosidade

• Tabulação de dados /redução de rugosidade• Análise estatística para obter informações

desejadas/ lapidação para obter a forma desejada• Apresentação gráfica/ polimento para obtenção de

brilho

Dados Estatísticos

• Organização

– Brutos – dados não organizados

– Rol – dados organizados em ordem crescente ou decrescente

Organização de Dados

• Distribuição de frequências/Tabela de frequências

Absoluta

– Frequência simples Relativa (%)

Absoluta

– Frequência Acumulada Relativa (%)

14,5 10 9,1% 10 9,1%

24,5 20 18,2% 30 27,3%

34,5 50 45,4% 80 72,7%

44,5 20 18,2% 100 90,9%

54,5 10 9,1% 110 100,0%

Custo de produção (em

m ilhões)

Frequência sim ples absoluta

Frequência sim ples relativa

Frequência acum ulada

absoluta

Frequência acum ulada

relativa

Organização de Dados

• Intervalos de Classe– Forma de categorizar dados– Permite agrupar grandes volumes de dados– Auxilia na detecção de padrões– Mínimo recomendável: 4 classes– Máximo recomendável:20 classes

• Tabela de frequência em classes

Organização de Dados

• Você consegue enxergar um padrão nestes dados?

Medidas de uma peça na linha de produção

8,60 9,05 9,76 11,09 9,02 11,07 9,08 10,60 8,70 8,90 8,7011,01 10,04 9,02 10,00 11,08 11,07 12,01 11,07 11,10 8,03 8,079,07 9,10 10,04 11,02 8,90 10,04 12,01 11,04 12,05 8,70 9,8011,04 10,80 12,05 10,01 10,06 9,54 8,60 12,06 9,70 10,04 11,0911,04 9,70 9,09 10,60 12,09 11,10 8,90 8,02 12,05 11,09 12,0911,03 10,02 8,05 9,02 9,06 11,09 11,09 10,01 12,01 10,04 12,089,80 10,07 11,07 8,06 8,91 11,05 11,01 8,08 8,00 12,04 12,049,80 12,01 9,04 9,06 10,05 10,08 11,05 9,02 8,04 11,06 10,0410,00 8,90 12,01 12,04 8,02 9,60 8,02 9,05 11,05 9,02 12,1010,04 11,06 9,02 10,08 8,04 9,02 12,10 11,08 9,56 8,09 9,0411,08 9,60 8,01 9,04 8,03 8,76 12,00 10,80 11,00 12,08 9,059,70 10,05 12,00 10,00 9,03 11,10 10,00 12,07 10,03 12,08 10,909,70 10,04 9,02 9,09 12,03 9,80 11,04 12,01 8,90 9,70 9,708,80 10,70 10,07 9,55 8,02 9,03 9,70 9,10 9,03 8,08 12,0310,07 9,05 10,06 8,03 12,05 12,06 11,08 11,07 9,09 9,00 8,069,80 10,01 11,04 11,06 12,09 11,03 8,01 9,88 8,09 9,09 9,029,80 10,70 10,01 9,90 8,80 12,01 10,07 9,06 10,04 8,03 10,0711,04 10,05 10,05 9,00 9,00 10,00 11,02 10,00 10,80 8,03 10,708,01 9,60 9,05 9,01 9,04 10,00 8,08 10,70 10,80 10,80 8,559,70 8,70 9,87 9,07 9,70 11,01 8,05 11,02 9,04 10,04 8,90

Organização de Dados

• Dicas para criar uma tabela de frequência

– O número de classes pode ser estimado pela fórmula

O intervalo de classe pode ser estimado pela fórmula

– Tradicionalmente, o limite inferior do intervalo de classe é múltiplo de seu tamanho

k= n

I=MAX −MIN

k

Organização de Dados• Seguindo as estimativas

anteriores:– K=14,83

– I=0,28

– Classes:

8 |—8,28

8,28 |— 8,42

8,42 |— 8,70

.

.

.

• Outra alternativa– K=8

– I=0,5

– Classes:

8 |—8,5

8,5 |— 9

9 |— 9,5

9,5 |— 10,0

10,0|— 10,5

10,5|— 11,0

11,0|— 11,5

11,5|—

Às vezes o bom senso pode ser

preferível, porém podem haver

perdas

Não há bom padrão visual,

embora estatisticamente

correto

Organização de Dados

Calcule as demais frequências!

8,0 8,50 258,5 9,00 179,0 9,50 389,5 10,00 25

10,0 10,50 3610,5 11,00 1211,0 11,50 3811,5 12,00 29

ClassesFrequência

SimplesAbsoluta

Frequência SimplesRelativa

Frequência Acumulada

Absoluta

Frequência Acumulada

Relativa|―|―|―|―|―|―|―|―

Organização de Dados

8,0 8,50 25 11,36% 25 11,36%8,5 9,00 17 7,73% 42 19,09%9,0 9,50 38 17,27% 80 36,36%9,5 10,00 25 11,36% 105 47,73%

10,0 10,50 36 16,36% 141 64,09%10,5 11,00 12 5,45% 153 69,55%11,0 11,50 38 17,27% 191 86,82%11,5 12,00 29 13,18% 220 100,00%

ClassesFrequência

SimplesAbsoluta

Frequência SimplesRelativa

Frequência Acumulada

Absoluta

Frequência Acumulada

Relativa|―|―|―|―|―|―|―|―

Outras formas de tabela• Pesquise

– Componentes de uma tabela e suas funções

– Tabelas com séries históricas, geográficas, específicas e conjugadas (dê exemplos)

– Normas para confecção de tabelas

Organização de Dados

• Índices: razões entre duas grandezas diferentes

• Coeficientes:razão entre o número de ocorrências e o total

• Taxas: Coeficientes multiplicados por uma potência de dez para facilitar leitura

renda per capta=renda

populacao

coeficientede inadinplência=inadinplentesclientes

taxa de inadinplência=coeficientede inadinplência∗100

Representação Gráfica

• Gráficos estatísticos são formas de apresentação de dados com o objetivo de facilitar o entendimento dos fenômenos em estudo

• A seguir são apresentados alguns tipos de gráficos

Representação Gráfica

• Gráfico de Colunas – ideal para comparar dados agrupados em classes ou dados nominais

0

20

40

60

80

100

Abril Maio Junho Julho

Representação Gráfica

• Gráfico de Barras – ideal para comparar dados com rótulos longos agrupados em classes ou dados nominais

20,4

50

20

80

0 20 40 60 80 100

Lazer

Saúde

Educação

Alimentação

Representação Gráfica

8,0 |― 8,50

8,5 |― 9,00

9,0 |― 9,50

9,5 |― 10,00

10,0 |― 10,50

10,5 |― 11,00

11,0 |― 11,50

11,5 |― 12,00

0 5 10 15 20 25 30 35 40

Medidas de peças em uma linha de produção

Distribuição de Frequências

Frequências

Ca

teg

ori

as

de

Me

did

a

Representação Gráfica

• Gráfico de Linhas – ideal para indicar variações e tendências de valores de um determinado fenômeno

7568

20

110

0

20

40

60

80

100

120

1998 1999 2000 2001

Representação Gráfica

• Gráfico em Setores ou Pizza – ideal para dados que representam quantidades ou percentuais

20%

15%

5%

60%

Saúde

Educação

Defesa

Administração

Representação Gráfica

• Gráfico de Dispersão – ideal comparar pares de valores e distribuição de dados

20

5

6160

14

5047

50

20

5

6160

14

5047

27

0

10

20

30

40

50

60

70

0 1 2 3 4 5

Representação Gráfica

• Pictograma – gráficos ilustrados de fácil entendimento, voltados para público em geral

Exemplo

• Complete a tabela e construa os gráficos solicitados

Distribuição de alunos em faixas de peso

UFFS - 2010

• Identifique nesta tabela os componentes: corpo, cabeçalho, coluna indicadora e título

Faixa de Peso

40 |– 60 40

60 |– 80 95

80 |– 100 60

100 |– 110 10

110 |– 8

Freqüência simples absoluta

Freqüência simples relativa

Freqüência acumulada

absoluta

Freqüência acumulada

relativa

População, amostra e amostragem• População

– Maior conjunto tomado como referência na observação de um fenômeno

– Conjunto de entes portadores de, pelo menos, uma característica em comum

• Amostra– Subconjunto não vazio da população

– Excetuando-se a própria população

– Seu uso gera economia e rapidez dos resultados

– Deve ser representativa da população, ou seja, deve possuir as mesmas características básicas da população

População, amostra e amostragem

• Amostragem – Técnica para escolher amostras que garanta

o acaso na escolha

– Ou seja, qualquer elemento da população tem a mesma probabilidade de ser escolhido

– Uma boa técnica de amostragem garante representatividade da amostra

• Tipos de amostragem:– Amostragem casual ou aleatória

• Técnica de amostragem onde cada elemento da população tem a mesma probabilidade de ser incluído na amostra

• Exemplo: sorteios

• Pode-se utilizar tabela de números aleatórios para grandes amostras

População, amostra e amostragem

• Tipos de amostragem:– Amostragem proporcional estratificada

• Grupos heterogêneos entre si, mas homogêneos internamente

• Quando a população é dividida em estratos e a amostragem é proporcional a eles

• Ex: Uma amostra de 10% de alunos em uma classe de 40 homens e 60 mulheres, consistirá na escolha aleatória de 4 homens e 6 mulheres

População, amostra e amostragem

População, amostra e amostragem

• Tipos de amostragem– Amostragem sistemática

• Quando os elementos da população já estão ordenados, faz-se uma amostragem sistemática

• Ex: Para se obter uma amostra de 50 elementos em 15 lotes de 100 produtos, temos os passos a seguir:

Exercício

Suponha uma linha de produção que produz, diariamente, 15 lotes de 100 produtos cada.

Faça uma amostragem sistemática de 10% da produção.

1) 15 X 100 = 1500 produtos

2)1500 X 10%= 150

3) 1500/150 = 10, logo será selecionado um produto

a cada 10 unidades

4) Um número de 1 a 10 é escolhido aleatoriamente

(por exemplo, o número 7)

5) Serão escolhidos os produtos 7, 17, 27, 37, 47, ...

Atividade Prática

• O formulário Pesquisa Estudantil, baseado em Levin & Fox (2004), trata-se de uma pesquisa sobre tabagismo

• Obtenha uma amostra e colete os dados

• Organize-os em tabelas e gere os gráficos que julgarem pertinentes

Estes dados serão utilizados para nos estudos de medidas de posição e

dispersão