estatística: conceitos e organização de dados · técnicas apropriadas para o estudo de...
TRANSCRIPT
Estatística: Conceitos e Organização de Dados
IntroduçãoConceitos
Método Estatístico
Dados Estatísticos
Tabulação de Dados
Gráficos
Disciplina: Estatística Básica
Professor: Fabrício Bueno
Introdução
• O que é Estatística?
– É a parte da matemática aplicada que se ocupa em obter conclusões a partir de dados observados
– É uma metodologia ou conjunto de técnicas que utiliza:
• Coleta de dadosColeta de dados
• Classificação de dados Classificação de dados
• Apresentação ou representação dos dadosApresentação ou representação dos dados
• Análise e interpretaçãoAnálise e interpretação
Introdução• Por que estudar?
– Entender grandes volumes de informação (pesquisas de mercado, índices populacionais, acessos a sites)
– Qualidade de processos (CEP)– Previsões confiáveis (projeções financeiras e
populacionais, vida útil de equipamentos)– Planejamento (coleta de dados, definição de
amostras, planos de contingência)
Ramos da Estatística
• Descritiva ou Dedutiva– Descreve e analisa grupos de observações
(amostras)– Uso de medidas e formas de representação
(tabelas, gráficos, curvas, ...)
• Inferencial ou Indutiva
– Processo de generalização a partir da análise e interpretação de dados amostrais
Ramos da Estatística
• Probabilidade
– Parte da Estatística que utiliza métodos e técnicas apropriadas para o estudo de processos com margem de incerteza
Pesquisa Social
• A importância da pesquisa social
– Explicar e predizer o comportamento humano
– Examinar características do comportamento humano chamadas variáveis
➢ Variáveis: características que diferem ou variam de um indivíduo para o outro ou de um instante para o outro no decorrer do tempo
Variáveis
• As variáveis são, basicamente:
– Dependentes (efeito)– Independentes (causa)
• A relação entre variáveis dependentes e independentes se dá por testes de hipóteses
➢ Exemplo: Identificar a relação entre anos de estudo e número de dependentes químicos; Índice de delinquência e número de pais
Variáveis: outras classificações
• Qualitativas ou nominais– valores expressos por atributos não
numéricos (Ex: cor, forma, profissão, ...)
• Quantitativas– Valores expresso por números (Ex:
resistência, peso, idade, ...)
Conceitos
• As variáveis quantitativas se dividem:
– Contínuas – variáveis podem assumir infinitos valores num intervalo (Ex: peso de uma pessoa, tamanho do pé de uma pessoa)
– Discretas – variáveis só podem finitos valores num intervalo (Ex: número de alunos numa sala, tamanho do calçado de uma pessoa)
Formas de Pesquisa
• Experimento– Grau de controle; Manipulação de variáveis
independentes (grupo experimental e de controle)
• Survey– Relatórios verbais; Questionários; Entrevistas; ....
• Análise de conteúdo– Jornais, livros, cartas, desenhos, músicas,
revistas,...
• Observação participativa
• Análise secundária – Dados preexistentes
Etapas do Método Estatístico
• Definição do problema - hipótese passível de teste
• Planejamento - conjunto apropriado de instrumentos
• Coleta de Dados
• Apuração dos Dados
• Apresentação dos Dados
• Análise e interpretação
• Coleta direta– Contínua– Periódica– Ocasional
• Coleta indireta (inferência a partir da coleta direta)
Exemplo: Coleta de média de reprovação do ensino médio a partir da coleta dos
registros diários de frequência
Coleta de dados
Dados Estatísticos
O método estatístico é análogo à lapidação e polimento de pedras preciosas
• Dados brutos numerosos/ matéria bruta com alta rugosidade
• Tabulação de dados /redução de rugosidade• Análise estatística para obter informações
desejadas/ lapidação para obter a forma desejada• Apresentação gráfica/ polimento para obtenção de
brilho
Dados Estatísticos
• Organização
– Brutos – dados não organizados
– Rol – dados organizados em ordem crescente ou decrescente
Organização de Dados
• Distribuição de frequências/Tabela de frequências
Absoluta
– Frequência simples Relativa (%)
Absoluta
– Frequência Acumulada Relativa (%)
14,5 10 9,1% 10 9,1%
24,5 20 18,2% 30 27,3%
34,5 50 45,4% 80 72,7%
44,5 20 18,2% 100 90,9%
54,5 10 9,1% 110 100,0%
Custo de produção (em
m ilhões)
Frequência sim ples absoluta
Frequência sim ples relativa
Frequência acum ulada
absoluta
Frequência acum ulada
relativa
Organização de Dados
• Intervalos de Classe– Forma de categorizar dados– Permite agrupar grandes volumes de dados– Auxilia na detecção de padrões– Mínimo recomendável: 4 classes– Máximo recomendável:20 classes
• Tabela de frequência em classes
Organização de Dados
• Você consegue enxergar um padrão nestes dados?
Medidas de uma peça na linha de produção
8,60 9,05 9,76 11,09 9,02 11,07 9,08 10,60 8,70 8,90 8,7011,01 10,04 9,02 10,00 11,08 11,07 12,01 11,07 11,10 8,03 8,079,07 9,10 10,04 11,02 8,90 10,04 12,01 11,04 12,05 8,70 9,8011,04 10,80 12,05 10,01 10,06 9,54 8,60 12,06 9,70 10,04 11,0911,04 9,70 9,09 10,60 12,09 11,10 8,90 8,02 12,05 11,09 12,0911,03 10,02 8,05 9,02 9,06 11,09 11,09 10,01 12,01 10,04 12,089,80 10,07 11,07 8,06 8,91 11,05 11,01 8,08 8,00 12,04 12,049,80 12,01 9,04 9,06 10,05 10,08 11,05 9,02 8,04 11,06 10,0410,00 8,90 12,01 12,04 8,02 9,60 8,02 9,05 11,05 9,02 12,1010,04 11,06 9,02 10,08 8,04 9,02 12,10 11,08 9,56 8,09 9,0411,08 9,60 8,01 9,04 8,03 8,76 12,00 10,80 11,00 12,08 9,059,70 10,05 12,00 10,00 9,03 11,10 10,00 12,07 10,03 12,08 10,909,70 10,04 9,02 9,09 12,03 9,80 11,04 12,01 8,90 9,70 9,708,80 10,70 10,07 9,55 8,02 9,03 9,70 9,10 9,03 8,08 12,0310,07 9,05 10,06 8,03 12,05 12,06 11,08 11,07 9,09 9,00 8,069,80 10,01 11,04 11,06 12,09 11,03 8,01 9,88 8,09 9,09 9,029,80 10,70 10,01 9,90 8,80 12,01 10,07 9,06 10,04 8,03 10,0711,04 10,05 10,05 9,00 9,00 10,00 11,02 10,00 10,80 8,03 10,708,01 9,60 9,05 9,01 9,04 10,00 8,08 10,70 10,80 10,80 8,559,70 8,70 9,87 9,07 9,70 11,01 8,05 11,02 9,04 10,04 8,90
Organização de Dados
• Dicas para criar uma tabela de frequência
– O número de classes pode ser estimado pela fórmula
O intervalo de classe pode ser estimado pela fórmula
– Tradicionalmente, o limite inferior do intervalo de classe é múltiplo de seu tamanho
k= n
I=MAX −MIN
k
Organização de Dados• Seguindo as estimativas
anteriores:– K=14,83
– I=0,28
– Classes:
8 |—8,28
8,28 |— 8,42
8,42 |— 8,70
.
.
.
• Outra alternativa– K=8
– I=0,5
– Classes:
8 |—8,5
8,5 |— 9
9 |— 9,5
9,5 |— 10,0
10,0|— 10,5
10,5|— 11,0
11,0|— 11,5
11,5|—
Às vezes o bom senso pode ser
preferível, porém podem haver
perdas
Não há bom padrão visual,
embora estatisticamente
correto
Organização de Dados
Calcule as demais frequências!
8,0 8,50 258,5 9,00 179,0 9,50 389,5 10,00 25
10,0 10,50 3610,5 11,00 1211,0 11,50 3811,5 12,00 29
ClassesFrequência
SimplesAbsoluta
Frequência SimplesRelativa
Frequência Acumulada
Absoluta
Frequência Acumulada
Relativa|―|―|―|―|―|―|―|―
Organização de Dados
8,0 8,50 25 11,36% 25 11,36%8,5 9,00 17 7,73% 42 19,09%9,0 9,50 38 17,27% 80 36,36%9,5 10,00 25 11,36% 105 47,73%
10,0 10,50 36 16,36% 141 64,09%10,5 11,00 12 5,45% 153 69,55%11,0 11,50 38 17,27% 191 86,82%11,5 12,00 29 13,18% 220 100,00%
ClassesFrequência
SimplesAbsoluta
Frequência SimplesRelativa
Frequência Acumulada
Absoluta
Frequência Acumulada
Relativa|―|―|―|―|―|―|―|―
Outras formas de tabela• Pesquise
– Componentes de uma tabela e suas funções
– Tabelas com séries históricas, geográficas, específicas e conjugadas (dê exemplos)
– Normas para confecção de tabelas
Organização de Dados
• Índices: razões entre duas grandezas diferentes
• Coeficientes:razão entre o número de ocorrências e o total
• Taxas: Coeficientes multiplicados por uma potência de dez para facilitar leitura
renda per capta=renda
populacao
coeficientede inadinplência=inadinplentesclientes
taxa de inadinplência=coeficientede inadinplência∗100
Representação Gráfica
• Gráficos estatísticos são formas de apresentação de dados com o objetivo de facilitar o entendimento dos fenômenos em estudo
• A seguir são apresentados alguns tipos de gráficos
Representação Gráfica
• Gráfico de Colunas – ideal para comparar dados agrupados em classes ou dados nominais
0
20
40
60
80
100
Abril Maio Junho Julho
Representação Gráfica
• Gráfico de Barras – ideal para comparar dados com rótulos longos agrupados em classes ou dados nominais
20,4
50
20
80
0 20 40 60 80 100
Lazer
Saúde
Educação
Alimentação
Representação Gráfica
8,0 |― 8,50
8,5 |― 9,00
9,0 |― 9,50
9,5 |― 10,00
10,0 |― 10,50
10,5 |― 11,00
11,0 |― 11,50
11,5 |― 12,00
0 5 10 15 20 25 30 35 40
Medidas de peças em uma linha de produção
Distribuição de Frequências
Frequências
Ca
teg
ori
as
de
Me
did
a
Representação Gráfica
• Gráfico de Linhas – ideal para indicar variações e tendências de valores de um determinado fenômeno
7568
20
110
0
20
40
60
80
100
120
1998 1999 2000 2001
Representação Gráfica
• Gráfico em Setores ou Pizza – ideal para dados que representam quantidades ou percentuais
20%
15%
5%
60%
Saúde
Educação
Defesa
Administração
Representação Gráfica
• Gráfico de Dispersão – ideal comparar pares de valores e distribuição de dados
20
5
6160
14
5047
50
20
5
6160
14
5047
27
0
10
20
30
40
50
60
70
0 1 2 3 4 5
Representação Gráfica
• Pictograma – gráficos ilustrados de fácil entendimento, voltados para público em geral
Exemplo
• Complete a tabela e construa os gráficos solicitados
Distribuição de alunos em faixas de peso
UFFS - 2010
• Identifique nesta tabela os componentes: corpo, cabeçalho, coluna indicadora e título
Faixa de Peso
40 |– 60 40
60 |– 80 95
80 |– 100 60
100 |– 110 10
110 |– 8
Freqüência simples absoluta
Freqüência simples relativa
Freqüência acumulada
absoluta
Freqüência acumulada
relativa
População, amostra e amostragem• População
– Maior conjunto tomado como referência na observação de um fenômeno
– Conjunto de entes portadores de, pelo menos, uma característica em comum
• Amostra– Subconjunto não vazio da população
– Excetuando-se a própria população
– Seu uso gera economia e rapidez dos resultados
– Deve ser representativa da população, ou seja, deve possuir as mesmas características básicas da população
População, amostra e amostragem
• Amostragem – Técnica para escolher amostras que garanta
o acaso na escolha
– Ou seja, qualquer elemento da população tem a mesma probabilidade de ser escolhido
– Uma boa técnica de amostragem garante representatividade da amostra
• Tipos de amostragem:– Amostragem casual ou aleatória
• Técnica de amostragem onde cada elemento da população tem a mesma probabilidade de ser incluído na amostra
• Exemplo: sorteios
• Pode-se utilizar tabela de números aleatórios para grandes amostras
População, amostra e amostragem
• Tipos de amostragem:– Amostragem proporcional estratificada
• Grupos heterogêneos entre si, mas homogêneos internamente
• Quando a população é dividida em estratos e a amostragem é proporcional a eles
• Ex: Uma amostra de 10% de alunos em uma classe de 40 homens e 60 mulheres, consistirá na escolha aleatória de 4 homens e 6 mulheres
População, amostra e amostragem
População, amostra e amostragem
• Tipos de amostragem– Amostragem sistemática
• Quando os elementos da população já estão ordenados, faz-se uma amostragem sistemática
• Ex: Para se obter uma amostra de 50 elementos em 15 lotes de 100 produtos, temos os passos a seguir:
Exercício
Suponha uma linha de produção que produz, diariamente, 15 lotes de 100 produtos cada.
Faça uma amostragem sistemática de 10% da produção.
1) 15 X 100 = 1500 produtos
2)1500 X 10%= 150
3) 1500/150 = 10, logo será selecionado um produto
a cada 10 unidades
4) Um número de 1 a 10 é escolhido aleatoriamente
(por exemplo, o número 7)
5) Serão escolhidos os produtos 7, 17, 27, 37, 47, ...
Atividade Prática
• O formulário Pesquisa Estudantil, baseado em Levin & Fox (2004), trata-se de uma pesquisa sobre tabagismo
• Obtenha uma amostra e colete os dados
• Organize-os em tabelas e gere os gráficos que julgarem pertinentes
Estes dados serão utilizados para nos estudos de medidas de posição e
dispersão