prof. hubert chamone gesser , dr. graduação em administração - esag/udesc
DESCRIPTION
Centro Universitário Estácio de Sá de Santa Catarina Instituto de Certificação de Estudos de Trânsito e Transportes. ESTATÍSTICA . Prof. Hubert Chamone Gesser , Dr. Graduação em Administração - ESAG/UDESC Doutorado e Mestrado em Engenharia de Produção - UFSC. - SUMÁRIO -. - PowerPoint PPT PresentationTRANSCRIPT
Prof. Hubert Chamone Gesser, Dr.
Graduação em Administração - ESAG/UDESCDoutorado e Mestrado em Engenharia de Produção - UFSC
Centro Universitário Estácio de Sá de Santa CatarinaInstituto de Certificação de Estudos de Trânsito e Transportes
- SUMÁRIO -
Conceitos Básicos em Estatística
Conhecendo os Dados
Medidas de Tendência Central
Medidas de Ordenamento
Medidas de Dispersão
Tabelas e Gráficos
Amostragem
Correlação
Prof. Hubert Chamone Gesser, Dr.
Disciplina de Estatística
Retornar
Conceitos Básicos em Estatística
ESTATÍSTICA
ESTATÍSTICA
Origem no latim status (estado) + isticum (contar)
“Informações referentes ao estado”
Coleta, Organização, Descrição, Análise e Interpretação de Dados
ESTATÍSTICA
Recenseamentos
Com o surgimento dos Estados, aparece a necessidade de se contar o povo (produção) e o exército (poder). Esforços dos governos para conhecer seus habitantes, sua condição socioeconômica, sua cultura, sua religião, etc.
ASSOCIAÇÃO ENTRE ESTATÍSTICA E ESTADO
PANORAMA HISTÓRICO
6
Desde a Antiguidade, vários povos já registravam o número de habitantes, de nascimentos e óbitos, que hoje chamamos de “estatísticas”.
Na Idade Média, colhiam-se informações, geralmente com finalidades bélicas ou tributárias.
ESTATÍSTICA
7
Fonte: http://www.educ.fc.ul.pt/icm/icm2003/icm24/introducao.htm
ESTATÍSTICA
Para Sir Ronald A. Fisher (1890-1962):
Estatística é o estudo das populações, das variações e dos métodos de redução de dados.
O Que é Estatística?
ESTATÍSTICA
ESTATÍSTICA
“Eu gosto de pensar na Estatística como a ciência de aprendizagem a partir dos dados...”
Jon KettenringPresidente da American Statistical Association, 1997
O Que é Estatística?
ESTATÍSTICA
O Que é Estatística (definição)? “Estatística é um conjunto de
técnicas e métodos que nos auxiliam no processo de tomada de decisão na presença de incerteza.”
ESTATÍSTICA
LIVROS DE ESTATÍSTICA
ESTATÍSTICA
As diferenças são atribuídas a causas erradas; As coincidências ocorrem frequentemente; As pessoas têm dificuldades com probabilidades; Acrescentam polimento às publicações; Faz conhecer o “grau de confiança” das
conclusões.
POR QUE A ESTATÍSTICA É IMPORTANTE?
ESTATÍSTICA
Indicadores Sociais Diferentes
1o Mundo 3o Mundo
Alta Expectativa de VidaBoas Condições Sanitárias
Hábitos de ConsumoAssistência em Saúde
Doenças InfecciosasAlta Mortalidade Infantil
Baixa EscolaridadeIniquidades em Saúde
As variabilidades mostram que existem diferenças
EXPECTATIVA DE VIDA – Diferenças entre os países
ESTATÍSTICA
ESTATÍSTICA
RENDA PER CAPITA NO BRASIL (PNUD, 2000)
ESTATÍSTICA
RENDA PER CAPITA EM SANTA CATARINA (PNUD, 2000)
ESTATÍSTICA
ACESSO AO ENSINO SUPERIOR NO BRASIL (PNUD, 2000)
ESTATÍSTICA
ACESSO AO ENSINO SUPERIOR EM SANTA CATARINA (PNUD, 2000)
ESTATÍSTICA
GRÁFICO DE DISPERSÃO - RENDA x EDUCAÇÃO (PNUD, 2000)
ESTATÍSTICA
FONTES DEMOGRÁFICAS
Bancos de Dados (OMS, OPAS, MS, IBGE, etc)
Indicadores Sociais (IDH, GINI, QV)
Pesquisas de Mercado (Hábitos de Consumo)
Censos Demográficos
Pesquisa Nacional por Amostra de Domicílios (PNAD)
Programa das Nações Unidas para o Desenvolvimento (PNUD)
ESTATÍSTICA
POPULAÇÃO: Conjunto de elementos que se deseja estudar
AMOSTRA: Subconjunto da população
Nem sempre o Censo é viável (questões econômicas)
É mais barato coletar dados de amostras
POPULAÇÃO E AMOSTRA
ESTATÍSTICA
POPULAÇÃO: Também chamada de Universo
AMOSTRA: Parte da população
População
Amostra
ESTATÍSTICA
POPULAÇÃO (N): Todos os motoristas de Fpolis/SC
AMOSTRA (n): Parte dos motoristas de Fpolis/SC
POPULAÇÃO E AMOSTRA
Plano de Amostragem
ESTATÍSTICA
REQUISITOS DE UMA AMOSTRA
1) Ter um tamanho adequado (previamente calculado) Existem fórmulas para o cálculo do adequado tamanho da amostra
2) Constituintes selecionados ao acaso (sorteio)
ESTATÍSTICA
Amostragem e Planejamento de Experimentos(coleta dos dados)
Estatística Descritiva(organização, apresentação e sintetização dos dados)
Estatística Inferencial(testes de hipóteses, estimativas, probabilidades)
Áreas da Estatística
ESTATÍSTICA
Amostragem e Planejamento de Experimentos(coleta dos dados)
- É o processo de escolha da amostra
- É o início de qualquer estudo estatístico- Consiste na escolha criteriosa dos elementos a serem submetidos ao estudo
Exemplos: Pesquisa sobre tendência de votação Cuidado: Perfil da Amostra = Perfil da População
ESTATÍSTICA
Estatística Descritiva(organização, apresentação e sintetização dos dados)
- É a parte mais conhecida- Diariamente veiculada na mídia (jornais, televisão, rádio)- Distribuições de frequência, médias, tabelas, gráficos
Exemplos: Quantidade de acidentes de trânsito em uma cidade Índice de Mortalidade Infantil (por mil nascimentos) Média de acidentes em uma rodovia
ESTATÍSTICA
Os Gráficos são Estatísticas Descritivas
ESTATÍSTICA
ESTATÍSTICA
ESTATÍSTICA
Real x Utopia
ESTATÍSTICA
Acidentologia - Risco e PrevençãoVisão Multidisciplinar
ESTATÍSTICA
Acidentes de Trânsito
ESTATÍSTICA
Manchetes de Jornais
Impunidade…o que acontece com aqueles que matam no trânsito? Número de mortes no trânsito ultrapassa o de homicídios em SP Acidente com van e carreta mata 12 em MG Acidentes com vítimas tiveram redução de 33% em Curitiba Número de mortes aumenta 4% nas estradas federais nos feriados
Paraguai
Argen
tina
ESTATÍSTICA
Estatística Inferencial, Indutiva ou Analítica(testes de hipóteses, estimativas)
- Auxilia o processo de tomada de decisões- Responde uma dúvida, compara grupos- Testam-se 2 hipóteses (hipótese nula e hipótese alternativa), sendo que
uma delas será aceita mediante a aplicação de um teste estatístico baseado na teoria das probabilidades.
Exemplo: O tabagismo está associado às doenças pulmonares? Hipóteses: Nula (não há associação), Alternativa (há associação)
37
FASES DO MÉTODO ESTATÍSTICO
COLETA DE DADOS CRÍTICA DOS DADOS APURAÇÃO DOS DADOS EXPOSIÇÃO OU
APRESENTAÇÃO ANALISAR OS RESULTADOS E
FAZER INFERÊNCIA
ESTATÍSTICA
38
SOFTWARES ESTATÍSTICOS• SPSS• Epidata• Bioestat• Excel• STATA• SAS• Epi Info
ESTATÍSTICA
Prof. Hubert Chamone Gesser, Dr.
Disciplina de Estatística
Retornar
Conhecendo os Dados
ESTATÍSTICA
Dados Nominais (Sexo, Raça, Cor dos Olhos) Dados Ordinais (Grau de Satisfação) Dados Numéricos Contínuos (Altura, Peso) Dados Numéricos Discretos (Número de Automóveis)
“Estatísticas aplicadas em alguns tipos de dadosnão podem ser aplicadas em outros .”
TIPOS DE DADOS
ESTATÍSTICA
Dados Intervalares (Temperatura oC)
Quando se referem a valores obtidos mediante a aplicação de uma unidade de medida arbitrária, porém constante e onde o zero é relativo. Este tipo de dado tem restrições a cálculos.
30oC não é três vezes mais quente que 10oCPara cálculos se utiliza a escala Kelvin
TIPOS DE DADOS
42
VARIÁVEL QUANTITATIVA OU QUALITATIVA?
ESTATÍSTICA
43
VARIÁVEL QUANTITATIVA OU QUALITATIVA?
Fonte: http://www.bocamaldita.com/1119733943/nova-charge-no-ar-contra-corrupcao/
ESTATÍSTICA
44
VARIÁVEL QUANTITATIVA OU QUALITATIVA?
ESTATÍSTICA
45
ARREDONDAMENTO DE NÚMEROS 1ª Regra: Arredondar para o número mais próximo
2ª Regra: Arredondar para o par mais próximo
5,0 5,5 6,0
6,0 6,5 7,0
ESTATÍSTICA
ESTATÍSTICA
EXERCÍCIO No 1
Faça os seguintes arredondamentos:
38,648 para o centésimo mais próximo 38,6554,76 para o décimo mais próximo 54,827,465 para o centésimo mais próximo 27,4642,455 para o centésimo mais próximo 42,464,5 para o inteiro mais próximo 4
ESTATÍSTICA
AGRUPAMENTO DE DADOS POR VALORES DISTINTOS
8 2 5 6 5 6 5 4 3 7 5 6 5 4 7 2 5 4 6 5 3 6 5 4 2 5 3 6
x f (frequência) 2 3 3 3 4 4 5 9 6 6 7 2 8 1Total 28
ESTATÍSTICA
AGRUPAMENTO DE DADOS POR CLASSES
Classes f (frequência) Ponto Médio
39 50 4 44,550 61 5 55,5 61 72 5 66,572 83 6 77,583 94 5 88,5
ESTATÍSTICA
POLÍGONO DE FREQUÊNCIA
x f 2 3 3 3 4 4 5 9 6 6 7 2 8 1Total 28
f
x
10
8
6
4
2
2 3 4 5 6 7 8
ESTATÍSTICA
CURVAS DE FREQUÊNCIA
Análise Horizontal: Análise Vertical: Assimétrica Positiva Leptocúrtica (alta) Simétrica Mesocúrtica Assimétrica Negativa Platicúrtica (baixa)
Análise Conjunta: Assimétrica Positiva Leptocúrtica Simétrica Mesocúrtica “Curva de Gauss” “Curva Normal”
ESTATÍSTICA
CURVAS DE FREQUÊNCIA
Análise Horizontal: Assimétrica Positiva (cauda direita longa)
f
x
ESTATÍSTICA
CURVAS DE FREQUÊNCIA
Análise Horizontal: Simétrica
f
x
ESTATÍSTICA
CURVAS DE FREQUÊNCIA
Análise Horizontal: Assimétrica Negativa (cauda esquerda longa)
f
x
ESTATÍSTICA
CURVAS DE FREQUÊNCIA
Análise Vertical: Leptocúrtica (alta)
f
x
ESTATÍSTICA
CURVAS DE FREQUÊNCIA
Análise Vertical: Mesocúrtica
f
x
ESTATÍSTICA
CURVAS DE FREQUÊNCIA
Análise Vertical: Platicúrtica (baixa)
f
x
ESTATÍSTICA
Apresentam-se os valores absolutos e as porcentagensPodem ser usadas tabelas ou gráficos
DESCRIÇÃO DE DADOS NOMINAIS E ORDINAIS
05
10152025303540
1° Trim. 2° Trim.
20,4
30,6
45,9
Gráfico de Barras Gráfico Circular
ESTATÍSTICA
DESCRIÇÃO DE DADOS NOMINAIS E ORDINAIS
05
1015202530354045
1° Trim. 2° Trim.
Gráfico de Linhas(não é usado, pois é restrito a dados numéricos contínuos)
20,4
30,6
45,9
0 10 20 30 40 50
Gráfico de Barras Horizontal
CUIDADO!!!
ESTATÍSTICA
Trazem informações que expressam a tendência central e a dispersão dos dados.
Tendência Central: Média ( x ), Mediana ( Md ), Moda ( Mo )
Medidas de Dispersão: Desvio Padrão, Variância, Amplitude, Coeficiente de Variação,
Valor Máximo, Valor Mínimo
DESCRIÇÃO DOS DADOS CONTÍNUOS
ESTATÍSTICA
EXERCÍCIO No 2Em uma pesquisa sobre infrações de trânsito foram coletados as seguintes quantidades de multas/dia em uma determinada rodovia: 65 66 62 66 63 61 67 63 64 62 68 67 65 64 65 66 63 64 65 66 64 63 64 66 65 63 64 65 64 63 64 63 64 68 69 70
a) Qual foi o tamanho da amostra (n)?b) Qual é o maior e o menor volume de multas/dia?c) Faça o agrupamento de dados por valores distintos.d) Faça o agrupamento em 3 classes.
Prof. Hubert Chamone Gesser, Dr.
Disciplina de Estatística
Retornar
Medidas de Tendência Central
ESTATÍSTICA
Nos dão uma idéia de onde se localiza o centro, o ponto médio de um determinado conjunto de dados.
Medidas:
- Média,
- Moda e
- Mediana.
MEDIDAS DE TENDÊNCIA CENTRAL
ESTATÍSTICA
Fonte: renovadoresudf.wordpress.com
ESTATÍSTICA
É um valor típico representativo de um conjunto de dados. Fisicamente representa o ponto de equilíbrio da distribuição.
Modos de calcular
1) para dados simples
2) para valores distintos
3) para agrupamentos em classes
MÉDIA
x = S x / n
x = S fx / n
x = S fx / n
ESTATÍSTICA
1) Cálculo para dados simples
MÉDIA
x = S x / n
S x = Soma dos valoresn = tamanho da amostra
x = (16+18+23+21+17+16+19+20)8
x = 18,75
16 18 23 21 17 16 19 20
ESTATÍSTICA
2) Cálculo para valores distintos x f fx 2 3 6 3 3 9 4 4 16 5 9 45 6 6 36 7 2 14 8 1 8 Total 28 134
MÉDIA
x = S fx / n
S fx = Soma dos produtos dos valores distintos
com a frequêncian = tamanho da amostra
x = 134 x = 4,7857 28
ESTATÍSTICA
3) Cálculo para agrupamentos em classes Classes f x fx 39 50 4 44,5 178 50 61 5 55,5 277,5 61 72 5 66,5 332,5 72 83 6 77,5 465 83 94 5 88,5 442,5 Total 25 - 1695,5
MÉDIA
x = S fx / n
S fx = Soma dos produtos dos valores distintos
com a frequêncian = tamanho da amostra
x = 1695,5 x = 67,82 25
ESTATÍSTICA
É o valor que ocupa a posição central de um conjunto de dados ordenados.
Para um número par de termos a mediana é obtida através da média aritmética dos dois valores intermediários.
Interpretação:50% dos valores estão abaixo ou coincidem com a mediana e 50% estão acima ou coincidem com a mediana.
MEDIANA
69
DADOS BRUTOS E ROLDados brutos são aqueles que ainda não foram
numericamente ordenados. Rol é um arranjo de dados numéricos brutos em
ordem crescente ou decrescente de grandeza
Fonte: http://danigimenes.blogspot.com.br/2012/03/fila-anda.html
ESTATÍSTICA
70
DISPOSIÇÃO EM ROL
ESTATÍSTICA
Fonte: http://guiacemtiradentes.blogspot.com.br/2013/03/moda-mediana-media-matematica.html
71
ESTATÍSTICA
Roteiro para o Cálculo do Valor da Mediana:
Fazer a disposição em rol Calcular a posição da mediana Encontrar o valor
ESTATÍSTICA
1) Cálculo da posição da mediana para dados simples
MEDIANA
2 3 4 5 67 8 9 10
PMd =(n+1) / 2PMd = (9+1) / 2PMd = 5o Termo
Mediana (Md) = 6
ESTATÍSTICA
2) Cálculo da posição da mediana para valores distintos x f fa 2 3 3o
3 3 6o
4 4 10o
5 9 19o
6 6 25o
7 2 27o
8 1 28o
Total 28 -
MEDIANA
PMd =(n+1) / 2PMd = (28+1) / 2
PMd = 14,5
x entre 14o e 15o Termo
Mediana (Md) = 5
ESTATÍSTICA
3) Cálculo da PMd para agrupamentos em classes Classes f x fa 39 50 4 44,5 4o
50 61 5 55,5 9o
61 72 5 66,5 14o
72 83 6 77,5 20o
83 94 5 88,5 25o Total 25 - -
MEDIANA
PMd =(n+1) / 2PMd = (25+1) / 2
PMd = 13o Termo
Classe Mediana61 72
Mediana (Md) = 66,5 (estimativa)
ESTATÍSTICA
É o valor que ocorre com maior frequência em um conjunto de dados. Símbolo = Mo
MODA
1) Moda para dados simples
Exemplos: 2, 3, 4, 5, 6, 7, 8 AMODAL2, 3, 3, 4, 5, 6 ,7 MODA = 32, 3, 3, 4, 5, 5, 6 BIMODAL (Mo = 3 e Mo = 5)
ESTATÍSTICA
2) Moda para valores distintos x f 2 3 3 3 4 4 5 9 6 6 7 2 8 1 Total 28
MODA
O valor 5 tem o maior número de ocorrências (9)
Mo = 5
ESTATÍSTICA
3) Moda para agrupamentos em classes Classes f x fa 39 50 4 44,5 4o
50 61 5 55,5 9o
61 72 5 66,5 14o
72 83 6 77,5 20o
83 94 5 88,5 25o Total 25 - -
MODA
Moda Bruta Ponto médio da classe de maior frequência
Mo = 77,5
É uma estimativa
ESTATÍSTICA
Fonte: http://lelima.com/enter/?tag=desenho-de-moda
A Moda pode ser usada com dados nominais.
ESTATÍSTICA
MÉDIA: Dados Numéricos e Intervalares
É a medida mais utilizada.
MODA: Dados Nominais
MEDIANA: Dados Ordinais
USO DAS MEDIDAS DE TENDÊNCIA CENTRAL
EXERCÍCIO No 1
Determine a média, a mediana e a moda para o seguinte conjunto de dados
ESTATÍSTICA
6 5 8 4 7 6 9 7 3
EXERCÍCIO No 2
Determine o menor valor, o maior valor, a média, a mediana e a moda para o seguinte conjunto de dados
ESTATÍSTICA
12 32 54 17 82 99 51 11 44 22
22 33 44 52 76 41 37 10 5 87
EXERCÍCIO No 3
Dado o seguinte agrupamento em classes determine:
ESTATÍSTICA
Classes f 1,60 1,65 101,65 1,70 151,70 1,75 221,75 1,80 181,80 1,85 3 Total 68
a) os pontos médios de cada classeb) a classe modalc) a moda brutad) a classe medianae) a mediana por agrupamento de classesf) a média por agrupamento de classes
Prof. Hubert Chamone Gesser, Dr.
Disciplina de Estatística
Retornar
Medidas de Ordenamento
ESTATÍSTICA
São os valores que subdividem uma disposição em rol
Medidas: QUARTIS, DECIS E PERCENTIS
Os Quartis dividem a disposição em 4 partes iguaisQ1, Q2, Q3
Os Decis dividem a disposição em 10 partes iguaisD1, D2, D3, D4, D5, D6, D7, D8, D9
Os Percentis dividem a disposição em 100 partes iguaisP1, P2, P3, P4, P5, P6, ... , P99
MEDIDAS DE ORDENAMENTO
85
Dr. William MendenhallNorth Carolina State University
Dr. Terry SincichUniversity of South Florida
ESTATÍSTICA
MEDIDAS DE ORDENAMENTO
86
4
1
nqrtilPosiçãoQua q
10
1
ndilPosiçãoDec d
100
1
nctilPosiçãoCen c
Cálculo de posições pela definição de Mendenhall e Sincich
ESTATÍSTICA
87
4
155122
rtilPosiçãoQua
Exemplificando...
Como pode ser encontrada a posição do segundo quartil em uma amostra de 551 pessoas?
termortilPosiçãoQua o2762
ESTATÍSTICA
ESTATÍSTICA
Os Quartis dividem a disposição em 4 partes iguaisQ1, Q2, Q3
Entre cada quartil há 25% dos dados da disposição
Posição do Primeiro Quartil (Q1) = (n + 1) / 4Posição do Segundo Quartil (Q2) = 2.(n + 1) / 4Posição do Terceiro Quartil (Q3) = 3.(n + 1) / 4
O segundo quartil coincide com a Mediana (Q2 = Md)
QUARTIS
ESTATÍSTICA
Os Quartis dividem a disposição em 4 partes iguaisQ1, Q2, Q3
1, 1, 1, 2, 2, 2, 3, 3, 3, 4, 4, 4, 5, 5, 5, 5, 6, 7, 7, 7, 8, 8, 8, 8, 9, 9, 9
QUARTIS
Q1 Q2 Q37o termo 14o termo 21o termo
n = 27
ESTATÍSTICA
Os Decis dividem a disposição em 10 partes iguaisD1, D2, D3, D4, D5, D6, D7, D8, D9
Entre cada decil há 10% dos dados da disposição
Posição do Primeiro Decil (D1) = (n + 1) / 10Posição do Segundo Decil (D2) = 2.(n + 1) / 10
Posição do Nono Decil (D9) = 9.(n + 1) / 10
O Quinto Decil coincide com a Mediana (D5 = Md)
DECIS
ESTATÍSTICA
Os percentis dividem a disposição em 100 partes iguaisP1, P2, P3, P4, P5, P6, ... , P99
Entre cada percentil há 1% dos dados da disposição
Posição do Primeiro Percentil (P1) = (n + 1) / 100Posição do Segundo Percentil (P2) = 2.(n + 1) / 100
Posição do Nonagésimo Nono Percentil (P99) = 99.(n + 1) / 100
P50 = Md P25 = Q1 P75 = Q3
PERCENTIS
ESTATÍSTICA
1) Dado o conjunto de dados:a) apresente a disposição em rol; b) o Percentil 50, c) o Primeiro Quartil, d) a Média, e) a Moda e f) a Mediana
EXERCíCIOS
10 13 24 45 66 77 11 14 26 33 65 21 57
ESTATÍSTICA
2) Em uma amostra com 2789 valores qual é a posição do oitavo decil, da mediana, do segundo decil, do terceiro quartil e do segundo quartil?
Prof. Hubert Chamone Gesser, Dr.
Disciplina de Estatística
Retornar
Medidas de Dispersão
95
MEDIDAS DE DISPERSÃO?
ESTATÍSTICA
Tudo é incerto e derradeiro. Tudo é disperso, nada é inteiro.
(Fernando Pessoa)
ESTATÍSTICA
É frequentemente chamada de variabilidade.Medidas mais comuns: Variância, Desvio Padrão, Amplitude
e Coeficiente de Variação
DISPERSÃO DOS DADOS
f
x
Dispersão dos dados na população
Dispersão dos dadosna amostra
ESTATÍSTICA
É uma forma de se ver o quanto os dados se afastam da média.Exemplo: Vilarejo com apenas 11 pessoas
135cm 152cm 136cm 152cm 138cm 157cm 141cm 163cm 143cm 170cm 152cm
Dispersão na População
Média = 149cmMediana e Moda = 152cm
Valor Máximo = 170cmValor Mínimo = 135cm
Amplitude = 35cm
Alturas de 11 pessoas
ESTATÍSTICA
Alturas (N=11) x - x (x - x)2 135cm 135-149 -14 196136cm 136-149 -13 169138cm 138-149 -11 121141cm 141-149 -8 64143cm 143-149 -6 36152cm 152-149 3 9152cm 152-149 3 9152cm 152-149 3 9157cm 157-149 8 64163cm 163-149 14 196170cm 170-149 21 441Total 1314
Dispersão na População
s2 Variância= 1314 / 11
= 119,454 cm2
s Desvio Padrão
= 119,454= 10,92 cm
Soma dos desvios quadráticos
s2 = S ( x - x )2 / N
ESTATÍSTICA
VARIÂNCIA E DESVIO PADRÃO NA POPULAÇÃO
Variância da população
Desvio Padrão da população = Raiz quadrada da variância
s s2
Como a dispersão nas amostras é menor do que na população, se faz um ajuste matemático.
ESTATÍSTICA
Variância da Amostra ( s2 ou v )
s2 = S ( x - x )2 / ( n -1 )
Desvio Padrão da amostra ( s ou DP ) = Raiz quadrada da variância
s s2
A dispersão nas amostras é menor do que na população, por isso é que se faz este ajuste matemático
VARIÂNCIA E DESVIO PADRÃO NA AMOSTRA
ESTATÍSTICA
SIGNIFICADO:É um modo de representar a dispersão dos dados ao redor da média.
DESVIO PADRÃO
f
xMédia
ESTATÍSTICA
A curva A mostra uma dispersão dos dados maior do que a curva B, logo o desvio padrão de A é maior do que o de B.
DESVIO PADRÃO
f
xMédia
Curva A Curva B
x
f
Média
ESTATÍSTICA
COEFICIENTE DE VARIAÇÃO
O desvio padrão depende da unidade de medida usada, assim um desvio medido em dias será maior do que um medido em meses.
O coeficiente de variação expressa o desvio-padrão como porcentagem do valor da média.
COEF. VARIAÇÃO = 100 . DESVIO PADRÃO MÉDIA
Quanto menor for este coeficiente mais homogênea é a amostra.
ESTATÍSTICA
COEFICIENTE DE VARIAÇÃO
Classificação da proporção que o desvio padrão apresenta sobre a média.GRAU DE HOMOGENEIDADE DOS DADOS
até 10% ÓTIMO de 10% a 20% BOM de 20% a 30% REGULAR acima de 30% RUIM
ESTATÍSTICA
EXERCÍCIOS
1) Determine a média, a amplitude, a variância, o desvio padrão e o coeficiente de variação da seguinte amostra de dados:
4 5 5 6 6 7 7 8
Prof. Hubert Chamone Gesser, Dr.
Disciplina de Estatística
Retornar
Amostragem
107
AMOSTRAGEMAMOSTRA significa um subconjunto de elementos pertencentes a uma população.
ESTATÍSTICA
108
AMOSTRAGEMPor que usar Amostras?
- Economia (É mais barato levantar dados de uma parcela da população)
- Tempo (É mais rápido)
ESTATÍSTICA
109
Amostra ou Censo?
AMOSTRA CENSO
Orçamento PQ GDE
Tempo PQ GDE
Tamanho da População GDE PQ
Variância PQ GDE
Natureza da Medição Destrutiva Não-destrutiva
Atenção Individual Sim Não
ESTATÍSTICA
110
REQUISITOS DE UMA AMOSTRA REPRESENTATIVA
- Aleatória (Sorteio)
- Tamanho Calculado (Fórmulas Matemáticas)
ESTATÍSTICA
111
PARÂMETROS x ESTATÍSTICAS
ESTATÍSTICA
112
Resultados Confiáveis
Uma pesquisa feita pela internet é
confiável?
ESTATÍSTICA
113
Resultados Confiáveis
Somente com amostras representativas da população.
ESTATÍSTICA
114
Importante
Na Amostra Probabilística:
“Todo elemento da população tem que ter a mesma chance de ser sorteado.”
ESTATÍSTICA
115
Fonte: http://www.ladislauleal.com.br/2013/07/bomba-bombabomba.html
ESTATÍSTICA
ESTATÍSTICA
Pesquisa Mercadológica (Índice de satisfação na população)Pesquisa Epidemiológica (Prevalência de uma doença na população)Pesquisa Eleitoral (Percentagem de votos para cada candidato)Perfil Socioeconômico da População (Grau de escolaridade, Renda)
APLICAÇÕES DE AMOSTRAGEM
População
Amostra
Na População ParâmetrosNa Amostra Estatísticas
Inferência Estatística
ESTATÍSTICA
Economia (É mais barato levantar dados de uma parcela da população)Tempo (É mais rápido)
Quando a população for pequena (n > 0,8.N)Quando a característica for de fácil mensuração (Sim ou Não) Quando houver a necessidade de alta precisão (Censo IBGE)
POR QUE USAR A AMOSTRAGEM?
QUANDO NÃO USAR A AMOSTRAGEM?
ESTATÍSTICA
AMOSTRAGEM ALEATÓRIA SIMPLES (Tem que obedecer a propriedade de qualquer elemento da população ter a mesma chance de pertencer à amostra. Pode-se utilizar uma tabela de números aleatórios ou sorteios)AMOSTRAGEM ALEATÓRIA SISTEMÁTICA(Após obter-se a lista dos elementos da população, sorteia-se a entrada e segue-se a relação N/n.)AMOSTRAGEM ALEATÓRIA ESTRATIFICADA(Elabora-se a amostra através do perfil conhecido da população. Exemplo: Se na UFSC 70% são alunos e 30% Funcionários, a amostra é confeccionada obedecendo-se estes parâmetros.)
TIPOS DE AMOSTRAGEM
ESTATÍSTICA
AMOSTRAGEM NÃO ALEATÓRIA(De fácil obtenção.)AMOSTRAGEM PARA ESTUDOS COMPARATIVOS(Não visa a descrição de uma população, mas a comparação entre grupos diferentes. Exemplos: Comparar as taxas de tabagismo em indivíduos com câncer de pulmão e sadios.)
OUTROS TIPOS DE AMOSTRAGEM
Procure respeitar o Plano de Amostragem para que seja alcançada uma amostra representativa da população.
ESTATÍSTICA
Fórmula GenéricaSejam: n0 = Primeira aproximação para o tamanho da amostra
e = Erro Amostral Tolerável (exemplo: 0,05)
n = Tamanho da Amostra N = Tamanho da População
DETERMINAÇÃO DO TAMANHO DA AMOSTRA (n)
n0 = 1 / e2 n = (N . n0) / (N + no)
ESTATÍSTICA
Fórmula para variável quantitativa, desvio conhecido e população infinita
Sejam: n = Tamanho da Amostra z = Nível de confiança expresso em desvio padrão (95%) = 1,96 s = Desvio padrão da população
e = Erro do estudo expresso na mesma unidade do desvio padrão
DETERMINAÇÃO DO TAMANHO DA AMOSTRA (n)
n = (z . s /e)2
ESTATÍSTICA
Fórmula para variável quantitativa, desvio desconhecido e população infinita
Sejam: n = Tamanho da Amostra z = Nível de confiança expresso em desvio padrão (95%) = 1,96 s = Desvio padrão de uma amostra previamente selecionada
e = Erro do estudo expresso na mesma unidade do desvio padrão
DETERMINAÇÃO DO TAMANHO DA AMOSTRA (n)
n = (z . s/e)2
ESTATÍSTICA
Fórmula para variável quantitativa, desvio conhecido e população finita
Sejam: n = Tamanho da Amostra z = Nível de confiança expresso em desvio padrão (95%) = 1,96 s = Desvio padrão população
e = Erro do estudo expresso na mesma unidade do desvio padrão N = Tamanho da População
DETERMINAÇÃO DO TAMANHO DA AMOSTRA (n)
n = z2 . s 2 . N z2 . s 2 + e2 . (N-1)
ESTATÍSTICA
Fórmula para variável quantitativa, desvio desconhecido e população finita
Sejam: n = Tamanho da Amostra z = Nível de confiança expresso em desvio padrão (95%) = 1,96 s = Desvio padrão uma amostra previamente selecionada
e = Erro do estudo expresso na mesma unidade do desvio padrão N = Tamanho da população
DETERMINAÇÃO DO TAMANHO DA AMOSTRA (n)
n = z2 . s2 . N z2 . s2 + e2 . (N-1)
ESTATÍSTICA
Populações infinitas com proporção conhecida
DETERMINAÇÃO DO TAMANHO DA AMOSTRA (n)
z2 . p . (1-p)) e2
Onde: n= Tamanho da Amostraz = Nível de confiança expresso em desvio padrão (95%) = 1,96e = Erro Amostral Tolerável expresso em proporção (exemplo: 0,05)p = Proporção do evento na População (prevalência de um evento)
n =
ESTATÍSTICA
Populações finitas com proporção conhecida
DETERMINAÇÃO DO TAMANHO DA AMOSTRA (n)
(N . z2 . p . (1-p)) (e2 . (N-1) + z2 . p . (1-p))
Onde: n = Tamanho da amostra N = Tamanho da População
z = Nível de confiança expresso em desvio padrão (95%) = 1,96e = Erro Amostral Tolerável expresso em proporção (exemplo: 0,05)p = Proporção do evento na População (prevalência de um evento)
n =
ESTATÍSTICA
Relação entre o tamanho da população e o tamanho da amostra
RELAÇÃO ENTRE (n) E (N)
n
N
600
500400300
200100
0
0 500 1000 1500 2000 2500 3000 3500
ESTATÍSTICA
EXERCÍCIOS
1) Determine o tamanho da amostra para uma pesquisa eleitoral em uma cidade com 200.000 eleitores, adotando uma margem de erro de 4 pontos percentuais. Utilize a fórmula genérica.
ESTATÍSTICA
n0 = 1 / (Eo)2 n = (N . n0) / (N + no)
n0 = 1 / (0,04)2
n0 = 625 pessoas
n = (200000 . 625) (200000 + 625)
n = 623,05 pessoas
CALCULANDO ...
Prof. Hubert Chamone Gesser, Dr.
Disciplina de Estatística
Retornar
Tabelas e Gráficos
ESTATÍSTICA
Tabela é a forma não discursiva de apresentar informações, das quais o dado numérico se destaca como informação central.
Uma tabela estatística conterá necessariamente uma série ou uma distribuição de frequência.
Vantagens:- Permitem a síntese dos resultados;- Auxiliam o pesquisador na análise dos dados e- Facilitam a compreensão das conclusões do autor.
TABELAS
ESTATÍSTICA
NORMAS PARA A CONFECÇÃO DE TABELAS
São numeradas consecutivamente com algarismos arábicos;Os números são precedidos da palavra “Tabela”;No topo deve estar o título que indica a natureza e as abrangências geográficas e temporal dos dados numéricos;O centro da tabela é representado por uma série de colunas e subcolunas onde são alocados os dados;No rodapé deve-se colocar a fonte (o responsável pelos dados) e opcionalmente uma nota geral ou uma nota específica;A moldura deve conter no mínimo 3 traços horizontais;Não se deve fechar uma tabela com traços verticais em suas extremidades.
ESTATÍSTICA
CLASSIFICAÇÃO DAS TABELAS
Séries Cronológicas (temporais ou históricas);Variável: Tempo Constantes: Lugar e Espécie
Séries Geográficas (territoriais);Variável: Lugar Constantes: Tempo e Espécie
Séries Especificativas;Variável: Espécie Constantes: Tempo e Lugar
Séries Mistas;Quando há mais de uma variável.
Distribuição de Frequência
ESTATÍSTICA
Séries Cronológicas (Temporais ou Históricas)
Anos Percentual 1999 25,742000 26,852001 27,942002 32,45
Fonte: Hipotética
Tabela 1: Prevalência da Doença X na Cidade Y
ESTATÍSTICA
Séries Geográficas (Territoriais)
Cidades PercentualItajaí 10,44Lages 29,45Florianópolis 8,66Blumenau 9,82
Fonte: Hipotética
Tabela 2: Prevalência da Doença X no Ano de 2010
ESTATÍSTICA
Séries Especificativas
Segmento populacional PercentualCrianças 60,25Jovens 20,72Adulto 2,753a Idade 5,82
Fonte: Hipotética
Tabela 3: Prevalência da Doença X no Ano de 2010 em Florianópolis
ESTATÍSTICA
Séries Mistas (Ex: Especificativa-Cronológica-Geográfica)
Produtos 2009 2010 Fpolis Lages Fpolis Lages
Cosméticos 24,24 9,34 25,95 9.98Vestuário 112,72 27,45 111,75 29,48Audio 86,75 18,45 79,37 19,57Video 1,95 0,85 2,01 0,84
Fonte: Hipotética
Tabela 4: Vendas de alguns produtos por ano e cidade (milhares)
ESTATÍSTICA
Distribuições de Frequência
Pesos Frequência Frequência Acumulada 64 51 51 65 100 151 66 22 173 67 14 187Total 187 -
Fonte: Hipotética
Tabela 5: Distribuição de frequência dos pesos corporais de uma amostra (valores em quilogramas)
ESTATÍSTICA
Gráfico é a forma geométrica de apresentação dos dados e respectivos resultados de sua análise.
A escolha do modelo ideal de representação gráfica depende das preferências e do senso estético do elaborador.
Vantagens: - Permitem a síntese dos resultados; - Auxiliam o pesquisador na análise dos dados e - Facilitam a compreensão das conclusões do autor.
GRÁFICOS
ESTATÍSTICA
NORMAS PARA A CONFECÇÃO DE GRÁFICOS
Deve facilitar a interpretação dos dados para um leigo;Não há a necessidade de se colocar título se estiver na mesma página da tabela correspondente;Há a necessidade de se colocar o título se a tabela correspondente não estiver na mesma página.O senso estético individual determina o espaço do gráfico (L x A);As colunas, barras, linhas e áreas gráficas devem ser ordenadas de modo crescente ou decrescente, mas a ordem cronológica prevalece;
ESTATÍSTICA
ORIGEM DOS GRÁFICOS
O diagrama cartesiano é a figura geométrica que deu origem à técnica de construção de gráficos estatísticos.
Utiliza-se o primeiro quadrante do sistema de eixos coordenados cartesianos ortogonais.
1o QuadranteAbscissas (eixo x)
Ordenadas (eixo y)
Eixo y FrequênciasEixo x Valores da Variável
ESTATÍSTICA
GRÁFICO EM COLUNAS OU DE BARRAS
0
5000
10000
15000
20000
25000
Hemat Bioq Imunol Parasit
Figura 1: Gráfico em colunas do número de exames em um determinado laboratório em 2003.
Tabela 1: Quantidade de exames realizados em um determinado laboratório em 2010.
Exames Quantidade Hematologia 9824 Bioquímica 21534 Imunologia 15432 Parasitologia 4310
Fonte: Hipotética
ESTATÍSTICA
GRÁFICO DE BARRAS HORIZONTAL
0 5000 10000 15000 20000 25000
Hemat
Bioq
Imunol
Parasit
Figura 2: Gráfico em barras horizontais do número de exames realizados em um determinado laboratório no ano de 2003.
Tabela 2: Quantidade de exames realizados em um determinado laboratório em 2010.
Exames Quantidade Hematologia 9824 Bioquímica 21534 Imunologia 15432 Parasitologia 4310
Fonte: Hipotética
ESTATÍSTICA
GRÁFICO DE SETORES OU CIRCULAR
Hemat
Bioq
Imunol
Parasit
Figura 3: Gráfico circular do número de exames realizados em um determinado laboratório no ano de 2003.
Tabela 3: Quantidade de exames realizados em um determinado laboratório em 2010.
Exames Quantidade Hematologia 9824 Bioquímica 21534 Imunologia 15432 Parasitologia 4310
Fonte: Hipotética
ESTATÍSTICA
HISTOGRAMA DE FREQUÊNCIA
0
2
4
6
8
10
12
0 a 2 2 a 4 4 a 6 6 a 8 8 a 10
Figura 4: Histograma das notas dos alunos
Tabela 4: Notas dos alunos na disciplina de Estatística no curso de Administração (ano x)
Notas Frequência
0 2 2
2 4 7
4 6 11
6 8 10
8 10 5
Fonte: Dados Fictícios
ESTATÍSTICA
HISTOGRAMA DE FREQUÊNCIA
5,7
20
31,428,6
14,3
0
5
10
15
20
25
30
35
0 a 2 2 a 4 4 a 6 6 a 8 8 a 10
Figura 5: Histograma dos percentuais das notas dos alunos
• A área do histograma é proporcional à soma das frequências;
• Para comparar duas distribuições, o ideal é utilizar números percentuais;
ESTATÍSTICA
POLÍGONO DE FREQUÊNCIA
28,6
14,3
31,4
5,7
20
0
5
10
15
20
25
30
35
0 0 a 2 2 a 4 4 a 6 6 a 8 8 a 10 11
Figura 6: Polígono de Frequência percentual de das notas dos alunos
• É um Gráfico em Linha de uma distribuição de frequência;
• Para se obter um polígono (linha fechada), deve-se completar a figura, ligando os extremos da linha obtida aos pontos médios da classe anterior à primeira e posterior à última, da distribuição.
ESTATÍSTICA
POLÍGONO DE FREQUÊNCIAS ACUMULADAS
100
85,7
57,1
25,7
5,7
0
20
40
60
80
100
120
0 0 a 2 2 a 4 4 a 6 6 a 8 8 a 10
Figura 7: Polígono de frequências acumuladas das notas dos alunos
Tabela 5: Notas dos alunos na disciplina de estatística no ano x
Notas Frequência F. Acumulada %
0 2 2 5,7
2 4 7 25,7
4 6 11 57,1
6 8 10 85,7
8 10 5 100,0
Fonte: Dados Fictícios
(Sinônimo: Ogiva)
GRÁFICO STEM AND LEAF (TRONCO E FOLHAS)
ESTATÍSTICA
Figura 8: Gráfico Stem-Leaf onde o primeiro dígito é o tronco e o segundo é a folha
13 14 15 1522 23 28 2933 35 36 37 39 3945 4753 57 58 58 5962 63 65 71 72
Conjunto de Dados
Tronco (Stem) Folha (Leaf) 1 3455 2 2389 3 356799 4 57 5 37889 6 235 7 12
GRÁFICO DE BARRAS COM DESVIO PADRÃO
ESTATÍSTICA
Figura 9: Gráfico de barras com os valores médios e o desvio padrão das alturas de estudantes da faculdade x (valores fictícios).
1,551,6
1,651,7
1,751,8
1,851,9
1,95
Medicina Odontologia Farmacia Nutrição
GRÁFICO BOX AND WISKER (Caixa e Fio de Bigode)
ESTATÍSTICA
Figura 10: Gráfico Box and Wisker das alturas dos estudantes de medicina (valores fictícios).
1,95m1,90m1,85m1,80m1,75m1,70m1,65m1,60m1,55m
Valor MáximoPercentil 75
Percentil 50Percentil 25
Valor Mínimo
ESTATÍSTICA
EXERCÍCIOS
1) Construa uma série cronológica com os dados das vendas de um determinado produto de uma empresa fictícia.
Prof. Hubert Chamone Gesser, Dr.
Disciplina de Estatística
Retornar
Correlação
ESTATÍSTICA
DIAGRAMA DE DISPERSÃO
Mostra o comportamento de duas variáveis quantitativas (com dados numéricos).
a aa
b bb
ESTATÍSTICA
CORRELAÇÃO LINEAR POSITIVA
Quando valores pequenos da variável a tendem a estar relacionados com valores pequenos de b, enquanto que valores grandes de a tendem a estar relacionados com valores grandes de b.
a
b
Exemplos:
Peso x AlturaNível socioeconômico x Volume de vendasConsumo de Álcool x Preval. Cirrose Hepática
ESTATÍSTICA
CORRELAÇÃO LINEAR NEGATIVA
Quando valores pequenos da variável a tendem a estar relacionados com valores grandes de b, enquanto que valores grandes de a tendem a estar relacionados com valores pequenos de b.
a
b
Exemplos:
Renda Familiar x Número de FilhosEscolaridade x AbsenteísmoVolume de vendas x Passivo circulante
ESTATÍSTICA
CORRELAÇÃO NÃO LINEAR
O diagrama de dispersão mostra um conjunto de pontos aproximando-se mais de uma parábola do que de uma reta.
aExemplos:
Coef. de Letalidade (a) x Dose do Medicamento (b)
Custo (a) x Lote Econômico de Compra (b)
b
ESTATÍSTICA
COEFICIENTE DE CORRELAÇÃO DE PEARSON
r = n . S (X.Y) - S X . S Y
n . S X2 - (S X)2 . n . S Y2 - (S Y)2
S(X.Y) = Fazem-se os produtos X.Y p/ cada par e depois efetua-se a somaSX = Somatório dos valores da variável XSY = Somatório dos valores da variável YSX2 = Elevam-se ao quadrado cada valor de X e depois efetua-se a somaSY2 = Elevam-se ao quadrado cada valor de Y e depois efetua-se a soma
ESTATÍSTICA
Cálculo do coeficiente de correlação para os dados das variáveis X = população residente e Y = taxa de cresc. populacional, em 12 vilarejos.
X Y X2 Y2 X . Y
101 3,2 10201 10,24 323,2193 4,6 37249 21,16 887,8 . . . . . . . . . .
. . . . .
42 2,8 1764 7,84 117,6 1452 39,3 251538 153,55 5706,2
EXEMPLO
ESTATÍSTICA
r = n . S (X.Y) - S X . S Y
n . S X2 - (S X)2 . n . S Y2 - (S Y)2
r = 12 . 5706,2 - 1452 . 39,3
12 . 251538 - (1452)2 . 12 . 153,55 - (39,3)2
r = 0,69 (Correlação Linear Positiva r > 0)
ESTATÍSTICA
INTERPRETAÇÃO
• O Valor de r (Correlação Linear de Pearson) varia de -1 a +1.• O sinal indica o sentido (correlação positiva ou negativa).• O valor indica a força da correlação (Fraca, Moderada ou Forte)
valor de r
0- 1 + 1
AusênciaFraca FracaModeradaForte ForteModerada
- 0,7 - 0,3 + 0,3 + 0,7
ESTATÍSTICA
1) Coloque V (Verdadeiro ou F (Falso):
( ) Quando o valor de r for maior que 0,7 ou menor que -0,7 a correlação entre as duas variáveis em estudo é forte
( ) O sinal negativo de r indica que as variáveis em estudo são inversamente proporcionais
( ) Ao se encontrar um valor de r = 0,6 não se pode afirmar que as variáveis sejam diretamente proporcionais.
( ) O coeficiente de correlação de Pearson pode ser aplicado em dados nominais
EXERCÍCIO
Fonte Bibliográfica
BARBETA, P. A. Estatística Aplicada às Ciências Sociais. 5.ed. Florianópolis: UFSC, 2006.
DAWSON, B.; TRAPP, R.G. Basic & Clinical Biostatistical. 3.ed. New York: Lange Medical Books/McGraw-Hill, 2006.
LEVIN, J. Estatística Aplicada às Ciências Humanas. 7.ed. São Paulo: Harbra, 2007.
SPIEGEL, M. R. Estatística. 8.ed. São Paulo: Makron Books, 2006.
STEVENSON, W. J. Estatística Aplicada à Administração. São Paulo: Harbra, 2007.
Mensagem Final
O trânsito é um local de
convivência e não de disputas.