aulas estatística descritiva - unesp
Post on 13-Apr-2018
238 Views
Preview:
TRANSCRIPT
-
7/26/2019 Aulas estatstica descritiva - Unesp
1/115
ANLISE
EXPLORATRIA DEDADOS
-
7/26/2019 Aulas estatstica descritiva - Unesp
2/115
Populao o conjunto de elementos sobreos quais se desejam informaes.
Finitas Infinitas
-
7/26/2019 Aulas estatstica descritiva - Unesp
3/115
AmostraTodo subconjunto de elementosretirados de uma populao, para
obter informaes sobre essapopulao.
Parmetro: Caracterstica Numrica da Populao.
Estatstica:Caracterstica numrica da amostra.
-
7/26/2019 Aulas estatstica descritiva - Unesp
4/115
Censos
Recenseamento:
Quando so coletados dados sobre todosos elementos da populao.
Censo:Conjunto de dados obtidos pelorecenseamento.
-
7/26/2019 Aulas estatstica descritiva - Unesp
5/115
Amostragem
Probabilstica:
Todos os elementos da populao
apresentam probabilidade conhecida, ediferente de zero, de pertencer a amostra.
No probabilstica:So realizadas pela simplicidade ou porimpossibilidade de se obter amostras
probabilsticas.
-
7/26/2019 Aulas estatstica descritiva - Unesp
6/115
Amostragem Probabilstica
Amostragem Casual simples: o equivalente a um sorteio lotrico. Todos oselementos da populao tm igual probabilidade
de pertencer a amostra.
Amostragem Sistemtica:Quando os elementos da populao seapresentam ordenados e a retirada doselementos da amostra feita periodicamente.
-
7/26/2019 Aulas estatstica descritiva - Unesp
7/115
Amostragem Probabilstica
Amostragem por Conglomerado:Quando a populao apresenta subdiviso empequenos grupos, conglomerados, as unidades
de amostragem sero os conglomerados.
Amostragem Estratificada:Quando a populao se subdivide emsubpopulaes ou estratos, a varivel deinteresse apresenta comportamento homogneo
entre os estratos e Heterogneo entre os estratos.
-
7/26/2019 Aulas estatstica descritiva - Unesp
8/115
Amostragem No-Probabilstica
Inacessibilidade a toda a populao:
Populao-objeto:
A que temos em mente ao realizar o trabalhoestatstico.
Populao amostrada:
Parte da populao acessvel para se retirar aamostra.
-
7/26/2019 Aulas estatstica descritiva - Unesp
9/115
Amostragem No-Probabilstica
Amostragem a esmo ou sem norma:Utiliza a aleatoriedade sem realizar o sorteio
Populao formada por materialcontnuo (lquido, gasoso ou slido): feita a homogeneizao do material e retirada a amostraaesmo.
-
7/26/2019 Aulas estatstica descritiva - Unesp
10/115
Amostragem No-Probabilstica
Amostragem Intencionais: feito um pr julgamento e escolhido determinados
elementos considerados bem representativos dapopulao.
Amostragem por Voluntrios
No tem como se escolher os elementos que faro parteda amostra.
-
7/26/2019 Aulas estatstica descritiva - Unesp
11/115
ANLISEEXPLORATRIA DEDADOS
Organizando os Dados
-
7/26/2019 Aulas estatstica descritiva - Unesp
12/115
Organizando os Dados
Dados Brutos:Material obtido na coleta de dados, geralmentedifceis de serem entendidos.
Dados Elaborados:So obtidos aps a organizao do dos dadosbrutos, o material pronto para anlise.
-
7/26/2019 Aulas estatstica descritiva - Unesp
13/115
Organizando os Dados
Apurao dos Dados:
Varivel Nominal ou Ordinal (contagem porcategoria).
Varivel Quantitativa (devem ser anotados todos osvalores observados)
-
7/26/2019 Aulas estatstica descritiva - Unesp
14/115
Organizao das Distribuies
de FrequnciasDados Nominais:
Desempenho Frequncia
Inferior 9
Mdio 14Superior 4
Total 27
-
7/26/2019 Aulas estatstica descritiva - Unesp
15/115
Frequncias
Frequncias Relativas:
Desempenho Frequncia Freqncia Relativa
Inferior 9 33,3 %
Mdio 14 51,9 %
Superior 4 14,8 %
Total 27 100,0 %
-
7/26/2019 Aulas estatstica descritiva - Unesp
16/115
Frequncias
Frequncias Acumuladas:
Escore Frequncia Frequncia Acumulada
0 0 0
1 0 0
2 0 03 2 2
4 12 14
5 26 40
-
7/26/2019 Aulas estatstica descritiva - Unesp
17/115
Frequncias
Frequncias Relativas Acumuladas:
Escore Frequncia FrequnciaRelativa FrequnciaAcumulada Frequncia RelativaAcumulada
0 0 0 % 0 0 %
1 0 0 % 0 0 %
2 0 0 % 0 0 %
3 2 5 % 2 5 %4 12 30 % 14 35 %
5 26 65 % 40 100 %
Total 40 100 % 40 100 %
-
7/26/2019 Aulas estatstica descritiva - Unesp
18/115
Organizao dos dados
Contnuos em Classes7 18 111 25 101 85 81 75 100
95 98 108 100 94 34 99 84 90
95 102 96 105 100 107 117 96 17
7 25 81 90 95 98 100 102 108
17 34 84 94 96 99 100 105 111
18 75 85 95 96 100 101 107 117
-
7/26/2019 Aulas estatstica descritiva - Unesp
19/115
Organizao dos dados
Contnuos em Classesi = raiz n ou i = 1+ 3,3 log n
hi = AT / iClasses Valor Central Frequncia
7 29 18 4
29 51 40 1
51 73 62 0
73 95 84 6
95117 106 16
-
7/26/2019 Aulas estatstica descritiva - Unesp
20/115
ANLISEEXPLORATRIA DEDADOS
Estatstica DescritivaMedidas de PosioMedidas de Disperso
-
7/26/2019 Aulas estatstica descritiva - Unesp
21/115
Tem por objetivo sintetizar a informao contida emum conjunto de dados
Estatstica Descritiva
Utilizamos de determinadas medidas numricasdescritivas que procuram sumariar o conjunto dedados em um nico nmero
Medidas de Posio e Medidas de Disperso
-
7/26/2019 Aulas estatstica descritiva - Unesp
22/115
Grandeza numrica que descreve um conjunto dedados, pela indicao da posio do conjunto naescala de valores possveis que a varivel podeassumir
Medidas de Posio ou de Tendncia Central
Valores tpicos que tendem a se localizar em umponto central do conjunto de dados ordenados
Medidas de Posio:Mdia,Mediana eModa
-
7/26/2019 Aulas estatstica descritiva - Unesp
23/115
a mais conhecida
Mdia
definida como:
Exemplo:
1,69 1,64 1,62 1,69 1,81 1,61 1,58 1,64
-
7/26/2019 Aulas estatstica descritiva - Unesp
24/115
Mdia
1,69 1,64 1,62 1,69 1,81 3,61 1,58 1,64
A mdia altamente influenciada por valores extremos(outliers)
-
7/26/2019 Aulas estatstica descritiva - Unesp
25/115
o valor que divide o conjunto de dados em doissubconjuntos de mesmo nmero de elementos
Mediana
1,69 1,64 1,62 1,69 1,81 1,61 1,58 1,64
o valor que divide a distribuio ao meio
Primeiramente devemos ordenar os valores
Exemplo:
1,58 1,61 1,62 1,64 1,64 1,69 1,69 1,81
-
7/26/2019 Aulas estatstica descritiva - Unesp
26/115
S e n par, somo os valores centrais e divido por 2
Mediana
1,58 1,61 1,62 1,64 1,64 1,69 1,69 1,81
S e n impar, a mediana o valor central
1,58 1,61 1,62 1,64 1,64 1,69 1,69
-
7/26/2019 Aulas estatstica descritiva - Unesp
27/115
A mediana no afetada por outliers
Mediana
1,69 1,64 1,62 1,69 1,81 3,61 1,58 1,64
Ordenando:
1,58 1,62 1,64 1,64 1,69 1,69 1,81 3,61
-
7/26/2019 Aulas estatstica descritiva - Unesp
28/115
Mediana para dados agrupados
1. calcula-se a F;
2. dividir n/2;
3. a F que se igualar ou exceder n/2, ser a classemediana.
-
7/26/2019 Aulas estatstica descritiva - Unesp
29/115
Mediana para dados agrupados com intervalos declasse
h
f
FN
lMed
c
i .2
1
li - limite inferior da classe mediana;
N - nmero de observaes;
F-1 - freq. acum. anterior classe mediana;
fc - freq abs. Simples da classe mediana;
h - amplitude de classe.
-
7/26/2019 Aulas estatstica descritiva - Unesp
30/115
o valor que ocorre com mais frequncia em umconjunto de dados
Moda
1,69 1,64 1,62 1,69 1,81 1,61 1,58
Primeiramente devemos ordenar os valores
Exemplo 1:
1,58 1,61 1,62 1,69 1,69 1,81
Moda para dados simples
-
7/26/2019 Aulas estatstica descritiva - Unesp
31/115
Moda para dados simples
Exemplo 2:
1,58 1,61 1,62 1,62 1,69 1,69 1,81
Exemplo 3:
1,58 1,61 1,62 1,69 1,81
A moda no influenciada por outliers
Amodal
-
7/26/2019 Aulas estatstica descritiva - Unesp
32/115
Moda para dados agrupados
Quando as classes tm amplitudes iguais, a classemodal a que tem a maior freq. absoluta simples.
Salrio f
12 7
14 20
16 33
18 2520 11
22 4
Total 100
Mo= 16
-
7/26/2019 Aulas estatstica descritiva - Unesp
33/115
Moda para dados agrupados com intervalo declasse
li - limite inferior da classe modal;
d1 - diferena entre a freqncia simples da classemodal e a anterior; d2 - diferena entre a freqncia simples da classe
modal e a posterior; h - amplitude de classe.
Moda l d
d dh
i
1
1 2
.
-
7/26/2019 Aulas estatstica descritiva - Unesp
34/115
Moda para dados agrupados com intervalo declasse
Salrio f
140 - 160 7
160 - 180 20
180 - 200 33
200 - 220 25
220 - 240 11
240 - 260 4Total
Mo=?
Moda l d
d d hi
1
1 2.
Mo=192,38
-
7/26/2019 Aulas estatstica descritiva - Unesp
35/115
Quando uma distribuio simtrica, as trsmedidas coincidem
Relao entre a Mdia, Mediana e Moda
-
7/26/2019 Aulas estatstica descritiva - Unesp
36/115
Assimtrica direita
Relao entre a Mdia, Mediana e Moda
Assimtrica esquerda
Quando os valores so diferentes a distribuio assimtrica
-
7/26/2019 Aulas estatstica descritiva - Unesp
37/115
As medidas de posio no informam sobre avariabilidade dos dados e so insuficientes parasintetizar as informaes de um conjunto de dados
Medidas de Disperso
Exemplo:
100 100 100 100 100 100 100
80 90 100 100 100 110 120
10 50 100 100 100 150 190
-
7/26/2019 Aulas estatstica descritiva - Unesp
38/115
uma grandeza numrica que descreve umconjunto de dados pela quantificao davariabilidade ou heterogeneidade neles presente
Medidas de Disperso
Medidas de disperso: Amplitude total, varincia,desvio padro, coeficiente de variao
-
7/26/2019 Aulas estatstica descritiva - Unesp
39/115
a diferena entre o maior e o menor valorobservado
Amplitude Total
1,69 1,64 1,62 1,69 1,81 1,61 1,58 1,64
Primeiramente devemos ordenar os valores
Exemplo:
1,58 1,61 1,62 1,64 1,64 1,69 1,69 1,81
-
7/26/2019 Aulas estatstica descritiva - Unesp
40/115
altamente influenciado por outliers
Amplitude Total
1,58 1,62 1,64 1,64 1,69 1,69 1,81 3,61
-
7/26/2019 Aulas estatstica descritiva - Unesp
41/115
Varincia
Baseia-se nos desvios em relao a mdia
-
7/26/2019 Aulas estatstica descritiva - Unesp
42/115
Varincia
1,69 1,64 1,62 1,69 1,81 1,61 1,58 1,64
Exemplo:
-
7/26/2019 Aulas estatstica descritiva - Unesp
43/115
Varincia para dados agrupados
21
2
1
2)( xfxfxxXVar i
k
i
ii
k
i
i
1
)( 22
2
n
n
fxfx
S
ii
ii
1
)...(...
2
112
1
2
12
n
n
fxfxfxfx
S
nnnn
-
7/26/2019 Aulas estatstica descritiva - Unesp
44/115
Varincia para dados agrupados
1
)...(...
2
112
1
2
12
n
n
fxfxfxfx
Snnnn
(xi) fi
1,58 11,61 1
1,62 1
1,64 21,69 2
1,81 1
Total 81
))1(81,1...)1(58,1(1)81,1(...1)58,1(
222
2
n
nS
0051,02 S
-
7/26/2019 Aulas estatstica descritiva - Unesp
45/115
Varincia para dados agrupados com intervalosde classe
1
))3(172...)4(152(1)172(...4)152(
222
2
n
nS
2
S
i valores xi fi1 150-154 152 4
2 154-158 156 9
3 158-162 160 11
4 162-166 164 85 166-170 168 5
6 170-174 172 3
40
31,79
-
7/26/2019 Aulas estatstica descritiva - Unesp
46/115
Desvio Padro
Sendo a varincia calculada a partir dos quadradosdos desvios, ela um nmero em unidadequadrada
O desvio padro tem utilidade e interpretaoprtica
Exemplo:
-
7/26/2019 Aulas estatstica descritiva - Unesp
47/115
Coeficiente de Variao
A varincia e o desvio padro podem noquantificar em algumas situaes a variabilidadepresente em um conjunto de dados
Exemplo:
50 70 60 80
470 490 460 480
90,12
475
S
x
90,12
65
S
x
-
7/26/2019 Aulas estatstica descritiva - Unesp
48/115
3.2.3. Coeficiente de Variao
O CV uma medida que caracteriza a dispersodos dados em termos relativos a seu valor mdio
1,69 1,64 1,62 1,69 1,81 1,61 1,58 1,64
Exemplo:
-
7/26/2019 Aulas estatstica descritiva - Unesp
49/115
Erro padro da mdia
uma medida que d a preciso com que a mdiapopulacional est sendo estimada.
1,69 1,64 1,62 1,69 1,81 1,61 1,58 1,64
Exemplo:
S
S X n
08606,08
0713,0)( xS
-
7/26/2019 Aulas estatstica descritiva - Unesp
50/115
Coeficiente de Preciso
uma medida mede o grau de preciso do erro padro damdia.
1,69 1,64 1,62 1,69 1,81 1,61 1,58 1,64
Exemplo:
%100.)(
x
SCP
x
%18,5%100.66,1
08606,0CP
-
7/26/2019 Aulas estatstica descritiva - Unesp
51/115
Interpretao Prtica
O erro padro representou apenas 5,18%
do valor mdio, conclu-se que a mdiapopulacional foi estimada com altapreciso, pois o erro relativo (CP) foi muitopequeno.
-
7/26/2019 Aulas estatstica descritiva - Unesp
52/115
40301010
Mdia = 22,50
Mediana (med) = 20
Moda (mo) = 10varincia amostral (s2) = 225
varincia populacional (2) = 168,75
desvio padro amostral (s) = 15
desvio padro populacional () = 12,99
coeficiente de variao (CV%) = 66,67
x
-
7/26/2019 Aulas estatstica descritiva - Unesp
53/115
40301010
Mdia = 32,50Mediana (med) = 30
Moda (mo) = 20
varincia amostral (s2) = 225
varincia populacional (2) = 168,75
desvio padro amostral (s) = 15
desvio padro populacional () = 12,99
coeficiente de variao (CV%) = 46,15
+ 10
50402020
-
7/26/2019 Aulas estatstica descritiva - Unesp
54/115
40301010
Mdia = 45Mediana (med) = 40
Moda (mo) = 20
varincia amostral (s2) = 900
varincia populacional (2) = 675
desvio padro amostral (s) = 30
desvio padro populacional () = 25,98
coeficiente de variao (CV%) = 66,67
x 2
80602020
-
7/26/2019 Aulas estatstica descritiva - Unesp
55/115
40301010
Mdia = 11,25Mediana (med) = 10
Moda (mo) = 5
varincia amostral (s2) = 56,25
varincia populacional (2) = 42,18
desvio padro amostral (s) = 7,5
desvio padro populacional () = 6,49
coeficiente de variao (CV%) = 66,67
/ 2
201555
40301010 + 10 50402020
-
7/26/2019 Aulas estatstica descritiva - Unesp
56/115
40301010
x 2 80602020
+ 10 50402020
Mdia = 22,50
Mediana (med) = 20
Moda (mo) = 10
varincia amostral (s2) = 225
varincia populacional (2) = 168,75
desvio padro amostral (s) = 15
desvio padro populacional () = 12,99
coeficiente de variao (CV%) = 66,67
Mdia = 32,50
Mediana (med) = 30
Moda (mo) = 20
varincia amostral (s2) = 225
varincia populacional (2) = 168,75
desvio padro amostral (s) = 15
desvio padro populacional () = 12,99
coeficiente de variao (CV%) = 46,15
Mdia = 45
Mediana (med) = 40
Moda (mo) = 20varincia amostral (s2) = 900
varincia populacional (2) = 675
desvio padro amostral (s) = 30
desvio padro populacional () = 25,98
coeficiente de variao (CV%) = 66,67
Mdia = 11,25
Mediana (med) = 10
Moda (mo) = 5
varincia amostral (s2) = 56,25
varincia populacional (2) = 42,18
desvio padro amostral (s) = 7,5
desvio padro populacional () = 6,49
coeficiente de variao (CV%) = 66,67
/ 2 201555
-
7/26/2019 Aulas estatstica descritiva - Unesp
57/115
Separatrizes
QUARTIL : Qi
-
7/26/2019 Aulas estatstica descritiva - Unesp
58/115
Q1 Q2=md Q3
0% 75% 100%50%25%
Q1: Primeiro Quartil
Q3: Terceiro Quartil
Q2: Segundo Quartil = Mediana
QUARTIL : Qi
-
7/26/2019 Aulas estatstica descritiva - Unesp
59/115
Distribuio de freqncias em classes :
onde:
lQi : limite inferior da classe que contm o i-simo Quartil
n: tamanho da Amostra
F
-
7/26/2019 Aulas estatstica descritiva - Unesp
60/115
( i)
Divide o conjunto de dados em 10 partes iguais
onde:
lDki: limite inferior da classe que contm o i-simo Decil
n: nmero de elementos do conjunto de dados;
F-Dki: frequncia acumulada das classes anteriores classe que contm o i-simoDecil;
fDki
: freqncia da classe que contm o i-simo Decil;
hDki: amplitude da classe que contm o i-simo Decil.
D1 D50%
ik
ik
ik
iki D
D
D
Dk hf
10
n.
lD
F
k
10% 20% 40%30% 60%50% 80%70% 90% 100%
D4D2 D6 D7 D8 D9D3
D5= mediana
Percentil (Pi)
-
7/26/2019 Aulas estatstica descritiva - Unesp
61/115
( i)
Divide o conjunto de dados em 100 partes iguais
onde:
LPki: limite inferior da classe que contm o i-simo Percentiln: nmero de elementos do conjunto de dados;
F-Pki: frequncia acumulada das classes anteriores classe que contm o i-simoPercentil
fPki: freqncia da classe que contm o i-simo Percentil
hPki: amplitude da classe que contm o i-simo Percentil
P1 P50=md0%
ik
ik
ik
iki P
P
P
Pk h
f
100
nk
LP
F
1% 2% 3% 50% 98%97% 99% 100%
P2 P97 P98 P99P3
-
7/26/2019 Aulas estatstica descritiva - Unesp
62/115
Medidas de forma
Uma distribuio de freqncia podesimtrica, assimtrica positiva ou
assimtrica negativa.
Medidas de assimetria:
Denomina-se assimetria o grau de desvio ouafastamento da simetria de uma distribuio.
-
7/26/2019 Aulas estatstica descritiva - Unesp
63/115
Medidas de forma
Uma distribuio simtrica apresenta a igualdade entre as
trs medidas de posio, mdia aritmtica, mediana emodo, ou:xx~M
o
xx
~
Mo
Em uma distribuio assimtrica positiva, ou assimtrica direita, tem-se que:
Em uma distribuio assimtrica negativa, ou assimtrica esquerda, tem-se que:
oMx~x
Medidas de assimetria:
-
7/26/2019 Aulas estatstica descritiva - Unesp
64/115
Medidas de forma
Existem vrias frmulas para o clculo do coeficiente deassimetria, dentre elas duas so bastante utilizadas:
- 1 Coeficiente de Pearson:s
MxASou
MxAS
oo
- 2 Coeficiente de Pearson:13
31
QQ
x~2QQAS
Se AS = 0, a distribuio simtrica
AS > 0, a distribuio assimtrica positivaAS < 0. a distribuio assimtrica negativa.
Medidas de assimetria:
-
7/26/2019 Aulas estatstica descritiva - Unesp
65/115
Medidas de forma
Exemplo: Identificar o grau de assimetria dadistribuio:
Medidas de assimetria:
Salrios
($1.000,00)
30 50 50 100 100 150
Empregados 80 50 30
-
7/26/2019 Aulas estatstica descritiva - Unesp
66/115
Medidas de forma
Exemplo:
Medidas de assimetria:
Classes xi f
i x
ifi x
i2fi F
i
[30,50[
[50,100[
[100,150[
40
75
125
80
50
30
3200
3750
3750
128000
281250
468750
80
130
160
160 10.700 878000 -
-
7/26/2019 Aulas estatstica descritiva - Unesp
67/115
11/09/2013 08:52
Medidas de forma
Exemplo:Medidas de assimetria:
6,04090
29040
QQ
x~2QQ
AS96,31s
796,096,31
429,4185,66
s
MxAS62,1021
160
)700.10(000.878
159
1s
502080
)080(30x~429,4120
34
430M
905050
)80120(50Q62,1021160
)700.10(000.8781591s
402080
)040(30Q875,66
160
700.10x
13
31
o
2
2
o
3
2
2
1
- Como AS > 0, ento a distribuio assimtricapositiva.
-
7/26/2019 Aulas estatstica descritiva - Unesp
68/115
Medidas de forma
Denomina-se curtose o grau de achatamentode uma distribuio.
Uma distribuio de freqncia pode ser:- Mesocrtica: quando sua forma nem
achatada e nem delgada;
- Leptocrtica: quando apresenta a formadelgada;
- Platicrdica: quando apresenta a formaachatada.
Medidas de curtose:
-
7/26/2019 Aulas estatstica descritiva - Unesp
69/115
Medidas de forma
Medidas de curtose:
-
7/26/2019 Aulas estatstica descritiva - Unesp
70/115
Medidas de forma
Para medir o o grau de curtose utiliza-se o coeficiente:
)PP(2
QQK
1090
13
onde Q3= 3 quartil; P90= 90 percentil;Q1= 1 quartil; P10= 10 percentil.
SeK = 0,263a curva correspondente distribuio mesocrtica;
K > 0,263a curva platicrdica;K < 0,263a curva leptocrdica.
Medidas de curtose:
-
7/26/2019 Aulas estatstica descritiva - Unesp
71/115
Medidas de forma
Exemplo: Para a mesma distribuio do exemplo daassimetria, calcula-se ainda P10eP90; logo:
Medidas de curtose:
355,0)34375,104(2
4090
)PP(2
QQK
375,10450160
)130144(100P
342080
)016(30P
1090
13
90
10
- Como K > 0,263, ento a distribuio do tipoplaticrtica.
TABELAS
-
7/26/2019 Aulas estatstica descritiva - Unesp
72/115
TABELA ou SRIES:
um quadro que resume um conjunto de observaes.Exemplo:
PRODUO DE CAFBRASIL1991-1995
ANOS PRODUO(1.000 t)
1991 2.5351992 2.6661993 2.1221994 3.7501995 2.007
TTULO
CABEALHO
COLUNANUMRICA
CASA OU CLULA
LINHAS
FONTE: IBGE.
CORPO
COLUNAINDICADORA
RODAP
CABEALHO
-
7/26/2019 Aulas estatstica descritiva - Unesp
73/115
PRINCIP IS TIPOS
DE
T BEL S ou SRIES
-
7/26/2019 Aulas estatstica descritiva - Unesp
74/115
TABELAS OU SRIES HISTRICAS,CRONOLGICAS OU TEMPORAIS.
Descrevem os valores da varivel, em determinado local,discriminados segundo intervalos de tempo variveis.
Exemplo:
-
7/26/2019 Aulas estatstica descritiva - Unesp
75/115
SRIES GEOGRFICAS, ESPACIAIS,TERRITORIAIS.
Descrevem os valores da varivel, em determinado instante,discriminados segundo regies.
Exemplo:
SRIES ESPECFICAS
-
7/26/2019 Aulas estatstica descritiva - Unesp
76/115
SRIES ESPECFICAS
Descrevem os valores da varivel, em determinado tempo e
local, discriminados segundo especificaes ou categorias.Exemplo:
-
7/26/2019 Aulas estatstica descritiva - Unesp
77/115
SRIES CONJUGADAS OU TABELA DE DUPLAENTRADA
Muitas vezes temos necessidade de apresentar, em umanica tabela, a variao de valores de mais uma varivel, isto, fazer uma conjugao de duas ou mais tabelas.
Exemplo:
DISTRIBUIO DE FREQUNCIA
-
7/26/2019 Aulas estatstica descritiva - Unesp
78/115
DISTRIBUIO DE FREQUNCIAPara variveis qualitativas: Sua distribuio usa diviso decategorias para melhorar a visualizao da distribuio de dados.
Para variveis quantitativas: Suaconstruo usa faixa de dados em
intervalos de classe que aumentama informao visual na distribuiode freqncias.Exemplo:
-
7/26/2019 Aulas estatstica descritiva - Unesp
79/115
GRFICOS
-
7/26/2019 Aulas estatstica descritiva - Unesp
80/115
GRFICO EM LINHA
0
10
20
30
40
5060
70
80
90
100
1 Trim 2 Trim 3 Trim 4 Trim
-
7/26/2019 Aulas estatstica descritiva - Unesp
81/115
GRFICO EM COLUNAS OU EM BARRAS SIMPLES
010
20
30
40
50
60
70
80
90
1 Trim 2 Trim 3 Trim 4 Trim
-
7/26/2019 Aulas estatstica descritiva - Unesp
82/115
GRFICO EM COLUNAS OU EM BARRAS MLTIPLAS
0
10
20
30
40
50
60
70
80
90
1 Trim 2 Trim 3 Trim 4 Trim
Leste
Oeste
Norte
-
7/26/2019 Aulas estatstica descritiva - Unesp
83/115
GRFICO EM SETORES
Leste
Oeste
Norte
-
7/26/2019 Aulas estatstica descritiva - Unesp
84/115
CARTOGRAMA
-
7/26/2019 Aulas estatstica descritiva - Unesp
85/115
PICTOGRAMA
HISTOGRAMA:
-
7/26/2019 Aulas estatstica descritiva - Unesp
86/115
HISTOGRAMA:
formado por um conjunto de retngulos justapostos, cujas
bases se localizam sobre o eixo horizontal, de tal modo queseus pontos mdios coincidam com os pontos mdios dosintervalos de classe.
POLGONO DE FREQNCIA:
-
7/26/2019 Aulas estatstica descritiva - Unesp
87/115
POLGONO DE FREQNCIA:
um grfico em linhas, sendo as freqncias marcadas sobre
perpendiculares ao eixo horizontal, levantadas pelos pontosmdios dos intervalos de classe.
POLGONO DE FREQNCIA ACUMULADA:
-
7/26/2019 Aulas estatstica descritiva - Unesp
88/115
POLGONO DE FREQNCIA ACUMULADA:
traado marcando-se as freqncias acumuladas sobre
perpendiculares ao eixo horizontal, levantadas nos pontoscorrespondentes aos limites superiores dos intervalos declasse.
O t A t G fi d D d
-
7/26/2019 Aulas estatstica descritiva - Unesp
89/115
Diagrama de pontos
Um diagrama de pontos um grfico estatstico que consisteem grupos de pontos de dados traados em uma escalasimples.
So utilizados para dados contnuos, quantitativos eunivariados, e so muito teis para exibir um pequenoconjunto de dados.
Esse tipo de grfico permite uma fcil visualizao de duascaractersticas dos dados: a posio (meio) e a disperso(espalhamento ou variabilidade)
Outras Apresentaes Grficas de Dados
O tras Apresentaes Grficas de Dados
-
7/26/2019 Aulas estatstica descritiva - Unesp
90/115
Diagrama de pontos
Exemplo 01 (Montgomery, 2004, p.2-3): Um engenheiro estprojetando um conector de nilon para ser usado em aplicaoautomotiva. Ele considera estabelecer como especificao do
projeto uma espessura de 3/32 pol., mas est inseguro. Oitounidades do prottipo so produzidas e suas foras de remooso medidas, resultando nos seguintes dados (em libras): 12,6;12,9; 13,4; 12,3; 13,6; 13,5; 12,6 e 13,1. Construa umdiagrama de pontos para esses dados.
Outras Apresentaes Grficas de Dados
Outras Apresentaes Grficas de Dados
-
7/26/2019 Aulas estatstica descritiva - Unesp
91/115
Diagrama de caixa (box plot)
Outras Apresentaes Grficas de Dados
Uma outra forma grfica de apresentar os dados o chamadodiagrama de caixa (box plot) ou diagrama de caixa e linhas(box and whiskers), que permite descrever simultaneamente
vrios fatores importantes de uma srie de dados, tais como atendncia central (mdia ou mediana), a disperso (desvio-padro), a possibilidade de detectar outliers (pontos bastantediferentes do conjunto de dados) e o desvio da simetria.
Um diagrama de caixa apresenta trs quartis, em uma caixaretangular, alinhados tanto horizontal como verticalmente;opcionalmente, pode apresentar a mdia.
Diagrama de caixa (box plot)
-
7/26/2019 Aulas estatstica descritiva - Unesp
92/115
Diagrama de caixa (box plot)
A caixa inclui a amplitude interquartil, com o canto esquerdo(ou inferior) no primeiro quartil, Q1, e o canto direito (ousuperior) no terceiro quartil, Q3. Portanto, o comprimento dacaixa igual a amplitude interquartil , DQ= Q3 - Q1.
Uma linha desenhada atravs da caixa, no segundo quartil
(que o percentil 50 ou a mediana), Q2. A mdia, como jdito, opcional.
Uma linha (whisker) estende-se de cada extremidade da caixa.
A linha inferior (ou esquerda) comea no primeiro quartil indoat o menor valor do conjunto de pontos dentro das amplitudesinterquartis de 1,5, a partir do primeiro quartil.
Outras Apresentaes Grficas de Dados
-
7/26/2019 Aulas estatstica descritiva - Unesp
93/115
Diagrama de caixa (box plot)
Outras Apresentaes Grficas de Dados
A linha superior (ou direita) comea no terceiro quartil indoat o maior do conjunto de pontos dentro das amplitudesinterquartis de 1,5, a partir do terceiro quartil.
Dados mais afastados dos que as linhas so plotados comopontos individuais. Um ponto alm da linha, porm a menosde 3 amplitudes interquartis a partir da extremidade da caixa, chamado de dispersos (outliers).
Um ponto a mais de 3 amplitudes interquartis a partir daextremidade da caixa chamado de um outlier extremo.Ocasionalmente, smbolos diferentes (crculos abertos efechados, por exemplo) so usados para identificar os doistipos de outlier.
Outras Apresentaes Grficas de Dados
-
7/26/2019 Aulas estatstica descritiva - Unesp
94/115
Diagrama de caixa (box plot)
Outras Apresentaes Grficas de Dados
Outras Apresentaes Grficas de Dados
-
7/26/2019 Aulas estatstica descritiva - Unesp
95/115
Diagrama de caixa (box plot)
Outras Apresentaes Grficas de Dados
Exerccio: Represente o diagrama de caixa para os dados daresistncia compresso do alumnio mostrados no exerccioanterior.
N = 80Min = 76Max = 245Mdia = 162,7Mediana = 161,5
Q1= 143,50Q3= 181,00
-
7/26/2019 Aulas estatstica descritiva - Unesp
96/115
Anlise Bidimensional
Anlise Bidimensional
-
7/26/2019 Aulas estatstica descritiva - Unesp
97/115
Anlise Bidimensional
Freqentemente estamos interessados em analisar duasvariveis conjuntamente.
Quando consideramos duas variveis, podemos ter 3
situaes e as tcnicas de anlise so diferentes.a) as duas qualitativas (tabela de contingncia)
b) as duas quantitativas (grficos de disperso)
c) uma qualitativa e outra quantitativa (tabela decontingncia)
possvel quantificar a relao entre as variveis emestudo
Variveis Qualitativas
-
7/26/2019 Aulas estatstica descritiva - Unesp
98/115
Variveis Qualitativas
Analisamos o comportamento conjunto de:
X: grau de instruo e
Y: regio de procedncia.
Tabela 1- Tabela de freqncias absolutas das variveis X e Y
Tabela de dupla entrada
Y\XEnsino
Fundamental Ensino Mdio Superior Total
Capital 4 5 2 11
Interior 3 7 2 12
Outra 5 6 2 13
Total 12 18 6 36
Podemos construir tabelas de freqncias relativas.
-
7/26/2019 Aulas estatstica descritiva - Unesp
99/115
Y\XEnsino
Fundamental Ensino Mdio Superior Total
Capital 11% 14% 6% 31%
Interior 8% 19% 6% 33%
Outra 14% 17% 6% 36%
Total 33% 50% 17% 100%
Tabela 1 - Tabela de freqncias relativas ao total geral das variveisX e Y
Relativa ao total geral
11% dos empregados vm da capital e tem ensino fundamental.
31% dos indivduos vm da capital, 33% do interior e 36% de outrasregies.
33% tem ensino fundamental.
Existe vrias possibilidades de construo e depende do objetivo doproblema.
Relativa ao total de colunas
-
7/26/2019 Aulas estatstica descritiva - Unesp
100/115
Tabela 1:Tabela de freqncias relativas ao total de coluna das
variveis X e Y
Relativa ao total de colunas
Entre os empregados com instruo at o ensino fundamental, 33%vm da capital.
Entre os empregados com ensino mdio, 28% vm da capital.Comparamos a distribuio da procedncia conforme o grau deinstruo.
De modo anlogo, podemos construir a distribuio do grau deinstruo conforme a procedncia.!!!
Y\XEnsino
Fundamental Ensino Mdio Superior Total
Capital 33% 28% 33% 31%
Interior 25% 39% 33% 33%
Outra 42% 33% 33% 36%
Total 100% 100% 100% 100%
G fi 1 Di ib i d i d d i d
-
7/26/2019 Aulas estatstica descritiva - Unesp
101/115
0%
10%
20%
30%
40%50%
60%
70%
80%
90%
100%
Ensino
Fundamental
Ensino Mdio Superior Total
Outra
Interior
Capital
Grfico 1- Distribuio da regio de procedncia por grau deinstruo
Associao entre variveis qualitativas
-
7/26/2019 Aulas estatstica descritiva - Unesp
102/115
Exemplo: Queremos verificar se existe ou no associao entre o sexo(X) e a carreira escolhida (Y) por 200 alunos de agronomia e zootecnia.
Y\X Masculino Feminino Total
Agronomia 85 (61%) 35 (58%) 120 (60%)
Zootecnia 55 (39%) 25 (42%) 80 (40%)
Total 140 (100%) 60 (100%) 200 (100%)
Tabela 4:Tabela de freqncias absolutas (relativas) dos alunos segundo osexo (X) e curso escolhido (Y)
Independente do sexo 60% preferem agronomia e 40% preferemzootecnia.
No sexo masculino essas propores so 61% e 39% e no feminino 58e 42%, as quais so prximas de 60 e 40 (marginais)
Forte indcio de no haver dependncia entre as variveis sexo e curso(no associadas)
Exemplo: Queremos verificar se existe ou no associao entre o sexo (X) e
-
7/26/2019 Aulas estatstica descritiva - Unesp
103/115
Exemplo: Queremos verificar se existe ou no associao entre o sexo (X) ea carreira escolhida (Y) por 200 alunos de Agronomia e Zootecnia.
Tabela 5:Tabela de freqncias absolutas (relativas) dos alunos segundo osexo (X) e curso escolhido (Y)
Independente do sexo 60% preferem Agronomia e 40% preferem
Zootecnia.No sexo masculino essas propores so 71% e 29% e no feminino 33e 67%. Disparidade bem acentuada nas propores
Forte indcio de haver dependncia entre as variveis sexo e curso(associadas)
Y\X Masculino Feminino Total
Agronomia 100 (71%) 20 (33%) 120 (60%)Zootecnia 40 (29%) 40 (67%) 80 (40%)
Total 140 (100%) 60 (100%) 200 (100%)
Exemplo: Queremos verificar se a criao de determinado tipo de
-
7/26/2019 Aulas estatstica descritiva - Unesp
104/115
cooperativa est associada com algum fator regional.
Tabela Valores observados do total de Cooperativas autorizadas afuncional por tipo e estado pesquisado.
Estado Consumidor Produtor Escola Outras
So Paulo 214 (33%) 237(37%) 78 (12%) 119 (18%) 648(100%)
Paran 51(17%) 102(34%) 126(42%) 22 (7%) 301(100%)
Rio G. do Sul 111 (18%) 304(51%) 139(23%) 48(8%) 602(100%)
Total 376(24%) 643 (42%) 343 (22%) 189 (12%) 1551(100%)
Tipo de Cooperativa
Total
Notamos que existe certa associao entre as variveis.
- Valor observado:
Sem associao:
-
7/26/2019 Aulas estatstica descritiva - Unesp
105/115
Tabela - Valores esperados assumindo independncia entre asvariveis tipo de cooperativa e fator regional.
Estado Consumidor Produtor Escola Outras
So Paulo 156 (24%) 272(42%) 142 (22%) 78 (12%) 648(100%)
Paran 72(24%) 127(42%) 66(22%) 36 (12%) 301(100%)
Rio G. do Sul 144 (24%) 254(42%) 132(22%) 72(12%) 602(100%)Total 376(24%) 643 (42%) 343 (22%) 189 (12%) 1551(100%)
Tipo de Cooperativa
Total
Por exemplo: caso no houvesse associao, e, fosse esperado quecada estado tivesse 24% de escolas e 12% de outros tipos.
Assim, o nmero esperado de cooperativas de consumidores noestado de So Paulo seria 648*0.24=156 e no Paran 301*0.24=72....
A tabela com os valores esperados ficaria assim:
-
7/26/2019 Aulas estatstica descritiva - Unesp
106/115
Tabela B:Valores esperados assumindo independncia entre asvariveis tipo de cooperativa e fator regional
Notamos fortes discrepncias entre os valores observados (O), eesperados (E) assumindo que as variveis no fossem associadas.
Estado Consumidor Produtor Escola Outras
So Paulo 156 (24%) 272(42%) 142 (22%) 78 (12%) 648(100%)
Paran 72(24%) 127(42%) 66(22%) 36 (12%) 301(100%)
Rio G. do Sul 144 (24%) 254(42%) 132(22%) 72(12%) 602(100%)Total 376(24%) 643 (42%) 343 (22%) 189 (12%) 1551(100%)
Tipo de Cooperativa
Total
Tabela A: Valor observado das Cooperativas autorizadas a funcionalpor tipo e estado.
Estado Consumidor Produtor Escola Outras
So Paulo 214 (33%) 237(37%) 78 (12%) 119 (18%) 648(100%)
Paran 51(17%) 102(34%) 126(42%) 22 (7%) 301(100%)
Rio G. do Sul 111 (18%) 304(51%) 139(23%) 48(8%) 602(100%)
Total 376(24%) 643 (42%) 343 (22%) 189 (12%) 1551(100%)
Tipo de CooperativaTotal
Consumidor Produtor Escola Outras
156 (24%) 272(42%) 142 (22%) 78 (12%)
Tipo de Cooperativa
Estado Consumidor Produtor Escola Outras
So Paulo 214 (33%) 237(37%) 78 (12%) 119 (18%)
Tipo de Cooperativa
-
7/26/2019 Aulas estatstica descritiva - Unesp
107/115
Uma medida de afastamento global pode ser dada pela soma de todasessas medidas. (Qui-quadrado de Pearson)
Um valor grande de indica associao entre as variveis. No exemploacima temos:
( ) ( ) ( ) ( )
72(24%) 127(42%) 66(22%) 36 (12%)
144 (24%) 254(42%) 132(22%) 72(12%)
376(24%) 643 (42%) 343 (22%) 189 (12%)
Filas
j
ijijij
Colunas
i
EEO1
2
1
2 /)(
2
2
24,17372/)7248(...156/)156214( 222
( ) ( ) ( ) ( )
Paran 51(17%) 102(34%) 126(42%) 22 (7%)
Rio G. do Sul 111 (18%) 304(51%) 139(23%) 48(8%)
Total 376(24%) 643 (42%) 343 (22%) 189 (12%)
O nmero de GL em tabelas assim calculado:
-
7/26/2019 Aulas estatstica descritiva - Unesp
108/115
GL = (nmero de linhas -1) x (nmero de colunas -1).
Portanto:GL = (3 - 1) x (4 - 1) = 6Depois, consulta-se a tabela de Qui quadrado e verifica-se que
= 20,51.
Como o valor de obtido maior conclui-se que os desvios sosignificativos. Portanto, os quatro tipos de cooperativas sofreminfluncia dos diferentes estados. Assim sendo, a proporo decooperativas por grupo depende dos estados onde elas seencontram.
2
C
2
C
Associao entre variveis quantitativas
-
7/26/2019 Aulas estatstica descritiva - Unesp
109/115
Quando as duas variveis so quantitativas podemos usar o mesmotipo de anlise para variveis qualitativas. (transformando as variveis)
Uma ferramenta bastante til o grfico de disperso.Exemplo:
Anos de Servio (X) Nmero de Clientes (Y)
1 48
2 50
3 56
4 52
5 43
6 60
7 62
8 58
9 64
10 72
Tabela 8: Nmero de anos de servio (X) por nmero de clientes (Y)de agentes de uma companhia de seguros
Notamos que medida que aumenta o tempo de servio, aumenta onmero de clientes, logo parece haver uma associao entre essasvariveis
Grfico 2: Grfico de disperso para as variveis X: anos de
-
7/26/2019 Aulas estatstica descritiva - Unesp
110/115
0
10
20
30
40
50
60
7080
0 2 4 6 8 10 12
Anos de Servio
NmerodeCleintes
Grfico 2: Grfico de disperso para as variveis X: anos deservio e Y: nmero de clientes
0
5
10
15
20
25
0 2 4 6 8 10 12 -12
-10
-8
-6
-4
-2
0
2
4
6
8
10
0 2 4 6 8 10 12
Grfico 3: Tipos de associaes entre duas variveis
-
7/26/2019 Aulas estatstica descritiva - Unesp
111/115
Coeficiente de correlao
Em um conjunto de dados com n pares de valores para as variveisX e Y o coeficiente de correlao (r) que mede a dependncialinear entre elas calculado como:
n
i
n
i
iiii
n
i
iiii
n
i
n
i
iiii
n
i
iiii
XY
ynyxnx
yxnyx
yyxx
yyxx
r
1 1
22
1
1 1
22
1
](][[
)(
])(][)([
))((Propriedades
-
7/26/2019 Aulas estatstica descritiva - Unesp
112/115
Simplificando:
Os valores de r variam de 1 a +1
-
7/26/2019 Aulas estatstica descritiva - Unesp
113/115
Se r = +1 correlao perfeita e positivaSe r = -1correlao perfeita e negativa
Se r = 0no h correlao linear
Se r + 0,9correlao alta e positivaSe r + 0,5correlao mdia e positiva
Se r + 0,1correlao baixa e positiva
Se r - 0,1 correlao baixa e negativaSe r - 0,5 correlao mdia e negativa
Se r - 0,9 correlao alta e negativa
Os valores de r variam de 1 a +1
-
7/26/2019 Aulas estatstica descritiva - Unesp
114/115
Anos de Servio (X) Nmero de Clientes (Y)
-
7/26/2019 Aulas estatstica descritiva - Unesp
115/115
1 48
2 50
3 56
4 52
5 43
6 60
7 62
8 58
9 64
10 72
top related