exercicio resolvidos
Post on 15-Apr-2017
182 views
Embed Size (px)
TRANSCRIPT
Anlise da Informao Econmica e Empresarial Pg. 1
Caderno de Exerccios Resolvidos
Estatstica Descritiva
Exerccio 1.
A figura seguinte representa, atravs de um polgono integral, a distribuio do rendimento nas famlias dos alunos de duas turmas.
Distribuio do rendimento Frequncias relativas acumuladas
0,000,06
0,34
0,72
0,00
0,26
0,60
0,84
1,00
0,00
0,25
0,50
0,75
1,00
0 100 200 300 400 500 600
Contos/ms
Turma BTurma A
Calcule o ndice de Gini correspondente turma A.
Classes Pmi fi fi*Pmi Fi ti Ti Fi - Ti0-100 50 0,0600 3 0,0600 0,0113 0,0113 0,0487
100 - 200 150 0,2800 42 0,3400 0,1579 0,1692 0,1708200 - 300 250 0,3800 95 0,7200 0,3571 0,5263 0,1937300 - 600 450 0,2800 126 1,0000 0,4737 1,0000 0,0000
Total (mdia aritm.) 266
1,1200 0,4132
0,3690
1
1
n
ii
F
=
=1
1( )
n
i ii
F T
=
=1
11
1
( )n
i ii
n
ii
F T
F
=
=
=
Anlise da Informao Econmica e Empresarial Pg. 2
Exerccio 2.
Considere o quadro seguinte com as frequncias relativas simples associadas s distribuies A, B e C.
Classe A B C
0-50 0 0 0
50-100 30 25 20
100-150 50 40 60
150-200 20 35 20
200-250 0 0 0
a) Represente as distribuies A, B, e C utilizando um histograma. Atravs da anlise das figuras, considera possvel indicar qual a que tem uma moda mais baixa? Em caso
afirmativo, faa-o. Em caso negativo, explicite que elemento(s) lhe falta(m).
0
0,1
0,2
0,3
0,4
0,5
0,6
0 50 100 150 200 250 0
0,1
0,2
0,3
0,4
0,5
0,6
0 50 100 150 200 250 0
0,1
0,2
0,3
0,4
0,5
0,6
0 50 100 150 200 250 Em rigor quando temos dados classificados no sabemos qual , ou se existe a moda. A conveno que se faz a de admitir que a moda se encontra na classe modal e que a sua localizao dentro desta proporcional diferena entre a respectiva frequncia e as frequncias das classes adjacentes, estando a moda mais perto da classe que tem maior frequncia. No caso deste exerccio, verifica-se que a classe modal a mesma nas trs distribuies consideradas. Mas na distribuio A que a classe anterior apresenta a maior frequncia relativamente classe que se segue classe modal. Desta forma claro que essa distribuio A que apresenta a moda mais baixa.
b) Considerando os valores apresentados qual a distribuio cujo valor para a mediana o mais baixo. Justifique utilizando o polgono integral de frequncias.
0,00
0,25
0,50
0,75
1,00
0 50 100 150 200
AB
C
Mediana A =
Anlise da Informao Econmica e Empresarial Pg. 3
A partir da anlise do polgono integral evidente que a distribuio A que tem a mediana mais baixa. Quando as distribuies no so muito assimtricas a moda, a mediana e a mdia esto relativamente prximas. Quando so simtricas as trs medidas coincidem: esse o caso da distribuio C onde a mdia est no centro do intervalo de variao e no centro da classe modal (125). Por outro lado a mdia o centro de gravidade da distribuio e a simples observao dos histogramas representados na alnea anterior permitiria dizer (i) que B tem uma mdia mais alta do que C (porque o peso da classe com valores mais elevados muito superior) e que (ii) a mdia de C necessariamente mais alta do que a mdia de A. Em distribuies regulares como estas a mediana est sempre entre a mdia e a moda. Isso permitiria dizer que tambm no caso da mediana a distribuio A que apresenta o valor mais baixo. Nota: Com base nos elementos fornecidos seria possvel calcular analiticamente o valor da mediana das diversas distribuies mas no era isso que se pedia no enunciado.
c) Compare, apresentando e justificando todos os clculos, a disperso associada s trs distribuies. Na primeira (Distribuio A), a mdia de 120 e o desvio padro de 41,13;
na segunda (Distribuio B), a mdia de 130 e o desvio padro de 39,52.
A comparao da disperso das diversas distribuies deve fazer-se com base no coeficiente de variao. Para isso torna-se necessrio calcular a mdia e o desvio padro da distribuio C:
Classes iPM if .i if PM 2( )i if PM x
50 - 100 75 0,20 15 500 100 - 150 125 0,60 75 0 150 - 200 175 0,20 35 500
Total (mdia aritm.) 125 Total (varincia) 1000 Desvio padro 31,6228
A B C Desvio-padro 41,13 39,52 36,62 Mdia 120 130 125 Coef. Variao 34,3% 30,4% 29,3%
V-se assim que a a distribuio C que apresenta a menor disperso tanto em termos absolutos (desvio padro) como relativos (coeficiente de variao).
Exerccio 3.
Considere o quadro seguinte onde se resume a estrutura etria da populao de uma regio de acordo com os censos de 1960 e 2001
Escalo de idade 1960 2001
0 10 19,7 12
10 25 25,7 24,3
25 40 21,5 21,1
40 60 21,3 23,6
60 80 11,8 19
Total 100 100
Anlise da Informao Econmica e Empresarial Pg. 4
a) Compare as duas distribuies no que respeita mdia e mediana, e discuta at que
ponto h sinais de envelhecimento da populao.
1960
Classes iPM if .i if PM ( )iX PM ( )2iX PM ( )2.i iX PMf iF 0 - 10 5 0,197 0,9850 26,38 695,9044 137,0932 0,197
10 - 25 17,5 0,257 4,4975 13,88 192,6544 49,5122 0,454 25 - 40 32,5 0,215 6,9875 -1,12 1,2544 0,2697 0,669 40 - 60 50 0,213 10,6500 -18,62 346,7044 73,8480 0,882 60 - 80 70 0,118 8,2600 -38,62 1491,5044 175,9975 1,000
1 31,3800 436,7206 Mdia Aritm. 31,38 Varincia 436,7206 Desvio padro 20,90 Coef. Variao 66,6%
2001
Classes iPM if .i if PM ( )iX PM ( )2iX PM ( )2.i iX PMf iF 0 - 10 5 0,120 0,6000 31,81 1011,8761 121,4251 0,120
10 - 25 17,5 0,243 4,2525 19,31 372,8761 90,6089 0,363 25 - 40 32,5 0,211 6,8575 4,31 18,5761 3,9196 0,574 40 - 60 50 0,236 11,8000 -13,19 173,9761 41,0584 0,810 60 - 80 70 0,190 13,3000 -33,19 1101,5761 209,2995 1,000
Total 1 36,8100 9,05 2678,8805 466,3114 Mdia Aritm. 36,81 Varincia 466,3114 Desvio padro 21,59 Coef. Variao 58,7%
Clculo da mediana
11 1
1
0,5.( )gme g g g
g
FX L L L
f
= +
1960 0,5 0,45625 .(40 25)0,215me
X = + = 28,07
2001 0,5 0,36325 .(40 25)0,211me
X = + = 34,74
A mdia e a mediana so medidas de localizao de tendncia central, que descrevem a
distribuio de frequncias. O facto de ambas aumentarem de valor de forma significativa
representa uma deslocao para a direita da distribuio de frequncias que traduz um claro
envelhecimento da populao.
b) Compare a disperso das duas distribuies com base num indicador de disperso relativo.
A medida de disperso relativa mais habitual o coeficiente de variao que relaciona o
desvio padro com a mdia. A importncia da distino entre disperso absoluta e relativa
est bem ilustrada neste exemplo. De facto entre 1960 e 2001 o desvio padro das idades
Anlise da Informao Econmica e Empresarial Pg. 5
passa de 20,9 anos para 22,6 anos (NB: importante notar que o desvio padro se
expressa nas mesmas unidades da varivel original). Mas o aumento da disperso absoluta
no acompanhado pelo aumento da disperso relativa, porque a mdia aritmtica (que
est no denominador do coeficiente de variao) aumenta mais do que o desvio padro. Isto
, relativamente, (ao valor da mdia) verifica-se uma diminuio da disperso das idades: o
C.V passa de 67% para 59% .
Uma medida alternativa de disperso relativa o quociente entre a amplitude do intervalo
interquartil (AIQ) que , em si, uma medida de disperso absoluta e a mediana. Os
clculos que a seguir se apresentam confirmam as concluses anteriores: aumenta a
disperso absoluta e diminui a disperso relativa.
1960
1
0, 25 0,19710 .(25 10) 13,090,257
Q = + = 196030,75 0,66940 .(60 40) 47,61
0,213Q = + =
2001
1
0, 25 0,12010 .(25 10) 18,020,243
Q = + = 200130,75 0,57440 .(60 40) 54,92
0,236Q = + =
Medida de disperso absoluta: Amplitude do intervalo interquartil (AIQ)
1960 1960 19603 1
2001 2001 20013 1
AIQ 47,61 13,09 34,52
AIQ 54,92 18,02 36,02
Q Q
Q Q
= = =
= = =
Medida de disperso relativa: AIQ
Mediana
1960
2001
34,52 1,2328,07
36,02 1,0634,74
me
me
AIQX
AIQX
= =
= =
c) Elabore um polgono integral de frequncias para as duas distribuies e compare a situao a nvel de primeiro, segundo e terceiro quartil, deduzidos graficamente.
O polgono integral de frequncias construdo com base nas frequncias acumuladas, que
esto na ltima coluna dos quadros onde se apresentam os clculos. A sua grande
vantagem permitir uma estimativa rpida dos quartis (incluindo a mediana que o segundo
quartil). Note-se igualmente como a deslocao do polgono para a direita traduz o
envelhecimento da populao. Admitindo que a populao era colocada por ordem de idades
a uma dada percentagem da populao em 1960 corresponde em 2001, uma idade mais
avanada. E isto acontece qualquer que seja a percentagem escolhida como referncia: as
duas curvas nunca se cruzam.
Anlise da Informao Econmica e Empresarial Pg. 6
0
0,25
0,5
0,75
1
0 10 20 30 40 50 60 70 80
19602001
Q11960 Q12001 Q32001Q31960Mediana
2001Mediana
1960
d) Elabore o diagrama