mad114r6.ppt
Post on 02-Mar-2018
217 Views
Preview:
TRANSCRIPT
-
7/26/2019 mad114r6.ppt
1/48
R - LIG-06
Anlise
Exploratria deDados - 2006
-
7/26/2019 mad114r6.ppt
2/48
Objetivos da aula Apresentar um mtodo para a determinao
aproximada de quantis para dados no-agrupados e usar a funo quantiledoR;
definir o esquema dos cinco nmeros eapresentar e construir um boxplot(grfico-caixa) de um conjunto de dados.
-
7/26/2019 mad114r6.ppt
3/48
Determinao dos quantisusando o R A funo apropriada do R para obter os quantis
de um etor numricox a funo quantile. !ex o etor contendo os dados" e desejamos
determinar os tr#s quartis" pedimosquantile(x,c(0.25,0.5,0.75)) !e desejamos o quinto e o nonagsimo-quinto
percentis" pedimos quantile(x,c(0.05,0.95))
$m gera%"q(p)quantile(x,p), que retorna oquanti% de ordem p dos dados em x.
-
7/26/2019 mad114r6.ppt
4/48
-
7/26/2019 mad114r6.ppt
5/48
Exemplo 1: Emisso de
Dixido de Carbono &s dados no arquio dados13bm.txtfornecem emiss'es de dixido de carbonoper capita" para uma amostra de *+
pa,ses. &s dados so do ano de /. 0onte1 Stabilizing The Atmosphere:
Population !onsumption and "reenhouse"ases.
-
7/26/2019 mad114r6.ppt
6/48
Exemplo 1: Emisso de
Dixido de Carbono (cont.) 2etermine os tr#s quartis" os decis" amdia e o desio-padro das emiss'esregistradas para os *+ pa,ses em /.
-
7/26/2019 mad114r6.ppt
7/48
Exemplo 1: Emisso de
Dixido de Carbono (cont.) dados
-
7/26/2019 mad114r6.ppt
8/48
Histograma das emisses
&bsere que a distribuio defreq9#ncias de dados sobre emissoapresenta forte assimetria positia
&bsere tambm que : umac%asse sem representantes nessadistribuio
-
7/26/2019 mad114r6.ppt
9/48
Histograma das emisses:sugerindo 10 interalos:
(0!0.""!0.#$!1!1.""!1.#$!%!"!&!#!10)
-
7/26/2019 mad114r6.ppt
10/48
&bsere que nessa figura tem-se+-
-
7/26/2019 mad114r6.ppt
11/48
Dados no'agrupados: clculoaproximado dos uantis =asso 1 &rdene a amostra de modo a ter as
estat,sticas de ordem1
)()2()1( ... nxxx
nin
ippx iii ,...,1,
5.0com),,( )( =
=
Considere os pontos da forma:
-
7/26/2019 mad114r6.ppt
12/48
*or exemplo! se n+%0i pi
1 0.025
2 0.075
3 0.1254 0.175
5 0.225
6 0.275
7 0.325
8 0.375
9 0.425
10 0.475
11 0.525
12 0.575
13 0.625
14 0.675
15 0.725
16 0.775
17 0.825
18 0.875
19 0.925
20 0.975
nin
ip
i,...,1,
5.0 =
=
-
7/26/2019 mad114r6.ppt
13/48
Dados no'agrupados
(cont.)1+
-
7/26/2019 mad114r6.ppt
14/48
Exemplo >onsidere noamente obter uma aproximao do terceiro quarti%. &bsere que
.54quetal757,072
5.05575.0
72
5.054743,0 =
-
7/26/2019 mad114r6.ppt
15/48
Esuema dos cinco
n,meros ? uma %ista de informa'es da distribuioque inc%ui cinco medidas" a saber" x(-)" "+" 7 e x(n).
$stes cinco a%ores so importantes parase ter uma boa idia da assimetria dosdados.
-
7/26/2019 mad114r6.ppt
16/48
Esuema dos cinco
n,meros =ara uma distribuio simtrica ouaproximadamente simtrica" deer,amoster1 (a) +- x(-) x(n)-+;
(b) +- 7-+;(c) - x(-) x(n)-7;(d) dist@ncias entre mediana e "
mediana e 7 menores do que dist@ncias
entre os extremos e " 7.
-
7/26/2019 mad114r6.ppt
17/48
istograma a%isadode uma distribuiosimtrica unimoda%
-
7/26/2019 mad114r6.ppt
18/48
Comandos summary() e fvenum()
& Rpossui uma funo que retorna asinforma'es do esquema dos cinconmeros1 -ienum(x)" sex o etor que
contm os dados. $xemp%o1 -ienum(dados#emissao)
/10 %.%%% %.%*' %.1' 1.,' +.%m,nimo mximo + 7
-
7/26/2019 mad114r6.ppt
19/48
Comandos summary() e fvenum()
summar(dados#emissao) Bin. st u. Bedian Bean 7rd u. Bax. 4.4444 4.45*/ 4.6/4 .*64 .6*74 8.6644
& comando summar(x) quandox umetor numrico" produC as informa'es doesquema dos cinco nmeros e a mdia.
-
7/26/2019 mad114r6.ppt
20/48
Desen-o Esuemtico (Box Plots)
A informao contida no esquema doscinco nmeros pode ser traduCidagraficamente num diagrama" con:ecido
como box plot (tamb2m $hamado degr-i$o4$aixa). A figura a seguir" i%ustra o boxplot.
-
7/26/2019 mad114r6.ppt
21/48
-
7/26/2019 mad114r6.ppt
22/48
Boxplot & ret@ngu%o no boxplot traado de ta%
maneira que suas bases t#m a%turascorrespondentes aos primeiro e terceiro
quartis da distribuio. & ret@ngu%o cortado por um segmento
para%e%o Ds bases" na a%turacorrespondente ao segundo quarti%.
Assim" o ret@ngu%o do boxplotcorrepondeaos /43 a%ores centrais da distribuio.
-
7/26/2019 mad114r6.ppt
23/48
-
7/26/2019 mad114r6.ppt
24/48
Cosntruindo o boxplot 2epois de desen:ado o ret@ngu%o" traa-se
um segmento para%e%o ao eixo" partindo doponto mdio da base superior do ret@ngu%o
at o maior a%or obserado que EF&supera o a%or de 7G("/)2$. & mesmo feito a partir do ponto mdio
da base inferior do ret@ngu%o" at o menor
a%or que EF& menor do que -("/)2$.
-
7/26/2019 mad114r6.ppt
25/48
-
7/26/2019 mad114r6.ppt
26/48
ec-ando o boxplot As obsera'es que estierem acima de
7G("/)2$ ou abaixo de -("/)2$so c:amadas pontos exteriores e
representadas por asteriscos. $ssa obsera'es destoantes das demais
podem ser o que c:amamos de outliersoua%ores at,picos.
-
7/26/2019 mad114r6.ppt
27/48
-
7/26/2019 mad114r6.ppt
28/48
-
7/26/2019 mad114r6.ppt
29/48
/bseraes Eo necessariamente
:aer a presena depontos exteriores numboxplot.
uando for este ocaso" o esquema tera seguinte apar#ncia1
-
7/26/2019 mad114r6.ppt
30/48
2uno boxplotnoR $xperimente pedir ao Rpara construir um
boxp%ot dos dados sobre emiss'es dedixido de carbono1
boxplot(dados#emissao)
-
7/26/2019 mad114r6.ppt
31/48
-
7/26/2019 mad114r6.ppt
32/48
lguns argumentos da
2uno boxplot &bserao1 poss,e% construir riosboxplotsna mesma funo.
box5ex: contro%a a %argura dos ret@ngu%os
no boxplot. & defau%t 4.8. outline: a%or %gico. Se T os pontos
exteriores so assina%ados (defau%t). !e 0"os pontos exteriores no so assina%ados
-
7/26/2019 mad114r6.ppt
33/48
Exemplo %
Hamos traba%:ar com os dados sobresa%rios para diferentesprofiss'esIforma'es do conjuntodados*bm.txt.
dados
-
7/26/2019 mad114r6.ppt
34/48
1 nvel mdio
2 mecnico
3 adminit!ado!
4 "n#. "lt!ico
-
7/26/2019 mad114r6.ppt
35/48
Corescol$ co! de %!eenc&imento do !etn#ulo
-
7/26/2019 mad114r6.ppt
36/48
3oxplots -ori4ontais horizontal- a%or
%gico" se J o boxp%otfica na posio:oriConta%. !e 0
(defau%t) fica naposio ertica%.
-
7/26/2019 mad114r6.ppt
37/48
/utros argumentos lim1 contro%a a esca%a de a%ores main1 t,tu%o sub1 sub-t,tu%o names1 etor com os rtu%os dos
conjuntos de dados" quando so pedidosmais de um boxplot.
p$h:espec,fica o caracter a ser usado nospontos exteriores. $x.1p$h6789.
-
7/26/2019 mad114r6.ppt
38/48
Exemplo ": Eo domingo" dia 6 de abri% de +446" ojorna% & K%obo pub%icou uma reportagemsobre o din:eiro da Lnio dispon,e% para
inestimentos nas prefeituras em +446. Eesta reportagem" foram pub%icados os
dados sobre +/ capitais" os partidos dosprefeitos destas capitais" o nmero de
:abitantes e o tota% em reais dispon,e%.
-
7/26/2019 mad114r6.ppt
39/48
Exemplo " (cont.) $stes dados foram armaCenados no
arquio dadosaula*.txtcom o nmero de:abitantes em mi%:ares e o inestimento
em mi%:ares de reais. &s nomes atribu,dos Ds arieis foram1 cidade" partido" :ab444 e inest444.
-
7/26/2019 mad114r6.ppt
40/48
Exemplo " (cont.) dados
-
7/26/2019 mad114r6.ppt
41/48
-
7/26/2019 mad114r6.ppt
42/48
'ont!ua tamm um o%lot do n*me!o de &aitante.
-
7/26/2019 mad114r6.ppt
43/48
+l&ando %a!a a !a-o invetimento o!e n*me!o de
&aitante voc di!ia que oi uta eta dit!iui-o
-
7/26/2019 mad114r6.ppt
44/48
+ ttulo da !e%o!ta#em no o!nal oiAos amigos, mais da
metade.
oc conco!da com ete ttulo o! que
+!denando o dado %o! %a!tido
indice
-
7/26/2019 mad114r6.ppt
45/48
6e%oi de o!dena! o dado %o! %a!tido em dadoo!d,
%ovel ve! que de 1 a 17 tem$e out!o %a!tido e
de 1 a 25 tem$e o 8.
-
7/26/2019 mad114r6.ppt
46/48
!eumo$mat!i(0,2) :va!i;vel que vai !ecee! o total
: de invetimento, na %oi-o 1 out!o %a!tido
: na %oi-o 2 8
!eumoinvet1000A=PJAP! 2& =J $2$ &LJO&! =AOJP2&! $B O$NAQF& A& J&JAN 2$ PEH$!JPB$EJ&!1
-
7/26/2019 mad114r6.ppt
47/48
5esultado%a!cial
-
7/26/2019 mad114r6.ppt
48/48
top related