mad114r6.ppt

Upload: alecir-silva

Post on 02-Mar-2018

217 views

Category:

Documents


0 download

TRANSCRIPT

  • 7/26/2019 mad114r6.ppt

    1/48

    R - LIG-06

    Anlise

    Exploratria deDados - 2006

  • 7/26/2019 mad114r6.ppt

    2/48

    Objetivos da aula Apresentar um mtodo para a determinao

    aproximada de quantis para dados no-agrupados e usar a funo quantiledoR;

    definir o esquema dos cinco nmeros eapresentar e construir um boxplot(grfico-caixa) de um conjunto de dados.

  • 7/26/2019 mad114r6.ppt

    3/48

    Determinao dos quantisusando o R A funo apropriada do R para obter os quantis

    de um etor numricox a funo quantile. !ex o etor contendo os dados" e desejamos

    determinar os tr#s quartis" pedimosquantile(x,c(0.25,0.5,0.75)) !e desejamos o quinto e o nonagsimo-quinto

    percentis" pedimos quantile(x,c(0.05,0.95))

    $m gera%"q(p)quantile(x,p), que retorna oquanti% de ordem p dos dados em x.

  • 7/26/2019 mad114r6.ppt

    4/48

  • 7/26/2019 mad114r6.ppt

    5/48

    Exemplo 1: Emisso de

    Dixido de Carbono &s dados no arquio dados13bm.txtfornecem emiss'es de dixido de carbonoper capita" para uma amostra de *+

    pa,ses. &s dados so do ano de /. 0onte1 Stabilizing The Atmosphere:

    Population !onsumption and "reenhouse"ases.

  • 7/26/2019 mad114r6.ppt

    6/48

    Exemplo 1: Emisso de

    Dixido de Carbono (cont.) 2etermine os tr#s quartis" os decis" amdia e o desio-padro das emiss'esregistradas para os *+ pa,ses em /.

  • 7/26/2019 mad114r6.ppt

    7/48

    Exemplo 1: Emisso de

    Dixido de Carbono (cont.) dados

  • 7/26/2019 mad114r6.ppt

    8/48

    Histograma das emisses

    &bsere que a distribuio defreq9#ncias de dados sobre emissoapresenta forte assimetria positia

    &bsere tambm que : umac%asse sem representantes nessadistribuio

  • 7/26/2019 mad114r6.ppt

    9/48

    Histograma das emisses:sugerindo 10 interalos:

    (0!0.""!0.#$!1!1.""!1.#$!%!"!&!#!10)

  • 7/26/2019 mad114r6.ppt

    10/48

    &bsere que nessa figura tem-se+-

  • 7/26/2019 mad114r6.ppt

    11/48

    Dados no'agrupados: clculoaproximado dos uantis =asso 1 &rdene a amostra de modo a ter as

    estat,sticas de ordem1

    )()2()1( ... nxxx

    nin

    ippx iii ,...,1,

    5.0com),,( )( =

    =

    Considere os pontos da forma:

  • 7/26/2019 mad114r6.ppt

    12/48

    *or exemplo! se n+%0i pi

    1 0.025

    2 0.075

    3 0.1254 0.175

    5 0.225

    6 0.275

    7 0.325

    8 0.375

    9 0.425

    10 0.475

    11 0.525

    12 0.575

    13 0.625

    14 0.675

    15 0.725

    16 0.775

    17 0.825

    18 0.875

    19 0.925

    20 0.975

    nin

    ip

    i,...,1,

    5.0 =

    =

  • 7/26/2019 mad114r6.ppt

    13/48

    Dados no'agrupados

    (cont.)1+

  • 7/26/2019 mad114r6.ppt

    14/48

    Exemplo >onsidere noamente obter uma aproximao do terceiro quarti%. &bsere que

    .54quetal757,072

    5.05575.0

    72

    5.054743,0 =

  • 7/26/2019 mad114r6.ppt

    15/48

    Esuema dos cinco

    n,meros ? uma %ista de informa'es da distribuioque inc%ui cinco medidas" a saber" x(-)" "+" 7 e x(n).

    $stes cinco a%ores so importantes parase ter uma boa idia da assimetria dosdados.

  • 7/26/2019 mad114r6.ppt

    16/48

    Esuema dos cinco

    n,meros =ara uma distribuio simtrica ouaproximadamente simtrica" deer,amoster1 (a) +- x(-) x(n)-+;

    (b) +- 7-+;(c) - x(-) x(n)-7;(d) dist@ncias entre mediana e "

    mediana e 7 menores do que dist@ncias

    entre os extremos e " 7.

  • 7/26/2019 mad114r6.ppt

    17/48

    istograma a%isadode uma distribuiosimtrica unimoda%

  • 7/26/2019 mad114r6.ppt

    18/48

    Comandos summary() e fvenum()

    & Rpossui uma funo que retorna asinforma'es do esquema dos cinconmeros1 -ienum(x)" sex o etor que

    contm os dados. $xemp%o1 -ienum(dados#emissao)

    /10 %.%%% %.%*' %.1' 1.,' +.%m,nimo mximo + 7

  • 7/26/2019 mad114r6.ppt

    19/48

    Comandos summary() e fvenum()

    summar(dados#emissao) Bin. st u. Bedian Bean 7rd u. Bax. 4.4444 4.45*/ 4.6/4 .*64 .6*74 8.6644

    & comando summar(x) quandox umetor numrico" produC as informa'es doesquema dos cinco nmeros e a mdia.

  • 7/26/2019 mad114r6.ppt

    20/48

    Desen-o Esuemtico (Box Plots)

    A informao contida no esquema doscinco nmeros pode ser traduCidagraficamente num diagrama" con:ecido

    como box plot (tamb2m $hamado degr-i$o4$aixa). A figura a seguir" i%ustra o boxplot.

  • 7/26/2019 mad114r6.ppt

    21/48

  • 7/26/2019 mad114r6.ppt

    22/48

    Boxplot & ret@ngu%o no boxplot traado de ta%

    maneira que suas bases t#m a%turascorrespondentes aos primeiro e terceiro

    quartis da distribuio. & ret@ngu%o cortado por um segmento

    para%e%o Ds bases" na a%turacorrespondente ao segundo quarti%.

    Assim" o ret@ngu%o do boxplotcorrepondeaos /43 a%ores centrais da distribuio.

  • 7/26/2019 mad114r6.ppt

    23/48

  • 7/26/2019 mad114r6.ppt

    24/48

    Cosntruindo o boxplot 2epois de desen:ado o ret@ngu%o" traa-se

    um segmento para%e%o ao eixo" partindo doponto mdio da base superior do ret@ngu%o

    at o maior a%or obserado que EF&supera o a%or de 7G("/)2$. & mesmo feito a partir do ponto mdio

    da base inferior do ret@ngu%o" at o menor

    a%or que EF& menor do que -("/)2$.

  • 7/26/2019 mad114r6.ppt

    25/48

  • 7/26/2019 mad114r6.ppt

    26/48

    ec-ando o boxplot As obsera'es que estierem acima de

    7G("/)2$ ou abaixo de -("/)2$so c:amadas pontos exteriores e

    representadas por asteriscos. $ssa obsera'es destoantes das demais

    podem ser o que c:amamos de outliersoua%ores at,picos.

  • 7/26/2019 mad114r6.ppt

    27/48

  • 7/26/2019 mad114r6.ppt

    28/48

  • 7/26/2019 mad114r6.ppt

    29/48

    /bseraes Eo necessariamente

    :aer a presena depontos exteriores numboxplot.

    uando for este ocaso" o esquema tera seguinte apar#ncia1

  • 7/26/2019 mad114r6.ppt

    30/48

    2uno boxplotnoR $xperimente pedir ao Rpara construir um

    boxp%ot dos dados sobre emiss'es dedixido de carbono1

    boxplot(dados#emissao)

  • 7/26/2019 mad114r6.ppt

    31/48

  • 7/26/2019 mad114r6.ppt

    32/48

    lguns argumentos da

    2uno boxplot &bserao1 poss,e% construir riosboxplotsna mesma funo.

    box5ex: contro%a a %argura dos ret@ngu%os

    no boxplot. & defau%t 4.8. outline: a%or %gico. Se T os pontos

    exteriores so assina%ados (defau%t). !e 0"os pontos exteriores no so assina%ados

  • 7/26/2019 mad114r6.ppt

    33/48

    Exemplo %

    Hamos traba%:ar com os dados sobresa%rios para diferentesprofiss'esIforma'es do conjuntodados*bm.txt.

    dados

  • 7/26/2019 mad114r6.ppt

    34/48

    1 nvel mdio

    2 mecnico

    3 adminit!ado!

    4 "n#. "lt!ico

  • 7/26/2019 mad114r6.ppt

    35/48

    Corescol$ co! de %!eenc&imento do !etn#ulo

  • 7/26/2019 mad114r6.ppt

    36/48

    3oxplots -ori4ontais horizontal- a%or

    %gico" se J o boxp%otfica na posio:oriConta%. !e 0

    (defau%t) fica naposio ertica%.

  • 7/26/2019 mad114r6.ppt

    37/48

    /utros argumentos lim1 contro%a a esca%a de a%ores main1 t,tu%o sub1 sub-t,tu%o names1 etor com os rtu%os dos

    conjuntos de dados" quando so pedidosmais de um boxplot.

    p$h:espec,fica o caracter a ser usado nospontos exteriores. $x.1p$h6789.

  • 7/26/2019 mad114r6.ppt

    38/48

    Exemplo ": Eo domingo" dia 6 de abri% de +446" ojorna% & K%obo pub%icou uma reportagemsobre o din:eiro da Lnio dispon,e% para

    inestimentos nas prefeituras em +446. Eesta reportagem" foram pub%icados os

    dados sobre +/ capitais" os partidos dosprefeitos destas capitais" o nmero de

    :abitantes e o tota% em reais dispon,e%.

  • 7/26/2019 mad114r6.ppt

    39/48

    Exemplo " (cont.) $stes dados foram armaCenados no

    arquio dadosaula*.txtcom o nmero de:abitantes em mi%:ares e o inestimento

    em mi%:ares de reais. &s nomes atribu,dos Ds arieis foram1 cidade" partido" :ab444 e inest444.

  • 7/26/2019 mad114r6.ppt

    40/48

    Exemplo " (cont.) dados

  • 7/26/2019 mad114r6.ppt

    41/48

  • 7/26/2019 mad114r6.ppt

    42/48

    'ont!ua tamm um o%lot do n*me!o de &aitante.

  • 7/26/2019 mad114r6.ppt

    43/48

    +l&ando %a!a a !a-o invetimento o!e n*me!o de

    &aitante voc di!ia que oi uta eta dit!iui-o

  • 7/26/2019 mad114r6.ppt

    44/48

    + ttulo da !e%o!ta#em no o!nal oiAos amigos, mais da

    metade.

    oc conco!da com ete ttulo o! que

    +!denando o dado %o! %a!tido

    indice

  • 7/26/2019 mad114r6.ppt

    45/48

    6e%oi de o!dena! o dado %o! %a!tido em dadoo!d,

    %ovel ve! que de 1 a 17 tem$e out!o %a!tido e

    de 1 a 25 tem$e o 8.

  • 7/26/2019 mad114r6.ppt

    46/48

    !eumo$mat!i(0,2) :va!i;vel que vai !ecee! o total

    : de invetimento, na %oi-o 1 out!o %a!tido

    : na %oi-o 2 8

    !eumoinvet1000A=PJAP! 2& =J $2$ &LJO&! =AOJP2&! $B O$NAQF& A& J&JAN 2$ PEH$!JPB$EJ&!1

  • 7/26/2019 mad114r6.ppt

    47/48

    5esultado%a!cial

  • 7/26/2019 mad114r6.ppt

    48/48