probabilidade e a vol unico

Upload: mauricio-siqueira

Post on 07-Jul-2015

328 views

Category:

Documents


0 download

TRANSCRIPT

9 7 8 8 5 7 6 4 8 5 0 0 1ISBN 978-85-7648-500-1Ana Maria Lima de Farias Volume nicoProbabilidade e EstatsticaApoio:Referncias Bibliogrcas e catalogao na fonte, de acordo com as normas da ABNT.2009/2Material DidticoCopyright 2008,Fundao Cecierj / Consrcio CederjNenhuma parte deste material poder ser reproduzida, transmitida e gravada, por qualquer meio eletrnico, mecnico, por fotocpia e outros, sem a prvia autorizao, por escrito, da Fundao.ELABORAO DE CONTEDOAna Maria Lima de FariasCOORDENAO DE DESENVOLVIMENTO INSTRUCIONALCristine Costa BarretoF224mFarias, Ana Maria Lima de.Probabilidade e Estatstica. v. nico / Ana Maria Lima de Farias. Rio de Janeiro: Fundao CECIERJ, 2009.373p.; 21 x 29,7 cm.ISBN: 978-85-7648-500-11. Probabilidade. 2.Anlise combinatria. 3. Teorema de Bayes. 3. Variveis aleatrias discretas. I. Ttulo. CDD: 519.5EDITORATereza QueirozREVISO TIPOGRFICACristina FreixinhoElaine BaymaCOORDENAO DE PRODUOJorge MouraPROGRAMAO VISUALMarcelo FreitasILUSTRAOAna Maria Lima de FariasEduardo BordoniCAPAEduardo BordoniPRODUO GRFICAFbio Rapello AlencarDepartamento de ProduoFundao Cecierj / Consrcio CederjRua Visconde de Niteri, 1364 Mangueira Rio de Janeiro, RJ CEP 20943-001Tel.: (21) 2334-1569 Fax: (21) 2568-0725PresidenteMasako Oya MasudaVice-presidenteMirian CrapezCoordenao do Curso de MatemticaUFF - Regina MorethUNIRIO - Luiz Pedro San Gil Jutuca Governo do Estado do Rio de JaneiroSecretrio de Estado de Cincia e TecnologiaGovernadorAlexandre CardosoSrgio Cabral FilhoUniversidades ConsorciadasUENF - UNIVERSIDADE ESTADUAL DO NORTE FLUMINENSE DARCY RIBEIROReitor: Almy Junior Cordeiro de CarvalhoUERJ - UNIVERSIDADE DO ESTADO DO RIO DE JANEIROReitor: Ricardo VieiralvesUNIRIO - UNIVERSIDADE FEDERAL DO ESTADO DO RIO DE JANEIROReitora: Malvina Tania TuttmanUFRRJ - UNIVERSIDADE FEDERAL RURAL DO RIO DE JANEIROReitor: Ricardo Motta MirandaUFRJ - UNIVERSIDADE FEDERAL DO RIO DE JANEIROReitor: Alosio TeixeiraUFF - UNIVERSIDADE FEDERAL FLUMINENSEReitor: Roberto de Souza SallesProbabilidade e EstatsticaSUMRIOVolume nicoAula 1 Apresentao de dados parte 1___________________________ 7Aula 2 Apresentao de dados parte 2__________________________27Aula 3 Medidas de posio ____________________________________47Aula 4 Medidas de disperso __________________________________73Aula 5 Probalidade conceitos bsicos ___________________________89Aula 6 Reviso de anlise combinatria ________________________ 109Aula 7 Probabilidade ______________________________________ 127Aula 8 Probabilidade condicional e independncia de eventos ________ 153Aula 9 Teorema da probabilidade total e teorema de Bayes __________ 185Aula 10 Variveis aleatrias discretas___________________________ 217Aula 11 Esperana e varincia de variveis aleatrias discretas________ 237Aula 12 Algumas distribuies discretas_________________________ 257Aula 13 Variveis aleatrias contnuas __________________________ 289Aula 14 A distribuio normal ________________________________ 319Aula 15 A distribuio normal concluso_______________________ 337Bibliograa_______________________________________________ 373Apresenta caodedadosparte1AULA1Aula1Apresentacaodedadosparte1Nestaaula,voceaprendera:os conceitos basicos de popula cao e amostra de uma pesquisa estatstica;adistin caoentrevariaveisqualitativasevariaveisquantitativas;a construir distribui coes de freq uencias para variaveis qualitativasequantitativasdiscretas;a construir gracos de colunas e de setores para representar dados qua-litativosequantitativosdiscretos.Pesquisaestatstica-conceitosbasicosPopulacaoeamostraEstatsticaeacienciadaaprendizagemapartirdosdados. Emgeral,fazemoslevantamentosdedadosparaestudarecompreendercaractersticasdeumapopula cao. Por exemplo, umgrandebanco, querendolan car umnovoproduto, precisaconheceroperl socioeconomicodosseusclientese,nesse caso, apopula caodeinteresseeformadapelos clientes detodas asagenciasdobanco. AFedera caodas Ind ustriasdoEstado doRiodeJaneiro FIRJAN mede o grau de conan ca dos empresarios industriais atraves deumapesquisajunto`asempresasindustriais,sendoapopula caodeinteresse,aqui,o conjuntodas empresasindustriaisdoestadodo Rio de Janeiro. Comessesdoisexemplosapenas, japodemosverqueoconceitodepopulacaodeumapesquisaestatsticaemaisamplo,naoserestringindoasereshumanos;elaedenidaexatamenteapartirdosobjetivosdapesquisa. Maisprecisa-mente,populacaoeoconjuntodeelementosparaosquaissedesejaestudarpopulac aodeterminada(s)caracterstica(s).Emboratenhampopula coes bastante distintas, essas duas pesquisastememcomumofatodeosresultadosdesejadosseremobtidosapartirdedados levantados juntoaumsubconjuntodapopula cao umaamostra.amostraHavariasrazoesparasetrabalharcompesquisasporamostragemcustoetempo, emgeral, saoasmaiscomuns. Mas, alemdeseremmaisbarataserapidas, aspesquisasporamostragem, se bemplanejadas, podemfornecer7CEDERJApresenta caodedadosparte1resultadosquasetaoprecisosquantoaqueles fornecidosporpesquisascen-sitarias, em que todos os elementos da popula cao sao investigados. Exemplosclassicos de pesquisa censitaria sao os Censos Demogracos realizados a cadacensodezanosnoBrasil eemoutrospases. Oobjetivodessescensoselevantarinforma coessobretodaapopula caodopas, demodoafornecersubsdiosparaosgovernantesdeniremaspolticasp ublicas.VariaveisqualitativasequantitativasNaspesquisasestatsticas, ascaractersticassobreasquaisqueremosobterinforma caosaochamadasvariaveis. Emumapesquisadomiciliarso-breempregoerenda, algumasvariaveisdeinteressesaosexo, ra ca, graudeinstru caoevalordosrendimentosdomorador. Emumapesquisasobreoestadonutricional dosbrasileiros, opesoeaalturadosmoradoresdecadadomicliodaamostraforam medidos. ParaoacompanhamentodaatividadeindustrialnoRiodeJaneiro,aFIRJANobteminforma coesjunto`asempre-sasindustriaissobretipodeatividadeeconomica, n umerodeempregados,n umerodehorastrabalhadas, valordafolhadepagamento.Eimportantediferenciarentrevariaveisqualitativasevariaveisquantitativas. Sexo, ra ca,religiaoeatividadeeconomicadeumaempresasaoexemplos devariaveisqualitativas. Javalor dosrendimentos,peso,altura,n umerodeempregados,valordafolhadepagamentosaoexemplosdevariaveisquantitativas. Pode-mosver, entao, queasvariaveisqualitativasdescrevemcaractersticasdosvari aveisqualitativaselementos de uma popula cao, enquanto as variaveis quantitativas mensuramvari aveisquantitativascaractersticasdesseselementos.As variaveis quantitativas, por sua vez, podem ser discretas ou contnuas.Quandoavariavel puderassumirqualquervalornumericoemumdetermi-nadointervalodevaria cao, elaseraumavariavel contnua. Essasvariaveisresultamnormalmentedemedi coes: peso, altura, dosagemdehemoglobina,renda etc. A interpreta cao desse tipo de variavel leva `a no cao de valor aproxi-mado, pois naoexisteinstrumentodemedi caocapazdefornecer precisaoabsolutanainforma cao. Assim,quandoumabalan camostraopesodeumapessoacomo65,5kg,essevalor,naverdade,eumaaproxima caoparaqual-quer valor entre, digamos, 65,495e65,505kg. Por outrolado, avariavelquantitativadiscretasopoderaassumirvalorespertencentesaumconjuntoenumeravel; osvaloresnormalmentesaoobtidosatravesdealgumprocessodecontagem. Algunsexemplossao: n umerodelhosdeumcasal, n umerodeempregadosdeumarmadecontabilidadeetc.CEDERJ8Apresenta caodedadosparte1AULA1Atividade1.1OtextoaseguirfoiextradodapaginadoIBOPEnaInternet:www.ibope.com.br. A temos parte da descri cao da pesquisa sociodemogracarealizadaporesseinstituto. Identiqueasvariaveispesquisadas,classican-do-ascomoqualitativasouquantitativas.O Levantamento Socioeconomico (LSE) e a pesquisa do IBO-PEMdiaquemapeiaascaractersticassociais, demogracaseeconomicasdasfamliasdasprincipaisregioesmetropolitanasdopas. Oferecetambemoutrosdadosessenciaisparatra caraes-trategia de marketing para um produto. Com uma base de dadosestendida em rela cao `as outras pesquisas do IBOPE Mdia, o LSEservedebaseparaoutrosestudos.Saolevantadosdadossobreacondi caododomiclioentrevis-tado (condi cao da rua, tipo de imovel) e sobre a condi cao socioe-conomicadodomiclio(informa coes sobre rendaeclassica caoeconomica). Tambemsaopesquisados on umerodepessoasnodomiclio, apresen caeaquantidadedecrian caseadolescentes,aidade, graudeinstru caoecondi caodeatividadedochefedacasaedadona-de-casa. Apesquisalevantatambemdadossobreapossedebens, comogeladeira, maquinadelavar, automovel,radio, computador, telefone, entreoutros, eacessoaservi cosdemdia,comoTVporAssinatura,Internet,etc.ApresentacaodedadosqualitativosVamos considerar o seguinte exemplo ctcio, mas verossmil. A dire caode uma empresa esta estudando a possibilidade de fazer um seguro sa ude paraseus funcionarios e respectivos familiares. Para isso, ela faz um levantamentojuntoaseus500funcionarios, obtendoinforma caosobresexo, estadocivil,idade, n umerodedependentesesalario. Comosao500funcionarios, temosqueachar umaformaderesumir osdados. Nestaaulavoceiraaprenderaresumirdadosqualitativosemformadeumadistribui cao(outabela)defreq uenciaetambememformagraca. Voceveraqueosgracoscomple-mentamaapresenta caotabular.9CEDERJApresenta caodedadosparte1Distribuicoesdefreq uenciaConsideremosinicialmenteavariavelqualitativasexo. Oqueinteressasabersobreessavariavel naoequeJoaoedosexomasculinoeMariaedosexofeminino, mas, sim, quantosfuncionariosequantasfuncionariashanaempresa. Esseresultadopodeserresumidoemumatabelaoudistribui caodefreq uenciasdaseguinteforma:Sexo N umerodeFuncionariosMasculino 270Feminino 230Total 500Os n umeros 270 e 230 resultaramda contagemdas freq uencias deocorrenciadecadaumadascategoriasdavariavel sexo. Essacontagemetambem chamada de freq uencia simples absolutaou simplesmente freq uencia.freq uenciasimplesabsolutaOtotalde500 eobtidosomando-seon umerodehomensedemulheres.Einteressantetambemexpressaressesresultadosemforma relativa,freq uenciarelativaouseja,considerarafreq uenciadecadacategoriaemrela caoaototal:270500= 0, 54ouseja,54%dosfuncionariosdaempresasaodosexomasculinoe230500= 0, 46ou seja, 46% dos funcionarios sao mulheres. A Tabela 1.1 apresenta a versaocompleta.Tabela1.1: Distribui caodon umerodefuncionariosporsexoSexo Freq uenciaSimplesAbsoluta RelativaMasculino 270 0,54Feminino 230 0,46Total 500 1,00Note que a soma das freq uencias relativas e sempre 1, enquanto a somadasfreq uenciasabsolutasdeveserigual aon umero total deelementossendoinvestigados.CEDERJ10Apresenta caodedadosparte1AULA1Demaneiraanaloga, obteramosaTabela1.2paraavariavel estadocivil. Noteque, a, afreq uenciarelativaestaapresentadaemformaper-centual,ouseja,multiplicadapor100. Porexemplo,paraoscasadostemos:280500 100 = 0, 56 100 = 56%Emgeral,essaeaformamaisusualdeseapresentaremasfreq uenciasrelativasenestecaso,asomadevedar100%.Tabela1.2: Distribui caodon umerodefuncionariosporestadocivilEstadoCivil Freq uenciaSimplesAbsoluta Relativa%Solteiro 125 25,0Casado 280 56,0Divorciado 85 17,0Vi uvo 10 2,0Total 500 100,0Exemplo1.1Consideremos que, na situa cao descrita anteriormente, os dados tenhamsido levantados por departamento, para depois serem totalizados. Para o De-partamentodeRecursosHumanos,foramobtidasasseguintesinforma coes:11CEDERJApresenta caodedadosparte1Nome Sexo Estadocivil N umerodedependentesJoaodaSilva M Casado 3PedroFernandes M Vi uvo 1MariaFreitas F Casada 0PaulaGon calves F Solteira 0AnaFreitas F Solteira 1LuizCosta M Casado 3AndreSouza M Casado 4PatrciaSilva F Divorciada 2ReginaLima F Casada 2AlfredoSouza M Casado 3MargareteCunha F Solteira 0PedroBarbosa M Divorciado 2RicardoAlves M Solteiro 0MarcioRezende M Solteiro 1AnaCarolinaChaves F Solteira 0Parapequenosconjuntosdedados,podemosconstruiratabela`amaoeparaissoprecisamoscontaron umerodeocorrenciasdecadacategoriadecadaumadasvariaveis. Varrendooconjuntodedadosapartirdaprimeiralinha,podemosirmarcandoasocorrenciasdaseguinteforma:Masculino |||||||| Solteiro ||||||Feminino ||||||| Casado ||||||Divorciado ||Vi uvo |Obtemos,entao,asseguintestabelas:Sexo Freq uenciaSimplesAbsoluta Relativa%Masculino 8 53,33Feminino 7 46,67Total 15 100,0EstadoCivil Freq uenciaSimplesAbsoluta Relativa%Solteiro 6 40,00Casado 6 40,00Divorciado 2 13,33Vi uvo 1 6,67Total 15 100,00CEDERJ12Apresenta caodedadosparte1AULA1Arredondamentoden umerosNoexemploanterior, adivisaodealgumasfreq uenciasabsolutaspelototal de 15 resultou em dzimas. Nesses casos, torna-se necessario arredondarosresultados, masessearredondamentodeveserfeitocomcautelaparaseevitaremproblemastaiscomoasomanaoseriguala1ou100%.A primeira etapa no processo de arredondamento consiste em se decidiron umerodecasasdecimaisdesejado. Emgeral, freq uenciasrelativasper-centuaissaoapresentadascom, nomaximo, 2casasdecimais. Issosignicaquetemosquedescartarasdemaiscasasdecimais. Existeaseguinteregradearredondamento:Regra: Arredondamentoden umerosQuandooprimeiroalgarismoaser suprimidoemenor ouigual a4(ouseja, e igual a0, 1, 2, 3ou 4), o ultimo algarismoa sermantidopermaneceinalterado. Quandooprimeiroalgarismoasersuprimidoeiguala5,6,7,8ou9,o ultimoalgarismoasermantido eacrescidode1.Nadistribui caodefreq uenciasdavariavelsexo,temososseguintesre-sultados:815 100 = 53, 33333 . . .715 100 = 46, 66666 . . .Noprimeirocaso, oprimeiroalgarismoasersuprimidoe3; logo, o ultimoalgarismoasermantido(3)naosealteraeoresultadoe53,33. Nosegundocaso, o primeiro algarismo a ser suprimido e 6; logo, o ultimo algarismo a sermantido(6) deveser acrescidode 1 e o resultado e 46,67. Tente sempreusaressaregraemseusarredondamentos;comela,voceevitaraerrosgrosseiros.Naapresenta caodetabelasdefreq uenciasrelativas,epossvel quees-sasfreq uenciasnaosomem100%, ouseja, epossvel que, aosomarmosasfreq uenciasrelativas,obtenhamosresultadoscomo99,9% ou 100,01%. Essespequenos erros sao devidos a arredondamentos e nem sempre e possvel evita-los; noentanto, aceita-se implicitamente que asomadas freq uencias seja100%. Vejaatabeladefreq uenciasapresentadanaFigura1.7, relativa`asolu caodoExerccio1- asomadasfreq uenciasrelativase99,99%. Setra-balhassemoscom3casasdecimais, obedecendo`aregradearredondamento,asomadaria100,001. Issonaosignicaqueascontasestejamerradas!13CEDERJApresenta caodedadosparte1Atividade1.2Para o Departamento Financeiro, obteve-se a seguinte informa cao sobreosexodos23funcionarios:M F F M M M F F M M M MM F M M F F M M M F FondeM=MasculinoeF=Feminino. Construaumatabeladefreq uenciasparaessesdados.GracosAsdistribui coesdefreq uenciaparadadosqualitativostambempodemserilustradasgracamenteatravesdegracosdecolunasougracosdese-tores, tambemconhecidoscomogracosdepizza. NaFigura1.1temososgracosdecolunaedesetoresparaosdadosdaTabela1.2, referentesaoestado civil dos funcionarios. No graco decolunas, a altura de cada colunagr aficodecolunasrepresentaafreq uenciadarespectivaclasseeogracopodeserconstrudocombase nas freq uencias absolutas ourelativas. Paradiferenciar umdooutro, coloca-senottulodoeixootipodefreq uenciautilizada. Noteque,no eixo horizontal, nao ha escala, uma vez que a se representam as categoriasdavariavel,quedevemserequi-espa cadas.gr aficodesetoresNo graco de setores, a freq uencia de cada categoria e representada pelotamanho(angulo) dosetor(ou fatia dapizza). Paraconstruirumgracodesetores`amao, voceprecisadeumcompassoparafazerumcrculoderaioqualquer. Emseguida, trace umraioqualquer nocrculoe apartir da,comecea marcar os raios de acordo com os angulos de cada setor, utilizandoumtransferidor. Paradeterminaroangulodecadasetor, vocedeveusaraseguinteregradeproporcionalidade: oangulototal360ocorrespondeaon umero total de observa coes; o angulo de cada setor corresponde `a freq uenciadarespectivaclasse. Dessaforma,voceobtemaseguinteregradetresparaossolteiros:360o500=x125 x = 90oEsses gracos podem ser construdos facilmente com auxlio de progra-masdecomputador, como, porexemplo, oprogramadeplanilhasExcel daMicrosoft R .CEDERJ14Apresenta caodedadosparte1AULA1Figura1.1: Distribui caodon umerodefuncionariosporestadocivil.Atividade1.3ConstruaosgracosdesetoresedecolunasparaosdadosdaAtividade1.2.ApresentacaodedadosquantitativosdiscretosQuandoumavariavelquantitativadiscretaassumepoucosvaloresdis-tintos, epossvelconstruirumadistribui caodefreq uenciasdamesmaformaquezemosparaasvariaveisqualitativas. Adiferen cae que,emvezdeter-mos categorias nas linhas databela, teremosos distintosvalores da variavel.Continuandocomonossoexemplo, vamostrabalharagoracomavariaveln umerodedependentes. Suponhaquealgunsfuncionariosnaotenhamde-pendentes e que o n umero maximo de dependentes seja 7. Obteramos, entao,aseguintedistribui caodefreq uencias:15CEDERJApresenta caodedadosparte1N umerode Freq uenciaSimplesdependentes Absoluta Relativa%0 120 24,01 95 19,02 90 18,03 95 19,04 35 7,05 30 6,06 20 4,07 15 3,0Total 500 100,0Oprocessodeconstru caoeabsolutamenteomesmomas, dadaana-turezaquantitativadavariavel,epossvelacrescentarmaisumainforma cao`atabela. Suponha, porexemplo, queaempresaestejapensandoemlimi-taroseuprojetoa4dependentes, demodoquefuncionarioscommaisde4dependentesteraoquearcarcomasdespesasextras. Quantosfuncionariosestaonessasitua cao? Pararesponder aperguntas desse tipo, e costumeacrescentar`atabeladefreq uenciasumacolunacomas freq uenciasacumu-freq uenciaacumuladaladas. Essas freq uencias sao calculadas da seguinte forma: para cada valor davariavel(n umerodedependentes),contamosquantasocorrenciascorrespon-dem a valores menores ou iguais a esse valor. Por exemplo, valores da variavelmenores ou iguais a 0 correspondem aos funcionarios sem dependentes. Logo,afreq uenciaacumuladaparaovalor 0eigual `afreq uenciasimples: 120.Analogamente, valoresdavariavel menoresouiguaisa1correspondemaosfuncionarios sem dependentesmais os funcionarios com 1 dependente. Logo,afreq uenciaacumuladaparaovalor 1eigual a120 + 95=215. Paraovalor2, afreq uenciaacumuladaeigual a120 + 95 + 90=215 + 90=305.Repetindoesseprocedimento, obtemos aTabela1.3. Notequea acres-centamos tambemasfreq uenciasacumuladas emformapercentual. Essasfreq uencias saocalculadascomoapropor caodafreq uenciaacumuladaemrela caoaototal;porexemplo,87, 0 =435500 100CEDERJ16Apresenta caodedadosparte1AULA1Tabela1.3: Distribui caodefreq uenciasparaon umerodedependentesN umerode Freq uenciaSimples Freq uenciaAcumuladadependentes Absoluta Relativa% Absoluta Relativa%0 120 24,0 120 24,01 95 19,0 215 43,02 90 18,0 305 61,03 95 19,0 400 80,04 35 7,0 435 87,05 30 6,0 465 93,06 20 4,0 485 97,07 15 3,0 500 100,0Total 500 100,0Atividade1.4Construaadistribui caodefreq uenciaparaon umerodedependentesdos funcionarios do Departamento de Recursos Humanos, conforme dados noExemplo1.1.Arepresenta caogracadadistribui caodefreq uenciasdeumavariavelquantitativa discreta pode ser feita atraves de um graco de colunas. A unicadiferen canesse casoe que noeixohorizontal dogracoerepresentadaaescaladavariavelquantitativaetal escaladeveserdenidacuidadosamentede modoarepresentar corretamente os valores. NaFigura 1.2temos ogracodecolunasparaon umerodedependentesdos500funcionarios.Figura1.2: Distribui caodon umerodedependentesde500funcionarios.17CEDERJApresenta caodedadosparte1Emboranaosejaincorreto, naoeapropriadorepresentardadosquan-titativosdiscretosemumgracodesetores,umavezque,nessegraco,naoepossvelrepresentaraescaladosdados.Atividade1.5Construaogracodecolunaspararepresentar adistribui caodefre-q uenciasobtidanaAtividade1.4.ResumodaAulaAonal destaaula, vocedevesercapazdecompreenderosseguintesconceitos:Popula caoconjuntode elementos paraos quais se desejaestudardeterminada(s)caracterstica(s).Amostrasubconjuntodeumapopula cao.Pesquisacensitaria-pesquisaemquetodaapopula cao einvestigada.Pesquisaporamostragempesquisaemqueapenasumaamostradapopula cao einvestigada.Variavelcaractersticadeumapopula caoquedesejamosestudar.Variavelqualitativa variavelquedescreveumacaractersticados ele-mentosdeumapopula cao.Variavel quantitativavariavel que mensuraumacaractersticadoselementosdeumapopula cao.Variavel quantitativa discreta variavel cujos possveis valores formamumconjuntoenumeravel.Variavel quantitativacontnuavariavel cujos possveis valoresper-tencemaumintervalo[a, b].Nestaaula, vocetambemaprendeuaresumirdadosdevariaveisquali-tativas e de variaveis quantitativas discretas atraves de tabelas de freq uenciae gracos de setores e de colunas.E importante saber os seguintes conceitos:CEDERJ18Apresenta caodedadosparte1AULA1Freq uenciasimplesabsolutaeacontagemdon umerodeelementospertencentes aumadeterminadacategoriade umavariavel qualita-tivaoun umerodeelementosqueassumemdeterminadovalordeumavariavelquantitativadiscreta.Freq uenciasimplesrelativarepresentaaparticipa c aopercentual decadacategoriaouvalornototaldeobserva coes.Freq uencia acumulada absoluta para cada valor de uma variavelquantitativa discreta, e o n umero de ocorrencias (elementos) correspon-dentesavaloresmenoresouiguaisaessevalor.Freq uenciaacumuladarelativaeafreq uenciaacumuladaemformapercentual,calculadacomoumaparticipa caonototaldeobserva coes.Exerccios1. NaTabela1.4temosinforma coessobreosexo, amateriapredileta(Portugues,Matematica,Historia, GeograaouCiencias)no2ograueanota(n umerodequestoescertas)emumtestedem ultiplaescolhacom10questoes dematematica, ministradonoprimeirodiadeauladoscalourosdeAdministra caodeumauniversidade(dadosctcios).(a) Classiqueasvariaveisenvolvidas.(b) Construaatabeladefreq uenciasapropriadaparacadaumadasvariaveis.(c) Construa gracos apropriados para ilustrar as distribui coes defreq uencia.19CEDERJApresenta caodedadosparte1Tabela1.4: Dadossobresexo,materiaprediletaenotadealunosSexo Predileta Nota Sexo Predileta Nota Sexo Predileta Nota Sexo Predileta NotaF H 5 M M 2 M H 3 F M 8M M 8 M G 4 M M 5 M P 5F P 8 M G 9 F P 5 M G 6F H 6 M M 7 F G 5 F M 7M C 5 M M 1 M C 7 M P 5M H 6 F P 8 M H 4 F M 5F M 8 F G 5 F M 7 F M 5F P 4 M G 9 F P 7 F P 9F H 2 M P 5 F M 6 M M 8M C 6 F M 8 M G 6F P 8 F G 6 M H 92. Na Tabela1.5 temos dados sobre o consumo de refrigerantes no Brasilem 2005, segundo dados da Associa cao Brasileira das Ind ustrias de Re-frigerantesedeBebidasNaoAlcoolicas. Construaumgracoapropri-adoparailustraressesdados.Tabela1.5: RefrigerantesParticipa cao dossabores2005Refrigerantes %Colas 51,1Guarana 24,4Laranja 10,9Limao 5,9Uva 3,2TutiFruti 1,1Tonica 0,7Ctrico 0,1Ma ca 0,5Outrossabores 2,1Total 100,0Fonte:ABIR-www.abir.org.brCEDERJ20Apresenta caodedadosparte1AULA13. NaTabela1.6temosasfreq uenciasacumuladas don umerodesin-istrosporapolicedesegurodoramoAutomoveis. Completeatabela,calculandoas freq uencias simples absolutas erelativas e tambemasfreq uenciasacumuladasrelativas.Tabela1.6: N umerodesinistrosporapolice,paraoExerccio 3N umerode N umerodesinistros apolices0 2913 1 4500 2 4826 3 4928 4 50004. Para a seguinte notcia, extrada do jornal Folha de S. Paulo, construaumgracoparailustrarotextonosegundoparagrafodanotcia.Dentro de dez anos, 90% do mercado automobilstico mundial estara nasmaosdemeiad uziadeconglomerados. Aprevisaoconstadeestudopro-duzidopelaconsultoriaespecializadabritanicaAutopolis, quedaassessoriatecnicaamontadoras queestaoinstaladasnoReinoUnido.DadoslevantadospelaAutopolismostramque,hoje,aconcentra caodemercadojaegrande. Cercade75%dosetoredominadoporsomenteseisconglomerados,lideradosporGeneral Motors(22,8%), Ford(16,8%), Volk-swagen (9,4%),Toyota (9,2%,incluindoDaihatsu),Reanult-Nissan (8,7%) eDaimler-Chrysler(8,3%). Osoutros24,8%domercadosaodominadosporumainnidadedeempresaspequenasemedias,comoFiat, BMW,PeugeoteHonda,entreoutras.SolucaodasAtividadesAtividade1.1Epossvelidenticarasseguintesvariaveis:Condi caododomicliovariavelqualitativa.Condi caodaruavariavelqualitativa.21CEDERJApresenta caodedadosparte1Tipodeimovelvariavelqualitativa.Renda pode ser qualitativa se for perguntada a faixa ou quantitativa,seforperguntadaarendaexata; aprimeiraop caoeamaisprovavelparaessetipodepesquisa.Classica caoeconomicavariavelqualitativa.N umerodepessoasvariavelquantitativa.Presen cadecrian casvariavelqualitativa.N umerodecrian casvariavelquantitativadiscreta.Presen cadeadolescentesvariavelqualitativa.N umerodeadolescentesvariavelquantitativadiscreta.Idadedochefeedadona-de-casapodeserquantitativa,casoseper-gunteaidadeexata,ouqualitativa,casoseidentiqueafaixaetaria.Graudeinstru caodochefeedadona-de-casavariavelqualitativa.Condi caodeatividadedochefevariavelqualitativa.Presen cadegeladeira, maquinadelavar, etc. variaveisqualitativasdotipoSim/Nao.Acessoaservi cosdemdiavariaveisqualitativasdotipoSim/Nao.Atividade1.2Adistribui caoedadanatabelaaseguir.Sexo Freq uenciaSimplesAbsoluta Relativa%Masculino 14 60,87Feminino 9 39,13Total 23 100,00CEDERJ22Apresenta caodedadosparte1AULA1Atividade1.3VejaaFigura1.3.Figura1.3: Distribui caodosfuncionariosdoDeptoFinanceiroporsexo.Atividade1.4VejaaTabela1.7Tabela1.7: Distribui caodon umerodedependentesdosfuncionariosdoDeptodeRHN umerode Freq uenciaSimples Freq uenciaAcumuladadependentes Absoluta Relativa% Absoluta Relativa%0 5 33,33 5 33,331 3 20,00 8 53,332 3 20,00 11 73,333 3 20,00 14 93,334 1 6,67 15 100,00Total 15 100,0023CEDERJApresenta caodedadosparte1Atividade1.5VejaaFigura1.4.Figura1.4: Distribui caodon umerodedependentesdosfuncionariosdoDeptodeRH.SolucaodosExerccios1. Variaveisqualitativas: Sexoemateriapredileta.Variavelquantitativadiscreta: notan umerodequestoescertas.Vejaas Figuras 1.5, 1.6, 1.7comas tabelas egracos paraessasvariaveis.Absoluta Relativa %Masculino 21 50Feminino 21 50Total 42 100Freqncia SimplesSexoMasculino21Feminino21Figura1.5: Distribui caodosalunosdeAdministra caoporsexo.CEDERJ24Apresenta caodedadosparte1AULA1Figura1.6: Distribui caodosalunosdeAdministra caopormateriapredileta.Figura1.7: Distribui caodasnotasdosalunosdeAdministra cao.2. VejaaFigura1.8.Figura1.8: Distribui caodapreferencia desaborderefrigerantes.25CEDERJApresenta caodedadosparte13. Noexercciosaodadasasfreq uenciasacumuladassimples, quevamosrepresentarpelaletraF. Paraobtermosasfreq uenciasabsolutassim-ples, que vamos representar pelaletraf, devemos notar oseguinte:paraomenorvalor(zero), afreq uenciasimpleseigual `aacumulada,ouseja:f1= F1= 2913Paraosegundovalor,temos:f1 +f2= F2 f2= F2F1 f2= 4500 2913 = 1587Paraoterceirovalor,temos:f1+f2+f3= F3 F2+f3= F3 f3= F3F2 f3= 48264500 = 326Deformaanaloga, obtemosquef4= F4F3= 4928 4826 = 102f5= F5F4= 5000 4928 = 72Obtemos,entao,aseguintetabela:N umero N umerodeapolicesde Freq uenciaSimples Freq uenciaAcumuladasinistros Absoluta Relativa Absoluta Relativa0 2913 58,26 2913 58,261 1587 31,74 4500 90,002 326 6,52 4826 96,523 102 2,04 4928 98,564 72 1,44 5000 100,00Total 5000 100,004. O graco apresentado na Figura 1.9 e um graco de colunas. Havendodisponibilidadedeseusarorecursodecores,epossvel usarogracodesetorestambem.Figura1.9: Concentra cao domercadoautomobilstico.CEDERJ26Apresenta caodedados-parte2AULA2Aula2Apresentacaodedados-parte2Nestaaula,voceaprendera:a construir distribui coes de freq uencias agrupadas para variaveis quan-titativasdiscretasecontnuas;a construir histogramas e polgonos de freq uencia para representar dis-tribui coesdefreq uenciasagrupadas;aconstruirgracosdelinhaediagramasderamosefolhas.Apresentacaodedadosquantitativos-conclusaoVariaveisquantitativasdiscretasNa aula anterior, voce aprendeu a construir distribui coes de freq uenciaspara variaveisdiscretascom poucos valores. Noexemploali apresentado,haduasvariaveisquantitativasdiscretas:n umerodedependenteseidade.Adiferen caentreelasequeaidadepodeassumirumn umeromaiordeva-lores, oqueresultariaemumatabelagrande, casodecidssemosrelacionartodos os valores. Alemdisso, emgeral naoenecessarioapresentar ain-forma caoemtal nvel dedetalhamento. Porexemplo, paraasseguradorasde planos de sa ude, as faixas etarias importantes - aquelas em que ha reajustepor idade - sao 0 a 18; 19 a 23; 24 a 28; 29 a 33; 34 a 38; 39 a 43; 44 a 48; 49a53; 54a58e59oumais. Sendoassim, podemosagruparosfuncionariossegundo essas faixas etarias e construir uma tabeladefreq uencias agrupadastabeladefreq uenciasagrupadasdamesmaformaquezemosparaon umerodedependentes, soqueagoracadafreq uenciacorrespondeaon umerodefuncionariosnarespectivafaixaetaria. NaTabela2.1temosatabelaresultante.27CEDERJApresenta caodedados-parte2Tabela2.1: Distribui caodefreq uenciadaidadede500funcionariosFaixa Freq uenciaSimples Freq uenciaAcumuladaEtaria Absoluta Relativa% Absoluta Relativa%19 23 1 0,2 1 0,224 28 23 4,6 24 4,829 33 103 20,6 127 25,434 38 246 49,2 373 74,639 43 52 10,4 425 85,044 48 50 10,0 475 95,049 53 25 5,0 500 100,0Total 500 100,0Atividade2.1NaTabela2.2temosasinforma coessobreidadeesalarioparaos15funcionariosdoDepartamentodeRecursosHumanos. Construaumatabeladefreq uenciasparaaidade,levandoemcontaasmesmasfaixasetariasuti-lizadasacima.Tabela2.2: IdadeesalariodosfuncionariosdoDepartamentodeRHNome Idade SalarioJoaodaSilva 36 6300PedroFernandes 51 5700MariaFreitas 26 4500PaulaGon calves 25 3800AnaFreitas 29 3200LuizCosta 53 7300AndreSouza 42 7100PatrciaSilva 38 5600ReginaLima 35 6400AlfredoSouza 45 7000MargareteCunha 26 3700PedroBarbosa 37 6500RicardoAlves 24 4000MarcioRezende 31 5100AnaCarolinaChaves 29 4500CEDERJ28Apresenta caodedados-parte2AULA2VariaveisquantitativascontnuasParaasvariaveisquantitativascontnuas, devemostambemtrabalharcomdistribui coesdefreq uenciasagrupadas. Oprocessodeconstru caoei-denticoaovistoparaas variaveis discretas, mas aqui devemos tomar umcuidadoespecialnaconstru caodas classes. Aescolhados limitesdasclassesdeveser feitacom basena natureza, valores e unidade de medidados dados.As unicasregrasquetemqueserseguidassaoasseguintes.Regra: Deni caodasclassesemumadistribui caodefreq uenciasagru-padas.1. Asclassestemqueserexaustivas, istoe, todososelementosdevempertenceraalgumaclasse.2. Asclassestemquesermutuamenteexclusivas, istoe,cadaelementotemquepertencerauma unicaclasse.Oprimeiropassoedeniron umerodeclassesdesejado; essen umero,depreferencia, deveestarentre5e25. Emseguida, devemosdeterminaraamplitudedosdados,ouseja,ointervalodevaria caodosvaloresobservadosdavariavelemestudo.DenicaoA amplitude de um conjunto de dados, representada por total, e denidacomoadiferen caentreosvaloresmaximoemnimo:total= VM axVMn(2.1)Sequeremostrabalharcomclasses demesmocomprimento(eessaeumaop caobastante comum),paradeterminaressecomprimento,temosquedividiraamplitudetotalpelon umerodeclassesdesejado. Noentanto,paragarantir a inclusao dos valores mnimo e maximo, podemos, como regra geral,usaroseguinteprocedimento: considereoprimeirom ultiplodon umerodeclasses maior que o valor da amplitude e use esse n umero como a novaamplitude. Porexemploseaamplitudee28equeremostrabalharcom5classes, vamosconsiderar30comoanovaamplitude. Dividindoessevalor29CEDERJApresenta caodedados-parte2pelon umerodeclasses, obtemosocomprimentodecadaclasseeoslimitesde classe podem ser obtidos somando-se o comprimentode classea partir dovalor mnimodos dados. Continuandocom onossoexemplo,ocomprimentodeclassee30 5 = 6;seovalormnimodosdadose4,entaooslimitesdeclasseserao4 + 6 = 1010 + 6 = 1616 + 6 = 2222 + 6 = 2828 + 6 = 34easclassesserao:[4, 10)[10, 16)[16, 22)[22, 28)[28, 34)Note o tipo de intervalo utilizado: para incluir o valor mnimo (4) na primeiraclasse, ointervalotemqueserfechadonaparteinferior: [4. Sefechassemosointervalonolimite superior, o10estariaincludonaprimeiraclasse e,portanto, nao poderia estar nasegunda classe. Isso resultaria em [4, 10] comoa primeira classe e (10, 16) como a segunda classe. Ou seja, as duas primeirasclassesestariamdenidasdeformadiferente, oquenaoeconveniente, poisdiculta a leitura da tabela. Assim, e prefervel incluir o 10 na segunda classe,oqueresultanasclassesapresentadasanteriormente.Exemplo2.1Suponha que entre os 500 funcionarios da nossa empresa, o menorsalarioseja2800eomaior salariosejade12400. Paraagrupar os dadosem5classesdevemosfazeroseguinte:total= VM axVMn = 12400 2800 = 9600Proximom ultiplode5 = 9605Comprimentodeclasse =96055= 1921CEDERJ30Apresenta caodedados-parte2AULA2Oslimitesdeclasse,entao,sao:28002800 + 1921 = 47214721 + 1921 = 66426642 + 1921 = 85638563 + 1921 = 1048410484 1921 = 12405easclassespodemserdenidascomo[2800, 4721) (2800includo;4721excludo)[4721, 6642) (4721includo;6642excludo)[6642, 8563) (6642includo;8563excludo)[8563, 10484) (8563includo;10484excludo)[10484, 12405) (10484includo;12405excludo)Essaeumaregraqueresultaemclassescorretamentedenidas, masnem sempre as classes resultantes sao apropriadas ou convenientes. No exem-plo acima, poderia ser prefervel trabalhar com classes de comprimento 2000,denindoolimiteinferiordosdadoscomo2500. Issoresultarianasclasses[2500,4500); [4500,6500); [6500,8500); [8500, 10500) e [10500, 12500), que saoclassescorretasemaisfaceisdeler.Atividade2.2Construaumadistribui caodefreq uenciasagrupadasem5classesdemesmocomprimentoparaosdadosdesalariosdaTabela2.2.Histogramasepolgonosdefreq uenciaO histograma e o polgono de freq uencias sao gracos usados para repre-sentarumadistribui caodefreq uenciassimplesdeumavariavelquantitativacontnua.Umhistograma e um conjuntode retangulos com basessobre um eixohistogramahorizontal divididodeacordocomoscomprimentosdeclasses, centrosnospontos medios das classes e areas proporcionais ouiguais `as freq uencias.Vamosilustraraconstru caodeumhistogramausandocomoexemploadis-tribui cao de freq uencia dos dados sobre salarios da Atividade 2.2, reproduzidanaTabela2.3.31CEDERJApresenta caodedados-parte2Tabela2.3: Distribui caodossalariosdosfuncionariosdoDepartamentodeRHClasse Freq uenciaSimples Freq uenciaAcumuladadesalario Absoluta Relativa% Absoluta Relativa%[3200,4021) 4 26,67 4 26,67[4021,4842) 2 1,33 6 40,00[4842,5663) 2 1,33 8 53,33[5663,6484) 3 20,00 11 73,33[6484,7305) 4 26,67 15 100,00Total 15 100,00Comoasclassestemomesmocomprimento,ohistograma,nessecaso,podeserconstrudodetalmodoqueasalturasdosretangulossejamiguais`asfreq uenciasdasclasses. Dessaforma,asareasseraoproporcionais(enaoiguais) `as freq uencias, conforme ilustrado no graco ` a esquerda na Figura 2.1.Nograco`adireitanessamesmagura, aareadecadaretanguloeigual `afreq uenciarelativadaclasseeaalturadecadaclasseecalculadausando-seaexpressaoquedaaareadeumretangulo. Porexemplo, paraaclasse[3200,4021), a freq uencia (area) e415= 0, 266667 e a base do retangulo (com-primentodeclasse) e821. Logo, aalturahdoretangulocorrespondenteeh =0, 266667821= 0, 000325Oresultadodessadivisaoedenominadodensidade, umavezquedaacon-densidadecentra caoemcadaclasseporunidadedavariavel. Emambososgracos,aformadosretangulos eamesma;oquemudaeaescalanoeixovertical.Demodogeral, quandoasclassestemomesmocomprimentoeessaeasitua caomaiscomumpodemosrepresentarasalturasdosretangulospelasfreq uenciasdasclasses,oquetornaogracomaisfacildeinterpretar.Figura2.1: Histogramasdadistribui caodossalariosdosfuncionariosdoDepartamentodeRH.CEDERJ32Apresenta caodedados-parte2AULA2Umpolgono de freq uencias e um graco de linha que se obtem unindopolgonodefreq uenciaspor uma poligonal os pontos correspondentes `as freq uencias das diversasclasses, centradas nos respectivos pontos medios. Mais precisamente, saoplotados os pontos com coordenadas (ponto medio, freq uencia simples). Paraobterasinterse coesdapoligonal comoeixo, cria-seemcadaextremoumaclassecomfreq uencianula. NaFigura2.2temosopolgonodefreq uenciaspara a renda dos funcionarios do Departamento de Recursos Humanos. Pode-se construiro polgono de freq uencias juntocom o histograma, oque facilitaavisualiza caodosresultados.Figura2.2: Polgonodefreq uenciaparaossalariosdosfuncionariosdoDepartamentodeRH.Atividade2.3NaTabela2.4abaixotemos as notas de50alunos emumaprova.Construaumatabeladefreq uenciasagrupadas,usandoasclasses2 3, 3 4, 4 5, , 9 10.Construaohistogramaeopolgonodefreq uencias. (Osmbolo indicaqueolimiteinferiorestaincludo, masnaoosuperior; sequisessemos ocontrario, usaramos osmbolo paraindicar que olimitesuperiorestaincludo,masnaoolimiteinferior.)Tabela2.4: Notasde50alunosparaaAtividade2.32,9 3,7 3,8 4,7 4,9 5,2 5,6 5,8 6,0 6,26,3 6,3 6,3 6,5 6,5 6,6 6,8 6,8 6,9 6,97,0 7,0 7,1 7,3 7,3 7,4 7,4 7,5 7,5 7,67,6 7,7 7,7 7,9 8,1 8,1 8,2 8,2 8,3 8,38,4 8,5 8,7 8,7 8,8 8,9 9,0 9,1 9,4 9,733CEDERJApresenta caodedados-parte2DiagramaderamosefolhasUmoutrogracousadoparamostraraformadadistribui caodeumconjuntode dados quantitativos eo diagramade ramos e folhas, desen-ramoefolhasvolvidopeloestatsticoamericanoJohnTukey. Estegraco e constitudodeumalinhavertical, comaescalaindicada`aesquerdadestalinha. Aescala,naturalmente,dependedos valores observados,mas deve ser escolhidade talformaquecadavalorobservadopossaserquebradoemduaspartes: umaprimeirapartequanticadapelovalor daescalaeasegundaquanticadapelo ultimoalgarismodon umerocorrespondente`aobserva cao. Os ramosramosdo graco correspondem aos n umeros da escala, `a esquerda da linha vertical.Jaas folhassaoosn umeros queaparecemnaparte direita. Na Figura2.3folhastemosodiagramaderamosefolhasparaasnotasde50alunosdadasnaTabela2.4. Nesse caso, a quebra dos valores e bastante natural: os ramossaoformadospeloalgarismointeiroeasfolhaspelosalgarismosdecimais, oque eindicadopelaescaladograco.Figura2.3: Notasde50alunos.O diagrama de ramos e folhas tambem e util na compara cao de conjun-tosdedados. Suponhaque, noexemploacima, amesmaprovatenhasidoaplicadaaduasturmasdiferentes. Paracompararosresultados, podemosconstruirodiagramaqueseencontranaFigura2.4. Parafacilitaracom-para cao, eusual indicar on umerodedadosemcadabandadodiagrama.Noteque, naparteesquerdadograco, asfolhas saoanotadascrescente-mentedadireitaparaaesquerda,enquantoque,napartedireitadograco,asfolhassaoanotadascrescentementedaesquerdaparaadireita.CEDERJ34Apresenta caodedados-parte2AULA2Figura2.4: Compara cao dasnotasde2turmas.Atividade2.4Suponha que as idades dos 23 funcionarios do Departamento Financeirosejam27;31;45;52;33;34;29;27;35;38;50;48;29;30;32;29;42;41;40;42; 28; 36; 48. UsandoessesdadoseaquelesapresentadosnaTabela2.2sobreosfuncionariosdoDepartamentodeRecursosHumanos,construaumdiagramaderamosefolhasparacompararos2departamentos.GracosdelinhasOgraco de linhas e usado principalmente para representar observa coesgr aficodelinhasfeitas ao longo do tempo, isto e, observa coes de uma serie de tempo. No eixoserietemporalhorizontalcolocam-seasdatasemqueforamrealizadasasobserva coesenoeixovertical,osvaloresobservados. Ospontosassimobtidossaounidosporsegmentosderetaparafacilitar avisualiza caodocomportamentodosdadosaolongodotempo. NaFigura2.5temosogracoqueilustraoconsumoderefrigerante(emmilhoesdelitros)noperodode1986a2005, conformedadosdaABIR.Figura2.5: Consumoderefrigerante 1986-2005.35CEDERJApresenta caodedados-parte2Na Tabela2.5 temos dados sobre o n umero de homicdios nos estadosdo Rio de Janeiroe de Sao Paulono perodo de 1980 a 2002. Para efeitos decompara cao, epossvelconstruirumgracodelinhasemqueas2seriessaorepresentadasconjuntamente. VejaaFigura2.6.Tabela2.5: N umerodehomicdios-RJeSP-1980a2002Ano RJ SP Ano RJ SP1980 2946 3452 1992 4516 90221981 2508 4187 1993 5362 92191982 2170 4183 1994 6414 99901983 1861 5836 1995 8183 115661984 2463 7063 1996 8049 123501985 2550 7015 1997 7966 125221986 2441 7195 1998 7569 140011987 3785 7918 1999 7249 158101988 3054 7502 2000 7337 156311989 4287 9180 2001 7304 157451990 7095 9496 2002 8257 144941991 5039 9671Figura 2.6: N umerode homicdios nos estados doRiode Janeiroe de S aoPaulo19802002.CEDERJ36Apresenta caodedados-parte2AULA2ResumodaAulaNestaaula, vocecompletouseuestudosobreapresenta caodedadosquantitativos com o estudo das distribui coes de freq uencias agrupadas.Certique-se de ter compreendido a forma de obter os limites dasclasses,respeitandoo fato de que cada observa cao tem que pertencer auma unica classe (as classes tem que ser exaustivas e mutuamente exclu-sivas). Asdistribui coesdefreq uenciasagrupadaspodemserrepresen-tadasgracamentepeloshistogramasepelospolgonosdefreq uencia.O histograma e um graco representado por um conjunto de retanguloscombase sobreumeixohorizontal divididode acordocomos com-primentos das classes. As bases dos retangulos estaocentradas nospontosmediosdasclasseseaareadecadaretanguloeproporcional`afreq uenciadaclasse. Quandoasclassestemcomprimentosiguais, asalturasdosretangulospodemseriguais`asfreq uenciasdasrespectivasclasses.Opolgonodefreq uenciaseumgracoemformadeumapoligonal,queuneospontosdecoordenadas(pontomediodaclasse, freq uenciadaclasse).Na constru cao do diagrama de ramos e folhas, cada valor e quebradoemduaspartes, demodoqueumadaspartes-afolha-correspondaao ultimoalgarismodovalor. Aoutraparte eoramoeemcadaramocolocam-seasfolhaspertencentesaoramo.Osgracosdelinhasaoutilizadosnarepresenta caodeseriestempo-rais,quesaodadosobservadosaolongodotempo. Noeixohorizontalrepresentam-seasdatasemqueosdadosforamcoletadosenaescalavertical,osvaloresobservados.Exerccios1. Numestudosobreajornadadetrabalhodas empresas deProdutosAlimentares foramlevantados os dados daTabela 2.6relativos aototal dehorastrabalhadaspelos funcionarios nomes deagosto(da-dos ctcios). Construaumatabeladefreq uencias usando5classesdemesmotamanho; construatambemohistogramaeopolgonodefreq uencias. Parafacilitarasolu cao,osvaloresmnimoemaximosao:1.815e118.800.37CEDERJApresenta caodedados-parte2Tabela2.6: JornadadetrabalhodeempresasalimentaresparaoExerccio2.63.960 5.016 13.015 8.008 6.930 5.544 4.224 6.138118.800 57.904 72.600 100.100 55.935 7.223 3.775 4.2243.216 7.392 2.530 6.930 1.815 4.338 8.065 10.9108.408 8.624 6.864 5.742 5.749 8.514 2.631 5.2368.527 3.010 5.914 11.748 8.501 6.512 11.458 10.0946.721 2.631 7.082 10.318 8.008 3.590 7.128 7.92910.450 6.780 5.060 5.544 6.178 13.763 9.623 14.88317.864 34.848 25.300 52.800 17.732 63.923 30.360 18.87630.800 19.562 49.240 49.434 26.950 22.308 21.146 14.21225.520 49.251 30.976 23.338 43.648 26.796 44.880 30.00830.769 16.907 33.911 27.034 16.500 14.445 28.160 42.44216.507 36.960 67.760 84.084 89.888 65.340 82.280 86.15291.080 99.792 77.836 76.0322. Na Tabela2.7 temos a popula cao dos municpios de MG com mais de50.000habitantes, combasenos dados doCensoDemograco2000.Construa uma tabela de freq uencias, trabalhando comas seguintesclasses (em1.000hab.): [50,60), [60,70), [70,80), [80,100), [100,200),[200, 500) e 500oumais. Noteque aqui estamos trabalhandocomclasses desiguais, oque e comumemsitua coes desse tipo, onde hamuitosobserva coespequenasepoucasgrandes.CEDERJ38Apresenta caodedados-parte2AULA2Tabela2.7: Popula caodosmunicpiosdeMGcommaisde50.000habitantes, paraoExerccio2.7Municpio Popula c ao Municpio Popula c ao Municpio Popula c aoLeopoldina 50.097 Tim oteo 71.478 Varginha 108.998Pirapora 50.300 Par adeMinas 73.007 Barbacena 114.126tresPontas 51.024 Patrocnio 73.130 Sabar a 115.352S aoFrancisco 51.497 Paracatu 75.216 PatosdeMinas 123.881PedroLeopoldo 53.957 Vespasiano 76.422 Te oloOtoni 129.424PonteNova 55.303 Ita una 76.862 Ibirite 133.044S.Seb.doParaso 58.335 Caratinga 77.789 Po cosdeCaldas 135.627Jana uba 61.651 S.Jo aodelRei 78.616 Divin opolis 183.962Formiga 62.907 Lavras 78.772 SeteLagoas 184.871Janu aria 63.605 Arax a 78.997 SantaLuzia 184.903Cataguases 63.980 Itajub a 84.135 Ipatinga 212.496NovaLima 64.387 Ub a 85.065 Ribeir aodasNeves 246.846Vi cosa 64.854 Ituiutaba 89.091 Gov.Valadares 247.131TresCora c oes 65.291 Muriae 92.101 Uberaba 252.051OuroPreto 66.277 Passos 97.211 Betim 306.675Jo aoMonlevade 66.690 Cor. Fabriciano 97.451 MontesClaros 306.947Alfenas 66.957 Itabira 98.322 JuizdeFora 456.796Manhua cu 67.123 Araguari 101.974 Uberl andia 501.214Curvelo 67.512 Cons.Lafaiete 102.836 Contagem 538.017Una 70.033 PousoAlegre 106.776 BeloHorizonte 2.238.526Fonte: IBGE -CensoDemograco 20003. Na Tabela 2.8 temos a densidade populacional (hab/km2) das unidadesdafedera caobrasileira. Construaumgracoramo-e-folhasparaessesdados. Para RJ e DF, voce pode dar umsalto na escala,de modo anaoacrescentarmuitosramosvazios.39CEDERJApresenta caodedados-parte2Tabela2.8: Densidadepopulacionaldosestadosbrasileiros, paraoExerccio2.8UF DensidadePopulacional UF DensidadePopulacional(hab/km2) (hab/km2)RO 6 SE 81AC 4 BA 24AM 2 MG 31RR 2 ES 68PA 5 RJ 328AP 4 SP 149TO 5 PR 48MA 17 SC 57PI 12 RS 37CE 51 MS 6RN 53 MT 3PB 61 GO 15PE 81 DF 353AL 102Fonte: IBGE-CensoDemograco20004. Construa um graco de linhas para os dados da ina cao brasileira anualmedidapeloIndiceNacional dePre cosaoConsumidor(INPC)apre-sentadosnaTabela2.9.CEDERJ40Apresenta caodedados-parte2AULA2Tabela2.9:IndiceNacionaldePre cosaoConsumidor-1995-2005Ano INPC(%)1995 22,01996 9,11997 4,31998 2,51999 8,42000 5,32001 9,42002 14,72003 10,42004 6,12005 5,1SolucaodasAtividadesAtividade2.1VejaaTabela2.10.Tabela2.10: Distribui caodefreq uenciadaidadedosfuncionariosdoDeptodeRHFaixa Freq uenciaSimples Freq uenciaAcumuladaEtaria Absoluta Relativa% Absoluta Relativa%24 28 4 26,67 4 26,6729 33 3 20,00 7 46,6734 38 4 26,67 11 73,3339 43 1 6,67 12 80,0044 48 1 6,67 13 86,6749 53 2 13,33 15 100,0Total 15 100,0041CEDERJApresenta caodedados-parte2Atividade2.2Ovalormnimoe3200eovalormaximoe7300. Dessaforma, aam-plitudeexata e 7300 3200 = 4100e oproximom ultiplode5 e4105. Logo,ocomprimentodecadaclassee41055= 821.Obtem-seaTabela2.11.Tabela2.11: Distribui caodossalariosdosfuncionariosdoDeptodeRHFaixa Freq uenciaSimples Freq uenciaAcumuladasalarial Absoluta Relativa% Absoluta Relativa%3200 4021 4 26,67 4 26,674021 4842 2 13,33 6 40,004842 5663 2 13,33 8 53,335663 6484 3 20,00 11 73,336484 7305 4 26,67 15 100,00Total 15 100,00Atividade2.3VejaaTabela2.12eosgracosnasFiguras2.7e2.8.Tabela2.12: Distribui caodefreq uenciadasnotasde50alunosNotas Freq uenciaSimples Freq uenciaAcumuladaAbsoluta Relativa(%) Absoluta Relativa(%)2 3 1 2,0 1 2,03 4 2 4,0 3 6,04 5 2 4,0 5 10,05 6 3 6,0 8 16,06 7 12 24,0 20 40,07 8 14 28,0 34 68,08 9 12 24,0 46 92,09 10 4 8,0 50 100,0Total 50 100,0CEDERJ42Apresenta caodedados-parte2AULA2Figura2.7: Histogramadadistribui caodasnotasde50alunos.Figura2.8: Polgono defreq uenciadadistribui caodasnotasde50alunos.Atividade2.4VejaaFigura2.9.Figura2.9: IdadesdosfuncionariosdoDepartamentoFinanceiro.SolucaodosExerccios1. Os valores mnimo e maximo sao, respectivamente, 1815 e 118800, o quefornece uma amplitude exata de 116985. Tomando o proximo m ultiplo43CEDERJApresenta caodedados-parte2de 5, aamplitude efetivapassaaser 116990, oque daumcompri-mentodeclasse1169905=23398. VejaaTabela2.13eosgracosnaFigura2.10.Tabela2.13: Distribui caodefreq uenciadon umerodehorastrabalhadasN umerode Freq uenciaSimples Freq uenciaAcumuladaHorasTrabalhadas Absoluta Relativa(%) Absoluta Relativa(%)1815 25213 63 63,0 63 63,025213 48611 17 17,0 80 80,048611 72009 9 9,0 89 89,072009 95407 8 8,0 97 97,095407 118805 3 3,0 100 100,0Total 100 100,0Figura2.10: Distribui caodajornadadetrabalhodeempresasalimentares.CEDERJ44Apresenta caodedados-parte2AULA22. VejaaTabela2.14.Tabela2.14: Popula cao dosmunicpiosmineiroscommaisde50000habitantesPopula cao Freq uenciaSimples Freq uenciaAcumulada(em1000hab Absoluta Relativa(%) Absoluta Relativa(%)50 60 7 11,67 7 11,6760 70 12 20,00 19 31,6770 80 11 18,33 30 50,0080 90 3 5,00 33 55,0090 100 4 6,67 37 61,67100 200 13 21,67 50 83,33200 500 7 11,67 57 95,00500oumais 3 5,00 60 100,00Total 60 100,03. VejaaFigura2.11.Figura2.11: DensidadepopulacionaldasUFsbrasileiras.45CEDERJApresenta caodedados-parte24. VejaaFigura2.12.Figura2.12: Ina caobrasileira anual.CEDERJ46Medidasdeposi caoAULA3Aula3MedidasdeposicaoNestaaula, voceestudaraasmedidasdeposi caodeumadistribui caodedadoseaprenderaosseguintesconceitos:mediamedianamodaMedidasdeposicaooutendenciacentralA redu cao dos dados atraves de tabelas de freq uencias ou gracos e umdosmeiosdisponveisparaseilustrarocomportamentodeumconjuntodedados. Noentanto, muitasvezesqueremosresumiraindamaisessesdados,apresentandoum unicovalor quesejarepresentativodoconjuntooriginal.Asmedidasdeposi caooutendenciacentral, comooproprionomeestain-dicando, saomedidasqueinformamsobreaposi caotpicadosdados. NaFigura3.1podemosnotarosseguintesfatos: em(a) e(b),asdistribui coessao identicas, exceto pelo fato de que a segunda esta deslocada `a direita. Em(c),podemosverquehaduasclassescomafreq uenciamaximae em(d),hauma grande concentra cao na cauda inferior e alguns poucos valores na caudasuperior. Asmedidas deposi caoqueapresentaremos aseguir iraocaptaressasdiferen cas.MediaaritmeticasimplesNo nosso dia-a-dia, o conceito de media e bastante comum, quando nosreferimos,por exemplo,`aalturamediados brasileiros,` atemperaturamediados ultimosanos,etc.47CEDERJMedidasdeposi caoFigura3.1: Exemplosilustrativosdoconceitodemedidasdeposi c ao.DenicaoDadoumconjuntodenobserva coesx1, x2, . . . , xn, amediaaritmeticasimplesedenidacomox =x1 +x2 + +xnn=1nni=1xi. (3.1)Anota caox(le-sexbarra), usadaparaindicar amedia, ebastantecomum;emgeral,usa-seamesmaletrautilizadaparaindicarosdadoscomabarraemcima. Nadeni caoacimafazemosusodosmbolodesomatorio,representadopelaletragregasigmamai uscula, . Nestaaulavoce aindaaprenderamaissobreessesmbolo. Por enquanto, entendacomoamediaaritmeticadeumconjuntodedadosecalculada. Aprimeiraobserva caoeque ela so pode ser calculada para dados quantitativos (nao faz sentido somarmasculino+feminino!). Oseucalculo efeitosomando-setodososvaloresedividindo-sepelon umerototaldeobserva coes.Consideremos as idades dos funcionarios do Departamento de RecursosHumanos, analisadasnaaulaanterioreapresentadas noramoefolhasdaFigura3.2.CEDERJ48Medidasdeposi caoAULA3Figura3.2: IdadedosfuncionariosdoDepartamentodeRH.Aidademediae:x =24 + 25 + 26 + 26 + 29 + 29 + 31 + 35 + 36 + 37 + 38 + 42 + 45 + 51 + 5315=52715= 35, 13Como as idades estao em anos, a idade media tambem e dada nessa unidade,ouseja, aidademediae35,13anos. Emgeral,amediadeumconjuntodedadostemamesmaunidadedosdadosoriginais.A interpreta cao fsica da media aritmetica e que ela representa o centrode gravidade da distribui cao;nos quatro histogramas da Figura3.1, ela e oponto de equilbrio, indicado pela seta. Note que o valor da media aritmeticae umvalor tal que, se substitussemos todos os dados por ela, istoe, setodasas observa coes fossemiguais`amediaaritmetica, asomatotal seriaigual `asomadosdadosoriginais. Entao, amediaaritmeticaeumaformade se distribuir ototal observadopelos nelementos, de modoque todostenhamomesmovalor. Considereosseguintesdadosctciosreferentesaossalariosde5funcionariosdeumarma: 136, 210, 350, 360, 2500. Ototaldafolhadepagamentose3236, havendoumsalariobastantealto, discrepantedosdemais. Amediaparaessesdadose647,20. Setodosos5funcionariosganhassemessesalario, a folha depagamentos seriaa mesmae todos teriamomesmosalario.ModaNohistograma(c)daFigura3.1, duasclassesapresentamamesmafreq uenciamaxima. Esseeoconceitodemoda.49CEDERJMedidasdeposi caoDenicaoAmodadeumadistribui caoouconjuntodedados, querepresentaremosporx, eovalorquemaisserepete,ouseja,ovalormaisfreq uente.Podemosterdistribui coesamodais (todososvaloresocorremomesmon umero de vezes), unimodais (uma moda), bimodais (duas modas), etc. ParaosdadosdaFigura3.2temosasseguintesmodas: x=26ex= 29anose,portanto,essaeumadistribui caobimodal. Assimcomoamedia,amodasempretemamesmaunidadedosdadosoriginais.MedianaVamos analisar novamente os seguintes dados referentes aos salarios (emR$)de5funcionariosdeumarma: 136, 210, 350, 360, 2500.Comovisto, osalariomedioeR$647,20. Noentanto, essevalornaorepresentabemnemos salarios mais baixos, nemosalariomais alto. Issoacontece porque osalariomais altoemuitodiferente dos demais. Esse exemploilustraumfatogeral sobre amediaaritmetica: elae muitoinuenciada por valoresdiscrepantes (emingles, outliers), istoe, valoresmuitograndes(oumuitopequenos) que sejamdistintos damaior partedos dados. Nesses casos enecessario utilizar uma outra medida de posi cao para representar o conjunto;umamedidapossveleamediana.DenicaoSejax1, x2, . . . , xnumconjuntodenobserva coesesejax(i), i=1, . . . , noconjuntodasobserva coesordenadas,demodoquex(1) x(2) x(n).Entao, amediana Q2e denida como o valor tal que 50% das observa coessaomenores queelae50%saomaiores queela. Paraefeitodecalculo,valemasseguintesregras:n mpar : Q2= x(n+12)npar : Q2=x(n2) +x(n2+1)2(3.2)Dessa deni cao, podemos ver que a mediana e o valor central dos dadose para calcula-la e necessario ordenar os dados. Para as idades na Figura 3.2,CEDERJ50Medidasdeposi caoAULA3temos queon umerototal deobserva coesen=15. Logo, amedianaeovalor central,que deixa7 observa coesabaixo e 7 observa coesacima. Logo, amedianaeaoitavaobserva cao,umavezquen + 12=15 + 12= 8Sendoassim, aidademedianaeQ2=35anos. Aunidadedamedianaeamesmadosdados.Exemplo3.1Naaulaanterior,analisamososdadosreferentesaon umerodedepen-dentesdosfuncionariosdoDepartamentodeRecursosHumanos,apresenta-dosnovamentenatabelaabaixo.Nome No.dedependentes Nome No.dedependentesJoaodaSilva 3 PatrciaSilva 2PedroFernandes 1 ReginaLima 2MariaFreitas 0 AlfredoSouza 3PaulaGon calves 0 MargareteCunha 0AnaFreitas 1 PedroBarbosa 2LuizCosta 3 RicardoAlves 0AndreSouza 4 MarcioRezende 1AnaCarolinaChaves 0Vamoscalcular as medidasdeposi caopara essesdados. Ordenando-ostemososeguinte:0 0 0 0 0 1 1 1 2 2 2 3 3 3 4Amedia ex =5 0 + 3 1 + 3 2 + 3 3 + 1 415=2215= 1, 47ou seja, em media temos 1,47 dependentespor funcionario do DepartamentodeRH.Amoda e0dependenteeamediana e(n = 15)Q2= x(15+12) = x(8)= 1dependente51CEDERJMedidasdeposi caoAtividade3.1NaAtividade 2.1, voce analisouos dados sobre os salarios dos fun-cionarios do Departamento de Recursos Humanos, cujos valores (em R$) saoosseguintes:6300 5700 4500 3800 3200 7300 7100 56006400 7000 3700 6500 4000 5100 4500Calculeamedia, amodaeamedianaparaessesdados, especicandoasrespectivasunidades.Atividade3.2Calcule a nota media, a nota modal e a nota mediana para os dados daTabela3.1.Tabela3.1: Notasde50alunosparaaAtividade3.22,9 3,7 3,8 4,7 4,9 5,2 5,6 5,8 6,0 6,26,3 6,3 6,3 6,5 6,5 6,6 6,8 6,8 6,9 6,97,0 7,0 7,1 7,3 7,3 7,4 7,4 7,5 7,5 7,67,6 7,7 7,7 7,9 8,1 8,1 8,2 8,2 8,3 8,38,4 8,5 8,7 8,7 8,8 8,9 9,0 9,1 9,4 9,7SomatorioAnota caodesomatorioebastante util naapresenta c aodeformulas,poiseleresumedeformabastantecompactaaopera caodesomadevariasparcelas. Paracompreenderaspropriedadesdosomatorio,bastalembraraspropriedadesdaadi cao.Paradesenvolverumsomatorio,temosquesubstituirovalordo ndiceem cadauma das parcelas e em seguidarealizar a somadessasparcelas. Porexemplo:5i=1i2= 12+ 22+ 32+ 42+ 52CEDERJ52Medidasdeposi caoAULA3Emtermosmaisgerais,temosasseguintespropriedades:ni=1(xi +yi) = (x1 +y1) + (x2 +y2) + + (xn +yn) == (x1 +x2 + +xn) + (y1 +y2 + +yn) ==ni=1xi +ni=1yini=1kxi= kx1 +kx2 + +kxn== k(x1 +x2 + +xn) == kni=1xini=1k= k +k + +k = nkEimportantesalientaralgumasdiferen cas:ni=1x2i =

ni=1xi

2umavezqueni=1x2i= x21 +x22 + +x2ne

ni=1xi

2= (x1 +x2 + +xn)2Temostambemqueni=1xiyi =

ni=1xi

ni=1yi

umavezqueni=1xiyi = x1y1 +x2y2 + +xnyne

ni=1xi

ni=1yi

= (x1 +x2 + +xn)(y1 +y2 + +yn)53CEDERJMedidasdeposi cao`Amedidadonecessarioiremosapresentandomaispropriedadesdoso-matorio.Atividade3.3Calculeasseguintesquantidadesparaosdadosabaixo:6i=1xi6i=1fi6i=1fixi6i=1fix2ii 1 2 3 4 5 6fi3 5 9 10 2 1xi10 11 15 19 21 26MediaaritmeticaponderadaVimosqueamediaaritmeticaequivaleadividirotodo(somadosvalores) em partes iguais, ou seja, estamos supondo que os n umeros que que-remossintetizartemomesmograu deimportancia. Entretanto,haalgumassitua coesondenaoerazoavel atribuiramesmaimport anciaparatodososdados. Porexemplo, oIndiceNacional dePre cosaoConsumidor (INPC)ecalculadocomumamediados IndicesdePre coaoConsumidor(IPC)dediversasregioesmetropolitanasdoBrasil, masaimportanciadessasregioesediferente. Umadasvariaveisqueasdiferenciaeapopula caoresidente.Nessetipodesitua cao, emvezdeseusaramediaaritmeticasimples,usa-seamediaaritmeticaponderada,queserarepresentadaporxp.DenicaoAmedia aritmetica ponderadade n umeros x1, x2, . . . , xncompesos1, 2, . . . , nedenidacomoxp=1x1 +2x2 + +nxn1 +2 +. . . +n=ni=1ixini=1i. (3.3)Sedenimosi=inj=1j(3.4)CEDERJ54Medidasdeposi caoAULA3entaoamediaaritmeticaponderadapodeserreescritacomoxp=ni=1ixi(3.5)ondeni=1i= 1.Notequeamediaaritmeticasimpleseumcasoparticular damediaaritmeticaponderada, onde todas as observa coes tem o mesmopeso i=1n.Para a constru cao doIndice Nacional de Pre cos ao Consumidor - INPC,opesodecada ndiceregional edenidopelapopula caoresidenteurbana,conforme dados da Tabela 3.2. Os pesos em porcentagem a apresentados re-presentam a participa cao da popula cao residente urbana da regiao metropoli-tananototal dapopula caoresidenteurbanadas11regioesmetropolitanaspesquisadas. O ndicegeral edadopelamediaponderada:INPC03/06= 0, 0306 0, 75 + 0, 0915 0, 64 + 0, 0623 0, 55 + 0, 0919 0, 52 +0, 0749 0, 50 + 0, 0425 0, 48 + 0, 0378 0, 48 + 0, 0385 0, 44 +0, 3626 0, 37 + 0, 0334 0, 37 + 0, 1340 0, 18= 0, 427137Tabela3.2: Estrutura basica de pondera cao regional para calculo do INPC - Mar co 2006AreaGeograca Peso(%) IPC-Mar/06Braslia 3,06 0,75BeloHorizonte 9,15 0,64Salvador 6,23 0,55PortoAlegre 9,19 0,52Curitiba 7,49 0,50Recife 4,25 0,48Goiania 3,78 0,48Belem 3,85 0,44SaoPaulo 36,26 0,37Fortaleza 3,34 0,37RiodeJaneiro 13,40 0,18INPC-Geral 0,42Fonte: IBGE55CEDERJMedidasdeposi caoAtividade3.4Segundo o criterio de avalia cao adotado pelo Departamento de Es-tatstica, cadaalunoserasubmetidoa2provas, aprimeiratendopeso2easegundatendopeso3. Paraseraprovadosemterquefazerprovanal,amedianas2provastemqueser, nomnimo, 6. Seumalunotirar5,5naprimeiraprova, quantodeveratirar nasegundaprovapara naoter quefazerprovanal?Eseasprovastivessemomesmopeso?PropriedadesdasmedidasdeposicaoDa interpreta cao fsica de media como centro de gravidade da dis-tribui cao,caclaroqueamediaesempreumvalorsituadoentreosvaloresmnimoemaximodosdados. Omesmoresultadovaleparaamedianaeamoda, o que e imediato a partir das respectivas deni coes. Resumindo temos:Propriedade1xmin x xmaxxmin Q2 xmax(3.6)xmin x xmaxVamosapresentarasoutrasduaspropriedadesatravesdoseguinteex-emplo. EmumaturmadeEstatstica, osresultadosdeumaprovacaramabaixodoqueaprofessoraesperava. Comotodososalunosvinhamparti-cipandoativamentedetodasasatividades,mostrandouminteresseespecialpela materia, a professora resolveu dar 1 ponto na prova para todos os alunos.Alemdisso, eladeuosresultadoscomasnotasvariandode0a10, masaSecretariadaFaculdadeexigequeasnotassejamdadasemumaescalade0a100. Sendoassim, aprofessoraprecisamultiplicartodasasnotaspor10.Oqueacontececomamedia,amodaeamedianadepoisdessasaltera coes?Vamos verissocom umconjuntode 5 notas: 5, 4, 2, 3, 4. Asnotas ordenadassao2, 3, 4, 4, 5 etemosasseguintesmedidasdeposi cao:x =5 + 4 + 2 + 3 + 45=185= 3, 6Q2= x= 4CEDERJ56Medidasdeposi caoAULA3Somando 1 ponto, as notas passam a ser 3, 4, 5, 5, 6 com as seguintes medidasdeposi cao:y =3 + 4 + 5 + 5 + 65=235= 4, 6 = 3, 6 + 1Q2,y= y= 5 = 4 + 1Aosomar1pontoemtodasasnotas, oconjuntodenotassofreumatransla cao, oque fazcomqueoseucentrotambemque deslocadode1ponto. Sendoassim, todasastresmedidasdeposi caocamsomadasde1ponto.Multiplicandoasnovasnotaspor10,obtemos30, 40, 50, 50, 60 ez =30 + 40 + 50 + 50 + 605=2305= 46, 0 = 4, 6 10Q2,z= z= 50 = 5 10ouseja,todasasmedidasdeposi caocammultiplicadaspor10.Esseexemploilustraasseguintespropriedades.Propriedade2Somando-seummesmovaloracadaobserva caoxi, obtemosumnovoconjuntodedadosyi=xi+ kparaoqual temosasseguintesmedidasdeposi cao:yi = xi +k

y= x +kQ2,y= Q2,x +ky = x +k(3.7)Propriedade3Multiplicando cada observa cao xi por uma mesma constante nao nula k,obtemos um novo conjuntode dados yi = kxipara o qual temos as seguintesmedidasdeposi cao:yi = kxi

y= kxQ2,y= kQ2,xy = kx(3.8)57CEDERJMedidasdeposi caoAtividade3.5Arela caoentreasescalasCelsiuseFahrenheit easeguinte:C=59(F 32)Se a temperatura media emdeterminada localidade e de 45F, qual e atemperaturamediaemgrausCelsius?Atividade3.6Emumacertapesquisa, foramlevantadosdadossobreolucrolquidodeumaamostradegrandesempresas,emreais,obtendo-sea mediadeR$ 1035 420,00. Na divulga cao dos resultados,os valores devem ser apresentadosemmilharesdereais. Qual eovaloraserdivulgadoparaolucromedio?Medidasdeposicaoparadistribuicoesdefreq uenciasagrupadasConsidereadistribui caodefreq uenciasdosalariodosfuncionariosdoDepartamentodeRecursosHumanosreproduzidanaTabela3.3.Tabela3.3: Distribui caodarendadosfuncionariosdoDepartamentodeRHClasse Ponto Freq uenciaSimples Freq uenciaAcumuladaderenda medio Absoluta Relativa% Absoluta Relativa%[3200,4021) 3610,5 4 26,67 4 26,67[4021,4842) 4431,5 2 1,33 6 40,00[4842,5663) 5252,5 2 1,33 8 53,33[5663,6484) 6073,5 3 20,00 11 73,33[6484,7305) 6894,5 4 26,67 15 100,00Total 15 100,00Essa tabela foi construda a partir dos dados da Tabela2.2, analisadanaaulaanterior. Imagine, agora, quenaodispusessemosdaquelesdadosesonosfossefornecidaaTabela3.3. Comopoderamoscalcularamedia,amodaeamediana?Issoeoquevoceaprenderanessapartenaldaaula.CEDERJ58Medidasdeposi caoAULA3MediaaritmeticasimplesQuandoagrupamososdadosemumadistribui caodefreq uencias, es-tamosperdendoinforma cao, umavezquenaoapresentamososvaloresin-dividuais. Informarapenasqueexistem4valoresnaclasse3200 4021nosobriga a escolher um valor tpico, representantede tal classe. Esse valor serasempre o ponto medio da classe. Entao a informa cao anterior e interpretadapontomediocomoaexistenciade4valoresiguaisa3610,5, queeopontomediodessaclasse. Essa e a interpreta caobasicadatabela de freq uencias: todososvalo-res de uma classe sao considerados iguais ao ponto medio da classe. O pontomedio da classe, por sua vez, e calculado como a media dos limites de classe.VejaacolunacriadacomessesvaloresnaTabela3.3.Ainterpreta caodatabeladefreq uenciasnosdizqueha4observa coesiguais a3610,5; 2observa coes iguais a4431,5; 2iguais a5252,5; 3iguaisa6073,5e4iguaisa6894,5. Entaoesses dadospodemservistoscomooseguinteconjuntodeobserva coes:3610, 53610, 53610, 53610, 5

4ocorrencias (3.9)4431, 54431, 52ocorrencias5252, 55252, 52ocorrencias6073, 56073, 56073, 5

3ocorrencias6894, 56894, 56894, 56894, 5

4ocorrencias59CEDERJMedidasdeposi caoParacalcularamediadessenovoconjuntodedadostemosquefazer:x =4 3610, 5 + 2 4431, 5 + 2 5252, 5 + 3 6073, 5 + 4 6894, 515==415 3610, 5 +215 4431, 5 +215 5252, 5 +315 6073, 5 +415 6894, 5 == 0, 2667 3610, 5 + 0, 1333 4431, 5 + 0, 1333 5252, 5+0, 20 6073, 5 + 0, 2667 6894, 5 == 5307, 2333Note, na pen ultima linha da equa cao anterior, que os pontos medios de cadaclassesaomultiplicadospelafreq uenciarelativadaclasse. Entao, amediadosdadosagrupadosemclasseseumamediaponderadadospontosmedios,ondeospesossaodenidospelasfreq uenciasdasclasses. Representandooponto medioda classe por xie por fia freq uencia relativa (nao multiplicadapor100),temosquex =ki=1fixi(3.10)Ospesos(freq uencias)aparecemexatamenteparacompensarofatodequeasclassestemn umerosdiferentesdeobserva coes.ModaEmbora existam metodos geometricos para se calcular a moda de dadosagrupados, taismetodosnaosaomuitoutilizadosnapratica. Sendoassim,estimaremos a moda de uma distribui cao de freq uencias agrupadas pelo pontomediodaclasse modal, quee aclasse de maior freq uencia. Noexemploanterior,temosumadistribui caobimodalcomx= 3610, 5ex= 6894, 5.MedianaComojavisto, amedianae ovalor que deixa50%das observa coesacimae50%abaixodela. Estandoosdadosagrupadosemclasses, existeummetodogeometricoqueproduzumaestimativadamediana. Asideiassubjacentesaessemetodosaoqueamedianadivideaomeiooconjuntodedados (ou seja, a deni cao de mediana) e que, no histograma da distribui cao,asareasdosretangulossaoproporcionais`asfreq uenciasrelativas.ConsidereohistogramadaFigura3.3,referenteaossalariosdosfun-cionarios do Departamento de Recursos Humanos. Nas duas primeiras classesCEDERJ60Medidasdeposi caoAULA3temos 40% das observa coes e nas tres primeiras classes temos 53,33%; logo, amediana e algum ponto da classemediana4842 5663 e abaixo dessepontotemos que ter 50% da distribui cao, ou seja, as areas dos 2 primeiros retangulosmaisaareadoretangulohachuradorepresentam50%dafreq uencia. Entao,paraidenticaramediana, devemosnotarquenaclassemedianacamfal-tando50%40% = 10%dadistribui caoparacompletar50%.EntaoaareaA1doretangulohachuradodeveserigual a10%, enquantoqueoretangulodaclassemedianatemareaAm= 13, 33%. Usandoaformulaquedaaareadeumretanguloobtem-se:A1= 0, 10 = (Q24842) hAm= 0, 1333 = (5663 4842) hondeh eaalturacomumdosdoisretangulos. Dividindoasduasigualdadestermoatermoobtem-seaseguinteregradeproporcionalidade:0, 100, 1333=Q24842821Q2= 5457, 904Figura3.3: Calculodamedianadossalarios dosfuncionariosdeRH.61CEDERJMedidasdeposi caoExemplo3.2Paraxarasideias, vamoscalcularamediaeamedianadaseguintedistribui cao:Classes Freq uenciaSimples Freq uenciaAcumuladaAbsoluta Relativa% Absoluta Relativa%0 5 5 6,25 5 6,255 10 15 18,75 20 25,0010 15 22 27,50 42 52,5015 20 18 22,50 60 75,0020 25 12 15,00 72 90,0025 30 8 10,00 80 100,00Total 80 100,00Ospontosmediosdasclassessao0 + 52= 2, 55 + 102= 7, 5 25 + 302= 27, 5eamediaecalculadacomox = 0, 0625 2, 5 + 0, 1875 7, 5 + 0, 2750 12, 5 + 0, 2250 17, 5 ++0, 15 22, 5 + 0, 10 27, 5= 15, 0625Note que e prefervel trabalhar com as freq uencias relativas em forma decimalpois, setrabalhassemoscomasfreq uenciasrelativasemformapercentual,teramosquedividiroresultadopor100! Lembre-sequeamediatemqueestarentreovalormnimo0eovalormaximo30.Dacolunadefreq uenciasrelativasacumuladas, vemosqueamedianaestanaterceiraclasse10 15. Nasduasprimeirasclassestemos25%dosdados;assim,estafaltando25%paracompletar50%. VejaaFigura3.4.Aregradetresresultante e:Q21025=15 1027, 5Q2= 14, 545CEDERJ62Medidasdeposi caoAULA3Figura3.4: CalculodamedianaparaoExemplo3.2.Atividade3.7Calculeamediaeamedianadaseguintedistribui cao:Classes Freq uencia4 6 106 8 128 10 1810 12 612 14 4Total 50ResumodaAulaNesta aula, voce estudou as principais medidas de posi cao ou de tendenciacentral,queilustramaposi caotpicados dados. Sejax1, x2, . . . , xnonossoconjuntodedados.Mediaaritmeticasimples- eovalordadoporx =x1 +x2 +. . . +xnn=1nni=1xicujainterpreta caogeometricacorrespondeaocentrodegravidadedadistribui cao.Moda-xeovalorquemaisserepete.63CEDERJMedidasdeposi caoMediana-considerandoosdadosordenadosx(1) x(2) x(n),amedianaQ2eovalorcentral, ouseja, amedianaeovalortal quemetadedasobserva coes emenorqueela:Q2= x(n+12)sen e mparQ2=x(n2 )+x(n2+1)2sen eparMedia aritmetica ponderada - se as observa coes tem pesos 1, 2, . . . , ntaisqueni=1i= 1,amediaponderada exp= 1x1 +2x2 +. . . +nxn=ni=1ixiMedia de dados agrupados em classes - e a media ponderada dos pontosmediosxidasclasses,emqueospesossaoasfreq uenciasrelativasfi:x =ifixiMedianadedadosagrupados-ecalculadapelaproporcionalidadedi-retadeareasnohistogramadadistribui cao.Media, medianaemodasaomedidasnamesmaunidadedosdadosesatisfazemasseguintespropriedades:xmin x xmaxxmin Q2 xmaxxmin x xmaxyi = k1xi +k2

y= k1x +k2Q2,y= k1Q2,x +k2y = k1x +k2Exerccios1. Quatro amigos trabalham em um supermercado em tempo parcial comosseguintessalarioshorarios:Pedro: R$3,50 Joao: R$2,60Marcos: R$3,80 Luiz: R$2,20Se Pedro trabalha 10 horas por semana, Joao 12 horas, Marcos 15 horaseLuiz8horas,qual eosalariohorariomediodessesquatroamigos?CEDERJ64Medidasdeposi caoAULA32. NaUFF, ocoeciente de rendimento(CR) semestral dos alunos ecalculadocomoumamediadasnotasnaisnasdisciplinas cursadas,levando em conta a carga horaria (ou credito) das disciplinas,de modoque disciplinas com maior carga horaria tem maior peso no CR. Suponhaqueumalunotenhacursado5disciplinas emumsemestre, obtendomedias naisde7,5; 6,1; 8,3; 6,5; 7,5. Astresprimeiras disciplinastinhamcargahorariade4horassemanais, aquarta, cargahorariade6horasea ultima, 2horassemanais. CalculeoCRdoalunonessesemestre.3. Em uma pesquisa sobre atividades de lazer realizada com uma amostrade20alunosdeumcampusuniversitario, perguntou-seon umerodehorasqueosalunosgastaramnavegandonaInternetnasemanaan-terior. Osresultadosobtidosforamosseguintes:15 24 18 8 10 12 15 14 12 1018 12 6 20 18 16 10 12 15 9Calculeamedia, amodaeamedianadessesdados, especicandoasrespectivasunidades.4. No nal do ano 2005, o dono de um pequeno escritorio de administra caodeuaseus 8funcionarios umagratica caode 250reais, pagajuntocomosalariodedezembro. Seemnovembroosalariomediodessesfuncionarioserade920reais,qualosalariomedioemdezembro?Quepropriedadesvoceutilizouparachegaraesseresultado?5. No mes de dissdio de determinada categoria trabalhista, os funcionariosdeumaempresativeramreajustesalarialde8,9%. Senomesanterioraodissdioosalariomediodesses funcionarioserade580reais, qualovalordosalariomediodepoisdoreajuste? Quepropriedadesvoceutilizouparachegaraesseresultado?6. On umeromediodeempregadosdasempresasindustriaisdosetordefabrica caodebebidasemdeterminadomomentoerade117emprega-dos,enquantoon umero medianoerade 27. De umaexplica c aopara adiferen caentreessasmedidasdetendenciacentral.7. Natabelaaseguirtemoson umerodeempresasporfaixadepessoalocupado(PO)dosetordefabrica caodebebidasemdeterminadomo-mento. Calculeamediaeamedianadessadistribui cao, especicandoasrespectivasunidades.65CEDERJMedidasdeposi caoClassedePO N umerodeempresas[10, 30) 489[30, 100) 269[100, 500) 117[500, 1000) 15[1000, 2000) 9[2000, 4000) 7SolucaodasAtividadesAtividade3.1Temos 15funcionarios. Os dados ordenados saoos seguintes: 3200,3780, 3800, 4000, 4500, 4500, 5100, 5600, 5700, 6300, 6400, 6500, 7000, 7100,7300. Amediaex =3200 + 3780 + + 730015=8070015= 5380Amoda ex= 4500eamedianaeaobserva caodeposi cao15+12= 8,ouseja,Q2= x(8)= 5600TodasessasmedidasestaoemR$.Atividade3.2Notequeosdadosjaestaoordenados; casonaoestivessem, umaboaop cao para ajudar na solu cao do exerccio seria construir o diagrama de ramosefolhas. Temos50notas. Logo,x =2, 9 + 3, 7 + + 9, 750=357, 150= 7, 142A nota modal e x= 6, 3, que aparece 3 vezes. Como o n umero de observa coese par (n = 50), a mediana e a media das 2 observa coes centrais, cujas posi coessao502e502+ 1,ouseja,amediana eamediada25aeda26aobserva coes:Q2=7, 3 + 7, 42= 7, 35CEDERJ66Medidasdeposi caoAULA3Atividade3.3Temososeguinte:6i=1xi= x1 +x2 +x3 +x4 +x5 +x6= 10 + 11 + 15 + 19 + 21 + 26 = 1026i=1fi = f1 +f2 +f3 +f4 +f5 +f6= 3 + 5 + 9 + 10 + 2 + 1 = 306i=1fixi= f1x1 +f2x2 +f3x3 +f4x4 +f5x5 +f6x6== 3 10 + 5 11 + 9 15 + 10 19 + 2 21 + 1 26 == 4786i=1fix2i= f1x21 +f2x22 +f3x23 +f4x24 +f5x25 +f6x26== 3 102+ 5 112+ 9 152+ 10 192+ 2 212+ 1 262== 8098Atividade3.4Vamos denotar por x1e x2as notas naprimeirae segundaprovas.Entao,amedianal ecalculadacomoxp=2x1 + 3x22 + 3Paraaprova caodireta,semprovanal,temosqueterxp 6.Logo,xp 6 2x1 + 3x22 + 3 6 25, 5+3x2 30 3x2 19 x2 193= 6, 33Sefossemediasimples,teramosqueterx 6 x1 +x22 6 5, 5 +x2 12 x2 6, 567CEDERJMedidasdeposi caoAtividade3.5Amesmarela caoqueseaplica`astemperaturasindividuaisseaplicatambem`a temperatura media, ou seja, a temperatura media emgrausCelsiuseC=59(F 32) =59 (45 32) = 7, 22CAtividade3.6Nao e necessariorecalculara mediaem milharesde reais;bastadividiramediapor1000,ouseja,olucromedioede1035,42milharesdereais.Atividade3.7Adistribui caodefreq uenciascompletaeaseguinte:Classes Ponto Freq. Simples Freq. AcumuladaMedio Absoluta Relativa Absoluta Relativa4 6 5 10 0,20 10 0,206 8 7 12 0,24 22 0,448 10 9 18 0,36 40 0,8010 12 11 6 0,12 46 0,9212 14 13 4 0,08 50 1,00Total 50 1,00Amedia ex = 5 0, 20 + 7 0, 24 + 9 0, 36 + 11 0, 12 + 13 0, 08 = 8, 28Amedianaestanaclasse8 10. Abaixodestaclassetemos44%dasob-serva coes. Assim, para completar 50% cam faltando 6% - veja a Figura 3.5aseguir.Aregradeproporcionalidade eQ286=10 836Q28 =1236 Q2= 8, 33CEDERJ68Medidasdeposi caoAULA3Figura3.5: Calculodamediana-Solu caodaAtividade3.7.SolucaodosExerccios1. Paracalcular osalariohorariomedio, temos quedividir ototal dosvencimentospelototaldehorastrabalhadaspelos4amigos.x =10 3, 50 + 12 2, 6 + 15 3, 80 + 8 2, 2010 + 12 + 15 + 8=10 3, 50 + 12 2, 6 + 15 3, 80 + 8 2, 2045=1045 3, 50 +1245 2, 6 +1545 3, 80 +845 2, 20=140, 845= 3, 1289Notequeosalariomedioeumamediaponderadadossalariosindivi-duais,comopesosendodenidopelon umerodehorasdetrabalho.2. A cargahorariasemanaltotal e 4 + 4 + 4 + 6 +2 = 20. Logo, oCRdoaluno eCR =4207, 5+4206, 1+4208, 3+6206, 5+2207, 5 =141, 620= 7, 083. Odiagramaderamosefolhas eoseguinte:0 6 8 91 0 0 0 2 2 2 2 4 5 5 5 6 8 8 82 0 4Amedia ex =6 + 8 + 9 + + 20 + 2420=27420= 13, 7Amoda ex= 12eamedianaeamediadosvalorescentrais:Q2=x(10) +x(11)3=12 + 142= 13Todosessesresultadosestaomedidosemhorasporsemana.69CEDERJMedidasdeposi cao4. Todosossalarioscaramaumentadosem250reais. Sechamamosdexio salario do funcionario i no mes de novembroe de yio salario dessemesmo funcionario em dezembro, entao yi= xi+250. De acordo com aPropriedade 2, temos que o salario medio em dezembro e y= x+250 =920 + 250 = 1170reais.5. Sejaxiosalariodofuncionarioinomesanterioraodissdio. Depoisdoaumento,seusalariopassaaser yi= xi +0, 089xi = 1, 089xi. Logo,todosossalarioscammultiplicadospor1,089e, pelaPropriedade3,amediatambemcamultiplicadaporestevalor, ouseja, depoisdodissdioosalariomediopassaasery=1, 089x=1, 089 580=631,62reais.6. Adiferen casedeve`aexistenciadegrandesempresasnosetordebe-bidas, com muitos empregados. Como vimos, a media e bastante inu-enciadapelosvaloresdiscrepantes.7. CompletandoatabelaobtemosClassedePO Ponto Freq. Simples Freq. Acumuladamedio Absoluta Relativa(%) Absoluta Relativa(%)[10, 30) 20 489 53,9735 489 53,9735[30, 100) 65 269 29,6909 758 83,6645[100, 500) 300 117 12,9139 875 96,5784[500, 1000) 750 15 1,6556 890 98,2340[1000, 2000) 1500 9 0,9934 899 99,2274[2000, 4000) 3000 7 0,7726 906 100,0000TOTAL 906 100,0000Comoasfreq uenciasrelativasestaoemformapercentual, temosquedividiroresultadopor100,ouseja:x = (20 53, 9735 + 65 29, 6909 + 300 12, 9139 + 750 1, 6556+1500 0, 9934 + 3000 0, 7726)/100= 119, 3322empregadosAmedianaestanaclasse10 30.Afreq uenciaabaixodestaclasseenula. Logo,aregradetres eQ21050=30 1053, 9735 Q210 =100053, 9735 Q2= 28, 528empregadosCEDERJ70Medidasdeposi caoAULA3Noteadiferen cadamediaparaamediana, resultadodapresen cadeempresascommuitosempregadosmuitasempresastempoucosem-pregados, mas poucas empresas tem muitos empregados, o que puxaamediaparacima.71CEDERJMedidasdedispersaoAULA4Aula4MedidasdedispersaoNestaaula, voce estudara as medidas de dispersaode uma distribui caodedadoseaprenderaosseguintesconceitos:amplitudedesviosemtornodamediadesviomedioabsolutovarianciadesviopadraoAmplitudeConsidere os conjuntos de dados apresentados por umdiagramadepontosnaFigura4.1. Nessegraco,aspilhasdepontosrepresentamasfreq uenciasdecadavalor. Podemosverfacilmentequeambososconjuntostem a mesma media (o centro de gravidade ou ponto de equilbrio e o mesmo),amesmamedianaeamesmamoda. Noentanto, essesdoisconjuntostemcaractersticas diferentes e aosintetiza-los apenas por algumamedida deposi cao, essacaractersticaseperdera. Tal caractersticaeadispersaodosdispers aodados: noprimeiroconjunto,osdadosestaomaisconcentradosemtornodamediadoquenosegundoconjunto.Figura4.1: Conjuntosdedadoscommedidasdeposi caoiguaisedispersaodiferente.Comopodemos mediressadispersao?Umaprimeiraideia e conside-raraamplitudedosdados,que e,comojavisto,adiferen caentreomaioreomenorvalor.73CEDERJMedidasdedispersaoDenicaoAamplitudedeum conjuntode dados e adistanciaentreomaior valor eomenorvalor.total= VmaxVmin. (4.1)Aamplitudetemamesmaunidadedosdados, maselatemalgumaslimita coes, conformeilustradonaFigura4.2. A osdoisconjuntostemamesmamedia, amesmamedianae amesmaamplitude, mas essas medi-dasnaoconseguemcaracterizarofatodeadistribui caodosvaloresentreomnimoeomaximoserdiferentenosdoisconjuntos. Alimita caodaam-plitudetambemcapatentepelofatodeelasebasearemapenasduasob-serva coes,independentementedon umerototaldeobserva coes.Figura4.2: Conjuntosdedadoscommedidasdeposi caoeamplitudeiguais.DesviomedioabsolutoUmamaneiradesemediradispersaodosdados econsiderarostama-nhosdosdesvios xi xdecadaobserva caoemrela cao`amedia. Notenasgurasacimaque, quantomaisdispersooconjuntodedados, maioresessesdesvios tendemaser. Paraobter umamedida-resumo, istoe, um unicon umero,poderamossomaressesdesvios, ouseja,consideraraseguinteme-dida:D =ni=1(xix). (4.2)CEDERJ74MedidasdedispersaoAULA4Vamos desenvolver tal formula, usandoas propriedades de somatorioe adeni caodamediaamostral.D =ni=1(xix) =ni=1xini=1x =ni=1xinx ==ni=1xin 1nni=1xi=ni=1xini=1xi= 0.Ou seja: essa medida, que representa a soma dos desvios em rela cao `a media,esemprenula, naoimportaoconjuntodedados! Logo, elan aoserveparadiferenciarquaisquerconjuntos!Vamos dar umaexplica cao intuitiva paraesse fato, que nos permi-tiraobtercorre coesparatalformula. Aoconsiderarmosasdiferen casentrecadavaloreovalormedio,obtemosvaloresnegativosepositivos,pois,peladeni caodemedia,sempreexistemvaloresmenoresemaioresqueamedia;essesvalorespositivosenegativos,aoseremsomados,seanulam.Bom, se o problema esta no fato de termos valores positivos e negativos,porquenaotrabalharcomovalorabsolutodasdiferen cas? Defato, esseprocedimentonosleva`adeni caodedesviomedioabsoluto.DenicaoOdesvio medio absoluto de umconjunto de dados x1, x2, . . . , xnedenidoporDMA =1nni=1|xix| (4.3)ondeasbarrasverticaisrepresentamovalorabsolutooumodulo.Note que nesta deni cao estamos trabalhando com o desvio medio, istoe, tomamosamediadosdesviosabsolutos. Issoevitainterpreta coesequi-vocadas, pois, setrabalhassemosapenascomasomadosdesviosabsolutos,um conjunto com um n umero maior de observa coes tenderia a apresentar umresultadomaiorparaasomadevidoapenasaofatodetermaisobserva coes.Estasitua cao eilustradacomosseguintesconjuntosdedados:Conjunto1: {1, 3, 5}Conjunto2:

1, 53, 3, 133, 5

75CEDERJMedidasdedispersaoParaosdoisconjuntos,x = 3eparaoconjunto13i=1|xix| = |1 3| +|3 3| +|5 3| = 4eparaoconjunto25i=1|xix| = |1 3| +

53 3

+|3 3| +

1333

+|5 3| =203= 6, 667.Entao,osomatorioparaosegundoconjunto emaior,masodesvioabsolutomedioeomesmoparaambos;defato,paraoprimeiroconjuntotemosDMA =43eparaosegundoconjuntoDMA =2035=43Ao dividirmos o somatorio pelo n umero de observa coes, compensamos o fatodeosegundoconjuntotermaisobserva coesqueoprimeiro.Odesviomedioabsolutotemamesmaunidadedosdados.Atividade4.1Para o conjunto de dados 2, 4, 7, 8, 9, 6, 5, 8, calcule os desvios em tornoda media e verique que eles somam zero. Em seguida, calcule o desvio medioabsoluto.VarianciaedesviopadraoConsiderar o valor absoluto das diferen cas (xix) e uma das maneirasde se contornar o fato de queni=1(xix) = 0. No entanto, a fun cao modulo temadesvantagemdesernaodiferenciavel nopontozero. Outrapossibilidadedecorre cao,compropriedadesmatematicaseestatsticasmaisadequadas, econsideraroquadradodasdiferen cas. Issonosleva`adeni caodevariancia.DenicaoAvariancia1deumconjuntodedadosx1, x2, . . . , xnedenidapor2=1nni=1(xix)2. (4.4)CEDERJ76MedidasdedispersaoAULA4Notequeestadeni caodevariancianosdizqueavariancia eamediadosdesviosquadraticos.Suponhamosqueosvaloresxirepresentemospesos, emquilogramas,deumconjuntodepessoas. Entao,ovalor medioxrepresentaopesomediodessaspessoasesuaunidadetambemequilogramas, omesmoacontecendocomasdiferen cas(xix).Aoelevarmosessasdiferen casaoquadrado,pas-samosateravarianciamedidaemquilogramasaoquadrado, umaunidadeque nao tem interpreta cao fsica. Uma forma de se obter uma medida de dis-persaocomamesmaunidadedosdadosconsisteemtomararaizquadradadavariancia.DenicaoOdesviopadraodeumconjuntodedadosx1, x2, . . . , xnedenidopor=Variancia =2(4.5)A ttulo de ilustra cao, vamos considerar novamente os dados analisadosnaaulaanterior, referentes `aidade dos funcionarios doDepartamentodeRecursosHumanos. Essasidadessao:24 25 26 26 29 29 31 35 36 37 38 42 45 51 53esuamedia e52715= 35, 13. Assim,avariancia,emanos2e2=115

(24 35, 13)2+ (25 35, 13)2+ 2 (26 35, 13)2+ 2 (29 35, 13)2+(31 35, 13)2+ (35 35, 13)2+ (36 35, 13)2+ (37 35, 13)2+ (38 35, 13)2+(42 35, 13)2+ (42 35, 13)2+ (45 35, 13)2+ (51 35, 13)2+ (53 35, 13)2==1213, 7315= 80, 92eodesviopadrao,emanos, e =

80, 92 = 8, 995Atividade4.2Para oconjuntode dados daAtividade 4.1 {2, 4, 7, 8, 9, 6, 5, 8}calculeavarianciaeodesviopadrao.77CEDERJMedidasdedispersaoFormulaalternativaparaocalculodavarianciaConsideremos a Equa cao (4.4) que dene a variancia. Desenvolvendooquadradoeusandoaspropriedadesdesomatorio,obtemos:2=1nni=1

x2i 2xix +x2

=1nni=1x2i 1nni=12xxi +1nni=1x2==1nni=1x2i 2x

1nni=1xi

+1nnx2=1nni=1x2i 2x2+x2ouseja2=1nni=1x2i x2(4.6)Essaformadeescrever avarianciafacilitaquandooscalculostemqueserfeitos `a mao ou em calculadoras menos sosticadas, pois o n umero de calculosenvolvidos emenor. Notequeelanos dizque avarianciaeamediadosquadradosmenosoquadradodamedia.VamoscalcularavarianciadasidadesdosfuncionariosdeRHusandoessaformula:2=115242+ 252+ 252+ 2 262+ 2 292+ 312+ 352+ 362+372+ 382+ 392+ 422+ 452+ 512+ 532

52715

2==19729 15 5272152=295935 277729225=18206225= 80, 916Nacompara caodosresultadosobtidospelasduasformulas, podehaveral-guma diferen ca por causa dos arredondamentos, uma vez que a media e umadzima.Atividade4.3NaAtividade4.2vocecalculouavarianciadoconjuntodedados{2, 4, 7, 8, 9, 6, 5, 8} como a media dos desvios quadraticos. Calcule a variancianovamenteutilizandoaformulaalternativadadanaEqua cao(4.6).Exemplo4.1Naaulaanterior,analisamososdadosreferentesaon umerodedepen-dentesdosfuncionariosdoDepartamentodeRecursosHumanos,apresenta-dosnovamentenatabelaaseguir.CEDERJ78MedidasdedispersaoAULA4Nome No.dedependentes Nome No.dedependentesJoaodaSilva 3 PatrciaSilva 2PedroFernandes 1 ReginaLima 2MariaFreitas 0 AlfredoSouza 3PaulaGon calves 0 MargareteCunha 0AnaFreitas 1 PedroBarbosa 2LuizCosta 3 RicardoAlves 0AndreSouza 4 MarcioRezende 1AnaCarolinaChaves 0Como o menor valor e 0 e o maior valor e 4, temos que a amplitude dosdados e de 4dependentes. A mediacalculadapara essesdadosfoi x =2215=1, 467. Vamos calcular asomados desviosemtorno damedia,usandoo fatodequetemosobserva coesrepetidas.(xix) = 5

0 2215

+ 3

1 2215

+ 3

2 2215

+ 3

3 2215

+

4 2215

== 110152115+2415+6915+3815= 13115+13115= 0Caso trabalhassemos com o valor aproximado 1, 467, o resultado aproximadoseria 0, 005.Odesviomedioabsoluto eDMA =1n|xix| ==115 5

0 2215

+ 3

1 2215

+ 3

2 2215

+ 3

3 2215

+

4 2215

==115 11015+2115+2415+6915+3815

=115 13115+13115

=262225= 1, 1644Avariancia e2=1n(xix)2=115 5

0 2215

2+ 3

1 2215

2+ 3

2 2215

2+ 3

3 2215

2+

4 2215

2 ==115 2420225+147225+192225+1587225+1444225

=579015 225= 1, 715556e=

579015 225= 1, 309879CEDERJMedidasdedispersaoVamosagoracalcularavarianciausandoaformulaalternativa:2=115

5 02+ 3 12+ 3 22+ 3 32+ 42

2215

2==3 + 12 + 27 + 1615484225=5815 484225=58 15 484225==386225= 1, 715556Notequecomessaformulaoscalculoscambemmaissimples, umavezquetemosquefazermenosconta!PropriedadesdasmedidasdedispersaoComovistoparaasmedidasdeposi cao, vamosverasprincipaispro-priedadesdasmedidasdedispersao.Propriedade1Todasasmedidasdedispersaosaonaonegativas! 0DMA 02 0 0(4.7)Propriedade2Somando-seumamesmaconstanteatodasasobserva coes,asmedidasdedispersaonaosealteram. Essapropriedade e bastanteintuitivasenotar-mosque,aosomarumaconstanteaos dados,estamossimplesmentefazendoumatransla caodosmesmos,semalteraradispersao.yi = xi +k

y= xDMAy= DMAx2y= 2xy= x(4.8)Propriedade3Aomultiplicarmostodososdadosporumaconstantenaonulatemosque:yi= kxi

y= |k|xDMAy= |k|DMAx2y= k22xy= |k|x(4.9)CEDERJ80MedidasdedispersaoAULA4Notequeerazoavel queapare caomodulodaconstante, j aqueasmedidasdedispersaosaonaonegativas.Atividade4.4Seodesviopadraodastemperaturasdiariasdeumadeterminadalo-calidade e de 5, 2F, qual e o desvio padrao em graus Celsius?Lembre-se quearela caoentreasduasescalas eC=59(F 32)Medidas de dispersao para distribuicoes de freq uenciasagrupadasVarianciaNaaulapassada,vimosque,emumatabeladefreq uenciasagrupadas,perdemos a informa cao sobre os valores individuais e isso nos obriga a tomaro ponto medio de cada classe como representante da respectiva classe. Vamosver, agora,comocalcularavarianciaparadadosagrupados. Maisumavez,vamos considerar os dados referentesaos salarios dos funcionarios do Depar-tamentodeRecursosHumanos,cujadistribui caoedadanaTabela4.1.Tabela4.1: Distribui caodarendadosfuncionariosdoDepartamentodeRHClasse Ponto Freq uenciaSimples Freq uenciaAcumuladaderenda medio Absoluta Relativa% Absoluta Relativa%[3200,4021) 3610,5 4 26,67 4 26,67[4021,4842) 4431,5 2 1,33 6 40,00[4842,5663) 5252,5 2 1,33 8 53,33[5663,6484) 6073,5 3 20,00 11 73,33[6484,7305) 6894,5 4 26,67 15 100,00Total 15 100,00Como ja dito, a interpreta cao da tabela de freq uencias nos diz que ha 4observa coesiguaisa3610,5; 2observa coesiguaisa4431,5; 2iguaisa5252,5;3iguaisa6073,5e4iguaisa6894,5. Logo,paracalcularavarianciadessesdadosbastausarumadasformulas4.4ou4.6.81CEDERJMedidasdedispersaoUsando(4.4),avariancia ecalculadacomo:2=115

4 (3610, 5 5307, 2333)2+ 2 (4431, 5 5307, 2333)2+2 (5252, 5 5307, 2333)2+ 3 (6073, 5 5307, 2333)2+4 (6894, 5 5307, 2333)2=415 (3610, 5 5307, 2333)2+215 (4431, 5 5307, 2333)2++215 (5252, 5 5307, 2333)2+315 (6073, 5 5307, 2333)2+415 (6894, 5 5307, 2333)2= 1659638, 729Note, na pen ultima linha da equa cao anterior, que os desvios quadraticosdecadaclasseestaomultiplicadospelafreq uenciarelativadaclasse. Dessaforma,chegamos`aseguinteexpressaoparaavarianciadedadosagrupados:2=fi(xix)2(4.10)ondexieopontomediodaclasseefieafreq uenciarelativa.UsandoaEqua cao(4.6),avariancia ecalculadacomo:2=115 4 3610, 52+ 2 4431, 52+ 2 5252, 52+3 6073, 52+ 4 6894, 525307, 23332=

415 3610, 52+215 4431, 52+215 5252, 52+315 6073, 52+415 6894, 525307, 23332= 1659638, 729Note, napen ultimalinhadaequa caoanterior, queosquadradosdospontos medios de cadaclasse estaomultiplicados pelafreq uenciarelativadaclasse. Dessaforma, chegamos `aseguinteexpressaoalternativaparaavarianciadedadosagrupados:2=fix2i x2(4.11)emaisumavez, obtemosqueavarianciaeamediadosquadradosmenosoquadradodamedia;adiferen caequeaquiamediaeumamediaponderadapelasfreq uenciasdasclasses.CEDERJ82MedidasdedispersaoAULA4DesviomedioabsolutoSeguindo raciocnio analogo, obtemos que o desvio medio absoluto paradadosagrupados eDMA =fi| xix|que eumamediaponderadadosdesviosabsolutosemtornodamedia.Atividade4.5Calculeavarianciaeodesviomedioabsolutoparaadistribui caodadanaseguintetabela,quefoianalisadanaAtividade3.6daaulaanterior:Classes Freq uencia4 6 106 8 128 10 1810 12 612 14 4Total 40ResumodaAulaNestaaula, voceestudouasprincipaismedidasdedispers ao, queme-dem a variabilidade dos dados. Seja x1, x2, . . . , xn o nosso conjunto de dados.Amplitude- eadistanciaentreomaioreomenorvalor:total= VM axVMn= x(n)x(1)Desvioemtornodamedia:di = xixparaqualquerconjuntodedados,ni=1di= 0Desviomedioabsoluto:DMA =1nni=1|xix|83CEDERJMedidasdedispersaoVariancia: desvioquadraticomedio2=1nni=1(xix)2=1nni=1x2i x2Desviopadrao: raizquadradadavariancia=2Exerccios1. ContinuacaodoExerccio3.3 Emumapesquisasobreatividadesdelazerrealizadacomumaamostrade20alunosdeumcampusuniver-sitario, perguntou-se o n umero de horas que os alunos gastaram nave-gandonaInternetnasemanaanterior. Osresultadosobtidosforamosseguintes:15 24 18 8 10 12 15 14 12 1018 12 6 20 18 16 10 12 15 9Calculeaamplitude,odesviomedioabsolutoeodesviopadraodessesdados,especicandoasrespectivasunidades.2. ContinuacaodoExerccio3.4 Nonal doano2005, odonode umpequeno escritorio de administra cao deua seus 8funcionarios umagratica cao de 250 reais, paga junto com o salario de dezembro. Se emnovembroodesviopadraodossalariosdessesfuncionarioserade180reais, qual o desvio padrao dos salarios em dezembro?Que propriedadesvoceutilizouparachegaraesseresultado?3. Continuacao do Exerccio 3.5No mes de dissdio de determinada cate-goria trabalhista, os funcionarios de uma empresa tiveramreajustesalarial de8,9%. Senomesanterioraodissdioodesviopadraodossalarios desses funcionarios erade 220reais, qual ovalor dodesviopadrao dos salarios depois do reajuste?Que propriedades voce utilizouparachegaraesseresultado?4. ContinuacaodoExerccio3.7 Natabelaaseguirtemoson umerodeempresaspor faixadepessoalocupado(PO)dosetordefabrica caodebebidas em determinado momento. Calcule o desvio medio absoluto e oCEDERJ84MedidasdedispersaoAULA4desvio padrao dessa distribui cao, especicando as respectivas unidades.ClassedePO N umerodeempresas[10, 30) 489[30, 100) 269[100, 500) 117[500, 1000) 15[1000, 2000) 9[2000, 4000) 7SolucaodasAtividadesAtividade4.1Amediadosdados ex =498= 6, 125.8i=1(xi x)= (2 6, 125) + (4 6, 125) + (5 6, 125) + (6 6, 125) + (7 6, 125) + 2 (8 6, 125) + (9 6, 125)= 4, 125 2, 125 1, 125 0, 125 + 0, 875 + 2 1, 875 + 2, 875= 7, 5 + 7, 5 = 0DMA =188i=1|xi x|=18|2 6, 125| +|4 6, 125| +|5 6, 125| +|6 6, 125| +|7 6, 125| +2 |8 6, 125| +|9 6, 125|=18(4, 125 + 2, 125 + 1, 125 + 0, 125 + 0, 875 + 2 1, 875 + 2, 875)=18(7, 5 + 7, 5) = 1, 875Atividade4.22=18(2 6, 125)2+ (4 6, 125)2+ (5 6, 125)2+ (6 6, 125)2+ (7 6, 125)2+2 (8 6, 125)2+ (9 6, 125)2=18

4, 1252+ 2, 1252+ 1, 1252+ 0, 1252+ 0, 8752+ 2 1, 8752+ 2, 8752

=38, 8758= 4, 859375 =2=4.859375 = 2, 20439985CEDERJMedidasdedispersaoAtividade4.32=22+ 42+ 52+ 62+ 72+ 82+ 82+ 9286, 1252=339837, 515625 = 4, 859375Atividade4.4NotequepodemosescreverC=59F 1609Como visto, somar uma constante aos dados nao altera o desvio padrao; logo,otermo 1609naoteminuenciasobreoresultado. Masquandomultipli-camospor umaconstante,odesviopadraocamultiplicadopelomodulodaconstante. Logo,C=59F C=59 5, 2F= 2, 8889FAtividade4.5Naaulaanteriorvocecalculouamediadestadistribui c ao, apartirdaseguintetabela:Classes Ponto Freq. Simples Freq. AcumuladaMedio Absoluta Relativa Absoluta Relativa4 6 5 10 0,20 10 0,206 8 7 12 0,24 22 0,448 10 9 18 0,36 40 0,8010 12 11 6 0,12 46 0,9212 14 13 4 0,08 50 1,00Total 50 1,00Oresultadofoix = 8, 28. Odesviomedioabsoluto eDMA = 0, 20 |5 8, 28| + 0, 24 |7 8, 28| + 0, 36 |9 8, 28|+0, 12 |11 8, 28| + 0, 08 |13 8, 28|= 1, 9264Usandoaformulaalternativa,temosque2= 0, 20 52+ 0, 24 72+ 0, 36 92+ 0, 12 112+ 0, 08 1328, 282= 73, 96 68, 5584 = 5, 4016CEDERJ86MedidasdedispersaoAULA4SolucaodosExerccios1. Odiagramaderamosefolhas e0 6 8 91 0 0 0 2 2 2 2 4 5 5 5 6 8 8 82 0 4eamediafoicalculadacomox = 13, 7.Aamplitudee =24 6 =18horas semanais. Odesviomedioabsoluto,tambememhorassemanais,eDMA =120

|6 13, 7| + |8 13, 7| + |9 13, 7| + 3 |10 13, 7| +4 |12 13, 7| +|14 13, 7| + 3 |15 13, 7| +|16 13, 7| +3 |18 13, 7| +|20 13, 7| + |24 13, 7|= 3, 6Avariancia,pelaformulasimplicada, e2=120 [62+ 82+ 92+ 3 102+ 4 122+ 142+ 3 152+ 162+3 182+ 202+ 242] 13, 72=413220187, 69 = 206, 6 187, 69 = 18, 912. Os novos salarios saoyi=xi+ 250. ComovistonaPropriedade 2,somar uma constante nao altera as medidas de dispersao; logo, os novossalarios tem o mesmodesviopadrao dos salarios de novembro,ou seja,180reais.3.