estatistica aplicada (30h) unidade i

51
Autores: Prof. Edwin F. F. Silva Prof. Wesley Cândido de Melo Colaboradores: Prof. Santiago Valverde Prof. Jean Carlos Cavaleiro Prof. Daniel Scodeler Raimundo Estatística Aplicada

Upload: sharkminas

Post on 02-Dec-2015

215 views

Category:

Documents


2 download

TRANSCRIPT

Page 1: Estatistica Aplicada (30h) Unidade I

Autores:Prof.EdwinF.F.Silva Prof.WesleyCândidodeMeloColaboradores:Prof.SantiagoValverde Prof.JeanCarlosCavaleiro Prof.DanielScodelerRaimundo

Estatística Aplicada

Page 2: Estatistica Aplicada (30h) Unidade I

Professores conteudistas: Edwin F. F. Silva e Wesley Cândido de Melo

Edwin F. F. Silva

PossuilicenciaturaemFísicapelaUniversidadeCatólicadeBrasília(2005);especializaçãoemHigienedasradiaçõesionizantes(Senacap,2011);emMetodologiadoEnsinoeAprendizagememMatemática(2009);pós-graduaçãoemTransporte(emandamento)pelaUniversidadedeBrasília.Atualmente,éprofessordaFaculdadeFortium,ministrandoaulasdecálculoeestatísticanoscursosdeSistemadeInformaçõeseAdministração,edaUniversidadePaulista,nocursodeEngenharia.Atuaempesquisas relacionadasàpoluição sonora,naáreadepolosgeradoresdeviagensetambémcomocorretordequestõesdoscursosdegraduaçãoadistânciadaUNIPecomotutordocursodeRHdaUNIPInterativa.

Wesley Cândido de Melo

Possui licenciatura em Física pela Universidade Católica de Brasília (2006); especialização em Matemáticae Estatística pela FACITEC (2008); pós-graduação em Transporte (em andamento) pela Universidade de Brasília.Atualmente, é professor da Universidade Paulista, ministrando aulas para os cursos de Engenharia, Gestão de RHeSegurançaPrivada;daFaculdade JK,noscursosdeAdministraçãoeRadiologia.Atua tambémcomocorretordequestõesdoscursosdegraduaçãoadistânciadaUNIPecomotutordocursodeRHdaUNIPInterativa.Épesquisadorvinculado ao grupo de pesquisa em Poluição sonora com ênfase em Ruídos aeronáuticos no curso de Física daUniversidadeCatólicadeBrasília.

©Todososdireitosreservados.Nenhumapartedestaobrapodeserreproduzidaoutransmitidaporqualquerformae/ouquaisquermeios(eletrônico,incluindofotocópiaegravação)ouarquivadaemqualquersistemaoubancodedadossempermissãoescritadaUniversidadePaulista.

Dados Internacionais de Catalogação na Publicação (CIP)

S586e Silva,EdwinF.Estatísticaaplicada/EdwinF.Silva;WesleyCândidodeMelo.–

SãoPaulo:EditoraSol,2012.112p.,il.Nota: este volume está publicado nos Cadernos de Estudos e

PesquisasdaUNIP,SérieDidática,anoXVII,n.2-064/12,ISSN1517-9230.

1.Estatística.2.Distribuiçãodefrequências.3.Probabilidades.I.Título.

CDU519.2

Page 3: Estatistica Aplicada (30h) Unidade I

Prof.Dr.JoãoCarlosDiGenioReitor

Prof.FábioRomeudeCarvalhoVice-Reitor de Planejamento, Administração e Finanças

Profa.MelâniaDallaTorreVice-Reitora de Unidades Universitárias

Prof.Dr.YugoOkidaVice-Reitor de Pós-Graduação e Pesquisa

Profa.Dra.MaríliaAncona-LopezVice-Reitora de Graduação

Unip Interativa – EaD

Profa.ElisabeteBrihy

Prof.MarceloSouza

Profa.MelissaLarrabure

Material Didático – EaD

Comissãoeditorial: Dra.AngélicaL.Carlini(UNIP) Dr.CidSantosGesteira(UFBA) Dra.DivaneAlvesdaSilva(UNIP) Dr.IvanDiasdaMotta(CESUMAR) Dra.KátiaMosorovAlonso(UFMT) Dra.ValériadeCarvalho(UNIP)

Apoio: Profa.CláudiaReginaBaptista–EaD Profa.BetisaMalaman–ComissãodeQualificaçãoeAvaliaçãodeCursos

Projetográfico: Prof.AlexandrePonzetto

Revisão: AndréiaGomes GeraldoTeixeiraJr.

Page 4: Estatistica Aplicada (30h) Unidade I
Page 5: Estatistica Aplicada (30h) Unidade I

SumárioEstatística Aplicada

APRESENTAçãO......................................................................................................................................................7INTRODUçãO...........................................................................................................................................................7

Unidade I

1HISTÓRIADAESTATÍSTICA..............................................................................................................................91.1Introduçãoàestatística........................................................................................................................91.2Importânciadaestatística.................................................................................................................111.3Elementosfundamentaisdaestatística...................................................................................... 12

1.3.1Populaçãoeamostra............................................................................................................................. 121.4Fasesdométodoestatístico............................................................................................................. 131.5Dadosestatísticos................................................................................................................................ 131.6Formasiniciaisdetratamentodosdados................................................................................... 151.7Notaçõesporíndices.......................................................................................................................... 16

1.7.1Notaçãosigma(∑)................................................................................................................................. 161.8Sériesestatísticas–simplesecompostas.................................................................................. 19

2APRESENTAçãODEDADOS–GRáFICOSETABELAS........................................................................ 202.1Elementosbásicosdastabelas........................................................................................................ 26

3MEDIDASDETENDÊNCIACENTRAL:MÉDIA,MODAEMEDIANAPARADADOSSIMPLES.................................................................................................................................................. 26

3.1Amédiaaritméticasimples(x)....................................................................................................... 273.2Amédiaaritméticaponderadaxp................................................................................................. 293.3Amediana(Md)..................................................................................................................................... 313.4Amoda..................................................................................................................................................... 343.5Posiçãorelativadamédia,modaemediana............................................................................. 36

4MEDIDASDEDISPERSãOPARADADOSSIMPLES.............................................................................. 364.1Amplitudetotal..................................................................................................................................... 384.2Desviomédioabsoluto....................................................................................................................... 394.3Variância.................................................................................................................................................. 404.4Desviopadrão........................................................................................................................................ 454.5Coeficientedevariação..................................................................................................................... 46

Unidade II

5DISTRIBUIçãODEFREQUÊNCIAS............................................................................................................. 525.1Aconstruçãodeumadistribuiçãodefrequênciasparadadoscontínuos.................... 53

Page 6: Estatistica Aplicada (30h) Unidade I

5.2Aconstruçãodeumadistribuiçãodefrequênciasparadadosdiscretos...................... 595.3Representaçõesgráficasdedadosagrupados......................................................................... 60

6ASMEDIDASDEPOSIçãOEVARIABILIDADENUMADISTRIBUIçãODEFREQUÊNCIA................................................................................................................................................... 69

6.1Asmedidasdeposição....................................................................................................................... 706.1.1Amédia....................................................................................................................................................... 706.1.2Amediana.................................................................................................................................................. 716.1.3Amoda........................................................................................................................................................ 72

6.2Asmedidasdedispersãonumadistribuiçãodefrequência................................................ 736.2.1Odesviomédio........................................................................................................................................ 736.2.2Variância..................................................................................................................................................... 746.2.3Desviopadrão........................................................................................................................................... 75

7INTRODUçãOÀPROBABILIDADE............................................................................................................. 807.1Teoriasdosconjuntos,espaçoamostraleeventos................................................................. 81

8PROBABILIDADE:ORIGEM,MÉTODOSEPRINCIPAISTEOREMAS................................................ 918.1Origensdaprobabilidade.................................................................................................................. 92

8.1.1Métodosobjetivos.................................................................................................................................. 928.1.2Métodosubjetivo.................................................................................................................................... 96

8.2Principaisteoremasdeprobabilidade.......................................................................................... 96

Page 7: Estatistica Aplicada (30h) Unidade I

7

APrESEntAção

Oobjetivodestematerial é fazer comqueoaluno tenhacondiçõesde interpretarumconjuntodeobservaçõesdeformaclaraeobjetiva,afimdedistinguiraslimitaçõeseasvantagensdousodeamostras,assimcomoosmétodospara suaobtenção; tenhahabilidadeparadescrevere interpretardadospormeiodefiguras(tabelasegráficos),estimativaspontuaisedevariabilidade;calcularointervalodeconfiançadaproporçãoemédia,assimcomoidentificarsuaaplicação;coletareinterpretardadosdeformasistematizadaeimprimircredibilidadeaanálisesquantitativasdosfenômenosderealidadeinvestigada.

Assim,esperamoscontribuirdamelhorformapossívelcomseuaprendizado.

Comnossoscumprimentos,

Equipeorganizadora.

Introdução

DesdeaAntiguidade,aestatísticafazpartedavidadaspessoas,mesmoquedeformaindireta,masocertoéqueessaciênciaestápresentenavidadaspessoasotempotodo.Quandoabrimosumjornal,porexemplo,láestáumasériedegráficosetabelasquenosauxiliamnoentendimentodedeterminadotema,ouquandolemosumareportagemquetrazcomotemaaprobabilidadedeomercadofinanceirofecharemaltaouembaixa,ou,ainda,virandoapáginadessemesmojornal,temosamanchetedivulgandoosdadosdoCenso2010.

Diantedessesfatos,nosperguntamosdequeformaaestatísticapodenosajudar,sejanolevantamentodedadosparaumaempresasabercomovãosuasvendas,sejaparasaberosriscosdeinvestirnasaçõesdeumaempresa,ou,ainda,comoogovernopodedeterminarascaracterísticasdosváriosaspectos,sociais,econômicoseambientaisdosestadoseatémesmodenossopaís.

Sãoperguntascomoessasqueaestatísticanosajudaaresponder,eaindanãopodemospensarnessaciênciacomoseelaselimitasseaapenascompilartabelasdedadoseosilustrargraficamente.Dessaforma,édesuaimportânciaconhecerasinúmerasvariáveisassociadasaela,poisemqualquerramodasociedadecontemporâneaestãopresentesosprocessosestatísticos.Eoestudantequenãosoubertrabalharcomessesconceitosestaráemdesvantagemnomercadodetrabalho.

Paratiraromáximoproveitodainterpretaçãodeumdeterminadofenômeno,deve-seseguiralgumasetapas, como,por exemplo,planejaraobtençãodedados, interpretar eanalisarosdadosobtidoseapresentarosresultadosdemaneiraafacilitaratomadadedecisõesrazoáveis.

É fundamentalqueotextoproduzidonestematerial leveoalunoapensaremsituaçõesdoseucotidianoequedessa formaelepossaassociara teoriacomapráticavivenciadaemseudiaadia.Pensandonisso,ele foidivididoemduasunidades,nasquais serãoabordados,naprimeiraunidade:sériesestatísticas,gráficosestatísticos,medidasdetendênciacentral,medidasdedispersão,entreoutros

Page 8: Estatistica Aplicada (30h) Unidade I

8

temas;jánasegundaunidade,serãoapresentados:dadostabulares,distribuiçãodefrequência,medidasdeposiçãoevariabilidadenumadistribuiçãodefrequência,probabilidade,bemcomoalgunsdeseusteoremas,entreoutrostemas.

Page 9: Estatistica Aplicada (30h) Unidade I

9

Revi

são:

And

réia

Gom

es -

Dia

gram

ação

: Léo

- 0

1/08

/201

2

Estatística aplicada

Unidade IComoaUniãorealizaadistribuiçãoderendaparaosEstados,MunicípioseoDistritoFederal?Como

saberquemdeverecebermaisoumenosverbas?Comosabersedeterminadotrechodeumaviaourodoviaéounãoperigoso?

SãoaquestõescomoessasqueadisciplinaEstatísticaprocuraresponder.

1 HIStÓrIA dA EStAtÍStICA

Na história do desenvolvimento humano, a sociedade primitiva se deparou com os primeirosproblemasparasaberotamanhodasuapopulação,aquantidadedeterrasesuasriquezas,porissoteveanecessidadedecontá-las.Emdecorrênciadisso,osgovernantesdasgrandescivilizaçõesantigasfizeramindiretamenteumestudoestatísticoparasaberosbensqueseuEstadopossuíaecomoapopulaçãodesseEstadoestavadistribuída.

NoAntigoEgito,aproximadamente3040a.C.,Heródotopediuquefossefeitoumestudosobreariquezadapopulação,comoobjetivodesaberaquantidadederecursoseconômicosehumanospararealizaraconstruçãodaspirâmides.NaChina,aproximadamente2238a.C.,oimperadorYaopediuquefossefeitoumestudodapopulação,comobjetivosindustriaisecomerciais.

Apalavra“estatística”foisugeridapeloalemãoGottifriedAchemmel(1719/1772)eéassociadaàpalavralatinastatus(Estado).

EssaciênciateveaceleradodesenvolvimentoapartirdoséculoXVII,comosestudosdeBernoulli,Fermat,Laplace,Gausseoutrosqueestabeleceramsuascaracterísticasatuais.

Saiba mais

Paraumaabordagemmaisdetalhadadahistóriada estatística, ler oartigo:“Conceitosiniciaisebrevehistóricodaestatística”,disponívelem:<http://mundobr.pro.br/uneal/wp-content/uploads/2010/04/01.conceitos_inicias-historico-somatorio.pdf>.Acessoem:12jul.2012.

1.1 Introdução à estatística

Atodoinstante,nosnoticiários,emrevistas,jornais,internet,ouvimosfalarnapalavra“estatística”,o que é possível perceber o quanto é importante conhecermos a fundo essa ciência. Algumas de

Page 10: Estatistica Aplicada (30h) Unidade I

10

Unidade i

Revi

são:

And

réia

Gom

es -

Dia

gram

ação

: Léo

- 0

1/08

/201

2

suasaplicabilidadespodemserobservadasnaspesquisasdeopiniãopúblicaenosdadospublicadosdiariamentenaimprensa.Narealidade,aestatísticacontemplamuitosoutrosaspectos,sendodevitalimportâncianainterpretaçãodeprocessosemqueexistavariabilidade.

De acordo com Dervalmar, é possível distinguir duas concepções para a palavra “estatística”. Noplural,“estatísticas”indicaqualquercoleçãodedadosquantitativosou,ainda,ramodamatemáticaquetratadacoleta,daanálise,dainterpretaçãoedaapresentaçãodemassadedadosnuméricos.Assim,por exemplo, as estatísticas demográficas referem-se aos dados numéricos sobre o quantitativo denascimentos,falecimentos,matrimônios,desquitesetc.Asestatísticaseconômicasestãorelacionadasaos dados numéricos como emprego, produção, vendas e com outras atividades ligadas aos váriossetoresdavidaeconômica.

Nosingular,“estatística”indicaaatividadehumanaespecializada,ouumcorpodetécnicas,ouaindaumametodologiadesenvolvidaparaacoleta,aclassificação,aapresentação,aanáliseeainterpretaçãodedadosquantitativoseautilizaçãodessesdadosparaatomadadedecisões.

Estatísticaéumconjuntodemétodoseprocessosquantitativosqueserveparaestudaremedirosfenômenoscoletivos.

Parafinsdidáticos, é comumos livros-textos apresentarema estatística emduasgrandes áreas,emboranãosetratedeáreasisoladas:estatística descritivaeestatística inferencial.

• estatística descritiva –éaquelaquetemporobjetivodescrevereanalisardeterminadapopulação,utilizandométodosnuméricos e gráficos, para sedeterminarempadrões, emumconjuntodedados,eassimapresentarainformaçãoemumaformaconveniente.

Exemplo 1: Ográficoaseguirapresentaaparticipaçãorelativadasbandeirasdecartõesdecrédito,noquartotrimestrede2010.

Visa52,2%

Outras9,4%

MasterCard38,4%

Figura1-Participaçãorelativadasbandeiras(quantidadedetransações)

Pormeiodográfico,épossívelverclaramentequemaisdametadedastransaçõessãofeitascomabandeiraVisaequeaproximadamente40%sãofeitascomabandeiraMasterCard.Comoográficodescreveostiposdebandeirasdecartõesutilizadasemtodasastransaçõesdoquartotrimestrede2010,ográficoéumexemplodeestatísticadescritiva.

Page 11: Estatistica Aplicada (30h) Unidade I

11

Revi

são:

And

réia

Gom

es -

Dia

gram

ação

: Léo

- 0

1/08

/201

2

Estatística aplicada

Exemplo 2:ÍndiceNacionaldePreçosaoConsumidor(INPC)

Suaapresentaçãoenvolveasintetização,emumúnicodado,dosaumentosdosprodutosdeumacestabásica.

Trata-sedeumexemplodeestatística inferencial,queconstituioconjuntodemétodosparaatomadadedecisões,nassituaçõesemqueháincerteza,variaçõesououtrasgeneralizaçõesacercadeumconjuntomaiordedados.

Exemplo 3:Análisedemercado

Quandoumaempresapretendelançarumproduto,precisaconheceraspreferênciasdosconsumidoresnomercadodeinteresse.Faz-senecessáriaumapesquisademercado.

Exemplo 4:Ocorrênciadeterremotos

Osgeólogosestãocontinuamentecoletandodadossobreaocorrênciadeterremotos.Gostariamdeinferirquandoeondeocorrerãotremoresequalasuaintensidade.Trata-se,semdúvida,deumaquestãocomplexaqueexigelongaexperiênciageológica,alémdecuidadosaaplicaçãodemétodosestatísticos.

1.2 Importância da estatística

Comodesenvolvimentohumanoe tecnológico, temospresenciadograndesdescobertasnaáreada saúde, da engenharia, da economia etc.; por outro lado, também observamos os problemas queseespalhampelomundo,porexemplo,aameaçacomadegradaçãodomeioambiente,asepidemias(H1N10) causando grandes preocupações para os governantes e para a população mundial. Comoajudarpesquisadores,cientistas,engenheirosetc.asenortearemcomoquedeveserfeitotantoparacriarnovaspossibilidadescomotambémparasolucionarosproblemasexistentes?

Ométodoestatísticolidacominformações,associandoosdadosaoproblema,mostrandocomoeoquecoletarparaobterconclusõesapartirdetodososdados,detalformaqueessasconclusõespossamserentendidasporoutraspessoas.Assim,essemétodoauxiliaosváriosprofissionaisnoplanejamentoenatomadadedecisões.

Saiba mais

Oartigo“Aelaboraçãodeestatísticasdemortalidadesegundocausasmúltiplas” apresenta uma aplicação da estatística mostrando a suaimportância para a tomada de decisões. Disponível em: <http://www.scielosp.org/pdf/rbepid/v3n1-3/03.pdf>.Acessoem:15jul.2012.

Page 12: Estatistica Aplicada (30h) Unidade I

12

Unidade i

Revi

são:

And

réia

Gom

es -

Dia

gram

ação

: Léo

- 0

1/08

/201

2

Vejamosalgunsexemplos:

Ogovernoanualmentedivulgaocensosobreadinâmicadapopulaçãobrasileira,apresentandoseucrescimentodemográfico,suascaracterísticasecomovivemosbrasileiros.

Asgrandesempresasfazemlevantamentossobrevendas,produção,inventário,folhadepagamentoeoutrosdados,afimdeverificarseaempresaestácrescendo,comoseucrescimentoestáemrelaçãoaoutrasempresasecomotomardecisõesfuturas.

Aanálisedosdadosémuitoimportanteparafazerumplanejamentoadequado.

Saiba mais

Para mais informações sobre o Censo, acesse o site do IBGE:<http://www.ibge.gov.br>.

1.3 Elementos fundamentais da estatística

Amostra:équalquersubconjuntonãovaziodeumapopulação.

Amostragem: éomeiodeescolhadaamostraeconsistenaseleçãocriteriosadoselementosaseremsubmetidosaoestudo.

1.3.1 População e amostra

Paraopesquisador,oestudodequalquerfenômeno,sejaelenatural,econômico,socialoubiológico,necessitadacoletaedaanálisededadosestatísticos.Acoletadedadoséparte inicialdequalquerpesquisa.

População:éoconjuntodetodosositens(pessoas,coisaseobjetos)queinteressamaoestudodeumfenômenocoletivo.

Parâmetro:éadenominaçãodeumacaracterísticanuméricaestabelecidaparatodaumapopulação.

Estimador:éacaracterísticanuméricaestabelecidaparatodaaamostra.

Exemplo: pesquisassobretendênciasdevotação.

Emépocasdeeleição,écomumarealizaçãodepesquisascomoobjetivodeconhecerastendênciasdo eleitorado. Para que os resultados sejam, de fato, representativos, deve-se atentar para que ascaracterísticas da população à qual os resultados da pesquisa serão estendidos sejam tão próximas

Page 13: Estatistica Aplicada (30h) Unidade I

13

Revi

são:

And

réia

Gom

es -

Dia

gram

ação

: Léo

- 0

1/08

/201

2

Estatística aplicada

quanto possível. A escolha da amostra, o questionário, a entrevista, a sintetização dos dados e arepresentaçãodosresultadossãoasetapasdessetipodepesquisa.

Populaçãosãotodos

oseleitoreshabilitadosdo

município.

Fenômenocoletivo

(EleiçõesparaPrefeituradeummunicípio).

Amostraéumgruponuméricodeeleitores

selecionadonapopulaçãodomunicípio

ParâmetroéumaproporçãodevotosparaocandidatoAobtidanapopulação

EstimadoréumaproporçãodevotosparaocandidatoAobtidanaamostra

Amostra

Figura2

1.4 Fases do método estatístico

Emumapesquisa,quandosedesejaempreenderumestudoestatísticocompleto,existemfasesdotrabalhoquedevemsertrabalhadasparasechegaraosresultadosfinaisdoestudo.

Asprincipaisfasessão:

• definição do problema –delimitaçãodoproblema;

• planejamento –organizaçãodasaçõesqueserãorealizadasnapesquisadecampo;

• coleta de dados – iracampobuscarasinformações;

• apuração dos dados – organizaçãodasinformaçõescoletadas;

• apresentação dos dados – gráficosetabelas;

• análise e interpretação dos dados – pormeioda linguagemmatemática (média,mediana,moda,desviopadrão,percentuaisetc.).

Observequaissãoasfasesprincipaisdométodoestatístico–compõemaorganizaçãodeumprojeto,suaexecuçãoeapresentaçãofinal.

1.5 dados estatísticos

Quandosetrabalhacomaobservação,amensuração,aanáliseeainterpretaçãodenúmeros,essesnúmerosnosconduzemaíndicesinflacionários,índicesdedesemprego,probabilidadededeterminadocandidatoganharaseleiçõesetc.Essesnúmeros,portanto,serãochamadosdedadosestatísticos,osquaisprecisarãoserorganizadosesumarizadosparasuacorretainterpretação.

O dado bruto significaqueos dadosnãoestãonumericamenteorganizadoseprocessados.Éoprocessamentoeaorganizaçãodosdadosqueostransformameminformação,enfatizando

Page 14: Estatistica Aplicada (30h) Unidade I

14

Unidade i

Revi

são:

And

réia

Gom

es -

Dia

gram

ação

: Léo

- 0

1/08

/201

2

seus aspectos mais importantes. A informação, portanto, é resultado de um tratamento dosdados.

Paraorganizar e processar osdados estatísticos, podem-seutilizar resumos visuais enuméricos,comográficos,mapas,tabelasemodelosnuméricos.

Amensuraçãoouaobservaçãodeitenscomoíndicesdepreços,rendamensalpercapitadeumEstadoetc.dãoorigemaosdadosestatísticos.Comoesses itensoriginamvaloresque tendemaapresentarcertograudevariabilidadequandosãomedidossucessivasvezes,iremoschamá-los,então,devariáveis.

Éimportanteidentificarosquatrotiposdevariáveis:variáveiscontínuas,variáveisdiscretas,variáveisnominaisevariáveisordinais.

• Variáveis contínuas:podemassumirqualquervalornumintervalocontínuo(dadocontínuo),ouseja,seráumnúmeroreal.Exemplos:altura,peso,velocidadeetc.

• Variáveis discretas:emgeral,originam-sedacontagemde itensesópodemassumirvaloresinteiros.Exemplos:númerodealunosemsaladeaula,númerodeprofessoresquetrabalhamnaescolaetc.

• Variáveis nominais:sãoaquelasqueexistemcomoobjetivodedefinircategorias,easobservações,mensuraçõeseanálisessãofeitas levando-seemcontaessasmesmascategorias.Exemplosdecategoriaseriam:separaçãoporsexo,estadocivil,esportepredileto,coretc.

• Variáveis ordinais: quando existe odesejodedispor os elementosobservados segundoumaordem de preferência ou desempenho, atribuem-se valores relativos para indicar essa ordem.Exemplo:primeiro,segundo,terceirograudeescolaridadeetc.

Asvariáveisdiscretasecontínuassãoditasvariáveisquantitativasporqueenvolvemdadosnuméricos.Jáasvariáveisnominaiseordinaisprecisamsertransformadasemvaloresnuméricosparaseremobjetodaanáliseestatística,esãoditasvariáveisqualitativas.Porexemplo:emumdepartamentodaempresaJJ,quetem36funcionários,fez-seumapesquisaparaverificaralgunsdados.Classifiqueasvariáveis,conformeosdadosdatabelaaseguir.

Tabela 1

Estado civil Grau de instrução Nº filhos Salário (X. min) Idade (anos-meses)

Solteiro EnsinoFundamental - 4,00 2303

Casado EnsinoFundamental 1 4,56 3210

Casado EnsinoSuperior 3 19,40 4811

Solteiro EnsinoMédio - 10,53 2508

Solteiro EnsinoMédio - 16,22 3105

Page 15: Estatistica Aplicada (30h) Unidade I

15

Revi

são:

And

réia

Gom

es -

Dia

gram

ação

: Léo

- 0

1/08

/201

2

Estatística aplicada

Resolução

Variável qualitativa nominal:estadocivil.

Variável qualitativa ordinal:graudeinstrução.

Variável quantitativa discreta:númerodefilhos.

Variável quantitativa contínua:salárioeidade.

Variáveis discretas e contínuas =variáveisquantitativas.

Variáveis nominais e ordinais =variáveisqualitativas.

Eainda:

Dados qualitativos:consistemematribuirqualidadeouatributoàvariávelpesquisada.

Dados quantitativos:consistememnúmerosquerepresentamcontagensoumedidas.

1.6 Formas iniciais de tratamento dos dados

Emgeral,quandonospropomosabuscarouconstruirinformaçõesapartirdedados,deparamo-nos,inicialmente, com um conjunto de dados brutos que pouco nos dizem. É preciso organizá-losminimamenteparaquecomecemafazeralgumsentido,viabilizandosuaanálise.

Exemplo 1:atabelaaseguirapresentaasnotasde40estudantesdadisciplinadeestatística.

Tabela 2

50 96 75 87 65 45 72 1032 54 25 69 72 30 81 2024 45 80 90 64 95 23 9080 35 96 47 65 70 73 6360 20 45 89 20 90 80 70

Essatabelaéchamadadetabelaprimitivaoudadosbrutos,poisosdadoscoletadosestãodispostosconformeaordemdacoletaenãonaordemdenumeração.

Observandoosdadosanteriores,tabelaprimitiva,ficadifícilvisualizaremtornodequevalortendemaseconcentrarasnotasdosestudantes,qualamaiorouqualmenornota,eaindaquantosalunosseachamabaixodeumadadanota.

Page 16: Estatistica Aplicada (30h) Unidade I

16

Unidade i

Revi

são:

And

réia

Gom

es -

Dia

gram

ação

: Léo

- 0

1/08

/201

2

Uma primeira forma de organização dos dados brutos é o chamado rol. Obtemos o rol quandoorganizamososdadosbrutosemordemcrescenteoudecrescentedegrandeza.

Aindacomrespeitoàtabeladenotados40estudantesdadisciplinadeestatística,vejamoscomofica:

Tabela 3

10 20 20 20 23 24 25 30

32 35 45 45 45 47 50 54

60 63 64 65 65 69 70 70

72 72 73 75 80 80 80 81

87 89 90 90 90 95 96 96

Agora,podemossaber,comrelativafacilidade,qualamenornota(10)equalamaiornota(96).Paradeterminaraamplitudedorol,bastarealizaradiferençaentreomaioreomenornúmerodorol,ouseja,paraoexemplo,aamplitudedevariaçãofoide96–10=86.

Exemplo 2:sejaA={10,7,3,9,1,5,10,4,2,8}oconjuntodasnotasdosalunos,determineoroleaamplitudedorol:

{10,7,3,9,1,5,10,4,2,8}àdadobruto

{1,2,3,4,5,7,8,9,10,10}àrol

Amplitude={maiorvalordorol–menorvalordorol}

àA=10–1=9

Limites de classe:sãoosnúmerosextremosdecadaclasse;sendoassim,temosumlimiteinferioreumsuperior,quedenominamosdeamplitudedevariação.

A=Lsup.-Linf.

1.7 notações por índices

Anotaçãoporíndicesébastanteutilizadanaestatística,sendoimportanteesclarecerseusignificado.Osímboloxi(lê-se“xíndicei”)irárepresentarqualquerumdosnvaloresassumidospelavariávelx,x1,x2,x3,x4,...,x.“n”édenominadoíndiceepoderáassumirqualquerdosnúmerosentre1,2,3,4,...,n.

1.7.1 Notação sigma (∑)

Amaioriadosprocessosestatísticosvaiexigirocálculodasomadeumconjuntodenúmeros.Aletramaiúsculagregasigma(∑)éutilizadapararepresentarosomatório.

Page 17: Estatistica Aplicada (30h) Unidade I

17

Revi

são:

And

réia

Gom

es -

Dia

gram

ação

: Léo

- 0

1/08

/201

2

Estatística aplicada

Assim,sedeterminadavariávelytiverosvalores3,5,7,9e11,o∑yserá:

∑y=3+5+7+9+11

∑y=35

Poroutrolado,seoconsumosemanaldearrozporx,duranteummês,foi2kg,4kg,3kg,5kg,ototalconsumidoporxnomêsteriasido:

∑x=2+4+3+5

∑x=14,xteriaconsumido14kgdearrozduranteomêsreferido.

Anotaçãosigmapossuialgumaspropriedadesqueprecisamosdesenvolverparafacilitarosconteúdosqueestudaremosnestadisciplina.

A) x x xi

n

i11=

∑ ∑ ∑= = ,issosignificaquedevemossomarasnobservaçõesdex,começandocom

aprimeira.

Porexemplo,numconjuntodedadosx={2,4,6,8,10,12},emquen=6,temos:

x x

x

ii

n

ii

i

= =∑ ∑

= = + + + + +

=1 1

6

2 4 6 8 10 12

42

Poroutrolado,épossívelutilizaressanotaçãoquandosepretendeanalisarasomadeapenasumapartedosdadosdisponibilizados, podendo-se, portanto, abreviar a somadeumconjuntodedados.Dessaforma,podemoster:

x x x xi1 2 31

3

+ + = ∑x x x x xi

i8 9 10 11

8

4

+ + + ==∑

B)Secadavalordavariávelxémultiplicadooudivididoporumaconstante,temosqueissoseráigualaovalordaconstantemultiplicadooudivididopelasomatóriadex.

c x c x. .= ∑∑

Page 18: Estatistica Aplicada (30h) Unidade I

18

Unidade i

Revi

são:

And

réia

Gom

es -

Dia

gram

ação

: Léo

- 0

1/08

/201

2

Assim,

4 4 4 4 4

4 4

1 2 3 41

4

1 2 3 41

4

x x x x x

x x x x x

ii

ii

= + + +

= + + + =

=

=

∑( )

Porexemplo:sexi={2,4,6,8,10,12},n=6,ecadavalordexémultiplicadopelaconstantec=2,temos:

cx c x= ∑∑cx c xi

ii

i

= = + + + + =

= + + + += =∑ ∑

1

6

1

6

2 2 2 4 2 8 2 10 2 12

2 2 4 6 8 10

( ) ( ) ( ) ( ) ( )

( ++

= = ===∑∑

12

2 2 2 42 841

6

1

6

)

( )x xi iii

C)Osomatóriodeumaconstantecseráigualaoprodutodaconstantepelonúmerodevezes(n)queelaserepete.Assim,temos:

c ncii i

n

==∑Porexemplo,numadeterminadaobservação,oconjuntodedadosdexi={7,7,7,7,7,7},n=6,

temosquexiéumaconstantecqueserepete.Então,temos:

x c

xi c nc

i i

iii

=

= = = + + + + + = ===∑∑

1

6

1

6

7 7 7 7 7 7 6 7 42( )

D)Osomatóriodeumasomaoudeumadiferençadeduasvariáveisseráigualàsomaoudiferençadossomatóriosindividuaisdasduasvariáveis.Assim,temos:

( )

( )

x y x y

x y x y

i i i ii

n

i

n

i

n

i i i ii

n

i

n

i

n

+ = +

− = −

===

===

∑∑∑

∑∑∑111

111

Page 19: Estatistica Aplicada (30h) Unidade I

19

Revi

são:

And

réia

Gom

es -

Dia

gram

ação

: Léo

- 0

1/08

/201

2

Estatística aplicada

Porexemplo:

i X Y (X-Y)

( )x y

x y

− =

− = − =∑∑ ∑

9

20 11 9

1 8 5 3

2 3 2 1

3 4 0 4

4 5 4 1

- - - -

Σ 20 11 9

Figura3

E)Osomatóriodeumconjuntodedadosxaoquadradonosobrigaaelevarcadaelementodexiaoquadradoparaefetuarasoma.Assim,temos:

x x x x xii

n

n2

112

22

32 2

=∑ = + + + +...

Porexemplo,numadadaobservação,oconjuntodedadosdexi={2,4,6,8,10},n=5;temos,então:

xii

2

1

52 2 2 2 22 4 6 8 10

4 16 36 64 100 220=∑ = + + + + =

= + + + + =

F)Osomatórioaoquadradodeumconjuntodedadosseráobtidotomando-seasomadosvaloresdexieelevando-seaoquadrado.Assim,temos:

( ) ( ... )x x x x xii

n

n=∑ = + + + +

1

21 2 3

2

Porexemplo,setemosummesmoconjuntoxi={2,4,6,8,10},n=5,talqualnoexemplodoitemE,teremosumresultadodistinto.Vejamos,nestecaso:

( ) ( ) ( )xii=∑ = + + + + = =

1

52 2 22 4 6 8 10 30 900

Nãoconfunda xii

n2∑ com xi

i

n

2

,pois,conformeseobservanoexemploanterior,seusresultadosserãodiferentes.

1.8 Séries estatísticas – simples e compostas

Umasérieestatísticadefine-secomoqualquertabelanaqualhajadistribuiçãodeumconjuntodedadosestatísticosdestinadosaumamesmaordemdeclassificação:quantitativa. Ou,ainda,nosentido

Page 20: Estatistica Aplicada (30h) Unidade I

20

Unidade i

Revi

são:

And

réia

Gom

es -

Dia

gram

ação

: Léo

- 0

1/08

/201

2

maisamplo,sérieéumasucessãodenúmerosreferidosaqualquervariável.Casoosnúmerosexpressemdadosestatísticos,asérieseráchamadadesérie estatística.

Astabelassãoutilizadasparaapresentarsériesestatísticas.Ostrêscaracterespresentesnatabelaqueasapresentasão:

• a época(fatortemporaloucronológico)–aqueserefereofenômenoestudado;

• o local(fatorespacialougeográfico)–ondeofenômenoacontece;

• o fenômeno(espéciedefatooufatorespecífico)–queédescritodeformacategórica.Assériessãodivididasemdoisgrupos:

Assériessãodivididasemdoisgrupos:

1. Séries homógradas:ondehávariaçãodiscretaoudescontínuanavariáveldescrita.

-SérietemporalSéries homógradas: -Sériegeográfica-Sérieespecífica.

2. Séries heterógradas: são aquelas nas quais o fenômeno/fato apresentam gradações ousubdivisões.

Séries heterógradas: Distribuiçãodefrequências

2 APrESEntAção dE dAdoS – gráFICoS E tAbElAS

Arepresentaçãográficadassériesestatísticastemporfinalidadesintetizarosresultadosobtidose,assim,chegaraconclusõessobreaevoluçãodofenômenoousobrecomoserelacionamosvaloresdasérie.Ográficomaisapropriadoficaráacritériodopesquisador,respeitandooselementosdeclareza,simplicidadeeveracidade(NOGUEIRA,2009).

Diretrizesparaaconstruçãodeumgráfico:

• otítulodográficodeveseromaisclaroecompletopossível,sendonecessárioacrescentarsubtítulos;

• aorientaçãogeraldosgráficosdeveserdaesquerdaparaadireita;

• asquantidadesdevemserrepresentadasporgrandezaslineares;

• semprequepossível,aescalaverticalhádeserescolhidademodoaapareceralinha0(zero);

• sódevemserincluídasnodesenhoascoordenadasindispensáveisparaguiaravistanaleitura,umtracejadomuitocerradodificultaoexamedográfico;

• aescalahorizontaldeveserlidadaesquerdaparaadireitaeaverticaldebaixoparacima;

Page 21: Estatistica Aplicada (30h) Unidade I

21

Revi

são:

And

réia

Gom

es -

Dia

gram

ação

: Léo

- 0

1/08

/201

2

Estatística aplicada

• os títulos e as marcações do gráfico dispor-se-ão de maneira que sejam facilmente legíveis,partindodamargemhorizontalinferioroudamargemesquerda.

Leituraeinterpretaçãodeumgráfico:

• declararqualofenômenooufenômenosrepresentados,aregiãoconsiderada,operíododetempo,afontedosdadosetc.;

• examinarotipodegráficoescolhido,verificarseéomaisadequado,criticarasuaexecução,noconjuntoenosdetalhes;

• analisarcadafenômenoseparadamente,fazendonotarospontosmaisemevidência,omáximoeomínimo,asmudançasmaisbruscas;

• investigarseháuma“tendênciageral”crescenteoudecrescenteou,então,seofatoexpostoéestacionário;

• procurardescobriraexistênciadepossíveisciclosperiódicos,qualoperíodoaproximadoetc.

Eisostiposmaiscomunsdegráficos:

Gráfico em linha

1234567

500

400

300

200

100

0

Série1

Série2

Figura4

Gráfico em colunas

População

1940195019601970

100

80

60

40

20

0

População

Figura5

Page 22: Estatistica Aplicada (30h) Unidade I

22

Unidade i

Revi

são:

And

réia

Gom

es -

Dia

gram

ação

: Léo

- 0

1/08

/201

2

Gráfico em barras

Ésemelhanteaográficoemcolunas,porémosretângulossãodispostoshorizontalmente.

PopulaçãodoBrasil

020406050100

1970

1960

1950

1940

PopulaçãodoBrasil

Figura6

Gráfico em setores

Anos Faturamento de uma empresa (em milhões)

2008 3

2009 4

2010 5

Total 12

Figura7

É a representação gráfica de uma série estatística, em círculo, por meio de setores. É utilizadoprincipalmentequandosepretendecompararcadavalordasériecomototal.

Total__________360ºParte___________xº

• Para2008:12-360º3-xºxº=90º

• Para2009:12-360º4-xºxº=120º

• Para2010:12-360º5-xºxº=150º

Page 23: Estatistica Aplicada (30h) Unidade I

23

Revi

são:

And

réia

Gom

es -

Dia

gram

ação

: Léo

- 0

1/08

/201

2

Estatística aplicada

2008

2009

2010

Figura8

Gráfico polar

Éarepresentaçãodeumasériepormeiodeumpolígono.Movimentomensaldecomprasdeumaagênciaem1972.

Tabela 4

Meses Valores (R$ 1.000,00)

Janeiro 12

Fevereiro 13

Março 14

Abril 12

Maio 15

Junho 19

Julho 17

Agosto 18

Setembro 14

Outubro 16

Novembro 12

Dezembro 18

JanFev

Mar

Abr

Mai

JunJul

Ago

Set

Out

Nov

Dez 20

15

10

5

0

Série1

Figura9

Page 24: Estatistica Aplicada (30h) Unidade I

24

Unidade i

Revi

são:

And

réia

Gom

es -

Dia

gram

ação

: Léo

- 0

1/08

/201

2

Gráfico carta geográfica

É a representação gráfica de um mapa geográfico indicando um acontecimento, por exemplo,aprevisãode tempoparadeterminadodiaemdeterminadoEstadooupaís.Afiguraa seguir éumcartogramaqueinformaaproduçãodepetróleosegundosuasregiõesgeográficas.

Cartograma 1.2–Produçãodepetróleo,segundoregiõesgeográficas(milhõesb/d)–2003

áfrica

AméricasCentraledoSul

8,4

14,2

6,7

7,9

7,9

22,6

OrienteMédio

ásia-Pacífico

EuropaeEx-UniãoSoviética

AméricadoNorte

Figura10

Nota:incluióleodexisto,óleodeareiasbetuminosas–oLGN,excetoparaoBrasil.

ParaoBrasil,incluiLGNenãoincluióleodexistoeóleodeareiasbetuminosas.

Pictograma

Éarepresentaçãográficamaisutilizadanaatualidadeporjornaiserevistas,poiséumgráficodeformaatraenteedefácilinterpretação.Mostraofenômenoestudadoinseridocomumgráficodelinha,coluna,barraoudesetor,conformeoexemploaseguir,emqueumoutdoorapontaaverbagastacompublicidadejuntocomumgráficodelinhaparamostrarseudesempenhoanual.

Page 25: Estatistica Aplicada (30h) Unidade I

25

Revi

são:

And

réia

Gom

es -

Dia

gram

ação

: Léo

- 0

1/08

/201

2

Estatística aplicada

Figura11

Publicidadeemalta

Institucional De utilidade pública

Orçamentoprevêaumentode20%emgastosdaadministraçãodireta

Valor da publicidadeEmR$Milhões

2007200820092010 200720082009201080,1

120,2

158,1167 532,1

425,1

294,7

152,6

Figura12

Saiba mais

AplicaçãodegráficosdecontroledeSomaAcumulada(CUSUM)paramonitoramento de um processo de usinagem. Disponível em: <http://dspace.universia.net/bitstream/2024/542/1/ArtigoXVISIMPEP2009.PDF>.Acessoem:20jul.2012.

Page 26: Estatistica Aplicada (30h) Unidade I

26

Unidade i

Revi

são:

And

réia

Gom

es -

Dia

gram

ação

: Léo

- 0

1/08

/201

2

2.1 Elementos básicos das tabelas

Umaformadesintetizarosvaloresqueumaoumaisvariáveispodemassumirépormeiodeumatabela.

Umatabelaéconstituídadosseguinteselementos:

Quadro 1

Título Éoconjuntodeinformaçõesqueprecedeatabelaecontémaindicaçãodosfatores:oquê?Quando?Onde?

Cabeçalho Éapartesuperiordatabelaqueespecificaoconteúdodascolunas.

Corpo da tabela Éoespaçoquecontémasinformaçõessobreofenômenoobservado.

Fonte Éaindicaçãodaentidaderesponsávelpelolevantamentodosdados.

Título Produção de petróleo em barris/dia

Estado e Região TotalBarris/dia Cabeçalho

RiodeJaneiro 1.597.387

Colunaindicadora

EspíritoSanto 193.962

Amazonas 52.964

Bahia 49.472

RioGrandedoNorte 60.861

Sergipe 42.072

SãoPaulo 16.983

Alagoas 6.300

Ceará 7.530

Paraná(xisto) 3.393

Rodapé

Figura13

3 MEdIdAS dE tEndÊnCIA CEntrAl: MÉdIA, ModA E MEdIAnA PArA dAdoS SIMPlES

Nodesenvolvimentodeumestudoestatístico,muitasvezeséinviávelexaminartodososelementosda população de interesse para tirar conclusões; pensando nisso, há medidas que possibilitamcondensar as informações para esclarecer a fase analítica da estatística descritiva. A inferênciaestatísticanosdáelementosparageneralizar,demaneirasegura,asconclusõesobtidasdaamostraparaapopulação.

Quandosetratadeamostra,apreocupaçãocentraléqueelasejarepresentativa.

Page 27: Estatistica Aplicada (30h) Unidade I

27

Revi

são:

And

réia

Gom

es -

Dia

gram

ação

: Léo

- 0

1/08

/201

2

Estatística aplicada

Assim que decidimos extrair informações por meio de um levantamento amostral, temosimediatamentedoisproblemas:

• definircautelosamenteapopulaçãodeinteresse;

• selecionaracaracterísticaqueiremospesquisar.

Portanto,temossituaçõesprofissionaisemquenosbastampoucosdadosouestatísticasdedadossimples.Poroutro lado,têm-setambémsituaçõesemqueumnúmeromaiordeelementosdeveserinvestigadoetratadocomodistribuiçõesdefrequência.

Quandoestamosdiantedeumconjuntodedados,sejaelepequenoougrande,emgeralbuscamosmedidasquepossamserusadasparaindicarumvalorquetendearepresentarmelhoraqueledeterminadoconjuntodenúmeros.Easmedidasmaisusadasnessesentidosãoaschamadasmedidasdetendênciaeventualoucentral,quesãoamédia,amedianaeamoda.

Sabe-sequeessesvaloresserãomedidosdeformadistintaconformeumgrandeconjuntodedadosouumpequenoconjuntodedados. Tambémocálculodessesvalores seráafetadocasoasvariáveissejamdiscretasoucontínuas.

Em estatística, a média é o valor médio de uma distribuição ou de um conjunto de dados,determinado segundo uma regra estabelecida a priori e que se utiliza para representar todos osvaloresdadistribuição.Existemdiversas formasdecalcularamédiadeumconjuntodenúmeros,porexemplo,algumasdelassão:médiaaritmética,médiaaritméticaponderada,médiageométricaemédiaharmônica.

observação

Neste módulo, trataremos do cálculo dessas estatísticas para oschamados dados simples ou conjuntos de dados com menos de 30elementos.

3.1 A média aritmética simples (x)

Amédiaaritméticaéumdosvaloresmaisrepresentativosdeumconjuntodedados.Obtém-seovalordamédiaaritméticadividindo-seosomatóriodosvaloresdoconjuntodedadospelonúmerodevalorestotaldesseconjunto.

Namédiaaritmética,temoscomosímbolo:x(lê-se“xtraço”ou“xbarra”).

Assim,temosque,paraaamostra,secalculaovalormédioutilizando-seosseguintesparâmetros:

Page 28: Estatistica Aplicada (30h) Unidade I

28

Unidade i

Revi

são:

And

réia

Gom

es -

Dia

gram

ação

: Léo

- 0

1/08

/201

2

x

x

n

ii

n

= =∑

1,onde

x⇒Médiaaritméticadaamostra(estimativa)

n⇒Númerodedadosdaamostra

xi⇒Cadavariáveldaamostra

Vamos, agora, tomar um exemplo de média aritmética. Supondo um conjunto de dadosxi = {2,4,6,8,10,12},onden=6,temos:

x

x

n

ii

n

= = + + + + + ==∑

1 2 4 6 8 10 126

7

Exemplo 1:

Umaamostradasnotasdasprovasdematemáticadosestudantesda7ªsériedeumagrandeescoladeSãoPauloxi,emque:

xi={87,42,64,58,90,90,85,63,47,74,100,94}en=12,temos:

x

x

n

ii

n

= = + + + + + + + + + + + ==∑

1 87 42 64 58 90 90 85 63 47 74 100 9412

74 5,

Anotamédianaprovadematemáticadosestudantesda7ªsériedessaescoladeSãoPaulo,poramostragem,é74,5.

observação

Sãoaspropriedadesqueamédiaaritméticasimplespossuiqueafazemamedidadetendênciacentralmaisusadaemaisimportantedetodas.

Sãopropriedadesdamédiaaritmética:

• emumconjuntodedados,ésemprepossívelocálculodamédia,independentementedequaiselementoscompõemesseconjuntodedados;

• emumdeterminadoconjuntodedados,ovalordamédiaseráúnicoecorresponderáaumaconstante;

• todososvaloresdedeterminadoconjuntodedadosirãoafetaramédia,seumvalorsemodifica,a média aritmética também se modificará; somando-se ou subtraindo-se uma determinadaconstantecacadaelementodeumdeterminadoconjuntodedadosxi=x1,x2,x3,...,xn,amédia

Page 29: Estatistica Aplicada (30h) Unidade I

29

Revi

são:

And

réia

Gom

es -

Dia

gram

ação

: Léo

- 0

1/08

/201

2

Estatística aplicada

aritméticaficaráaumentadaoudiminuídadessaconstantec;se,poroutrolado,multiplicarmoscada elemento desse conjunto de dados por uma constante c, a nova média será tambémmultiplicadaporessaconstantec;sedividirmoscadaelementodoconjuntodedadosporessamesmaconstantec,amédiaserádivididaporc.

Assim,setemosumconjuntoxi=x1,x2,x2,...,xn,amédiaserá:

x

x

ni

n

1

11= =

∑,logo:

x

c x

nx

x

nncn

x x ci

i

n

ii

n

21

21

2 1=+

⇒ = + ⇒ = += =∑ ∑( )

• asomaalgébricadosdesviosdosnúmerosdeumconjuntodedadosemtornodamédiaézero,issopodeserrepresentadodaseguinteforma:

x xi − =∑ 0

Porexemplo,setemosumconjuntodedadosxi=(2,4,6,8,10),onden=5,temosque:

x

xii= = + + + + ==∑

1

5

52 4 6 8 10

56

Seaplicarmosafórmulaacima,temos:

x x xi i− = − = − + − + − + − + −∑ ∑ 6 2 6 4 6 6 6 8 6 10 6( ) ( ) ( ) ( ) ( )

x x

x x

i

i

∑∑

− = − − + + +

− =

4 2 0 2 4

0

observação

A média aritmética é a mais utilizada em nosso dia a dia. É obtidadividindo-seasomadasobservaçõespelonúmerodelas.

3.2 A média aritmética ponderada xp

Numconjuntodedadosemquecadaelementooucadaobservaçãopossuiamesmaimportância,o cálculodamédia aritmética simplesmostrará bemapopulaçãoou a amostra estudada.Noentanto, se queremos atribuir pesos distintos ou importâncias distintas aos elementos de um

Page 30: Estatistica Aplicada (30h) Unidade I

30

Unidade i

Revi

são:

And

réia

Gom

es -

Dia

gram

ação

: Léo

- 0

1/08

/201

2

conjuntodedados,aestatísticaaseradotadaéamédiaaritméticaponderada,emqueacadavalorxideveráseratribuídoumdeterminadopesopi.Aexpressãoestatísticaparaocálculodamédiaponderadaé:

x

x p

pp

i ii

n

ii

n= =

=

∑1

1

Supondoqueumestudantetenhadeefetuarumasériedequatroexamesparaobtersuamédiafinalepassardeano,cadaexamepossuiumpesodiferentenacomposiçãodessamédia,conformeatabelaaseguir:

x

x p

p

x

p

i ii

n

ii

n

p

=

=+ + +

=

=

∑1

1

0 30 68 0 20 89 0 40 45 0 1

,

( , ) ( , ) ( , ) ,

logo

00 1000 30 0 20 0 40 0 10

20 4 17 8 18 10 66 2

( ), , , ,

, , ,

+ + += + + + =xp

Exame Nota Peso

1 68 0,30

2 89 0,20

3 45 0,40

4 100 0,10

1,00

Figura14

Anotamédiaserá,então,66,2, resultadodiferentedoqueseriaobtidoseutilizássemosamédiaaritméticasimples.

Numconjuntodedados,emquecadaelementooucadaobservaçãopossuiimportânciadiferente,utilizamosamédiaaritméticaponderada.

Exemplificandoasmédiasaritméticaeponderada:

Média aritmética–exemplo:umalunotirouasnotas5,8e6emtrêsprovas.Asuamédiaaritméticaserá(5+8+6)/3=7,25.

Média ponderada–exemplo:umalunofezumteste(peso1)eduasprovasprova(peso2), tirando 8 no teste, 5 na primeira prova e 6 na segunda prova. A sua média (ponderada)será [(1 x 8) + (2 x 5) + (2 x 6) ]/3 = 6. Se o teste e a prova tivessem o mesmo peso (enão importa qual o valor do peso, importa apenas a relação entre os pesos), a média seria,aproximadamente,6,33.

Distribuição por frequência é a tabela em que se organizam grandes quantidades de dados,determinandoonúmerodevezesquecadadadoocorre–frequência (fi) –eaporcentagemcomqueaparece–frequência relativa (fr).

Page 31: Estatistica Aplicada (30h) Unidade I

31

Revi

são:

And

réia

Gom

es -

Dia

gram

ação

: Léo

- 0

1/08

/201

2

Estatística aplicada

observação

∑fi=nnúmerototaldeobservações;

xi=valordavariáveloupontosmédiosdeclasses;

k=númerodeclassesoudevaloresindividuaisdiferentedavariável.

Exemplo: em uma turma, a nota atribuída a 30 alunos, referente a um teste de estatística, foidispostaemordemcrescente:4,4,4,4,5,5,5,5,5,5,5,5,6,6,6,6,6,7,7,7,7,7,8,8,8,8,9,9,10.

Observandoquealgumasnotasserepetem,podemosutilizaronúmerodeobservaçõesoufrequênciadecadaumdelescomoopesooufatordeponderação.

Assim:

(4x4)+(7x5)+(5x6)+(5x7)+(4x8)+(2x9)+(1x10)x=-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------=6,294+7+5+5+4+2+1

Utilizandoumatabelapararepresentaradistribuiçãodefrequência,temos:

Tabela 5

xi fi xi fi

∑xi fi 176x=------------------------------------=---------------------------=6,29n28

4 4 4x4=16

5 7 5x7=35

6 5 6x5=30

7 5 7x5=35

8 4 8x4=32

9 2 9x2=18

10 1 10x1=10

∑ 28 176

3.3 A mediana (Md)

Outramedidaimportantedeumconjuntodedadoséamediana.Amedianadividedeterminadoconjunto de dados que deverá estar ordenado em dois grupos iguais, em que metade terá valoresmenores,emetadeterávaloresmaioresqueamediana.

Antesdecalcularamediana,éprecisoorganizarosvaloresnumrolemordemcrescente,paraentãocontaratéametadedosvaloreseencontraramediana.Emgeral,apósorganizarmososdadosemumrol,podemoscalcularaposiçãodamedianacomafórmulaaseguir:

Page 32: Estatistica Aplicada (30h) Unidade I

32

Unidade i

Revi

são:

And

réia

Gom

es -

Dia

gram

ação

: Léo

- 0

1/08

/201

2

(n+1)Md=----------------------------2

Em que n é o número de dados observados. Por exemplo, para um conjunto de dadosxi = {6,9,3,5,2,9,5,5,8,7,1,7,2},emquen=13,temosprimeiroqueorganizaressesdados em um rol e depois encontrar a posição da mediana para então saber qual será amediana.Senão,vejamos:

rolxi-{1,2,3,5,5,5,6,7,7,8,9,9}

(n+1)13+1Md=----------------------------=----------------------------=722

Md=5

Amedianaéoutramedidadeposiçãodefinidacomoonúmerodomeio,quandoasmedidassãoorganizadasemordemascendenteoudescendente.Emoutraspalavras,amedianadeumconjuntodetermosordenadoséovalorsituadodetalformanoconjuntoqueoseparaemdoissubconjuntosdemesmonúmerodeelementos.

observação

Seonúmerodeelementosforímpar,entãoamedianaseráexatamenteovalor“domeio”.Seonúmerodeelementosforpar,entãoamedianaseráexatamenteamédia“dosdoisvaloresdomeio”.

Paradeterminaramediana:

• organizeoconjuntodedadosemumrol;

• paraumconjuntodedadoscujon=ímpar,amedianaseráovalordomeio;

• paraumconjuntodedadoscujon=par,amedianaseráamédiadosdoisvaloresdomeio.

Paraumconjuntodedadosxi={6,4,8,3,2,9,7,1},emquen=8,temos,então:

rolxi={1,2,3,4,6,7,8,9}

(n+1)8+1Posiçãomediana=----------------------------=----------------------------=4,522

Amedianaseráovalorqueestáameiocaminhodosdoisvaloresmédios;nessecaso,entre4e6.Comofazer?Deve-setiraramédiaentreosdoisvaloresdomeioparaobterovalordamediana.

Page 33: Estatistica Aplicada (30h) Unidade I

33

Revi

são:

And

réia

Gom

es -

Dia

gram

ação

: Léo

- 0

1/08

/201

2

Estatística aplicada

Assim,temos:

4+6Md=----------------------------=52

observação

Quandousamosamediana?

Empregamosamedianaquando:

• desejamosobteropontoquedivideadistribuiçãoempartesiguais;

• hávaloresextremosqueafetamdemaneiraacentuadaamédia;

• avariávelemestudoésalário.

Em teoria da probabilidade e em estatística, a mediana é uma medida de tendênciacentral,umnúmeroque representaasobservaçõesdedeterminadavariável,de tal formaqueessenúmero,amediana,deumgrupodedadosordenados,separaametadeinferiordaamostra,população ou probabilidade de distribuição, da metade superior. Mais concretamente, 1/2 dapopulaçãoterávaloresinferioresouiguaisàmediana,e1/2dapopulaçãoterávaloressuperioresouiguaisàmediana.

Emcasosdepopulações(n)ímpares,amedianaseráoelementodeposiçãocentraln +

°12

.

Paraoscasosdepopulações(n)pares,amedianaseráoresultadodamédiasimplesdoselementosdeposiçãocentral

ne

n2

12

° +

° .Porexemplo,paraasseguintesséries,temos:

Exemplo 1

1,3,5,7,9,ondasérieéímpar,temos:

n +

°

+

°

12

5 12

3ºposição

Amedianaéiguala5,poiséa3ªposiçãodasérie.

Page 34: Estatistica Aplicada (30h) Unidade I

34

Unidade i

Revi

são:

And

réia

Gom

es -

Dia

gram

ação

: Léo

- 0

1/08

/201

2

Exemplo 2

1,2,4,7,9,10,ondasérieépar,temos:

n n

en

e

21

2

63

12

3 4

° +

°

° +

°

° °

e

3°e4°

Amédiaseráamédiaentreo3°eo4°elementodasérie,queserá:

3°=4

4°=7

Md

Md

= +

=

4 72

5 5,Md=5,5

3.4 A moda

Muitasvezes,emumconjuntodedados,existemvaloresquese repetemcomfrequênciamaior.Amoda éjustamenteessevalorouessesvaloresquemaisserepetememumconjuntodedados.Épossívelhaverestatísticasquenãopossuammodaouquepossuammaisdeumamoda.

Noexemploquedemosanteriormente,paraumconjuntodedadosxi={1,2,3,4,6,7,8,9},nãoexistemoda,ediz-sequeoconjuntooudistribuiçãoéamodal.

Amodaéumaestatísticamuitomaisdescritivaesuaimportânciacresceàmedidaqueumvalorougrupodevaloresserepetemaisqueoutros,enessesentidoamodaindicariaovalortípicodaqueleconjuntodedadoscommaiorocorrência.Porexemplo,oconjuntodedadosxi={2,2,7,9,9,9,10,10,11,12,18}temmodaiguala9,porqueonúmero9éaquelecommaiorfrequência,repetindo-setrêsvezes.

Denominamos moda o valor ou valores de um conjunto de dados que aparecem com maiorfrequênciaemumasérie.Porexemplo:osaláriomodaldosprofessoresdeumaescolaéosaláriomaiscomum,istoé,osaláriorecebidopelomaiornúmerodeempregadosdessaescola.

Amodapodeapresentarmaisdeumvalor,diferentementedamédiaoudamediana.Éespecialmenteútilquandoosvaloresouobservaçõesnãosãonuméricos,umavezqueamédiaeamedianapodemnãoserbemdefinidas.

Amodade{pera,pera,banana,limão,limão,limão,pêssego}élimão.

Page 35: Estatistica Aplicada (30h) Unidade I

35

Revi

são:

And

réia

Gom

es -

Dia

gram

ação

: Léo

- 0

1/08

/201

2

Estatística aplicada

Asérie{1,3,4,5,5,6,6}apresentaduasmodas(bimodal):5e6.

Asérie{1,3,2,5,8,7,4,9}nãoapresentamoda.

Exemplo

Sabendo-sequeaproduçãoleiteiradiáriadeumavaca,duranteumasemana,foide10,14,13,15,16,18e12litros,pede-sequeseencontreamédia,amodaeamedianaparaaproduçãodiáriadeleitedessavaca.

Média

x

x

n

ii

n

= = + + + + + + = ==∑

1 10 14 13 15 16 18 127

987

14

Logo,x=14litrosdeleiteemmédiapordia,oquesignificaumaproduçãode98litrosdeleiteemmédiaporsemana.

observação

Amédiapodeserumnúmerodiferentedetodososvaloresdaamostraqueelarepresenta.

Moda

Comonãopossuiumvalorqueaparececommaiorfrequênciaqueosoutros,nãohávalordemodaparaesseexemplo.

Mediana

Ordenandoosdadosdeformacrescente,temos:10-12-13-14-15–16–18

Mdn

Md

Md

= +

°

= +

°

= °

12

7 12

4

Medianaseráo4°elementodasérie,queéiguala14litrosdeleitepordia.

Page 36: Estatistica Aplicada (30h) Unidade I

36

Unidade i

Revi

são:

And

réia

Gom

es -

Dia

gram

ação

: Léo

- 0

1/08

/201

2

observação

Cada frequência acumulada é a soma das frequências anteriores àclasse.

f1a=f1f2a=f1a+f2f3a=f2a+f3f4a=f3a+f4...........fna=f(n-1)a+fn

3.5 Posição relativa da média, moda e mediana

Emumadistribuiçãodefrequênciassimétricas,asmedidasdemédia,medianaemodacoincidem.Já quando a assimetria torna-se diferente, essa diferença é tanto maior quanto é a assimetria.Resumidamente,temos:

(a) (b) (c)

x=Md=Mo MoMdx xMdMo

Figura15-Distribuições:(a)simétrica,(b)assimétricae(c)assimétricanegativa.

a)x=xmd=Moàcurvasimétrica

b)Mo<xmd<xàcurvaassimétricapositiva

c)x<xmd<Moàcurvaassimétricanegativa

4 MEdIdAS dE dISPErSão PArA dAdoS SIMPlES

Observamosqueamoda,amediana,eamédiapodemserusadasparacondensar,numúniconúmero,aquiloqueé“médio”ou“típico”deumconjuntodedados.Noentanto,ainformaçãofornecidapelasmedidasdeposiçãonecessita,emgeral,sercomplementadapelasmedidasdedispersão.Essasmedidassãousadasparaindicaroquantoosdadosseapresentamdispersosemtornodaregiãocentral.Dessaforma,caracterizamograudevariaçãoexistentenoconjuntodevalores.Asmedidasdedispersãomaisutilizadassão:

• amplitudetotal;

Page 37: Estatistica Aplicada (30h) Unidade I

37

Revi

são:

And

réia

Gom

es -

Dia

gram

ação

: Léo

- 0

1/08

/201

2

Estatística aplicada

• desviopadrão;

• variância;

• coeficientedevariação.

Noteque,quantomaioresforemasmedidasdedispersão,maisheterogêneossãoosdadose,aocontrário,quantomenoresforemessasmedidas,maishomogêneoéoconjunto.

Vejamosaseguiralgunsexemplosquemostramanecessidadedeconhecermosasmedidasdedispersão.

Exemplo 1

Sabe-se que em Honolulu (Havaí) e em Houston (Texas) a temperatura média diária é quase amesma,emtornode23,9ºC.Pergunta-se:seráque,porisso,podemosinferirqueatemperaturasejabasicamenteamesmaemambasas localidades?Ounão serápossívelque, enquantoumacidadeémelhorparanatação,aoutraosejaparaatividadesexternas?

AtemperaturaemHonoluluvariamuitopoucoaolongodoano,oscilando,emgeral,entre21,1ºCe26,7ºC.Poroutrolado,atemperaturaemHoustonpodediferirsazonalmente(nasestaçõesdoano),istoé,apresentar-sebaixaemjaneiro(cercade4,4ºC)ealtaemjulhoeagosto(bempertode37,8ºC).Logo,podemosperceberumaoscilaçãosignificativa.DesnecessáriodizerqueaspraiasemHoustonnãoestãocheiasdegenteoanotodo.

Exemplo 2

Suponhaque,numaparticularcidade,tantoladrõesquantoprofessoressecundáriostenhamumarendamédiamensaldeR$900,00.Seráqueessainformaçãoindicaqueasduasdistribuiçõesderendasão, necessariamente, semelhantes? Muito ao contrário, poder-se-ia descobrir que elas diferem, emuito,numoutroaspectoimportante,queéofatodeasrendasdosprofessoresconcentrarem-seaoredordeR$900,00(seremconstantes,homogêneas),enquantoasdosladrõesespalham-semais(sãodescontínuas,heterogêneas),oquereflete,portanto,maioresoportunidadesparaprisões,desemprego,pobrezae,emalgunscasos,fortunasexcepcionais.

Os fatosmostramqueprecisamos,alémdeumamedidade tendênciacentral,deum índicequesinalizeograudedispersãodosdadosemtornodamédia.Esseíndiceéumamedidaindicativadoquecostumamoschamardevariabilidadeoudispersão.

Retornando ao exemplo 1, poderíamos concluir que a distribuição de temperatura em Houston(Texas)temmaiorvariabilidadedoqueadistribuiçãodetemperaturasemHonolulu(Havaí).Damesmaforma,podemosdizerqueadistribuiçãoderendasentreprofessoresapresentamenosvariabilidadedoqueadistribuiçãoderendasentreladrões.

Assim,quandosedesejaentender,analisaredescreverdeformaadequadaumdeterminadoconjuntodedados,faz-senecessáriodispornãoapenasdeinformaçõesrelativasàsmedidasdeposição.Épreciso

Page 38: Estatistica Aplicada (30h) Unidade I

38

Unidade i

Revi

são:

And

réia

Gom

es -

Dia

gram

ação

: Léo

- 0

1/08

/201

2

quesedisponhadeinformaçõesrelativasàvariabilidade(dispersão)daquelesnúmerosquecompõemoreferidoconjuntodedados.Essasmedidasdevariabilidadeoudispersãoindicamseosdadosobservadosestãopróximosouseparadosunsdosoutros.

Diferentedasmedidasdeposição,asmedidasdedispersãonãosãoautoexplicativas,suaaplicabilidadedependedacomparaçãodepopulaçõesoudeamostrasdomesmotamanhoedamesmacaracterísticaparaqueseobtenhaalgumainformaçãoimportanteapartirdaqueladeterminadavariabilidade.

Asprincipaismedidasdedispersãosão:aamplitudetotal(ouintervalo),odesviomédio,avariânciaeodesviopadrão.Amédiaservedereferênciaparatodasessasmedidas,excetoparaointervalo(ouamplitudetotal).Àproporçãoqueessasmedidasseelevam,issorepresentaumaumentodadispersão,oquesignificaque,seamedidaforigualazero,nãoexistedispersão.

Asmedidasdevariabilidade,quetêmamédiaaritméticacomopontodereferência,sãoimportantesporquenospermitemavaliarograudedispersãodasobservaçõesemrelaçãoaessamesmamédia,istoé,permitem-nosavaliaroquãodistanteosdadosdeumdeterminadogrupodeobservaçõesestãoda média calculada, dando-nos uma noção mais precisa da situação de determinada população ouamostra,alémdecondiçõesdetirarconclusõeseinformaçõesimportantesdaquelesdadosdisponíveis.

Exemplo 3

UmestudantedeeconomiaresolvefazerumapesquisasobreossaláriosmédiosdosfuncionáriosdedeterminadosetorindustrialemSãoPaulo.Nessapesquisa,esseestudanteconseguiuosseguintesdadosemtermosdesaláriosmínimosmensais:

xi={1.0;1.5;2.0;2.0;2.0;2.5;3.0;3.0;80.0;85.0}

Aocalcularosaláriomédiodessesetor,elechegouaovalormédiode18,2saláriosmínimospormês.Ora,masessedado,semocálculodesuadispersãoemrelaçãoàmédiaaritmética,pouconosdizsobrearealidadedessapopulação,eacabamosporterumavisãodistorcidadopadrãodevidadamaiorpartedosfuncionáriosdessesetoranalisadopeloestudante.Asmedidasdevariabilidadeoudispersãonospermitemperceberessadistorção.

Temos,comoprincipaismedidasdedispersão,intervalo,desviomédio,variânciaedesviopadrão.

As medidas mais comuns de variabilidade para dados quantitativos são a variância; a sua raizquadradaeodesviopadrão.Aamplitudetotal,adistânciainterquartílicaeodesvioabsolutosãomaisalgunsexemplosdemedidasdedispersão.

4.1 Amplitude total

Ointervalo ouamplitude total dedeterminadoconjuntodedadoséobtidopeladiferençaentreomaioreomenorvalornesseconjuntodenúmeros.Indica,portanto,adistânciaentreamaioreamenorobservaçãodeumconjuntodedados.Assim,temos:

Page 39: Estatistica Aplicada (30h) Unidade I

39

Revi

são:

And

réia

Gom

es -

Dia

gram

ação

: Léo

- 0

1/08

/201

2

Estatística aplicada

Amplitudetotal=Valormáximo-Valormínimo

Porexemplo,numconjuntodedadosxi={2,3,3,5,5,5,8,10,12},emquen=9,aamplitudetotalserá:

Atotal=Vmáximo-Vmínimo=12-2=10

Emalguns casos, o intervaloouamplitude total pode ser expresso simplesmentepela indicaçãodomenoredomaiornúmerodoconjuntodedados.Nocasodoexemploanterior,aamplitudetotalpoderia ser expressa simplesmentepela identificaçãodomenor edomaiornúmero, indicada comosendode(2a12)ou(2–12).

Agrandevantagemdaamplitudetotaléqueelaapresentacertafacilidadedesercalculada,mesmoquandooconjuntodedadosobservadosérelativamentegrande.Noentanto,comoaamplitudetotalapenaslevaemcontaosdoisextremosdoconjuntodenúmeros,emalgunscasoselapodeserumamedidaenganosaquantoàindicaçãodadispersãodeumconjuntodenúmeros,tendo,portanto,umautilidadelimitada.

Ointervalodedeterminadoconjuntodedadoséobtidopeladiferençaentreomaioreomenorvalornesseconjuntodenúmeros.

4.2 desvio médio absoluto

Odesviomédioabsolutoinauguraoestudodasmedidasdevariabilidadequetêmamédiacomopontodereferência.

Ochamadodesvionadamaiséqueadiferençaentre cadavalordedeterminadoconjuntodedadoseamédiadessemesmoconjuntodenúmeros (xi-x).Ovalorabsolutodeumnúmeroseráelepróprio, semosinalque lheéassociado,eé indicadopormeiodeduas linhasverticaisqueoenquadram.

Assim,|-67|=67;|9|=9.

Éprecisocalcularprimeiroamédiaaritméticadosdadosdisponíveis,queemgeralseapresentamcomodadosamostrais.

O desvio médio absoluto será calculado pela média dos desvios dos valores a contar da média,ignorandoosinal(+ou-)dodesvio,ouseja,convertendoosvaloresdosdesviosemvaloresabsolutos,considerando-ostodosdesviospositivos.Assim,temos:

Dmédio= x x

n

ii

n

−=∑

1

Page 40: Estatistica Aplicada (30h) Unidade I

40

Unidade i

Revi

são:

And

réia

Gom

es -

Dia

gram

ação

: Léo

- 0

1/08

/201

2

Emquenéonúmerodeobservações.

Vamos,agora,tomarumexemplodedesviomédio.Numconjuntodedadosamostraisxi={2,4,6,8,10,12},emquen=6,determineodesviomédio.Temos,então:

Dmédio=x x

ni −∑

Precisamos,primeiro,calcularamédia,paraentãopassarmosaocálculododesviomédio.Relembrandoafórmuladocálculodamédiaaritmética,temos:

xx

nx xi= ⇒ = + + + + + = ⇒ =∑ 2 4 6 8 10 12

67 7

Agora,podemoscalcularosdesviosparacadavalordoconjuntodedados.Assim,temos:

xi - xDmédio= x x

n

i −=

− + − + − + + +∑ 5 3 1 1 3 5

6

Dmédio= 5 3 1 1 3 56

3+ + + + +

=

Dmédio=3

2–7 -5

4–7 -3

6–7 -1

8–7 1

10–7 3

12–7 5

Σ 0

Figura16

Ovalorencontradoanteriormenterepresentaadiferençamédiadecadaobservaçãoeamédiadadistribuição,mastambémnessecasosóseriapossívelobtermaisinformaçõesapartirdodesviomédiocomparando com outras populações ou amostras de mesmas características. Por exemplo, se outroconjuntodedados,comasmesmascaracterísticasetamanho,apresentasseumdesviomédioabsolutoiguala2,4,ouseja,menorqueodesviomédioabsolutocalculadonoexemploanterior,poder-se-iadizerqueessesegundoconjuntodevaloresémaishomogêneodoqueonossoexemplo,jáqueadiferençadecadaumdosseuselementosemrelaçãoàmédiaaritméticaémenor.Teríamos,assim,umadispersãomenor.

Odesvioéqueadiferençaentrecadavalordedeterminadoconjuntodedadoséamédiadessemesmoconjuntodenúmeros.

4.3 Variância

Comonocálculododesviomédio,paraocálculodavariância,precisaremosutilizarodesviodecadaelementodeumconjuntodedadosemrelaçãoàmédiaaritmética(xi-x).Noentanto,aoinvésde

Page 41: Estatistica Aplicada (30h) Unidade I

41

Revi

são:

And

réia

Gom

es -

Dia

gram

ação

: Léo

- 0

1/08

/201

2

Estatística aplicada

trabalharmoscomosvaloresabsolutos(emmódulo),agoraosdesviossãoelevadosaoquadradoantesdasoma.Paraocasodedadosamostrais,aoinvésdedividirmosporn,dividimosporn–1(queéototaldaamostramenosumaunidade).

Avariânciairánosdizerograudedispersãodedeterminadogrupodedadoscomrelaçãoàmédiaaritméticadessesnúmeros.Assim,avariânciapopulacionalpoderásercalculadadaseguinteforma:

σµ2

2

=−∑ ( )x

ni ,onde

σ2:Variânciapopulacional;xi:Cadaobservaçãodoconjuntodedadospopulacional;µ:Médiadapopulação;n:Númerodeobservações.

Avariânciaamostralpoderásercalculadapelaseguintefórmula:

sx x

ni2

2

1=

−−

∑ ( ) ,onde

s2:Variânciadaamostra;xi:Cadaobservaçãodoconjuntoamostral;x:Médiadaamostra;n:Númerodeobservaçõesdaamostra.

Porexemplo,sejadeterminadoconjuntodedadosxi={1,3,5,7,9,11,13},emquen=7.Calculeavariânciadesseconjuntodedados,supondo:

• queesseconjuntodedadosrepresentatodaumapopulação;

• queesseconjuntodedadosrepresentaumaamostra.

A)Paracalcularavariânciadesseconjuntodedados,considerandoqueele representatodaumapopulação,devemosutilizaraseguintefórmula:

σµ2

2

=−∑ ( )x

ni

Devemospassaraocálculodamédiadesseconjuntodedadospara,então,procederaocálculodavariância.Sendoassim,temos:

µ µ

µ

= ⇒ =

= + + + + + + =

=

∑ x

ni

1 3 5 7 9 11 137

7

7

(médiapopulacional)

Page 42: Estatistica Aplicada (30h) Unidade I

42

Unidade i

Revi

são:

And

réia

Gom

es -

Dia

gram

ação

: Léo

- 0

1/08

/201

2

Partindodamédia,podemosagoracalcularosdesviosepartirparaocálculodavariânciapopulacional,jáquesupomosqueoconjuntodedadosrepresentavatodaapopulação.Assim,temos:

µ xi - µ (xi - µ)2

σµ

σ

σ

22

22 2 2 2 2 2

2

6 4 2 2 4 67

36 16 4 4 16

=−

=+ + + − + − + −

=+ + + + +

∑( )

( ) ( ) ( )

x

Ni

3367

16

162

=

7 7–1=6 62

7 7–3=4 42

7 7–5=2 22

7 7–7=0 0

7 7–9=-2 (-2)2

7 7–11=-4 (-4)2

7 7–13=-6 (-6)2

Σ 0 112

Figura17

Dessemodo,avariânciapopulacionaldesseconjuntodedadosseriaiguala16.

B)Se,poroutrolado,temosomesmoconjuntodedadosesupondoqueelerepresentaapenasdadosamostrais,devemoscalcularavariânciaamostraldeoutraforma,partindodocálculodamédiapara,então,calcularmosavariância.

Comovimosnoitem2,aexpressãoparaocálculodamédiaaritméticaemumaamostraéamesmadocálculodamédiaparaumapopulação,masutilizaremosparaasamostrasoutranotação.Vejamos:

xx

nxi= ⇒ =∑ 7 (médiaamostral).

Normalmente,amédiaamostralaproxima-sedamédiapopulacionalquantomaiorotamanhodaamostra,masnãoseigualaaela.

Passemos,então,aocálculodavariânciaamostral.Utilizaremososmesmospassosdocálculodavariânciapopulacional.Dessaforma:

sx x

ni2

2

1=

−−

∑ ( )

x xi - x (xi - x)2

Sx x

n

S

S

i22

22 2 2 2 2 2

2

1

6 4 2 2 4 67 1

36 16 4 4

=−

=+ + + − + − + −

=+ + +

∑( )

( ) ( ) ( )

++ +−

=

=

16 367 1

1126

18 6662S , ...

7 7–1=6 62

7 7–3=4 42

7 7–5=2 22

7 7–7=0 0

7 7–9=-2 (-2)2

7 7–11=-4 (-4)2

7 7–13=-6 (-6)2

Σ 0 112

Figura18

Page 43: Estatistica Aplicada (30h) Unidade I

43

Revi

são:

And

réia

Gom

es -

Dia

gram

ação

: Léo

- 0

1/08

/201

2

Estatística aplicada

Avariânciaamostraldesseconjuntodedadoséiguala18,666.

Comoamédiaaritmética,avariânciapossuialgumaspropriedadesimportantesquedevemoscolocaremdestaqueequefacilitamocálculodealgunsproblemasmaiscomplexos.

A)Somando-seousubtraindo-seumaconstanteacadaelementodeumconjuntodedados,ovalordavariâncianãosealtera.

Porexemplo,umconjuntodedadosxi={2,4,6,8},emquen=4,eamédiaéiguala5.Avariânciadesseconjuntoserádadacomosegue:

σµ

σ

σ

22

22 2 2 2

22 2

2 5 4 5 6 5 8 54

3 1

=−

⇒ = − + − + − + −

=−( ) + −( )

∑ ( ) ( ) ( ) ( ) ( )x

ni

++ += + + + = =

1 3

49 1 1 9

4204

52 2

Sesomarmosumaconstantec=4acadaumdoselementosdoconjuntodedados,temosumnovoconjuntodedadosyi={6,8,10,12},emqueamédiaseráiguala9.Avariânciaserá,então:

σµ

σ

22 2

2 2 2 2 2

22

2

6 9 8 9 10 9 12 9

4

3 1

=−

=−( ) + −( ) + −( ) + −( )

=−( ) + −(

∑ ( )y

ni

)) + ( ) + ( ) = + + + = =2 2 21 3

49 1 1 9

4204

5

Sendoassim,demonstramosqueσ σ222 = =,ouseja,aosomarmosumaconstanteacadaelemento

deumconjuntodedados,avariânciapermaneceamesma.

B)Aomultiplicarmosumaconstantecacadaelementodeumconjuntodedados,temosumanovavariânciaaomultiplicarmosavariânciadoconjuntodedadosoriginalporc2.

Assim,anovavariânciaserárepresentadadaseguinteforma:

σ σ22 2

12= c .

C)Aodividirmoscadaelementodeumconjuntodedadosporumaconstantearbitráriac,obtemosanovavariânciadividindo-seaantigavariânciaporc2.

Assim,podemosapresentaranovavariânciadaseguinteforma:

σ σ22 1

2

2=c

D)Avariânciadeumaconstanteéigualazero.

Page 44: Estatistica Aplicada (30h) Unidade I

44

Unidade i

Revi

são:

And

réia

Gom

es -

Dia

gram

ação

: Léo

- 0

1/08

/201

2

Existeumafórmulaalternativaereduzidaparaocálculodavariânciapopulacional,deduzidadafórmulaoriginal,queé:

σ µ22

2= −∑ x

ni

Paraavariânciaamostral,tambémexisteumafórmulaalternativabastanteutilizadaquenãoexigeocálculodamédiaequedecorredafórmulaanterior:

sx x n

nxi i22 2

1=

−−

∑ ∑( )

lembrete

Relembrandoaspropriedadesdevariância:

• aosomarmosumaconstanteacadaelementodeumconjuntodedados,avariânciapermaneceamesma;

• aomultiplicarmosumaconstantecacadaelementodeumconjuntodedados,temosumanovavariânciaaomultiplicarmosavariânciadoconjuntodedadosoriginalporc2;

• aodividirmoscadaelementodeumconjuntodedadosporumaconstantearbitráriac,obtém-seanovavariânciadividindo-seaantigavariânciaporc2;

• variânciadeumaconstanteéigualazero.

Saiba mais

Paraaprofundamentodotemadestaunidade,seguemalgunslinksquepodemauxiliá-lo:

“Métodos quantitativos e estatísticos para a tomada de decisão”.Disponível em: <http://www.santahelena.ueg.br/posgraduacao/mba/2007/download/metodosquantitativos/METODOS_QUANTITATIVOS_PARTE_I.pdf>.Acessoem:25jul.2012.

“Estatísticaexploratória”.Disponívelem:<http://www.cin.ufpe.br/~psb/EAD/Estatistica%20Exploratoria%20-%20Volume%201%20v11.pdf>.Acessoem:25jul.2012.

Page 45: Estatistica Aplicada (30h) Unidade I

45

Revi

são:

And

réia

Gom

es -

Dia

gram

ação

: Léo

- 0

1/08

/201

2

Estatística aplicada

4.4 desvio padrão

Obtém-se o desvio padrão extraindo-se a raiz quadrada da variância. Assim como a variância eodesviomédio,odesviopadrãotambémrepresentaumamedidadevariabilidadeabsoluta,e indicaodesviodecadaumdosnúmerosxideumdadoconjuntodeobservaçõesemrelaçãoàmédiaμ.Étambémchamadoporalgunsautoresdedesviodaraizmédiaquadrática.

Matematicamente,odesviopadrãopoderáserrepresentadodaseguinteforma:

DesviopadrãopopulacionalDesviopadrãoamostral

σµ

=−∑ ( )x

ni

2

sx x

ni=−

−∑ ( )2

1

Porexemplo,umconjuntodedadosamostraisxi={2,4,6},emquen=3eamédiaéiguala4.Vamos,então,calcularodesviopadrãoparaaamostra:

sx x

n

s

i=−

−= − + − + −

−=

= − + + = = =

∑ ( ) ( ) ( ) ( )

( )

2 2 2 2

2 2

12 4 4 4 6 4

3 1

2 0 22

82

4 2

Esseconjuntodedadosiráapresentarumdesviopadrãoiguala2.

Aspropriedadesdavariânciatambémsãoaplicáveisaodesviopadrão.Noentanto,existemduaspropriedades que serão distintas no caso do desvio padrão por causa de sua característica de raizquadradamédiapositivadavariância.

Assim,aomultiplicarmoscadaelementodeumconjuntodedadosporumaconstantec,onovodesviopadrãoseráigualaoantigomultiplicadopelaconstante.Temos,então:

σ2=c.σ1

Poroutrolado,sedividirmoscadaelementodeumconjuntodedadosporumaconstantec,onovodesviopadrãoseráigualaoanteriordivididopelaconstantec.Assim,temos:

σ σ2

1=c

Asdemaispropriedadesdavariânciaserãoasmesmasparaodesviopadrão.

Page 46: Estatistica Aplicada (30h) Unidade I

46

Unidade i

Revi

são:

And

réia

Gom

es -

Dia

gram

ação

: Léo

- 0

1/08

/201

2

4.5 Coeficiente de variação

Emestatísticadescritiva,ocoeficientedevariaçãoservepara indicar seodesviopadrãoégrandeoupequenoemrelaçãoàmédiaaritméticadasériequeestásendoestudada;portanto,éumacomparaçãoentreodesviopadrãoeamédiaaritméticadeumapesquisaquevaideterminarem porcentagem o quanto houve de desvio em relação à média. O coeficiente de variação écalculadopor:

Cvsx

= ,onde:

S=desviopadrão;

x=médiaaritmética,quepodeserdeumasériepopulacionalouamostral.

Porexemplo,noitem3.4,foideterminadoodesviopadrãodeumasérieamostral,portanto,vamoscalcularocoeficientedevariaçãodessasérie,queserá:

CvSx

Cv

Cv

Cv

=

=

==

240 5

50

,

%

Nesse exemplo, o coeficiente de variação é grande, indica que a variabilidade foi a metade emrelaçãoàmédiadessasérie.

Aspropriedadesdavariânciaseaplicamaodesviopadrão,exceto:

• quandomultiplicarmoscadaelementodeumconjuntodedadosporumaconstantec,onovodesviopadrãoseráigualaoantigomultiplicadopelaconstante;

• quandodividirmoscadaelementodeumconjuntodedadosporumaconstantec,onovodesviopadrãoseráigualaoanteriordivididopelaconstantec.

Em probabilidade e estatística, o desvio padrão é a medida mais usada da dispersão estatística.Nãoésenãocomoaraizquadradadavariância,ou,ainda,éaraizquadradadamédiaaritméticadosquadradosdosdesvios,tomadosapartirdamédiaaritmética.Édefinidodessaformademodoadar-nosumamedidadadispersãoqueseja:

• umnúmeroquenãosejanegativo;

• useasmesmasunidadesdemedidaqueosnossosdados.

Page 47: Estatistica Aplicada (30h) Unidade I

47

Revi

são:

And

réia

Gom

es -

Dia

gram

ação

: Léo

- 0

1/08

/201

2

Estatística aplicada

Faz-seumadistinçãoentreodesviopadrão(sigma)dototaldeumapopulaçãooudeumavariávelaleatóriaeodesviopadrãosdeumsubconjuntoemamostra.

OtermodesviopadrãofoiintroduzidonaestatísticaporKarlPearson,emseulivroSobreadissecçãodecurvasdefrequênciaassimétricas,de1894.

Exemplo

Utilizando-seoexemploapresentadoanteriormente,temosqueaproduçãoleiteiradiáriadeumavaca,duranteumasemana,foide10,14,13,15,16,18e12litros,pede-secalcularaamplitude,odesviopadrão(S),avariância(S2)e5ocoeficientedevariação(CV).

Solução

Amplitude

R=18–10=8litrosdeleite,ouseja,amaiorvariaçãodonúmerodelitrosdeleiteproduzidopordiapelavacaéde8litros.

observação

Sabemosqueamédiaparaessesdadosé:x=14litrosdeleitepordia.

Desvio padrão

s

x x

n

x x x x xn x

ni

n

=−( )

−=

−( ) + −( ) + + −( )−

==∑ 1

2

1 12

22 2

1 1

...

10 14 14 14 13 14 15 14 16 14 18 14 12 12 2 2 2 2 2−( ) + −( ) + −( ) + −( ) + −( ) + −( ) + − 44

7 1

2( )−

=

−( ) + ( ) + −( ) + ( ) + ( ) + ( ) + −( ) += + + + + + + =

4 0 1 1 2 4 2

616 0 1 1 4 16 4

64

2 2 2 2 2 2 222

6=

7 ≅ 2,65litrosdeleiteporsemana

Variância

S2=(S)2=(2,65)2≅7(litrosdeleite)2

Coeficientedevariação

Page 48: Estatistica Aplicada (30h) Unidade I

48

Unidade i

Revi

são:

And

réia

Gom

es -

Dia

gram

ação

: Léo

- 0

1/08

/201

2

cvSx

= = =2 6514

0 1893,

, ouseja,existeumavariabilidadede18,93%dosdadosemrelaçãoàmédia.

Saiba mais

Dicadeleitura:

“Análise do risco na avaliação de projetos de investimentos: umaaplicação do método de Monte Carlos”. Disponível em: <http://www.regeusp.com.br/arquivos/c6-Art7.pdf>.Acessoem:18jul.2012.

resumo

Nesta unidade, vimos que a estatística utiliza métodos matemáticosparasolucionarproblemasreaisdetomadadedecisãoquandoháincerteza.

Em situações nas quais poderíamos contar unicamente com a sorte,temosuminstrumentoquenospossibilitaaumentaraschancesdetomaramelhordecisão.

Utiliza ferramentas matemáticas definidas e, mesmo lidando comgrandenúmerodedados,essasferramentasresumemaanáliseemtabelasou gráficos. Na prática, a estatística pode ser empregada como baseconceitualefundamentalemváriasoutrasciências,inclusiveemanálisesgerenciais.

Foram apresentados também os cálculos de medidas de tendênciacentral (média,mediana,moda), asquais sãoutilizadaspara representara série pesquisada. Vimos que, por meio delas, podemos observar ocomportamentodavariávelqueasoriginou, istoé,nosdáumaideiadatendênciadetodoumconjuntodedados.E,ainda,foramapresentadasdeformaresumidaasideiasdesimetriaeassimetriaemfunçãodasmedidasdetendênciacentral.

Foram abordadas questões a respeito da distribuição de frequênciae suas representações gráficas, estudo das medidas de dispersão evariabilidade;e,porfim,foiapresentadoumestudodeintroduçãoaocálculoda probabilidade que nos ajuda a entender o significado de fenômenosaleatóriosparaoentendimentodoqueéprovávelepresumíveleaindaosváriostiposdefenômenosemdistribuiçãodeprobabilidade.

Page 49: Estatistica Aplicada (30h) Unidade I

49

Revi

são:

And

réia

Gom

es -

Dia

gram

ação

: Léo

- 0

1/08

/201

2

Estatística aplicada

Exercícios

Questão 1 (ENEM/2011–adaptada).Umaequipedeespecialistasdocentrometeorológicodeumacidademediu a temperaturado ambiente, semprenomesmohorário, durante15dias intercalados,apartirdoprimeirodiadeummês. Esse tipodeprocedimentoé frequente,umavezqueosdadoscoletadosservemdereferênciaparaestudoseverificaçãodetendênciasclimáticasaolongodosmeseseanos.Asmediçõesocorridasnesseperíodoestãoindicadasaseguir:

Dia do mês Temperatura (em ºC)

1 15,5

3 14

5 13,5

7 18

9 19,5

11 20

13 13,5

15 13,5

17 18

19 20

21 18,5

23 13,5

25 21,5

27 20

29 16

Emrelaçãoàtemperatura,osvaloresdamédia,medianaemodasão,respectivamente,iguaisa:

A)17oC,17oCe13,5oC.

B)17oC,18oCe13,5oC.

C)17oC,13,5oCe18oC.

D)17oC,18oCe21,5oC.

E)17oC,13,5oCe21,5oC

Respostacorreta:AlternativaB.

Page 50: Estatistica Aplicada (30h) Unidade I

50

Unidade i

Revi

são:

And

réia

Gom

es -

Dia

gram

ação

: Léo

- 0

1/08

/201

2

Análise das alternativas

Comosdadosfornecidos,tem-seaseguintetabeladefrequências:

xi 13,5 14 15,5 16 18 18,5 19,5 20 21,5

fi 4 1 1 1 2 1 1 3 1

1)Paracalcularamédiatem-se:

X−

= + + + + + + + +13 5 4 14 1 15 5 1 16 1 18 2 18 5 2 19 5 1 20 3 215 14

, . . , . . . , . , . . , .++ + + + + + +

= =1 1 1 2 1 3 1

25515

17

Amédiaé17oC.

2)Amediana(valordooitavotermo)é18oC.

3)Amodaé13,5oC.

Sendoassim,

A)Alternativaincorreta.

Justificativa:deacordocomoscálculos.

B)Alternativacorreta.

Justificativa:deacordocomoscálculos.

C)Alternativaincorreta.

Justificativa:deacordocomoscálculos.

D)Alternativaincorreta.

Justificativa:deacordocomoscálculos.

E)Alternativaincorreta.

Justificativa:deacordocomoscálculos.

Questão 2(ENEM/2011).AparticipaçãodosestudantesnaOlimpíadaBrasileiradeMatemáticadasEscolasPúblicas(OBMEP)aumentaacadaano.Oquadroindicaopercentualdemedalhistasdeouro,porregião,nasediçõesdaOBMEPde2005a2009.

Page 51: Estatistica Aplicada (30h) Unidade I

51

Revi

são:

And

réia

Gom

es -

Dia

gram

ação

: Léo

- 0

1/08

/201

2

Estatística aplicada

Região 2005 2006 2007 2008 2009

Norte 2% 2% 1% 2% 1%

Nordeste 18% 19% 21% 15% 19%

Centro-Oeste 5% 6% 7% 8% 9%

Sudeste 55% 61% 58% 66% 60%

Sul 21% 12% 13% 9% 11%

Disponívelem:http://www.obmep.org.br.Acessoem:abr.2010(adaptado).

Emrelaçãoàsediçõesde2005a2009daOBMEP,qualopercentualmédiodemedalhistasdeourodaregiãoNordeste?

A)14,6%.

B)18,2%.

C)18,4%.

D)19,0%.

E)21,0%.

Resolução desta questão na plataforma.