apostila estatistica aplicada

Upload: eduardo-barbosa

Post on 10-Jul-2015

895 views

Category:

Documents


2 download

TRANSCRIPT

CURSO DE ESTATSTICA APLICADAProf. Henrique Dantas NederDepartamento de Economia Universidade Federal de Uberlndia.SUMRIO1.Introduo............................................................................................................42.Estatstica Descritiva............................................................................................8 2.1 Tipos de Variveis........................................................................................8 2.2 Tabelas e Distribuies de Freqncia......................................................10 2.3 Histogramas................................................................................................12 2.4 Tabulao de Freqncia e Histograma para Variveis Contnuas..........13 2.5 Medidas de Posio e de Disperso..........................................................16 2.5.1 Uma Nota sobre Notao Estatstica ................................................17 2.5.2 A Mdia Aritmtica No Ponderada.....................................................18 2.5.3 A Mdia Aritmtica Ponderada.............................................................19 2.5.4 Propores como Mdias.....................................................................20 2.5.5 A Mdia Geomtrica.............................................................................21 2.5.6 A Mdia Harmnica..............................................................................25 2.5.7 A Mediana.............................................................................................26 2.5.8 A Mdia para Dados Agrupados..........................................................27 2.5.9 A Mediana para dados Agrupados.......................................................29 2.5.10 A Moda para dados Agrupados.........................................................30 2.5.11 O Intervalo (ou amplitude)..................................................................37 2.5.12 Percentis, Decis e Quartis..................................................................39 2.5.13 Varincia e Desvio Padro.................................................................40 2.5.14 Varincia e Desvio Padro para Dados Agrupados..........................42 2.5.15 Interpretando e Aplicando o Desvio Padro......................................44 2.5.16 Coeficiente de Variao ....................................................................45 2.6 Medidas de Assimetria...............................................................................46 2.7 Curtose: uma medida de achatamento......................................................483. Probabilidade....................................................................................................51 3.1Definio Clssica de Probabilidade.........................................................52 3.2 Conceito da Freqncia Relativa...............................................................53 3.3Probabilidade Subjetiva.............................................................................54 3.4 Algumas Regras Bsicas de Probabilidade...............................................54 3.5 A Regra do Complemento..........................................................................55 3.6 A Regra Geral da Adio............................................................................57 3.7Regras de Multiplicao............................................................................59 3.8 Probabilidade Condicional..........................................................................61 3.9 Diagramas em rvore.................................................................................63Probabilidades......................................................................................................64 3.10 Teorema de Bayes...................................................................................64 Anexo 1 Recordando Definies e Conceitos ..............................................65 Anexo 2 - Independncia e Modelos de rvore para Calcular Probabilidades ........................................................................................................................68 Anexo 3 - Probabilidade Condicional ...........................................................73 Resumo do Clculo de Probabilidades............................................................77 Exerccios de Probabilidade.............................................................................78A............................................................................................................................8224. Variveis Aleatrias Discretas..........................................................................964.1 O Valor Esperado (mdia) de uma Distribuio de Probabilidade Discreta............................................................................................................100 4.2 A Varincia e o Desvio Padro de uma Distribuio de Probabilidade Discreta............................................................................................................100 4.3 A Distribuio de Probabilidade Binomial................................................103 4.4 A Mdia e Varincia De Uma Distribuio Binomial................................106 Apndice 1 (Recordao)...............................................................................107 Apendice 2 (Recordao)...............................................................................108 Apndice 3 (Recordao)...............................................................................109 Apndice 4 (recordao)................................................................................115 Valor Esperado e Varincia de uma Varivel Aleatria..............................115 Variveis Aleatrias Independentes...............................................................1225. Variveis Aleatrias Contnuas e Distribuio Normal..................................125 5.1 Variveis Aleatrias Contnuas................................................................125 5.2 Mdia e Varincia de uma Varivel Aleatria Contnua..........................126 5.3 Varivel Aleatria Normal.........................................................................127 5.4 Distribuio Normal Padro.....................................................................129 5.5 reas Abaixo da Curva Normal................................................................1306. Mtodos de Amostragem e Distribuies Amostrais.....................................139 6.1 Amostragem Probabilstica .....................................................................140 6.2 Teorema do Limite Central.......................................................................144 6.3 Estimativa de Ponto..................................................................................145 6.4 Estimativa de Intervalo.............................................................................145 6.5 Intervalo de Confiana para Uma Proporo Populacional.....................146 6.6 Fator de Correo de Populao Finita...................................................147 6.7 Selecionando uma Amostra.....................................................................148 6.8 Tamanho Amostral para Estimativa de Propores................................1497. Teste de Hipteses Amostras Grandes......................................................149 7.1 Testes de Significncia Unicaudais........................................................151 7.2 Testes de Significncia Bicaudais ...........................................................152 7.3 P-value de um Teste de Hiptese ...........................................................153 7.4 Clculo do P-value....................................................................................154 7.5 Teste de Hipteses: Duas Mdias Populacionais....................................155 7.6 Testes Referentes a Proporo...............................................................157 Exerccios :.....................................................................................................160 ...........................................................................................................................17031. IntroduoA Significncia e a Abrangncia da EstatsticaPorque a estatstica importante?

Os mtodos estatsticos so usados hoje em quase todos os campos de investigao cientfica, jqueeles capacitam-nos aresponder aumvasto nmero de questes, tais como as listadas abaixo:1)Como os cientistas avaliam a validade de novas teorias?2)Como os pesquisadores mdicos testam a eficincia de novas drogas ?3)Como os demgrafos prevemotamanho dapopulaodo mundo em qualquer tempo futuro?4)Como pode um economista verificar se a mudana atual no ndice de Preos ao Consumidor a continuao de umatendncia secular, ou simplesmente um desvio aleatrio?5)Como possvel para algum predizer o resultado de uma eleio entrevistando apenas algumas centenas de eleitores ?Estes so poucos exemplos nos quais a aplicao da estatstica necessria. Podemos presumir que a matemtica uma das rainhas das cinciasporqueelaforneceaestruturatericaparaquasetodasasoutras cincias. Sevocjfezumcursobsicodefsica, jestfamiliarizadocom algumasdasleismatemticasquegovernamtemastodiversificadoscomo gravidade, energia, luz, eletricidade, etc. Mastambmdevemosconsiderar o fato de que as teorias matemticas esto sendo desenvolvidas todos os dias em muitas reas por estatsticos tericos - pessoas treinadas em teoria estatstica e probabilidade. Para citar alguns poucos casos ilustrativos elas so desenvolvidas para teoria dos vos espaciais emfsica; para teorias do conhecimento do comportamento animal e humano em psicologia; para teorias da migrao e dos diferenciais de raa em sociologia; para teorias de epidemias em sade pblica;...4De fato, a estatstica tornou-se uma ferramenta cotidiana para todos os tipos de profissionais que entram em contato com dados quantitativos ou tiram concluses a partir destes.O que Estatstica ?AnoodeEstatstica foi originalmentederivadadamesmaraizda palavra Estado, j que foi a funo tradicional de governos centrais no sentido dearmazenar registrosdapopulao, nascimentosemortes, produodas lavouras, taxas e muitas outras espcies de informao e atividades. A contagememensuraodessasquantidadesgeratodosostiposdedados numricosquesoteisparaodesenvolvimentodemuitostiposdefunes governamentais e formulao de polticas pblicas.Dados numricos so de fato uma parte da Estatstica, mas so apenas a matria-prima, que precisa ser transformada pelos mtodos estatsticos para posterior anlise. A Estatstica, como um mtodo cientfico, refere-se ao projeto de experimentos e a descrio e interpretao de observaes que so feitas. De um ponto de vista moderno, a Estatstica freqentemente definida como um mtodo de tomada de deciso em face da aleatoriedadedos fenmenos. Em uma mais vasta perspectiva, o escopo da estatstica pode ser pensado em termosdetrsreasdiferentesdeestudos: (1) aEstatsticaDescritiva(2) A Estatstica Indutiva e (3) A Teoria da Deciso Estatstica.Estatstica DescritivaAestatsticaDescritivarefere-seaocorpodemtodosdesenvolvidos para coletar, organizar, apresentar e descrever dados numricos. Essa rea da Estatstica refere-se s seguintes tarefas:1)Encontrar um mtodo apropriado de coletar dados numricos eficientemente e acuradamente para um dado problema.2)Determinar um formato eficiente , tal como uma apresentao tabular, para a organizao dos dadosdeumaformasistemticaeordenada, demaneira 5queainformaofornecidapelosdadospossaserobservadacomgrande facilidade e preciso.3)Apresentar dadosnumricos, sejaorganizadosouno, deformaqueas caractersticas e o comportamento dos dados so clara e facilmente revelados. Tais apresentaes So feitas por meio de mtodos grficos.4)Sumarizar ou descrever cada caracterstica ou propriedade dos dados por um simplesnmero, tal comoumamdia, umaporcentagemoualgumaoutra medida apropriada, a qual calculada a partir dos dados por meio de uma frmula derivada a partir de algum princpio vlido. Estatstica IndutivaA Estatstica Indutiva, que tambmfreqentemente chamada de infernciaestatsticaouestatsticainferencial, emcontrastecomaestatstica descritiva, essencialmente analtica emsua natureza. Consiste de um conjuntodeprincpiosouteoremasquenospermitemgeneralizar acercade alguma caracterstica de uma populao a partir das caractersticas observadas de uma amostra. Nessa definio, uma populao o conjunto de todos os itens, objetos, coisas ou pessoas a respeito das quais a informao desejada para a soluo de um problema. Uma amostra um grupo de itens selecionados por um mtodo cuidadosamente concebido e projetado a partir de uma populao. Existem diferentes tipos de amostras, dependendo dos diferentes mtodos deseleodisponveis. Umaamostraaleatriasimples, falando em termos simplificados, aquela que selecionada de tal forma que cada e todos os itens na populao tem a mesma chance de serem includos na amostra.Se uma medida descritiva calculada a partir dos dados da populao elachamadadeparmetropopulacional, ousimplesmenteparmetro;se calculada a partir dos dados da amostra ela chamada de estatstica amostral, ousimplesmenteestatstica.Considerandoessesconceitospodemos definir estatstica indutivacomo o processo de generalizar acerca de do valor de um parmetro a partir do valor de uma estatstica. Existem dois procedimentos de inferncia distintos mas relacionados: estimao e teste de hipteses. 6Estimao processo de usar o valor de uma estatstica amostral para estimar o valor de um parmetro que desconhecido, mas uma constante. Como um exemplo suponhamos que temos uma populao de 100.000 bolas de gude em um saco, todas as quais so idnticas exceto pela cor, e que no podemos v-las embora saibamos que uma parte delas so brancas e o restante so pretas. Suponha que desejamos ter uma idia da proporo de, digamos, bolas brancas nessa populao. Suponha que para conseguir isso selecionamos 1.000 bolas aleatoriamente do saco e verificamos que 350 so brancas. Isso significa que nossa proporo amostral de bolas brancas 35 %. A partir disso conclumos que a proporo populacional de bolas brancas tambm 35 %. Fazendo isso ns realizamos o que chamado de estatstica pontual. Mas afirmar que a proporo de bolas brancas em toda a populao exatamente igual a proporo daquela amostra particular como dar um tiro no escuro: o valor da proporo amostral um resultado aleatrio e depende de cada amostra de 1.000 bolas escolhida da populao. Pode ser que por uma enormecasualidadeoresultadodaquelaamostraqueescolhemos coincida exatamente com o valor da proporo de bolas brancas em toda a populao. Masaschancesdequeissonoocorrasomuitograndes. Umaformade contornarmos esse problema afirmarmos que as chances so de 95 em 100 (ou de 95 %) de que o intervalo formado pela proporo amostral acrescida e diminudade3 pontos percentuaiscontenha o verdadeirovalor da proporo populacional desconhecido. Ou seja, construmos um intervalo com limites 35 + 0,03 x 35 = 36,05 e 35 - 0,03 x 35 = 33,95 e afirmamos (com base em algum princpio obtido a partir da teoria estatstica) que as chances so de 95 em 100 de queo verdadeirovalor daproporopopulacional esteja localizadodentro desse intervalo. Quando uma afirmativa dessa natureza feita estamos realizando o que se chama de estimativa por intervalo.Quanto ao segundo procedimento da estatstica inferencial deixaremos para coment-lo quando for abordado em sua ntegra. E o terceiro campo de estudos da Estatstica, a Teoria da Deciso Estatstica no ser discutido nessa apresentao.72. Estatstica Descritiva2.1 Tipos de VariveisExistem diversos tipos de variveis que sero utilizadas em um estudo estatstico. importante compreender o conceito matemtico de varivel. Varivel uma abstrao que se refere a um determinado aspecto do fenmeno que est sendo estudado. Podemos afirmar que a quantidade colhida da safra anual de soja uma varivel. Representemos essa varivel pela letra X. Essa varivel podeassumir diversosvaloresespecficos, dependendodoanosde safra, por exemplo, X1986, X1990 e X1992. Esses valores que a varivel assume em determinados anos no so a prpria varivel , mas valores assumidos ela para determinados objetos ou pessoas da amostra ou da populao. Se uma amostra tiver 50 indivduos podemos referimo-nos a X como sendo a varivelnota de estatstica e a X30como a nota de um indivduo particular, no caso o trigsimo. freqente tambm na literatura utilizar-se letras maisculas para a notao de variveiseascorrespondentesletrasminsculaspararefernciaaosvalores particulares assumidos por essa varivel mas nesse resumo procuraremos evitar essa forma de notao. Variveis quantitativas -referem-se a quantidades e podem ser medidas em uma escala numrica. Exemplos: idade de pessoas, preo de produtos, peso de recm nascidos.As variveis quantitativas subdividem-se em dois grupos: variveis quantitativas discretasevariveisquantitativascontnuas. Variveisdiscretassoaquelas que assumemapenas determinados valores tais como 0,1,2,3,4,5,6 dando saltos de descontinuidade entre seus valores. Normalmente referem-se a contagens. Por exemplo: nmero de vendas dirias em uma empresa, nmero de pessoas por famlia, quantidade de doentes por hospital.1As variveis 1Uma varivel quantitativa discreta no precisa assumir necessariamente apenas valores de contagem, ou seja nmeros inteiros ou nmeros naturais em seqncia. Umexemplodevarivel quantitativadiscretaseria, por exemplo, 8quantitativas contnuas so aquelas cujos valores assumem uma faixa contnua e no apresentam saltos de descontinuidade. Exemplos dessas variveis so o pesodepessoas, arendafamiliar, oconsumomensal deenergiaeltrica, o preo de um produto agrcola.2As variveis quantitativas contnuas referem-se ao conjunto dos nmeros reais ou a um de seus subconjuntos contnuos. Variveis Qualitativas - referem-se a dados no numricos.3 Exemplos dessas variveis so o sexo das pessoas, a cor, o grau de instruo.Asvariveisqualitativassubdividem-setambmemdoisgrupos: asvariveis qualitativas ordinais e as variveis qualitativas nominais. As variveis qualitativas ordinais so aquelas que definemumordenamento ou uma hierarquia. Exemplos so o grau de instruo, a classificao de um estudante no curso de estatstica, as posies das 100 empresas mais lucrativas, etc. As uma que assumisse apenas os seguintes valores : { 1;3,5 ;5,75 ; 10 }. Apesar dessa varivel abranger valores no inteiros ela apresenta saltos de descontinuidade: nesse exemplo ela no pode assumir nenhum valor intermedirio entre 1 e 3,5 ou entre 5,75 e 10. 2Seria impossvelobter na prtica uma varivel perfeitamente contnua j que os instrumentos de medida no tem preciso infinita. Por exemplo., o peso de pessoasmedidocomumabalanacompreciso, digamos, dedcimosde gramas. Ento jamais conseguiremos obter um valor para essa varivel que se localizeentre50.000,1e50.000,2gramas, por exemplo, 50.000,15gramas. Ocorre portanto um salto de descontinuidade entre os dois valores possveis de serem medidos e a varivel, do ponto de vista terico, no pode ser considerada como varivel quantitativa contnua, mas varivel quantitativa discreta. Mas do pontodevistaprtico, acabamosfreqentementepor consider-laetrat-la como sendo uma varivel quantitativa contnua, apesar dessa falta de preciso absoluta. Omesmo podemosdizerparaocasodarendaouqualqueroutra variveleconmica medida em unidades monetria: no existe uma renda de por exemploR$200,345 jqueocentavo amenor divisodosistema monetrio. Masdequalquer forma, costuma-setratar arendacomovarivel quantitativa contnua e no discreta.3 muito comum considerar-se que a estatstica apenas abrange os estudos que utilizam as variveis quantitativas. Nada mais equivocado. Existe um vasto campo de aplicaes estatsticas em que so empregadas as variveis qualitativas, tanto isoladamente como em conjunto com variveis quantitativas.9variveis qualitativas nominais por sua vez no definem qualquer ordenamento ou hierarquia. So exemplos destas a cor , o sexo, o local de nascimento, etc.4Dependendo da situao uma varivel qualitativa pode ser representada (codificada) atravs de emprego de nmeros (por exemplo: em sexo representamos homens como sendo 0 e mulheres como sendo 1). Mas no tratamento estatstico dessa varivel codificada no podemos consider-la como sendo quantitativa. Ela continua sendo uma varivel qualitativa (pois o em sua essncia e natureza) apesar de sua codificao numrica que temcomo finalidade uma maior finalidade de tabulao de resultados.No podemos dizer que para qualquer uma destas categorias qualquer mtodo estatstico pode ser adequadamente aplicado. As variveis quantitativas contnuas soaquelas quepermitemautilizaodeumconjuntomaior e superior de mtodos estatsticos e so, sem dvida, as variveis mais passveis de um rico tratamento estatstico. Em seguida vm, nessa ordem, as variveis quantitativas discretas, as variveis qualitativas ordinais e por ltimo, as variveis qualitativas nominaisEssas ltimas so as que permitem a utilizao de um menor e menos poderoso arsenal de instrumentos estatsticos de anlise.2.2 Tabelas e Distribuies de FreqnciaAanliseestatsticaseiniciaquandoumconjuntoconjuntodedados torna-se disponvelde acordocom a definio do problemadapesquisa. Um conjunto de dados, seja de uma populao ou de uma amostra contem muitas vezes um nmero muito grande de valores. Alm disso, esses valores, na sua forma bruta, encontram-se muito desorganizados. Eles variam de um valor para outro sem qualquer ordem ou padro. Os dados precisam ento ser organizados e apresentados em uma forma sistemtica e seqencial por meio deumatabelaougrfico. Quandofazemosisso, aspropriedadesdosdados tornam-semaisaparentesetornamo-noscapazesdedeterminar osmtodos estatsticos mais apropriados para serem aplicados no seu estudo. Suponhamos o seguinte conjunto de dados:4 No podemos dizer que a cor X superior a cor Y mas podemos afirmar que o terceiro ano dosegundo grau superior hierarquicamente ao primeiro ano do primeiro grau.1014 12 13 11 12 1316 14 14 15 17 1411 13 14 15 13 1214 13 14 13 15 1612 12Para montarmos uma distribuio de freqncias desses dados verificamos quais so os valores no repetidos que existem e em uma primeira coluna de uma tabela colocamos esses valores e na segunda coluna colocamos o nmero de repeties de cada um desses valores. Para o exemplo acima, a distribuio de freqncias ser :Varivel freqncia11 212 513 614 715 316 217 1Afreqncia de uma observao o nmero de repeties dessa observaonoconjuntodeobservaes. Adistribuiodefreqnciauma funo formada por pares de valores sendo que o primeiro ovalor da observao (ou valor da varivel) e o segundo o nmero de repeties desse valor.Freqncias Relativas e Acumuladas11Paraoexemploacimatambmpodemoscalcular afreqnciarelativa referente a cada valor observado da varivel. A freqncia relativa o valor da frequncia absoluta dividido pelo nmero total de observaes. Varivel freqncia absolutafreqncia relativa11 2 2/26 = 0,076912 5 5/26 = 0,192313 6 6/26 = 0,230814 7 7/26 = 0,269215 3 3/26 = 0,115416 2 2/26 = 0,076917 1 1/26 = 0,0385TOTAL 26 1,0000Podemos tambmcalcular as freqncias acumuladas. Nesse caso existem as freqncias absolutas acumuladas e as freqncias relativas acumuladas. 5Varivel freqncia absolutafreqncia relativafreqnciaabsolutaacumuladafreqncia relativa acumulada11 2 2/26 = 0,0769 2 2/26 = 0,076912 5 5/26 = 0,1923 7 7/26 = 0,269213 6 6/26 = 0,2308 13 13/26 = 0,5000 14 7 7/26 = 0,2692 20 20/26 = 0,7692 15 3 3/26 = 0,1154 23 23/26 = 0,884616 2 2/26 = 0,0769 25 25/26 = 0,961517 1 1/26 = 0,0385 26 26/26 = 1,0000TOTAL 26 1,00002.3 HistogramasHistograma uma representao grfica de uma tabela de distribuio de frequncias. Desenhamos um par de eixos cartesianos e no eixo horizontal 5Observequeosvalores daltimacoluna(freqnciarelativaacumulada) podem ser calculados de duas maneiras. Na primeira, tal como feito na tabela aseguir, dividimosovalor dafreqnciaabsolutaacumuladapelototal de observaes. Na segunda maneira, acumulamos o valor da freqncia relativa. Este ltimo mtodo pode levar a acmulos de erros, de forma que o ltimo valor de freqncia relativa acumulado se distancie consideravelmente de 1. 12(abcissas) colocamos osvaloresdavarivel emestudoenoeixovertical (ordenadas) colocamososvaloresdasfreqncias. Ohistogramatantopode ser representado para as freqncias absolutas como para as freqncias relativas. No caso do exemplo anterior, o histograma seria:Histograma0123456711121314151617MaisBlocoFreqnciaFreqnciahistograma de frequnciaacumulada(ou ogiva) a representao grfica do comportamento da frequncia acumulada. Na figura abaixo a ogiva mostrada em sobreposio ao histograma.

Histograma0123456711121314151617MaisBlocoFreqncia,00%20,00%40,00%60,00%80,00%100,00%Freqncia% cumulativo2.4 Tabulao de Freqncia e Histograma para Variveis Contnuas13At agora vimos como so calculadas as freqncias (relativas e acumuladas) para variveis quantitativas discretas. Nesse caso a tabulao dos resultados maissimples. Mas quandotratamos devariveisquantitativas contnuas os valores observados devem ser tabulados em intervalos de classes. Paraadeterminaodessasclassesnoexisteumaregraprestabelecida, sendo necessrio um pouco de tentativa e erro para a soluo mais adequada. Suponhamosqueassafrasagrcolasdeumdeterminadoproduto, emuma determinada regio seja dada pela tabela a seguir:Ano Safra (1000 t) Ano Safra (1000 t)1 280 10 3652 305 11 2803 320 12 3754 330 13 3805 310 14 4006 340 15 3717 310 16 3908 340 17 4009 369 18 370 Devem serseguidoalguns passosparaa tabulao de freqncias de dados que se referem a uma varivel quantitativa contnua, como o caso de nosso exemplo.1. Definironmerodeclasses. Onmerodeclassesnodeveser muito baixo nem muito alto. Um nmero de classes pequeno gera amplitudes de classes grandes o que pode causar distores na visualizao do histograma. Um nmero de classes grande gera amplitude de classes muito reduzidas. Foram definidas regras prticas para a determinao do nmero de classes, sendo que este deve variar entre 5 e 20 (5 para um nmero muito reduzido deobservaese20paraumnmeromuitoelevado). Senrepresentao nmero de observaes (na amostra ou na populao, conforme for o caso) o nmero aproximado de classes pode ser calculado por Nmero de Classes = n arredondando os resultados. No caso do exemplo anterior temos n = 18 e 18 4 24 ,e podemos adotar um nmero de 5 classes, que ser razovel.142. Calcular a amplitude das classes. Essa ser obtida conhecendo-se o nmero de classes e amplitude total dos dados. A amplitude total dos dados o resultado da subtrao valor mximo - valor mnimo da srie de dados. A amplitude de classe ser:classes deMinimo Valor- Maximo Valor = classe de AmplitudenmeroEm geral, o valor do resultado tambm arredondado para um nmero inteiro mais adequado. No nosso exemplo temos:Amplitudede Classe=430 - 2805 303. Preparar a tabela de seleo com os limites de cada classe. Na tabela abaixo apresentamos para os dados do nosso exemplo os limites inferior e superior de cada uma das 5 classes de freqncia.Classe Limite inferior Limite Superior1 280 3102 310 3403 340 3704 370 4005 400 430Observa-se na tabela acima que o limite superior de cada classe coincide com o limite inferior da classe seguinte. Prevendo-se que pode ocorrer que o valor de umaobservaosejaexatamenteigual aovalor dolimitedeclassedeve-se estabelecer umcritrio de incluso. Para evitar esse tipo de dificuldade normalmenteseestabelecequeolimitesuperior decadaclasseaberto(e consequentemente, olimiteinferiordecadaclassefechado), ouseja,cada intervalo de classenoincluiovalor de seu limitesuperior, com exceoda ltima classe.154. Tabular os dados por classe de freqncia.A partir da listagem de dados seleciona-se para cada umdeles qual a sua classe de freqncia e acumula-seototal defreqnciadecadaclasse. Deacordocomnosso exemplo, teremos:Classe Freqncia AbsolutaSimplesFreqncia RelativaSimples280 - 310 3 0,12(12 %)310 - 340 4 0,16(16 %)340 - 370 6 0,24(24 %)370 - 400 7 0,28(28 %)400 - 430 5 0,20(20%)Total 25 1,00(100 %)Veremos adiante, quando discutirmos as medidas de posio e de disperso, quequandoagrupamosdadosnumricosemintervalosdeclasse ocorre perda de informao o que leva a resultados no to precisos do que aqueles que seriam obtidos a partir dos dados originais sem agrupamento. 2.5 Medidas de Posio e de DispersoPodemosconsiderar queaEstatsticaDescritivasubdivide-seemduas partes. Naprimeira, abordada anteriormente, soestudadas as formas de apresentaodosdadosparaquefiquemsalientadasassuascaractersticas principais. Na segunda, que comearemos a tratar agora, abrange as medidas descritivasna formade simples nmerosquerepresentamde forma sinttica essas caractersticas dadistribuio estatstica dos dados. Estudaremos, a rigor, quatro tipos de medidas:1. Medidas de Tendncia Central(ou medidas de posio). Essa propriedade dosdadosrefere-sealocalizaodocentrodeumadistribuio. Elasnos indicam qual a localizao dos dados ( no eixo que representa o conjunto dosnmerosinteirosseestivermostratandodeumavarivel quantitativa contnua).162. Medidas deDisperso. Essapropriedaderevelaograudevariaodos valores individuais em torno do ponto central.3. Assimetria. a propriedade que indica a tendncia de maior concentrao dos dados em relao ao ponto central.4. Curtose. a caracterstica que se refere ao grau de achatamento, ou a taxa na qual a distribuio cresce ou cai da direita para a esquerda.2.5.1 Uma Nota sobre Notao Estatstica Utilizaremos as letras maisculas para representar as variveis, como por exemplo a varivel X. Os valores individuais que uma varivel pode assumir so representadospelascorrespondentesletrasminsculas. Por exemploseX usado para designar o peso de uma amostra de 50 pessoas, ento x o valor numricodopesodeumadessas 50pessoas. Diferentes valores deuma varivel soidentificadosporsubscritos. Assim, ospesosde50pessoasem uma amostra podem ser denotados por x1, x2, ..., x50. nmero total de observaes em uma populao finita designado por Nenaamostrarepresentadoporn. Adistinoentremedidas descritivas para populaes e amostras muito importante. Denotaremos osparmetros (medidas referentes apopulao) por letras gregas ou letras minsculas emportugus. As estatsticas amostrais sero representadas por letras maisculas em portugus e os valores observados de uma estatstica amostral pela correspondente letra minscula em portugus. Por exemplo, as medidas descritivas a serem introduzidas nessa seo sero denotadas como segue: Nome da Medida Parmetro Notao daEstatsticaValor observadomdia aritmticaXxproporoPp17mdia geomtrica~gG gmdia harmnica~hH hmediana~.x5X.5 x.5moda~xmXm xm2.5.2 A Mdia Aritmtica No PonderadaA mdia definida como a soma das observaes dividida pelo nmero de observaes. Se tivermos, por exemplo, n valores, temos:Xx x xnxnniin+ + +1 2 1...Propriedades da mdia aritmtica no ponderada:1. Amdia umvalor tpico, ou seja, ela o centro de gravidade da distribuio, um ponto de equilbrio. Seu valor pode ser substitudo pelo valor de cada item na srie de dados sem mudar o total. Simbolicamente temos:n X x ( ) (6)2. A soma dos desvios das observaes em relao a mdia igual a zero.( ) x X 03. A soma dos desvios elevados ao quadrado das observaes em relao a mdia menor que qualquer soma de quadrados de desvios em relao a qualquer outro nmero. Em outras palavras,( ) x X 2 = um mnimo.6 - Utilizaremos muito freqentemente a notaoxsimplificadamente para representarxiin1.18A idia bsica de selecionar um nmero tal que a soma dos quadrados dos desvios em relao a este nmero minimizada tem grande importncia na teoria estatstica. Ela chega a ter um nome especial : o princpio dos mnimos quadrados. Ela, por exemplo, abase racional domtodo dos mnimos quadrados que usado para ajustar a melhor curva atravs de um conjunto de pontos emumsistema deeixos cartesianos, como veremos adiante. Esta propriedadetambmabaseparaoclculodeumaimportantemedidade disperso, que veremos logo a seguir.A validade dessas tr6es propriedades pode ser facilmente demonstrada por um exemplo numrico simples, mostrado na tabela a seguir. Nesta tabela, a coluna(1) contemoconjuntodedadoscujasoma9ecujamdia3. A coluna (2) demonstra a primeira propriedade da mdia, ou seja, se cada uma das observaes individuais dos dados substituda pela mdia, a soma permanece igual a 9. Acoluna (3) verifica que de fato ( ) x X 0 . Finalmente, as colunas (4), (5) e (6) demonstram que( ) x X 2 = 14, que menor quesomas quando os desvios individuais sotomados apartir do nmero 2 e do nmero 5, respectivamente.(1)x(2)x(3)(x - x)(4)(x - x)2(5)(x - 2)2(6)(x - 5)21 3 -2 4 1 162 3 -1 1 0 96 3 +3 9 16 1Soma 9 9 0 14 17 26

2.5.3 A Mdia Aritmtica PonderadaNo clculo da mdia aritmtica no ponderada todos os valores observados foram somados atribuindo-se o mesmo peso a todas observaes. Agora veremos uma nova forma de calcular a mdia. Consideremos um exemplo familiar de clculo da mdia de notas de estudantes, quando o exame final valeduas vezes mais doqueas duas provas comuns realizadas no 19decorrer do semestre. Se um determinado obter as notas 7, 5 e 8 a sua mdia ponderada final ser:1 (7) +1 (5) +2 81+1+2= 7 Em termos gerais, a frmula para a mdia aritmtica ponderada :Xw w x wxi iin1onde wi o peso da observao ie no nmero de observaes.Asomadospesosnopodeser igual azero. Foradisto, noexiste restrioparaosvaloresdospesos. Setodosospesosforemiguaisa1, a mdia ponderada recai emseu caso particular, a mdia aritmtica no ponderada. O mesmo ocorre se todos os pesos forem iguais a uma constante c. Portanto, a mdia aritmtica no ponderada na realidade uma mdia aritmtica ponderada com pesos iguais.2.5.4 Propores como MdiasFreqentementeencontramospopulaescujasunidadeselementares podem ser classificadas em duas categorias: uma que tem um certo atributo e outra que no temesse atributo. Nesse caso, estamos interessados na proporo de casos que possuem esse atributo. Uma proporo comumente pensadacomoumafraoouporcentagem, mastambmpodeser pensada como um caso especial de mdia. Suponhaquequeremosdeterminar aproporodevotantesentreos cidados brasileiros. Devemos primeiro designar um valor 1 para cada pessoa qualificada como eleitor e um valor 0 para cada pessoa no qualificada como eleitor. Ento, a soma dos 1s seriax e a mdia seria a mdia seria obtida pela diviso da soma pelo nmero N total de pessoas no Brasil. 20A mdia da varivelx = x N. No entanto essa mdia tambm uma proporo, a proporo de eleitores na populao brasileira. 2.5.5 A Mdia GeomtricaA mdia geomtrica de uma amostra definida como a raiz ensima do produto nos n valores amostrais.G = n( )( )...( ) x x xn 1 2Por exemplo, a mdia geomtrica de 5, 9 e 13 :G = =8,36 3( )( )( ) 5 9 13Paraamesmasriededadosamdia9. sempreverdadequea mdiaaritmticamaior doqueamdiageomtricaparaqualquer sriede valores positivos, com exceo do caso em que os valores da srie so todos iguais, quando as duas mdias coincidem. clculo da mdia geomtrica muito simples. Mas a sua interpretao e as sua propriedades tornam-se mais evidentes quando reduzimos a frmulaasuaformalogartmica. Tomandologaritmosdeambosos lados da equao anterior teremos:logG = log(n( )( )...( ) )log log ... log logx x xx x xnxnnn1 21 2+ + +Aconclusoquechegamosqueologaritmodamdiageomtrica igual a mdia aritmtica dos logaritmos dos valores da srie. Verifica-se que a mdiageomtricasomentetemsignificadoquandotodososvaloresdasrie so todospositivos. Suponhamos como exemplo de aplicao de clculo da mdia geomtrica os dados da tabela seguinte que mostram as mudanas de preos de duas mercadorias, A e B, de 1980 a 1985. Durante esse perodo o preo de A subiu 100 % e o preo de B decresceu 50 %. Qualfoia mudana mdia 21relativa de preos? Em outras palavras, qual foi o percentual mdio de mudana de preos?Preos das Mercadorias A e B em 1980 e 1985 Preo Relativo de Preos1980 = 1001985 = 100Mercadoria 1980 1985 1980 1985 1980 1985A R$ 50 R$ 100 100 200 50100B R$ 20R$10 100 50 200100 Mdia Aritmtica 100 125 125100 Mdia Geomtrica100 100 100100Amdiaaritmticaforneceumarespostaincorretaparaessaquesto. Como indicado pelos clculos da tabela acima leva a duas concluses opostas. Se1980tomadocomobaseparaorelativodepreos, ospreossoem mdia 25 % maiores em 1985 do que em 1980. Se 1985 tomado como base, os preos de 1980 so 25 % maiores do que os preos de 1985. Portanto, a mdia aritmtica dos relativos de preos conduz a resultados inconsistentes.No entanto, um resultado consistente obtido quando a mdia geomtrica aplicada:1. Se 1980 escolhido como a base, os preos de 1985 so 100 % dos preos de 1980, ou seja:g 200 50 10 000 100 .2. Se 1985 escolhido como a base, os preos de 1980 sero tambm 100 % dos preos em 1985, ou seja:g 50 200 100 22

Amaisimportanteaplicaodamdiageomtricarefere-setalvezao clculo de taxas de crescimento mdias, desde que essas podem ser corretamente medidas somente por esse mtodo. Para exemplificar, no campo da economia, esse ponto, suponha que a produo anual de um setor industrial cresceu de10.000 para17.280unidades duranteo perodo1985-1988 como mostrado na tabela a seguir; qual a taxa mdia de crescimento anual? A taxa mdia anual de crescimento pode ser calculada a partir dos valores em porcentagem daproduoem relao aosanos anteriores. Se calcularmosa mdia aritmtica desses valores teramos:x + + ( ) / 60 96 300 3 152implicando uma taxa de crescimento mdia de 152 -100 = 52 %. Se a produo cresce52%aoano, comeandodaproduode1985de10.000unidades, ento a produo de 1986 seria de 23.0+ 0,52 (10.000) = 15.200;a produo de 1987 seria de15.200+ 0,52(15.200) = 23.104;a produo de 1988 seria de23.104+ 0,52(23.104) = 35.118,0823Ano1985 1986 1987 1988ProduoPorcentagem do ano anterior10.000 6.000605.7609617.280300

Observe-se que este ltimo valor quase 200 % do valor efetivamente observado em 1988, de 17.200.A mdia geomtrica, por sua vez, :g ( )( )( ) 60 96 300 1203implicando uma taxa anual mdia de crescimento de 120 - 100 =20 %. Verificando, teremos:no ano de 1986: 10.000 + 0,20(10.000) = 12.000;no ano de 1987: 12.000 + 0,20(12.000) = 14.400;noanode1988: 12.000+0,20(14.400) =17.280quecoincidecomovalor observado efetivamente em 1988.Seovalor damdiageomtricadasporcentagensdecrescimentofor menor do que 100, implica emuma porcentagemmdia de crescimento negativa, o que indica uma taxa mdia de declnio ao invs de uma taxa mdia decrescimento.7Atentetambmparaofatodequeastrsporcentagensa partir das quais a mdia geomtrica calculada so percentuais do ano anteriorao invs de mudana percentual do ano anterior.8 clculodataxamdiadecrescimentobaseadoprincipalmentena hiptese de uma taxa constante de crescimento ou de que os valores individuais formamuma progresso geomtrica. Quando oclculo 7Se, por exemplo, ao invs de 60, 96 e 300 %, como anteriormente, tivermos 60, 96 e 78 %, a taxa de crescimento geomtrica mdia ser de g ( )( )( ) , 60 96 78 76 593, o que indica um decrscimo mdio de 76,59 - 100 = - 23,41 %.8 Essas ltimas porcentagens, referentes ao exemplo da tabela anterior, seriam (6.000 - 10.000)/10.000= - 0,40, ou seja - 40 %; (5.760 - 6.000)/6.000 = -0,04 , ou seja, - 4 %; e (17.280 - 5.760)/5760 = 2, ou seja + 200 %. 24envolveumnmeroconsidervel deperodos, utiliza-secommais freqncia uma frmula que se relaciona com a mdia geomtrica, que :Rxxfin

_,

1onde:R = taxa de crescimento geomtrica mdia,n = nmero de perodos de tempo,xf = valor no perodo final,xi = valor no perodo inicial.Para os dados da tabela anterior, teremos:R

_, 17 28010 0001 0 203.., ou 20 % ,como obtido anteriormente.9Note que R = G -1. 2.5.6 A Mdia HarmnicaAmdiaharmnicaoinversodamdiaaritmticadosinversosdos valores observados.Simbolicamente, para uma amostra, temos:Hx x xnxnnxn+ + + 11 1 11111 2...( / )( / )Para clculos mais simples, a frmula anterior pode ser reescrita como:9- interessante notar que pelo clculo anterior empregam-se os valores dos anos intermedirios, ao passo que nesse ltimo, apenas empregam-se os valores do perodo iniciale final, no importando o que ocorreu nos perodos intermedirios.2511 1 111 2Hx x xnxnn+ + + ...( / )A mdia harmnica dos trs valores 4, 10 e 16 :11411011630 13757 27HH+ +,, Para os mesmos dados a mdia aritmtica 10 e a mdia geomtrica 8,62. Para qualquer srie de dados cujos valores no so todos os mesmos e que no incluem o zero, a mdia harmnica sempre menor que tanto a mdia aritmtica como a mdia geomtrica.2.5.7 A MedianaA mediana o valor do item central da srie quando estes so arranjados em ordem de magnitude. Para a srie R$ 2, R$ 4, R$ 5, R$ 7 e R$ 8, a mediana o valor do terceiro item, R$ 5. No caso do nmero de itens na srie ser par, a mediana a semi-soma dos doisvalores mais centrais. Por exemplo, paraa srie 3, 5 ,8 ,10, 15 e 21 kg, a mediana a media dos valores 8 e 10, ou seja 9.A mediana pode ser formalmente definida como o valor que divide a srie de tal forma que no mnimo 50 % dos itens so iguais ou menores do que ela, e no mnimo 50 %dos itens so iguais ou maiores do que ela. Mais rigorosamente, estabelecemos que:X.5 = o valor do [(n+1)/2] -simo itemPor exemplo, para uma srie formada pelos valores 3,5,8,10,15 e 21 a mediana ser o valor do [(6+1)/2] = 3,5 simo item, ou seja, a semisoma do item de posto 3 e do item de posto 4, que so 8 e 10.26O valor da mediananoinfluenciadopelosvaloresnascaudas deumadistribuio. Por exemplo, setemos asriededados 1,2,3,4,5 a mediana3. Sesubstitumososvaloresdascaudasdessadistribuiopor quaisquer valores uma nova distribuio formada poderia ser formada pela srie -1000,-100,3,500,5000 e a mediana permanece sendo 3. Portanto,ela uma medida de posio da distribuio bem adequada para distribuies assimtricas, tais como a distribuio de renda, j que no sabemos se a famlia mais rica ganha R$7.000.000 ou R$ 500.000.000. Veremos, mais a frente que ela possui vantagens em relao a mdia aritmtica, como medida de posio (ou medida de tendncia central) para dados agrupados emclasses de freqncia, quando a ltima classe tem limite superior indeterminado.A mediana tambm tem a interessante propriedade de que a soma dos desvios absolutos das observaes em relao a mediana menor do que a soma dos desvios absolutos a partir de qualquer outro ponto na distribuio. Simbolicamente:x X .5um mnimo2.5.8 A Mdia para Dados AgrupadosQuando estamos tratando de amostras ou populaes muito grandes conveniente calcular as medidas descritivas a partir das distribuies de freqncia. A mdia no pode ser determinada exatamente a partir de distribuiesdefreqncia, masumaboaaproximaopodeser obtidapela hiptese do ponto mdio. A aproximao quase sempre muito satisfatria se a distribuio bemconstruda.10A hiptese do ponto mdio refere-se a considerar-se de que todas as observaes de uma dada classe esto centradas no ponto mdio daquela classe. Consequentemente, o valor total da freqncia da classe da i-sima classe simplesmente o produto fi mi, onde fi a freqncia (absoluta simples) da classe i e mi ponto mdio da classe i. Sob 10 Isto , principalmente se no agrupamento dos dados originais em uma tabela de distribuio de freqncia, empregou-se um nmero adequado de classes de freqncia. 27essa hiptese, a mdia aproximada para uma distribuio de uma amostra com k classes vem a ser:Xf m f m f mf f ffmfk kk+ + ++ + +1 1 2 21 2......fmn importante notar que todos os somatrios na equao acima referem-sesclassesenosobservaesindividuais. Consideremosaseguinte tabeladedistribuiodefreqnciaparadadosdegastocomalimentao extrados de uma pesquisa de oramentos familiares.Classe f m fmR$ 120,00 - R$139,995 130,0650,0 140,00 - 159,9926150,03900,0 160,00 - 179,9924170,04080,0 180,00 - 199,99 15 190,0 2850,0 200,00 - 219,99 8 210,01680,0 220,00 - 239,992230,0460,0Total80 13620,0 25 , 170 $8000 , 13620R x Ao utilizar essa aproximao estamos considerando a hiptese de quetodasasobservaesemcadaclasseestouniformementedistribudas nessa classe.Por exemplo, se tivermos um intervalodetamanho100 ecom frequncia igual a 6 observaes, a localizao dessas observaes seria 0,20,40,60,80 e 100, com distncia constante entre cada par de observaes, de forma que:0+20+40+60+80+100 = 300 = m x 6 e m = 50 , ou seja o ponto mdio do intervalode0a100. Conclui-sequeseadistribuiodasobservaesfor uniforme em cada intervalo, o somatrio dos valores das observaes de cada intervalo igual ao produto da freqncia no intervalo pelo valor do ponto mdio 28desse intervalo. Supe-se que com uma conveniente construo de intervalos de classe os eventuais erros nos intervalos compensam-se mutuamente.2.5.9 A Mediana para dados AgrupadosAssim como possvel estabelecer uma aproximao da mdia aritmtica para dados agrupados, o mesmo pode ser feito para a mediana. O mtodousadoodainterpolaoutilizando-seadistribuiodefreqncia acumulada ou ogiva. Inicialmente determina-se a classe que contem a mediana. Essaseraclassecujafreqnciaacumuladarelativacorrespondenteaseu limiteinferior menorque0,50(ou 50%) eafreqnciaacumulada relativa correspondente a seu limitesuperior maior que 0,50 (ou50%). O prximo passoadeterminaodopontoexatoondelocaliza-seamediananaquela classe. Para o exemplo anterior de gastos com alimentao de famlias, temos:Classe freq. absoluta simplesfreq.acumulada freqncia relativa acumuladaR$ 120,00 - R$139,995 5 0,0625 140,00 - 159,992631 0,3875 160,00 - 179,992455 0,6875 180,00 - 199,99 15 700,8750 200,00 - 219,99 8 78 0,9750 220,00 - 239,99280 1,0000Total80 Aclassequecontmamedianaaterceiraclasse, poisafreqncia relativaacumuladadaclasseanterior (segundaclasse)menor que0,5ea freqncia relativa acumulada da terceira classe maior do que 0,5.11 Freqncia acumulada da classe que contem11- Afreqnciarelativaacumuladadaclasseanterior classecorrentea freqncia relativa acumulada do limite inferior daclasse corrente. A freqncia relativaacumuladadaclassecorrenteafreqnciarelativaacumuladado limite superior dessa mesma classe.29a mediana

5 , 4021 8021++ n

Por semelhana de tringulos,verifica-se que:XX..,,55160180 16040 5 3155 31167 92 Este procedimento o mesmo que a seguinte frmula de interpolao:X LIn Ffca. ..( ) /5 551 2 ++

1]1onde:LI.5 = limite de classe inferior da classe da mediana,Fa= freqncia acumulada da classe imediatamente anterior classe da mediana,f.5= freqncia absoluta simples da classe da mediana,c= amplitude (tamanho) da classe da mediana.2.5.10 A Moda para dados AgrupadosA moda de uma distribuio de freqncia pode muitas vezes ser aproximada pelo ponto mdio da classe modal - a classe com maior densidade 30X.5160 180X5531Fde freqncia.12Ento, para os dados de gastos com alimentao do exemplo anterior, xm= R$ 150, o ponto mdio da segunda classe, que possuia maior freqncia. Esse mtodo de localizar a moda totalmente satisfatrio quando as densidades de freqncia da classe imediatamente anterior classe modal (a classe premodal) e da classe imediatamente posterior classe modal (classe posmodal) so aproximadamente iguais. Quando isso no ocorre, como sugerido pela figura a seguir, resultados mais precisos podem ser obtidos com a seguinte frmula, para uma amostra:X L cm m ++( ) 11 2onde:Lm = o verdadeiro13 limite inferior de classe da classe modal1 = da diferena entre das densidades de freqncia da classe modal e classe premodal. 2= da diferena entre das densidades de freqncia da classe modal e classe posmodal.C = a verdadeira amplitude de classe da classe modal.

Interpretao geomtrica da interpolao12Definimos densidade de freqncia de um intervalo de classe como sendo o quociente entre a freqncia absoluta simples desse intervalo e o seu tamanho (amplitude). Quandoosintervalosdeclassepossuemamplitudesdesiguais, existe uma tendncia de os intervalos maiores apresentarem maiores freqncias. Dessa forma a classe modalno a classe de maior freqncia mas a classe de maior densidade de freqncia. Naturalmente, quando todos os intervalos tm a mesma amplitude, como no caso do exemplo anterior e como geralmente so construdos para no distorcer a distribuio, a classe modal a classedemaior densidadedefreqnciaassimcomotambmaclassede maior freqncia. Esseconceitodedensidadedefreqnciasermuitotil, quando definirmos, mais adiante, a funo densidade de probabilidade e para a sua compreenso intuitiva. 131Para determinar os limites de classe verdadeiros para uma varivel contnua, temos que escrever os limites de classe com uma casa decimal a mais do que os dados originais. Por exemplo, se o conjunto de dados consiste de medidas de peso arredondadas para um dcimo de grama, os limites nominais de classe (tambm chamados de limites aparentes podem ser 11,0 - 11,2; 11,3 - 11,5;11,6 -11.8; ...Os limitesverdadeiros declasse(tambm conhecidos como limites reais ou efetivos) seriam 10,95 - 11,25; 11,25 - 11,55; 11,55 - 11,85;...31 algbrica para a determinao da moda

No exemplo anterior de gastos com alimentos de 80 famlias, como a amplitude de todos os intervalos so iguais, podemos utilizar as freqncias absolutas de classe no lugar das densidades de freqncia, para o clculo do valor aproximado da mediana.Lm = 140,001= 26 - 15 = 11c = 202= 26 - 24 = 2xm ++ 140 001111 220 156 92 , ( ) ,Uma observaes aqui necessria. possvel calcular os valores aproximados damediana edamodaparadados agrupados quando o ltimo intervalo de classe tem limite superior indeterminado. No casodamedianaissoimediatoenocasodamoda, oseuclculo somentepodeserfeitosealtimaclassenofor aclassemodal e preciso primeiramente calcular as densidades de freqncia. Como exemplo, suponhamos que a distribuio de renda de uma certa regio dada pela seguinte distribuio de freqncia:32Densidade de freqnciaxm Xrenda (R$)limites nominaislimites reais freqnciaabsolutadensidade defreqncia 0-1200 -120,5040 40/120,50 = 0,332 121-605120,50-605,50 170 170/485 =0,350 606-1200605,50-1200,50 220 220/595 =0,3701201 -2400 1250,50 -2400,50 1515/1150=0,013 mais de2400 mais de 2450,50 97 indeterminadoTotal542 A mediana est localizada na terceira classe:14x.,( )( , , )5605 50542 122102201200 50 605 50 772 ++

1]11 A classe modal tambm a terceira classe:15 xm + + 605 500 370 0 3500 370 0 350 0 370 0 0131200 50 605 50 637 ,( , , )( , , ) ( , , )( , , )Infelizmente, para esse exemplo no possvel o clculo da mdia, o que demonstra que para algumas situaes temos que contar com a mediana como medida de posio (ou de tendncia central) de uma distribuio estatstica.14Observe-sequeosdadosoriginaisesto, deacordocomosugeridopela tabela acima, comaproximao igual a unidades de gramas. Os limites verdadeiros (ou reais) de classe) passam, portanto, a ter aproximao de uma casa decimal de grama. O valor final dos clculos da mediana e da moda so aproximados para unidades de grama, j que essa a aproximao dos dados originais (que se refere ao instrumento de medida). 151 J que esta classe a que apresenta maior densidade de freqncia. Como a ltimaclassenotemlimitesuperior definidonofoi possvel calcular sua densidade de freqncia, j que no podemos determinar sua amplitude. Dependendodessaamplitudeelapoderiater umadensidadedefreqncia maior que a da terceira classe. Mas mesmo nesse caso, a terceira classe ainda seriamodal, jquesuadensidadedefreqnciamaior queadassuas classes vizinhas, e a distribuio passaria a ser bimodal.33Discutiremos agora comparativamente algumas das caractersticas das trs principais medidas de posio:A Mdia Aritmtica 1)Ela afetada por todas as observaes e influenciada pelas magnitudes absolutas dos valores extremos na srie de dados.2)Ela das trs medidas de posio a que possibilita maiores manipulaes algbricas, dadas as caractersticas de sua frmula.3)Emamostragem, a mdia uma estatstica estvel. Isso ser aprofundado posteriormente.A Mediana1)Seuvalor afetadopelonmerodeobservaesecomoelas esto distribudas mas ela no afetada pelos valores das observaes extremas.2)Sua frmula no passvel de manipulao algbrica.3)Seuvalor podeser obtido, comovimos, emdistribuies, com limites superiores indeterminados para a sua ltima classe.4)A mediana a estatstica mais adequada para descrever observaes que so ordenadas ao invs de medidas.A Moda1)A moda o valor mais tpico e representativo de uma distribuio. Ela representa o seu valor mais provvel.2)Como a mediana, a moda tambmno influenciada pelos valores extremos da distribuio e no permite manipulaes algbricas como a frmula da mdia.34Existem algumas relaes entre as diversas medidas de posio:1)Para qualquer srie, exceto quando no caso de todas as observaescoincidirememumnicovalor, amdiaaritmtica sempre maior que a mdia geomtrica, a qual, por sua vez, maior que a mdia harmnica.2)Paraumadistribuiosimtricaeunimodal, mdia=mediana= moda.3)Para uma distribuio positivamente assimtrica, mdia > mediana > moda. A distncia entre a mediana e a mdia cerca de um tero da distncia entre a moda e a mdia.4)Para uma distribuio negativamente assimtrica, mdia < mediana < moda. A distncia entre a mediana e a mdia cerca de um tero da distncia entre a moda e a mdia.Essas ltimas caractersticas so apresentadas graficamente, a seguir POSIES RELATIVAS DA MDIA, MEDIANA E MODA EM FUNO DA ASSIMETRIA DAS DISTRIBUIES

35Assimetria positivaMedidas de Disperso, Assimetria e CurtoseMuitassriesestatsticaspodemapresentar amesmamdia, masno entanto, osdadosdecadaumadessassriespodemdistribuir-sedeforma distinta em torno de cada uma das mdias dessas sries. Na anlise descritiva deumadistribuioestatsticafundamental, almdadeterminao de uma medidadetendnciacentral, conhecer adispersodosdadoseaformada distribuio.Duas sries de dados podem possuir a mesma mdia, mas uma podeapresentar valoresmaishomogneos(menosdispersosemrelaoa mdia) do que a outra. Um pas, por exemplo, com uma distribuio de renda mais equnime, ter uma disperso de suas rendas menor do que um pas com estrutura de renda mais diferenciada em diversos estratos ou categorias sociais. Uma mquina que produz parafusos e que estiver menos ajustada do que outra produzir medidas de parafusos com distribuio mais dispersa em torno de sua mdia.A inequao das mdiasA importncia das mdias com freqncia exagerada. Se dizemos que a renda familiar mdia de um determinado pas de US$ 5.000 por ano no 36Assimetria negativaDistribuio SimtricaAssimetria negativasabemosmuitacoisasobreadistribuioderendadessepas. Umamdia, como um simples valor adotado para representar a tendncia centralde uma srie de dados uma medida muito til. Porm, o uso de um simples e nico valor para descrever uma distribuio abstrai-se de muitos aspectos importantes.Em primeiro lugar, nem todas as observaes de uma srie de dados tem omesmo valor da mdia.Quase sem exceo,asobservaes includas em uma distribuio distanciam-se do valor central, embora o grau de afastamento varie de uma srie para outra. Muito pouco pode ser dito a respeito da disperso mesmo quando diversas medidas de tendncia central so calculadas para a srie. Por exemplo, no podemos dizer qualdistribuio tem maior ou menor grau de disperso da informao dada pela tabela abaixo.Distribuio A Distribuio BMdiaMedianaModa15151515126Uma segunda considerao que as formas de distribuio diferem de um conjunto de dados para outro. Algumas so simtricas; outras no. Assim, para descrever uma distribuio precisamos tambm de uma medida do grau de simetria ou assimetria. A estatstica descritiva para esta caracterstica chamada de medida de assimetria.Finalmente, existem diferenas no grau de achatamento entre as diferentesdistribuies. Estapropriedadechamadadecurtose(emingls, kurtosis). Medir a curtose de uma distribuio significa comparar a concentrao de observaes prximas do valor central com a concentrao de observaes prximas das extremidades da distribuio.2.5.11 O Intervalo (ou amplitude)37A medida de disperso mais simples a amplitude, a diferena entre o maior e o menor valor nos dados. Para uma distribuio de freqncia que usa intervalos de classe, a amplitude pode ser considerada como a diferena entre o maior eo menor limitedeclasse ou a diferena entre ospontosmdios dos intervalos de classe extremos. Os preos de aes e de outros ativos financeiros so freqentemente descritos em termos de sua amplitude, com a apresentao pelas Bolsas de Valores do maior valor e do menor valor da ao em um determinado perodo de tempo. Para algumas distribuies simtricas amdia pode ser aproximada tomando-seasemi-somadosdoisvaloresextremos,16quefreqentemente chamadade semi-amplitude.Porexemplo,prticaentre os meteorologistas derivar a mdia diria de temperatura tomando a mdia somente dos valores mximo e mnimo de temperatura ao invs, de digamos, a mdia das 24 leituras horrias do dia.A amplitude tem alguns defeitos srios. Ela pode ser influenciada por um valor atpico na amostra. Alm disso o seu valor independe do que ocorre no interior dadistribuio, jquesomentedependedosvaloresextremos. Este defeito ilustrado na figura a seguir:

161Foi o que fizemos ao calcular a mdia para valores agrupados em classes de freqncia. Nesse caso utilizamos o ponto mdio de cada intervalo de classe comorepresentativodamdiadecadaintervalo. Assim, aomultiplicarmosa freqnciadecadaclassepelovalor doponto mdio, estamos calculando aproximadamente a soma das observaesem cada intervalo, admitindo como hiptese que a distribuio dos dados em todos osintervalos simtrica.38f(X)XNa figura acima so mostradas duas distribuies com diferentes variabilidade, mas com mesma amplitude. A amplitude tende a crescer, embora no proporcionalmente, a medida que o tamanho da amostra cresce. Por esta razo, nopodemos interpretar aamplitude corretamente semconhecer o nmero de informaes dos dados. 2.5.12 Percentis, Decis e QuartisPodemos tentar responder aseguinte pergunta: que proporo dos valores de uma varivel menor ou igual a um dado valor? Ou maior ou igual a um dado valor? Ou entre dois valores ? Quando construmos uma distribuio de freqncia acumulada, tais questes somente podem ser respondidas com relao aos limites de classe exatos.Por exemplo,a partir da distribuio de freqncia relativa acumulada da pgina 28, podemos dizer que 38,75 % das observaes somenores doque159,99. Mas nopodemos responder a pergunta:qual ogasto familiar talque a proporo da amostra tendo este valor oumenos35%?. Masvisvel databelaque6,25%dasfamlias gastam com alimentao at R$ 139,99 e 38,75 % das famlias gastam at R$ 159,99. Portanto, como 35 % est entre estes dois valores, o gasto familiar tal que a proporo da amostra tendo este valor ou menos 35 % est situado entre R$ 139,99 e R$ 159,99.Este valor chamado de percentil 35.Opercentil 40ovalor davarivel quemaior doque40%das observaes. Generalizando, o percentil x, o valor da varivel que maior do quex%dasobservaes. Emoutraspalavras, opercentilxovalor da varivel correspondente ao valor de freqncia relativa acumulada de x %.17O 171 Para o clculo do valor exato do percentilx para dados agrupados utiliza-se o mesmo mtodo para a determinao da mediana, ou seja, a interpolao linear. Como no caso da mediana, podemos empregar uma frmula de interpolao X LIp n Ffcp pap + +

1]11( ) / 1 100ondeXp opercentilp,Lipolimiteinferior real daclassequecontemo percentil,Fa a freqncia relativa acumulada da classe anterior classe que 39primeiro decil o valor da varivel que supera um dcimo (ou 10 %) do total de observaes. Se tivermos 200 observaes, o segundo decil ser aproximadamentea observao de posto 40.O primeiro quartil o valor da varivel cuja freqncia relativa acumulada 0,25 (ou 25 %). O terceiro quartil o valor da varivel cuja freqncia relativa acumulada 0,75 (ou 75 %). O primeiro quartil maior do que um quarto dos valoresobservadosemenor doquetrsquartosdestesvalores. Oterceiro quartil maior do que trs quartos dos valores observados e menor do que um quarto destes valores. O segundo quartil confunde-se com a mediana. Umamedidadedispersoochamadodesviointerquartlicoquea diferena entre o terceiro e o primeiro quartis.2.5.13 Varincia e Desvio PadroA varincia definida como a mdia dos desvios ao quadrado em relao mdia da distribuio. Para uma amostra,1) (22nX xSPara uma populao finita,Nx22) ( Na penltima equao, n-1 chamado de nmero de graus de liberdade de S2 , um conceito a ser definido mais tarde. Existe uma restrio para esta equao: n > 1 (no se pode calcular a varincia para uma amostra de uma observao apenas). O desvio padro a raiz quadrada da varincia, e denotado S (para amostra) e (para populao). Existem frmulas que facilitam os clculos para S2 e 2 :contem o percentil,fp a freqncia relativa (simples) da classe que contem o percentil,c a amplitude do intervalo de classe que contem o percentil e o nmero de observaes. O mesmo mtodo pode ser empregado tambm para os decis e quartis. 40Sn x xn nxNxN22 22221

_,

( )( )Com estas duas ltimas frmulas, podemos calcular a varincia somente com a soma dos valores ( x) e a soma dos quadrados dos valores ( x2); no mais necessrio calcular a mdia, em seguida os desvios em relao s mdias e finalmente os quadrados destes desvios.Para ilustrar o processo de clculo da varincia e desvio padro e para mostrar o uso destas medidas, considere o seguinte exemplo. Dois tipos diferentes de mquina,X e Y so projetadas para produzir o mesmo produto. Elas tm o mesmo preo de venda. Umfabricante est tentando decidir qual delas comprar e observou 10 mquinas distintas de cada tipo em operao por uma hora. A tabela seguinte mostra as produes horrias nas primeiras duas colunas.As mdias sox 4031040 3 , unidades por hora ey 4081040 8 ,unidades por hora. Portanto, com base nestes dados, o tipo Y um pouco mais rpida. Podemos retirar mais alguma informao a partir destes dados? Podemosmedir ecomparar asdispersesdasprodueshorriasdosdois tipos de mquina. Usando a penltima frmula para os dados da tabela, obtemos:SSSSXXYY222210 16 405 40310 10 118 2318 23 4 2710 17 984 40810 10 11351113512 11 62 ( . ) ( )( ),, ,( . ) ( )( ),, , unidades por hora unidades por horax y x2y24135364944433738423940252655524824344750471.2251.2962.4011.9361.8491.3691.4441.7641.5211.6006256763.0252.7042.3045761.1562.2092.5002.209Soma 403 408 16.405 17.984O tipo X tem menor disperso que o tipo Y.Apesar de ter maior preo que o tipo Y, a mquina X mais precisa. 2.5.14 Varincia e Desvio Padro para Dados AgrupadosA varincia e o desvio padro (como a mdia, mediana, moda, quartis, percentis, decis) podemser calculados para dados agrupados, ou seja, distribuies de freqncia com intervalos de classe. Entretanto, os resultados podemser apenasaproximadamenteprecisos. Utiliza-se, comonocasoda mdia, a hiptese do ponto mdio: a de que toda observao est localizada no ponto mdio de sua classe. Cada ponto mdio entra nos clculos quantas vezes so as observaes naquele intervalo de classe. As equaes para as varincias so:42Sfm XnfmN221( )( ) ,para a amostra;,para a populacao.2Os smbolos utilizados nestas equaes j foram definidos anteriormente. Para facilitar os clculos podemos utilizar as seguintes frmulas mais convenientespara as varincias:Sfm fm nnfm NN22 221 ( ) /( ) / e=fm22paraaamostraepopulao, respectivamente. Aqui, comoantes, assumimos que a populao finita.Ossomatriosemtodas estasequaessoparatodasas kclasses, noparaasobservaes individuais. Estasequaespodemser aplicadas tanto para intervalos de classe iguais como para intervalos de classe desiguais. Entretanto, elas no podemser empregadas quando existemumou mais intervalossemlimites. Comoparaosdadosnoagrupados, araizquadrada destas equaes so os desvios padres para a amostra e para a populao, respectivamente.Aplicando as ltimas equaes para o exemplo de consumo de alimentos, temos:Classe (1)m(2)f(3)fm(2)(1)(4)fm2(3)(1)R$ 120,00 - R$139,99 130565084.500 140,00 - 159,99 150263.900585.000 160,00 - 179,99 170244.080693.000 180,00 - 199,9919015 2.850541.500 200,00 - 219,992108 1.680352.800 220,00 - 239,99 2302460105.80043Total80 13.620 2.363.200Sfm fm nnS22 2 212 363 200 13 620 8080 1561 96561 96 23 71 ( ) / . . ( . ) /,, ,2.5.15 Interpretando e Aplicando o Desvio PadroOdesviopadromaisamaisusadadasmedidasdevariabilidade. Infelizmente, o desvio padro no tem uma interpretao intuitivamente bvia. Por exemplo, no exemplo anterior das mquinas, SX = 4,27 unidades por hora, mas no bvio o que isto quer dizer para a mquina X. Para muitas sries de dados h dois teoremas para a interpretao do desvio padro que so muito teis. Eles so chamados de Desigualdade de Chebyshev e a Regra de Gauss, as quais introduzimos a seguir.Teorema: Desigualdade de Chebyshev.Para qualquer conjunto de dados e qualquer constante h > 1, no mnimo 1 12 / h dos dados estaro situados dentro de um intervalo formado por h desvios padres abaixo e acima da mdia.Por este teorema temos certeza de que no mnimo , ou 75 % dos dados iro situar-se dentro do intervaloX S t 2. Neste caso h = 2 e 1 1 1 1 2 3 42 2 / / / h. Nomnimo8/9, ou88,9%dosdados estarono intervaloX S t3 ; enomnimo15/16, oucercade94%dos valores de qualquer varivel estaro includos dentro do intervaloX S t4 .Considere o exemplo anterior das mquinas. TemosX 40 3 ,eSX 4 27 ,. Que percentagem das mquinas tero produo entre X SXt t 15 40 3 15 4 27 , , , , , ouseja, entre33,9e46,7?Resposta: nomnimo 11150 562 ,,, ou aproximadamente 56 %.Da tabela anterior encontramos 9 das 10 mquinas tipo X que esto dentro deste intervalo e claramente 9/10 maior do que 56 %.44A vantagem da Desigualdade de Chebyshev que ela pode ser aplicada variveis comqualquer padro de distribuio (no importa que sejam simtricas, assimtricas, mesocrticas, platicrticas, leptocticas, etc.). Entretanto, ela tema desvantagemde no ser muito precisa, j que a porcentagem efetiva que caem dentro do intervalo em torno da mdia quase sempre muito maior do que o mnimo dado por 1 12 / h, especialmente quando as amostras so pequenas, como no nosso exemplo anterior.Teorema: A Regra de Gauss.Se os dados so amostrais e se so, de forma aproximada, distribudos normalmente, ou seja, o histograma dos dados aproximadamente simtrico e tem a forma de um sino, ento:1. X S t1 incluir aproximadamente 68 % dos dados2. X S t2incluir aproximadamente 95 % dos dados3. X S t3incluir aproximadamente 100 % dos dadosChamamos isto de Regra de Gauss, porque baseada na distribuio de probabilidade gaussiana (ou distribuio de probabilidade normal). Esta distribuio ser discutida em detalhe em um captulo posterior.2.5.16 Coeficiente de Variao Com freqncia, como no caso do exemplo das duas mquinas, queremos comparar a variabilidade de dois ou mais conjuntos de dados. Podemosfazer istofacilmenteusandoasvarinciasouosdesviospadres quando,primeiro,todas as observaes individuais tm a mesma unidade de medida e, segundo, as mdias dos conjuntos de dados so aproximadamente iguais.Quandoqualqueruma destascondies no satisfeita, uma medida relativadedispersodeveser usada. Umamedidarelativadevariabilidade freqentemente usada chamada de coeficiente de variao, denotada por CV para uma amostra. Esta medida o valor do desvio padro em relao mdia:CVSX45Suponha que um cientista na ndia obteve os seguintes dados referentes aos pesos de elefantes e ratos.Elefantes RatosxE 6 000 .kgskgE 300xkgR 0 150 ,skgR 0 04 ,Se calcularmos os respectivos coeficientes de variao, teremos:cv(Xou 5,0 %cv(Xou 26,7 %ER) ,),,, sxsxEERR30060000 0500 040 1500 266Portanto, a variabilidade relativa dos pesos dos ratos mais do que 5 vezes maior do que a variabilidade dos pesos dos elefantes. Para o exemplo anterior das mquinas, teremos:cv(Xou 10,60 %cv(You 28,48 %),,,),,, 4 2740 300 106011 6240 800 2848Assim, a disperso relativa da produo da mquina Y quase trs vezes maior do que a disperso relativa da mquina X. 2.6 Medidas de AssimetriaDuasdistribuiestambmpodemdiferir umadaoutraemtermosde assimetria ou achatamento, ou ambas. Como veremos, assimetria e achatamento (o nome tcnico utilizado para esta ltima caracterstica de forma dadistribuiocurtose) tmimportnciadevidoaconsideraes tericas relativas inferncia estatstica que so freqentemente baseadas na hiptese de populaes distribudasnormalmente.Medidas deassimetriaede curtose so, portanto, teis para se precaver contra erros aos estabelecer esta hiptese.Diversas medidas deassimetria so disponveis, mas introduziremos apenas uma, que oferece simplicidade no conceito assim como no clculo. Esta 46medida, a medida de assimetria de Pearson, baseada nas relaes entre a mdia, medianaemoda. Recordequeestastrsmedidassoidnticasem valor para uma distribuio unimodal simtrica, mas para uma distribuio assimtricaamdiadistancia-sedamoda, situando-seamedianaemuma posiointermediria, amedida queaumenta aassimetria dadistribuio. Consequentemente, a distncia entre a mdia e a moda poderia ser usada para medir a assimetria. Precisamente,Assimetria = mdia - modaQuanto maior a distncia, seja negativa ou positiva, maior a assimetria da distribuio. Tal medida, entretanto, temdoisdefeitosnaaplicao. Primeiro, porqueelaumamedidaabsoluta, oresultadoexpressoemtermos da unidadeoriginal demedidadadistribuioe, portanto, elamudaquandoa unidade de medida muda. Segundo, a mesma grandeza absoluta de assimetria tem diferentes significados para diferentes sries de dados com diferentes graus devariabilidade. Paraeliminar estes defeitos, podemos medir uma medida relativa de assimetria. Esta obtida pelo coeficiente de assimetria de Pearson, denotado por SKP e dado por:SKX XSPm A aplicao desta expresso envolve outra dificuldade, que surge devido aofatodequeovalor modal damaioriadasdistribuiesser somenteuma distribuio, enquanto que a localizao da mediana maissatisfatoriamente precisa. Contudo, em distribuies moderadamente assimtricas, a expresso X X X Xm 35( ). adequada (no envolve impreciso muito grande). A partir disto, vemos que:X X X X X X X Xm [ ( )] ( ). .3 35 5 Comesteresultado, podemosrescrever ocoeficientedeassimetriade Pearson como:47SKX XSP 35( ). Esta medida igual a zero para uma distribuio simtrica, negativa para distribuiescomassimetriaparaadireitaepositivaparadistribuiescom assimetria para a esquerda. Ela varia dentro dos limites de t3. Aplicando SKP aos dados agrupados de gastos comconsumo dealimentos das famlias, temos:SKP +3 170 25 167 9223 710 295( , , ),,Este resultado revela que a distribuio de gastos com consumo de alimentos tem assimetria moderadamente positiva (o que significa maior concentrao de famlias nas classes de menor gasto). muito comum encontrar distribuies positivamente assimtricas em dados econmicos, particularmente na produo e sries de preos, os quais podem ser to pequenos quanto nulos mas podem serinfinitamentegrandes. Distribuiesassimetricamentenegativassoraras em cincias sociais.2.7 Curtose: uma medida de achatamentoApresentaremos agora uma medida de achatamento das distribuies, o coeficiente de curtose, denotado por K. Esta medida algebricamente tratvel e geometricamente interpretvel. definida como a relao entre o desvio semi-interquartlico, ou seja, a metade do valor do desvio interquertlico, e o intervalo entre o decil 9 e o decil 1:KQ QD D123 19 1( ) Por meiodocoeficientedecurtose, classificamosdiferentesgrausde achatamentoemtrscategorias:leptocrtica,platicrticaemesocrtica(ver figura, a seguir). Uma distribuio leptocrtica (curva a) tem a maior parte de 48suas observaes concentrada no centro. Consequentemente, a diferena entre as duas distncias,(Q3-Q1)e (D9- D1)tende a ser muito pequena. Para um dado grau de disperso, quanto menor for o achatamento da distribuio, menor ser diferena entre estas duas distncias. Desde que (Q3- Q1) < (D9- D1) para umadistribuio com formamuito pontiaguda,K aproxima-se de0,5no limite, quandoQ3- Q1=D9- D1. Aocontrrio, quantomaisplaticrticaa distribuio (curva b), mais o intervalo entre os decis 9 e 1 tende a exceder o intervalo interquartlico. Portanto, quando o intervalo de uma varivel tende ao infinito e para uma curva completamente achatada,Ktende a zero.Em vista destasconsideraes, parecerazovel estabelecer valoresprximosde0,25 para representar distribuies mesocrticas (curva c). Esta escolha reforada pelo fato de que para a varivel normal padronizada, k = 0,2630 (veremos este ponto em captulo posterior).Na figura acima compara-se a curtose de duas distribuies com a curtose de uma distribuio mesocrtica (em linha tracejada). Na figura da esquerda temos umadistribuioplaticrtica(linhacheia) enafiguradadireitatemos uma distribuio leptocrtica (linha cheia).Aps o clculo dos quartis e decis a partir dos dados agrupados para a distribuio de gastos com alimentao, temos que:49KQ QD D121 2 188 39 154 83209 78 146 580 26553 19 1( )( / )( . , ), ,,Este resultado indica que a distribuio de gastos comalimentos aproximadamente mesocrtica, j que muito prximo de 0,25.503. ProbabilidadeObjetivos do captulo: Definir o termo probabilidade. Descrever as abordagens clssica, da freqncia relativa e subjetiva da probabilidade. Entender os termos experimento, espaos amostral e evento. Definir os termos probabildade condicional e probabilidade conjunta Calcular probabilidades aplicando as regras da adio e da multiplicao Determinar o nmero de possveis permutaes e combinaes Calcular uma probabilidade usando o Teorema de Bayes Probabilidade: uma medida de possibilidade de ocorrncia de um determinado evento; ela pode assumir um valor entre 0 e 1 Evento: Uma coleo de um ou mais resultados de um experimento Exemplo: Experimento jogar uma moeda duas vezesPossveis resultados (espao amostral) { KK, KC, CK, CC }Evento: no mnimo uma cara = {CC, CK, KC}Como uma probabilidade expressa ?Uma probabilidade expressa como uma nmero decimal, tal como 0,70 ; 0,27 ; ou 0,50. Entretanto ela pode ser representada como uma percentagem tal com 70 %, 27 % ou 50 %. O valor de uma probabilidade est localizado no intervalo de nmero reais que vai de 0 a 1, inclusive as extremidades deste intervalo.51 Quanto mais uma probabilidade prxima de 0, o evento a ela associado mais improvvel de ocorrer. Quanto mais uma probabilidade prxima de 1, o evento a ela associado mais provvel de ocorrer.3.1Definio Clssica de Probabilidade Probabildade Clssica: baseada na hiptese de que os resultados de um experimento so igualmente provveis.Usando o ponto de vista clssico:resultados possveis de total nmerofavorveis resultados de nmeroevento um de ade Probabilid Considere o experimento de jogar duas moedas. O espao amostral deste experimento S = { CC,CK,KC,KK} Considere o evento:uma cara2142resultados possveis de total nmerofavorveis resultados de nmeroevento um de ade Probabilid Definies Eventos mutuamente exclusivos: a ocorrncia de qualquer um evento significa que nenhumdos outros pode ocorrer ao mesmo tempo. No caso do experimento de jogar duas moedas, os quatro possveis resultados so mutuamente exclusivos.52 Eventos Coletivamente Exaustivos: no mnimo um dos eventos deve ocorrer quando o experimento conduzido.No experimento de jogar 2 moedas, os quatro possveis resultados so coletivamente exaustivos.Soma das probabilidades = 1 Desde que cada resultado no experimento de jogar 2 moedas tem probabilidade igual a , ento a soma das probabilidades dos resultados possveis + + + = 1 3.2 Conceito da Freqncia Relativa A probabilidade de um evento ocorrer no longo prazo determinada pela observao de que frao de vezes o evento ocorreu no passado. A probabilidade pode ser calculada pela frmula:s observae de total nmeropassado no ocorreuevento o que em vezes de nmeroevento do Pr e obabilidad53CCCKKC KKExemplo 2 A questo de ser ou no um ru culpado: em uma amostra de 500 estudantes em um determinado campus, 275 indicaram que o ru era culpado. Qual a probabilidade de que um estudante neste campus indicar que o ru neste caso era culpado? Nota: Neste problema podemos aplicar a frmula para a probabilidade baseada na frequncia relativa.Assim, P(culpado) = 275/500 = 0,553.3Probabilidade Subjetiva Probabilidade Subjetiva : a probabilidade de que um particular evento ocorra atribuda por um indivduo e baseada em um conjunto de informao disponvel.Exemplos de probabilidade subjetiva so: Estimar a probabilidade de que o time de futebol da Ponte Preta disputar a final do campeonato nacional. Estimar a probabilidade de que voc obtenha conceito A neste curso.3.4 Algumas Regras Bsicas de Probabilidade Regra da Adio: Se dois eventos A e B so mutuamente exclusivos, a regra especial da adio estabelece que a probabilidade de que A ou B ocorram igual a soma de suas respectivas probabilidades. A regra dada pela seguinte frmula:P(A ou B) = P(A) + P(B)Exemplo 3 54A companhia de aviao X recentemente forneceu a seguinte informao para o Departamento de Aviao Civil (DAC) sobre os vos da origem A ao destino BChegada FrequnciaAdiantadaNo horrioAtrasadaCancelado1008007525Total 1000 Seja A o evento: o vo chega adiantadoEnto P(A) = 100 / 1000 = 0,1 Seja B o evento: o vo chega atrasadoEnto P(B) = 75 / 1000 = 0,075 Nota: os eventos A e B so mutuamente exclusivos. Porque ? Qual a probabilidade de que um vo chegue adiantado ou atrasado?P(A ou B) = P(A) + P(B) = 0,1 + 0,075 = 0,1753.5 A Regra do ComplementoA regra do complemento usada para determinar a probabilidade de um evento ocorrer subtraindo-se a probabilidade do evento no ocorrer de 1.Seja P(A) a probabilidade do evento A e) ( A P a probabilidade do evento no A (complemento de A).55) ( 1 ) (1 ) ( ) (A P A PA P A P + Um diagrama de Venn pode ilustrar a Regra do Complemento:Exemplo 3 Reconsidere os dados do exemplo 2. Seja C o evento: o vo chega no horrio. Ento P(C)= 800 / 1000 = 0,8 Seja D o evento: o vo cancelado. Ento P(D) = 25 / 1000 = 0,025 Nota: os eventos C e D so mutuamente exclusivos. Porque?Use a regra do complemento para mostrar que a probabilidade do vo chegar adiantado (A) ouatrasado (B) 0,175 P(A ou B) = 1 P(C ou D) = 1 [0,8 + 0,025] = 0,175O diagrama de Venn abaixo ilustra esta situao:56 AA(C ou D) = (A ou B) =0,175 A regra do complemento muito importante no estudo de probabilidade. Com freqncia, mais eficiente calcular a probabilidade de um evento ocorrer determinando-se a probabilidade do evento no ocorrer e subtraindo o resultado de 1.3.6 A Regra Geral da Adio Sejam A e B dois eventos que no so mutuamente exclusivos. Ento P(A ou B) dado pela seguinte frmula:P(A ou B) = P(A) + P(B) P(A e B)O Diagrama de Venn abaixo ilustra esta regra:57

C0,8D 0,025B Exemplo 5 Em uma amostra de 150 estudantes, 70 disseram que somentetm um aparelho de CD, 50 disseram que somente tm uma TV e 25 disseram que tm ambos.O Diagrama de Venn a seguir descreve esta situao.58ACD70

TV 50Ambos25Se um estudante selecionado ao acaso, qual a probabilidade de que ele tenha somente um aparelho de CD ? De somenteuma TV ? De tanto uma TV como um aparelho de CD? Seja C o evento o estudante tem um aparelho de CD e T o evento o estudante tem uma TVP(C) = 70 / 150 = 0,4667P(T) = 50 / 150 = 0,3333P(C e T) = 25 / 150 = 0,1667 Se um estudante selecionado ao acaso, qual a probabilidade de que ele tenha tanto um aparelho de CD ouuma TV?( Nota: isto inclui a probabilidade de Ter ambos os aparelhos).Desde que:P(C ou T) = P(C) + P(T) P(C e T)Ento, P(C ou T) = 0,4667 + 0,3333 0,1667 = 0,63333.7Regras de MultiplicaoRegra Especial de Multiplicao Aregraespecial demultiplicaorequer quedoiseventosAeBsejam independentes. Definio: Dois eventos A eB so independentes se a ocorrncia de um no tem efeito sobre a probabilidade de ocorrncia do outro.59 A regra especial escrita simbolicamente como:P(A e B) = P(A). P(B) Para trs eventos independentes A,B e C, a regra especial da multiplicao usada para determinar a probabilidade de que todos os eventos ocorram :P(A e B e C) = P(A).P(B).P(C)Exemplo 6Um investidor possuiduas aes. Uma de uma companhia de produo de petrleo e a outra de uma cadeia de supermercados, de forma que podemos assumir que suas cotaes so independentes. A probabilidade de que a ao da companhia de petrleo suba no prximo ano 0,50. A probabilidade de que acotaodacadeia de supermercadosaumenteem valornoprximoano 0,70. Qual aprobabilidade dequeambas as aes cresamemvalor no prximo ano? Seja A o evento: a cotao da companhia de petrleo cresce no prximo ano e seja B o evento: a cotao da cadeia de supermercados cresce no prximo ano.P(A e B) = (0,50).(0,70) = 0,35 Qual a probabilidade de que ao menos uma destas aes aumentem em valor no prximo ano?Isto implica que tanto uma podeaumentar (sem que a outra aumente) assim como ambas.Portanto, 60P(no mnimo uma) = (0,50).(0,30) + (0,50).(0,70) + (0,70).(0,50) = 0,85Exemplo 7Um estudo recente constatou que 60 % das mes com crianas de idade de at 10anosempregam-seemtempointegral. Trsmessoselecionadasaos acaso. Assumiremosqueasmessoempregadasdeformaindependente umas das outras. Qual a probabilidade de quetodassejamempregadas emperodo integral? P( todas as trs empregadas em perodo integral) = (o,60).(0,60).(0,60) = 0,216 Qual a probabilidade de que no mnimo umas das mes sejam empregadas em perodo integral?P(no mnimo uma) = 1 P(nenhuma empregada em perodo integral) = 1 [(0,40).(0,40).(0,40)] = 0,9363.8 Probabilidade Condicional a probabilidade de que um evento particular ocorra,dadoque outro evento tenha ocorrido. Notao : AprobabilidadedoeventoAdadoqueoeventoBocorreu denotada por P(A/B)Regra Geral da Multiplicao61 ARegraGeral daMultiplicaousadaparaencontrar aprobabilidade conjunta de que dois eventos ocorram. A regra estabelece que para dois eventos A e B, a probabilidade conjunta de que os dois eventos ocorram obtida pela multiplicao da probabilidade de que o evento A ocorra pela probabilidade condicional de B dado que A ocorreu.A probabilidade conjunta, P(A e B) dadapela seguinte frmula:P(A e B)= P(A) . P(B/A)Alternativamente, podemos tambm escrever:P(A e B) = P(B) . P(A/B)Exemplo 8Uma faculdade coletou a seguinte informao sobre seus estudantes de graduao:Curso HomensMulheres TotalContabilidade 120 80 200Finanas 110 70 180Marketing 70 50 120Administrao 110 100 210Estatstica 50 10 60Computao 140 90 230Total 600 400 1000Umestudanteselecionadoaoacaso. Qual aprobabilidadedequeo(a) estudante seja mulher e que esteja cursando Contabilidade? Seja Ao evento: o(a) estudante est cursando Contabilidade e Fo evento: o(a) estudante mulher.P(A e F) = 80 / 100062 Qual a probabilidade de selecionar uma mulher ?P(F) = 400 / 1000 Dadoqueo(a) estudantemulher, qual aprobabilidadedequeesteja cursando Contabilidade ?Precisamos calcular P(A / F).P(A / F) = P(A e F) / P(F) = [80 / 1000] / [400 / 1000] = 0,203.9 Diagramas em rvore Umdiagrama emrvore muito til para representar probabilidades conjuntas e probabilidades condicionais. Ele particularmente til para analisar decises quando h diversos estgios no problema. Exemplo : Suponhaqueh7peasvermelhase5peasazuisemuma sacola. Suponha que voc selecione duas peas, uma aps a outra e sem reposio. Construa um diagrama em rvore para esta informao.637/125/126/115/117/114/11V1B1V2B2V2B2 (7/12) (6/11) (7/12) (5/11) (5/12) (7/11) (5/12) (4/11)3.10 Teorema de Bayes Considere o seguinte diagrama com as parties A1 e A2 :Espao AmostralP(A1 / B) = P(A1 e B) / P(B); P(A1 e B) = P(A1) . P(B / A1)P(B) = P(A1 e B) + P(A2 e B);P(A2 e B) = P(A2) P(B / A2)A partir disto, temos a frmula seguinte (Teorema de Bayes):) / ( ) ( ) / ( ) () / ( ) () / (2 2 1 11 11A B P A P A B P A PA B P A PB A P +

Nota: Esteteoremapodeser estendidoparadiversas parties doespao amostral ( A1, A2, A3, etc.)64A1A2A1 e BA2 e BBProbabilidadesCondicionaisProbabilidadesConjuntasExemplo 9:A Companhia C & W tem recebido recentemente diversas reclamaes de que suas garrafas esto sendo preenchidas com contedo abaixo do especificado. Umareclamaofoi recebidahojemasoadministrador daproduono capaz de identificar qual das duas plantas (A ou B) preencheu a garrafa. Qual a probabilidade de que a garrafa com pouco preenchimento provenha da planta A? SejaSo evento: a garrafa foi preenchida comcontedo abaixo do especificado.% da Produo Total % de garrafas com pouco preenchimentoA 55 3B 45 4

4783 , 004 , 0 45 , 0 03 , 0 55 , 003 , 0 55 , 0) / ( + S A PAnexo 1 Recordando Definies e Conceitos Uma moeda mostra cara 50% do tempo, em mdia. Depois de muitos lances, o nmero de caras aproximadamente igual ao nmero de coroas.Um conceito de Probabilidade No limite quando o nmero de lances -> infinito0,5lanamenos de nmerocaras denmeroDizemos que a probabilidade de aparecer uma cara em qualquer lance 1/2. Isto ilustra o conceito de probabilidade que ser usada neste curso. Exemplo - 10 000 lances de moeda John Kerrich, um matemtico sul africano estava visitando Copenhague quando a Segunda Guerra Mundial comeou. Dois dias antes de seu voo marcado para 65aInglaterra, osalemesinvadiramaDinamarca. Kerrichpassouorestoda guerra internado em um acampamento em Jutland e para passar o tempo ele levoua cabouma sriede experimentos em teoriada probabilidade. Emum destesexperimentos, lanouumamoeda10.000vezes. Seusresultadosso mostrados no grfico seguinte. (O eixo horizontal est em uma escala logartmica) Olanamentodeumamoeda10vezesumexemplodeumexperimento aleatrio. AmaioriadosexperimentosestsujeitoaVariaoAleatria.A Teoria de probabilidade a aproximao matemtica que busca quantificar em temos de modelos o que ocorre com estes experimentos.Exemplo - 2 lanamentos de uma moeda Lance uma moeda duas vezes e registre para cada lance seo resultado era uma cara (C) ou uma coroa (K). Exerccio: Liste os possveis resultados. Seja A o evento deu uma ou mais caras. Quais resultados pertencem ao evento A? (CK, KC, CC). Seja B o evento no aparece nenhuma cara. (KK) 66-10510-5100 1000 10000Nmero de lanamentos0% de caras 50 %10Neste exemplo, os eventos A e B so ditos disjuntos ou mutuamente exclusivos, pois eles no tm nenhum resultado em comum. Eles tambm so exaustivos, j que eles cobrem todos os possveis resultados do experimento. Exerccio: Defina um evento C que no disjunto em relao a A. DEFINIES Um espao amostral o conjunto de todos os possveis resultados de um experimento.Um evento um conjunto de um ou mais resultados no espao amostral. Doiseventos sodisjuntosoumutuamente exclusivosseeles notm nenhum resultado em comum. Avariaoaleatriaocorre quando impossvel predizer comcerteza o resultado exato deumexperimento individual, mas como oexperimento repetido um nmero grande de vezes uma distribuio regular de freqncias relativas surge.Aprobabilidadedeumresultadooueventopode ser determinadatanto empiricamente(baseado emdados) outeoricamente (baseado emum modelo matemtico do processo). A definio emprica a seguinte: Suponha que um resultado (ou evento) A ocorre f vezes em n observaes. Entonffrequncia s observae de nmeroocorre Aque em vezes de nmeroAde relativa O conceito daprobabilidadede um eventoA umidealizaodafreqncia relativa. o valor limite da freqncia relativa quando n fica muito grande, i.e. quando n => nquando ) ( A Pnf (P(A) denota a probabilidade de A ocorrer). Estimativas tericas de probabilidade esto baseadas em suposies plausveis. Asuposio mais comum a de que todos os possveis resultados so igualmente provveis. Ento 67 amostral espao no resultados de total nmeroA a endo correspond resultados de) (nmeroA P Por analogiacomfreqnciasrelativas, asprobabilidadestmasseguintes propriedades: 1. P(A) um valor entre 0 e 1. 2. P(A) = 0 significa A nunca acontece (correspondendo a f = 0) 3. P(A) = 1 significa A sempre acontece (correspondendo a f = n) 4. O conjunto S de todos os possveis resultados tem probabilidade 1. P(S) = 1, os quais se agrupam em 5 eventos. Anexo 2 - Independncia e Modelos de rvore para Calcular Probabilidades Se eventos X e Y so mutuamente exclusivos, ento, P(X ou Y) = P(X) + P(Y) Em geral, se eventos X e Y no so mutuamente exclusivos ento P(X ou Y) = P(X) + P(Y) - P(X e Y). Exemplo - Fruta em 2 distritos Um certo tipo de fruta produzido em 2 distritos, A e B. Ambas as reas s vezes so atacadas por uma praga (mariposa que ataca as frutas). Suponha que as probabilidades so P(A) = 1/10, P(B) = 1/20, P(A e B) = 1/50 Qual a probabilidade de que um ou outro (ou ambos) distrito esto infetados em um determinado momento? P(A ou B) = P(A) + P(B) - P(A e B) = 0.1 + 0.05 - 0.02 68= 0.13 Alternativamente, considere partes mutuamente exclusivas A ou B consiste em 3 partes mutuamente exclusivas: A somente, B somente, A e B. P(A ou B) = P(A somente) + P(B somente) + P(A e B) = 0.08 + 0.02 + 0.03 = 0.13 .DoiseventosXeYsoditosindependentesseaprobabilidadedequeX acontece no afetada pelo fato de Y acontecer ou no. Pode ser mostrado que isto implica: P(X e Y) = P(X)P(Y) Esta chamado a regra de multiplicao para eventos independentes. Exemplo - 2 guardas de segurana e o seus aparelhos de controle Hdoisguardasdeseguranaparaumgrandeestabelecimento. Cadaum carrega um aparelho de controle ativado por detectores nos edifcios. O Guarda 1 consciencioso e est atento ao aparelho 80% do tempo. O Guarda 2 no to confivel e s responde ao aparelho 50% do tempo. Se os guardas relatam independentemente qualquer alerta para a polcia ou o corpo de bombeiros, qual a probabilidade de que pelo menos um informar um alerta? Seja X o evento o Guarda 1 relata o alerta. P(X) = 0.8 Seja Y o evento o Guarda 2 relata o alerta. P(Y) = 0.5 69P(A somente)= 0,1 0,02= 0,08P(A e B)= 0,02P(B somente)= 0,05 0,02= 0,03 So os eventos X e Y mutuamente exclusivos? - No, ambos podem informar. X e Y so independentes? - Considere por hiptese que Sim. P(no mnimo um Guarda informa) = P(X ou Y) = P(X) + P(Y) - P(X e Y) Mas P(X e Y) = P(X) P(Y) (independentes) = 0.8 x 0.5 = 0.4 assim P(X ou Y) = 0.8 + 0.5 - 0.4 = 0.9 Assimembora Y s fidedigno 50%do tempo, empreg-lo aumenta a probabilidade de informar um alerta.Diagramas de rvore so teis em clculos que envolvem vrias fases. Cada segmento na rvore uma fase do problema e as probabilidades nos ramos a partirde cadapontotemquesomar 1.Aprobabilidade de alcanarofimde qualquer caminhocompletooprodutodasprobabilidadesescritasemseus ramos. Exemplo - Meninos e meninas em uma famlia de 3 filhos Modelo de rvore para meninos (B) e meninas (G) em uma famlia de tamanho 3. (ver figura a seguir)70Figura 1Cada caminho representa um resultado ( famlia de 3 filhos). H 8 resultados. Se voc assume que estes so igualmente provveis ento a probabilidade de cada 1/8. por exemplo P(BGB) = 1/8. Outro modo de calcular isto assumir que para cada nascimento P(B) = P(G) = 1/2. Ento por exemplo P(BGB) = 1/2 x 1/2 x 1/2 = 1/8 = 0.125 i.e. assumindo que sexo independente dos nascimentos prvios e multiplicando probabilidades ao longo dos ramos da rvore. Modelos de rvore so teis para analisar qualquer processo "passo por passo". Exe