apostila amostragem

Upload: milena-caram

Post on 18-Jul-2015

211 views

Category:

Documents


2 download

TRANSCRIPT

Cap. 1-AmostragemeDistribuicoesAmostraisFebruary27,20091 IntroducaoO objetivodeste captulo e introduziro conceito de amostragem e apresentaralguns resultados dedistribui coes teoricas geradas pela amostragem.E um captulo de liga cao, ele junta a teoria de dis-tribui coes estudada em probabilidade com a teoria de inferencia estatstica atraves da apresenta caodealgumasdistribui coesassociadas`aamostragemqueseraonecessariasnocurso. Destaforma,quando elas aparecerem mais tarde nao sera necessario parar o curso para deriv a-las. Inicialmentesera vista uma discussao de popula coes,amostras,estatstica e momentos amostrais. Depois seraorevistosalgunsresultadosligadosamediasamostrais,taiscomoleidosgrandesn umeros,teoremacentraldolimiteealgumasdistribui coesdefamliasparametricas. Amostrasdefamliasnormaisseraoestudadascommaiorcuidado, quandoseraoapresentadasasdistribui coesqui-quadrado, FdeSnedecoretdeStudent. Finalmenteseraodiscutidasasestatsticasdeordem.1.1 InferenciaIndutivaeInferenciaDedutivaNos2tiposdeinferenciaqueremosinferirumresultadoapartirdeumconjuntodeinforma coes.Se as informa coes forem sucientes para inferir com certeza o resultado nal temos uma inferenciadedutiva,casocontrarioumainferenciaindutiva. Considereosseguintesproblemas:Exemplo1.1: Sabe-se o angulo entre 2 lados de um triangulo e que estes 2 lados s ao iguais; quaisosoutrosdoisangulos?Exemplo1.2: Quer-sedescobrirapropor caodeeleitoresdacidadedeCampinasqueapoiaumcertocandidatoemumaelei cao. Paratantofoi realizadaumapesquisaeleitoral. Oconjuntodeinforma coesdisponveis eametodologiautilizadanapesquisaeoresultadodapesquisa.Exemplo1.3: Umengenheiropropoeumamodica caonacomposi caodaligautilizadanosla-mentos das l ampadas. Um experimento e realizado com 100 l ampadas medindo-se o tempo de vidadas75primeirasl ampadasquequeimam. Apartirdesteexperimentoqueremosestimarotempomediodevidadasl ampadasevericarsecomonovolamentootempomediodevidaaumenta.Exemplo1.4: Amdedescobrirquanto eimpopularavoltadoIPMFamdearrecadarrecur-sosparaasa ude,aDataFolhaentrevistou2000pessoasnoEstadodeSaoPauloeencontrou1740destas pessoas contrarias `a volta do imposto. Isto nos diz que, nesta amostra, 87% das pessoas s aocontrariasaoimposto. Oqueistodizarespeitodapopula caodoBrasil?Seraqueapercentagemde pessoas contrarias ao IPMF e proxima de 87%?Se sim, qual a margem de erro desta estimativa?Seraquehaevidenciasignicativaqueovalorverdadeiro emaiorque85%?Exemplo1.5: Uma ind ustria produtora de fornos de microondas gostaria de saber quanto tempodeve-sedardegarantiaaseusprodutosdemodoquesomente1%deseusprodutosdemandem1reparosnoprazodegarantia. Atravesdetestesacelerados,pode-seobterostemposdevidade50fornosdemicroondasecombasenestesdadosestimaroprazodegarantia.Exemplo1.6: Elabora caodeumacartadecontroleutilizandoosdadosdisponveis.Exemplo1.7: Umaind ustriadesucosconcentradosest adesenvolvendoumnovoprocedimentopararetiraraaguadosucodelaranjademodoqueosucoreconstitudosejamaisagrad avel aopaladar. Osabordosucovariaemumaescalade1a10. Peloprocedimentoatual este ndicepodeserconsideradocomoumavariavelaleat orianormalmentedistribudacommedia7edesviopadrao1. Comodescobrirseonovometodo erealmentemelhor?Nestes 7 exemplos e facil vericar onde temos ums inferencia dedutiva ou indutiva. Neste cursoestaremosinteressadoseminferenciaindutivaemmodelosparametricos(InferenciaParametrica),principalmentedentrodaabordagemfrequentista. Asdeni coesdestesnovostermosapareceraomaistarde.Umdiagramadoprocessodeaprendizadoedosobjetivosdainferencias aoapresentadosnodiagramaaseguir.ProcessodeAprendizagem:ExperimentacaoDadosInducao Hipotese 2Hipotese 1 Deducao ConsequenciasObjetivodaInferencia:Amostra InferenciaVerdadeiro estado Dados Estado inferido da natureza (?)1.2 Populacaoeamostra:Oobjetivodeumainvestiga caocientcaedescobrir (entender, estudar) algumacaractersticadecertapopula cao. Como, emgeral, eimpossvel ouimpratic avel examinartodaapopula cao,examinamospartedelaecombasenestesdadosprocuramosfazerinferenciasarespeitodetodapopula cao. Temosquedistinguirentrepopula caoalvoepopula caoamostrada.Deni cao1.1: Popula caoalvo: Atotalidadedoselementosqueest aosobdiscussaoeparaosquaisqueremosinforma coesserachamadadepopula caoalvo.2Napraticanemsempreoselementosescolhidosparaanalisepertencem`apopula caoalvo. Porexemplo, paratestaraecienciadeumanovavacinas aoselecionadosalunospertencentes`aredep ublica,mas quer-se inferir o resultado para todas as crian cas dentro de uma certa faixa de idade.Neste caso os alunos da rede p ublica formam a popula cao amostrada. Normalmente a inferencia dapopula cao amostrada para a popula cao alvo e realizada atraves de conhecimentos nao (puramente)estatsticos;pelomenosnaonaabordagemfrequentista.O motivo de se utilizar uma popula cao amostral e analisar-se apenas alguns elementos da pop-ula cao e econ omica. No caso em que o teste de aceita cao de lote e do tipo destrutivo alem da perdadetodasaspe casteramosocustodaamostragem. A(formada)escolhadoselementosaseremanalisadosformagrandepartedoobjetodaAmostragemeseraapenastratadosupercialmenteaqui. Onossointeressecentralizar-se- anainferencia.Deni cao1.2: Popula caoamostrada: aquela da qual retiramos a nossa amostra. No Exemplo1.4,apopula caoamostradas aoadultosquemoramemSaoPauloenquantoapopula caoalvos aotodasaspessoasatingidaspeloIPMFnoBrasil.Comocomentadoanteriormente, seapopula caoamostradanaoeamesmaqueapopula caoalvo, as conclus oes (inferencias) obtidas atraves daamostra, aprincpio, s os aov alidas paraapopula caoamostrada.EmEstatsticatambemechamadodepopula caooconjuntodetodososvaloresdavariaveldeinteressedoselementosdapopula caoamostrada,eadsitribui caodeprobabilidadeassociadaaestesvalores. Amostraseriaosvaloresobservadosnoselementosobservados.Em cada um dos exerccios seguintes dena a popula cao alvo e a popula cao amostral. Veriquese a amostragem e utilizada em todos os casos. Discuta ent ao como cam os coment arios realizadosanteriormente.Exerccio1.1: Discuta nos exemplos anteriores as amostras e as popula coes no sentido estatsticousualmenteadotado.Exerccio1.2: TestedeumnovoprodutoparatratamentodeAIDS einiciado. Foramseleciona-dosvoluntariamente2100volunt arios.Exerccio1.3: Experimento erealizadoemlaboratorioparatestarseaingest aodecertotipodedietareduzopeso. Noexperimentoforamutilizados35ratos.Pergunta: Comoselecionarumaamostra? Otamanhodaamostra exadoatravesdonveldeprecis aodesejado. Os requisitos de uma amostra e que seja nita e representativa da popula cao, embora o termorepresentativaaindanaoestejaclaraporenquanto.Vamos voltar ao Exemplo 1.4, que trata da pesquisa do DataFolha para ilustrar como e realizadaamodelagemestatstica. Parasimplicarequanticaresteexemplodena:Xi=_1, seoi-esimoentrevistado econtrarioaoIPMF0, casocontrarioAposretiraraamostratemosdisponveis2000respostas0ou1. Sep=propor caodevotoscontrariosaoIPMF,comoutilizaros2000dadosparaestimarp?3NotequeX1, X2, . . . , X2000s aovariaveisaleat orias, naosendopossvel predizercomcertezaseusvaloresantesdeobservaraamostra.Depoisderetiraraamostra: x1, x2, . . . , x2000s aovaloresobservados,realiza coesdasv.as.Nota cao: As letras mai usculas serao utilizadas para denotar variaveis aleat orias (v.as.) enquantoasmin usculasparavaloresassumidospelasv.as.Qualadistribui caoconjuntadeX1, X2, . . . , Xn?Suponhaquen = 2.X1=_1, seaprimeirapessoaentrevistada econtrariaaoIPMF0, casocontrarioX2=_1, seasegundapessoaentrevistada econtrariaaoIPMF0, casocontrarioNestecaso,parai = 1, 2,P(Xi= x) = px(1 p)1x, x = 0 ou 1,isto e,X1eX2s aoidenticamentedistribudas.Caso1: Supondoqueaamostra efeitacomreposi cao:P(X1= x, X2= y) = P(X1= x)P(X2= y).Isto e,X1eX2s aoindependentes.Caso2: Supondoqueaamostra efeitasemreposi cao:P(X1= x, X2= y) = P(X1= x)P(X2= y).Isto e,X1eX2naos aoindependentes.Ocaso2emaisdifcildeserestudado. Vamosnosconcentrarnocaso1porquealemdemaisfacileleocorre,pelomenosdeformaaproximada,comumacertafreq uencianapr atica. Veriqueseafun caodeprobabilidadeconjuntasatisfazadeni caoabaixo.Deni cao1.3: AmostraAleatoria(1)X1, X2, . . . , Xnformamumaamostraaleat oriadetamanhondeumavariavelaleat oriaX,oudeumapopula caocomfun caodistribui caoFX(.),se,esomentese,afun caodistribui caoconjuntadeX1, X2, . . . , Xne:FX1,...,Xn(x1, . . . , xn) =n

i=1FX(xi),isto e,X1, X2, . . . , Xns aoindependenteseidenticamentedistribudas(i.i.d.) comcomfun caodis-tribui caoFX(.). Dizemosqueelesformammumaamostraaleat oriadetamanhondapopula cao(comfun caodedistribui cao) FX(.) Paraos casos ondeXeumavariavel aleat oriadiscretaoucontnuatemosasdeni coesequivalentes.4(2)X1, X2, . . . , Xnformamumaamostraaleat oriadetamanhondeumavariavel aleat oriadisc-retaX, oudeumapopula caocomfun caodeprobabilidadepX(.), se, esomentese, afun caodeprobabilidadeconjuntadeX1, X2, . . . , Xne:pX1,...,Xn(x1, . . . , xn) =n

i=1pX(xi),isto e,X1, X2, . . . , Xns aoindependenteseidenticamentedistribudas(i.i.d.) comfun caodeprob-abilidadepX(.),. Dizemosqueelesformammumaamostraaleat oriadetamanhondapopula cao(comfun caodeprobabilidadepX(.)(3)X1, X2, . . . , Xn formam uma amostra aleat oria de tamanho n de uma variavel aleat oria contnuaX, , ou de uma popula cao com fun cao densidade de probabilidade fX(.), se, e somente se, a fun caodedensidadeconjuntadeX1, X2, . . . , XnefX1,...,Xn(x1, . . . , xn) =n

i=1fX(xi).Istoe,X1, X2, . . . , Xns aoindependenteseidenticamentedistribudas(i.i.d.) comfun caodeden-sidade fX(.). Dizemos que eles formam muma amostra aleat oria de tamanho n da popula cao (comfun caodedensidade)fX(.). Notextoenocursonaofaremosdistin caoemtermosdenota caoenomenclatura entre variaveis aleat orias discretas e contnuas e nos referiremos `a fun cao densidade,semprequeistonaocausarconfusao.Deni cao1.4: Popula caoAmostrada: SejaX1, X2, . . . , Xn,umaamostraaleat oriadeumapopula caocomdensidadefX(.);ent aoestapopula cao echamadadepopula caoamostrada.Exerccio1.4: SuponhaqueestamosinteressadosemestudarotempodevidaXdecertocom-ponente eletr onico. Sabe-se que nao ha envelhecimento neste componente, portanto h a raz oes parasuporqueXeexponencialmentedistribudacommedia1/. Isto e,fX(x) = exI(0,+)(x) > 0.A m de determinar o valor de , 10 destes componentes foram selecionados ao acaso e seus tem-posdevidaanotados. SejaXi=tempodevidadoi-esimocomponenteeletr onico, i=1, . . . , 10.Acheadensidadedaamostra. Qual aprobabilidadequetodososcomponentesvivammaisde10horas? Setodososcomponentesviverammaisde10horas, voceachariarazo avel suporque = 1/5?Quaisassuposi coesadotadas?Exerccio1.5: Veriquenoexperimentoanterioremquesitua coestemosumaamostraaleat oria.NainferenciaestaremosinteressadosemrealizarinferenciassobrefX(.)ousobrealgumacar-actersticadefX(.);porexemplo,suamediaevariancia. Alemdisso,nocasoemqueapopula caoamostrada e popula cao alvo forem diferentes esperamos que as duas fun coes fX(.) sejam iguais, datermos adotado o mesmo nome. Quando nos referirmos `a popula cao fX(.) estaremos nos referindo`apopula caoamostradacomdensidadefX(.). Observequeenecessariodenirclaramenteapop-ula caoalvo, ainforma caoasercoletadaXi, i = 1, . . . , n, aformaqueestainforma caoecoletadae,comoveremosmaistarde,onossointeressenapopula caoalvo.Exemplo1.8 : No Exemplo1.4 vimos que no caso de uma amostra com reposi cao fX(.) tem umadistribui cao Bernoulli com par ametro p, onde p e a propor cao de eleitores que apoiam o candidato,5eeacaractersticadapopula caoalvodeinteressesendotambemumacaractersticadefX(.).Nestecaso eclaroqueXdainforma caosobrepporquefX(.) efun caodep.Exemplo1.9: Suponhaqueumcertoprodutoetestadoantesdeserlan cadonomercado. Paratantoescolhe-sealgumascasasaleatoriamentedeumacidade-piloto. Nestecaso, comoexistein-teresseemlan caroprodutoemtodoopas,apopula caoalvo eopas,enquantoqueapopula caoamostrada s ao as famlias da cidade-piloto. Como colocado anteriormente, a inferencia da amostraparaapopula caoamostradaebaseadanosmetodosdainferenciaestatstica, enquantoqueaex-trapola caoparaapopula caoalvo ebaseadaemoutrosjulgamentos.Exerccio 1.6: De exemplos especicando de forma clara a popula cao alvo, a popula cao amostrada,f(.) epossveiscaractersticasdeinteressedef(.)2 EstatsticasQuando queremos estudar um fenomeno aleat orio, devemos tirar uma amostra aleat oria X1, . . . , Xndavariaveldeinteresse. Comoestascaractersticasnumericass aoaleat orias,omelhorquepode-mos fazer para descreve-las e utilizar sua lei de probabilidade. Se as v.a.s s ao discretas isto e feitoatraves de sua fun cao de probabilidade e se elas s ao contnuas podemos utilizar a sua densidade deprobabilidade. Primeiramenteprecisamosdeterminaraformadadistribui cao. Isto efeitoatravesdeconsidera coesteoricassobreoexperimentoemquest ao,comoporexemplo,seadistribui caoecontnua, discreta, simetrica ou nao, etc. Se isto nao for possvel e necessario utilizar inferencia naoparametrica. Sepodemosdeterminaraformadadistribui cao,emgeral,faltamalgunspar ametrosnumericosqueprecisamserdeterminadoscombasenaamostra. Porexemplo, seestamosestu-dandotempodevidadel ampadasuorescentes, podemosargumentar queotempodevidadel ampadas e uma v.a. contnua,positiva e como nao ha envelhecimento pode ser considerada expo-nencial. Assim se tiramos uma a.a. X1, . . . , Xnde uma distribui cao exp(), falta ainda determinar, como isso nao e possvel de ser feito exatamente, utilizaremos a a.a. da melhor forma possvelpara estimar o par ametro .E, portanto, natural que a estimativa seja dada atraves de uma fun caodaamostraaleat oriaX1, X2, . . . , Xn. Paraquetenhamutilidadeestasfun coestemqueobedecercertasrestri coesdadaspeladeni caoaseguir.Deni cao2.1: Estatstica: Qualquerfun caodoselementosdeumaamostra, aleat oriaounao,quenaodependedepar ametrosdesconhecidos echamadadeestatstica.Exemplo2.1: Se X1, X2, . . . , Xne uma amostra de uma distribui cao com densidade (ou fun caodeprobabilidade)f(x, ),ent aoX1 +X2;X3X4;Xn=n

i=1Xi;n

i=1X2i ;n

i=1XiS2X=n

i=1(XiX)2;n

i=1log(Xi); max(X1, . . . , Xn); min(X1, . . . , Xn)s aoestatsticas.Exemplo2.2: SejamX1, . . . , Xni.i.d. N(, 2)par ametrosdesconhecidose. TemosqueX1,X ,X ,n

i=1(Xi)26naos aoestatsticas,poisdependemdepar ametrosdesconhecidose.Obs.: Estatsticass aov.a.seportantotemdistribui caodeprobabilidade. Porexemplo,setemosX1, . . . , Xni.i.d. N(, 2)ent aoX=1nn

i=1Xieumaestatsticaeasuadistribui cao edadapor:X N(, 2n).NotequeT=X SX/n t(n 1)temdistribui caoindependentedepar ametrosdesconhecidosmasnao eumaestatstica.2.1 MomentosamostraisQuando foram estudadas as distribui coes de probabilidade uma das caractersticas estudadas foramos momentos, centrais e nao centrais, das distribui coes. Alem da interpreta cao intutitiva de algunsdos seus momentos como medidas de loca cao, dispersao, assimetria e curtose, uma das justicativasdoseuestudoeofatodelas(casoexistamtodas)caracterizaremadistribui cao(lembrem-sedaspropriedadesdafun caogeratrizdemomentosqueseraorevistasmaistarde).Denotepork= E(Xk)ok-esimomomentodav.a. X.Deni cao2.2: MomentoAmostral: SeX1, . . . , Xnea.a. comamesmadistribui caodeX,ok-esimomomentoamostral e:Mk=1nn

i=1Xkiparak = 1, 2, . . ..NotequeparacadakxoMkeumav.a. e eestatstica.Nota cao: mkeok-esimomomentoamostralobservado(isto e,aposretirarmosaamostra).Nota: Algunsmomentosamostraistemespecialimportancia:M1=X=1nn

i=1Xieamediaamostral. AestatsticaS2=1n 1n

i=1(XiX)2=nn 1(M2M21)eavarianciaamostral,ondeM2=1n

ni=1X2i .7Teorema2.1:S2=nn 1[M2X2].Nota cao: S=_(S2) eodesviopadraoamostral.2.1.1 Distribui caodosmomentosamostraisTeorema2.2: SejamX1, . . . , Xnumaamostraaleat oriadeumapopula caoX. Temos,E[Mk] = k, k = 1, 2, . . .eVar[Mk] =1n[2k2k].Prova:E[Mk] = E[1nn

i=1Xki ] =1nn

i=1E[Xki ]=1nn

i=1k= kVar[Mk] = Var[1nn

i=1Xki ] =1n2n

i=1Var[Xki ]=1nVar[Xk] =1n[E[X2ki] E2[Xk]]=1n[2k2k].Corolario2.1:E[ X] = , Var[ X] =2n.Corolario2.2:E[S2] = 2.Prova:E[S2] =nn 1[E[M2] E[ X2]]=nn 1[2(2n+2)]=nn 1[222n]=nn 1[22n]=nn 1[n 1n2] = 2.Teorema2.3: SeX1, . . . , Xns aoi.i.d. N(, 2).(a)X N(, 2/n),i.e.,X /n N(0, 1).8(b)n

i=1(Xi)22 2(n).(c)n

i=1(XiX)22 2(n 1).(d)X S/n t(n 1).Prova: Esteteoremaest asendoapresentadoaqui,masasprovasapareceraomaistardenaSe cao4. Oresultado(a)comoaplica caodoTeorema4.2, o(b)noTeorema4.1, o(c)comoCorol ario4.1eoresultado(d)comoaplica caodoTeorema4.4.3 SomasdeVariaveisAleatoriasVamosagoratornarumpoucomaisprecisoumcoment arioquezemosdeformaintuitivaare-speitodefrequenciarelativa: `amedidaqueon umeroderepeti coesdeumexperimentocresce,afreq uencia relativa fAde um evento A converge para a probabilidade teorica P(A). Por exemplo,seumanovape caforserproduzidaenaotivermosconhecimento`apriorisobreoquaoprov avelape casejadefeituosa,podemosprocederainspe caodeumgranden umerodestaspe cas. SejaN=n umerodepe casinspecionadasen =n umerodepe casdefeituosas.Portanto,p = P(pe cadefeituosa) n/N.Entretanto,n/Neumavariavelaleat oria,poisn b(N, p). Da,n/N p (emalgumsentido).3.1 LeidosGrandesN umerosTeorema3.1: DesigualdadedeChebyshev: Seja Xuma variavelaleat oriae g()uma fun caonaonegativacomdomnionaretareal;ent aoP[g(X) k] E[g(X)]/k paratodok > 0.Corolario3.1: SeX eumavariavelaleat oriacomvariancianitaent aoP[|X | r] = P[(X )2 r22] 1/r2p/todor > 0.Exerccio3.1: Seumapopula caotem=2eXeamediadeumaamostradetamanho90encontre, utilizando Chebyshev, um intervalo que contenha |X| com probabilidade, no mnimo,iguala0,90.Teorema3.2: Lei FracadosGrandesN umeros(Bernoulli). SejaEumexperimentoeAumeventoassociado`aE. ConsidereNrepeti coesindependentesdeE, non umerodevezesem9que A ocorre nas Nrepeti coes e p = P(A) (a qual supoe-se seja a mesma para todas as repeti coes).Da,P(|n/N p| ) p(1 p)N20quandoN ,paratodo > 0.Teorema3.3: LeiFracadosGrandesN umeros: SejaX1, X2, . . .umasequenciadevariaveisaleat oriasi.i.d. Sejam = E(Xi)e2= Var(Xi)edenaXn=

ni=1Xin.Ent ao,E( Xn) = , Var( Xn) = 2/n,etambemP(|Xn| ) 2n2 0quandon ,paratodo > 0.Exemplo3.1: Umgranden umerodev alvulas eletr onicas s aotestadas. Seja, Tiotempodevidadai-esimav alvula. suponhatambemquenaohaenvelhecimentodaspe caseTi exp().Portanto,E(Ti) = 1/, Var(Ti) = 1/2.SedenimosTn=T1 + +TnntemospelaLeiFracadosGrandesN umerosP(|Tn1/ | > ) 0quandon paratodo > 0.Ouseja,seotamanhodaamostran emuitogrande,seramuitoprov avelqueovalorobtidoparaamediaamostralestejaproximode1/. Qu aoprov avel?3.2 TeoremaCentraldoLimiteTeorema3.4: SejaX1, X2, . . . umaseq uenciadev.a.si.i.d. (i.e., umaamostraaleat oria)comE(Xi) = eVar(Xi) = 2. DenaSn= X1 + +Xn,ent aoE(Sn) = n, Var(Sn) = n2eZn=SnE(Sn)_Var(Sn)=Snnn=Xn/n N(0, 1).Isto e,seGn(z) = P(Zn z)ent aolimnGn(z) = (z) =_z12ex2/2dx.10Comotrabalhamoscomamostrasnitastrabalhamoscomadistribui caoaproximada. Zntemdistribui caoaproximadamenteN(n, n2)eXtemdistribui caoaproximadamenteN(, 2/n).Talvezomaiorproblemacomoteoremacentral dolimitesejaadiculdadedesaberquandonesucientementegrande.Deformageral, quantomais proximaadistribui caodos Xisforsimetrica, unimodal, contnua, istoe, mais parecidocomadistribui caonormal mais r apidaeaconvergencia. Emparticular temosdistribui caoexatanormal paraqualquernquandoadis-tribui caodosXisfornormal. Emmuitoscursosintrodut oriosecomumaspessoasutilizaremon umeromagico30. Emboraesten umerosejaadequadoparaamaioriadassitua coeselenaopodeseraplicadoemtodososcasos.Algunspontosimportantesaseremvericadoss ao:1. simetria2. naotercaudaspesadas.3. aproxima caorelativamelhorproximo`aesperan ca.Senfor consideradosucientementegrandeparaseutilizar oteoremacentral dolimite,mas aindanaoe umn umeroenorme, podemos nos perguntar oque ocorre comocalculodaprobabilidadedeumn umero, quepodeserbemdiferentedezeroparaadistribui caodiscretaezeroparaadistribui caocontnuanormal. Comoosvaloresdadistribui caobinomial s aointeirosadotamosoquechamamosdecorre caodecontinuidadede1/2unidade. SeY Binomial(n,p)eX N(np, np(1 p)),ent aoP[Y k] P[X k + 1/2]P[Y= k] P[k 1/2 X k + 1/2]Outrascaractersticasdoteoremacentraldolimite:1. Naoevalidaapenasparadistribui coesDiscretaeContnua: Oteoremacentraldolimite e aplicavel quando Xitiver qualquer tipo de distribui cao. Apenas mencionamos certasnuan casquandotrabalhamoscomdistribui coesdiscretas.2. Condi coesquepodemserRelaxadas: oteoremacentraldolimiteassumesomentequeXis aoindependentes eidenticamentedistribuidas (iid) comvariancianita(e, portanto,commedianita). Mas, mesmoascondi coesiidpodemserrelaxadas. Porexemplo, seasvariaveis s ao independentes mas nao identicamente distribuidas, mas satisfazem as condi coesde LindebergouLiapunov(signicando, essencialmente que nenhumavariavel que entranasomadominetotalmenteasoma). Damesmaforma, existemcondi coessobasquaisoteoremacentral dolimiteaindaeaplicavel paravariaveisdependentes(masidenticamentedistribuidas),seadependenciacairapidamente.3. ExtensaoparaFun coesdaSomaouMedia: Ometododelta, queseradiscutidomaistarde, permite a utiliza cao do teorema central do limite no calculo da distribui cao de fun coesdasomadevariaveisaleat oriasdeumamaneiradiretaesimples.4. Outraslimita coesofteoremacentraldoLimite eque-emboraassuposi coesdeinde-pendencia e mesma distribui cao possam ser relaxadas - a necessidade de termos as variancias2sdosXisseremnitasnaopodeserrelaxada. Portanto,oteoremacentraldolimitenaopodeseraplicado, porexemplo, paraadistribui caoCauchyeparaadistribui c aot-Studentcom2oumenosgrausdeliberdade.11Exerccio3.2: Resolva o Exerccio3.1 anterior utilizando o teorema central do limite. Discuta sevocepodeutilizaroteorema. Porqueosdoisresultadoss aodiferentes? Qualtamanhoamostralvoceutilizaria?Justique.Exerccio 3.3: Em uma pesquisa de opiniao p ublica utilizando amostra aleat oria simples deseja-sequeaprobabilidadedequeoerroabsolutodaestimativadapropor caoverdadeirasejamaiordoque0,03seja, nomaximoigual a0,05. CalculeotamanhodaamostrautilizandoadesigualdadedeChebysheveoteoremaCentraldoLimite. Qualresultadovoceutilizarianapratica?Exerccio 3.4: Verique que, sob certas condi coes as distribui coes Poisson, Gama (Erlang) podemseraproximadaspeladistribui caonormal. Quaiss aoestascondi coes?Exerccio3.5: Umpesquisadordeveestimaramediadeumapopula caoutilizandoumaamostrasucientemente grande para que com probabilidade, no mnimo, igual a 0.95 a media amostral naoseja diferente da media populacional mais do que 25% do desvio padrao. Qual deve ser o tamanhodaamostra?Exerccio3.6: No Exerccio 3.1 discuta se voce poderia utilizar o teorema central do limite. Casopossa,refa caascontasecomenteosresultados.Exemplo3.2: Seja X1, X2, . . . uma seq uencia de v.a.s de Bernoulli independentes, (P(Xi= 1) =p). Ent aoSn=n umerodesucessosemnensaiosdeBernoulliindependenteseSn b(n, p).PeloTeoremaCentraldoLimite(TCL),Snnp_np(1 p) N(0, 1).Suponhaquesomosprodutoresdearruelas, cercade5%dasquaiss aodefeituosas. Senumlote,100arruelass aoinspecionadas,qualaprobabilidadedequenomaximo4sejamdefeituosas?S100=n umerodearruelasdefeituosasencontradasnumaamostradetamanho100,temosS100 b(100, 0.05)eP(S100 4) =4

k=0_100k_(0.05)k(0.95)100k= P(S100100 0.05100 0.05 0.954 100 0.05100 0.05 0.95)= P(Z100 12.179) = P(Z100 0.459) (0.459) = 0.3228.Eseencontrarmos8defeituosos,aindaacreditamosquep = 0.05?P(S100 8) = 1 P(S100 7)= 1 P(S100100 0.05100 0.05 0.957 100 0.05100 0.05 0.95)= 1 P(Z100 22.179) 0.166.12Refa caascontasutilizandoacorre caodecontinuidadeeveriqueseexistealgumadiferen caecomparecomosvaloresexatos.Exemplo3.3: Considere que a distribui cao do tempo de vida de um componente pode ser aprox-imadoporumadistribui caoexponencialcommediaiguala1dia. Sabe-sequeumcomponenteesubstitudoassimquefalha,queostemposdefalhaspodemserconsideradocomoindependentes,e que o componente nao falha enquanto nao estiver em uso. Qual o tamanho do estoque necessarioparaqueoestoquesejasucientepara10diascomprobabilidade,nomnimoigual0,90.Vamos denotar por Tio tempo de falha do i-esimo componente e por T= T1+. . . +Tno tempodefalhatotal. QueremosqueP[T= T1 +. . . +Tn< 10] < 0, 10a. Distribui caoexataSabemosseTitemdistribui caoexponencialcommediaiguala1ent ao2Titemdistribui caoexpo-nencial com media igual a 2,que e uma qui-quadrado com 2 g.l. Como a soma de qui-quadrados eumaqui-quadradocomog.l. dadapelasomadosg.ls. temosque2Ttemdistribui cao2n. LogoqueremosencontrarntalqueP[2n< 20] < 0, 10Pelatabeladasdistribui coesqui-quadradostemosque2n = 30;isto e, enecessarionomnimoumestoqueden = 15componentes. Discutaasolu caoutilizandoadistribui caodePoisson.b. Distribui caoaproximadaPeloTCLtemosqueadistribui caodeTpodeseraproximadaporumanormalN(n, n). PortantoP[T< 10] = P[N(n, n) < 10] = P[N(0, 1) 0) = 1)comdensidadefY (y) =1(n/2)12n/2y(n/2)1ey/2, y> 0dizemosqueY temdistribui caoqui-quadradocomngrausdeliberdade.Nota cao: Y 2(n).TemosqueE(Y )=n, eVar(Y )=2n, fun caogeradorademomentosmY (t)=(1 2t)n/2parat < 1/2.Teorema4.1: SejaX1, . . . , Xnumaamostraaleat oriadeumadistribui caoN(, 2).Ent aoU=n

i=1(Xi)2temdistribui cao2(n).Prova: Sejamasv.a.si.i.d.Zi=Xi N(0, 1)etemosU=

ni=1Z2i . Aqualtemfun caogeradorademomentos,mU(t) = E[etU] = E[et

ni=1Z2i]= E[

i = 1netZ2i] =n

i=1E[etZ2i]mas,E[etZ2i] =_+etz2 12ez2/2dz=_+12e(1/2)(12t)z2dz=11 2t_+1 2t2e(1/2)(12t)z2dz. .=1, t < 1/2=11 2t, t < 1/2.Portanto, mU(t)=(1 2t)n/2, queeatemfun caogeradorademomentosdadistribui cao2(n). Pelaspropriedadesdafun caogeradorademomentos,temosqueU 2(n).Notas:14 oteoremaanteriornosdizqueasomadosquadradosdeknormaispadroesindependentestemdistribui caoqui-quadradocomkg.l. asomadequi-quadradosindependenteseumaqui-quadradocomograudeliberdadedadopelasomasdosgrausdeliberdade. distribui cao qui-quadrado com 2 g.l. e igual a uma distribui cao exponencial com media iguala2.Exerccio4.1: Qualarela caoentreasdistribui coesGamaequi-quadrado?Exemplo4.1: SejaX1, . . . , Xnumaamostraaleat oriadeumadistribuiccaoexponencial commedia4. Utilizeasdistribui coesGama,Poisson,qui-quadradaeoTCLparacalcularaProbabili-dadedequeamediaamostralestejaentre1.5e2.5paran=20.SeXtemdistribui caoexponencial commedia4, X/2temdistribui caoexponencial commedia2(par ametro1/2), ousejaqui-quadradocom2grausdeliberdade. Portanto, podemosutilizarosseguintesfatosparacalcularasprobabilidades.

Xi/2temdistribui caoGama(n,1/2)queeadistribui caoqui-quadradocom2ngraus deliberdade. Alemdisso, aprobabilidadedequeamediaestejanointervalo eigualaprobabilidadedequeototalestejaentre30 e50,ouseja,queavigesima ocorrencia ocorra entre 30 e 50. Pelo TCL basta lembrar que Xtem media e varianciarespectivamenteiguaisa4e6.Teorema4.2: SeZ1, Z2, . . .s aov.a.si.i.d. N(0, 1). Temos:(i)Zn N(0, 1/n);(ii)Zne

ni=1(ZiZn)2s aov.a.sindependentes;(iii)

ni=1(ZiZn)2 2(n 1).Prova: EstudarTeorema6,pagina241eTeorema8,pagina243dolivrodoMoodetal.Aplica cao: Suponha que temos X1, . . . , Xn uma amostra aleat oria de uma distribui cao N(, 2).Ent aoZi=Xi N(0, 1)epor(i)1n

Zi=1nn

i=1Xi=1n

ni=1Xin=X N(0, 1/n)Portanto,X N(, 2n).Por(ii)temosqueX en

i=1(XiX)22s aoindependentesepor(iii)n

i=1(XiX)22 2(n 1).15Nota: Estamosutilizandoofatodequecombina coeslinearesdevariaveisaleat oriasnormaisin-dependentestambemtemdistribui caonormal. Observequenemsemprecombina coeslinearesdevariaveis aleat orias normais tem distribui cao normal. Uma condi cao suciente e que a distribui caomultivariadadovetormultivariadodasvariaveistenhadistribui caonormalmultivariada.Corolario4.1: SejaS2=n

i=1(XiX)2n 1avarianciaamostral. Ent ao(n 1)S22 2(n 1).4.3 Distribui caoFdeSnedecorDeni cao4.2: SeZeumav.a. contnua,positiva(P(Z> 0) = 1)comdensidadefZ(z) =((m+n)/2)(m/2)(n/2)(m/n)m/2z(m2)/2(1 + (mz/n))(m+n)/2, z> 0dizemosqueZtemdistribui caoFdeSnedecorcommengrausdeliberdade.Nota cao: Z F(m, n).TemosqueE(Z)=n/(n 2), paran>2eVar(Z)=(2n2(m + n 2))/(m(n 2)2(n 4)),paran > 4.Teorema4.3: SeX 2(m)eY 2(n)s aov.a.sindependentesent aoF=X/mY/n F(m, n).Aplica cao: SejamX1, . . . , Xm uma amostra aleat oria N(1, 2) e Y1, . . . , Yn uma amostra aleat oriaN(2, 2)independentes. SedenimosS2X=m

i=1(XiX)2m1e S2Y=n

i=1(YiY )2n 1ent aotemosque(m1)S2X2 2(m1)e(n 1)S2Y2 2(n 1)s aoindependentes. Portanto,S2XS2Y F(m1, n 1).Notas:16 Seavariavel aleat oriaXtemdistribui caoFcommeng.l., ent ao1/Ftemdistribui caoFcomnemg.l. Se a variavel aleat oria Xtemdistribui cao Fcomme ng.l. ent ao W=mX/n1+mX/ntemdistribui caoBeta(a = m/2, b = n/2).4.4 Distribui caot-StudentDeni cao4.3: SeTeumav.a. contnuacomdensidadefT(t) =((n + 1)/2)(n/2)n[1 +t2n](n+1)/2, t RdizemosqueTtemumadistribui caotdeStudentcomngrausdeliberdade.Nota cao: T t(n).TemosE(T) = 0,sen > 1eVar(T) = n/(n 2),sen > 2.Observa cao: (t) =_0xt1exdx.Teorema4.4: SeZ N(0, 1)eU 2(n)s aov.a.sindependentes,ent aoZ_U/n t(n).Aplica cao: SejaX1, . . . , Xnumaamostraaleat oriaN(, 2),sabemosqueX /n N(0, 1)en

i=1(XiX)22 2(n 1)s aov.a.sindependentes. Portanto,T=X/n_(1/(n 1))

ni=1(XiX)22=X _1/n_(1/(n 1))

ni=1(XiX)2=X S/n t(n 1).Porexemplo,paran = 30,pelatabelatemosqyeP(T> 1.699) = 0.05eP(|X S/n| 1.699) = 0.90i.e.,P( X 1.699Sn X + 1.699Sn) = 0.90. qualquerquesejaovalorde2.Exerccio4.2: SejaX1, . . . , Xnumaamostraaleat oriadeumapopula caonormalcommediaevariancia2. Aamostraerealizadaparaseestimarovalordamedia. Nestecasopodemosdarumvalorcomoestimativadamedia,ouent aodarumintervalo.17a. Considere que a variancia seja conhecida e que o intervalo seja dado na forma ( Xa,X+a).Dadoquen=25, qual ovalordeaparaqueintervalosdestetipocontenhamovalorverdadeirodecomprobabilidadeiguala0.90?b. Suponhaagoraqueavarianciasejadesconhecidaevocedecideformarintervalosdaforma( X bS,X +bS). Encontreovalordeb.c. Encontreagoraovalordatamanhodaamostratalquenoscasosanterioresosvaloresdeaebsejamiguala0,1.d. Discutanoscasosanterioresanecessidadedasuposi caodetermosumaamostraaleat oriadeumanormal.Nota: Noexemploanterior temos oquechamamos deestimativapor intervalos deconan ca.Observeque, mesmonaoconhecendoovalorverdadeirode, intervalosconstrudosdestaformaincluem o valor verdadeiro, em media, em 90% dos casos, ou com probabilidade 0.90. Desta forma,dizemosquetemos90%deconan canointervaloconstrudo.Exerccio4.3: Emumprocessodeprodu caoodiametrodosparafusospodemserconsideradosindependentescomdistribui caonormalN(, 2). Quandooprocessoest asobcontroletemosque=10e=0, 5. Acadahora20parafusoss aoselecionadosecalculadosamediaevarianciaamostral. Estesvaloress aoutilizadosparavericarsehouveaumentodavariabilidadeouseamediasemodicou. Foramencontradososseguintesvalores x=10.5es=0.48. Nestecasoquetipodeconclus aovocetiraria?Notas: Nestecasoestamosinteressadosapenasemvericarsecertahip oteseeverdadeiraounao;eumcasotpicodetestedehip oteses, quejuntocomestima caoformamosdoisproblemasprincipaisdeinferenciaestatstica. Observe que apenas tratamos de estatsticas que s ao fun coes das medias e variancias amostrais.Mais tarde veremos que as medias e as variancias amostrais contem toda a informa cao quandoamostramosdeumapopula caonormal.Exemplo4.4: SejamZ1, Z2umaamostraaleat oriadetamanho2deumaN(0, 1)eX1, X2umaamostraaleat oriadetamanho2deumaN(1, 1). SuponhaqueosZissejamindependentesdosXis. Deasdistribui coesdasseguintesvariaveisaleat orias:a.X +Z.b. (Z1 +Z2)/_[(X2X1)2+ (Z2Z1)2]/2.c. [(X2X1)2+ (Z2Z1)2+ (Z2 +Z1)2]/2d. (X2 +X12)2/(X2X1)2.5 EstatsticasdeordemDeni cao5.1: EstatsticasdeOrdem: Considereumaamostraaleat oriaX1, . . . , Xndeumapopula caocomfun caodistribui caoF(.). ColoqueaamostraemordemcrescenteX(1) X(2) X(n)temosX(1)= min(X1, . . . , Xn),X(n)= max(X1, . . . , Xn),18X(i)= i-esimaestatsticadeordem.NotequeX(1), X(2), . . . , X(n)s aov.a.s,masnaos aoindependentes. Pois,porexemplo,P[X(1) y|X(n) y] = 1.Deni cao5.2: MedianaAmostral : Dadaumaamostraaleat oriaX1, . . . , Xnamedianaamostral edadapor:M0= X(n+12), sen e mpar12[X(n2 ) +X(n+22)], sen epar.Teorema5.1: Emumaamostraaleat oriaFX(n)(t) = P(X(n) t) = [F(t)]neFX(1)(t) = P(X(1) t) = 1 [1 F(t)]n.Prova:FX(n)(t) = P(X(n) t) = P(X1 t, . . . , Xn t)(indep) = P(X1 t) . . . P(Xn t)= [F(t)]nFX(1)(t) = P(X(1) t) = 1 P(X(1)> t)= 1 P(X1> t, . . . , Xn> t)(indep) = 1 P(X1> t) . . . P(Xn> t)= 1 [1 F(t)]n.Seasv.a.sX1, . . . , Xns aocontnuasetemdensidadeftemosfX(n)(t) = n[F(t)]n1f(t) efX(1)(t) = n[1 F(t)]n1f(t).6 DistribuicoesassintoticasUm resultado assint otico e o Teorema Central do Limite. Podemos dizer que se X1, . . . , Xne umaa.a. comE(Xi) = ,eVar(Xi) = 2. Ent aon( X ) N(0, 1).Exerccio6.1: UtilizandooMINITAB,veriqueoTeoremaCentraldoLimite.Pergunta: Existedistribui caoassint oticadamediana?Resposta: Sim!M0 N(0.5,14n[f(0.5]2)onde0.5eamedianapopulacional(F(0.5) = 0.5),feadensidadedasv.a.sXi.197 AgumasDistribuicoesdeProbabilidadeSuponha que X1, . . . , Xnseja uma amostra aleat oria de uma popula cao com distribui cao com f.d.p.f(.). Estamosinteressadosnadistribui caodamediaamostral. Nestecasopodemostrabalharcomavariavelaleat oriaXoucomavariavelaleat oriaTn= n. X. Aseguirs aoapresentadasalgumasdistribui coes,suaspropriedadeseasdistribui coesexatasdealgumasdelas.7.1 Distribui coesdiscretasa. Distribui caoUniformef(x; N) = N1I{1,2,...,N}(x)E(X) = (N+ 1)/2 V (X) = (N21)/12b. Distribui caodeBernoulli(236)f(x; p) = px(1 p)1xI{0,1}(x); 0 p 1E(X) = p V (X) = pq-Tntemdistribui caoBinomialB(n,p)dadaaseguirc. Distribui caoBinomial: B(N,p)f(x; N, p) =_Np_pk(1 p)NkI{0,...,n}(x); 0 p 1E(X) = Np V (X) = Npq-Tntemdistribui caoBinomialB(nN,p)d. Distribui caoHipergeometricaE(X) = nK/M V (X) =nKM_(M K)(M n)M(M 1)_e. Distribui caodePoisson: P()f(x; ) =exx!I{0,1,...}(x)E(X) = V (X) = -Tntemdistribui caodePoissonP(n)f. Distribui caoGeometrica: G(p)f(x; l) = px(1 p)1xI{0,1,...}(x); 0 p 1E(X) = q/p V (X) = q/p220-Tntemdistribui caoBinomialNegativaBN(r,p)g. Distribui caoBinomialNegativa: BN(r, p)f(x; r, p) =_r +x 1x_pr(1 p)xI{0,...}(x); 0 p 1E(X) = rq/p V (X) = rq/p2-Tntemdistribui caoBinomialNegativaBN(nr,p)7.2 Distribui coescontnuasaDistribui caoUniforme: U(a, b)f(x; a, b) = (b a)1I[a,b](x)E(X) = (b +a)/2 V (X) = (b a)/12fTn(t) =n1

k=01(n 1)!_tn1_n1_(t 1)n1+_n2_(t 2)n1. . . .... . . + (1)k_nk_(t k)nk_I[k,(k+1)](x)b. Distribui caoNormal: N(, 2)f(x; , 2) =122e(x)22E(X) = V (X) = 2-Tntemdistribui caoN(n, n2)eXtemdistribui caoN(, 2/n)c. Distribui caoExponencial: Exp()f(x; ) = exI[0,)(x); > 0E(X) = 1/ V (X) = 1/2 Semmem oria; Taxadefalhaconstante; Tntemdistribui caoGama(n, ); Seon umerodeocorrenciasdeumfenomenotemdistribui caodePoissonhomogeneaent aootempoentreocorrenciastemdistribui caoExponencial. SeXTeon umerodeocorrenciasnointervalo[0,T],ent aoP[XT< n] = P[Tempodan-esimaocorrencia > T] = P[Gama(n, ) > T]21d. Distribui caoGama: Gama(r, )f(x; r, ) = [(r)]1(x)r1expxI[0,)(x); r > 0, > 0E(X) = r/ V (X) = r/2-Gama(1, ) = Exp()-Tntemdistr. Gama(nr, )eXntemdistribui caoGama(nr, n)e. Distribui caoBeta: Beta(, )f(x; , ) = [B(, )]1x1(1 x)1I(0,1)(x); > 0, > 0E(X) = +V (X) =( + + 1)( +)2-Beta(1,1)=U(0,1)f. Distribui caodeCauchy: Cauchy(, )f(x; , ) =1{1 + [(x )/]2}< < , > 0F(x; , ) = 0.5 +1arctan[(x )/] naotemnenhummomentodenido, logoafun caogeratrizdemomentos naoexiste. Noentanto, afun caocaractersticasempreexiste, oqueeumadasvantagensdesetrabalharcomestasfun coescomplexas; SeX1eX2s aoiidN(0,1)ent aoX1/X2temdistr. C(0,1)g. ExponencialDuplaoudeLaplaceh. Distribui caodeWeibull: W(, )f(x; , ) = x1exI(0,)(x); > 0, > 0-W(1, )=Exp()-SeXtemdistribui caoW(, )ent aoWtemdistribui caoExp().-TaxadefalhaZ(t) = t18 AlgunsteoremasimportantesTeorema8.1: DesigualdadedeJensen: SejaXumavariavel aleat oriaeg(.) umafun caoconvexa;ent aoE[g(X)] g(E[X]).Teorema8.2: SeX1, . . . , Xns aovariaveis aleat orias independentes eseg1(.), . . . , gk(.) s aokfun coestaisqueYj= gj(Xj), j= 1, . . . , ks aovariaveisaleat orias,ent aoY1, . . . , Yks aoindepen-dentes.Teorema8.3Seja(X,Y)umavariavel aleat oriabi-dimensional; ent aoE[g(Y)] =E[E[g(Y)/X]].Emparticular22E[Y ] = E[E[Y |X]]; e(p.159) V ar[Y ] = E[V ar[Y |X]] +V ar[E[Y |X]].Teorema8.4: Seja(X,Y)umavariavel aleat oriabi-dimensional eg1(.)eg2(.)fun coesdeumavariavel. Ent aoE[g1(Y ) +g2(Y )|X= x] = E[g1(Y )|X= x] +E[g2(Y )|X= x],E[g1(Y )g2(X)|X= x] = g2(x)E[g1(Y )|X= x].Teorema8.5: SejamXumavariavelaleat oriacontnuacomf.d.p. fX(.)e = {x : fX(x) > 0}.Assumaquei)y=g(x)deneumatransforma caoumaumdeemD.ii)Aderivadadex = g1(y)comrespeitoaysejacontnuaenaozeroparay D.Ent aoY=g(X) eumavariavelaleat oriacontnuacomf.d.p.fY (y) = |ddyg1(y)|fX[g1(y)]ID(y).Teorema 8.6: Se Xe umavariavel aleat oriacomfun caodistribui caocontnuaFX(x), ent aoU= FX(X) e uniformemente distrbuido sobre o intervalo (0,1). Conversamente, se U e uniforme-mentedistribudosobreointervalo(0,1)ent aoX= F1X(U)temfun caodistribui caoFX(.).Teorema8.7: Sejam X1e X2variaveis aleat orias conjuntamente contnuas com fun cao densidadef(X1,X2)(x1, x2). Seja = {(x1, x2) : f(X1,X2)(x1, x2) > 0}. Assumaque(i) y1= g1(x1, x2) e y2= g2(x1, x2) dene uma transforma cao 1-1 de em D; onde D e o conjuntodepontos(y1, y2)paraosquaisexistem(x1, x2) taisque(y1, y2) = (g1(x1, x2), g2(x1, x2)).(ii)Asprimeirasderivadasdex1= g11(y1, y2)ex2= g12(y1, y2)s aocontnuasemD.(iii)OJacobianodatransforma cao enaozeropara(y1, y2) D.Ent aoadensidadeconjuntadeY1= g1(X1, X2)eY2= g2(X1, X2) edadapor:f(Y1,Y2)(y1, y2) = |J|f(X1,X2)(g11(y1, y2), g12(y1, y2))ID(y1, y2).Esteteoremapodesergeneralizadoparaumvetordequalquerdimensao.Exemplo8.1: Considereumaamostraaleat oriadeumauniformeU(0,1). Encontreaf.d.p. deX1 +X2edeX1 +X2 +X3utilizandooteoremaanterior.Paran=2considereatransforma caoy = x1 +x2,z = x1,quetemaseguinteinversa:x2= y z,x1= z.23Comoaf.d.p. conjuntadavariavel aleat oria(X1, X2)eumauniformeeoJacobianoigual a1temosqueaf.d.p. conjuntadavariavelaleat oria(Y, Z) edadaporf(Y,Z)(y, z) = IA(y, z),onde A = {(y, z); 0 z 1, z y z + 1}eaf.d.p. marginaldeY edadaporfY (y) =_ _yz=0 1dz= y, se0 y 1_1z=y1 1dz= 2 y, se1 < y 2Para o caso da soma de 3 uniformes tanto podemos encontrar a f.d.p. utilizando a soma Y+X3comopodemosaplicaroteoremadiretamenteutilizandoumatransforma caoadequada. Comoaprimeira abordagem e semelhante ao caso anterior vamos utilizar a segunda abordagem. Considereoseguintesistemadetransforma coes:y = x1 +x2 +x3,z = x1,w = x2.E facil encontrar a inversa e vericar que o Jacobiano e igual a 1. Logo a f.d.p. conjunta da variavelaleat oria(Y, Z, W) edadapor:f(Y,Z,W)(y, z, w) = IA(y, z, w),onde A = {(y, z, w); 0 z 1, 0 z 1, z +w y z +w + 1}eaf.d.p. marginaldeY edadapelaintegralemzew. Isto e:Para0 Y 1fY (y) =_yz=0(_yzw=01dw)dz=_yz=0(y z)dz= y2/2.Para1 Y 2fY (y) =_y1z=0(_1w=yz11dw)dz +_1z=y+1(_yzw=01dw)dz=_y1z=0(2 y +z)dz +_1z=y+1(y z)dz= y2+ 3y 1.5,ondeaprimeiraparcela epara(y z) > 1,isto ez< (y 1),enquantoasegundaparcela eparay z< 1,isto ez> y 1.Para2 Y 3fY (y) =_1z=y2(_1w=y1z1dw)dz=_1z=y2(2 +z y)dz= y2/2 3y + 4.5.Exerccio8.1: SejamX1eX2variaveisaleat oriasindependentescomdistribui coesGamacompar ametros (n1, ) e (n2, ), respectivamente. Mostre que adistribui caodavariavel aleat oriaY1= X1/(X1 +X2)temdistribui caoBeta(n1, n2),eque eindependentede(X1 +X2). Utilizeastranforma coesY1= X1/(X1 +X2)eY2= X1 +X224Cap. 2-Estima caoParametricaPontual1 IntroducaoAssumaquealgumacaractersticadeinteressedoselementosdeumapopula caoamostradapossaserrepresentadaporumav.a. X, cujadensidade(oufun caodeprobabilidade)ef(, ), ondeaformadadensidadeeassumidaserconhecida, excetoporumpar ametrodesconhecido. Nestasitua caovamosconsiderarquetomamosumaamostradetamanhondeX(emgeral temosumaamostra aleat oria, i.e. X1, . . . , Xne i.i.d. com densidade f(, )). Com base nos valores observadosx1, . . . , xn,deseja-seumbomchutedovaloroudeumafun cao().Exemplo1.1:E razo avel supor que o n umero de clientes que v ao ao Banespa no hor ario das 12 ` as14heumav.a. Poissoncommedia(desconhecida). Amdedimensionaron umerodepessoas(caixas), quedevemtrabalharnessehor ario, observamosomovimentodobancodurante10dias.Baseadonessasobserva coesdesejamosestimareaprobabilidadedequeemumintervalode15minutoscompare campelomenos10clientes.Exemplo1.2: Um partido poltico realiza pesquisas periodicamente para acompanhar a popular-idadedopartidoentreoseleitores. Emcadapesquisaprocura-seestimarapropor caodeeleitoresqueaprovamasatividadesdopartido.Aestima caodeumpar ametrodeinteressepodeserfeitadeduasformas:(i) Estima caoPontual: Tomamos o valor de alguma estatstica T(X1, . . . , Xn) para representar,ouestimar,(). Talestimativa echamadaestimativapontual;(ii) Estima cao por intervalo: Denimos duas estatsticas T1(X1, . . . , Xn) e T2(X1, . . . , Xn) ondeT1(X1, . . . , Xn) < T2(X1, . . . , Xn)de modo que [T1(X1, . . . , Xn), T2(X1, . . . , Xn)] constitui umintervalo aleat orio para o qual epossvel secalcular aprobabilidadequeesteintervalocontenha(). Esteintervaloaleat orio,bemcomoointervaloobtidopelasubstitui caodosvaloresobservadoss aochamadosdeintervalosdeconan ca.Exemplo1.3: Sequeremosdescobriramassadeumobjetoequeremosterumaideiadacon-an canoresultadopodemos pesar oobjetonvezes; chame os resultados de X1, . . . , Xn.Erazo avel supor que Xi N(, 2), onde e o valor procurado e = (, 2) e o vetor de par ametrosdesconhecidos. Estamosinteressadosemestimar() = .AestatsticaX=1nn

i=1Xieumestimadorpontualparae_X 2_S2n;X + 2_S2n_eumintervalodeconan capara. Assimcomoexisteumn umeroincont avel deestimadorespontuaisexisteumumn umeroincont aveldeestimadoresporintervalo. Temosent aoosseguintesproblemas:25 Comoencontrarumbomestimador? Comoselecionaromelhorestimador?2 MetodosparaseencontrarestimadoresAssumaqueX1, . . . , Xneumaamostracomfun caodistribui caoFX(, ) ( nocasodeamostraaleat oria,deumapopula caocomfun cao(densidade)deprobabilidadef(, ))e= (1, . . . , k) eumvetorden umerosreais(podemosterk = 1).Deni cao1.1: Espa coParametrico: Oconjuntodevalorespossveisquepodeassumirechamadodeespa coparametrico,egeralmente edenotadopor.Objetivo: Queremos,apartirdasinforma coesdaamostraestimaralgumafun caodeFX(, )ouf(, ). Estafun caoefun caode,denoteapor(). Aestima caoerealizadaatravesdefun coesdaamostraquenaopodemdependerdevaloresdesconhecidos. Estasfun coesforamdenidasan-teriormentecomoEstatstica. Logo,Deni cao1.2: Estimador: Qualquerestatsticacujosvaloress aousadosparaestimar()editaserumestimadorde().Exemplo 1.4: Suponhaque os pesos dos frangos de umcertogalp aopossamser considera-doscomotendodistribui caoaproximadamentenormal. Podemosestarinteressadosemestimaropesomediodos frangos, avarianciaouapropor caodefrangos acimadeumpesoP0. Casonfrangossejamescolhidosaleatoriamente, chamandodeXiopesodoi-esimofrango, podemosconsiderarX1, . . . , Xni.i.d. N(, 2). Temoscomopar ametro= (, 2)eoespa coparametrico = {(, 2); > 0, 2> 0}. Neste caso, as fun coes () seriam iguais a , 2e P[N(, 2) > P0],respectivamente. Comoestimadorespodemos, porexemplo, utilizarXparaestimar, S2paraestimar2eP[N( X, S2) > P0]paraestimarapropor cao.2.1 MetododosmomentosEstemetodo eomaisantigo,propostoporKarlPearsonem1894. Este eummetodosimplesqueproduzresultadosrazo aveisnamaioriadoscasos. Iremosconsiderarquetemosumsamostra(naonecessariamentealeat oria)detamanhon, istoe, X1, , Xn, etal queXi, i=1, ntemdistribui caof(, 1, . . . , k). SejaXumav.a. comdistribui caof(, ). Denar= E[Xr]or-esimomomentodeX. Emgeral, refun caode1, . . . , k. SejaX1, . . . , Xnumaamostradef(, )edenoteMr=1nn

i=1Xrior-esimomomentoamostral. SabemosqueE[Mr] = r(1, . . . , k),26da eintuitivoutilizarosvaloresdeMr= r( 1, . . . ,k)paraestimarospar ametros.Existemv ariasformasdedenirestesestimadores; come caremospelosmaissimples, ques aoutilizadosnostextosmaisintrodut orios.Deni cao1.3.a: O estimador pelo metodo dos momentos (EMM) de , denotado por (1, . . . , k)edadapelasolu caodosistemadeequa coes:Mi= i(1, , k), i = 1, , k,isto e,iguala-seoskprimeirosmomentosamostraisaoskprimeirosmomentospopulacionais.Estadeni caotemavantagemdelevar,quasesempre,aumasolu cao unica. Noentanto,nemsemprelevaaumasolu cao. Porexemplo, tomeumaamostraaleat oriadeumapopula caonor-mal commediaconhecida, ondeopar ametrodesconhecidoeavariancia, ouent aoadistribui caoexponencialdupla. Paraevitaroproblemadenaolevaranenhumestimadorpode-segeneralizaradeni caoescolhendo-sedeformaadequadakmomentosamostraisepopulacionaisparaseremigualados. Adeni caocaDeni cao1.3.b: Um estimador pelo metodo dos momentos e qualquer solu cao de um sistema deequa coesdadoporMi= i(1, , k), i I, I= {ii1, , iik}paraumaescolhaadequadadeformaquesetenhaumasolu cao unica.Emgeral procura-seutilizarosmomentosdemaisbaixaordem. Istosedeveaofatodosmo-mentos amostrais com menor ordem terem menor variabilidade e serem menos afetados por valoresaberrantes. Dadaaliberdadedeescolhadosmomentosutilizadosestadeni caonaoproduzumestimador unico.Exemplo1.5: SejaX1, . . . , Xnumaa.a. deumadistribui caoN(, 2). Nestecaso,1= , 2= 221.Da,utilizando-seosdoisprimeirosmomentostemos:M1= , M2= 2+ 2,cujasolu cao e: = M1=X e =_M2M21=_

(XiX)2n.Exemplo1.6: Seja X1, . . . , Xnuma a.a. de uma Poisson(). Queremos estimar pelo metodo demomentos. Como temos somente um par ametro, uma equa cao e suciente. Por exemplo, tomandooprimeiromomentotemos:M1=X=.Exemplo1.7: SejaX1, . . . , Xnumaa.a. deumaexp(). Lembre-seque1=1/. Queremosestimarpelometododemomentos. Comoantestemossomenteumpar ametro. Tomando-seoprimeiromomentotemos:M1=X= 1/ =1X.27Veriqueasolu caocasofosseescolhidoosegundomomento.Exemplo1.8: SejamX1, . . . , Xni.i.d. U[a, b], ondeopar ametrodeinteressee(1, 2)=(a, b).Nestecaso,1=a +b2, 2=a2+ab +b23.Assim,umestimadorpelometododosmomentos edadopelasolu caode:M1= 1= a +b2, M2= a2+ ab +b23.Exemplo1.9: SejamX1, . . . , Xni.i.d. U[0, ],opar ametrodeinteresse e. Nestecaso,1=2 = 2 X.Suponhaquex1= 4, x2= 6, x3= 50eassim x = 20. Assim, = 40.Esteeumresultadoabsurdopois sabemos que 50=x(n); ouseja, ometododos mo-mentospodeproduzirpessimasestimativas. Umestimadormelhorseria, porexemplo, T(X)=max(X(n), 2X).Deni cao1.3.c: Suponha que queremos estimar = () e que ela possa ser expressa como umafun caocontnuadosrprimeirosmomentospopulacionais,isto e,que() = g(1, , r).Nestecasodizemosqueumestimadordepelometododosmomentos edadoporT(X) = g(M1(X), , Mr(X))Exemplo1.10: Considereumaamostraaleat oriadetamanhondeumaPoissoncommedia.Dealgunsestimadorespelometododosmomentos.Sabemosque1=, 2= + 2. Logo, algunsdosestimadorespelometododosmomentos aodadospor = 1 = M1 = 221 = M2M21 = 2/11 = M2/M11.Notequenaoeespecicadoquerdeveseromnimovalorparaaqual existeumafun caog.Casoistofosseespecicadonoexemploanteriorteramosum unicoestimadorpelometododosmomentos. Noentanto,aunicidadenaoestariagarantidamesmotendoestarestri cao.Exemplo 1.11: Considere uma amostra aleat oria de tamanho n de uma uma distribui cao logstica,isto e,dadensidade:f(x; ) =e(y){1 +e(y)}2.28Como a esperan ca existe ele e igual ao ponto de simetria, isto e, . Logo um estimador pelo metododosmomentosedadopelamediaamostral. Esteeumcasotpicoondeaestimativapelometododosmomentos efacilmenteencontrado,masnaoodemaximaverossimilhan ca(seradenidomaistarde), quenaotemsolu caoanaltica. Nestecaso, aestimativapelometododosmomentospodeserutilizadacomopontoinicial emumarotinademaximiza caoparaencontraraestimativademaximaverossimilhan ca.*Deni cao1.3.d- Metododos Momentos Generalizados: Vamos considerar agoraquetemos umaamostraX, comf.d.p. f(x|). Aamostrapode ser aleat oriaounao. Considereadicionalmente que temos fun coes gi(X, ) com media igual a zero. Desta forma, dada uma amostragostaramos que gi(x, ) fosse o mais proximo possvel de zero. Se considerarmos mais fun coes g doqueadimesaodenaoconseguiremosfazerestadistanciaigualazero. Ometododosmomentosgeneralizadosdizquequalquervalordequeminimizaadistancia:g(x, )S(x, x)1g(x, )ondeg(x, )=(g1(x, ), , gk(x, )),eumestimadorpelometododosmomentos. S(x, x)desertalqueconvirjaemprobabilidadeparaumvalornaoaleat orioS0quandootamanhodaamostravaiparainnito. Emgeralescolhe-seS(x, x)umamatrizsimetricapositivadenida.Observequesetomarmosgi(x, )=mi i(), i=1, , keamatrizSigual aidentidadetemosaDeni cao1.3.adeestimadordometododosmomentos. Emnenhumadasdeni coesometododosmomentoseinvarianteemrela caoatransforma coesnaolineares. Porexemplocon-sidere uma amostra aleat oria de uma U(0, ). Neste caso vimos que um estimador pelo metodo dosmomentos e2X. Procureagoraoestimadorpelometododosmomentossevocetivesseobservadooquadradodasobserva coesetrabalhassecomadistribui caodoquadradodaU(0, ).Exerccio1.1: Nosexemplosanterioresprocureoutrosestimadorespelometododosmomentos.2.2 MetododemaximaverossimilhancaOmetododemaximaverossimilhan caparagerarestimadoresdeumpar ametrodesconhecidofoiintroduzidoporSirR.A.Fisher.Estemetodogeralmenteproduzmuitobonsestimadores. Veremosmaistardeasboaspro-priedadesdosestimadoresdemaximaverossimilhan caealgunsexemplosondeometodoproduzpessimosestimadores.Considereoseguinteproblema: temosduasmoedas, umaehonestaeaoutraeviciada(temprobabilidadedecaraiguala0.70). Oproblema equemisturamosasduasmoedase naosabemosdiferencia-las. Paradecidiristo,tomamosumadasmoedasejogamosnvezes. Seja:X=n umerodecarasnasnrepeti coes;Da,X b(n, p),isto e:P(X= k) =_nk_pk(1 p)nk= f(k, n)Aqui,p = 0.5oup = 0.7,isto e, = {.5; .7}. Sen = 3,temos29ValoresPossveisk 0 1 2 3f(k;0.5) 0.125 0.375 0.375 0.125f(k;0.7) 0.027 0.189 0.441 0.343Note que se tiramos 3 caras em 3 lan camentosda moeda nao acreditamosmuito que p = 0.5, emaisverossmilquep = 0.7. Poroutrolado,setirassemos0carasem3lan camentosp = 0.5seriamaisverossmil, emboraaprobabilidadedesairesteresultadoaindasejabaixa. Oqueimporta,portanto,s aoosvaloresrelativos.Nestecaso,Setiramos0ou1caradizemosque p = 0.5;Setiramos2ou3carasdizemosque p = 0.7Isto e,escolhemos pquefazcomquef(k, p)sejamaximo: p = arg maxpf(k, p).Daformageral,paraumtamanhodeamostrane = [0, 1]temosf(k; p) = P(X= k) =_nk_pk(1 p)nk.Queremos p = arg maxpf(k; p),paratantoderivamosf(k; p),igualamosaderivadaazeroeprocuramosospontoscrticosnointervaloparamtrico.ddpf(k; p) =_nk_kpk1(1 p)nk_nk_pk(n k)(1 p)nk1=_nk_pk1(1 p)nk1[k(1 p) (n k)p]=_nk_pk1(1 p)nk1[k np].Igualando a zero e resolvendo a equa cao temos como razes os pontos 0, 1 e k/n. Se 0 < k < n,analisandoasegundaderivadanestespontostemosque0e1s aopontosdemnimo. Analiseafun caodeverossimilhanaquandokeigual azerooun. Vocevericar aqueemtodososcasosasolu caodepontodemaximopodeserescritacomo p=k/n. Portanto, oestimadordemaximaverossimilhan ca e: p =Kn .Deni cao1.4: Fun caodeVerossimilhan ca:Seja X1, . . . , Xnuma amostra de uma variavel aleat oria discreta (contnua) Xe que a fun cao (den-sidade) de probabilidade conjunta e dada por fX(, ), que depende de um par ametro desconhecido. Sex1, . . . , xns aoosvaloresobservados,afun caodeverossimilhan cadaamostra eL(; x1, . . . , xn) = fX(x1, . . . xn, ), .No caso de uma amostra aleat oria de uma popula cao com fun cao (densidade) de probabilidadef(., )afun caodeverossimilhan ca dadapor:L(; x1, . . . , xn) = f(x1, ) . . . f(xn, ), .30Deni cao1.5: Estimador de Maxima Verossimilhan ca: SejaL() =L(; x1, . . . , xn) afun caodeverossimilhan caparaasv.a.sX1, . . . , Xn. Se=(x1, . . . , xn)eumafun caodasob-serva coes e e o valor de no espa co parametrico que maximiza L(), ent ao = arg maxL()eaestimativademaximaverossimilhan cadee=(X1, . . . , Xn)eoestimador demaximaverossimilhan cade.Antesdeolharalgunsexemplos, vamosrelembrarumteoremadecalculoqueemuito util paraencontrarmaximosdefun coes. Geralmente,comoL() eum produto de fun coesde probabilidadeoudensidades, esemprepositiva. Assim,l() = log(L())semprepodeserdenidaeovalordeque maximiza L() tambem maximiza l(). Observa que no caso de termos uma amostra aleat oriaoprodutodasdensidadestransforma-senasomadalog-densidadeaoaplicarmosatranforma caologaritmica.Exemplo1.12: Suponha que retiramos uma amostra aleat oria de tamanho n de uma distribui caodeBernoullif(x, p) = px(1 p)1xI{0,1}(x), 0 p 1.Osvaloresamostraisx1, . . . , xnseraoumaseq uenciade0se1seafun caodeverossimilhan cae:L(p) =n

i=1pxi(1 p)1xiI{0,1}(xi) = p

xi(1 p)n

xi.Podemosdenir,l(p) =

xi log(p) + (n

xi) log(1 p).Comoleumafun caocontnuaediferenciaveldep,seexistirumvalor( p)talqueddpl( p) = 0,d2dp2l( p) < 0ent aoestevalormaximizaafun caol:ddpl(p) =

xipn

xi1 pAssim,

xi pn

xi1 p= 0.Para

xidiferentesdezeroentemos, p =

xin.Como,d2dp2=

xipn

xi1 p< 0para todos os valores de p temos que p corresponde a um ponto de maximo. Portanto, o estimadordemaximaverossimilhan cadee:P=

Xin.Discuta, deformaanalogaarealizadanoExemplodabinomial quandotemos

xiigual azero ou n. Note que,se o espa co parametrico for (0, 1) o estimador de maxima verossimilhana naoexistequando

xiigualazerooun.31Exemplo1.13: Suponha que retiramos uma amostra aleat oria de tamanho n de uma distribui caonormal com media e variancia 1. Se X1, . . . , Xn e a amostra aleat oria, a fun cao de verossimilhan cadaamostra e:L() =n

i=1f(xi, ) =n

i=112e(xi)2/2= (2)n/2exp[

(xi)2/2]cujologaritmo e:l() = n2log(2)

(xi)22eddl() =

(xi) =

xind2d2l() = n < 0.Assim, =1n

xi= xeaestimativademaximaverossimilhan cadeeoestimadordemaximaverossimilhan ca e: =

Xin=X.Seafun caodeverossimilhan cacontemkpar ametros,isto e,se:L(1, . . . , k) =n

i=1f(xi; 1, . . . , k),ent aoosestimadoresdemaximaverossimilhan cas aoasestatsticas1(X1, . . . , Xn), . . . , k(X1, . . . , Xn) onde 1, . . . , k s ao os valores em que maximizamL(1, . . . , k).Secertascondi coesderegularidades aosatisfeitas,opontoondeafun caodeverossimilhan ca emaxima easolu caodaskequa coes:1L(1, . . . , k) = 0, . . . ,kL(1, . . . , k) = 0ouequivalentemente,1l(1, . . . , k) = 0, . . . ,kl(1, . . . , k) = 0.Exemplo1.14: Uma amostra aleat oria de tamanho n da distribui cao normal de media e desviopadraotemdensidade:f(x1, . . . , xn, , 2) =n

i=112e122 (xi)2eL(, 2) = (22)n/2exp{122

(xi)2},seulogaritmosendo:l(, 2) = n2log(2) n2log 2122

(xi)2,32onde = {(, 2); < < , 2> 0}. Portanto,l(, 2) =12

(xi)2l(, 2) = n212+124

(xi)2.Da,1 2

(xi ) = 0

(xi ) = 0 =

xinn21 2+12 4

(xi )2= 0 2=n

i=1(xi x)2neosestimadoresdemaximaverossimilhan cas ao: =

Xine 2=n

i=1(XiX)2n.Exemplo1.15: Sejaumavariavelaleat oriatendodensidadeuniformedadapor:f(x, ) = I[0.5;+0.5](x),onde=(, ). Afun caodeverossimilhan caparaumaamostraaleat oriadetamanhonedadapor:L() =n

i=1I[0.5;+0.5](xi)= I[x(n)0.5;x(1)+0.5](),ondex(1)= min{x1, . . . , xn}ex(n)= max{x1, . . . , xn}etemosa ultimaigualdadepoisn

i=1I[0.5;+0.5](xi) = 1 xi [ 0.5; + 0.5], paratodoi = 1, . . . , n 0.5 x(1)e + 0.5 x(n) x(1) + 0.5e x(n)0.5Da,L() =_1, sex(n)0.5 x(1) + 0.50, casocontrario.Assim, qualquerestatsticacomvalorsatisfazendoX(n) 0.5 X(1) + 0.5eestimadordemaximaverossimilhan cade. Porexemplo, X(n) 0.5, X(1) + 0.5ou(X(1) + X(n))/2, etc...;ouseja,oestimadordemaximaverossimilhan canestecasonao e unico.Exemplo1.16: SejaXumavariavel aleat oriacomdensidadeuniformenointervalo[0, ]. En-contreoEMVde.f(x, ) =1I[0;](x)33onde = (0, ). Afun caodeverossimilhan caparaumaamostraaleat oriadetamanhonedadapor:L() =n

i=1f(xi, )=n

i=11I[0;](xi)= nI[0;](x(n))= nI[x(n);](),ondex(n)= max{x1, . . . , xn}. Da,L() =_n, sex(n) 0, casocontrario;ouseja, L()=0para 0e/2, set = 0.Seovalordaobserva caoforigual azeroent aoaverossimilhan caeigual ae/2queemaxi-mizadoquando=0. Casoaobserva caosejaumvalort>0ent aooEMVedadopelasolu cao unicadaequa cao:df(t)d=

k=1(/2)k1(t/2)k(k 1)!(k 1)!_1 2k_= 0vemos queparaparaqualquer valor det >0aderivadaseranegativapara 0]?Exerccio 1.4: Se X Geom(p) qual o EMV de V ar(X) baseado em uma amostra de tamanho n?Exerccio1.5: SeX Exp()qualoEMVdeP[X> t0]baseadoemumaamostraaleat oriadenobserva coes?Exerccio1.6: Considereumapopula caocomtrestiposdeelementosdenominados1,2e3queocorremcomapropor caodeHardy-Weinberg;i.ep(1, ) = 2, p(2, ) = 2(1 ), p(3, ) = (1 )2onde0 0. MostrequeaestatsticaT(X) = (2)Xeumestimadornaoviciadode() = e3.E(T) =

x=0(2)xxex!= e

x=0(2)xx!= ee2= e3.Esteestimador eridculoporqueassumevaloresnegativosquandoovalorobservado e mpar. Porexemplo,se o valor observado for 10 temos uma estimativa igual a 1024 enquanto se o valor obser-vadofor11aestimativa eiguala 2048,oque eridculo. Opior eque,comoveremosmaistardenoExemplo3.19,ele eo unicoestimadornaoviciadodee3.Exemplo2.4: Considere X1, . . . , Xnfun coes indicadoras de n ensaios de Bernoulli independentescomprobabilidadedesucesso. Javimosqueestemodelopodeserutilizadoemv ariassitua coes.Afun cao()=/(1 )echamadaderiscorelativoebastanteutilizadoembioestatsticaeepidemiologia. Mostrequenaoexisteumestimadornaoviciadoparaoriscorelativo.Ospossveisresultadosdoexperimentos aoas2ndistintascombina coesdezeroseuns. Qualquerestatstica Tdene um valor real tjpara cada um dos pontos do espa co amostral, onde j= 1, . . . , 2nenumeraosresultadospossveis. Paraestaestatsticageralaesperan ca edadapor:E(T) =2n

j=1tjnj(1 )nnj,onde nje o n umero de sucessos obtidos no j-esimo ponto do espa co amostral. Para que Tseja naoviciadoprecisamosteraseguintecondi cao:2n

j=1tjnj(1 )n nj=1 paratodo (0, 1)Estaigualdadenosdizqueumpolin omioemdeordem2ndeveseriguala/(1 )paratodoemumintervalo. Claramenteistonaopodeocorrere,portanto,naopodemosterumestimadornaoviciadoparaoriscorelativo.Osdoisexemplosanterioresmostramquenemsemprepodemos,ou edesejavel,nosrestringir-mosaosestimadoresnaoviciados.373.1 ErroQuadraticoMedioNem sempre um estimador viciado e ruim`As vezes, o que perdemos por ter um vcio pequeno podeser compensado pela concentra cao em torno do valor verdadeiro. De alguma forma temos que com-binarosdoisfatoresmencionadosanteriormente: E()pr oximadeeVar()pr oximade0.Istopodeserobtidoatravesdeumamedidamuito util deproximidadechamadaerroquadr aticomedio(EQM).Deni cao2.3: ErroQuadraticoMedio: Seja =(X1, . . . , Xn) um estimador de baseadoemumaamostraX1, . . . , Xn. Oerroquadraticomedio(EQM)de e:EQM(, ) = E[( )2].Obs.: Para uma amostra aleat oria de uma popula cao com distribui cao dada pela fun cao densidadedeprobabilidadef(, ),E[( )2] =_. . ._[( (x1, . . . , xn) )2]f(x1, ) . . . f(xn, )dx1. . . dxn.ComoEQM(, ) =Var + [ E]2ent aoseenaoviciado, EQM(, ) =Var()eEQM(, )podeserpensadocomoumamedidadeespalhamentodeemtornode.SeformoscompararestimadoresbaseadosemseusEQM,naturalmenteiremospreferiraquelecommenor EQM. Geralmente, EQMdependede(par ametrodesconhecido) enaotemos umestimadorcomEQMuniformementemenor. Emgeral,comodadonoExemplo2.5se A1emelhordoque2emtermosdeEQM;se B2emelhordoque1;enaregi aocomplementarosdoisestimadorestemomesmoEQM.Destaforma,naotemosbaseparaescolherumestimadoremdetrimentodooutroutilizandoocriteriodoEQM.Exemplo2.5: SejamX1, X2, . . . , Xni.i.d. expcomtaxadefalha. ConsidereT1= (n

i=1Xi)/neT2=n

i=1aiXi,onde

ni=1ai=1, estimadoresde()=1/, amediapopulacional. Portanto, T1eT2s aoesti-madoresnaoviciadode().CalculeEQM(T1, )eEQM(T2, )everiquesepreferimosT1ouT2combasenestecriterio.ComoT1eT2s aonaoviciadostemosqueEQM(T1, ) = Var(1nn

i=1Xi)=1n2Var(n

i=1Xi)=1nVar(X1) =1n238eEQM(T2, ) = Var(n

i=1aiXi)=n

i=1a2iVar(Xi)=12n

i=1a2iDa, EQM(T1, ) EQM(T2, )se(1/n) ni=1a2i. Masmin

ni=1a2isujeitoa

ni=1ai=1ocorrequandoai= 1/nparatodoi = 1, . . . , n. Portanto,T1esempremelhorqueT2.Exemplo2.6: SejamX1, X2, . . . , Xni.i.d. Poisson(). SejamT1= 1eT2=Xdoisestimadoresde. Da,EQM(T1, ) = E(1 )2= (1 )2EQM(T2, ) = E( X )2= Var( X) = /nVamossuporquen = 2,assim,etemosquese: Se [1/2; 2]temosT1prefervelaT2; Se [1/2; 2]temosT2prefervelaT1. Mas,em = 1,EQM(T1, 1) = 0 < EQM(T, 1)paraqualquerestimadorT = 1de. Assim,quando = 1 o estimador T1= 1 sera prefervel a qualquer estimador. Assim vemos que naoexisteumestimadordequepossaseromelhorquequalqueroutroestimador, emtodooespa coparametrico,considerando-seocriteriodeEQM.Oproblemade encontrar umestimador que tenhauniformemente omenor EQMnaotemsolu cao (uniformemente signica para qualquer valor do par ametro pertencente ao espa co parametrico).Javimos queopiorestimador possvel, temumEQMdezeroparaumvalor particular dopar ametro. Istoocorreporqueestamosprocurandoestimadoresnumaclassemuitoampla. Al-gumasvezespode-seencontrarestimadorescommnimavariancianaclassedosestimadoresnao39viciados(vejaENVUMV); masexcetopelofatodequenestaclasseoproblemademinimalidadedeEQMtemsolu cao, arestri caoaestimadoresnaoviciadosalgumasvezesexcluemestimadoresques aobons.Exemplo2.7: Javimosquesetemosumaamostraaleat oriadeumadistribui caoN(, 2), oestimadordemaximaverossimilhan cade2e 2= (1/n)

(XiX)2eE[ 2] = 2(1 1n).Portanto, 2temumpequenovcio. Seuerroquadr aticomedio e:EQM( 2; , 2) = Var( 2) + (E( 2) 2)2=24(n 1)n2+ (2n)2=2n 1n24.Umestimadornaoviciadode2eS2=(n 1)1

(XiX)2(avarianciaamostral)eseuEQM e:EQM(S2; , 2) = Var(S2)=1(n 1)22(n 1)4=24n 1>2n 1n24.Portanto, nestecaso, oestimador naoviciadotemumEQMmaior queumestimador umpoucoviciado.Apesardedependerdepar ametrosdesconhecidosoEQM e utilnaEstatstica. Emparticular,quandoestamosestudandoaperformancedosestimadoresparagrandesamostras. Nestecaso,gostaramosdeterestimadorescujosEQMssejamproximosazeroquandootamanhoamostralcresce.3.2 ConsistenciaUmestimador,emgeral,dependedotamanhodaamostra. Porexemplo,osmomentosamostraisdependem de n e s ao denidos para todos os tamanhos amostrais, e.g.,Xn= (1/n)

ni=1Xi. Assimtemosumaseq uenciadeestimadoresnquedependemdotamanhodaamostra.Eintuitivodese-jarquequantomaioraamostramelhorsejaonossoestimador;assimumbomestimadorntemEQMquedecrescea0quantomaiselementoscontiveraamostra, daadeni caodeconsistenciaemmediaquadr atica.Deni cao 2.4: Estimador Consistente emMedia Quadratica: Umaseq uenciade esti-madores {n} editaserconsistenteemmediaquadraticaseaseguintecondi caoocorre:limnEQM(n, ) =limnE(n)2= 0.Notequeacondi caoeverdadeirase,esomentese,ovciodoestimadoreavarianciadoesti-madortendea0quandon . Umaoutracondi caoumpoucomaisfraca edadapeladeni cao40seguinte.Teorema2.1: Seumaseq uenciadeestimadoreseConsistenteemmediaquadraticaent aoelaeconsistente(convergenciaemprobabilidade),masoinversonao enecessariamenteverdadeiro.Prova: Seja {n}umaseq uenciadeestimadoresde.P[|n| < ] = P[|n|2< 2](peladesigualdadedeChebyshev) 1 E[(n)2]2.Como {n}econsistenteemmediaquadr aticatemosqueE[(n)2]vaiparazeroquandontendeaoinnito. LogolimnP(|n| ) = 0, paratodo > 0Paramostrarqueocontrarionaoenecessariamenteverdadeirobastadarumcontra-exemplo.Vejaoexemplo5.15dolivrodeRomanoeSiegel(CounterexamplesinProbabilityandStatistics).Exemplo2.8: OsmomentosamostraisMn,k=(1/n)

ni=1Xkis aoestimadoresconsistentesemmediaquadr aticadoscorrespondentesmomentospopulacionaiskquandoke2kforemnitos.Bastamostrarqueosestimadoress aonaoviciadosequesuavarianciatendeazero.E(Mn,k) = E(1nn

i=1Xki )=1nn

i=1E(Xki ) = k.Portanto,ovcio ezero. Maisainda,Var(Mn,k) = Var(1nn

i=1Xki )=1n2n

i=1Var(Xki )=1nVar(Xk1) =2k2kn0quando n 0. Em particular,Xe um estimadorconsistente de e 2e estimadorconsistente de2. Avarianciaamostraltambem eumestimadorconsistentede2(porque?).3.3 NormalidadeAssintoticaNovamentevamosconsiderarumasequenciadeestimadoresndopar ametrodesconhecido.Deni cao2.5: Melhor Seq uencia Assintoticamente Normal: Umasequenciade esti-madoresndeedenidacomosendoamelhorsequenciaassintoticamentenormal(bestasymptoticallynormal,BAN)se,esomentese,as3condi coesabaixos aosatisfeitas:41 (i) n(n) N(0, 2()),quandon ; (ii)Paratodo > 0limnP[|n| > ] = 0paratodo. (nefracamenteconsistente). (iii)SejaSnumaoutraseq uenciadeestimadoresfracamenteconsistentesdetalquen(Sn) N(0, 2())quandon ,Ent ao2() ) Var( Xn)2=2n2 0, quandon en( Xn) N(0, 2), quandon e nenhum outro estimador com essas propriedades possui variancia assint otica menor que 2. MashamuitosoutrosestimadoresSnquetambems aoBAN,e.g.Sn=1n + 1n

i=1Xitambem eBANpara.3.4 RobustezOconceitode robusteze bastante importante emEstatstica. Por exemplo, dizemos que umestimador e robusto em rela cao `a valores aberrantes quando o estimador nao depende muito forte-mente em rela cao a um valor ou a um grupo de valores. Tome a media e a mediana amostrais comoestimadoresdamediapopulacional. Casoovalordeuma unicaobserva caov aparaoinnitoaestimativa dada pela media vai para o innito,enquanto a estimativa dada pela mediana modicapoucoounemsemodica. Paraqueaestimativadadapelamedianav aparainnito enecessarioquepelomenosmetadedosvaloresv aparaoinnito. Dizemosqueamedianaemaisrobustadoqueamediaemtermos devalores aberrantes. Umoutropontoimportanteimportanteearobustez em termos de distribui cao da popula cao,onde estamos interessados nas conseq uencias dese considerar uma distribui cao errada para a distribui cao da popula cao. A robustez sera visto commaiscuidadonosoutroscaptulos.4 ENVUMV- Estimadores NaoViciados UniformementedeMnimaVarianciaNesta se cao vamos nos restringir ao estudo dos estimadores nao viciados. Neste caso, os criterios deEQMevariancias aoequivalentes. Portanto,vamosprocurarmetodospara encontrarestimadores42naoviciados uniformemente demnimavariancia(ENVUMV). Paraistoprecisamos introduziros conceitos de suciencia, minimalidade, completitude e famlias exponenciais. Emboraestesconceitos sejamutilizados aqui basicamente paraencontrar ENVUMVsuaimport anciaemaisabrangenteemestatsticaeporistoemmuitoslivrostextoselesmerecemcaptulosproprios.Aprincipalraz aoparanosatermosaosestimadoresnaoviciadoseofatodeconseguirmosen-contar, em casos importantes, estimadores que sejam otimos nesta classe de estimadores. Veremosmaistardetambemqueestarestri caopodeserexagerada: podenaoexistirum unicoestimadornaoviciado,ouootimodentrodestaclasseserpessimo.4.1 SucienciaQuandorealizamosumexperimentoenosdeparamoscomumaamostra,emgeral,temosumcon-juntodedadososquaisnaoest aosucientementeorganizadosparaquepossamostirarqualquerinforma cao. Nesteponto, fazemos umaanaliseexploratoriadedados ereduzimos os dados detal formaquepossamosentenderofenomenodeinteresse. Porexemplo, calculamosasmedidasdetendenciacentral ededispersao, fazemosramoefolhas, histogramas, etc. Sabemosqueesteprocedimento pode implicar em uma perda de informa cao, mas a pergunta a ser feita e se podemosreduzirosdadosemumacole caodeestatsticassemperdadeinforma caosobreopar ametro. NosproblemasdeEstatstica, emparticularemestima cao, temosumconjuntodedadosobservadosx1, . . . , xne queremos condensar esta informa cao em alguns n umeros sem perder informa cao sobreopar ametrodeinteresse. Istoe, queremossercapazesdeencontrarumafun caodaamostraquenosdigatudosobreopar ametrocomoseolhassemosaamostracomoumtodo. Talfun caoseriasucienteparapropositosdeinferenciae echamadaestatsticasuciente.Seja X1, . . . , Xn uma amostra, que possue uma distribui cao conhecida, exceto por um par ametro. Gostaramos deencontrar estatsticas, istoefun coes daamostra: Ti=ti(X1, . . . , Xn), i =1, , kquecontemasmesmasinforma coesqueaamostrasobreopar ametro. Enfatizamosqueotipodeinforma caoqueestamosfalandoesobredadoqueconhecemosaformadadistribui cao(e.g.,normal,exponencial,Poisson,etc). Aofazeristoemgeralperdemosoutrasinforma coes;porexemplo,paravericarseadisitribui caoconsiderada ecorreta.Deni cao3.1EstatsticaSuciente(paraocasouniparametrico): SejaX1, . . . , Xnumaamostra comfun cao distribui cao FX(, ), onde pode ser umvetor. Uma estatstica S =s(X1, . . . , Xn)editaserumaestatsticasucienteparase, esomentese, adistribui caocondi-cionaldeX1, . . . , XndadoqueS= snaodependedequalquerquesejaovalordes.Note que a ideia e que se soubermos o valor da estatstica suciente, ent ao os valores amostraispor si mesmos nao s ao mais necessarios e nao nos dao nenhuma informa cao adicional a respeito de. N ao podemos esperar aprender nada sobre amostrando uma distribui cao que nao depende de .Exemplo 3.1: SejaX1, X2, X3umaamostraaleat oriade tamanho3de umadistribui caodeBernoulli,isto e:fX1,X2,X3(t1, t2, t3) = pt1+t2+t3(1 p)3t1t2t3parati= 0ou1,i = 1, 2, 3.Considereasestatsticas:S= X1 +X2 +X3T= X1X2 +X343VamosmostrarqueSesucientemasTnao e.X1, X2, X3) S T fX1,X2,X3|SfX1,X2,X3|T(0,0,0) 0 0 11p1+p(0,0,1) 1 1 1/31p1+2p(0,1,0) 1 0 1/3p1+p(1,0,0) 1 0 1/3p1+p(0,1,1) 2 1 1/3p1+2p(1,0,1) 2 1 1/3p1+2p(1,1,0) 2 1 1/3p1+2p(1,1,1) 3 2 1 1Adensidadecondicionaldadapor:fX1,X2,X3|S=1(0, 1, 0) = P(X1= 0, X2= 1, X3= 0|S= 1)=P(X1= 0,2 = 1, X3= 0, S= 1)P(S= 1)=P(X1= 0, X2= 1, X3= 0)P(S= 1)=(1 p)p(1 p)3p(1 p)2=13efX1,X2,X3|T=1(1, 0, 1) = P(X1= 1, X2= 0, X3= 1|T= 1)=P(X1= 1, X2= 0, X3= 1, T= 1)P(T= 1)=P(X1= 1, X2= 0, X3= 1)P(T= 1)=p2(1 p)p(1 p)2+ 3p2(1 p)=p1 p + 3p=p1 + 2pPois,P(T= 1) = P(X1= 0, X2= 0, X3= 1) +P(X1= 0, X2= 1, X3= 1)+P(X1= 1, X2= 1, X3= 0) +P(X1= 1, X2= 0, X3= 1)= p(1 p)2+p2(1 p) +p2(1 p) +p2(1 p)Adistribui caocondicionalde(X1, X2, X3)dadoosvaloresdeSeindependentedep,assimSeestatsticasuciente.Adistribui caocondicionalde(X1, X2, X3)dadoosvaloresdeTnaoindependedep,portanto,Tnao eestatsticasuciente.A distribui cao condicional s o e trabalh avel em poucos casos. Primeiro, nos temos que chutarumaestatsticaasertratadaedepoiscalcularadistribui caocondicional quen aoemuitofacil,principalmentenocasocontnuo.44Temos assimqueachar alguns criterios quenos ajudemaencontrar estatsticas sucientes.Antes,notequesetivermosmaisdeumpar ametro, eimprov avelqueuma unicaestatsticapossasersucientepara(1, . . . , k). Entretanto,sempreexistiraumconjuntodeestatsticasqueseraoconjuntamentesucientes,apropriaamostra.Deni cao3.2EstatsticasConjuntamenteSucientes: SejaX1, . . . , Xn)umaamostracomfun cao distribui cao FX(, ). As estatsticas S1, . . . , Sr s ao ditas serem conjuntamente sucientes se,e somente se, a distribui cao condicional de X1, . . . , Xn dado S1= s1, . . . , Sr= srnao depende de .Generalizando o resultado do exerccio anterior seja X1, . . . , Xnuma amostra aleat oria de umaBernoulli;porexemplo,paratestarapropor caodepe casdefeituosas. Sejaapropor caorealquequeremosdescobrir. Nestecasoo n umerode pe casdefeituosasconcentratodaa informa cao?Isto,noentanto, somenteecorretosepartirmosdoprincpioqueomodeloeadequado. Sequisermosvericar se o modelo est a correto, isto e, independencia e probabilidade constante precisaramos tercadaumadasrespostas. Noentanto,seomodeloforconsideradocorretonaoperdemosnenhumainforma cao.Observe que oconjuntode varia caode X=(X1, . . . , Xn) e acole caode todos os vetores n-dimensionaiscomoscomponentesiguaisa0ou1. AEstatsticadeneumaparti caodeX.(Umaparti caodeXeumconjuntodesubconjuntosdisjuntoscujauni aoeX. Destaforma, paran=3, osubconjuntorelativoaovalordaestatsticaigual a1edadopor {(0, 0, 1), (0, 1, 0), (1, 0, 0)};ouseja, seaEstatsticaTesucienteet =1, ainforma caodequal dostres possveis pontosocorreunaotraznenhumainforma caoadicional sobreopar ametro. Comocadaestatsticainduzumaparti caopodemostambemfalaremparti caosuciente. Observequeumaestatsticainduzapenasumaparti cao,masqueumamesmaparti caopodeserinduzidapordiferentesestatsticas.PorexemploqualquerestatsticaT=g(T)tal queg()sejaumafun cao1 1noconjuntodevaria caodasestatsticasinduzamesmaparti cao. Umresultadoequivalenteedadopeloteoremaseguinte.Teorema3.3: SeS1, . . . , Srs aoconjuntamentesucientesparaeh:RdRdeumafun caobijetoraent ao(T1, . . . , Tr) = h(S1, . . . , Sr)tambems aoconjuntamentesucientes.Porexemplo, seS1=

ni=1XieS2=

ni=1X2is aoconjuntamentesucientespara(1, 2)ent aoXeS2tambems aoconjuntamentesucientespara(1, 2). Mesmoquepossaseresti-madosomentepelaestatsticaS1(maistardeveremosqueS1eoENVUMVde)naopodemosdizer queS1sejasucientepara. Oconceitodesucienciaest arelacionadoaoconjuntodospar ametrosdomodelo.4.2 CriteriodaFatorizacaoA deni cao de estatstica suciente e conjuntamente sucientes s ao dadas por deni coes nao muitofaceisdeseremvericadas;portanto edesejaveltercriteriomaisfacil.Teorema3.2: SejaX1, . . . , Xnumaamostradetamanhoncomdistribui caoFX(, ), ondepode ser um vetor. Um conjunto de estatsticas S1= s1(X1, . . . , Xn), . . . , Sr= sr(X1, . . . , Xn) s aoconjuntamente sucientes para se, e somente se, a distribui cao conjunta de X1, . . . , Xnpuder serfatoradacomo:FX(x1, . . . , xn, ) = g(s1(x1, . . . , xn), . . . , sr(x1, . . . , xn); ) h(x1, . . . , xn),onde h(x1, . . . , xn) e uma fun cao nao negativa e nao envolve o par ametro e a fun cao g(t1, . . . , tr, )enaonegativaedependedex1, . . . , xnsomenteatravesdasfunc oess1, . . . , sr. Nocasodedis-45tribui caodiscreta(contnua)podemossubstituirafun caodistribui caopelafun cao(densidade)deprobabilidadenotermoaserfatorado.Obs.: Ser = 1temosumaestatsticasucienteunidimensional.Notequehaumconjuntonaoenumeravel deconjuntosdeestatsticassucientes. Oteoremaacimanosdaummetodorelativamentefacildevericarseumacertaestatstica esucienteouseumconjuntodeestatsticas econjuntamentesuciente. Entretanto,ometodon aonosdizquandouma estatstica nao e suciente pois pode ser que a fatoriza cao exista mas foi possvel encontra-la.Exerccio3.1: Qualaestatsticasucienteparaopar ametronoscasosaseguir?(1)X1, . . . , Xni.i.d. b(1, );(2)X1, . . . , Xni.i.d. N(, 1), = ;(3)X1, . . . , Xni.i.d. N(, 2), = (, 2);(4)X1, . . . , Xni.i.d. U(1, 2), = (1, 2.Teorema3.3: Seoestimador demaximaverossimilhan cae unicoeles odependedaamostraatravesdasestatsticassucientes.Prova: SeS1=s1(X1, . . . , Xn), . . . , Sr=sr(X1, . . . , Xn)s aoconjuntamentesucientesparaent aoafun caodeverossimilhan capodeserescritacomoL(; x1, . . . , xn) = g(s1(x1, . . . , xn), . . . , sr(x1, . . . , xn); )h(x1, . . . , xn)emax L()seraatingidonomesmopontoquemax g(s1(x1, . . . , xn), . . . , sr(x1, . . . , xn); ). Casooestimadorseja unicoeledependedex1, . . . , xnsomenteatravesdasfun coess1, . . . , sr.O ultimo teorema est a anunciado incorretamente no livro; est a faltando a condi cao de unicidade.Comocontra-exemploconsidereumauniformeU( 1/2, + 1/2).Efacilvericarque(X1, Xn)esucientepara, equequalquer valor nointervalo(Xn 0, 5, X1+ 0, 5)eumestimador demaxima verossimilhan ca. Em particular, a estatstica {(Xn0.5) +[cos(X2)]2(X1Xn+1)} e umestimador de maxima verossimilhan ca porque seus valores est ao no intervalo (Xn0, 5, X1 +0, 5),maseledependedeX2. Anecessidadedaunicidadevemdofatodequenocasodetermosmaisdeumpontodemaximoaescolhadopontodemaximopodenaoserumafun caodasestatsticassucientes. Este eocasonoexemplo.Notequeos estimadores pelometododos momentos podemnaoser fun caosomentedees-tatsticassucientes.4.3 EstatsticasSucientesMinimaisQuando introduzimos o conceito de suciencia,nosso objetivo era condensar a informa cao contidanaamostrasemperder informa caosobreopar ametro. Javimos quehamais deumconjuntodeestatsticassucientes. Porexemplo, nocasodanormal, temosqueasestatsticasdeordem(X(1), . . . , X(n))s aoconjuntamentesucientesparae2, mastambemXeS2tambemos ao.Mas estas ultimas condensam mais a informa cao. Pergunta: Sera que podemos condensar os dadosmaisainda? Comoveremosaseguirarespostaenao. Quandoistoocorretemosasestatsticassucientesminimais.Deni cao3.3: Estatsticasucienteminimal: Umconjuntodeestatsticasconjuntamentesucientes e dito ser minimal se, e somente se, e uma fun cao de todo outro conjunto de estatsticassucientes.46Note que a deni cao acima e pouco pratica para se realmente encontrar as estatsticas sucientesminimais. Umadeni caoequivalentepodeserconseguidaatravesdeparti caomaisgrossa. Esteconceitoest aportrasdeumdosteoremasqueauxiliamaprocurarestatsticassucientesmin-imais. Mais tardeestudaremos umaclassededistribui coes, afamliaexponencial, ondeofatodadensidadeserpropriamentefatorada, nosdaumconjuntodeestatsticassucientesminimais.InicialmenteveremosoteoremaTeorema3.4: Teorema: Seja(X1, . . . , Xn)umaamostraaleat oriadetamanhondeumaden-sidade f(; ). Suponha que exista uma fun caoT(X1, . . . , Xn) tal que para dois pontos x={x1, . . . , xn}ey= {y1, . . . , yn}araz aofc(x; ) =fc(y; )econstantecomofun caode seesomenteseT(x)=T(y). Ent aoT(X)eumaestatsticasucienteminimal. fc(; )eafun caodensidadeconjunta.Exemplo3.2: Seja (X1, . . . , Xn) uma amostra aleat oria de uma N(, ), onde os dois par ametross aodesconhecidos. Sejamxeydoispontosamostraise( x, s2x)e( y, s2y)asmediasevarianciasamostrais dos pontos x e y, respectivamente. Ent ao a raz ao das duas densidades conjuntas e dadaporfc(x; , 2)fc(y; , 2)=(22)n/2exp{[(n x )2+ (n 1)s2x]/(22)}(22)n/2exp{[(n y )2+ (n 1)s2y]/(22)}.A raz ao sera constante como uma fun cao de e se e somente se x = ye s2x= s2y. Ent ao peloteoremaanterior( X, S2) eumconjuntodeestatsticassucienteminimalpara(, ).4.4 FamliasExponenciaisMuitas das distribui coes que estamos interessados em estudar tem caractersticas e propriedades co-muns e s ao agrupadas em uma classe de distribui coes chamada famlia exponencial. (nao confundircom a distribui cao exponencial que sera um caso particular desta classe). Para uma distribui cao naclassedafamliaexponencial seramuitofacil encontraraestatsticasucienteminimal completa(queveremosaseguir)eapartirdelasencontrarENVUMVs. Estesmodelostambems aoimpor-tantespoiselestemmuitacoisaemcomumquandoqueremosfazerinferenciasarespeitodeles.Reconhece-los como casos especiais de modelos mais gerais torna possvel derivar os resultados emcomumqueteriamqueserobtidoscasoacaso.Deni cao3.4: FamliaExponencial deDistribui coes Uniparametrica: Umafamliadedistribui coesuniparametricaquepodeserescrita(atravesdeumaescolhaadequadadefun coes)como:f(x; ) = B()h(x) exp[Q()T(x)]editapertencer`afamliaexponencial dedistribuic oesuniparametrica.A maioria das distribui coes que encontramos ate o presente momento pertencem a esta famlia.Exemplo3.3:(1)Bernoulli: f(x; p) = px(1 p)1x.B(p) = 1 p; Q(p) = logp1 p; T(x) = x; h(x) = 1.47(2)Binomial: f(x; p) =_nx_px(1 p)nx.B(p) = (1 p)n; Q(p) = logp1 p; T(x) = x; h(x) =_nx_.(3)Geometrica: f(x; p) = p(1 p)x.B(p) = p; Q(p) = log(1 p); T(x) = x; h(x) = 1.(4)BinomialNegativa: f(x; p) =_r +x 1x_pr(1 p)x1.B(p) = pr(1 p)1; Q(p) = log(1 p); T(x) = x; h(x) =_r +x 1x_.(5)Poisson: f(x; ) = e xx! .B() = e; Q() = log ; T(x) = x; h(x) =1x!.(6)Exponencial: f(x; ) = ex.B() = ; Q() = ; T(x) = x; h(x) = 1.(7)Normal(N(0, )): f(x; ) = (2)1/2exp[x2/2].B() = (2)1/2; Q() = (2)1; T(x) = x2; h(x) = 1.(8)Normal(N(, 1)): f(x; ) = (2)1/2exp[12(x )2].B() = (2)1/2exp[122]; Q() = ; T(x) = x; h(x) = exp[12x2].(9)Gama: f(x; ) = nxn1 ex(n1)!.B() =n(n 1)!; Q() = ; T(x) = x; h(x) = xn1.(10)Raleigh: f(x; ) =x2exp[x2/22].B() =12; Q() = (22)1; T(x) = x2; h(x) = x.Deni cao3.5: FamliaExponencialdeDistribui coes: Umafamliadedistribui coesindex-adaporumpar ametro = (1, . . . , k)quepodeserescrita(atravesdeumaescolhaadequadadefun coes)como:f(x; ) = B()h(x) exp[(Q1()T1(x) + +Qk()Tk(x))]editapertencer`afamliaexponencialdedistribui coes.Nadeni caoXpodeserumavariavelaleat oriamultivariada.Exemplo3.4: Considereadistribui caonormalN(, 2)indexadapelopar ametro = (, 2):f(x; , 2) =122exp((x )222)=122exp(222) exp[x222+x2].48Aqualpertence`afamliaexponencialcomaseguinteidentica cao:B(, 2) =122exp(222); h(x) = 1;Q1(, 2) = 122; R1(x) = x2;Q2(, 2) =2; T2(x) = x.Exerccio3.2: Veriquequeadistribui caoBetacomdensidade:f(x; r, s) =(r)(s)(r +s)xr1(1 x)s1, 0 < x < 1pertence`afamliaexponencial.Notequenemtodasasdistribui coespertencemafamliaexponencial. Algunsexemploss aoadistribui caodeCauchyeadistribui caouniforme. Naverdade, qualquerfamiadedensidadesnaqual o conjunto de valores,para os quais a densidade e positiva depende de (suporte da fun cao),naopertence`aclasseexponencial.Teorema3.5: SejaX1, . . . , Xnumaamostraaleat oriadeumadensidadeexponencialdadaporf(x; ) = B()h(x) exp[(Q1()T1(x) + +Qk()Tk(x))].Ent ao(S1, . . . , Sk) = (n

i=1T1(xi), . . . ,n

i=1Tk(xi))econjuntamentesucientepara.Prova: Adensidadeconjuntadenobserva coesindependentesadensidadeconjunta edadapor:f(x1, . . . , xn; ) =n

i=1B()h(xi) exp[(Q1()T1(xi) + +Qk()Tk(xi))]= B()nn

i=1h(xi) exp[(Q1()n

i=1T1(xi) + +Qk()n

i=1Tk(xi))]etambempertence`afamliaexponencialemaisainda,seh(x1, . . . , xn) =n

i=1h(xi)eg(s1, . . . , sk; ) = B()nexp[(Q1()s1 + +Qk()sk)]temosquef(x1, . . . , xn; ) = g(s1, . . . , sk; )h(x1, . . . , xn)eportanto(S1, . . . , Sk) = (n

i=1T1(xi), . . . ,n

i=1Tk(xi))49econjuntamentesucientepara.Pode-se mostrar tambem que e conjuntamente suciente completa (deni cao dada a seguir) e min-imal casoaregi aodevaria caode(Q1(), . . . , Qk()) contenhauminterior naovazio. Pode-setambemmostrarqueseumaestatsticaeconjuntamentesucienteecompletaent aotambememinimal, mas queumaestatsticaeconjuntamentesucienteeminimal naonecessariamenteecompleta.Exemplo 3.5: No caso da normal vimos que o vetor (x, x2) e conjuntamente suciente para (, 2).Dadaumaamostraaleat oria, pelapropriedadeanterior, (

xi,

x2i)eumvetorconjuntamentesucienteminimal para(, 2). Temosqueestevetoreumatransforma cao1-1dovetor( X, S2)eportantonaoexistecontradi caocomoExemploondededuzimosqueestevetorerasucienteminimal. ObservequeemboraXsejautilizadoparaestimareS2paraestimar2naopodemosdizerqueXsejasuceinteparaeS2sejasucentepara2. Veriquesepoderamosfazerestasarma coesseumdosestimadores econhecido.Existemv ariasformasdeseescreverumadensidadepertencente`afamliaexponencial. Porexemplo,fazendo-seumareparametriza cao,= (),adensidadedeumadistribui caodafamliaexponencialpodeserescritadaforma:f(x; ) = A()b(x) exp[k

i=1idi(x)],estareparametriza cao echamadadeparametriza caonaturaldafamliaexponencial.Outraformaderepresentarumadensidadedeumafamliaexponencial uniparametricanaformanatural edadaporf(x; ) = {exp[T(x) +d() +S(x)}IA(x)Nestecasotemosque, seeumpontointerior, afun caogeratrizdemomentosdeT(X)existeeedadapor(s) = exp[d() d(s +)]parasemalgumavizinhan cade0. Umaaplica caoimediata equeE[T(X)] = d() e V [T(X)] = d(h).Exemplo3.6: Seja X1, . . . , Xnuma amostra aleat oria de uma distribui cao de Rayleigh (utilizadaparamodelartempodefalhadecertosequipamentos)f(x; ) = (x/2) exp(x/22) , x > 0, > 0= exp{(22}1x2log() + log x}I(0,)(x)naformaanterior temos = 1/(22, ouseja2= 1/2, d() =nlog(2). Portanto,E(X2i ) = 1/= 22eV (X) = 1/2= 44.4.5EstatsticasAncilaresAo introduzir o conceito de estatstica suciente comentamos que certas estatsticas dao informa caosobreopar ametroporquesuadistribui caodependedopar ametro. Devemostomarcuidado,no50entanto,paraolharparatodaainforma cao. Considereosseguintesexemplos:Exemplo3.7: Considere adistribui caouniforme U(, + 1). Neste casotemos que (X(n) X(1), X(n)+X(1)) e uma estatstica suciente minimal. No entanto e facil vericar que a distribui caodadiferen caentreasestatsticasdeordemextremaisindependede, masquecondicionadoemtodaainforma caonaamostraeladependede. Estasestatsticascujadistribui caoindependedopar ametro s ao chamadas de estatsticas ancilares, e desempenham um papel importante em certasareasdeinferenciaestatstica.Exemplo3.8: Suponha que uma variavel aleat oria Xtem a mesma probabilidade de vir de umanormalN(, 21)oudaN(, 22). Considereavariavelaleat oriaCqueiradecidirdeondeviraavariavelaleat oria. Seelaforiguala1aamostraviradaprimeiranormaleseCforiguala2viradasegunda. TemosP[C= 1] = P[C= 2] = 1/2. Averossimilhan canocaso edadaporfC,X(c, x) =exp_(x)222c_2(2)0.52c.Peloteoremadafatoriza caotemos que(C, X)esucienteparaquandoas variancias s aoconhecidas. Emboraadistribui caode Csejaxae conhecidatemos que Xnaoe suciente.Observequearaz aof(C,X)(1, x)/f(C,X)(2, x)deveriaserindependentedeparaqualquerxseXfossesuciente. Calculearaz aoparaXigual azeroevequeseestacondi caoesatisfeita. Araz aodeveriaserconstanteporquedeveramosestarnomesmosubconjuntodaparti caogeradapelaestatsticasucienteX.4.6 CotaInferiorParaVarianciaComojavimosestimadoresquetenhamuniformementemnimoEQMnaoexistemesequeremosusarestecriteriodevemosrestringiraclassedeestimadoressobestudo. Vamosnosrestringiraclassedeestimadoresn aoviciados.Deni cao 3.6: Estimador Nao Viciado Uniformemente de Mnima Variancia (EN-VUMV): SejaX1, . . . , Xnumaamostraaleat oriadeumadistribui caof(x; ). Umestimador= (X1, . . . , Xn)de()edenidocomosendoumestimadorn aoviciadouniformementedemnimavari ancia(ENVUMV)se,esomentese:(i)E() = (),isto e,enaoviciado;(ii)Var[] Var[S]paraqualqueroutroestimadorSnaoviciadode().Oproblemaagora ecomoencontrarumENVUMV.Umbomincioseriatermosumaideiadamnima variancia que poderia ser atingido pelos estimadores nao viciados. Se tivermos este limite eencontrarmos um estimador nao viciado que atinge este limite teremos encontrado um ENVUMV.Este limite existe,mas como veremos mais tarde ele e mais importante em outras aplica coes e naoparaencontraroENVUMV.SejaX1, . . . , Xnumaamostracomfun caodensidadedeprobabilidadeconjuntafX(.; ),onde . Assumaqueeunivariado. SejaT=t(X1, . . . , Xn), umestimadornaoviciadode().Estamossupondoqueestamostratandocomumvetoraleaatoriocontnuo,procurevericarquaisascondi coesequivalenteparaocasodiscreto. Assumaqueasseguintescondic oesderegularidades aosatisfeitas:(i)fX(x1, . . . , xn; )existeparatodoxe;51(ii)_ _fX(x1, . . . , xn; )dx1. . . dxn=_ _fX(x1, . . . , xn; )dx1. . . dxn(iii)_ _t(x1, . . . , xn)fX(x1, . . . , xn; )dx1. . . dxn=_ _t(x1, . . . , xn)fX(x1, . . . , xn; )dx1. . . dxn(iv)0 < E[[ log fX(X1, . . . , Xn; )]2] < ,paratodo .Teorema3.6: DesigualdadedeCramer-Rao. sobascondi coesderegularidadeacimatemosque:Var[T] [()]2E[[ log fX(X; )]2],ondeT= t(X1, . . . , Xn) eumestimadornaoviciadode().Aequa caoacimaechamadadedesigualdade de Cramer-Raoeaexpressao`adireitaechamadacotainferiordeCramer-Raoparaavarianciadeestimadoresnaoviciadosde().O numerador e chamada de informa cao de Fisher. O termo informa cao e adequado porque quantomaior eestetermomenorpodeseravariancia.Teorema 3.7: Sobcertas condi coes de regularidade que englobama existencia de segundasderivadasdaf.d.p. eavalidadedesetrocarasordensdecertasderivadaseintegraistemos:E{[log fX(X; )]2} = E[22log fX(X; )].Nocasodetermosumaamostraaleat oriadeumadensidadef(., )temosqueE[[log fX(X; )]2] = nE[[log f(X; )]2].Oteoremapodeserutilizadodeduasformas:(1)OteoremanosdaumacotainferiorparaavarianciadeestimadoresnaoviciadoseportantosetemosumestimadornaoviciadocujavarianciaatingeacotainferiordeCramer-Rao,sabemosquetemosoENVUMV.Infelizmenteestenemsempre eocaso.(2)Poroutrolado,senaoconseguimosacharoENVUMV,mastemosumestimadornaoviciadocujavarianciaestejapertodacotainferiordeCramer-Raosabemosquetemosumbomesti-mador.(3)OfatodeumestimadorterumavarianciamuitolongedacotainferiordeCramer-RaonaosignicaqueelesejaruimporqueavarianciadoENVUMVtambempodeestarlongedaquotainferior. Este coment ario vale para pequenas amostras porque como veremos mais tarde, dentro decertas condi coes de regularidade, para grandes amostras os estimadores de maxima verossimilhan catemvciopequenoesuavariancia eproxima`aquotainferior.52Exemplo 3.9: SejaX1, . . . , Xnumaamostraaleat oriade umadistribui caoexponencial compar ametro, suponhaquedesejamosestimar. Pode-semostrarfacilmentequeascondi coesderegularidades aosatisfeitas(tente!). Nestecaso,() = 1eVar[T] 1nE[[ log f(X; )]2].Noteque, log f(x; ) =(log x) = 1/ x,eportanto,E[[log f(X; )]2] = E[(1 X)2] = Var(X) =12Assim, a cota inferior de Cramer-Rao para a variancia de estimadores nao viciados de e dadapor:Var[T] 1n(1/2)=2n .Teorema3.8: Seaestimativademaximaverossimilhan cade, digamos,=(x1, . . . , xn)edadapelasolu caodaequa caolog L(; x1, . . . , xn) =logn

i=1f(xi; ) = 0e se e umestimador naoviciadode () que atinge acotainferior de Cramer-Rao, ent ao= ((X1, . . . , Xn)).Exerccio 3.3: Considere uma amostra aleat oria de tamanho n de uma popula cao com distribui caoexponencial comtaxadefalha. AcheacotainferiordeCramer-Raoparaavarianciadosesti-madoresnaoviciadosde1everiquequeXeENVUMVpara1.NemsempreacotainferiordeCramer-Raopodeseratingida, portantoprecisamosdeoutrosmetodosparaencontrarENVUMVs. Paraistoprecisamosdoconceitodeestatsticasucienteecompleta.4.7 SucienciaeCompletitudeUmailustra caoparaotipodeproblemas quepodemos resolver comos resultados destase cao.Suponha que X1, . . . , Xnseja uma amostra aleat oria de uma distribui cao N(, 2) onde = (, ).Em1920, umaapostasurgiuentreofsicoA. Eddingtoneumdosfundadoresdaestatstica, SirR.A. Fisher, sobre qual o melhor estimador para . Fisher argumentava que um m ultiplo do desviopadraoamostral =_1nn

i=1(XiX)2deveria ser utilizado, enquanto que Eddington propunha que um m ultiplo do desvio medio amostral =1nn

i=1|XiX|.Os m ultiplos naturais a serem considerados s ao aqueles que dao um estimador nao viciado para. Sejam, 1= a e 1= c . Vamosmostrarque 1eENVUMV.Portanto, 1esempremelhor53que 1eaapostafoiganhaporFisher.Naproximasubse caoiremosmostrarque,aoprocurarmosestimadoresnaoviciados, devemosnosateraquelesquesejamfun coessomentedaestatsticassucientes. Casooestimadorencon-tradosejafun caosomentedeestatsticassuciente, quetenhamapropriedadedecompletitude,propriedadeestaqueseradenidaaseguir,teremosencontradoumENVUMV.Deni cao3.7: Completitude: SejaX1, . . . , Xnumaamostraaleat oriadeumadistribui caof(, ) comespa coparametrico, esejaT =t(X1, . . . , Xn)umaestatstica. Afamliadedis-tribui caodeTeditasercompletase,esomentese,a unicafun caogquesatisfazE[g(T)] = 0, paratodo,eafun caog(T) = 0.UmoutromododedizerqueTecompleta edizeroseguinte: Tecompletase,esomentese,o unicoestimadornaoviciadode0que eumafun caodeTeaestatsticaque eidenticamentezero.Exemplo 3.10: Seja X1, . . . , Xnuma amostra aleat oria de uma densidade Bernoulli. A estatsticaT= X1X2 nao e completa porque E[X1X2] = 0 e X1X2 nao e igual a zero com probabilidade1. ConsidereagoraaestatsticaT=

ni=1Xi. Sejag(T)qualquerestatsticaqueefun caodeTeparaaqual E[g(T)] =0paratodo , istoe, para0 1. Paramostraratravesdadeni caoqueTecompletaprecisamosmostrarqueg(t)=0paraumconjuntodevaloresdeTcomprobabilidadeiguala1,isto e,parat = 0, 1, . . . , n. MasE[g(T)] =n

t=0g(t)_nt_t(1 )nt= (1 )nn

t=0g(t)_nt__1 _tcomoE[g(T)] 0paratodo0 1istoimplicaquen

t=0g(t)_nt__1 _t 0 isto en

t=0g(t)_nt_t 0paratodo, onde=/(1 ). Paraqueopolin omioemsejaidenticamentezerocadacoe-cientedettemqueserzero, istoe, g(t)_nt_=0parat=0, . . . , n; mascomo_nt_ =0temosqueg(t) = 0parat = 0, . . . , n.Exemplo 3.11: Suponha que X1, . . . , Xn seja uma amostra aleat oria de uma distribui cao Poisson().Sabemos que T =

ni=1Xie suciente para e tambemque soma de v.a.s independentesPoisson()ePoisson(n). VamosvericarqueTecompleta. Suponhaquegsejaumafun caotalqueE[T] = 0paratodo > 0. Ent ao:en

k=0g(k)(n)kk!= 0paratodo > 0. Sabemosdosteoremasdecalculoqueumaseriedepotenciaque eidenticamentezeroemumintervalodevetertodososseuscoecientesiguaisazero. Portanto, g(k)=0, para54todok = 0, 1, . . .,c.q.d.Exemplo3.12: SejaX1, . . . , Xnumaamostraaleat oriadeumadistribui caoU[0, ] onde=(0, ). MostrequeaestatsticaX(n)= max{X1, . . . , Xn} ecompleta.Sejagumafun