livro-texto de probabilidade e estatísticaverav/livros/livros/livro_probabilidade_e... · todos os...

Download Livro-texto de Probabilidade e Estatísticaverav/LIVROS/LIVROS/livro_probabilidade_e... · Todos os direitos reservados ... A estatística é também comumente associada às pesquisas

If you can't read please download the document

Upload: dodien

Post on 06-Feb-2018

219 views

Category:

Documents


0 download

TRANSCRIPT

  • Probabilidade e Estatstica Sonia Maria Barros Barbosa Correa

    2 Edio

  • Pontifcia Universidade Catlica de Minas Gerais

    Gro Chanceler Dom Serafim Fernandes de Arajo

    Reitor Prof. Pe. Geraldo Magela Teixeira

    PUC Minas Virtual

    Diretora de Ensino a Distncia Maria Beatriz Ribeiro de Oliveira Gonalves

    Coordenao Acadmico-pedaggica Stela Beatris Trres Arnold (coordenadora) Agnela da Silva Giusta Liana Portilho Mattos Maria Ceclia de Ruiz Combat Stortini Mercia Moreira Wilba Lcia Maia Bernardes

    Coordenao Tecnolgica Luiz Flvio F. B. Oliveira (coordenador) Antnio Bosco de Oliveira Jnior Eduardo Marques Duarte Guilherme C. V. Costa Mrcio Tlio Morato Rosiane C. M. Oliveira Simone Nogueira Tlio Nogueira

    Coordenao da rea de Televiso Iara Cordeiro de Melo Franco (coordenadora)

    Assessoria de Comunicao e Marketing Jnia Cludia Carvalho (assessora de comunicao) Carolina Franco

    Gerncia de Projetos Eduardo Silva Ladeira

    Secretaria Eloisa A. T. Lott Carvalho (secretria) Cludio Elias Marques Cristina Maria Isoni Auad Jacqueline C. Carvalho

    PUCMINAS, 2003

    Design Grfico e diagramao: Simone Nogueira / Slvia Fonseca (Trainee I)

    Reviso: PUC Minas Virtual

    Reproduo proibida. Art. 184 do Cdigo Penal

    e Lei 9.610 de 19 de fevereiro de 1998. Todos os direitos reservados PONTIFCIA UNIVERSIDADE

    CATLICA DE MINAS GERAIS

    DIRETORIA DE ENSINO A DISTNCIA R. Esprito Santo, 1.059 - 12 andar Centro

    CEP 30160-922 - Belo Horizonte - MG Telefone: (0xx31) 3273-7898 - Fax: 3274-2805

    http://www.virtual.pucminas.br e-mail: [email protected]

    ATENDIMENTO E INFORMAES:

    Belo Horizonte: (0xx31) 3274-1862 Demais localidades: 0300 313 3 313*

    e-mail: [email protected] * O custo da ligao 0300 de R$ 0,27/min, para telefones fixos,

    ou de R$ 0,63/min, para telefones celulares, e ser pago pelo usurio. Os valores indicados no incluem impostos

    (ref. 30/06/03). Valores sujeitos a alteraes sem aviso prvio. Confira os valores atualizados em

    http://www.virtual.pucminas.br/0300

    FICHA CATALOGRFICA

    Elaborada pela Biblioteca da Pontifcia Universidade Catlica de Minas Gerais

    Correa, Sonia Maria Barros Barbosa

    C824p Probabilidade e estattica / Sonia Maria

    Barros Barbosa Correa. 2 ed. - Belo Hori-zonte: PUC Minas Virtual, 2003

    116 p.

    Bibliografia

    1. Probabilidade. 2. Estatstica matemtica. 3. Amostragem (Estatstica). I. Pontifcia Uni- versidade Catlica de Minas Gerais.

    II. Ttulo. CDU: 519.2

    Bibliotecria - Eunice dos Santos - CRB 6/1515

    Impresso no Brasil

  • sumrio Unidade 1 Natureza e Fundamentos do Mtodo Estatstico........................ 07

    1.1 - Introduo Estatstica ........................................................ 07

    1.2 - Importncia da Estatstica ..................................................... 08

    1.3 - Grandes reas da Estatstica .................................................. 09

    1.4 - Fases do Mtodo Estatstico ................................................... 12

    1.5 - Sries Estatsticas ............................................................... 15

    1.6 - Apresentao de dados

    Tabelas e Grficos: Construo e Interpretao .......................... 22

    Unidade 2 Amostragem.................................................................... 28

    2.1 Importncia da Amostragem................................................... 28

    2.2 Conceitos Fundamentais ....................................................... 29

    2.3 Amostragem Aleatria Simples................................................ 31

    2.4 Amostragem Aleatria Estratificada ......................................... 32

    2.5 Amostragem por Conglomerado.............................................. 34

    2.6 Amostragem Sistemtica ...................................................... 34

    Unidade 3 Distribuio de Freqncia ................................................. 37

    3.1 Conceitos ......................................................................... 37

    3.2 - Elementos de uma distribuio de freqncia: amplitude total,

    limites de classe, amplitude do intervalo de classe, ponto mdio

    da classe, freqncia absoluta, relativa e acumulada .................... 40

    3.3 - Regras Gerais para a elaborao de uma distribuio de freqncia... 44

    3.4 - Grficos representativos de uma distribuio de freqncia:

    histograma, polgono de freqncia e ogiva ................................ 45

  • Unidade 4 - Medidas de Posio ........................................................... 48

    4.1. Introduo......................................................................... 48

    4.2. Mdia aritmtica simples e ponderada e suas propriedades .............. 49

    4.3. Moda: Dados agrupados e no agrupados em classes....................... 50

    4.4. Mediana: Dados agrupados e no agrupados em classes ................... 52

    4.5. Mdia Geomtrica: Dados agrupados e no agrupados em classes....... 54

    4.6. Mdia Harmnica: Dados agrupados e no agrupados em classes ........ 54

    4.7. Separatrizes: Quartis, Decis e Percentis ..................................... 55

    Unidade 5 Medidas de Disperso ........................................................ 59

    5.1 Disperso ......................................................................... 59

    5.2 Assimetria ....................................................................... 61

    5.3 Curtose............................................................................ 63

    Unidade 6 Probabilidade .................................................................. 65

    6.1 Experimento aleatrio, espao amostral e eventos ....................... 65

    6.2 Probabilidade:Definio clssica; Probabilidade e freqncia relativa ............................................................. 70

    6.3 Tipos de eventos ................................................................ 70

    6.4 Axiomas de Probabilidade ..................................................... 72

    6.5 Probabilidade condicional e independncia de eventos ................. 74

    Unidade 7 Variveis Aleatrias .......................................................... 78

    7.1 Conceito de varivel aleatria ............................................... 78

    7.2 Distribuio de probabilidade ................................................. 79

    7.3. Funo de densidade de probabilidade....................................... 79

    7.4. Esperana matemtica, varincia e desvio padro: propriedades ....... 79

    7.5. Distribuies discretas: Hipergeomtrica, Binomial e Poisson............ 80

    7.6. Distribuio contnua: Normal - propriedades, distribuio normal padro, a Normal como aproximao da Binomial ................ 85

  • Unidade 8 - Inferncia Estatstica ......................................................... 93

    8.1. Populao e amostra; Estatsticas e parmetros;

    Distribuies amostrais ......................................................... 93

    8.2. Estimao ......................................................................... 96

    8.3. Testes de Hipteses ............................................................. 100

    Unidade 9 Correlao e Regresso Linear ............................................. 106

    9.1. Diagrama de disperso .......................................................... 107

    9.2. Correlao Linear ................................................................ 107

    9.3. Coeficiente de Correlao Linear ............................................. 108

    9.4. Regresso Reta de regresso ................................................. 112

    Referncias Bibliogrficas .................................................................. 116

  • UNIDADE 1

    Natureza e Fundamentos do Mtodo Estatstico

    1.1. Introduo Estatstica 1.2. Importncia da Estatstica 1.3. Grandes reas da Estatstica 1.4. Fases do Mtodo Estatstico 1.5. Sries Estatsticas 1.6. Apresentao de dados Tabelas e Grficos:

    Construo e Interpretao

    Nesta unidade, sero abordados temas relacionados ao mtodo estats-

    tico. Oferecer exemplos de tabelas e grficos que podem representar, de

    forma sinttica, as informaes obtidas atravs de processos de pesqui-

    sa, so objetivos especficos desta unidade, que tem o propsito de:

    Demonstrar a importncia da Estatstica na vida diria;

    Mostrar como podemos utiliz-la de forma correta;

    Ensinar como compor tabelas a partir de dados numricos;

    Ensinar como representar dados numricos em grficos.

    1.1. Introduo Estatstica

    A palavra estatstica lembra, maioria das pessoas, recenseamento. Os censos

    existem h milhares de anos e constituem um esforo imenso e caro feito pelos

    governos, com o objetivo de conhecer seus habitantes, sua condio socioeconmi-

    ca, sua cultura, religio, etc. Portanto, associar estatstica a censo perfeitamente

    correto do ponto de vista histrico, sendo interessante salientar que as palavras

    estatstica e estado tm a mesma origem latina: status.

    A estatstica tambm comumente associada s pesquisas de opinio pblica, aos

    vrios ndices governamentais, aos grficos e s mdias publicados diariamente na

    imprensa. Na realidade, entretanto, a estatstica engloba muitos outros aspectos,

    sendo fundamental na anlise de dados provenientes de quaisquer processos onde

    exista variabilidade.

    PUC Minas Virtual 7 Probabilidade e Estatstica

  • possvel distinguir duas concepes para a palavra ESTATSTICA: no plural (esta-

    tsticas), indica qualquer coleo de dados numricos, reunidos com a finalidade de

    fornecer informaes acerca de uma atividade qualquer. Assim, por exemplo, as

    estatsticas demogrficas referem-se aos dados numricos sobre nascimentos,

    falecimentos, matrimnios, desquites, etc. As estatsticas econmicas consistem

    em dados numricos relacionados com emprego, produo, vendas e com outras

    atividades ligadas aos vrios setores da vida econmica. No singular (Estatstica),

    indica a atividade humana especializada ou um corpo de tcnicas, ou ainda uma

    metodologia desenvolvida para a coleta, a classificao, a apresentao, a anlise e

    a interpretao de dados quantitativos e a utilizao desses dados para a tomada

    de decises.

    1.2. Importncia da Estatstica

    O mundo est repleto de problemas. Para resolvermos a maioria deles, necessita-

    mos de informaes. Mas, que tipo de informao? Que quantidade de informa-

    es? Aps obt-las, que fazer com elas? A Estatstica trabalha com essas informa-

    es, associando os dados ao problema, descobrindo como e o que coletar, assim

    capacitando o pesquisador (ou profissional ou cientista) a obter concluses a partir

    dessas informaes, de tal forma que possam ser entendidas por outras pessoas.

    Portanto, os mtodos estatsticos auxiliam o cientista social, o economista, o enge-

    nheiro, o agrnomo e muitos outros profissionais a realizarem o seu trabalho com

    mais eficincia.

    A Estatstica uma parte da Matemtica que fornece mtodos para a coleta, organizao, descrio, anlise e interpretao de dados, viabili-

    zando a utilizao dos mesmos na tomada de decises.

    Vejamos alguns exemplos:

    Os estatsticos do governo conduzem censos de populao, moradia, produtos

    industriais, agricultura e outros. So feitas compilaes sobre vendas, produo,

    inventrio, folha de pagamento e outros dados das indstrias e empresas. Essas

    estatsticas informam ao administrador como a sua empresa est crescendo, seu

    crescimento em relao a outras empresas e fornece-lhe condies de planejar

    aes futuras. A anlise dos dados muito importante para se fazer um plane-

    jamento adequado.

    PUC Minas Virtual 8 Probabilidade e Estatstica

  • Na era da energia nuclear, os estudos estatsticos tm avanado rapidamente e,

    com seus processos e tcnicas, tm contribudo para a organizao de empresas

    e utilizao dos recursos do mundo moderno.

    Em geral, as pessoas, quando se referem ao termo estatstica, desconhecem que o

    aspecto essencial o de proporcionar mtodos inferenciais, que permitam conclu-

    ses que transcendam os dados obtidos inicialmente.

    1.3. Grandes reas da Estatstica

    Para fins de apresentao, usual se dividir a estatstica em trs grandes reas,

    embora no se trate de ramos isolados:

    Estatstica Descritiva e Amostragem Conjunto de tcnicas que objetivam cole-

    tar, organizar, apresentar, analisar e sintetizar os dados numricos de uma po-

    pulao, ou amostra;

    Estatstica Inferencial Processo de se obter informaes sobre uma populao

    a partir de resultados observados na amostra;

    Probabilidade - Modelos matemticos que explicam os fenmenos estudados

    pela Estatstica em condies normais de experimentao.

    Em estatstica, utilizamos extensamente os termos: populao, amostra, censo,

    parmetros, estatstica, dados discretos, dados contnuos, dados quantitativos e

    dados qualitativos; que estaremos definindo abaixo para maior compreenso::

    Populao: uma coleo completa de todos os elementos a serem

    estudados.

    Amostra: uma subcoleo de elementos extrados de uma popula-

    o.

    Censo: uma coleo de dados relativos a todos os elementos de

    uma populao.

    Parmetros: uma medida numrica que descreve uma caractersti-

    ca de uma populao.

    Estatstica: uma medida numrica que descreve uma caracterstica

    de uma amostra.

    Dados contnuos: resultam de um nmero infinito de valores poss-

    veis que podem ser associados a pontos em uma escala contnua de

    tal maneira que no haja lacunas.

    PUC Minas Virtual 9 Probabilidade e Estatstica

  • Dados discretos: resultam de um conjunto finito de valores possveis,

    ou de um conjunto enumervel de valores.

    Dados quantitativos: consistem em nmeros que representam conta-

    gens ou medidas.

    Dados qualitativos:podem ser separados em diferentes categorias

    que se distinguem por alguma caracterstica no-numrica.

    Amostragem

    o processo de escolha da amostra. a parte inicial de qualquer estudo estatstico.

    Consiste na escolha criteriosa dos elementos a serem submetidos ao estudo. Ge-

    ralmente, as pesquisas so realizadas atravs de estudo dos elementos que com-

    pem uma amostra, extrada da populao que se pretende analisar.

    Exemplo 1.1. Pesquisas sobre tendncias de votao

    Em pocas de eleio, comum a realizao de pesquisas com o objeti-

    vo de se conhecer as tendncias do eleitorado. Para que os resultados

    sejam de fato representativos, toma-se o cuidado de se entrevistar um

    conjunto de pessoas com caractersticas socioeconmicas, culturais, re-

    ligiosas, etc. to prximas quanto possvel da populao qual os resul-

    tados da pesquisa sero estendidos. A escolha da amostra, a redao do

    questionrio, a entrevista, a codificao dos dados e a apurao dos re-

    sultados so as etapas deste tipo de pesquisa.

    Populao e amostra

    O estudo de qualquer fenmeno, seja ele natural, social, econmico ou biolgico,

    exige a coleta e a anlise de dados estatsticos. A coleta de dados , pois, a fase

    inicial de qualquer pesquisa.

    sobre os dados da amostra que se desenvolvem os estudos, visando a fazer infe-

    rncias sobre a populao.

    Exemplo 1.2. Avaliao de um programa de ensino

    Toma-se certo nmero de pares de turmas: a um conjunto de turmas

    ensina-se um assunto por um novo mtodo e, ao outro, pelo mtodo

    clssico. Aplica-se uma prova a ambos os grupos. As notas observadas

    PUC Minas Virtual 10 Probabilidade e Estatstica

  • nesses conjuntos de turmas constituem a nossa amostra. Se os resulta-

    dos do novo mtodo forem melhores, iremos aplic-lo a todas as tur-

    mas, isto , populao. A partir da amostra, estabelecemos o que

    conveniente para a populao, ou seja, fazemos uma inferncia sobre a

    populao.

    Exemplo 1.3. Renda mdia per capita em diversas regies do pas

    Toma-se um conjunto de indivduos em cada regio, escolhidos ao aca-

    so, e sobre esse grupo so feitos os estudos. Os indivduos assim esco-

    lhidos constituem a amostra e os resultados nela observados sero es-

    tendidos populao.

    Estatstica Descritiva

    a parte mais conhecida. Quem v o noticirio, na televiso ou nos jornais, sabe

    quo freqente o uso de mdias, ndices e grficos nas notcias.

    Exemplo 1.4. INPC (ndice Nacional de Preos ao Consumidor)

    Sua construo envolve a sintetizao, em um nico nmero, dos au-

    mentos dos produtos de uma cesta bsica.

    Exemplo 1.5. Anurio Estatstico Brasileiro

    O IBGE publica esse anurio apresentando, em vrias tabelas, os mais

    diversos dados sobre o Brasil: educao, sade, transporte, economia,

    cultura, etc. Embora simples, fceis de serem entendidas, as tabelas so

    o produto de um processo demorado e extremamente dispendioso de

    coleta e apurao de dados.

    Exemplo 1.6. Anurio Estatstico da Embratur

    A Embratur publica esse anurio apresentando, em vrias tabelas e gr-

    ficos, os mais diversos dados sobre Turismo Interno e dados sobre en-

    trada de turistas estrangeiros no Brasil.

    PUC Minas Virtual 11 Probabilidade e Estatstica

  • Estatstica Inferencial (ou Indutiva)

    A tomada de decises sobre a populao, com base em estudos feitos sobre os da-

    dos da amostra, constitui o problema central da inferncia estatstica.

    Exemplo 1.7. Suponha que a distribuio das alturas de todos os habi-

    tantes de um pas possa ser representada por uma distribuio normal.

    Mas no conhecemos de antemo a mdia da distribuio. Devemos,

    pois, estim-la.

    Exemplo 1.8. Anlise financeira. Os analistas financeiros estudam dados

    sobre a situao da economia, visando explicar tendncias dos nveis de

    produo e de consumo, projetando-os para o futuro.

    Exemplo 1.9. Ocorrncia de terremotos. Os gelogos esto continua-

    mente coletando dados sobre a ocorrncia de terremotos. Gostariam de

    inferir quando e onde ocorrero tremores, e qual a sua intensidade. Tra-

    ta-se, sem dvida, de uma questo complexa, que exige longa experi-

    ncia geolgica, alm de cuidadosa aplicao de mtodos estatsticos.

    Probabilidade

    O processo de generalizao, que caracterstico do mtodo indutivo, est associa-

    do a uma margem de incerteza. A existncia da incerteza deve-se ao fato de que a

    concluso, que se pretende obter para o conjunto de todos os indivduos analisados

    quanto a determinadas caractersticas comuns, baseia-se em uma parcela do total

    das observaes. A medida da incerteza tratada mediante tcnicas e mtodos que

    se fundamentam na Teoria da Probabilidade. Essa teoria procura quantificar a

    incerteza existente em determinada situao.

    1.4. Fases do Mtodo Estatstico

    Quando se pretende empreender um estudo estatstico completo, existem diversas

    fases do trabalho que devem ser desenvolvidas para se chegar aos resultados finais

    de um estudo capaz de produzir resultados vlidos. As fases principais so as

    seguintes:

    Definio do problema

    PUC Minas Virtual 12 Probabilidade e Estatstica

  • Planejamento

    Coleta de dados

    Apurao dos dados

    Apresentao dos dados

    Anlise e Interpretao dos dados

    Definio do problema

    A primeira fase do trabalho consiste em uma definio ou formulao correta do

    problema a ser estudado. Alm de considerar detidamente o problema objeto do

    estudo, o analista dever examinar outros levantamentos realizados no mesmo

    campo e que sejam anlogos, uma vez que parte da informao de que se necessi-

    ta pode, muitas vezes, ser encontrada nesses ltimos.

    Planejamento

    O passo seguinte, aps a definio do problema, compreende a fase do planeja-

    mento, que consiste em se determinar o procedimento necessrio para se resolver

    o problema e, em especial, como levantar informaes sobre o assunto, objeto do

    estudo. preciso planejar o trabalho a ser realizado tendo em vista o objetivo que

    se pretende atingir. nessa fase que ser escolhido o tipo de levantamento a ser

    utilizado. Sob esse aspecto, pode haver dois tipos de levantamento:

    Levantamento censitrio, quando a contagem for completa, abrangendo todo o

    universo;

    Levantamento por amostragem, quando a contagem for parcial.

    Outros elementos importantes que devem ser tratados nesta mesma fase so:

    Cronograma das atividades, atravs do qual so fixados os prazos para as vrias

    fases;

    Custos envolvidos;

    Exame das informaes disponveis;

    Delineamento da amostra, etc.

    PUC Minas Virtual 13 Probabilidade e Estatstica

  • Coleta dos dados

    O terceiro passo essencialmente operacional, compreendendo a coleta das infor-

    maes propriamente ditas. Nesta fase do mtodo estatstico, conveniente esta-

    belecer uma distino entre duas espcies de dados:

    Dados primrios quando so publicados ou coletados pelo prprio pesquisador

    ou organizao que os escolheu;

    Dados secundrios quando so publicados ou coletados por outra organizao.

    Um conjunto de dados , pois, primrio ou secundrio em relao a algum. As

    tabelas do Censo Demogrfico so fontes primrias. Quando determinado jornal

    publica estatsticas extradas de vrias fontes e relacionadas com diversos setores

    industriais, os dados so secundrios para quem desejar utilizar-se deles em algu-

    ma pesquisa que esteja desenvolvendo.

    A coleta de dados pode ser realizada de duas maneiras:

    Coleta Direta quando obtida diretamente da fonte, como no caso da empresa

    que realiza uma pesquisa para saber a preferncia dos consumidores pela sua

    marca;

    Coleta Indireta quando inferida a partir dos elementos conseguidos pela cole-

    ta direta, ou atravs do conhecimento de outros fenmenos que, de algum mo-

    do, estejam relacionados com o fenmeno em questo.

    Apurao dos dados

    Antes de comear a analisar os dados, conveniente que lhes seja dado algum tra-

    tamento prvio, a fim de torn-los mais expressivos. A quarta etapa do processo ,

    ento, a da apurao ou sumarizao, que consiste em resumir os dados atravs de

    sua contagem e agrupamento. Pode ser manual, eletromecnica ou eletrnica.

    Apresentao dos dados

    Por mais diversa que seja a finalidade, os dados devem ser apresentados sob forma

    adequada, tornando mais fcil o exame do fenmeno que est sendo objeto de tra-

    tamento estatstico.

    PUC Minas Virtual 14 Probabilidade e Estatstica

  • H duas formas de apresentao ou exposio dos dados observados, que no se

    excluem mutuamente:

    Apresentao tabular uma apresentao numrica dos dados. Consiste em

    dispor os dados em linhas e colunas distribudas de modo ordenado, segundo al-

    gumas regras prticas adotadas pelos diversos sistemas estatsticos. As tabelas

    tm a vantagem de conseguir expor, sinteticamente e em s local, os resultados

    sobre determinado assunto, de modo a se obter uma viso global mais rpida

    daquilo que se pretende analisar.

    Apresentao grfica uma apresentao geomtrica dos dados numricos.

    Embora a apresentao tabular seja de extrema importncia no sentido de facili-

    tar a anlise numrica de dados, no permite ao analista obter uma viso to

    rpida, fcil e clara do fenmeno e sua variao como aquela conseguida atra-

    vs de um grfico.

    Anlise e interpretao dos dados

    Nesta ltima etapa, o interesse maior reside em tirar concluses que auxiliem o

    pesquisador a resolver seu problema. A anlise dos estatsticos est ligada essenci-

    almente ao clculo de medidas, cuja finalidade principal descrever o fenmeno.

    Assim, o conjunto de dados a ser analisado pode ser expresso por nmeros-

    resumo, as estatsticas que evidenciam as caractersticas particulares desse conjun-

    to. O significado exato de cada um dos valores obtidos atravs do clculo das vrias

    medidas estatsticas disponveis deve ser bem interpretado. possvel mesmo, nes-

    ta fase, arriscar algumas generalizaes, as quais envolvero, como mencionado

    anteriormente, algum grau de incerteza, porque no se pode estar seguro de que o

    que foi constatado para aquele conjunto de dados (a amostra) se verificar igual-

    mente para a populao.

    1.5. Sries Estatsticas

    Define-se srie estatstica como toda e qualquer coleo de dados estatsticos refe-

    ridos a uma mesma ordem de classificao: quantitativa. No sentido mais amplo,

    srie uma sucesso de nmeros referidos a qualquer varivel. Se os nmeros

    expressarem dados estatsticos, a srie ser chamada de srie estatstica.

    Em sentido mais restrito, pode-se dizer que uma srie estatstica uma sucesso

    de dados estatsticos referidos a caracteres qualitativos, ao passo que uma suces-

    PUC Minas Virtual 15 Probabilidade e Estatstica

  • so de dados estatsticos referidos a caracteres quantitativos configurar uma Dis-

    tribuio de Freqncia.

    Em outros termos, a palavra srie usada normalmente para designar um conjunto

    de dados dispostos de acordo com um carter varivel, residindo a qualidade serial

    na disposio desses valores, e no em uma disposio temporal ou espacial de

    indivduos.

    Tabela um quadro que resume um conjunto de observaes.

    Uma tabela compe-se de:

    Corpo conjunto de linhas e colunas que contm informaes sobre a varivel

    em estudo;

    Cabealho parte superior da tabela que especifica o contedo das colunas;

    Coluna indicadora parte da tabela que especifica o contedo das linhas;

    Linhas retas imaginrias que facilitam a leitura, no sentido horizontal, de da-

    dos que se inscrevem nos seus cruzamentos com as colunas;

    Casa ou clula espao destinado a um s nmero;

    Ttulo conjunto de informaes, as mais completas possveis, respondendo s

    perguntas: O qu?- Quando?- Onde?- localizado no topo da tabela.

    Fonte referncia de onde se obteve os dados, colocado, de preferncia, no ro-

    dap.

    As tabelas servem para apresentar sries estatsticas. Conforme varie um dos ele-

    mentos da srie, podemos classific-la em:

    Cronolgicas - Tempo (fator temporal ou cronolgico) a que poca refere-se o

    fenmeno analisado;

    Geogrficas - Local (fator espacial ou geogrfico) onde o fenmeno acontece;

    Especficas - Fenmeno (espcie do fato ou fator especificativo) o que des-

    crito.

    As sries tambm so divididas em:

    Sries Homgradas - aquelas em que a varivel descrita apresenta variao dis-

    creta ou descontnua. So sries homgradas a srie temporal, a srie geogrfi-

    ca e a srie especfica;

    PUC Minas Virtual 16 Probabilidade e Estatstica

  • Sries Hetergradas - aquelas nas quais o fenmeno ou o fato apresenta gradu-

    aes ou subdivises. Embora fixo, o fenmeno varia em intensidade. A Distribu-

    io de freqncias ou seriao uma srie hetergrada.

    Os dados estatsticos resultantes da coleta direta da fonte, sem outra manipulao

    seno a contagem ou medida, o chamados dados absolutos. Dados Relativos so o

    resultado de comparaes por quociente (razes) que se estabelecem entre dados

    absolutos e tm por finalidade realar ou facilitar as comparaes entre quantida-

    des.

    1.5.1. Tipos de Sries Estatsticas Simples (ou de uma entrada)

    As sries estatsticas diferenciam-se de acordo com a variao de um dos trs ele-

    mentos: tempo, local e fenmeno.

    PUC Minas Virtual 17 Probabilidade e Estatstica

  • Srie Cronolgica

    Tambm chamada de srie temporal, srie histrica, srie evolutiva ou marcha,

    identifica-se pelo carter varivel do fator cronolgico. Assim, deve-se ter:

    Elemento varivel: poca

    Elementos Fixos: Local e Fenmeno

    Exemplo:

    Tabela 1.1 - Operadora WKX Venda de bilhetes areos

    Mercado Interno 1995

    Meses Vendas (em milhares

    de reais)

    Janeiro 2300

    Fevereiro 1800

    Maro 2200

    Abril 2210

    Maio 2360

    Junho 2600

    Julho 2690

    Agosto 3050

    Setembro 3500

    Outubro 3440

    Novembro 3100

    Dezembro 2760

    TOTAL ANUAL 31510

    Fonte: Departamento de Anlise de Mercado

    PUC Minas Virtual 18 Probabilidade e Estatstica

  • Srie Geogrfica

    Tambm chamada de srie territorial, srie espacial ou srie de localizao, identifi-

    ca-se pelo carter varivel do fator geogrfico. Assim, deve-se ter:

    Elemento varivel: Local

    Elementos Fixos: poca e Fenmeno Exemplo:

    Tabela 1.2 Operadora WKX - Vendas por Unidade da Federao 1995

    Unidades da Federao Vendas (em milhares de reais)

    Minas Gerais 4000

    Paran 2230

    Rio Grande do Sul 6470

    Rio de Janeiro 8300

    So Paulo 10090

    Outros 420

    TOTAL BRASIL 31510

    Fonte: Departamento de Anlise de Mercado

    PUC Minas Virtual 19 Probabilidade e Estatstica

  • Srie Especfica

    Tambm chamada de srie categrica ou srie por categoria, identifica-se pelo ca-

    rter varivel de fator especificativo. Assim, deve-se ter:

    Elemento varivel: Fenmeno

    Elementos Fixos: Local e poca

    Exemplos:

    Tabela 1.3. Operadora WKX -

    Venda de bilhetes areos por Linha 1995

    Linha do Produto Vendas (em milhares de reais)

    Linha A 6450

    Linha B 9310

    Linha C 15750

    TODAS AS LINHAS 31510

    Fonte: Departamento de Anlise de Mercado

    Tabela 1.4. Nmero de empregados das vrias classes

    de salrios no estado de So Paulo 1998

    Classes de Salrios (R$) Nmero de Empregados

    At 80 41 326

    De 80 a 119 123 236

    De 120 a 159 428 904

    De 160 a 199 324 437

    De 200 a 399 787 304

    De 400 a 599 266 002

    De 600 a 799 102 375

    De 800 a 999 56 170

    1000 e mais 103 788

    TOTAL 2 233 542

    Fonte: Servio de Estatstica da Previdncia e Trabalho

    (Dados alterados para melhor compreenso)

    PUC Minas Virtual 20 Probabilidade e Estatstica

  • 1.5.2. Tabelas Compostas (ou de dupla entrada)

    As tabelas apresentadas anteriormente so tabelas estatsticas simples, onde ape-

    nas uma srie est representada. comum, todavia, haver necessidade de apre-

    sentar, em uma nica tabela, mais do que uma srie. Quando as sries aparecem

    conjugadas, tem-se uma tabela de dupla entrada. Em uma tabela desse tipo so

    criadas duas ordens de classificao: uma horizontal (linha) e uma vertical (colu-

    na).

    Exemplos:

    A) Srie especfico-temporal

    B) Srie geogrfico-temporal

    A) Tabela 1.5 Populao economicamente ativa

    por setor de atividades Brasil

    Populao (1 000 Hab.) Setor

    1940 1950 1960

    Primrio 8 968 10 255 12 163

    Secundrio 1 414 2 347 2 962

    Tercirio 3 620 4 516 7 525

    Fonte: IPEA

    B) Tabela 1.6 Populao Indgena Brasileira

    Produo Unidade de

    Produo 1937 1938 1939

    Acre 5 007 4 765 4 727

    Amazonas 6 858 5 998 5 631

    Par 4 945 4 223 4 500

    Mato Grosso 1 327 1 285 1 235

    Outros Estados 333 539 337

    Fonte: Anurio Estatstico do Brasil IBGE - (Dados alterados para melhor compreenso)

    PUC Minas Virtual 21 Probabilidade e Estatstica

  • Podem existir, se bem que mais raramente, pela dificuldade de representao, s-

    ries compostas de trs ou mais entradas.

    Observao:

    Nem sempre uma tabela representa uma srie estatstica. Por vezes, os dados

    reunidos no revelam uniformidade, sendo meramente um aglomerado de in-

    formaes gerais sobre determinado assunto, as quais, embora teis, no apre-

    sentam a consistncia necessria para se configurar uma srie estatstica.

    Exemplo: Tabela com resumos de dados, mas que no representa uma

    srie estatstica.

    Tabela 1.8 Situao dos espetculos cinematogrficos no Brasil 1967

    Especificao Dados Numricos

    Nmero de cinemas 2 488

    Lotao dos cinemas 1 722 348

    Sesses por dia 3 933

    Filmes de longa metragem 131 330 488

    Meia-entrada 89 581 234

    Fonte: Anurio Estatstico do Brasil IBGE

    1.6. Apresentao de dados - Tabelas e Grficos:

    Construo e Interpretao

    A representao grfica das sries estatsticas tem por finalidade representar os

    resultados obtidos, permitindo que se chegue a concluses sobre a evoluo do

    fenmeno ou sobre como se relacionam os valores da srie. A escolha do grfico

    mais apropriado ficar a critrio do analista. Contudo, os elementos simplicidade,

    clareza e veracidade devem ser considerados, quando da elaborao de um grfico.

    Simplicidade o grfico deve ser destitudo de detalhes de importncia secund-

    ria, assim como de traos desnecessrios que possam levar o observador a uma

    anlise morosa ou sujeita a erros.

    Clareza o grfico deve possibilitar uma correta interpretao dos valores re-

    presentativos do fenmeno em estudo.

    Veracidade o grfico deve expressar a verdade sobre o fenmeno em estudo.

    PUC Minas Virtual 22 Probabilidade e Estatstica

  • Diretrizes para a construo de um grfico:

    O ttulo do grfico deve ser o mais claro e completo possvel. Quando necessrio,

    deve-se acrescentar subttulos;

    A orientao geral dos grficos deve ser da esquerda para a direita;

    As quantidades devem ser representadas por grandezas lineares;

    Sempre que possvel, a escala vertical h de ser escolhida de modo a aparecer a

    linha 0 (zero);

    S devem ser includas no desenho as coordenadas indispensveis para guiar o

    olhar do leitor ao longo da leitura. Um tracejado muito cerrado dificulta o exame

    do grfico;

    A escala horizontal deve ser lida da esquerda para a direita, e a vertical de baixo

    para cima;

    Os ttulos e marcaes do grfico devem ser dispostos de maneira que sejam

    facilmente lidos, partindo da margem horizontal inferior ou da margem esquer-

    da.

    Leitura e interpretao de um grfico:

    Declarar qual o fenmeno ou fenmenos representados, a regio considerada, o

    perodo de tempo, a fonte dos dados, etc;

    Examinar o tipo de grfico escolhido, verificar se o mais adequado, criticar a

    sua execuo, no conjunto e nos detalhes;

    Analisar cada fenmeno separadamente, fazendo notar os pontos mais em evi-

    dncia, o mximo e o mnimo, assim como as mudanas mais bruscas;

    Investigar se h uma tendncia geral crescente ou decrescente ou, ento, se o

    fato exposto estacionrio;

    Procurar descobrir a existncia de possveis ciclos peridicos, qual o perodo a-

    proximado, etc.

    PUC Minas Virtual 23 Probabilidade e Estatstica

  • Eis os tipos mais comuns de grficos:

    Grfico em Linhas

    Constitui uma aplicao do processo de representao das funes num sistema de coordenadas cartesianas

    Exemplo: Vendas em Cr$ 1000,00 nos anos de 1971 a 1977 de determinado produ-

    to da empresa x.

    Vendas em Cr$ 1000,00

    0

    100

    200

    300

    400

    500

    1971 1972 1973 1974 1975 1976 1977

    anos

    vend

    as

    Fonte: Dados Fictcios.

    Grfico em Colunas

    a representao de uma srie por meio de retngulos, dispostos verticalmente.

    Exemplo:Populao Brasileira nas dcadas de 40 a 70.

    0

    20

    40

    60

    80

    100

    1940 1950 1960 1970

    Populao

    Populao

    Fonte: Dados Fictcios

    PUC Minas Virtual 24 Probabilidade e Estatstica

  • Grfico em Barras

    semelhante ao grfico em colunas, porm, os retngulos so dispostos horizon-

    talmente.

    Exemplo:Populao Brasileira nas dcadas de 40 a 70

    0 20 40 60 80 100

    1940

    1950

    1960

    1970

    Populao do Brasil

    Populao doBrasil

    Fonte: Dados Fictcios

    Grfico em Setores

    a representao grfica de uma srie estatstica em crculo, por meio de setores.

    utilizado principalmente quando se pretende comparar cada valor da srie com o

    total.

    Exemplo:

    Receita (em R$ 1.000.000,00) do Municpio X de 1975-77

    Anos Receita (em R$ 1.000.000,00)

    1975 90

    1976 120

    1977

    Total

    Fonte: Departamento da Fazenda, Municpio X.

    O total representado pelo crculo, que fica dividido em tantos setores quantas so

    as partes. Os setores so tais que suas reas so respectivamente proporcionais

    aos dados da srie.

    PUC Minas Virtual 25 Probabilidade e Estatstica

  • Obtemos cada setor por meio de uma regra de trs simples e direta, lembrando

    que o total da srie corresponde a 360.

    Total __________360

    Parte___________ x

    Para 1975: 360 - 360 Para 1976: 360 - 360 Para 1977: 360 - 360

    90 - x 120 - x 150 - x

    x = 90 x = 120 x = 150

    Receita do Municipio X

    197519761977

    Fonte: Departamento da Fazenda, Municpio X

    Grfico Polar

    o grfico ideal para representar sries temporais cclicas, isto , sries que apre-

    sentam em seu desenvolvimento determinada periodicidade, como, por exemplo, a

    variao da precipitao pluviomtrica ao longo do ano, ou da temperatura ao lon-

    go do dia, o consumo de energia eltrica durante o ms ou o ano, etc.

    PUC Minas Virtual 26 Probabilidade e Estatstica

  • Exemplo:

    Movimento Mensal de Compras de uma agencia em 1972

    Meses Valores (R$1.000,00)

    Janeiro 12

    Fevereiro 13

    Maro 14

    Abril 12

    Maio 15

    Junho 19

    Julho 17

    Agosto 18

    Setembro 14

    Outubro 16

    Novembro 12

    Dezembro 18

    Fonte: Departamento financeiro da Agncia (dados Fictcios)

    Movimento Mensal de Compras de uma agencia em 1972

    05

    101520

    Jan

    Fev

    Mar

    Abr

    Mai

    Jun

    Jul

    Ago

    Set

    Out

    Nov

    Dez

    Fonte: Departamento financeiro da Agncia (dados Fictcios)

    PUC Minas Virtual 27 Probabilidade e Estatstica

  • UNIDADE 2

    Amostragem

    2.1. Importncia da Amostragem 2.2. Conceitos Fundamentais 2.3. Amostragem Aleatria Simples 2.4. Amostragem Aleatria Estratificada 2.5. Amostragem por Conglomerado 2.6. Amostragem Sistemtica

    Nesta unidade, veremos quais as tcnicas que podemos utilizar para

    compor uma amostra. So objetivos especficos desta unidade:

    Familiarizar o leitor com a terminologia empregada na pesquisa de

    um fenmeno;

    Identificar os fatores que afetam a quantidade de informaes de um

    fenmeno;

    Explicar como utilizar a Tabelas de Nmeros Aleatrios (TNA) para

    selecionar amostras aleatrias.

    2.1. Importncia da Amostragem

    Na realizao de qualquer estudo, quase nunca possvel examinar todos os ele-

    mentos da populao de interesse. Temos usualmente que trabalhar com uma

    amostra da populao. A inferncia estatstica nos d elementos para generalizar,

    de maneira segura, as concluses obtidas da amostra para a populao. Mas, para

    as inferncias serem corretas, necessrio garantir que a amostra seja

    representativa da populao, isto , a amostra deve possuir as mesmas

    caractersticas bsicas da populao no que diz respeito ao fenmeno pesquisado.

    errneo pensar que, caso tivssemos acesso a todos os elementos da populao,

    seramos mais precisos. Os erros de coleta e manuseio de um grande nmero de

    dados so maiores do que as imprecises a que estamos sujeitos quando generali-

    zamos, via inferncia, as concluses de uma amostra bem selecionada.

    PUC Minas Virtual 28 Probabilidade e Estatstica

  • Em se tratando de amostra, a preocupao central que ela seja representativa.

    preciso que a amostra, ou as amostras que vo ser usadas sejam obtidas por pro-

    cessos adequados.

    Assim que decidimos obter informaes atravs de um levantamento amostral, te-

    mos imediatamente dois problemas:

    Definir cuidadosamente a populao de interesse;

    Selecionar a caracterstica que iremos pesquisar.

    Dados coletados de forma descuidada podem ser to inteis que nenhum proces-

    samento estatstico consegue salv-los.

    2.2. Conceitos Fundamentais

    O conceito de populao intuitivo; trata-se do conjunto de indivduos ou objetos

    que apresentam em comum determinadas caractersticas definidas para o estudo.

    Amostra - um subconjunto da populao.

    Amostragem - so procedimentos para extrao de amostras que repre-

    sentem bem a populao.

    Riscos - a margem de erro motivado pelo fato de investigarmos parcial-

    mente (amostras) o universo (populao).

    Populao-alvo - a populao sobre a qual vamos fazer inferncias ba-

    seadas na amostra.

    Para que possamos fazer inferncias vlidas sobre a populao a partir de uma a-

    mostra, preciso que essa seja representativa. Uma das formas de se conseguir

    representatividade fazer com que o processo de escolha da amostra seja, de al-

    guma forma, aleatrio. Alm disso, a aleatoriedade permite o clculo de estimativas

    dos erros envolvidos no processo de inferncia.

    Quanto extrao dos elementos, as amostras podem ser:

    Com reposio - quando um elemento sorteado puder ser sorteado novamente;

    Sem reposio - quando o elemento sorteado s puder figurar uma nica vez na

    amostra.

    Basicamente, existem dois mtodos para composio da amostra: probabilstico e

    no probabilstico (intencional).

    PUC Minas Virtual 29 Probabilidade e Estatstica

  • O mtodo de amostragem probabilstica exige que cada elemento da populao

    possua determinada probabilidade de ser selecionado. Normalmente, possuem a

    mesma probabilidade. Assim, se N for o tamanho da populao, a probabilidade

    de cada elemento ser 1/N. Somente com base em amostragens probabilsticas

    pode-se realizar inferncias sobre a populao, a partir dos parmetros estuda-

    dos na amostra. So elas:

    Amostragem Aleatria Simples;

    Amostragem Aleatria Estratificada;

    Amostragem Sistemtica;

    Amostragem por Conglomerado.

    Por serem as principais tcnicas estudas, sero mais detalhadamente exploradas no

    item 2.3.

    Os mtodos no probabilsticos so amostragens em que h uma escolha delibe-

    rada dos elementos que compem a amostra. No se pode generalizar os resul-

    tados das pesquisas para a populao, uma vez que as amostras no probabils-

    ticas no garantem a representatividade da populao. So elas:

    Amostragem Acidental;

    Amostragem Intencional;

    Amostragem por Quotas.

    Amostragem Acidental - formada por elementos que vo aparecendo, que so

    possveis de se obter at completar o nmero de elementos da amostra.

    Ex: Pesquisa de opinio, em que os entrevistados so acidentalmente escolhidos.

    Amostragem Intencional - formada por elementos escolhidos por determinado

    critrio, ou seja, escolhe-se intencionalmente um grupo de elementos que iro

    compor a amostra.

    Amostragem por Cotas - Classificao da populao em termos de propriedades

    que se sabe serem relevantes para a caracterstica a ser estudada. Determinao

    da proporo da populao para cada caracterstica com base na constituio co-

    nhecida, ou estimada, da populao. Fixao de quotas para cada observador, ou

    entrevistador, a quem tocar a responsabilidade de selecionar interlocutores ou

    entrevistados, de modo que a amostra total observada, ou entrevistada, contenha a

    proporo de cada classe.

    PUC Minas Virtual 30 Probabilidade e Estatstica

  • 2.3. Amostragem Aleatria Simples

    A amostragem aleatria simples um processo para selecionar amostras de tama-

    nho n dentre as N unidades em que foi dividida a populao. Sendo a amostra-

    gem realizada sem reposio, que o caso mais comum, existem (N,n) possveis

    amostras, todas igualmente provveis. As amostras aleatrias podem ser escolhi-

    das por diversos mtodos, inclusive por tabelas de nmeros aleatrios (TNA) e de

    computadores para gerar nmeros aleatrios Na prtica, a amostra aleatria sim-

    ples escolhida unidade por unidade. As unidades da populao so numeradas de

    1 a N. Em seguida, escolhe-se, na tabela de nmeros aleatrios (TNA), (ou por

    computador) n nmeros compreendidos entre 1 e N. Esse processo equivalente a

    um sorteio no qual se colocam todos os nmeros misturados dentro de uma urna.

    As unidades correspondentes aos nmeros escolhidos formaro a amostra.

    Observao:

    1. Um exemplo de TNA encontra-se no final da unidade 2.

    2. A TNA (Tabela de Nmeros Aleatrios) consiste em tabelas que apresen-

    tam seqncias dos dgitos de 0 a 9 distribudos aleatoriamente nas li-

    nhas(horizontais) e colunas (verticais). Para obtermos os elementos da

    amostra usando a TNA, sorteamos uma linha e uma coluna qualquer para

    comearmos a leitura. Por exemplo: escolho 3 linha 15 coluna o digito

    encontrado 5. A leitura da tabela pode ser feita horizontalmente (da direi-

    ta para a esquerda ou vice-versa), verticalmente (de cima para baixo ou vi-

    ce-versa), diagonalmente (no sentido ascendente ou descendente). A op-

    o, porm, deve ser feita antes de iniciado o processo.

    Assim, em nossos exerccios, avaliaes e trabalhos, utilizaremos sempre a TNA

    lendo na vertical, de cima para baixo, considerando sempre as colunas da

    esquerda para a direita.

    Exemplo de utilizao da TNA

    Procure os 10 primeiros nmeros na TNA comeando a leitura na 9 li-

    nha e na 5 coluna (lembre-se que cada dgito representa uma coluna.

    (Resposta: 1, 0, 0, 1, 8, 4, 7, 0, 1, 3)

    3. Para retirar amostras em populaes com mais de 10 itens, necessitaremos ler

    as colunas quantos dgitos comporem o nmero total de itens da populao. E-

    xemplo: para retirarmos 5 amostras de uma populao com 300 itens, temos

    PUC Minas Virtual 31 Probabilidade e Estatstica

  • que ler trs colunas para conseguirmos valores entre 001 e 300. Se o nmero

    sorteado superar o nmero de elementos rotulados, abandona-se o nmero sor-

    teado, prosseguindo-se o processo. Considerando 9 linha e 5 coluna temos

    como resposta : 124,056,094,143,014.

    Outras tcnicas de amostragem so preferveis aleatria simples, pois levam

    em considerao a composio da populao, facilitando o trabalho de seleo

    de amostras e aumentando a preciso.

    Exemplo:

    Vamos obter uma amostra representativa de 8 itens para a pesquisa da

    estatura de noventa alunos de uma escola. Utilize a TNA (3 linha e 8

    Coluna).

    Resoluo:

    Numeramos os alunos de 01 a 90;

    Iniciamos o processo de sorteio dos itens da amostra na TNA conside-

    rando as colunas 8 e 9, pois 90 so dois dgitos;

    A amostra ser os alunos correspondentes aos nmeros: 46, 58, 16,

    51, 88, 09, 89, 14.

    2.4. Amostragem Aleatria Estratificada

    Uma amostra estratificada obtida separando-se as unidades da populao em

    grupos no superpostos chamados estratos, e selecionando-se independentemente

    uma amostra aleatria simples de cada estrato. Existem dois tipos de amostragem

    estratificada:

    De igual tamanho;

    Proporcional.

    No primeiro tipo, sorteia-se igual nmero de elementos em cada estrato. Esse pro-

    cesso utilizado quando o nmero de elementos por estrato for aproximadamente

    o mesmo.

    PUC Minas Virtual 32 Probabilidade e Estatstica

  • No outro caso, utiliza-se a amostragem estratificada proporcional, cujo processo de

    calcular o nmero de amostras por estrato :

    N N de unidades da populaon N de unidades das amostrasNa N de unidades do estrato Ana N de amostras de A

    aaaa N

    Nnn

    nn

    NN .==

    Exemplo:

    Supondo, no exemplo anterior, que, dos noventa alunos, 54 sejam me-

    ninos e 36 sejam meninas, vamos obter uma amostra proporcional es-

    tratificada de 10%.

    Resoluo:

    So, portanto, dois estratos (sexo masculino e feminino) e queremos

    uma amostra de 10% da populao;

    Calcula-se o nmero de amostras de cada estrato.

    Sexo Populao 10% Nmero de amostras

    M 54 5,4 5

    F 36 3,6 4

    Total 90 9,0 9

    Numeramos os alunos de 01 a 90, sendo que de 01 a 54 correspon-

    dem meninos e de 55 a 90, meninas. O prximo passo o mesmo do

    exemplo anterior.

    PUC Minas Virtual 33 Probabilidade e Estatstica

  • 2.5. Amostragem por Conglomerado

    Uma amostra por conglomerado uma amostra aleatria simples na qual cada uni-

    dade de amostragem um grupo, ou um conglomerado de elementos.

    O primeiro passo na amostragem por conglomerado especificar conglomerados

    apropriados. Os elementos em um conglomerado tendem a ter caractersticas simi-

    lares, portanto, o fato de novas medidas serem tomadas num conglomerado no

    implica necessariamente aumento de informao sobre o parmetro populacional.

    Como regra geral, o nmero de elementos num conglomerado dever ser pequeno

    em relao ao tamanho da populao e o nmero de conglomerados dever ser

    razoavelmente grande.

    Na amostragem por conglomerado a populao dividida em grupos. E selecionam-

    se amostras aleatrias simples de grupos e, ento, todos os itens dos grupos (con-

    glomerados) selecionados faro parte da amostra.

    Exemplo:

    Em um levantamento da populao de uma cidade, podemos dispor do

    mapa indicando cada quarteiro e no dispor de uma relao atualizada

    dos seus moradores. Pode-se, ento, colher uma amostra dos quartei-

    res e fazer a contagem completa de todos os que residem naqueles

    quarteires sorteados.

    2.6. Amostragem Sistemtica

    Quando os elementos da populao j se encontram ordenados, no h necessida-

    de de se construir o sistema de referncia. Nesses casos, a seleo dos elementos

    que constituiro a amostra pode ser por um sistema imposto pelo pesquisador.

    Em geral, para se obter uma amostra sistemtica de n elementos de uma popula-

    o de tamanho N, K deve ser menor ou igual a N/n. No possvel determinar K,

    precisamente, quando o tamanho da populao desconhecido, mas pode-se supor

    um valor de k de tal modo que seja possvel obter uma amostra de tamanho n. Em

    vez da amostragem aleatria simples, pode-se empregar a amostragem sistemtica

    pelas seguintes razes:

    a amostragem sistemtica mais fcil de se executar e, por isso, est menos

    sujeita a erros do entrevistador do que aqueles que acontecem na aleatria sim-

    ples;

    PUC Minas Virtual 34 Probabilidade e Estatstica

  • a amostragem sistemtica freqentemente proporciona mais informaes por

    custo unitrio do que a aleatria simples.

    Diretrizes para calcular as amostras:

    1 - Estabelecer o intervalo de amostragem K:

    nNK =

    OBS: Para valores de K=N/n , arredondar para o valor inteiro menor.

    2 - Iniciar aleatoriamente a composio da amostra.

    b inicio (n de ordem inicial sorteado na TNA).

    Kb

  • Tabela de Nmeros Aleatrios

    COLUNA 1 5 9 13 17 21 25 29 33 37 41 45 49

    LINHA 01 9486 9821 6074 1432 0995 0157 0071 9871 6678 0140 9522 0995 1735 02 3155 9878 3359 8244 8952 0084 1558 4775 1699 1652 2555 4765 2709 03 6136 2824 6030 4256 3870 5725 2204 5318 8337 3867 6184 2018 3522 04 7249 9182 8669 7423 1768 8147 7285 8390 9134 9863 9486 9821 6074 05 0071 9871 6678 0140 9522 0995 1735 1248 9807 1910 3155 9878 3359 06 1558 4775 1699 1652 2555 4765 2709 0561 4397 1135 6136 2824 6030 07 2204 5318 8337 3867 6184 2018 3522 0941 5569 5800 7249 9182 8669 08 7285 8390 9134 9863 9486 9821 6074 1432 0995 0157 0071 9871 6678 09 1735 1248 9807 1910 3155 9878 3359 8244 8952 0084 1558 4775 1699 10 2709 0561 4397 1135 6136 2824 6030 4256 3870 5725 2204 5318 8337 11 3522 0941 5569 5800 7249 9182 8669 7423 1768 8147 7285 8390 9134 12 6074 1432 0995 0157 0071 9871 6678 0140 9522 0995 1735 1248 9807 13 3359 8244 8952 0084 1558 4775 1699 1652 2555 4765 2709 0561 4397 14 6030 4256 3870 5725 2204 2318 8337 3867 6184 2018 3522 0941 5569 15 8669 7423 1768 8147 7285 8390 9134 9863 9486 9821 6074 1432 0995 16 6678 0140 9522 0995 1735 1248 9807 1910 3155 9878 3359 8244 8952 17 1699 1652 2555 4765 2709 0561 4397 1135 6136 2824 6030 4256 3870 18 8337 3867 6184 2018 3522 0941 5569 5800 7249 9182 8669 7423 1768 19 9134 9863 9486 9821 6074 1432 0995 0157 0071 9871 6678 0140 9522 20 9807 1910 3155 9878 3359 8244 8952 0084 1558 4775 1699 1652 2555 21 4397 1135 6136 2824 6030 4256 3870 5725 2204 5318 8337 3867 6184 22 5569 5800 7249 9182 8669 7423 1768 8147 7285 8390 9134 9863 8486 23 0995 0157 0071 9871 6678 0140 9522 0995 1735 1248 9807 1910 3155 24 8952 0084 1558 4775 1699 1652 2555 4765 2709 0568 4397 1135 6136 25 3870 5725 2204 5318 8337 3867 6184 2018 3522 0941 5569 5800 7249 26 7425 3566 6151 4731 6489 2491 2765 8525 7849 1488 8833 2597 1333 27 8961 8175 0879 6945 8029 9119 5990 1063 9444 8320 1740 6131 9907 28 3298 6173 1741 3874 9321 3748 7507 0170 0568 9112 1275 0924 3054 29 2276 4898 2394 1098 4063 5393 0226 8144 4778 7471 1764 4939 8063 30 9557 8114 1576 9767 1486 7161 5606 6295 3503 5050 9549 2500 9666 31 8650 1920 2533 7755 5324 3731 3414 2153 3815 0626 5718 8679 6801 32 2885 8101 1467 0080 7962 5999 9562 5819 1562 6793 2065 0239 8253 33 1841 8626 0344 4344 7446 0867 6157 8935 4413 2363 7187 8980 2488 34 4638 8030 0018 7760 9819 4276 0650 3516 5159 9236 3257 1694 7157 35 1320 7033 1218 5605 4206 2878 0230 1740 4553 8729 5827 7176 8703 36 1488 5803 6790 9368 0465 4819 0065 7633 3950 2109 7027 5824 5057 37 4353 4347 8565 2231 8789 4231 2585 0157 2037 7835 1320 8999 9181 38 7816 5817 9764 8789 7387 2172 0896 1038 6047 9539 3510 1343 8098 39 8600 9738 5415 8426 7152 8705 5829 0164 8330 9152 6045 8129 2293 40 1057 1550 8773 3003 4302 4034 2478 1078 0429 7189 0778 3260 5969

    PUC Minas Virtual 36 Probabilidade e Estatstica

  • UNIDADE 3

    Distribuio de Freqncia

    3.1. Conceitos 3.2. Elementos de uma distribuio de freqncia: amplitude total,

    limites de classe, amplitude do intervalo de classe, ponto mdio da classe, freqncia absoluta, relativa e acumulada

    3.3. Regras Gerais para a elaborao de uma distribuio de freqncia

    3.4. Grficos representativos de uma distribuio de freqncia: histograma, polgono de freqncia e ogiva

    Vamos considerar, nesta unidade, o estudo detalhado da distribuio de

    freqncia, que a forma pela qual podemos descrever os dados esta-

    tsticos resultantes de variveis quantitativas. So objetivos desta uni-

    dade:

    Compor uma distribuio de freqncia com ou sem intervalos de

    classe;

    Determinar o quadro de freqncias, eles so teis para condensar

    grandes conjuntos de dados, facilitando o sua utilizao;

    Representar uma distribuio de freqncia atravs de histograma, polgono e ogiva.

    3.1. Conceitos

    Ao analisarmos um conjunto de dados, devemos determinar se temos uma amos-

    tra ou uma populao. Essa determinao afetar no somente os mtodos utiliza-

    dos, mas tambm as concluses, pois se estamos trabalhando com uma amostra os

    resultados encontrados so estimativas da populao.

    Nem sempre possvel compreender o significado contido numa amostragem por

    simples inspeo visual dos dados numricos coletados. Entretanto, entendemos

    que o sucesso de uma deciso depender da nossa habilidade em compreender as

    informaes contidas nesses dados. O objetivo deste estudo mostrar a organiza-

    o, apresentao e anlise grfica de uma srie de dados, matria prima das dis-

    tribuies de freqncias e dos histogramas. Freqncia de uma observao o

    PUC Minas Virtual 37 Probabilidade e Estatstica

  • nmero de repeties dessa observao, ou seja, quantas vezes determinado fe-

    nmeno acontece.

    Os dados podem ser classificados como:

    Dados brutos so os dados originais, que ainda no se encontram prontos para anlise, por no estarem numericamente organizados. (Tambm so co-

    nhecidos como Tabela Primitiva).

    Exemplo: Nmero mensal de aparelhos defeituosos na Empresa X.

    J F M A M J J A S O N D

    1995 6 2 5 1 0 3 2 1 3 5 5 3

    1996 5 4 2 1 3 4 1 4 5 4 0 1

    1997 3 1 2 4 3 1 4 1 0 3 0 2

    1998 2 2 0 3 1 4 2 0 1 1 5 2

    Rol so os dados brutos, organizados em ordem crescente ou decrescente.

    Exemplo: Considerando o exemplo anterior temos:

    0 0 0 0 0 0 1 1 1 1 1 1

    1 1 1 1 1 2 2 2 2 2 2 2

    2 2 3 3 3 3 3 3 3 3 4 4

    4 4 4 4 4 5 5 5 5 5 5 6

    PUC Minas Virtual 38 Probabilidade e Estatstica

  • Dados discretos a varivel discreta quando assume valores em pontos da reta real.

    Exemplo: nmero de erros em um livro: 0,1,2,3,4,....

    nmero de filhos de vrios casais: 1,2,3,4,.....

    quantidade de acidentes em determinada rodovia: 4,10,12,15,....

    Dados contnuos a varivel pode assumir, teoricamente, qualquer valor em certo intervalo da reta real.

    Exemplo: peso de alunos: 55,5 kg; 61,0kg; 63,4 kg; 68,1 kg.......

    distncia entre cidades: 35,5 km; 48,6 km; 100,10 km; ....

    Dados Tabelados no agrupados em classes os valores da varivel apare-cem individualmente.

    Exemplo, considerando os dados da tabela anterior:

    N de aparelhos

    com defeitos N de meses

    0 06

    1 11

    2 09

    3 08

    4 08

    5 05

    6 01

    Total 48

    PUC Minas Virtual 39 Probabilidade e Estatstica

  • Dados Tabelados agrupados em classes - os valores da varivel no apare-cem individualmente, mas agrupados em classes.

    Notas N de alunos

    0 |--- 20 020

    20 |--- 40 065

    40 |--- 60 230

    60 |--- 80 160

    80 |--- 100 025

    Total 580

    3.2. Elementos de uma distribuio de freqncia:

    amplitude total, limites de classe, amplitude do intervalo de classe,

    ponto mdio da classe, freqncia absoluta, relativa e acumulada

    3.2.1. Amplitude total (A) - a diferena entre o maior e o menor nmero

    do rol.

    Exemplo: Estatura de 40 alunos do Colgio A em cm. (Dados ordenados

    em ordem crescente, por colunas)

    150 154 155 157 160 161 162 164 166 169

    151 155 156 158 160 161 162 164 167 170

    152 155 156 158 160 161 163 164 168 172

    153 155 156 160 160 161 163 165 168 173

    A = 173 150 = 23

    PUC Minas Virtual 40 Probabilidade e Estatstica

  • 3.2.2. Nmero de classes (K) e Classe (i) no existe regra fixa para se

    determinar o nmero de classes. Podemos utilizar:

    A Regra de Sturges, que nos d o nmero de classes em funo do nmero de valores da varivel:

    nK log.3,31+= , onde n o nmero de itens que compe a amostra;

    Ou

    25.n para k e 25 n para 5K >= ,n

    Exemplo: considerando o exemplo anterior n=40

    Pela formula de Sturges: K= 1+3,3log40 = 6,28 K=6

    Adotando nK = , temos 40=k =6,3 K=6

    3.2.3. Amplitude de um intervalo de classe (h) ou simplesmente inter-

    valo de classe a medida do intervalo que define a classe.

    h = A / K

    Exemplo, considerando o exemplo anterior:

    H = 23/ 6 = 3,83 h = 4

    3.2.4. Limites de Classe denominamos limites de classe os extremos de

    cada classe. Assim temos:

    limite inferior (linf) e

    limite superior (Lsup)

    Observao: Vamos trabalhar com intervalos fechados esquerda e abertos

    direita; isso significa que valores iguais ou superiores ao limite inferior so conside-

    rados nessa classe e valores iguais e/ou superiores ao limite superior so conside-

    rados na classe abaixo.

    PUC Minas Virtual 41 Probabilidade e Estatstica

  • Exemplo: Do exemplo anterior, temos:

    i Classes n

    1 150 | 154 4

    2 154 | 158 9

    3 158 | 162 11

    4 162 | 166 8

    5 166 | 170 5

    6 170 | 174 3

    40

    Na segunda classe, temos:

    L2=158

    l2 = 154

    3.2.5. Ponto Mdio da Classe - (xi) , como o prprio nome indica, o

    ponto que divide o intervalo de classe em duas partes iguais. Para

    obtermos o ponto mdio de uma classe, calculamos:

    2supinf Llxi

    +=

    Exemplo: considerando a segunda classe do exemplo anterior, temos:

    1561562

    15815422 ==

    += xx

    3.2.6. Freqncias

    Freqncias simples ou absoluta da classe i (ni) - so os valores que real-mente representam o nmero de dados de cada classe. A soma das freqncias

    simples igual ao nmero total dos dados.

    Exemplo: considerando a segunda classe do exemplo anterior, temos:

    n2 = 9 .

    PUC Minas Virtual 42 Probabilidade e Estatstica

  • Freqncias relativas (fi) so os valores das razes entre as freqncias simples e o nmero total de dados.

    nnf ii =

    Exemplo: considerando a segunda classe do exemplo anterior, temos:

    f2 = 9/40=0,225 .

    Obs: as freqncias relativas permitem a anlise ou facilitam as

    comparaes.

    Freqncia acumulada (Ni) o total das freqncias de todos os valores inferiores ao limite superior do intervalo de uma dada classe:

    Exemplo: Considerando a freqncia acumulada da quarta classe (N4),

    temos:

    N4= n1+n2+n3+n4= 4+9+11+8 = 32

    Freqncia acumulada relativa (Fi) a freqncia acumulada da classe, dividida pela freqncia total da distribuio.

    nN

    F ii =

    Exemplo: para o exemplo anterior, F4 = 0,8 .

    NOTA Usualmente, denominamos:

    Freqncia relativa acumulada crescente da classe i Fi.

    Obs: Fi pode ser entendido como sendo a percentagem de observaes abaixo

    do limite superior da classe i.

    Freqncia relativa acumulada decrescente da classe i Fi.

    Obs: Fi e a porcentagem de observaes acima do limite inferior da classe i.

    PUC Minas Virtual 43 Probabilidade e Estatstica

  • 3.3. Regras Gerais para a elaborao de uma distribuio de freqncia

    Os principais estgios na construo de uma distribuio de freqncia para dados

    amostrais so:

    1. Encontrar a amplitude total do conjunto de valores observados;

    2. Escolher o nmero de classes;

    nnK =+= k ou log,3313. Determinar a amplitude do intervalo de classe;

    kAh =

    4. Determinar os limites de classe;

    5. Construir a tabela de freqncias.

    Exemplo:

    Calcule as freqncias e o ponto mdio dos dados abaixo:

    Alturas de 50 estudantes do sexo masculino da Univesidade XYZ

    33 35 35 39 41 41 42 45 47 48

    50 52 53 54 55 55 57 59 60 60

    61 64 65 65 65 66 66 66 67 68

    69 71 73 73 74 74 76 77 77 78

    80 81 84 85 85 88 89 91 94 97

    Soluo: Amplitude : A = 97-33 = 64

    Nmero de Classes : 750 =K

    Intervalo de classe : h =64/7 10

    PUC Minas Virtual 44 Probabilidade e Estatstica

  • i Classes n Ni fi Fi xj

    1 30 | 40 4 4 0,08 0,08 35

    2 40 | 50 6 10 0,12 0,20 45

    3 50 | 60 8 18 0,16 0,36 55

    4 60 | 70 13 31 0,26 0,62 65

    5 70 | 80 9 40 0,18 0,80 75

    6 80 | 90 7 47 0,14 0,94 85

    7 90 |100 3 50 0,06 1,0 95

    50 1

    3.4. Grficos representativos de uma distribuio de freqncia:

    histograma, polgono de freqncia e ogiva

    Uma distribuio de freqncia pode ser representativa graficamente pelo histo-

    grama, pelo polgono de freqncia e pelo polgono de freqncia acumulada (Ogiva

    de Galton).

    Histograma formado por um conjunto de retngulos justapostos, cujas bases

    se localizam sobre o eixo horizontal, de tal modo que seus pontos mdios coinci-

    dem com os pontos mdios dos intervalos de classe.

    As larguras dos retngulos so iguais s amplitudes dos intervalos de classe.

    As alturas dos retngulos devem ser proporcionais s freqncias das classes, sendo igual a amplitude dos intervalos.

    Histograma ni

    12

    8

    4

    30 40 50 60 70 80 90 100

    PUC Minas Virtual 45 Probabilidade e Estatstica

  • Polgono de freqncia um grfico em linha, sendo as freqncias marcadas

    sobre perpendiculares ao eixo horizontal, levantada pelos pontos mdios dos inter-

    valos de classe.

    Para realmente obtermos um polgono (linha fechada), devemos completar a figura,

    ligando os extremos da linha obtida aos pontos mdios da classe anterior primeira

    e da posterior ltima, da distribuio.

    Polgono de Freqncia ni

    12

    8

    4

    35 45 55 65 75 85 95 Ponto mdio

    Polgono de freqncia acumulada traado marcando-se as freqncias a-

    cumuladas sobre perpendiculares ao eixo horizontal, levantadas nos pontos corres-

    pondentes aos limites superiores dos intervalos de classe.

    Polgono de Freqncia Acumulada

    30 40 50 60 70 80 90 100

    F

    50

    47

    40

    31

    18

    10

    4

    classes

    PUC Minas Virtual 46 Probabilidade e Estatstica

  • Observao: Uma distribuio de freqncia sem intervalos de classe

    representada graficamente por um diagrama onde cada valor da varivel

    representado por um segmento de reta vertical e de comprimento proporcional

    respectiva freqncia.

    ni

    xi 1 2 3 4 5 6

    4

    8

    12

    PUC Minas Virtual 47 Probabilidade e Estatstica

  • UNIDADE 4

    Medidas de Posio

    4.1. Introduo 4.2. Mdia aritmtica simples e ponderada e suas propriedades 4.3. Moda: Dados agrupados e no agrupados em classes 4.4. Mediana: Dados agrupados e no agrupados em classes 4.5. Mdia Geomtrica: Dados agrupados

    e no agrupados em classes 4.6. Mdia Harmnica: Dados agrupados

    e no agrupados em classes 4.7. Separatrizes: Quartis, Decis e Percentis

    Nesta unidade, veremos as tendncias caractersticas de cada distribui-

    o, destacando as medidas de posio central, que recebem tal deno-

    minao pelo fato de os dados observados tenderem, em geral, a se a-

    grupar em torno dos valores centrais. So objetivos desta unidade:

    Calcular as medidas de posio central;

    Diferenciar as medidas - moda, mdia e mediana;

    Utilizar as separatrizes para melhor interpretar os resultados.

    4.1. Introduo

    Nas sees anteriores, vimos a sintetizao dos dados sob a forma de tabelas, gr-

    ficos e distribuies de freqncias. Agora, vamos destacar o clculo das medidas

    que possibilitam localizar a maior concentrao de valores de uma dada distribui-

    o, isto , se ela se localiza no incio, no meio ou no final, ou, ainda, se h uma

    distribuio por igual. Tais medidas possibilitam comparaes de sries de dados

    entre si pelo confronto desses nmeros.

    No entanto, para ressaltar as tendncias caractersticas de cada distribuio, isola-

    damente, ou em confronto com outras, necessitamos introduzir os elementos tpi-

    cos da distribuio, que so:

    Medidas de posio;

    Medidas de variabilidade ou disperso;

    Medidas de assimetria;

    Medidas de curtose.

    PUC Minas Virtual 48 Probabilidade e Estatstica

  • As medidas de posio mais importantes so as medidas de tendncia central, que

    destacamos:

    A mdia aritmtica;

    A mediana;

    A moda.

    As outras medidas de posio so as separatrizes, que englobam:

    A mediana;

    Os quartis;

    Os decis;

    Os percentis.

    Primeiramente, vamos estudar as principais medidas de tendncia central, depois

    veremos as separatrizes e, na prxima unidade, as medidas de Disperso, Assime-

    tria e Curtose.

    4.2. Mdia aritmtica simples e ponderada e suas propriedades

    o quociente da diviso da soma dos valores da varivel pelo nmero deles. A m-dia (aritmtica) , de modo geral, a mais importante de todas as medidas descriti-

    vas.

    Dados no tabelados

    xi : valor observado n : nmero total de observaes

    n

    xx

    n

    ii

    == 1

    Exemplo: Suponha que o tempo de vida til de 10 aparelhos de telefone so:

    10 29 26 28 15 23 17 25 0 20. Qual a mdia de vida til

    destes aparelhos?

    Soluo: =+++++++++= 1932002517231528262910X

    3,1910193

    === n

    xx ,

    portanto mdia de vida til dos aparelhos so 19,3 anos.

    PUC Minas Virtual 49 Probabilidade e Estatstica

  • Dados Tabelados

    Sem intervalo de Classe

    n

    nxx

    i

    n

    ii

    =

    =1

    Com intervalo de Classe

    n

    nxX

    i

    n

    ii

    ==1

    s vezes, a mdia pode ser um n

    que ela representa.

    4.3. Moda (Mo): Dados agrupados

    o valor que ocorre com maior freq

    nominado valor modal. Baseado nesse

    sentar mais de uma moda. Nesse ca

    quando no existe um valor predomin

    Dados no tabelados: o valor moda

    Exemplo: Nos valores abaix

    3 4 4 5 6 7

    Soluo: Mo= 9

    Dados tabelados

    Sem intervalo de Classe: O valocia.

    Exemplo:

    Classes 0 1 2

    PUC Minas Virtual

    Xi : valor observado ni : n de observaes por classe n : n de observaes totais

    mero diferente de todos os da srie de dados

    e no agrupados em classes

    ncia em um conjunto de dados, e que de-

    contexto, um conjunto de dados pode apre-

    so, dizemos ser multimodais; caso contrrio,

    ante, dizemos que amodal.

    l o predominante na distribuio.

    o, qual o valor modal?

    8 9 9 9 10 11 12 13

    r modal o valor que possuir maior freqn-

    3 4 5 6

    ix : ponto mdio da classe ni : n de observaes

    50 Probabilidade e Estatstica

  • N 06 11 09 08 08 05 01 48

    Soluo: o valor predominante o nmero 1, que ocorreu 11 vezes.

    Temos, portanto, Mo=1.

    Com intervalo de classe: tratando-se de dados agrupados em classe, a moda no percebida to facilmente como nos casos anteriores. Para calcular o va-

    lor modal nesses casos, podemos utilizar os seguintes processos:

    1 Processo: Frmula de Czuber

    )()(inf postmoantmoantmo

    Mo nnnnnnhlMo

    +

    +=

    onde constatamos:

    Classe Modal: Classe de maior freqncia

    n mo: freqncia simples da classe modal

    nant : freqncia simples anterior classe modal

    npost : freqncia simples posterior classe modal

    linf: limite inferior da classe modal

    hMo: intervalo de classe modal

    2 Processo: Frmula de Pearson

    XMdM o 23 =

    onde constatamos:

    Md = Mediana

    X = Mdia

    PUC Minas Virtual 51 Probabilidade e Estatstica

  • Exemplo - Determinar a moda para a distribuio:

    Classes 0|--- 1 1|--- 2 2|--- 3 3|--- 4 4|--- 5

    ni 3 10 17 8 5 43

    Soluo: Utilizando a frmula de Czuber

    a classe modal a classe 2|----3

    linf = 2

    hMo = 1

    nMo = 17

    nant = 10

    npost =8

    Substituindo esses valores na frmula, encontramos: Mo= 2,44

    4.4. Mediana (Md): Dados agrupados e no agrupados em classes

    A mediana uma medida de posio. , tambm, uma separatriz, pois divide o

    conjunto em duas partes iguais, com o mesmo nmero de elementos. O valor da

    mediana encontra-se no centro da srie estatstica organizada, de tal forma que o

    nmero de elementos situados antes desse valor (mediana) igual ao nmero de

    elementos que se encontram aps esse mesmo valor (mediana).

    Dados no tabelados

    Para uma srie com nmero mpar de itens: a mediana corresponde ao valor central.

    EMd - elemento mediano: indica a posio da mediana.

    n mpar EMd = (n+1)/2

    )(EMd

    XMd =

    A mediana ser o termo de ordem (n+1)/2.

    PUC Minas Virtual 52 Probabilidade e Estatstica

  • Para uma srie com nmero par de itens: no h termo central nico, mas, sim, dois termos centrais. A mediana ser dada por:

    n par EMd = n/2 2

    XXMd 1)(E)(E MdMd +

    +=

    A mediana ser a mdia aritmtica entre os termos centrais.

    Dados tabelados:

    Neste caso, o problema consiste em determinar o ponto do intervalo em que est

    compreendida a mediana.

    Sem intervalo de classe: devemos, primeiro, obter a localizao da mediana na srie atravs do termo de ordem:

    2nEMD =

    Uma vez localizada a posio da mediana, devemos verificar o valor numrico da

    varivel correspondente a essa posio.

    Com intervalo de classe: localizada a classe mediana, calculamos o valor da mediana pela frmula:

    Md

    ant

    n

    N2n

    Md

    +=

    Mdhlinf

    onde temos:

    linf: limite inferior da classe mediana.

    hMo: intervalo de classe mediana.

    nMd : freqncia simples absoluta na classe mediana.

    Nant : freqncia acumulada absoluta anterior classe mediana.

    Classe Mediana: classe onde est o elemento mediano.

    PUC Minas Virtual 53 Probabilidade e Estatstica

  • 4.5. Mdia Geomtrica (MG): Dados agrupados e no agrupados em classes

    Dados no tabelados

    A mdia geomtrica de um conjunto de N nmeros x1, x2,x3,......xn a raiz de or-

    dem N do produto desses nmeros:

    NnG xxxxM ....... 321=

    Dados agrupados

    Sem intervalo de classe

    N nn

    nnnG

    nxxxxM ....321 321=

    Com intervalo de classe

    nG xxxxM ....321 N nnnn n321=

    4.6. Mdia Harmnica (Mh): Dados agrupad

    Sejam x1, x2, x3,......xn, valores de x, associad

    n3,......nn, respectivamente.

    A mdia harmnica de X definida por:

    +++=

    xn

    xn

    xn

    nMh

    3

    3

    2

    2

    1

    1 .......

    Para dados no agrupados n = 1.

    Para dados agrupados sem intervalo de clas

    Para dados agrupados com intervalo de clas

    PUC Minas Virtual 54 P

    Xi : valor observado ni : n de observaes da classe

    ix : ponto mdio

    ni : n de observaes

    os e no agrupados em classes

    os s freqncias absolutas n1, n2,

    =

    =+

    n

    i i

    i

    n

    n

    xn

    n

    xn

    1

    .

    se xi o valor da varivel.

    se xi o ponto mdio da classe.

    robabilidade e Estatstica

  • 4.7. Separatrizes: Quartis, Decis e Percentis

    So valores que ocupam determinados lugares de uma distribuio de freqncia.

    Podemos classific-las em:

    Quartis: dividem a distribuio em 4 partes iguais

    Qi = quartil i=1,2,3

    Q1 = 1 quartil, valor situado de tal modo na srie que uma quarta parte (25%)

    dos dados menor que ele e as trs quartas partes restantes (75%) so maio-

    res.

    Q2 = 2 quartil, evidentemente, coincide com a Mediana (Q2 = Md).

    Q3 = 3 quartil, valor situado de tal modo que as trs quartas partes (75 %) dos

    termos so menores que ele e uma quarta parte 25 % maior.

    hn

    Nn

    lQQ

    ant

    Q .4

    1

    11

    += hn

    Nn

    lQQ

    ant

    Q .4

    3

    3

    33

    +=

    Onde temos:

    linf : limite inferior da classe do quartil considerado

    hQ: intervalo de classe do quartil considerado

    nQ : freqncia simples absoluta do quartil considerado

    Nant : freqncia acumulada anterior classe do quartil considerado

    Decis: dividem a distribuio em 10 partes iguais

    Di = decil i=1,2,3, , 9

    1 Passo: Calcula-se em que K = 1,2,3,......,9;

    2 Passo: Identifica-se a classe DK , pela Nac ;

    3 Passo: Aplica-se a frmula:

    lDK: limite inferior da Classe Dk N : tamanho da amostra h : amplitude da classe nDK: freqncia da classe N(ant): freqncia acumulada da classe

    hn

    NKN

    lDK

    KD

    ant

    DK

    +=)(10

    PUC Minas Virtual 55 Probabilidade e Estatstica

  • Percentis:: dividem a distribuio em 100 partes iguais.

    Pi = centil i=1,2,3, , 99

    1 Passo: Calcula-se em que K = 1,2,3,4,............98,99

    2 Passo: Pela Nac identifica-se a classe Pi

    3 Passo: Aplica-se a frmula

    lPK: limite inferior da classe em que, K = 1,2,3,...,98,99. N : tamanho da amostra N(ant): freqncia acumulada anterior classe h : amplitude da classe nPK: freqncia da classe

    hn

    NKN

    lPK

    KP

    ant

    PK

    +=)(100

    Exemplo:

    1- Num acampamento infantil, foram obtidas as seguintes estaturas:

    Estaturas 120|--- 128 128|---136 136|--- 144 144|--- 152 152|--- 160

    frequencia 6 12 16 13 7

    Calcule:

    a) O 1 Quartil (Q1);

    b) o 4 Decil (D4);

    Soluo:

    Primeiro vamos estruturar a tabela de distribuio de Freqncias, como esta-

    mos trabalhando com intervalos de classe , temos que calcular os pontos m-

    dios de cada classe. Depois iremos utilizar as frmulas para cada item que que-

    remos calcular.

    PUC Minas Virtual 56 Probabilidade e Estatstica

  • i Estaturas (cm) n N Xi (Ponto mdio)

    1 120|--- 128 6 6 124

    2 128 |--- 136 12 18 132

    3 136 |--- 144 16 34 138

    4 144 |--- 152 13 47 148

    5 152 |--- 160 7 54 156

    Total 54

    a) Calculo de Q1,

    Para calcular Q1, temos que primeiro identificar a classe que esta o valor, para

    isto consideramos :

    5,134

    544

    ==N

    , que vamos neste momento arredondar para 14, pela frequencia

    acumulada procuramos a classe que encontra o 14 elemento, que a 2 classe

    com limites de 128 |--- 136.

    Agora usamos a formula para calcular Q1

    hn

    Nn

    lQQ

    ant

    Q .4

    1

    11

    +=

    Onde:

    linf : limite inferior da classe do quartil considerado = 128

    hQ: intervalo de classe do quartil considerado = 8

    nQ : freqncia simples absoluta do quartil considerado = 12

    Nant : freqncia acumulada anterior classe do quartil considerado =6

    Substituindo estes valores na expresso acima temos

    ( ) 1338*12

    65,131281 =

    +=Q

    PUC Minas Virtual 57 Probabilidade e Estatstica

  • b) Calculo de D4

    Primeiro identificamos a classe que esta o valor;

    276,2110

    54410

    ===xKN

    , atravs da freqncia acumulada identificamos a clas-

    se que encontra o 27 , que a 3 classe com limites de 136 |--- 144

    Agora usamos a frmula

    hn

    NKN

    lDK

    KD

    ant

    DK

    +=)(10

    onde:

    8

    S

    lDK: limite inferior da Classe Dk = 136 N : tamanho da amostra = 54 h : amplitude da classe = 8 nDK: freqncia da classe = 16 N(ant): freqncia acumulada da classe anterior = 1

    ubstituindo estes valores na expresso acima temos:

    ( ) 8,1378*16

    186,211364 =

    +=D

    PUC Minas Virtual 58 Probabilidade e Estatstica

  • UNIDADE 5

    Medidas de Disperso

    5.1. Disperso 5.2. Assimetria 5.3. Curtose

    A interpretao de dados estatsticos exige que se realize um nmero

    maior de estudos, alm das medidas de posio. Nesta unidade, vere-

    mos que as medidas de disperso servem para verificar a representati-

    vidade das medidas de posio, que o nosso principal objetivo.

    5.1. Disperso

    So medidas estatsticas utilizadas para avaliar o grau de variabilidade, ou disper-

    so, dos valores em torno da mdia. Servem para medir a representatividade da

    mdia.

    Absoluta

    Amplitude (A)

    Varincia (S2)

    Desvio padro (S)

    Relativa

    Coeficiente de Variao (CV)

    PUC Minas Virtual 59 Probabilidade e Estatstica

  • Amplitude Total (A)

    a diferena entre o maior e o menor dos valores da srie. A utilizao da amplitu-

    de total como medida de disperso muito limitada, pois sendo uma medida que

    depende apenas dos valores externos, instvel, no sendo afetada pela disperso

    dos valores internos.

    Varincia (S2)

    A varincia leva em considerao os valores extremos e os valores intermedirios,

    isto , expressa melhor os resultados obtidos. A varincia relaciona os desvios em

    torno da mdia, ou, mais especificamente, a mdia aritmtica dos quadrados dos

    desvios.

    Dados Brutos Dados Agrupados

    222

    11

    = n

    nxn

    nxS iiii

    1

    )( 2_

    12

    = =

    n

    xxS

    i

    n

    i

    Onde temos que:

    Para dados agrupados sem intervalo de classe, xi o valor da varivel.

    Para dados agrupados com intervalo de classe, xi o ponto mdio da classe.

    Para dados amostrais, o denominador n-1; para dadospopulacionais, usamos no denominador o valor de n.

    Sendo a varincia calculada a partir dos quadrados dos desvios, ela um nmero

    em unidade quadrada em relao varivel em questo, o que, sob o ponto de

    vista prtico, um inconveniente; por isso, tem pouca utilidade na estatstica des-

    critiva, mas extremamente importante na inferncia estatstica e em combinaes

    de amostras.

    PUC Minas Virtual 60 Probabilidade e Estatstica

  • Desvio Padro (S)

    O desvio-padro a medida mais usada na comparao de diferenas entre conjuntos de

    dados, por ter grande preciso. O desvio padro determina a disperso dos valores em rela-

    o mdia e calculado por meio da raiz quadrada da varincia.

    2SS =

    Coeficiente de Variao (CV)

    Trata-se de uma medida relativa de disperso til para a comparao em termos

    relativos do grau de concentrao. O coeficiente de variao a relao entre o

    desvio padro (S) e a mdia x . da mdia de sries distintas.

    xSCV =

    Diz- se que uma distribuio tem:

    Baixa disperso: CV 15%

    Mdia disperso: 15%< CV

  • Simetria

    MdMoX ==

    Toda distribuio deformada sempre assimtrica. Entretanto, a assimetria pode

    dar-se na cauda esquerda ou na direita da curva de freqncias.

    Em uma distribuio assimtrica positiva, ou assimetria direita, tem-se:

    Assimetria direita (ou positiva)

    XMdMo

  • Existem vrias frmulas para o clculo do coeficiente de assimetria. As mais utiliza-

    das so:

    1 Coeficiente de Pearson

    SMoxAS =

    2 coeficiente de Pearson

    13

    31 2QQMdQQAS

    +

    =

    Quando

    5.3. Curtose

    Curtose o grau de

    uma distribuio padr

    camos trs tipos de c

    Mesocrtica: um

    AS = 0, diz-se que a distribuio simtrica.

    AS > 0, diz-se que a distribuio assimtrica positiva ( direita)AS > 0, diz-se que a distribuio assimtrica positiva ( direita)

    achatamento

    o (chamada

    urvas de freq

    a curva bsic

    PUC Minas Virtu

    Mo: valor modal (moda)S : Desvio padro X : Mdia

    Q1 : valor do 1 Quartil Q3 : valor do 3 QuartilMd : valor da Mediana

    (ou afilamento) de uma distribuio em comparao com

    curva normal). De acordo com o grau de curtose, classifi-

    ncia:

    a de referncia chamada curva padro ou curva normal;

    al 63 Probabilidade e Estatstica

  • Platicrtica: uma curva mais achatada (ou mais aberta) que a curva normal;

    Leptocrtica: uma curva mais afilada que a curva normal;

    Para medir o grau de curtose utiliza-se o coeficiente:

    Q1 : valor do 1 Quartil Q3 : valor do 3 Quartil P10 : valor do percentil 10 P90 : valor do percentil 90

    )( 109013

    2 PPQQK

    =

    Se K= 0,263, diz-se que a curva correspondente distribuio de freqncia

    mesocrtica.

    Se K > 0,263, diz-se que a curva correspondente distribuio de freqncia

    platicrtica.

    Se K < 0,263, diz-se que a curva correspondente distribuio de freqncia leptocrtica.

    PUC Minas Virtual 64 Probabilidade e Estatstica

  • UNIDADE 6

    Probabilidade

    6.1. Experimento aleatrio, espao amostral e eventos 6.2. Probabilidade: Definio clssica; Probabilidade e

    freqncia relativa 6.3. Tipos de eventos 6.4. Axiomas de Probabilidade 6.5. Probabilidade condicional e independncia de eventos

    Nesta unidade, vamos ver que a probabilidade expressa por meio de va-

    lores numricos as possibilidades da ocorrncia dos resultados de um

    fenmeno. So objetivos desta unidade:

    Definir e determinar os possveis espaos amostrais de determinados

    fenmenos;

    Determinar a probabilidade de ocorrncia de um determinado fen-

    meno.

    Formar um conhecimento slido dos valores probabilsticos que sero

    utilizados nas prximas unidades.

    6.1. Experimento aleatrio, espao amostral e eventos

    Introduo

    Todas as vezes que se estudam fenmenos de observao, cumpre-se distinguir o

    prprio fenmeno e o modelo matemtico (determinstico ou probabilstico) que

    melhor o explique.

    Os fenmenos estudados pela estatstica so fenmenos cujo resultado, mesmo em

    condies normais de experimentao, varia de uma observao para outra, dificul-

    tando dessa maneira a previso de um resultado.

    A observao de um fenmeno casual recurso poderoso para se entender a varia-

    bilidade do mesmo. Entretanto, com suposies adequadas e sem observar direta-

    mente o fenmeno, podemos criar um modelo terico que reproduza de forma bas-

    PUC M