introdução à estatística

94
Universidade Federal de Santa Catarina Centro Sócio–Econômico Departamento de Ciências Econômicas Curso de graduação em Ciências Econômicas a distância Introdução à Estatística José Francisco Fletes

Upload: enzomassignan

Post on 09-Nov-2015

26 views

Category:

Documents


1 download

DESCRIPTION

Livro texto utilizado na disciplina de Introdução à Estatística do curso de Ciências econômicas EAD UFSC. Autor José Francisco Fletes

TRANSCRIPT

  • Universidade Federal de Santa CatarinaCentro ScioEconmico

    Departamento de Cincias Econmicas

    Curso de graduao em Cincias Econmicasa distncia

    Introduo EstatsticaJos Francisco Fletes

  • F615e Fletes, Jos Franciso

    Introduo Estatstica. / Jos Franciso Fletes. - Florianpolis : Departamento de Cincias Econmicas/UFSC, 2009. 94p. : il Curso de Graduao Cincias Econmicas Inclui bibliografia

    ISBN 978-85-7426-064-8

    1. Anlise descritiva. 2. Anlise exploratria. 3. Amostragem. 4. Hipteses. 5. Educao a distncia I. Universidade Federal de Santa Catarina.Departamento de Cincias Econmicas. II. Ttulo.

    CDU: 519

    Universidade Federal de Santa Catarina, Sistema UAB. Nenhuma parte deste material poder ser reproduzida, transmitida e gravada, por qualquer meio eletrnico, por fotocpia e outros, sem a prvia autorizao, por escrito, dos autores.

  • Presidente da RepblicaMinistro da Educao

    Secretrio de Educao a DistnciaCoodenador Nacional da Universidade Aberta do brasil

    ReitorViceReitor

    Pr-Reitor de Desenvolvimento Urbano e SocialPr-Reitora de Assuntos EstudantisPr-Reitora de Pesquisa e Extenso

    Pr-Reitora de Ps-GraduaoPr-reitor de Ensino de Graduao

    Coordenadora de EAD/PREGSecretrio de Planejamento e Finnaas

    Secretrio de Cultura e ArteCoordenador UAB - UFSC

    DiretorVice-Diretor

    Chefe do DepartamentoSub-Chefe do Departamento

    Coordenador Geral na modalidade a distncia

    Luiz Incio Lula da SilvaFernando HadadCarlos Eduardo BielschowskyCelso Costa

    lvaro Toubes PrataCarlos Alberto Justo da SilvaLuiz Henrique Vieira SilvaCludio Jos AmanteDbora Peres MenezesMaria Lucia de Barros CamargoYara Maria Rauh MullerEleonora Milano Falco VieiraLuiz AlbertonMaria de Lourdes Alves BorgesCcero Barboza

    Ricardo Jos Arajo OliveiraAlexandre Marino Costa

    Helton Ricardo OuriquesLuiz Carlos de Carvalho JniorRabah Benakouche

    Universidade Federal de santa Catarina

    GOvernO Federal

    dePartaMentO de CinCias eCOnMiCas

    CentrO sCiO-eCOnMiCO

  • eqUiPe de PrOdUO de Material

    Coordenao de Design InstrucionalDesign Instrucional

    Reviso Textual

    Coordenao de Design GrficoDesign Grfico

    Ilustraes

    Design de Capa

    Projeto Editorial

    Fernanda Pires TeixeiraMrcia MeloJlio Csar Ramos

    Giovana SchuelterAndr Rodrigues da SilvaFrancielli SchuelterRafaella Volkmann Paschoal

    Aurino Manuel dos Santos Neto

    Guilherme Dias SimesFelipe Augusto FrankeSteven Nicols Franz Pea

    Andr Rodrigues da SilvaFelipe Augusto FrankeMax VartuliSteven Nicols Franz Pena

  • Unidade 1Anlise descritiva e exploratria de dados

    1.1 Fundamentos bsicos ............................................................................................11Por que estudar Estatstica? ....................................................................................11Diferena entre Estatstica e Estatsticas ........................................................... 12Conceitos Bsicos em Estatstica ......................................................................... 13Variveis: tipos e escalas de medida ................................................................... 14Amostragem ............................................................................................................... 18

    1.2 amostragem ..........................................................................................................18Fundamentos bsicos .............................................................................................. 18Amostragem .............................................................................................................. 20Conceito de amostragem ...................................................................................... 20Caractersticas das amostras ................................................................................ 20Plano amostral ............................................................................................................ 21Tamanho da amostra ...............................................................................................22Tipos de amostras .....................................................................................................23Erros potenciais de pesquisa ................................................................................ 26Questes ticas ......................................................................................................... 26

    1.3 descrio e explorao de dados ..................................................................... 28Fundamentos Bsicos ............................................................................................. 28Distribuies ou tabelas de frequncias .......................................................... 29Medidas de resumo ou de sntese ......................................................................35Medidas de tendncia central ou de posio ou de localizao .............37Esquema dos cinco nmeros o box-plot ................................................ 42Medidas de disperso ou de variao .............................................................. 43

    Unidade 2Teoria da probabilidade e modelos matemticos bsicos

    2.1 probabilidade ........................................................................................................51Fundamento bsico .................................................................................................. 51Conceitos de Probabilidade ................................................................................. 54Teoremas fundamentais de probabilidade ..................................................... 59

    2.2 VariVel aleatria e distribuies de probabilidade .........................................66Conceito de varivel aleatria e tipos ...............................................................66Valor esperado de uma Varivel Aleatria Conceito geral ........................ 69Varincia de uma varivel aleatria conceito geral ...................................... 71Modelos matemticos probabilsticos .............................................................. 71

  • Unidade 3Inferncia estatstica

    3.1 estimao de parmetros ................................................................................... 75Fundamentos bsicos ..............................................................................................75Propriedades de um estimador ............................................................................76Erro amostral () .........................................................................................................77Distribuio amostral de mdias .........................................................................79Erro padro da mdia ..............................................................................................81Intervalos de confiana .......................................................................................... 82

    3.2 teste de hipteses ................................................................................................84Fundamentos bsicos ............................................................................................. 84Erros num teste de hipteses ..............................................................................86Etapas bsicas de um teste de hiptese ...........................................................87

  • Palavra do Professor

    Prezado (a) acadmico (a) do Curso de Cincias Econmicas:

    Seja bem-vindo (a) Estatstica!

    Voc est iniciando uma viagem que considero fascinante! E espero que esta seja a sua opinio medida que for descobrindo as diversas paisagens que a disciplina ir nos permitir.

    Parafraseando Galileu Galilei, aprenderemos a lidar com a linguagem do universo, a matemtica aplicada ao nosso cotidiano pessoal e profissional, para entender melhor a realidade.

    Nesta disciplina teremos como foco principal a viso prtica baseada na inter e na transdisciplinaridade como base da apropriao autnoma e independente, construindo novos conhecimentos em seu fazer cotidiano.

    com esse esprito que voc ir resolver problemas concretos oriundos do seu dia a dia, comeando pela sua casa (oikia ou domus) resgatando assim a origem da disciplina economia (oiko nomos), buscando inte-grar a teoria com a prtica, bem como as diversas disciplinas com que a Estatstica tem uma relao direta (Econometria, por exemplo) e indireta (Auditoria, Teoria da deciso, Logstica, Teoria dos jogos, Controle esta-tstico de qualidade,).

    Espero que nesta jornada, consigamos desfrutar de resultados prazerosos e que um novo degrau pessoal e profissional seja a continuidade do que representa a vida nas suas descontinuidades.

    Estou sua inteira disposio para dirimir quaisquer dvidas na soluo de problemas reais que voc ir enfrentar.

    Mais uma vez, bem-vindo jornada da Estatstica!

    Prof. Jos Francisco Danilo de Guadalupe Correa Fletes

  • 1

  • 11

    anlise desCritiva e exPlOratria de dadOsA Anlise descritiva de dados considerada a fase inicial do processo no estudo das unidades coletadas de uma ou mais amostras. Nesta etapa, utilizar-se-o tcnicas que resumem (ou sintetizam) e classificam os dados de forma a obter as informaes que sero utilizadas na etapa de Inferncia Estatstica (Unidade 3).

    A Anlise exploratria uma filosofia que privilegia a percepo grfica visan-do a um melhor discernimento do comportamento dos dados, bem como para descobrir padres, anomalias e desenvolver modelos matemticos adequados aplicados na teoria das probabilidades e na Inferncia Estatstica.

    1.1 FUndaMentOs bsiCOs

    1.1.1 Por que estudar estatstica?H um sculo, H. G. Wells dizia Raciocinar estatisticamente ser um dia to necessrio quanto a habilidade de ler e escrever. Na atualidade, a questo colocada para profissionais que lidam com dados e informao de como utilizar o que se tem dis-ponvel para tomar melhores decises.

    Estuda-se Estatstica porque o instrumento em trabalhos de pesquisa que requerem a anlise de dados, em que o pesquisador ou o cientista:

    Precisa saber como apresentar e descrever dados para resumi-los em in-formaes de forma adequada.

    Precisa saber como tirar concluses a partir de uma ou mais populaes com base nos dados e informaes obtidos de uma ou mais amostras.

    Precisa saber como melhorar processos de sua rea de atuao.

    Estuda-se Estatstica para aplicar seus conceitos como instrumento nas tomadas de decises diante de incertezas, justificando-se cientificamente tais decises.

    A Estatstica compreende o planejamento e a execuo de pesquisas, a descrio e explorao dos dados e a formulao de predies com base nesses resultados.

    Unidade 1

  • 12

    Palavra do Professor

    Todos os conceitos e princpios estatsticos que iro ser abordados aqui so utili-zados em vrias situaes reais, como nas aes governamentais, nos negcios, na indstria, nas reas das cincias sociais, biolgicas e da sade.

    1.1.2 diferena entre estatstica e estatsticasMuitas pessoas confundem a palavra Estatstica, no singular, e estatsticas, no plural considerando-as, na linguagem cotidiana, como sinnimos. Como um profissional que aplique os conceitos e princpios da disciplina, voc, futu-ro economista, precisa saber as diferenas entre uma e outra; por isso vamos detalhar a seguir:

    Estatstica, no singular, refere-se a um conjunto de tcnicas e mtodos que entre outros tpicos pressupe o planejamento, a coleta, o processamento dos dados, a anlise dos resultados-informaes, a inferncia, se for o caso, e a disseminao das informaes.

    O desenvolvimento e o aperfeioamento de tcnicas de obteno e de anli-se de dados permitem o controle e o estudo adequado de fenmenos, fatos, eventos e ocorrncias em diversas reas do conhecimento. A Estatstica tem por objetivo fornecer mtodos e tcnicas para lidarmos, racionalmente, com situaes sujeitas a incertezas.

    Estatsticas, no plural, refere-se a registros de dados estatsticos que tm por finalidade precisa melhor delimitar um determinado fenmeno ou fato para melhor control-lo ou nele intervir. Progressivamente, esta finalidade social e poltica se desdobraram numa finalidade cientfica, que a de melhorar o conhecimento de certos fenmenos sociais ou humanos.

    A crena na ideia de que um conhecimento quantificado dos fatos da socie-dade permite melhor conhec-los e eventualmente modific-los muito pro-missora, tanto para os administradores do Estado quanto para os cientistas.

    Introduo Estatstica

  • 13

    Saiba Mais

    Acesse:

    http://www.ence.ibge.gov.br/estatistica/default.asp

    http://www.estatistica.ccet.ufrn.br/

    !

    1.1.3 conceitos Bsicos em estatsticaA estatstica possui termos especficos relativos s fases de uma pesquisa e os tipos de anlise ou procedimento adotados, alm da origem do conjunto de dados. Alguns termos so por demais conhecidos por serem frequentemente utilizados ou citados no dia a dia do pesquisador. Outros, todavia sero apre-sentados e discutidos ao longo do texto, quando de sua utilizao ou descrio.

    Alguns termos mais usuais, dentro da proposta do curso, esto descritos, a seguir, para familiarizar o leitor com o linguajar estatstico.

    Parmetro: uma medida obtida para um conjunto de dados que coletou ca-ractersticas ou valores para todo o grupo populao. Os parmetros com os quais iremos lidar na disciplina so: a mdia da populao (), a varincia da populao (2) e a proporo de sucesso da populao ().

    Estimador ou Estatstica: uma medida obtida para o subconjunto de da-dos ou amostra. Os estimadores ou estatsticas com os quais iremos lidar na disciplina so: a mdia da amostra ( X ), a varincia da populao (s2) e a proporo de sucesso da populao (p).

    Populao ou Universo experimental: o conjunto total de itens, objetos ou pessoas, entes, enfim, que se pretendem analisar ou buscar levantar dados que vo gerar informaes.

    Amostra: uma parte ou subconjunto dos elementos do grupo, definida pre-viamente e obtida atravs de regras a fim de que seja significativa (quanto ao nmero de elementos) e se mostre representativa (possua basicamente as mesmas caractersticas) do todo.

    A relao entre as medidas obtidas num estudo envolvendo a populao ou uma parte dela (amostra) est resumida na Figura 1.1, veja:

    Unidade 1

  • 14

    Populao Amostra

    Amostrage

    Inferncia

    X=Varivel de Estudo

    X1, X2, X3, ..., Xn n observaes de X

    =? X

    Figura 1.1 - Relaes observadas em estudos da populao ou por amostragem.

    Fonte: Elaborado pelo autor

    1.1.4 variveis: tiPos e escalas de medidaAs variveis resultantes de um levantamento estatstico podem ser classificadas basicamente em: qualitativas (nominais e ordinais), quantitativas (discretas e contnuas) e de escala.

    No caso de escala, empregadas em mtodos de pesquisa de Survey, existem as es-calas de Likert, de Bogardus, Thurstone e de Guttman (BABBIE, 2005, p.232-240).

    Classicao dasVariveis

    Nominais:Apenas para identicar com nome as categorias.

    Ordinais: possvel ordenar

    as categorias.

    Discretas:Conjunto limitado

    de valores

    Contnuas:Qualquer valor num intervalo de valores

    Qualitativas:As observaes so

    atributos ou caractersticas possveis

    de observao nos elementos amostrados.

    De Escala:As observaes

    representam atitudes, valoraes ou

    sentimentos em relao

    questo investigada.

    So nmeros resultantes

    de contagens ou medidas dos

    elementos amostrados.

    Figura 1.2 Classificao das variveis quanto aos possveis valores.Fonte: Elaborado pelo autor

    Introduo Estatstica

  • 15

    Ainda sobre as variveis envolvidas no estudo importante ter claro o nvel de medio (FOX & LEVIN, 2004 p. 10) delas, pois os procedimentos ou a tcnica estatstica a ser utilizada dependem dessa medio.

    Nvel nominal:

    Este nvel envolve o simples ato de nomear ou rotular um item resultante da observao de uma varivel. A varivel pode assumir categorias ou classifi-caes, mas estas no possuem hierarquia apenas estabelecem preferncia. O resultado faz parte de uma ou outra categoria no sendo mais ou menos relevante, importante ou prioritria na observao.

    Exemplo 1.1.1: Sexo, Naturalidade, Curso, Filiao partidria, Tipo de seguro que possui.

    Nvel ordinal (ou de rank):

    Se uma varivel do tipo nominal permitir estabelecer para cada uma das catego-rias ou classificaes obtidas uma relao de ordem ou de hierarquia, teremos ento uma varivel ordinal. A relao pode ser do tipo maior do que, mais importante, mais caro. O resultado de cada observao estabelece uma ordem (ou rank) em que categoria ser alocada numa posio de escala de valorao.

    Exemplo 1.1.2: Classe social, Escolaridade, Fase no curso, Nvel de satisfao de clientes, Classificao de filmes.

    Nvel intervalar:

    uma escala ordenada em que a diferena entre as medies representa uma quantidade significativa. Por exemplo, ao meio-dia, uma leitura de temperatu-ra de 32C dois graus Celsius mais quente do que uma leitura de temperatura de 30C. Alm disso, a diferena tem o mesmo significado em qualquer ponto da escala.

    Exemplo 1.1.3: Temperatura (em graus Celsius ou Fahrenheit), Calendrio (Gregoriano, Hebraico ou Islmico).

    a) Nvel de razo (ou de proporcionalidade):

    Se numa varivel, alm de as diferenas serem significativas e iguais em todos os pontos da escala, existir um ponto de partida inerente (um zero verdadei-ro) de modo que as proporcionalidades das medies sejam sensveis para se considerar, ento a escala uma escala de razo ou de proporcionalidade.

    Unidade 1

  • 16

    Exemplo 1.1.4: Altura (em cm ou polegadas), Peso (em kg ou lb), Idade (em anos ou dias), Salrio (em R$ ou US$)

    Observao importante: a temperatura um caso sutil, pois as escalas Celsius ou Fahrenheit so escalas de intervalo e no de proporcionalidade, j que a demarcao do zero arbitrria, no real. No entanto, quando medida a partir de um zero absoluto, como na escala Kelvin, a temperatura est numa escala de proporcionalidade.

    Na maioria das situaes, podemos classificar as variveis com nveis de men-surao nominal ou ordinal como qualitativas, enquanto que aquelas com nveis intervalar ou de razo, como quantitativas.

    Deve-se destacar que algumas variveis podem ser observadas (medidas) por mais de um nvel, dependendo do objetivo da anlise.

    Por exemplo, pode-se perguntar a um usurio de algum servio sobre a sua satisfao com o servio oferecido. Se for utilizada uma escala intervalar pode-se pedir que atribua uma nota de zero a dez; j no caso de uma es-cala ordinal, a classificao pode ser feita por uma escala do tipo Insatisfeito, Pouco Satisfeito, Satisfeito, Muito Satisfeito.

    iMPOrtante:

    A Necessidade de definies operacionais

    Independentemente do nvel de medio das variveis, definies operacionais so necessrias para obter a resposta apropriada ou alcanar o produto apropriado.

    No contexto de uma pesquisa, numa pergunta Qual a sua idade?. Para evitar problemas de ambiguidade, deve-se desenvolver uma definio ope-racional para as respostas pergunta. Por exemplo, deve-se deixar claro se a idade seria ao aniversrio mais prximo ou ao ltimo aniversrio, uma vez que, se seu aniversrio no prximo ms, voc provavelmente escolheria o prximo aniversrio se fosse completar 21 anos; no entanto, iria escolher sua idade atual se estivesse completando 60 anos!

    Encerramos esta seo. Faa a autoavaliao proposta a seguir e avalie seu pr-prio aprendizado. Caso perceba que alguns pontos no ficaram claros para voc, releia o contedo. Se a dvida persistir, solicite ajuda de seu tutor. No siga em frente com dvidas, pois isso pode comprometer todo o seu aprendizado.

    Uma definio operacional fornece um significado para um conceito ou varivel que pode ser comunicado a outros indi-vduos. algo que tem o mesmo significado ontem, hoje e amanh para todos os indivduos.

    Introduo Estatstica

  • 17

    Atividade de Aprendizagem 1.1

    Orientao: Este um exerccio individual e deve ser encaminhado para o tutor da disciplina.

    Atividade 1.1.1: Prepare uma definio operacional para cada um dos itens abaixo:

    a) um dia agradvel;

    b) um bom zagueiro;

    c) um desempenho extraordinrio;

    d) um aluno esforado;

    e) pede-se no fumar e proibido fumar;

    f ) um indivduo dinmico;

    g) uma aula montona;

    h) um livro interessante;

    i) tempo de percurso para o trabalho;

    j) a chegada do transporte coletivo no horrio.

    Atividade 1.1.2: Desafio individual: um caso prtico

    No seu municpio, os postos de combustveis afixam os preos em local visvel ao consumidor.

    Um grupo de pessoas numa reunio social em que voc participa comenta que os preos praticados pelos postos praticamente demonstram que no h concorrncia entre eles. Isto , os preos so uma constante. Voc diante desse comentrio ir verificar com dados que mostrem essa evidncia. Para isso planeja uma coleta de preos, considerando uma srie de caractersticas sobre a situao:

    1 Elabore uma planilha para a coleta dos preos e registre o valor para cada tipo de combustvel, segundo a localizao e a bandeira do posto. Assim, a planilha contemplaria:

    PoSTo A B C ... V wBAIRRo

    BANDEIRA

    gASolINA CoMUM

    gASolINA ADITIVADA

    DIESEl

    lCool

    oBSERVAo

    Na observao: registre o endereo do posto e alguma caracterstica especfica do estabelecimento.

    Unidade 1

  • 18

    2 Faa a coleta dos preos considerando os diversos bairros da cidade e as vrias bandeiras concorrentes.

    3 Qual seria uma amostra significativa? Vamos coletar no mnimo em trinta (30) postos de combustveis. Considere que o acesso ao preo, neste caso, fcil e rpido, pois a tabela exposta ao pblico.

    obs.: nas prximas sees vamos abordar como analisar os dados coletados.

    Atividade 1.1.3: Continuidade do caso prtico (aps a coleta dos dados)

    Digite os dados coletados numa planilha Excel (extenso .xls), reproduzindo a plani-lha de dados acima (nas linhas os postos e nas colunas as caractersticas levantadas). Identifique a planilha: CoMBUSTVEIS.

    Acesse o SestatNet e importe os dados, salvando no seu ambiente de trabalho.

    Saiba Mais

    Para aprofundar os conceitos estudados nesta Unidade consulte:

    http://www.fortunecity.com/skyscraper/deschutes/745/id20.htm

    http://www.ence.ibge.gov.br/estatistica/default.asp

    http://www.estatistica.ccet.ufrn.br

    !

    Resumo da unidade:

    Nesta seo voc estudou os fundamentos bsicos que permitiro compreender as tcnicas de amostragem no processo de coleta de dados (seo1.2), bem como as tcnicas analticas a serem empregadas no resumo de dados (seo1.3).

    E importante ter claro os conceitos bsicos vistos no item 1.1.3, assim como os tipos de variveis com os quais iremos lidar na anlise dos dados.

    1.2 aMOstraGeM

    1.2.1 fundamentos BsicosExistem situaes especficas em que podemos ter acesso a toda a populao para estudar caractersticas de interesse, o que resulta num estudo por Censo. No entanto, na maioria das situaes, tal procedimento no pode ser realizado, por alguns fatores limitantes:

    Introduo Estatstica

  • 19

    1. por dificuldade de acesso ao dado;

    2. por inviabilidade econmica, devido aos custos envolvidos;

    3. por uma questo de tempo em obter todas as unidades.

    H ainda outras razes ticas (quando os experimentos de laboratrio envol-vem o uso de seres vivos ou em casos de pesquisa com questes de foro nti-mo), quando de inacessibilidade a toda a populao (uma produo industrial qualquer, os acidentados em rodovias federais).

    No estudo de uma populao, uma questo que deve tambm ser considerada quanto ao nmero de elementos que a compe, muitas vezes um nmero infinito ou um nmero muito grande.

    Tendo em vista as dificuldades em observar todos os elementos da populao, selecionaremos alguns deles para formar uma parcela a ser analisada. A essa parte proveniente da populao em estudo denominamos amostra.

    Uma amostra sempre um subconjunto finito de uma populao.

    Figura 1.3 Elementos da populao selecionados para compor a amostra.

    Fonte: Elaborado pelo autor

    Uma amostra usualmente envolve o estudo de uma parcela dos itens de uma populao, enquanto que um censo requer o exame de todos os itens. Embora concentremos nossa ateno nas amostras, conveniente considerar tambm a alternativa do censo. primeira vista pode parecer que a inspeo completa ou total de todos os itens de uma populao seja mais conveniente do que a inspe-o de apenas uma amostra deles. Na prtica, o contrrio quase sempre vlido.

    Qualquer instituto ou entidade de pesquisa recorrer amostragem, por v-rias razes. O custo geralmente o fator determinante para a deciso. Coletar dados e analisar resultados envolve muitos recursos monetrios e humanos;

    Populao (N )

    Amostra (n

  • 20

    claro que quanto maior o nmero de dados a coletar, maior o custo. Outra razo para o emprego de amostragem que o valor da informao dura pouco. Para ser til, a informao deve ser obtida e usada temporalmente. A amostra-gem a alternativa tcnica de se fazer isso.

    1.2.2 amostragemA amostragem utilizada cotidianamente com o propsito de avaliar (inferir) sobre o valor, a qualidade ou caractersticas de determinado item de interesse em uma populao.

    Uma indstria de veculos decide lanar um novo produto no mercado e, buscando caractersticas especficas dos con-

    sumidores, realiza uma clnica*, amostra, (pessoas previamente escolhidas a partir de um perfil de idade, caractersticas de consumo e renda) consideradas entre todos os potenciais compradores (populao) para analisar o produto em questo.

    Uma parte da populao (amostra), tomada com base em critrios estats-ticos possibilita estimar a partir dos resultados, estimativas dessa amostra (valores aproximados) para as caractersticas populacionais de interesse (os parmetros).

    O processo de estimao, que busca o valor do parmetro (, ou ) atravs

    do valor de uma estatstica ( )pou s ,X ser abordado na Unidade 3.

    1.2.3 conceito de amostragemAmostragem a parte da Estatstica que rene os mtodos e tcnicas adequados para coletar dados de uma populao formando amostras representativas e sig-nificativas, de preferncia aleatrias, que propiciem que os resultados obtidos possam ser generalizados para a populao da qual as amostras foram obtidas.

    1.2.4 caractersticas das amostrasAs amostras devem atender a alguns aspectos para que o sucesso da amostra-gem se reflita numa estimao adequada de resultados o mais aproximado da realidade possvel.

    Clinica: Reunio em que se disponibiliza o produto/bem para os eventuais compradores/consumidores para anlise, comentrios, crticas e/ou sugestes.

    Introduo Estatstica

  • 21

    Representao: a caracterstica de representatividade diz respeito capa-cidade da amostra em reproduzir a populao quanto aos aspectos de suas caractersticas prprias. Assim, por exemplo, se estiver analisando a preferncia pela grade de programao de uma emissora de TV, o sexo, a idade, o grau de instruo, a classe social entre outras devem ser con-sideradas.

    Significao: o tamanho da amostra deve ser suficiente para representar a variabilidade presente na populao e deve ser tanto maior quanto maior for a variabilidade da populao. No exemplo da programao da TV, as caractersticas intrnsecas da populao devem ser consideradas e quantificadas previamente.

    Aleatoriedade: se os elementos que compem a amostra foram obtidos por um processo aleatrio (por sorteio, ao acaso) todos teriam chance de fazer parte da amostra, sendo possvel calcular o erro amostral quan-do da aplicao da tcnica de estimao.

    Palavra do Professor

    Embora nenhum plano de amostragem possa garantir que a amostra seja exata-mente semelhante populao da qual foi extrada, uma amostra aleatria permite estimar o valor do erro possvel, isto , dizer quo prxima est a amostra da popula-o, em termos de representatividade, motivo pelo qual se procura trabalhar com as amostras probabilsticas.

    1.2.5 Plano amostralO plano amostral de uma pesquisa consiste na descrio dos tpicos associada a um levantamento por amostragem:

    Definir o problema a estudar.

    Estabelecer os objetivos: geral e especficos.

    Definir a populao-alvo.

    Limitar os dados a ser coletados.

    Estabelecer o grau de preciso desejada.

    Definir o instrumento para o levantamento dos dados.

    Unidade 1

  • 22

    Definir o mtodo de medida.

    Definir as unidades amostrais.

    Definir a tcnica, o tipo e a forma da amostragem.

    Realizar o pr-teste do instrumento e a verificao preliminar.

    Organizar a estrutura para o trabalho de campo.

    Executar o levantamento dos dados.

    Digitar, criticar e analisar os dados.

    Obter concluses.

    Fazer recomendaes e sugestes para outros trabalhos.

    Elaborar relatrio tcnico e gerencial.

    Divulgar os resultados.

    1.2.6 tamanho da amostraO tamanho da amostra depende de muitos fatores, entre os quais se podem citar a heterogeneidade da varivel em estudo, o tipo de parmetro (=mdia, =proporo, s=desvio padro, entre outros) que se pretende estimar, os recursos fsicos, temporais e materiais disponveis, e fundamentalmente do objetivo de anlise que se pretende realizar com os dados amostrais.

    Dada a complexidade deste estudo, vamos restringi-lo aos casos em que se de-seje estimar mdias ou propores. Assim, busca-se inicialmente o tamanho mnimo de uma amostra para estimar, por exemplo, a proporo de votos em um dado candidato eleio de um municpio, considerando uma amostra aleatria simples.

    Para o clculo do tamanho da amostra necessrio previamente especificar o erro amostral (ou seja, quanto o pesquisador admite, est disposto a errar, na avaliao do parmetro). Este considerado num enfoque probabilstico, considerando que, por maior que seja a amostra, existe sempre o risco de ela possuir caractersticas diversas da populao da qual foi extrada.

    Para uma amostra considerando a estimao de uma proporo vai-se consi-derar a seguinte expresso:

    Introduo Estatstica

  • 23

    n0=1/e2 a qual, como pode ser vista, no leva em considerao o tamanho da populao.

    Vamos considerar os seguintes termos:

    n0 = valor inicial para o tamanho da amostra;

    e = erro amostral considerado;

    N = tamanho da populao (nmero de elementos da populao).

    Agora com o tamanho da populao declarado, pode-se modificar a expresso inicial do tamanho da amostra para a seguinte:

    n=(N* n0)/(N+ n0)1.2.7 tiPos de amostrasExistem basicamente duas espcies de amostras: amostra probabilstica e amostra no probabilstica.

    As populaes das quais as amostras so obtidas podem ser finitas ou infinitas; todavia, as amostras so sempre finitas no interesse de se poder observar e calcu-lar medidas de sntese, elaborar tabelas ou grficos sobre as variveis de interesse.

    1.2.7.1 amostragem ProBaBilsticaUma amostragem ser dita probabilstica, se todos os entes (elementos) da populao tiverem probabilidade conhecida e maior do que zero de pertencer amostra

    Casual ou aleatria simples Neste tipo de amos-tragem, cada elemento da populao tem probabi-lidade conhecida, diferente de zero e idntica dos outros, dada por n/N, de ser selecionado para compor a amostra. Cada elemento da populao deve estar identificado por um nmero ou rtulo. adequada quando a populao tiver um comportamento homogneo com relao varivel principal em estudo.

    Sistemtica Pode ser considerada uma derivao da casual. Se a popu-lao for grande e a amostra necessria ao estudo tambm, o processo de sortear n, de N elementos pode se tornar demorado e a repetio

    Unidade 1

  • 24

    de itens j sorteados podem aparecer seguidamente. Para este procedi-mento os elementos na populao devem aparecem em listas ordenadas.

    Definido o tamanho da amostra n de uma populao de N elementos, uma razo calculada k=N/n, aps o que um nmero entre, um e k, sorteado correspondendo ordem do primeiro elemento na lista a compor a amostra, sendo os demais obtidos pela soma da razo ordem do nmero imediata-mente anterior.

    Estratificada: muito comum que a populao de uma pesquisa seja heterognea com relao aos objetivos da pesquisa, mas possvel iden-tificar grupos dentro da populao, os quais tm caractersticas seme-lhantes dentro do grupo, mas diversas de outros. O estudo est focado na populao; assim, preciso garantir a participao de indivduos na amostra com as mais diversas caractersticas.

    Definidos os estratos, estes passam a ser considerados, cada um, como uma subpopulao diferente, e os elementos que comporo a amostra podero ser obtidos atravs de uma das tcnicas j citadas (simples ou sistemtica), depen-dendo de como a populao est identificada.

    Nesse caso a amostragem estratificada permite trs variaes que so:

    Uniforme: sorteado o mesmo nmero de indivduos em cada estrato.

    Proporcional: o nmero de indivduos que compor a amostra pro-porcional ao tamanho de cada estrato.

    tima: alm do tamanho de cada estrato levada em considerao tam-bm a variao dentro de cada estrato da varivel principal da pesquisa.

    Problemas: A amostragem estratificada mais difcil de ser aplicada por ter-se que previamente definir os estratos, o que exige um bom conhecimento da populao e da distribuio dos elementos dentro dela.

    No caso da estratificada uniforme, temos problema com a relao tamanho amostra x estrato; no caso da proporcional, algum estrato pode ficar mini-mamente representado; e na tima, temos o problema de ter que levantar antecipadamente (antes de tomar os elementos) a variao em cada estrato.

    Os estratos devem, alm de um comportamento homogneo dentro de cada um (e diferenciado de um para outro), ser mutuamente exclusivos e exaustivos. A maior dificuldade em sua aplicao o fato de o conhecimento necessrio sobre a populao na maioria das vezes no existir ou ser muito custoso de obter.

    Exaustivos: cada elemento da populao deve per-tencer a um s estrato, e a unio de todos os estratos restaura a populao.

    Introduo Estatstica

  • 25

    1.2.7.2 amostragem no ProBaBilsticaNas amostragens no probabilsticas, todo ente da populao tem probabilidade maior do que zero, todavia desconhecida, de pertencer amostra.

    A esmo ou sem norma: um processo que pretende simu-lar uma amostra aleatria; todavia no se realiza nenhum sorteio. O pesquisador quer obter itens da populao; contudo, no pos-svel, por qualquer motivo prtico, identificar e numerar cada elemento da populao.

    Intencional ou por julgamento: neste caso o pesquisador deliberada-mente escolhe baseado num pr-conhecimento ou julgamento os ele-mentos da populao que comporo sua amostra. Um problema neste tipo de amostragem o de que na avaliao prvia tenha havido equ-vocos.

    Por cotas: esta parece simular uma amostragem estratificada, s que no so feitos os sorteios. A populao dividida em subgrupos dos quais so tomados os elementos que comporo a amostra de maneira pro-porcional ao tamanho do subgrupo. Um problema que a escolha do elemento da amostra fica a critrio pessoal ou da oportunidade que se oferece ao pesquisador.

    Populao disponvel: quando a totalidade da populao-objeto (aque-la da qual se tem interesse em realizar o estudo) no est acessvel, os elementos que comporo a amostra sero obtidos daqueles acessveis (populao amostrada) e as concluses do estudo dependero da seme-lhana entre as duas.

    Material contnuo: se estiver fazendo uma verificao quanto quali-dade da gua, ao rudo numa indstria, a partculas suspensas em um ambiente qualquer, no h possibilidade de numerar e sortear elemen-tos da populao.

    outros tipos de amostragem probabilstica, aqui no estudados, so: bola de neve, de voluntrios, de populaes infinitas e de estudos comparativos.

    Unidade 1

  • 26

    1.2.8 erros Potenciais de PesquisaO primeiro passo na avaliao da validade de uma pesquisa determinar se ela teve como base uma amostra probabilstica ou no probabilstica.Vimos que o nico modo de realizar inferncias estatsticas corretas de uma amostra para uma populao e interpretar os resultados pelo uso de uma amostra probabilstica. Pesquisas que empregam mtodos de amostragem no probabilstica esto sujeitas a erros (ou vis), embora no intencionais, mas que podem apresentar resultados sem qualquer significado.

    Mesmo quando se empregam mtodos de amostragem probabilstica, as pes-quisas esto sujeitas a erros potenciais, entre os quais:

    1. Erro de abrangncia (ou cobertura), ou vis de seleo, resulta da exclu-so de certos grupos de entes da populao, de modo que eles no tm a chance de ser selecionados na amostra, decorrendo o vis de seleo. Qualquer amostra probabilstica selecionada ir fornecer uma estimati-va das caractersticas da populao-alvo, e no da populao real.

    2. Erro por falta de resposta, ou vis por falta de resposta, resulta da falha em coletar dados de todos os entes da amostra, decorrendo o vis por falta de resposta, pois nem todos os entes se dispem a responder a uma pesquisa.

    3. Erro de amostragem reflete a heterogeneidade ou diferena de oportu-nidade de amostra para amostra, com base na probabilidade de os entes serem selecionados nas amostras em particular.

    4. Erro de medio refere-se falta de exatido das respostas registra-das em instrumento que visam reunir informaes significativas, o que ocorre por deficincia na formulao da pergunta, por um efeito cau-sado pelo entrevistador sobre o informante, ou por causa do esforo realizado pelo informante.

    1.2.9 questes ticasNem todo estudo de pesquisa bom, significativo ou importante, e nem todo estudo de pesquisa tico. Diante desta constatao, devemos nos tornar sau-davelmente cticos e avaliar de forma criteriosa, com esprito crtico, o que lemos e ouvimos. Devemos examinar o objetivo da pesquisa, por que ela foi conduzida, para quem, e ento descart-la se considerarmos que carece de objetividade ou de credibilidade.

    Introduo Estatstica

  • 27

    Consideraes ticas surgem em relao aos erros potenciais que podem ocorrer ao projetar pesquisas que usam amostras probabilsticas.

    Assim, devemos tentar distinguir projetos precrios de projetos an-titicos, pois a chave a inteno!

    Erro de cobertura, ou vis de seleo, torna-se uma questo tica somente se grupos ou entes especficos forem intencionalmente excludos da estrutura da populao, de modo que os resultados da pesquisa tendam a indicar uma posio mais favorvel para o patrocinador.

    Erro por falta de resposta, ou vis por falta de resposta, torna-se uma questo tica somente se grupos ou entes especficos tiverem menor probabilidade de estar disponveis para responder a um modelo de pesquisa, e o patrocinador intencionalmente projetar com intuito de excluir tais grupos ou entes.

    Palavra do Professor

    No entanto, erro de amostragem torna-se uma questo tica em qualquer das si-tuaes antes descritas, pois o patrocinador pode intencionalmente escolher per-guntas direcionadas que iriam conduzir as repostas numa direo especfica. Alm disso, o informante que menospreze o processo de pesquisa pode intencionalmente fornecer falsas informaes enquanto dado a ser analisado.

    Encerramos esta seo. Faa a autoavaliao proposta a seguir e avalie seu prprio aprendizado. Caso perceba que alguns pontos no ficaram claros para voc, releia o contedo. Se a dvida persistir solicite ajuda de seu tutor. No siga em frente com dvidas, pois isso pode comprometer todo o seu aprendizado.

    Atividade de Aprendizagem 1.2

    Orientao: Este um exerccio individual e deve ser encaminhado para o tutor da disciplina.

    Atividade 1.2.1: Uma concessionria de sua cidade tem um showroom para carros. o gerente est pensando em fazer painis de propaganda ao longo da estrada bem movimentada, que o principal acesso cidade onde a concessionria est loca-lizada. Ele est interessado no tipo de carro que passa pela estrada, que seria um indicador do mercado local. Voc contratado, como consultor, para determinar se vale a pena fazer a propaganda, apresentando um relatrio sobre quantos carros do tipo certo passam pela estrada. o que voc proporia em termos de amostragem? Discorra com base no abordado nas sees, at o momento.

    Unidade 1

  • 28

    Atividade 1.2.2: Uma determinada rede de loja de roupas masculina e feminina tem 100 filiais espalhadas pelas diversas regies do pas. o gerente geral deseja aplicar um pequeno questionrio a uma amostra de pessoas que entram na loja. Um dos objetivos traados para a pesquisa determinar a proporo de clientes que fize-ram uma compra, considerando um grau de preciso (erro amostral) de 5%; o ou-tro investigar os mritos da loja em relao aos competidores. Voc contratado com consultor para propor um plano amostral e determinar o tamanho da amostra. Considere que durante a hora do almoo cada loja particularmente cheia e o custo de enviar entrevistadores para todas as filiais proibitivo. Faa tambm qualquer suposio para seu planejamento (por exemplo, a distribuio geogrfica das lojas).

    Saiba Mais

    Para aprofundar os conceitos estudados nesta Unidade, consulte:

    http://www.ence.ibge.gov.br/estatistica/default.asp

    !

    Resumo da unidade:

    Nesta seo voc estudou as principais tcnicas de amostragem. fundamental ter claro os itens que compem um Plano Amostral, para aplic-lo num trabalho de pes-quisa com levantamento de dados, bem como os erros potenciais de pesquisa e as questes ticas com que se defronta o profissional.

    1.3 desCriO e exPlOraO de dadOs

    1.3.1 fundamentos BsicosAps estruturar a tabela de dados (exemplo dos preos dos combustveis seo 1.1) onde se tem linhas e colunas, faa uma primeira leitura dos dados, em que:

    nas linhas, dispem-se as unidades objeto de estudo, procurando como avaliar os semelhantes para agrup-los, e

    nas colunas, dispem-se as variveis de interesse para verificar as asso-ciaes.

    Introduo Estatstica

  • 29

    Assim, a descrio e explorao dos dados tm por finalidade descrever os da-dos observados (amostra) procurando como extrair o mximo de informao.

    Nesta fase utilizam-se:

    a) tcnicas de agrupamento: distribuies ou tabelas de frequncias;

    b) tcnicas grficas: ramo-e-folhas, histograma, curva de frequncia e box-plot (diagrama em caixa);

    c) tcnicas analticas atravs do clculo de medidas de resumo: medidas de tendncia central (ou de posio), de disperso (ou de variao) e de forma (assimetria).

    Objetivos bsicos no emprego dessas tcnicas:

    1. obter o mximo de informao dos dados;

    2. descobrir padres de comportamento ou estruturas bsicas;

    3. identificar anomalias e/ou dados discrepantes (outliers)

    4. obter modelos matemticos adequados (a ser abordado na Unidade 2) que viabilizem a inferncia estatstica (a ser abordado na Unidade 3).

    1.3.2 distriBuies ou taBelas de frequnciasA partir da Tabela de Dados na qual se apresentam os dados brutos coletados e que compe a amostra a ser analisada, a primeira etapa recomendada a de resumir o conjunto de dados em distribuio ou tabela de frequncias.

    Assim,

    Uma distribuio ou tabela de frequncias o agrupamento atravs da organiza-o dos valores observados para a varivel de interesse, em ordem crescente ou de-crescente de grandeza, subdividindo em categorias ou classes, indicando o nmero de ocorrncias em cada classe, relacionando cada valor (ou classe de valores) com a frequncia de ocorrncia.

    Considerando o tamanho da amostra, abordaremos dois casos.

    Caso 1 Amostra menor do que 30 unidades (n < 30), o tratamento aos dados ser SEM PERDA DE INFORMAO, isto , eles sero analisados tal como coletados, obtendo-se a tabela de frequncias.

    Unidade 1

  • 30

    Exemplo 1.3.1: Suponha que voc conseguiu coletar os preos (R$) em dez (10) postos de combustveis, obtendo os dados no site da Agncia Nacional de Petrleo (A.N.P), resultando nos dados abaixo:

    Tabela 1.1 Tabela de Freqncias conjunto de dados

    PoSTo BANDEIRA gASolINA CoMUMgASolINA ADITIVADA lCool

    1 BR 2,599 2,699 1,699

    2 TEXACo 2,579 2,679 1,679

    3 IPIRANgA 2,549 2,649 1,649

    4 BR 2,599 2,659 1,659

    5 IPIRANgA 2,549 2,699 1,699

    6 SHEll 2,599 2,699 1,699

    7 TEXACo 2,579 2,659 1,659

    8 BR 2,599 2,659 1,659

    9 SHEll 2,599 2,659 1,659

    10 BR 2,599 2,699 1,699

    Fonte: ANP

    Desejando analisar o preo da Gasolina Comum, listam-se todos os valores em ordem (crescente ou decrescente), marcando as vezes em que aparece, incluindo as repeties, contando o nmero de ocorrncias de cada valor (fre-quncia absoluta ou frequncia).

    Assim, o preo da Gasolina Comum resultaria em:

    Tabela 1.2 Tabela de Freqncias - preo da gasolina comum

    PREo DA g.C CoNTAgEM FREQUNCIA

    2,549 II 2

    2,579 II 2

    2,599 IIIII I 6

    Fonte: ANP

    Organizada numa tabela de frequncias, sem perda de informao, seria apre-sentada como segue:

    Introduo Estatstica

  • 31

    Tabela 1.3 preo da gasolina comum*

    PREo gAS.CoMUM

    FREQUNCIA (NUM. PoSToS)

    2,549

    2,579

    2,599

    Total

    2

    2

    6

    10

    Fonte: A.N.P

    Atividade de Aprendizagem 1.3a

    Orientao: Este um exerccio individual e deve ser encaminhado para o tutor da disciplina.

    Tarefa individual 1.3.1: Construa a tabela de frequncias, sem perda de informa-o, para os preos dos outros combustveis (gasolina aditivada, lcool e Diesel) da Tabela de dados no Exemplo 1.3.1.

    Caso 2 Amostra mnima de 30 unidades (n 30), o tratamento ser COM PERDA DE INFORMAO, agrupando os dados em Distribuio de frequncias ou Tabela de frequncias (que permite a obteno de um MODELO EMPRICO).

    Nesse caso, os valores da varivel de interesse so subdivididos em Classes (ou intervalos de valores), delimitadas pelo limite inferior e superior do intervalo, utilizando um critrio para o agrupamento, havendo perda de informao j que os valores originais no mais aparecero individualmente, mas em Classes (grupos supostos homogneos). Para cada Classe, o nmero de dados observados registrado, obtendo a frequncia da classe.

    Algumas caractersticas da tabela de frequncias so:

    1. Que cada valor observado deve pertencer a uma, e apenas uma, Classe (isto significa dizer que, as classes so mutuamente exclusivas e exaustivas).

    2. Que as Classes tenham o mesmo intervalo (caracterstica no essencial, porm desejvel para efeitos de anlise dos dados).

    Unidade 1

    * municpio Florianpolis/ SC dez. 08

  • 32

    Construo de uma tabela de frequncias etapas bsicas

    Critrios:

    1. Raiz de n;

    2. de Sturges

    Etapa 1 - Identifique o menor (X1) e o maior valor (Xn) da varivel de interesse.

    Etapa 2 - Calcule a amplitude total (ou Range) dos valores, isto ,

    R = Xn - X1Etapa 3 Calcule o nmero de classes ou intervalos de classe (k) em funo do nmero de valores observados (n). Para isto, existem dois

    critrios empricos.

    Critrio 1 Raiz de n: k = n

    Critrio 2 de Sturges: k = 1 + 3,332* log n

    Observao: o nmero de classes recomendado deve ser de tal forma que os valores no fiquem muito compactados ou muito dispersos. Isto significa que, em termos prticos, recomenda-se um nmero de classes entre 5 e 15, obtido pelo critrio que melhor se ajusta situao a analisar (muito bom senso e senso crtico).

    Etapa 4 Calcule a amplitude de classe ou intervalo de classe (C), dividindo a amplitude total pelo nmero de classes; isto ,

    C = R / k = (Xn - X1) / k

    Observao: arredondar o resultado para um nmero inteiro superior, ou mltiplo de 10, para facilitar a interpretao dos valores.

    Etapa 5 - Construa a distribuio ou tabela de frequncias estabelecendo os li-mites de classes e fazendo a apurao dos dados. Utilize como limite inferior da primeira classe o menor valor observado (ou um inteiro imediatamente inferior), somando ao valor a amplitude de classe para obter o limite superior da primeira classe, isto :

    Li 1 = X1Ls1 = X1 + C

    Introduo Estatstica

  • 33

    Para as classes posteriores, utilizar o processo a seguir:

    Li 2 = Ls1Ls2 = Li 2 + C

    E assim sucessivamente...

    Exemplo 1.3.2 Os dados abaixo se referem ao preo (R$) da gasolina comum em 49 postos de combustveis de vrias cidades do estado de Santa Catarina. Construa a distribuio ou tabela de frequncias com perda de informao, utilizando as etapas anteriores.

    dados Originais

    2,599 2,570 2,580 2,559 2,399 2,599 2,470 2,599 2,540 2,584

    2,577 2,599 2,550 2,639 2,479 2,579 2,499 2,599 2,499 2,590

    2,560 2,449 2,690 2,589 2,599 2,570 2,490 2,459 2,560 2,389

    2,410 2,420 2,430 2,438 2,439 2,450 2,460 2,697 2,470 2,599

    2,599 2,470 2,579 2,499 2,599 2,449 2,639 2,499 2,599 ---

    A varivel a analisar : X = {Preo da gasolina (R$)}; n = 49Etapa 1: X1 = R$ 2,389 X49 = R$ 2,697

    Etapa 2 : R = X49 - X1 = 2,697 2,389 = 0,308

    Etapa 3: k (pela Raiz de n) = 7 classes

    Etapa 4 : C = R / k = 0,308/7 = 0,044

    Etapa 5 : Estabelecer os limites de classes de preos e, fazendo a apurao dos valores em sua classe respectiva, a distribuio de frequncias seria:

    PREoS (R$) APURAo N DE PoSToS

    2,389 | 2,433

    2,433 | 2,477

    2,477 | 2,521

    2,521 | 2,565

    2,565 | 2,609

    2,609 | 2,653

    2,653 | | 2,697

    T o T A l

    ||||

    ||||| |||||

    ||||| |||

    ||||

    ||||| ||||| ||||| ||||

    |||

    |

    4

    10

    8

    4

    19

    3

    1

    49

    Unidade 1

  • 34

    Observaes:

    O smbolo | utilizado para delimitar os valores entre os limites de classes, equivale ao utilizado na matemtica (intervalo fechado esquerda e aberto direita), isto ,

    Li | Ls [Li ;Ls) Li Preo < Ls

    Na ltima classe o intervalo fechado nos dois extremos, pois o maior valor observado coincide com o Ls da classe; do contrrio, teria que considerar mais uma classe e incluir esse valor.

    Ao apurar os dados, identificar cada valor em sua classe, separando de cinco em cinco para melhor identificar a frequncia final.

    A apurao j nos d um grfico que representa as Classes no eixo da abscissa (X) e as frequncias no eixo da ordenada (Y), e denominado de HISTOGRAMA (grfico processado no SEstatnet), como pode ser visualizado abaixo, onde cada classe representada pelo valor central (denominado de ponto mdio de classe, a ser visto adiante).

    2,411 2,455 2,499 2,543 2,587 2,631 2,675

    Con

    tagem

    0

    5

    10

    15

    20

    25

    GCOM

    Atividade de Aprendizagem 1.3b

    Orientao: Este um exerccio individual, deve ser encaminhado para o tutor da disciplina.

    Introduo Estatstica

  • 35

    Tarefa individual 1.3.2: Acesse o SestatNet e no mdulo ANLISE DE DADOS utilize Avaliao da Aprendizagem, aps abrir a base de dados COMBUSTIVEIS. Faa uma anlise denominada DESCRIO e obtenha os histogramas dos preos de cada combustvel, idntico ao grfico acima.

    Consulte o site SEstanet Ensino-aprendizagem de estatstica na web

    http://www.sestatnet.ufsc.br/area_excl.php

    1.3.3 medidas de resumo ou de snteseAs medidas resumo ou de sntese pertencem ao grupo de ferramentas mate-mticas que permitem caracterizar um conjunto de dados sob ponto de vista da tendncia central ou da disperso dos dados estudados. Isso quer dizer, so ferramentas que exibem a relao existente entre os dados coletados em uma pesquisa estatstica e podem ser mais bem explicadas pelo analista com o conhecimento do ambiente de anlise e das diferentes perturbaes que podem alterar o comportamento das caractersticas estudadas tais como: Equipamentos, Mtodos de trabalho, Interpretaes na leitura de medies, Alteraes ambientais, Recursos econmicos e aspectos fsicos limitados. As ferramentas selecionadas para representar essas tcnicas so: Mdia, Moda, Mediana, Varincia, Amplitude e Desvio Padro.

    Vamos ver detalhadamente o que uma medida de resumo.

    1.3.3.1 o que uma medida de resumo? um valor que melhor caracteriza o conjunto de valores da amostra, isto , um valor nico que represente todos os outros valores do conjunto.

    Unidade 1

  • 36

    Na atualidade, com as facilidades de acesso a calculadoras e/ou a compu-tadores, recomenda-se no clculo de uma medida de resumo utilizar os valores originais, principalmente quando se agrupam os valores em distri-buies de frequncias (com perda de informao), pois se realizarmos os clculos a partir desta, perdemos em preciso.

    No caso em que no possvel ter acesso aos dados originais, tendo-se ape-nas a distribuio de frequncias, para o clculo das medidas de resumo, necessrio obter o PONTO MDIO DE CLASSE, que passa a ser conside-rado o valor representativo de cada classe, e dado por:

    Xi = (Li + Ls)/2

    Atividade de Aprendizagem 1.3c

    Orientao: Este um exerccio individual e deve ser encaminhado para o tutor da disciplina.

    Tarefa Individual 1.3.3: Calcule os pontos mdios de classe para a distribuio dos preos de gasolina (Exemplo 1.3.2)

    Utilize o Sestatnet para facilitar a organizao dos dados.

    Consulte o site SEstanet Ensino-aprendizagem de estatstica na web

    http://www.sestatnet.ufsc.br/area_excl.php

    1.3.3.2 classificao das medidas de resumo3. Medidas de tendncia central ou de posio ou de localizao:

    Mdia aritmtica ou Mdia

    Introduo Estatstica

  • 37

    Mediana

    Moda

    Observao: Alm da mdia aritmtica, existe a mdia harmnica, mdia geo-mtrica, mdia quadrtica, mdia bi-quadrtica, mdia cbica.

    4. Medidas de disperso ou de variao:

    Absolutas:

    Amplitude total

    Varincia ou Quadrado mdio

    Desvio padro

    Observao: Tambm existe o desvio mdio e o desvio quartlico.

    Relativa:

    Coeficiente de variao

    Observao: Tambm existe o coeficiente quartlico.

    5. Medida de forma: Assimetria

    1.3.4 medidas de tendncia central ou de Posio ou de localizaoAs medidas de tendncia central, apresentadas a seguir, permitem-nos identi-ficar o valor que melhor sintetiza o conjunto ou distribuio de valores. Cada uma delas tem a caracterstica primordial que se diferencia em funo do comportamento dos dados.

    1.3.4.1 mdia aritmtica ou mdiaNotao: Me ou X (l-se Xis barra)Conceito: a mdia representa o ponto de equilbrio dos dados, j que conside-ra a influncia de todos os valores, distribuindo por igual a soma ou total pelo nmero de valores observados.

    A mdia pode ser: mdia simples, quando obtida para dados sem perda de informao, e mdia ponderada, quando obtida para dados com perda de informao.

    Unidade 1

  • 38

    Frmula matemtica:

    1. Mdia simples (Frmula 1.3.1)

    nx...xx

    n

    x X n21

    n

    1ii +++==

    =

    Aplicao para o Exemplo 1.3.1 dados originais

    = (2,599 + 2,579 + 2,549 + 2,599 + 2,549 + 2,599 + 2,579 + 2,599 + 2,599 + 2,599)/10

    = R$ 2,585

    2. Mdia ponderada (Frmula 1.3.2)

    ( ) ( ) ( ) ( )k21

    kk2211k

    1ii

    k

    1iii

    n...nnnx...nxnx

    n

    nx

    ++++++

    =

    =

    =

    =X

    Note que os xi representam os pontos mdios de classe de uma distribuio de frequncias.

    =

    k

    1iin

    = n (total de valores observados)

    Introduo Estatstica

  • 39

    Aplicao para o Exemplo 1.3.2:

    PREoS (R$) NI XI

    2,389 | 2,433

    2,433 | 2,477

    2,477 | 2,521

    2,521 | 2,565

    2,565 | 2,609

    2,609 | 2,653

    2,653 | | 2,697

    T o T A l

    4

    10

    8

    4

    19

    3

    1

    49

    2,411

    2,455

    2,499

    2,543

    2,587

    2,631

    2,675

    ---

    Observao: os pontos mdios voc pode observar no histograma.

    X=(2,411*4)+(2,455*10)+(2,499*8)+(2,543*4)+(2,587*19)+(2,631*3)+(2,675*1)

    4+10+8+4+19+3+1

    X = R$ 2,532 (mdia ponderada, da distribuio de frequncias, isto , com perda de informao)

    Para verificar a perda de informao, vamos obter a mdia dos dados originais (a mdia simples, ou seja, sem perda de informao).

    X = R$ 2,539

    Erro relativo devido ao agrupamento (r):Atravs do Erro Relativo pode-se avaliar a perda de informao devido ao agrupamento dos dados, calculando a diferena, em valor absoluto, entre a mdia dos dados originais e a mdia dos dados agrupados, dividindo pela mdia dos dados originais.

    r = (|2,539 -2,532|)*100 / 2,539 = 0,27%Qual o significado do resultado?

    Unidade 1

  • 40

    1.3.4.2 mediana (ou Percentil 50)Notao: Md ou P50 (l-se Percentil de 50)Conceito: a mediana, ou Percentil 50, representa o valor do meio dos dados, isto , o valor que divide em duas partes iguais (50/50) o conjunto de dados (sejam os dados originais ou os dados agrupados). uma medida de ordem, pois separa em dois subconjuntos de igual nmero o conjunto original (tam-bm se denomina como uma Separatriz de ordem 50).

    Obteno da mediana:

    1. Para dados originais: Primeiro ordenam-se os dados (crescente ou de-crescentemente) de forma a identificar o valor que subdivide em dois subconjuntos de igual nmero de valores, sendo o valor maior ou igual aos valores do subconjunto inferior e menor ou igual aos valores do sub-conjunto superior.

    Para o exemplo 1.3.1, temos o conjunto ordenado:

    {2,549; 2,549; 2,579; 2,579; 2,599; 2,599; 2,599; 2,599; 2,599; 2,599}

    O valor que divide em dois subconjuntos de igual nmero de valores igual a R$ 2,599.

    2. Para dados agrupados: No caso de dados agrupados (distribuies de frequncias), calcula-se o percentual acumulado de cada classe, de for-ma a identificar a classe que contm o valor que acumula os 50% dos primeiros valores e atravs de uma regra de trs, obtenha o valor que divide em duas subdistribuies, a distribuio original.

    Para o exemplo 1.3.2, tem-se:

    PREoS (R$) NI % % ACUMUlADo

    2,389 | 2,433

    2,433 | 2,477

    2,477 | 2,521

    2,521 | 2,565

    2,565 | 2,609

    2,609 | 2,653

    2,653 | | 2,697

    T o T A l

    4

    10

    8

    4

    19

    3

    1

    49

    8,2

    20,4

    16,3

    8,2

    38,8

    6,1

    2,0

    100,0

    8,2

    28,6

    44,9

    53,1

    91,8

    98,0

    100,0

    ---

    Introduo Estatstica

  • 41

    Observe que a quarta classe contm a mediana, pois h 50% dos valores acumulados.

    Assim, podemos obter a mediana:

    (2,565 2,521)/ 8,2% =(P50 - 2,521) / 5,1%

    P50 = 2,521 + (2,565 2,521) * 5,1% / 8,2%

    P50 = R$ 2,526

    Frmula matemtica:

    P50 = Li50 + (c * )/ p50

    1.3.4.3 moda ou normaNotao: Mo Conceito: a Moda ou Norma de um conjunto ou de uma distribuio de fre-quncias representa o valor (ou valores), se existir (em) que mais se observa (m) ou que (so) mais frequente (s).

    Note que a moda poder no existir, pois se no houver nenhum valor que predomina no conjunto ou na distribuio, no se tem moda, isto , amodal. No entanto, poder existir mais de uma caracterizando o conjunto ou a distri-buio e se diz plurimodal.

    No caso de exemplo 1.3.1, a moda R$ 2,599.

    No caso do exemplo 1.3.2, da distribuio de frequncias, a moda bruta dada pelo ponto mdio da classe de maior frequncia, isto , R$ 2,587.

    Comparao entre as medidas de tendncia central

    A mdia uma funo de todos os valores e influenciada pela magnitude dos valores Me = f (Xi; n)A mediana uma funo do total e da ordem dos valores: Md = f (n)A moda uma funo da maior frequncia: MO = f (nmx)Karl Pearson desenvolveu uma frmula emprica de relao entres as medidas de tendncia central, a mdia, a mediana e a moda. Para aplicar a frmula preciso que algumas condies devam ser satisfeitas e que a relao proposta por Pearson se verifique com maior aproximao:

    Unidade 1

  • 42

    a distribuio (curva) de frequncias deve ser unimodal;

    a) a distribuio de frequncias deve ser levemente assimtrica (uma pe-quena cauda);

    b) o nmero de observaes (n) deve ser suficientemente grande e pequena a escala de unidades que divide a distribuio.

    Satisfeitas tais condies, temos a seguinte relao estabelecida (Frmula 1.3.3):

    X = Mo = 3( X - Md)1.3.5 EsquEma dos cinco nmEros o box-plot A partir do conceito da Mediana (ou Percentil 50) pode-se construir um gr-fico que permite avaliar o comportamento dos dados subdividido em quatro grupos, utilizando cinco nmeros:

    1. o menor valor observado (P0);2. o percentil 25 ou quartil1 (P25);3. o percentil 50 ou quartil2 ou mediana (P50);4. o percentil 75 ou quartil3 (P75);5. o maior valor observado (P100);

    No grfico abaixo, pode ser analisado cada um dos cinco nmeros, onde os limites da caixa (box-plot) representam os Quartis 1 e 3, enquanto a mediana dada pela linha que divide a caixa. Tambm representado o valor da mdia (vista pelo sinal de +).

    806

    643.6

    481.2

    318.8

    154.4

    -6

    CPR

    SEXO

    F M

    Introduo Estatstica

  • 43

    Ao utilizar o Sestatnet, iremos tratar do procedimento de como obter o grfico e as partes componentes.

    1.3.6 medidas de disPerso ou de variaoAs medidas de disperso apresentadas a seguir, nos permitem identificar o valor que mede a distncia ou disperso dos valores em torno da medida de tendncia central.

    1.3.6.1 amPlitude total ou range uma medida de disperso absoluta, pois mede a variao total dos dados e, como j visto, obtida pela diferena entre os extremos.

    R = Xn - X1 Permite comparar conjunto de dados ou distribuies de frequncias avalian-do a disperso total, sem considerar a distncia entre os valores. No entanto, uma medida pouco utilizada por ser instvel, j que influenciada to somente pelos valores extremos, no fornecendo informao sobre o comportamento dos valores intermedirios.

    Exemplo 1.3.3 Conforme os dados da tabela abaixo, em que as colunas de preos da gasolina, comum e aditivada, podem ser considerados conjunto de dados no agrupados, calcule a amplitude de cada conjunto de preos. Interprete o resultado.

    Tabela 1.4 Tabela de Freqncias Gasolina comum e aditivada

    PoSTo BANDEIRA gASolINA CoMUMgASolINA ADITIVADA

    1 BR 2,599 2,699

    2 TEXACo 2,579 2,679

    3 IPIRANgA 2,549 2,649

    4 BR 2,599 2,659

    5 IPIRANgA 2,549 2,699

    6 SHEll 2,599 2,699

    7 TEXACo 2,579 2,659

    8 BR 2,599 2,659

    9 SHEll 2,599 2,659

    10 BR 2,599 2,699

    Fonte: ANP

    Unidade 1

  • 44

    R = Xn - X1

    R (Gas. Comum) = 2,599 2,549 = R$ 0,05

    R (Gas. Aditivada) = 2,699 2,649 = R$ 0,05

    1.3.6.2 varincia ou quadrado mdioNotao: Var (X) que se l, varincia da varivel X de anlise.

    Importante: No caso de populao, utiliza-se o smbolo 2, que se l sigma ao qua-drado. Quando se trata de amostra, um conjunto de dados simples (no agrupados) ou dados agrupados em distribuio de frequncias, utiliza-se s2, que se l esse minsculo ao quadrado

    Conceito: a Varincia ou Quadrado Mdio de um conjunto ou de uma distri-buio de frequncias representa o valor da mdia dos quadrados dos desvios de cada valor em relao sua mdia.

    Note que a varincia uma mdia quadrtica dos desvios; portanto, a unidade de medida passa a ser o quadrado da unidade de medida da varivel de anlise.

    Por exemplo, no caso do preo do combustvel, cuja unidade de medida em R$, a mdia expressa em R$ e a varincia em (R$)2.

    1.3.6.3 desvio PadroNotao: Dp(X) que se l, desvio padro da varivel X de anlise.

    Importante: No caso de populao, utiliza-se o smbolo , que se l sigma. Quando se trata de amostra, um conjunto de dados simples (no agrupados) ou dados agru-pados em distribuio de frequncias, utiliza-se s, que se l esse minsculo.

    Conceito: o Desvio padro de um conjunto ou de uma distribuio de fre-quncias dado pela raiz quadrada da varincia e representa o valor da raiz quadrada da mdia dos quadrados dos desvios de cada valor em relao sua mdia.

    Note que o desvio padro expresso na mesma unidade de medida da varivel de anlise e da mdia, podendo-se interpretar como a distncia mdia dos valores em torno de sua mdia.

    Introduo Estatstica

  • 45

    Frmula matemtica:

    1- Para dados simples (dados no agrupados)

    2- Para dados agrupados (distribuies de frequncias)

    O denominador n 1 da varincia (bem como do desvio padro) deno-minado de graus de liberdade, pois representa a quantidade de comparaes independentes que podem ser feitas entre as n unidades da amostra.

    O princpio dos graus de liberdade muito utilizado na Estatstica e parte da considerao de que as diferenas de cada uma das observaes em relao sua mdia no so independentes, j que a mdia calculada a partir dos valores.

    Assim, quando do clculo da varincia, diz-se que os n graus de liberdade originalmente disponveis no conjunto sofrem a reduo de uma unidade porque uma estatstica, a mdia, j foi calculada dos dados do grupo e aplica-da na determinao da varincia.

    1.3.6.4 coeficiente de variaoNotao: CV (X) que se l, coeficiente de variao da varivel X de anlise.Conceito: o coeficiente de variao de um conjunto ou de uma distribuio de frequncias dado pelo quociente entre o desvio padro e a mdia e repre-senta a disperso relativa dos dados em torno da mdia.

    Frmula matemtica:

    CV (X) = (Desvio padro)/(Mdia)CV (X)...... pode assumir valores entre zero e maior do que um (quando o desvio padro maior do que a mdia)

    Unidade 1

  • 46

    Interpretao: se o coeficiente de variao um valor pequeno (prximo do valor zero), os valores do conjunto ou da distribuio so homogneos; e quando um valor em torno da unidade ou maior, os valores so heterogneos ou muito heterogneos.

    0 < CV (X) <

    Encerramos a seo. Faa a autoavaliao proposta a seguir e avalie seu prprio aprendizado. Caso perceba que alguns pontos no ficaram claros para voc, releia o contedo. Se a dvida persistir, solicite ajuda de seu tutor. No siga em frente com dvidas, pois isso pode comprometer todo o seu aprendizado.

    Atividade de Aprendizagem 1.3d

    Orientao: Este um exerccio individual e deve ser encaminhado para o tutor da disciplina.

    Tarefa Individual 1.3.4: Acesse o SestatNet e obtenha no mdulo de ANlISE DoS DADoS, Ensino-Aprendizagem, a descrio dos dados, calculando as medidas de resumo, bem como os Box-plots para os preos dos combustveis

    Consulte o site SEstanet Ensino-aprendizagem de estatstica na web

    http://www.sestatnet.ufsc.br/area_excl.php

    Saiba Mais

    Para aprofundar os conceitos estudados neste captulo consulte:

    http://www.ence.ibge.gov.br/estatistica/default.asp

    !

    Introduo Estatstica

  • 47

    Resumo da unidade:

    Nesta seo voc estudou as principais tcnicas analticas para o clculo das medi-das de resumo (ou de sntese) de um conjunto de dados, optando por aquelas que melhor representam os dados coletados.

    importante a interpretao de cada uma das medidas, bem como a utilizao de uma ferramenta informtica para obter com maior rapidez os indicadores estats-ticos e os grficos que permitem uma visualizao do padro de comportamento.

    enCerraMentO da Unidade 1

    Nesta unidade, abordamos os tpicos que integram a Estatstica Descritiva e Exploratria de Dados.

    Para a sua maior compreenso, recomendamos o emprego do ambiente de ensino-aprendizagem via Web, atravs do Sistema especialista SestatNet.

    Unidade 1

  • Anotaes

    importante

    d m a

  • 2

  • 51

    teOria da PrObabilidade e MOdelOs MateMtiCOs bsiCOs

    Na Unidade 1 abordamos os princpios da Estatstica Descritiva e Exploratria, organizando e resumindo os dados atravs de indicadores que permitem ter uma ideia do comportamento tpico e sua disperso. Destacamos que na Unidade 3 abordaremos os princpios da Estatstica Indutiva (ou Inferencial), pelos quais, a partir da (s) amostra (s), procura-se obter concluses sobre o (s) parmetro (s) de determinada populao, como um instrumento auxiliar na tomada de deciso em condies de incerteza.

    nessa condio de incerteza que a Teoria da Probabilidade nos fornece os fundamentos que auxiliam na tomada de deciso, quantificando o grau de incerteza e determinando o erro em uma estimao de algo desconhecido (parmetro da populao). Probabilidade o tema de estudo que abordamos nesta Unidade 2.

    2.1 PrObabilidade

    2.1.1 fundamento BsicoA Teoria do Clculo das Probabilidades tem a sua origem em me-ados do sculo XVII, quando dois matemticos franceses trocam correspondncia (Blaise Pascal e Pierre de Fermat) sobre proble-mas formulados por um jogador compulsivo na cidade de Monte Carlo, Chevalier de Mr.

    A partir dos questionamentos de de Mr, Pascal e Fermat realizam estudos de modelos matemticos com base nos jogos de azar (moe-das, dados, baralho e roleta) desenvolvendo uma srie de conceitos que se ampliam na aplicao para outras reas do nosso cotidiano.

    Para o entendimento desses conceitos, utilizaremos os exemplos bsicos dos jo-gos de azar, pois facilitam a compreenso e a manipulao em exerccios. Como ponto de partida, afirma-se que em todo jogo de azar h um fator presente no resultado que incontrolvel e ao qual se lhe atribui como devido ao acaso.

    Unidade 2

  • 52

    Assim, ao realizar uma experincia da qual no se tem controle sobre o re-sultado, diz-se que este se d ao acaso. No entanto, se repeti-la um nmero expressivo de vezes, possvel construir um modelo probabilstico e tomar decises quanto ao processo restrito ao experimento, apenas pelas suas carac-tersticas, sem ser preciso repetir a experincia.

    A prtica indica que muitas situaes experimentais ocorrem em condies consideradas estveis, permitindo a aplicao em vrios ramos da cincia e da indstria por seu comportamento idntico. Assim, o modelo matemtico construdo ao se revelar satisfatrio, emprega-se no estudo de propriedades e na obteno de concluses.

    Exemplo simples: Tome uma moeda (de qualquer valor). Intuitivamente voc sabe qual a proporo de cara e de coroa, isto , voc espera igual nmero de caras e de coroas, ao lanar um determinado nmero de vezes. Se voc lanar por dez vezes, no necessariamente ocorrem 5 faces de cada, e essa diferena entre os resultados atribuda ao acaso. No entanto, se lanar cem ou aumentar para quinhentos ou mil lanamentos, a tendncia se aproximar, medida que aumenta o nmero de repeties, do valor esperado, 50/50, isto , metade cara e metade coroa.

    Atividade de Aprendizagem 2.1a

    Orientao: Este um exerccio individual e deve ser encaminhado para o tutor da disciplina.

    Atividade 2.1.1: atividade individual: Prepare uma planilha para registrar os resulta-dos, por exemplo:

    EXPERINCIA E10 E50 E100

    1 C C C

    2 C C C

    ... ... ... ...

    10 C C C

    11 C C

    ... ... ...

    50 C C

    ... ...

    100 C

    Faa 10, 50 e 100 lanamentos! Anote a sequncia de resultados, cara (C) e coroa (C), compare os resultados quanto proporo de cara e coroa, para cada nmero de lanamentos.

    Introduo Estatstica

  • 53

    Outro exemplo simples: Ao se verificar a qualidade de componentes produzi-dos em uma fbrica, atravs de amostras que so retiradas periodicamente, pode-se prever o percentual de componentes fora do padro (defeituosos) esperados no processo de fabricao, desde que as condies experimentais sejam mantidas. Este processo implica em considerar, na fabricao dos componentes, o emprego da mesma matria-prima, o mesmo equipamento, o mesmo tipo de operrio na manipulao e outras implicaes do estudo realizado para estabelecer o modelo de representao.

    Palavra do Professor

    Pode-se concluir, desses exemplos, que estamos diante de experincias nas quais o experimentador no tem controle sobre os resultados. A esse tipo de experincia se denominam de experincias aleatrias.

    Uma experincia aleatria (a ) constitui toda prova (teste ou ensaio) que tm trs caractersticas bsicas:

    1. Pode ser repetida quantas vezes forem necessrias para avaliar o evento de interesse ou sucesso ( S ), isto , repetidas indefinidas vezes, isto :

    n Vamos denominar esta caracterstica como a repetitividade da experincia aleatria.

    2. Associa-se um Espao Amostral () isto , um conjunto total de pos-sibilidades experincia. Este conjunto tem que ser exaustivo e todos os seus eventos excludentes.

    Exemplo 2.1.1: Jogo de moeda

    Seja a experincia aleatria, a: lanamento de uma moeda equilibrada.

    O espao amostral dado por todos os eventos igualmente poss-veis na moeda, excluindo-se por questes prticas o evento dar a moeda de quina, isto , = {cara; coroa} = {C; C}

    Se o evento de interesse for obter face Cara, S = {C}

    Observe que C representa o evento insucesso ou fracasso (complementar ou contrrio), de C!

    Unidade 2

  • 54

    Exemplo 2.1.2: Jogo de dado

    Seja a experincia aleatria, a: lanamento de um hexaedro (cubo) ou dado equilibrado. O espao amostral dado por todos os eventos igualmente poss-veis de ocorrer no dado:

    = {face1; face2; face3; face4; face5; face6} = {1; 2; 3; 4; 5; 6}Se o evento de interesse for obter face Par, S = {2; 4; 6}

    3. Observa-se a regularidade estatstica com que ocorre o evento de inte-resse, o que permite a modelagem matemtica da situao experimental, considerando a adequabilidade realidade.

    Palavra do Professor

    Estas trs caractersticas nos sero muito teis no desenvolvimento dos modelos matemticos a serem abordados adiante.

    2.1.2 conceitos de ProBaBilidadeVoc j percebeu o que fundamenta a Teoria da Probabilidade, agora vamos apresentar alguns conceitos relacionados, fique atento.

    2.1.2.1 conceito clssico (ProBaBilidade a Priori)Quando numa experincia equipossvel (igualmente possvel) forem enume-rados todas as possibilidades, a probabilidade de um determinado evento de interesse (ou sucesso) dada pela proporo entre o nmero de resultados favorveis ao sucesso em relao ao total de possibilidades, isto :

    P(S) = (n de resultados favorveis a S)/ (n de resultados possveis de )P(S) =(n de resultados favorveis a S)/(n de favorveis a S + n de contr-rios a S)

    Frmula matemtica: (conhecida como Lei de Laplace)

    P(S) = n S n = n S (n S + n S') (Frmula 2.2.1)

    Palavra do Professor

    observe que: a probabilidade, sendo uma proporo, um valor entre zero e um!

    laplace enunciou o Princpio da indiferena segundo o qual duas probabilidades so equiprovveis (igualmente provveis) se, e somente se, no existem motivos para favorecer qualquer delas.

    Introduo Estatstica

  • 55

    Veja a aplicao da frmula nos exemplos a seguir:

    Para o Exemplo 2.1.1:

    P (Cara) = P(C) = 1 2 = 0,50 ou que equivale a interpretar como probabi-lidade de 50% de obter a face Cara na moeda.

    Para o Exemplo 2.1.2:

    P (qualquer uma das faces do dado) = 1 6 = 0,1667 ou 16,67%P (face Par no dado) = 3 6 = 1 2 = 0,50 ou 50%

    Palavra do Professor

    No cotidiano, Voc ouve muitos leigos (sejam jornalistas ou comentaristas na mdia) empregar o termo probabilidade e chance como sinnimos. Mas h uma diferena conceitual entre elas que importante Voc, futuro profissional, perceba com clare-za a diferena entre Probabilidade e Chance. Apresentamos esta diferena a seguir. Estude-a com ateno.

    Enquanto a Probabilidade de um evento de interesse (ou sucesso), a interpre-tamos como a proporo de sucesso do evento, a Chance deve ser interpretada como sendo a razo entre o sucesso em relao ao insucesso.

    Assim, a Chance de um evento sucesso (S) dada por:

    Ch (S) = (n de resultados favorveis a S) / ( n de resultados contrrios a S)

    Ch (S) = nS nS' (Frmula 2.2.2)

    Palavra do Professor

    observe que a Chance de um evento, sendo uma razo, pode ser um valor maior do que um! Por exemplo, a Chance de retirar uma Carta diferente de s de um baralho comum dada por: Ch (s) = 48 4 ou seja, 12 contra 1.

    2.1.2.2 conceito axiomtico Neste conceito, considera-se a lgica aristotlica, em que um axioma o ponto de partida de um raciocnio tido como evidente, sendo a base das demonstra-es de uma teoria.

    Unidade 2

  • 56

    Assim, em termos axiomticos, a Probabilidade dada por um valor entre zero e um, isto :

    0 P(S) 1Assim, podemos interpretar que existe um espao de probabilidade entre o limite inferior, onde ocorre o evento impossvel (ou espao vazio), e o limite superior, quando ocorre o evento certo ou espao amostral, ou seja, no extre-mo inferior,

    P () = 0 e no extremo superior, P () = 1.

    Como consequncia, pode-se obter um Corolrio do axioma, em que se o evento sucesso (S) e o evento insucesso (S) so excludentes e exaustivos, tem-se que:

    S U S ' = E a probabilidade dada por: P (S U S ') = P () = P(S) + P(S') = 1Obtendo-se o clculo da probabilidade de um evento sucesso atravs do com-plemento pelo insucesso subtrado do total:

    P(S) = 1 P(S') (Frmula 2.2.3)Guarde essa pequena expresso matemtica e mais adiante mostraremos quo importante a sua utilizao!

    Da interpretao axiomtica pode-se afirmar:

    1. No negatividade das probabilidades.

    2. Normalizao de um evento, em que a probabilidade do evento ocorrer no mximo igual unidade.

    3. Aditividade, isto , a probabilidade de dois eventos excludentes (ou mu-tuamente exclusivos) dada pela soma das probabilidades individuais dos eventos.

    2.1.2.3 conceito exPerimental (ou frequentista)Este conceito, tambm conhecido como probabilidade estatstica, baseado na frequncia relativa do evento sucesso, onde em um nmero muito grande de n repeties de uma experincia aleatria obtm-se o nmero de realizaes favorveis ao evento sucesso, podendo-se aproximar o valor da proporo ao

    Introduo Estatstica

  • 57

    valor da probabilidade do evento, no limite, pois quanto maior o nmero de repeties e medida que este aumenta, h uma estabilidade na ocorrncia do evento sucesso, aparecendo a regularidade estatstica do evento e possvel considerar a frequncia relativa do evento como a sua probabilidade. Isto pode ser expresso atravs de:

    tendelim (nS / n) P(S)

    n Na obra Ars conjectandi, do francs Jacques Bernoulli (1654-1705), publicada postumamente em 1713, aparece pela primeira vez uma lei que veio a ser deno-minada de Teorema de Bernoulli ou Lei emprica do azar, ou mais conhecida como Primeira Lei dos Grandes Nmeros, cujo enunciado :

    muito pouco provvel que, se efetuarmos um nmero suficientemente gran-de de experimentos, a frequncia relativa de um evento se afaste muito da sua probabilidade.

    Outra forma de express-la tambm dada por:

    Quando o nmero de repeties de uma experincia aleatria aumenta muito, a frequncia relativa do evento sucesso se aproxima cada vez mais de certo valor estvel, denominado de probabilidade de sucesso.

    Palavra do Professor

    A lei dos grandes nmeros est associada ao conceito de probabilidade a poste-riori porque, quando no se pode estabelecer a probabilidade a priori, a nica al-ternativa a de estimar a probabilidade de sucesso avaliando o valor limite para o qual as frequncias relativas se aproximam, como expressado na formulao acima.

    Relacionada com a primeira lei dos grandes nmeros, existe a segunda lei dos grandes nmeros, que pode ser expressa atravs de:

    medida que o nmero de repeties de um experimento aleatrio cresce, maior tende a ser o valor absoluto da diferena entre a frequncia absoluta experimen-tal de um sucesso e a frequncia absoluta esperada (terica).

    Unidade 2

  • 58

    observe que a primeira lei dos grandes nmeros refere-se frequncia relativa, en-quanto a segunda lei refere-se frequncia absoluta!

    2.1.2.4 conceito suBjetivo (ou grau de crena)Este conceito, tambm conhecido como probabilidade subjetiva (ou grau de crena), baseado numa combinao da experincia passada de um indi-vduo racional (aquele que sobrepe a razo emoo), da opinio pessoal e da anlise da situao especfica. Diferentes indivduos racionais podem ter graus diferentes de crena, mesmo diante da mesma evidncia, devido s dife-renas dos nveis de informao e conhecimento que possuem.

    A probabilidade subjetiva especialmente til para tomarem-se decises nas quais a probabilidade de vrios eventos no pode ser determinada de maneira emprica. Proporciona um novo mtodo de investigao do desenvolvimento de nossos poderes mentais, da infncia em diante, oferecendo uma sistemtica conceitual unificada para o estudo de como percebemos, pensamos, aprende-mos, decidimos e agimos.

    Assim, a probabilidade subjetiva nada mais do que a medida da confiana que se tem sobre a verdade de certa proposio, pois aprendemos a estruturar nossos julgamentos sobre uma populao (todo) a partir de amostragens, que representam apenas parte desse todo.

    Um exemplo dessa situao o caso de um economista experiente que, ao atribuir incerteza a respeito do futuro da economia como a atual, em crise em nvel internacional, expressa os eventos em termos de probabilidades subjeti-vas. As predies so realizadas em termos probabilsticos; quando se fala certo que a crise nos atingir no Brasil, a probabilidade atribuda um valor prximo de 90%; se fala provvel que a crise nos atinja..., a probabilidade um valor em torno de 50%, e assim por diante.

    Palavra do Professor

    Preste ateno no noticirio e avalie diferentes comentaristas que utilizam esse tipo de frase!

    Outro exemplo muito prximo dos aficionados de futebol o caso de time denominado de azaro, pois suas probabilidades de vitria so medidas em funo de seu passado;, porm, teoricamente ele tem as mesmas probabilida-

    Introduo Estatstica

  • 59

    des de vitria que qualquer outro time (mesmo estando na zona de rebaixa-mento). Quem garante que o azaro no pode ganhar?

    Palavra do Professor

    Excluem-se dessa anlise outros fatores que podem influenciar no resultado do jogo!

    2.1.3 teoremas fundamentais de ProBaBilidadeApresentaremos nesta seo alguns teoremas como o da adio, do produto e de BAYES. Perceba a diferena e aplicabilidade de cada um.

    2.1.3.1 teorema da adio1 Caso: Para eventos excludentes

    Dois eventos so considerados excludentes, ou mutuamente exclusivos, quan-do no tm elementos em comum; isto , se analisamos dois eventos, A e B, eles so excludentes se (A B) = em que a probabilidade de

    P(A B) = P () = 0A frmula bsica neste caso para calcular a probabilidade da ocorrncia de um dos eventos, ou A ou B, dada por:

    P(A B) = P(A) + P(B) (Frmula 2.2.4)

    exemplo 2.1.3 baralho comum

    Seja um baralho comum, composto de 52 cartas com quatro naipes (paus, espadas, ouros e copas).

    Retirando-se, ao acaso, uma carta do baralho, qual a probabilidade de obter uma carta de ouros ou uma de copas?

    Dados do problema:

    n = 52; n(ouros) = n(copas) = 13

    Soluo:

    Como a carta de ouros exclui a possibilidade de serem copas, ento

    P(ouros copas) = P(ouros) + P(copas)

    = 13/52 + 13/52 = 26/52 = 0,50

    Unidade 2

  • 60

    2 Caso: Para eventos no excludentes

    Dois eventos so considerados no excludentes, ou no mutuamente exclusi-vos, quando tm elementos em comum; isto , se analisamos dois eventos, A e B, eles so no excludentes se (A B) em que a probabilidade de:

    P(A B) P () 0A frmula bsica neste caso para calcular a probabilidade da ocorrncia de um dos eventos dada por:

    P(AB) = P(A) + P(B) - P(AB) (Frmula 2.2.5)

    Exemplo 2.1.4 Baralho comum

    Seja um baralho comum, composto de 52 cartas com quatro naipes (paus, es-padas, ouros e copas) e ainda as cartas s.

    Retirando-se, ao acaso, uma carta do baralho, qual a probabilidade de obter uma carta de s ou uma de copas?

    Dados do problema:

    n = 52; n(Copas) = 13; n ( s) = 4

    Soluo:

    Como a carta de Copas no exclui a possibilidade de estar retirando uma carta s, j que existe o s de copas, ento:

    P(Copass) = P(Copas) + P(s) - P(Copas s)

    =13/52 + 4/52 1/52 = 16/52 = 4/13 = 0,3077

    2.1.3.2 TEorEma do ProduTo1 Caso: Para eventos condicionados

    Dois ou mais eventos so condicionados quando a ocorrncia do primeiro influncia na ocorrncia do segundo, e assim sucessivamente. Para simplifica-o, se analisamos dois eventos, A e B, dizemos que B est condicionado a A quando a probabilidade de B est condicionada probabilidade de A.

    A frmula bsica para calcular a probabilidade da ocorrncia dos eventos, A e B, considerando a ordem de ocorrncia, dada por:

    P(AB) = P(B) * P(A/B) no caso em que B ocorre primeiro.

    Introduo Estatstica

  • 61

    Assim, P(A/B) = P(AB) P(B) (Frmula 2.2.6)P(AB) = P(A) * P(B/A) no caso em que A ocorre primeiro. Assim, P(B/A) = P(AB) P(A)Observao: a expresso P(A/B) l-se como Probabilidade do evento A ocorrer dado que ocorreu B.

    Exemplo 2.1.5 Baralho comum

    Seja um baralho comum, composto de 52 cartas com quatro naipes (paus, espadas, ouros e copas).

    Retirando-se, ao acaso, duas cartas do baralho, de forma sucessiva, qual a probabilidade de obter uma carta de ouros primeiro, e uma de copas depois?

    Dados do problema:

    n = 52; n(ouros) = n(copas) = 13

    Soluo:

    Como a carta de ouros retirada primeiro, esta influencia a de copas em rela-o ao total de possibilidades; ento:

    P(ouros copas) = P(ouros) * P(copas/ouros)

    = 13/52 * 13/51 = 0,25 * 0,2549 = 0,0637

    2 Caso: Para eventos independentes

    Dois ou mais eventos so independentes quando a ocorrncia do primeiro no influncia na ocorrncia do segundo, e assim sucessivamente. Para simplifica-o, se analisamos dois eventos, A e B, dizemos que B independente de A quando a probabilidade de B no est condicionada probabilidade de A.

    A frmula bsica neste caso para calcular a probabilidade da ocorrncia dos eventos, A e B, dada por:

    P(AB) = P(A) * P(B) (Frmula 2.2.7)J que um no influencia na ocorrncia do outro.

    Unidade 2

  • 62

    Neste caso, tem-se que:

    P(A/B) = P(A) e P(B/A) = P(B)

    Exemplo 2.1.6 Baralho comum

    Seja um baralho comum, composto de 52 cartas com quatro naipes (paus, espadas, ouros e copas).

    Retirando-se, ao acaso, duas cartas do baralho, de forma sucessiva, com a reposio da primeira carta, qual a probabilidade de retirar uma carta de ouros primeiro, e uma de copas depois?

    Dados do problema:

    n = 52; n(ouros) = n(copas) = 13

    Soluo:

    Como a carta de ouros retirada primeiro, porm recolocada no baralho, esta no influencia a de copas em relao ao total de possibilidades; ento:

    P(ouros copas) = P(ouros) * P(copas/ouros)

    = 13/52 * 13/52 = 0,25 * 0,25 = 0,0625

    2.1.3.3 teorema de BayesO Teorema de BAYES permite modificar probabilidades a priori e atualiz-las com base em informao adicional, permitindo obter probabilidades a posteriori. um teorema muito til na anlise de decises que precisa da in-formao probabilstica de forma diferente da que naturalmente ocorre (ma-neira mais fcil de coletar ou avaliar dados nas probabilidades condicionadas).

    etapas bsicas para a compreenso do teorema de bayes:

    1 etapa Particionar o espao amostral, isto , dividi-lo nos eventos excluden-tes existentes (Ei) na experincia, o que constitui as probabilidades a priori:

    U Ei = n

    i=1

    e

    [P (Ei)] = P() = 1n

    i=1

    Introduo Estatstica

  • 63

    2 etapa Tem-se informao adicional de evento sucesso (S) que ocorre e que permite reduzir o espao amostral para S.

    U (EiS) = Sn

    i=1

    e

    [P (EiS)] = P(S)n

    i=1

    P (Ei S) = P (Ei ) * P(S/Ei)3 etapa Corrigem-se as probabilidades a priori a partir da informao adicional do evento sucesso (S) e que permite calcular as probab