ta1.introdução à estatística

Upload: nanas14

Post on 05-Feb-2018

226 views

Category:

Documents


0 download

TRANSCRIPT

  • 7/21/2019 TA1.Introduo Estatstica

    1/141

    Estatstica1.Populao e Amostra. Censo e sondagem

    " Cincia que dispe de processos apropri ados para r ecolher, organizar, classif icar , apresentar e interpretarconjuntos de dados"

    A estatstica fornece-nos as tcnicas para extrair informao de dados, os quais somuitas vezes incompletos, na medida em que nos do informao til sobre o problemaem estudo, no realando, no entanto, aspectos importantes. objectivo da Estatstica extrair informao dos dados para obter uma melhorcompreenso das situaes que representam.

    Uma vez os dados recolhidos, sob a forma de uma amostra, faz-se a reduo erepresentao desses dados, utilizando as tabelas e os diferentes tipos de grficos,

    sendo um dos principais objectivos desta fase, a identificao da estruturasubjacente aos dados, deixando de lado a aleatoriedade presente.Seguidamente o objectivo do estudo estatstico pode ser o de estimar uma quantidadeou testar uma hiptese, utilizando-se tcnicas estatsticas convenientes, as quaisrealam toda a potencialidade da Estatstica, na medida em que vo permitir tirarconcluses acerca de uma populao, baseando-se numa pequena amostra, dando-nosainda uma medida do erro cometido.

    1.1. Populao e Amostra

    1.1.1. PopulaoColeco de unidades individuais, que podem ser pessoas ou resultadosexperimentais, com uma ou mais caractersticas comuns, que se pretendemestudar.

    Exemplo 1: Relativamente populao constituda pelos alunos do 10 ano deescolaridade matriculados na Escola Secundria dos Olivais n 2, podemos estarinteressados em estudar as seguintes caractersticas populacionais:

    - Altura (em cm) dos alunos:Depois de medir a altura de cada aluno, obteramos um conjunto dedados com o seguinte aspecto:145, 161, 158, 156, 146, ... ,140, 139, 162

    - Notas obtidas na disciplina de Portugus, no 1 perodo:10, 15, 13, 16, 9, 11, 10, ... , 18, 11, 13, 8

  • 7/21/2019 TA1.Introduo Estatstica

    2/142

    Exemplo 2: Conjunto das temperaturas (em graus), numdeterminado dia s 9h, em todas as cidades da Europa:

    12 ,8, 15, 4, 10, 11, 13, 12, ... , 14, 12, 10, 11

    Por vezes, identifica-se Populao com a caractersticapopulacional que se pretende estudar.

    Relativamente ao exemplo 1, falamos da- Populao das alturas dos alunos do ...- Populao das notas em Portugus no 1 ...Relativamente ao exemplo 2, falamos da- Populao das temperaturas s 9h ...

    Nem sempre possvel estudar exaustivamente todos os elementos dapopulao!Porqu?

    - Pode a populao ter dimenso infinitaExemplo:Populao constituida pelas presses atmosfricas, nosdiferentes pontos de uma cidade.

    - Pode o estudo da populao levar destruio da populaoExemplo:Populao dos fsforos de uma caixa.

    - Pode o estudo da populao ser muito dispendiosoExemplo: Sondagens exaustivas de todos os eleitores, sobre determinado candidato

    1.1.2. Amostra

    Quando no possvel estudar, exaustivamente, todos os elementos da populao,estudam-se s alguns elementos, a que damos o nome de Amostra.Conjunto de dados ou observaes, recolhidos a partir de um subconjunto dapopulao, que se estuda com o objectivo de tirar concluses para a populao deonde foi recolhida.

    importante a fase de recolha da amostra?

    Sim, pois a amostra deve ser to representativaquanto possvel da Populao que sepretende estudar, uma vez que vai ser a partir do estudo da amostra, que vamos tirarconcluses para a Populao.

  • 7/21/2019 TA1.Introduo Estatstica

    3/143

    Quando a amostra no representa corretamente a populao diz-se enviesadae a suautilizao pode dar origem a interpretaes erradas, como se sugere nos seguintesexemplos:- Utilizar uma amostra constituda por 10 benfiquistas, para prever o vencedor doprximo Benfica-Sporting.- Utilizar uma amostra constituda pelos leitores habituais de determinada revista

    especializada, para tirar concluses sobre a populao geral.

    1.2.Recenseamento e sondagem

    1.2.1-Recenseamento

    O termo recenseamentoest, em regra geral, associado contagem oficial e peridicados indivduos de um Pas, ou parte de um Pas. Ele abrange, no entanto, um leque maisvasto de situaes. Assim, pode definir-se recenseamento do seguinte modo:estudo cientfico de um universo de pessoas, instituies ou objectos fsicos como propsito de adquirir conhecimentos, observando todos os seus elementos, efazer juzos quantitativos acerca de caractersticas importantes desse universo.

    Para a maioria das pessoas a palavra recenseamentoou censoencontra-se associada enumerao dos elementos da populao de um Pas. Em Portugal, de dez em dez anos,realiza-se o Recenseamento Geral da Populao. O ltimo ocorreu em 2001,encontrando-se disponveis na Internet (Infoline- Servio de Informao On Line do

    INE) os resultados desses censos - Censos 2001.

    1.2.2. Sondagem

    Por vezes no vivel nem desejvel, principalmente quando o nmero de elementos dapopulao muito elevado, inquirir todos os seus elementos sempre que se querestudar uma ou mais caractersticas particulares dessa populao.Assim surge o conceito de sondagem, que se pode tentar definir como:

    estudo cientfico de uma parte de uma populao com o objectivo de estudaratitudes, hbitos e preferncias da populao relativamente a acontecimentos,circunstncias e assuntos de interesse comum.

    fundamental referir que, contrariamente ao recenseamento, as sondagens inquiremou analisam apenas uma parte da populao em estudo, isto , restrinjem-se a umaamostra dessa populao, mas com o objectivo de extrapolar para todos os elementosda populao os resultados observados na amostra.

    http://www.ine.pt/censos2001/censos.asphttp://www.ine.pt/censos2001/censos.asphttp://www.ine.pt/censos2001/censos.asphttp://www.ine.pt/censos2001/censos.asp
  • 7/21/2019 TA1.Introduo Estatstica

    4/144

    2- Fases de um estudo estatstico.

    2.1. Estatistica descritiva e estatistica indutiva

    De acordo com o que dissemos anteriormente, numa anlise estatsticadistinguem-se

    essencialmente duas fases:Umaprimeira faseem que se procura descrever e estudar a amostra:Estatstica Descritiva

    e uma segunda fase em que se procura tirar concluses para a populao:Estatstica Indutiva

    Esquematicamente, temos:

    Resumindo, podemos dizer que uma anlise estatstica envolve duas fasesfundamentais, com objectivos distintos:

    1 Fase Estatstica DescritivaProcura-se descrever a amostra, pondo em evidnciaas caractersticas principais e as propriedades.

    2 Fase Estatstica Indutivaou Inferncia EstatsticaConhecidas certaspropriedades (obtidas a partir de uma anlise descritiva da amostra), expressas pormeio de proposies, imaginam-se proposies mais gerais, que exprimam a existnciade leis (na populao).No entanto, ao contrrio das proposies deduzidas, no podemos dizer que so falsasou verdadeiras, j que foram verificadas sobre um conjunto restrito de indivduos, eportanto no so falsas, mas no foram verificadas para todos os indivduos daPopulao, pelo que tambm no podemos afirmar que so verdadeiras !Existe, assim, um certo grau de incerteza (percentagem de erro) que medido emtermos de Probabilidade

    http://alea.ine.pt/html/glossar/html/glossar.html#ehttp://alea.ine.pt/html/glossar/html/glossar.html#ehttp://alea.ine.pt/html/glossar/html/glossar.html#ehttp://alea.ine.pt/html/glossar/html/glossar.html#ehttp://alea.ine.pt/html/glossar/html/glossar.html#ehttp://alea.ine.pt/html/glossar/html/glossar.html#e
  • 7/21/2019 TA1.Introduo Estatstica

    5/145

    2.2. Campos de aplicao

    "Os campos de aplicao da Estatstica so muitos e os maisvariados."

    Estudos de mercado

    O gerente de uma fbrica de detergentes pretende lanarum novo produto para lavar a loia, pelo que, encarregauma empresa especialista em estudos de mercado de"estimar" a percentagem de potenciais compradores desseproduto.

    Populao:conjunto de todos os agregados familiares do

    PasAmostra:conjunto de alguns agregados familiares, inquiridos pela empresaProblema:pretende-se, a partir da percentagem de respostas afirmativas, de entreos inquiridos sobre a compra do novo produto, obter uma estimativa do nmero decompradores na Populao.

    Medicina

    Pretende-se estudar o efeito de um novo medicamento para curar

    determinada doena. seleccionado um grupo de 20 doentes,administrando-se o novo medicamento a 10 desses doentesescolhidos ao acaso e o medicamento habitual aos restantes.

    Populaoconjunto de todos os doentes com a doena que o medicamento a estudarpretende tratar.Amostra:conjunto dos 20 doentes seleccionadosProblema:pretende-se, a partir dos resultados obtidos, realizar um "teste dehipteses" para tomar uma deciso sobre qual dos medicamentos melhor.

    Controle de QualidadeO administrador de uma fbrica de parafusos pretende assegurar-se deque a percentagem de peas defeituosas no excede um determinado valor,a partir do qual determinada encomenda poderia ser rejeitada.

    Populao:conjunto de todos os parafusos fabricados ou a fabricar pelafbrica, utilizando o mesmo processo.Amostra:conjunto de parafusos escolhidos ao acaso de entre o lote de produzidosProblema:pretende-se, a partir da percentagem de parafusos defeituosos presentesna amostra, "estimar" a percentagem de defeituosos em toda a produo.

  • 7/21/2019 TA1.Introduo Estatstica

    6/146

    PedagogiaUm conjunto de pedagogos desenvolveu uma tcnica nova para aaprendizagem da leitura, na escola primria, a qual, segundo dizem,encurta o tempo de aprendizagem relativamente ao mtodotradicional.Populao:conjunto de todos os alunos que entram para a escola

    primria, sem saber ler.Amostra:conjunto de alunos de algumas escolas seleccionadas para este estudo. Osalunos foram separados em dois grupos para se aplicarem as duas tcnicas emconfronto.Problema: do estudo da amostra, decidir qual a tcnica melhor.

    3. Organizao e apresentao de dados

    Podemos classificar os dados que constituem aAmostra,ou dados amostrais, em doistipos fundamentais:

    3.1.Dados qualitativos e dados quantitativos

    3.1.1-Dados qualitativosRepresentam a informao que identifica algumaqualidade, categoria ou caracterstica, no susceptvel de medida, mas declassificao, assumindo vrias modalidades.

    Exemplo:O estado civil de um indivduo um dado qualitativo, assumindo ascategorias: Solteiro, casado, vivo e divorciado.

    Os dados qualitativos so organizados na forma de uma tabela de frequnciasque

    apresenta o nmero de elementos - frequncia absoluta(ou s frequncia) de cadauma das categorias ou classes.

    Numa tabela de frequncias, alm das frequncias absolutas, tambm se apresentamas frequncias relativas, onde

    Dimenso da amostra ?Nmero de elementos da amostra.

    http://alea.ine.pt/html/nocoes/html/cap2_2_3.htmlhttp://alea.ine.pt/html/nocoes/html/cap2_2_3.htmlhttp://alea.ine.pt/html/nocoes/html/cap2_2_3.htmlhttp://alea.ine.pt/html/nocoes/html/cap2_2_3.html
  • 7/21/2019 TA1.Introduo Estatstica

    7/147

    3.1.2-Dados quantitativosRepresentam a informao resultante de caractersticas susceptveis de seremmedidas, apresentando-se com diferentes intensidades, que podem ser denatureza discreta (descontnua) - dados discretos, ou contnua - dados contnuos.

    Exemplo:Consideremos uma amostra constituda pelo n de irmos de 10 alunos de

    uma determinada turma :

    3, 4, 1, 1, 3, 1, 0, 2, 1, 2

    Estes dados so de natureza discreta.

    Se para os mesmos alunos considerarmos as alturas (cm):153, 157, 161, 160, 158, 155, 162, 156, 152, 159obteremos dados do tipo contnuo.

    3.2. Dados discretos e dados contnuos3.2.1. Dados discretos

    Estes dados s podem tomar um nmero finito ou infinito numervel de valores distintos, apresentando vrios valoresrepetidos - o caso, por exemplo, do n de filhos de uma famlia ou do n de acidentes, por dia, em determinado

    cruzamento.

    Os dados soorganizados na forma deuma tabela de

    frequncias, anloga construda para o caso dos dadosqualitativos. No entanto, em vez das categoriasapresentam-se os valores distintos da amostra, os quaisvo constituir as classes.

    Representao grfica que consiste em marcar num sistemade eixos coordenados, no eixo dos xx o valor das classes e

    nesses pontos barras verticais de altura igual frequnciaabsoluta ou frequncia relativa.

    Obter-se- um grfico com o aspecto seguinte:

    A linha a tracejado, que une os extremos das barras, chama-sePolgono de Frequncias

    Como organizar os dados?

    Diagrama de barras

    ou

    Distribuio de frequncias

  • 7/21/2019 TA1.Introduo Estatstica

    8/148

    3.2.2. Dados contnuosNo caso de uma varivel contnua, esta pode tomar todos os valores numricos, inteiros ou no,

    compreendidos no seu intervalo de variao - temos por exemplo o peso, a altura, etc...

    Enquanto que no caso de dados discretos, a construo da tabela de frequncias noapresenta qualquer dificuldade, no caso das variveis contnuas o processo um poucomais elaborado, distinguindo-se certas etapas principais, que se descrevem naspginas seguintes...

    Para exemplificar o processo descrito a seguir, utilizaremos a amostra de notas

    obtidas num ponto de Matemtica deuma determinada turma:

    1 Definio das classesa)Determinar a amplitude da amostra, isto , a diferena entre o valor mximo e ovalor mnimo

    No caso da amostra considerada, amplitude= 16.2 - 7.5 = 8.7b)Dividir essa amplitude pelo nmero k de classes pretendido; tomar para essaamplitude de classe hum valor aproximado por excesso do valor anteriormenteobtido.

    No caso da amostra considerada, k=5,h= 8.7 / 5 = 1.74 1.8

    c)Construir as classes de modo que tenham todas a mesma amplitude e cuja uniocontenha todos os elementos da amostra.

    Uma metodologia a seguir para construir as classes Ci= [ci, ci+1[ poder ser aseguinte:

    A primeira classe C1 ser

    As outras classes Cisero

    Como organizar os dados?

    Construo da tabela de frequncias, de uma amostra de dados contnuos

    12.1 8.9 16.28.2 9.8 15.1 14.5 13.4 14.7 7.58.8 12.4 16.1

    15.2 13.5 14.6 15.5 7.8 12.5 13.2 11.0 10.5

    C1= [c1, c2[ = [mn. daamostra, mn. da amostra + h[

    Ci= [ mn. amostra + ( i - 1) x h ,mn. amostra + i x h[com i=1,2,...,k

  • 7/21/2019 TA1.Introduo Estatstica

    9/149

    No caso da amostra dada temos:C1=[7.5, 9.3[ ; C2=[9.3, 11.1[ ; C3=[11.1, 12.9[ ; C4=[12.9, 14.7[ ; C5=[14.7, 16.5[

    Conta-se o nmero de elementos da amostra, que pertencem a cada classe.Analogamente ao que foi considerado no caso dos dados discretos, esses valores seroas frequncias absolutas das classes. No caso da amostra dada

    Quantas classes se devem considerar, para fazer a reduo de um conjunto dedados?

    Existe uma regra emprica, que nos d um valor aproximado para o nmero de classesque se devem considerar e que a seguinte:

    Para uma amostra de dimenso n, k o menor inteirotal que: 2k n

    Exemplo:Os dados seguintes (que se encontram ordenados) referem-se ao tempo de vida (emanos) de 50 doentes que nasceram com uma certa doena rara:

    Dimenso da amostra: 50

    De acordo com a regra emprica apresentada anteriormente teramos:

    Podemos escolher para amplitude da classe h=10 ( mais sugestivo considerarintervalos com amplitude de 10 anos do que um valor prximo do sugerido).

    Classe Freq Absoluta

    [7.5, 9.3[ 5

    [9.3, 11.1[ 3

    [11.1, 12.9[ 3

    [12.9, 14.7[ 5

    [14.7, 16.5[ 6

    Qual o valor de k ?

    0.8 1.7 2.5 4.8 9.7 16.2 23.5 28.1 23.2 45.00.9 1.9 2.6 6.3 13.5 18.2 23.6 29.7 36.6 45.11.0 2.0 2.6 6.9 13.5 18.2 23.7 30.9 36.7 61.71.1 2.0 3.2 7.6 14.4 20.7 27.1 31.2 38.0 66.41.1 2.4 3.5 9.0 15.5 21.8 27.6 31.7 40.2 67.4

  • 7/21/2019 TA1.Introduo Estatstica

    10/1410

    Representao grfica de dados contnuos

    Para a representao grfica de dados contnuos, usa-se um diagrama de reas ou

    histograma, formado por uma sucesso de rectngulos adjacentes, tendo cada um porbase um intervalo de classe e por rea a frequncia relativa (ou a frequnciaabsoluta).Deste modo a rea total ser igual a 1 (resp. igual a n, a dimenso da amostra).

    Arepresentao obtida ter o seguinte aspecto:

    Funo Cumulativa

    Para representar graficamente as frequncias acumuladas considera-se a funocumulativa cuja construo se exemplifica a seguir:

    - Antes do limite inferior da 1 classe, isto o ponto 0, a frequncia acumulada nula,pelo que se traa um segmento de recta sobre o eixo dos xx, at esse ponto.- No limite inferior da 2 classe, isto o ponto 10, a frequncia acumulada a

    frequncia da classe anterior, ou seja 0.42. Agora, admitindo que a frequncia sedistribui uniformemente sobre o intervalo da classe, unimos o ponto (0,0) com o ponto(10, 0.42).- No limite inferior da 3 classe, a frequncia acumulada a soma das frequncias dasduas classes anteriores, sendo portanto 0.56. Ento, unimos o ponto (10, 0.42) com oponto 20, 0.56).- Quando chegarmos ltima classe, temos a garantia que a frequncia acumuladacorrespondente ao seu limite superior igual a 1, pelo que nesse ponto marcamos 1 econtinuamos com um segmento de recta paralelo ao eixo dos xx.

    Pode-se chamar a ateno para algumas propriedades da funo cumulativa, tal comofoi construda:

    Histograma

  • 7/21/2019 TA1.Introduo Estatstica

    11/1411

    - Est definida para todo o x real;- sempre no decrescente;- S assume valores no intervalo [0, 1]

    A partir da representao grfica anterior possvel, por exemplo, saber qual o valoraproximado da varivel tempo de vida a que corresponde uma frequncia relativa

    acumulada igual a 50%.

    Uma vez que se admite que a frequncia se distribui uniformemente sobre a amplitudede classe, isto , a frequncia 0.14 (=0.56-0.42) distribui-se uniformemente sobre ointervalo de amplitude 10, atravs da resoluo de uma equao de proporcionalidade,obtm-se o ponto que andvamos procura

    Ento o valor procurado 10 + 5.71 = 15.71

    Ao valor obtido anteriormente, a que corresponde uma frequncia acumulada de 50%,chamamosmediana.A mediana divide a distribuio das frequncias em duas partesiguais, j que 50% dos dados so menores ou iguais a ela e os restantes 50% somaiores ou iguais a ela. Recordamos que a tcnica utilizada permitiu-nos obter umvalor aproximadopara a mediana, e no o valor exacto da mediana do conjunto dedados originais, antes de proceder ao agrupamento. Mais frente, quando falarmos demedidas de localizao, veremos como determinar a mediana a partir dos dados, semestarem agrupados.

    Diagrama de caule-e-folhas um tipo de representao que se pode considerar entre a tabela e o grfico, uma vez que so apresentados osverdadeiros valores da amostra, mas numa apresentao sugestiva, que faz lembrar um histograma.

    Consiste em escrever do lado esquerdo de uma linha vertical o dgito (ou dgitos) da classe demaior grandeza, seguidos dos restantes. A representao obtida ter o seguinte aspecto:

    http://alea.ine.pt/html/glossar/html/glossar.html#mhttp://alea.ine.pt/html/glossar/html/glossar.html#mhttp://alea.ine.pt/html/glossar/html/glossar.html#mhttp://alea.ine.pt/html/glossar/html/glossar.html#m
  • 7/21/2019 TA1.Introduo Estatstica

    12/1412

    Exemplo: Num determinado teste realizado a 50 estudantes, obtiveram-se asseguintes pontuaes:

    Fazer uma representao em caule-e-folhas destes dados.

    Por vezes, utiliza-se o "caule" horizontal, em vez de ser vertical. Este processo tornamais aparente a semelhana entre um histograma e uma representao em caule-e-folhas.

    Dada uma amostra, o aspecto do histograma reflete a forma da distribuio daPopulao subjacente aos dados observados!Este um dos aspectos da reduo dos dados, em que se perde alguma informaocontida nesses dados, mas em contrapartida obtemos a estrutura da Populao, queeles pretendem representar.

    75 98 42 75 84 87 65 59 63 86 78 37 99 66 90 79 80 89 68 5795 55 79 88 76 60 77 49 92 83 71 78 53 81 77 58 93 85 70 6280 74 69 90 62 84 64 73 48 72

    Caulevertical

    Caulehorizontal

    Que caracterstica que se pretende realar, quando se representa um conjunto de dados sob aforma de um histograma ou dum caule-e-folhas?

  • 7/21/2019 TA1.Introduo Estatstica

    13/1413

    Distribuies caractersticas

    Alguns histogramas apresentam formas que, pela frequncia com que surgem,merecem referncia especial. Assim, as distribuies mais comuns apresentadaspelos dados so:

    a. Distribuies simtricasA distribuio das frequncias faz-se de formaaproximadamente simtrica, relativamente a uma classe mdia:

    Caso especial de uma distribuio simtricaUm caso especial de uma distribuio simtrica aquele que sugere a forma de um

    "sino" e que apresentado por amostras provenientes de Populaes "Normais". Osignificado deste termo ser explicado mais tarde, no mbito das Probabilidades

    b. Distribuies enviesadasA distribuio das frequncias faz-se de formaacentuadamente assimtrica, apresentando valores substancialmente maispequenos num dos lados, relativamente ao outro:

    c. Distribuies com "caudas" longas

    A distribuio das frequncias faz-se de tal forma que existe um grandenmero de classes nos extremos, cujas frequncias so pequenas,

    relativamente s classes centrais:

    d. Distribuies com vrios "picos" ou modasA distribuio das frequncias apresenta 2 ou mais "picos" a que chamamomodas, sugerindo que os dados so constitudos por vrios grupos distintos:

  • 7/21/2019 TA1.Introduo Estatstica

    14/14

    Exemplos de distribuies caractersticas: