livro - introdução a estatística - cap 1 · começamos nosso estudo de estatistica observando...

21

Upload: hoangtuyen

Post on 11-Nov-2018

225 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: Livro - Introdução a Estatística - Cap 1 · Começamos nosso estudo de estatistica observando que a pala na tem dois significados básicos. No primeiro sentido. o termo é usado
Page 2: Livro - Introdução a Estatística - Cap 1 · Começamos nosso estudo de estatistica observando que a pala na tem dois significados básicos. No primeiro sentido. o termo é usado

INTRODUÇÃO À ~

ESTATISTICA SÉTIMA EDIÇÃO

Biblioteca

li l llll llll llll llll li llll lllll lllll li l li ()000:!6~1

NAcl F/\Ç,\ CoPIA

Page 3: Livro - Introdução a Estatística - Cap 1 · Começamos nosso estudo de estatistica observando que a pala na tem dois significados básicos. No primeiro sentido. o termo é usado

fo mtcresse de difusão da cultura e do conhecimento. os autores e os editores envidaram mávirno esforço para localizar os cetemores dos direitos autorais de qualquer material utilizado. dispondo-se a po~~iveb acertos posteriores caso, iandvertldamcntc, a identificação íe algum dele- tenha sido omitida.

Elementarv Statistics Copyright e 1998 Addison Wesley Longman, lnc. Published by arrangement with Addison Wesley Longman, Inc.

Capa: Barbara Atkinson Ilustracão de capa: Dave Cutler

Direitos exclusivos para a língua portuguesa Copyright t:, 1999 by LTC- Livros Técnicos e Científicos Editora S.A. Travessa do Ouvidor. 11 Rio de Janeiro, RJ - CEP 20040-040 Tel: '.!1-2221-9621 Fax: 21-'.!221-3202

Reservados todos os direitos. É proibida a duplicação ou reprodução deste volume, no todo ou em pane,

b quaisquer formas ou por quaisquer meios (eletrônico, mecânico. gravação, fotocopia. distribuição na Web ou outros). sem permissão expressa da Editora.

Page 4: Livro - Introdução a Estatística - Cap 1 · Começamos nosso estudo de estatistica observando que a pala na tem dois significados básicos. No primeiro sentido. o termo é usado

Para Marc e Scott

Page 5: Livro - Introdução a Estatística - Cap 1 · Começamos nosso estudo de estatistica observando que a pala na tem dois significados básicos. No primeiro sentido. o termo é usado

lntroducão à Estatística ,

1 • 1 Aspectos Gerais Define-se o termo estatística juntamente com os termos população, amostra, parâmetro e estatística (segundo significado).

1 ·2 Natureza dos Dados

Definem-se os dados guantitati vos e os dados qualitativos juntamente com dados discretos e dados contínuos. Definem-se também os quatro níveis de mensuração (nominal, ordinal, intervalar e razão).

1-3 Usos e Abusos da Estatística

Apresentam-se exemplos de utilização benéfica da estatística e, ao mesmo tempo, algumas formas em que a estatística é usada para enganar. A utilização incorreta inclui pequenas amostras, números precisou,

percentagens distorcidas, questões tendenciosas, gráficos enganosos e amostras mal extraídas.

1 ·4 Planejamento de Experimentos

Descrevem-se estudos observacionais e experimentos, juntamente com uma boa metodologia estatística. Dá-se ênfase à importância de uma boa amostragem. Definem- e e descrevem-se diversos métodos de amostragem, inclusive amostragem aleatória, amostragem estratificada, amostragem sistemática. amostragem por conglomerados e amostragem de conveniência.

1 ·5 Estatística com Calculadoras e Computadores

Discute-se a importância das calculadoras e do computadores. A utilização das calculadoras é abordada em conjunto com pacotes STA TDISK e Minitab.

Page 6: Livro - Introdução a Estatística - Cap 1 · Começamos nosso estudo de estatistica observando que a pala na tem dois significados básicos. No primeiro sentido. o termo é usado

Problema do Capítulo

Que podemos concluir desta pesquisa?

O programa de televí5ào ABC-Níghtline realizou urna pe:,quí5a em que eoticitsv» a opinião doe eepectedore« sobre a permanência, ou não, da :,ede da5 Naçõe5 Unida!> nos EUA. Para responder, os eepectedore» deviam pagar 50 centavos (americanos) para fazer uma chamada teldônica. Do!> 186.000 que responderam, 67"1. di551m1m que a eede da ONU devu, sair dos EUA. Com base ne.se;e5 resurtaao;:, amof>t.rais, que podemo« conciutr eoore a opinião da população americana, sobre a permanência ou não da ~de da ONU nos EUA?

1-1 Aspectos Gerais

Começamos nosso estudo de estatistica observando que a pala­ na tem dois significados básicos. No primeiro sentido. o termo é usado em relação a números específicos obtidos de dados, con­ forme ilustrado nos exemplos seguintes:

• Em uma pesquisa, feita pela Bruskin-Goldring Research junto a 1.012 pessoas. a quem foi formulada pergunta sobre como utilizar um bolo de frutas. l 3'k responderam que de, eria servir para calço de porta.

• Entre as pessoas com quem se fez um teste sobre o uso de drogas para admissão em novo emprego, 3.8% reagiram positivamente [de acordo com a Arnerican Managemenl Associaúon (Associação Americana de Gerenciamento)].

• O escore máximo de rebatidas de beisebol registrado até agora é de 0.442. obtido por James O-Neil em 1887.

A segunda acepção se refere à estatística como método de análise.

O Estado da Estatística

A palavra esfatí51ico provém do lotlm s!atus, que significo estado. A primihva utilização do eslalística envolvia compilações de dados e gráficos que dexreviam vários aspectos de um estado ou país. Em 1662. John Graunt publicou informes estatísnco! sobre nascimentos e mortes. O trabalho de Graunt fo; secundado por estudos de mortalidade e roxos de morbidode. tamanho de populações, rendas e taxas de desemprego. A$ famílias, os governos e os empresas se apóiam largamente em dados estolísticos. Assim é que os laxas de desemprego, de inRoçõo, os índices do consumidor. os taxas de nololidode e mortalidade são colcufodas cuidadosamente a intervalos regulares, e seus resultados roo 11tilizodos por empresórios paro lomorem decisões que afetam o futuro controtoçõo de empregodos, níveis de produção e exponsõo poro novos mercados.

DEFINl~ÃO

A estatística é uma coleção de método~ para planejar ex­ perimento'>. obter dados e organir.á-lo.,, resumi-los, analisã­ los, interpretá-lo., e deles extrair conclusões.

estatística abrange muito mais do que o simples traçado de gráficos e o cálculo de médias. Neste livro veremos como tirar conclusões gerais e significativas que vão além dos dados origi­ nais. Em estatística. utilizamos extensamente os termos popula­ ção e amostra. Esses lermos. que passamos a definir. estão no próprio cerne da estatística.

DEFINIÇÕES

Uma população é uma coleção completa de todos os ele­ mentos (valores. pessoas, medidas etc.) a serem estudados.

Um censo é uma coleção de dados relativos a lodos os ele­ mentos de uma população.

Uma amostra é uma subcoleção de elementos extraídos de uma população.

Por exemplo, uma pesquisa Nielsen típica de televisão utiliza uma amostra de 4000 lares e, com base nos resultados, formula con­ clusões acerca da população de todos os 97.855.392 lares no EUA.

EsLreitamente relacionados com os conceitos de população e amostra estão os conceitos de parâmetro e estattstica. As defi­ nições seguintes são de fácil memorização.

DEFINIÇÕES

Um parâmetro é uma medida numérica que descreve uma característica de uma população.

ma estatística é uma medida numérica que descreve uma característica de uma amostra.

Com,ideremo<, um exemplo. cm uma pesquisa, foi ta pela Bruskin­ Goldring Research com l O J 5 pessoas escolhidas aleatoriamen­ te. 269 (ou 26,5%) possuíam computador. Como a cifra de 26,51 se baseia em uma amostra, e não em toda a população, trata-se de uma estatística (e não um parâmetro). Já se uma pesquisa fei­ ta entre os 50 governadores estaduais dos EUA mostra que 42

Page 7: Livro - Introdução a Estatística - Cap 1 · Começamos nosso estudo de estatistica observando que a pala na tem dois significados básicos. No primeiro sentido. o termo é usado

(ou 84%) possuem computador. a cifra de 84% é um /H11·fi111etm porque se baseia cm toda a população de governadores.

rn nspccto i mportantc da estatística é sua apl icabil idade õbviu a situações reais e relevantes: cm todo este I ivro encontra­ remos ampla diversidade dessas aplicações.

1-2 A Natureza dos Dados Alguns conjuntos de dados (como alturas) consistem em núme­ ros. enquanto outros são não-numéricos (como sexo). Aplicam­ se as expressões dados quantitativos e dados qualitativos para distinguir esses dois tipos.

DEFINIÇÕES

Os dados quantitativos consistem cm números que repre­ ·entam contagens ou medidas. Os dados qualitativos (ou dados categóricos, ou atribu­ tos) podem ser separados em diferentes categorias que se distinguem por alguma característica não-numérica.

O Conjunto de Dados 4 do Apêndice B registra as quantida­ des de alcatrão em diferentes marcas de cigarros; esses valore representam dados quantitativos. mas as diversas marcas cons­ tituem dados qualitativos.

Podemos ainda descrever os dados quantitativos distinguin­ do entre os tipos discreto e contínuo.

DEFINIÇÕES

Os dados discretos resultam de um conjunto finito de valores possíveis, ou de um conjunto enumerável desse valores. (Ou seja. o número de valores possíveis é O. ou 1. ou 2 etc.)

Os dados contínuos (numéricos) resultam de um núme­ ro infinito de valores possíveis que podem ser associados a pontos em uma escala contínua de tal maneira que não haja lacunas ou interrupções.

Quando os dados representam contagens. são discretos: quan­ do represe/liam mensurações, são contínuos. O número de ovos que as galinhas põem constitui dados discretos, porque representa uma contagem; já a quantidade de leite que as vacas produzem constitui dados contínuos. porque representa mensurações que podem tornar qualquer valor cm um intervalo contínuo.

Outra maneira comum de classificar dados consiste cm utilizar quatro níveis de mensuração: nominal. ordinal. intervalar e razão.

DEFINIÇÃO

O nível nominal de mensuração e caructerizado por da­ dos que consistem apenas em nomes, rótulos ou categori­ as. Os dados não podem ser dispostos segundo um esque­ ma ordenado (como de baixo para cima).

Introdução à fatatí,tíca 3

Se associamos o termo nominal a "nome somente". o signifi­ cado é fácil de memorizar Um exemplo de dado nominal é o partido político a que cada senador do, EUA pertence.

1 EXEMPLO Seguem outros exemplos de dados amostrais ao nível nominal de mensuração. 1. Resposta, do tipo "sim". "não" ou "indeciso". 2. O sexo dos estudantes em uma turma de estatística.

Corno as categorias carecem de qualquer significado ordinal ou numérico, os dados precedentes não podem ser utilizados em cálculos. Assim é que não podemos tirar a "média" de 20 mu­ lheres e 15 homens. Cuidado: Por vezes atribuem-se números a categorias (mormente quando os dados são computadorizados). mas tais números não têm qualquer significado para efeito de cálculo, e a média calculada com base neles em geral não tem entido. Poderíamos citar o fato de que a Gallup Organization computou dados de uma pesquisa em que se atribuí o "valor" O aos democratas, l aos republicanos e 2 aos independentes. Mes­ mo estando diante de rótulos numéricos, os dados permanecem no nível nominal e não podemos fazer cálculos com eles.

DEFINIÇÃO

O nível ordinal de mensuração envolve dados que po­ dem ser dispostos em alguma ordem. mas as diferenças entre os valores dos dados não podem ser determinadas, ou não têm sentido.

EXEMPLO Dão-se a seguir exemplos de dados ao nível ordinal de mensuração. 1. Um editor classifica alguns originais como "excelentes".

alguns como "bons" e alguns como "maus". (Não podemos determinar uma diferença quantitativa entre "bom" e "mau". l

2. Um comitê de preparação olímpica classifica Gail em 3.0, Diana em 7.ºe Kim em 10.º. (Podemos determinar a dife­ rença entre os 3.0 e 7.0 lugares mas a diferença de 4 não tem qualquer significado.)

Esse nível ordinaJ dá informações sobre comparações relati­ vas. mas os graus de diferença não servem para cálculos. Os dado em nível ordinal não devem. pois. ser utilizados em cálculos.

Censo do Ano 2000 O censo nocionol (dos EUA) do ano 2000 será mais rapido, menos dispendioso e mais preciso do que o censo de 1990 Ao contrário do censo de 1990. o Censo de 2000 utilizará métodos de amostragem poro obter resultados mais precisos Em 1990, os agenciadores voltaram até seis vezes às 35 milhões de casas que não remeteram os formulários preenchidos; mos em 2000, essas casas omissas serôo submetidas a uma amostragem Espera-se que a amostragem produzo resultodos mais precisos do que as tenlohvos de atingir codo caso individualmente. O

nso de 2000 custará cerca de $4 bilhões, o que significa $1 milhão menos do que o custo do repetição dos mesmos métodos de 1990. O censo de 2000 seró mois eficiente - emboro o censo de 1990 nõo tenho sido tõo ineficiente como sugeriu o colunista Dove Barry #O Deportomento do Censo expede 100 milhões de formulários, 87 milhões dos quais chegam a um único destino em Albony.

Page 8: Livro - Introdução a Estatística - Cap 1 · Começamos nosso estudo de estatistica observando que a pala na tem dois significados básicos. No primeiro sentido. o termo é usado

4 E.<;TATISTIC \

DIFIN1l~ÃO

O nívet intervalar de mensuração é anãlogo no nível rdinal, com a propriedade adicional de que podemos de­

terminar diferenças significativas entre os dados. Todavia, não existe um ponto de partida zero inerente, ou natural (onde não haja qualquer quantidade presente).

As temperaturas de 98,2"F e 98,6"F são exemplos de dados nes nível intervalar de mensuração. Os valores se apresentam ordena­ dos, e podemos determinar diferenças entre eles (em geral chama­ das distância entre os dois valores). Todavia, não há ponto de par­ tida natural. O valor O"F pode parecer um ponto de partida, mas é inteiramente arbitrário. e não representa "ausência de calor". É um erro dizermos que 50"F é duas vezes mais quente do que 25°F. (Na escala Kelvin. as marcações de temperatura estão ao nível de razão de mensuração: essa escala tem um zero absoluro.)

EXEMPLO Seguem exemplos de dados ao nível intervalar de mensuração.

1. Os anos l 000, 2000. I 776 e 19-W. (O tempo não começou no ano zero e, assim. O é arbitrário. e não um ponto de partida zero natural.)

2. As temperaturas anuais médias (em graus Celsius) da apitais dos 50 estados americanos.

Medida da Desobediência Como coletor dedos sobre olgo que não se apresente mensurável, como o nível de desobediência do povo? O psicólogo Stanfey Milgrom planejou o seguinte experimento: Um pesquisador determinou que um voluntário acionasse um poinel de controle que dava choques elétricos crescentemente dolorosos em uma terceiro pessoa. No reofidade, não eram dados choques e o terceiro pessoo era um ator. O voluntário começou com 15 volts e foi orientado o aumentar os choques de ,sem 15 vol~. O nível de desobediência era o ponto em que o pessoa se recusava o aumentar a voltagem. Surpreendentemente, dois terços dos volunlários obedeceram às ordens mesmo que o olor grito5$1? e simulasse um ataque cordiaco.

TABELA 1-1 Níveis de Mensuração de Dados

DEFINl~ÃO

O nível de razão de mensuração é o nível de intervalo modificado de modo a incluir o ponto de partida zero ine­ rente (onde zero significa nenhuma quantidade presente). Para valores nesse nível, tanto as diferenças como as ra­

têm significado.

EXEMPLO Dão-se a seguir exemplos de dados ao nível de ra­ zão de mensuração.

1. Pesos de artigos de material plástico descartados pelas re­ idências (O lb indica que nenhum plástico foi descartado,

e lO 1b representam duas vezes 5 lb). 2. Duração (em minutos) de filmes. 3. Distâncias (em milhas) percorridas por carros em um tes­

te de consumo de combustível.

Os valores de cada um desses conjuntos de dados podem ser dispostos em ordem, suas diferenças podem ser calculadas, e existe um ponto de partida zero inerente. Este nível é chamado o nível de razão porque o ponto de partida torna as razões signi­ ficativas. Como um peso de 2001b é duas vezes um peso de 100 lb, mas 50ºF não é duas vezes mais quente do que 25ºF, os pesos estão ao nível de razão, enquanto as temperaturas Fahrenheit estão em nível de intervalo. Para uma comparação e revisão concisas, deve-se estudar a Tabela 1-1 para ver as diferenças entre os qua­ tro níveis de mensuração.

Ao aplicarmos a estatística a problemas reais, o nível de men- uração dos dados é um fator importante para determinarmos o processo a ser utilizado. Nossa compreensão dos quatro níveis de mensuração deve ser complementado pelo bom senso - uma ferramenta indispensável na estatística. Por exemplo, não tem sentido calcularmos a média dos números de inscrição de segu­ rados no INSS, porque esses números não medem nem contam qualquer coisa; têm por função única e exclusiva identificar as pessoas. Tais números são, na verdade, nomes diferentes para as diversas pessoas e, como tais, não devem ser utilizados para cál­ culos. De modo geral, não devemos calcular médias de dados aos níveis nominal ou ordinal de mensuração.

ível Sumário Exemplo

Categorias somente. Os dados não podem ser dispostos em um esquema ordenado.

Ordinal As categorias são ordenadas, mas não podemos estabelecer diferenças, ou estas não têm sentido.

Intervalo Podemos determ.ínar diferenças entre valores, mas não há ponto de panída inerente. As razões não têm sentido.

Como intervalo, mas com um ponto de panicla Inerente. As razões têm sentido.

Razão

Carros de alunos: 1 O Corvettes } 20 Ferraris 40 Porsches

Carros de alunos: Estã determinada 10 compactos} uma ordem: 20 médios "compacto", "médio", 40 grandes "grande".

Temperaturas no campus: 45ºF } 90°P não é duas vezes 80°P mais quente do que 90ºF 45°P.

Categorias ou nomes somente.

Pesos de jogadores de rugby cm uma faculdade; 1501b} 195 Jb 300 Jb é duas vezes 150 Ih. 300 lb

Page 9: Livro - Introdução a Estatística - Cap 1 · Começamos nosso estudo de estatistica observando que a pala na tem dois significados básicos. No primeiro sentido. o termo é usado

1 ·2 Exercícios A: Habilidades e Conceitos Básicos

Nos Exeectcios 1-8, identifique cada número como discreto ou co111(11uo. I. Cada cigarro Carne! tem 16, 13 mg de alcatrão. 2. o altímetro de um avião da American Airlines indica uma altitude

de 21.359 pés. 3. Uma pesquisa efetuada com 1015 pessoas indica que 40 delas são

assinantes de um serviço de computador on-line. 4. O radar indica que Nolan Ryan rebateu a última bola a 82,3 rni/h. s. De todos os escores SAT marcados no ano passado, 27 foram per­

feitos. 6. De 1000 consumidores pesquisados, 930 reconheceram a marca de

sopa Campbel 1. 7. O tempo total gasto anualmente por um motorista de táxi de Nova

York ao dar passagem a pedestres é de 2,367 segundos. 8. Ao completar um programa de treinamento, Shaquille O' Neal pe­

ava 12,44 lb menos do que no início do treinamento.

Nos Exercícios 9-18, determine o nível de mensuração mais adequado ( nominal, ordinal, intervalo, razão).

9. Classificação como superior, acima da média, médio, abaixo da média ou pobre para encontros marcados com desconhecidos.

10. Conteúdo de nicotina (em miligramas) de cigarros Carne!. 11. Números de inscrição do INSS. 12. Temperaturas (em graus Celsius) de uma amostra de contribuinte

irritados por estarem sendo fiscalizados. 13. Anos em que os democratas ganharam as eleições presidenciais. 14. Graus finais (A, B, C, D, F) de estudantes de estatística. 15. Códigos de endereçamento postal. 16. Rendas anuais de enfermeiras. 17. Carros classificados como subcompacto, compacto, intermediário

ou grande. 18. Cores de uma amostra de confeitos M&M.

1- 2 Exercícios B: Acima do Básico 19. Presidentes americanos foram assassinados nos anos de 1865, 1881.

1901 e 1963. Qual é o nível de mensuração para esses anos? plique sua resposta.

20. No quadrinho "Boro Loser" (Perdedor nato) por Art Sansom, Brutus manifesta alegria por um aumento de temperatura de 1° para 2º. Ao lhe perguntarem a razão, respondeu: "Está agora duas ve­ zes mais quente que hoje de manhã." Por que Brutus errou mai uma vez?

1-3 Usos e Abusos da Estatística Usos da Estatística As aplicações da estatística se desenvolveram de tal forma que, hoje, praticamente todo campo de estudo se beneficia da utiliza­ ção de métodos estatísticos. Os fabricantes fornecem melhore produtos a custos menores através de técnicas de controle d qualidade. Controlam-se doenças com auxílio de análises que antecipam epidemias. Espécies ameaçadas são protegidas por regu.lamentos e leis que reagem a estimativas estatísticas de modificação do tamanho das populações. Visando reduzir as ta· xas de casos fatais, os legisladores têm melhor justificativa para

Introdução à Estatística 5

leis como as que regem a poluição atmosférica, inspeções de automóveis, utilização do cinto de segurança e da bolsa de ar, e dirigir cm estado de embriaguez. Citamos apenas esses exem­ plos, porque uma compilação completa das aplicações da esta­ tística facilmente tomaria o resto deste livro.

Alguns estudantes escolhem um curso de estatística porque é exigido, mas um número cada vez maior o faz voluntariamente, porque reconhecem seu valor e aplicabilidade em qualquer campo cm que pretendam trabalhar. Como os empregadores gostam de ver um curso de estatística no currículo de um candidato, o lei­ tor que tiver estudado estatística levará vantagem ao procurar um emprego. Afora razões relacionadas com a obtenção de empre­ go e com a disciplina, o estudo da estatística pode tomar o leitor mais crítico em sua análise de informações, e menos sujeito a afirmações enganosas, como as que se acham cornumente asso­ ciadas a pesquisas, gráficos e médias. Como membro educado e responsável da sociedade, o leítor deve aguçar sua capacidade de reconhecer dados estatísticos distorcidos e de interpretar in­ teligentemente dados que se apresentem sem distorção.

Os Motoristas Mais Idosos São Mais Seguros do que os Mais Moços? A American Association oi Retired People -AARP [Assocícçôo Americano de Aposentados) alego que os motoristas mais idosos se envolvem em menor número de acidentes do que os mais jovens. Nos últimos anos, os motoristas com 16-19 anos de idade cousorom cerco de 1,5 milhão de acidentes, em comparação com apenas 540.000 causados por molorisfos com 70 onos ou mais, de formo que o alegação da AARP parece válido. Acontece, entretanto, que os molorisfos mais idosos não dirigem tonto quanto os mais jovens. Em lugar de considerar apenas o número de acidentes, devemos examinar fombém os taxas de acidentes. Eis as taxas de acidentes por 100 milhões de milhos percorridos: 8,6 poro os motoristas com idades de 16 a 19, 4,6 poro os com idade de 75 o 79, 8, 9 poro os com idade de 80 o 8.4 e 20,3 poro os motoristas com 85 anos de idade ou mais. Embora os motoristas mais jovens tenham de foto maior número de acidentes, os mais velhos apresentam os mais oiros toxos de ocidente.

Abusos da Estatística

Page 10: Livro - Introdução a Estatística - Cap 1 · Começamos nosso estudo de estatistica observando que a pala na tem dois significados básicos. No primeiro sentido. o termo é usado

(l rXl \lls TI''

Números Precisos À~ vezes os próprios números podem ser enga­ nosos. Uma cifra. como um salário anual de $37.735,29. pode parecer muito precisa. introduzindo alto grau de confiança em sua exatidão. Já a cifra $37.700,00 não infunde o mesmo senso de precisão. Entretanto. uma estatística com muitas casas deci­ mais não é necessariamente precisa.

Es~motivos por Suposição Out.rn fonte de engano estatístico envol­ ve estimativas que são. na verdade, suposições (ou, na língua­ gem popular .:' palpites"). podendo apresentar erros ~ubstanciais: E preciso considerar a fonte da estimativa e a maneira como foi estabelecida. Quando o Papa visitou Miami, as fontes oficiais estimaram a multidão em 250.000 pessoas. mas. utilizando fo­ tos aéreas e grades. o Miami Hera/d chegou a uma cifra mais precisa de apenas 150.000.

Porcentagens Distorcidas Por vezes utilizam-se porcentagens con­ fusas ou distorcidas. Em um anúncio de página inteira, a Conti­ nental Airlines anuncia melhores serviços. No Locante ao caso de bagagem extraviada. o anúncio afirmava que "se trata de uma área em que já melhoramos. l 00% nos últimos seis meses". Em um editorial criticando essa estatística, o New Yo,-k Times inter­ pretou corretamente a melhora de 100% como significando que gora não se extravia mais qualquer bagagem -o que ainda não foi conseguido pela Continental Airlines.

Cifras Parciais .. Noventa por cento dos carros vendidos nos EUA nos últimos I O anos ainda estão rodando." Milhões de consumi­ dores ouviram esta mensagem e ficaram com a impressão de que esses carros devem ter sido muito bem construídos para durarem ramo. O que o fabricante não mencionou foi que 90% dos carros por ele vendidos. o foram nos úllimoi. três anos. A alegação. embora tecnicameme correta. era enganosa. por não apresentar O!> resuhados compleros.

Distorções Deliberadas No livro Taimed Truth, Cynrhia Crossen cita um exemplo da revista Corporate Trave! que publicou dados mostrando que. entre as companhia s locadoras de carros. a Avi foi a vencedora em uma pesquisa junto aos ,ocalárifü. Quando a Hem solicitou informaçõc., detalhadas sobre a pesquisa, as res­ postas desapareceram e o coordenador da pesquisa se demitiu. A Hertz processou a Avis (por falsa propaganda ba'>eada na pes­ quisa) e a rev ista: chegou-se a um acordo.

Perguntas Tendenciosas As pergunta'> em uma pesquisa podem ser formuladas de modo a "sugerirem" uma resposta. Um caso fa­ moso envolve o candidato à presidência do'> EUA, Ross Perot, que formulou a seguinte pergunta em um que'>tionário: "O pre- idente deve ter o poder de vetar decisões do Cong.re.<,so?'" No­

venta e sete por cento das respostas foram "sim". Entretanto, o percentual de respo'>tas "sim" caiu para 57'* quando a pergunta

foi "O presidente de, e ter, ou não, o poder de vetar dt•crsá,•,1 cio ·011gre.1.w>T' Às vezes us perguntas se upresenrem i11\olunta­

riamente tendenciosas cm virtude de fatores como a ordem dos itens n serem considerados. Por exemplo, uma pesquisa nlemil formulou estas dum, perguntas:

leitor diria que o tráfego contribui cm maior ou menor grau do que a indústria para a poluição atmosférica·)

• O leitor diria que a indústria contribui em maior ou menor grau do que o trãfcgo para a poluição atmosférica?

uando o tráfego foi mencionado cm primeiro lugar. 45% acu­ saram o tráfego e 12% acusaram a indústria: quando a indtístria foi citada cm primeiro lugar. as porcentagens se modificaram grandemente para 24% e 57%. respectivamente.

Pesquisa do Literory Digest

No componho presidencial de 1936, o revisto Ltterary Digest fez uma pesquisa e concluiu pelo vitória de Alf London, mas Franklin D. Roosevelt venceu por largo margem. Mourice Bryson observa: "Foram enviados 1 O milhões de cédulas - amostra a eleitores em potencial. mas apenas 2,3 milhões foram devolvidos. Como todos devem saber, tais amostras são quase sempre tendenciosos." Bryson afirma também: "As respostas voluntárias o questionários enviados pelo correio constituem talvez o método mais comum de coleta de dados sobre ciências sociais encontrado pelos estatísticos, e é também talvez o pior " (Ver Bryson, "Ihe Üferory Digest Poli: Moking of a Stotistical Myth", The American Statistician, Vol. 30, N.24.)

Gráficos Enganosos Muitos dispositivos visuais - como gráfico em barras e gráficos em setores - podem ser utilizados para exagerar ou diminuir a verdadeira natureza de um conjunto de dados. (Tais recursos serão discutidos no Capítulo 2.) Os dois gráficos da Figura 1-1 representam os mesmos dados do Bureau of Labor Statistics (Departamento de Estatística do Trabalho). mas a parte (b) tem como objetivo exagerar a diferença entre os ganhos dos homens e os das mulheres. Não partindo do zero no eixo vertical, o gráfico (b) tende a produzir uma impressão sub­ jetiva errônea. A Figura 1- 1 nos dá uma lição importante. Deve­ mos analisar as informações numéricas contidas em um gráfico, não nos deixando enganar por sua forma geral.

Pictográficos Os desenhos de objetos. chamados pictográficos. tam­ bém podem levar-nos a erro. Os objetos comumente usados para ilustrar dados incluem sacos de dinheiro, pilhas de moedas, tan-

$7!:::>4 1 $754 e $750 r--

~ $750 C C -~ ~ 700 1 $520 ~ E :'.)()O .-- s

~ - 6':)0 ~ ? l'4

~ 600 .~ 2'::;;0 "' ~ { bbO 1 1 1 $S20

e t:: •••

l'4 ~ o ~ ?00 Homene Mulhere§ Homem; Mulhere~ (a)

(b) Fig, 1 • 1 Ganho~ de proliu,onoi& de lempo integral.

Page 11: Livro - Introdução a Estatística - Cap 1 · Começamos nosso estudo de estatistica observando que a pala na tem dois significados básicos. No primeiro sentido. o termo é usado

qucs do exército (pura 01!\PI!'-ª" rmhtal'l!S), vaca, (para produção de laticfnios). harris (para produção de petróleo) e casas (para ~onstruçfio). Ao desenhar tais objetos, o artista pode criar impres­ sões falsas que distorcem as diferenças. Se duplicamos o lado de um quadrado, a área não é apenas duplicada. e sim quadrupl i­ cadn; duplicando cada aresta de um cubo, seu volume não é ape nas duplicado. e sim multiplicado por oito. Se os imposto'> do brama cada década, um desenhista pode representar os aumen­ tos de imposto por um saco de dinheiro para o primeiro ano e um segundo saco duas vezes mais fundo. duas vezes mais alto e duas vezes mais largo para o segundo ano. Ao invés de aparece­ rem duplicados, os impostos se apresentarão aumentados oito vezes: o desenho distorce. assim, a realidade.

Pressão do Pesquisador Quando se formulam perguntas a indiví­ duos pesquisados, esses freqüentemente dão respostas favoráveis à sua auto-imagem. Em uma pesquisa telefônica, 94% dos que responderam disseram que lavam suas mãos após usar um ba­ nheiro, mas a observação em lugares tais como a Estação Penn. em Nova York e Golden Gare Park em San Francisco mostra­ ram que o percentual efetivo é de apenas 68%.

Más Amostras Outra fonte de estatística enganosa são os método inadequados de coleta de dados. É comum um pesquisador ana­ lisar dados e formular conclusões errôneas porque o método de coleta de dados foi deficiente.

Um exemplo típico é a pesquisa "Nightline" em que 186.000 espectadores de televisão pagaram 50 centavos para discar um número de telefone "900" dando sua opinião sobre se a sede da"> Nações Unidas deve permanecer nos EUA. Os resultados mos­ traram que 67% dos que foram consultados eram favoráveis a que a sede da ONU saísse dos EUA. No começo deste capítulo perguntamos o que se poderia concluir quanto à opinião geral da população sobre a permanência da ONU nos EUA. Como o próprios espectadores é que decidiram se seriam incluídos na pesquisa. temos um exemplo de pesquisa auto-selecionada. que e define como segue.

DEFINl~ÃO

Uma pesquisa auto-selecionada é uma pesquisa em que os próprios entrevistados decidem se serão incluídos.

Em tais pesquisas. o que freqüentemente ocorre é que participam apenas aqueles que têm uma opinião firmada. resultando daí que a amostra dos que respondem não é representativa da população como um todo. Como 67% dos 186.000 pesquisados eram ta rãvcis à mudança da sede da ONU dos EUA. nada podemos co11- rtuir sobre a população em geral. dada a maneira como se ol>­ teve u amostra. Na realidade. Ted Koppel reportou que uma pes­ quisa "científica" de 500 pessoas revelou que 72% delas deseja­ vam que a sede da ONU permanecesse nos EUA. Nessa pesqui­ sa de 500 pessoas. os que responderam foram selecionados ale atoriamenn, pelo pesquisador, de modo que o resultado tende muito mais a refletir a verdadeira opinião da população cm ge rui.

Uma pesquisa auto-selecionada e upcnus uma dus maneirus como o método de coleta de dados pode ser seriamente prejudi­ cado. Em vista de suu i mportâncla, dedicaremos a próxima se­ ção ao método de amostraaem ou coleta de dados.

Imroduçúo à btatfsuca 7

()<, exemplos precedentes constituem uma pequena amostra das maneira'> como a estatística pode ser utilizada de forma en­ ganosa. Livros inteires têm sido dedicado- a esse assunto, inclu­ sive o clássico How to Li« with Statistics. de Darrell Huff. 'lhe Figure Finaglerv, de Robert Rcichard. e Tainted Truth, de Cyruhra Crossen. O entendimento de tars práticas <,erá de grande auxílio na avaliação dos dados estatísticos encontrados cm situ­ ações cotidianas.

1-3 Exercícios A: Habilidades e Conceitos Básicos l. Uma pessoa foi encarregada de pesquisar o reconhecimento da

marca Nikc. devendo contactar por telefone 1500 consumidores nos EUA. Por que razão é incorreta a utilização de li~ta, telefónica, como população para fornecer a amostra'!

2. Setenta e dois por cento dos americanos espremem o tubo de den­ tifrício a partir da parte superior. Essa observação. assim corno outras também não muito sérias. é apresentada em The First Reall, lmportant Survey of American Habits (a primeira pesqui-a realmen­ te importante dos hábitos dos americanos). Esses resultados se baseiam em 7000 respostas a 25.000 quesuonários enviados pelo correio. Qual o lado errado dessa pesquisa?

3. Um relatório patrocinado pela Florida Citrus Comrnissíon concluiu que os níveis de colesterol podem ser reduzidos mediame ingestão de produtos cítncos. Por que razão a conclusão podena ser suspeita?

4. Uma funcionária tem um salário anual de $40.000. mas é informa­ da de que terá uma redução de 10% no pagamento em virtude do declínio dos lucros da companhia. É informada também de que no próximo ano terá um aumento de IO'K A situação não se afigura tão má. porque a redução de l 0% parece ser compensada pelo au­ mento de l O'k.

a. Qual a renda anual após o corte de IQq.? b. Com base na renda anual da parte a. determme a renda anual

após o aumento de 10~. O corte de 10~ seguido do aumento de 10% restituem à funcionãna o salário original de $40.000?

5. A revista Glamour publicou o seguinte resultado de uma pesqui­ sa: "Setenta e nove por cento dos que responderam à nossa pes­ quisa de agosto afirmaram crer que os americanos se tomaram demasiadamente propensos u apelar para ujustiça em casos corri­ queirós." A questão foi publicada na revista e os leitores pocham responder pelo correio. fax ou e-mail ( Tel1 [email protected] . té que pomo é válido o resultado de 79%'!

6. ADT Securiry Systerns advertiu que "quaado v ocê sai de fénas. o. ladrões começam a agir ... O anúncio afirmava que .. de acordo com cstutísricas do FBI. muis de 25q. dos assauos a residências ocor­ riam entre o Memorial Day [feriado que homenageia os soldado mortos na guerra] e o Dia do Trabalho". Em que pomo essa afir­ mação é enganosa'!

7. Em um estudo sobre crimes cometidos no campus de uma univer­ sidade por estudantes sob efeito do álcool ou das drogas. foram pesquisados 1.875 estudantes, Um artigo no USA Todav notou· ""i10 por cento dos estudnntes que respondem nnonimameme ufir­ mum ter cometido um crune no campus. F 62<:t desse grupo d1- zem ter agido sob a mfluêncra do álcool ou da, drogas." Supondo que o número de estudantes que responderam unornmarncntc seja de l .ln5. quantos efetivamente cometeram um crime no campu­ xob a influencia do álcool ou das drogas'!

8. Um e-tudo reutizudo pelo lnsurance ln~ti1u1e for H1gh,"1~ Satety ( Instiuno de Segurança nas Rodovrn~l constatou que o Chex rolet Corvette acusa o mais ele, ado mdice de acrdemc-, fauu~ .. 5.:!

Page 12: Livro - Introdução a Estatística - Cap 1 · Começamos nosso estudo de estatistica observando que a pala na tem dois significados básicos. No primeiro sentido. o termo é usado

T.\TISTI

manes para cada 10.000". O carro com menor índice de acidentes m apenas 0,6 morte por l 0.000. Significa isto

que o Corveue não é tão seguro quanto o Volvo? 9. O jornal Newport Chronicle afirma que as mães gravidas podem

aumentar suas chances de ter um bebê sadio comendo lagostas. alegação se baseia em um estudo mostrando que as crianças nas­ idas de mães que comem lagostas têm menos problemas de saú­ de do que as nascidas de mães que não comem lagostas. Qual é o erro nesta alegação?

10. Uma pesquisa inclui o seguinte item: "Registre sua altura em po­ legadas." Com isso pretende-se obter e analisar as alturas dos que respondem. Identifique os dois problemas neste item.

11. "De acordo com uma pesquisa de âmbito nacional feita por 250 agências de empregos, os sapatos gastos constituem o motivo mai comum para que um homem que procura emprego não cause boa impressão à primeira vista" Os jornais apresentavam essa alega- ão com base em uma pesquisa encomendada pela Kiwi Brands, produtores de graxa para sapatos . Faça um comentário sobre a ra­ zão por que os resultados de tal pesquisa podem ser questionados.

12. Em um suplemento de propaganda inserido no Time. os aumentos das despesas com o combate à poluição foram ilustrados em um gráfico como o que aparece a seguir. O que estã errado com a figura?

$í864,8 Milhõe5

$1483,3 Milhões

fe83,5 Milhõe5

$643,.3 Milh5t:5

2 3 4 Ano

1-3 Exercícios B: Além do Básico

13. Um artigo no New York Times afirmou que a duração média da vida de 35 regentes de orquestra do sexo masculino era de 73,4 anos, em contraste com a média de 69 ..5 anos para a população masculina em geral. A vida mais longa foi atribuída a fatores como satisfação pes­ soal e motivação. Há uma falha fundamental na conclusão de que os regentes de orquestra do sexo masculino vivem mais. Qual é?

14. Um pesquisador do Sloan-Keltering Cancer Research Center foi criticado certa vez por adulterar dados. Entre seus dados estavam cifras obtidas de seis grupos de ratos. com 20 ratos em cada gru­ po. Foram dados os seguintes valores como porcentagens de su­ cesso: 53%, 58%, 63%. 46%, 48%, 67%. O que está errado?

15. Procure identificar a, quatro maiores falhas no seguinte. Um jor­ nal realizou uma pesquisa solicitando a resposta dos leitores a esta pergunta; "Você apóia o desenvolvimento de armas atômicas que poderiam matar milhões de pessoas inocentes?" Relata-se que 20 leitores responderam, 87% com "não" e 13% com "sim".

16. Um editorial do New York Times criticou um anúncio que alegava que determinado anti-séptico bucal "reduzia em mais de 300% as placas no~ dentes".

a. Removendo-se 100% de uma quantidade, quanto resta? b. Que significa reduzir as placas em mais de 300%?

1-4 Planeiamento de Experimentos

1. Identificar com precisão a questão a ser respondida e definir om clareza a população de interesse.

2. Estabelecer um plano para coleta de dados. Esse plano deve descrever detalhadamente a realização de um estudo obser­ vacional ou de um experimento (ambos definidos a seguir), e deve ser elaborado cuidadosamente. de modo que os da­ dos coletados representem efetivamente a população cm questão.

3. Coletar os dados. Devemos ser extremamente cautelosos, para minimizar os erros que podem resultar de uma coleta tenden­ ciosa de dados.

4. Analisar os dados e tirar conclusões. Identificar também pos­ íveis fontes de erros.

Os estudos que requerem métodos estatísticos decorrem tipi­ camente de duas fontes comuns: estudos observacionais e expe­ rimentos.

DEFINIÇÕES

Em um estudo observacional, verificamos e medimos características específicas, mas não tentamos manipular ou modificar os elementos a serem estudados.

Em um experimento, aplicamos determinado tratamento e passamos então a observar seus efeitos sobre os elemen­ tos a serem pesquisados.

Por exemplo, um estudo observacional pode envolver uma pesquisa de cidadãos para determinar que porcentagem da po­ pulação é a favor do registro de armas de fogo. Um experimento pode envolver o tratamento com um remédio ministrado a um grupo de pacientes a fim de determinar sua eficiência na cura. o caso da arma de fogo, coligimos dados sem modificar as

pessoas a serem pesquisadas; já o tratamento por um remédio envolve a modificação das pessoas.

Os experimentos bem planejados costumam envolver um gru­ po a quem é dado um tratamento particular (chamado grupo de tratamento) e um segundo grupo de controle ao qual não se ad­ ministra o tratamento. Por exemplo, o experimento sobre pólio realizado em 1954 envolveu um grupo de tratamento de crian­ ças em quem foi injetada a vacina Salk, e um grupo de controle de crianças que recebeu um remédio neutro (placebo). Em ex­ perimentos deste tipo, ocorre um efeito placebo quando um in­ divíduo não tratado acredita estar recebendo o tratamento e ale· ga uma melhora nos sintomas. O efeito placebo pode ser contra­ balançado fazendo-se um experimento cego, uma técnica em que o indivíduo não sabe se está recebendo o tratamento ou um pia· cebo. O experimento sobre pólio foi do tipo duplo-cego, em que as crianças que recebiam a injeção não sabiam se estavam rece­ bendo a vacina Salk ou um placebo, e os médicos que davam e injeção e avaliavam os resultados também não sabiam.

Page 13: Livro - Introdução a Estatística - Cap 1 · Começamos nosso estudo de estatistica observando que a pala na tem dois significados básicos. No primeiro sentido. o termo é usado

As Pesquisas Politicas Crescem

Em "Consulting the Orode", um artigo poro o U.S. News ond World Reporf, o outor Stephen Budiansky escreve que o Presidente Kennedy encomendou 16 pesquises em seus três anos de mondoto, Nixon encomendou 233 pesquisas em seus seis anos, e Clinton encomendou entre 100 e 150 pesquisas em seus primeiros 2,5 onos. As pesquisas de Clinton custaram entre $30.000 e $45.000 codo uma, o que dó um custo de $30 por pessoa. Budionsky reloto que a pesquiso é complicado por m6quinas de resposta e por pessoas que se recusam a cooperar, mos os boas pesquisas incluem tentativas repetidos paro obter respostas dos que não estão em casa ou se recusam o responder. Não levar em conto os que nõo respondem pode resultar em uma amostro que nõo represente adequadamente o população.

Ao planejar um experimento para testar a eficiência de um ou mais tratamentos, devemos ter o cuidado de atribuir as unidades experimentais (ou indivíduos) aos diferentes grupos de tal modo que esses grupos sejam bem semelhantes. (Tais grupos semelhan­ tes de unidades experimentais são chamados blocos.) Uma abor­ dagem eficiente consiste em uti lizar um planejamento experimen­ tal completamente aleatorizado, que exige que as unidades ex­ perimentais sejam divididas em diferentes grupos mediante um processo de seleção aleatória. Assim é que tal planejamento pode envolver a atribuição aleatória de pessoas a um grupo tratado com aspirina e a um grupo de controle que não é tratado. Outro pro­ cesso consiste em utilizar um planejamento controlado rigoro­ samente, com unidades experimentais escolhidas cuidadosamen­ te. de modo que os diferentes grupos (ou blocos) sejam tão se­ melhantes quanto possível. Com um planejamento rigorosamente controlado, podemos tentar formar grupos de tratamento e de controle que incluam pessoas semelhantes em idade, peso, pres­ são sanguínea etc. É importante também considerar a replicação, que exige tamanhos de amostra suficientemente grandes que re­ duzam os efeitos da variação amostral aleatória. O experimento com a pólio foi um planejamento experimental completamente aleatorizado, porque os indivíduos em ambos os grupos, de tra­ tamento e de controle, foram selecionados aleatoriamente. Incor­ porou a replicação incluindo números muito grandes (200.000) de indivíduos em cada grupo.

Na realização de experimentos, os resultados por vezes são comprometidos pelo confundirncnto.

DEFINIÇÃO

Ocorre o confundimento quando os efeitos de duas ou mais variáveis não podem distinguir-se uns dos outros.

Por exemplo, se estamos realizando um experimento para testar a eficiência de um novo retardante no incêndio em uma sarça, e repentinamente começa a chover, ocorre o confundimento por­ que é impossível distinguir entre o efeito do retardante e o efeit da chuva.

Um dos erros mais graves consiste em uma forma inadequa­ da de coleta de dados. Nunca é demais enfatizarmos este impor­ tante ponto:

Dados coletados de forma descuidada podem ser tão inúteis que nenhum processamento estatístico consegue salvá-los.

Introdução à Estatística 9

Notamos na Seção 1-3 que uma pesquisa auto-selecionada é uma pesquisa em que as próprias pessoas decidem se vão responder ou não. As pesquisas auto-selecionadas são muito comuns, mas seus resultados em geral não têm uti I idade para fazer inferências válidas sobre toda uma população.

Passamos agora a definir e descrever os cinco métodos mais comuns de amostragem.

DEFINIÇÃO

m uma amostra aleatória, os elementos da população são escolhidos de tal forma que cada um deles tenha igual chance de figurar na amostra. (Escolhe-se uma amostra aleatória simples de n elementos, de maneira que toda a mostra de tamanho n possível tenha a mesma chance de ser escolhida.)

As amostras aleatórias podem ser escolhidas por diversos mé­ todos, inclusive a utilização de tabelas de números aleatórios e de computadores para gerar números aleatórios. Com a amos­ tragem aleatória, espera-se que todos os grupos da população sejam representados na amostra de forma aproximadamente proporcional. Uma amostragem descuidada pode facilmente resultar em uma amostra tendenciosa. com características as­ saz diferentes das da população que a originou. Em contrapar­ tida, a amostragem aleatória é cuidadosamente planejada para evitar qualquer tendenciosidade. Por exemplo. a utilização de catálogos telefônicos elimina automaticamente todos aquele cujos telefones não figurem no catálogo, e a exclusão desse egmento da população pode facilmente conduzir a resultado falsos. Em Los Angeles, por exemplo. 42.5% dos números de telefones não estão no catálogo (com base em dados da Survey Sampling, Inc.). Os pesquisadores costumam contornar esse problema utilizando computadores para gerar números de te­ lefone. de modo que todos os números sejam possíveis. Ele devem também ter o cuidado de incluir os que inicialmente não foram encontrados ou se recusaram a responder. A Companhia de Pesquisas Harris constatou que a taxa de recusa para entre­ vistas telefônicas é em geral de 20%, no mínimo. O fato de ignorarmos os que inicialmente se recusam a responder pode concorrer para que nossa amostra seja tendenciosa.

DEFINIÇÃO

Page 14: Livro - Introdução a Estatística - Cap 1 · Começamos nosso estudo de estatistica observando que a pala na tem dois significados básicos. No primeiro sentido. o termo é usado

J() l:'ST\TISTI(.\

da, então o, resultado, poderão xcr ujustudos nu ponderados onvcnientemcnte. Para um tamanho r,,o de amostra. -e escolhemos alcatoria­

mente elementos de diferente, estratos, temos chance de obter resultado, mai-, consistcruec (e menos variáveis) do que com a nnplcs escolha de uma amostru alcatúria de toda a população. Por essa razão. costuma-se usar a amostragem csrrnrificada para reduzir a variação nos resultudns.

DEFINIÇÃO

Na amostragem sistemática. cscofhemos um ponto de partida. e selecionamos cada 1.. °'""" elemento (como por exemplo cada 50.ºelementol da população

Por exemplo. se a Motorola qursessc fazer uma pesquisa sobre seus 107.000 empregados. poderia partir de uma relação com­ pleta dos mesmos e selecionar cada 100.º empregado. obtendo uma amostra de 1.070 elementos, Esse método é simples e utili­ zado com freqüência.

DEFINl~O

a amostragem por conglomerados. começamos divi­ dindo a área da população em seções rou conglomerados l: em seguida escolhemos algumas dessas seções e. finalmen­ te. tomamos todos O.'> elementos das seções escolhidas.

Uma diferença imponanre entre a amostragem por conglomera­ dos e a amostragem estratificada é que a amostragem por con­ glomerados utiliza todos os elementos dos conglomerados sele­ cionados. enquanto a amostragem estratificada utiliza uma amos­ tra de membros de cada estrato. Pode-se encontrar um exemplo de amostragem por conglomerado em uma pesquisa pré-eleitoral. onde escolhemos aleatoriamente 30 zonas eleitorais e pesquisamo rodos os elementos de cada uma das zonas escolhidas. Esse méto­ do é muito mais rápido e menos dispendioso do que a escolha de um indivíduo de cada uma das inúmeras zonas da área popu­ lacional. O-<. resultados podem ser ajustados ou ponderados para corrigir qualquer representação desproporcionada de grupos. A amostragem por conglomerados é extensamente utilizada pelo governo e por organizações particulares de pesquisa.

Meta-análise

O termo meto-análise se refere o umo lécnic.o de estudo que, essencialmente, combino os resulfodos de oulros estudos. Tem o vontogem de permitir que amostras menores sepcrodos sejom combinados em uma único amostro grande, tornando mais significativos os resullodos globo;s. Tem também o vantagem de utilizar um trabalho ió feiro Por oulro lodo, fem o desvonragem de ser openos tõo boo quonro o tenham sido os estudos básicos Se esses a5tudos apresentam folhas, pode ocorrer o fenômeno ·9orba9e m, 9orbo9e ovt" (N. do L "O que sai é tõo bom como o que enfra. ·, A utílizoçôo do me1o-onólise é de uso corren1e em pesquisas médicos e psícotógicos. Um exemplo: "Reversai of Left Ventricular Hypertrophy in Essential Hypertension: A Meto-onalysis of Rondomized Double-bfind Studia5·. por Schmieder, Mortus e Klíngbeil, Journa/ of lhe Americon Medico/ A5sodolion, Vol. 275, No.19

DEFINl~ÃO

a amostragem de conveníência. simplesmente utili,11 mos resultados que já estão disponíveis.

Em alauns casos, os resultado, da amostragem de conveniên­ eia podem ser assaz bons, mas em outros casos podem aprcst:ntar séria tendenciosidade. Ao fazer uma pesquisa <obre pcs~oas ca­ nhotas. seria conveniente um escudante pesquisar -cus propnn,

legas de classe, porque estão ao seu alcance imediato. \1-:~mo que tal amostra não seja aleatória. os resultado, devem ser bem satisfatórios. Em contrapartida. poderia ser muito conveniente (e talvez mesmo lucrativo) para a ABC New :- fazer uma pesquisa pedindo aos espectadores que liguem para um número de telefone ··900·· para registrar suas opiniões. mas essa pesquis., seria auto­ selecionada e os resultados seriam provavelmente tendencioso,.

Figura 1-2 ilustra os cinco métodos mais comuns de amos. rragern que acabamos de descrever. Essas descrições pretendem ser breves e gerais. O ccnhecrment.. aprofundado desses diver- os métodos. que permita sua utilização c.nn proveito. exige um

estudo muito mais extenso. que ultrapassa o níve! de um curso introdutório. Para manter esta seção em perspectiva. notemos que este texto fará referência freqüente a dados "selecionados alea­ toriamente". o que significa que os dados foram selecionados de modo que todos os elementos da população têm a mesma chan­ ce de serem escolhidos. Conquanto não façamos referência fre­ qüente aos outros métodos de amostragem, devemos ter consci­ ência de que eles existem. e que o método de amostragem exige planejamento e execução cuidadosos. Os métodos apresentados em todo este texto dependem de amostras que tenham sido obtidas cuidadosamente. Além disso. o tamanho da amostra deve sempre ser suficientemente grande para os propósitos em vista. (Os pro­ blemas de tamanho da amostra são abordados mais adiante. espe­ cialmente no Capítulo 6.) Muitas pessoas acreditam que as gran­ des amostras são sempre boas. mas mesmo essas podem ser total­ mente desprovidas de valor. se os dados tiverem sido coletados de maneira negligente. Finalmente. se estamos medindo uma carac­ terística (corno altura) de um conjunto de indivíduos. podemo obter resultados mais precisos "e fizermos nós mesmos as medi­ das, em vez de pedirmos aos indivíduos que indiquem os valores. Este último procedimento pode resultar em um número despro­ porcionado de resultados arredondados. assim como muitos resul­ tados que refletem valores desejados em lugar de valores efetivo:

ão importa quão bem planejemos e executemos o processo de coleta de amostras, há sempre a possibilidade de um erro nos resultados. Como exemplo. escolha aleatoriamente 1000 adul­ tos e pergunte a eles se têm o curso secundário completo. regrs­ trando a porcentagem de respostas "sim". Escolhido um outro grupo de l 000 indivíduos, é provável que se obtenha uma por· centagem amostraí diferente.

DEFINIÇÕES

m erro amostral é a diferença entre um resultado amos· tral e o verdadeiro resultado populacional; tais erro'> resul­ tam de ílutuaçôe'> amostrais aleatórias.

Ocorre um erro não-amostral quando os dados amostrais são coterados, registrados ou analisados incorretamente. Tais erros resultam de um erro que não seja uma simples

Page 15: Livro - Introdução a Estatística - Cap 1 · Começamos nosso estudo de estatistica observando que a pala na tem dois significados básicos. No primeiro sentido. o termo é usado

~ t-<~il

, Você scre.d1t.i "" ,,.,118 de morr,d

j l· Ir l• li

tt t .I .I .I

tttttttttt

Introdução à Estatística 11

Amostragem A/eat6rla Cada elemento da populaçifo tem a mesma chance de !5er escolhido. Em geral utilizam-se computedoree para gerar números de telefone aleat6ríos.

Amo6tra{Jem Estratificada

Classificar a população em, ao menos, dois estratos e extrair uma amostra de cada um .

Amostragem Si6temática Escolher cada elemento de ordem k.

Amo5tragem por Conglomerado

Dividir em seções a área populacional, selecionar aleatoriamente algumas dessas eeçõee e tomar todos os elementos das mesmas.

Amostragem de Conveni8ncla

Utilizar resultados de fácil sceeeo.

Fig. 1 ·2 Métodos comuns de amostragem.

flutuação amostral aleatória, como a escolha de uma amos­ tra não-aleatória e tendenciosa, a utilizução de um instru­ mento de mensuração defeituoso, uma questão formulada de modo tendencioso, um grande número de recusas de resposta ou a cópia incorreta dos dados amostrais.

e extrairmos uma amostra cuidadosamente. de forma qu ela represente realmente a população. podemos aplicar os mé­ todos descritos neste livro para analisar o erro amostral. mas devemos ter o máximo cuidado em minimizar os erros não­ amosnuís.

Hawthorne e os Efeitos do Experimentador O bem conhecido efeito placebo ocorre quando um indivíduo nõo trotado acredito incorretomenle que estó recebendo um trotamento real e reporta uma melhora dos sintomas. O efe;1o Hawthome ocorre quando indivíduos trotados respondem de maneiro um tonto diferente, simplesmente porque sõo portes de um experimento. (Esse fenômeno foi chamado Mefeito Howthorne" porque Foi observado pelo primeira vez. em um estudo levado a efeito em operários do fóbrico do Western Electric, em Howthome.) Ocorre um efeito de experimentador (os vezes chamado efeito Rosentholl) quando o pesquisador ou ex.perimentodor involuntoriomen inRuencio o indivíduo pesquisado, através de fatores corno expressôo facial, tom de voz ou atirude.

Page 16: Livro - Introdução a Estatística - Cap 1 · Começamos nosso estudo de estatistica observando que a pala na tem dois significados básicos. No primeiro sentido. o termo é usado

12 Esnrlsnc,

1-4 Exercícios A: Habilidades e Conceitos Básicos o.\ Exercicios J-.J. determine se a descrição dada corresponde

a um estudo obsetvacional ou o um exnerimeuta.

1. Mede-se o conteúdo de alcatrão, nicotina e monóxido de carbono em diferentes marcas de cigarro (conforme Conjunto de Dados 4 no Apêndice B).

2. Pede-se a fumantes que reduzam à metade o número de cigarro. onsumidos diariamente. para que se possam medir os efeitos so­ bre a freqüência de pulsação.

3. Em uma turma de educação física, estuda-se o efeito dos exercl­ ios füicos sobre a pressão sanguínea, dctermmando-sc que meta­ de dos estudantes ande uma milha cada dia, enquaaro a outra 1111'­ tade corra uma milha diãria,

4. Estuda-se a relação entre os pesos de ursos e seus comprimentos, tomando-se as medidas em ursos anestesiados.

los Exercicios 5-16, identifique o tipo de amostragem utiliza­ do: aleatória, estratificada. sistemática. por conglomerado ou de conveniência.

5. Quando escreveu Women and Lave: A Cultural Revolution, a au­ tora Shere Hite baseou suas conclusões em 4.500 respostas a l00.000 questionários distribuídos a mulheres. m psicólogo da Universidade de Nova York foz uma pesquisa bre todos os estudantes de cada uma de 20 turmas selecionadas

alearori amente. m sociólogo na Universidade de Cbarleston se leciona 12 homen

e 12 mulheres de cada uma de quatro turmas de inglês. empresa Sony seleciona cada 200.°CD de sua linha de produção

e faz um teste de qualidade rigoroso. 9. Um cabo eleitoral escreve o nome de cada senador dos EUA. em

cartões separados, mistura-os e extrai 10 nomes. 10. O gerente comercial da América Online testa uma nova estratégia

de vendas selecionando aleatoriamente 250 consumidores com renda in.ferior a $50.000 e 250 consumidores com renda de ao menos $50.000.

J 1. O programa Planned Parenthood (Planejamento Familiar) pesquisa 500 homens e 500 mulheres sobre seus pontos de vista sobre o uso de anticoncepcionaü,.

12. Um pesquisador de mercado da American Airlines entrevista todos os passageiros de cada um de JO vôos selecionados aleatoriamente.

13. Um pesquisador médico da Universidade Johns Hopkins entrevis­ la todos os portadores de leucemia em cada um de 20 hospitais selecionados aleatoriamente.

14. Um repórter da revista Business IVeek entrevista todo 50.º gerente geral constante da relação das 1000 empresas com maior cotação de suas ações.

IS, Um repórter da revista Business Week obtém uma relação nume­ rada das 1000 empresas com maiores cotações de ações na bolsa, utiliza um computador para gerar 20 números aleatórios e então entrevista O!> gerentes gerais das empresas correspondentes aos números extraídos.

16. Ao fazer uma pesquisa para um noticiário vespertino de Boston, um repórter da NBC entrevista 15 pessoas que saem do auditório da lRS.

1 ·4 Exercícios B: A,lém do Básico 11. Aberta e fechada são dois tipos de questões de uma pesquisa. Uma

questão aberta permite uma resposta livre, enquanto uma questão

fechada comporta apenas urna resposta fixa. Alguns exeniploi baseados em pesquisas Gallup. Questão aberta: Na opinião do leitor, que se pode fazer para redu­ zir o crime? uestão fechada: Qual das seguintes medidas mais contribuirin pam

a redução da criminalidade?

a. Quais são as vantagens e as desvantagens das questões aber­ tas?

b. Quais as vantagens e as desvantagens das questões fecha­ das?

c. Que tipo é mais fácil de analisar com processos estatístico formais? Por quê?

18. Descreva detalhadamente um método que poderia ser usado parai obteruma amostra aleatória simples das alturas de cinco alunos de ua turma de estatística. •

1-5 Estatística com Calculadoras e Computadores

m subproduto importante do programa espacial dos EUA é a invenção do chip de microprocessador- urna invenção que teve profunda influência na aplicação da estatística. A instalação de chips de microprocessador em calculadoras e computadores eli­ minou a tremenda tarefa de cálculos monótonos, tornando o uso da estatística mais acessível a muitas pessoas. Descreveremos brevemente, nesta seção, o papel das calculadoras e dos compu­ tadores na estatística.

Calculadoras

Os estudantes de estatística cedo descobrem que uma calculado· ra é um de seus melhores auxiliares. Além de ter as operações básicas ( +, - , X, +. ..[ etc.), muitas calculadoras apresentam hoje recursos estatísticos especiais, como média, desvio-padrão e resultados de correlação/regressão. (Esses tópicos serão abor­ dados em capítulos posteriores.) Além de possibilitar o cálculo de expressões complicadas e de certas operações estatísticas, algumas calculadoras também permitem a introdução e armaze­ nagem de programas especiais a serem utilizados durante todo o curso. A TI-83 da Texas Instrurnents é um excelente exemplo de calculadora perfeitamente adaptável a um curso introdutó~o de estatística. E programável, pode exibir gráficos e tem nao poucas funções estatísticas especiais incluídas.

Existe um disco separado com programas escritos para a TI· 82 e TJ-83, e esses programas podem ser transferidos de um com· putador para a calculadora. Alguns professores de estatíslica exigem que todos os seus alunos utilizem uma calculadora TI· 83, outros exigem qualquer calculadora que processe estatística bivariada e outros finalmente aceitam o uso de qualquer calcu­ ladora. Para o estudante que ainda não tem uma calculadora, re­ comenda-se uma que seja capaz de processar estatística de dua variáveis. Qualquer que seja a calculadora escolhida, o manual que a acompanha é um guia valioso. Em caso de dúvida, consul

Page 17: Livro - Introdução a Estatística - Cap 1 · Começamos nosso estudo de estatistica observando que a pala na tem dois significados básicos. No primeiro sentido. o termo é usado

li te o manual e procure fazer os exemplos apresentados. Se ainda assim tiver dificuldade, recorra ao seu professor.

.I•

,1 Computadores o computador desempenha hoje papel relevante em quase todos os aspectos da análise estatfstica. A ampla diversidade de com­ putac.lores e pacotes de software possibilitou a utilização da cs­ tansuca por pessoas com di ferentes tipos de formação matemá­ tica, mas também criou maior oportunidade de uso indevido da estatística. é importante reconhecer que tanto os pacotes de soft­ ware como os computadores têm uma limitação muito séria: eles seguem cegamente as instruções, ainda que inadequadas ou mesmo absurdas. O computador não raciocina, e não pode for­ mular julgamentos. A compreensão dos princípios da estatística é pré-requisito importante para a correta interpretação de resul­ tados obtidos por computador. Mesmo que o leitor não venha a usar efetivamente os computadores neste curso, deve procurar desenvolver habilidade cm interpretar resultados de análise es­ tatística obtidos em um computador, como os que ocorrem em todo este texto.

Faremos referência freqüentemente a dois pacotes em parti­ cular: O STATDLSK e Minitab. O STATDISK apresenta uma vantagem importante: é um programa fácil de ser usado. O Minitab já é um pacote estatístico de nível mais elevado, mas também é de utilização relativamente fácil.

Com o ST ATDISK e o Minitab, os programas são escolhidos de uma barra de ferramentas no topo da tela, como segue:

STATDISK: File Edit Analysis Data Help Minitab:

File Edit Manip Cale Stat Graph Editor Window Help

Utilizando STA TDISK ou Minitab, podemos familiarizar-no melhor com a operação geral de um computador. Os exemplo que seguem ilustram alguns aspectos básicos de ST ATDISK e Minitab:

Para introduzir um novo conjunto de dados:

STATDISK: Selecionar Da La da barra de ferramentas e es­ colher então a opção Sample Editor.

Minitab: Selecionar File da barra principal e escolher então a opção New Worksheet.

Para salvar e nomear um conjunto de dados:

STATDISK Selecionar File da barra principal e escolher então a opção Save As.

Minitab: Selecionar File da barra principal e escolher então a opção Save Worksheet As ...

Introdução à Estatística 13

Para imprimir resultados: STATDISK: Selecionar FiJ ,:, da barra principal e escolher

a opção Pr n

Minitab: Selecionar F 11 e da barra principal e escolher a opção P r r t W naow.

Para sair do programa: STA TDISK: Selecionar 1- i leda barra principal e escolher

então a opção Q..i~ ~ .

Mínitab: Selecionar F l 1 e da barra principal e escolher então a opção Exi t.

STATDfSK e Minirab são ambos capazes de realízar quase to­ das as operações importantes abordadas neste livro.

Apresentamos apenas algumas características de ST ATDISK e Minitab, mas a utilização desses programas é abordada com maior detalhe em STATDTSK Student Laboratory Manual and Workbook (7. ª edição) e em Minitab Student Laboratary Manu­ al and Workbook (7."edição). As características e a apresenta­ ção de alguns resultados dados por esses programas são também discutidos em todo este livro. sempre que adequado.

Alguns professores de estatística preferem outros pacotes como SPSS. SAS, BMDP, Execustat, Systar, Mystat ou Statgraphics. Qualquer que seja o pacote escolhido, o estudante sempre se beneficiará, melhorando seus conhecimentos em uma área que se tomou tão importante.

Deixe o Computador Ligado Algumas pessoas costumam desligar o computador logo após o término de determinado tarefa, enquanto outros deixam-no ligado até que não precisem mais utilizó-lo naquele dia. O painel de circuitos e os chips do computador sofrem com esses ciclos de ligo/desligo. Mas o monitor pode se danificar quando o mesmo imagem é deixado na tela por períodos de tempo muito longos. O tempo médio entre interrupções IMTBF = Meon Time Between Foilures) poro o disco rígido [ó foi de 5000 horas, mos hoje é de cerco de 30.000 horas. Considerando os efeitos danosos dos ciclos on/off sobre o painel de circuitos e os chips do computador, e o grande MTBF poro discos rígidos, faz sentido deixar o computador ligado até o fim do dia, desde que o tela do monitor posso ser protegido utilizando-se um programo poro descansar o tela. Muitos pessoas utilizam essa estratégia, que se originou em porte de umo onélise estatístico de eventos passados.

1-5 Exercícios A: Habilidades e Conceitos Básicos Exercícios iniciais com calculadora: Nos Exercícios 1-l:J. as ex­ pressões apresentadas são análogas às que se encontram em diferentes panes do livro. Utilize sua calculadora para obter o valores indicados.

t. Para abrir um arquivo de dados previamente armazenado:

TATDlSK: Selecionar File da barra principal e escolher 2. ~(2 - si então a opção Open.

Minitah: clccionar File da barra principal e escolher então a opção Open Worksheel .

5 (4 - 5)2 + (9 - 5~~ 3 - l

e1 ÍJ(lOL)-152 ,7.\):::..: • 6

Page 18: Livro - Introdução a Estatística - Cap 1 · Começamos nosso estudo de estatistica observando que a pala na tem dois significados básicos. No primeiro sentido. o termo é usado

(22 - 25.3 )1 +-- -- 25 .. , :;; 1.96: · o .•... ··-0.03-2 - 6. 102.7 - 100.0

14,2 ('

"·' 7 15! · - tSueeaõo: ó'=6 X 'i x • x3 x '>xJ) 9!6! t:, • • - •.• -

1-5 Exercícios B: Além do Básico

9. Carregar STATDISK ou Minítab e abrir o arquivo do con­ junto de dados indicado a seguir. Esses dados já estão ar­ mazenados. Escreva os três primeiros valores relacionados.

TATD!SK: B:..0s. SiJD (pesos de balas M&M azuis)

Minitab: Al PAL?A. t,-":";,; (safras de alfafa de diversas variedade em diferentes plantações)

10. CarregarSTATDISK ou Minitah e salvaras seguintes quanti­ dades de alcatroo (em miligramas por cigarro) para 15 cigar­ ros diferentes. Salve os dados com o nome de arquivo CIGTAR

16 16 9 8 16 13 15 9 2 15 15 9 14 6 18

bra o arquivo de dados para verificar que foram realmente alvos e obtenha uma apresentação impressa dos mesmos.

Vocabulário estsn sr...-1 oopulãç censo amo~tra parâmetro estatí stica dados quantitativo dados qualitati,o dados dhcreto dados contínuos nfvel nominal de mensuração nível ordinal de mensuração nível intervalar de mensuração

nível de razão de mensuração pesquisa auto-selecionada estudo observacional experimento confundi mento amostra aleatória amostra aleatória simples amostragem estratificada amostragem i.istern.ática amostragem por conglomerados amostragem de conveniência erro amosuaí erro não-amostral

Revisão Iniciamos este capítulo com urna descrição geral da natureza da estatís­ rica e abordamos diferentes aspectos da natureza dos dados. Ilustramos com exemplos usos e abusos da estatística. Discutimos o planejamento de experimentos enfatizando a importância dos métodos de boa amos­ tragem. Encerramos o capítulo com urna rápida discussão do papel das calculadorai. e dos computadores. Ao completar o estudo oeste capitu­ lo. o estudante deve ser capa? de:

• Distinguir entre uma população e uma amostra • Distinguir entre um parâmetro e uma estausrlca • Identificar o nível de mensuração (nominal, ordinal, intervalar,

razão) de um conjunto de dado·

• Reconhecer a importância dos métodos de boa nmostragern. bem como a séria deficiência dos métodos viciados de amostrngcm

• Reconhecer que as pesquisas auto-selecionadas não podem servir de base para formar conclusões vãlidas sobre uma populaçiío

Exercícios de Revisão 1.

2.

O Laboratório de Teste de Produtos para o Consumidor seleciona uma düzin de pilhas (indicadas como de 9 volts) de cada um dm fabricantes, e testa a capacidade efetiva de cada uma. a. Os valores obtidos são discretos ou contínuos? b, Identifique o nível de mensuração (nominal, ordinal. intervalar,

razão) para as voltagens. e. Que tipo de amostragem (aleatória. estratificada, sistemática,

por conglomerado. de conveniência) está sendo utili.a1do'/ d. Trata-se de um estudo observacional ou de um experimento? e. Qual é o efeito relevante da utilização, pelo consumidor, de

pilhas rotuladas como de 9 volts, quando, na realidade, seu ní­ vel de voltagem é muito diferente?

Os pesquisadores do Laboratório de Teste de Produtos para o Con­ surnidor testam amostras de protetores eletrônicos contra variações de corrente para determinar os níveis de voltagem que podem da­ nificar os computadores. Para cada um dos casos seguintes, deter­ mine qual dos quatro níveis de mensuração (nominal. ordinal, intervalar. razão) é apropriado. a. Os níveis de voltagem que causam dano. b. Postos (primeiro. segundo, terceiro etc.) por ordem de qualida­

de para uma amostra de protetores. e. Relacionar os protetores como "recomendado, aceitável, não-

aceitável". d. As temperaturas das salas em que os protetores são testados. e. Os países em que os protetores foram fabricados. A revista Business Week faz uma pesquisa, enviando pelo correio um questionário a 5000 pessoas que investem em títulos. Com base nos resultados. os editores das revista concluem que a maioria do investidores nos EUA estão pessimistas quanto à economia. Qual o erro desta conclusão? Identifique cada cifra como discreta ou continua. a. A Nielsen Media Research Organization (Organização de Pes­

quisas Nielsen) pesquisou 2027 adultos que assistem ao pro­ grama Monday Night Football na ABC.

b. O Professor Fisher registrou os tempos gastos por estudantes de estatística para completarem um exame final, e o primeiro resultado foi 87.25 minutos.

e, Kathy Patel pesou seu livro de estatística e obteve o valor de 1,87 lb.

Identifique o tipo de amostragem (aleatória, estratificada, sistemá­ tica, por conglomerado, de conveniência) utilizada em cada um dos casos seguintes: a. Obtém-se uma amostra de um produto extraindo-se cada 100.•

unidade da linha de montagem. b. Geram-se números aleatórios cm um computador para selecio­

nar números de série de carros a serem escolhidos para uma amostra de teste.

e. Um fornecedor de peças para automóvel obtém uma amostra de todos os itens de cada um de 12 fornecedores selecionados aleatoriamente.

d. Um fabricante de automóveis faz um estudo de mercado compre­ endendo testes de direção feitos por uma amostra de I O homens e 10 mulheres em cada uma de quatro diferentes faixas etárias.

e. Um fabricante de automóveis faz um estudo de mercado entre­ vistando clientes em potencial que solicitam teste de direção a um revendedor local.

Agenciadore, do censo constataram que ao perguntar a idade dos pessoas encontram mais pessoas com 50 anos do que com 49 ou 5 I. Pode explicar por que isso ocorre? O leitor pretende fazer uma pe\quisa cm ~eu campus. Onde está o erro ao selecionar cada 50.º estudante que sai da lanchonete?

3.

4.

5.

6.

7.

Page 19: Livro - Introdução a Estatística - Cap 1 · Começamos nosso estudo de estatistica observando que a pala na tem dois significados básicos. No primeiro sentido. o termo é usado

8. O Southpart Chronidl' reportou que uma corrida preliminar foi ussi~titla por 8725 pessoa». Comente.

Exercícios Cumulativos de Revisão Os exerdcios cumutativos de revisão deste livro destinam-se a incor­ porar algum material de capttulos anteriores, uma caractertstica que será i111plcml'11lada nos capitulas seguintes. Os exercícios desta seção urili.,am conceitos aprendidos antes do estudo deste livro. J. A pergunta seguinte, feita cm uma pesquisa, teve repercussão quan­

do as respostas sugeriram que cerca de 22% dos americanos acha­ vam que o holocausto pode não ter existido.

"Acha possível ou impossível que a exterminação de judeus pelos nazistas nunca tenha existido?" Uma pesquisa subseqüente revelou que os que responderam pro­ vavelmente se sentiram confusos pela dupla negativa da frase. Eis uma formulação adequada em uma pesquisa Roper subseqüente:

"Acha possível que a exterminação de judeus pelos nazistas jamais ocorreu, ou está certo de que realmente aconteceu?"

Esta segunda versão parece substancialmente menos confusa? Pode formular a questão de modo que ela se apresente ainda mais clara do que nas duas versões?

Introdução à Estatística 15

2. Observe a figura a seguir. É semelhante a uma a que Edwin Tufte, autor de The Visual Display of Quantitative Data. se refere quan­ do observa: "Este pode muito bem ser o pior gráfico jamais dado à imprensa". Observe que o gráfico relaciona "quase por acaso, ape­ nas cinco conjuntos de dados (pois a divisão dentro de cada ano soma 100 por cento)". Examine primeiro o gráfico e identifique a informação que ele procura transmitir. Faça então um novo gráfi­ co retratando a mesma situação.

Proieto para Computador hj Recorra ao Conjunto de Dados 2 no Apêndice B e considere as 106 tem­ peraturas (cm graus Fahrenheit) encontrada, na última coluna (Dia 2. 12 horas). Os pesquisadores da Universidade de Maryland coletaram dados sobre a temperatura do corpo humano e constataram que a média não era de 98,6"F, valor que quase todos nós supomos ser a média cor- reta. Utilizando o STA TDTSK ou o Minitab, introduza ru; 106 tempera- turas e as salve sob o nome BODYTEMP.

O objetivo deste projeto de computador é introduzir os dados e armazená-los em um disquete de computador. Isso permitirá termos os dados disponíveis para usá-los no Capítulo 2, contribuindo tam­ bém para aumentar sua capacidade de introduzir e armazenar dados em um computador - uma técnica críticamente importante nos dia atuais.

ESTRUTURA EíÁRJA DA MATRÍCULA EM FACULDADES

72,0 72

71 1 1 '70,8

Me:=lie:25 70

69

68

671 \ \ \. ·....__ 67.~ ..... li\ 67,0 ~ :::,

'~ 1 ~ ', 66.4 ...,

~ 66 "' -,:s ] i2 ~ t "' 1 .3.3 e

ª ti: .32

.3J r\ .30t ~~Ç(/ITl:f

zs

28 {I 1 1 1

1972 197.'í 1974 1975 1971

Page 20: Livro - Introdução a Estatística - Cap 1 · Começamos nosso estudo de estatistica observando que a pala na tem dois significados básicos. No primeiro sentido. o termo é usado

16 fa1ATISTI

DOS DADOS À DECISÃO

Dados Mal Representados btenha um exemplo de um jornal ou uma revista em que os

dados tenham sido apresentados de maneira enganosa. Iden­ tifique a fonte (incluindo data de publicação) de onde o exern-

pio foi tirado. Explique como a apresentação é enganosa e ugira uma forma mais honesta de apresentar os dados.

ATIVIDADES EM GRUPO 1. Atividade extraclasse: Divida em grupos de cinco e co­

lete 50 valores utilizando amostragem aleatória, confor­ me descrita na Seção 1-4. Repita então a coleta de 50 valores para cada um dos outros quatro métodos de amos­ tragem: estratificada. sistemática. por conglomerados e de conveniência. Em cada caso, calcule a "média". (A média é definida no Capítulo 2 e se obtém somando-se todos os valores e dividindo-se o total peJo número de valores.) Descreva inicialmente, com detalhe, o proces- o utilizado para cada método de amostragem; relacione então os valores e compare as cinco médias. Os diferen­ tes métodos parecem dar os mesmos resultados? Os da­ dos devem ser extraídos de uma população como idades dos li\ ros em uma biblioteca, ou idades dos carros no es­ tacionamemo da faculdade.

2. Atividades na classe: Divida em grupos de três ou quatro e utilize os dados a seguir para construir um gráfico que exa­ gere os aumentos nos pontos altos da Média Industrial Dow fones. Construa outro gráfico que minimize a importância desses aumentos, e finalmente construa um terceiro gráfico que represente os dados sem qualquer tendenciosidade. Década 1950 1960 1970 1980

Dow Alto 683 995 1.052 2.796 3. Atividades na classe: Divida em grupos de três ou quatro.

Suponha que deve fazer uma pesquisa junto a estudantes de tempo integral de sua faculdade. Planeje e descreva de­ talhadamente um processo para obter uma amostra alea­ tória de 100 estudantes.

Page 21: Livro - Introdução a Estatística - Cap 1 · Começamos nosso estudo de estatistica observando que a pala na tem dois significados básicos. No primeiro sentido. o termo é usado

entrevista Paul Mones Paul Mones é odvogado, outor o consultor. Escreveu When o Chi/d Kílls: Abused Children Who Kill Their Porents. Escreveu também S1alkín9 Justice, 0 verdadeiro hist6rio de um defetivo que utilizou pela primeira vez impressões digílais DNA para apanhar um cssossino contumaz. Foi entrevistado em muitos programas importantes nos EUA, na Europa e na Austrólio, inclusive "60 Minutos", "20/20" e "Larry King líve", Seus comenlóríos oparecerom em jornais e revistas como o Ne.w !ork Tí~es_e Time; foi correspondente legol poro "NBC News·. Treina médicos. advogados e oficiais de justiço, e testemunho perante cormssoes leg1slahvas.

o senhor utiliza a estatística em seu trabalho como advogado? Utilizo extensamente o estatístico em meu trabalho. Com a doctiloscopia DNA, por exemplo, consideramos vários fatores e determinamos a probabilidade de obter uma seqüência específica de genótipos nos mesmas pessoas. Costumávamos atentar para três /oci (posições que os genes ocupam nos cromossomas); em seguida possamos para cinco, mas agora estamos em sete. Estudamos uma amostro de referência e umo amostra de comparação para ver a freqüência com que determinada seqüência ocorre. Se a seqüência de um suspeito coincide em sete loci, existe uma boa chance de o suspeito ser culpado; em seguido determinamos a freqüência daquela seqüência no população. Em Stalking Justice, os chances eram de 1 em 750.000.000 de outra pessoa ter o mesmo perfil DNA do acusado no coso. Aplicamos o teste de hipóteses e determinamos o nível de significância para o perfil DNA específico. O DNA é também muito importante em investigações de paternidade e casos de estupro. Com os testes convencionais de sangue-enzima, poderíamos chegar o cerca de 10% da população. Isso significa que há uma chance em 1 O de o culpodo não ser o acusado. Com a dactiloscopia DNA, temos uma chance em 300.000.000, e entramos assim no domínio da inevitabilidade estatística. O processo é usado não somente para condenar pessoas, mas também para excluir suspeitos. Há um caso famoso na Carolina do Norte, em que duas testemunhas oculares testificaram que o acusado era um estuprador. Ele ficou preso 11 anos, mos foi liberado quando o DNA mostrou que ele não era o culpado. Nesse caso, a estatística e o DNA se revelaram muito mais precisos do que as identificações por testemunhas oculares.

Tenho utilizado a estatística em casos de homicídio, de abusos de crianças, de mulheres espancados e de paternidade. Nos casos de paternidade hoje, os resultados do DNA são tão precisos que todo o sistema de julgamento está sendo obreviodo. Os condenados simplesmente não vão o julgamento quando os resultados do DNA são bastante claros. Uma dúvida razoável se transforma em nenhuma dúvida. A grande pergunta é: "A estatística é tão poderosa o ponto de tirar do júri sua responsabilidade de tomar decisõesê" Há exceções, mos, na maioria dos casos, a presença de uma forte evidência estatística é um instrumento eficiente paro o tomoda de decisões.

Como advogado que faz; extenso uso da estatística, o senhor acha que todos os advogados deveriam conhecer os princípios da estatística? Eles necessitam de muito mais. Se queremos dominar efetivoment, nossa evidência, devemos ter algum fundamento estatístico. O problema é que, hoje, os advogados costumam recorrer a outros

peritos. Nos casos de morte acidental, por exemplo, costumam recorrer o estatísticos paro obter dados atuariais sobre o vida provável de alguém. E raro o advogado que sequer entende o que o estatístico está dizendo, de formo que seria recomendável que qualquer pessoa desejosa de ingressar no carreira de advogado, estudasse estatístico.

O senhor utiliza a estatística em seu trabalho com abuso de crianças e violência? Tenho grande interesse no relação entre abuso de crianças e violência, e uma das melhores formas de convencer os legisladores, ou jurados, ou audiências é utilizar a estatística. Entre os adolescentes que matam seus pais, sabemos que um dos maiores fatores de risco ocorre quando as crianças vêem seus pais espancarem suas mães. O estado do Texos fez uma pesquisa e constatou que, entre os meninos que cometeram homicídio, 66 por cento haviam matado alguém que, de alguma forma, fizera mal às suas mães. Quanta mois conhecemos acerca de umo população, mais sabemos que pesquisas estatísticos devemos fazer.

Recomenda a estatística para os alunos de universidades hoje? A estatístico não é somente poro os que lidam com ciências exatos. Proporciono importantes recursos para os que desejam tornar-se advogados, médicos, enfermeiros ou policiais. Verifiquei que posso apreciar melhor notícias sobre eventos, notícias financeiras e demonstrações de lucros e perdas poro ações. A estatística é mais importante do que boa porte do matemática bósica ensinada. Utilizo muito mais a estatística do que a geometria ou o trigonometria.

Que outros conhecimentos são im,portantes par~ o-universitário de hoie? Em uma épocá em que tudo está sendo computadorizado, as pessoas estão dando cada vez menos atenção à comunicação, de Forma que a arte da palavra Falada esló sendo um tanto negligenciado. Pode haver milhões de pessoas capazes de utilizarem um computador, mas muito poucos em condições de se dirigirem o uma assembléia. As pessoas pe~isom também ter capacidade de comunicar suas idéias por escrito.

17