estatistica aplicada-(introduçãolegal)

Upload: michel-silva

Post on 10-Jul-2015

1.205 views

Category:

Documents


0 download

TRANSCRIPT

Ministrio da Educao Escola Tcnica Aberta do Brasil Escola Tcnica da Universidade Federal do Paran

Estatstica AplicadaJavert Guimares Falco

Cuiab, 2008

Ministro da Educao Fernando Haddad Secretrio SEED/MEC Carlos Eduardo Bielschowsky Coordenador da Escola Tcnica Geraldo Severino dos Santos Aberta do Brasil Comisso Editorial Prof Dr Maria Lucia Cavalli Neder - UFMT Prof Dr Ana Arlinda de Oliveira - UFMT Prof Dr Lucia Helena Vendrusculo Possari - UFMT Prof Dr Mrcia Freire Rocha Cordeiro Machado - ET-UFPR Prof Dr Gleyva Maria Simes de Oliveira - UFMT Prof. M. Sc. Oreste Preti - UAB/UFMT Designer Educacional Maria Cristina de Aguiar Campos

Ficha Catalogrfica F181e FALCO, Javert Guimares Estatstica aplicada / Javert Guimares Falco. Cuiab: EdUFMT; Curitiba: UFPR, 2008. 92p.: il.; color. Inclui bibliografia ISBN 9788561819286 1. Estatstica 2. Estatstica - Textos didticos 1. I. Ttulo. CDU - 311(075)

Reviso Germano Aleixo Filho Capa To de Miranda (Lay out) Hugo Leonardo Leo Oliveira (arte final) Ilustrao To de Miranda

Diagramao Terencio Francisco de Oliveira Elizabeth Kock Carvalho Netto

Cuiab, 2008

PROGRAMA e-TEC BRASIL

Amigo(a) estudante:

O Ministrio da Educao vem desenvolvendo Polticas e Programas para expanso da Educao Bsica e do Ensino Superior no Pas. Um dos caminhos encontrados para que essa expanso se efetive com maior rapidez e eficincia a modalidade a distncia. No mundo inteiro so milhes os estudantes que freqentam cursos a distncia. Aqui no Brasil, so mais de 300 mil os matriculados em cursos regulares de Ensino Mdio e Superior a distncia, oferecidos por instituies pblicas e privadas de ensino. Em 2005, o MEC implantou o Sistema Universidade Aberta do Brasil (UAB), hoje, consolidado como o maior programa nacional de formao de professores, em nvel superior. Para expanso e melhoria da educao profissional e fortalecimento do Ensino Mdio, o MEC est implementando o Programa Escola Tcnica Aberta do Brasil (e-Tec Brasil). Espera, assim, oferecer aos jovens das periferias dos grandes centros urbanos e dos municpios do interior do Pas oportunidades para maior escolaridade, melhores condies de insero no mundo do trabalho e, dessa forma, com elevado potencial para o desenvolvimento produtivo regional. O e-Tec resultado de uma parceria entre a Secretaria de Educao Profissional e Tecnolgica (SETEC), a Secretaria de Educao a Distncia (SEED) do Ministrio da Educao, as universidades e escolas tcnicas estaduais e federais. O Programa apoia a oferta de cursos tcnicos de nvel mdio por parte das escolas pblicas de educao profissional federais, estaduais, municipais e, por outro lado, a adequao da infra-estrutura de escolas pblicas estaduais e municipais. Do primeiro Edital do e-Tec Brasil participaram 430 proponentes de adequao de escolas e 74 instituies de ensino tcnico, as quais propuseram 147 cursos tcnicos de nvel mdio, abrangendo 14 reas profissionais. O resultado deste Edital contemplou 193 escolas em 20 unidades federativas. A perspectiva do Programa que sejam ofertadas 10.000 vagas, em 250 plos, at 2010.

Assim, a modalidade de Educao a Distncia oferece nova interface para a mais expressiva expanso da rede federal de educao tecnolgica dos ltimos anos: a construo dos novos centros federais (CEFETs), a organizao dos Institutos Federais de Educao Tecnolgica (IFETs) e de seus cmpus.

O Programa e-Tec Brasil vai sendo desenhado na construo coletiva e participao ativa nas aes de democratizao e expanso da educao profissional no Pas, valendo-se dos pilares da educao a distncia, sustentados pela formao continuada de professores e pela utilizao dos recursos tecnolgicos disponveis. A equipe que coordena o Programa e-Tec Brasil lhe deseja sucesso na sua formao profissional e na sua caminhada no curso a distncia em que est matriculado(a).

Braslia, Ministrio da Educao setembro de 2008.

CURSO TCNICO EM GESTO PBLICA

Seja bem-vindo(a): Queremos cumpriment-lo(a), pois voc est comeando o Curso Tcnico em Gesto Pblica do Programa e-Tec Brasil 2008. O profissional Tcnico em Gesto Pblica dever, aps o trmino do Curso, estar integrado s particularidades da gesto pblica, tais como: a estrutura do Poderes Pblicos e hierarquia dos Setores Pblicos; o processo de elaborao e execuo dos planejamentos polticos e econmicos da administrao pblica, bem como o processo de prestao de contas aos cidados; o funcionamento dos quadros dos servidores pblicos, bem como o processo de contratao e remunerao; os processos de comunicaes formais utilizados pela administrao pblica, bem como o processo de aplicao destes recursos; o atendimento ao pblico e o processo de aplicabilidade da legislao, bem como adaptar-se s atualizaes devido s mudanas de legislao. O Programa e-Tec Brasil se constitui instrumento valioso para a formao de seus cidados. Esperamos, que, efetivamente, voc aproveite esta oportunidade de escrever sua histria e seu futuro ao lado de quem est ajudando a transformar nosso Pas. Sucesso para voc!

Mrcia Denise Gomes Machado Carlini, Coordenadora do Curso Tcnico em Gesto Pblica - e-Tec Brasil.

SUMRIO

Estatstica Aplicada - Javert Guimares Falco

CONVERSA INICIAL UNIDADE 1 - INTRODUO ESTATSTICA UNIDADE 2 - TABELAS E GRFICOS UNIDADE 3 - DISTRIBUIO DE FREQUENCIAS UNIDADE 4 - MEDIDAS UNIDADE 5 - PROBABILIDADE RETOMANDO A CONVERSA INICIAL REFERNCIAS BIBLOGRFICAS

9 11 21 37 55 81 89 91

CONVERSA INICIAL

Caro(a) aluno(a): Este material foi elaborado a partir de minha experincia na educao presencial e a distncia, buscando trazer de forma objetiva, simples e prtica os principais contedos que sero importantes para seu exerccio profissional. Objetiva-se, nesta disciplina, fundamentar as possibilidades de coletar, organizar, descrever e interpretar dados, enfim, medir fenmenos coletivos. Os assuntos abordados iniciam-se com um texto introdutrio, onde so estudados: panorama histrico, conceitos e variveis . Na Unidade II, estudaremos tabelas e grficos. Na Unidade III, a distribuio de freqncia e o nosso foco. Na Unidade IV, as medidas so estudadas em profundidade. Na Unidade V, estudaremos Probabilidade. Espero que, atravs dos contedos contemplados nesta apostila, somados s aulas expositivas e ao seu esforo pessoal, possamos quebrar, juntos, o paradigma de que a Estatstica uma disciplina difcil, complicada e transform-la em uma disciplina de simples compreenso, til e aplicvel no seu cotidiano profissional. Muito estudo e consequente sucesso nesta caminhada! Prof. Javert Guimares Falco

Estatstica Aplicada - Javert Guimares Falco

9

UNIDADEINTRODUO ESTATSTICA

1

Nesta unidade, apresentaremos noes bsicas de Estatstica e vocabulrio correspondente. O homem curioso, e como tal, procura investigar sobre tudo aquilo que o cerca. Investigao sugere pesquisa, busca de informaes e anlise de dados e tudo isto faz pensar em ESTATSTICA. O relacionamento da Estatstica com as demais cincias cada vez mais intenso. Veja, por exemplo, que a estatstica auxilia a Gentica, nas questes de hereditariedade; valiosa na Economia, na anlise da produtividade, da rentabilidade, nos estudos de viabilidade; bsica para as Cincias Sociais, nas pesquisas scio-econmicas; de aplicao intensa na Engenharia Industrial, no controle de qualidade, na comparao de fabricaes; indispensvel Administrao, Programao, Medicina, Psicologia, Histria, e, de forma direta ou indireta, s demais atividades.

PANORAMA HISTRICO DA ESTATSTICAHistoricamente, o desenvolvimento da estatstica pode ser entendido a partir de dois fenmenos : a necessidade de governos coletarem dados censitrios e o desenvolvimento da teoria do clculo das probabilidades. Dados tm sido coletados atravs de toda a histria. Na Antiguidade, vrios povos j registravam o nmero de habitantes, de nascimentos, de bitos, faziam estimativas das riquezas sociais, distribuam equitativamente terras aos povos, cobravam impostos e realizavam inquritos quantitativos por processos que, hoje, chamaramos de estatsticas. Na Idade Mdia colhiam-se informaes, geralmente com finalidades tributrias ou blicas. Atualmente, informaes numricas so necessrias para cidados e organizaes de qualquer natureza, e de qualquer parte do mundo globalizado.

O que Estatstica?Estatstica um conjunto de mtodos e processos quantitativos que serve para estudar e medir os fenmenos coletivos. Dug de Bernonville Em outras palavras, a cincia que se preocupa com a coleta, a organizao, descrio (apresentao), anlise e interpretao de dados experimentais e tem como objetivo fundamental o estudo de uma populao. Este estudo pode ser feito de duas maneiras: Investigando todos os elementos da populao; Amostragem, ou seja, selecionando alguns elementos da populao.

Conceitos EstatsticosPopulao: Conjunto de indivduos, objetos ou informaes que apresentam pelo

Estatstica Aplicada - Javert Guimares Falco

13

menos uma caracterstica comum, cujo comportamento interessa-nos analisar. Em outras palavras, conjunto de todas as medidas, observaes relativas ao estudo de determinado fenmeno. Como em qualquer estudo estatstico temos em mente estudar uma ou mais caractersticas dos elementos de uma populao, importante definir bem essas caractersticas de interesse para que sejam delimitados os elementos que pertencem populao e quais os que no pertencem. Exemplos: Deseja-se saber se nas indstrias situadas no Estado do Paran, em 2007, existia algum tipo de controle ambiental. 1- Populao ou universo: indstrias situadas no Estado do Paran em 2007. Caracterstica: existncia ou no de algum tipo de controle ambiental na indstria. Deseja-se conhecer o consumo total de energia eltrica em MWH nas residncias da cidade de Curitiba no ano de 2007. 2- Populao ou universo: todos as residncias que estavam ligadas rede eltrica em Curitiba, em 2007. Caractersticas: consumo anual de energia eltrica em MWH. Diviso da populao 1-Populao Finita: apresenta um nmero limitado de elementos. possvel enumerar todos os elementos componentes. Exemplo: Idade dos alunos do curso de Gesto Pblica em EAD no Estado do Paran. Populao: Todos os alunos de Gesto Pblica em EAD No Estado do Paran. 23-2-1-2-Populao infinita: apresenta um nmero ilimitado de elementos. No possvel enumerar todos os elementos componentes. Entretanto, tal definio existe apenas no campo terico, uma vez que, na prtica, nunca encontraremos populaes com infinitos elementos, mas sim, populaes com grande nmero de componentes; e nessas circunstncias, tais populaes so tratadas como se fossem infinitas. Exemplo: Tipos de bactrias no corpo humano Populao: Todas as bactrias existentes no corpo humano. Em geral, como os universos so grandes, para se investigarem todos os elementos populacionais, para determinarmos a caracterstica, necessita-se muito tempo, e/ou o custo elevado, e/ ou o processo de investigao leva destruio do elemento observado, ou, como no caso de populaes infinitas, impossvel observar a totalidade da populao. Assim, estudar parte da populao constituise um aspecto fundamental da Estatstica. Amostragem: a coleta das informaes de parte da populao, chamada amostra, mediante mtodos adequados de seleo destas unidades.

14

Estatstica Aplicada - Javert Guimares Falco

Amostra: uma parte (um subconjunto finito) representativa de uma populao selecionada segundo mtodos adequados. O objetivo tirar concluses sobre populaes com base nos resultados da amostra. Para isso, necessrio garantir que amostra seja representativa, ou seja, a amostra deve conter as mesmas caractersticas bsicas da populao, no que diz respeito ao fenmeno que desejamos pesquisar.

Voc j deve ter sido entrevistada ou conhece algum que j respondeu ao Censo do IBGE. Voc considera que o Censo importante para alm de se conhecerem nmeros relativos idade, profisso, nascimento, morte etc serem feitas propostas de melhoria das condies de vida?

Censo: o exame completo de toda populao. Quanto maior a amostra, mais precisas e confiveis devero ser as indues feitas sobre a populao. Logo, os resultados mais perfeitos so obtidos pelo Censo. Na prtica, esta concluso muitas vezes no acontece, pois, o emprego de amostras, com certo rigor tcnico, pode levar a resultados mais confiveis ou at mesmo melhores do que os que seriam obtidos atravs de um Censo. As razes de se recorrer a amostras so: menor custo e tempo para levantarem dados; melhor investigao dos elementos observados. Dados sobre o Brasil podem ser obtidos junto ao instituto Brasileiro de Geografia e Estatstica (iBGE) pelo site www.ibge.gov.br A Estatstica ocupa-se fundamentalmente das propriedades das populaes cujas caractersticas so passveis de representao numrica como resultado de medies e contagens. Essas caractersticas da populao so comumente chamadas de VARIVEIS. As caractersticas ou variveis podem ser divididas em dois tipos: qualitativas e quantitativas. variveis qualitativas - quando o resultado da observao apresentado na forma de qualidade ou atributo. Dividem-se em: variveis nominais: quando podem ser separadas por categorias chamadas de no mensurveis. Exemplo: a cor dos olhos, tipo de acomodao, marcas de carro, sexo etc. variveis ordinais: quando os nmeros podem agir como categorias ou ordenaes. Como sugere o nome, elas envolvem variveis que representam algum elemento de ordem. Uma classificao em anos pode ser um exemplo clssico. A classificao deste tipo de variveis geralmente causa confuso. Exemplo: Grau de satisfao da populao brasileira com relao ao trabalho de seu presidente (valores de 0 a 5, com 0 indicando totalmente insatisfeito e 5 totalmente satisfeito). variveis quantitativas - quando o resultado da observao um nmero, decorrente de um processo de mensurao ou contagem. Dividem-se em:

Estatstica Aplicada - Javert Guimares Falco

15

variveis contnuas: so aquelas que podem assumir qualquer valor num certo intervalo (contnuo) da reta real. No possvel enumerar todos os possveis valores. Essas variveis, geralmente, provm de medies. Exemplo: A altura dos alunos uma varivel contnua, pois teoricamente, um aluno poder possuir altura igual a 1,80m, 1,81m, 1,811m, 1,812m . . . (medies: peso, estatura, etc.) variveis discretas: so aquelas que podem assumir apenas valores inteiros em pontos da reta real. possvel enumerar todos os possveis valores da varivel. Exemplo: Nmero de alunos de uma escola, nmero de mensagens em uma secretria eletrnica etc. As variveis podem ser resumidas da seguinte maneira:

Diviso da EstatsticaA Teoria Estatstica moderna se divide em dois grandes campos: Estatstica Descritiva - aquela que se preocupa com a coleta, organizao, classificao, apresentao, interpretao e anlise de dados referentes ao fenmeno atravs de grficos e tabelas, alm de calcular medidas que permitam descrever o fenmeno. Estatstica indutiva - aquela que partindo de uma amostra, estabelece hipteses, tira concluses sobre a populao de origem e que formula previses, fundamentando-se na teoria das probabilidades. A estatstica indutiva cuida da anlise e interpretao dos dados. O processo de generalizao do mtodo indutivo est associado a uma margem de incerteza. Isto se deve ao fato de que a concluso que se pretende obter para o conjunto de todos os indivduos analisados quanto a determinadas caractersticas comuns baseia-se em uma parcela do total de observaes. Para se analisarem os dados de forma estatstica podem-se obter os resultados de duas maneiras: atravs de um censo ou atravs de uma amostragem (pesquisa em uma amostra). Para exemplificar essas teorias analise o esquema abaixo: Populao caractersticas tcnicas de Amostragem Amostra Anlise Descritiva Concluses sobre as caractersticas da populao inferncia Estatstica Informaes contidas nos dados

16

Estatstica Aplicada - Javert Guimares Falco

Exemplos de utilizao: Pesquisa de Mercado, Pesquisa de opinio pblica e em praticamente todo experimento.

Fases do mtodo Estatstico1 FASE - Definio do Problema: Saber exatamente aquilo que se pretende pesquisar o mesmo que definir corretamente o problema. 2 FASE - Planejamento: Como levantar informaes? Que dados devero ser obtidos? Qual levantamento a ser utilizado? Censitrio? Por amostragem? E o cronograma de atividades? Os custos envolvidos? etc. 3 FASE Coletas de Dados: Fase operacional. o registro sistemtico de dados, com um objetivo determinado. Coleta de Dados. Aps a definio do problema a ser estudado e o estabelecimento do planejamento da pesquisa (forma pela quais os dados sero coletados; cronograma das atividades; custos envolvidos exame das informaes disponveis; delineamento da amostra etc.), o passo seguinte a coleta de dados, que podem ser de dois tipos: 1- Dados Primrios: os dados so obtidos diretamente na fonte originria (coleta direta) Exemplo: Preferncia dos consumidores por um determinado produto. Mtodos de coleta de dados primrios: importante garantir que a coleta de dados primrios seja executada de maneira estatisticamente correta, seno os resultados podem ser tendenciosos. Observao: O pesquisador no pergunta, observa. Por exemplo: pesquisa de observao para diagnosticar as necessidades de trnsito de uma cidade. 2- Levantamento: o mtodo mais comum de se coletar dados. O instrumento pode ser um questionrio estruturado ou um roteiro de itens em que o entrevistado disserta vontade sobre cada item da pesquisa. As trs principais formas de levantamento, resumindo as vantagens e desvantagens so: Entrevista pessoal: mais flexvel e muito caro. Telefone: mais barato, penetra em segmentos difceis, mas de fcil recusa. Questionrios (postal, fax ou e-mail): mais lento, mdia de retorno das respostas muito baixas, mas sem interferncia do pesquisador. Dados Secundrios: os dados so obtidos de algo j disposto. Provm da coleta direta.

Estatstica Aplicada - Javert Guimares Falco

17

Exemplo: Pesquisa sobre a mortalidade infantil, que feita atravs de dados colhidos por outras pesquisas.

Voc j deve ter sido entrevistado(a) para alguma pesquisa. Voc sempre respondeu verdadeiramente? Quando a pesquisa feita por telefone ou e-mail, voc tem a mesma disposio para responder?

mais seguro trabalhar com fontes primrias. O uso da fonte secundria traz o grande risco de erros de transcrio.

4 FASE Apurao dos Dados: Resumo dos dados atravs de sua contagem e agrupamento. a condensao e tabulao de dados. 5 FASE Apresentao dos Dados: H duas formas de apresentao, que no se excluem mutuamente. A apresentao tabular, ou seja, uma apresentao numrica dos dados em linhas e colunas distribudas de modo ordenado, segundo regras prticas fixadas pelo Conselho Nacional de Estatstica e a apresentao grfica dos dados numricos que constitui uma apresentao geomtrica permitindo uma viso rpida e clara do fenmeno. 6 FASE Anlise e Interpretao dos Dados: A ltima fase do trabalho estatstico a mais importante e delicada. Est ligada essencialmente ao clculo de medidas e coeficientes, cuja finalidade principal descrever o fenmeno (estatstica descritiva). Na estatstica indutiva a interpretao dos dados se fundamenta na teoria da probabilidade.

Em snteseEstatstica a cincia que se preocupa com a coleta, organizao, descrio, anlise e interpretao de dados experimentais. Populao um conjunto de indivduos, objetos ou informaes que apresentam pelo menos uma caracterstica comum. Amostra uma parte representativa de uma populao. As caractersticas das populaes so chamadas de variveis, que podem ser divididas em: Qualitativas: - nominal (sexo, cor dos olhos...) - ordinal (classe social, grau de instruo...) Quantitativas: - contnua (peso, altura...) - discreta (nmero de filhos, nmero de carros...)

18

Estatstica Aplicada - Javert Guimares Falco

Estatstica Descritiva se preocupa com a coleta, organizao, classificao, apresentao, interpretao e anlise de dados experimentais. Estatstica Indutiva se preocupa com as hipteses e concluses sobre a populao.

Responda s questes abaixo e confira as respostas, no gabarito, no final do livro1) Podemos dizer que a Estatstica pode ser: a) Construtiva ou referencial b) Destrutiva ou direcional c) Descritiva ou inferencial d) Regressiva ou pontencial e) Ingressiva ou preferencial 2)O que Estatstica Descritiva? a) o clculo de medidas que permitiro descrever, com detalhes, o fenmeno que est sendo analisado. b) a parte da Estatstica referente coleta e tabulao dos dados. c) a parte da Estatstica referente s concluses sobre as fontes de dados. d) a generalizao das concluses sobre as fontes de dados. e) a obteno dos dados seja atravs de simples observao ou mediante a utilizao de alguma ferramenta. 3) Assinale a alternativa que expressa corretamente o que populao para a Estatstica: a) populao a totalidade de habitantes de uma pas. b) populao uma parte da amostra. c) populao uma reunio de pessoas populares. d) populao um conjunto de elementos portadores de, pelo menos, uma caracterstica comum. e) populao o conjunto de elementos que respondero a um questionrio que fornecer informaes relevantes para uma pesquisa. 4) A definio correta de amostra a que consta da alternativa: a) amostra o conjunto de dados obtidos em uma pesquisa. b) amostra um brinde que ganhamos em um evento. c) amostra o conjunto dos resultados obtidos com uma pesquisa. d) amostra uma tabela de dados obtida com uma pesquisa. e) amostra um subconjunto finito de uma populao.

Estatstica Aplicada - Javert Guimares Falco

19

5) Dentro do universo estatstico alunos de uma faculdade, as variveis cor dos cabelos e nmero de irmo podem ser classificadas, respectivamente, como: a) 1. varivel quantitativa discreta; 2. varivel qualitativa. b) 1.varivel quantitativa contnua; 2.varivel qualitativa. c) 1.varivel qualitativa; 2.varivel quantitativa contnua. d) 1. varivel qualitativa; 2.varivel quantitativa discreta. e) 1. varivel quantitativa discreta; 2.varivel qualitativa contnua.

20

Estatstica Aplicada - Javert Guimares Falco

UNIDADETABELAS E GRFICOS

2

Nesta unidade, estudaremos a apresentao tabular que uma apresentao numrica dos dados. Consiste em dispor os dados em linhas e colunas distribudos de modo ordenado, segundo algumas regras prticas ditadas pelo Conselho Nacional de Estatstica e pelo IBGE. As tabelas tm a vantagem de conseguir expor, sinteticamente e em um s local, os resultados sobre determinado assunto, de modo a se obter uma viso global mais rpida daquilo que se pretende analisar. Essa integrao de valores que temos nas tabelas, nos permite ainda a utilizao de representaes grficas, normalmente, uma forma mais til e elegante de demonstrar as caractersticas que sero analisadas.

TABELA um quadro que resume um conjunto de observaes. Uma tabela compe-se de: Corpo conjunto de linhas e colunas que contm informaes sobre a varivel em estudo; Cabealho parte superior da tabela que especifica o contedo das colunas; Coluna indicadora parte da tabela que especifica o contedo das linhas; Casa ou clula espao destinado a um s nmero; Ttulo conjunto de informaes, as mais completas possveis, respondendo s perguntas: O qu?, Quando?, Onde?, localizado no topo da tabela; Fonte indicao da entidade responsvel pelo fornecimento dos dados ou pela sua Veja o exemplo abaixo, que mostra os elementos que formam uma tabela. Ttulo Cabealho Casa ou Clula

Tabela 11 Evoluo da renda dos Empreendedores Brasileiros Faixa de Renda Menos de 3 SM De 3 a 6 SM Mais de 6 a 9 SM Mais de 9 a 15 SM Mais de 15 SM No sabe Recusou TotalFonte: Pesquisas GEM 2000 2003

2000(%) 30 30 14 12 1 4 100

2000(%) 39 31 12 12 3 6 100

2000(%) 43 34 11 9 3 2 100

2000(%) 53 22 8 6 1 2 100

Coluna Indicadora

Fonte

Corpo

Estatstica Aplicada - Javert Guimares Falco

23

De acordo com a resoluo 886 da Fundao IBGE nas casas ou clulas, devemos colocar: 1) um trao horizontal (_ ) quando o valor zero e no s quanto a natureza das coisas , como que resultado do inqurito; 2) trs pontos (...) quando no temos os dados. 3) um ponto de interrogao (? ) quando temos dvida quanto a exatido de determinado valor 4) zero (0) quando o valor muito pequeno para ser expresso pela unidade utilizada. Se os valores so expressos em numerais decimais precisamos acrescentar a parte decimal um nmero correspondente de zeros (0,0; 0,00; 0,00; ..).

Sries EstatsticasDenomina-se srie estatstica toda tabela que apresenta a distribuio de um conjunto e dados estatsticos em funo da POCA, do LOCAL, ou da ESPCIE (fenmeno). Numa srie estatstica observa-se a existncia de trs elementos ou fatores: o TEMPO, o ESPAO e a ESPCIE. Conforme varie um desses elementos, a srie estatstica classifica-se em TEMPORAL, GEOGRFICA e ESPECFICA

- Srie temporal, Histrica ou cronolgica a srie cujos dados esto em correspondnciacom o tempo, ou seja, variam com o tempo. Exemplo: Preo do artigo Y no atacado na cidade X anos Preo mdio em reais

Anos 2003 2004 2005 2006 2007Fonte: Dados Fictcios

Preos Mdios em Reais 2,43 2,54 3,01 2,99 2,83

- Srie Geogrfica, Territorial ou de Localidade a srie cujos dados esto em correspondncia com a regio geogrfica, ou seja, o elemento varivel o fator geogrfico (a regio). Exemplo: Nmero de Assaltos na Cidade X em 2006

Regio Centro Zona Sul Zona Norte Zona Leste Zona OesteFonte: Dados Fictcios

Nmero de Assaltos 74 54 31 29 44

24

Estatstica Aplicada - Javert Guimares Falco

- Srie Especfica ou categrica a srie cujos dados esto em correspondncia com a espcie, ou seja, variam com o fenmeno. Exemplo: Nmero de Candidatos ao vestibular da universidade X em 2006rea ofertada Cincias Sociais Aplicadas Cincias Exatas Cincias Humanas Cincias Biolgicas Cincias TecnolgicasFonte: Dados Fictcios

Nmero de Candidatos 2086 1065 1874 1102 1902

- Sries mistasAs combinaes entre as sries anteriores constituem novas sries que so denominadas sries compostas ou mistas e so apresentadas em tabelas de dupla entrada. Exemplo: Nmero de Alunos Matriculados nas Escolas Particulares na cidade XBairros Bairro - A Bairro - B Bairro - C Bairro - D Bairro - EFonte: Dados Fictcios

2005 2894 7075 1099 4333 2976

2006 3454 9876 3218 3455 1765

2007 2989 6543 2100 3543 4098

GRFICOS ESTATSTICOSA apresentao grfica um complemento importante da apresentao tabular. A vantagem de um grfico sobre a tabela est em possibilitar uma rpida impresso visual da distribuio dos valores ou das freqncias observadas. Os grficos propiciam uma idia inicial mais satisfatria da concentrao e disperso dos valores, uma vez que, atravs deles, os dados estatsticos se apresentam em termos de grandezas visualmente interpretveis. A representao grfica de um fenmeno deve obedecer a certos requisitos fundamentais, para ser realmente til: simplicidade: destitudo de detalhes e traos desnecessrios; clareza: possuir uma correta interpretao dos valores representativos do fenmeno em estudo; veracidade: expressar a verdade sobre o fenmeno em estudo.

Principais tipos de GrficosGrfico em curvas ou em linhasSo usados para representar sries temporais, principalmente quando a srie cobrir um grande nmero de perodos de tempo.

Estatstica Aplicada - Javert Guimares Falco

25

70 60 50 40 30 20 10 0

1 Europa

2 Trimestre Amrica Oriente

3

4

Grfico em Colunas trimestre a representao de uma srie estatstica atravs de retngulos, dispostos em colunas (na vertical) ou em retngulos (na horizontal). Este tipo de grfico representa praticamente qualquer srie estatstica. Vendas no Oriente Mdio (Em R$ Mil) 70 60 50 40 30 20 10 0

1

2 Trimestre

3

4

Observao: As regras para a construo so as mesmas do grfico em curvas. As bases das colunas so iguais e as alturas so proporcionais aos respectivos dados. O espao entre as colunas pode variar de 1/3 a 2/3 do tamanho da base da coluna

Grfico em Barras representado por retngulos dispostos horizontalmente, prevalecendo os mesmos critrios adotados na elaborao de grfico em coluna. Vendas por Regio (Em R$ Milhares/Ano) Europa Amrica do Sul Extremo Oriente 0 50 100 150 200Estatstica Aplicada - Javert Guimares Falco

26

Grfico em Setores a representao grfica de uma srie estatstica em um crculo de raio qualquer, por meio de setores com ngulos centrais proporcionais s ocorrncias. utilizado quando se pretende comparar cada valor da srie com o total. O total da srie corresponde a 360 (total de graus de um arco de circunferncia). O grfico em setores representa valores absolutos ou porcentagens complementares. As sries geogrficas, especficas e as categorias em nvel nominal so mais representadas em grficos de setores, desde que no apresentem muitas parcelas (no mximo sete). Cada parcela componente do total ser expressa em graus, calculada atravs de uma regra de trs:Total - 360 Parte - x

Exemplo Prtico: Em uma amostra com alunos do Ensino Mdio, quando perguntados sobre o interesse em aprender computao, obteve-se como respostas: 30 alunos manifestaram interesse, 15 no demonstraram interesse e 5 no sabem. Representar graficamente:Sobremesas 14% Sanduches 40%

Bebidas 15% Sopas 10% Saladas 21%

Aprender Computao 35 30 25 20 15 10 5 0 Interesse Sem Interesse No sabem

Nmero de Alunos

Aprender Computao No sabem 10%

No Interessados 30%

Interessados 60%

Estatstica Aplicada - Javert Guimares Falco

27

Comparando os dois grficos Aprender Computao 35 30 25 20 15 10 5 0 Interesse Sem Interesse No sabem Nmero de Alunos Aprender Computao No sabem 10% No Interessados 30% Interessados 60%

Observe acima que comparamos os grficos. Essa prtica, feita quando desenhamos dois grficos, lado a lado, para podermos estabelecer melhor a comparao de um fenmeno.

NOES BSICAS SOBRE AS PLANILHAS NO EXCELO Excel uma poderosa ferramenta para se organizar informaes, fazer clculos e criar grficos. Seus documentos so chamados de planilhas, que so grandes tabelas onde podem ser colocados textos, nmeros, figuras, grficos, frmulas e muito mais. Conhecer o Excel e seus fundamentos bsicos certamente um grande diferencial para os profissionais de qualquer rea.

A tela principalPara abrir o Excel, clique no boto Iniciar, Todos os programas e Microsoft Excel. Voc ver, ento, a tela principal, com menus parecidos com os do Word, alguns botes, a barra de frmulas, uma planilha em branco, as abas de planilhas e uma linha de informaes. O que e para que serve uma planilha. Voc deve notar, ao olhar para a planilha em branco que se abre quando iniciamos o Excel, que ela formada por retngulos, denominados clulas. Elas podem conter textos, frmulas e nmeros. Cada clula localizada pela letra que est acima dela e pelo nmero que est do seu lado esquerdo. Assim, em cima e esquerda temos a clula A1, ao lado direito dela a clula B1 e assim por diante. Para voc compreender como funciona esta planilha, vamos criar um exemplo simples:

28

Estatstica Aplicada - Javert Guimares Falco

- Clique sobre a clula A1 e digite: MINHAS NOTAS; - Depois, clique sobre a clula A3 e digite: Matemtica. - Pressione Enter, para ir para a linha de baixo (ou clique sobre a clula A4) ; - Digite Portugus Enter novamente, Informtica; - Enter de novo e Fsica. Agora, vamos aumentar um pouco a largura da coluna A. Para isso, passe com o mouse entre as letras A e B at que o cursor mude para uma barra vertical com duas setas ao lado. Agora, clique e arraste para a direita, at que as palavras que digitamos caibam com certa folga na coluna. O mesmo poderia ser feito com o menu Formatar, Coluna, Largura e digitando o valor 14, por exemplo. A nossa planilha deve estar assim: Agora, na clula B2, digite Prova 1, na clula C2, digite Prova 2 e na clula D2, digite Mdia. Agora, complete com as seguintes notas:

Vamos, ento, digitar a nossa primeira frmula: em D3, digite: =(B3+c3)/2 Quando voc pressionar enter, o valor da mdia aritmtica entre 95 e 86 ir aparecer na clula D3. Note que para digitar uma frmula, voc comea digitando o sinal de igual, depois a operao que voc quer fazer com as clulas. Voc somou os valores que estavam nas clulas B3 e C3, e depois dividiu o resultado por 2 para fazer a mdia. A diviso representada pela barra ( / ) e os parnteses so necessrios para que o Excel calcule primeiro a soma e s depois divida por 2. Caso no usssemos os parnteses, o valor da clula B3 seria somado metade do valor da clula C3, o que no desejamos

Estatstica Aplicada - Javert Guimares Falco

29

Bem, agora vamos usar os recursos do Excel para que no tenhamos que digitar todas as frmulas! Clique sobre a clula D3. Voc notou que ao redor dela aparece um retngulo mais grosso com um pequeno quadrado do lado direito e embaixo da clula? Clique nesse quadrado e arraste para baixo, at a clula D6. Veja o que aconteceu: as clulas D4, D5 e D6 foram automaticamente criadas copiando a frmula em D3, mas modificando o nmero da linha! A clula D4, por exemplo, ficou assim: =(B4+C4)/2 Este recurso muito poderoso e economiza um grande trabalho na hora de elaborar planilhas maiores! Agora, vamos deixar a nossa planilha mais bonita. Primeiro, selecione as clulas de A3 at A6 clicando sobre a clula A3 e arrastando at A6. Agora pressione o boto boto para deixar os nomes das matrias em negrito. Pressione tambm o para alinhar as matrias pela direita. Selecione agora as clulas B2 at e para centralizar.

D2 e pressione novamente

Selecione todas as notas (de B3 at D6) e clique em

para centralizar as notas.

Agora, selecione as clulas de A1 at D1 e clique no boto as clulas (chama-se mesclar as clulas) e nos botes e

, que ir agrupar .

Ainda com as clulas selecionadas, clique na clula de tamanho da fonte e selecione o tamanho 14. Agora vamos colocar bordas para melhorar ainda mais o visual. Para isso, selecione as clulas de A1 a D6 e clique no tringulo preto pequeno ao lado do boto , para escolher o tipo de borda e clique em .

A nossa planilha est assim:

30

Estatstica Aplicada - Javert Guimares Falco

Agora experimente mudar um nmero, por exemplo, trocar o 80 de Fsica por 100. Veja que a mdia se altera automaticamente. Esse um recurso muito interessante, pois torna os dados das planilhas sempre atualizados! No se esquea de salvar a sua planilha, clicando em Arquivo, Salvar. O procedimento igual ao do Word.

Formatao de nmeros e ordenao alfabticaAbra a planilha que voc salvou, com as notas, caso a tenha fechado. Agora, selecione as clulas de B3 at D6. V at o menu Formatar, Clulas. Abre-se uma janela que contm vrias opes para formatao das clulas

Estatstica Aplicada - Javert Guimares Falco

31

Algumas das operaes que fizemos para embelezar a nossa planilha esto tambm disponveis ali. Mas clique em Nmero, e em casas decimais abaixe para 1. Clique em OK para ver o resultado. Agora as notas aparecem com uma casa decimal. Isso ajuda na visualizao, pois todas as notas tm agora o mesmo aspecto. Explore tambm as outras opes desta janela, formatando os nmeros como Moeda, Porcentagem, alterando a fonte (tipo de letra utilizado) etc. Agora, experimente selecionar as clulas A3 at D6 e clicar no boto . Ele serve para ordenar os nomes em ordem alfabtica. Agora, a ordem fica Fsica, Informtica, Matemtica e Portugus.

CoresVamos colorir um pouco o nosso trabalho. Para isso, selecione todas as clulas da planilha clicando no retngulo que aparece esquerda do A e acima do 1 nos cabealhos de linhas e colunas:

Clique, ento, no boto com o baldinho . Isso faz com que todas as clulas sejam pintadas de branco, realando a nossa planilha. Depois, selecione a clula A1 (que est mesclada com as clulas sua direita) e no tringulo preto ao lado do boto do baldinho. Selecione a cor azul plido, o azul mais de baixo da paleta de cores. Mude as cores de outras clulas e tente reproduzir esta visualizao:

Experimente, tambm trocar as cores das letras e nmeros com o boto

Grficos no ExcelFinalmente, vamos a um recurso muito utilizado, que a capacidade do Excel de gerar grficos a partir dos dados de uma planilha Para isso, selecione as clulas de A1. at D6 e clique no boto . Abre-se, ento, a janela de criao de grficos.

32

Estatstica Aplicada - Javert Guimares Falco

H vrios tipos de grficos que podem ser criados (Colunas, Barras, Linha etc.) e para cada tipo h vrias opes (subtipos). Para ver como ser o grfico com o seu conjunto de dados em cada tipo e subtipo, selecione a opo desejada, clique e segure o boto

Vamos criar um grfico de colunas com o primeiro sub-tipo (colunas agrupadas). Para isso, clique em Avanar. Selecione, ento, sries em linhas (o que neste caso agrupa as notas da Prova 1, Prova 2 e Mdia) e clique em Avanar. Em Ttulo do grfico, digite Minhas Notas. Se desejar dar nomes aos eixos x e y, digite-os nos campos indicados. Clique novamente em Avanar e Concluir. Seu grfico est criado e um objeto que pode ser movimentado na planilha,Estatstica Aplicada - Javert Guimares Falco

33

redimensionado e apagado, se voc desejar. Vamos agora dar o ltimo toque ao grfico, clicando com o boto direito do mouse sobre o valor 105 do eixo vertical. Depois, clique com o boto esquerdo em Formatar eixo. Clique sobre a palavra Escala, na parte superior. Em mnimo, onde est 75, mude para 0 e em mximo, onde est 105, mude para 100. O nosso grfico ficou assim:

Minhas Notas

Agora voc pode explorar o Excel, criando planilhas, fazendo grficos e experimentando sem medo de errar!

Em sntese Tabela um quadro que resume um conjunto de observaes. - Srie estatstica toda a tabela que apresenta a distribuio de um conjunto de dados estatsticos em funo da poca, local, ou da espcie. - As sries podem ser divididas em: temporal, histrica ou cronolgica geogrfica, territorial ou de localidade especfica ou categrica Grfico um complemento da tabela e deve apresentar simplicidade, clareza e veracidade.

34

Estatstica Aplicada - Javert Guimares Falco

Os grficos podem ser classificados em: grfico em curvas ou linhas grfico em colunas grfico em barras grfico em setores

Responda s questes abaixo e confira as respostas, no gabarito, no final do livro6)Classifique a srie abaixo: Aplicaes em milhes de reais do ltimo quadrimestre de 2007 num determinado banco Ms Aplicaes Setembro 20,3 Outubro 22,2 Novembro 23,1 Dezembro 21,0

a) cronolgica b) geogrfica c) especfica d) distribuio de freqncia e) nenhuma das anteriores

Fonte: dados fictcios

7)Classifique a srie abaixo: Exportao em milhes de dlares por parte de empresas no ano 2006.

Porte Pequeno Mdio Grande

Exportaes 100 150 200

a) cronolgica b) geogrfica c) especfica d) distribuio de freqncia e) nenhuma das anteriores

Fonte: dados fictcios

Estatstica Aplicada - Javert Guimares Falco

35

8) A escolaridade dos jogadores de futebol nos grandes centros maior do que se imagina, como mostra a pesquisa abaixo, realizada com os jogadores profissionais dos quatro principais clubes de futebol do rio de Janeiro. De acordo com esses dados, o percentual dos jogadores dos quatro clubes que concluram o Ensino mdio de aproximadamente: Total: 112 jogadores 60 40 20 0 54 14 16 14Mdio incompleto Mdio

14Superior incompleto

a) 14%. b) 48%. c) 54%. d) 60%. e) 68%.

Fundamental Fundamental incompleto(O Globo, 24/7/2005)

9) Por que importante fazermos a representao grfica de uma srie de dados estatsticos: a) Para que a apresentao fique mais bonita. b) Para que seja possvel uma melhor visualizao dos fenmenos em estudo. c) Porque toda apresentao deve ter grficos. d) Porque uma apresentao com grficos impressiona mais os leitores. e) Nenhuma das alternativas est correta.

10) Os dados abaixo referem-se s vendas de uma equipe da empresa-WB. construa o grfico de linhas da tabela abaixo: MS VEND. JAN A B C D E 55 52 45 47 58 FEV MAR ABR 48 52 44 32 63 56 34 38 59 51 34 57 50 54 43 MAI 47 51 59 47 37 JUN 32 48 33 70 29 JUL 63 33 25 41 44 AGO 28 36 53 57 26 SET 39 40 32 51 45 OUT NOV 32 53 41 35 36 42 42 53 46 37 DEZ 67 29 38 57 48

Fonte: dados fictcios

36

Estatstica Aplicada - Javert Guimares Falco

UNIDADEDISTRIBUIO

3

Nesta unidade, abordaremos Distribuio, com o objetivo de produzir visualizao dos dados e posterior anlise de informaes.

DISTRIBUIO DE FREQNCIASUm conjunto de observaes de certo fenmeno, no estando adequadamente organizado, fornece pouca informao de interesse ao pesquisador e ao leitor. Para uma viso rpida e global do fenmeno em estudo preciso que os dados estejam organizados. Uma das formas de se fazer a organizao dos dados coletados em uma pesquisa atravs das distribuies de freqncia.

Representao dos Dados (Amostrais ou Populacionais)Dados brutos: so aqueles que no foram numericamente organizados, ou seja, esto na forma com que foram coletados. Por exemplo: Nmeros de filhos de um grupo de 50 casais

Rol: a organizao dos dados brutos em ordem de grandeza crescente ou decrescente. Por exemplo: Nmeros de filhos de um grupo de 50 casais

Distribuio de freqncia sem intervalos de classe: a simples condensao dos dados conforme as repeties de seus valores. Para um rol de tamanho razovel esta distribuio de freqncia inconveniente, j que exige muito espao. Veja exemplo abaixo: Nmero de pontos obtidos pelos alunos na disciplina-X, colgio-Y, em 2007.

Nota: dados hipotticos

Estatstica Aplicada - Javert Guimares Falco

39

Distribuio de freqncia com intervalos de classe: Quando o tamanho da amostra elevado e o nmero de variveis muito grande, mais racional efetuar o agrupamento dos valores em vrios intervalos de classe. Veja o Exemplo:

Nota: dados hipotticos

Vamos, agora, analisar um exemplo prtico de coleta de dados e organizao destes valores em tabelas de frequncias com intervalos de classe. Dados Brutos: Taxas municipais de urbanizao (em percentual) no Estado X 2005

Nota: dados hipotticos

Rol: Taxas municipais de urbanizao (em percentual) no Estado X 2005

Nota: dados hipotticos

40

Estatstica Aplicada - Javert Guimares Falco

Distribuio de freqncias para dados agrupados em classes:

Observao: Representaremos o somatrio pela letra grega maiscula sigma () Elementos de uma Distribuio de Freqncia - classe: so intervalos de variao da varivel. As classes so representadas simbolicamente por i, sendo i = 1, 2, 3, . . ., k (onde k o nmero total de classes da distribuio). Pelo exemplo prtico anterior o intervalo 16 26 define a segunda classe (i = 2).

A distribuio formada por nove classes, podemos afirmar que i = 9.

O smbolo representa um intervalo fechado esquerda e aberto direita. Significa que o nmero a esquerda pertence classe e o nmero direita no pertence. Limites de classe: so os extremos de cada classe. O menor nmero o limite inferior da classe ( li ) e o maior nmero, o limite superior da classe ( ls ). Por exemplo Pelo exemplo prtico anterior na terceira classe, temos: li3= 26 e ls3 = 36 Amplitude de um intervalo de classe (h): a medida de intervalo que define a classe. Ela obtida pela diferena entre os limites superior e inferior. Assim: h = ls - li Exemplo: A amplitude da classe descrita acima 10, pois a diferena do limite superior com o inferior.

Estatstica Aplicada - Javert Guimares Falco

41

- Amplitude total (H): a diferena entre o valor mximo e o valor mnimo da amostra. H = Ls - Li Pelo exemplo prtico anterior, sabemos que ls = 92 e Li = 6, logo amplitude total H = 92 6 = 86 Ponto mdio de uma classe (xi): o ponto que divide o intervalo de classe em duas partes iguais. l i+ ls xi = 2 Pelo exemplo prtico anterior na quinta classe, temos: li5= 46 e ls5 = 56, logo o ponto mdio dessa classe xi = 46 + 56 = 102 = 51 2 2 Em sntese: - Dados brutos so aqueles que no foram numericamente organizados. - Rol a organizao dos dados brutos em ordem de grandeza crescente ou decrescente. - Distribuio de freqncias pode ser com ou sem intervalos de classe. - Os elementos da distribuio de freqncias so: classe: so intervalos de variao da varivel limites da classe: so os extremos de cada classe amplitude de um intervalo: a diferena entre o limite superior e inferior h=ls li amplitude total: a diferena entre o maior e o menor da amostra H=LS LI ponto mdio: a mdia aritmtica dos limites da classe xi = ls + li 2

DISTRIBUIO DE FREQNCIAS NMEROS DE CLASSE TIPOS DE FREQNCIADeterminao do Nmero de Classes (K) importante que a distribuio conte com um nmero adequado de classes. Se o nmero de classes for excessivamente pequeno acarretar perda de detalhe e pouca informao se poder extrair da tabela. Por outro lado, se for utilizado um nmero excessivo de classes, haver alguma classe com freqncia nula ou muito pequena, no atingindo o objetivo de classificao que tornar o conjunto de dados supervisionveis.

42

Estatstica Aplicada - Javert Guimares Falco

No h uma frmula exata para determinar o nmero de classes. Trs solues so apresentadas abaixo: 1) Para n 25 K = 5 e para n > 25 K= n

Esse processo menos preciso. Exemplo: Se a amostra tiver 23 elementos analisados o nmero de classes 5, pois n < 25. Suponha que a amostra tenha 83 elementos analisados (n > 25) o nmero de classes calculado por 83 = 9,1104335 = 9 2) Pode-se utilizar a regra de Sturges, que fornece o nmero de classes em funo do total de observaes: K = 1 + 3,3.log n Onde: K o nmero de classes; n o nmero total de observaes.

Para facilitar o clculo do nmero de classes pela regra de Sturges, utilize a tabela abaixo:

observao: Inclui tanto o valor da direita quanto o da esquerda No inclui nem o valor da direita, nem o da esquerda Inclui o valor da direita mas no o da esquerda Inclui o valor da esquerda mas no o da direita A frmula de Sturges revela um inconveniente, prope um nmero demasiado de classes para um nmero pequeno de observaes e relativamente poucas classes, quando o total de observaes for muito grande. Exemplo: Se a amostra tiver 94 elementos analisados, o clculo do nmero de classes pela

Estatstica Aplicada - Javert Guimares Falco

43

frmula de Sturges ficar da seguinte maneira: K= 1+ 3,3. log n . log 94 . 1,97313 K@ K = 1+ 3,3 K = 1+ 3,3 K@ 7,51 8 Tambm, percebemos pela tabela que 94 um nmero entre 91 teremos 8 classes formando a tabela de freqncias. 181, logo

3) Truman L. Kelley, sugere os seguintes nmeros de classes, com base no nmero total de observaes, para efeito de representao grfica:

Exemplo: Se a amostra tiver 50 elementos analisados o nmero de classes 8, conforme tabela acima.

Qualquer regra para determinao do nmero de classes da tabela no nos leva a uma deciso final, esta vai depender, na realidade, de um julgamento pessoal, que deve estar ligado natureza dos dados.

Amplitude do intervalo de classe (Ai): o comprimento da classe. Ai = Observao: convm arredondar o nmero correspondente amplitude do intervalo de classe para facilitar os clculos (arredondamento arbitrrio). Exemplo prtico: Antes de enviar um lote de aparelhos eltricos para venda, o Departamento de Inspeo da empresa produtora selecionou uma amostra casual de 32 aparelhos avaliando o desempenho atravs de uma medida especfica, obtendo os seguintes resultados:

Construir uma tabela de distribuio de freqncias com intervalos de classes. 1 passo: A amplitude total ser dada por: H = Ls - Li H = 218 -154 = 64 2 passo: Neste caso, n = 32 K=6 pela regra de Sturges (consultar Tabela)

44

Estatstica Aplicada - Javert Guimares Falco

64 10,66... 11 = = 6 4 passo: Construir a tabela de distribuio de freqncias com intervalos de classes: 3 passo: A amplitude do intervalo de cada classe ser: Ai = =

32 Perceba que utilizamos o menor valor do Rol, para iniciar a 1 classe e a amplitude do intervalo encontrado para formar as outras classes que completam a tabela.

Tipos de FreqnciasFreqncias simples ou absolutas (fi): o nmero de repeties de um valor individual ou de uma classe de valores da varivel. A soma das freqncias simples igual ao nmero total dos dados da distribuio. fi = n Freqncias relativas (fri): so os valores das razes (divises) entre as freqncias absolutas de cada classe e a freqncia total da distribuio. A soma das freqncias relativas igual a 1 ou 100 % Freqncia relativa: fri = fi fi fri % = fi . 100 fi

Freqncia relativa %:

Freqncia simples acumulada (faci): o total das freqncias de todos os valores inferiores ao limite superior do intervalo de uma determinada classe. Freqncia relativa acumulada (fraci): a freqncia acumulada da classe, dividida pela freqncia total da distribuio. fraci = fac fi

Vamos colocar em prtica, juntos, todos esses conceitos que estudamos nas aulas 5, 6, 7 e 8 atravs do seguinte exerccio: O departamento comercial de uma empresa pediu o levantamento das vendas dirias (em milhares de reais) durante

Estatstica Aplicada - Javert Guimares Falco

45

os 25 dias do ms de novembro de 2007. Assim obteve os seguintes valores:

Pede-se: 1) Montar o Rol 1) Calcular amplitude total. 2) Calcular o nmero de classes. 3) Calcular a amplitude do intervalo de cada classes. 4) Construir uma tabela com todos os tipos de freqncias (simples, relativa, acumulada e acumulada relativa) Soluo: O Rol :

A amplitude total ser dada por:

Neste caso, n = 25

pela regra de Sturges, temos:

Amplitude do intervalo de cada classe ser:

Utilizando o menor valor do Rol, para iniciar a 1 classe e a amplitude do intervalo de cada classe, e completando a tabela com as freqncias temos:

46

Estatstica Aplicada - Javert Guimares Falco

Em Sntese - Para determinar o nmero de classes temos trs casos: 1 caso Para n 25 Para n 25

nmero de classes K = 5 nmero de classes K = n K = 1 + 3,3 log n

2 caso Pela regra de sturges

3 caso Pela regra de Truman L. Kelley

conforme a tabela abaixo:

- Amplitude do intervalo de classe: o comprimento da classe, calculado por: Ai = - Freqncia simples ou absoluta o nmero de repeties de um valor individual. - Freqncia relativa so os valores das divises entre as freqncias absolutas de cada classe e a freqncia total da distribuio. - Freqncia simples acumulada o total das freqncias de todos os valores inferiores ao limite superior do intervalo de uma determinada classe. - Freqncia relativa acumulada a freqncia acumulada da classe dividida pela freqncia total da distribuio.

DISTRIBUIO DE FREQNCIAS HISTOGRAMA E POLGONO DE FREQNCIASHistograma: um grfico formado por um conjunto de retngulos justapostos e muito utilizado para representar a distribuio de freqncias cujos dados foram agrupados em classes ou intervalos de mesma amplitude. A base do retngulo igual amplitude do intervalo classe e altura proporcional freqncia da classe.

Exemplo: Estaturas dos alunos da Turma A 2006 nmero de alunos12 10 8 6 4 2 0150 154 154 158 158 162 162 166 166 170 170 174

11 9 8 5 3

4

Estatura e cmEstatstica Aplicada - Javert Guimares Falco

47

Polgono de Frequncias: obtido unindo-se por segmentos de reta os pontos mdios das base superiores dos retngulos de histograma. Exemplo: Estaturas dos alunos da Turma A 2006 nmero de alunos12 10 8 6 4 2 0150 154 154 158 158 162 162 166 166 170 170 174

. . . . . .Estatura e cm Vamos colocar em prtica, juntos, todos esses conceitos desta aula atravs dos seguintes exerccios: 1) Numa empresa, foi observada a seguinte tabela de salrios semanais (em reais) de 40 operrios no-especializados.

Forme com esses dados uma tabela de dados agrupados por classes e depois construa o histograma e polgono de freqncia correspondente. Soluo: Antes de construirmos o histograma e o polgono de freqncias, temos que montar a tabela com dados agrupados por classes, desta forma faremos inicialmente os seguintes clculos: A amplitude total ser dada por:

Neste caso, n = 40 de Sturges, temos: pela regra

A amplitude do intervalo de cada classe ser:

48

Estatstica Aplicada - Javert Guimares Falco

Utilizando o menor valor do Rol, para iniciar a 1 classe e a amplitude do intervalo de cada classe, e completando a tabela com as freqncias temos:

Depois de montarmos a tabela com dados agrupados em classes, iremos construir o histograma e o polgono de freqncia:

2) Examine o histograma abaixo, que corresponde s notas relativas aplicao de um teste de inteligncia a um grupo de alunos.30

nmero de alunos

25 20 15 10 5 040 50 50 60 60 70 70 80 80 90 90 100 100 110 110 120 120 130 130 140 140 150

n de alunos Determine: a) O nmero de alunos: ____________ b) A freqncia acumulada da quinta classe: _____________ c) A freqncia relativa stima classe: ______________ d) A porcentagem de alunos que atingiram pelo menos 90 pontos: __________ e) O nmero de alunos que obtiveram pontuao menor que 110 pontos: ______

Estatstica Aplicada - Javert Guimares Falco

49

Em sntese - Histograma um grfico formado por um conjunto de retngulos justapostos. - Polgono de freqncias obtido unindo-se por segmentos de reta os pontos mdios das bases superiores dos retngulos de um histograma.

Responda s questes abaixo e confira as respostas, no gabarito, no final do livro11) Quando um intervalo de classe est representado por 1,250 significa que: a) o valor 1,250 no faz parte do intervalo de classe. b) o valor 1,250 o limite superior do intervalo de classe. c) o valor 1,260 faz parte do intervalo de classe. d) o valor 1,260 o limite inferior do intervalo de classe. e) o ponto mdio deste intervalo o valor 1,255. 1,260, isto

12) com relao distribuio de freqncia dada abaixo, possvel dizer que:

a) a amplitude total da distribuio 0,24. b) o limite inferior da 4a. classe 12,44. c) o limite superior da 3a. classe 12,44. d) a amplitude do intervalo de classe 0,04. e) todas as alternativa esto corretas.

13) Dada a distribuio de freqncias a seguir, responda qual o limite da quarta classe: a) 8 b) 6 c) 4 d) 10 e) 40 14) Na distribuio de freqncias da questo 3, qual a amplitude de cada classe ou intervalo? a) 10 b) 1 c) 2 d) 40 e) 8

50

Estatstica Aplicada - Javert Guimares Falco

15) Na distribuio de freqncias da questo 3, qual o ponto mdio da quinta classe ou intervalo? a) 40 b) 5 c) 8 d) 9 e) 10 16) A tabela abaixo refere-se a uma pesquisa realizada com 20 alunos, a respeito da rea da carreira universitria que cada um pretende seguir.

? ?

A freqncia simples e a freqncia relativa que faltam (assinaladas por ? ) so respectivamente: a) 7 e 5 b) 7 e 7 c) 5 e 7 d) 7 d) 8 e) 5e) 5 e e a) b) c) 20 20 20 20 20 17. Se a distribuio de freqncia obtida atravs da entrevista com 35pessoas, em relao ao nmero de irmos que cada uma tm, representada abaixo:

34 7 Total 35 1,0000 1,001

Obs.: A ltima freqncia acumulada relativa resultou 1,0001 por critrios de arredondamento. perfeitamente admissvel desprezar a ltima casa decimal. Em relao a esta distribuio possvel dizer que: a) temos 30 pessoas que possuem 3 irmos. b) temos temos 8,57% das pessoas com, pelo menos, 3 irmos. c) temos 94,29% das pessoas entrevistadas com 5 ou menos irmos. d) temos 34 pessoas com mais de 6 irmos. 18) dada a distribuio de freqncias a seguir,

Estatstica Aplicada - Javert Guimares Falco

51

19 | 21 | 23 | 25 | 27 | 29 |

21 23 25 27 29 31

responda qual a freqncia acumulada total: a) 31 b) 55 c) 20 d) 60 e) 12

As questes de nmero 19 e 20 devem ser respondidas com base na tabela primitiva de dados obtidos em uma pesquisa. Massa, em Kg, de pacotes de certo produto produzido por uma indstria X

Fonte: Dados Fictcios

19) O limite superior da quinta classe : a) 1,060 b) 1,046 c) 1,088 d) 1,074 e) 1,052 20) As freqncias da terceira e da quinta classe so, respectivamente: a) 8 e 9 b) 10 e 12 c) 8 e 12 d) 10 e 4 e) 10 e 9 Analise os dados abaixo que se referem a uma amostra de bitos/ms nos hospitais de uma grande capital brasileira, nos ltimos 25 meses e faa o que se pede: 410, 440, 440, 584, 579, 577, 577, 454, 460, 460, 491, 561, 556, 491, 490, 491, 490, 553, 553, 540, 540, 520, 491, 520, 491. 21) colocar os dados acima em forma de rol e calcular a amplitude total.

52

Estatstica Aplicada - Javert Guimares Falco

22) Calcular o nmero de classes.

23) calcular a amplitude das classes.

24) construir a tabela com os dados agrupados por classes.

25) construir o histograma e o polgono de freqncia.

Estatstica Aplicada - Javert Guimares Falco

53

UNIDADEMEDIDAS DE POSIO MDIAS, MODA E MEDIANA

4

Na maior parte das vezes em que os dados estatsticos so analisados, procuramos obter um valor para representar um conjunto de dados. Este valor deve sintetizar, da melhor maneira possvel, o comportamento do conjunto do qual ele originrio. Nem sempre os dados estudados tm um bom comportamento, isto pode fazer com que um nico valor possa represent-lo ou no perante o grupo. As medidas de posio mais importantes so as medidas de tendncia central, que recebem tal denominao pelo fato de os dados observados tenderem, em geral, a se agrupar em torno dos valores centrais. Dentre as medidas de tendncia central, destacam-se as seguintes: Mdias, Moda e Mediana. Cada uma com um significado diferenciado, porm tendo como serventia representar um conjunto de dados.

MDIASMdia Aritmtica Simples: para se obter a mdia aritmtica simples de um conjunto de dados, devemos dividir a soma dos valores de todos os dados do conjunto pela quantidade deles.= x1 + x2 + x3 + ... + x n ou N = xi N

x=

x1 + x2 + x3 + ... + x n x ou x = i n n

Onde: xi = so os valores que a varivel x assume n = o nmero de valores = a medida aritmtica da amostra = a mdia aritmtica da populao Exemplo: Sabendo-se que as vendas dirias da empresa A, durante uma semana, foram de 10, 14, 13, 15, 16, 18 e 12 unidades. Determinar a mdia de vendas nesta semana feitas pela empresa A: Para obter a mdia aritmtica simples das vendas, faremos o seguinte clculo: X1 = 10, x2 = 14, x3 = 13, x4 = 15, x5 = 16, x6 = 18 e x7 = 12 e n = 7, logo:

x = n i = 10 +14 +13 +15 + 16 + 18 + 12 = 98 = 14 7 7Mdia Aritmtica Ponderada: mdia ponderada uma mdia aritmtica na qual ser atribudo um peso a cada valor da srie.

x

x =

x i . pi pi

Exemplo: O capital da empresa est sendo formado pelos acionistas, por financiamentos e por debntures. Cada tipo tem um custo diferente para a empresa, definido pela sua taxa de juros anual. Calcule a taxa de juros mdia do capital da empresa, considerando os dados apresentados na tabela seguinte:

Estatstica Aplicada - Javert Guimares Falco

57

A taxa de juros mdia calculada pela seguinte relao: 12 %1 000.000 + 8 % 600.000 +14 % 400.000 . 1.000 .000 + 600.000 + 400.000

x i . p1 + x 2 . p2 + x 3 . p3 p1 + p2 + p3 11, 20 %

Mdia aritmtica para dados agrupados sem intervalos de classesAs freqncias so as quantidades de vezes que a varivel ocorre na coleta de dados, elas funcionam como fatores de ponderao, o que nos leva a calcular uma mdia aritmtica ponderada.

x i fiN

(Populao)

x i fin

(amostra)

Exemplo: Aps ter sido realizado trabalho bimestral, numa turma de Estatstica, o professor efetuou levantamento das notas obtidas pelos alunos, e observou a seguinte distribuio e calculou a mdia de sua turma:

x i fin

26 10

2,6

Mdia aritmtica para dados agrupados com intervalos de classesNeste caso, convencionamos que todos os valores includos em um determinado intervalo de classe coincidem com o seu ponto mdio, e determinamos a mdia aritmtica ponderada por meio das seguintes frmulas:

x i f i , onde X iN

li

ls

(Populao)

x i f i , onde x in

li

ls

(amostra)

Exemplo: Determine a renda mdia familiar, de acordo com os dados da tabela:

58

Estatstica Aplicada - Javert Guimares Falco

x i fin

268 40

6,7

MODA (MO)Define-se a moda como o valor que ocorre com maior freqncia em um conjunto de dados.

Moda para dados no agrupadosPrimeiramente os dados devem ser ordenados para, em seguida, observar o valor que tem maior freqncia. Exemplo: Calcular a moda dos seguintes conjuntos de dados: X = (4, 5, 5, 6, 6, 6, 7, 7, 8, 8) Mo = 6 (0 valor mais freqente) Esse conjunto unimodal, pois apresenta apenas uma moda. Y = (1, 2, 2, 2, 3, 4, 4, 4, 5, 5, 6) Mo = 2 e Mo = 4 (valores mais freqentes) Esse conjunto bimodal, pois apresenta duas modas. Z = (1, 2, 2, 2, 3, 3, 3, 4, 4, 4, 5) Mo = 2, Mo = 3 e Mo = 4 (valores mais freqentes) Esse conjunto plurimodal, pois apresenta mais de duas modas. W = (1, 2, 3, 4, 5, 6) predominante. Esse conjunto amodal porque no apresenta um valor

A moda utilizada quando desejamos obter uma medida rpida e aproximada de posio ou quando a medida de posio deva ser o valor mais tpico da distribuio.

J a mdia aritmtica a medida de posio que possui a maior estabilidade.

MEDIANA (MD) uma medida de posio cujo nmero divide um conjunto de dados em duas

Estatstica Aplicada - Javert Guimares Falco

59

partes iguais. Portanto, a mediana se localiza no centro de um conjunto de nmeros ordenados segundo uma ordem de grandeza. Para se obter o elemento mediano de uma srie deveremos seguir os seguintes passos: - Se N for mpar a mediana o termo de ordem: P N +1 2 N 2 N 2

- Se o N for par a mediana a mdia aritmtica dos termos de ordem: P P

Exemplos: 1) Determine o valor da mediana da srie que composta dos seguintes elementos: 56, 58, 62, 65 e 90. N = 5 (mpar) P N +1 2 5 +1 2 3 3 elemento Md = 62

2) Em uma pesquisa realizada a respeito de erros por folha, cometidos por digitadores, revelou as seguintes quantidades: 12, 12, 13, 13, 15, 16, 18 e 20. Determinar a quantidade mediana de falhas. N = 8(par) P P N 2 N 2 8 2 4 8 2 4 elemento 5 5 elemento 28 2 14 Md = 13 Md = 15

Logo a mediana ser Md

13 + 15 2

Comparao entre Mdio e Moda

60

Estatstica Aplicada - Javert Guimares Falco

Em snteseMdia aritmtica simples:

=

x1 + x2 + x3 + ... + x n ou N

=

xi N

da populao

Mdia aritmtica simples:

x=

x1 + x2 + x3 + ... + x n x ou x = i n n

da amostra

Mdia aritmtica ponderada:

x =

x i . pi pi

Mdia aritmtica para dados agrupados sem intervalos de classes:

x i fiN

(Populao)

x i fin

(amostra)

Mdia aritmtica para dados agrupados com intervalos de classes:

x i f i , onde X iN

li

ls

(Populao)

x i f i , onde x in

li

ls

(amostra)

Moda o valor que se repete o maior nmero de vezes, entre os dados obtidos. Mediana (md) representa o valor central entre os dados obtidos, estando esses dados em ordem crescente ou decrescente. Para obter o elemento mediano devemos considerar: 1 caso: se o N for impar a mediana o termo de ordem: P N +1 2

2 caso: se N for par a mediana a medida aritmtica dos termos de ordem: P N 2 P N 2

POSIO QUARTIS, DECIS E PERCENTISAs medidas de posio denominadas quartis, decis e percentis tm o mesmo princpio da mediana. Enquanto a mediana separa a distribuio em duas partes iguais, a caracterstica principal de cada uma dessas medidas que: Quartis: dividem a distribuio em quatro partes iguais; Decis: dividem em dez partes iguais; Percentis: dividem em cem partes iguais.

Estatstica Aplicada - Javert Guimares Falco

61

Notaes: Qi = quartil de ordem i; Di = decil de ordem i;

Pi = percentil de ordem i.Essas medidas - os quartis, os decis e os percentis - so, juntamente com a mediana, conhecidas pelo nome genrico de separatrizes.

Quartis para dados no agrupados em classesOs quartis dividem um conjunto de dados em 4 partes iguais. Assim:

Para o clculo das posies usaremos: Q1 P1 n+1 4 Q2 P2 2.(n+1) 4 Q3 P3 3.(n+1) 4

Onde n = nmero de dados (valores) Exemplo: Considere as seguintes notas de uma turma e calcule os quartis dessa amostra: 52,0 54,5 55,8 55,9 56,2 56,4 56,7 57,2 58,9 59,4 59,5 60,0 60,2 60,5 60,8 54,4 55,7 55,9 56,4 56,8 57,6 59,4 59,8 60,3 60,6

Utilizando as relaes para a posio dos quartis, temos: Q1 Q2 Q3 P1 P2 P3 n+1 4 2.(n+1) 4 3.(n+1) 4 Q1 P2 P3 P1 25 + 1 4 6,5 13 19,5 P1 P2 P3 7 13 20

2.(25+1) 4 3.(25+1) 4

O primeiro quartil (Q1 ) abrange 25% dos valores da srie, o segundo quartil 50% (Q2 )e o terceiro (Q3 ) 75%.

Decis para dados no agrupadosSo valores que dividem a srie em 10 partes iguais. Assim:

62

Estatstica Aplicada - Javert Guimares Falco

Para o clculo das posies usaremos: D1 P 1 n+1 10 D2 P2 2.(n+1) 10 D5 P5 5.(n+1) 10 D9 P9 9.(n+1) 10

Onde n = nmero de dados (valores) Exemplo: Considere as seguintes notas de uma turma e calcule os decis dessa amostra: 52,0 54,5 55,8 55,9 56,2 56,4 56,7 57,2 58,9 59,4 59,5 60,0 60,2 60,5 60,8 54,4 55,7 55,9 56,4 56,8 57,6 59,4 59,8 60,3 60,6

Utilizando as relaes para a posio dos decis, temos: D1 D2 D9 P1 P2 P9 n+1 10 2.(n+1) 10 9.(n+1) 10 P1 25 + 1 10 P2 P9 2,6 P1 5,2 23,4 3 P1 P1 5 20

2.(25+1) 10 9.(25+1) 10

O primeiro decil (D1 ) abrange 10% dos termos da srie, o segundo decil (D2 ) 20% e assim por diante,o nono (D9 ) 90%.

Percentis para dados no agrupadosSo as medidas que dividem a amostra em 100 partes iguais. Assim

Para o clculo das posies usaremos: n+1 100 2.(n+1) 100 50.(n+1) 100 99.(n+1) 100

P 1

P 1

P2

P2

P50

P50

D99

P99

Onde n = nmero de dados (valores) Exemplo: Considere as seguintes notas de uma turma e calcule os percentis dessa amostra:

Estatstica Aplicada - Javert Guimares Falco

63

Utilizando as relaes para a posio dos Percentis, temos: P10 P20 P90 P10 P20 P90 10.(n+1) 100 20.(n+1) 100 90.(n+1) 100 P10 P20 P90 10.(25+1) 100 20.(25+1) 100 90.(25+1) 100 2,6 5,2 23,4 P10 P20 P90 3 5 23

O dcimo percentil (P10) abrange 10% dos termos da srie, o vigsimo percentil (P20) 20% e assim por diante, o nonagsimo (P90) 90%

EM SNTESE Quartis dividem a distribuio em quatro partes iguais. Para o clculo das posies usaremos: Q1 P1 n+1 4 Q2 P2 2.(n+1) 4 Q3 P3 3.(n+1) 4

Decis dividem a distribuio em dez partes iguais. Para o clculo das posies usaremos: D1 P 1 n+1 10 D2 P2 2.(n+1) 10 D5 P5 5.(n+1) 10 D9 P9 9.(n+1) 10

Percentis dividem a distribuio em cem partes iguais. Para o clculo das posies usaremos: P 1 P 1 n+1 100 P2 P2 2.(n+1) 100 P50 P50 50.(n+1) 100 D99 P99 99.(n+1) 100

MEDIDAS DE DISPERSO (MEDIDAS DE VARIABILIDADE)So medidas utilizadas para medir o grau de variabilidade, ou disperso dos valores observados em torno da mdia aritmtica. Servem para medir a representatividade da mdia e proporcionam conhecer o nvel de homogeneidade ou heterogeneidade dentro de cada grupo analisado. Para compreender esse conceito, considere a seguinte situao: Um empresrio deseja comparar a performance de dois empregados, com base na produo diria de determinada pea, durante cinco dias: Empregado A: 70, 71, 69, 70, 70 Empregado B: 60, 80, 70, 62, 83 x = 70 x = 71

64

Estatstica Aplicada - Javert Guimares Falco

A performance mdia do empregado A de 70 peas produzidas diariamente, enquanto que a do empregado B de 71 peas. Com base na mdia aritmtica, verifica-se que a performance de B melhor do que a de A. Porm, observando bem os dados, percebe-se que a produo de A varia apenas de 69 a 71 peas, ao passo que a de B varia de 60 a 83 peas, o que revela que a performance de A bem mais uniforme do que de B.

Tipos de medidas de disperso absolutaAmplitude total (At): a diferena entre o maior e o menor valor observado. At = x max - x min Exemplo: Pela situao sugerida na introduo, temos para a amplitude total os seguintes clculos para os empregados: Empregado A Empregado B At= 71 69 = 2 At = 83 60 = 23

Observaes: - A amplitude total a medida mais simples de disperso. - A desvantagem desta medida de disperso que leva em conta apenas os valores mnimo e mximo do conjunto. Se ocorrer qualquer variao no interior do conjunto de dados, a amplitude total no nos d qualquer indicao dessa mudana. - A amplitude total tambm sofre a influncia de um valor atpico na distribuio (um valor muito elevado ou muito baixo em relao ao conjunto).

Varincia( d e Desvio Padro(d ou S) ou S)So as medidas de disperso mais empregadas, pois levam em considerao a

2

totalidade dos valores da varivel em estudo. um indicador de variabilidade bastante estvel. Para medir a disperso dos dados em torno da mdia, os estatsticos usam a soma dos quadrados dos desvios dividida pelo tamanho da populao ou da amostra. Definindo assim, varincia como mdia aritmtica dos quadrados dos desvios.Dados no agrupados Dados agrupados

N ( xi x) 2 2 S = n1

( xi m ) d =2

2

( xi m ) 2 . fi 2 d = NS2

( xi x) . fi = n1

2

Sendo a varincia calculada a partir dos quadrados dos desvios, ela um nmero em unidade quadrada em relao varivel em questo, o que, sob o ponto de vista prtico, um inconveniente.

Estatstica Aplicada - Javert Guimares Falco

65

Por isso mesmo, imaginou-se uma nova medida que tem utilidade e interpretao prticas, denominada desvio padro, definido como a raiz quadrada da varincia.2 d d

(Populao)

2

(Amostra)

Observaes: - Se os valores dos dados se repetirem em todas as amostras, ento a varincia da amostra ser zero. - Se os dados estiverem muito espalhados, ento a varincia da amostra acusar um nmero positivo elevado. Assim, uma grande varincia significar uma grande disperso dos dados em relao mdia. - A varincia uma medida que tem pouca utilidade na estatstica descritiva, porm extremamente importante na inferncia estatstica e em combinaes de amostras. - Quanto menor o desvio padro, mais os valores da varivel se aproximam de sua mdia. - Quanto maior o desvio padro, mais significativo heterogeneidade entre os elementos de um conjunto Exemplo: Pela situao sugerida na introduo, temos a varincias e o desvio padro apresentando os seguintes clculos para os empregados: - Como a mdia do empregado A 70, a varincia ser:

d

2

( xi - x ) N

2

=

( 70 - 70 ) + ( 71- 70 ) + ( 69 - 70 ) + ( 70 - 70 ) + ( 70 - 70 ) 5

2

2

2

2

2

2 =4 = 0, 5

E o desvio padro ser:

d2 d0,4

0,64

Como a mdia do empregado B 71 a varincia ser:

d

2

( xi - x ) N

2

=

( 60 - 71 ) + ( 80 - 71) + ( 70 - 71 ) + ( 62 - 71 ) + ( 83 - 71) 5

2

2

2

2

2

428 =85, 6 = 5

E o desvio padro ser:

d85,6 d2

9,25

Vamos colocar em prtica, juntos, todos esses conceitos desta aula atravs do seguinte exerccio: 1) Calcule a varincia e o desvio padro da tabela seguinte.

66

Estatstica Aplicada - Javert Guimares Falco

xi

li

ls

xi.fi

(xi - x)

(xi - x) .fi

Fonte: pesquisa do setor de pessoal

Calcular a mdia dos salrios:

x i fin

Calcular a varincia dos salrios:

s2

( xi x ) .f i n-1

2

Calcular o desvio padro:

2

Construo de tabelas e clculos estatsticos usando o excelPartindo da seguinte srie de dados, vamos construir: uma distribuio de freqncia sem intervalo de classe e com intervalo de classe, um histograma e clculos de estatstica descritiva.

Estatstica Aplicada - Javert Guimares Falco

67

Entrada de Dados- Para entrar no Microsoft Excel, clicar no boto - Entrar com os dados na coluna A. - Na clula C1, digitar variveis. - Na clula D1, digitar fi. - Na clula E1, digitar fri. - Na clula F1, digitar Faci. - Na clula G1, digitar Fraci.- Marcar as clulas C1:G1, na barra de formatos, clicar no boto Negrito e no boto Centralizar . - Nas clulas C2:C8, digitar as variveis correspondentes a cada classe para uma distribuio de freqncia sem intervalo de classe. (11, 12, 13, 14, 15, 16, 17) - Marcar as clulas C2:C9, na barra de formatos, clicar no boto Negrito e no boto Centralizar Freqncia Simples - Marcar as clulas D2:D8, na barra de ferramentas, clicar no boto Colar Funo . - Na janela da esquerda, clicar em Estatstica e na janela da direita, procurar Freqncia, clicar em Ok. - Na Matriz_dados, digitar A1:A26. - Na Matriz_bin, digitar C2:C8. - Como os dados foram preparados para obter os dados da funo freqncia como matriz coluna, no lugar de pressionar Ok ou a tecla Enter, devemos pressionar ao mesmo tempo as trs teclas Ctrl + Shift + Enter. Se no funcionar, comeamos por: Marcar as clulas D2:D8 Digitar a frmula = FREQNCIA(A1:A26;C2:C8) Sem pressionar a tecla Enter, devemos pressionar ao mesmo tempo as trs teclas Ctrl+ Shift + Enter. - Na clula C9, digitar total. - Clicar na clula D9 e na barra de ferramentas, clicar no boto Auto Soma . (Vai aparecer os valores acima marcados e a frmula.) Pressionar a tecla Enter. - Marcar D2:G9 e clicar no boto Centralizar . Freqncia Simples relativa - Na clula E2, digitar a frmula = D2/$D$9 e pressionar a tecla Enter. - Retornar para a clula E2 e no canto inferior direito, pressionar o boto . .

68

Estatstica Aplicada - Javert Guimares Falco

esquerdo do mouse e arrastar at a clula E8. - Na barra de ferramentas, clicar no boto Diminuir Casas Decimais, at 4 casas decimais. - Na clula E9, clicar no boto Auto Soma .

Freqncia Acumulada - Na clula F2, digitar a frmula = FREQNCIA ($A$1:$A$26,C2) e pressionar a tecla Enter. - Retornar para a clula F2 e no canto inferior direito, pressionar o boto esquerdo do mouse e arrastar at a clula F8. Freqncia Acumulada relativa - Na clula G2, digitar a frmula = F2/$D$9 e pressionar a tecla Enter. - Retornar para a clula G2 e no canto inferior direito, pressionar o boto esquerdo do mouse e arrastar at a clula G8. - Na barra de ferramentas, clicar no boto Diminuir Casas Decimais, at 4 casas decimais.

Histograma e Freqncia SimplesNa barra de ttulos, abrimos o menu Ferramentas, escolher Anlise de Dados, recebe-se a caixa de dilogo com todas as ferramentas de anlise disponveis. Nessa caixa de dilogo escolher Histograma e pressionar o boto Ok.

Estatstica Aplicada - Javert Guimares Falco

69

Observao: Se ao abrirmos o menu Ferramentas, no estiver disponvel Anlise de Dados, devemos clicar em Suplementos. Ao abrir uma janela, devemos ativar Ferramentas de Anlise, pressionar o boto Ok e repetir o passo anterior. - No Intervalo de Entrada, digitar $A$1:$A$26. - No Intervalo do Bloco, digitar $C$2:$C$8. - No Intervalo de Sada, digitar $C$11. (O resultado grfico ser apresentado a partir desta clula.) - Assinalar, atravs de um click, Porcentagem Cumulativa e Resultado Grfico e pressionar o boto Ok. - Marcar e deletar as clulas C19:E19. - Dar um duplo click dentro de um dos retngulos do histograma. - Dentro da caixa Formatar Ponto de Dados, selecionar Opes. - A Largura do Espaamento, reduzir para zero, e pressionar o boto Ok.

Distribuio de Freqncia com intervalos de classe- Selecionar uma nova planilha, copiando para essa os dados da coluna A. - Na clula C1, digitar Classes. - Na clula D1, digitar Li. -Na clula E1, digitar fi. - Marcar as clulas C1:E1, centralizar e colocar em negrito. - Marcar as clulas C2:E5 e centralizar. - Digitar as classes na coluna C e os limites superiores na coluna D. - Marcar as clulas E2:E5, na barra de ferramentas, clicar no boto Colar Funo . Na janela da esquerda, clicar em Estatstica e na janela da direita, procurar Freqncia, clicar em Ok. - Na Matriz_dados, digitar A1:A26. - Na Matriz_bin, digitar D2:D5. - Como os dados foram preparados para obter os dados da funo freqncia como matriz coluna, no lugar de pressionar Ok ou a tecla Enter , devemos pressionar ao mesmo tempo as trs teclas Ctrl + Shift + Enter.

70

Estatstica Aplicada - Javert Guimares Falco

Anlise dos DadosNa barra de ttulos, abrimos o menu Ferramentas, escolher Anlise de Dados, recebe- se a caixa de dilogo com todas as ferramentas de anlise disponveis. Nessa caixa de dilogo escolher Estatstica Descritiva e pressionar o boto Ok. - No Intervalo de Entrada, digitar $A$1:$A$26. - No Intervalo de Sada, digitar $B$7. - Assinalar em Resumo Estatstico, Ensimo Maior e Ensimo Menor, pressionar o boto Ok. Abaixo, encontram-se os resultados das atividades descritas acima, confira:

EM SNTESE Amplitude total a diferena entre o maior e o menor valor observado. At = x max - x min Varincia de dados no agrupados em classe: Populao:

d N d N2

2

( xi

)

2

Amostra:

s

2

( xi x ) n-1

2

Varincia de dados agrupados em classe: Populao: ( xi ) .f i2

Amostra:

s

2

( xi x ) .f i n-1

2

Estatstica Aplicada - Javert Guimares Falco

71

Desvio padro: Populao:2 dd

Amostra:

2

MEDIDAS DE DISPERSO (MEDIDAS DE VARIABILIDADE) COEFICIENTE DE VARIAO DE PEARSONCoeficiente de variao de Pearson (medida de disperso relativa)Quando se deseja comparar a variabilidade de duas ou mais distribuies, mesmo quando essas se referem a diferentes fenmenos e sejam expressas em unidades de medida distintas, podemos utilizar o Coeficiente de Variao de Pearson. O coeficiente de variao para um conjunto de n observaes definido como o quociente entre o desvio padro e a mdia aritmtica da distribuio.dx

Populao: cv

100

Amostra: cv

x

100

Observao: CV = coeficiente de variao de Pearson ou apenas coeficiente de variao, geralmente expresso em porcentagem. Alguns analistas consideram: - Baixa disperso: cv 15% - Mdia disperso: 15% cv - Alta disperso: cv 30%

30%

Um coeficiente de variao maior ou igual a 30% revela que a srie heterognea e a mdia tem pouco significado. Se o coeficiente de variao for menor que 30%, portanto a srie homognea e a mdia tem grande significado. Exemplo: Considerando uma amostra que apresenta uma distribuio de freqncias com _ x = 161 e s = 4,22, logo temos coeficiente de variao valendo: cvx

100

4,2 x 100 161

2,62111

2,6

Em sntese coeficiente de variao de Pearson: Populao: cvd x

100

Amostra: cv

x

100

Pelos resultados do coeficiente de variao de Pearson podemos classificar: - baixa disperso: cv 15%

72

Estatstica Aplicada - Javert Guimares Falco

- mdia disperso: 15% cv - alta disperso: cv 30%

30%

MEDIDAS DE ASSIMETRIAUma distribuio de freqncias com classes simtrica quando: Mdia = Mediana = Moda

Uma distribuio de frequencias com classes : Assimtrica esquerda ou negativa quando: Mdia Moda

Para fazer a classificar do tipo de assimetria atravs de clculo, temos a seguinte relao: x Se: _ x _ - Mo = 0 x _ - Mo < 0 x - Mo > 0 Mo

assimetria nula ou distribuio simtrica. assimetria negativa ou esquerda. assimetria positiva ou direita.

Estatstica Aplicada - Javert Guimares Falco

73

Exemplo: Determinando os tipos de assimetria das distribuies abaixo:

Calculando a mdia, mediana, moda e o desvio padro para cada distribuio, temos: Distribuio A Distribuio B Distribuio C x = 12, Md = 12, Mo = 12 kg e s = 4,42 x = 12,9, Md = 13,5 , Mo = 16 kg e s = 4,20 x = 11,1, Md = 10,5 , Mo = 8 kg e s = 4,20

Logo, calculando o tipo de assimetria: Distribuio A Distribuio B negativa. Distribuio C x - Mo = 12 - 12 = 0 x - Mo = 12,9 16 = - 3,1 a distribuio simtrica. a distribuio assimtrica

x - Mo = 11,1 8 = 3,1

a distribuio assimtrica positiva.

Construindo os grficos das distribuies anteriores, temos: Distribuio A 24 18 12 6 0 4 8 12 16 20 30 24 18 12 6 0 4 8 12 16 20 Distribuio B 30 24 18 12 6 0 4 8 12 16 20 Distribuio C

Coeficiente de assimetria (coeficiente de Pearson)A medida anterior, por ser absoluta, apresenta a mesma deficincia do desvio padro, isto , no permite a possibilidade de comparao entre as medidas de

74

Estatstica Aplicada - Javert Guimares Falco

duas distribuies. Por esse motivo, daremos preferncia ao coeficiente de assimetria de Pearson: AS 3( x - Md ) s

Escalas de assimetria: 0,15 < | AS | < 1 | AS | 1 assimetria moderada

assimetria elevada

Observao: Coeficiente de assimetria de Pearson (AS) considerado em mdulo para se fazer a classificao acima. Exemplo: Considerando as distribuies anteriores A , B e C , calcule os coeficientes de assimetria e faa a anlise dos resultados obtidos: ASA AS B ASC 3( x - Md ) s 3( x - Md ) s 3( x - Md ) s 3( 12 - 12 ) =0 4,42 Simetria

3( 12,9 - 13,5 ) = - 0,429 4,20 3( 11,1 - 10,5 ) = 0,429 4,20

Assimetria considerada moderada e negativa Assimetria considerada moderada e positiva

Em sntese Uma distribuio de freqncias com classes simtrica quando: Mdia = Mediana = Moda Uma distribuio de freqncias com classes assimtrica esquerda ou negativa quando: Mdia < Mediana < Moda Uma distribuio de freqncias com classes assimtrica direita ou positiva quando: Mdia > Mediana > Moda Coeficiente de assimetria: AS Pelos resultados do coeficiente de assimentria podemos classificar: Simtrico: |AS| = 0 Assimetria moderada: 0,15 < | AS | < 1 Assimetria elevada: | AS | 1 3( x - Md ) s

Estatstica Aplicada - Javert Guimares Falco

75

Responda s questes abaixo e confira as respostas, no gabarito, no final do livro26) A tabela a seguir representa a distribuio de freqncias dos salrios de um grupo de 50 empregados de uma empresa, num certo ms.

o salrio mdio desses empregados, nesse ms, foi de: a) R$ 2 637,00 b) R$ 2 520,00 c) R$ 2 500,00 d) R$ 2 420,00 e) R$ 2 400,00 27) O professor Javert aplicou uma prova de matemtica a 25 alunos, contendo 5 questes, valendo 1 ponto cada uma. Aps fazer a correo, o professor construiu o grfico abaixo, que relaciona o nmero de alunos s notas obtidas por eles. 10 nmero de alunos 8 6 4 2 0 notas obtidas 28) O grfico de setores abaixo mostra os resultados obtidos em uma pesquisa com clientes de um supermercado sobre um de seus produtos.7% 33% 13%

Observando o grfico, conclui-se que a mediana das notas obtidas pelos 25 alunos correspondem, a: a) 1 b) 2 c) 3 d) 4 e) 5

1 2 3

20%

4 5

27%

De acordo com a satisfao, cada cliente indicava uma nota de 1 a 5 para o mesmo produto. Esse grfico, por exemplo, mostra que 7% dos consumidores deram nota 1 para o produto consultado. considerando o mesmo grfico, correto afirmar que a moda do conjunto de todas as notas dadas para o produto foi:

76

Estatstica Aplicada - Javert Guimares Falco

a) 1 b) 2 c) 3 d) 4 e) 5 29) As notas de um candidato nas provas de um concurso foram: 8,4; 9,1;7,2; 6,8; 8,7 e 7,2. A nota mdia, a nota mediana e a nota modal desse aluno so respectivamente: a) 7,9; 7,8; 7,2 b) 7,1; 7,8; 7,9 c) 7,8; 7,8; 7,9 d) 7,2; 7,8; 7,9 e) 7,8; 7,9; 7,2 30) Analise os dados abaixo que se referem a uma amostra de bitos/ms nos hospitais de uma grande capital brasileira, nos ltimos 25 meses e faa o que se pede: 410, 440, 440, 584, 579, 577, 577, 454, 460, 460, 491, 561, 556, 491, 490, 491, 490,553, 553, 540, 540, 520, 491, 520, 491. Calcular a mdia aritmtica, mediana e a moda.

Considere as seguintes notas de uma amostra de uma turma e faa o que se pede: 35, 45, 40, 40, 52, 56, 59, 60, 54, 55, 56, 59, 60, 54, 56, 57, 59, 60, 55, 56, 57, 59, 60, 55, 56, 58, 60, 60, 70, 75, 80, 85, 60, 65, 63. 31) calcular o terceiro quartil da amostra.

32) calcular o segundo decil da amostra.

33) calcular o nono decil da amostra.

34) calcular o vigsimo percentil da amostra.

Estatstica Aplicada - Javert Guimares Falco

77

35) calcular o nonagsimo percentil da amostra.

36)Dado o conjunto de nmeros 8, 4, 6, 9, 10, 5, determine a varincia desse conjunto, supondo que esses valores correspondem a uma amostra. a) 28 b) 2,3664 c) 7 d) 2,8 e) 5,6 37) Determine o desvio padro do conjunto de nmeros da questo anterior, supondo que esses valores correspondem a uma amostra. a) 28 b) 2,3664 c) 7 d) 2,8 e) 5,6 Considere as seguintes notas de uma amostra de uma turma e responda as perguntas a seguir: 35, 45, 40, 40, 52, 56, 59, 60, 54, 55, 56, 59, 60, 54, 56, 57, 59, 60, 55, 56, 57, 59, 60, 55, 56, 58, 60, 60, 70, 75, 80, 85, 60, 65, 63. 38) calcule a amplitude total do rol. a) 50 b) 49 c) 48 d) 47 e) 45 39) calcule a varincia do rol. a) 94,56 b) 105,83 c) 110,83 d) 109,83 e) 120,00 40) calcule o desvio padro do rol. a) 10,29 b) 9,72 c) 10,53 d) 10,48 e) 10,99

78

Estatstica Aplicada - Javert Guimares Falco

41) Dada a figura a seguir, podemos afirmar que:

a) a moda maior do que a mediana e menor do que a mdia; b) a moda menor do que a mediana e maior do que a mdia; c) a moda menor do que a mediana e est maior do que a mdia; d) a mediana maior de que a mdia e menor do que a moda; e) n.d.a. 42) os coeficientes de variao dos resultados a seguir so: _ Estatstica: x = 80 e s = 16 _ Histria: x= 20 e s = 5 a) 16% e 40% b) 20% e 25% c) 50% e 40% d) 80% e 40% e) n.d.a. 43) Considere os seguintes resultados relativos a trs distribuies de freqncia:Distribuio x Mo

Determine o tipo de assimetria de cada uma delas.

Estatstica Aplicada - Javert Guimares Falco

79

44) uma distribuio de freqncia apresenta as seguintes medidas: x = 48,1, md = 47,9 e s = 2,12. Calcule o coeficiente de assimetria.

45) Em uma distribuio de freqncia foram encontradas as seguintes medidas: x = 33,18, mo = 27,50, md = 31,67 e s = 12,45. a) classifique o tipo de assimetria.

b) Calcule o coeficiente de assimetria.

80

Estatstica Aplicada - Javert Guimares Falco

UNIDADEPROBABILIDADE

5

J sabemos que para se obter informaes sobre alguma caracterstica da populao, o tamanho amostral de fundamental importncia. Estudaremos agora a probabilidade, que uma ferramenta usada e necessria para se fazerem ligaes entre a amostra e a populao, de modo que a partir de informaes da amostra se possam fazer afirmaes sobre caractersticas da populao. Assim, pode-se dizer que a probabilidade a ferramenta bsica da Estatstica Inferencial.

Experimento AleatrioSo aqueles que no podem ser previamente determinados. Essa impossibilidade de preverse os resultados, chamamos de acaso . Exemplo: Lanar um dado e anotar o nmero que ocorrer na face voltada para cima.

Espao Amostral (S) o conjunto formado por todos os resultados possveis de um experimento aleatrio. Exemplo 1: Ao se lanar um dado e observar a face superior, tm-se o espao amostral: S = {1,2,3,4,5,6 }

Exemplo 2: Numa partida de futebol, uma das equipes pode obter resultados tais como: vitria (v), empate (e) ou derrota (d). Tem-se ento: S = {v, e, d }

Evento (E) um conjunto qualquer de resultados de um experimento aleatrio. Pode-se dizer que um evento um subconjunto do espao amostral. Exemplo: no lanamento de 2 moedas apaream faces iguais. Os elementos do evento so E = {(K, K), (C, C) }.

Estatstica Aplicada - Javert Guimares Falco

83

Tipos

de eventos- Evento certo o prprio espao amostral.

Exemplo: Lanamento de um dado e ocorrncia de um nmero menor ou igual a 6 na face superior. - Evento impossvel o subconjunto vazio do espao amostral. Exemplo: Lanamento de um dado e ocorrncia de um nmero maior do que 6 na face superior. - Eventos elementares so aqueles que tm um s elemento. Exemplo: Lanamento de um dado e ocorrncia de um nmero mpar maior do que 4 na face superior. Clculo da probabilidade de um evento ocorrer Podemos definir o clculo da probabilidade de um evento como a razo (diviso) entre o nmero de elementos do evento e o nmero de elementos do espao amostral.

P( E ) =

n(E) n(S)

Onde: n (E) = o nmero de elementos do evento n (S) = o nmero de elementos do espao amostral P (E) = a probabilidade de ocorrer o evento Na prtica, calcular a probabilidade dividir:

P( E ) =

nmero de resultados favorveis nmero de resultados possveis

Observao: Percentualmente, a probabilidade varia de 0% a 100%, ou seja, 0% P (E) 100% ou 0 P (E) 1.

Eventos complementares P ( A )A probabilidade de no ocorrer o evento A igual a 1 menos a probabilidade de ocorrer A, que pode ser representada por: P( A ) 1 P ( A ) Exemplo: Analisando um lote de 360 peas para computador, o departamento de controle

84

Estatstica Aplicada - Javert Guimares Falco

de qualidade de uma fbrica constatou que 40 peas estavam com defeito. Retirando-se uma das 360 peas, ao acaso, a probabilidade de esta pea NO ser defeituosa : - Sendo S = conjunto dos elementos do espao amostral, casos possveis, e n(s) o nmero de elementos deste conjunto. - Sendo E = conjunto de elementos das peas defeituosas, e n(E) o nmero de elementos deste conjunto. - Use ~E = conjunto dos elementos das peas no defeituosas, e n(~E) o nmero de elementos deste conjunto. Neste caso, o conjunto dos casos favorveis. - n(S) = 360 , n(E) = 40 e n(~E) = 320 Para calcular a probabilidade de, retirada uma pea que seja no defeituosa, faa assim: P (~ E ) n( E ) n( S ) 320 360 8 9

Probabilidade da unio P(A

B) = P(A ou B)

Nesse caso, existem dois tipos possveis de situao - Eventos mutuamente exclusivos: Dois eventos so mutuamente exclusivos se A A B P (A B) = P (A) + P (B) B = , neste caso:

- Eventos no mutuamente exclusivos: Dois