Transcript
Page 1: Apostila de Estatistica Aplicada

E s t a t í s t i c a A p l i c a d a

1. Introdução à Estatística

1.1. Entendendo a importância da EstatísticaJornais, televisão, rádio, revistas e outros meios de comunicação nos bombardeiam, diariamente, com notícias,

baseadas em estatísticas, como se fossem verdades absolutas. Nessa hora, provavelmente, você sente a importânciade ser capaz de avaliar corretamente o que lhe dizem. Todavia, será que os números apresentados resultam de umaanálise estatística cuidadosa? O perigo está no fato de que, se não consegue distinguir as afirmações falsas dasverdadeiras, então você está vulnerável à manipulação por outras pessoas, cujas conclusões podem conduzir vocêpara decidir contra os interesses seus e, depois, arrepender-se. Por estas razões, conhecer Estatística é um grandepasso no sentido de você tomar controle da sua vida (embora não seja, obviamente, a única maneira necessária paraesta finalidade).

Observe os seguintes exemplos de afirmações recentemente publicadas em dez meios de comunicação (nãoestou dizendo que cada uma delas seja verdadeira).

Sua expectativa é de que a inflação feche o ano entre 6% e 7%. (Folha de São Paulo, Dinheiro, 16 de maio de2005)Atualmente, a taxa de pacientes com câncer de pulmão que não apresentam reincidência depois de cinco anosde tratamento é de 17% – um avanço de 70% em relação à década de 70. (Revista Veja, edição 1905, 18 demaio de 2005)As projeções de mercado para o IPCA de 2005 subiram de 6,30% para 6,39% em pesquisa semanal feita peloBanco Central e divulgada hoje. (O Estado de São Paulo, 16 de maio de 2005)Um estudo da Corporate Executive Board mostrou que a produtividade de um funcionário brilhante chega a seraté 12 vezes superior à do colega mediano. (Revista Exame, edição 841, 27 de abril de 2005)De acordo com a Embratur (Empresa Brasileira de Turismo), a companhia aérea trouxe 1.473.183 dos6.138.000 passageiros que entraram no país no ano passado, o equivalente a 24% desses passageiros.(Revista Aeromagazine, Notícias, 16 de maio de 2005)IBGE: Emprego industrial cai 0,2% em março. (JB Online, 16 de maio de 2005)Os investidores que colocam todo seu dinheiro em uma única ação estão elevando em mais de 50% a chancede queda do poder de compra de seu investimento em um período de 20 anos, aponta o estudo. (JB Online, 17de abril de 2005)Nordestinos já são 52,6% dos migrantes. (Jornal O Globo, 16 de maio de 2005)Comércio varejista cresce 1,75% em volume de vendas e 2,44% em receita nominal. (IBGE, 12 de maio de2005)Se a vítima não fosse o prefeito de Santo André, o impacto não seria o mesmo e o caso teria sido tratadocomo mera estatística. (Márcio Coimbra em http://www.ambito-juridico.com.br/aj/cron0237.htm)

Todas essas notícias são, na sua essência, Estatística. Elas parecem familiares, embora os exemplos sejamde áreas bastante distintas: economia, medicina, gestão, turismo, social, investimentos, comércio e até política. Emresumo, os números (também expressos por meio de tabelas e gráficos) e a interpretação deles surgem nos discursosde praticamente todo aspecto da vida contemporânea.

Desse modo, as estatísticas são, freqüentemente, apresentadas como um testemunho de credibilidade a umargumento ou a uma recomendação, fato que você pode comprovar ouvindo o veiculado nos meios de comunicação: oprimeiro pensamento é acreditar na notícia como se fosse verdade absoluta. Recorde-se, então, do ex-primeiro-ministrobritânico Benjamin Disraeli (1804-1881), quando afirmou que “Há três espécies de mentiras: mentiras, mentirasdeslavadas e estatísticas”.

No entanto, Estatística é método, ciência e arte. É método quando, na Física, na Biologia, na Medicina ou naPedagogia, aplica-se a populações específicas, isto é, serve a uma ciência particular, da qual se torna instrumento. Éciência quando, graças às suas teorias, estuda grandes conjuntos, independentemente da natureza destes, sendoautônoma e universal. Finalmente, é arte na construção de modelos para representar a realidade.

Assim sendo, nem tudo está perdido, porque a Estatística pode ajudar você a reagir de modo inteligente àsinformações que lê ou escuta e, neste sentido, torna-se um dos mais importantes assuntos que provavelmente estudou.O presente artigo tem o objetivo de motivar você a ser mais um dos consumidores inteligentes de estatísticas e, paraser um deles, o primeiro passo é refletir e começar a questionar aquelas que encontrar. Por esta razão, convido você areformar os seus hábitos estatísticos a partir de agora. Simplesmente, não mais aceite números, tabelas, gráficos econclusões. Ao invés disso, comece a pensar nas fontes de informação e, mais importante, nos procedimentos usados

Prof. Carlos Alexandre Santório 3

Page 2: Apostila de Estatistica Aplicada

E s t a t í s t i c a A p l i c a d a

para gerar essa informação. Defenda-se contra afirmações falsas, embrulhadas como se fossem estatísticas. Aprenda areconhecer se uma evidência estatística apóia, realmente, uma conclusão apresentada.

A Estatística está toda ela em volta de você, algumas vezes usada de modo adequado, outras vezes não.Como o objetivo da Estatística é auxiliar a sua tomada de decisões em situações de incerteza, distinguir as boas dasmás estatísticas é mais do que nunca, um dever, uma obrigação.

1.2. Objeto da EstatísticaEstatística é uma ciência exata que visa fornecer subsídios ao analista para coletar, organizar, resumir,

analisar e apresentar dados. Trata de parâmetros extraídos da população, tais como média ou desvio padrão.A estatística fornece-nos as técnicas para extrair informação de dados, os quais são muitas vezes incompletos,

na medida em que nos dão informação útil sobre o problema em estudo, sendo assim, é objetivo da Estatística extrairinformação dos dados para obter uma melhor compreensão das situações que representam.

Quando se aborda uma problemática envolvendo métodos estatísticos, estes devem ser utilizados mesmoantes de se recolher a amostra, isto é, deve-se planejar a experiência que nos vai permitir recolher os dados, de modoque, posteriormente, se possa extrair o máximo de informação relevante para o problema em estudo, ou seja para apopulação de onde os dados provêm.

Quando de posse dos dados, procura-se agrupá-los e reduzi-los, sob forma de amostra, deixando de lado aaleatoriedade presente.

Seguidamente o objetivo do estudo estatístico pode ser o de estimar uma quantidade ou testar uma hipótese,utilizando-se técnicas estatísticas convenientes, as quais realçam toda a potencialidade da Estatística, na medida emque vão permitir tirar conclusões acerca de uma população, baseando-se numa pequena amostra, dando-nos aindauma medida do erro cometido.

Exemplo:Ao chegarmos a uma churrascaria, não precisamos comer todos os tipos de saladas, de sobremesas e de

carnes disponíveis, para conseguirmos chegar a conclusão de que a comida é de boa qualidade. Basta que sejaprovado um tipo de cada opção para concluirmos que estamos sendo bem servidos e que a comida está dentro dospadrões.

1.2. Método Estatístico

1.2.1. O Método CientíficoMuitos dos conhecimentos que temos foram obtidos na antiguidade por acaso e, outros, por necessidades

práticas, sem aplicação de um método.Atualmente, quase todo acréscimo de conhecimento resulta da observação e do estudo.Podemos dizer, então, que:

Método é um conjunto de meios dispostos convenientemente para se chegar a um fim que se deseja.

Dos métodos científicos, vamos destacar o método experimental e o estatístico.

1.2.2. O Método Experimental

O método experimental consiste em manter constantes todas as causas (fatores), menos uma, e variar estacausa de modo que o pesquisador possa descobrir seus efeitos, caso existam.

É o método preferido no estudo da Física, da Química, etc.

Prof. Carlos Alexandre Santório 4

Page 3: Apostila de Estatistica Aplicada

E s t a t í s t i c a A p l i c a d a

1.2.3. O Método EstatísticoMuitas vezes temos a necessidade de descobrir fatos em um campo em que o método experimental não se

aplica (nas ciências sociais), já que os vários fatores que afetam o fenômeno em estudo não podem permanecerconstantes enquanto fazemos variar a causa que, naquele momento, nos interessa.

Como exemplo, podemos citar a determinação das causas que definem o preço de uma mercadoria. Paraaplicarmos o método experimental, teríamos que fazer variar a quantidade da mercadoria e verificar se tal fato iriainfluenciar seu preço.

Porém, seria necessário que não houvesse alteração nos outros fatores. Assim, deveria existir, no momento dapesquisa, uma uniformidade dos salários, o gosto dos consumidores deveria permanecer constante, seria necessária afixação do nível geral dos preços das outras necessidades etc. Mas isso tudo é impossível.

Nesses casos, lançamos mão de outro método, embora mais difícil e menos preciso, denominado métodoestatístico.

O método estatístico, diante da impossibilidade de manter as causas constantes, adimite todas essascausas presentes variando-as, registrando esses variações e procurando determinar, no resultado final, queinfluências cabem a cada uma delas.

1.3. A EstatísticaExprimindo por meio de números as observações que se fazem de elementos com, pelo menos, uma

característica comum (por exemplo: os alunos do sexo masculino de uma comunidade), obtemos os chamados dadosreferentes a esses elementos.

Podemos dizer, então, que:

A Estatística é uma parte da Matemática Aplicada que fornece métodos para a coleta, organização,descrição, análise e interpretação de dados e para a utilização dos mesmos na tomada de decisões.

A coleta, a organização e a descrição dos dados estão a cargo da Estatística Descritiva, enquanto aanálise e a interpretação desses dados ficam a cargo da Estatística Indutiva ou Inferencial.

Em geral, as pessoas, quando se referem ao termo estatística, o fazem no sentido da organização e descriçãodos dados (estatística do Ministério da Educação, estatística dos acidentes de tráfego, etc.), desconhecendo que oaspecto essencial da Estatística é o de proporcionar métodos inferenciais, que permitam conclusões quetranscedam os dados obtidos inicialmente.

Assim, a análise e interpretação dos dados estatísticos tornam possível o diagnóstico de uma empresa (porexemplo, de uma escola), o conhecimento de seus problemas (condições de funcionamento, produtividade), aformulação de soluções apropriadas e um planejamento objetivo de ação.

1.4. Fases do Método EstatísticoPodemos distinguir no método estatístico as seguintes fases:

1.4.1. Coleta de DadosA coleta de dados pode ser direta e indireta.A coleta é direta quando feita sobre elementos informativos de registro obrigatório (nascimentos, casamentos

e óbitos, importação e exportação de mercadorias), elementos pertinentes aos prontuários dos alunos de uma escolaou, ainda, quando os dados são coletados pelo prórpio pesquisador através de inquéritos e questionários, como é ocaso das notas de verificação e de exames, do censo demográfico, etc.

A coleta direta de dados pode ser classificada relativamente ao fator tempo em:a) contínua (registro) – quando feita continuamente, tal como a de nescimentos e óbitos e a de frequencia

dos alunos às aulas;b) periódica – quando feita em intervalos constantes de tempo, como os censos (de 10 em 10 anos) e as

avaliações mensais dos alunos;

Prof. Carlos Alexandre Santório 5

Page 4: Apostila de Estatistica Aplicada

E s t a t í s t i c a A p l i c a d a

c) ocasional – quando feita exporadicamente, a fim de atender a uma conjuntura ou a uma emergência,como no caso de epidemias que assolam ou dizimam rebanhos inteiros.

A coleta se diz indireta quando é inferida de elementos conhecidos (coleta direta) e/ou do conhecimento deoutros fenômenos relacionados com o fenômeno estudado. Como exemplo, podemos citar a pesquisa sobre amortalidade infantil, que é feita através de dados colhidos por uma coleta direta.

1.4.2. Apuração dos DadosApós a coleta dos dados, torna-se necessária sua apuração, ou contagem, denominando-a Tabulação. Para

tanto, de posse dos dados, devemos ordená-los mediante critérios de classificação. Pode ser manual, eletromecânicaou eletrônica.

1.4.3. Apresentação dos DadosPor mais diversa que seja a finalidade que se tenha em vista, os dados devem ser apresentados sob forma

adequada (tabelas ou gráficos), tornando mais fácil o exame daquilo que está sendo estudado.

1.4.4. Análise dos ResultadosO objetivo último da estatística é tirar conlusões sobre o todo (população) a partir de informações fornecidas

por parte representativa do todo (amostra). Assim, realizadas as fases anteriores (Estatística Descritiva), fazemosuma análise dos resultados obtidos, através dos métodos da Estatística Indutiva ou Inferencial, que tem por base aindução ou inferência, e tiramos desses resultados conclusões e previsões.

1.5. Abusos da Estatística

1.5.1. Más AmostrasOutra fonte de estatística enganosa são os métodos inadequados de coleta de dados. É comum um

pesquisador analisar dados e formular conclusões errôneas porque o método de coleta de dados foi deficiente.Considere o seguinte exemplo:

Um jornal fez a seguinte pergunta: “Se você tivesse que começar novamente, você teria filhos? Escreva-nos.Algumas semanas depois o jornal informava que 70% dos pais dizem que não vale a pena ter filhos. Será que

está amostra não era tendenciosa constituída dos pais que queriam desabafar.

Como os próprios pais é que decidiram se seriam incluídos na pesquisa, temos um exemplo de pesquisa auto-selecionada, ou seja, uma pesquisa em que os próprios entrevistados decidem se serão incluídos.

1.5.2. Pequenas AmostrasOs resultados obtidos com pequenas amostras não são necessariamente más, entretanto, os resultados

obtidos com pequenas podem por vezes ser usados como uma forma de “mentira” estatística. As preferências deapenas 10 dentistas por determinado creme dental não devem servir de base para uma afirmação generalizada como“A pasta WW é recomendada por 8 em cada 10 dentistas.” Mesmo que a amostra seja grande, ela deve ser nãotendenciosa e representativa da população de onde provém.

1.5.3. Estimativas por SuposiçãoOutra fonte de engano estatístico envolve estimativas que são, na verdade, suposições (palpites), podendo

apresentar erros substanciais. É preciso considerar a fonte da estimativa e a maneira como foi estabelecida.

Prof. Carlos Alexandre Santório 6

Page 5: Apostila de Estatistica Aplicada

E s t a t í s t i c a A p l i c a d a

1.5.4. Porcentagens Distorcidas:Por vezes utilizam-se porcentagens confusas ou distorcidas. Em um anúncio de página inteira, a Continental

Airlines anuncia melhores serviços. No tocante ao caso de bagagem extraviada, o anúncio afirmava que se trata deuma área em que já melhoramos 100% nos últimos seis meses”. Em um editorial criticando essa estatística, o New YorkTimes interpretou corretamente a melhora de 100% como significando que agora não se extravia mais qualquerbagagem – o que ainda não foi conseguido pela Continental Airlines.

1.5.5. Perguntas TendenciosasAs perguntas em uma pesquisa podem ser formuladas de modo a “sugerirem” uma resposta. Por exemplo,

Considere estas duas perguntas:Que rádio você prefere? A pergunta não sugere a resposta enquanto que a pergunta:A rádio Transamérica é a sua rádio preferida? Bom claro que é. Esta pergunta força a resposta.

1.5.6. Pressão do PesquisadorQuando se formulam perguntas a indivíduos pesquisados, esses freqüentemente dão respostas favoráveis à

sua auto imagem. Em uma pesquisa telefônica, 94% dos que responderam disseram que lavam suas mãos após usarum banheiro, mas a observação em lugares mostraram que o percentual efetivo é de apenas 68%.

Outros exemplos:1. Para determinar a reação do público à continuação de certo programa governamental, o pesquisador pergunta: “Achaque este programa dispendioso deve ser interrompido?” Explique por que esta pergunta provavelmente nãoproporcionará a informação desejada.Resposta: Ao formular a questão, o entrevistador está de fato, sugerindo que o programa é dispendioso.

2. Para estudar a reação do consumidor a um novo tipo de alimento enlatado, faz-se uma pesquisa de casa em casadurante as manhãs dos dias úteis, sem plano de voltar no caso de não ser encontrado ninguém em casa. Explique porque esta abordagem pode conduzir a uma informação enganadora.Resposta: Esta pesquisa não atinge os que têm maior probabilidade de usar o produto, pessoas solteiras ou casais emque ambos trabalham fora.

3. Uma estatística enganosa pode resultar, também da formulação de perguntas no lugar errado ou no momentoerrado. Explique por que, no caso seguinte, poderemos obter dados inúteis. Para predizer uma eleição, um pesquisarentrevista pessoas que saem do edifício onde está a sede nacional de um partido político.Resposta: As pessoas que saem de um edifício onde está a sede de um partido político provavelmente são filiadas aopartido.

4. Uma pessoa foi encarregada de pesquisar o reconhecimento da marca Nike, devendo contactar por telefone 1500consumidores. Por que razão é incorreta a utilização de listas telefônicas como população para fornecer a amostra?Resposta: Excluem-se as pessoas com números não listados e pessoas sem telefone.

5. A revista Glamour publicou o seguinte resultado de uma pesquisa: “79% dos que responderam à nossa pesquisa deagosto afirmaram crer que os americanos se tornaram demasiadamente propensos a apelar para a justiça em casoscorriqueiros”. A questão foi publicada na revista e os leitores podiam responder por correio, fax ou e-mail([email protected]). Até que ponto é válido o resultado de 79%.Resposta: Como os pesquisados são auto-selecionados, os resultados da pesquisa não são válidos.

6. “De acordo com uma pesquisa de âmbito nacional feita por 250 agências de empregos, os sapatos gastos constituemo motivo mais comum para que um homem que procura emprego não cause boa impressão à primeira vista.” Os jornaisapresentaram essa alegação com base em uma pesquisa encomendada pela Kiwi Brands, produtores de graxa parasapatos. Faça um comentário sobre a razão por que os resultados de tal pesquisa podem ser questionados.

Prof. Carlos Alexandre Santório 7

Page 6: Apostila de Estatistica Aplicada

E s t a t í s t i c a A p l i c a d a

Resposta: Um fabricante de graxa para sapatos obviamente tem interesse na importância do seu produto, e há muitasmaneiras de este fato afetar os resultados da pesquisa.

7. O jornal Newport Chronicle afirma que as mães grávidas podem aumentar suas chances de ter uma criança sadiacomendo lagostas. A alegação se baseia em um estudo mostrando que as crianças nascidas de mães que comemlagostas têm menos problemas de saúde do que as nascidas de mães que não comem lagostas.Resposta: Mães que comem lagostas tendem a ser mais ricas e portanto podem pagar por melhor atendimento médico.

Prof. Carlos Alexandre Santório 8

Page 7: Apostila de Estatistica Aplicada

E s t a t í s t i c a A p l i c a d a

2. População e Amostra

2.1. VariáveisA cada fenômeno corresponde um número de resultados possíveis. Assim, por exemplo:para o fenômeno “sexo” são dois os resultados possíveis: sexo masculino e sexo feminino;para o fenômeno “número de filhos” há um número de resultados possíveis expresso através dos númerosnaturais: 0, 1, 2, 3, ..., n;para o fenômeno “estatura” temos uma situação diferente, pois os resultados podem tomar um número infinitode valores numéricos dentro de um determinado intervalo.

Variável é, convencionalmente, o conjunto de resultados possíveis de um fenômeno.

Os exemplos acima nos dizem que uma variável pode ser:a) qualitativa – quando seus valores são expressos por atributos: sexo (masculino ou feminino), cor

da pele (branca, preta, amarela, vermelha, parda), etc.;b) quantitativa – quando seus valores são expressos em números (salários dos operários, idade dos

alunos de uma escola, etc.). Uma variável quantitativa que pode assumir, teoricamente, qualquer valorentre dois limites recebe o nome de variável contínua; uma variável que só pode assumir valorespertencentes a um conjunto enumerável recebe o nome de variável discreta.

Assim, o número de alunos de uma escola pode assumir qualquer um dos valores do conjunto N = {1, 2, 3, ...,58, ...}, mas nunca valores como 2,5 ou 3,78 ou 4,325, etc. Logo, é uma variável discreta. Já o peso desses alunos éuma variável contínua, pois um dos alunos pode pesar 72 kg, como 72,5 kg, como 72,54 kg, etc., dependendo essevalor da precisão da medida.

2.2. População e AmostraA Estatística é uma ciência baseada na teoria das probabilidades, cujo principal objetivo é nos auxiliar a tirar

conclusões, em situações de incerteza, a partir de informações numéricas de uma amostra. É comum, por exemplo, àsvésperas de uma eleição, um jornal afirmar que um candidato A vencerá com uma certa margem de votos. Em geral,esse tipo de afirmação está baseado numa pesquisa feita entre alguns eleitores, que constituem a amostra dapesquisa, uma vez que é impossível fazer a pesquisa com todos os eleitores (população envolvida).

A primeira tarefa de um estatístico é definir clara e precisamente o problema a ser estudado, qual a populaçãoenvolvida e que amostra irá utilizar.

Exemplo 1: Queremos obter informações sobre a audiência de certo programa de TV, na Grande Vitória.- População: conjunto de todos os domicílios da região da Grande Vitória que possuem TV.- Amostra: conjunto de domicílios que serão visitados.

Exemplo 2: Estudar a procedência dos candidatos a uma certa universidade.- População: conjunto de todos os candidatos à referida universidade.- Amostra: conjunto dos candidatos que serão entrevistados.

Todos os elementos do grupo a ser estudado constituem a população. A parte da população efetivamenteexaminada é a amostra.

Suponhamos uma pesquisa sobre o nível de escolaridade de um grupo de 800 (oitocentas) pessoas. Nessecaso, a população é o conjunto das oitocentas pessoas. Se sentirmos desnecessário ou impossível examinar osoitocentos elementos, podemos recorrer a amostragem, ou seja, podemos examinar alguns desses elementos.

É claro que se escolhermos apenas dois desses oitocentos elementos, corremos o risco de selecionarexatamente dois elementos com as mesmas características. Se os dois forem analfabetos, por exemplo, podemosconcluir que todos elementos da população também o são.

Observe que, qualquer que seja a amostra, sempre corremos o risco de chegar a conclusões erradas, maseste risco diminui à medida qua aumenta a quantidade de elementos a serem examinados.

Devemos estabelecer um número mínimo de elementos para compor a amostra. Essa quantidade não deve

Prof. Carlos Alexandre Santório 9

Page 8: Apostila de Estatistica Aplicada

E s t a t í s t i c a A p l i c a d a

ser menor que 10% do total de elementos da população. Assim, estaremos minimizando as chances dasinformações da amostra se afastarem demasiadamente daquelas que obteríamos se examinássemos toda a população.

No exemplo citado anteriormente, como a população tem 800 elementos, devemos escolher uma amostra com,no mínimo, 80 pessoas (10% de 800).

Podemos recorrer a diferentes formas de amostragem: amostragem aleatória simples, amostragem sistemáticae amostragem estratificada proporcional.

2.2.1. Amostragem Aleatória SimplesEste tipo de amostragem é equivalente a um sorteio lotérico.Na prática, a amostragem aleatória simples pode ser realizada numerando-se a população de 1 a n e

sorteando-se, a seguir, por meio de um dispositivo aleatório qualquer, k números dessa sequência, os quaiscorresponderão aos elementos pertencentes à amostra.

Exemplo: Vamos obter uma amostra representativa para uma pesquisa da estatura de 90 (noventa) alunos de umaescola:

a) Numeramos os alunos de 01 a 90.b) Escrevemos os números, de 01 a 90, em pedaços iguais de um mesmo papel, colocando-os dentro de uma

caixa. Agitamos sempre a caixa para misturar bem os pedaços de papel e retiramos, um a um, 9 (nove)números que formarão a amostra. Neste caso, 10% da população.

Quando o número de elementos da população é grande, esse tipo de sorteio torna-se muito trabalhoso.

2.2.2. Amostragem SistemáticaContinuemos a considerar a população de 90 elementos de nossa lista numerada. Para organizar uma

amostragem sistemática, sorteamos um número de 1 a 10, ao acaso. Suponhamos que tenha sido obtido o número 6.Ele será o primeiro elemento da amostra, e os demais serão determinados em intervalos de dez unidades. Assim,nossa amostra será:

6 16 26 36 46 56 66 76 86

A amostragem sistemática é simples de ser realizada e, no caso de amostras muito grandes, acarretaeconomia de tempo e dinheiro.

2.2.3. Amostragem Estratificada ProporcionalMuitas vezes a população se divide em subpopulações – estratos.Como é provável que a variável em estudo apresente, de estrato em estrato, um comportamento heterogêneo

e, dentro de cada estrato, um comportamento homogêneo, convém que o sorteio dos elementos da amostra leve emconsideração tais estratos.

É exatamente isso que fazemos quando empregamos a amostragem estratificada proporcional, que, além deconsiderar a existência dos estratos, obtém os elementos da amostra proporcional ao número de elementos dosmesmos.

Exemplo: Supondo, no exemplo anterior, que, dos 90 alunos, 54 sejam meninos e 36 sejam meninas, vamos obter aamostra estratificada proporcional.

São, portanto, dois estratos (sexo masculino e sexo feminino) e queremos uma amostra de 10% da população.Logo, temos:

Sexo População 10% Amostra

M 54 4,55410010

=× 5

F 36 6,33610010

=× 4

Prof. Carlos Alexandre Santório 10

Page 9: Apostila de Estatistica Aplicada

E s t a t í s t i c a A p l i c a d a

Total 90 0,99010010

=× 9

EXERCÍCIOS:

Série Aula:1) Classifique as variáveis em qualitativas ou quantitativas (discretas ou contínuas):a) Universo: alunos de uma escola.

Variável: cor dos cabelos – ....................................b) Universo: casais residentes em uma cidade.

Variável: número de filhos – ....................................c) Universo: as jogadas de um dado.

Variável: o ponto obtido em cada jogada – ....................................d) Universo: peças produzidas por certa máquina.

Variável: nº de peças produzidas por hora – ....................................e) Universo: peças produzidas por certa máquina.

Variável: diâmetro externo – ....................................f) População: alunos de uma escola.

Variável: cor dos olhos – ....................................g) P.: casais residentes em uma cidade.

V.: sexo dos filhos – ....................................

2) Diga quais variáveis abaixo são discretas e quais são contínuas:a) P.: estação meteorológica de uma cidade.

V.: precipitação pluviométrica, durante um ano – ....................................b) P.: Bolsa de Valores de São Paulo.

V.: nº de ações negociadas – ....................................c) P.: funcionários de uma empresa.

V.: salários – ....................................d) P.: pregos produzidos por uma máquina.

V.: comprimento – ....................................e) P.: propriedades agrícolas do Brasil.

V.: produção de algodão – ....................................f) P.: segmentos de reta.

V.: comprimento – ....................................g) P.: bibliotecas da cidade de São Paulo.

V.: número de volumes – ....................................h) P.: aparelhos produzidos em uma linha de montagem.

V.: nº de defeitos por unidade – ....................................i) P.: indústrias de uma cidade.

V.: índice de liquidez – ....................................

3) Na Escola São Leopoldo, para estudar a preferência em relação a refrigerantes, sortearam-se 150 estudantes, entreos 1.000 matriculados. Responda:a) Qual é a população envolvida na pesquisa?b) Que tipo de amostragem foi utilizada e qual é a amostra considerada?

4) A população envolvida em uma pesquisa sobre a incidência de cárie dentária em escolares da cidade de MorroGrande é apresentada abaixo. Baseando-se nesses dados, estratifique uma amostra com 200 elementos.

Escola PopulaçãoA 500B 250C 440D 360

Total 1.550

Prof. Carlos Alexandre Santório 11

Page 10: Apostila de Estatistica Aplicada

E s t a t í s t i c a A p l i c a d a

5) Em uma escola existem 250 alunos, sendo 35 na 1ª série, 32 na 2ª série, 30 na 3ª série, 28 na 4ª série, 35 na 5ªsérie, 32 na 6ª série, 31 na 7ª série e 27 na 8ª série. Obtenha uma amostra de 40 alunos preenchendo a tabela abaixo.

Séries População Cálculo Proporcional Amostra

1ª 35 6,5250

4035=

⋅ 6

2ª __ = __

3ª __ = __

4ª 28 = __

5ª __ = 6

6ª __ = __

7ª __ = __

8ª __ = __

Total 250 40

6) Uma cidade X apresenta o seguinte quadro relativo às escolas de Ensino Fundamental. Obtenha uma amostraestratificada proporcional de 120 estudantes.

Escolas Nº de EstudantesMasculino Feminino

A 80 95B 102 120C 110 92D 134 228E 150 130F 300 290

Total 876 955

Série Casa:1) População ou universo é:a) Um conjunto de pessoas;b) Um conjunto de elementos quaisquer;c) Um conjunto de pessoas com uma característica comum;d) Um conjunto de elementos com pelo menos uma característica em comum;e) Um conjunto de indivíduo de mesmo município, estado ou país.

2) Uma parte da população retirada para analisá-la denomina-se:a) Universo;b) Parte;c) Pedaço;d) Dados brutos;e) Amostra.

3) A parte da estatística que se preocupa somente com a descrição de determinadas características de um grupo, semtirar conclusões sobre um grupo maior denomina-se:a) Estatística de População;

Prof. Carlos Alexandre Santório 12

Page 11: Apostila de Estatistica Aplicada

E s t a t í s t i c a A p l i c a d a

b) Estatística de Amostra;c) Estatística Inferencial;d) Estatística Descritiva;e) Estatística Grupal.

4) Diga qual tipo de variável estamos trabalhando nos casos abaixo:a) Número de inscrições no Seguro Social;b) Número de passageiros no ônibus da linha Rio/São Paulo;c) Escolaridaded) Peso médio dos recém nascidos;e) Altitude acima do nível do mar;f) Uma pesquisa efetuada em 1.015 pessoas indica que 40 delas são assinantes de um serviço de computador on-line;g) Cada cigarro Camel tem 16,13 mg de alcatrão;h) O radar indica que Nolan Ryan rebateu a última bola a 82,3 km/h

5) Classifique as seguintes variáveis:a) Cor dos olhos:

i) Qualitativa;ii) Qualitativa discreta;iii) Quantitativa contínua;iv) Quantitativa discreta;v) Qualitativa contínua.

b) Número de filhos de um casal:i) Qualitativa;ii) Qualitativa discreta;iii) Quantitativa contínua;iv) Quantitativa discreta;v) Qualitativa contínua.

c) Peso de um indivíduo:i) Qualitativa;ii) Qualitativa discreta;iii) Quantitativa contínua;iv) Quantitativa discreta;v) Qualitativa contínua.

d) Altura de um indivíduo:i) Qualitativa;ii) Qualitativa discreta;iii) Quantitativa contínua;iv) Quantitativa discreta;v) Qualitativa contínua.

e) Número de alunos de uma escola:i) Qualitativa;ii) Qualitativa discreta;iii) Quantitativa contínua;iv) Quantitativa discreta;v) Qualitativa contínua.

f) Tipo sanguíneo:i) Qualitativa;ii) Qualitativa discreta;iii) Quantitativa contínua;

Prof. Carlos Alexandre Santório 13

Page 12: Apostila de Estatistica Aplicada

E s t a t í s t i c a A p l i c a d a

iv) Quantitativa discreta;v) Qualitativa contínua.

6) Na Escola São Miguel, as classes têm 20, 40, 25 e 15 alunos. Determine uma amostra estratificada com 20elementos.

7) Em uma cidade com 30.000 habitantes, deseja-se fazer uma pesquisa sobre a preferência por tipo de lazer entrepessoas de 20 anos de idade, levando em conta o sexo a que pertencem.a) Qual a população envolvida na pesquisa?b) Supondo que na cidade haja 5.500 mulheres e 6.000 homens com 20 anos, determine uma amostra com 1.200pessoas.

8) Quer fazer-se um estudo que estabeleça a relação entre faixa salarial e interesse por teatro, tomando-se um grupode 1.550 pessoas. A tabela abaixo indica o número de pessoas de determinadas faixas salariais. Determine umaamostra com 200 elementos.

Faixa salarial Nº de pessoasAté 3 salários mínimos 776De 3 a 6 salários mínimos 387De 6 a 9 salários mínimos 232Acima de 9 salários mínimos 155

Total 1.550

Prof. Carlos Alexandre Santório 14

Page 13: Apostila de Estatistica Aplicada

E s t a t í s t i c a A p l i c a d a

3. Séries Estatísticas

3.1. TabelasUm dos objetivos da Estatística é sintetizar os valores que uma ou mais variáveis podem assumir, para que

tenhamos uma visão global da variação dessa ou dessas variáveis. E isso ela consegue, inicialmente, apresentandoesses valores em tabelas e gráficos, que irão nos fornecer rápidas e seguras informações a respeito das variáveis emestudo, permitindo-nos determinações administrativas e pedagógicas mais coerentes e científicas.

Tabela é um quadro que resume um conjunto de observações.

3.2. Séries Estatísticas

Denominamos série estatística toda tabela que apresenta a distribuição de um conjunto de dados estatísticosem função da época, do local ou da espécie.

Daí, podemos inferir que numa série estatística observamos a existência de três elementos ou fatores: otempo, o espaço e a espécie.

Conforme varie um dos elementos da série, podemos classificá-la em histórica, geográfica e específica.

3.2.1. Séries Históricas, Cronológicas ou TemporaisDescrevem os valores da variável, em determinado local, discriminados segundo intervalos de tempo variáveis.

Exemplo:

PREÇO DO ACÉM NO VAREJOSÃO PAULO – 1989-94

Anos Preço Médio (US$)1989 2,241990 2,731991 2,121992 1,891993 2,041994 2,62

FONTE: APA.

3.2.2. Séries Geográficas, Especiais, Territoriais ou de LocalizaçãoDescrevem os valores da variável, em determinado instante, discriminados segundo regiões.

Exemplo:

DURAÇÃO MÉDIA DOS ESTUDOSSUPERIORES – 1994

Países Númerode Anos

Itália 7,5Alemanha 7,0França 7,0Holanda 5,9Inglaterra Menos de 4

FONTE: Revista Veja.

Prof. Carlos Alexandre Santório 15

Page 14: Apostila de Estatistica Aplicada

E s t a t í s t i c a A p l i c a d a

3.2.3. Séries Específicas ou CategóricaDescrevem os valores da variável, em determinado tempo e local, discriminados segundo especificações ou

categorias.

Exemplo:

REBANHOS BRASILEIROS – 1992

Espécies Quantidade(1.000 cabeças)

Bovinos 154.440,8Bubalinos 1.423,3Eqüinos 549,5Asininos 47,1Muares 208,5Suínos 34.532,2Ovinos 19.955,9Caprinos 12.159,6Coelhos 6,1

FONTE: IBGE.

3.2.4. Séries Conjugadas – Tabela de Dupla EntradaMuitas vezes temos necessidade de apresentar, em uma única tabela, a variação de valores de mais de uma

variável, isto é, fazer uma conjugação de duas ou mais séries.Conjugando duas séries em uma única tabela, obtemos uma tabela de dupla entrada. Em uma tabela desse

tipo ficam criadas duas ordens de classificação: uma horizontal (linha) e uma vertical (coluna).

Exemplo:

TERMINAIS TELEFÔNICOS EM SERVIÇO – 1991-93Regiões 1991 1992 1993

Norte 342.938 375.658 403.494Nordeste 1.287.813 1.379.101 1.486.649Sudeste 6.234.501 6.729.467 7.231.634Sul 1.497.315 1.608.989 1.746.232Centro-Oeste 713.357 778.925 884.822

FONTE: Ministério das Comunicações.

A conjugação, no exemplo dado, foi série geográfica-série histórica, que dá origem à série geográfico-histórica ou geográfico-temporal.

Podem existir, se bem que mais raramente, pela dificuldade de representação, séries compostas de três oumais entradas.

3.3. Dados Absolutos e Dados Relativos

Os dados estatísticos resultantes da coleta direta da fonte, sem outra manipulação senão a contagem oumedida, são chamados dados absolutos.

Dados relativos são o resultado de comparações por quociente (razões) que se estabelecem entre dadosabsolutos e têm por finalidade realçar ou facilitar as comparações entre quantidades.

Traduzem-se os dados relativos, em geral, por meio de porcentagens, índices, coeficientes e taxas.

Prof. Carlos Alexandre Santório 16

Page 15: Apostila de Estatistica Aplicada

E s t a t í s t i c a A p l i c a d a

3.3.1. As PorcentagensConsidere a série:

MATRÍCULAS NAS ESCOLAS DA CIDADE A – 1995Categorias Número de Alunos

1º grau 19.2862º grau 1.6813º grau 234Total 21.201

Dados fictícios.

Calculemos as porcentagens dos alunos de cada grau:

1º grau: 0,9196,90100201.21286.19

==⋅

2º grau: 9,792,7100201.21

681.1==⋅

3º grau: 1,110,1100201.21

234==⋅

Com esses dados, podemos formar uma nova coluna na série em estudo:

MATRÍCULAS NAS ESCOLAS DA CIDADE A – 1995Categorias Número de Alunos %

1º grau 19.286 91,02º grau 1.681 7,93º grau 234 1,1Total 21.201 100,0

Dados fictícios.

Os valores dessa nova coluna nos diz que, de cada 100 alunos da cidade A, 91 estão matriculados no 1º grau,8, aproximadamente, no 2º grau e 1 no 3º grau.

O emprego da porcentagem é de grande valia quando é nosso intuito destacar a participação da parte no todo.Considere, agora, a série:

MATRÍCULAS NAS ESCOLASDAS CIDADES A E B – 1995

Categorias Nº de AlunosCidade A Cidade B

1º grau 19.286 38.6602º grau 1.681 3.3993º grau 234 424Total 21.201 42.483

Dados fictícios.

Qual das cidades tem, comparativamente, maior número de alunos em cada grau?Como o número total de alunos é diferente nas duas cidades, não é fácil concluir a respeito usando os dados

absolutos. Porém, usando as porcentagens, tal tarefa fica bastante facilitada. Assim, acrescentando na tabela anterioras colunas correspondentes às poscentagens, obtemos:

MATRÍCULAS NAS ESCOLAS

Prof. Carlos Alexandre Santório 17

Page 16: Apostila de Estatistica Aplicada

E s t a t í s t i c a A p l i c a d a

DAS CIDADES A E B – 1995

Categorias Cidade A Cidade BNº de Alunos % Nº de Alunos %

1º grau 19.286 91,0 38.660 91,02º grau 1.681 7,9 3.399 8,03º grau 234 1,1 424 1,0Total 21.201 100,0 42.483 100,0

Dados fictícios.

o que nos permite dizer que, comparativamente, contam, praticamente, com o mesmo número de alunos em cada grau.

3.3.2. Os Índices

Os índices são razões entre duas grandezas tais que uma não inclui a outra.

São exemplos de índices:

Índice cefálico = 100 crânio do allongitudin diâmetrocrânio do transverso diâmetro

×

Quociente intelectual = 100 crônica idademental idade

×

Densidade demográfica = superfíciepopulação

Índices econômicos:

Produção per capita = populaçãoprodução da total valor

Consumo per capita = populaçãobem do consumo

Renda per capita = populaçãorenda

Receita per capita = populaçãoreceita

3.3.3. Os Coeficientes

Os coeficientes são razões entre o número de ocorrências e o número total (número de ocorrências e númerode não-ocorrências).

São exemplos de coeficientes:

Coeficiente de natalidade = total populaçãosnascimento de número

Coeficiente de mortalidade = total populaçãoóbitos de número

Prof. Carlos Alexandre Santório 18

Page 17: Apostila de Estatistica Aplicada

E s t a t í s t i c a A p l i c a d a

Coeficiente educacionais:

Coeficiente de evasão escolar = matrículas de inicial número

evadidos alunos de número

Coeficiente de aproveitamento escolar = matrículas de final númeroaprovados alunos de número

Coeficiente de recuperação escolar = orecuparaçã em alunos de númerosrecuperado alunos de número

3.3.4. As Taxas

As taxas são os coeficientes multiplicados por uma potência de 10 (10, 100, 1.000, etc.) para tornar oresultado mais inteligível.

São exemplos de taxas:

Taxa de natalidade = coeficiente de natalidade x 1.000Taxa de mortalidade = coeficiente de maortalidade x 1.000Taxa de evasão escolar = coeficiente de evasão escolar x 100

EXERCÍCIOS:

Série Aula:

1) Clasifique as séries:a)

PRODUÇÃO DE BORRACHA NATURAL – 1991-93Anos Toneladas1991 29.5431992 30.7121993 40.663

FONTE: IBGE.

b)AVICULTURA BRASILEIRA – 1992

Espécies Número(1.000 cabeças)

Galinhas 204.160Galos, frangos, frangas e pintos 435.465Codornas 2.488

FONTE: IBGE.

c)VACINAÇÃO CONTRA A POLIOMIELITE – 1993

Regiões QuantidadeNorte 211.209Nordeste 631.040Sudeste 1.119.708Sul 418.785Centro-Oeste 185.823

FONTE: Ministério da Saúde.d)

Prof. Carlos Alexandre Santório 19

Page 18: Apostila de Estatistica Aplicada

E s t a t í s t i c a A p l i c a d a

AQUECIMENTO DE UM MOTOR DE AVIÃO DE MARCA XMinutos Temperatura (ºC)

0 201 272 343 414 495 566 63

Dados fictícios.

2) A tabela seguinte foi elaborada a partir da leitura do texto de Philip M. Fearnsinde, do Instituto Nacional da Amazônia.DESMATAMENTO EM RONDÔNIA

Regiões 1975 1978 1980 1983Área (km2) 1.216,5 4.184,5 7.579,3 13.955,2

% 0,5 1,72 3,12 5,74FONTE: Revista Ciência Hoje, nº 19.

a) Que tipo de fonte (primária ou secundária) foi consultada para a elaboração da tabela?b) Que tipo de série está representada na tabela?

3) Uma série estatística é denominada espacial quando?a) O elemento variável é o tempo;b) O elemento variável é o local;c) O elemento variável é a espécie;d) É o resultado da combinação de séries estatísticas de tipos diferentes;e) Os resultados são agrupados em subintervalos do intervalo observado.

4) Uma série estatística é denominada cronológica quando?a) O elemento variável é o tempo;b) O elemento variável é o local;c) O elemento variável é a espécie;d) É o resultado da combinação de séries estatísticas de tipos diferentes;e) Os resultados são agrupados em subintervalos do intervalo observado.

5) Uma série estatística é denominada composta quando?a) O elemento variável é o tempo;b) O elemento variável é o local;c) O elemento variável é a espécie;d) É o resultado da combinação de séries estatísticas de tipos diferentes;e) Os resultados são agrupados em subintervalos do intervalo observado.

6) Construa a tabela e especifique o tipo de série em cada caso:a) As capacidades dos estádios do Maracanã (Rio de Janeiro), do Morumbi (São Paulo) e do Mineirão (Belo Horizonte)são, respectivamente: 220.000, 150.000, 110.000 pessoas. (Fonte: Brasil em dados)b) A população do Brasil em 1962 era de 74.100.000 habitantes; em 1964, de 78.800.000; em 1966, de 83.900.000 eem 1969, de 92.300.000. (Fonte: IBGE)

7) Uma escola registrou em março, na 1ª série, a matrícula de 40 alunos e a matrícula efetiva, em dezembro, de 35alunos. A taxa de evasão foi de:

%5,1210010040

35 - 40100inicial matrícula nº

evadidos de nº=×=×=×=TEE

8) Complete a tabela abaixo:

Prof. Carlos Alexandre Santório 20

Page 19: Apostila de Estatistica Aplicada

E s t a t í s t i c a A p l i c a d a

Escolas Nº de Alunos Dados RelativosPor 1 Por 100

A 175 0,098 9,8B 222 _____ _____C 202 _____ _____D 362 _____ _____E 280 _____ _____F 540 _____ _____

Total 1.781 1,000 100,0

9) São Paulo tinha, em 1992, uma população de 32.182,7 mil habitantes. Sabendo que sua área terrestre é de248.256 km2, calcule a sua densidade demográfica.

10) Um professor preencheu um quadro, enviado pela D.E., com os seguintes dados:

SérieNº de

Alunos30/03

Nº deAlunos30/11

Promovidossem

recuperaçãoRetidos semrecuperação

Emrecuperaçã

oRecuperados Não-

recuperadosTotal Geral

Promovidos Retidos

1º A 49 44 35 03 06 05 01 40 041º B 49 42 42 00 00 00 00 42 001º C 47 35 27 00 08 03 05 30 051º D 47 40 33 06 01 00 01 33 07Total 192 161 137 09 15 08 07 145 16

Calcule:a) a taxa de evasão, por classe.b) a taxa de evasão total.c) a taxa de aprovação, por classe.d) a taxa de aprovação geral.e) a taxa de recuperação, por classe.f) a taxa de recuperação geral.g) a taxa de reprovação na recuperação geral.h) a taxa de aprovação, sem a recuperação.i) a taxa de retidos, sem a recuperação.

Série Casa:1) Calcule a taxa de aprovação de um professor de uma classe de 45 alunos, sabendo que obtiveram aprovação de 36alunos.

2) Considerando que Minas Gerais, em 1992, apresentou (dados fornecidos pelo IBGE):população: 15.957,6 mil habitantes;superfície: 586.624 km2;nascimentos: 292.036;óbitos: 99.281.

Calcule:a) o índice de densidade demográfica;b) a taxa de natalidade;c) a taxa de mortalidade.

3) Uma série estatística é denominada categórica quando?a) O elemento variável é o tempo;

Prof. Carlos Alexandre Santório 21

Cálculos:

A → 098,01781.1

175=×

Page 20: Apostila de Estatistica Aplicada

E s t a t í s t i c a A p l i c a d a

b) O elemento variável é o local;c) O elemento variável é a espécie;d) É o resultado da combinação de séries estatísticas de tipos diferentes;e) Os resultados são agrupados em subintervalos do intervalo observado.

4) Uma série estatística é denominada geográfica quando?a) O elemento variável é o tempo;b) O elemento variável é o local;c) O elemento variável é a espécie;d) É o resultado da combinação de séries estatísticas de tipos diferentes;e) Os resultados são agrupados em subintervalos do intervalo observado.

5) Uma série estatística é denominada específica quando?a) O elemento variável é o tempo;b) O elemento variável é o local;c) O elemento variável é a espécie;d) É o resultado da combinação de séries estatísticas de tipos diferentes;e) Os resultados são agrupados em subintervalos do intervalo observado.

6) Uma série estatística é denominada mista quando?a) O elemento variável é o tempo;b) O elemento variável é o local;c) O elemento variável é a espécie;d) É o resultado da combinação de séries estatísticas de tipos diferentes;e) Os resultados são agrupados em subintervalos do intervalo observado.

7) Uma série estatística é denominada temporal quando?a) O elemento variável é o tempo;b) O elemento variável é o local;c) O elemento variável é a espécie;d) É o resultado da combinação de séries estatísticas de tipos diferentes;e) Os resultados são agrupados em subintervalos do intervalo observado.

8) Uma escola apresentava, no final do ano, o seguinte quadro:

Séries MatrículasMarço Novembro

1ª 480 4752ª 458 4563ª 436 4304ª 420 420

Total 1.794 1.781

a) Calcule a taxa de evasão por série.b) Calcule a taxa de evasão da escola.

Prof. Carlos Alexandre Santório 22

Page 21: Apostila de Estatistica Aplicada

E s t a t í s t i c a A p l i c a d a

4. Distribuição de FrequênciaPraticamente se resume na maneira de ordenar os dados estatísticos em linhas ou colunas, tornando possível

sua leitura, tanto no sentido horizontal quanto no vertical.

4.1. Tabela Primitiva / RolSuponhamos termos feito uma coleta de dados relativos às estaturas de 40 (quarenta) alunos, que compõem

uma amostra dos alunos de um colégio A, resultando a seguinte tabela de valores:

ESTATURA DE 40 ALUNOS DO COLÉGIO A166 160 161 150 162 160 165 167 164 160162 161 168 163 156 173 160 155 164 168155 152 163 160 155 155 169 151 170 164154 161 156 172 153 157 156 158 158 161

A esse tipo de tabela, cujos elementos não foram numericamente organizados, denominamos tabelaprimitiva.

A maneira mais simples de organizar os dados é através de uma certa ordenação (crescente ou decrescente).A tabela obtida após a ordenação dos dados recebe o nome de rol.

ESTATURA DE 40 ALUNOS DO COLÉGIO A150 154 155 157 160 161 162 164 166 169151 155 156 158 160 161 162 164 167 170152 155 156 158 160 161 163 164 168 172153 155 156 160 160 161 163 165 168 173

Agora, podemos saber, com relativa facilidade, qual a menor estatura (150 cm) e qual a maior (173 cm); que aamplitude de variação foi de 173 – 150 = 23 cm; e, ainda, a ordem que um valor particular da variável ocupa noconjunto. Com um exame mais acurado, vemos qua há uma concentração das estaturas em algum valor entre 160 cm e165 cm e, mais ainda, que há poucos valores abaixo de 155 cm e acima de 170 cm.

4.2. Distribuição de FreqüênciaDenominamos frequência o número de alunos que fica relacionado a um determinado valor da variável.

Obtemos, assim, uma tabela que recebe o nome de distribuição de frequência:

ESTAT.(cm) FREQ. ESTAT.

(cm) FREQ. ESTAT.(cm) FREQ.

150 1 158 2 167 1151 1 160 5 168 2152 1 161 4 169 1153 1 162 2 170 1154 1 163 2 172 1155 4 164 3 173 1156 3 165 1 Total 40157 1 166 1

Este tipo de tabela não é aconselhavel quando estamos trabalhando com amostragens grandes, sendo quepoderá ficar muito extensa, dificultando, além de sua elaboração, as análises e conclusões dos dados pesquisados.

Sendo possível, a solução mais aceitável é o agrupamento dos valores em vários intervalos.Chamando de frequência de uma classe o número de valores da variável pertencentes à classe, os dados da

tabela acima, podem ser dispostos como na tabela abaixo, denominada distribuição de frequência com intervalo declasse:

Prof. Carlos Alexandre Santório 23

Page 22: Apostila de Estatistica Aplicada

E s t a t í s t i c a A p l i c a d a

ESTATURA DE 40 ALUNOS DO COLÉGIO AEstaturas

(cm) Frequência150 |–– 154 4154 |–– 158 9158 |–– 162 11162 |–– 166 8166 |–– 170 5170 |–– 174 3

Total 40

4.3. Elementos de uma Distribuição de Freqüência4.3.1. Classe

Classes são intervalos de variação da variável.

4.3.2. Limites de ClasseDenominamos limites de classe os extremos de cada classe. O menor número é o limite inferior da classe (Li) e

o maior número, o limite superior da classe (Lf).

4.3.3. Amplitude de um Intervalo de ClasseAmplitude de um intervalo de classe ou, simplesmente, intervalo de classe é a medida do intervalo que define a

classe.Ela é obtida pela diferença entre os limites superior e inferior dessa classe e indicada por h. Assim:

h = Lf – Li

4.3.4. Amplitude Total da DistribuiçãoAmplitude total da distribuição (At) é a diferença entre o limite superior da última classe (limite superior

máximo) e o limite inferior da primenra classe (limite inferior mínimo):

At = Lf (máx.) – Li (mín.)

4.3.5. Ponto Médio de uma ClasseÉ o ponto que divide o intervalo de classe em duas partes iguais.

2LLPm fi +=

4.4. Determinação do número de ClassesNão existe regra fixa para se determinar o número de classes. Sturges sugere uma regra para a determinação

do número de classes (desde que se conheça o número de observações ou informações), que é a seguinte:

n = 1 + 3,3 . log Nonde,

n = número de classesN = número de dados (observações) a distribuir

Prof. Carlos Alexandre Santório 24

Page 23: Apostila de Estatistica Aplicada

E s t a t í s t i c a A p l i c a d a

Outra maneira de estipular o número de classes é empregando a seguinte relação (conhecendo a amplitude):

n = hAt

4.5. Tipos de FreqüênciasFreqüências simples ou absoluta (Fi) são os valores que realmente representam o número de dados de

cada classe. Assim, a soma das freqüências simples é igual ao número total dos dados:

∑ = NFi

Freqüências simples relativas (fi) são os valores das razões entre freqüências simples e a freqüência total:

∑=

i

ii F

Ff

Freqüência acumulada (Fa) é o total das freqüências de todos os valores inferiores ao limite superior dointervalo de uma dada classe:

)k...,,2,1i(FFa i == ∑

Freqüência acumulada relativa (fa) são os valores das razões entre freqüências simples e a freqüência total:

∑=

iFFafa

Considerando a tabela do exemplo anterior (item 4.2), podemos montar a seguinte tabela com as frequênciasestudadas:

ESTATURA DE 40 ALUNOS DO COLÉGIO A

i Estaturas(cm) Fi Pm fi Fa fa

1 150 |–– 154 4 152 0,100 4 0,1002 154 |–– 158 9 156 0,225 13 0,3253 158 |–– 162 11 160 0,275 24 0,6004 162 |–– 166 8 164 0,200 32 0,8005 166 |–– 170 5 168 0,125 37 0,9256 170 |–– 174 3 172 0,075 40 1,000

Total ∑ = 40 ∑ = 1,000

4.6. Distribuição de Freqüência sem Intervalos de ClasseQuando se trata de variável discreta de variação relativamente pequena, cada valor pode ser tomado com um

intervalo de classe (intervalo degenerado) e, nesse caso, a distribuição é chamada distribuição sem intervalo declasse, tomando a seguinte forma:

xi Fi

x1 F1

x2 F2

x3 F3

… F4

xN F5

Σ Fi = N

Prof. Carlos Alexandre Santório 25

Page 24: Apostila de Estatistica Aplicada

E s t a t í s t i c a A p l i c a d a

Exemplo:Seja x a variável “número de cômodos das casas ocupadas por vinte famílias entrevistadas”:

i xi Fi

1 2 42 3 73 4 54 5 25 6 16 7 1

Σ = 20

Completada com os vários tipos de freqüências, temos:

i xi Fi Fa fi fa1 2 4 4 0,20 0,202 3 7 11 0,35 0,553 4 5 16 0,25 0,804 5 2 18 0,10 0,905 6 1 19 0,05 0,956 7 1 20 0,05 1,00

∑ = 20 ∑ = 1,00

EXERCÍCIOS:

Série Aula:

1) As notas obtidas por 50 alunos de uma classe foram:1 2 3 4 5 6 6 7 7 82 3 3 4 5 6 6 7 8 82 3 4 4 5 6 6 7 8 92 3 4 5 5 6 6 7 8 92 3 4 5 5 6 7 7 8 9

Complete a distribuição de freqüência abaixo:

i Notas Pm Fi

1 0 |–– 2 1 12 2 |–– 4 ___ ___3 4 |–– 6 ___ ___4 6 |–– 8 ___ ___5 8 |–– 10 ___ ___

∑ = 502) Complete a tabela abaixo:

i Classes Fi Fa fi (%) fa (%)1 0 |–– 8 4 ___ ___ ___2 8 |–– 16 10 ___ ___ ___3 16 |–– 24 14 ___ ___ ___4 24 |–– 32 9 ___ ___ ___5 32 |–– 40 3 ___ ___ ___

∑ = 40 ∑ = 100 %

3) Complete os dados que faltam na distribuição de freqüência:

Prof. Carlos Alexandre Santório 26

Page 25: Apostila de Estatistica Aplicada

E s t a t í s t i c a A p l i c a d a

i xi Fi Fa fi (%) fa (%)1 0 1 ___ 5,0 ___2 1 ___ 4 15,0 ___3 2 4 ___ ___ ___4 3 ___ 13 25,0 ___5 4 3 ___ 15,0 ___6 5 2 18 ___ ___7 6 ___ 19 ___ ___8 7 ___ ___ ___ ___

∑ = 20 ∑ = 100 %

4) A tabela abaixo apresenta uma distribuição de freqüência das áreas de 400 lotes:

Áreas(m2) 300 |–– 400 |–– 500 |–– 600 |–– 700 |–– 800 |–– 900 |–– 1.000 |–– 1.100 |–– 1.200

Nº deLotes 14 46 58 76 68 62 48 22 6

Com referência a essa tabela, determine:a) a amplitude total;b) o limite superior da quinta classe;c) o limite inferior da oitava classe;d) o ponto médio da sétima classe;e) a amplitude do intervalo da segunda classe;f) a freqüência da quarta classe;g) a freqüência relativa absoluta da sexta classe;h) a freqüência acumulada da quinta classe;i) o número de lotes cuja área não atinge 700 m2;j) o número de lotes cuja área atinge e ultrapassa 800 m2;k) a porcentagem de lotes cuja área não atinge 600 m2;l) a porcentagem de lotes cuja área seja maior ou igual a 900 m2;m) a porcentagem de lotes cuja área é de 500 m2, no mínimo, mas inferior a 1.000 m2;n) a classe do 72º lote;o) até que classe estão incluídos 60% dos lotes.

Série Casa:1) Complete a distribuição abaixo, determinando as frequências absolutas:

i xi Fi Fa1 2 ___ 22 3 ___ 93 4 ___ 214 5 ___ 295 6 ___ 34

∑ = 34

2) A distribuição abaixo indica o número de acidentes ocorridos com 70 motoristas de uma empresa de ônibus:

Nº de acidentes 0 1 2 3 4 5 6 7Nº de motoristas 20 10 16 9 6 5 3 1

Determine:a) o número de motoristas que não sofreram nenhum acidente;b) o número de motoristas que sofreram pelo menos 4 acidentes;

Prof. Carlos Alexandre Santório 27

Page 26: Apostila de Estatistica Aplicada

E s t a t í s t i c a A p l i c a d a

c) o número de motoristas que sofreram menos de 3 acidentes;d) o número de motoristas que sofreram no mínimo 3 e no máximo 5 acidentes;e) a porcentagem dos motoristas que sofreram no máximo 2 acidentes.

3) Complete os dados que faltam na distribuição de freqüência:

i Classes Pm Fi Fa fi (%) fa (%)1 0 |–– 2 1 4 ___ 4,0 ___2 2 |–– 4 ___ 8 ___ ___ ___3 4 |–– 6 5 ___ 30 18,0 ___4 __ |–– __ 7 27 ___ 27,0 ___5 8 |–– 10 ___ 15 72 ___ ___6 10 |–– 12 ___ ___ 83 ___ ___7 __ |–– __ 13 10 93 10,0 ___8 14 |–– 16 ___ ___ ___ 7,0 ___

∑ = ___ ∑ = ___

4) Conhecidas as notas de 50 alunos:

84 68 33 52 47 73 68 61 73 7774 71 81 91 65 55 57 35 85 8859 80 41 50 53 65 76 85 73 6067 41 78 56 94 35 45 55 64 7465 94 66 48 39 69 89 98 42 54

obtenha a distribuição de freqüência, tendo 30 para limite inferior da primeira classe e 10 para intervalo de classe.

5) As notas obtidas em Matemática por 80 estudantes de uma escola X estão relacionadas abaixo:

68 84 75 82 68 90 62 88 76 9373 79 88 73 60 93 71 59 85 7561 65 75 87 74 62 95 78 63 7266 78 82 75 94 77 69 74 68 6096 78 89 61 75 95 60 79 83 7179 62 67 97 78 85 76 65 71 7565 80 73 57 88 78 62 76 53 7486 67 73 81 72 63 76 75 85 77

a) Organize o rol colocando os dados em ordem crescente.b) Qual é a menor nota? Qual é a maior nota?c) Qual é a amplitude total?d) Qual é a nota do estudante classificado em 10º lugar?e) Organize os dados em classes considerando 5 como amplitude.f) Faça a distribuição de freqüências.g) Quantos estudantes receberam nota superior ou igual a 85? Qual a porcentagem?

6) Observando a tabela abaixo, responda:

Faixa de renda HabitaçõesAté 1 salário mínimo 224.740De 1 a 3 salários mínimos 363.860De 4 a 8 salários mínimos 155.700Acima de 8 salários mínimos 47.500

Total 791.800

a) Qual é a porcentagem de domicílios onde a renda é superior a 8 salários mínimos?b) Quantos são os domicílios onde a renda está entre 1 e 3 salários?c) Quantos são os domicílios onde a renda está abaixo de 3 salários?

Prof. Carlos Alexandre Santório 28

Page 27: Apostila de Estatistica Aplicada

E s t a t í s t i c a A p l i c a d a

7) Em uma fábrica foram testadas 400 lâmpadas; a duração delas aparece na distribuição de freqüência abaixo:

Duração(em horas)

Nº delâmpadas

300 |–– 400 14400 |–– 500 46500 |–– 600 58600 |–– 700 76700 |–– 800 68800 |–– 900 62900 |–– 1.000 48

1.000 |–– 1.100 221.100 |–– 1.200 6

Total ∑ = 400

Observando a tabela, responda:a) Qual a amplitude de cada classe?b) Qual a amplitude total da distribuição?c) Qual o ponto médio da quinta classe?d) Qual a freqüência relativa absoluta da sexta classe?e) Qual a porcentagem de lâmpadas com durabilidade máxima de 500 horas?f) Qual a porcentagem de lâmpadas com durabilidade de 900 horas ou mais?g) Construir uma tabela de distribuição de freqüência, em que apareçam Pm, Fi, Fa, fi e fa.

Prof. Carlos Alexandre Santório 29

Page 28: Apostila de Estatistica Aplicada

E s t a t í s t i c a A p l i c a d a

5. Gráficos Estatísticos

5.1. Representação GráficaOs gráficos constituem um poderoso instrumento de análise e interpretação de um conjunto de dados. Eles

aparecem nos mais variados veículos de comunicação. Pesquisas de opinião pública, pesquisas eleitorais, economia,agricultura, saúde são apenas alguns exemplos de assuntos em que as representações gráficas assumem um papelfundamental para explicar o comportamento do objeto de estudo. Os mais importantes recursos fornecidos pelosgráficos são a facilidade e a rapidez na absorção e interpretação dos resultados, por parte do leitor.

5.1.1. Gráfico de LinhaOs gráficos de linhas são bastante utilizados na identificação de tendências de aumento ou diminuição dos

valores numéricos de uma dada informação. Assim, vamos encontrar com frequência esse tipo de representação emanálises tais como lucros de empresas, incidência de moléstias, índices de crescimento populacional ou de mortalidadeinfantil, índices de custo de vida, etc. Seu traço é feito no plano cartesiano.

Exemplo:Na cidade de São Joaquim (SC), foi anotada a temperatura registrada às 8 horas, durante sete dias

consecutivos, conforme a seguinte tabela:

TEMPERATURA NA CIDADEDE SÃO JOAQUIM – SC

Dia Temperatura (ºC)1º 12º –23º –34º 45º 56º 67º 7

Com base na tabela, façamos a representação gráfica da variação de temperatura.

Solução:

-4-3-2-1012345678

1º 2º 3º 4º 5º 6º 7º

Dia

Tem

pera

tura

(ºC)

5.1.2. Gráfico de Colunas ou de BarrasÉ a representação de uma série por meio de retângulos, dispostos verticalmente (em colunas) ou

horizontalmente (em barras).Quando em colunas, os retângulos têm a mesma base e as alturas são proporcionais aos respectivos dados.

Prof. Carlos Alexandre Santório 30

Page 29: Apostila de Estatistica Aplicada

E s t a t í s t i c a A p l i c a d a

Quando em barras, os retângulos têm a mesma altura e os comprimentos são proporcionais aos respectivosdados.

Assim estamos assegurando a proporcionalidade entre as áreas dos retângulos e os dados estatísticos.

Exemplo:a) Gráfico em colunas

PRODUÇÃO BRASILEIRA DECARVÃO MINERAL BRUTO

1989-92

Anos Quant. Produzida(1.000 t)

1989 18.1961990 11.1681991 10.4681992 9.241

Fonte: Ministério da Agricultura

0

5.000

10.000

15.000

20.000

1989 1990 1991 1992Anos

Mil t

onela

das

b) Gráfico em barras

EXPORTAÇÕES BRASILEIRASMARÇO – 1995

Estados Valor(US$ milhões)

São Paulo 1.344Minas Gerais 542Rio Grande do Sul 332Espírito Santo 285Paraná 250Santa Catarina 202

Fonte: SECEX

0 500 1.000 1.500

Santa Catarina

Paraná

Espírito Santo

Rio Grande do Sul

Minas Gerais

São Paulo

Milhões de dólares

Prof. Carlos Alexandre Santório 31

Page 30: Apostila de Estatistica Aplicada

E s t a t í s t i c a A p l i c a d a

5.1.3. Gráfico de Colunas ou de Barras MúltiplasEste tipo de gráfico é geralmente empregado quando queremos representar, simultaneamente, dois ou mais

fenômenos estudados com o propósito de comparação.

Exemplo:

BALANÇA COMERCIAL DO BRASIL – 1989-93

Especificações Valor (US$ 1.000.000)1989 1990 1991 1992 1993

Exportação (FOB) 34.383 31.414 31.620 35.793 38.783Importação 18.263 20.661 21.041 20.554 25.711

Fonte: Ministério da Fazenda

0

10.000

20.000

30.000

40.000

1989 1990 1991 1992 1993

US$ m

ilhão

Ex portação (FOB) Importação

5.1.4. Gráfico de SetoresA estatística recorre com frequência a esse tipo de gráfico, que consiste em distribuir num círculo setores

proporcionais aos dados do problema. O gráfico de setores, ou setograma, é utilizado principalmente quando asquantidades a serem comparadas são muito diferentes umas das outras, caso em que uma ou mais delas se salientamem relação ao conjunto.

Exemplo:

DISTRIBUIÇÃO DE REMUNERAÇÕES MENSAIS NO BRASIL – 1983Faixa Salarial

(em salários mínimos) Nº de empregados %Até 3 salários 11.770.000 67,1De 3 a 7 salários 3.931.000 22,4De 7 a 15 salários 1.355.000 7,7Mais de 15 salários 483.000 2,8

Total 17.539.000 100,0

Mais de 15 salários

De 7 a 15 salários

De 3 a 7 salários

Até 3 salários

Prof. Carlos Alexandre Santório 32

% Graus67,1 241,622,4 80,67,7 27,72,8 10,1

Page 31: Apostila de Estatistica Aplicada

E s t a t í s t i c a A p l i c a d a

5.2. Representação Gráfica de Distribuição de FrequênciaUma distribuição de frequência pode ser representada graficamente pelo histograma, pelo polígono de

frequência e pelo polígono de frequência acumulada.

5.2.1. HistogramaO histograma é um gráfico constituído no plano cartesiano por retângulos em número igual ao número de

classes da distribuição. Cada classe é representada por uma coluna de altura correspondente a sua frequência.Trata-se também de um gráfico de área. É utilizado para variáveis contínuas; por isso, o gráfico também é

contínuo: as colunas são justapostas. A área de cada coluna é proporcional à frequência da classe representada. Logo,a área de todo o histograma é proporcional à soma total das frequências.

Exemplo:

i Classes Pm Fi Fa fi (%) fa (%)1 150 |--- 155 152,5 6 6 15,0 15,02 155 |--- 160 157,5 10 16 25,0 40,03 160 |--- 165 162,5 15 31 38,0 78,04 165 |--- 170 167,5 5 36 12,0 90,05 170 |--- 175 172,5 3 39 8,0 98,06 175 |--- 180 177,5 1 40 2,0 100,0

Total 40 100,0

0

5

10

15

Fi

5.2.2. Polígono de FrequênciaNum sistema de coordenadas cartesianas ortogonais, tomamos sobre o eixo das abscissas segmentos

proporcionais aos valores dos pontos médios das classes, e sobre o eixo das ordenadas segmentos proporcionais àsfrequências, determinando pontos no plano.

Unindo os pontos obtidos, determinamos um diagrama poligonal, que convencionalmente é fechado no eixodas abscissas pelo ponto médio da classe imediatamente inferior à inicial e pelo ponto médio da classse imediatamentesuperior à final. Desta forma, obtemos um polígono de frequência.

Vejamos agora como, a partir da tabela do item anterior, podemos construir um polígono de frequência.

0

3

6

9

12

15

Fi

Prof. Carlos Alexandre Santório 33

150 155 160 165 170 175 180

150 155 160 165 170 175 180

Page 32: Apostila de Estatistica Aplicada

Vestuário (5,08)

Educação, leitura e recreação (9,23)

Saúde e cuidados pessoais (12,01)

Transportes (13,95)

Alimentação (25,12)Despesas div ersas

(inclui bebidas, cigarros e jogos eletrônicos) (3,46) H abitação (31,15)

E s t a t í s t i c a A p l i c a d a

5.2.3. OgivaA ogiva é um gráfico de frequências acumuladas, o que justifica ser também denominada curva de

caumulação de frequências.Retomando o exemplo do item 5.2.1., podemos construir um gráfico de ogiva com os valores de frequência

acumulada (Fa).

0

10

20

30

40

150 155 160 165 170 175 180

Fa

EXERCÍCIOS:

Série Aula:1)

Retrato do Orçamento FamiliarItens que mais pesam (%)

Capital Renda média familiar(em salários mínimos)

Renda per capita(em salários mínimos)

Belém 7,52 1,95Belo Horizonte 10,76 2,69Brasília 23,83 6,40Curitiba 12,59 3,57Florianópolis 12,06 3,34Fortaleza 9,34 2,24Goiânia 7,42 1,86Porto Alegre 12,73 3,88Recife 9,08 2,26Salvador 6,06 1,43Rio de Janeiro* 17,20 5,60São Paulo* 15,62 4,27

* Para o Rio e São Paulo, os dados são referentes à Pesquisa do Orçamento Familiar de 1997/98.

Fonte: O Estado de São Paulo, 15/03/2001.

Considerando que, nos primeiros meses de 2002, o salário mínimo era de R$ 200,00, aproximadamente, analise asinformações seguintes, classificando-as em V ou F, justificando:

I. Em Belém, uma família gastava, em média, R$ 468,00 por mês em moradia.

Prof. Carlos Alexandre Santório 34

Page 33: Apostila de Estatistica Aplicada

O pesadelo vai continuar

Não96%

Sim4%

Total de participantes: 1.061

VEJA on-line perguntou aos internautas: “Capturando Bin Laden, os EUA estarão livres de novos atentados?”

E s t a t í s t i c a A p l i c a d a

II. No Recife, um indivíduo gastava menos de R$ 65,00 por mês em transporte.III. Os gastos com saúde de uma família em Fortaleza superavam os gastos com transportes de uma

família em Goiânia.IV. Descontados os gastos com habitação e alimentação, sobravam a uma família paulista menos de

R$ 1.300,00 por mês.

2) Analisando o gráfico de colunas ao lado, classifiqueem V ou F cada sentença seguinte, justificando:a) Se esse conjunto de dados fosse representado em umgráfico de setores (pizza), o ângulo correspondente àregião Sul seria menor que 90º.b) O número de emissoras da região Sudeste supera asoma do número de emissoras das regiões Nordeste,Centro-Oeste e Norte.c) Supondo que Goiás concentre 60% das emissoras desua região, o percentual de emissoras do paísrepresentado por este Estado é menor que 5%.

3)

a) Quais as medidas dos ângulos apresentadosno gráfico ao lado?b) Quantos internautas responderam “sim”?

4) O histograma abaixo representa o tempo de espera (em minutos) na fila de um banco, em certa manhã, no centro deBelo Horizonte. Que porcentagem do total de pessoas esperou até 20 minutos na fila?

16

12

6

4

2

5) Considere os resultados abaixo de medição de temperatura, obtidos durante 10 dias, no mesmo horário, e construaum gráfico de linha.

Dia 1º 2º 3º 4º 5º 6º 7º 8º 9º 10ºTemperatura (ºC) 32 35 34 30 28 31 32 33 30 29

Prof. Carlos Alexandre Santório 35

Fi

Tempo

8 12 16 20 24 28

RádioEmissoras - 2000

1064

762664

227165

Sudeste Sul Nordeste Centro-Oeste Norte

Page 34: Apostila de Estatistica Aplicada

E s t a t í s t i c a A p l i c a d a

6) A tabela abaixo representa, em termos percentuais, a distribuição da população brasileira por cor. Construa:a) um gráfico de setores;b) um gráfico de colunas.

Cor %Branca 54,23Preta 5,92Amarela 0,56Parda 38,85Sem declaração 0,44

Total 100,00Fonte: IBGE.

7) Examinando o histograma abaixo, que corresponde às notas relativas à aplicação de um teste de inteligência a umgrupo de alunos, responda?a) Qual é o intervalo de classe que tem maior freqüência?b) Qual a amplitude total da distribuição?c) Qual o número total de alunos?d) Qual é a freqüência do intervalo de classe 110 |–– 120?e) Quantos alunos receberam notas de teste entre 90 (inclusive) e 110?f) Quantos alunos receberam notas de teste não inferiores a 100?

Série Casa:1) Construa um gráfico de linha a partir da seguinte tabela:

COMÉRCIO EXTERIORBRASIL – 1984-93

Anos Quantidade (1.000 t)Exportação Importação

1984 141.737 53.9881985 146.351 48.8701986 133.832 60.5971987 142.378 61.9751988 169.666 58.0851989 177.033 57.2931990 168.095 57.1841991 165.974 63.2781992 167.295 68.0591993 182.561 77.813

Prof. Carlos Alexandre Santório 36

0

5

10

15

20

25

30

20 40 60 80 100 120 140 160

Page 35: Apostila de Estatistica Aplicada

E s t a t í s t i c a A p l i c a d a

2) Represente as tabelas usando o gráfico de colunas:a)

PRODUÇÃO BRASILEIRA DEPETRÓLEO BRUTO

1991-93

Anos Quantidade(1.000 m3)

1991 36.180,41992 36.410,51993 37.164,3

Fonte: Petrobrás

b)ENTREGA DE GASOLINA

PARA CONSUMOBRASIL – 1988-91

Anos Volume(1.000 m3)

1988 9.267,71989 9.723,11990 10.121,31991 12.345,4

Fonte: IBGE

3) Represente as tabelas usando o gráfico de barras:a)

PRODUÇÃO DE OVOSDE GALINHA

BRASIL – 1992

Regiões Quantidade(1.000 dúzias)

Norte 57.297Nordeste 414.804Sudeste 984.659Sul 615.978Centro-Oeste 126.345

Fonte: IBGEb)

PRODUÇÃO DE VEÍCULOSDE AUTOPROPULSÃO

BRASIL – 1993Tipos Quantidade

Automóveis 1.100.278Comerciais leves 224.387Comerciais pesados 66.771

Fonte: ANFAVEA

4) Construa um gráfico de colunas múltiplas a partir da seguinte tabela:PROPORÇÃO DOS DOMICÍLIOS POR CONDIÇÃO DE OCUPAÇÃO

BRASIL – 1990-91

Anos NATUREZAPróprios (%) Alugados (%) Cedidos (%)

1990 62,7 22,9 14,41991 70,3 16,5 13,2

5) Represente as tabelas por meio de gráficos de setores:a)

ÁREA TERRESTREBRASIL

Regiões Relativa (%)Norte 45,25Nordeste 18,28Sudeste 10,85Sul 6,76Centro-Oeste 18,86

Total 100,0Fonte: IBGE

b)PRODUÇÃO DE FERRO-GUSA

BRASIL – 1993

Estados Produção(1.000 t)

Minas Gerais 12.888Espírito Santo 3.174Rio de Janeiro 5.008São Paulo 2.912

Fonte: Instituto Brasileiro de Siderurgia

6) A tabela a seguir mostra as áreas, em milhões de km2, dos oceanos. Representar graficamente os dados, usando: a)um gráfico de colunas; b) um gráfico de setores.

Oceano Antártico Ártico Atlântico Índico PacíficoÁrea

(milhões de km2) 36,8 23,2 199,4 137,9 342,7

7) Construa um gráfico de setores a partir da seguinte tabela:

Prof. Carlos Alexandre Santório 37

Page 36: Apostila de Estatistica Aplicada

E s t a t í s t i c a A p l i c a d a

Espécie QuantidadeAuxílio-natalidade 901.000

Auxílio-doença 467.000Auxílio-funeral 88.000

Aposentadoria por Invalidez 40.000Aposentadoria por Tempo de Serviço 39.000

Abono Permanente em Serviço 30.000Pensão por Morte 73.000Outras Espécies 44.000

8) Dada a amostra: 3, 4, 4, 5, 6, 7, 7, 4, 5, 5, 6, 6, 7, 5, 8, 5, 6, 6, pede-se:a) construir a distribuição das freqüências absolutas;b) determinar as freqüências acumuladas, relativas absolutas e relativas acumuladas.c) construir o gráfico das freqüências absolutas (faça o gráfico que preferir).

9) De um exame final de Estatística, aplicado em 54 alunos da Faculdade FESAV, resultaram as seguintes notas:

7,0 6,7 3,5 4,2 5,0 6,2 7,2 8,9 9,07,1 6,9 6,7 7,4 6,2 5,1 4,3 6,9 7,02,1 4,2 6,4 7,1 8,3 9,2 6,6 7,1 1,72,8 4,5 5,7 6,1 6,8 7,5 6,4 6,5 8,38,6 7,0 9,8 10,0 7,5 7,8 6,9 6,1 5,08,0 7,8 7,0 8,0 7,2 7,0 7,4 6,9 5,0

Pede-se:a) Construir uma tabela de distribuição de freqüência, iniciando com 1,6 e adotando amplitude do intervalo declasse igual a 1,4, fechado à esquerda.b) Os pontos médios.c) Elaborar uma distribuição de freqüência acumulada e percentual (absoluta e acumulada).d) Quantos alunos obtiveram notas inferiores a 5,0?e) Quantos alunos obtiveram notas entre 5,0 e 8,0?f) Que porcentagem de alunos obteve notas acima ou igual a 7,0?g) Construa o gráfico de setores para as classes.

10) Construa um gráfico de colunas considerando a tabela abaixo:

DISTRIBUIÇÃO DE RENDA NO BRASIL – 1971Faixa de renda Habitações

Até 1 salário mínimo 224.740De 1 a 3 salários mínimos 363.860De 4 a 8 salários mínimos 155.700Acima de 8 salários mínimos 47.500

Total 791.800

11) Represente num gráfico de setores as faixas de renda observadas no Brasil, em 1971, de acordo com a tabelaobservada no exercício 14 acima. Para isso, utilize as freqüências relativas absolutas.

12) A tabela abaixo no fornece as principais altas de preço verificadas no Brasil, no período de setembro a 11 denovembro de 1984. Construa um gráfico de colunas, com estes dados.

ELEVAÇÃO ACUMULADA DE SETEMBRO A11 DE NOVEMBRO DE 1984Produto % de alta

Prof. Carlos Alexandre Santório 38

Page 37: Apostila de Estatistica Aplicada

E s t a t í s t i c a A p l i c a d a

Carne 2,5Leite 10,7Frutas 18,7Vestuário 14,5

Fonte: IBGE.

13) Considerando as distribuições de freqüência seguintes, confeccione, para cada uma:a) o histograma;b) o polígono de freqüência;c) a ogiva.I.

i Pesos (kg) Fi1 40 |–– 44 22 44 |–– 48 53 48 |–– 52 94 52 |–– 46 65 56 |–– 60 4

Σ = 26

II.i Estaturas (cm) Fi1 150 |–– 156 12 156 |–– 162 53 162 |–– 168 84 168 |–– 174 135 174 |–– 180 3

Σ = 30

III. i Salários (R$) Fi1 500 |–– 700 82 700 |–– 900 203 900 |–– 1.100 74 1.100 |–– 1.300 55 1.300 |–– 1.500 26 1.500 |–– 1.700 17 1.700 |–– 1.900 1

Σ = 44

14) Conhecidas as notas de 50 alunos:68 85 33 52 65 77 84 65 74 5771 35 81 50 35 64 74 47 54 6880 61 41 91 55 73 59 53 77 4541 55 78 48 69 85 67 39 60 7694 98 66 66 73 42 65 94 88 89

Determine:a) a distribuição de freqüência começando por 30 e adotando o intervalo de classe de amplitude igual a 10;b) as freqüências acumuladas;c) as freqüências relativas;d) o histograma, o polígono de freqüência e a ogiva.

15) Um grau de nebulosidade, registrado em décimos, ocorre de acordo com a distribuição abaixo:Nebulosidade 0 |–– 0,5 |–– 1,5 |–– 2,5 |–– 3,5 |–– 4,5 |–– 5,5 |–– 6,5 |–– 7,5 |–– 8,5 |–– 9,5 |–– 10,0

Fi 320 125 75 65 45 45 55 65 90 145 676

Construa o histograma correspondente.

Prof. Carlos Alexandre Santório 39

Page 38: Apostila de Estatistica Aplicada

E s t a t í s t i c a A p l i c a d a

6. Medidas de Posição: Medidas de Tendência CentralAs medidas de posição mais importantes são as medidas de tendência central, que recebem tal

denominação pelo fato dos dados observados tenderem, em geral, a se agrupar em torno de valores centrais. Dentre asmedidas de tendência central, destacamos:

- A média aritmética- A mediana- A moda

As outras medidas de posição são as separatrizes, que englobam:- A própria média aritmética- Os quartis- Os percentis

6.1. Média Aritmética ( x )Em um conjunto de dados, podemos definir vários tipos de médias. Porém, em nossos estudos iremos nos

limitar à mais importante: a média aritmética.Média aritmética é o quociente da soma dos valores da variável pelo número deles:

nxx iΣ

=

sendo:x é a média aritmética;

ix os valores da variável;n o número de valores.

6.1.1. Dados não-agupadosQuando desejamos conhecer a média dos dados não-agrupados em tabelas de freqüências, determinamos a

média aritmética simples.

Exemplo:Sabendo-se que a venda diária de arroz tipo A, durante uma semana, foi de 10, 14, 13, 15, 16, 18 e 12 kg,

temos, para venda média diária na semana de:

147

12181615131410nxx i =

++++++=

Σ=

Logo: x = 14 kg

6.1.2. Desvio em relação à média

É a diferença entre cada elemento de um conjunto de valores e a média aritmética, ou seja:. xxd ii −= .

No exemplo anterior temos sete desvios:.d1 = 10 – 14 = –4 d5 = 16 – 14 = 2d2 = 14 – 14 = 0 d6 = 18 – 14 = 4d3 = 13 – 14 = –1 d7 = 12 – 14 = –2d4 = 15 – 14 = 1

Page 39: Apostila de Estatistica Aplicada

E s t a t í s t i c a A p l i c a d a

6.1.3. Propriedades da média1ª propriedade:

A soma algébrica dos desvios em relação à média é nula:

0dk

1ii =∑

=

No exemplo anterior:

0d07)7()2(421)1(0)4(d7

1ii

7

1ii =⇒=+−=−++++−++−= ∑∑

==

2ª propriedade:Somando-se (ou subtraindo-se) uma constante (c) a todos os valores de uma variável, a média do conjunto fica

aumentada (ou diminuída) dessa constante:cxycxy ii ±=⇒±=

Somando 2 a cada um dos valores da variável do exemplo dado, temos:y1 = 12, y2 = 16, y3 = 15, y4 = 17, y5 = 18, y6 = 20 e y7 = 14,

Daí:

11214201817151612yk

1ii =++++++=∑

=

Logo:

2xy21416y167

112y +=⇒+==⇒==

3ª propriedade:Multiplicando-se (ou dividindo-se) todos os valores de uma variável por uma constante (c), a média do conjunto

fica multiplicada (ou dividida) por essa constante:

cxycxy ii ×=⇒×= ou cxy

cxy i

i =⇒=

Multiplicando por 3 cada um dos valores da variável do exemplo dado, temos:y1 = 30, y2 = 42, y3 = 39, y4 = 45, y5 = 48, y6 = 54 e y7 = 36,

Daí:

29436544845394230yk

1ii =++++++=∑

=

Logo:

3xy31442y427

294y ×=⇒×==⇒==

6.1.4. Dados agrupados

6.1.4.1. Sem intervalos de classeConsideremos a distribuição relativa a 34 famílias de quatro filhos, tomando para variável o número de filhos

do sexo masculino:

Page 40: Apostila de Estatistica Aplicada

E s t a t í s t i c a A p l i c a d a

Nº de meninos Fi

0 21 62 103 124 4

Σ = 34

Como as freqüências são números indicadores da intensidade de cada valor da variável, elas funcionam comofatores de ponderação, o que nos leva a calcular a média aritmética ponderada, dada pela fórmula:

i

iiF

FxxΣ

⋅Σ=

O modo mais prático de obtenção da média ponderada é abrir, na tabela, uma coluna correspondente aosprodutos ii Fx ⋅ :

Nº demeninos Fi ii Fx ⋅

0 2 01 6 62 10 203 12 364 4 16

Σ = 34 Σ = 78

Temos, então:

3,2x29,23478

FFxx

i

ii =⇒==Σ⋅Σ

=

Logo: x = 2,3 meninos.

6.1.4.2. Com intervalos de classeNeste caso, convencionamos que todos os valores incluídos em um determinado intervalo de classe coincidem

com o seu ponto médio (Pm), e determinamos a média aritmética ponderada por meio da fórmula:

i

iiF

FxxΣ

⋅Σ=

onde xi é o ponto médio (Pm) da classe.

Exemplo: Calcular a estatura média dos alunos de uma escola conforme a tabela abaixo.

i Estaturas (cm) Fi

1 150 |–– 154 42 154 |–– 158 93 158 |–– 162 114 162 |–– 166 85 166 |–– 170 56 170 |–– 174 3

Σ = 40

Vamos abrir uma coluna para os pontos médios e outra para os produtos ii Fx ⋅ :

Page 41: Apostila de Estatistica Aplicada

E s t a t í s t i c a A p l i c a d a

i Estaturas (cm) Fi xi ii Fx ⋅1 150 |–– 154 4 152 6082 154 |–– 158 9 156 1.4043 158 |–– 162 11 160 1.7604 162 |–– 166 8 164 1.3125 166 |–– 170 5 168 8406 170 |–– 174 3 172 516

Σ = 40 Σ = 6.440

Temos, então:

161x16140440.6

FFxx

i

ii =⇒==Σ

⋅Σ=

Logo: x = 161 cm.

6.1.5. Emprego da médiaA média é utilizada quando:a) desejamos obter a medida de posição que possui a maior estabilidade;b) houver necessidade de um tratamento algebrico posterior.

EXERCÍCIOS:

Série Aula:1) Calcule a média aritmética da série:a) X: 1, 2, 8, 10, 12, 16, 21, 30.b) Y: 5, 6, 6, 10, 11, 11, 20.c) Z: 3,4; 7,8; 9,23; 12,15.

2) Um produto é acondicionado em lotes contendo cada um deles 10 unidades. O lote só é aprovado se apresentar umpeso superior a 40 quilos. Se as unidades que compõem determinado lote pesam: 3; 4; 3,5; 5; 3,5; 4; 5; 5,5; 4; 5, estelote será aprovado? Qual o peso médio do produto?

3) Um produto é vendido em três supermecados por R$ 13,00/kg, R$ 13,20/kg e R$ 13,50/kg. Determine quantos R$/kgse paga em média pelo produto.

4) Calcule a média aritmética da série:xi Fi

2 13 44 35 2

5) Uma imobiliária gerencia o aluguel de residências particulares, segundo o quadro abaixo:

i Aluguel(R$)

Nº de casasFi

1 0 |––– 200,00 302 200,00 |––– 400,00 523 400,00 |––– 600,00 284 600,00 |––– 800,00 75 800,00 |––– 1.000,00 3

Page 42: Apostila de Estatistica Aplicada

E s t a t í s t i c a A p l i c a d a

6.2. Mediana (Md)A mediana é outra medida de posição definida como o número que se encontra no centro de uma série de

números, estando dispostos segundo uma ordem. Em outras palavras, a mediana de um conjunto de valores, dispostossegundo uma ordem (crescente ou decrescente), é o valor situado de tal forma no conjunto que o separa em doissubconjuntos de mesmo número de elementos.

6.2.1. Dados não-agrupadosDada uma série de valores como, por exemplo:

5, 2, 6, 13, 9, 15, 10

de acordo com a definição de mediana, o primeiro passo a ser dado é o da ordenação (crescente ou decrescente) dosvalores:

2, 5, 6, 9, 10, 13, 15

O valor que divide a série acima em duas partes iguais é igual a 9, logo a Md = 9.Se, porém, a série dada tiver um número par de termos, a mediana será a média aritmética dos valores

centrais da série.Assim, a série de valores:

2, 6, 7, 10, 12, 13, 18, 21

tem para a mediana a média aritmética entre 10 e 12.Logo:

Md = 11222

21210

==+ ⇒ Md = 11

Verificamos que, estando ordenados os valores de uma série e sendo n o número de elementos da série, ovalor mediano (P) será:

21nP +

=

Para comprovar tal fato nas séries dadas:

- Para n = 7, temos 42

17P =+

= . Logo, a mediana é o 4º termo da série, isto é: Md = 9.

- Para n = 8, temos 5,42

18P =+

= . Logo, a mediana é a média aritmética do 4º e 5º termos da série,

isto é: 112

1210Md =+

= ⇒ Md = 11.

Notas:• Quando o número de elementos da série estatística for ímpar, haverá coincidência da mediana com um dos

elementos da série. • Quando o número de elementos da série estatística for par, nunca haverá coincidência da mediana com um

dos elementos da série. A mediana será sempre a média aritmética dos 2 elementos centrais da série. • Em uma série a mediana, a média e a moda não têm, necessariamente, o mesmo valor. • A mediana depende da posição e não dos valores dos elementos na série ordenada. Essa é uma das

diferenças marcantes entre mediana e média (que se deixa influenciar, e muito, pelos valores extremos).Vejamos:

5, 7, 10, 13, 15 ⇒ x = 10 e Md = 105, 7, 10, 13, 65 ⇒ x = 20 e Md = 10

Page 43: Apostila de Estatistica Aplicada

E s t a t í s t i c a A p l i c a d a

isto é, a média do segundo conjunto de valores é maior do que a do primeiro, por influência dos valoresextremos, ao passo que a mediana permanece a mesma.

6.2.2. Dados agrupadosSe os dados se agrupam em uma distribuição de freqüência, o cálculo da mediana se processa de modo muito

semelhante àquele dos dados não-agrupados, implicando, porém, a determinação prévia das freqüências acumuladas.Para o caso de uma distribuição, porém, a ordem, a partir de qualquer um dos extremos, é dada por:

21nP +

=

6.2.2.1. Sem intervalos de classeNeste caso, é o bastante identificar a freqüência acumulada imediatamente superior ao valor de P. A mediana

será aquele valor da variável que corresponde a tal freqüência acumulada.Tomemos a tabela do item 6.1.4.1., completando-a com a coluna correspondente à freqüência acumulada:

Nº demeninos Fi Fa

0 2 21 6 82 10 183 12 304 4 34

Σ = 34

Sendo: 5,172

134P =+

=

a menor freqüência acumulada que supera esse valor é 18, que corresponde ao valor 2 da variável, sendo esse o valormediano. Logo, Md = 2.

Nota:No caso de existir uma freqüência acumulada (Fa), tal que: P – Fa = 0,5, a mediana será dada pela média

aritmética dos valores das variáveis correspondentes às freqüências acumuladas imediatamente inferior e superior a P.

Exemplo:

xi Fi Fa12 1 114 2 315 1 416 2 617 1 720 1 8

Σ = 8

Temos: 5,42

18P =+

= Logo: 5,15231

21615Md ==

+=

6.2.2.2. Com intervalos de classeDevemos seguir os seguintes passos:

1º) Determinamos as freqüências acumuladas;

Page 44: Apostila de Estatistica Aplicada

E s t a t í s t i c a A p l i c a d a

2º) Calculamos 2

1nP += ;

3º) Marcamos a classe correspondente à freqüência acumulada imediatamente superior à P. Tal classe será a classemediana;

4º) Calculamos a Mediana pela seguinte fórmula:

Fih)FaP(LiMd

* ⋅−+=

Li = é o limite inferior da classe mediana.Fa* = é a freqüência acumulada da classe anterior à classe mediana.Fi = é a freqüência simples da classe mediana.h = é a amplitude do intervalo da classe mediana.

Exemplo:

i Estaturas (cm) Fi Fa1 50 |–– 54 4 42 54 |–– 58 9 133 58 |–– 62 11 244 62 |–– 66 8 325 66 |–– 70 5 376 70 |–– 74 3 40

Σ = 40

Temos: 5,202

140P =+

= Logo,.a classe mediana será a terceira (i = 3).

Li = 58 Fa* = 13 Fi = 11 h = 4

Substituindo esses valores na fórmula, obtemos:

73,6011

4)135,20(58MdFi

h)FaP(LiMd*

=⋅−

+=⇒⋅−

+=

Isto é: Md = 60,73.

OBS: Esta mediana é estimada, pois não temos os 40 valores da distribuição.

6.2.3. Emprego da Mediana• Quando desejamos obter o ponto que divide a distribuição em duas partes iguais. • Quando há valores extremos que afetam de maneira acentuada a média aritmética. • Quando a variável em estudo é salário.

EXERCÍCIOS:

Série Aula:1) Calcule a mediana da sequência:a) X: 2, 5, 8, 10, 12, 15, 8, 5, 12.b) Y: 3,4; 5,2; 4,7; 6; 8,4; 9,3; 2,1; 4,8.2) Calcule a mediana da distribuição:

Page 45: Apostila de Estatistica Aplicada

E s t a t í s t i c a A p l i c a d a

xi Fi

2 54 205 326 408 2

3) Uma loja de departamentos selecionou um grupo de 54 notas fiscais, durante um dia, e obteve o quadro abaixo.Determine o valor mediano da série.

i Consumo por nota(R$) Nº de notas

1 0 |––– 50,00 102 50,00 |––– 100,00 283 100,00 |––– 150,00 124 150,00 |––– 200,00 25 200,00 |––– 250,00 16 250,00 |––– 300,00 1

6.3. Moda (Mo)É o valor que ocorre com maior freqüência em uma série de valores.Desse modo, o salário modal dos empregados de uma fábrica é o salário mais comum, isto é, o salário

recebido pelo maior número de empregados dessa fábrica.

6.3.1. Dados não-agrupadosA moda é facilmente reconhecida: basta, de acordo com definição, procurar o valor que mais se repete.

Exemplo: Na série {7, 8, 9, 10, 10, 10, 11, 12} a moda é igual a 10.

Há séries nas quais não exista valor modal, isto é, nas quais nenhum valor apareça mais vezes que outros.

Exemplo: {3, 5, 8, 10, 12} não apresenta moda. A série é amodal.

Em outros casos, pode haver dois ou mais valores de concentração. Dizemos, então, que a série tem dois oumais valores modais.

Exemplo: {2, 3, 4, 4, 4, 5, 6, 7, 7, 7, 8, 9} apresenta duas modas: 4 e 7. A série é bimodal.

6.3.2. Dados agrupados6.3.2.1. Sem intervalos de classe

Uma vez agrupados os dados, é possível determinar imediatamente a moda: basta fixar o valor da variável demaior freqüência.

Exemplo: Qual a temperatura mais comum medida no mês abaixo:Temperatura

(ºC) Fi

0 31 92 123 6

Σ = 30Na distribuição acima a freqüência máxima é 12, correspondente ao valor 2 da variável. Logo, a temperatura

mais comum é 2 ºC.

Page 46: Apostila de Estatistica Aplicada

E s t a t í s t i c a A p l i c a d a

6.3.2.2. Com intervalos de classeA classe que apresenta a maior freqüência é denominada classe modal. Pela definição, podemos afirmar que

a moda, neste caso, é o valor dominante que está compreendido entre os limites da classe modal. O método maissimples para o cálculo da moda consiste em tomar o ponto médio da classe modal. Damos a esse valor a denominaçãode moda bruta.

2LiLsMo +

=

onde:Li = é o limite inferior da classe modal.Ls = é o limite superior da classe modal.

Exemplo: Calcule a estatura modal conforme a tabela abaixo.

i Estaturas (cm) Fi

1 50 |–– 54 42 54 |–– 58 93 58 |–– 62 114 62 |–– 66 85 66 |–– 70 56 70 |–– 74 3

Σ = 40

Temos que a classe modal é i = 3.

Como: 602

58622

LiLsMo =+

=+

=

Logo: Mo = 60 cm

Para determinar a moda de uma variável contínua (com intervalos de classe), podemos optar por váriosprocessos. Daremos destaque para a moda de Pearson, a moda de King e a moda de Czuber.

1º Processo: Moda de PearsonSegundo Pearson, a moda de uma variável contínua pode ser obtida através do valor da média e da mediana:

x2Md3Mo −=

2º Processo: Moda de KingKing levou em consideração, em sua fórmula, a freqüência absoluta da classe anterior e a freqüência absoluta

da classe posterior à classe modal.

hFF

FLMo

postant

posti ⋅

++=

onde:Li = limite inferior da classe modal.Fpost = freqüência absoluta da classe posterior à classe modal.Fant = freqüência absoluta da classe anterior à classe modal.h = amplitude do intervalo de classe.

3º Processo: Moda de CzuberCzuber levou em consideração, em sua fórmula, a freqüência absoluta da classe anterior e a freqüência

absoluta da classe posterior, além da freqüência absoluta da classe modal.

Page 47: Apostila de Estatistica Aplicada

E s t a t í s t i c a A p l i c a d a

h)FF(F2

FFLMo

postanti

antii ⋅

+−−

+=

onde:Li = limite inferior da classe modal.Fi = freqüência absoluta da classe modal.Fpost = freqüência absoluta da classe posterior à classe modal.Fant = freqüência absoluta da classe anterior à classe modal.h = amplitude do intervalo de classe.

Comentários:A fórmula de Pearson tem normalmente interesse teórico. Se não dispusermos da média e da mediana da

distribuição, a fórmula de Pearson é a mais trabalhosa.A fórmula de King é a mais simples delas, mas não é a mais precisa.A fórmula de Czuber é mais precisa que a fórmula de King, pois leva também em consideração a freqüência da

classe modal.Normalmente o processo mais confiável é o valor de Czuber.

EXERCÍCIOS:

Série Aula:1) Calcule a moda das séries abaixo:a) X: 2, 3, 5, 4, 5, 2, 5, 7b) Y: 4, 12, 5, 9, 12, 4, 3c) Z: 7, 7, 7, 7 7d) J: 4, 5, 6, 6, 6, 7, 8, 8, 8, 9, 10, 10, 10, 11e) T: 2, 5, 9, 8, 10, 12

2) Calcule a moda da distribuição:xi Fi

2 13 74 25 2

3) Calcule a moda de Czuber para a distribuição representativa dos salários de 25 funcionários de uma empresa.

i Salários(R$)

Nº defuncionários

1 1.000,00 |––– 1.200,00 22 1.200,00 |––– 1.400,00 63 1.400,00 |––– 1.600,00 104 1.600,00 |––– 1.800,00 55 1.800,00 |––– 2.000,00 2

6.4. Utilização das Medidas de Tendência CentralNa maioria das situações, não necessitamos calcular as três medidas de tendência central. Normalmente

precisamos de apenas uma das medidas para caracterizar o centro da série.Surge, então, a questão: qual medida deve ser utilizada?A medida ideal em cada caso é aquela que melhor representa a maioria dos dados da série.Quando todos os dados de uma série são iguais, a média, a mediana e a moda coincidirão com este valor e,

portanto qualquer uma delas representará bem a série. No entanto, este caso dificilmente ocorrerá na prática.

Page 48: Apostila de Estatistica Aplicada

E s t a t í s t i c a A p l i c a d a

Na maioria das vezes, teremos valores diferenciados para a série e conseqüentemente a medida irárepresentar bem, apenas os dados da série que se situam próximos a este valor. Os dados muito afastados em relaçãoao valor da medida não serão bem representados por ela. Assim:

- Devemos optar pela média, quando houver forte concentração de dados na área central da série;- Devemos optar pela mediana, quando houver forte concentração de dados no início ou no final da série; e- Devemos optar pela moda apenas em séries que apresentam um elemento típico, isto é, um valor cuja

freqüência é muito superior à freqüência dos outros elementos da série.

EXERCÍCIOS:

Série Aula:1) Uma loja vende cinco produtos básicos, A, B, C, D e E. O lucro por unidade cormecializada destes produtos valerespectivamente R$ 200,00; R$ 300,00; R$ 500,00; R$ 1.000,00 e R$ 5.000,00. A loja vendeu em determinado mês 20,30, 20, 10 e 5 unidades respectivamente. Qual foi o lucro médio por unidade comercializada por esta loja?

2) Um caminhão cujo peso vazio é 3.000 kg será carregado com 480 caixas de 10 kg cada, 350 caixas de 8 kg cada,500 caixa de 4 kg cada e 800 caixas de 5 kg cada. O motorista do caminhão pesa 80 kg e a lona de cobertura da cargapesa 50 kg. (a) Se este caminhão tem que passar por uma balança que sá permite passagens a caminhões com pesomáximo de 15 toneladas, este caminhão passará pela balança? (b) Qual o peso médio das caixas carregadas nocaminhão?

3) Num quartel, constatou-se que o peso médio de 40 soldados era de 69 quilos. Posteriormente, verificou-se que abalança estava desregulada, ocasionando um peso indicado superior em 15 gramas ao peso verdadeiro. Qual era amédia verdadeira dos pesos dos soldados?

4) Calcule o número médio de acidentes por dia em uma determinada esquina.Nº de acidentes

por dia: xi

Nº de diasFi

0 301 52 33 14 1

Série Casa:1) Considerando os conjuntos de dados:

I. 3, 5, 2, 6, 5, 9, 5, 2, 8, 6II. 20, 9, 7, 2, 12, 7, 20, 15, 7

III. 51,6; 48,7; 50,3; 49,5; 48,9IV. 15, 18, 20, 13, 10, 16, 14

Calcule:a) a média aritméticab) a medianac) a moda

2) Os salários-hora de cinco funcionários de uma companhia são:R$ 75,00; R$ 90,00; R$ 83,00; R$ 142,00; R$ 88,00

Determine:

Page 49: Apostila de Estatistica Aplicada

E s t a t í s t i c a A p l i c a d a

a) a média dos salários-horab) o salário-hora mediano

3) As notas de um candidato, em seis provas de um concurso, foram: 8,4; 9,1; 7,2; 6,8; 8,7 e 7,2. Determine:a) a nota médiab) a nota medianac) a nota modal

4) Considerando a distribuição abaixo:

xi 3 4 5 6 7 8Fi 4 8 11 10 8 3

Calcule:a) a médiab) a medianac) a moda

5) Em uma das classes de 50 alunos, as notas obtidas formaram a seguinte distribuição:

Notas 2 3 4 5 6 7 8 9 10Nº de Alunos 1 3 6 10 13 8 5 3 1

Calcule:a) a nota médiab) a nota medianac) a nota modal

6) Calcule a média, a mediana e a moda das distribuições de freqüência abaixo:I.

i Notas Fi

1 0 |–– 2 52 2 |–– 4 83 4 |–– 6 144 6 |–– 8 105 8 |–– 10 7

Σ = 44

II.i Estaturas (cm) Fi1 150 |–– 158 52 158 |–– 166 123 166 |–– 174 184 174 |–– 182 275 182 |–– 190 8

Σ = 70

III. i Salários (R$) Fi1 500 |–– 700 182 700 |–– 900 313 900 |–– 1.100 154 1.100 |–– 1.300 35 1.300 |–– 1.500 16 1.500 |–– 1.700 17 1.700 |–– 1.900 1

Σ = 70

IV.i Pesos (kg) Fi1 145 |–– 151 102 151 |–– 157 93 157 |–– 163 84 163 |–– 169 65 169 |–– 175 36 175 |–– 181 37 181 |–– 187 1

Σ = 40

Page 50: Apostila de Estatistica Aplicada
Page 51: Apostila de Estatistica Aplicada

7) Calcule a idade média e a idade mediana dos alunos de uma classe de primeiro ano de determinada Faculdade, emanos.

Idade (anos)xi

Nº de alunosFi

17 318 1819 1720 821 4

8) O salário de 40 funcionários de um escritório está distribuído segundo o quadro abaixo. Calcule a salário médiodestes funcionários.

i Salário(R$)

Nº de funcionáriosFi

1 400,00 |––– 500,00 122 500,00 |––– 600,00 153 600,00 |––– 700,00 84 700,00 |––– 800,00 35 800,00 |––– 900,00 16 900,00 |––– 1.000,00 1

9) Determine o valor mediano da distribuição a seguir que representa os salários de 25 funcionários selecionados deuma empresa.

i Salário(R$)

Nº de funcionáriosFi

1 1.000,00 |––– 1.200,00 22 1.200,00 |––– 1.400,00 63 1.400,00 |––– 1.600,00 104 1.600,00 |––– 1.800,00 55 1.800,00 |––– 2.000,00 2

10) Calcule a moda de Czuber para a distribuição de valores de 54 notas fiscais, emitidas na mesma dada,selecionadas em uma loja de departamentos:

i Consumo por nota(R$) Nº de notas

1 0 |––– 50,00 102 50,00 |––– 100,00 283 100,00 |––– 150,00 124 150,00 |––– 200,00 25 200,00 |––– 250,00 16 250,00 |––– 300,00 1

11) Calcule a moda de Czuber para a distribuição abaixo que representa a nota de 60 alunos em uma prova dematemática:

i Notas Nº de alunos1 0 |––– 2 52 2 |––– 4 203 4 |––– 6 124 6 |––– 8 205 8 |––– 10 3

Page 52: Apostila de Estatistica Aplicada

7. Medidas de Posição: SeparatrizesDados que produzem histogramas simétricos são adequadamente descritos pela média e pelo desvio-padrão.

Quando os dados são assimétricos, a mediana identifica mais adequadamente o centro de um conjunto de dados. Paraentender bem uma distribuição, precisamos conhecer valores acima ou abaixo dos quais se encontra uma determinadaporcentagem dos dados: as separatrizes.

Separatriz de uma série de n termos colocados em ordem crescente de valor, é o termo da série que a divideem duas partes quaisquer. As principais separatrizes são a mediana, os quartis, os decis e os percentis (ou centis).

Assim como a mediana divide os dados em duas partes iguais, os três quartis, denotados por Q1 , Q2 e Q3,dividem as observações ordenadas em quatro partes iguais. O primeiro quartil separa os 25% inferiores dos 75%superiores dos valores ordenados; o segundo quartil é a mediana e o terceiro quartil separa os 75% inferiores dos 25%superiores dos dados.

Analogamente, há nove decis, denotados por D1 , D2, D3 , ..., D9 que dividem os dados em 10 grupos comcerca de 10% deles em cada grupo. Há finalmente, 99 percentis, que dividem os dados em 100 grupos com cerca de1% em cada grupo.

Exemplo: O nível de albumina no sangue, um indicador do estado nutricional, foi medido em um grupo de 60 pacientes,obtendo-se os resultados (g/dl) apresentados na Tabela 9.1 em forma ordenada. Obtenha o primeiro quartil e o percentilde ordem 80.

Tabela 9.1: Nível de albumina no sangue.4,44 4,47 4,48 4,51 4,54 4,54 4,61 4,64 4,66 4,684,68 4,69 4,71 4,73 4,76 4,76 4,76 4,81 4,86 4,864,87 4,88 4,90 4,90 4,95 4,95 4,96 4,97 4,98 4,984,99 5,00 5,01 5,01 5,01 5,02 5,04 5,05 5,08 5,095,09 5,10 5,11 5,11 5,16 5,17 5,18 5,18 5,19 5,245,24 5,26 5,27 5,27 5,29 5,32 5,35 5,46 5,50 5,85

O primeiro quartil deixa pelo menos 25% dos dados abaixo e pelo menos 75% dos dados acima dele. Como25% de 60 é igual a 15, Q1 tem pelo menos 15 valores abaixo de si e pelo menos 45 acima. Contando-se 15 valores domenor para o maior, teremos o paciente com valor de albumina igual a 4,76 g/dl. Começando do maior para o menor econtando 45 valores, encontramos também 4,76 g/dl. Assim, a dosagem 4,76 g/dl é o valor do primeiro quartil.

Podemos dizer que pelo menos 25% dos pacientes da amostra apresentam nível de albumina inferior ou iguala 4,76 g/dl.

O percentil de ordem 80 deixa pelo menos 80%, ou seja, 48 valores abaixo de si e pelo menos 12 acima.Contando 48 valores a partir, chegamos ao valor de 5,18 g/dl. E contando 12 valores do maior para o menor obtemos5,19 g/dl. Por convenção, usa-se a média destes dois valores, ou seja, o valor 5,185 g/dl.

7.1. Os QuartisHá três quartis:

a) O primeiro quartil (Q1) – valor situado de tal modo na série que uma quarta parte (25%) dos dadosé menor que ele e as três quartas partes restantes (75%) são maiores.

b) O segundo quartil (Q2) – evidentemente, coincide com a mediana (Q2 = Md).c) O terceiro quartil (Q3) – valor situado de tal modo na série que as três quartas partes (75%) dos

dados são menores que ele e uma quarta parte restante (25%) é maior.

Page 53: Apostila de Estatistica Aplicada

Quando os dados são agrupados, para determinar os quartis usamos a mesma técnica do cálculo da

mediana, bastando substituir, na fórmula da mediana, 2

1FP i∑ += por:

( )4

1Fk i∑ +⋅

sendo k o número de ordem do quartil.

Assim, temos:

41FP i

1Q∑ +

= 2

1FPP i2Q

∑ +==

( )4

1F3P i3Q

∑ +⋅=

Logo,

( )i

*1Q

i1 FhFaPLQ ⋅−

+=

( )i

*2Q

i2 FhFaPLMdQ ⋅−

+==

( )i

*3Q

i3 FhFaPLQ ⋅−

+=

sendo,Li = é o limite inferior da classe que contém a separatriz.Fa* = é a freqüência acumulada da classe anterior à classe que contém a separatriz.Fi = é a freqüência simples da classe que contém a separatriz.h = é a amplitude do intervalo da classe que contém a separatriz.

Exemplo:A partir da tabela abaixo, determine o primeiro, o segundo e o terceiro quartis.

Estaturas (cm) Fi Fa150 |–– 154 4 4154 |–– 158 9 13158 |–– 162 11 24162 |–– 166 8 32166 |–– 170 5 37170 |–– 174 3 40

Σ = 40

Primeiro Quartil:

25,104

140P 1Q =+

=

( )9

4425,10154Q1⋅−

+=

Q1 = 156,8 cm

← Q1

← Q3

← Q2

Segundo Quartil (Mediana):

Q1 = 160,7 cm

Terceiro Quartil:

Q1 = 165,4 cm

Page 54: Apostila de Estatistica Aplicada

7.2. Os Decis

O cálculo de um decil segue a mesma técnica do cálculo dos quartis, onde utilizamos:

( )10

1Fk i∑ +⋅

sendo k o número de ordem do decil.

Assim, temos:

101FP i

1D∑ +

= , 5

1FP i2D

∑ += , ... ,

( )10

1F9P i9D

∑ +⋅=

Logo, para o 7º decil, temos:

( )i

*7D

i7 FhFaPLD ⋅−

+=

Exemplo:Considerando a tabela do exemplo anterior, temos, para o 7º decil:

( ) ( ) 7,2810

140710

1F7P i7D =

+⋅=

+⋅= ∑

Logo,

( )8

4247,28162D7⋅−

+= ∴ D7 = 164,4 cm

7.3. Os Percentis

O cálculo de um percentil segue a mesma técnica do cálculo dos quartis, onde utilizamos:

( )100

1Fk i∑ +⋅

sendo k o número de ordem do percentil.

Assim, temos:

1001FP i

1∑ +

= , 50

1FP i2

∑ += , ... ,

( )100

1F99P i99

∑ +⋅=

Page 55: Apostila de Estatistica Aplicada

É evidente que:

P50 = Md, P25 = Q1 e P75 = Q3

Logo, para o 27º percentil, temos:

( )i

*27

i27 FhFaPLP ⋅−

+=

Exemplo:

Considerando a tabela do exemplo anterior, temos, para o 27º percentil:

( ) ( ) 07,11100

14027100

1F27P i27 =

+⋅=

+⋅= ∑

Logo,

( )9

4407,11154P27⋅−

+= ∴ P27 = 157,1 cm

EXERCÍCIOS:

Série Aula:1) Para a distribuição abaixo calcular: D2, P40 e Q3.

Classes 20 |–– 30 30 |–– 40 40 |–– 50 50 |–– 60 60 |–– 70Fi 3 8 18 22 24

Série Casa:1) Determine o valor da medida que deixa 45% dos elementos da distribuição é:

Renda 10 |–– 20 20 |–– 30 30 |–– 40 40 |–– 50 50 |–– 60 60 |–– 70 70 |–– 80 80 |–– 90 90 |–– 100Nº de

famílias 50 100 150 250 150 100 80 70 50

2) Calcular o 5º decil da distribuição:Classes 2 |–– 4 4 |–– 6 6 |–– 8 8 |–– 10 10 |–– 12

Fi 5 7 10 3 5

3) O departamento pessoal de uma certa empresa fez um levantamento dos salários dos 120 funcionários do setoradministrativo, obtendo os resultados (em salários mínimos) da tabela abaixo. Calcule o primeiro quartil e a mediana.

Faixa salarial fi (%)0 |–– 2 25,02 |–– 4 40,04 |–– 6 20,06 |–– 8 15,0

4) Numa companhia A, a média dos salários é R$ 10.000,00 e o 3º quartil é R$ 5.000,00.a) Se você se apresentasse como candidato a funcionário nessa empresa e se o seu salário fosse escolhido ao acasoentre todos os possíveis salários, o que seria mais provável: ganhar mais ou menos que R$ 5.000,00?b) Suponha que na companhia B a média dos salários seja R$ 7.000,00, a variância praticamente zero e o saláriotambém seja escolhido ao acaso. Em qual companhia você se apresentaria para procurar emprego?

Page 56: Apostila de Estatistica Aplicada

8. Medidas de Dispersão ou de VariabilidadeSão medidas estatísticas utilizadas para avaliar o grau de variabilidade, ou dispersão, dos valores em torno da

média. Servem para medir a representatividade da média.

Sejam as séries:a) 20, 20, 20b) 15, 10, 20, 25, 30

Tem-se: 20x a = e 20x b =

Apesar de as séries terem médias iguais, na série “a” não se tem dispersão, enquanto que os valores da série“b” apresentam dispersões em torno da média 20. Assim, a média é muito mais representativa para a série “a” do quepara a série “b”.

Portanto, para qualificar os valores de uma variável, ressaltando a maior ou menor dispersão ou variabilidadeentre esses valores e a sua medida de posição, a Estatística recorre às medidas de dispersão ou de variabilidade.

Dessas medidas, estudaremos a amplitude total, a variância, o desvio padrão e o coeficiente de variação.

8.1. Amplitude TotalA amplitude total é a diferença entre o maior e o menor valor observado.

mínmáx xxAT −=

Exemplo: Para os valores: 40, 45, 48, 52, 54, 62 e 70, temos,

AT = 70 – 40 = 30

Logo: AT = 30

Quando dizemos que a amplitude total dos valores é 30, estamos afirmando alguma coisa do grau de suaconcentração. É evidente que, quanto maior a amplitude total, maior a dispersão dos valores da variável.

A amplitude total tem o incoveniente de só levar em conta os dois valores extremos da série, descuidando doconjunto de valores intermediários, o que quase sempre invalida a idoneidade do resultado. Ela é apenas umaindicação aproximada da dispersão ou variabilidade.

Faz-se uso da amplitude total quando se quer determinar a amplitude da temperatura de um dia ou no ano, nocontrole da qualidade ou como uma medida de cálculo rápido, e quando a compreensão popular é mais importante quea exatidão e a estabilidade.

8.2. Variância / Desvio PadrãoComo vimos, a amplitude total é instável, por se deixar influenciar pelos extremos, que são, na sua maioria,

devidos ao acaso.A variância e o desvio padrão são medidas que fogem a essa falha, pois levam em consideração a totalidade

dos valores da variável em estudo, o que faz delas índices de variabilidade bastante estáveis e, por isso mesmo, osmais geralmente empregados.

A variância baseia-se nos desvios em torno da média aritmética, porém determinando a média aritmética dosquadrados dos devios. Assim, representando a variância por s2, temos:

xi

x

dispersão

Page 57: Apostila de Estatistica Aplicada

( )n

xxs

2i2 ∑ −

=

Sendo a variância calculada a partir dos quadrados dos desvios, ela é um número em unidade quadrada emrelação à variável em questão, o que, sob o ponto de vista prático, é um incoveniente.

Por isso mesmo, imaginou-se uma nova medida que tem utilidade e interpretação práticas, denominada desviopadrão, definida como a raiz quadrada da variância e representada por s.

Assim:

( )n

xxs

2i∑ −

=

Podemos simplificar os cãlculos fazendo uso da igualdade:

( )( )

∑ ∑∑ −=−nx

xxx2

i2i

2i

Assim:

( )n1

nx

xs2

i2i ⋅

⎟⎟⎟

⎜⎜⎜

⎛−= ∑∑

Logo:

2i

2i

nx

nx

s⎟⎟

⎜⎜

⎛−= ∑∑

Para dados agrupado, temos:

2

i

ii

i

2ii

FxF

FxF

s⎟⎟

⎜⎜

⎛−=∑∑

∑∑

O desvio padrão goza de algumas propriedades, dentre as quais destacamos:1ª) Somando-se (ou subtraindo-se) uma constante a (de) todos os valores de uma variável, o desvio padrão não sealtera:

xyii sscxy =⇒±=

2ª) Multiplicando-se (ou dividindo-se) todos os valores de uma variável por uma constante (diferente de zero), o desviopadrão fica multiplicado (ou dividido) por essa constante:

csscxy xyii ×=⇒×=

csscxy xyii ÷=⇒÷=

8.3. Coeficiente de VariaçãoO desvio padrão por si só não diz muita coisa. Assim, um desvio padrão de duas unidades pode ser

considerado pequeno para uma série de valores cujo valor médio é 200; no entando, se a média for 20, o mesmo não

Page 58: Apostila de Estatistica Aplicada

pode ser dito. Além disso, o fato de o desvio padrão ser expresso na mesma unidade dos dados limita o seu empregoquando desejamos comparar duas ou mais séries de valores, relativamente à sua dispersão ou variabilidade, quandoexpressas em unidades diferentes.

Para contornar essas dificuldades e limitações, podemos caracterizar a dispersão ou variabilidade dos dadosem termos relativos a seu valor médio, medida essa denominada coeficiente de variação (CV):

100xsCV ⋅=

Exemplo:Tomemos os resultados das medidas das estaturas e dos pesos de um mesmo grupo de indivíduos:

x sEstaturas 175 cm 5,0 cm

Pesos 68 kg 2,0 kg

Temos:

%85,2100175

5CVE =⋅=

%94,2100682CVP =⋅=

Logo, nesse grupo de indivíduos, os pesos apresentam maior grau de dispersão que as alturas.

EXERCÍCIOS:

Série Aula:1) Calcule os desvios padrões dos conjuntos de dados:a) 1, 3, 5, 9b) 20, 14, 15, 19, 21, 22, 20c) 17,9; 22,5; 13,3; 16,8; 15,4; 14,2d) –10, –6, 2, 3, 7, 9, 10

2) Calcule os desvios padrões das distribuições:a)

xi 2 3 4 5 6 7 8Fi 1 3 5 8 5 4 2

b)Classes 1,5 |–– 1,6 |–– 1,7 |–– 1,8 |–– 1,9 |–– 2,0 |–– 2,1 |–– 2,2

Fi 4 8 12 15 12 8 4

3) Dada a distribuição relativa a 100 lançamentos de 5 moedas simultaneamente:Nº de caras 0 1 2 3 4 5Frequências 4 14 34 29 16 3

calcule o desvio padrão.4) Em um exame final de Matemática, o grau médio de um grupo de 150 alunos foi 7,8 e o desvio padrão, 0,80. EmEstatística, entretanto, o grau médio final foi 7,3 e o desvio padrão, 0,76. Em que disciplina foi maior a dispersão?

Page 59: Apostila de Estatistica Aplicada

Série Casa:1) Medidas as estaturas de 1.017 indivíduos, obtivemos x = 162,2 cm e s = 8,01 cm. O peso médio desses mesmosindivíduos é 52 kg, com um desvio padrão de 2,3 kg. Esses indivíduos apresentam maior variabilidade em estatura ouem peso?

2) Um grupo de 85 moças tem estatura média de 160,6 cm, com um desvio padrão igual a 5,97 cm. Outro grupo de 125moças tem uma estatura média de 161,9 cm, sendo o desvio padrão igual a 6,01 cm. Qual é o coeficiente de variaçãode cada um dos grupos? Qual o grupo mais homogêneo?

3) Numa empresa o salário médio dos funcionários do sexo masculino é de R$ 4.000,00, com um desvio padrão deR$ 1.500,00, e os funcionários do sexo feminino é em média de R$ 3.000,00, com um desvio padrão de R$ 1.200,00.Então, calcule os coeficientes de variações e diga qual o grupo mais homogêneo.

4) O Desvio padrão de um conjunto de dados é 9. A variância é:a) 3 c) 81b) 36 d) 18

5) Na distribuição de valores iguais, o Desvio Padrão é:a) negativo c) zerob) a unidade d) positivo

6) O cálculo da variância supõe o conhecimento da:a) FAC c) medianab) média d) moda

7) A variância do conjunto de dados tabelados abaixo é:

Classes Fi03 |–– 08 508 |–– 13 1513 |–– 18 2018 |–– 23 10

a) 1,36 c) 4,54b) 18,35 d) 20,66

Page 60: Apostila de Estatistica Aplicada

REFERÊNCIAS

- BUSSAB, W. O., MORETTIN, P. A. Estatística Básica. Ed. Saraiva. 5ª edição. 2004.

- CRESPO, A. A. Estatística Fácil. Ed. Saraiva. 16ª edição. 1998.

- DOWNING, D., CLARK, J. Estatística Aplicada. Ed. Saraiva. 2ª edição. 2005.

- FONSECA, J. S., MARTINS, G. A. Curso de Estatística. Ed. Atlas. 6ª edição. 1996.

- LAPPONI, J. C. Estatírtico Usando Excel. Ed. Lapponi. 2000.

- MARTINS, G. A. Estatística Geral e Aplicada. Ed. Atlas. 2ª edição. 2002.

- MARTINS, G. A., DONAIRE, D. Princípios de Estatística. Ed. Atlas. 4ª edição. 1995.

- NAZARETH, H. Curso Básico de Estatística. Ed. Ática. 7ª edição. 1995.

- PEREIRA, W., TANAKA, O. K. Estatística – Conceitos Básicos. Ed. Makron Books.

- SILVA, E. M., GONÇALVES, V., MUROLO, A. C. Estatística para os cursos de: Economia, Administraçãoe Ciências Contábeis. Ed. Atlas. 3ª edição. 1999.

- TOLEDO, G. L., OVALLE, I. I. Estatística Básica. Ed. Atlas. 2ª edição. 1995.

Page 61: Apostila de Estatistica Aplicada
Page 62: Apostila de Estatistica Aplicada

SUMÁRIO

1. INTRODUÇÃO À ESTATÍSTICA...............................................................................................................................3

1.1. ENTENDENDO A IMPORTÂNCIA DA ESTATÍSTICA..................................................................................................................31.2. OBJETO DA ESTATÍSTICA................................................................................................................................................41.2. MÉTODO ESTATÍSTICO...................................................................................................................................................4

1.2.1. O Método Científico.........................................................................................................................................41.2.2. O Método Experimental....................................................................................................................................41.2.3. O Método Estatístico........................................................................................................................................5

1.3. A ESTATÍSTICA.............................................................................................................................................................51.4. FASES DO MÉTODO ESTATÍSTICO.....................................................................................................................................5

1.4.1. Coleta de Dados...............................................................................................................................................51.4.2. Apuração dos Dados........................................................................................................................................61.4.3. Apresentação dos Dados..................................................................................................................................61.4.4. Análise dos Resultados.....................................................................................................................................6

1.5. ABUSOS DA ESTATÍSTICA................................................................................................................................................61.5.1. Más Amostras...................................................................................................................................................61.5.2. Pequenas Amostras...........................................................................................................................................61.5.3. Estimativas por Suposição................................................................................................................................61.5.4. Porcentagens Distorcidas:...............................................................................................................................71.5.5. Perguntas Tendenciosas...................................................................................................................................71.5.6. Pressão do Pesquisador...................................................................................................................................7

2. POPULAÇÃO E AMOSTRA........................................................................................................................................9

2.1. VARIÁVEIS...................................................................................................................................................................92.2. POPULAÇÃO E AMOSTRA................................................................................................................................................9

2.2.1. Amostragem Aleatória Simples......................................................................................................................102.2.2. Amostragem Sistemática.................................................................................................................................102.2.3. Amostragem Estratificada Proporcional........................................................................................................10

3. SÉRIES ESTATÍSTICAS............................................................................................................................................15

3.1. TABELAS....................................................................................................................................................................153.2. SÉRIES ESTATÍSTICAS...................................................................................................................................................15

3.2.1. Séries Históricas, Cronológicas ou Temporais..............................................................................................153.2.2. Séries Geográficas, Especiais, Territoriais ou de Localização.....................................................................153.2.3. Séries Específicas ou Categórica...................................................................................................................163.2.4. Séries Conjugadas – Tabela de Dupla Entrada.............................................................................................16

3.3. DADOS ABSOLUTOS E DADOS RELATIVOS.......................................................................................................................163.3.1. As Porcentagens.............................................................................................................................................173.3.2. Os Índices.......................................................................................................................................................183.3.3. Os Coeficientes...............................................................................................................................................183.3.4. As Taxas..........................................................................................................................................................19

4. DISTRIBUIÇÃO DE FREQUÊNCIA........................................................................................................................23

4.1. TABELA PRIMITIVA / ROL.............................................................................................................................................234.2. DISTRIBUIÇÃO DE FREQÜÊNCIA......................................................................................................................................234.3. ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQÜÊNCIA.........................................................................................................24

4.3.1. Classe..............................................................................................................................................................244.3.2. Limites de Classe............................................................................................................................................244.3.3. Amplitude de um Intervalo de Classe.............................................................................................................244.3.4. Amplitude Total da Distribuição....................................................................................................................244.3.5. Ponto Médio de uma Classe...........................................................................................................................24

4.4. DETERMINAÇÃO DO NÚMERO DE CLASSES.......................................................................................................................244.5. TIPOS DE FREQÜÊNCIAS................................................................................................................................................254.6. DISTRIBUIÇÃO DE FREQÜÊNCIA SEM INTERVALOS DE CLASSE.............................................................................................25

Page 63: Apostila de Estatistica Aplicada

5. GRÁFICOS ESTATÍSTICOS.....................................................................................................................................30

5.1. REPRESENTAÇÃO GRÁFICA............................................................................................................................................305.1.1. Gráfico de Linha.............................................................................................................................................305.1.2. Gráfico de Colunas ou de Barras...................................................................................................................305.1.3. Gráfico de Colunas ou de Barras Múltiplas..................................................................................................325.1.4. Gráfico de Setores..........................................................................................................................................32

5.2. REPRESENTAÇÃO GRÁFICA DE DISTRIBUIÇÃO DE FREQUÊNCIA............................................................................................335.2.1. Histograma.....................................................................................................................................................335.2.2. Polígono de Frequência.................................................................................................................................335.2.3. Ogiva..............................................................................................................................................................34

6. MEDIDAS DE POSIÇÃO: MEDIDAS DE TENDÊNCIA CENTRAL..................................................................40

6.1. MÉDIA ARITMÉTICA ().................................................................................................................................................406.1.1. Dados não-agupados......................................................................................................................................406.1.2. Desvio em relação à média............................................................................................................................406.1.3. Propriedades da média...................................................................................................................................416.1.4. Dados agrupados............................................................................................................................................41

6.1.4.1. Sem intervalos de classe..........................................................................................................................................416.1.4.2. Com intervalos de classe..........................................................................................................................................42

6.1.5. Emprego da média..........................................................................................................................................436.2. MEDIANA (MD)..........................................................................................................................................................44

6.2.1. Dados não-agrupados....................................................................................................................................446.2.2. Dados agrupados............................................................................................................................................45

6.2.2.1. Sem intervalos de classe..........................................................................................................................................456.2.2.2. Com intervalos de classe..........................................................................................................................................45

6.2.3. Emprego da Mediana.....................................................................................................................................466.3. MODA (MO)..............................................................................................................................................................47

6.3.1. Dados não-agrupados....................................................................................................................................476.3.2. Dados agrupados............................................................................................................................................47

6.3.2.1. Sem intervalos de classe..........................................................................................................................................476.3.2.2. Com intervalos de classe..........................................................................................................................................48

6.4. UTILIZAÇÃO DAS MEDIDAS DE TENDÊNCIA CENTRAL.......................................................................................................49

7. MEDIDAS DE POSIÇÃO: SEPARATRIZES...........................................................................................................54

7.1. OS QUARTIS...............................................................................................................................................................547.2. OS DECIS..................................................................................................................................................................567.3. OS PERCENTIS............................................................................................................................................................56

8. MEDIDAS DE DISPERSÃO OU DE VARIABILIDADE.......................................................................................58

8.1. AMPLITUDE TOTAL......................................................................................................................................................588.2. VARIÂNCIA / DESVIO PADRÃO......................................................................................................................................588.3. COEFICIENTE DE VARIAÇÃO..........................................................................................................................................59

REFERÊNCIAS................................................................................................................................................................62

Page 64: Apostila de Estatistica Aplicada

ESTATÍSTICA APLICADAESTATÍSTICA APLICADA

Tecnologia em Petróleo e Gás Natural

Prof. Carlos Alexandre Santório

Serra (ES), 2007/2


Top Related