livroestatística.pdf

230
Estatística Aplicada à Educação Matemática Inder Jeet Taneja Fernando Guerra 2ª Edição Florianópolis, 2010

Upload: maria-fernanda-sartor

Post on 29-Dec-2015

223 views

Category:

Documents


4 download

TRANSCRIPT

Page 1: LivroEstatística.pdf

Estatística Aplicada à Educação MatemáticaInder Jeet TanejaFernando Guerra

2ª Edição

Florianópolis, 2010

Page 2: LivroEstatística.pdf
Page 3: LivroEstatística.pdf

Governo FederalPresidente da República: Luiz Inácio Lula da Silva

Ministro de Educação: Fernando Haddad

Secretário de Ensino a Distância: Carlos Eduardo Bielschowky

Coordenador Nacional da Universidade Aberta do Brasil: Celso Costa

Universidade Federal de Santa CatarinaReitor: Alvaro Toubes Prata

Vice-Reitor: Carlos Alberto Justo da Silva

Secretário de Educação a Distância: Cícero Barbosa

Pró-Reitora de Ensino de Graduação: Yara Maria Rauh Müller

Pró-Reitora de Pesquisa e Extensão: Débora Peres Menezes

Pró-Reitor de Pós-Graduação: Maria Lúcia de Barros Camargo

Pró-Reitor de Desenvolvimento Humano e Social: Luiz Henrique Vieira Silva

Pró-Reitor de Infra-Estrutura: João Batista Furtuoso

Pró-Reitor de Assuntos Estudantis: Cláudio José Amante

Centro de Ciências da Educação: Wilson Schmidt

Centro de Ciências Físicas e Matemáticas: Tarciso Antônio Grandi

Centro de Filosofia e Ciências Humanas: Roselane Neckel

Curso de Licenciatura em Matemática naModalidade à DistânciaCoordenação de Curso: Neri Terezinha Both Carvalho

Coordenação de Tutoria: Jane Crippa

Coordenação Pedagógica/CED: Roseli Zen Cerny

Coordenação de Ambientes Virtuais/CFM: Nereu Estanislau Burin

Comissão EditorialAntônio Carlos Gardel Leitão

Albertina Zatelli

Elisa Zunko Toma

Igor Mozolevski

Luiz Augusto Saeger

Roberto Corrêa da Silva

Ruy Coimbra Charão

Page 4: LivroEstatística.pdf

Laboratório de Novas Tecnologias - LANTEC/CEDCoordenação PedagógicaCoordenação Geral: Andrea Lapa, Roseli Zen Cerny

Núcleo de Formação: Nilza Godoy Gomes

Núcleo de Pesquisa e Avaliação: Claudia Regina Flores

Núcleo de Criação e Desenvolvimento de MateriaisDesign GráficoCoordenação: Laura Martins Rodrigues, Thiago Rocha Oliveira

Projeto Gráfico Original: Diogo Henrique Ropelato, Marta Cristina Goulart

Braga, Natal Anacleto Chicca Junior.

Redesenho do Projeto Gráfico: Laura Martins Rodrigues,

Thiago Rocha Oliveira

Diagramação: Natália de Gouvêa Silva

Ilustrações: Cristina da Silva, Rafael Schmidt Alves,

Natália de Gouvêa Silva, Kallani Maciel Bonelli

Capa: Ângelo Bortolini Silveira

Design InstrucionalCoordenação: Juliana Machado

Design Instrucional: Janice Pereira Lopes

Revisão do Design Instrucional: Marcia Maria Bernal

Revisão Gramatical: Jane Maria Viana Cardoso

Copyright © 2010, Universidade Federal de Santa Catarina/CFM/CED/UFSC

Nenhuma parte deste material poderá ser reproduzida, transmitida e gravada, por qualquer

meio eletrônico, por fotocópia e outros, sem a prévia autorização, por escrito, da Coordena-

ção Acadêmica do Curso de Licenciatura em Matemática na Modalidade à Distância.

Ficha Catalográfica T164e Taneja, Inder Jeet Estatística Aplicada à Educação Matemática / Inder Jeet Taneja, Fernando Guerra. – 2. ed. – Florianópolis : UFSC/EAD/CED/CFM, 2010. 230 p. ISBN 978-85-99379-72-1 1. Estastística. 2. Educação. I. Guerra, Fernando. II Título. CDU 519.2

Elaborada pela Bibliotecária Eleonora M. F. Vieira – CRB – 14/786

Page 5: LivroEstatística.pdf

Sumário

Apresentação ............................................................................. 9

1 Noções Básicas da Estatística ............................................ 111.1 Origem da Estatística ................................................................. 131.2 Conceitos ..................................................................................... 151.3 População ou Universo .............................................................. 161.4 Amostra ....................................................................................... 161.5 A Estatística na Metodologia Científica .................................. 161.6 Tipos de Pesquisas ..................................................................... 171.7 Dados Estatísticos ....................................................................... 181.8 Análise Crítica dos Dados ......................................................... 191.9 Análise Exploratória de Dados ................................................. 191.10 Classificação dos Dados ........................................................... 201.11 Tipos de Variáveis ..................................................................... 201.12 Mensuração de uma Variável ................................................. 221.13 Instrumento de Coleta de Dados ............................................ 231.14 Plano de Amostragem .............................................................. 281.15 Amostra Aleatória Simples ..................................................... 28Exercícios Propostos ........................................................................ 31Resumo .............................................................................................. 33Bibliografia Comentada ................................................................... 33

2 Organização de Dados, Gráficos e Distribuição de Freqüência ............................................... 35

2.1 Variáveis ...................................................................................... 372.2 Coleta dos Dados........................................................................ 382.3 Gráficos ........................................................................................ 41

2.3.1 Tipos de Gráficos ................................................................ 422.4 Distribuição de Freqüências ..................................................... 462.5 Histograma de Freqüências ...................................................... 56Exercícios Propostos ........................................................................ 60Resumo .............................................................................................. 64Bibliografia Comentada ................................................................... 64

3 Medidas de Tendência Central ......................................... 653.1 Introdução ................................................................................... 673.2 Média Aritmética ....................................................................... 68

3.2.1 Média Aritmética Simples ................................................ 68

Page 6: LivroEstatística.pdf

3.2.2 Média Aritmética Ponderada ........................................... 693.2.3 Média Aritmética para Dados Agrupados em classe (ponderada) ....................................................... 72

3.3 Outras Médias ............................................................................ 763.3.1 Média geométrica .............................................................. 763.3.2 Média Harmônica .............................................................. 773.3.3 Média Quadrática .............................................................. 783.3.4 Desigualdade entre Quatro Médias ................................ 79

3.4 Mediana ...................................................................................... 803.4.1 Mediana para Dados Isolados .......................................... 803.4.2 Mediana para Dados Agrupados .................................... 82

3.5 Moda ............................................................................................ 873.5.1 Caso de Dados Isolados e/ou Não Agrupados em Classe ............................................... 883.5.2 Cálculo da Moda para Dados Agrupados em Classes ......................................... 90

Exercícios Propostos ........................................................................ 92Resumo .............................................................................................. 97

4 Medidas de Dispersão e Utilização das Planilhas ........ 994.1 Introdução ..................................................................................1014.2 Amplitude ................................................................................. 1034.3 Desvio Médio ............................................................................ 104

4.3.1 Desvio Médio Absoluto – Dados Isolados .................... 1054.3.2 Dados Isolados Ponderados e Agrupados em Classe ......................................................107

4.4 Variância ....................................................................................1104.5 Desvio Padrão ...........................................................................1124.6 Coeficiente de Variação ............................................................113Exercícios Propostos .......................................................................1174.7 A Estatística no Excel ............................................................... 120

4.7.1 Conhecendo o Excel ......................................................... 120Resumo ............................................................................................ 130Bibliografias Comentadas ............................................................. 130

Cálculo de Probabilidade .................................................... 1315.1 Introdução ................................................................................. 1335.2 Experimentos Aleatórios ......................................................... 1345.3 Espaço amostral e Noção de Probabilidade ......................... 1345.4 Variáveis Aleatórias ................................................................. 1385.5 Esperança Matemática ou Valor Esperado ............................142

Page 7: LivroEstatística.pdf

5.5.1 Variância e Desvio Padrão .............................................. 1445.6 Distribuições Discretas .............................................................145

5.6.1 Distribuição de Bernoulli .................................................1455.6.2 Distribuição Binomial ......................................................147

5.7 Distribuições Contínuas ...........................................................1525.7.1 Distribuição Normal ........................................................ 153

5.8 Distribuição Normal como Aproximação da Distribuição Binomial ....................................................... 163Exercícios Propostos .......................................................................168Resumo .............................................................................................170Apêndice ......................................................................................... 171

6 Amostragem ....................................................................... 1736.1 Introdução ................................................................................. 175

6.1.1 Tipos de amostragem ........................................................1766.1.2 Principais fases de um levantamento estatístico ......... 179

6.2 Amostragem Causal Simples.................................................. 1806.3 Distribuições Amostrais ..........................................................182

6.3.1 Distribuição Amostral da Média: Com e Sem Reposição ..................................................... 183

6.4 Distribuição Amostral das Proporções ................................. 195Exercícios Propostos ...................................................................... 199Resumo ............................................................................................ 201

7 Estimação ............................................................................ 2037.1 Introdução .................................................................................. 2057.2 Estimativas Pontuais e Intervalares ....................................... 2057.3 Intervalo de confiança .............................................................. 2067.4 Estimação de Média de uma População ................................ 207

7.4.1 Desvio Padrão Populacional Conhecido ....................... 2097.4.2 Erro de Estimação e Tamanho da Amostra ...................215

7.5 Desvio Padrão Populacional Desconhecido ..........................2167.5.1 Distribuição t de Student ..................................................2167.5.2 Amostragem de Pequenas Populações: Fator de Correção Finita ...........................................................................219

7.6 Estimativa por Intervalo de Confiança para Proporções .... 222Exercícios Propostos ...................................................................... 225Resumo ............................................................................................ 227

Referências ............................................................................ 229

Page 8: LivroEstatística.pdf
Page 9: LivroEstatística.pdf

ApresentaçãoEste livro é destinado a quem estuda estatística pela primeira vez. O objetivo dos autores foi dar as idéias principais da Estatística, e uma certa habilitação para a parte algébrica. Através de uma linguagem simples e clara, muitas vezes coloquial são apresentados conceitos com alguns exercícios resolvidos. Dentre os exercícios apresentados, encontram-se aqueles que se destinam a auxiliar a compreensão do conteúdo exposto, e aqueles que objetivam conferir ao leitor certa familiaridade com a disciplina de Estatística.

No capítulo 1, abordaremos as noções básicas de Estatística, bem como sua origem, conceitos de Estatística, de população e de amos-tra. Mostraremos a Estatística na Metodologia Científica, os tipos de pesquisas, a coleta de dados estatísticos, a análise exploratória de dados, os tipos de variáveis e sua mensuração, a coleta de dados, o plano de amostragem e a amostra aleatória simples.

No capítulo 2, faremos uma rápida organização de dados, através de coleta e apuração, os quais serão apresentados em tabelas, em qua-dros, em gráficos (por exemplo, o gráfico de linha) e em diagramas de pontos. Estudaremos a distribuição de freqüência (ou tabela de freqüência) e construiremos uma tabela de freqüência com interva-los de classe. Estudaremos também a freqüência simples, a relativa, a acumulada e a acumulada relativa. Abordaremos a construção do gráfico do histograma de freqüência e do polígono de freqüência.

Já no capítulo 3, estudaremos várias medidas de posição ou de ten-dência central e suas utilidades no ensino fundamental. Dentre elas, destacaremos a média aritmética, a mediana e a moda. Estudare-mos também outras médias, tais como a média geométrica, a média harmônica e a média quadrática.

Apresentaremos, no capítulo 4, as medidas de dispersão ou variabi-lidade, ou seja, o desvio médio, o desvio padrão, a variância e o co-eficiente de variação que têm sua importância na Estatística. Abor-daremos ainda a utilização da Estatística no Excel para o cálculo de algumas freqüências (absoluta e relativa acumulada).

Page 10: LivroEstatística.pdf

Iniciaremos o capítulo 5 dando os conceitos de experimentos ale-atórios, espaço amostral, noção de probabilidade e de evento. De-finiremos variáveis aleatórias discretas e contínuas, esperança matemática ou valor esperado, variância e desvio padrão de uma variável aleatória discreta. Abordaremos as principais distribuições de probabilidade discreta: a distribuição de Bernoulli e a Binomial e também a principal distribuição de probabilidade contínua, que é a distribuição normal ou de Gauss Abordaremos a distribuição normal como aproximação da distribuição Binomial.

O capítulo 6 tratará dos tipos de amostragem e da distribuição amostral da média com e sem reposição. Estudaremos o Teorema do Limite Central e a distribuição amostral das proporções com e sem reposição.

Finalmente, no capítulo 7, estudaremos a Estimação de Parâmetros: pontual e intervalar e intervalo de confiança. Abordaremos a esti-mação da média de uma população e o desvio padrão populacional, erro de estimação e o tamanho da amostra. Apresentaremos a dis-tribuição t de Student, a amostragem de pequenas populações: Fator de Correção Finita (FCF) e a estimativa por intervalo de confiança para proporções.

Inder Jeet TanejaFernando Guerra

Page 11: LivroEstatística.pdf

Capítulo 1Noções Básicas da Estatística

Page 12: LivroEstatística.pdf
Page 13: LivroEstatística.pdf

13

Capítulo 1Noções Básicas da Estatística

Neste capítulo, o nosso objetivo será o de apresentar a ori-gem e alguns conceitos de Estatística, tais como popula-ção e amostra, além de mostrar os tipos de pesquisas, os tipos de variáveis, a análise exploratória de dados, como mensurar uma variável, a coleta de dados estatísticos e a amostra aleatória simples.

1.1 Origem da EstatísticaDesde a Antigüidade, vários povos já registravam o número de ha-bitantes, de nascimentos, de óbitos, faziam estimativas das riquezas individual e social, distribuíam eqüitativamente terras ao povo, co-bravam impostos e até realizavam inquéritos quantitativos por pro-cessos que hoje chamaríamos de “estatísticas”.

Na Idade Média, colhiam-se informações com finalidades tributá-rias e bélicas.

A partir do século XVI surgem as primeiras análises sistemáticas de fatos sociais, tais como batizados, casamentos, funerais, originando as primeiras tábuas e tabelas.

No século XVIII, o estudo de tais fatos vai ganhando feição ver-dadeiramente científica. Godofredo Achenwall denomina a nova ciência de Estatística, determinando seu objetivo e suas relações com as ciências.

No Brasil, a Estatística surgiu na segunda metade do século XIX com um Decreto Imperial, em 14 de janeiro de 1871 quando foi cria-da a primeira Diretoria Geral de Estatística (DGE).

Em 1930, houve uma reforma que fundiu a DGE com a Diretoria de Estatística Comercial e, com o advento da República, esta passou a

A palavra estatística surge da expressão em Latim statisticum collegium,

palestra sobre os assuntos do Estado, de onde surgiu a

palavra em língua italiana statista, que significa

“homem de estado”, ou político, e a palavra alemã

Statistik, designando a análise de dados sobre o

Estado. A palavra adquiriu um significado de coleta e classificação de dados, no

início do século 19. Fonte: http://pt.wikipedia.org/

wiki/Estatistica

Page 14: LivroEstatística.pdf

14

se chamar Departamento Nacional de Estatística, cujos setores de atividades foram se desenvolvendo até 1934.

Pelo Decreto de 6 de julho de 1934, foi criado o Instituto Nacional de Estatística, órgão que veio centralizar todas as atividades estatísticas do país e responsável pela publicação do Anuário Estatístico do Brasil.

Para unificar os serviços de estatística oficial, o Instituto Brasileiro de Geografia e Estatística (IBGE) foi criado pelo Decreto Lei de 16 de ja-neiro de 1938. O IBGE é uma entidade de natureza federativa, subor-dinada diretamente à Presidência da República, e tem por objetivo promover, fazer executar ou orientar tecnicamente o regime naciona-lizado, o levantamento sistemático de todas as estatísticas brasileiras e a coordenação metódica das atividades geográficas do país.

Como disciplina científica, só no século passado foi que a Estatística se estruturou, mas já era conhecida desde a antiguidade. Há mais de quatro mil anos, os chineses utilizavam quadros de estatística agrícola. Na Bíblia, há referências de censo dos Hebreus; no Egito, devido às inundações do Nilo, efetuavam anualmente trabalhos ca-dastrais para a repartição de terras férteis; na Grécia, realizaram-se censos demográficos muitos séculos antes de Cristo; em Roma, os censos eram levados a efeito principalmente com o objetivo de fazer aplicar o regime de imposto.

Na época moderna, as informações estatísticas mais importantes figuram nos registros de estado civil, mantidos inicialmente pela Igreja e depois pelo Poder Civil. É o estudo dos jogos de azar, desen-volvido ao ponto de formar um ramo distinto das matemáticas - o cálculo das probabilidades - que vem dar à Ciência Estatística sua justificação teórica e seus métodos de pesquisa.

A palavra estatística formou-se da mesma raiz da palavra Estado (organização política), talvez porque, originalmente, as estatísticas eram colhidas para as finalidades relacionadas com o Estado, com objetivos militares ou mesmo tributários, e para a computação de nascimentos e de casamentos.

A palavra estatística, quando usada no plural, refere-se a dados numé-ricos, mesmo aqueles obtidos por simples contagem (dados estatís-ticos).

Page 15: LivroEstatística.pdf

15

Quando usada no singular, estatística significa o conjunto de méto-dos que se destinam a possibilitar a tomada de decisões acertadas face às incertezas.

1.2 ConceitosExiste mais de uma centena de conceitos ou definições propostos por autores, objetivando estabelecer com clareza a filosofia, os limi-tes e o campo de atuação da Estatística. Alguns são:

A estatística é a disciplina científica que trata da • coleta, des-crição (organização, sumarização e apresentação) e análise de dados, bem como na obtenção de conclusões válidas e na to-mada de decisões acertadas, face a insuficiência das informa-ções disponíveis.

A Estatística é um conjunto de processos ou técnicas empre-•gadas na investigação e análise de fenômenos coletivos ou de massa.

A Estatística é a matemática aplicada aos dados de observação.•

De acordo com os Parâmetros Curriculares Nacionais (PCN) elaborados e publicados pela SEF/MEC, as atividades pro-postas para o ensino da estatística e de probabilidade da 1a à 8a série do ensino fundamental (7 a 14 anos) estão recomen-dados no bloco de conteúdo “Tratamentos da Informação” do currículo de Matemática. Nesse bloco, além da probabili-dade e da estatística, inclui-se a combinatória.

Os Parâmetros Curriculares Nacionais (PCN) recomendam o trabalho com Estatística com a finalidade de que o estudante construa pro-cedimentos para coletar, organizar, comunicar e interpretar dados, utilizando tabelas, gráficos e representações, e que seja capaz de descrever e interpretar sua realidade, usando conhecimentos mate-máticos.

Page 16: LivroEstatística.pdf

16

1.3 População ou UniversoO termo população ou universo se refere a todas as observações (to-dos os indivíduos ou a todos os objetos) que sejam relevantes a um determinado problema.

Uma população pode ser finita ou infinita (em princípio, não se pode, na realidade, enumerar todas as observações, como por exemplo, os astros existentes no Universo).

1.4 Amostra É um conjunto de observações (aleatórias, sem preferência) e re-presentativas tomadas de uma População. Uma amostra deve ser probabilística, isto é, cada elemento da população deve ter a mesma oportunidade ser escolhido. É, portanto, um subconjunto finito de uma população. Eis alguns exemplos:

População: a) Os trinta sabores de sorvete da Confeitaria “Bem Gelado”.

Amostra: Cinco sabores testados para saber se a Confeitaria “Bem Gelado” vende sorvetes de boa qualidade.

População: b) Todos os eleitores do Estado de Santa Catarina.

Amostra: Três mil eleitores entrevistados em uma pesquisa do IBOPE.

1.5 A Estatística na Metodologia Científica

A Estatística pode estar presente nas diversas etapas de uma pesquisa desde o seu planejamento até a interpretação de seus resultados, po-dendo, com isso, influenciar na condução do processo da pesquisa.

A coleta de dados é uma fase da pesquisa que precisa ser cuidado-samente planejada, para que os dados a serem levantados forneçam informações relevantes para os objetivos da pesquisa.

Metodologia científica refere-se à forma como funciona o conhecimento científico. Tem sua origem no pensamento de Descartes, que foi posteriormente desenvolvido empiricamente pelo físico inglês Isaac Newton. Descartes propôs chegar à verdade através da dúvida sistemática e da decomposição do problema em pequenas partes, características que definiram a base da pesquisa científica. Fonte: http://pt.wikipedia.org/wiki/Metodologia_cientifica

Page 17: LivroEstatística.pdf

17

Em uma pesquisa científica, precisamos coletar dados que nos forne-çam informações capazes de responder aos nossos questionamentos.

As principais etapas de planejamento da pesquisa estatística são:

a definição do problema a ser pesquisado;•

os objetivos da pesquisa (geral e específico) devem ser elabora-•dos de forma bem clara;

a execução da pesquisa;•

o levantamento de dados necessários;•

a análise dos dados;•

os resultados alcançados;•

a conclusão.•

Apesar de a aplicação de técnicas estatísticas ser feita basicamente na etapa de análise dos dados, a metodologia estatística deve ser aplicada nas diversas etapas da pesquisa, havendo uma iteração com a metodologia da área em estudo.

1.6 Tipos de PesquisasDepois dos objetivos traçados, precisamos decidir sobre o delinea-mento da pesquisa. Para isto temos dois tipos de pesquisas que são:

Pesquisa de Levantamento1)

Neste tipo de pesquisa, levantamos diversas características dos elementos da população, utilizando questionários ou entrevis-tas. A observação é feita naturalmente sem a interferência do pesquisador.

Pesquisa Experimental2)

Este tipo de pesquisa é usado para resolver problemas bem específicos, geralmente formulados sob a forma de hipóteses de causa e efeito. Por exemplo, a metodologia que certo aluno utiliza para estudar uma disciplina do seu curso e sua repro-vação nesta mesma disciplina é influenciada por isto.

Page 18: LivroEstatística.pdf

18

Um passo importante no delineamento da pesquisa consiste na decisão de quem se vai pesquisar. E para isto, temos a po-pulação alvo, que são os elementos para os quais desejamos que as conclusões da pesquisa sejam válidas. Definidos os ob-jetivos e a população a ser estudada, precisamos pensar em como deverá ser a coleta de dados.

1.7 Dados EstatísticosApós cuidadoso planejamento e devida determinação das caracte-rísticas do fenômeno que se quer pesquisar, damos início à coleta dos dados numéricos necessários à sua descrição.

A coleta pode ser direta e indireta.

A coleta • direta é feita sobre elementos informativos de registro obrigatório, como nascimentos, casamentos e óbitos, elemen-tos pertinentes aos prontuários dos alunos de uma escola, ou ainda quando coletados pelo próprio pesquisador através de inquéritos e questionários, como é o caso das notas de verifica-ção e de exames.

A coleta direta de dados pode ser classificada relativamente ao fator tempo em:

contínua (registro) –a) quando é feita continuamente, tal como a de nascimentos e óbitos, a freqüência dos alunos às aulas;

periódica –b) quando é feita em intervalos constantes de tem-po, como os censos (de 10 em 10 anos), as avaliações mensais dos alunos;

ocasional -c) quando é feita extemporaneamente, a fim de atender uma conjuntura ou uma emergência, como no caso de epidemias que assolam ou dizimam rebanhos inteiros.

A coleta se diz• indireta quando é inferida de elementos conhe-cidos (coleta direta) e/ou do conhecimento de outros fenôme-nos relacionados com o fenômeno estudado. Como exemplo, podemos citar a pesquisa sobre a mortalidade infantil, que é feita através de dados colhidos por uma coleta direta.

Page 19: LivroEstatística.pdf

19

1.8 Análise Crítica dos DadosObtidos os dados, eles devem ser cuidadosamente analisados, à pro-cura de possíveis falhas, imperfeições e erros, a fim de não incor-rermos em erros grosseiros ou de certo vulto, que possam influir sensivelmente nos resultados.

A crítica é externa quando visa às causas dos erros por parte do informante, por distração ou má interpretação das perguntas que lhe foram feitas; é interna quando visa a observar os elementos ori-ginais dos dados da coleta.

1.9 Análise Exploratória de DadosCom os dados adequadamente resumidos e apresentados em tabe-las e gráficos, podemos observar certos aspectos relevantes e come-çar a delinear hipóteses a respeito da estrutura do fenômeno objeto de estudo. Isto se chama Análise Exploratória de Dados (técnicas para extrair informações de conjuntos de dados).

Os dados são a matérias prima da Estatística. Cada observação in-dividual ou item é denominado como unidade elementar ou simples-mente unidade. Cada unidade elementar pode estar composta por um ou mais itens medidos, propriedades, atributos etc, denomina-dos como variáveis.

Variável é uma característica, propriedade ou atributo de uma uni-dade da população, cujo valor pode variar entre as unidades dessa população.

São exemplos de unidades elementares:

As pessoas, quando descrevemos todos ou parte de seus atri-•butos, por exemplo: nome, idade, CPF, endereço etc.

As empresas, quando descrevemos todos ou parte de seus atri-•butos, por exemplo: razão social, CNPJ, número de funcioná-rios, capital social etc.

Page 20: LivroEstatística.pdf

20

As cidades, por exemplo: número de habitantes, número de •alunos matriculados no Ensino Fundamental, número de par-tidos políticos, área etc.

1.10 Classificação dos DadosOs dados são classificados quanto à sua origem, e temos:

Dados de Levantamento –• São obtidos através da simples observação de como um fenômeno acontece, provenientes de uma situação onde não existe nenhum controle sobre os fa-tores que influenciam os dados. É o que chamamos também de dados secundários, por exemplo: o levantamento dos dados pessoais de professores e funcionários da Escola Estadual XX, da cidade YY, no Estado de Santa Catarina.

Dados de Experimento – • Têm a finalidade de observar as rela-ções de causa e efeito que existem entre fenômenos provenien-tes de uma situação onde existe realmente controle sobre os fatores que influenciam os dados. É o que chamamos também de dados primários, por exemplo: o interesse de um aluno em participar em programas de capacitação; o nível de satisfação do aluno em relação a seu curso.

1.11 Tipos de VariáveisAlgumas variáveis, por exemplo, sexo, escolaridade etc. apresentam como possíveis realizações uma qualidade (ou atributo) dos elemen-tos pesquisados, ao passo que outras como peso e idade apresentam como possíveis realizações números resultantes de uma contagem ou mensuração. As variáveis do primeiro tipo são chamadas quali-tativas e as do segundo tipo são chamadas quantitativas.

Um pesquisador deve aprender a identificar quatro tipos de variá-veis:

Variáveis Quantitativas• se referem a quantidade, isto é, são medidas numa escala numérica. Estas variáveis podem ser de dois tipos:

Page 21: LivroEstatística.pdf

21

Variáveis Discretas, i) que se referem às variáveis que podem assumir valores inteiros, podendo pertencer a uma conta-gem 0, 1, 2, 3 ... Por exemplo: o número de alunos matricu-lados na turma A da disciplina de Estatística, o número de peças com defeito num lote de produção, etc.

Variáveis Contínuas ii) são variáveis não discretas, isto é, são variáveis que podem assumir qualquer valor do conjunto dos números reais. Por exemplo: o valor das notas do aluno XX no semestre YY da UFSC, o valor das vendas diárias de uma empresa, o consumo mensal de energia elétrica da Escola Estadual Dona Chiquinha, etc.

Variáveis Qualitativas • não são numéricas, pois somente po-dem ser classificadas:

Variáveis Nominais i) são variáveis onde não existe nenhum ordenamento ou hierarquia. Por exemplo: o estado onde nas-ceram os alunos matriculados na UFSC; a cidade onde nas-ceram os servidores técnicos administrativos da UFSC, etc.

Variáveis Ordinárias ii) são variáveis onde existe um ordena-mento ou uma hierarquia. Por exemplo: hierarquia numa empresa: presidente, diretor, gerente etc.; resposta a um questionário de pesquisa onde existe uma escala: bom, re-gular e ruim; as posições das 10 melhores instituições de ensino superior: primeira, segunda etc.

Para melhor entendermos os tipos de variáveis, vejamos um exemplo.

Exemplo 1.1. No quadro abaixo, um pesquisador registrou parte do cadastro de funcionário da Escola Estadual Resplendor. Pede-se: identificar as unidades elementares e as variáveis desse cadastro.

Nome Idade Cargo Sexo Peso Escolaridade

João Paulo 36 Supervisor Escolar M 68 kg Ens. Fundamental

Ana Cristina 29 Secretária F 71 kg Ens. Médio

Alex Pereira 39 Chefe de expediente M 65 kg Ens. Fundamental

Paulo José 26 Analista de Sistema M 74 kg Ens. Superior

Quadro 1.1

Page 22: LivroEstatística.pdf

22

Resposta. Como os dados coletados se referem aos funcionários da Es-cola Estadual Resplendor, as unidades elementares são os referidos fun-cionários da Escola; isto é, cada funcionário registrado no quadro acima é uma unidade elementar. As variáveis são as propriedades ou atributos dos funcionários que variam entre si, por exemplo: idade, cargo, etc.

De um modo geral, para cada elemento investigado, tem-se asso-ciado um resultado (ou mais de um resultado) correspondente à re-alização de certa variável (ou variáveis). No exemplo em questão, considerando-se a variável sexo, para cada funcionário temos asso-ciada a realização masculino(M) ou feminino(F). Observamos que o pesquisador colheu informações sobre seis variáveis: nome, idade, cargo, sexo, peso e escolaridade.

Quanto aos tipos de variáveis, temos:

Nome: • variável qualitativa ordinal;

Idade: • variável quantitativa contínua;

Cargo: • variável qualitativa ordinal;

Sexo:• variável qualitativa nominal;

Peso:• variável quantitativa continua;

Escolaridade:• variável qualitativa ordinal.

Na descrição das variáveis envolvidas numa pesquisa, devemos in-cluir a escala (ou unidade) em que serão mensuradas.

1.12 Mensuração de uma VariávelMuitas características podem ser mensuradas de várias formas, e nem sempre fica evidente qual delas é a mais apropriada. Por exem-plo, vamos procurar levantar o nível de satisfação de um servidor técnico-administrativo com a política de trabalho na UFSC fazendo a ele duas perguntas:

Primeira•

Em termos de trabalho que você exerce no seu serviço, você se sente:( ) muito satisfeito ( ) pouco satisfeito ( ) insatisfeito

Page 23: LivroEstatística.pdf

23

Segunda•

Dê uma nota de 0 (zero) a 10 (dez), relativa ao seu grau de satisfação com o trabalho que você exerce no seu serviço.

Nota: _________.

A primeira pergunta está associada a uma variável qualitativa, pois o servidor técnico-administrativo deve atribuir uma resposta den-tre as três qualidades apresentadas, e como existe uma ordenação do nível de satisfação nas três opções, temos uma variável qualita-tiva ordinal.

Na segunda pergunta, tenta-se mensurar a característica satisfação quantitativamente, onde o servidor técnico-administrativo vai atri-buir um valor, que ele julga ser sua satisfação, na escala de 0 a 10.

A decisão de como medir determinada característica depende de vários aspectos, mas é sempre recomendável verificar se a mensura-ção proposta leva aos objetivos da pesquisa.

Em muitas situações, não precisamos ir até os elementos da popu-lação para obter os dados, pois para isto podemos utilizar a cole-ta direta ou a coleta indireta. Quando os dados forem levantados diretamente dos elementos da população sua coleta deve ser feita de forma organizada, e pra isto construímos um instrumento que chamamos de questionário.

1.13 Instrumento de Coleta de DadosCom os objetivos da pesquisa e a população a ser estudada defini-dos, apresentamos, a seguir, alguns procedimentos para a constru-ção de um questionário.

Separar as características a serem levantadas.1)

Por exemplo, o objetivo geral da pesquisa é conhecer melhor a relação de um aluno da UFSC com o curso em que está ma-triculado (digamos Licenciatura em Matemática). Precisamos

Page 24: LivroEstatística.pdf

24

especificar melhor o que queremos conhecer dos alunos, ou seja, os objetivos específicos, tais como:

conhecer o tempo médio dos alunos para a conclusão do a) curso;

verificar a disciplina em que existe um número excessivo de b) reprovação em cada semestre;

verificar o interesse dos alunos pelo curso, evitando com c) isto o abandono;

avaliar o grau de satisfação do aluno com o curso;d)

levantar pontos positivos e negativos do curso, segundo e) sua visão.

Com isto, temos as seguintes características a serem levanta-das dentre os alunos do Curso de Licenciatura em Matemáti-ca da UFSC: o tempo de conclusão do curso; a disciplina que mais reprova por semestre; o grau de satisfação com o curso; o interesse do aluno pelo curso e pontos positivos e negativos do curso, segundo a visão do aluno.

2) Fazer uma revisão bibliográfica para verificar como mensu-rar adequadamente algumas características.

No nosso exemplo, queremos avaliar o grau de satisfação do aluno com o seu curso. Devemos procurar referências bibliográ-ficas que nos orientem sobre como medir a satisfação.

3) Estabelecer a forma de mensuração das características das variáveis a serem levantadas.

Para variáveis quantitativas, devem estar bem definidas as uni-dades de medida (semestre, metros, kg, etc) que devem acompa-nhar as respostas. Para as variáveis qualitativas, deve haver uma lista completa de alternativas, tais como: outros, não têm opinião, etc. Por exemplo, o tempo de conclusão do curso pode ser obser-vado quantitativamente em semestres de estudos na UFSC.

4) Elaborar uma ou mais perguntas para cada característica a ser observada.

Page 25: LivroEstatística.pdf

25

A característica grau de satisfação do aluno com o curso pode ser avaliada sob vários enfoques, como, por exemplo, satisfação com o corpo docente do semestre, laboratórios de informática disponíveis, biblioteca setorial disponível, etc. Estes itens po-dem ser avaliados isoladamente, num mesmo tipo de escala.

5) Verificar se a pergunta está suficientemente clara.

As perguntas devem ser formuladas numa linguagem que não deve deixar dúvidas de interpretação.

O questionário deve ser feito de forma a facilitar a análise dos dados, deve ser completo, no sentido de abranger as características necessá-rias para atingir os objetivos da pesquisa e não deve ter perguntas que fujam destes objetivos.

Apresentaremos a seguir um exemplo hipotético de um questioná-rio que foi aplicado aos alunos de certa instituição de ensino, forne-cendo as seguintes informações:

Id:1) Identificação do alunos;

Turma: 2) Turma em que o aluno foi alocado (A ou B);

Sexo: 3) F se feminino, M se masculino;

Idade: 4) Idade em anos;

Altura: 5) Altura em metros;

Peso: 6) Peso em quilogramas;

Filhos: 7) Número de filhos;

Gosta: 8) Identifica se o aluno gosta ou não de prati- car atividades físicas;

N vez:9) Número de vezes que pratica atividades físi- cas, por semana;

Est. Civ.: 10) Estado civil;

Pratic.: 11) Identifica se o aluno pratica ou não algum esporte;

Qual: 12) Em caso afirmativo, identifica qual o esporte que o aluno pratica.

Page 26: LivroEstatística.pdf

26

Com base nestas informações, apresentamos o questionário aplica-do aos alunos da sua instituição de ensino:

Questionário•

Este questionário faz parte de um trabalho de pesquisa da disci-plina de Estatística. Não há necessidade de colocar seu nome, pois os questionários são anônimos. Agradecemos sua colaboração em responder correta e francamente os diversos itens. Os resultados da pesquisa ficarão disponíveis para a comunidade científica.

Id:________1)

Turma: ( ) A ( ) B2)

Sexo: ( ) Masc. ( ) Fem3)

Idade: _________ anos4)

Altura: _________ m5)

Peso: __________ kg6)

Número de filhos: __________7)

Gosta de praticar atividades físicas? ( ) Sim ( ) Não8)

Quantas vezes por semana pratica atividade física? _____9)

Estado civil: ( ) Solteiro ( ) Casado ( ) Divorciado10)

Pratica algum esporte? ( ) Não ( ) Sim 11)

Se sim, qual? _______________________________12)

Depois de os dados terem sido coletados, precisamos organizá-los, para facilitar a realização da análise. Tomemos o primeiro questio-nário respondido.

Id: 1) 1_

Turma: ( x ) A ( ) B2)

Sexo: ( x ) Masc. ( ) Fem3)

Idade: 4) 30,5_ anos

Altura: 5) 1,72_ m

Page 27: LivroEstatística.pdf

27

Peso: 6) 74,6_ kg

Número de Filhos: __7) 0___

Gosta de praticar atividades físicas? ( x ) Sim ( ) Não8)

Quantas vezes por semana pratica atividade física? __9) 2__

Estado Civil: ( ) Solteiro ( x ) Casado ( ) Divorciado10)

Pratica algum esporte? ( ) Não ( x ) Sim 11)

Se sim, qual? 12) Natação

É comum armazenar os dados num quadro, onde cada coluna se re-fere a uma variável e cada linha a um respondente. O quadro abaixo mostra os dados armazenados dos dez primeiros respondentes.

1 2 3 4 5 6 7 8 9 10 11 12

Id. Turma Sexo Idade Altura Peso Filhos Gosta N° vez Est civil Pratica Qual

1 A Mas 30,5 1,72 74,6 0 Sim 2 Cas Sim Nat

2 A Fem 35,7 1,62 62,8 0 Não 2 Solt Sim Nat

3 B Mas 23,4 1,68 80,2 1 Sim 1 Divor Sim Fut

4 B Mas 27,2 1,69 64,8 0 Sim 5 Solt Sim Bas

5 A Fem 32,1 1,63 36,9 0 Não Nen Solt Não Nen

6 B Fem 23,6 1,62 65,3 0 Sim 2 Solt Sim Vol

7 A Fem 30,6 1,72 62,7 2 Sim 3 Cas sim Fut

8 B Fem 22,7 1,83 71,7 1 Sim 2 Cas Sim Nat

9 A Mas 25,5 1,83 109,2 1 Sim Nen Solt Não Nen

10 B Fem 21,8 1,52 58,2 1 Sim Nen Dolt Não Nen

Quadro 1.2

Nas pesquisas científicas, quando queremos conhecer algumas características de certa população, basta observamos apenas uma amostra de seus elementos e, a partir dos resultados dessa amostra, obter estimativas para as características populacionais de nosso in-teresse e isto nós chamamos de levantamento por amostragem.

Geralmente, temos o interesse em descrever certas características dos elementos da população (chamados de parâmetros). Por exem-

Page 28: LivroEstatística.pdf

28

plo, para planejar políticas de recursos humanos na UFSC, pode-mos realizar uma pesquisa para avaliar alguns parâmetros da po-pulação dos alunos matriculados na UFSC, no semestre 2005/1, tais como: tempo médio de conclusão de seu curso, porcentagem de alu-nos vindos de outros estados da federação, porcentagem de alunos oriundos do interior do Estado de Santa Catarina, porcentagem de alunos matriculados nos cursos de EaD do Centro de Ciências Físi-cas e Matemáticas.

1.14 Plano de AmostragemApós termos bem definidos os objetivos da pesquisa fazemos um plano de amostragem, e para isto precisamos da população a ser amostrada e dos parâmetros. Num plano de amostragem deve cons-tar a definição da unidade da amostragem, ou seja, a unidade a ser sele-cionada para chegar aos elementos da população, que podem ser os próprios elementos da população; a forma de seleção dos elementos da população feita sob a forma de sorteio (são as amostras aleatórias) e o ta-manho da amostra. Por exemplo, numa população de alunos matricu-lados na UFSC, residentes em Florianópolis, podemos planejar a sele-ção dos alunos com domicílios residenciais na ilha ou no continente. Chegando ao domicílio (unidade de amostragem), podemos chegar aos estudantes domiciliados na ilha (elemento da população).

1.15 Amostra Aleatória SimplesPara a seleção de uma amostra aleatória simples precisamos ter uma lista completa dos elementos da população (ou de unidades de amos-tragem apropriadas). Para calcularmos o tamanho de uma amostra aleatória simples precisamos de alguns conceitos, tais como:

Parâmetros:• são usados para designar alguma característica dos elementos da população;

Estatística: • característica descritiva dos elementos da amostra. Por exemplo, na população dos servidores técnicos administrati-vos da UFSC, a porcentagem dos servidores que possuem o nível

Page 29: LivroEstatística.pdf

29

superior é um parâmetro. Numa amostra de 300 destes servido-res técnicos administrativos, a porcentagem dos que possuem o nível superior, nesta amostra, é uma estatística e encontramos 70% dos servidores técnicos administrativos que possuem o ní-vel superior (chamada de estimativa do referido parâmetro).

Erro amostral tolerável:• é quanto o pesquisador admite errar na avaliação dos parâmetros de interesse. Por exemplo, na di-vulgação de pesquisas eleitorais feitas por órgãos especializa-dos, no relatório apresentado “o erro da presente pesquisa é de 3%”. Isto significa dizer que, na pesquisa de intenção de votos que determinado candidato tem é de 30% de preferência dos eleitores entrevistados, na verdade a preferência por este candi-dato é um valor no intervalo de 27% a 33%, isto é, 30% ± 3%.

De posse destes conceitos, sejam:

N• = tamanho (número de elementos) da população;

n• = tamanho (número de elementos) da amostra;

0n• = uma primeira aproximação para o tamanho da amostra;

0E• = erro amostral tolerável.

Um primeiro cálculo do tamanho da amostra, 0n , sem conhecer o tamanho N da população, é dado pela fórmula

0 20

1nE

= .

Conhecendo o tamanho N da população, corrigindo o cálculo ante-rior, temos

20 1

NnE N

=× +

.

Vamos a alguns exemplos de aplicação.

Exemplo 1.2. Planeja-se um levantamento por amostragem para avaliar diversas características da população 600N = alunos matri-culados na UFSC, no semestre de 2005/1. Estas características (pa-râmetros) são do tipo porcentagens: porcentagem dos alunos matri-culados no Curso de Licenciatura em Matemática, porcentagem dos alunos matriculados no Curso de Medicina, porcentagem dos alunos

Page 30: LivroEstatística.pdf

30

matriculados no Curso de Medicina com domicílio residencial em Florianópolis, porcentagem dos alunos matriculados no Curso de Licenciatura de Matemática oriundos do interior do Estado de Santa Catarina, etc. Qual deve ser o tamanho mínimo de uma amostra aleatória simples, tal que o erro amostral não seja superior a 5% ?

Resolução. Os dados do exemplo são: 600N = e 0 5% 0,05E = = .

Uma primeira aproximação para o tamanho da amostra é

0 02 20

1 1 1 400(0,05) 0,0025

n nE

= ⇒ = = = ,

ou seja, uma amostra de 400 alunos.

Corrigindo, em função do tamanho N da população, temos

20

600 600 600 2401 0,0025 600 1 1,5 1 2,5

Nn nE N

= ⇒ = = = =× + × + +

,

ou seja, uma amostra de 240 alunos.

Portanto, o tamanho mínimo de uma amostra aleatória simples, tal que o erro amostral não seja superior a 5% é de 240 alunos.

Exemplo 1.3. Considerando-se os objetivos e os valores do exemplo 1.3, qual deveria ser o tamanho da amostra se a pesquisa fosse am-pliada para todos os alunos matriculados na UFSC, no semestre de 2005/1, digamos, 23.000N = alunos?

Resolução. Uma primeira aproximação para o tamanho da amostra continua sendo 0 400n = alunos. Fazendo a correção em termos do novo valor de 23.000N = , vem

23.000 23.000 393,160,0025 23.000 1 58,5

n = = =× +

393n⇒ = .

Portanto, o tamanho da amostra se a pesquisa fosse ampliada para todos os alunos matriculados na UFSC, no semestre de 2005/1,

23.000N = alunos, é de 393 alunos.

No exemplo 1.3, com a correção em temos do tamanho N da popu-lação, praticamente não foi alterado o cálculo inicial do tamanho da amostra ( 0 400 e 393n n= = ). Geralmente, se a população for muito grande, o cálculo do tamanho da amostra pode ser feito pela equação

Page 31: LivroEstatística.pdf

31

0 20

1n nE

= = ,

sem considerar o tamanho exato N da população.

Considerando os estudos feitos até o final dessa seção, atenda aos exercícios propostos.

Exercícios Propostos

Numa pesquisa para estudar se o povo brasileiro confia no 1) atual presidente da república, diante dos fatos de denúncias de corrupção e as CPIs, qual o tamanho de uma amostra aleatória simples de pessoas (maiores de 18 anos) que garanta um erro amostral não superior a 3%?

Resposta. 1.111 pessoas.

A UFSC com, digamos, 3.500 servidores técnicos administrati-2) vos, numa política de recursos humanos, deseja estimar a por-centagem de servidores favoráveis a certo tipo de capacitação para o seu tipo de trabalho. Qual deve ser o tamanho de uma amostra aleatória simples que garanta um erro amostral não superior a 2%?

Resposta. 1.458 servidores.

O objetivo geral da pesquisa é conhecer melhor a relação de 3) um aluno da UFSC com o curso em que está matriculado (di-gamos Licenciatura em Matemática). Precisamos especificar melhor o que queremos conhecer dos alunos, ou seja, os obje-tivos específicos, tais como:

conhecer o tempo médio dos alunos para a conclusão do a) curso;

verificar a disciplina em que existe um número excessivo de b) reprovação em cada semestre;

verificar o interesse dos alunos pelo curso, evitando com c) isto o abandono;

Page 32: LivroEstatística.pdf

32

avaliar o grau de satisfação do aluno com o curso;d)

levantar pontos positivos e negativos do curso, segundo sua e) visão.

Defina as variáveis de cada um dos objetivos específicos acima. Verificar qual delas são qualitativas e quais são quantitativas.

Respostas.

Variável quantitativa contínua.a)

Variável qualitativa ordinal.b)

Variável qualitativa ordinal.c)

Variável qualitativa ordinal.d)

Variável qualitativa ordinal.e)

4) Considerando a população dos alunos do quarto semestre (4ª fase) do Curso de Licenciatura (noturno) em Matemática da UFSC, se-mestre 2005/1, completar as definições das seguintes variáveis e verificar quais são qualitativas e quais são quantitativas.

Turma; a)

Sexo; b)

Idade; c)

Altura; d)

Peso;e)

Filhos; f)

Est. Civ..g)

Resposta.

Variável qualitativa ordinal.a)

Variável qualitativa nominal.b)

Variável quantitativa contínua.c)

Variável quantitativa contínua.d)

Variável quantitativa contínua.e)

Page 33: LivroEstatística.pdf

33

Variável quantitativa discreta.f)

Variável qualitativa nominal.g)

ResumoNeste capítulo, você teve a oportunidade de estudar e compreender os conceitos de Estatística, população e amostra, campo de aplicação e também o conceito de Estatística Descritiva.

Você deve ter compreendido também o significado de dados esta-tísticos, análise crítica dos dados, análise exploratória de dados e classificação dos dados, análise dos tipos de pesquisas e tipos de va-riáveis, e aprendeu como mensurar uma variável e um instrumento de coleta de dados (o questionário). Além disso, estudou e compre-endeu amostra aleatória simples.

Resta mencionar que a compreensão, sempre referida, é importante para que você possa acompanhar o curso. Se você teve alguma dú-vida, releia todo o capítulo, já que tudo que veremos a seguir depen-de dos conceitos abordados neste capítulo. Consulte o tutor do pólo sempre que achar necessário.

Bibliografia ComentadaBARBETTA, Pedro Alberto. Estatística aplicada às ciências sociais. 5. ed. Florianópolis: UFSC, 2002.

O livro apresenta uma introdução à estatística, e uma orientação de como planejar e conduzir uma pesquisa. Todos os capítulos se iniciam com alguns problemas práticos para motivar a introdução de técnicas estatísticas.

Page 34: LivroEstatística.pdf
Page 35: LivroEstatística.pdf

Capítulo 2Organização de Dados, Gráficos e Distribuição de Freqüência

Page 36: LivroEstatística.pdf
Page 37: LivroEstatística.pdf

37

Capítulo 2Organização de Dados, Gráficos e

Distribuição de Freqüência

O objetivo deste capítulo é mostrar, após a coleta de dados, como organizá-los em tabelas e em gráficos. Vamos estudar também a distribuição de freqüência ou tabela de freqüência em intervalos de classe. Além disso, elaboraremos o histograma e o polígono de freqüência.

Os PCN indicam que a coleta, a organização e a descrição dos dados são procedimentos utilizados com muita freqüência na resolução de problemas e estimulam as crianças a fazer perguntas, estabelecer relações, construír justificativas e desenvolver o espírito de inves-tigação. Ressaltam a necessidade de calcular medidas estatísticas, sem se preocupar em enfatizar que o mais importante é saber o que cada medida significa e não simplesmente efetuar seus cálculos. Os gráficos fornecem uma visualização mais sugestiva do que as tabe-las. Constituem-se numa forma alternativa de representação de dis-tribuição de freqüências. Uma distribuição de freqüências pode ser representada graficamente por histograma de freqüência, polígono de freqüência, gráfico de barras, gráfico de setores e diagrama de pontos, etc. Construímos qualquer um dos gráficos enumerados utilizando o primeiro quadrante do sistema de eixos coordenados cartesianos ortogonais.

2.1 VariáveisSempre que desejamos simbolizar os elementos de uma população, utilizamos as variáveis, representadas por letras ( ), , , , ...a b x y , que podem assumir o valor de cada elemento desta população.

De uma maneira geral, quando a variável representa dados de uma enumeração ou contagem, chama-se variável discreta. Quando ela

Page 38: LivroEstatística.pdf

38

representa dados de uma medição diz-se variável contínua. Por exemplo:

o número de peças defeituosas produzidas por uma fábrica •poderá ser 0, 1, 2, ... e não 1,6 ou 3,17 . Assim, este número é representado por uma variável discreta;

o peso de uma pessoa poderá ser • 74,8 kg ou 74,796 kg , con-forme a precisão da balança utilizada. Este peso é, então, re-presentado por uma variável contínua.

2.2 Coleta dos DadosQuando falamos em coleta dos dados devemos separá-los em dois métodos ou fontes: coleta de dados primários (diretos), quando o pesquisador coleta os dados na fonte originária, e coleta de dados secundários (indiretos), no caso contrário.

Explicando melhor: quando o IBGE faz o levantamento (censo) da população brasileira, normalmente utiliza o processo primário ou direto. Caso queira, com base nos censos anteriores, projetar esta mesma população, estará utilizando o método secundário ou indi-reto (pois os dados já foram obtidos anteriormente).

Apuração dos dadosApós a coleta dos dados, torna-se necessária a tabulação, ou seja, sua apuração ou contagem. Para tanto, de posse dos dados (sobre o mesmo fenômeno), devemos ordená-los mediante critérios de clas-sificação. Estas classificações podem ser efetuadas mecânica ou ma-nualmente. Estas operações podem ser ainda:

totais ou parciais;a)

simples ou cruzadas.b)

Depois dos dados estarem tabulados, ou apurados, eles podem ser apresentados em:

tabelas ou quadros;a)

gráficos.b)

Page 39: LivroEstatística.pdf

39

Análise, Interpretação e Conclusão dos DadosDe todas as fases do método estatístico, esta é a que apresenta maior importância. Isto por que todo trabalho efetuado até o momento deixará de ter o valor devido, se a conclusão não estiver coerente.

Não existe, portanto, um critério a ser utilizado nesta fase. É neces-sário que o analisador tenha muita sensibilidade com os dados que ora estão sendo manipulados.

Em resumo, podemos entender que as fases do trabalho estatístico necessitam de planejamento, coleta, crítica, apuração, exposição e interpretação.

Organização de Dados em TabelasResolução nº 886, 26/10/66 – Conselho Nacional de Estatísitica.

A tabela é um quadro que resume um conjunto de observações colo-cadas em linhas e colunas e distribuídas de modo ordenado.

Um grupo de informações pode ser escrito na forma de uma tabela, para facilitar a compreensão.

O planejamento de uma tabela requer alguma experiência. A mani-pulação destas tabelas pelo estatístico faz com que a cada dia este profissional fique mais familiarizado com elas. É importante ressal-tar que os seguintes pontos devem ser observados na construção das tabelas:

A tabela deve ser auto-explicada. Deve incluir seu título e to-i) das as notas julgadas explicativas.

O título e os cabeçalhos das colunas e linhas devem ser claros ii) e concisos, sem a possibilidade de interpretação ambígua.

O título deve explicitar o objetivo, o lugar e o tempo da clas-iii) sificação.

Um dos objetivos da Estatística é sintetizar os valores que uma ou mais variáveis podem assumir, para que tenhamos uma visão global da variação dessas variáveis. E isto é possível pela apresentação des-

Page 40: LivroEstatística.pdf

40

ses valores em tabelas e gráficos, que nos fornecerão informações rápidas e seguras a respeito das variáveis em estudo, permitindo-nos determinações administrativas e pedagógicas mais coerentes e científicas.

Uma tabela compõe-se de:

título:• O título deve responder as seguintes questões:

o que? (referente ao fato);a)

onde? (relativo ao lugar);b)

quando? (correspondente à época).c)

cabeçalho:• Parte superior da tabela, que especifica a natureza do conteúdo das colunas.

corpo:• Conjunto de linhas e colunas que contêm informações sobre a variável em estudo.

linhas:• Partes do corpo que contêm uma seqüência horizontal de informações.

colunas:• Partes do corpo que contêm uma seqüência vertical de informações.

coluna indicadora: • Parte da tabela que contém as discrimi-nações correspondentes aos valores distribuídos pelas colunas numéricas.

casa ou célula:• Parte da tabela formada pelo cruzamento de uma linha com uma coluna.

Rodapé: • Espaço reservado para colocar as observações perti-nentes, a identificação da fonte dos dados, as notas e as cha-madas.

notas e chamadas: • São esclarecimentos contidos na tabela:

notaa) – conceituação geral;

chamadab) – esclarecimento de minúcias em relação a uma cé-lula).

Exemplo 2.1. Feito o levantamento (em termos percentuais) do reajuste de salários dos professores de ensino fundamental e ensino médio da

Page 41: LivroEstatística.pdf

41

Escola Prof. Fortunato Siqueira, do município XX, no estado de Santa Catarina, no período de 1998 a 2007, obteve-se a seguinte tabela:

Reajuste de salários dos professores de ensino fundamental e ensino médio da Escola Prof. Fortunato Siqueira, do município XX, estado de

Santa Catarina, no período de 1998 a 2007

Anos Reajuste Salarial (%)

1998 12,2

1999 11,4

2000 13,0

2001 10,4

2002 2,8

2003 5,9

2004 6,7

2005 10,9

2006 9,3

2007 8,7

Tabela 2.1 Fonte: Dados Hipotéticos

2.3 GráficosOs gráficos assumem papel fundamental em qualquer campo da ciência. Seja na Física, na Química, na Biologia, na Medicina, na En-genharia, na Estatística e em outras.

O gráfico pode retratar as análises das situações atuais ou de históricos, e também pode fazer previsões. Sua utilização na estatística é de suma importância, visto que praticamente todo relatório analítico vem acompanhado de gráficos ilustrativos. Isto facilita a interpretação rápida do fenômeno que se analisa. Mas, para que esta afirmação se torna válida, é necessário seguir certas normas para elaboração correta e precisa dos gráficos. Se isto não ocorrer, poder-se-á ter uma visão distorcida, ou mesmo errônea, do fenômeno estudado. Basicamente, devemos levar em consideração três características para a construção de um gráfi-co: simplicidade, clareza e veracidade.

Page 42: LivroEstatística.pdf

42

2.3.1 Tipos de GráficosExistem vários tipos de gráficos que são classificados a seguir:

gráfico de linha;i)

diagrama ou gráfico de barras;ii)

barras simples;a)

barras horizontais;b)

barras superpostas;c)

barras complementares;d)

iii) gráficos em setores (setograma);

iv) gráfico ilustrativo, figuras (pictograma);

v) gráfico polar;

vi) mapas (cartograma);

vii) estereogramas (representação em três dimensões);

viii) diagrama de área (proporcionalidade entre itens diagramas e as áreas de quadrados e círculos).

Gráfico de linhaExemplo 2.2. A tabela seguinte mostra a evolução do número de alunos do ensino médio matriculados na Escola Dona Benta, do Município YY, estado de Santa Catarina, no período de 1996 a 2005:

Evolução do número de alunos do ensino médio matriculados na Escola Dona Benta, do Município YY, estado de Santa Catarina,

no período de 1996 a 2005

Anos Número de alunos matriculados

1996 1.308

1997 1.308

1998 1.433

1999 2.066

2000 2.574

2001 3.222

2002 3.222

Page 43: LivroEstatística.pdf

43

2003 3.222

2004 3.222

2005 3.222

Tabela 2.2 Fonte: Dados Hipotéticos

Temos o seguinte gráfico de linha da tabela acima:

1.000

1996 1997 1998 1999 2000 2001 2002 2003 2004 2005

1.1001.2001.3001.4001.5001.6001.7001.8001.9002.0002.1002.2002.3002.4002.5002.6002.7002.8002.9003.0003.1003.2003.300

Núm

ero

de a

luno

s m

atri

cula

dos

Anos

Gráfico 2.1 Fonte: Dados Hipotéticos

Gráfico de barrasNo gráfico de barras, cada categoria é representada por uma barra de comprimento proporcional à sua freqüência, conforme identifica-ção no eixo horizontal.

Exemplo 2.3. Um pesquisador obteve informações sobre o grau de instrução de uma amostra de 36 funcionários da Escola Estadual Pri-mavera, em Florianópolis no ano de 2005, conforme quadro a seguir:

Grau de instrução Ens. Fundamental Ens. Médio Ens. Superior

Número 12 18 6

Quadro 2.1

Page 44: LivroEstatística.pdf

44

O gráfico de barras da amostra dos 36 funcionários da Escola Esta-dual Primavera, conforme quadro acima, segundo o grau de instru-ção, é dado abaixo:

0 3 6 9 12 15 18 21

Grau de instrução dos funcionários da Escola Estadual Primavera

Ensi. Superior

Ens. Médio

Ens. Fudamental

Número de funcionários

Gráfico 2.2

Gráfico de setoresEste gráfico é constituído com base em um círculo, e é empregado sempre que desejamos ressaltar a participação do dado em relação ao total. O total é representado pelo círculo, que fica dividido em tantos setores quantas são as partes. Os setores são tais que suas áreas são proporcionais aos dados. Cada setor é obtido por meio de uma regra de três simples e direta, lembrando que o total corres-ponde a 0360 .

Exemplo 2.4.

Receita do Município XX de 2001 a 2003

Anos Receita (em R$1.000,00)

2001 90

2002 120

2003 150

Total 360

Tabela 2.3 Fonte: Secretaria de Finanças do Município XX

Diagrama de pontosEste diagrama é utilizado quando os dados consistem em um pe-queno conjunto de números. Podem ser representados traçando-se

Receita do Município XX de 2001 a 2003

200125%

200341,5%

200233,5%

Gráfico 2.3

Page 45: LivroEstatística.pdf

45

uma reta com uma escala que abranja todas as mensurações obser-vadas e marcando-se as respectivas freqüências como ponto acima da reta.

Exemplo 2.5. Consideremos os tempos, em segundos, que os alunos da turma A demoram para responder questões de múltipla escolha de uma avaliação de Estatística: 2, 6, 3, 5, 6, 4, 3, 5, 4, 6, 3, 4, 5, 18. Construir o diagrama de pontos correspondente.

Resolução. Marcando numa reta os tempos correspondentes, temos o seguinte gráfico:

Gráfico 2.4

Note que os valores tendem a se agrupar, em torno de 3, 4, 5 ou 6, com exceção do valor 18, que se afasta grandemente do conjunto. Casos como este, com valores extremos ou erráticos, devem ser sem-pre investigados, com vistas a uma explicação, e para que se determi-ne se os extremos devem ou não ser excluídos do conjunto.

Vamos conferir se você está acompanhando tudo até aqui? Para sa-ber, procure atender aos exercícios propostos abaixo.

Exercícios Propostos

Consideremos os dados relativos ao aproveitamento dos alu-1) nos na disciplina de Estatística, turma 404 no Curso de Mate-mática-EaD-UFSC, período 2005.1 apresentados abaixo.

Classificação dos alunos de Estatística, turma 404 em EaD da UFSC

Classificação Fraca Razoável Média Boa Excelente Total

Número de alunos 2 4 20 10 4 40

Porcentagem 5 10 50 25 10 100

Tabela 2.4

Page 46: LivroEstatística.pdf

46

Representar esses dados em:

um gráfico de barras horizontais,a)

em um gráfico de setores, usando os valores das freqüências b) relativas.

Respostas:

a) Gráfico em barras horizontais.

0 10 20 30 40 50 60

Média

Razoável

Fraca

Porcentagem

Excelente

Boa

Clasificação dos alunos de Estatística Turma 404

Gráfico 2.5

b) Gráfico em setores.

Média50%

Razoável10%

Fraca5%

Excelente10%

Clasificação dos alunos de Estatística Turma 404

Boa25%

Gráfico 2.6

2.4 Distribuição de FreqüênciasEntre as séries estatísticas, merece referência especial a distribui-ção de freqüência. Uma distribuição de freqüência é uma tabela, na qual os possíveis valores de uma variável se encontram agrupados em classes, registrando-se o número de valores observados em cada classe. Os dados organizados em uma distribuição de freqüência

Page 47: LivroEstatística.pdf

47

são chamados dados agrupados. Praticamente se resume na manei-ra de ordenar os dados estatísticos em linha ou colunas, tornando possível sua leitura, tanto no sentido horizontal quanto vertical. Isto quer dizer que, dada uma grande quantidade de dados, geralmen-te não organizados, costumamos distribuí-los em classes ou cate-gorias, denominando o número de indivíduos pertencentes a cada uma delas. A este número damos o nome de freqüência da classe.

Tabela de FreqüênciaQuando se estuda uma variável, o maior interesse do pesquisador é conhecer a distribuição dessa variável através de suas possíveis realizações (valores), isto é, organizar os dados de acordo com a fre-qüência com que ocorrem.

Estaturas de 40 alunos (em cm) da Escola Estadual “Esperança”, semestre 2007/1

166 160 161 150 162 160 165 167 164 160

162 161 168 163 156 173 160 155 164 168

155 152 163 160 155 155 169 151 170 164

154 161 156 172 153 157 156 158 158 161

Tabela 2.5

Esse tipo de tabela, cujos elementos não foram numericamente orga-nizados, denominamos tabela primitiva.

A partir dos dados acima - tabela primitiva - é difícil averiguar em torno de que valor tende a concentrarem-se as estaturas, qual a me-nor ou qual a maior estatura, ou, ainda, quantos alunos se acham abaixo ou acima de uma dada estatura.

Assim, conhecidos os valores de uma variável, é difícil formarmos uma idéia exata do comportamento do grupo como um todo a partir dos dados não ordenados.

A maneira mais simples de organizar os dados é através de certa ordenação (crescente ou decrescente). A tabela obtida após a orde-nação dos dados se denomina rol.

Page 48: LivroEstatística.pdf

48

Estatura de 40 alunos (em cm) da Escola Estadual “Esperança“

150 154 155 157 160 161 162 164 166 169

151 155 156 158 160 161 162 164 167 170

152 155 156 158 160 161 163 164 168 172

153 155 156 160 160 161 163 165 168 173

Tabela 2.6

Agora, podemos saber, com relativa facilidade, qual a menor estatu-ra (150 cm) e qual a maior (173 cm), que a amplitude de variação foi de 173 150 23− = cm e, ainda, a ordem que um valor particular da variável ocupa no conjunto. Com um exame mais acurado, vemos que há uma concentração das estaturas em algum valor entre 160 cm e 165 cm e, mais ainda, que há poucos valores abaixo de 155 cm e acima de 170 cm.

No exemplo que trabalhamos, a variável em questão, estatura, será observada e estudada muito mais facilmente quando dispusermos os valores ordenados em uma coluna e colocarmos, ao lado de cada valor, o número de vezes que ele aparece repetido.

O número de alunos, que fica relacionado a um determinado valor da variável, denominamos freqüência. Obtemos, assim, uma tabela, que recebe o nome de distribuição de freqüência.

Se um dos intervalos for, por exemplo, [ )154,158 ou 154 158, ao in-vés de dizermos que a estatura de 1 aluno é de 154 cm, de 4 alunos, 155 cm, de 3 alunos, de 156 cm, e de 1 aluno, 157 cm, diremos que 9 alunos têm estaturas entre 154, inclusive, e 158 cm.

Deste modo, agruparemos os valores da variável em intervalos, sen-do que, em Estatística, preferimos denominar classes aos interva-los.

Chamando de freqüência de uma classe o número de valores da variável pertencentes à classe, os dados acima podem ser dispostos na tabela abaixo, denominada distribuição de freqüência com in-tervalos de classe.

Page 49: LivroEstatística.pdf

49

Estatura de 40 alunos (em cm) da Escola Estadual “Esperança“, semestre 2007/1

Estaturas (cm) Freqüências

150 154 4

154 158 9

158 162 11

162 166 8

166 170 5

170 174 3

Total 40

Tabela 2.7

Fonte: Dados Hipotéticos

Para construirmos uma tabela de distribuição de freqüência com intervalos de classe, necessitamos dos seguintes elementos:

ClasseClasses de freqüência, ou simplesmente classes, são intervalos de variação da variável. As classes são representadas simbolicamente por i, sendo i = 1,2,3,...,k (onde k é o número total de classes de dis-tribuição).

Assim, em nosso exemplo, o intervalo 154 158 define a segunda classe (i = 2) e, como a distribuição é formada de seis classes, pode-mos afirmar que k = 6.

Para a determinação do número de classes de uma distribuição po-demos lançar mão da REGRA DE STURGES, que nos dá o número de classes em função do número de valores da variável:

1 3,3 logi n= + ×

onde:

i = número de classes;n = número total de dados.

Observação: 5i = para 25n ≤

i n para 25n > .

A notação se aplica a intervalos semi-fechados à

esquerda (ou semi-aberto à direita).

Page 50: LivroEstatística.pdf

50

Limites de classeAos extremos de cada classe denominamos limites de classe. O me-nor número é o limite inferior da classe ( il ), e o maior número é o limite superior da classe ( iL ).

Na segunda classe, por exemplo, temos 2 154l = e 2 158L = .

Amplitude de um intervalo de classe

Amplitude de um intervalo de classe, ou simplesmente intervalo de classe, é a medida do intervalo que define a classe. Ela é obtida pela diferença entre os limites superior e inferior dessa classe, e será in-dicada por rh . Assim:

r r rh L l= − .

No nosso exemplo, temos

2 2 2 2158 154 4 4h L l h= − = − = ⇒ = cm.

Amplitude total da distribuiçãoAmplitude total da distribuição ( )AT é a diferença entre o limite su-perior da última classe (limite superior máximo) e o limite inferior da primeira classe (limite inferior mínimo):

(máximo) (mínimo)AT L l= − .

No nosso exemplo, temos

174 150 24 24AT AT= − = ⇒ = cm.

Amplitude amostralA amplitude amostral é a diferença entre o valor máximo e o valor mínimo da amostra.

max minAT x x= − .

No nosso exemplo, temos:

173 150 23 23AT AT= − = ⇒ = cm.

Page 51: LivroEstatística.pdf

51

Amplitude da classe (h)

É dado por AThi

= .

A amplitude total da distribuição jamais coincide com a amplitude amostral.

Ponto médio de uma classeO ponto médio de uma classe é o ponto que divide o intervalo de classe em duas partes iguais, sendo indicado por ix .

Para obtermos o ponto médio de uma classe, basta adicionar ao li-mite inferior da classe a metade do intervalo de classe. Assim, o ponto médio da segunda classe, em nosso exemplo, é:

22 2 2 2

4 154 156 1562 2hx l x x= + ⇒ = + = ⇒ = cm, ou ainda

2154 158 156

2x +

= = .

Freqüência simples ou absolutaA freqüência simples, ou freqüência absoluta, ou simplesmente, fre-qüência de uma classe ou de um valor individual, é o número de observações correspondentes a essa classe ou a esse valor.

A freqüência simples é simbolizada por if (lemos: f índice i ou freqüência da classe i ).

Assim, em nosso exemplo, temos

1 2 3 4 5 64; 9; 11; 8; 5 e 3f f f f f f= = = = = = .

A soma de todas as freqüências será representada pelo símbolo de somatório:

1

k

ii

f=∑ é evidente que

1

k

ii

f n=

=∑ .

Para a distribuição em estudo, temos f i = 40∑ .

Page 52: LivroEstatística.pdf

52

Freqüências relativas ( fri)São os valores das razões entre as freqüências simples e a freqüência total, isto é:

fri ∑=

i

ii f

ffr .

Logo, a freqüência relativa da terceira classe no nosso exemplo é:

33 3 3

11 0,275 0,27540i

ffr fr frf

= ⇒ = = ⇒ =∑

.

Freqüência acumulada (Fk) É o total das freqüências de todos os valores inferiores ao limite su-perior do intervalo de uma dada classe. Temos

F f fk = + +1 2 ... + fkfk.

Assim, no nosso exemplo, a freqüência acumulada correspondente à terceira classe é:

3 1 2 3 3 4 9 11 24F f f f F= + + ⇒ = + + = ,

o que significa existirem 24 alunos com estatura inferior a 162 cm (limite superior do intervalo da terceira classe).

Freqüência acumulada relativa (Fri) É a freqüência acumulada da classe, dividida pela freqüência total da distribuição:

Fr

Ffi

i

i

= ∑ .

Assim, para a terceira classe, temos

Fr3

2440

0 600= = , .

Portanto, veja na tabela abaixo a distribuição de freqüência das esta-turas dos 40 alunos (em cm) da Escola Estadual “Esperança”, ao se-mestre 2007/1.

Page 53: LivroEstatística.pdf

53

Classe Estaturas(em cm) f xi fr F Fr Porcentagem

1 150 154 4 152 0,1000 4 0,1000 10,00%

2 154 158 9 156 0,2250 13 0,3250 32,50%

3 158 162 11 160 0,2750 24 0,6000 60,00%

4 162 166 8 164 0,2000 32 0,8000 80,00%

5 166 170 5 168 0,1250 37 0,9250 92,50%

6 170 174 3 172 0,0750 40 1,000 100,00%

40f =∑Tabela 2.8

O conhecimento dos vários tipos de freqüência nos ajuda a respon-der muitas questões com relativa facilidade, como as seguintes:

Quantos funcionários têm estaturas entre 154 cm, inclusive, e a) 158 cm?

Resposta: Esses são os valores da variável que formam a segunda classe, logo, 9 funcionários.

Qual a porcentagem de funcionários cujas estaturas são infe-b) riores a 154 cm?

Resposta: Esses valores são os que formam a primeira classe, logo, 10%.

Quantos funcionários têm estatura abaixo de 162 cm?c)

Resposta: É evidente que as estaturas consideradas são aquelas que formam as classes de ordem 1, 2 e 3 , isto é, 4+9+11=24.

Exemplo 2.6. Considere os dados brutos do quadro a seguir, que representam o peso (em kilogramas) de 40 crianças, entre 0 e 8 anos, da Creche Municipal “O Bom Pastor”, no semestre 2007/2.

11,1 12,5 32,4 7,8 21,0 16,4 11,2 22,3

4,4 6,1 27,7 32,8 18,5 16,4 15,1 6,0

10,7 15,8 25,0 18,2 12,2 12,6 4,7 23,5

14,8 22,6 16,0 19,1 7,4 9,2 10,0 26,2

3,5 16,2 14,5 3,2 8,1 12,9 19,1 13,7

Quadro 2.2

Page 54: LivroEstatística.pdf

54

Determinar:

a construção do rol em ordem crescente;1)

a amplitude total dos dados;2)

o número de classes;3)

amplitude de classe;4)

os intervalos de variação das classes (sugestão: considere o li-5) mite inferior da primeira classe igual a 3);

a tabela de freqüência.6)

Resposta:

1) Rol em ordem crescente:

Peso (em kilogramas) de 40 crianças, entre 0 e 8 anos, da Creche Municipal “O Bom Pastor”, no semestre 2007/2

3,2 3,5 4,4 4,7 6,0 6,1 7,4 7,8

8,1 9,2 10,0 10,7 11,1 11,2 12,2 12,5

12,6 12,9 13,7 14,5 14,8 15,1 15,8 16,0

16,2 16,4 16,4 18,2 18,5 19,1 19,1 21,0

22,3 22,6 23,5 25,0 26,2 27,5 32,4 32,8

Quadro 2.3

2) Amplitude total dos dados (AT): 32,8 3,2 29,6AT = − = .

3) Número de classe (i): 1 log(40) 6,286 6i = + = ≈( 3,3 )1 log(40) 6,286 6i = + = ≈ .

4) Amplitude da classe (h): 29,6 4,93 5

6AThi

= = = ≈ .

5) e 6)

Peso (em kilogramas) de 40 crianças, entre 0 e 8 anos, da Creche Municipal “O Bom Pastor, no semestre 2007/2

Classe Peso f rf F rF

1 3 8 8 0,20 8 0,20

2 8 13 10 0,25 18 0,45

3 13 18 9 0,23 27 0,68

Page 55: LivroEstatística.pdf

55

4 18 23 7 0,18 34 0,85

5 23 28 4 0,10 38 0,95

6 28 33 2 0,05 40 1,00

40f =∑Tabela 2.9

Exemplo 2.7. Suponhamos que uma empresa deseja analisar a dis-tribuição dos salários pagos por hora a seus funcionários. O estatís-tico da empresa dispõe dos seguintes dados:

13,3 15,2 12,4 15,8 9,6 10,4

13,2 8,8 8,3 8,5 10,2 11,5

12,6 10,7 12,6 9,7 12,1 13,5

10,3 14,3 9,8 12,3 10,4 11,6

12,4 12,9 11,6 10,3 14,2 13,6

Quadro 2.4

Pode-se notar, no quadro citado, que os dados estão desordenados. Portanto, não houve preocupação quanto à sua ordem (crescente ou decrescente). Nestas condições, esses dados são denominados, em estatística, dados brutos. Quando estiverem ordenados (crescente ou decrescente), são denominados rol.

Para ordená-los, é aconselhável a elaboração de tabelas de freqüên-cia. Inicialmente designamos o x para variável em estudo, no caso, salário/hora.

máx o maior valor da variável 15,8 x = = .

mín o menor valor da variável 8,3 x = = .

máx mín 15,8 8,3 7,5 x x− = − = .

Para facilitar, podemos dividir em 5 classes com intervalos de 1,5.

Com estas informações iniciais, podemos construir a tabela 2.10 da freqüência:

Page 56: LivroEstatística.pdf

56

Classe Freqüências

8,3 9,8 6

9,8 11,3 6

11,3 12,8 9

12,8 14,3 7

14,3 15,8 2

Total 30

Tabela 2.10

Pode-se observar que quando os dados não estavam agrupados no quadro 2.4, não se tinha nenhuma informação sobre a distribuição de salários. Agora, observada a tabela 2.10, já podemos estabele-cer algumas considerações valiosas. Podemos, por exemplo, con-cluir que a classe de salários predominante na empresa é a terceira: 11,3 12,8.

2.5 Histograma de FreqüênciasO gráfico de distribuição de freqüência também é conhecido como histograma. Ele é formado por um conjunto de retângulos justapos-tos, cujas bases se localizam sobre o eixo horizontal, de tal modo que seus pontos médios coincidam com os pontos médios dos inter-valos de classe.

Exemplo 2.8. Histograma de freqüências dos alunos da Escola Esta-dual “Esperança”. (Veja a tabela 2.8)

0150 154 158 162 166 170 174

123456789

101112

Histograma e Polígono de Freqüência

Histograma de Freqüência

Polígono de Freqüência

Estatura dos alunos Escola Estadual Esperança (em cm)

Freq

üênc

ia

152 156 160 164 168 172

Gráfico 2.7

As larguras dos retângulos são iguais às amplitudes dos intervalos de classe. As alturas dos retângulos deverão ser proporcionais às fre-

Page 57: LivroEstatística.pdf

57

qüências das classes, sendo a amplitude dos intervalos iguais. Isso nos permite tomar as alturas numericamente iguais às freqüências. Vejamos agora alguns exemplos de histograma de freqüências.

Exemplo 2.9. Histograma de freqüência de uma amostra de 36 fun-cionários da Escola Estadual Primavera, conforme quadro 2.1, se-gundo o grau de instrução.

Histograma de freqüência

Escolaridade dos Funcionários

EnsinoFundament

33,3%

50,0%

16,7%

EnsinoMédio

EnsinoSuperior

Freq

üênc

ia O

bser

vada

02468

101214161820

Gráfico 2.8

Polígono de freqüênciasO polígono de freqüência é um gráfico em linha, sendo as freqüências marcadas sobre perpendiculares ao eixo horizontal, levantados pelos pontos médios dos intervalos de classe.

Para realmente obtermos um polígono (linha fechada), devemos com-pletar a figura, ligando os extremos da linha obtida aos pontos médios da classe anterior à primeira e posterior à última, da distribuição.

Exemplo 2.10. Polígono de freqüência dos alunos da Escola Estadual “Esperança”. (Tabela 2.8)

0

150 154 158 162 166 170 174

Polígono de Freqüência

21

3

5

7

9

4

6

8

101112

Gráfico 2.9

Page 58: LivroEstatística.pdf

58

Exemplo 2.11. Usando os dados da tabela 2.10:

Classe Freqüência Ponto Médio

8,3 9,8 6 9,05

9,8 11,3 6 10,55

11,3 12,8 9 12,05

12,8 14,3 7 13,55

14,3 15,8 2 14,05

Total 30 -

Tabela 2.11

01

8,3 9,8 11,3 12,8 14,3 15,8 Classe

Freq

üênc

ias

23456789

Gráfico 2.10

15,8Classe

14,312,811,39,88,3

1

9

8

7

6

5

4

3

2

Gráfico 2. 11

Page 59: LivroEstatística.pdf

59

Exemplo 2.12.

Classe Freqüência Ponto Médio

00 05 42 2,5

05 10 65 7,5

10 15 23 12,5

15 20 28 17,5

20 25 10 22,5

25 30 24 27,5

30 35 08 32,5

Total 200 -

Tabela 2.12

10

0 5 10 15 20 25 30 35

20

30

40

50

60

70

Classe

Freq

üênc

ias

Gráfico 2.12

0

10

20

30

40

50

60

70

5 10 15 20 25 30 35Classe

Freq

üênc

ias

Gráfico 2.13

Page 60: LivroEstatística.pdf

60

Exercícios PropostosDadas as distribuições de freqüência a seguir, determinar para 1) cada uma:

i) O histograma de freqüência.

ii) O polígono de freqüência.

a)

Tabela 2.13

Resposta.

0 40 44 48 52 56 60 Kg

2

4

6

8

10f

Gráfico 2.14

b) Estaturas(em cm) Freqüência

150 156 1

156 162 5

162 168 8

168 174 13

174 180 3

30=∑Tabela 2.14

Pesos(em Kg) Freqüência

40 44 2

44 48 5

48 52 9

52 56 6

56 60 4

26=∑

Page 61: LivroEstatística.pdf

61

Resposta.

01

3

5

7

9

11

13

150 156 168 180162 174 cm

f

Gráfico 2.15

c) Salários (em R$) Freqüência

500 700 8

700 900 20

900 1100 7

1100 1300 5

1300 1500 2

1500 1700 1

1700 1900 1

44=∑Tabela 2.15

Resposta.

5000

4

8

12

16

20

900 1300 1700 R$

f

Gráfico 2. 16

Page 62: LivroEstatística.pdf

62

2) Feito um levantamento sobre as idades de 25 alunos que cur-sam a 5a série da Escola Estadual “Sena Figueiredo”, da cidade X do Estado de Santa Catarina, chegou-se ao seguinte quadro:

Idade Freqüência

10 3

11 11

12 8

13 3

Quadro 2.5

Faça um gráfico por setores que represente esta distribuição.

O quadro seguinte mostra as médias, em matemática, dos 50 2) alunos da 3a série do ensino médio durante um determinado bimestre do Colégio Pio XII, da cidade Y do Estado de Santa Catarina.

68 85 33 52 65 77 84 65 74 57

71 35 81 50 35 64 74 47 54 68

80 61 41 91 55 73 59 53 77 45

41 55 78 48 69 85 67 39 60 76

94 98 66 66 73 42 65 94 88 89

Quadro 2.6

Determinar:

A distribuição de freqüência iniciando por 30 e adotando-se a) o intervalo de classe de amplitude igual a 10.

As freqüências acumuladas.b)

As freqüências relativas.c)

O histograma e o polígono de freqüência.d)

4) O gráfico de setores representa as notas obtidas em uma ques-tão pelos 32.000 candidatos presentes à primeira fase de uma prova de vestibular. Ele mostra, por exemplo, que 32% desses

Page 63: LivroEstatística.pdf

63

candidatos tiveram nota 2 nessa questão. Quantos candidatos tiveram nota 3?

5 (10%)

0 (10%)

1 (20%)

2 (32%)

4 (12%)3 (16%)

Gráfico 2.17

Resposta. 5.120 candidatos.

(PUC) O histograma seguinte apresenta a distribuição de fre-5) qüência das faixas salariais numa pequena empresa.

0500 1000 1500 2000 2500

2

4

6

8

10

12

14

Salário (R$)

N° de Funcionários

0

Gráfico 2.18

Com os dados disponíveis, pode-se concluir que a média des-ses salários é, aproximadamente:

R$ 420,00 a)

R$ 536,00 b)

R$ 562,00c)

R$ 640,00d)

R$ 708,00 e)

Resposta. e).

Page 64: LivroEstatística.pdf

64

ResumoVocê viu neste capítulo como identificar os elementos de uma distri-buição de freqüência e os tipos de freqüência.

Você foi capaz de verificar a representação gráfica do histograma e do polígono de freqüência, viu a construção de gráfico de barra, de gráfico de setores e de diagrama de pontos.

Bibliografia ComentadaCRESPO, A. Arnot. Estatística fácil. 7. ed. São Paulo: Saraiva, 1990.

O autor aborda o conteúdo de distribuição de freqüência e de construção de gráficos estatísticos usando uma linguagem bem simples e clara, tornando sua leitura agradável.

FONSECA, Jairo Simom da; MARTINS, Gilberto de Andrade. Curso de estatística. 3. ed. São Paulo: Atlas, 1982.

Da mesma forma que a fonte anterior, apresentam os principais conceitos sobre levantamento de dados estatísticos por meio de tabelas e gráficos.

Page 65: LivroEstatística.pdf

Capítulo 3Medidas de Tendência Central

Page 66: LivroEstatística.pdf
Page 67: LivroEstatística.pdf

67

Capítulo 3 Medidas de Tendência Central

Neste capítulo estudaremos várias medidas de posição ou de tendência central e suas utilidades em ensino funda-mental e médio. A maioria dos dados apresentam uma di-ferente tendência de se agrupar ou concentrar em torno de um ponto central. Assim sendo, para um conjunto de dados em particular, geralmente se torna possível selecionar um valor típico ou médio para descrever todo o conjunto. Tal descritivo típico é uma medida de localização ou tendência central. As mais importantes das medidas estatísticas de localização ou medidas de posições são as chamadas medi-das de posição ou de tendência central, e dentre elas desta-camos: a média aritmética, a mediana e a moda.

3.1 IntroduçãoPelo apresentado nos capítulos anteriores, vemos que à Estatística cabe a análise de fenômenos mensuráveis. Temos, assim, diante de nós, informações numéricas, obtidas nas fases iniciais do trabalho estatístico (planejamento, coleta, crítica, apuração e exposição), que deverão ser analisadas agora na fase do trabalho estatístico que cha-mamos de interpretação.

Cabe-nos, assim, a determinação dos índices estatísticos que atuarão como indicadores do comportamento do fenômeno que estamos pesquisando.

O objetivo central deste capítulo é apresentar, de forma simples e prática, os parâmetros que caracterizam a distribuição de uma va-riável. Em vez de seguirmos uma linha geral, por motivo óbvio, ini-ciaremos o nosso estudo discutindo as medidas de tendência cen-tral. Denominam-se medidas de posição, ou medidas de tendência central, os valores típicos, que tendem a se localizar em pontos cen-

Page 68: LivroEstatística.pdf

68

trais num conjunto de dados ordenados, ou que ocupam uma po-sição específica dentro de uma distribuição. As principais medidas de tendência central são as seguintes:

Médiasa)

aritmética (simples e ponderada);i)

geométrica;ii)

harmônica;iii)

quadrática.iv)

b) Mediana.

c) Moda.

3.2 Média AritméticaÉ uma das principais medidas de posição. Seguramente, a mais usa-da, sendo que pode ser simples (dados não agrupados em classe) e ponderada (dados agrupadas em classe).

3.2.1 Média Aritmética SimplesMédia aritmética simples ou simplesmente média ( )x, de uma série ou conjunto de n valores 1 2, ,..., nx x x é, por definição, o quociente da soma desses valores pelo número deles, ou seja:

1 2 1...

n

in i

xx x xx

n n=+ + +

= =∑

,

ou simplesmentexx

n∑

= .

Exemplo 3.1.

A média aritmética dos números 4, 9, 12, 3, 6, 10 e 20 será:i)

4 9 12 3 6 10 20 70 107 7

x + + + + + += = = .

Page 69: LivroEstatística.pdf

69

ii) 2, 5, 7, 6x =4

1 2 5 7 6 20 54 4 4

ii

xx = + + +

= = = =∑

.

Exemplo 3.2. Sabendo-se que um funcionário da Escola Estadual “Esperança” trabalha, durante uma semana, em horas, 10, 14, 13, 15, 16, 18 e 12 horas, temos que a média de trabalho da semana foi de

10 14 13 15 16 18 12 14 horas7

x + + + + + += = .

Observação 3.1. Às vezes acontece de a média ser um número di-ferente de todos da série de dados que ela representa. Por exemplo, quando temos os valores 2, 4, 8 e 9, a média é 5; neste caso, costuma-mos dizer que a média não tem existência concreta.

3.2.2 Média Aritmética PonderadaMédia aritmética ponderada é uma forma simplificada de calcular a média aritmética simples dos dados repetidos.

Se os números 1 2, ,..., nx x x ocorrem em determinadas freqüências,

1 2, ,..., nf f f , respectivamente, a média aritmética ponderada é defi-nida por:

1 1 2 2

1 2

......

n n

n

f x f x f xxf f f+ + +

=+ + +

1 1

1

n n

i i i ii i

n

ii

f x f x

nf

= =

=

= =∑ ∑

∑,

onde

1

n

ii

n f=

= ∑ , é a freqüência total.

Observação 3.2. As freqüências 1 2, ,..., nf f f também são chamadas de pesos, para 1 2, ,..., nx x x , respectivamente.

Exemplo 3.3. Cálculo da média aritmética ponderada dos seguin-tes dados:

Page 70: LivroEstatística.pdf

70

Notas em provas (x) Números de estudantes ( f )

20 3

35 6

40 2

60 10

65 8

75 16

80 3

100 2

Total 50

Quadro 3.1

3 20 6 35 2 40 10 60 8 65 16 75 3 80 2 100

50x × + × + × + × + × + × + × + ×

=

60 210 80 600 520 1200 240 20050

+ + + + + + +=

3110 62,250

= =

Exemplo 3.4. Cálculo da média aritmética ponderada dos seguin-tes dados:

xi fi

2 8

3 2

5 4

8 6

6 5

9 3

Total 28

Quadro 3.2

8 2 2 3 4 5 6 8 5 6 3 9

28x × + × + × + × + × + ×

=

16 6 20 48 30 27

28+ + + + +

=147 5,2528

= = .

Page 71: LivroEstatística.pdf

71

Exemplo 3.5. O Colégio “Aprender a Lição”, do Sistema de Ensino Prof. “Sabe Tudo”, possui dois técnicos em informática recebendo salários mensais de R$ 3.400,00 cada um; quatro professores de fí-sica recebendo mensalmente R$ 4.500,00 cada um; um diretor de recursos humanos com salário mensal de R$ 7.000,00; e três outros profissionais recebendo mensalmente R$ 5.500,00 cada um. A média

mensal destes salários é:

3.400 2 4.500 4 7.000 1 5.500 3 48.300 4.830

2 4 1 3 10x × + × + × + ×

= = =+ + +

.

Portanto, a média de salários do Colégio “Aprender a Lição” é de R$ 4.830,00.

Observação 3.3. Quando os dados são agrupados em intervalos de classe, convenciona-se que todos os valores incluídos em um deter-minado intervalo de classe coincidem com o seu ponto médio, e o cálculo da média aritmética é dado pela fórmula acima onde ix é o ponto médio da classe.

Exemplo 3.6. Consideremos a tabela abaixo referente aos salários (em R$) do mês de março/2007 de 44 professores da Escola “Básica Professora Zulmira”:

Classe Salários Freqüência

1 500 700 8

2 700 900 20

3 900 1100 7

4 1100 1300 5

5 1300 1500 2

6 1500 1700 1

7 1700 1900 1

Total = 44

Tabela 3.1

Calcular o salário médio mensal pago pela Escola “Básica Profes-sora Zulmira”.

Page 72: LivroEstatística.pdf

72

Aplicando a fórmula da média dada acima, temos

4800 16000 7000 6000 8200 1600 180044

+ + + + + +=

40.000 909,0944

= =

Portanto, o salário médio mensal pago pela Escola “Confiança no Futuro” é de R$ 909,09.

Exemplo 3.7. Calcular a altura média dos quarenta alunos da Escola Estadual “ESPERANÇA”:

Classe Estaturas (em cm) fi xi fi × xi

1 150 154 4 152 608

2 154 158 9 156 1404

3 158 162 11 160 1760

4 162 166 8 164 1312

5 166 170 5 168 840

6 170 174 3 172 516

40if =∑ 6440i if x× =∑Tabela 3.2

Resolução. Na última coluna do quadro acima, temos a altura média

6440 161,0040

x = = .

Portanto, a altura média dos quarenta alunos da Escola Estadual “Es-perança” é 161 cm.

3.2.3 Média Aritmética para Dados Agrupados em classe (ponderada)

Processo LongoÉ definido como sendo o “quociente entre a soma dos produtos das freqüências pelos pontos médios de cada classe, e a soma de todas as freqüências”. Assim,

Page 73: LivroEstatística.pdf

73

1

1

i

n

i mi

n

ii

f px

f

=

=

=∑

∑,

onde

imp = ponto médio de cada classe.

Exemplo 3.8. Calcule a média aritmética da seguinte tabela de fre-qüência (isto é, dados agrupados em classes):

Tempo de serviço (anos)

Número de empregados ( fi )

Ponto Médio(pm)

( f · pm)

00 05 42 2,5 105

05 10 65 7,5 487,5

10 15 23 12,5 287,5

15 20 28 17,5 490

20 25 10 22,5 225

25 30 24 27,5 660

30 35 08 32,5 260

Total 200 - 2515

Tabela 3.3

7

17

1

.ii m

i

ii

f px

f

=

=

=∑

105 487,5 287,5 490 225 660 260200

+ + + + + +=

2515200

= 12,575= .

Processo das freqüências relativasPor definição,

1

1

i

n

i mi

n

ii

f px

f

=

=

⋅=

∑ 1 1

1

i i

n ni

m i mni i

ii

f p fr pf= =

=

= = ⋅

∑ ∑∑

,

onde

1

, 1, 2,...,ii n

ii

ffr i nf

=

= =

∑ são freqüências relativas.

Page 74: LivroEstatística.pdf

74

Exemplo 3.9. Calcule a média aritmética da seguinte tabela de fre-qüência, usando processo de freqüências relativas:

Tempo de serviço (anos)

Número de empregados ( fi )

Ponto Médio (pm)

Freqüência Relativa ( fri)

( pmi· fri)

00 05 42 2,5 0,21 0,525

05 10 65 7,5 0,325 2,4375

10 15 23 12,5 0,115 1,4375

15 20 28 17,5 0,14 2,45

20 25 10 22,5 0,05 1,125

25 30 24 27,5 0,12 3,3

30 35 08 32,5 0,04 1,3

Total 200 - 1,00 12.575

Tabela 3.4

Neste caso, temos7

112,575

ii mi

x fr p=

= ⋅ =∑ .

Processo dos desviosPodemos, também, para os dados agrupados, calcular a média arit-mética, considerando um ponto médio qualquer - ( )

omp e a dife-rença entre este e os restantes m mp p−

. Chamamos esta diferença de desvio (d) de mp em relação a mp

( )i om md p p= − . Isto implica

que, im i mp d p= +

. (Levando esta igualdade à fórmula dada no item acima).

1

1

.i

n

i mi

n

ii

f px

f

=

=

=∑

( )1

1

n

i i mi

n

ii

f d p

f

=

=

+=

Page 75: LivroEstatística.pdf

75

1 1

1

.n n

i i i mi i

n

ii

f d f p

f

= =

=

+=

∑ ∑

1 1

1 1

.n n

i i i mi i

n n

i ii i

f d f p

f f

= =

= =

= +∑ ∑

∑ ∑

, pois mp

é constante.

1 1

1 1

n n

i i ii i

mn n

i ii i

f d fp

f f

= =

= =

= +∑ ∑

∑ ∑

Isto é,

1

1

n

i ii

m n

ii

f dx p

f

=

=

= +∑

.

Observação 3.4. Como mp

pode ser uma constante qualquer ar-bitrária, é usual toma-la como um ponto médio intermediário de uma classe da distribuição de freqüência, o que simplificará muito a resolução dos exercícios práticos. Então, mp

passa a ser um ponto médio intermediário arbitrado.

Exemplo 3.10. Dados do exemplo 3.9:

Freqüência ( f )

Ponto Médio (pm)

Desvio( )

Produto( f ·d )

42 2,5 -15 -630

65 7,5 -10 -650

23 12,5 -5 -115

28 17,5 = mp

0 0

10 22,5 5 50

24 27,5 10 240

8 32,5 15 120

200 - - -985

Tabela 3. 5

Page 76: LivroEstatística.pdf

76

Resolução. Neste caso, temos

1

1

n

i ii

m n

ii

f dx p

f

=

=

= +∑

, i i od pm pm= −

98517,5200

− = +

( )17,5 4,925 17,5 4,925= + − = −

12,575= .

3.3 Outras Médias

3.3.1 Média geométrica

A média geométrica G de um conjunto de n valores ( )1 2, ,..., nx x x é a raiz de ordem n ( n -ésimo raiz) do produto desses valores, ou seja:

1 2 ...nnG x x x= × × ×

1

nn i

ix

=

= ∏.

Exemplo 3.11.

A média geométrica entre os números 18, 36 e 72 é:i)

3 318 36 72 46.656 36G = × × = = .

A média geométrica entre os números 1, 9 e 81 é:ii)

3 31 9 81 729 9G = × × = = .

Observação 3.5. Devemos notar que nos exemplos apresentamos números que propositadamente nos conduziram à extração de ra-ízes bem simples. No entanto, em grande parte de exercícios sobre o cálculo da média geométrica (principalmente se tivermos três ou mais valores), somos induzidos a utilizar logaritmos. Veja a seguir.

Page 77: LivroEstatística.pdf

77

Sabemos que 1

nn i

iG x

=

= ∏ , então podemos escrever

1/

1

log lognn

ii

G x=

=

( )1 21 log . ... nx x xn

=

( )1 21 log log ... log nx x xn

= + + +

1

1 logn

ii

xn =

= ∑ .

Portanto,

1

1ant. log logn

ii

G xn =

=

∑ ,

onde a base do logaritmo é preferencialmente decimal.

3.3.2 Média HarmônicaA média harmônica H de uma série de n valores diferentes de zero,

1 2, ,..., nx x x , é, por definição, o inverso da média aritmética dos inver-sos desses valores, ou seja:

1 2 1

11 1 1 1...

n

n i i

nH

x x x xn

=

= =+ + + ∑

,

ou simplesmente

, 01nH x

x

= ≠∑

,

ou

11 xH n

∑= .

Observação 3.6. Quando um elemento da série for igual a zero, a média harmônica será nula, por definição.

Page 78: LivroEstatística.pdf

78

Exemplo 3.12.

A média harmônica entre 18, 36 e 72 será:i)

1 1 1 1 1 1 4 2 1 73 18 36 72 3 72 216H

+ + = + + = = .

Portanto, 216 30,867

H = = .

A média harmônica entre 5, 2 e 8 será:ii)

1 1 1 1 1 1 8 20 5 1 33 113 5 2 8 8 40 3 40 40H

+ + = + + = = = .

Portanto, 40 3,6311

H = = .

iii) A média harmônica entre 1 e 4 será:

1 1 1 1 1 1 4 1 5 52 4 1 2 4 2 4 8H

+ = + = = = .

Portanto, 8 1,65

H = = .

3.3.3 Média QuadráticaA média quadrática Q de uma série de n valores, 1 2, ,..., nx x x , é, por definição, a raiz quadrada da média aritmética dos quadrados des-ses valores, ou seja:

2 2 21 2 ... nx x xQ

n+ + +

=

2

1

n

ii

x

n==∑

,

ou simplesmente2xQ

n∑

= .

Page 79: LivroEstatística.pdf

79

Exemplo 3.13.

A média quadrática dos números 1 e 4 será:i)

2 21 4 1 16 17 8,5 2,92 2 2

Q + += = = = = .

A média quadrática dos números 3, 5 e 6 será:ii)

2 2 23 5 6 9 25 36 70 23,33 4,83 3 3

Q + + + += = = = = .

iii) A média quadrática dos números 1, 2 e 3 será:

2 2 21 2 3 1 4 9 14 4,66 2,163 3 3

Q + + + += = = = = .

3.3.4 Desigualdade entre Quatro MédiasExiste uma desigualdade relacionando as quatro médias (aritméti-ca, geométrica, harmônica e quadrática) dada por

mín máxx G H x Q x≤ ≤ ≤ ≤ ≤ ,

com a igualdade quando 1 2 3 ... nx x x x= = = = , onde

1 2, ,...,mín nx mín x x x= e 1 2, ,...,máx nx máx x x x= .

Uso das médias geométricas, harmônicas e quadráticas:

Como aplicações importantes da i) média geométrica, podemos citar a estimativa do crescimento demográfico e o cálculo do índice do custo de vida.

A ii) média harmônica é particularmente recomendada para sé-ries constituídas de números recíprocos, como, por exemplo, para o cálculo das médias de velocidade (referidas a uma dada distância), do custo médio de artigos (adquiridos com uma de-terminada quantia), etc.

A iii) média quadrática, além de ser usada na Física, será de grande valia no estudo sobre as medidas de dispersão, mais especificamente no cálculo do desvio padrão, que será apre-sentado adiante.

Page 80: LivroEstatística.pdf

80

3.4 Mediana A mediana é o valor médio ou a média aritmética de dois valores centrais de um conjunto de números ordenados (crescente ou de-crescente). Isto é, mediana ( )eM de uma série de n termos, 1 2, ,..., nx x x , colocados em ordem crescente (ou decrescente) de valor, é o termo da série ou a média aritmética de dois valores centrais, que é prece-dido e seguido pelo mesmo número de ocorrências.

3.4.1 Mediana para Dados Isolados

Dado um conjunto qualquer de valores, o primeiro passo é ordená-los. Isto poderá ser feito tanto em ordem crescente quanto decres-cente. O segundo passo é verificar se o número de elementos que compõem este conjunto é par ou ímpar.

Quando a série é constituída de um número (n) ímpar de termos, a posição (P) de mediana é dada por

12

nP += .

Exemplo 3.14. Cálculo da mediana da série 9, 15, 3, 7, 6, 16, 4, 19 e 1.

Colocando os termos em ordem crescente, temos 1, 3, 4, 6, 7, 9, 15, 16, e 19. Neste caso, 9n = , então

1 9 1 52 2

nP + += = = .

Isto é, a mediana é o 5° termo da série ordenada.

Portanto, 7eM = .

Observação 3.7. Quando a série é constituída de um número ( )n par de termos, ela terá dois valores centrais. Neste caso, a mediana é a média aritmética dos dois valores centrais cujas posições são:

'2nP = e '' 1

2nP = + .

A mediana de um grupo de dados ordenados separa a metade inferior da amostra, população ou probabilidade de distribuição, da metade superior. Mais concretamente, 1/2 da população terá valores inferiores ou iguais à mediana e 1/2 da população terá valores superiores ou iguais à mediana. Fonte: http://pt.wikipedia.org/wiki/Mediana

Page 81: LivroEstatística.pdf

81

Exemplo 3.15. Cálculo da mediana da série 3, 4, 7, 12, 15, 10, 18 e 14.

Resolução. Colocando em ordem crescente, temos 3, 4, 7, 10, 12, 14, 15 e 18. Como o número de termos é par, 8n = , a mediana será a média aritmética dos dois termos centrais com posições:

8' 42 2nP = = = e

8'' 1 1 52 2nP = + = + = .

Tomando então a média aritmética do 4° e do 5° termos da série, tem-se finalmente a mediana, ou seja, a mediana é

10 12 22 112 2eM +

= = = .

Observação 3.8. Neste exemplo, a mediana é um valor que não é termo da série, mas não prejudica a definição introduzida.

Exemplo 3.16. Suponha que o seguinte conjunto de dados represente os salários (em reais) para uma amostra de sete profissionais na área da educação que recentemente colaram grau em sua faculdade:

4.600 3.700 6.900 6.300 7.400 4.800 5.300

Resolução. A disposição ordenada torna-se:

3.700 4.600 4.800 5.300 6.300 6.900 7.400

Exemplo 3.17. Suponha que o seguinte conjunto de dados represen-te a idade (em anos) de uma amostra de oito funcionários da Escola Estadual “Nova Esperança”:

42 34 32 27 39 29 45 30

Resolução. A disposição ordenada torna-se:

27 29 30 32 34 39 42 45

Mediana = 32 34 33

2+

= .

Exemplo 3.18. Suponha que o seguinte conjunto de dados repre-sente os salários (em reais) de uma amostra de sete funcionários da Escola Estadual “Nova Esperança”:

Mediana

Page 82: LivroEstatística.pdf

82

2.100 1.900 3.400 2.800 1.800 2.400 1.900

Resolução. A disposição ordenada torna-se:

1.800 1.900 1.900 2.100 2.400 2.800 3.400

3.4.2 Mediana para Dados AgrupadosValores isolados ponderados (não agrupados em classes)•Variável discreta

Quando estamos trabalhando com dados tabulados, mas não agru-pados em classe, ou seja, quando aparecem repetições de valores, o cálculo da mediana é feito através de um procedimento análogo, lembrando, contudo, que agora temos freqüências correspondentes a cada variável.

Desta forma, precisamos acumular freqüências, permitindo, com isto, localizar o elemento que divide esta observação em duas partes iguais. Para tal, é preciso verificar se o número de observações é ím-par ou par e, para cada caso, aplicar os critérios anteriores.

Exemplo 3.19. Cálculo da mediana dos seguintes dados:

x f fa

2 2 2

4 5 7

5 8 15

7 6 21

8 4 25

Total 25 -

Quadro 3.3

Neste caso, 25 1 13

2P +

= = .

O elemento mediano ocupa a 13ª posição do conjunto, sendo, por-tanto, 5, isto é, 5eM = .

Mediana

Page 83: LivroEstatística.pdf

83

Exemplo 3.20. Cálculo da mediana da seguinte tabela:

x f fa

3 5 5

5 4 9

6 6 15

7 8 23

9 3 26

Total 26 -

Quadro 3.4

Neste caso, temos

26' 132

P = = e 26'' 1 142

P = + = .

A mediana será o valor médio dos valores das 13ª e 14ª posições. Isto é,

6 6 62eM +

= = .

Valores agrupados em classe•Variável Contínua

Quando uma série é agrupada em classes de freqüência, a mediana corresponde ao termo que divide a série em duas partes iguais, isto

é, é o valor que é precedido e seguido por 50% ou 2n

dos termos da série.

Em uma distribuição de freqüência, chama-se classe mediana, a classe que contém a mediana.

A fórmula para o cálculo da mediana é dada por:

2 a

e i

n fM L h

f

−= + × ,

onde

eM = = mediana;

iL = = limite inferior da classe que contém a mediana;

Page 84: LivroEstatística.pdf

84

n = = número de termos da série;

af = = freqüência acumulativa da classe vizinha anterior à classe mediana;

f = = freqüência da classe mediana;

h = = amplitude da classe mediana.

Exemplo 3.21. Calcular a mediana dos 40 alunos da Escola Estadual “Esperança”.

i Estaturas (cm) Freqüências Freqüência Acumulada

1 150 154 4 4

2 154 158 9 13

3 158 162 11 24

4 162 166 8 32

5 166 170 5 37

6 170 174 3 40

Total 40

Tabela 3.6

Resolução. Temos 40 20

2 2n

= = , a classe da Mediana é a terceira.

MDLi = 158; n = 40; fa= 13; h = 4; f = 11.

Logo,

Me

40 13 42158

11dM

− × = +

(20 13) 415811

− ×= +

158 2,545 160,545= + = .

Portanto, a mediana dos 40 alunos da Escola Estadual “Esperança” é 160,545 cm.

Page 85: LivroEstatística.pdf

85

Exemplo 3.22. Cálculo da mediana de distribuição de notas dadas em classe:

Notas (Classe) Alunos ( f ) ( fa)

0 10 3 3

10 20 7 10

20 30 12 22

30 40 34 56

40 50 48 104

50 60 90 194

60 70 54 248

70 80 52 300

80 90 15 315

90 100 5 320

Total 320

Tabela 3.7

Resolução. Temos os seguintes dados:

1602n

= , 104af = , 50iL = , 90f = , 10h = .

Portanto, a classe mediana é 50 60.

2 a

e i

n fM L h

f

−= + ×

160 10450 1090−

= + ×

56050 50 6,2 56,290

= + = + = .

A mediana igual à nota 56,2 revela que tal resultado coloca tantos alunos com notas inferiores a 56,2 quanto com notas superiores a 56,2.

Page 86: LivroEstatística.pdf

86

Gráfico da mediana:

Classe03

1022

56

104

160

194

248

300315320

10 20 30 40 50 60 70 80 90 100

Me = 56,2

fa

Gráfico 3.1

Exemplo 3.23. Cálculo da mediana da seguinte distribuição de fre-qüência:

Tempo de serviço(anos)

Freqüência( f )

Freqüência acumulada( fa)

00 05 42 42

05 10 65 107

10 15 23 130

15 20 28 158

20 25 10 168

25 30 24 192

30 35 08 200

Total 200

Tabela 3. 8

Resolução. Neste caso, temos

1002n

= , 42af = , 5iL = , 65f = e 5h = .

Page 87: LivroEstatística.pdf

87

Portanto, a classe mediana é 5 10. Logo,

100 42 58 585 5 5 5 565 65 13eM −

= + × = + × = + =

5 4,46 9,46= + = .

Gráfico da mediana:

Classe50

42

fa

100107

130

158

168

192200

10 15 20 25 30 35

Gráfico 3. 2

Observação 3.9. A mediana

não depende de todos os valores da série, podendo mesmo se i) alterar com a modificação de alguns dados;

não é influenciada pelos valores extremos;ii)

pode ser calculada para distribuição com limites indetermi-iii) nados (indefinidos) na maioria dos casos.

3.5 Moda

A moda é o valor que ocorre com maior freqüência em um dado con-junto de números. Isto é, moda ou norma ( )oM de uma série de n valores, 1 2, ,..., nx x x , é o valor que se repete o maior número de vezes.

Page 88: LivroEstatística.pdf

88

Observação 3.10. A moda pode não existir e, quando existir, pode não ser única.

Exemplo 3.24. Suponha que o seguinte conjunto de dados represen-te a idade (em anos) de uma amostra de nove funcionários da Escola Estadual “Nova Esperança”:

42 34 32 27 39 29 34 30 26

Resolução. A moda é 34 anos.

Exemplo 3.25. Suponha que o seguinte conjunto de dados repre-sente a idade (em anos) de uma amostra de cinco profissionais de departamento financeiro da empresa “Capital”:

34 32 27 29 45

Resolução. Neste caso não existe moda (amodal).

Exemplo 3.26. Suponha que o seguinte conjunto de dados represen-te a idade (em anos) de uma amostra de nove funcionários da Escola Estadual “Nova Esperança”:

42 37 32 27 39 29 37 42 26

Resolução. Neste caso existem duas modas 37 anos e 42 anos.

3.5.1 Caso de Dados Isolados e/ou Não Agrupados em Classe

Série amodalÉ aquela em que todos os seus valores ocorrem com a mesma fre-qüência, ou seja, não existe moda.

Série amodal

Gráfico 3.3

Page 89: LivroEstatística.pdf

89

Exemplo 3.27. Não existe moda da série 3, 5, 8, 4, 2, 1, 7, 9 e 10, pois todos os números são diferentes entre si (possuem freqüência unitá-ria). O mesmo ocorre com o conjunto de números 2, 2, 3, 3, 7, 7, 4, 4, 5 e 5, onde todos os valores têm a mesma freqüência (2).

Série modal (ou unimodal)•

Neste caso, existe única moda.

Série modal

Gráfico 3. 4

Exemplo 3.28. Determinar a moda da série

3, 4, 4, 8, 4, 5, 4, 3, 4, 9, 4, 3 e 6.

Resolução. Uma simples inspeção dos números indica que a moda é 4, valor que tem freqüência (6) maior que qualquer outro valor da série.

Série bimodalNeste caso, existem duas modas.

Gráfico 3. 5

Exemplo 3.29. A série 3, 5, 5, 5, 9, 10, 10, 10, 10, e 15 é bimodal, pois possui duas modas (5 e 10).

Page 90: LivroEstatística.pdf

90

Série multimodal (ou plurimodal)Neste caso, existem mais que duas modas.

o o o

Gráfico 3. 6

Exemplo 3.30.

x f

3 5

5 8

7 4

8 8

10 7

12 8

15 3

20 1

Total 44

Quadro 3. 5

Neste exemplo temos 3 modas 5, 8 e 12.

3.5.2 Cálculo da Moda para Dados Agrupados em Classes

Em uma distribuição de freqüência, denominamos classe modal a classe que possui a mais alta freqüência ou, conseqüentemente, a classe que contém a moda.

Moda bruta é, por definição, o ponto médio da classe modal.

Page 91: LivroEstatística.pdf

91

Exemplo 3.31. Na distribuição seguinte a classe modal é a quarta classe (6 8), e a moda bruta é 7.

Notas em prova (classe) Alunos ( f )

0 2 9

2 4 19

4 6 26

6 8 32

8 10 14

Total 100

Tabela 3. 9

A seguir, daremos uma fórmula para cálculo de moda dos dados agrupados em classes.

O cálculo do valor da moda 0( )M de dados apresentados em tabelas de distribuição de freqüências é dado pela seguinte fórmula (fórmu-la de Czuber):

10 1

1 2

M L h∆= + ×

∆ + ∆i1

0 11 2

M L h∆= + ×

∆ + ∆,

onde

1Li = limite inferior da classe modal;

h = amplitude da classe;

=∆1 = diferença entre a freqüência da classe modal e a imediatamente anterior;

=∆2 = diferença entre a freqüência da classe modal e a imediatamente posterior.

Exemplo 3.32. Calcular a moda dos quarenta alunos da Escola Esta-dual “Esperança”.

i Estaturas(cm) Freqüências

1 150 154 4

2 154 158 9

3 158 162 11

Page 92: LivroEstatística.pdf

92

4 162 166 8

5 166 170 5

6 170 174 3

Total 40

Tabela 3. 10

Resolução. Neste caso, temos que a classe modal é a terceira.

L = 158; h = 4; =∆1 11 – 9 = 2; =∆2 11 – 8 = 3.

02158 4

2 3M = + ×

+

2158 4 158 1,6 159,605

= + × = + = .

Portanto, a moda dos quarenta alunos da Escola Estadual “Esperança” é 159,60 cm.

Vamos conferir se você está acompanhando tudo até aqui? Para sa-ber, procure atender aos exercícios propostos a seguir.

Exercícios Propostos

Calcular a média aritmética da seguinte distribuição de fre-1) qüência:

Classe Freqüência

0 4 2

4 8 6

8 12 8

12 16 3

16 20 1

Tabela 3.11

Resposta. Média aritmética = 9.

Page 93: LivroEstatística.pdf

93

Feito um levantamento sobre os salários (pagos em dólar) de 2) 20 funcionários de uma empresa multinacional, pode-se ela-borar o seguinte quadro de distribuição:

Classes de Salários Freqüência

50 100 3

100 150 4

150 200 10

200 250 2

250 300 1

Tabela 3. 12

Nessas condições:

determine a distribuição de freqüência acumulada;a)

calcule a média dessa distribuição;b)

determine o valor da mediana.c)

Respostas:

a)

Classes de Salários Freqüência Freq.Acum.

50 100 3 3

100 150 4 7

150 200 10 17

200 250 2 19

250 300 1 20

Tabela 3. 13

b) 160;

c) 165.

Page 94: LivroEstatística.pdf

94

3) Dada a distribuição de freqüência abaixo,

Pesos (em kg) Freqüência

145 151 10

151 157 9

157 163 8

163 169 6

169 175 3

175 187 3

181 1

40=∑Tabela 3. 14

determinar:

a média; a)

moda; b)

mediana. c)

Respostas. a) 159,4 kg; b) 150,8 kg; c) 157,8 kg.

Uma amostra de 85 valores tem média 82,31. Uma segunda 4) amostra, de 35 valores, tem média 81,52. Calcular a média combinada dos 120 valores.

Resposta. 82,08.

No quadro abaixo está a distribuição dos salários mensais (em 5) reais) de 40 funcionários da Empresa “Sorriso e Sossego”.

Salários(em R$) Número de funcionários

800 900 4

900 1.000 10

1.000 1.100 18

1.100 1.200 5

1.200 1.300 3

Tabela 3. 15

Page 95: LivroEstatística.pdf

95

Nessas condições:

Elabore um quadro de distribuição de freqüências relativas a) e de freqüências relativas acumuladas.

Quantos funcionários dessa empresa ganham menos de b) R$1.000,00 mensais?

Qual o índice em % dos funcionários dessa empresa que c) ganham mais de R$1.000,00 mensais?

Quantos funcionários dessa empresa ganham entre R$800,00 d) e R$1.200,00, inclusive?

Respostas. b) 14; c) 65%; d) 37.

6) Determinar a média aritmética dos valores apresentados no quadro abaixo.

xi Freqüência - Fi

2 5

3 10

4 15

5 12

6 5

7 3

Quadro 3. 6

Resposta. Média = 4,22.

7) (FUVEST –SP) (Fundação Universitária para o Vestibular). Numa classe com vinte alunos, as notas do exame final po-diam variar de 0 a 100, e a nota mínima para aprovação era 70. Realizado o exame, verificou-se que 8 alunos foram repro-vados. A média aritmética das notas desses 8 alunos foi 65, enquanto a média dos aprovados foi 77. Após a divulgação dos resultados, o professor verificou que uma questão havia sido mal formulada e decidiu atribuir 5 pontos a mais para todos os alunos. Com essa decisão, a média dos aprovados passou a ser 80 e a dos reprovados, 68,8.

Page 96: LivroEstatística.pdf

96

Calcule a média aritmética das notas da classe toda antes a) da atribuição dos cinco pontos.

Com a atribuição dos cinco pontos extras, quantos alunos, b) inicialmente reprovados, atingiram nota para aprovação?

Respostas. a) 72,2; b) 3.

8) (FGV) A tabela a seguir apresenta a distribuição de freqüências dos salários de um grupo de 50 empregados de uma empresa, num certo mês.

Número da classe Salário do mês em reais Número de empregados

1 1.000 2.000 20

2 2.000 3.000 18

3 3.000 4.000 9

4 4.000 5.000 3

Tabela 3. 16

O salário médio desses empregados nesse mês foi de:

R$ 2.637,00a)

R$ 2.420,00b)

R$ 2.520,00c)

R$ 2.400,00d)

R$ 2.500,00e)

Resposta. d)

9) (UNICAMP – SP) A média aritmética das idades de um gru-po de 120 pessoas é de 40 anos. Se a média aritmética das idades das mulheres é de 35 anos e a dos homens é de 50 anos, qual o número de pessoas de cada sexo?

Resposta. São 80 mulheres e 40 homens.

Page 97: LivroEstatística.pdf

97

ResumoNeste capítulo explicamos várias medidas de tendência central, que também são conhecidas com medidas de posição. As principais me-didas são: média, mediana e moda. Também explicamos outras mé-dias, tais como: médias harmônicas, geométricas e quadráticas.

Através dos diversos exemplos, o leitor deve ter observado também que o estudo deste capítulo contribuiu para a compreensão de como se desenvolve toda a Estatística Descritiva.

Page 98: LivroEstatística.pdf
Page 99: LivroEstatística.pdf

Capítulo 4Medidas de Dispersão e Utilização das Planilhas

Page 100: LivroEstatística.pdf
Page 101: LivroEstatística.pdf

101

Capítulo 4Medidas de Dispersão e Utilização das Planilhas

As medidas como variância e desvio padrão também têm sua importância em estatística, por isso, vamos estudá-las. Estudo de planilha via computador é um dos assuntos importantes que também serão abordados neste capítulo.

4.1 IntroduçãoNo capítulo anterior, aprendemos a calcular e a entender convenien-temente as medidas de posição representativas de uma determina-da série, em que destacamos a média, a mediana e a moda.

Muitas vezes apenas os cálculos ou as apresentações de um valor es-pecífico para um conjunto qualquer não são suficientes para carac-terizar uma distribuição ou um conjunto de valores. Por exemplo, consideremos quatro grupos de alunos com as seguintes notas:

Grupo • A : 7, 7, 7, 7 e 7

Grupo • B : 5, 6, 7, 8 e 9

Grupo • C : 4, 5, 7, 9 e 10

Grupo • D : 0, 5, 10, 10 e 10.

Para representarmos cada grupo, podemos calcular a sua respecti-va média aritmética. Assim, encontramos que 7A B C Dx x x x= = = = . Portanto, vemos que, apesar de constituídos de valores diferentes, os grupos revelam uma mesma média aritmética, 7.

Vamos considerar agora outro exemplo de uma empresa que opera em três turnos. No final de cada semana, a produção apresentada foi a seguinte:

Page 102: LivroEstatística.pdf

102

DiaTurno

2ª Feira

3ª Feira

4ª Feira

5ª Feira

6ª Feira

Total Média

I 150 150 150 150 150 750 150

II 70 130 150 180 220 750 150

III 15 67 117 251 300 750 150

Tabela 4.1

Assim, se este departamento enviasse um relatório mostrando es-pecificamente a produção média diária, dificilmente iríamos iden-tificar o grau de relacionamento entre as variáveis (produção). Isto porque todos os turnos estavam mantendo a mesma produção mé-dia semanal de 150 peças.

Nos dois exemplos, vemos que há necessidade de uma medida estatística complementar para melhor caracterizar cada conjunto apresentado.

As medidas de dispersão indicam se os valores estão relativamen-te próximos uns dos outros, ou separados. Todas elas têm na mé-dia o ponto de referência.

As medidas estatísticas responsáveis pela variação ou dispersão dos valores de uma série ou de um conjunto de dados apresentados são as medidas de dispersão ou variabilidade, tais como:

desvio médio;i)

desvio padrão;ii)

variância;iii)

coeficiente de variação.iv)

As medidas de dispersão nos oferecem condições para analisarmos até que ponto estes valores apresentam oscilações para mais ou para menos em relação a uma medida de posição fixada.

Em princípio, diremos que entre duas ou mais séries, a mais dis-persa (ou menos homogênea) é aquela que tem a maior medida de dispersão.

Utilizaremos o termo dispersão para indicar o grau de afastamento de um conjunto de números em relação à sua média.

Page 103: LivroEstatística.pdf

103

Antes de apresentar as medidas de dispersão, apresentaremos, a se-guir, o conceito de amplitude.

4.2 AmplitudeAmplitude ou intervalo total ( )tI de uma série de n termos,

1 2, , ..., nx x x , é definida como a diferença entre os valores extremos da série, ou seja:

t máx mínI x x= − ,onde:

tI = amplitude ou intervalo total;

máxx = valor máximo da série, isto é, 1 2, , ..., nmáx x x x ;

mínx = valor mínimo da série, isto é, 1 2, , ..., nmín x x x .

Exemplo 4.1. Suponha que o seguinte conjunto de dados represente a idade (em anos) de uma amostra de oito professores da Escola Es-tadual “Esperança”:

42 34 32 27 39 29 45 30

Resolução. A disposição ordenada torna-se:

27 29 30 32 34 39 42 45

Amplitude total = 45 – 27 = 18.

A utilização da amplitude total como medida de dispersão é muito limitada, pois, sendo uma medida que depende apenas dos valores externos, é instável, não sendo afetada pela dispersão dos valores internos.

A amplitude nos dá idéia do campo de variação dos valores da série. Apesar de serem de fácil obtenção, não são muito utilizadas, visto que elas não levam em consideração as flutuações apresentadas em relação aos valores internos da distribuição.

Quando os dados estiverem em uma tabela de freqüência, com da-dos agrupados em classe, podemos utilizar dois processos na obten-ção da amplitude.

Page 104: LivroEstatística.pdf

104

Um deles segue o mesmo raciocínio anterior, sendo que a amplitude é obtida pela diferença entre o limite superior da última classe e o limite inferior da primeira classe, assim,

t máx mínI x x= − .

O outro processo utiliza a diferença entre o ponto médio da última classe e o ponto médio da primeira classe, ou seja: tI = (ponto mé-dio da última classe) – (ponto médio da primeira classe).

Exemplo 4.2. Vamos considerar a tabela de distribuição de freqüência abaixo:

Classe Freqüência( f )

Ponto Médio(pm)

0 2 5 1

2 4 3 3

4 6 8 5

6 8 3 7

8 10 1 9

Total 20 -

Tabela 4.2

Resolução.

Primeiro processo:•

10 0 10tI = − =

Segundo processo:•

9 1 8tI = − = .

4.3 Desvio MédioDesvio Médio é a média aritmética dos valores absolutos dos des-vios da distribuição em relação a uma medida de tendência central: média ou mediana.

Page 105: LivroEstatística.pdf

105

Chamamos de desvio ( )id em relação à média a diferença entre cada elemento de um conjunto de valores e a média aritmética, isto é,

xxd ii −= .

Exemplo 4.3. Sabendo-se que um funcionário da Escola Estadual “Esperança” trabalha, durante uma semana, 10, 14, 13, 15, 16, 18 e 12 horas, temos que a média de trabalho da semana foi de:

10 14 13 15 16 18 12 14 horas7

x + + + + + += = .

Determine o desvio ( )id em relação à média ( 14x = ).

Resolução. Aplicando a fórmula xxd ii −= , temos

1 1

2 2

3 3

4 4

10 14 4;14 14 0;13 14 1;15 14 1;

d x xd x xd x xd x x

= − = − = −= − = − == − = − = −= − = − =

5 5

6 6

7 7

16 14 2;18 14 4;12 14 2.

d x xd x xd x x

= − = − == − = − == − = − = −

Observe que na determinação de cada desvio id estaremos medindo a dispersão entre cada ix e a média x . Temos que a soma algébrica dos desvios em relação à média é zero, isto é,

∑=

=n

iid

1

0 .

4.3.1 Desvio Médio Absoluto – Dados Isolados

Desvio médio absoluto é uma medida de dispersão, pois as medidas de dispersão (que têm a média como ponto de referência) indicam se os valores estão relativamente próximos uns dos outros, ou sepa-rados.

Desvio médio ( )md de uma série de n termos, 1 2, ,..., nx x x , é a mé-dia aritmética dos desvios absolutos tomados em relação à sua mé-dia aritmética, ou seja:

Page 106: LivroEstatística.pdf

106

1 1

N N

i ii i

m

d x xd

n n= =

−= =

∑ ∑ ,

ou simplesmente

m

dd

n∑

= ,

onde,

md = desvio médio;

d = desvio, afastamento, resíduo ou discrepância dos termos da série, calculados em relação à média aritmética ( )d x x= − sem considerar sinal, ou seja, desvio absoluto;

n = número de termos da série.

Observação. 4.1. Definimos desvio médio a partir dos desvios ab-solutos, pois se assim não fosse, a soma deles seria sempre nula em virtude da propriedade da média aritmética (a soma dos desvios calculados em relação à média aritmética é nula).

Exemplo 4.4. Seja 2, 5, 8,15, 20x = .

Resolução. A média do conjunto acima é:

2 5 8 15 20 105

ixxn

∑ + + + += = = .

Logo, o desvio médio absoluto é

im

x xd

n∑ −

=

2 10 5 10 8 10 15 10 20 10

5− + − + − + − + −

=

8 5 2 5 10 30 6

5 5+ + + +

= = = .

Exemplo 4.5. Com os dados do exemplo apresentado em 4.3, tem-se o Desvio Médio Absoluto (DMA)

7

1 4 0 1 1 2 4 2 14 2.7 7 7

ii

x xDMA =

− − + + − + + + + −= = = =

Page 107: LivroEstatística.pdf

107

4.3.2 Dados Isolados Ponderados e Agrupados em Classe

Quando os dados se apresentarem ordenados em uma tabela de fre-qüência, agrupados em classe ou isolados ponderados, utilizamos a seguinte fórmula:

md f

df

∑ ×=

∑,

onded x x= − (no caso de dados repetidos);

md p x= − (no caso de dados agrupados em classe);

x = média aritmética;

mp = ponto médio;

f = freqüência da classe.

Podemos também calcular desvio médio usando a mediana, em lu-gar de média. Basta fazer:

m

d fd

f∑ ×

=∑

,

onde

ed x M= − ou m ep M− ,

eM = mediana;

e demais variáveis como acima.

Exemplo 4.6. Cálculo do desvio médio dos seguintes dados:

usando a ma) édia:

x f x · f d · f5 4 20 3,2 12,8

6 5 30 2,2 11,0

8 12 96 0,2 2,4

10 4 40 1,8 7,2

12 5 60 3,8 19,0

Total 30 246 - 52,4

Tabela 4.3

Page 108: LivroEstatística.pdf

108

Resolução.246 8,230

i i

i

f xxf

∑= = =

∑,

e. 52,4 1,75

30i i

mi

d fd

f∑

= = =∑

.

usando a mediana:b)

x f f · x f · d

5 4 20 3 12

6 5 30 2 10

8 12 96 0 0

10 4 40 2 8

12 5 60 4 20

Total 30 246 - 50

Tabela 4.4

Resolução.

30' 15ª2 2nP = = = e

30'' 1 16ª2

P = + = ,

8 8 82eM +

= = ,

e

. 50 1,6730

i im

i

d fd

f∑

= = =∑

.

Exemplo 4.7. Considerando o tempo de serviço (em anos) dos 200 servidores públicos da Escola Estadual “Sena Figueiredo”, da cidade XX, do Estado de Santa Catarina até janeiro de 2006, calcular o des-vio médio dos dados a seguir:

usando a média:a)

Tempo de serviço (anos)

f Pm d · f

0 5 42 2,5 10,075 423,15

5 10 65 7,5 5,075 329,875

Page 109: LivroEstatística.pdf

109

10 15 23 12,5 0,075 1,725

15 20 28 17,5 4,925 137,9

20 25 10 22,5 9,925 99,25

25 30 24 27,5 14,925 358,2

30 35 08 32,5 19,925 159,4

Total 200 - - 1.509,5

Tabela 4.5

Resolução.12,575i i

i

f xxf

∑= =

∑,

e

. 1.509,5 7,547200

i im

i

d fd

f∑

= = =∑

.

usando a mediana: b) m ed p M= −

Tempo de serviço (anos) f Pm d · f

0 5 42 2,5 10,075 423,15

5 10 65 7,5 5,075 329,875

10 15 23 12,5 0,075 1,725

15 20 28 17,5 4,925 137,9

20 25 10 22,5 9,925 99,25

25 30 24 27,5 14,925 358,2

30 35 08 32,5 19,925 159,4

Total 200 - - 1.462,3

Tabela 4.6

Resolução.

9,45eM =

e

. 1.462,3 7,311200

i im

i

d fd

f∑

= = =∑

.

Page 110: LivroEstatística.pdf

110

Observação 4.2.

O i) desvio médio depende de todos os valores da distribuição, fazendo com que seu resultado apresente maior segurança em relação à amplitude total.

Seu cálculo pode ser efetuado a partir da média ou da media-ii) na, sendo mínimo quando calculado a partir da mediana.

Não levamos em consideração a existência de desvios negati-iii) vos, porque eles são medidos em termos absolutos.

4.4 Variância

A variância de uma amostra de valores (dados não agrupados),

1 2, ,..., nx x x , é definida como sendo a média dos quadrados dos des-vios das medidas em relação à sua média x , evitando, com isso, que

∑=

=n

iid

1

0 . A variância da amostra é dada por

2

2 1( )

N

ii

x xs

n=

−=

∑ ,

ou pela fórmula alternativa2

2

2

ii

ii

xx

nsn

=

∑∑

.

Variância de uma série é o quadrado do desvio padrão desta série. É representado por 2s e suas fórmulas de cálculo são as mesmas vistas anteriormente para o desvio padrão:

22 ds

n∑

= .

Alternativamente, se os dados estão apresentados em uma tabela de distribuição de freqüências, para obter a variância, aplica-se a seguinte fórmula:

22

2

( )i ii i

x fx f

nsn

× −=

∑∑,

A variância de uma variável aleatória é uma medida da sua dispersão estatística, indicando quão longe em geral os seus valores se encontram do valor esperado. Fonte: http://pt.wikipedia.org/wiki/Variancia

Page 111: LivroEstatística.pdf

111

onde

ix são os valores dados;

if são as freqüências, e

in f= ∑ número total de observações.

Exemplo 4.8. Calcule a variância dos seguintes valores: 2, 5, 5, 6 e 7.

Resolução. Você tem:

xi xi2

2 45 255 256 367 49

25ix∑ = 2 139ix∑ =

Tabela 4.7

Aplicando a fórmula

( )22

2

ii

xx

nsn

∑∑ −

= , vem

2

625139 139 125 145 2,85 5 5

s− −

= = = = .

Exemplo 4.9. Calcule a variância da altura dos quarenta alunos da Escola Estadual “Esperança”, do exemplo 3.7.

Resolução. Veja o quadro a seguir:

Estaturas (cm) fi xi xi2 xi

2 fi xi fi

150 | 154 4 152 23104 92416 608

154 | 158 9 156 24336 219024 1404

158 | 162 11 160 25600 281600 1760

162 | 166 8 164 26896 215168 1312

166 | 170 5 168 28224 141120 840

170 | 174 3 172 29584 88752 516

if∑ = 40 1.038.080 6440

Tabela 4.8

Page 112: LivroEstatística.pdf

112

Aplicando a fórmula

22

2

( )i ii i

x fx f

nsn

∑∑ −

= , vem

2

2

(6440)1.038.08040

40s

−=

2 1.038.080 1.036.840 3140

s −= = .

4.5 Desvio Padrão É definido como a raiz quadrada da média aritmética dos quadra-dos dos desvios em relação à média. É a mais importante medida de variabilidade, ou seja, o desvio padrão de uma série de n termos,

1 2, , ..., nx x x , é a média quadrática dos desvios calculados em relação à média aritmética da série, e é dada por

n

xxs i

i∑ −=

2)(,

ou

nn

xx

s

ii

ii

2

2

−=

∑∑

,

ou

2

1

N

ii

ds

n==∑

,

ou, simplesmente,

2dsn

∑= ,

O termo “desvio padrão” foi introduzido na estatística por Karl Pearson. Ele foi o fundador do Departamento de Estatística Aplicada (Department of Applied Statistics) na University College London em 1911.

Page 113: LivroEstatística.pdf

113

ondes = desvio padrão;

d = desvio em relação à média ( )d x x= − ;

n = número de termos da série.

Tomando os desvios em relação a uma constante intermediária arbi-trária ( )0x , a fórmula para o cálculo do desvio padrão se torna:

22d dsn n

∑ ∑ = −

.

Onde

0d x x= − (desvio em relação a um valor arbitrário).

Para facilitar ainda mais os cálculos, podemos usar 0 0x = , o que re-sulta em 0d x x= − = . Então, a fórmula anterior transforma-se em:

22x xsn n

∑ ∑ = −

.

Exemplo 4.10. Calcule o desvio padrão dos números 2, 5, 5, 6 e 7.

Resolução. Pelo exemplo 4.8 você tem que a variância é 2,8, ou seja, 2 2,8s = . Logo, o desvio padrão s será 2,8 1,67s = = .

Portanto, o desvio padrão dos números 2, 5, 5, 6 e 7 é 1,67.

Exemplo 4.11. Calcule o desvio padrão dos dados do exemplo 3.7.

Resolução. Pelo exemplo 4.9 você tem que a variância é 31. Logo, o desvio padrão é 31 5,56s = = .

4.6 Coeficiente de VariaçãoAté o momento, estudamos medidas absolutas de dispersão, cujas unidades de medida, com exceção da variância, são as mesmas dos termos da série.

Page 114: LivroEstatística.pdf

114

O coeficiente de variação é útil para a comparação, em termos re-lativos, do grau de concentração em torno da média de séries dis-tintas. Ele mede percentualmente a relação entre o desvio padrão e a média aritmética, sendo, pois, uma medida adimensional. Sua expressão de cálculo é:

100%sCV

x= × ;

ondeCV = coeficiente de variação;

s = desvio padrão;

x = média aritmética.

Observação 4.3. O coeficiente de variação é usado principalmente na comparação das unidades diferentes, como: salário com peso, kg com cm, etc.

Exemplo 4.12. Calcule o coeficiente de variação do exemplo 3.7, cuja altura média é 161 cm.

Resolução. Pelo exemplo 4.11, você tem 5,56s = e a média aritmé-tica é 161x = cm. Logo,

100%sCVx

= ×

5,56 100% 3,453%161

CV = × =

Exemplo 4.13. Sejam as distribuições de pesos e estaturas com as seguintes características:

distribuição de peso: i) 1 57,7 kgx = e 1 7,5kgs = ;

distribuição de estaturas: ii) 2 170,0 cmx = e 2 7,1 cms = .

Calcule os coeficientes de variação.

Resolução.

i) 1

11

7,5100 100 12,9957,7

SCVx

= × = × = , isto é, 1 13,0 %CV ≅

ii) 22

2

7,1100 100 4,117170,0

SCV

x= × = × = , isto é, 2 4,176%CV ≅

Page 115: LivroEstatística.pdf

115

Vemos, assim, que a distribuição de estaturas é mais homogênea (mais dispersa) que a distribuição de pesos.

Exemplo 4.14. Considerando os dados do exemplo 4.3, calcular sua variância, desvio padrão e coeficiente de variação.

Resolução. Inicialmente, vamos calcular a variância:

2 2 2 21 (10 14) (14 14) (13 14)7

s = − + − + −

2 2 2 2(15 14) (16 14) (18 14) (12 14) + − + − + − + −

16 0 1 1 4 16 4 42 67 7

+ + + + + += = = .

Vamos mostrar o cálculo da variância pela fórmula alternativa:

xi xi2

10 100

14 196

13 169

15 225

16 256

18 324

12 144

98=∑i

ix 98 ∑ =

iix 14142

1414

Tabela 4.9

2

2

(98)1414 1414 1372 427 67 7 7

s− −

= = = = .

Agora, vamos ao cálculo do desvio padrão:

4495,26 ==s .

Finalmente, temos o cálculo do coeficiente de variação:

2,4495 100 % 17,5%14

CV = × = .

Page 116: LivroEstatística.pdf

116

Exemplo 4.15. Um fabricante produz certos tipos de materiais es-colares. Inspecionaram-se dez itens. Os números de defeitos por unidade são: 1, 0, 3, 4, 2, 1, 0, 3, 1, 2. Calcule a média, a variância, o desvio padrão e o coeficiente de variação do número de defeitos.

Resolução. Cálculo da média:

1 0 3 4 2 1 0 3 1 2 17 1,710 10

x + + + + + + + + += = = .

Cálculo da variância:

2 2 2 2 2 21 (1 1,7) (0 1,7) (3 1,7) (4 1,7) (2 1,7)10

s = − + − + − + − + −

2 2 2 2 2(1 1,7) (0 1,7) (3 1,7) (1 1,7) (2 1,7) + − + − + − + − + −

0,49 2,89 1,69 5,29 0,09 0,49 2,89 1,69 0,49 0,0910

+ + + + + + + + +=

16,10 1,6110

= = .

Cálculo do desvio padrão:

1,61 1,2689s = = .

Cálculo do coeficiente de variação:

1,2689 100 % 74,64%1,7

CV = × = .

Exemplo 4.16. Considere as informações, obtidas na secretaria, re-lativas ao número de faltas ao trabalho, durante o mês de Maio/X1, dos quarenta funcionários da Escola Estadual “ESPERANÇA”. Calcular a variância e o desvio padrão.

Número de faltas Número de funcionários

0 15

1 10

2 5

3 5

4 1

Page 117: LivroEstatística.pdf

117

5 1

6 0

7 3

Quadro 4.1

Resolução. Os cálculos intermediários estão apresentados a seguir.

x f x × f x2 x2 × f

0 15 0 0 0

1 10 10 1 10

2 5 10 4 20

3 5 15 9 45

4 1 4 16 16

5 1 5 25 25

6 0 0 36 0

7 3 21 49 147

40=∑ ∑ = 65 ∑ = 263

Tabela 4.10

Cálculo da variância:•

2

2

(65)263 263 105,6340 3,934440 40

s− −

= = = .

Cálculo do desvio padrão: •

9835,19344,3 ==s .

Vamos conferir se você está acompanhando tudo até aqui? Para sa-ber, procure atender aos exercícios propostos abaixo.

Exercícios Propostos

Calcular a variância e o desvio padrão da seguinte distribui-1) ção de freqüência:

Page 118: LivroEstatística.pdf

118

Classe Freqüência

0 4 2

4 8 6

8 12 8

12 16 3

16 20 1

Tabela 4.11

Resposta. Variância = 15,8; desvio padrão = 9,37.

Feito um levantamento sobre os salários (pagos em dólar) de 2) 20 funcionários de uma empresa multinacional, pode-se ela-borar o seguinte quadro de distribuição:

Classes de Salários Freqüência

50 100 3

100 150 4

150 200 10

200 250 2

250 300 1

Tabela 4.12

Nessas condições:

Faça uma representação gráfica da distribuição usando o a) histograma de freqüência.

Determine a variância e o desvio padrão da distribuição.b)

Determine o coeficiente de variação da distribuição.c)

Resposta. b) 2.525 e 50,24; c) 31,40%.

3) Em um exame de Matemática, o grau médio final de um grupo de 150 alunos foi 7,8, e o desvio padrão, 0,80. Em Física, entre-tanto, o grau médio final foi 7,3, e o desvio padrão, 0,76. Em que disciplina foi maior a dispersão?

Resposta. Física.

Page 119: LivroEstatística.pdf

119

4) Um grupo de 100 estudantes tem uma estatura média de 163,8 cm, com um coeficiente de variação de 3,3%. Qual o desvio padrão desse grupo?

Resposta. 5,41.

Uma distribuição apresenta as seguintes estatísticas: 4) s = 1,5 e CV = 2,9%. Determinar a média da distribuição.

Resposta. 51,7.

Num teste aplicado a 20 alunos, obteve-se a seguinte distribui-5) ção de pontos:

Pontos No de alunos

35 45 1

45 55 3

55 65 8

65 75 3

75 85 3

85 95 2

Tabela 4.13

Nessas condições:

Calcular o desvio médio.a)

Determinar o desvio padrão.b)

Calcular o coeficiente de variação.c)

Respostas. a) 11; b) 13,23; c) 20%.

7) Determinar a variância, o desvio padrão e o coeficiente de va-riação dos valores apresentados no quadro abaixo.

xi Freqüência – fi

2 5

3 10

4 15

Page 120: LivroEstatística.pdf

120

5 12

6 5

7 3

Quadro 4.2

Respostas. Variância = 2,99; desvio padrão = 1,73; CV = 41%.

8) Determinada editora pesquisou o número de páginas das re-vistas mais vendidas em uma cidade.

Revistas A B C D E F

Número de páginas 62 90 88 92 110 86

Quadro 4.3

Calcular:

O número médio de páginas.a)

O desvio médio.b)

A variância.c)

O desvio padrão.d)

Respostas. a) 88; b) 9,3; c) 197,3; d) 14.

4.7 A Estatística no ExcelNesta seção, apresentaremos a utilização da planilha no progra-ma Excel. Explicaremos alguns conceitos importantes da estatística através do uso desse programa.

4.7.1 Conhecendo o ExcelO Excel é um programa de planilha de cálculo que foi desenvolvido pela Microsoft para operar em ambiente Windows.

Uma planilha eletrônica tal como o Excel é um conjunto de linhas e colunas em que podemos colocar as informações de forma orga-nizada.

Page 121: LivroEstatística.pdf

121

Você poderá fazer no Excel não apenas cálculos (simples ou muito complexos), mas também construir gráficos, gerenciar banco de da-dos, fazer simulações, etc.

A tela do Excel possui uma série de elementos, e é importante co-nhecermos cada um deles.

Vamos destacar os principais na seguinte figura:

Barra de menusBarra de ferramentas

Endereço de Célula ativa

Identificadorde linha

Guia de planilhas

Botões de rolamentode planilhas

Identificadorde coluna

Barra de rolagemvertical e horizontal

Célula ativa

Barra de fórmulas

Figura 4.1

É importante ler as seguintes observações:

A barra de menus permite selecionar um comando no Excel •para realizar uma determinada operação.

A barra de ferramentas permite acionar comandos no Excel ao •dar um clique com o mouse nos botões correspondentes.

A barra de fórmulas mostra o conteúdo da célula ativa. É por •intermédio dela que podemos fazer eventuais alterações.

Célula é a intercessão entre uma coluna e uma linha da plani-•lha. Podemos referenciar uma célula pelo seu endereço. Por exemplo, endereço C3 indica a célula que se encontra na colu-na C, linha 3. A célula ativa é a aquela em que está posicionado

Page 122: LivroEstatística.pdf

122

o cursor. Tudo o que for digitado será incluído na célula que estiver ativa.

As barras de rolamento permitem nos movimentarmos pela pla-•nilha.

As guias de planilha permitem tornar ativa a planilha na qual •damos um clique.

Os botões de rolamento de planilhas permitem a rolagem das •guias de planilhas.

Uma das primeiras coisas que devemos aprender sobre uma plani-lha é como nos movimentarmos. Realmente é uma área de traba-lho muito grande que o Excel nos oferece. Quando ingressamos no Excel, ele nos fornece uma pasta de trabalho que tem 3 folhas (ou guias), cada uma das quais tem 256 colunas e 16.384 linhas. Em outras palavras, cada guia tem mais de 4 milhões de células indivi-duais. Como deslocarmos nesta grande área?

Você pode “navegar” pelo Excel com o teclado e com o mouse.

Com o teclado1)

Para movimentar célula a célula: utilize as • setas cursor de seu teclado.

Para movimentar tela a tela, para baixo ou para cima: utilize •as teclas PgUp e PgDown de seu teclado.

Para movimentar tela a tela lateralmente: utilize as teclas •Ctrl + PgUp e Ctrl + PgDown de seu teclado.

Para posicionarmos no início da planilha: • Ctrl + Home.

Para posicionarmos na ultima célula ocupada da planilha: •Ctrl + End.

Com o mouse2)

Para nos movimentar com o mouse utilizamos as barras de rolagem. Cada uma das barras (vertical ou horizontal) possui dois botões de movimentação, que contêm uma seta em cada uma de suas extremidades. Ao clicarmos nestas setas, produ-zimos a movimentação em função do seu sentido.

Page 123: LivroEstatística.pdf

123

Com o mouse também podemos passar de uma planilha para outra. O método é bastante intuitivo, pois no rodapé da tela es-tão os guias da planilha. Para que tornemos uma determinada planilha ativa, basta dar um simples clique sobre o seu nome.

Figura 4.2

Outra atividade fundamental quando trabalhamos no Excel é a seleção de células. Isto nos permite trabalhar simultaneamen-te com todas as células previamente selecionadas, por exemplo, para mudar o tipo de letra que elas apresentam, ou para apagar seu conteúdo, etc.

Para a seleção de uma linha, uma coluna ou a planilha inteira, veja, na figura abaixo, como proceder.

Para selecionar toda a planilha, posicionar o mouse sobre este botão e dar um clique.

Para selecionar toda uma coluna: posiconar o ponteiro do mouse sobre o nome da coluna e clicar com o botão esquerdo.

Para selecionar toda uma linha: posico-nar o ponteiro do mouse sobre o número da linha e clicar com o botão esquerdo.

Figura 4.3

Para sair do Excel, clique no menu arquivo e depois na opção sair.

Se você não tiver salvado previamente seu trabalho, o Excel pergun-tará se deseja salvar agora. Se der um clique em sim, você poderá

Page 124: LivroEstatística.pdf

124

dar um nome à sua pasta, para que ela fique armazenada em seu disco. Se der um clique em não, todas as alterações que você tiver feito na sua pasta serão perdidas para sempre. O ato de dar um cli-que no botão cancelar cancela o comando sair, e faz com que você retorne ao programa Excel.

Para a edição de uma planilha no Excel, se quisermos introduzir qualquer dado, primeiramente devemos selecionar uma célula, cli-cando nela. Depois de escrever o dado pressionamos Enter para fixá-lo na célula.

É importante também saber identificar em que célula está escrito o dado. Para isto, é suficiente que você selecione uma célula e verifique, na barra de fórmulas, se o dado está sendo visualizado também ali.

Uma fórmula é a maneira que indicamos para o Excel para executar uma conta. Quando montamos uma fórmula, devemos começar co-locando um sinal de igual (=) e em seguida a fórmula propriamente.

Você não precisa escrever os endereços de células que intervêm na fórmula. É suficiente dar um clique nas células com as quais deseja trabalhar.

É bom lembrar que existe uma hierarquia entre os operadores mate-máticos. O Excel executa os cálculos na seguinte ordem:

1• o Exponenciação ( ^ )

2• o Multiplicação ( * ) e Divisão ( / )

3• o Adição ( + ) e Subtração ( - )

Para alterarmos esta hierarquia, lançamos mão dos parêntesis, e des-ta forma o Excel executa primeiramente o que estiver dentro dos pa-rêntesis. Observe o resultado das seguintes expressões matemáticas:

2*3+10 = 16

2*(3+10) = 26.

Uma função é um processo de cálculo padronizado. Para escrever uma função, em primeiro lugar escrevemos o signo igual (=), depois

Page 125: LivroEstatística.pdf

125

o nome da função e entre parêntesis os argumentos. O nome é a denominação pela qual o Excel reconhece o cálculo a ser executado. Os argumentos são parâmetros auxiliares ou informações adicio-nais que passamos à função para que possam ser feitos os cálculos. Por exemplo, se escrevemos numa célula livre

=media(A1:A5),

onde media é o nome da função e indica que o cálculo a ser execu-tado é uma média simples. (A1:A5) é um argumento da função e indica que esta média deve ser calculada pelos valores contidos das células A1 até a célula A5. Caso a função seja mais complexa e exija mais parâmetros, estes devem estar separados por vírgulas.

O Excel possui mais de 700 funções predefinidas, separadas em 11 categorias. Você também poderá escrever uma função com o assis-tente de função, o qual pode ser acessado clicando no botão fx da barra de ferramentas padrão. Quando você ativa o Assistente de Função, aparecerá a Caixa de Diálogo, mostrada na seguinte figura:

Lista das funçõesLista das categorias

Figura 4.4

Vamos a um exemplo de aplicação.

Exemplo 4.17. Vamos considerar o seguinte exemplo do capítulo 2:

Page 126: LivroEstatística.pdf

126

Estaturas de 40 alunos (em cm) da Escola Estadual “Esperança”, no Semestre 2007/1

166 160 161 150 162 160 165 167 164 160

162 161 168 163 156 173 160 155 164 168

155 152 163 160 155 155 169 151 170 164

154 161 156 172 153 157 156 158 158 161

Tabela 4.14

Construir a freqüência simples ou absoluta, a freqüência relativa, a freqüência acumulada, a freqüência relativa acumulada e a porcen-tagem, usando o Excel.

Resolução. Comece por digitar na célula A1 o título ESTATURAS DE ALUNOS. Da célula A2 à célula J5, digite cada um dos valores apre-sentados na tabela 4.12, conforme o exemplo abaixo.

Figura 4.5

Na célula A7 digite MÁXIMO, desloque o cursor para a célula C7 e in-troduza a função MÁXIMO. Para isto, clique em “assistente de função”, selecione a categoria “estatística” e selecione a função MÁXIMO(núm 1; núm 2; ...;núm 30) – Dá como resultado o valor máximo dos valores numéricos núm 1, núm 2; ...;núm 30. Cada um desses núm pode ser um intervalo de células de uma planilha contendo valores numéricos. Sele-

Page 127: LivroEstatística.pdf

127

cione as células de A2 até J5, ou seja, = MÁXIMO(A2:J5), que fornece o resultado igual a 173.

Na célula A8, digite MÍNIMO, desloque o cursor para a célula C8 e in-troduza a função MÍNIMO(núm 1; núm 2; ...;núm 30) – Dá como re-sultado o valor mínimo dos valores numéricos núm 1, núm 2; ...;núm 30. Cada um desses núm pode ser um intervalo de células de uma planilha contendo valores numéricos. Selecione as células de A2 até J5, ou seja,

= MÍNIMO(A2:J5), que fornece o resultado igual a 150.

Na célula A9, digite AMPLITUDE, desloque o cursor para a célula C9 e introduza a função C7 C8= − , que fornece o resultado igual a 23.

Na célula A10, digite i = NÚM. DE CLASSES; na célula A11, digite n; na célula B11, digite 40; e na célula A12, digite h (amplitude do intervalo de classe). Desloque o cursor até a célula C10 e introdu-za a Regra de Sturges, 1 3,33 log i n= + , no nosso exemplo, digite:

1 3,33*log(B11)= + , que fornece i = 6,286798 ou i = 6(célula D10). Desloque o cursor até a célula C12 , digite a função = C9/C10, cujo resultado é 3,83333, ou h = 4(célula D12).

Na célula A14, digite i; na B14, digite Estaturas; na C14, digite em cm; na D14, digite Fre. Abs.; na E14, digite Freq. Rel.; na F14, digite Freq. Acum.; na G14, digite Freq. Rel. Acum.; e na H14, digite Porcent.

Nas células de A15 até A20, digite o número de classes.

Na célula B15, digite 150 (o limite inferior da primeira classe); na cé-lula C15, digite 154 (o limite superior da primeira classe) e assim por diante, até a célula B20, onde você deve digitar 170 (o limite inferior da sexta classe), e na célula C20, digite 174 (o limite superior da sexta classe).

Para calcular a freqüência simples ou absoluta, você utiliza a função estatística CONT.SE. Esta função calcula o número de células que não estejam em branco em um intervalo e que obedeçam a um determina-do critério, ou seja, = CONT.SE(intervalo; critérios).

Para determinar o número de alunos que têm estatura igual ou supe-rior a 150 cm e menor do que 154 cm:

Desloque o cursor para a célula D15.•

Page 128: LivroEstatística.pdf

128

Introduza a função:•

= CONT.SE(A2 : J5 ; “< 154”) – CONT.SE(A2 : J5 ; “<150”)

cujo resultado é 4.

Para determinar o número de alunos que têm estatura igual ou supe-rior a 154 cm e menor do que 158 cm:

Desloque o cursor para a célula D16.•

Introduza a função:•

= CONT.SE(A2 : J5 ; “< 158”) – CONT.SE(A2 : J5 ; “<154”),

cujo resultado é 9, e assim por diante, até a sexta classe.

Para determinar o número de alunos que têm estatura igual ou supe-rior a 170 cm e menor do que 174 cm:

Desloque o cursor para a célula D20.•

Introduza a função:•

= CONT.SE(A2 : J5 ; “< 174”) – CONT.SE(A2 : J5 ; “<170”)

cujo resultado é 3.

Desloque agora o cursor para a célula D21 e introduza a função SOMA. Para introduzir a função SOMA, selecione, no assistente de função, a categoria “matemática e trigonometria” e selecione a fun-ção SOMA (núm 1; núm 2; ...;núm 30) que soma todos os números em um intervalo de células. Neste exemplo,

= SOMA (D15:D20), cujo resultado é 40.

Para calcular a freqüência relativa da primeira classe, desloque o cur-sor para a célula E15 e introduza a função = D15/D21, cujo resulta-do é 0,10000. Para calcular a freqüência relativa da segunda classe, desloque o cursor para a célula E16 e introduza a função = D16/D21, cujo resultado é 0,2250, e assim por diante, até a sexta classe. Para calcular a freqüência relativa da sexta classe, desloque o cursor para a célula E20 e introduza a função

= D20/D21, cujo resultado é 0,0750.

Page 129: LivroEstatística.pdf

129

Para calcular a freqüência acumulada da primeira classe, desloque o cursor para a célula F15 e digite 4. Para calcular a freqüência acu-mulada da segunda classe, desloque o cursor para a célula F16 e in-troduza a função = F15 + D16, cujo resultado é 13. Para calcular a freqüência acumulada da terceira classe, desloque o cursor para a célula F17 e introduza a função

= F16 + D17, cujo resultado é 24, e assim por diante, até a sexta classe.

Para calcular a freqüência relativa acumulada da primeira classe, des-loque o cursor para a célula G15 e introduza a função = F15/F20, cujo resultado é 0,1000. Para calcular a freqüência relativa acumulada da segunda classe, desloque o cursor para a célula G16 e introduza a função =F16/F20, e assim por diante, até a sexta classe.

Para determinar a porcentagem da primeira classe, desloque o cur-sor para a célula H15, digite = G15 e utilize os botões da barra de ferramentas FORMATAÇÃO, no caso, o formato percentual %, cujo resultado é 10,00%. Utilize o mesmo procedimento para as demais classes.

Exemplo 4.18. Construir a freqüência simples ou absoluta, a freqüên-cia relativa, a freqüência acumulada, a freqüência relativa acumulada e a porcentagem, usando o Excel, considerando os dados brutos do quadro abaixo, que representam o peso (em kilogramas) de 40 crian-ças, entre 0 e 8 anos, da Creche Municipal “O Bom Pastor”, no semes-tre 2004/2.

11,1 12,5 32,4 7,8 21,0 16,4 11,2 22,3

4,4 6,1 27,7 32,8 18,5 16,4 15,1 6,0

10,7 15,8 25,0 18,2 12,2 12,6 4,7 23,5

14,8 22,6 16,0 19,1 7,4 9,2 10,0 26,2

3,5 16,2 14,5 3,2 8,1 12,9 19,1 13,7

Quadro 4.5

Resolução. Exercício.

Page 130: LivroEstatística.pdf

130

ResumoNeste capítulo, explicamos as medidas de dispersão, de cálculo de amplitude total, o desvio médio absoluto, a variância, o desvio pa-drão, o coeficiente de variação, etc.

Além disso, fornecemos um pouco de conhecimento do uso de pla-nilhas no Excel.

Só prossiga após compreender todo o conteúdo deste capítulo. Con-sulte o tutor do pólo sempre que achar necessário.

Bibliografias ComentadasCRESPO, A. Arnot. Estatística fácil. 7. ed. São Paulo: Saraiva, 1990.

Apresenta o conteúdo de Medidas de Dispersão de uma maneira bem clara e objetiva, facilitando a compreensão por parte do aluno. É um livro complementar para o estudo deste capítulo.

FONSECA, Jairo Simom da; MARTINS, Gilberto de Andrade. Curso de estatística. 3. ed. São Paulo: Atlas, 1982.

Para aprender mais sobre o conteúdo deste capítulo, sugerimos a consulta deste livro. Nele você encontra exercícios de aplicação.

LEVINE, D. M.; BERENSON, M. L.; STEPHAN, D. Estatística: teoria e aplicações – usando microsoft excel em português. Rio de Janeiro: LTC, 2000.

Aborda conceitos de Estatística utilizando o Excel. Uma das vantagens de utilizar uma aplicação de planilha como o Microsoft Excel é que ela facilita o uso da análise de simulação, que permite ao aluno explorar o efeito de modificações de valores dados.

Page 131: LivroEstatística.pdf

Capítulo 5Cálculo de Probabilidade

Page 132: LivroEstatística.pdf
Page 133: LivroEstatística.pdf

133

Capítulo 5Cálculo de Probabilidade

O nosso objetivo neste capítulo é encontrar explicação no fato de que a maioria dos fenômenos de que se trata a Esta-tística é de natureza aleatória ou probabilística. Conseqüen-temente, o conhecimento dos aspectos mais fundamentais do cálculo de probabilidades é uma ferramenta essencial para o estudo da Inferência Estatística ou Estatística Infe-rencial, que será abordada no próximo capítulo.

5.1 IntroduçãoO cálculo das probabilidades pertence ao campo da Matemática que trata situações sujeitas às leis do acaso.

Historicamente, a teoria da probabilidade começou com o estudo de jogos de azar, como a roleta e as cartas. O tratamento moderno da teoria da probabilidade é puramente axiomático. Isto significa que as probabilidades de nossos eventos podem perfeitamente ser arbitrárias, a menos que certos axiomas, enunciados abaixo, sejam satisfeitos.

Toda pessoa que se aventura em um jogo de azar sabe que tem chance de perder e de ganhar, embora em geral não saiba de quanto é essa chance. Mas foi procurando quantificar essas chances que o matemático francês Pascal deu origem ao estudo de probabilidade.

Sempre que estudamos alguns fenômenos de observação, devemos distinguir o próprio fenômeno e o modelo matemático (determinís-tico ou probabilístico) que melhor explique.

Os fenômenos estudados pela estatística são fenômenos cujo resul-tado, mesmo em condições normais de experimentação, variam de uma observação para outra, dificultando dessa maneira a previsão de um resultado.

A palavra probabilidade origina-se do Latim

probare (provar ou testar). Informalmente, provável é

uma das muitas palavras utilizadas para eventos

incertos ou conhecidos. Tal como acontece com a

teoria da mecânica, que atribui definições precisas a termos de uso diário, como

trabalho e força, também a teoria das probabilidades

tenta quantificar a noção de provável. Fonte: http://

pt.wikipedia.org/wiki/obabilidade#Probabilidade_

na_matem.C3.A1tica

Blaise Pascal. Extraordinário filósofo, físico e matemático francês de curta existência.

Juntamente com Pierre de Fermat, estabeleceu

as bases da teoria das probabilidades e da análise

combinatória. Fonte: http://pt.wikipedia.org/wiki/

Blaise_Pascal

Blaise Pascal (1623-1662)

Page 134: LivroEstatística.pdf

134

Na teoria da probabilidade, definimos um modelo matemático para tal fenômeno pela associação de suas “probabilidades” (ou os valo-res limites das freqüências relativas) aos “eventos” relacionados com um experimento. A validade do nosso modelo matemático, para um dado experimento, depende de as probabilidades associadas esta-rem bem próximas da freqüência relativa (veja tabela 2.8).

5.2 Experimentos AleatóriosSão aqueles que, mesmo repetidos várias vezes sob condições seme-lhantes, apresentam resultados imprevisíveis. A cada experimento correspondem, em geral, vários resultados possíveis. Estes experi-mentos também são conhecidos como experimentos não-determi-nísticos. Por exemplo:

Jogue um dado e observe o número mostrado na face de i) cima.

Jogue uma moeda quatro vezes e observe o número de caras ii) obtido.

Em uma linha de produção, fabrique peças em série e conte o iii) número de peças defeituosas produzidas em um período de 24 horas.

Uma lâmpada é fabricada. Em seguida é ensaiada quanto à iv) duração da vida, pela colocação em um soquete e anotação do tempo decorrido (em horas) até queimar.

5.3 Espaço amostral e Noção de Probabilidade

Espaço amostral é o conjunto de todos os possíveis resultados de um experimento aleatório.

Considerando cada uma dos experimentos acima, o espaço amos-tral de cada um deles será:

Ω• i: 1,2,3,4,5,6

Page 135: LivroEstatística.pdf

135

Ω• ii: 0,1,2,3,4.

Ω• iii: 0,1,2,...,n, onde n é o número máximo de peças que pode ser produzido em 24 horas.

Ω• iv: t / t ≥ 0.

Evento (E)Chamamos de evento qualquer subconjunto do espaço amostral Ω de um experimento aleatório. Um evento é sempre definido por uma sentença.

Se • E = Ω , então E é chamado evento certo.

Se • E = ∅, então E é chamado evento impossível.

Por exemplo, no lançamento de um dado, onde Ω = 1,2,3,4,5,6, te-mos:

um número par na face superior. a) A = 2,4,6.

um número menor ou igual a seis na face superior. b) B = 1,2,3,4,5,6 = Ω .

um número maior do que seis na face superior. c) C = ∅.

Podemos combinar eventos usando as várias operações com con-juntos:

o evento • A B∪ ocorre se e somente se ocorre A ou ocorre B (ou ambos);

o evento • A B∩ ocorre se e somente se ocorrem A e B ;

o evento • cA , complemento de A , ocorre se e somente se não ocorre A .

Dois eventos, A e B , são ditos mutuamente exclusivos se são disjun-tos, isto é, se A B∩ = ∅ . Em outras palavras, A e B são mutuamen-te exclusivos se não ocorrem simultaneamente.

Page 136: LivroEstatística.pdf

136

Axiomas de ProbabilidadeDados Ω um espaço amostral, ( )P A probabilidade do evento A e

( )P A uma função definida em Ω que associa a cada evento um nú-mero real, satisfazendo os seguintes axiomas:

Axioma 1: Para todo evento A , 0 ( ) 1P A≤ ≤ .

Axioma 2: ( ) 1P Ω = .

Axioma 3: Se A e B são eventos mutuamente exclusivos, então( ) ( ) ( )P A B P A P B∪ = + .

Desses axiomas decorrem as seguintes propriedades:

Se • ∅ é um conjunto vazio, então ( ) 0P ∅ = .

Se • cA é o complemento de um evento A , então ( ) 1 ( )cP A P A= − .

Se • A B⊂ , então ( ) ( )P A P B≤ .

Se • A e B são dois eventos quaisquer, então ( / ) ( ) ( )P A B P A P A B= − ∩ .

Seja Ω um espaço amostral finito: 1 2 , ,..., na a aΩ = . Consideremos o evento formado por um resultado simples iA a= . A cada evento simples ia , associemos um número ip , denominado probabilida-de de ia , satisfazendo as seguintes condições:

1a condição: 0ip ≥ para 1,2,...,i n= .

2a condição: 1 2 ... 1np p p+ + + = .

Definição 5.1. Seja A um experimento aleatório e Ω o seu espa-ço amostral. Admitamos que os elementos de Ω tenham a mesma chance de acontecer, ou seja, Ω é um conjunto equiprovável. A pro-babilidade de um evento A , A ⊂ Ω , é o número real ( )P A , tal que

)(AP = número de vezes que o evento A pode ocorrer

número de vezes que o espaço amostral ocorreΩ.

Definição 5.2. Dados dois eventos, A e B , denotaremos ( / )P A B a probabilidade condicionada do evento A , quando B tiver ocorrido,

por: ( / )P A B = )(

)(BP

BAP ∩ , com ( ) 0P B > , pois B já ocorreu.

Page 137: LivroEstatística.pdf

137

Assim,( )( / ) ( ) ( ) ( / )

( )P A BP A B P A B P B P A B

P B∩

= ⇒ ∩ = ×

e

( )( / ) ( ) ( ) ( / )( )

P A BP B A P A B P A P B AP A

∩= ⇒ ∩ = × .

Logo, podemos dizer que:

A probabilidade da ocorrência simultânea de dois eventos, A e B, do mesmo espaço amostral, é igual ao produto da probabilidade de um deles pela probabilidade condicional do outro, dado o primeiro.

Observação 5.1. O teorema do produto para quaisquer eventos

nAAAA ,...,,, 321 é dado por

1 2( )nP A A A∩ ∩ ∩

1 2 1 3 1 2 1 2 1( ). ( / ). ( / )... ( / .... )n nP A P A A P A A A P A A A A −= ∩ ∩ ∩ .

Definição 5.3. Os eventos A e B são independentes se ( ) ( ) ( )P A B P A P B∩ = × , pois ( ) ( / )P B P B A= ; caso contrário, são de-

pendentes.

Definição 5.4. Dizemos que dois ou mais eventos são mutuamente exclu-sivos quando a realização de um exclui a realização do(s) outro(s).

Por exemplo, no lançamento de uma moeda, o evento “tirar cara” e o evento “tirar coroa” são mutuamente exclusivos, já que, ao se realizar um deles, o outro não se realiza.

Não é difícil de observar que se A e B são eventos mutuamente ex-clusivos, então A B∩ = ∅ e ( ) 0P A B∩ = .

Se A e B podem ocorrer ao mesmo tempo, a probabilidade de ocor-rer A ou B é dada pela probabilidade de A, mais a probabilidade de B, menos a probabilidade de A e B, e escrevemos

( ) ( ) ( ) ( )P A B P A P B P A B∪ = + − ∩ .

Page 138: LivroEstatística.pdf

138

Observação 5.2. O resultado acima é válido para mais de dois even-tos, ou seja, podemos generalizá-lo. Por exemplo, para três eventos: A, B e C, o resultado fica:

( ) ( ) ( ) ( ) ( ) ( )P A B C P A P B P C P A B P A C∪ ∪ = + + − ∩ − ∩

( ) ( )P B C P A B C− ∩ + ∩ ∩ .

5.4 Variáveis AleatóriasAo descrever um espaço amostral de um experimento, não espe-cificamos que um resultado individual necessariamente seja um número. Temos alguns exemplos nos quais o resultado do experi-mento não é uma quantidade numérica: ao descrever uma peça ma-nufaturada, podemos empregar apenas as categorias “defeituosa” e “não defeituosa”; ao observar a temperatura durante o período de 24 horas, podemos apenas registrar a curva traçada pelo termógra-fo. Contudo em muitas situações experimentais, estaremos interes-sados na mensuração de alguma coisa e no seu registro como um número. Mesmo nos exemplos citados, poderemos atribuir um nú-mero a cada resultado (não) numérico do experimento. Por exemplo, poderemos atribuir o valor um às peças perfeitas e o valor zero às defeituosas. Podemos registrar a temperatura máxima ou a tempe-ratura mínima do dia.

Os exemplos acima são bastante típicos de uma classe muito geral de problemas: em muitas situações experimentais, desejamos atri-buir um número real a todo elemento do espaço amostral. Com isto em mente, podemos formular a seguinte definição:

Definição 5.5. Sejam E um experimento e Ω o espaço associado ao experimento. Uma função X, que associe a cada elemento s de Ω um número real X(s), é denominada variável aleatória.

X(s)

X

s

Ω Figura 5.1

Page 139: LivroEstatística.pdf

139

Exemplo 5.1.

E: lançamento de duas moedas;

X: número de caras obtidas nas duas moedas;

Ω = (Ca,Co), (Ca,Ca), (Co,Ca), (Co,Co), onde Ca é cara e Co é coroa.

X = 0 - corresponde ao evento (Co,Co), com probabilidade 1/4;

X = 1 - corresponde ao evento (Ca,Co), (Co,Ca) com probabilidade 1/2;

X = 2 - corresponde ao evento (Ca,Ca) com probabilidade 1/4.

Quando uma variável tem resultados ou valores numéricos que tendem a variar de uma observação para outra em ra-zão de fatores relacionados com a chance, chama-se variável aleatória.

Definição 5.6. Seja X uma variável aleatória. Se o número de valo-res possíveis de X for finito ou infinito numerável, denominaremos X de variável aleatória discreta, isto é, os valores de X, podem ser contados.

Vejamos alguns exemplos:

Número de reprovados em física em uma amostra contendo 20 •alunos, extraídos de uma turma de 60 alunos.

Número de pais de alunos na fila de um banco comercial para •realizarem o pagamento da mensalidade.

Número de falhas que um equipamento apresenta ao longo de •certo período.

Definição 5.7. Seja X uma variável aleatória. Suponha que o contra-domínio de X seja um intervalo ou uma coleção de intervalos, então diremos que X é uma variável aleatória contínua.

Vejamos alguns exemplos:

A altura de um aluno da turma A da 5• a série da Escola XX.

Uma variável aleatória é considerada discreta se

toma valores que podem ser contados.

Uma variável aleatória é considerada contínua

quando pode tomar qualquer valor do

determinado intervalo.

Page 140: LivroEstatística.pdf

140

O tempo requerido para que um aluno possa realizar a avalia-•ção da disciplina de estatística na Escola XX.

O salário mensal de um professor do ensino fundamental pago •pela Escola XY.

Definição 5.8. Seja X uma variável aleatória discreta. A cada possível resultado de xi associaremos um número ( ) ( ),i ip x P X x= = 1,2,...i = ..., denominado probabilidade de xi tal que 0)( ≥ixp e ∑

=1

1)(i

ixp , ou ( ) ( )p x P X x= = .

A função p, assim definida, é denominada função de probabilidade da variável aleatória X. A coleção de pares ( ), ( ) , 1, 2,...i ix p x i = é de-nominada distribuição de probabilidade de X.

( )P X x= pode ser expressa por uma tabela, gráfico ou fórmula.

Vejamos alguns exemplos para ( )P X x= .

Exemplo 5.2. Consideramos o seguinte experimento E: lançamento de duas moedas. Seja a variável aleatória X: número de caras obti-das. Vamos expressar ( )P X x= por

Tabela1) :

x 0 1 2

1/4 1/2 1/4

Tabela 5.1

Gráfico:2)

1/2

1/4

0 1 2 x

P(X=x)

Gráfico 5.1

Page 141: LivroEstatística.pdf

141

Fórmula:3)

2

( )4x

P X x

= = , para x = 0,1,2.

Exemplo 5.3. Seja o lançamento de um par de dados. O espaço amostral é constituído de 36 pares ordenados de números entre 1 e 6, isto é, Ω = (1,1),(1,2),...,(6,6), e X associa a cada ponto (a,b) de Ω o maior desses números, isto é, X(a,b) = máx (a,b). Então, X é uma variável aleatória com o conjunto imagem 1,2,3,4,5,6. Determinar

( ) ( ),i ip x P X x= = 1,2,...,6i = , ou seja, a distribuição ou função de probabilidade de X.

Resolução. Calculando a distribuição p de X , vem:

Para 1 1x = temos

11( ) (1) ( 1) ((1,1))36

p x p P X P= = = = = .

Para 2 2x = temos

23( ) (2) ( 2) ((2,1), (2, 2), (1, 2))

36p x p P X P= = = = = .

Para 3 3x = temos

3( ) (3) ( 3)p x p P X= = =

((3,1),(3,2),(3,3),(2,3),(1,3))P=

536

= .

Para 4 4x = temos

4( ) (4) ( 4)p x p P X= = =

((4,1),(4,2),(4,3),(4,4),(3,4),(2,4),(1,4))P= .

736

= .

Da mesma forma, temos

59( ) (5) ( 5)36

p x p P X= = = =

e

611( ) (6) ( 6)36

p x p P X= = = = .

Page 142: LivroEstatística.pdf

142

Esta informação é colocada na forma de uma tabela, como segue:

xi 1 2 3 4 5 6

136

336

536

736

936

1136

Tabela 5.2

5.5 Esperança Matemática ou Valor Esperado

Chama-se esperança matemática de uma variável aleatória discreta X, a soma de todos os produtos possíveis da variável aleatória com respectiva probabilidade.

i( ) ( )X i iE X x p x = = = ×∑ ,

isto é, ( )E X é a média ponderada dos possíveis valores de X, cada um ponderado por sua probabilidade.

Exemplo 5.4. Calcular o valor esperado ou a esperança matemática do exemplo 5.3.

Resolução. Pela tabela da distribuição de probabilidade encontrada, temos

xi 1 2 3 4 5 6

136

336

536

736

936

1136

Tabela 5.3

e,

i

( ) ( )i iE X x p x= ×∑

1 3 51 2 336 36 36

= × + × + ×

Discutimos a média ponderada no capítulo 3. Volte a ele se sentir necessidade de esclarecimentos.

Page 143: LivroEstatística.pdf

143

7 9 114 5 636 36 36

+ × + × + ×

161 4,4736

= = .

Portanto, o valor esperado ou esperança matemática é 4,47.

Exemplo 5.5. Um fabricante produz peças tal que 5% delas são de-feituosas e 95% são não defeituosas. Se uma peça for defeituosa, o fabricante perde R$ 2,45, enquanto uma peça não defeituosa lhe dá um lucro de R$ 6,50. Se X for o lucro líquido por peça, então X será uma variável aleatória, cujo valor esperado é dado por

( ) 0,05 2,45 0,95 6,50 $6,05E X R= − × + × = .

Se for produzido um grande número de peças, neste caso, quando o fabricante perder R$ 2,45, cerca de 5% das vezes, e ganhar R$ 6,50, cerca de 95% das vezes, ele espera ganhar cerca de R$ 6,05 por peça, em longo prazo.

Exemplo 5.6. O almoxarifado da Escola Estadual “Vida Nova” es-tabeleceu um registro de requisição para certo tipo de material es-colar, conforme quadro abaixo. Determine o número esperado de requisições por dia.

Número de requisições/dia 0 1 2 3 4 5 6 7 8 9

Probabilidade de ocorrência 0,02 0,07 0,09 0,12 0,20 0,20 0,18 0,10 0,01 0,01

Quadro 5.1

Resposta. 4,36 ~ 5 requisições/dia.

Exemplo 5.7. O número de chamadas telefônicas da Operadora XX por mesa e suas respectivas probabilidades por um intervalo de 3 minutos são dados abaixo.

N° de chamadas 0 1 2 3 4 5

Probabilidade 0,60 0,20 0,10 0,4 0,03 0,03

Quadro 5.2

Page 144: LivroEstatística.pdf

144

Em média, quantas chamadas podem ser esperadas num intervalo de 3 minutos?

Resposta. 1,87 ~ 2 chamadas

5.5.1 Variância e Desvio PadrãoA variância, ( )Var X ou 2 , de uma variável aleatória discreta pode ser obtida multiplicando-se cada diferença ao quadrado 2( )iX − por sua probabilidade correspondente ( )iP X e somando-se, depois, os produtos resultantes. Assim, a variância da variável aleatória X pode ser expressa da seguinte maneira:

2 2

1( ) ( ) ( )

n

i ii

VAR X X P X =

= = − ×∑ ,

onde

X = variável aleatória discreta de interesse;

iX = i-ésimo resultado de X;

( )iP X = probabilidade de ocorrência do i-ésimo resultado de X.

= média aritmética.

Sendo assim, o desvio padrão ( ) de uma variável aleatória discreta é dado por:

2

1( ) ( )

n

i ii

X P X =

= − ×∑ ,

ou seja,

( )Var X = + .

Exemplo 5.8. Considere a distribuição de probabilidade dos resulta-dos de um lançamento de um dado

Face do resultado 1 2 3 4 5 6

Probabilidade 1/6 1/6 1/6 1/6 1/6 1/6

Tabela 5.4

Calcular a média, a variância e o desvio padrão.

Fizemos algumas reflexões sobre a variância e o desvio padrão no capítulo anterior (Cap. 4), se sentir necessidade, volte e retome-as!

Page 145: LivroEstatística.pdf

145

Resolução.

i ( )X i ix p x = = ×∑

1 1/ 6 2 1/ 6 3 1/ 6= × + × + ×

4 1/ 6 5 1/ 6 6 1/ 6+ × + × + ×

21/ 6 3,5= = .

2 2 2 2(1 3,5) 1/ 6 (2 3,5) 1/ 6 (3 3,5) 1/ 6σ = − × + − × + − ×

2 2(4 3,5) 1/ 6 (5 3,5) 1/ 6+ − × + − × +

9166,26/1)5,36( 2 =×−+

e

= 2,9166 1,71= .

5.6 Distribuições DiscretasNesta seção, abordaremos algumas distribuições de probabilidades discretas que, pela sua importância, merecem um estudo especial. Conforme veremos, tais distribuições partem da pressuposição de certas hipóteses bem definidas. Como diversas situações reais mui-tas vezes se aproximam dessas hipóteses, os modelos aqui descritos são úteis no estudo de tais situações, daí a sua importância.

As distribuições de probabilidades discretas envolvem variáveis aleatórias relativas a dados que podem ser contados, como o nú-mero de ocorrências por amostra ou o número de ocorrências por unidade num intervalo de tempo ou de área.

As principais distribuições de probabilidade discretas aqui aborda-das são: a distribuição de Bernoulli e distribuição Binominal.

5.6.1 Distribuição de BernoulliConsideremos uma única tentativa de um experimento aleatório. Podemos ter “sucesso” ou “fracasso” nessa tentativa.

Jakob Bernoulli é considerado o pai do

cálculo exponencial. Foi professor de matemática

em Basiléia, tendo sido importantíssima sua

contribuição à geometria analítica, à teoria das

probabilidades e à variação do cálculo.

Jakob Bernoulli (1654, 1705)

Page 146: LivroEstatística.pdf

146

Seja p a probabilidade de sucesso e 1q p= − a probabilidade de fra-casso. Seja X a variável aleatória: número de sucessos em uma única tentativa do experimento. X assume o valor 0, que corresponde ao fra-casso, com probabilidade 1q p= − , ou o valor 1, que corresponde ao sucesso, com probabilidade p ou

0 fracasso1 sucesso

X =

com

( 0) 1 e ( 1)P X p P X p= = − = = .

Diremos que a variável aleatória assim definida tem distribuição de Bernoulli e sua função de probabilidade é dada por

1( ) x xP X x p q −= = × .

A média e a variância, da distribuição de Bernoulli são facilmente cal-culadas como segue:

Cálculo da média •

Temos que

X ( )iP X 2( )iX − 2( ) ( )i iX P X− ×

0 1 p− 2 2(0 )p p− = 2(0 ) (1 )p p− × −

1 p 2(1 )p− 2 2(1 ) (1 )p p p p− × + − ×

Quadro 5.3

Logo,

i ( ) 0 (1 ) 1i ix P x p p p = × = × − + × =∑ .

Cálculo da variância e desvio padrão•

2 2

1( ) ( ) ( )

n

i ii

Var X X P X =

= = − ×∑

2 2(0 ) (1 ) (1 )p p p p= − × − + − ×

2 2(1 ) (1 )p p p p= × − + − ×

(1 ) [ (1 )]p p p p= × − × + −

(1 )p p p q= × − = × , onde 1q p= − .

Page 147: LivroEstatística.pdf

147

Portanto, a média é p = , a variância é ( )Var X p q= × , e o desvio pa-drão é pqσ = .

Observação 5.3. A média é p = , a variância é ( )Var X pq= , e o des-vio padrão é pqσ = serão utilizados posteriormente.

Exemplo 5.9. Uma urna tem 30 bolas brancas e 20 verdes. Retira-se uma bola dessa urna. Seja X o número de bolas verdes, calcular a média, a variância e ( )P X x= .

Resolução. Pelo enunciado, temos

30 30 50 520 21 50 5

qX

p

⇒ = == ⇒ = =

.

Portanto,

2( )5

E X p = = = ,

2 3 6( )5 5 25

Var X p q= × = × = ,

6 0,489925

σ = = ,

e12 3( )

5 5

x x

P X x−

= = ×

.

5.6.2 Distribuição BinomialA distribuição binomial é uma distribuição de probabilidade discre-ta extremamente útil para descrever muitos fenômenos. A distribui-ção binomial possui quatro propriedades essenciais.

Cada observação ou experimento pode ser considerado como i) se tivesse sido selecionado a partir de uma população finita com reposição.

Cada observação ou experimento pode ser classificado em ii) uma de duas categorias mutuamente excludentes, geralmente chamadas de sucesso e fracasso.

Page 148: LivroEstatística.pdf

148

A probabilidade de uma observação ser classificada como su-iii) cesso (p) é constante de observação para observação. Assim sendo, a probabilidade de uma observação ser classificada como fracasso (1 )p− é constante para todas as observações.

O resultado (isto é, sucesso ou fracasso) de qualquer observa-iv) ção independe do resultado de qualquer outra observação.

A variável aleatória discreta, ou fenômeno de interesse, que segue a distribuição binomial, é um número de sucessos obtidos em uma amostra de n observações. Dessa maneira, a distribuição binomial pode estar presente em inúmeras aplicações, entre elas:

Em jogos de azar•

Qual a probabilidade de que irá aparecer uma carta vermelha, de um baralho de 52 cartas, 15 vezes em 19 tentativas?

No controle de qualidade de produtos•

Qual a probabilidade de que, numa amostra de 20 pneus do mesmo tipo, nenhum será defeituoso, se 8% de todos os pneus produzidos por determinada fábrica são defeituosos?

Na educação•

Qual a probabilidade de que um aluno seja aprovado numa prova de múltipla escolha com 10 perguntas (cada pergunta contendo quatro escolhas), se o aluno tenta adivinhar cada uma das respostas? (Ser aprovado significa acertar 60% dos itens, ou seja, conseguir acertar 6 entre 10 itens.)

Nas finanças•

Qual a probabilidade de que uma determinada ação irá apre-sentar elevação no seu preço de fechamento numa base diária nas próximas 10 sessões (consecutivas) de negociação, se as mudanças no preço de mercado de ações forem aleatórias?

Associando uma variável aleatória X igual ao número de suces-sos nessas n observações, ou provas, X poderá assumir os valores 0,1,2,3,..., n .

Page 149: LivroEstatística.pdf

149

Vamos determinar a distribuição de probabilidade dessa variável X, dada através da probabilidade, de um número genérico k de sucessos.

Suponhamos que ocorram apenas sucessos nas k primeiras provas ou observações e apenas fracassos nas n k− provas restantes. Indi-cando sucesso em cada prova por 1 e fracasso por 0, temos

1,1,1,....1,0,0,0,...,0k n k−

Como as provas são independentes, a probabilidade de ocorrência desse evento é k n kp q −× . Porém, o evento “k sucessos em n provas” pode acontecer em outras ordens distintas, todas com a mesma pro-babilidade e o número de ordens é o número de combinações de n elementos k a k.

Portanto, a probabilidade de ocorrerem k sucessos em n provas ou observações é dada por

( ) ,k n knP X k p q

k−

= =

que é chamada de distribuição binomial, onde 1q p= − e k n kp q − é o termo de grau k em p no desenvolvimento do binômio de Newton de nqp )( + . Também

!( )! !

n nk n k k

= −

.

Observação 5.4. A média ou valor esperado da distribuição binomial é n p = × e a variância é 2( )Var X n p q= = × × .

Vejamos agora alguns exemplos resolvidos.

Exemplo 5.10. Uma avaliação final de matemática tem 50 questões independentes. Cada questão tem 5 alternativas. Apenas uma alter-nativa é correta. Se um aluno resolve a avaliação a esmo (no popular chute), qual a probabilidade de tirar nota 5?

Resolução. Seja X o número de acertos, ou seja, X : 0,1,2,...,50.

Logo, a probabilidade de acerto 15

p = e

1 415 5

q = − = .

Você recorda o que seria o binômio de Newton? Binômio de Newton é

uma fórmula que permite desenvolver sob a forma

de polinômio qualquer potência de um binômio,

,

onde n é um inteiro não negativo.

Page 150: LivroEstatística.pdf

150

Portanto, a probabilidade de acertar 25 questões em 50 será

25 50 2550 1 4( 25) 0,000002

25 5 5P X

− = = = .

Exemplo 5.11. Num determinado processo de fabricação, 5% das pe-ças são consideradas defeituosas. As peças são colocadas em caixas com 5 unidades cada uma.

Qual a probabilidade de haver exatamente quatro peças defei-a) tuosas numa caixa?

Qual a probabilidade de haver duas ou mais peças defeituosas b) numa caixa?

Se a empresa paga multa de R$ 15,00 por caixa em que houver c) alguma peça defeituosa, qual o valor esperado da multa num total de 500 caixas?

Resolução. Seja sucesso em cada prova o aparecimento de uma peça defeituosa, assim, 0,05 e 0,95p q= = . Logo,

a) 4 15( 4) (0,05) (0,95)

4P X

= =

4 15 (0,05) (0,95) 0,00003= × × = .

b) P (duas ou mais peças defeituosas)

= ( 2) ( 3) ( 4) ( 5)P X P X P X P X= + = + = + = ,ou,

( 2) 1 [ ( 0) ( 1)]P X P X P X≥ = − = + = ;

0 55( 0) (0,05) (0,95)

0P X

= = =

0,7738;

1 45( 1) (0,05) (0,95)

1P X

= = =

0,2036.

Logo,

0226,0]2036,07738,0[1)2( =+−=≥XP .

c) A probabilidade de ter que pagar multa por caixa defeituosa é P (pagar multa) = 1 ( 0) 1 0,7738 0,2262P X− = = − = .

Page 151: LivroEstatística.pdf

151

O número esperado de caixas com uma ou mais peças defeituosas será

E (pagar multa) = 500 0,2262 113,10× = .

O valor esperado das multas será R$ 15,00 x 113,10 = R$ 1.696,50.

Exemplo 5.12. A probabilidade de um item produzido por uma in-dústria ser defeituoso é 0,03. Um lote de 5.000 itens é enviado para seu depósito. Calcule a média de um item defeituoso e o desvio padrão.

Resolução. Usando diretamente as fórmulas da média e da variância, temos

5.000 0,03 150.n p = × = × =e

5.000 0,03 0,97n p q= × × = × ×

145,5 12,06= = .

Exemplo 5.13. Suponha que 80% de uma criação de suínos esteja atacada por leptospirose. Se uma amostra de 1000 suínos foi exami-nada por um veterinário:

qual a média do número de porcos doentes dessa amostra a) de 1000?

qual a variância e qual o desvio padrão?b)

Resolução. Aqui n = 1000; p = 0,8 e q = 0,2.

Logo,

a) 1000 0,8 800= × = suínos.

b) 2 1000 0,8 0,2 160= × × = suínos e 160 12,649= = suínos.

Exemplo 5.14. Num rebanho bovino, 30% dos animais estão ataca-dos de febre aftosa. Retirando-se ao acaso uma amostra de 10 ani-mais, qual a probabilidade de se encontrar 6 animais doentes?

Resolução. Seja X a variável aleatória associada ao número de ani-mais com febre aftosa, logo : 0,1, 2,...,10X .

n = 10 ; p = 0,3; q = 0,7 e k = 6.

Page 152: LivroEstatística.pdf

152

( 6)P X = 6 410(0,3) (0,7)

6

= × ×

210 0,00073 0,2401 0,037 3,7%= × × = = .

Exemplo 5.15. Numa criação de coelhos, 40% são machos. Qual a probabilidade de que nasçam pelo menos 2 coelhos machos, num dia em que nasceram 19 coelhos?

Resolução. Seja X a variável aleatória associada ao número de coe-lhos macho, logo

: 0,1, 2,...,19X , p = 0,4 e q = 0,6.

A probabilidade desejada, ( 2)P X ≥ , é dada por

( 2) 1 ( 2) 1 [ ( 0) ( 1)]P X P X P X P X≥ = − < = − = + =

0 19 1 1819 191 (0,4) (0,6) (0,4) (0,6)

0 1

= − × × + × ×

1 0,0001 0,008 1 0,00833 0,9919= − + = − = .

Portanto,

( 2)P X ≥ = 99,19%.

5.7 Distribuições ContínuasAté aqui temos lidado com algumas distribuições discretas de pro-babilidade, as quais tratam de situações em que o espaço amostral contém um número finito ou infinito, porém contável, de pontos. Quando uma variável aleatória apresenta um grande número de re-sultados possíveis, não podemos usar distribuições discretas como a binomial para obter probabilidades. Se o espaço amostral contém um número infinito não-contável de pontos, isto porque uma variá-vel contínua inclui, em seus resultados, valores tanto inteiros como não-inteiros, não pode ser adequadamente descrita por uma distri-buição discreta, e por causa disso temos que trabalhar com distri-buições contínuas. O estudo completo destas distribuições exige a aplicação dos métodos do cálculo diferencial e integral, que não são utilizados aqui.

Page 153: LivroEstatística.pdf

153

Consideremos uma variável aleatória que pode tomar todos os va-lores de um dado intervalo. Pertencem a este tipo as mensurações de altura, temperatura, precipitação pluviométrica, tempo de espe-ra numa fila, etc. Tais mensurações na prática são registradas com aproximação de inteiro, décimo ou centésimo. Conforme o caso, a natureza da variável aleatória é essencialmente contínua.

Algumas distribuições de variáveis aleatórias contínuas são impor-tantes. Faremos o estudo da distribuição normal por ser a mais im-portante.

5.7.1 Distribuição NormalÉ uma das mais importantes distribuições de probabilidades, sendo aplicada em inúmeros fenômenos e constantemente utilizada para o desenvolvimento teórico da inferência estatística. Sem dúvida já conhecida de muitos leitores como a “curva em forma de sino”, tem sua origem associada aos erros de mensuração. Sabemos que, ao se efe-tuarem repetidas mensurações de determinada grandeza com um aparelho equilibrado, não se chega ao mesmo resultado todas às ve-zes; obtém-se, ao contrário, um conjunto de valores que oscilam, de modo aproximadamente simétrico, em torno do verdadeiro valor.

Inicialmente se supunha que todos os fenômenos da vida real de-vessem ajustar-se a uma curva em forma de sino em caso contrário, suspeitava-se de alguma anormalidade no processo de coleta de da-dos. Daí a designação de curva normal.

Muitas das variáveis analisadas na pesquisa sócio econômica cor-respondem ou se aproximam da distribuição normal. A distribuição normal é também conhecida como distribuição de Gauss, Laplace ou Laplace-Gauss. A equação da curva normal foi primeiro deduzi-da por Abraham de Moivre por volta de 1730. Posteriormente, Pierre S. de Laplace e Karl F. Gauss desenvolveram estudos sobre a curva.

Uma variável aleatória contínua X tem Distribuição Normal ca-racterizada por uma função ( )f x , cujo gráfico descreve uma curva em forma de sino. Esta distribuição depende de dois parâmetros:

Johann Carl Friedrich Gauss foi um famoso matemático, astrônomo e físico alemão.

Era conhecido como o príncipe dos matemáticos.

Muitos consideram Gauss o maior gênio da história da Matemática. Pierre Simon

Laplace (1749-1827) foi um matemático, astrônomo e

físico francês. Foi chamado o Newton da França, sendo

considerado o fundador da moderna teoria das

probabilidade. Fontes:http://pt.wikipedia.

org/wiki/Carl_Friedrich_Gauss;http://pt.wikipedia.org/

wiki/Laplace

Johann Carl Friedrich Gauss (1777-1855)

Page 154: LivroEstatística.pdf

154

• (média): este parâmetro especifica a posição central da dis-tribuição de probabilidades.

• (desvio padrão): este parâmetro especifica a variabilidade da distribuição de probabilidades. Logo, temos o seguinte grá-fico de ( )f x .

f (x)

Gráfico 5.2

Costuma-se representar essa variável aleatória por 2( , )X = .

A curva é perfeitamente simétrica em torno da média e, indepen-dentemente dos valores de e , a área total entre a curva e o eixo das abscissas é igual a 1, permitindo identificar probabilidades de eventos com áreas sob a curva.

Como a curva é simétrica em torno da média ( ), a probabilidade de ocorrer valor maior do que a média é igual à probabilidade de ocorrer valor menor do que a média, isto é, ambas as probabilidades são iguais a 0,5.

Escrevemos:

( ) ( ) 0,5P X P X> = < = .

A probabilidade de uma variável aleatória com distribuição normal tomar um valor entre dois pontos quaisquer, por exemplo, entre os pontos a e b , é igual à área sob a curva normal compreendida entre aqueles dois pontos. Suponha, então, que: 2( , )X = , e queiramos determinar a probabilidade de X estar entre a e b. Para isso devemos realizar o seguinte cálculo.

Page 155: LivroEstatística.pdf

155

2

2( )

21( )2

xb

aP a X b e dx

−−

< < = ∫ .

No cálculo da probabilidade de uma variável aleatória normalmen-te distribuída, surgem dois problemas:

Para integrar • ( )f x é necessário o seu desenvolvimento usan-do procedimentos de cálculo diferencial e integral.

É necessária a elaboração de uma tabela de probabilidades, •pois ( )f x depende de dois parâmetros, seria muito trabalho para tabelar essas probabilidades considerando as várias com-

binações de e 2 .

Vimos, portanto, que temos dois problemas. O primeiro deles é o fato de existirem infinitas distribuições normais e o segundo é a di-ficuldade para calcular probabilidades na distribuição normal. Para resolver esses dois problemas, foi realizada uma transformação na variável aleatória X , originando uma nova variável, denominada va-riável aleatória normal padronizada e representada pela letra Z , cuja distribuição denomina-se distribuição normal padrão, a qual pas-saremos a estudar.

Foi desenvolvida uma alternativa, para solucionar os problemas le-vantados, que é o de trabalhar com valores padronizados, isto é, a média é tomada como origem, referência do novo sistema (a nova média tem valor zero), e o desvio padrão como medida de afasta-mento a contar da média, ou seja, é a nova unidade de medida. Esta nova escala é chamada de escala Z .

A variável reduzida Z é dada por

XZ −

= ,onde

Z = é o número de desvios padrões a contar da média;

X = é a variável na unidade original;

= é a média da população;

= é o desvio padrão da população.

Page 156: LivroEstatística.pdf

156

Exemplo 5.16. Consideremos uma distribuição normal com média =100 e desvio padrão = 10. Para X = 100, tem-se

100 100 010

Z −= = .

Para X = 130, tem-se:

130 100 310

Z −= = ,

e assim por diante.

Definição 5.9. Se N ( , 2), então a variável aleatória Z definida por

XZ −

= ,

tem uma distribuição N (0,1), isto é, tem distribuição normal com média 0 = e variância 2 1 = , e a função ( )f z é dada por:

2121( )

2z

f z e

−= , com z−∞ ≤ ≤ +∞ .

Logo, Z tem distribuição normal de média zero e variância 1. O aspecto gráfico de uma distribuição normal reduzida ou padronizada é o da figura a seguir.

−2 −1 0 1 2(µ−σ) µ (µ+2σ)(µ+σ)(µ−2σ)

Figura 5.2

Para uma perfeita compreensão da distribuição normal, observemos a figura 5.2 acima e procuremos visualizar as seguintes propriedades:

A variável aleatória • Z pode assumir todo e qualquer valor real.

A representação gráfica da distribuição normal é uma curva •em forma de sino, simétrica em torno da média ( ).

Page 157: LivroEstatística.pdf

157

A área total limitada pela curva e pelo eixo das abscissas é •igual a 1; já que essa área corresponde à probabilidade de a variável aleatória Z assumir qualquer valor real.

A curva normal é assintótica em relação ao eixo das abscissas, •isto é, aproxima-se indefinidamente do eixo das abscissas sem, contudo, alcançá-lo.

As probabilidades, isto é, as áreas sob esta curva, associadas à dis-tribuição normal reduzida ou padronizada são encontradas em tabelas, não havendo necessidade de serem calculadas.

A tabela de distribuição normal reduzida nos dá a probabilidade de Z tomar qualquer valor entre a média zero e um dado valor z , (veja figura abaixo), isto é:

(0 )P Z z< <

0(Média)

z

Área tabelada = área desejada

Figura 5.3

A tabela da distribuição normal reduzida (tabela 5.5, no final do ca-pítulo) é a área sob a curva (a probabilidade de um valor cair naque-le intervalo) entre a média e valores escolhidos de z . A porção som-breada da figura acima corresponde à área sob a curva que pode ser lida diretamente, dada no final deste capítulo.

A tabela vem dada em termos de valores de z com duas casas de-cimais decompostos em duas partes: os valores da parte inteira e da primeira decimal integram a coluna à esquerda, enquanto que a segunda decimal aparece na linha horizontal do topo.

Page 158: LivroEstatística.pdf

158

Vejamos agora um exemplo para determinarmos a área entre a mé-dia e z para ilustrar o uso da tabela.

Exemplo 5.17. Determinar a área entre a média e 1,25z = .

Resolução. Devemos inicialmente localizar 1,2 na coluna à esquerda e, em seguida, 0,05 na linha horizontal do topo. A área será então dada pelo número formado pela interseção da linha 1,2z = e da co-luna 0,05. O valor 0,3944 é a porcentagem da área sob a curva nor-mal entre a média 0 e 1,25z = . Veja a figura abaixo:

00 01 02 03 04 05 06

1,01,11,2 0,3944

......

1,25

...

Figura 5.4

Naturalmente, tal porcentagem (0,3944 = 39,44%) nada mais é do que a probabilidade de uma variável aleatória normal tomar um valor z entre a média e um ponto situado a 1,25 desvios padrões acima da média.

Eis mais alguns exemplos no quadro abaixo, que usam diretamente a tabela da distribuição normal reduzida ou padronizada.

Valor de z Área entre a média e z

0,67 0,2486

-0,67 0,2486(a curva é simétrica em torno da média)

1,84 0,4671

-1,84 0,4671(a curva é simétrica em torno da média)

2,05 0,4798

2,11 0,4826

3,06 0,4985

Quadro 5.4

Page 159: LivroEstatística.pdf

159

A tabela normal reduzida pode também ser usada para determinar a área sob a curva além de um dado valor de z . O detalhe aqui é que a área de uma das metades é 50%, logo a área além de z é 50% menos o valor tabelado. Por exemplo, a área além de 1z = + será 0,5 0,3413 0,1587− = , pois a área entre a média e 1z = + é 0,3413.

50%

Áreana

tabela

0 z

Área desejada = 50% - área tabelada

Figura 5.5

Eis alguns exemplos no quadro abaixo, que usam a tabela da distri-buição normal reduzida ou padronizada e o conceito ilustrado na figura acima.

z

1,73 0,4582 0,5 0,4582 0,0418− =

-1,73 0,48820,5 (0 1,73)P z+ < < −

0,5 04582 0,9582= + =

2,33 0,4901 0,5 0,4901 0,0099− =

1,96 0,4750 0,5 0,4750 0,0250− =

-1,84 0,46710,5 (0 1,84)P z+ < < −

0,5 0,4671 0,9671= + =

Quadro 5.5

Temos, então, que se X é uma variável aleatória com distribuição normal de média e desvio padrão , isto é, 2( , )N , podemos escrever:

1 2 1 2( ) ( )P x X x P z Z z< < = < < , com XZ

= .

Page 160: LivroEstatística.pdf

160

Para melhor compreensão, veremos alguns exemplos resolvidos com o auxílio da tabela da distribuição normal reduzida ou padro-nizada.

Exemplo 5.18. Seja: (100,25)N . Calcular

)106100( ≤≤ XPa) ;

(89 107)P X≤ ≤b) ;

)116112( ≤≤ XPc) .

Resolução. Como 100 = e 5 = logo 5100−

=XZ .

Assim, para responder a letra a), temos

)106100( ≤≤ XP

100 100 100 106 1005 5 5

XP − − − = ≤ ≤

(0 1,2) 0,384930 38,4930%P Z= ≤ ≤ = = .

Portanto, a (100 106) 38,4930%P X≤ ≤ = .

Para responder a letra b), temos

(89 107)P X≤ ≤

89 100 100 107 1005 5 5

XP − − − = ≤ ≤ ( 2,2 1,4)P Z= − ≤ ≤

( 2,2 0) (0 1,4)P Z P Z= − ≤ ≤ + ≤ ≤

0,486097 0,419243 0,90534 90,534%= + = = .

Portanto, (89 107) 90,534%P X≤ ≤ = .

Finalmente, para responder a letra c), temos

)116112( ≤≤ XP

112 100 100 116 1005 5 5

XP − − − = ≤ ≤

(2,4 3,2)P Z= ≤ ≤

Tabela 5.5 no final deste capítulo (p. XX).

Page 161: LivroEstatística.pdf

161

(0 3,2) (0 2,4)P Z P Z= ≤ ≤ − ≤ ≤

0,499313 - 0,491803 = 0,007510=0,7510%= .

Portanto, (112 116) 0,7510%P X≤ ≤ = .

Exemplo 5.19. O peso de uma caixa de frango embalado que a can-tina da Escola Estadual “João XXIII” compra de seu fornecedor para fazer a merenda escolar é uma variável aleatória que tem distribui-ção normal com média de 65 kg e desvio padrão de 4 kg. Um cami-nhão é carregado com 120 caixas de frango. Qual a probabilidade de a carga do caminhão pesar:

Entre 7.893 kg e 7.910 kg?a)

Mais de 7.722 kg? b)

Observação 5.5. Considerar o peso da carga com distribuição normal.

Resolução. Sejam iX : peso de uma caixa de frango embalado onde 2: ( , )iX N ou : (65,16)iX N para 1,2,...,120i = e X é a variável

aleatória do peso da carga do caminhão. Então,

120

1i

iX X

=

= ∑ .

Assim,120

1( ) 65 120 65 7.800

iE X

=

= = = × =∑e

2( )Var X =

120 120

1 1( ) 16 120 16 1.920,i

i iVAR X

= =

= = = × =∑ ∑

ou1920 43,82 = = .

Logo,(7800,1920)N ,

7800 = ,

43,82 = e

7.80043,82

XZ −= .

Page 162: LivroEstatística.pdf

162

Para respondermos a letra a), temos

(7893 7910)P X< <

7893 7800 7800 7910 780043,82 43,82 43,82

XP − − − = ≤ ≤

(2,12 2,51)P Z= ≤ ≤

(0 2,51) (0 2,12)P Z P Z= < < − < <

0,493963 0,482997 0,010966 1,0966%= − = = .

Portanto, a probabilidade de a carga do caminhão pesar entre 7.893 kg e 7.910 kg é de 1,0966%.

Para respondermos a letra b), temos

( 7722)P X >

7800 7722 780043,82 43,82

XP − − = >

( 1,78) ( 1,78 0) 0,5P Z P Z= ≥ − = − ≤ ≤ +

0,5 0,462462 0,962462 96,2462%= + = = .

Portanto, a probabilidade de a carga do caminhão pesar mais de 7.722 kg é de 96,2462%.

Exemplo 5.20. Seja X a variável aleatória que representa os diâme-tros dos parafusos utilizados pela Escola Estadual “Sena Figueire-do” para a manutenção das carteiras e mesas. Suponhamos que essa variável tenha distribuição normal com média = 2 cm e desvio padrão = 0,04 cm. Calcular a probabilidade de um parafuso ter um diâmetro com valor entre 2 e 2,05 cm.

Resolução. Queremos calcular (2 2,05)P X< < . Como 2 = e 2,05 = , temos

2 2 2 2,05 2(2 2,05)0,04 0,04 0,04

XP X P − − − < < = < <

= (0 1,25)P Z< < = 0,3944 = 39,44%.

Portanto, a probabilidade de um parafuso ter um diâmetro com valor entre 2 e 2,05 cm é de 39,44%.

Page 163: LivroEstatística.pdf

163

Exemplo 5.21. A duração de certo tipo de brinquedo na creche “Dona Marrequinha” tem média de 850 dias e desvio padrão de 45 dias. Calcular a probabilidade de esse brinquedo durar:

menos que 750 dias;a)

mais que 800 dias.b)

Resolução.

a) Seja X a variável aleatória de dias de duração do brinquedo na creche “Dona Marrequinha”. Assim 850 = e 45 = .

Temos850 750 850( 750)

45 45XP X P − − < = <

( 2, 222)P Z= < −

0,5 (0 2,222)P Z= − < <

0,5 0,4868 0,0132 1,32%= − = = .

Portanto, a probabilidade de esse brinquedo durar menos que 750 dias é de 96,68%.

b) 850 800 850( 800)

45 45XP X P − − > = >

= ( 1,111)P Z > −

= 0,5 (0 1,1111)P Z+ < <

= 0,5 0,3665 0,8665 86,65%+ = = .

Portanto, a probabilidade de esse brinquedo durar mais que 800 dias é de 86,65%.

5.8 Distribuição Normal como Aproximação da Distribuição Binomial

Muitas situações reais podem ser convenientemente descritas pelo modelo binomial. Acontece que quando o número de repetições do experimento ( n ) for muito grande, para se calcular as probabilida-

Page 164: LivroEstatística.pdf

164

des binomiais são necessários cálculos extensos. Para n suficiente-mente grande e p não próximo de zero e de um, já se obtém boas aproximações da normal à binomial. Se n aumenta, a necessidade de se ter p próximo de 0,5 diminui. Para verificar se a aproximação é boa, uma sugestão é verificar se 5n p× ≥ e (1 ) 5n p× − ≥ , desde que 20n > e 0,50p ≅ .

Uma dificuldade verificada neste tipo de aproximação é que o mo-delo normal é para variável aleatória contínua (raciocinar em termos de intervalo), enquanto o modelo binomial é para variável aleatória discreta.

Para melhorar a aproximação, é necessário um pequeno ajuste (correção de continuidade), que consiste em subtrair e/ou somar 0,5 aos valores da variável aleatória discreta.

Mostraremos este procedimento através de exemplos.

Exemplo 5.22. Consideremos Y uma variável aleatória binomial de parâmetros 10n = e 0,5p = , e queremos calcular (8 10)P Y≤ ≤ .

Resolução. Chamando de X a variável com distribuição normal, tem-se:

(8 10) (7,5 10,5)P Y P X≤ ≤ = ≤ ≤

7,5 10,5XP − − − = ≤ ≤

,

onde10 0,5 5n p = × = × =

e

10 0,5 0,5 1,58113 = × × = . Assim,

7,5 5 10,5 51,58113 1,58113

P Z− − ≤ ≤

(1,5811 3,4785)P Z= ≤ ≤

0,49975 0,44295 0,0568 5,68%= − = = .

Page 165: LivroEstatística.pdf

165

Portanto, a (8 10)P Y≤ ≤ é de 5,68%.

Resolvendo o exemplo 5.22 pela distribuição binomial, vem:

(8 10) 0,044 0,010 0,001 0,055 5,5%P Y≤ ≤ = + + = = .

Observamos que os dois resultados são bem próximos, mesmo com n pequeno, porém, 0,5p = .

Exemplo 5.23. Os frangos da produção da granja “Frangolândia”, responsável pelo fornecimento para a cantina da Escola Estadual “Bento Ribeiro” para merenda escolar de seus alunos, são classifi-cados em grande ou pequeno, conforme seu peso. Verificou-se que 45% dos frangos são considerados grandes. Supondo que os frangos são colocados em caixas de 60, aleatoriamente, calcular:

Em que porcentagem de caixas teremos pelo menos 50% de a) frangos grandes? (50% é igual a 30 frangos).

Em que porcentagem de caixas terá exatamente 50% de fran-b) gos grandes?

Resolução. Aqui, 45% 0,45p = = ; 60n = , pois são colocados nas caixas 60 frangos; 0,45 60 27 = × = e

60 0,45 0,55 3,85356 = × × = frangos.

a) Usando aproximação normal à binomial, a probabilidade de uma caixa conter 30 ou mais frangos será:

( 30) ( 29,5)P Y P X≥ = ≥

29,5 27 ( 0,65)3,85356

P Z P Z− = ≥ = ≥

0,5 (0 0,65)P Z= − ≤ ≤

0,5 0,24215 0,25785 25,785%= − = = .

Portanto, a porcentagem de caixas ou a probabilidade em que tere-mos pelo menos 50% dos frangos grandes é de 25,785%.

b) A probabilidade de encontrarmos exatamente 30 frangos é:

( 30) (29,5 30,5)P Y P X= = ≤ ≤

29,5 27 30,5 273,85356 3,85356

P Z− − = ≤ ≤

Verifique você mesmo este resultado!!

Page 166: LivroEstatística.pdf

166

= (0,65 0,91)P Z≤ ≤

0,31859 0,024215 0,0764 7,64%= − = = .

Portanto, a probabilidade de encontrarmos exatamente 30 frangos é de 7,64%.

Exemplo 5.24. Um dado não viciado é lançado 180 vezes. Determi-nar a probabilidade de o número 4 aparecer:

entre 29 e 32 vezes, inclusive;a)

entre 31 e 35 vezes, inclusive.b)

Resolução. Seja Y a variável aleatória que representa o número de vezes em que ocorre o número 4.

Aqui, 180n = ; 16

p = ; 56

q = .

Assim, 1180 306

= × = ⇒ 30 =

e1 5180 25 56 6

= × × = = ⇒ 5 = .

Na letra a), calculando (29 32)P Y≤ ≤ , temos

(29 32)P Y≤ ≤ (28,5 32,5)P X= ≤ ≤

28,5 30 30 32,5 305 5 5

XP − − − = ≤ ≤

( 0,3 0,5)P Z= − ≤ ≤

( 0,3 0) (0 0,5)P Z P Z= − ≤ ≤ + ≤ ≤

= 0,1179 0,1915 0,3094 30,94%+ = = .

Portanto, a probabilidade de o número 4 aparecer entre 29 e 32 ve-zes, inclusive, é de 30,94%.

Na letra b), calculando (31 35)P Y≤ ≤ , temos

(31 35)P Y≤ ≤ = (30,5 35,5)P X≤ ≤

Page 167: LivroEstatística.pdf

167

30,5 30 30 35,5 305 5 5

XP − − − = ≤ ≤

= (0,1 1,1)P Z≤ ≤ .

(0 1,1) (0 0,1)P Z P Z= ≤ ≤ − ≤ ≤ .

= 0,3643 0,0398 0,3245 32,45%− = = .

Portanto, a probabilidade de o número 4 aparecer entre 31 e 35 vezes, inclusive, é de 32,45%.

Exemplo 5.25. Entre 10.000 dígitos aleatórios, determinar a probabi-lidade de o dígito 2 ocorrer pelo menos 950 vezes.

Resolução. Seja X a variável aleatória que representa o número de vezes em que o dígito 2 ocorre. Vamos calcular ( 950)P X ≤ .

Neste exemplo, 10000n = ; 1

10p = ;

910

q = .

Assim, 110000 1000

10 = × = ⇒ 1000 =

e 1 910000 900 30

10 10 = × × = =

⇒ 30 = .

Logo,

1000 950 1000( 950)30 30

XP X P − − ≤ = ≤

= ( 1,67)P Z ≤ −

( 0) ( 1,67 0)P Z P Z= ≤ − − ≤ ≤

0,5000 0,4525 0,0475 4,75%= − = = .

Portanto, a probabilidade de o dígito 2 ocorrer pelo menos 950 vezes é de 4,75%.

Page 168: LivroEstatística.pdf

168

Exercícios PropostosLançam-se dois dados conjuntamente. Determinar a probabi1) li-dade da soma ser igual ou maior do que 10.

Resposta. 16

.

Um casal planeja ter três filhos. Qual a probabilidade de nas-2) cerem:

Três homens?a)

Dois homens e uma mulher? b)

Resposta. a) 18

; b) 38

.

Uma loja dispõe de 12 geladeiras do mesmo tipo, das quais 4 3) apresentam defeitos.

Se um cliente vai comprar uma geladeira, qual a probabili-a) dade de levar uma defeituosa?

Se um cliente vai comprar duas geladeiras, qual a probabili-b) dade de levar duas defeituosas?

Resposta. a) 13

; b) 111

.

4) Um diretor da “Escola Estadual Primavera” julga que tem 0,40 de probabilidade de ganhar R$ 25.000,00 e 0,60 de probabili-dade de perder R$ 15.000,00 num investimento. Calcule o seu ganho esperado.

Resposta. R$ 1.000,00

5) O diretor da “Escola Estadual D. Pedro I” necessita reformar algumas salas de aula e contratou um empreiteiro que fez se-guintes estimativas para a execução da obra:

Prazo de execução Probabilidade

10 dias 0,30

15 dias 0,20

22 dias 0,50

Page 169: LivroEstatística.pdf

169

Calcule o prazo esperado para a execução da obra, de acordo com essas estimativas.

Resposta. 17 dias.

6) Um número inteiro é escolhido aleatoriamente dentre os nú-meros 1, 2, 3, ..., 50. Qual a probabilidade de o número:

ser divisível por 5;a)

terminar em 3,b)

ser primo;c)

ser divisível por 6 ou por 8.d)

Resposta. a) 1/5; b) 1/10; c) 3/10; d) 0,24.

7) Se 1 1 1( ) ; ( ) e ( )2 3 4

P A P B P A B= = ∩ = , calcular:

a) ( )P A B∪ ; b) ( )P A B− −

∪ ; c) ( )P A B− −

∩ .

Resposta. a) 7/12; b) 3/4 e c) 5/12.

8) Um grupo de 10 pessoas apresenta, de acordo com o sexo e a filiação partidária, a seguinte composição:

Partido AA Partido BB

Homens 21 39

Mulheres 14 26

Calcular:

a probabilidade de um escolhido ser homem;a)

a probabilidade de um escolhido ser mulher do Partido BB;b)

a porcentagem dos partidários do Partido BB;c)

a porcentagem dos homens filiados ao Partido AA;d)

se o sorteado for do Partido AA, a probabilidade de ser mu-e) lher;

se o sorteado for homem, a probabilidade de ser do Partido BB.f)

Resposta. a) 60%; b) 26%; c)65%; d) 21%; e) 40% e f) 65%.

Page 170: LivroEstatística.pdf

170

9) O peso de 60 estudantes da Escola Estadual “Dona Chiqui-nha” são normalmente distribuídos com média 65,3 kg e des-vio padrão 5,5 kg. Determinar a probabilidade de estudantes que pesam:

entre 60 e 70 kg;a)

mais que 63,2 kg;b)

menos que 68 kg.c)

Resposta. a) 0,6338; b) 0,648; c) 0,6879.

10) Dois times de futebol, A e B, jogam entre si 6 vezes. Determi-nar a probabilidade do time A ganhar 4 jogos.

Resposta. 20/243.

Para saber mais sobre distribuição normal como aproxima-ção da binominal, consulte:

SOARES, J. F; FARIAS, A. A.; CESAR, C. C. Introdução à esta-tística. Rio de Janeiro: LTC, 1991.

ResumoNeste capítulo, você teve a oportunidade de estudar e compreender os conceitos de experimento, espaço amostral, evento, axiomas da probabilidade, probabilidades finitas dos espaços amostrais finitos, cálculo de probabilidade condicional e ainda percebeu a indepen-dência estatística com eventos mutuamente exclusivos.

Você pôde compreender também como calcular o valor esperado, a variância e o desvio padrão de uma variável aleatória, entender a análise dos modelos clássicos de distribuição de probabilidade, principalmente a distribuição discreta binomial, a distribuição nor-mal e a distribuição normal como aproximação da binomial.

Resta mencionar que a compreensão sempre referida é importante para que você possa acompanhar o curso. Só prossiga após fazer

Page 171: LivroEstatística.pdf

171

todos os exercícios propostos, já que tudo que veremos a seguir de-pende de alguns conceitos abordados neste capítulo. Consulte o tu-tor do pólo sempre que achar necessário.

ApêndiceÁrea na Cauda Direita sob a Distribuição Normal Padronizada

Cada valor da tabela indica a proporção da área total sob a curva normal contida no segmento delimitado por uma perpendicular le-vantada na média e uma perpendicular levantada à distância de z desvios padrões unitários.

zMédia

Ilustrando: 43,57% da área sob uma curva normal estão entre a or-denada máxima e um ponto 1,52 desvios padrões adiante.

z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09

0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359

0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753

0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141

0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517

0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879

0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224

0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2518 0,2549

0,7 0,2580 0,2612 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852

0,8 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133

0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389

Page 172: LivroEstatística.pdf

172

z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09

1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621

1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830

1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015

1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177

1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319

1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441

1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545

1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633

1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706

1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767

2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817

2,1 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857

2,2 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890

2,3 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916

2,4 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936

2,5 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952

2,6 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964

2,7 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974

2,8 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,4981

2,9 0,4981 0,4982 0,4982 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986

3,0 0,4986 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990

3,1 0,4990 0,4991 0,4991 0,4991 0,4992 0,4992 0,4992 0,4992 0,4993 0,4993

3,2 0,4993 0,4993 0,4994 0,4994 0,4994 0,4994 0,4994 0,4995 0,4995 0,4995

3,3 0,4995 0,4995 0,4995 0,4996 0,4996 0,4996 0,4996 0,4996 0,4996 0,4997

3,4 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4998 0,4998

3,5 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998

3,6 0,4998 0,4998 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999

3,7 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999

3,8 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,5000 0,5000 0,5000

3,9 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000

Tabela 5.5

Page 173: LivroEstatística.pdf

Capítulo 6Amostragem

Page 174: LivroEstatística.pdf
Page 175: LivroEstatística.pdf

175

Capítulo 6Amostragem

Neste capítulo, apresentaremos o conceito de amostragem. Estudaremos a amostragem casual simples e também ana-lisaremos o conceito de distribuições amostrais das médias com e sem reposição. Também explicaremos distribuição amostral das proporções. Todos esses assuntos serão abor-dados com exemplos numéricos.

6.1 IntroduçãoA seguir, apresentamos alguns conceitos básicos de amostragem. Explicamos também sua utilização conforme a cada situação.

Amostragem• – é a parte de Estatística que se preocupa com os modos e as maneiras de relacionar amostras que sejam represen-tativas das populações e que proporcionem estimativas, as mais precisas possíveis, para a obtenção dos objetivos desejados.

População• – é um conjunto de elementos possuindo pelo me-nos uma característica comum. Na prática, considera-se popu-lação como sendo um conjunto de números que representam esta característica de interesse. Às vezes, a população também é chamada de universo. As populações podem ser:

Finitasi) – quando possuem um número finito de elementos. Por exemplo: os alunos da uma turma; os alunos da UFSC; resultados possíveis do lançamento de uma moeda ou da-dos; produção mensal de uma máquina.

Infinitasii) – quando uma população é suficientemente gran-de para que sua distribuição de probabilidade se mantenha inalterada durante a retirada de uma amostra. Por exem-plo: resultado dos lançamentos de uma moeda ou de dados; produção passada e futura de uma máquina.

Page 176: LivroEstatística.pdf

176

Amostra• – é uma parte (subconjunto) necessariamente fini-ta da população, retirada segundo uma regra conveniente. Quanto maior a amostra, mais precisos e mais cofiáveis são os resultados.

Censo• – ao medir ou observar todos os elementos de uma po-pulação realizamos um censo.

Censo x Amostragem• – há várias situações de aplicação de censo ou amostragem. Abaixo, descrevemos algumas situa-ções de quando utilizamos censo e quando utilizamos amos-tragem:

Censoi) – é utilizado quando:

a população é bastante pequena;a)

o tamanho da amostra for grande em relação à popula-b) ção;

for necessária a precisão completa;c)

já se dispõe da informação completa.d)

ii) Amostragem – é utilizada quando:

a população é infinita;a)

uma amostra for mais atualizada do que o censo (infor-b) mações urgentes – epidemias);

houver testes de caráter destrutivo (lâmpadas, munições, c) vidraçarias);

o custo do censo é mais elevado;d)

a precisão sofrer quando a população for muito grande;e)

O tipo de informação pode depender da utilização de f) uma amostra ou de um censo (premência de tempo, res-trições orçamentárias, exame de laboratório de análise clínica).

6.1.1 Tipos de amostragemExistem dois tipos de amostragem: probabilística e não probabi-lística.

Um censo é um processo de obter informação sobre a totalidade dos membros de uma dada população (não tem de ser, necessariamente, uma população humana). Os chineses e romanos elaboraram os primeiros censos conhecidos; a finalidade deste trabalho na época era militar e fiscal; em Roma, era o censor que mantinha o moral público e levava ao governo central as informações sobre o estado geral da população. Fonte: http://pt.wikipedia.org/wiki/Censo

Page 177: LivroEstatística.pdf

177

Amostragem probabilísticaA amostragem será probabilística se todos os elementos da popu-lação tiverem probabilidade conhecida, e diferente de zero, de per-tencer à amostra. Isto implica num sorteio com regras bem deter-minadas, cuja realização só será possível se a população for finita e totalmente acessível.

A utilização de uma amostragem probabilística é o melhor que se deve fazer para garantir a representatividade de amostra ao se fazer inferências estatísticas. Números de amostras possíveis de construir:

Sem reposição: • nNC ;

Com reposição: • nN .

As seguintes técnicas de amostragem probabilística são as seguintes:

Amostragem simples ao acasoa) (aleatória, randômica, casual, simples, elementar) – é equivalente a um sorteio lotérico. Pode ser usada a tabela de números aleatórios (TNA):

a TNA contém os dez algarismos 0, 1,..., 9. Estes números •podem ser lidos isoladamente ou em grupos, em qualquer ordem, por coluna, por linhas, diagonalmente, de cima para baixo;

uma característica TNA é que todos os algarismos têm a •mesma probabilidade de ocorrer;

outra característica é que as combinações de algarismos têm •a mesma probabilidade que outras combinações.

Procedimento. Seja a escolha aleatória de 15 clientes entre 830.

atribuímos números de 001 a 830 (o 1• o ao último);

necessitamos de três algarismos.•

Amostragem sistemáticab) – caso os elementos se apresentem ordenados, e as retiradas dos elementos da amostra forem fei-tas periodicamente.

Procedimento. Seja a escolha aleatória de 15 clientes entre 830:

tamanho dos grupos •830 55,3...15

= , isto é 56;

Page 178: LivroEstatística.pdf

178

pela TNA, procuramos o 1• o elemento entre 01 e 56;

vamos supor que ocorra o elemento 12; •

os demais serão obtidos pela fórmula: • 12 56 n+ × com 1, 2,.., 14n = ;

12, 68, ... , 740, 796.•

Amostragem estratificadac) – muitas vezes, a população se divi-de em sub populações ou estratos, sendo razoável supor que, de estrato para estrato, a variável de interesse apresente um comportamento substancialmente diverso, tendo, entretanto, comportamento razoavelmente homogêneo dentro de cada estrato. Por exemplo,

usinas de açúcar no estado de São Paulo (três grupos – pe-•quenos, médios e grandes);

estudantes, conforme suas especializações ou faixas etárias.•

A amostragem estratificada pode ser:

Uniforme• – mesmo número de elementos por estrato pro-porcional ao número de elementos de estrato.

Ótima• – número de elementos de cada estrato proporcional ao número de elementos de estrato e usando-se o desvio padrão (variação menor – menos elementos).

Amostragem por conglomeradosd) – pressupõe a disposição dos itens de uma população em grupos heterogêneos repre-sentativos da população global. Por exemplo, no estudo da po-pulação de uma favela:

é impossível relacionar todos os habitantes, porém é possí-•vel relacionar os barracos;

efetuar a escolha casual simples de barracos e estudar os •indivíduos que moram nos barracos sorteados.

Amostragem em estágios múltiplose) – a amostra é retirada em diversas etapas sucessivas. Dependendo dos resultados ob-servados, etapas suplementares podem ser dispensadas. Por exemplo, na pesquisa para uma fábrica de detergentes em San-ta Catarina

Page 179: LivroEstatística.pdf

179

1• o estágio: sortear os municípios de Santa Catarina;

2• o estágio: sortear quarteirões dos municípios;

3• o estágio: sortear residências dos quarteirões sorteados.

Amostragem não probabilísticaÉ aquela em que há uma escolha deliberada dos elementos da amos-tra. As amostras intencionais como também são usadas em certos tipos de pesquisa de mercado, porém as inferências feitas nestas condições não permitem analisar a probabilidade de erro.

As situações onde utilizamos amostragem não probabilística são as seguintes:

Inacessibilidade a toda a populaçãoa) – busca-se a amostra na parte da população que é acessível. Por exemplo,

minério• – colhe-se na camada próxima à superfície;

peixes• – somente os que foram apanhados.

A população é formada por material contínuob) – impossível a amostragem probabilística, por exemplo, quando trabalhamos com gases ou líquidos, etc.

Amostragens intencionaisc) – o amostrador escolhe deliberada-mente certos elementos para pertencer à amostra por julgar tais elementos bem representativos da população. Por exemplo,

pesquisa de mercado para carros superluxo• – selecio-nar pessoas de alto poder aquisitivo.

congressos estudantis• – participação de elementos que coordenam os diretórios.

6.1.2 Principais fases de um levantamento estatístico

Objetivos do levantamentoa) – conseguir definições claras e di-retrizes para sua perfeita execução.

Populaçãob) – deve ser bem definida.

Page 180: LivroEstatística.pdf

180

Dados a serem coletadosc) – somente levantar dados essenciais.

Grau de precisão desejadod) – dimensionar a amostra no grau de precisão desejado.

Métodos de medidae) – estruturar toda a metodologia da coleta de dados.

Unidade de amostraf) – definir a unidade de amostra – indiví-duo, casa, família etc.

Escolha do tipo de amostrag) – de acordo com o tipo de levan-tamento, levando em conta a exeqüibilidade e os custos ope-racionais.

Pré-amostragemh) – testar em pequena escala para verificar a necessidade ou não de alternações.

Organização do trabalhoi) – traçar uma sistemática de trabalho ou uma rotina de operações para toda equipe de trabalho.

Sintetização e analise de dadosj) – compilação e conferência de dados, gráficos, tabelas e testes estatísticas.

Sugestõesk) – informações utilizáveis em futuros levantamentos.

Este trabalho somente vai se concentrar no caso mais simples de amostragem probabilística: amostragem casual simples.

6.2 Amostragem Causal SimplesA maneira mais fácil de selecionarmos uma amostra é aquela em que atribuímos a cada elemento da população a mesma probabili-dade de seleção, e o elemento sorteado é reposto na população antes do próximo sorteio. Podemos obter uma amostra nessas condições, escrevendo cada elemento da população num cartão, misturando-se numa e sorteando tantos cartões quantos desejarmos nas amostras. Esse procedimento torna-se invariável quando a população é mui-to grande. Nesse caso, usa-se um processo alternativo, em que os elementos são numerados e em seguida sorteados através de uma tabela de números aleatórios. A seguir damos algumas definições de amostra casual simples de tamanho n .

Page 181: LivroEstatística.pdf

181

Definição 6.1. Uma amostra casual simples de tamanho n de uma variável aleatória X com uma dada distribuição é o conjunto de n variáveis aleatórias independentes, 1 2, ,..., nX X X , cada uma com a mesma distribuição de X . Ou seja, a amostra será a n -upla or-denada 1 2( , ,..., )nX X X em que iX indica a observação do i -ésimo elemento sorteado.

A média da amostra é dada por

( )1 21 ... nX X X Xn

= + + + .

Podemos observar que X é também uma variável aleatória. Qual-quer outra característica da amostra também será uma função do vetor aleatório 1 2( , ,..., )nX X X .

Definição 6.2. Uma estatística é uma característica da amostra, ou seja, uma estatística T é uma função de 1 2, ,..., nX X X , isto é,

1 2( , ,..., )nT f X X X= .

As estatísticas mais comuns são:

1

1 n

ii

X Xn =

= ∑ → média de amostra

2 2

1

1 ( )1

n

ii

s X Xn =

= −− ∑

→ variância da amostra

mín 1 2mín , ,..., nX X X X= → menor valor da amostra

máx 1 2máx , ,..., nX X X X= → maior valor da amostra

máx mínw X X= − → amplitude total da amostra

( )iX → ésima maior observação da amostra

2 2

1

1ˆ ( )n

ii

X Xn

=

= −∑

→ variância da população Assim, se estamos colhendo amostras de uma população identifi-cada pela variável aleatória (v.a.) X (definida na seção 5.4) então, a média ( )E X e a variância var ( )X são da população, ou seja,

( ) 2Var X = e ( )E X = .

Page 182: LivroEstatística.pdf

182

Normalmente, são utilizadas as seguintes notações:

Estatística amostral População

Média X

Variância 2s 2

Número de Elementos n N

Proporção p p

Quadro 6.1

Como já vimos antes amostra é uma parte (subconjunto)necessaria-mente finita da população, retirada segundo uma regra convenien-te. Veja o gráfico a seguir:

População AmostrasFunções

AmostraisDistribuições

das F. Amostrais

A AA

U U

Inferência Estatística

X,S2,n,pµ,σ,N,P

Gráfico 6.1

Observação 6.1. Quanto maior a amostra mais precisa e mais confi-ável devem ser os resultados.

6.3 Distribuições AmostraisA teoria da amostragem é um estudo das relações existentes entre uma população e as amostras dela extraídas.

Através das estatísticas amostrais – grandezas correspondentes às amostras (média aritmética, desvio padrão, variância etc.)- procura-se avaliar as grandezas desconhecidas das populações parâmetros populacionais (parâmetros).

Page 183: LivroEstatística.pdf

183

Ao retirar uma amostra aleatória de uma população, portanto, esta-remos considerando cada valor da amostra como um valor de uma variável aleatória cuja distribuição de probabilidade é a mesma da população no instante da retirada desse elemento para amostra.

Uma distribuição amostral é uma distribuição de probabili-dades que indica até que ponto uma estatística amostral tende a variar devido à variações casuais na amostragem aleatória.

6.3.1 Distribuição Amostral da Média: Com e Sem Reposição

Se extrairmos um objeto de uma urna, poderemos repô-lo ou não na urna antes da extração seguinte. No primeiro caso, determinado objeto pode aparecer mais de uma vez, enquanto, no segundo caso, o objeto só pode aparecer uma vez. No primeiro caso, temos a amos-tragem com reposição e no segundo, amostragem sem reposição.

Vamos estudar agora a distribuição amostral da estatística X , a média da amostra. Consideremos uma população identificada pela variável X , cujos parâmetros médios populacionais ( )E X = e va-riância populacional ( )2 Var X = são supostamente conhecidos. Va-mos retirar todas as possíveis amostras causais simples de tamanho n dessa população, para cada uma calcular a média X . Em seguida, construímos a distribuição amostral e estudamos suas propriedades.

A seguir apresentaremos um exemplo de cálculo de média, variân-cia etc. da amostra e da população:

Exemplo 6.1. Seja uma população limitada a 3 valores, ou seja, 2,4,6X = . Então, a média da população.

2 4 6 43

+ +

= = .

O desvio padrão da população é:

1 ( )ix Xn

= −∑

Page 184: LivroEstatística.pdf

184

2 2 2(4 2) (4 4) (6 4)3

− + − + −=

8 1,6333

= = .

Consideremos as amostras aleatórias de 2 elementos com reposição.

Conjunto das amostras:

( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) 2,2 , 2,4 , 2,6 , 4,2 , 4,4 , 4,6 , 6,2 , 6,4 , 6,6 .

Conjunto das médias das amostras:

2, 3, 4, 3, 4, 5, 4, 5, 6 .

Este conjunto é uma população.

Média do conjunto das médias:

2 3 4 3 4 5 4 5 6 49X

+ + + + + + + += =

Desvio padrão do conjunto das médias:

4 1,15473X = =

Pelo exemplo observamos que

4 8 8 13 3 2 3 2X = = = ×

×.

Observação 6.2. Do exemplo acima podemos observar que

É possível demonstrar que de uma população de tamanho i) N da qual são retiradas todas as amostras possíveis de tamanho n , obtemos população infinita ou amostragem com reposição.

ii) X = , isto é, a média das médias de todas as amostras possí-veis do mesmo tamanho retirados de uma mesma população de valores X é igual a média desta população.

ii) X n

= , isto é, o desvio padrão das médias dessas amostras é

igual ao desvio padrão da população dividida pela raiz quadrada do tamanho da amostra.

Page 185: LivroEstatística.pdf

185

Mais precisamente, temos o seguinte teorema:

Teorema 6.1. Seja X uma v.a. com média e variância 2 , e seja

1 2( , ,..., )nX X X uma amostra casual simples (amostragem com repo-sição) com

1 2 ... nX X XXn

+ + += .

Então, temos

( )X E X = = (1)

e2

2 2var ( ) ( )X X E Xn

= = − = . (2)

O teorema a seguir é conhecido como Teorema do Limite Central, em que a distribuição amostral de X aproxima-se cada vez mais de uma distribuição normal quando o tamanho da amostra aumenta in-dependente de distribuição da população original.

Teorema 6.2. Para amostras casuais simples 1 2( , ,..., )nX X X retira-das de uma população com média e a variância 2 , a distribuição

amostral da média ( )1 2, ,..., nX X X

Xn

= aproxima-se de uma distri-

buição normal com média e variância 2

n

, quando n tende ao infinito.

Observação 6.3. Se a população tem tamanho N , se a amostragem é sem reposição, e se o tamanho da amostra é n N≤ , então (2) é substi-tuída por

22

1X

N nn N

− = −

, (3)

ao passo que X é dado ainda por (1), ou seja, X = . Note que (3) se reduz a (2) quando N → ∞ .

Assim, podemos dizer que

À medida em que se aumenta o tamanho da amostra, a distri-buição da amostragem da média se aproxima da forma da dis-tribuição normal, qualquer que seja a forma da população.

O Teorema do Limite Central estabelece condições

segundo as quais a soma de variáveis aleatórias é

aproximadamente normal. Fonte: http://pt.wikipedia.

org/wiki/Teorema_do_Limite_Central

Page 186: LivroEstatística.pdf

186

Na prática, a distribuição de amostragem da média pode ser consi-derada como aproximadamente normal sempre que o tamanho da amostra for 30n ≥ .

Exemplo 6.2. Uma população consiste dos números 1, 3, 6, 7, 8. Con-sideremos todas as amostras possíveis de tamanho 2 que podem ser extraídas, com reposição dessa população. Determine:

a média da população;a)

o desvio padrão da população;b)

a média da distribuição amostral de médias;c)

o desvio padrão da distribuição amostral de médias, isto é, o d) erro padrão das médias;

a média de distribuição amostral de médias sem reposição;e)

a variância da distribuição amostral de médias.f)

Resolução.

a) A média da população é

1 3 6 7 8 55

+ + + +

= = .

b) O desvio padrão da população é

( ) ( ) ( ) ( ) ( )2 2 2 2 22 1 5 3 5 6 5 7 5 8 5

5

− + − + − + − + −=

16 4 1 4 9 34 6,85 5

+ + + += = = .

c) Média da distribuição amostral de médias:

temos 25 25= amostras de tamanhos 2 com reposição. Essas amos-tras são:

(1,1) (1,3) (1,6) (1,7) (1,8)

(3,1) (3,3) (3,6) (3,7) (3,8)

(6,1) (6,3) (6,6) (6,7) (6,8)

(7,1) (7,3) (7,6) (7,7) (7,8)

(8,1) (8,3) (8,6) (8,7) (8,8)

Page 187: LivroEstatística.pdf

187

As correspondentes médias amostrais são:

1 2 3,5 4 4,5

2 3 4,5 5 5,5

3,5 4,5 6 6,5 7

4 5 6,5 7 7,5

4,5 5,5 7 7,5 8

A média da distribuição amostral das médias é

soma de todas as médias dadas na tabela25X =

125 5,025

= = .

d) Obtém-se a variância da distribuição amostral da média subtrain-do-se a média 5,0 de cada número dado na tabela, elevando-se o resultado ao quadrado, somando-se todos os valores assim obtidos, e dividindo os por 25. O resultado final é:

( ) ( ) ( ) ( )2 2 2 22 1 5 2 5 ... 7,5 5 8 5

25X− + − + + − + −

=

85 3,425

= = .

Isto mostra que, para população finita envolvendo amostragem com

reposição ou populações infinitas, 2

2X n

= , pois o membro direto é

6,8 3,42

= , o que está de acordo com o valor obtido acima.

e) Há 5,25! 5.4 10

2! 3! 1.2C = = = amostras de tamanho dois, sem reposi-

ção, que podem ser extraídas da população. Isto significa que pode-mos extrair um número e em seguida outro número diferente do 1°, a saber,

(1,3) (1,6) (1,7) (1,8) (3,6)

(3,7) (3,8) (6,7) (6,8) (7,8)

Aqui a escolha (1,3), por exemplo, é considerada idêntica à escolha (3,1). As médias amostrais correspondentes são

Page 188: LivroEstatística.pdf

188

2 3,5 4 4,5 4,5

5 5,5 6,5 7 7,5

e a média da distribuição amostral das médias é

2 3,5 4 4,5 4,5 5 5,5 6,5 7 7,510X

+ + + + + + + + +=

50 5,010

= = .

Isto mostra que X = .

f) A variância da distribuição amostral de médias é

2 2 2 2 2 21 (2 5) (3,5 5) (4 5) (4,5 5) (4,5 5)10x = − + − + − + − + −

( ) ( ) ( ) ( ) ( ) 2 2 2 2 25 5 5,5 5 6,5 5 7 5 7,5 5+ − + − + − + − + −

2 2 2 2 2 2 2 2 21 3 (1,5) 1 (0,5) (0,5) (0,5) (1,5) 2 (2,5)10

= + + + + + + + +

2 2 2 2 2 21 3 (2,5) 2 2 (1,5) 1 3 (0,5)10

= + + + × + + ×

1 9 6,25 4 4,5 1 0,7510

= + + + + +

1 25,5 2,55

10= × =

1,5968X⇒ = .

Isto mostra que

2

2

1X

N nn N

− = −

( 5 e 2)N n= =

1,5968X⇒ = ,

o que é o mesmo valor calculado acima.

Page 189: LivroEstatística.pdf

189

Fator de Correção Finita (FCF)O fator de correção finita é usado quando o tamanho da amostra é superior a 5% do tamanho da população, principalmente no caso de amostragem sem reposição. Esse fator é dado por

5%1

N nn FCFN

−> ⇒ =

−,

xσ = µ .e

1xN nNn

σ −σ = ⋅

−.

Observação 6.4. Quanto à normalidade da distribuição da popu-lação:

se for a) normal, então a distribuição amostral de X será normal para qualquer tamanho da amostra.

se não for normal, então,b)

para amostras suficientemente grandes (população infinita, •amostragem com reposição) a distribuição de X será aproxima-damente normal.

para amostras • sem reposição de população finita com 30n > , a distribuição de X é aceita como normal.

para a determinação da probabilidade e caso a distribuição de c) X seja normal, aplicamos a transformação de padronização:

x

Xz − µ=

σ ou

/Xz

n− µ

,

onde:

X – elemento da distribuição X;

µ – média da população;

σ – desvio padrão da população;

n – tamanho da amostra.

Exemplo 6.3. Suponhamos que as alturas de 2500 estudantes do sexo masculino em uma universidade tenha média 175 cm e desvio

Page 190: LivroEstatística.pdf

190

padrão 9 cm. Extraindo-se 70 amostras de 36 estudantes de cada uma, quais seriam a média e o desvio padrão da distribuição amos-tral de médias no caso de:

amostragem com reposição;a)

amostragem sem reposição;b)

abaixo de 170 cm.c)

quantos amostras podem esperar que a média esteja entre 172 d) cm e 179 cm.

Resolução.

a) e b) Pela fórmula, temos em total de amostras com reposição 36(2500) e 2500,36C sem reposição. Logicamente, ambas são bem

maiores que 70. Então, neste caso não obtemos uma distribuição amostral verdadeira, mas uma distribuição amostral experimental. Como o número de amostras é muito grande, deve haver aproxima-ção satisfatória entre as duas distribuições amostrais. Logo, a média e o desvio padrão esperados devem estar próximos dos valores corres-pondentes de distribuição teórica. Então, temos

175X = = cm,

9 9 1,5636X n

= = = = .

Agora, utilizando o fator de correção finita, temos

9 2500 36 3 49,6386 1,4891 6 2500 1 2 49,9984X

N nNn

− −= = = = × =

− − cm.

O que é quase igual a 1,5, portanto, para fins práticos, podemos con-siderar como o mesmo valor obtido por amostragem com reposição.

Assim, podemos concluir que a distribuição experimental das médias tem distribuição aproximadamente normal com média 175 cm e des-vio padrão 1,5 cm.

c) A média amostral X , em unidades padronizadas, é aqui dada por

1751,5

X

X

X Xz

− −= = ;

Page 191: LivroEstatística.pdf

191

172 em unidades padronizadas é

( )172 1752,0

1,5−

= = − ;

179 em unidades padronizadas é

( )179 1752,67

1,5−

= = .

Proporção da amostra com médias 172 e 179

= (área sob a curva normal entre 2z = − e 2,67z = )

= área entre ( 2z = − e 0z = ) + área entre ( 0z = e 2,67z = ).

=0,4772 + 0,4962 = 0,9734.

Número esperado da amostra:

= 70 (0,9734) = 68,13 ou 68.

-2 2,67

Figura 6.1

d) 173 em unidades padronizadas é

( )173 1751,34

1,5−

= = − .

Porções de amostras com média inferior a 173 cm

= (área sob a curva normal à esquerda de 1,34z = − )

= (área à esquerda de 0z = ) – (área entre 1,34z = − e 0z = ).

= 0,5 - 0,4099 = 0,0901.

Page 192: LivroEstatística.pdf

192

-1,34

Figura 6.2

Então o número esperado de amostras é

( )70 0,0910 6,307× = ,

ou seja, aproximadamente 6.

Exemplo 6.4. Seiscentos alunos têm peso médio de 70 kg e desvio padrão de 5,0 Kg. Determine a probabilidade de 50 pessoas extraí-das aleatoriamente desse grupo terem:

um peso médio entre 68 e 69 kg;a)

de mais que 72 kg.b)

Resolução. Para distribuição amostral de médias:

70x kg = =e

5 600 501 600 150X

N nNn

− −= =

− −

0,707 0,958 0,68= × = .

a) O peso médio estará entre 68 e 69 Kg. Se o peso médio da amostra de 100 alunos estiver entre 68 e 69 Kg,

68 em unidades padronizadas é

68 70 2,98

0,67−

= = − ;

69 em unidades padronizadas é

69 70 1,49

0,67−

= = − .

Page 193: LivroEstatística.pdf

193

Probabilidade desejada

= (área entre 2,98z = − e 1,49z = − )

= (área entre 2,98z = − e 0z = ) – (área entre 1,49z = − e 0z = )

= 0,4986 0,4319 0,0667− = =6,67%.

−2,98 −1,49

Figura 6.3

b) O peso total excederá 72Kg se o peso médio dos 100 alunos da amostra exceder os 75Kg.

Em unidades padronizadas, 75 é

( )72 702,98

0,67−

= = .

Probabilidade desejada

= (área entre 2,98z = )

= (área à direita de 2,98z = )

= (área à direita de 0z = ) – (área entre 0z = e 2,98z = )

= 0,5 0,4986 0,0014− = =0,14%,

o que é praticamente zero.

Exemplo 6.5. Um fabricante de baterias alega que seu artigo de pri-meira categoria tem uma vida esperada (média) de 50 meses. Sabe-se que o desvio-padrão correspondente é de 4 meses. Que percentagem de amostras de 36 observações acusará vida média, no intervalo de 1 mês, em torno de 50 meses, admitindo ser de 50 meses a verdadei-ra vida média das baterias?

Page 194: LivroEstatística.pdf

194

Resolução.

1) Dados: 50µ = meses, 4σ = meses, 36n = .

2) (49 51) ?P X≤ ≤ =

3) Cálculos: 1 2(49 51) ( )P X P z z z≤ ≤ = ≤ ≤

149 50 1,54 / 36

z −= = − , 2

51 50 1,54 / 36

z −= = .

Logo,

(49 51) ( 1,5 1,5)P X P z≤ ≤ = − ≤ ≤

0,4332 0,43320= +

0,8664 86,64%= = .

Exemplo 6.6. Uma máquina para recobrir cerejas de chocolates é regulada para produzir um revestimento de 3mm de espessura. O processo tem distribuição normal com desvio padrão de 1mm. Se o processo funciona conforme e esperado (isto é, média de 3mm e desvio padrão de 1mm), qual seria a probabilidade de extrair uma amostra de 25 de um lote de 169 cerejas e encontrar uma média amostral superior a 3,4mm?

Resolução. Temos os seguintes dados:

1) 3µ = mm, 1σ = mm, 25n = , 169N = .

2) ( 3,4) ?P X > =

3) Cálculos: 1( 3,4) ( )P X P z z> = >

25 0,15 5%169

nN

= = > - FCF,

1 169 25 0,185169 125x

−σ = ⋅ =

−, 1

3,4 3 2,160,185

z −= = .

Logo,

( 3,4) ( 2,16)P X P z> = >

0,5 0,4846 0,0154 1,54%= − = = .

Page 195: LivroEstatística.pdf

195

Exemplo 6.7. Certos amortecedores fabricados por uma empresa têm uma vida média de 800 dias e desvio padrão de 60 dias. Deter-minar a probabilidade de amostras aleatórias de 16 amortecedores, retirados do grupo terem a vida média entre 770 e 830 dias.

Resolução. Temos seguintes dados:

1) 800µ = dias, 60σ = dias, 16n = .

2) (770 830) ?P X≤ ≤ =

3) Cálculos: 1 2(770 830) ( )P X P z z z≤ ≤ = ≤ ≤

1770 800 260 / 16

z −= = − , 2

830 800 260 / 16

z −= = .

Logo,

(770 830) ( 2 2)P X P z≤ ≤ = − ≤ ≤

0,4772 0,4772= + 0,9544 95,44%= = .

6.4 Distribuição Amostral das Proporções

Uma distribuição de proporções amostrais indica quão provável é de-terminado conjunto de proporções amostrais, dados o tamanho da amostra e a proporção populacional. Quando o tamanho da amos-tra é 20 ou menos, as probabilidades dos diversos resultados pos-síveis podem ser lidas diretamente numa tabela de probabilidades binomiais, simplesmente convertendo o número de sucessos em percentagens. Por exemplo, 4 ocorrências em 10 observações corres-pondem a 40% e 10 ocorrências em 20 observações correspondem a 50%. Para maiores amostras, a aproximação normal da binomial dá resultados bastante satisfatórios.

Admitamos que uma população é infinita e que a probabilidade da ocorrência de um evento (seu sucesso) é p , enquanto sua não-ocor-rência é 1q p= − . De uma população de tamanho N são retiradas todas as amostras possíveis de tamanho n e é determinada a pro-porção de sucessos. Então:

Page 196: LivroEstatística.pdf

196

População Infinita ou Amostragem com Reposição•

p pµ = e ppqn

σ = .

Amostragem sem Reposição de População Finita•

p pµ = e caso 5%n > 1p

pq N nn N

−σ = ×

−.

Fator de Correção de Continuidade (FCC)• - Considerando que a proporção é uma variável discreta e que a população é distribuída binomialmente ( p e q ), o que não impede de

30n > ser aceita como aproximadamente normal. É necessá-

rio, então, que se acrescente ou se subtraia 1

2 n×, conforme a

situação exigir. A transformação para o uso da Curva Normal Padronizada será efetuada pela fórmula:

p p FCCz′ − ±

,

onde

p′ é a proporção da amostra;

p é a proporção da população;

σ é o desvio padrão da população;1

2FCC

n=

× Fator de Correção de Continuidade.

Exemplo 6.8. Determine a probabilidade de que em 80 jogadas de uma moeda apareçam:

entre 45% e 55% de cara.a)

.b) 35

ou mais caras.

Resolução. Consideremos 80 jogadas como uma amostra das infini-tas jogadas possíveis da moeda. Em tal população, a probabilidade de

“cara” é 12

p = , e a probabilidade de coroa é 19 12

p= − = .

a) Queremos a probabilidade de o número de caras em 80 jogadas estar entre 36 (45% de 80) e 44 (55% de 80). Temos

Page 197: LivroEstatística.pdf

197

1número de caras 80 402

np = = = × = ,

1 180 20 4,472 2

n p q = = × × = = ,

1 1 1 0,006252 2 80 160

FCCn

= = = =×

e

1 12 2 0,055980p

p qn

×

= = = .

Em unidades padronizadas, 45% com FCC é

0,45 0,00625 0,50 1,00

0,0559− −

= = − ;

e 55% em unidades padronizadas com FCC é

0,55 0,00625 0,50 1,00

0,0559+ −

= = .

Logo, a probabilidade desejada é

= (área sob a curva normal entre 1,00z = − e 1,00z = )

= 2 (área entre 0z = e 1,00z = )

= 2 (0,3413) = 0,6826 = 68,26%.

Portanto,

(0,45 0,55) 68,34%P p< < = .

b) Agora, 3 0,60 60%5

= = .

Em unidades padronizadas 60%, com FCC é

0,60 0,00625 0,50 1,900,0559

+ −= = .

Logo, a probabilidade procurada é

= (área sob a curva normal à direita de 1,90z = )

= (área à direita de 0z = ) – (área entre 0z = e 1,90)z =

Page 198: LivroEstatística.pdf

198

= 0,5 – 0,4712 = 0,0288 = 2,88%.

Portanto,

( 0,6) 2,88%P p ≥ = .

Exemplo 6.9. Um varejista compra copos diretamente da fábrica em grandes lotes. Os copos vêm embrulhados individualmente. Perio-dicamente, o varejista inspeciona os lotes para determinar a pro-porção dos copos quebrados ou lascados. Se um grande lote contém 10% de copos quebrados ou lascados, qual a probabilidade de o va-rejista obter uma de 100 copos com 17% ou mais defeituosos?

Resolução. Temos os seguintes dados:

1) 0,10p = , 100n = ;

2) ( 0,17) ?P p > = ;

3) Cálculos: 1( 0,17) ( )P p P z z> = > ;

0,1p pµ = = , 1 0,9q p= − = ,

1 0,0052 100

FCC = =×

,

0,1 0,9 0,03100p×

σ = =

10,17 0,10 0,005 2,167 2,17%

0,03z − −

= = = .

Logo, ( 0,17) ( 2,17)P p P z> = >

0,5 0,4850 0,0150 1,5%= − = = .

Exemplo 6.10. Um processo de encher garrafas de cola dá, em mé-dia, 10% de garrafas mal cheias. Extraída uma amostra de 225 gar-rafas de uma seqüência de produção de 625, qual a probabilidade de que a proporção amostral de garrafas cheias esteja entre 9% e 11%?

Resolução. Temos seguintes dados:

Page 199: LivroEstatística.pdf

199

1) 0,10p = , 100n = , 625N = .

2) ( 0,17) ?P p > =

3) Cálculos: 1 2(0,9 0,11) ( )P p P z z z≤ ≤ = ≤ ≤ ,

0,1p pµ = = , 1 0,9q p= − = ,

1 0,002222 225

FCC = =×

,

225 5%625

n FCCN

= > → ,

0,1 0,9 625 225 0,0160128225 625 1r× −

σ = ⋅ =−

,

10,09 0,10 0,0022 0,7632761 0,76

0,0160128z − −

= = − = −

e

20,11 0,10 0,0022 0,7632761 0,76

0,0160128z − −

= = = .

Logo,

(0,09 0,11) ( 0,76 0,76)P p P z≤ ≤ = − ≤ ≤

2 0,2764 0,5528 55,28%= × = = .

Exercícios Propostos

Um fabricante de baterias alega que seu artigo de primeira ca-1) tegoria tem uma vida esperada (média) de 50 meses. Sabe-se que o desvio padrão correspondente é de 4 meses.

Que percentagem de amostras de 36 observações acusará a) vida média, no intervalo de 1 mês, em torno de 50 meses, admitindo ser de 50 meses a verdadeira vida média das ba-terias?

Qual será a resposta para uma amostra de 64 observações? b)

Page 200: LivroEstatística.pdf

200

Qual seria a probabilidade de obter uma média amostral in-c) ferior a 49,8 meses com uma amostra de 100 observações?

Respostas. a) 86,64% ; b) 95,44%; c) 30,85%.

2) Uma população consiste de cinco números: 2, 3, 6, 8 e 11. Con-siderem-se todas as amostras de 2 elementos que dela podem ser retiradas com reposição. Determinar:

A média da população. a)

O desvio padrão da população. b)

A média da distribuição amostral das médias.c)

O desvio padrão da distribuição amostral das médias. d)

Respostas. a) 6µ = ; b) 3,29σ = ; c) 6µ = ; d) 2,32σ = .

3) Resolver o problema anterior para o caso de amostragem sem reposição.

Respostas. a) 6µ = ; b) 3,29σ = ; c) 6µ = ; d) 2,01σ = .

4) Admite-se que as alturas de 3000 estudantes do sexo mascu-lino de uma universidade são normalmente distribuídas com média 172,72 cm, e o desvio padrão esperado da distribuição amostral das médias resultantes se a amostragem for finita:

com reposição. a)

sem reposição. b)

Respostas. a) 172,72 e 1,52; b) 172,72 e 1,52.

5) Em quantas amostras do problema anterior pode-se esperar que a média se encontre:

entre 169,67 cm e 173,48 cm? a)

abaixo de 169,65 cm? b)

Respostas. a) 54 ; b) 2.

6) Certos amortecedores fabricados por uma empresa têm uma vida média de 800 dias e desvio padrão de 60 dias. Determinar

Page 201: LivroEstatística.pdf

201

a probabilidade de uma amostra aleatória de 16 amortecedo-res, retirados do grupo, ter a vida média:

superior a 820 dias;a)

menor que 785 dias;b)

entre 790 e 810 dias.c)

Respostas. a) 9,18%; b) 15,37%; c) 49,72%.

ResumoNeste capítulo, apresentamos o conceito de amostragem. Estudamos a amostragem casual simples, e analisamos o conceito de distribui-ções amostrais das médias com e sem reposição. Também explica-mos distribuição amostral das proporções. Todos esses assuntos foram abordados com exemplos numéricos e, ao final propusemos uma lista de exercícios.

Page 202: LivroEstatística.pdf
Page 203: LivroEstatística.pdf

Capítulo 7Estimação

Page 204: LivroEstatística.pdf
Page 205: LivroEstatística.pdf

205

Capítulo 7Estimação

Neste capítulo, apresentaremos os assuntos relacionados à estimação e estudaremos o que é intervalo de confiança para média de uma população. Explicaremos como cal-cular o erro da estimação e o tamanho da amostra, assim como o desvio padrão populacional desconhecido utili-zando a distribuição t de Student.

7.1 IntroduçãoEstimação é o processo que consiste em utilizar dados amostrais para estimar os valores de parâmetros populacionais desconhecidos. Essencialmente, qualquer característica de uma população pode ser estimada a partir de uma amostra aleatória. Por exemplo: Lojas – de-vem prever a procura dos diversos artigos, tais como: avaliação de estoques, estimação de custos de projetos, avaliação de novas fontes de energia, predições sobre realizações de empreendimentos, esti-mativas de tempo médio etc.

7.2 Estimativas Pontuais e Intervalares

Neste caso, há dois tipos de situações:

Estimativa Pontual• – é a estimativa única de um parâmetro populacional.

Estimativa Intervalar• – dá um intervalo de valores possíveis, no qual se admite estar o parâmetro populacional.

Page 206: LivroEstatística.pdf

206

Veja quadro abaixo, que dá exemplos de estimativas pontuais e in-tervalares:

Parâmetro populacional

Pontual Intervalar

Média

1. O brasileiro consome em média 15kg de carne/ano.

2. Um Palio de 8 cilindros faz 10 km/l de gasolina.

1. O consumo médio de carne no país está entre 12 e 18 kg/ano.

2. Um Palio de 8 cilindros faz entre 8 e 12 km/l de gasolina.

Proporção

1. 20% da população se opõe a um aumento do limite de velocidade.

2. A proporção de estudantes fumantes é de 40%

1. Entre 18% e 22% da popula-ção há oposição a um aumento do limite de velocidade.

2. A proporção de estudantes fumantes está entre 38% e 42%.

Quadro 7.1

Podemos também considerar outros parâmetros, tais como: a vari-ância, o desvio padrão etc.

7.3 Intervalo de confiançaSuponha que estejamos interessados num parâmetro populacional verdadeiro (mas desconhecido) q. Podemos estimar o parâmetro q usando informação de nossa amostra. Chamamos o único número que representa o valor mais plausível do parâmetro (baseado nos dados amostrais) de uma estimativa pontual de q. Contudo, sabe-mos que o valor estimado, na maior parte das vezes, não será exata-mente igual ao valor verdadeiro. Então, também seria interessante encontrar um intervalo de confiança que forneça um intervalo de valores plausíveis para o parâmetro, com base nos dados amostrais. Um intervalo de confiança dá um intervalo de valores centrado na estatística amostral, no qual julgamos, com um risco conhecido de erro, estar o parâmetro da população.

Tecnicamente, 95% de todos os intervalos de confiança que cons-truirmos conterá o verdadeiro valor do parâmetro (dado que todas

Page 207: LivroEstatística.pdf

207

as suposições envolvidas estejam corretas). Então, se obtivermos um intervalo de confiança para o parâmetro q para cada uma dentre 100 amostras aleatórias da população, somente 5, em média, destes in-tervalos de confiança não conterão q. Por exemplo, 95% de confiança ⇒ risco de 5%.

Confiança = 1 – P(risco) = 1 − , então

5% 1,96z = ⇒ = . (Usando tabela de distribuição normal padronizada.)

Analogamente, 98% de confiança ⇒ risco de 2%,

i.e., 2% 2,33z = ⇒ = .

Como não sabemos ao certo, admitimos o pior e construímos um intervalo de valores verdadeiros possíveis.

Intervalo de confiança: XX z ±

X−zσz X X+zσz

Figura 7.1

7.4 Estimação de Média de uma População

A proximidade que a determinada média amostral pode estar da média da distribuição amostral, em unidades efetivas, depende da variabilidade na distribuição amostral (desvio padrão). Grandes amostras implicam em médias amostrais mais perto da verdadeira média. Uma razão para a distribuição normal ser considerada tão importante é porque qualquer que seja a distribuição da variável de interesse para grande amostras, a distribuição das médias amos-trais será aproximadamente normalmente distribuída, e tenderá a uma distribuição normal à medida que o tamanho de amostra cres-cer. Então, podemos ter uma variável original com uma distribuição muito diferente da normal (pode até mesmo ser discreta), mas se

Page 208: LivroEstatística.pdf

208

tomarmos várias amostras grandes desta distribuição e então fizer-mos um histograma das médias amostrais, a forma se parecerá com uma curva normal.

A distribuição da média amostral X é aproximadamente normal com média e desvio padrão / n . Aqui, µ e σ são a média e o desvio padrão populacionais das medidas individuais X , e n é o tamanho amostral. Denota-se

2( , / )X N n .

A seguir, consideremos alguns exemplos de uso da tabela de distri-buição normal padronizada.

Quando 30n > , já entendemos que estamos trabalhando com gran-des amostras. Se a estatística S é a média amostral X , então os li-mites de confianças de 95% e 99% para estimação de média da po-pulação são dados por 1,96 XX ± e 2,58 XX ± , respectivamente. Mas geralmente, os limites de confianças são dados por c XX z ± , onde cz , que depende do particular nível de confiança desejado, pode ser lido no seguinte quadro.

Nível de Confiança

99,73% 99% 98% 96% 95,45% 95% 90% 80% 68,27% 50%

zc 3,00 2,58 2,33 2,05 2,00 1,96 1,643 1,28 1,00 0,6745

Quadro 7.2

Esses valores são obtidos a partir da tabela de áreas sob a curva normal (veja tabela 5.5, capítulo 5).

Utilizando os valores de X obtidos no capítulo anterior, vemos que os limites de confiança para a média da população, no caso de amostragem de uma população infinita ou amostragem com reposi-ção de uma população finita, são dadas por

cX zn

± , (1)

e no caso de amostragem sem reposição de uma população finita de tamanho N , são dadas por

1cN nX zNn

−±

−. (2)

Page 209: LivroEstatística.pdf

209

Em geral, não se conhece o desvio padrão da população, de modo que se passam a obter os limites de confiança acima. Vamos analisar a seguir dois casos:

desvio padrão populacional conhecido;i)

desvio padrão populacional desconhecido.ii)

7.4.1 Desvio Padrão Populacional Conhecido

Estimativa Pontual de • : x .

Estimativa Intervalar de • : xx z ± .

Por exemplo, se consideremos 36n = , 3 = e 24,2x = , então temos os seguintes cálculos, conforme a confiança desejada:

Confiança desejada

z Cálculo Solução Intervalo

90% 1,65324,2 1,6536

± × 24,2 0,825± 23,375 a 25,025

95% 1,96324,2 1,9636

± × 24,2 0,980± 23,220 a 25,180

99% 2,58324,2 2,5836

± × 24,2 1,290± 23,910 a 25,490

Quadro 7.3

Para amostras de 30 ou menos observações é importante saber que a população submetida à amostragem tem dis-tribuição normal. De outra forma estas técnicas não podem ser utilizadas.

Exemplo 7.1. Suponha que as alturas de 100 estudantes do sexo masculino da UFSC constituam uma amostra aleatória das alturas dos 2000 estudantes de sexo masculino. A amostra é dada (em cm) na seguinte tabela.

Page 210: LivroEstatística.pdf

210

Intervalo Média Freqüência

160 164 162 15 2430 56,55 848,26

164 168 166 23 3818 12,39 284,98

168 172 170 30 5100 0,23 6,91

172 176 174 23 4002 20,07 461,62

176 180 178 9 1602 71,91 647,19

Total 100 16952 2248,96

Quadro 7.4

Determine:

a média (estimativa eficiente),a)

a variância,b)

o intervalo de confiança de 95%,c)

um intervalo de confiança de 99% para estimar a altura média.d)

Resolução.

a) Média 16952 169,52cm

100f x f xXf n

∑ ∑= = = =

∑.

b) Variância

( )2

2248,96 22,49 4,7423100

f x X Xs

n∑ −

= = = = cm.

c) Os limites de confiança na base de 95% são 1,96Xn

± .

Usando 169,52X = e 4,7423s = como estimativa de , os limites de confiança são

4,7423169,52 1,96 169,52 0,92100

± = ±

168,59⇒ a 170,44 .

Assim, o intervalo de confiança de 95% para média da população de 168,59 a 170,44 cm é de 95% ou 0,95, ou seja,

Page 211: LivroEstatística.pdf

211

( )168,59 170,44 0,95P < < = .

Isto equivale a dizer que temos 95% de confiança em que a verdadei-ra média da população esteja entre 168,59 e 170,44 cm.

d) Os limites de confiança na base de 99% são 2,58Xn

± . Para o

nosso caso,

4,74232,58 169,52 2,58

100X

n

± = ±

169,52 1,22= ±

168,06⇒ e 170,74 .

Assim, o intervalo de confiança de 99% para a média da população é de 168,06 a 170,74 cm, que se pode denotar por

168,06 170,74< < .

Ao obter os intervalos de confiança acima, admitimos que a população fosse infinita ou tão grande que se pudessem considerar as condições idênticas às de amostragem com re-posição. Para populações finitas sujeitas a amostragem sem

reposição, deveríamos utilizar em lugar de .

Sempre podemos considerar o fator

2000 100 0,97491 2000 1

N nN

− −= =

− −,

o que é bem próximo de 1. Logo, podemos omiti-lo. Se levarmos em conta os limites de confiança, serão:

c) 169,52 0,90±

d) 169,52 1,22± .

Exemplo 7.2. A medida dos diâmetros de uma amostra aleatória de 160 mancais fabricados por determinada máquina durante uma semana acusa média de 2,15 cm e desvio padrão de 0,17 cm. Deter-mine o intervalo de confiança de:

Page 212: LivroEstatística.pdf

212

95%a)

99%b)

98%c)

90%d)

99,73%e)

para o diâmetro médio de todos os mancais.

Resolução.

a) Os limites de confiança de 95% são

1,96 1,96 SX Xn n

± = ±

0,172,15 1,96160

= ±

0,172,15 1,9612,65

= ±

2,15 0,026= ±

2,124⇒ a 2,176 cm.

b)Os limites de confiança de 99% são

2,58 2,58 SX Xn n

± = ±

0,172,15 2,58

12,65= ±

2,15 2,58 0,01086= ± ⋅

2,15 0,028= ±

2,122⇒ a 2,178cm.

c) Seja cz tal que a área sob a curva normal à direita de cz z= é de 1%. Então, por simetria, a área à esquerda de cz z= − é também 1%, de modo que a área sombreada é 98% da área total. Como a área to-tal sob a curva é 1, a área de 0z = a cz z= é 0,49 logo 2,33cz = .

Page 213: LivroEstatística.pdf

213

−zc zc

Figura 7.2

Assim, os limites de confiança de 98% são

0,172,33 2,15 2,58160

Xn

± = ±

0,172,15 2,33

12,65= ±

2,15 2,33 0,01086= ± ⋅

2,15 0,025= ±

2,125⇒ a 2,175cm.

d) Queremos cz tal que a área de 0z = a z c= . Seja 0,45, então 1,645cz = .

Assim, os limites de confiança de 90% são

0,171,65 2,15 1,645160

Xn

± = ±

2,15 1,645 0,01086= ± ⋅

2,15 0,018= ±

2,132⇒ a 2,168cm.

e) Os limites de confiança de 99,73% são

0,173 2,15 3160

Xn

± = ±

2,15 0,032= ±

2,118⇒ a 2,182 cm.

Page 214: LivroEstatística.pdf

214

Exemplo 7.3. De um total de 250 notas em matemática, uma amostra aleatória de 50 notas acusa média 7,0 e desvio padrão de 0,10.

Quais os limites de confiança de 95% para estimar a média das a) 250 notas?

Com que grau de confiança poderíamos afirmar que a média b) das 250 notas é 7,0 0,01± ?

Resolução.

a) Como o tamanho da população não é muito grande comparando com o da amostra, devemos fazer um ajuste. Então, os limites de con-fianças de 95% são

1,96 1,961X

N nX XNn

−± = ±

0,1 250 507,0 1,96250 150

−= ±

0,17,0 1,96 0,8967,14

= ±

7,0 1,96 0,0125= ± ⋅

7,0 0,025= ±

⇒ o intervalo de confiança será de 6,975 a 7,025.

b) Os limites de confiança podem ser representados por

1c cX

N nX z X zNn

−± = ±

0,1 250 507,0250 150cz −

= ±−

7,0 0,0125cz= ± .

Como este valor deve ser igual a 7,0 0,03± , temos

0,030,0125 0,03 2,40,0125c cz z= ⇒ = = .

A área sob a curva normal de 0z = a 2,4z = é 0,4918.

Logo, o grau de confiança procurado é 2 0,4918 0,9836× = , ou seja, 98,36%.

Page 215: LivroEstatística.pdf

215

7.4.2 Erro de Estimação e Tamanho da AmostraO erro num intervalo de estimação diz respeito ao desvio (diferença) entre a média amostral e a verdadeira média da população. Como o intervalo de confiança tem centro na média amostral, o erro máxi-mo provável é igual à metade da amplitude do intervalo.

x z e zn n

± ⋅ ⇒ = ⋅ .

Se quisermos saber qual é o tamanho da amostra, então calculamos a seguir:

2

e z e zn n

= ⋅ ⇒ = ⋅

, onde e = erro tolerável.

Exemplo 7.4. Qual o tamanho da amostra necessária para se estimar a média da população infinita cujo desvio padrão é igual a 4, com 98% de confiança e precisão de 0,5?

Resolução. IC = 98% 2,33z⇒ = ,

22,33 4 347,4496 3480,5

n n× = = ⇒ =

.

Exemplo 7.5. Ao medir um tempo de reação, um psicólogo estima o desvio padrão em 0,06 segundos. Qual o tamanho de uma amostra de medidas que ele deve tomar a fim de que possa ter (a) 95% e (b) 99% de confiança em que o erro de sua estimativa do tempo médio de reação não supera 0,02 segundos?

Resolução.

a) Os limites de confiança de 95% são 1,96Xn

± , com o erro da es-

timativa sendo 1,96n

. Tomando 0,06S = = segundos, vemos que

este erro será igual a 0,02 segundos se (1,96) (0,06) 0,02

n= , isto é,

1,96 0,06 5,88

0,02n ×

= =

34,57n⇒ = .

Podemos assim ter 95% de confiança em que o erro de estimativa será inferior a 0,02 se n for igual ou maior do que 35.

Page 216: LivroEstatística.pdf

216

b) Os limites de confiança de 99% são 2,58Xn

± . Então,

(2,58) (0,06) 0,02n

= , isto é,

2,58 0,06 7,740,02

n ×= =

59,90n⇒ = .

Assim, podemos ter 99% de confiança em que o erro da estimativa será inferior a 0,02 se n for igual ou maior do que 60.

7.5 Desvio Padrão Populacional Desconhecido

Quando o desvio padrão é desconhecido, como é geralmente o caso, usa-se o desvio padrão da amostra S . Sabemos que, caso o tamanho da amostra seja superior a 30, a distribuição das médias é aproxima-damente normal. Todavia, para amostras de 30 ou menos observa-ções, a aproximação normal não é adequada. Devemos usar, então, a distribuição t de Student.

7.5.1 Distribuição t de StudentA forma da distribuição t é bastante parecida com a normal. A prin-cipal diferença entre as duas distribuições é que a distribuição t tem maior área nas caudas.

NORMAL

t

Figura 7.3

A distribuição t não é uma distribuição padronizada tal como a distribuição normal. Para cada amostra, existe uma distribuição t ligeiramente diferente. A distribuição normal é essencialmente in-

Page 217: LivroEstatística.pdf

217

dependente do tamanho da amostra, o que não ocorre com a dis-tribuição t.

Para grandes amostras ( 30n > ), é razoável usar valores z para apro-ximar valores t, muito embora a distribuição t seja sempre teorica-mente correta quando não se conhece o desvio padrão da população independentemente do tamanho da amostra.

Para usar a tabela t, devemos conhecer duas coisas:

o nível de confiança desejado;•

o número de graus de liberdade (GL).•

O número de graus de liberdade está relacionado com a maneira como se calcula o desvio padrão da amostra:

( )2

2

1

xx

nsn

−=

∑∑ .

s - desvio padrão amostral

1n − - graus de liberdade.

47,59% 47,59%

95%z

0 z=1,96

Figura 7.4

t

t

2,5%2,5%95%

Figura 7.5

Page 218: LivroEstatística.pdf

218

Observações 7.1.

Se 1) 30n t z> ⇒ ≈

A distribuição 2) t supõe que a população submetida à amostra-gem seja normal, principalmente para 30n ≤ .

Exemplo 7.6. Completar a tabela:

Inter. Conf. n Coluna Conf.

GL Fórmula Valor t

95% 8 0,975 7 t0,976;7 2,36

95% 13

95% 23

95% 28

90% 18

99% 29

50% 7

90% 37

98% 5

40% 10

Tabela 7.5

Estimação por intervalo de : sx tn

± × .

Agora veremos o que você compreendeu! Complete a tabela do exemplo seguinte, com base no que foi apresentado.

Exemplo 7.7. Sejam 20,0x = ; 1,5s = ; 25n = . Completar:

Conf. Desej. t Fórmula Cálculo Solução

90% 1,711,520 1,7125

− × 20 0,513±(19,487 20,513)P ≤ µ ≤

0,90=

95%

99%

Tabela 7.6

Page 219: LivroEstatística.pdf

219

7.5.2 Amostragem de Pequenas Populações: Fator de Correção Finita

Quando a população é finita e a amostra constitui mais de 5% da população, devemos aplicar o fator de Correção Finita (FCF), dado por

1N nn

−−

. Veja na tabela como utilizar este FCF.

Desvio padrão Intervalo de Cofiança Erro

x conhecido 1x N nx z

Nn −

± ⋅ ⋅− 1

x N nzNn

−⋅ ⋅

x desconhecido 1s N nx t

Nn−

± ⋅ ⋅− 1

s N ntNn

−⋅ ⋅

Tabela 7.7

Exemplo 7.8. Determine um intervalo de confiança para estas duas situações:

20x =a) , 2,5x = , 120n = , 1200N = ;

20x =b) , 2,5xs = , 20n = , 240N = .

Resolução.

a) Como 120 10%

1200nN

= = , devemos utilizar o fator de correção fi-

nita. A fórmula para o intervalo de confiança é

1

x N nx zNn

−± ⋅ ⋅

2,5 1200 12020 1,961200 1120

−= ±

20 (1,96)(0,2283)(0,9132)= ±

20 0,408= ± .

b) Como 20 0,0833 8,33%240

nN

= = = , x é desconhecido e 30n ≤ ,

devemos utilizar a distribuição de t , e a fórmula para o intervalo de confiança é

Page 220: LivroEstatística.pdf

220

1

s N nx tNn

−± ⋅ ⋅

−2,5 240 2020 2,131

240 120−

= ±−

20 (2,131)(0,559)(0,959)= ±

20 1,142= ± .

Fórmula Modificada para Determinação do Tamanho da AmostraNo caso de determinação do tamanho da amostra, devemos aplicar também FCF da seguinte maneira:

x• conhecido: 2 2

2 2 2 ( 1)x

x

z Nnz e N

=

+ −.

x• desconhecido: 2 2

2 2 2 ( 1)t s Nn

t s e N=

+ −.

Observação 7.2. A não utilização destas fórmulas pode resultar numa amostra que exceda o tamanho da população.

Exemplo 7.9. Os coeficientes de confiança de 95%, (duas caudas) para a distribuição normal, são dadas por 1,96± . Quais são os coeficien-tes correspondentes para a distribuição t se:

a) 9v = ?

b) 20v = ?

c) 30v = ?

d) 60v = ?

Resolução. Para os coeficientes de confiança de 95%, (duas caudas) a área sombreada total na figura abaixo deve ser 0,05.

Figura 7.6

Page 221: LivroEstatística.pdf

221

Assim, a área sombreada à direita é 0,025 e o valor crítico corres-pondente é 0,975t . Então, os coeficientes de confiança procurados são

0,975t± . Para os valores dados de v , são:

a) 2,26± b) 2,09± c) 2,04± d) 2,00± .

Exemplo 7.10. Uma amostra de 10 medidas do diâmetro de uma esfera acusa média 11,0X = cm e desvio padrão 0,15S = cm. Deter-mine os limites de confiança (a) de 95% e (b) de 99% para o diâmetro efetivo.

Resolução.

a) Os limites de confiança de 95% são dados por 0,975 ( | 1)X t S n± − .

Como 1 10 1 9v n= − = − = , obtemos 0,975 2,26t = (conforme exem-plo a)).

Fazendo 11,0X = e 0,15S = , obtemos os limites de 95% procura-dos:

0,1511,0 2,26 11,0 0,11310 1

cm± = ±−

4,3348⇒ e 4,4252 .

Podemos, assim, ter 95% de confiança em que a verdadei-ra média esteja compreendida entre 11,0 0,113 10,887− = cm e 11,0 0,113 11,113+ = cm.

b) Para 9v = , 0,975 3,25t = . Então, os limites de confiança de 99% são

0,9950,1511,0 3,25

1 10 1SX t

n ± = ± − −

11,0 0,163 pols.= ± cm.

e o intervalo de 99% de confiança vai de 10,837 cm a 11,163cm.

Exemplo 7.11.

Resolver o exemplo anterior supondo válidos os métodos de a) teoria das grandes amostras.

Compare os resultados dos dois métodos.b)

Page 222: LivroEstatística.pdf

222

Resolução.

a) Utilizando a teoria das grandes amostras, os limites de confiança de 95% são

0,151,96 11,0 1,9610

Xn

± = ±

11,0 0,093= ± ,

onde tomamos o desvio padrão amostral de 0,15 como estimativa de . Analogamente, os limites de confiança de 99% são

0,1511,0 2,58 11,0 0,12210

± = ±

10,878⇒ e 11,122 .

b) Em cada caso, os intervalos obtidos pelos métodos das pequenas amostras são mais amplos do que os obtidos pela teoria das grandes amostras, o que já era de esperar, uma vez que há menos precisão quando lidamos com pequenas amostras.

7.6 Estimativa por Intervalo de Confiança para Proporções

Seja estatística S a proporção de “sucesso” em uma amostra de ta-manho 30n ≥ extraída de uma população binomial em que p é a proporção de sucessos (isto é, a probabilidade de sucesso). Então, os limites de confiança para p são dados por c pP z ± , onde P denota a proporção de sucessos na amostra de tamanho n . Usando os va-lores de p obtidos no Capítulo anterior, vemos que os limites de confiança para a proporção da população são dados por

( )1c c

p ppqP z P zn n

−± = ± ,

no caso de amostragem de uma população infinita, ou amostragem com reposição de uma população finita. Analogamente, os limites de confiança são

Page 223: LivroEstatística.pdf

223

1cpq N nP zn N

−±

se a amostragem é sem reposição, de uma população finita de tama-nho N . Nota-se que tais resultados se obtêm de (1) e (2) substituin-do X por P e por pq .

Em resumo, temos:

Proporção• ⇒ percentagem

Ocorre sob forma de perguntas sobre percentagem, sobre pro-porções, sobre probabilidade de pessoas num grupo, etc.

xpn

=• , onde

x – no de elementos da proporção;

n – tamanho da amostra.

Estimação pontual• de p : xn

;

Estimação intervalar • de p : 1

x xn nx z

n n

± ⋅ ;

População Finita:• 5%nN

> ⇒ F.C.F.;

Erro de Estimação:•

1x xn n

e zn

= ⋅ ;

Tamanho da Amostra:• 22

1x xn n

n ze

= ⋅ .

Exemplo 7.12. Qual o tamanho da amostra necessária para obter um intervalo de 95% de confiança para a proporção populacional, se o erro tolerável é de 0,08?

Page 224: LivroEstatística.pdf

224

Resolução. Dados: IC = 95% ⇒ 1,96z = , 0,08e = , 0,5xpn

= = .

Cálculos:

22

0,5(1,0 0,5)(1,96) 150,0625 151(0,08)

n n −= = ⇒ =

.

Exemplo 7.13. Uma amostra aleatória de 100 eleitores de certo dis-trito eleitoral dá 55% como favoráveis a determinado candidato. De-termine os limites de confianças para a proporção global de eleitores favoráveis ao candidato

na base de 95%;a)

na base de 99%;b)

na base de 99,73%.c)

Resolução.

a) Os limites de confiança para a população são

( )11,96 1,96p

p pP P

n

−± = ±

( )( )0,55 0,450,55 1,96

100= ±

0,55 0,10= ±

0,45⇒ a 0,65 ,

onde tomamos a proporção amostral 0,55 como estimativa de p .

c) Os limites de confiança de 99% para p são

( )( )0,55 0,450,55 2,58 0,55 0,15

100± = ±

0,40⇒ a 0,70 .

Exemplo 7.14. Em 40 jogadas de uma moeda, apareceram 24 “caras”. Determine os seguintes limites de confiança para a proporção de “caras” em uma seqüência ilimitada de jogadas:

Page 225: LivroEstatística.pdf

225

de 95%a)

de 99,73%b)

Resolução.

a) Para 95%, 1,96cz = . Levando os valores 24 0,640

P = = e 40n = na fórmula

( )c

P pp P z

n−

= ±

( )( )0,6 0,40,6 1,96

40= ±

0,6 0,15= ± ,

tem-se o intervalo de 0,37 a 0,83.

Exercícios Propostos

Considerando-se que uma amostra de 100 elementos extraída 1) de uma população aproximadamente normal, cujo desvio pa-drão é igual a 2,0, forneceu uma média 35,6= , construir um intervalo de 95% de confiança para a média população.

Resposta. 35,208; 35,992.

Feito um ensaio de corrosão com 64 peças de um lote de produ-2) ção, verificou-se que o tempo que a peça suportou nesse teste apresentou uma média 200X = horas. Calcular um intervalo de 95% de confiança para a verdadeira média, sabendo-se que o = 16 horas.

Resposta. 196,08; 203,92.

Suponha que o desvio padrão da vida útil de uma determinada 3) marca de tubo de imagem de TV seja conhecido e igual a 500, mas que a média da vida útil é desconhecida. Supõe-se que a vida útil dos tubos de imagem tenha uma distribuição aproxi-madamente normal. Para uma amostra de n = 15, a média da

Page 226: LivroEstatística.pdf

226

vida útil é 8900X = horas de operação. Construir intervalo de confiança de 90% para estimar a média populacional.

Resposta. 8687; 9113.

Uma amostra aleatória de uma população normal com variân-4) cia populacional igual a 1,96 forneceu: 25,2, 26, 26,4 27,1, 28,2, 28,4. Obtenha estimativas por ponto e por intervalo da verda-deira média, com confiança de 95% e 90%.

Resposta. 25,76; 28 e 25,94; 27,82.

Sabe-se que os comprimentos das barras produzidas por uma 5) siderúrgica têm uma distribuição normal de variância 1,69 m. Numa amostra de 5 barras encontraram-se: 20,1, 21, 21,4, 22,1, 23,3 m. Determinar o erro máximo provável para a média, com:

= 0,10,a)

= 0,06.b)

Resposta. a) 0,96; b)1,09.

6) A distribuição dos números de parafusos produzidos por certa máquina é normal, com desvio padrão igual a 0,17 mm. Uma amostra de seis parafusos retirada ao acaso da produção apresentou os seguintes diâmetros (em mm): 25,4 25,2 25,6 25,3 25 25,4. Calcular o erro máximo provável para intervalos de 90%, 95% e 98,74% para o diâmetro médio da produção da máquina.

Resposta. 0,11, 0,14 e 0,17.

7) Um comprador potencial deseja estimar o valor médio das compras por cliente em uma loja de brinquedos em um aero-porto. Com base em dados de outros aeroportos similares, o desvio padrão de tais valores de vendas é estimado em cerca de o = $ 0,88. Qual o tamanho mínimo que deveria ter uma amostra aleatória se ele deseja estimar a média das vendas dentro de $ 0,15 e com uma confiança de 99%?

Resposta. 69.

Page 227: LivroEstatística.pdf

227

8) Dados 500X = , 16s = e 25n = , determinar o intervalo de con-fiança de 98% para a média populacional.

Resposta. 492,03; 507,97.

9) Uma amostra é composta pelos seguintes elementos: 7, 7, 8, 9, 9, 9, 10, 11, 11, 11, 12, 13, 13, 14, 15, 15. Pede-se construir o intervalo de confiança para:

a média real, com confiança de 98%. a)

a proporção real de valores inferiores a 9, com significância b) de 20%.

Resposta. a) 9,17; 12,59; b) 6,25%; 31,25%.

10) Determinar um intervalo de 95% de confiança para estas duas situações:

a) 15,0X = , 2,0s = , 16n = , 200N = .

b) 15,0X = , 2,0s = , 100n = , 1000N = .

Resposta. a) 13,98; 16,02; b) 14,63; 15,37.

11) Determinar um intervalo de 98% de confiança para a verda-deira proporção populacional, se 15X = e 200n = .

Resposta. 0,18; 0,32.

ResumoEste capítulo está dedicado para assuntos relacionados com estima-ção. Explicamos o que é intervalo de confiança e abordamos esse assunto para média de uma população. Também explicamos como calcular o erro da estimação e o tamanho da amostra. No caso de desvio padrão populacional desconhecido, explicamos como utili-zar a distribuição t de Studant.

Page 228: LivroEstatística.pdf
Page 229: LivroEstatística.pdf

229

Referências BARBETTA, P. A. Estatística aplicada às ciências sociais. 5. ed. Floria-nópolis: UFSC, 2002.

BRASIL. Secretaria de Educação Fundamental. Parâmetros curricu-lares nacionais: matemática (1º e 2º ciclos do ensino fundamental). Brasília: SEF/MEC, 1997.

BRASIL. Secretaria de Educação Fundamental. Parâmetros curricu-lares nacionais: matemática (3º e 4º ciclos do ensino fundamental). Brasília: SEF/MEC, 1998.

BUSSAB, W. O.; MORETTIN, P. A. Estatística básica. 5. ed. São Paulo: Saraiva, 2004.

CRESPO, A. A. Estatística fácil. 7. ed. São Paulo: Saraiva, 1990.

FONSECA, J. S. da; MARTINS, G. A. Curso de estatística. 3. ed. São Paulo: Atlas, 1982.

KAZMIER, L. J. Estatística aplicada à economia e administração. São Paulo: McGraw-Hill, 1982.

LEVINE, D. M.; BERENSON, M. L.; STEPHAN, D. Estatística: teoria e aplicações – usando Microsoft Excel em português. Rio de Janeiro: LTC, 2000.

LOPES, C. A. E. A probabilidade e a estatística no ensino fundamental: uma análise curricular. Dissertação (Mestrado em Educação). Cam-pinas: Faculdade de Educação da UNICAMP, 1998. 125p.

MORETTIN, P. A.; BUSSAB, W. O. Estatística básica. 3. ed. São Paulo: Atual, 1984.

PEREIRA, A. SPSS guia prático de utilização: análise de dados para ciências sociais e psicologia. Lisboa: Sílabo, 1999.

Page 230: LivroEstatística.pdf

230

SOARES, J. F.; FARIAS, A. A.; CESAR, C. C. Introdução à estatística. Rio de Janeiro: LTC, 1991.

SPIEGEL, M. R. Probabilidade e estatística. São Paulo: McGraw-Hill, 1997.

STEVENSON, W. J. Estatística aplicada à administração. São Paulo: Harbra, 1981.

VINACUA, B. V. Analisis estadístico con SPSS para WINDOWS. Madri: McGraw-Hill/Interamericana de Espana, 1997.

Sites na Internethttp://www.mat.ubi.pt/~jgama/Ficheiros/Apontamentos.pdf•

http://www.vademecum.com.br/iatros/estdiscritiva.htm•

http://alea-estp.ine.pt/english/html/glossar/html/glossar.•html#h

http://www.socio-estatistica.com.br/Edestatistica/glossario.•htm

http://www.ibge.gov.br/•

http://www.ibope.com.br•

http://www.dme.im.ufrj.br/divulgacao.ppt#22•