sÉrie provas e concursos - forumturbo.org

237

Upload: others

Post on 28-Oct-2021

2 views

Category:

Documents


0 download

TRANSCRIPT

SÉRIE PROVAS E CONCURSOS

Noções de Estatística para ConcursosTEORIA, QUESTÕES RESOLVIDAS E MAIS DE 230

QUESTÕES COM GABARITO

Anderson Meneses

Fabrício Mariano

© 2010, Elsevier Editora Ltda.

Todos os direitos reservados e protegidos pela Lei nº 9.610, de 19/02/1998.

Nenhuma parte deste livro, sem autorização prévia por escrito da editora, poderá ser reproduzida ou transmitida sejam

quais forem os meios empregados: eletrônicos, mecânicos, fotográficos, gravação ou quaisquer outros.

Copidesque: Maria da Glória Silva de Carvalho

Revisão: Hugo de Lima Corrêa

Editoração Eletrônica: SBNIGRI Artes e Textos Ltda.

Coordenador da Série: Sylvio Motta

Elsevier Editora Ltda.

Conhecimento sem Fronteiras

Rua Sete de Setembro, 111 – 16º andar

20050-006 – Centro – Rio de Janeiro – RJ – Brasil

Rua Quintana, 753 – 8º andar

04569-011 – Brooklin – São Paulo – SP – Brasil

Serviço de Atendimento ao Cliente

0800-0265340

[email protected]

ISBN 978-85-352-3906-5

Nota: Muito zelo e técnica foram empregados na edição desta obra. No entanto, podem ocorrer erros de digitação,

impressão ou dúvida conceitual. Em qualquer das hipóteses, solicitamos a comunicação ao nosso Serviço de Atendimento

ao Cliente, para que possamos esclarecer ou encaminhar a questão.

Nem a editora nem o autor assumem qualquer responsabilidade por eventuais danos ou perdas a pessoas ou bens,

originados do uso desta publicação.

CIP-Brasil. Catalogação-na-fonte.

Sindicato Nacional dos Editores de Livros, RJ

M286n Mariano, Fabrício

Noções de estatísticas para concursos: teoria, questões resolvidas e mais de 230 questões com gabarito / Fabrício

Mariano e Anderson Meneses. – Rio de Janeiro: Elsevier, 2010.

160 p. – (Provas e concursos)

Apêndice

Inclui bibliografia

ISBN 978-85-352-3906-5

1. Estatística – Problemas, questões, exercícios. 2. Serviço público – Brasil – Concursos. I. Meneses, Anderson. II.

Título. III. Título: teoria, questões resolvidas e mais de duzentos e trinta questões com gabaritos. IV. Série.

10-2005.

CDD: 519.5

CDU: 519.2

Dedicatórias

Anderson Meneses

À minha esposa Heloísa, por sempre me apoiar, e a toda a minha família, especialmenteao meu sobrinho Daniel, motivo de muitas alegrias em nossas vidas.

A mais profunda raiz do fracasso em nossas vidas é pensar “como sou inútil e fraco”. É essencial pensarpoderosa e firmemente “eu consigo” sem ostentação ou preocupação.

Dalai Lama

Fabrício MarianoÀ minha namorada Marinéa, pelo amor, incentivo e presença. Aos meus pais, Salete

(in memorian) e Geraldo, pela educação, exemplo e incentivo ao estudo, que foi a basepara me tornar a pessoa que sou. À minha irmã Cristiani, pelo amor, companheirismo eamizade que sempre me acompanham.

Aqueles que dizem que algo não pode ser feito deveriam sair do caminho daqueles que estão fazendo.

Joel Arthur Barke

Agradecimentos

Anderson Meneses

Ao grande amigo Fabrício Mariano.Ao professor Sylvio Motta e a todos os colaboradores da Editora Campus/Elsevier

pela atenção, pela presteza e pelo profissionalismo.

Fabrício MarianoÀ minha namorada Marinéa pelo auxílio técnico. Ao amigo Anderson Meneses pela

parceria em dividir comigo este projeto. Ao professor Sylvio Motta pelo fortalecimentoda parceria ao lançarmos mais uma obra. Aos colaboradores da EditoraCampus/Elsevier, pela presteza e atenção dispensadas e por estarmos juntos mais umavez.

Os Autores

Anderson Meneses

• Doutor em Engenharia Nuclear pela Coppe/UFRJ e IDSIA/Universidade de Lugano(Suíça).

• Mestre em Engenharia Nuclear pela Coppe/UFRJ.• Especialista em Análise, Projeto e Gerência de Sistemas pela PUC-Rio.• Graduado em Física pela UFRJ.• Ex-aluno do Colégio Pedro II.• Atua há mais de dez anos como professor, sete dos quais também dedicados ao ensino

superior.• Membro da IEEE Nuclear and Plasma Sciences Society.• Autor de publicações internacionais na área de Engenharia Nuclear.• Palestrante em congressos no Brasil, Itália, Espanha, Alemanha e Estados Unidos.

Fabrício Mariano

• Mestrado em Economia pela Wisconsin International University.• Pós-graduação em Finanças e Gestão Corporativa pela Ucam – Universidade Cândido

Mendes.• Graduação em Física pela Universidade Federal do Rio de Janeiro – UFRJ.• Ensino Fundamental e Médio – Colégio Pedro II.• Professor da Academia do Concurso Público;• Professor da Fabec (Faculdade da Academia Brasileira de Educação e Cultura).• Professor do Curso Companhia dos Módulos.• Professor do Curso Debret.• Ex-professor do União Concursos.• Ex-professor do Degrau Concursos.• Ex-professor de Radiologia, Biofísica e Proteção Radiológica do Curso Henry Dunant.

• Cursos de aperfeiçoamento nas áreas de:

– Derivativos (Associação Nacional das Instituições do Mercado Financeiro – Andima).– Finanças Empresariais (Fundação Getulio Vargas – FGV).

– Gestão do serviço público (Fundação Getulio Vargas – FGV).– Atendimento ao Público (Interlegis).– Lei de Responsabilidade Fiscal (Unilegis).– Estatísticas I e II (Cecierj – UERJ).– Análises combinatórias I e II (Cecierj – UERJ).– Educação Matemática (Instituto de Matemática – UFRJ).– Magnetismo Experimental (CBPF – Centro Brasileiro de Pesquisas Físicas).– Física Moderna e Contemporânea (UFF – Universidade Federal Fluminense).

Apresentação

Nesta obra, procuramos abordar o conteúdo de modo a evidenciar as noçõesfundamentais dos principais tópicos pedidos em concurso, dando uma atenção especialàs questões de prova e sua resolução, sempre seguindo a filosofia da Série Provas eConcursos da Editora Campus/Elsevier.

Assim, os Capítulos 1, 2 e 3 (respectivamente Estatística Descritiva, Probabilidades eVariáveis Aleatórias e Distribuições de Probabilidades) permitem uma revisão deimportantes conceitos, procurando trazer tanto base ao estudo quanto um meio deacesso ao entendimento de assuntos posteriores.

Os Capítulos 4, 5, 6 e 7 (respectivamente Distribuições Teóricas de Probabilidades,Inferência Estatística, Teoria das Pequenas Amostras e Regressão Estatística), trazem osprincipais conceitos de nível intermediário seja para concursos ou para a compreensãodas importantes e poderosas ferramentas estatísticas, nos mais diversos ramos de ciênciaaplicada que as utilizam.

Tradicionalmente, o último capítulo traz questões de importantes concursos, debancas de todo o Brasil.

A abordagem aqui apresentada, com foco nos principais conceitos e na resolução dequestões, pode ser uma grande aliada dos candidatos, e esperamos que se torne decisivana conquista de seus objetivos. Desejamos sucesso a todos.

Os autores

TABLE OF CONTENTSCover Image

Title

Copyright

Dedicatrias

Agradecimentos

Os Autores

Apresentação

Capítulo 1. Estatística Descritiva

1.1 INTRODUÇÃO À ESTATÍSTICA

1.2 MEDIDAS DE TENDÉNCIA CENTRAL (POSIÇÃO OU LOCALIZAÇÃO)

1.3 MEDIDAS DE DISPERSÃO

1.4 MEDIDA DE ASSIMETRIA E MEDIDA DE ACHATAMENTO

1.5 QUESTÃES RESOLVIDAS

1.6 QUESTÃES PROPOSTAS

Capítulo 2. Probabilidades

2.1. Probabilidade de um Evento

2.2. PROBABILIDADE CONDICIONAL E REGRA DE BAYES

2.3. PROBABILIDADE TOTAL E TEOREMA DE BAYES

2.4. Questões Resolvidas

2.5. Questões Propostas

Capítulo 3. Variáveis Aleatórias e Distribuições de Probabilidades

3.1. VARIÁVEIS ALEATÓRIAS

3.2. VARIÁVEIS ALEATÓRIAS DISCRETAS

3.3. VARIÁVEIS ALEATÓRIAS CONTÍNUAS

3.4. MÉDIA, MOMENTO E VARIÂNCIA PARA VARIÁVEIS ALEATÓRIAS

3.5. QUESTÕES RESOLVIDAS

3.6. QUESTÕES PROPOSTAS

Capítulo 4. Distribuições Teóricas de Probabilidades

4.1 DISTRIBUIçãO DE BERNOULLI

4.2 DISTRIBUIçãO BINOMIAL

4.3 DISTRIBUIçãO DE POISSON

4.4 DISTRIBUIçãO UNIFORME

4.5 DISTRIBUIçãO POLINOMIAL

4.6 DISTRIBUIçãO GEOMÉTRICA

4.7 DISTRIBUIçãO EXPONENCIAL

4.8 DISTRIBUIçãO DE PASCAL (BINOMIAL NEGATIVA)

4.9 DISTRIBUIçãO NORMAL

4.10 QUESTÕES RESOLVIDAS

4.11 QUESTÕES PROPOSTAS

Capítulo 5. Inferência Estatística

5.1. ESTIMAÇÃO

5.2. TESTE DE HIPÓTESES

5.3. ANÁLISE DE VARIÂNCIA

5.4. QUESTÕES RESOLVIDAS

5.5. QUESTÕES PROPOSTAS

Capítulo 6. Teoria das Pequenas Amostras – “t” de Student e Qui Quadrado

6.1. DISTRIBUIÇÃO T DE STUDENT

6.2. DISTRIBUIÇÃO DE QUI QUADRADO

6.3. QUESTÕES RESOLVIDAS

6.4. QUESTÕES PROPOSTAS

Capítulo 7. Regressão Estatística

7.1 O MÉTODO DOS MÍNIMOS QUADRADOS

7.2 ANÁLISE DE VARIÂNCIA PARA O MODELO LINEAR SIMPLES

7.3 Questões Resolvidas

7.4 QUESTÕES PROPOSTAS

Capítulo 8. Provas de Concursos

8.1 ESTATÍSTICA DESCRITIVA

8.2 PROBABILIDADES

8.3 VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÕES DE PROBABILIDADES

8.4 DISTRIBUIÇÕES TEÓRICAS DE PROBABILIDADES

8.5 INFERÊNCIA ESTATÍSTICA

8.6 TEORIA DAS PEQUENAS AMOSTRAS – “T” DE STUDENT E QUI QUADRADO

8.7 CORRELAÇãO E REGRESSÃO ESTATÍSTICA

8.8 TÓPICOS DIVERSOS

Referências Bibliográficas

APÊNDICE 1. TABELA DA DISTRIBUIÇÃO NORMAL-PADRÃO

APÊNDICE 2. TABELA DA DISTRIBUIÇÃO T DE STUDENT

APÊNDICE 3. TABELA DA DISTRIBUIÇÃO DE QUI QUADRADO

APÊNDICE 4. TABELA DA DISTRIBUIÇÃO F

Capítulo 1

Estatística Descritiva

1.1 INTRODUÇÃO À ESTATÍSTICA

1.1.1 A Estatística

A Estatística se dedica À coleta, análise, apresentação e interpretação dos dados. À umramo da matemática aplicada cujos métodos possuem aplicação nos mais diversossetores. Estatística se origina do vocábulo latino status, que significa estado.

1.1.2 Ramos da Estatística

Estatística Descritiva

O objetivo da Estatística Descritiva é obter uma descrição do comportamento da variávelem estudo por meio de um tratamento adequado dos dados. Medidas de tendénciacentral, dispersão, assimetria e curtose são recursos da Estatística Descritiva.

Teoria da Probabilidade

De um modo geral, por meio da Teoria da Probabilidade faz-se o estudo de experimentosaleatórios, ou seja, processos de observação cujos resultados não podem ser previstos.Porém, apesar de não se poder fazer uma previsão dos resultados, podem ser calculadas“medidas” de chances de que tais resultados ocorram, as chamadas probabilidades.

Inferéncia Estatística

Com a Inferéncia Estatística, por meio da análise de partes ou porçães (amostras), épossível fazer generalizaçães a respeito do todo (população). Com métodos de InferénciaEstatística também é possível analisar a representatividade dos resultados, asignificância e a confiabilidade dos estudos realizados.

1.1.3 Conceitos Fundamentais

População

É a coleção de todos os elementos (objetos) estudados, relativos a uma determinadapesquisa.

Parâmetro Populacional

A expressão parâmetro populacional representa uma medida numérica utilizada para adescrição de uma dada população.

Amostra

É um subconjunto de uma determinada população.

Estatística Amostral

A expressão estatística amostral representa uma medida numérica que descreve umacaracterística relativa a uma amostra da população.

Censo

É a coleção de dados referentes a todos os elementos de uma população.

Variável

É qualquer característica de um indivíduo de uma população, que caracterizará oudescreverá um fenômeno ou fato de uma população. Uma variável assumirá valores noespaço e no tempo.

Dados Qualitativos

Dados qualitativos ou categóricos ou atributos descrevem condiçães particulares e sedistinguem por alguma característica não numérica. Como exemplo, temos dadoscaracterizados como nominais, como sexo (descrito por masculino ou feminino),nacionalidade (brasileira, chilena, francesa etc.), ou ainda, dados que podem sercaracterizados como ordinais, ou seja, aos quais poderá ser atribuída uma ordem, comoclassificação em torneios (1º lugar, 2º lugar etc.), ou conceitos relativos ao desempenhode alunos (muito bom, regular ou insuficiente). No caso de dados ordinais, pode-se ter ounão uma distância (ou métrica) entre os valores.

Dados Quantitativos

Dados quantitativos se originam de contagens, mediçães, cálculos ou enumeraçães.Como exemplo, temos dados quantitativos discretos ou contínuos. São discretos quandoestão associados a um conjunto finito ou enumerável de valores (como número deacertos de alunos de uma turma em um determinado exame). São contínuos quandoestão associados a uma escala contínua de valores (como mediçães relativas a tempo,comprimento etc.).

Estudo observacional

Em estudos observacionais, características específicas são verificadas e medidas, masnão se manipula ou modifica elementos. Por exemplo, a determinação do índicepluviométrico em uma determinada época do ano, em uma dada região do país.

Experimentos

Nos experimentos ocorre o planejamento da execução, de modo a se manipularcondiçães ou conduzir procedimentos com alguma finalidade específica. Por exemplo,podem-se realizar testes e posteriormente passa-se a observar os efeitos sobre elementosa serem pesquisados. Por exemplo, algum estudo relativo ao tratamento médico com umremédio dado a um grupo de pacientes a fim de determinar sua eficiéncia na cura.

Modelos Matemáticos

Modelos matemáticos representam os fenômenos de maneira abstrata. Nestarepresentação são utilizadas funçães definidas, com constantes e variáveis.

1.1.4 Fases do Trabalho Estatístico

As fases do trabalho estatístico são Definição do Problema, Planejamento, Coleta dosDados, Apuração dos Dados, Apresentação dos Dados e Análise e Interpretação dosDados.

Definição do Problema

Nesta fase, busca-se formular corretamente o problema, procurando-se saber exatamenteo que se pretende estudar.

Planejamento

Com o planejamento, definem-se os procedimentos a serem adotados para a realizaçãodo trabalho, como, por exemplo, as perguntas que deverão ser feitas nos questionários,quando a pesquisa deverá estar concluída, definição da população etc.

Coleta dos Dados

Esta é a fase de obtenção dos dados, que pode ser feita de maneira direta, quandolevantam-se os dados primitivos, ou seja, a partir de fontes originais (comorecenseamentos), ou de maneira indireta, de modo contrário. Quanto ao tempo, a coletade dados pode ser contínua, periódica ou ocasional.

Apreciação ou Crítica dos Dados

Verificação de erros ou enganos em marcaçães que levariam a conclusães errôneas,prejudicando o estudo realizado.

Apuração dos Dados

É a contagem dos dados propriamente dita, somando-se ou classificando-se os dadosadquiridos.

Apresentação ou Exposição dos Dados

Nesta fase, publicam-se ou mostram-se os resultados obtidos nas fases anteriores.

Análise e Interpretação dos Dados

Fase em que se fazem as medidas estatísticas, com métodos de estatística descritiva ouindutiva (inferéncia estatística).

1.2 MEDIDAS DE TENDÉNCIA CENTRAL (POSIÇÃO OULOCALIZAÇÃO)

As mais importantes medidas de tendéncia central são a média aritmética, médiaharmônica, média geométrica, moda e mediana, que serão descritas nos itens a seguir.

1.2.1 Média Aritmética

Podemos nos referir à média aritmética como o primeiro momento de uma distribuição.

Cálculo da Média Aritmética para dados não agrupados

Para populaçães, a média é denotada por μ. Para amostras, representa-se a média por .Para dados não agrupados em distribuiçães de frequéncias, podem ser calculados

em que, para efeito de simplificação de notação, para populaçães e

para amostras. N e n é o número total de observaçães para populaçães eamostras, respectivamente.

Cálculo da Média Aritmética para dados agrupados

Para dados agrupados em distribuiçães de frequéncias, pode-se calcular

em que as parcelas do somatório são as frequéncias fi das classes i vezes o ponto

médio Xi de cada classe. Vale notar que para populaçães e paraamostras.

1.2.2 Média Geométrica

Cálculo da Média Geométrica para dados não agrupados

A média geométrica ou proporcional entre dois números a e b é um terceiro número μGtal que

Logo:

ou ainda:

De uma maneira geral, a média geométrica entre os números X1, X2, …, Xn é dadapor:

.

Cálculo da Média Geométrica para dados agrupados

Para dados agrupados, ou seja, quando a distribuição das frequéncias para os k númerosX1, X2, …, Xk (k linhasda tabela de distribuição de frequéncias) é dada, correspondendorespectivamente aos valores f1, f2, …, fk, a média geométrica é:

,

lembrando que n = f1 + f2 + … + fk. Aplicando o logaritmo em ambos os membros daequação supra, tem-se que:

No 2º membro, o logaritmo do produto é a soma dos logaritmos, e isto leva a:

de modo que:

o que resulta finalmente em:

Exemplo: Seja a distribuição de frequéncias dada na tabela a seguir.

Xi fi

3 1

4 2

5 4

6 3

7 5

∑ 15

Calcular sua média geométrica.

Solução:

1º modo de resolução:

Utilizando tem-se que → G ≅ 5,44.

2º modo de resolução:

Utilizando , tem-se que

de forma que ≅ 100,7358 → G ≅ 5,44.

1.2.3 Média Harmônica

Cálculo da Média Harmônica para dados não agrupados

Em geral, a média harmônica envolve grandezas inversamente proporcionais. É dadapor:

.

Cálculo da Média Harmônica para dois valores

Para dois valores X1 = a e X2 = b (N = 2), temos:

cujo desenvolvimento resulta em:

Cálculo da Média Harmônica para dados agrupados

No caso de distribuiçães de frequéncias, em que cada classe está associada a um valor defrequéncia fi, a média harmônica é dada por:

em que (em que k é o número de classes) e Xi é o valor médio de cadaintervalo de classe.

Exemplo 1: Calcule a média harmônica entre os valores a = 4 e b = 9.

Solução: Substituindo os valores dados em ,

temos

Exemplo 2: Calcule a média harmônica da distribuição de classes dada na tabela aseguir:

Xi Frequências

15 17 12

17 19 84

19 21 265

21 23 281

23 25 260

25 27 83

27 29 15

Total 1000

Solução: Substituindo os valores para cálculo da média em obtemos

cujo desenvolvimento resulta em μH ≅ 21,74.

1.2.4 Moda

A moda é o valor que ocorre com maior frequéncia, ou seja, o valor prevalente de umadistribuição. Costuma-se distinguir moda absoluta e relativa. O termo foi introduzido porPearson. Significa que o valor que é mais típico ou frequente.

Cálculo da moda para não agrupados

Para uma lista de dados a moda é o valor que aparece com maior frequéncia. Porexemplo, para os valores observados 25, 35, 35, 35, 40, 45 a moda é 35.

Cálculo da moda para dados agrupados (Fórmula de Czuber)

Das várias fórmulas utilizadas para o cálculo aproximado da moda em uma distribuiçãode frequéncias, a mais utilizada é a fórmula de Czuber.

em que:

d1 é a diferença absoluta entre as frequéncias das classes modal e pré-modal;d2 é a diferença absoluta entre as frequéncias das classes modal e pós-modal;h é o intervalo de classe; eL é limite inferior da classe modal.

Exemplo: Seja a distribuição de frequéncias dada a seguir.

Diâmetro (cm) Freq. simples absoluta

4 6 6

6 8 8

8 10 12

10 12 10

12 14 4

O valor aproximado da moda da distribuição é igual a:

a) 9,7 cm;b) 9,3 cm;c) 9,6 cm;d) 9,4 cm;e) 9,5 cm.

Solução: De acordo com a tabela de distribuição de frequéncias dada no problema,temos d1 = 4, d2 = 2, h = 2 e L = 8. Substituindo tais valores na fórmula de Czuber,obtemos:

o que resulta em:

Gabarito: letra B.

1.2.5 Mediana

A Mediana é o valor que divide a coleção estudada em duas partes com o mesmonúmero de valores observados.

Cálculo da mediana para dados não agrupados

Para dados não agrupados dispostos em ordem crescente ou decrescente em uma lista, a

mediana será o valor (para uma amostra, usar n em vez de N).Exemplo: Sejam os valores observados 3, 7, 10, 12, 18, 21, 23 e 25. Determine a

mediana.

Solução: Como N = 8, temos que , então a mediana será dada pela médiaaritmética simples dos 4º e 5º termos, ou seja,

Cálculo da mediana para dados agrupados

Para dados agrupados, utiliza-se

em que:

L é limite inferior da classe mediana;h é o intervalo de classe;N é o número de observaçães na população (n para amostras);F é a soma de frequéncias até a classe mediana, sem contar com a mesma; efm é a frequéncia da classe mediana.

Exemplo: Considere a distribuição de frequéncia.

Peso (kg) Frequência absoluta

2 4 9

4 6 12

6 8 6

8 10 2

10 2 1

A mediana da distribuição, em kg, é igual a:

a) 5,27;b) 5,00;c) um valor inferior a 5,00;d) 5,10;e) 5,20.

Solução: Pela tabela de distribuição de frequéncias, notamos que a classe modal é aclasse 4 6, então L = 4. Além disto, h = 2, N = 30, F = 9 e fm = 12, substituindo nafórmula da mediana para distribuiçães de classes segue que:

que resulta em:

Gabarito: letra B.

Relação entre a Média Aritmética, a Moda e a Mediana

Quando tratamos de distribuiçães assimétricas podemos nos valer da relação de Pearson

em que Md é a Mediana e é a média aritmética.

1.3 MEDIDAS DE DISPERSÃO

As mais importantes medidas de dispersão são o desvio médio, a variância, o desviopadrão e o coeficiente de variação, que serão descritos nos itens a seguir.

1.3.1 Desvio Médio

Cálculo do Desvio Médio para dados não agrupados

O desvio médio (DM) para dados não agrupados de uma população é dado por:

Já para uma amostra,

Cálculo do Desvio Médio para dados agrupados

Quando os dados de uma população estiverem agrupados o desvio médio será dado por:

De modo similar, para uma amostra,

e da mesma maneira que outros casos que envolvam dados agrupados, X estarárepresentando o ponto médio da classe i e f será a respectiva frequéncia.

1.3.2 Variância

A variância de uma população é representada por σ2. Já a variância de uma amostra érepresentada por S2. Podemos nos referir à variância como o segundo momento de umadistribuição.

Cálculo da Variância para dados não agrupados

Para uma população, a variância é dada por:

Para uma amostra, a variância é dada por:

Cálculo da Variância para dados agrupados

Para uma população que tenha seus dados apresentados em uma tabela de distribuiçãode frequéncias, a variância é dada por:

Para uma amostra, a variância para dados agrupados é dada por:

Outra maneira de obter a variância

A variância (também representada por V[X]) pode ser calculada em função dossomatórios dos valores observados (∑X) e de seus quadrados (∑X 2), como exemplificadona fórmula:

Cálculo da Variância Combinada

A variância combinada é dada por:

em que ∑A é o somatório dos valores observados A, ∑B é o somatório dos valoresobservados B, ∑A2 é o somatório dos quadrados dos valores observados A, ∑B2 é osomatório dos quadrados dos valores observados B, nA e nB são os números de valoresobservados A e B, respectivamente.

1.3.3 Desvio padrão

Cálculo do desvio padrão para dados não agrupados

Para uma população, o desvio padrão σ é dado por:

Para uma amostra, o desvio padrão é representado por S e é dado por:

Cálculo do desvio padrão para dados agrupados

Para uma população que tenha seus dados apresentados em uma tabela de distribuiçãode frequéncias, o desvio padrão σ é dado por:

Para uma amostra, o desvio padrão S para dados agrupados é representado por:

1.3.4 Coeficiente de Variação (CV)

Coeficiente de Variação para uma população

Coeficiente de Variação para uma amostra

1.4 MEDIDA DE ASSIMETRIA E MEDIDA DE ACHATAMENTO

As medidas de assimetria e de achatamento dizem respeito à forma de uma distribuição.

1.4.1 Medida de Assimetria

Coeficiente de Assimetria

O coeficiente de assimetria (CA) de Pearson mede a assimetria de uma distribuição. Parauma população, ele é dado por:

Para uma amostra, temos:

Uma distribuição normal é simétrica. Neste caso é fácil ver que CA = 0.

Assimetria e sua relação com o terceiro momento de uma distribuição

O coeficiente de assimetria (CA) pode ser calculado como o terceiro momento de umadistribuição dividido pelo cubo do desvio padrão. Para uma população,

Para uma amostra,

1.4.2 Medida de Achatamento ou Curtose

Uma medida de curtose ou achatamento, assim como a medida de assimetria, também serefere à forma da distribuição. Uma distribuição achatada é chamada platicúrtica. Jáuma distribuição que apresenta um pico é denominada leptocúrtica. Uma distribuiçãonormal é chamada mesocúrtica. O Coeficiente de Curtose (CC) pode ser calculado comoo quarto momento da distribuição dividido pelo desvio padrão elevado à 4ª poténcia.Para populaçães, tem-se:

Para uma amostra,

1.5 QUESTÃES RESOLVIDAS

1. (Esag/TJ-MA – Analista Judiciário/2005) Utilizando-se o arredondamentoestatístico em duas casas decimais, em qual das alternativas o arredondamentoestá incorreto?

a) 68,485 = 68,49;c) 187,775 = 187, 78;b) 131,999 = 132,00;d) 74,445 = 74, 44.

Solução:

O arredondamento estatístico deve ser feito da seguinte forma:

(1) para os casos em que o último algarismo é 1, 2, 3, ou 4, o penúltimo algarismopermanece;

(2) para os casos em que o último algarismo é 6, 7, 8 ou 9, o penúltimo algarismo éacrescido de uma unidade (como o caso da letra B, que está correto);

(3) para os casos em que o último algarismo é 5, se o penúltimo algarismo for ímpar,acresenta-se a ele uma unidade (como o caso da letra C, que está correto). Se openúltimo algarismo for par, ele é mantido (como o caso da letra D, que estácorreto, e como deveria ser feito na letra A, que é o item incorreto).

Gabarito: letra A.

2. (Esag/TJ-MA – Analista Judiciário/2005) Associe a série de dados estatísticoscom o tipo de gráfico mais adequado para representá-la.Série de dados:

S1: Evolução do consumo mensal de materiais.S2: Participação percentual de cada sócio no capital de uma empresa.S3: Quantidade de alunos de uma escola por faixa etária.Gráficos:G1: HistogramaG2: Gráfico de LinhasG3: Gráfico Setorial (Pizza)A alternativa correta é:

a) (S1, G2); (S2, G1); (S3, G3);

c) (S1, G2); (S2, G3); (S3, G1);b) (S1, G3); (S2, G1); (S3, G2);d) (S1, G1); (S2, G2); (S3, G3).

Solução:

De um modo geral, gráficos representam visualmente relaçães entre variáveisenvolvidas em uma determinada modelagem matemática. No caso da evolução doconsumo mensal de materiais (S1), o fenômeno modelado diz respeito a uma evoluçãotemporal, que nem o histograma nem gráfico de setores representariam de modoadequado, de forma que o gráfico de linhas (G2) é o mais apropriado. O gráfico desetores (G3), por sua vez, é útil para representar, por exemplo, as participaçãespercentuais dos sócios de uma empresa (S2). Para as quantidades de alunos de umaescola por faixa etária (S3), o histograma (G1) é o mais adequado.

Gabarito: letra C.

3. (Esag/TJ-MA – Analista Judiciário/2005) Um aluno obteve as notas 4,5; 8,0 e7,0 nas trés avaliaçães realizadas durante o semestre.O aluno que não conseguea média 7,0 nas trés avaliaçães mensais deve realizar a prova final. Nacomposição da média final, a média das trés avaliaçães tem peso 4, e a nota daprova final tem peso 6.O aluno será considerado aprovado com a média final superior ou igual a

5.Para obter aprovação, o aluno citado deverá conseguir no exame final, notamínima igual a:

a) 5,0;b) 3,5;c) 4,0;d) 7,0.

Solução:

De acordo com os dados do problema, pode-se montar a seguinte equação, com arepresentação do cálculo da média final ponderada pelos pesos 4 e 6, na qual 6,5representa a média das notas nas trés avaliaçães realizadas durante o semestre, xrepresenta a nota do exame final e o valor 5, a média final mínima para aprovação,

Resolvendo-se esta equação, obtém-se X = 4.

Gabarito: letra C.

4. (Esag/TJ-MA – Analista Judiciário/2005) Observe a tabela a seguir:

TEMPO DE MONTAGEM DE EQUIPAMENTO

TEMPO (MIN) (x) N. EQUIPAMENTOS (f)

50 5

51 10

52 8

53 5

54 2

TOTAL 30

Determinando-se a média e a mediana, chega-se aos seguintes resultados:

a) Média = 50,52 minutos/equipamento; Mediana = 52,00 minutos.b) Média = 51,63 minutos/equipamento; Mediana = 51,50 minutos.c) Média = 51,36 minutos/equipamento; Mediana = 51,00 minutos.d) Média = 51,88 minutos/equipamento; Mediana = 52,50 minutos.

Solução:

a) Estimando a média:A média do tempo de montagem será ponderada pelosrespectivos números de equipamentos, representando as frequéncias fi dasobservaçães de cada Xi.Desta forma,

Assim, ≅ 516,3 minutos.b) Estimando a mediana:Como N = 30, então teremos que achar o valor de mediana

que nos fornece 15 valores de xi maiores e 15, menores. No entanto, os dados estão

agrupados. Assim, o valor se situaria entre os valores de x2 = 51 e x3 = 52. Nestecaso, podemos estimar a mediana como a média de x1 e x2, que nos dá o valor51,50 minutos.Gabarito: letra B.

6. (FCC/Bacen – Analista/2005) A média aritmética dos valores das vendas diáriasrealizadas pelas 50 empresas do setor A é de R$ 1.000,00, com desvio padrão deR$ 100,00. Sabe-se ainda que a média aritmética dos valores das vendas diáriasrealizadas pelas 200 empresas do setor B é R$ 2.000,00, com desvio padrão deR$ 200,00. A variância em (R$)2 dos valores das vendas diárias realizadas pelos2 setores reunidos é:

a) 288.000,00;b) 207.500,00;c) 194.000,00;d) 50.000,00;e) 34.000,00.

Solução:

Trata-se de um problema de variância conjunta, portanto utilizaremos

em que nA = 50 e nB = 200. Falta então determinarmos ∑A, ∑B, ∑A2 e ∑B2.

Para determinarmos ∑A e ∑B, utilizaremos nA, nB e os valores das médias dados noproblema ( = 1000 e = 2000). Assim,

.

De modo similar,

.

Para determinarmos ∑A2 e ∑B2, utilizaremos os desvios padrão dados SA = 100 e SB =200, os valores nA, nB e os valores das médias que acabamos de achar, usando:

em que V[A] = SA 2 = 1002 = 104. Assim, De modo similar,

em que V[B] = SB 2 = 2002 = 4 × 104, e então temos:

Substituindo então os valores determinados na equação para a variância conjunta,temos:

o que resulta em:

Gabarito: letra C.

1.6 QUESTÃES PROPOSTAS

1. (Esag/TJ-MA – Analista Judiciário/2005) Relacione cada série histórica com otipo de função mais adequada para explicar seu movimento de tendéncia:

Séries:S1: 6; 12; 20; 30S2: 7; 21; 63; 189S3: 4, 8, 12, 16Funçães:F1: LinearF2: Parabólica (do 2º grau)F3: ExponencialEstá correta a alternativa:

a) (S1, F1); (S2, F2); (S3, F3);c) (S1, F2); (S2, F1); (S3, F3);b) (S1, F2); (S2, F3); (S3, F1);d) (S1, F3); (S2, F2); (S3, F1).

Considere a situação-problema relatada na tabela a seguir para responder À squestães 2 e 3, mantendo a precisão dos dados na casa decimal.

A Secretaria de Educação, em 2007, fez um levantamento sobre o tempo gastona realização do ensino fundamental pelos alunos da cidade “A”. O resultado dolevantamento dos dados consta na tabela a seguir:

Com base nas informaçães, pode-se afirmar que:

2. (Unama/Seduc-PA – Técnico em Gestão Pública/2008) O tempo médio gasto narealização do ensino fundamental na cidade “A” é de:

a) 7,0 anos;b) 7,5 anos;c) 8,1 anos;d) 8,5 anos.

3. (Unama/Seduc-PA – Técnico em Gestão Pública/2008) O tempo mais frequente eo tempo mediano gasto na realização do ensino fundamental na cidade “A”são, respectivamente:

a) 7,0 e 7,5 anos;b) 7,5 e 8,0 anos;c) 8,1 e 7,5 anos.d) Ambos 7,0 anos.

4. (FCC/MPE-PE – Analista Ministerial/2006) Em uma linha de produção demontadoras de tratores existem 5 verificaçães realizadas pela equipe decontrole de qualidade. Foram sorteados alguns dias do més e anotados osnúmeros de controles em que o trator produzido foi aprovado nestes dias.

Aprovações Nº de tratores

3 250

4 500

5 1250

Total 2000

A tabela supra descreve estes dados coletados. Sabe-se que cada reprovaçãoimplica custos adicionais para a montadora. Admitindo-se um valor básico de R$10,00 por cada item reprovado no trator produzido, a média da despesa adicionalpor trator produzido será:

a) R$ 1,00;b) R$ 10,00;c) R$ 6,00;d) R$ 5,00;e) R$ 7,00.

5. (Esag/TJ-MA – Analista Judiciário/2005) Considerando-se o ano de 2003 emrelação ao ano de 2002, um produto apresentou um aumento de 10% no seupreço unitário. Na sequéncia, de 2004 em relação a 2003, houve uma redução de5% no preço unitário do mesmo produto.Considerando-se o perído completo de2002 a 2004, pode-se afirmar que houve:

a) um aumento geral de 2,5%;

b) um aumento geral de 4,5%;c) uma redução geral de 5%;d) um aumento geral de 5%.

6. (FCC/Metro-SP – Analista/2008) O histograma de frequéncias absolutas abaixoapresenta a distribuição dos salários dos empregados de uma empresa no mésde dezembro de 2007.

Dado:Considere que os intervalos de classe deste histograma são fechados àesquerda e abertos à direita.Encontrou-se a média aritmética dos salários dosempregados, considerando que todos os valores incluídos em um certo intervalode classe são coincidentes com o ponto médio deste intervalo. Obteve-se tambéma mediana dos salários utilizando o método da interpolação linear. O valor damoda dos salários (Mo) calculada conforme a fórmula Mo = 3Md – 2Me, sendo Mda mediana e Me a média aritmética, é igual a:

a) R$ 2.125,00;b) R$ 1.950,00;c) R$ 1.875,00;d) R$ 1.750,00;e) R$ 1.625,00.

7. (Esag/TJ-MA – Analista Judiciário/2005) Referindo-se ao formato das curvas defrequéncia, considere as características descritas nos próximos 3 itens para identificaras alternativas corretas:

I. As distribuiçães de frequéncia que tém a maior concentração de dados àesquerda são denominadas assimétricas negativas.

II. As distribuiçães leptocúrticas apresentam alta concentração de frequéncia

numa faixa estreita de valores.III. As distribuiçães normais são mesocúrticas e simétricas.

A alternativa contendo sentenças corretas:

a) Somente I e II.b) Somente II e III.c) Somente I e III.d) I, II e III.

8. (Esag/TJ-MA – Analista Judiciário/2005) A tabela a seguir apresenta adistribuição de frequéncia por classes de pontos obtidos por candidatos em umconcurso.

PONTOS Nº EQUIPAMENTOS (f)

39 − 50 8

50 − 61 19

61 − 72 10

72 − 83 5

83 − 94 3

TOTAL 45

Determinando-se as estimativas da Mediana (por interpolação) e Moda (modelode Czuber) chega-se aos resultados:

a) Mediana = 58,68 pontos; Moda = 55,50 pontos.b) Mediana = 66,50 pontos; Moda = 61,00 pontos.c) Mediana = 58,39 pontos; Moda = 56,05 pontos.d) Mediana = 55,50 pontos; Moda = 56,11 pontos.

9. (FCC/Bacen – Analista/2005) Em uma instituição bancária, o salário médio dos100 empregados do sexo masculino é de R$ 1.500,00, com desvio padrão de R$100,00. O salário médio dos 150 empregados do sexo feminino é de R$1.000,00, com desvio padrão de R$ 200,00. A variância em (R$)2 dos dois gruposreunidos é de:

a) 25.600,00;b) 28.000,00;

c) 50.000,00;d) 62.500,00;e) 88.000,00.

10. (Cespe-UnB/CPCRC-PA – Perito/2007)

Variável XFrequência relativa

0 0,10

1 0,20

2 0,30

3 0,40

Considerando a tabela supra, que apresenta as frequéncias relativas de umavariável X, relativa a uma contagem, assinale a opção correta.

a) A média de X é inferior a 1,5.b) O desvio padrão de X é inferior a 1,5.c) A moda e a mediana de X são iguais a 3.d) O coeficiente de variação de X é superior a 1.

Gabarito:

1. B2. C3. A4. D5. B6. C7. B8. C9. E10. B

Capítulo 2

Probabilidades

2.1. Probabilidade de um Evento

Espaço Amostral

É o conjunto de todos os possíveis resultados de uma experiência aleatória. Serárepresentado por Ω.

2.1.1. Evento

Um evento é um subconjunto qualquer de Ω. Será representado por E.

Medida de Probabilidade de um Evento

A medida de probabilidade de um Evento E é a razão entre o número de elementos doconjunto E, designado por n(E), e o número de elementos do espaço amostral, designadopor n(Ω). A probabilidade de um evento E será representada por P(E).

Também pode-se interpretar n(E) como o número de resultados ditos favoráveis en(Ω) como o número de possíveis resultados do espaço amostral.

Exemplo 1: Uma moeda é viciada de modo que a probabilidade de observarmos aface cara é 3 vezes mais provável do que observarmos a face coroa. Calcule aprobabilidade de sair cara num lançamento dessa moeda.

Solução:

Em um lançamento de uma moeda não viciada, a probabilidade de sair cara (evento C)é igual à probabilidade de sair a face coroa (evento K). No entanto, para a moedaviciada do problema, a probabilidade de que a face cara seja obtida é 3 vezes maior que

a probabilidade de se obter a face coroa. Logo P(C) = 3P(K), e daí obtemos As probabilidades de se obter cara e coroa em um lançamento da moeda viciada,somadas, devem totalizar uma unidade, então P(C) + P(K) = 1. Substituindo o valor

achado de P(K) em função de P(C) nesta última equação tem-se , queresulta em P(C) = 75%.

Exemplo 2: Ao entrar em uma casa de amigos, 5 pessoas deixam seus guarda-chuvascom a dona da casa. Quatro pessoas resolvem pedi-los de volta para sair, a dona da casaconstata que todos eles são aparentemente iguais, e resolve distribuí-los ao acaso. Quala probabilidade de que exatamente 3 pessoas recebam cada uma o seu próprio guarda-chuva?

Solução:

Existe um total de 5! = 120 possibilidades para a distribuição de guarda-chuvas peladona da casa, logo n(Ω) = 120. Porém, procura-se a probabilidade referente àdevolução correta de grupos de 3 guarda-chuvas. Para tal evento existem n(E) = C5,3 =10 possibilidades. Sendo assim, a probabilidade do evento é dada por:

Exemplo 3: Uma moeda honesta é arremessada 6 vezes. Qual a probabilidade deobter exatamente 3 caras?

Solução:

1º modo de resolução:Em 6 lançamentos da moeda do problema existem 26 possibilidades de resultados

diferentes, logo n(Ω) = 64. No entanto, 3 resultados caras em 6 lançamentos podem serobtidos de n(E) = C6,3 = 20 maneiras diferentes, logo:

2º modo de resolução:

Existe a possibilidade de resolução deste exercício utilizando um princípio básico dadistribuição binomial, que será discutida no Capítulo 4. Para repetições do mesmo

experimento aleatório, neste caso em N = 6 tentativas, a probabilidade de obtenção deX = 3 caras, dadas a probabilidade de obtenção de cara (sucesso) p = 0,5 e aprobabilidade de insucesso q = 0,5 é:

2.2. PROBABILIDADE CONDICIONAL E REGRA DE BAYES

Probabilidade Condicional

A probabilidade condicional P(B | A) de que um evento B ocorra dado que um evento Atenha ocorrido é dada por:

Regra da Multiplicação para Eventos Dependentes

De maneira similar para a equação supra, temos:

Assim, podemos escrever a probabilidade conjunta P(A ∩ B) como:

P(A ∩ B) = P(B | A) P(A) = P(A | B) P(B).

Regra de Bayes

Da equação supra, obtém-se imediatamente que:

que é muitas vezes chamada de regra de Bayes.

Exemplo 1 (UERJ): Um instituto de pesquisa colheu informações para saber asintenções de votos no segundo turno das eleições para governador de um determinadoestado.

Intenção de voto %

Candidato A 26%

Candidato B 40%

Voto nulo 14%

Voto branco 20%

Escolhendo-se aleatoriamente um dos entrevistados, verificou-se que ele não vota nocandidato B. Qual a probabilidade de que esse eleitor vote em branco?

Solução:

Sejam os conjuntos , de eleitores que não votam no candidato B, e C, dos eleitoresque votam em branco. O problema pede a probabilidade de que um eleitor vote embranco dado que ele não vota no candidato B. Utilizando-se a notação de conjuntos,pede-se para calcular P( | C) e pelo teorema de Bayes tem-se:

Pela tabela, pode ser verificado que P(C ∩ ) = 20/100 e que P( ) = 60/100. Assim,temos

Exemplo 2 (FTSM – 1995): Uma eleição é disputada por dois candidatos X e Y. Sabe-se que 60% dos eleitores preferem o candidato X, 20% preferem o Y e os demaiseleitores estão indecisos. Entre os eleitores que já se decidiram, qual a porcentagem dosque preferem Y?

Solução:

A porcentagem pedida no problema é referente aos eleitores que preferem o candidatoY, dado que se trata de eleitores que já se decidiram. Sendo I o conjunto dos eleitoresindecisos e o conjunto dos eleitores que já se decidiram, pede-se P(Y | ). Pelo Teoremade Bayes, temos:

Pelos dados do enunciado do problema, sabemos que P(Y ∩ ) = 20% e que P( ) =80%. Sendo assim,

Exemplo 3: Suponha que um escritório possua 100 computadores, entre novos eantigos. Algumas dessas máquinas possuem o processador da marca A, enquanto outraspossuem o processador da marca B, conforme mostra a tabela a seguir:

Uma pessoa entra no escritório, escolhe um computador ao acaso e descobre que énovo. Qual é a probabilidade de que ela possua o processador A?

Solução:

Está sendo pedida a probabilidade de que o computador possua o processador A dadoque ele é novo. Pede-se então P(A | N) e pelo Teorema de Bayes

Exemplo 4: Um grupo de pessoas está classificado de acordo com o sexo e o idiomaque fala, conforme mostra a tabela abaixo.

Escolhendo-se uma pessoa ao acaso e sabendo-se que esta pessoa fala francês, qual é aprobabilidade de que seja homem?

Solução:

Está sendo pedida a probabilidade de que uma pessoa escolhida ao acaso seja homem,dado que a pessoa escolhida fala francês, ou seja, pede-se P(H | F). Pelo Teorema de

Bayes, e pelos dados da tabela, que resulta em P(H| F) ≅ 47,5%.

2.3. PROBABILIDADE TOTAL E TEOREMA DE BAYES

Sejam os eventos A1,A2, …, An, de modo que A i ∩ A j = Ø ∀ i ≠ j (eventos disjuntos) e

que Já o evento B é tal que B ⊂ Ω, conforme mostra afigura a seguir.

Podemos observar pela figura que a chamada probabilidade total de B é dada por

Da regra da multiplicação para eventos dependentes sabe-se que P(B ∩ A) = P(B | A)P(A). Assim, podemos reescrever a equação para a probabilidade total de B como:

Mas da regra de Bayes mostrada na seção (2.2), sabemos que:

e substituindo a expressão com o somatório referente a P(B) no denominador, temos aexpressão que geralmente é denominada Teorema de Bayes

Exemplo 1: Durante o mês de agosto a probabilidade de chuva em um determinadodia é 4/10. O Fluminense ganha um jogo em um dia de chuva com probabilidade 6/10 eem um dia sem chuva com probabilidade 4/10. Sabendo-se que o Fluminense ganhou umjogo naquele dia de agosto, qual a probabilidade de que choveu nesse dia?

Solução:

Seja a vitória do Fluminense o evento B. Seja a chuva no dia do jogo o evento A1.Procura-se determinar P(A1 | B) (probabilidade de ter chovido, dado que o Fluminenseganhou o jogo). E pelo Teorema de Bayes,

em que A2 será o evento não chuva no dia do jogo. Desenvolvendo o somatório nodenominador, temos:

em que:

P(B | A1) é a probabilidade de que o time ganhou, dado que choveu; e P(B | A2) é aprobabilidade de que o time ganhou, dado que não choveu.

Pelo enunciado, P(B | A1) = 6/10, P(B | A2) = 4/10, P(A1) = 4/10 e P(A2) = 6/10.

Substituindo tais valores na expressão para P(A1 | B), temos:

o que resulta finalmente em:

Exemplo 2: Num exame há 3 respostas para cada pergunta e apenas uma delas estácerta, portanto, para cada pergunta, um aluno tem probabilidade 1/3 de escolher aresposta certa, se ele está adivinhando, e 1, se sabe a resposta. Um estudante sabe 30%das respostas do exame. Se ele deu a resposta correta para uma das perguntas, qual é aprobabilidade de que adivinhou?

Solução:

Sejam:

B: o evento em que o aluno acerta a resposta;A 1: o evento em que o aluno não sabe (adivinha) a resposta;A2: o evento em que o aluno sabe a resposta;B | A1: o evento em que o aluno acerta a resposta, dado que ele adivinhou a resposta;

eB | A2: o evento em que o aluno acerta a resposta, dado que ele sabia a resposta.

Pede-se, neste problema, a probabilidade de o aluno ter adivinhado (A1), dado que oaluno deu a resposta correta b). Assim,

Pelo enunciado do problema, P(B | A1) = 1/3, P(A1) = 70%, P(B | A2) = 1 e P(A2) =30%. Substituindo tais dados na expressão para P(A1 | B), temos:

que resulta em:

Exemplo 3: Tem-se três urnas absolutamente iguais U1, U2 e U3, contendo bolasbrancas e pretas da seguinte forma:

U1: Contém 3 bolas brancas e 4 bolas pretas.U2: Contém 5 bolas brancas e 3 bolas pretas.U3: Contém 4 bolas brancas e 2 bolas pretas.

Seleciona-se ao acaso uma urna e dela se extrai uma bola que se constata ser branca.Qual a probabilidade de que a urna selecionada seja U2?

Solução:

Como a urna foi selecionada ao acaso, então P(U1) = P(U2) = P(U3) = 1/3. Alémdisto, sejam:

B | U1: evento no qual a bola selecionada foi branca, dado que a mesma pertencia àurna 1;

B | U2: evento no qual a bola selecionada foi branca, dado que a mesma pertencia àurna 2; e

B | U3: evento no qual a bola selecionada foi branca, dado que a mesma pertencia àurna 3.

O que o problema pede é a probabilidade de que a urna selecionada foi a urna 2 (U2),sabendo-se que a bola selecionada foi branca b). Assim, pede-se P(U1 | B), e peloTeorema de Bayes tem-se:

Do enunciado do problema tem-se P(B | U1) = 3/7, P(B | U2) = 5/8 e P(B | U3) =4/6. Substituindo tais valores, temos

que resulta em:

Independência de Dois Eventos

Dois eventos A e B são chamados independentes estatisticamente se e somente se

Em palavras, dois eventos são independentes se a ocorrência de um evento A nãoimplica informação para predizer a probabilidade da ocorrência de um evento B, e vice-versa. Neste caso, dizemos que a probabilidade condicional de B dado A é simplesmenteigual à probabilidade de B, ou seja,

De modo similar para o evento A, temos:

Observações

1) Não confundir eventos mutuamente exclusivos e eventos independentes. Note que:

a) Se eventos A1, A2, …, An são mutuamente exclusivos, então:

b) Se eventos A1, A2, …, An são independentes, então:

2) Lei dos Grandes Números

Pela resolução de problemas anteriores, podemos notar que com auxílio do cálculo dasprobabilidades é possível fazer uma certa previsão dos fatos reais. E essa previsão étanto mais segura quanto maior for o número de experiências. Quanto maior o númerode provas, mais a nossa previsão se aproximará da realidade. Esta é a lei dos grandes

números, que liga os cálculos da probabilidade à estatística.

Como veremos adiante, num experimento aleatório, uma variável aleatória assumeum valor com uma determinada frequência relativa, cujo valor é uma aproximação daprobabilidade. Tal aproximação é mais precisa quanto maior for o número deobservações.

Assim, os valores que em estatísticas se chamam médias encontram correspondênciasno cálculo das probabilidades nas esperanças matemáticas. Maiores explicações edetalhes serão dados nos capítulos seguintes.

2.4. Questões Resolvidas

1. (FCC/Metro-SP – Analista/2008) Dois irmãos investem no mercado financeiro.Em um determinado período, sabe-se que o primeiro tem 80% de probabilidadede apresentar um ganho positivo e o segundo tem 90%. A probabilidade denenhum deles apresentar um ganho positivo, neste período, é igual a:

a) 2%;b) 3%;c) 10%;d) 20%;e) 25%.

Solução:

A probabilidade de que o primeiro irmão não tenha um ganho positivo (evento E1) éP(E1) = 1 – 0,8 = 0,2. A probabilidade de que o segundo irmão não tenha um ganhopositivo (evento E2) é P(E2) = 1 – 0,9 = 0,1. Neste problema é pedida a probabilidadede que o primeiro não tenha lucro positivo e que o segundo não tenha lucro positivo.Logo, procura-se P(E1 ∩ E2). Como os eventos são independentes, P(E1 ∩ E2) = P(E1) ·P(E2) = 0,2 · 0,1 = 0,02.

Gabarito: letra A.

2. (Esag/TJ-MA – Analista Judiciário/2005) De 240 empregados, 120 dominam amatemática, 100 dominam o português e 40 dominam as duasáreas.Considerando-se que um empregado seja escolhido ao acaso, pergunta-se:qual a probabilidade de esse empregado não dominar nem matemática nemportuguês?

a) 1/36;b) 7/24;c) 3/4;d) 1/4.

Solução:

Sejam:

U: o conjunto universo;

M: o conjunto dos empregados que dominam matemática;P: o conjunto dos empregados que dominam português;M ∩ P: o conjunto dos empregados que dominam matemática e português;M ∪ P: o conjunto dos empregados que dominam matemática ou português; o

conjunto dos empregados que não dominam matemática nem português; en(A): o número de elementos de um conjunto A qualquer dentre os supramencionados.

Tais conjuntos podem ser representados pelo diagrama a seguir:

Das relações entre os conjuntos apresentados podemos observar que:

(i) o número de elementos do conjunto universo (total de empregados) é a soma dosnúmeros de elementos dos conjuntos que representam os empregados que dominamportuguês ou matemática com os que não dominam nem a primeira nem a segundamatéria, ou seja, n(U) = n(M ∪ P) + n (M ∪ P); e

(ii) n(M ∪ P) = n(M) + n(P) – n (M ∩ P) e Pelo enunciado do problema, n(M) = 120,n(P) = 100 e n(M ∩ P) = 40, e após sua substituição na equação do item (ii) temos:

(iii) n(M ∪ P) = 120 + 100 – 40 ⇒ n (M ∩ P) = 180

Substituindo o resultado obtido em (iii) na equação apresentada no item (i) sabendoque n(U) = 240, temos:

Ao escolher ao acaso um empregado, a probabilidade de que o mesmo não domineportuguês nem matemática é dada por:

Gabarito: letra D.

3. (Esag/TJ-MA – Analista Judiciário/2005) Uma caixa contém 8 cilindros, sendo 5brancos e 3 verdes. A caixa também contém 6 cubos, sendo 4 brancos e 2verdes. Retirando-se apenas uma peça de forma aleatória, a probabilidade deencontrar um cubo ou uma peça qualquer da cor verde é:

a) 10/14;b) 45/56;c) 9/14;d) 11/14.

Solução:

Sejam os eventos:

A: retirar um cubo; e

B: retirar uma peça da cor verde.

Tais eventos não são mutuamente exclusivos, pois podemos retirar uma peça verdeque seja um cubo. O que é pedido no problema é P(A ∪ B) (retirar um cubo ou umapeça qualquer da cor verde). Tal probabilidade (para eventos que não sejam mutamenteexclusivos) é dada por:

Pelo enunciado do problema, P(A) = 6/14 (6 cubos em 14 peças), P(B) = 5/14 (5peças de cor verde em 14 peças) e P(A ∩ B) = 2/14 (2 cubos verdes em 14 peças).Substituindo, temos:

que resulta em:

Gabarito: letra C.

4. (Esaf/Bacen – Analista/2005) Do total de títulos em poder de um investidor, é do tipo T1, ¼ é do tipo T2 e o restante do tipo T3. Sabe-se que asprobabilidades de se obter uma taxa real de juros positiva com essas aplicaçõessão 0,60 com T1, 0,70 com T2 e 0,80 com T3. Se for escolhido um títuloaleatoriamente entre estes em poder do investidor e verificar-se queapresentou uma taxa real de juros não positiva, a probabilidade de ele ser dotipo T3 é:

a) 50%;b) 40%;c) 30%;d) 20%;e) 10%.

Solução:

A probabilidade pedida é a probabilidade condicional de que o título pertencente aoinvestidor seja do tipo 3, sabendo-se que ele apresentou uma taxa de juros não positiva.Esta probabilidade condicional é dada pelo Teorema de Bayes, de modo que:

Pelo enunciado, Também podemoscalcular as probabilidades P(N | T1) = 1 – 0,6 = 0,4, P(N | T2) = 1 – 0,7 = 0,3 e P(N |T3) = 1 – 0,8 = 0,2. Substituindo tais valores na expressão para P(T3 | N), segue que:

de modo que:

Gabarito: letra A.

5. (NCE/Anac – Estatística/2007) Uma moeda honesta é lançada duas vezes. Aprobabilidade condicional de que ocorram duas caras, dado que ao menos umacara ocorre, é igual a:

a) 1/3;b) 1/2;c) 3/5;d) 3/4;e) 4/5.

Solução:

Sejam os eventos:

A a ocorrência de duas caras; e

B a ocorrência de ao menos 1 cara.

A probabilidade condicional que está sendo pedida é P(A | B) que pela regra de Bayesé dada por:

Calculemos então a probabilidade P(A) do evento A. Para que ocorram duas caras,teremos que obter cara no primeiro lançamento e cara no segundo, o que significa que

A probabilidade P(B), relativa ao evento B, será a probabilidade de obtermos umacara (no 1º ou no 2º lançamento, lembrando que as possibilidades são CC, KK, KC ou

CK, então tal probabilidade é ou cara nos dois lançamentos (já calculado e

equivalente a .

Assim,

Porém deve-se notar que o evento A está contido no evento B e, nesse caso, P(A ∩ B)= P(A) (pois B é obtenção de 1 cara ou 2 caras e A é a obtenção de 1 cara). Assim,voltando à expressão para P(A | B), podemos reescrevê-la como:

o que, pelos cálculos, resulta em:

Gabarito: letra A.

2.5. Questões Propostas

1. (Esag/TJ-MA – Analista Judiciário/2005) Uma caixa de ferramentas contém 5martelos, sendo 3 com cabo de madeira e 2 com cabo de borracha. A caixatambém contém 7 limas, sendo 3 com cabo de madeira e 4 com cabo deborracha.Retirando-se 2 ferramentas de forma aleatória e sem reposição, aprobabilidade de que uma seja martelo com cabo de madeira e a outra umalima com cabo de borracha é:

a) 2/11;b) 12/35;c) 7/12;d) 1/11.

2. (Esag/TJ-MA – Analista Judiciário/2005) Uma caixa contém 4 peças, sendo 3perfeitas e 1 defeituosa. Uma segunda caixa contém 6 peças sendo 4 perfeitas e2 defeituosas.Uma experiência consiste em retirar uma peça de cada caixa coma expectativa de que ambas as peças selecionadas sejam perfeitas. Após arealização de cada experiência, as peças retiradas voltam à caixa de origem. Sea experiência for realizada 3 vezes, a probabilidade de que a expectativa sejasatisfeita em duas oportunidades é:

a) 1/2;b) 1/8;c) 3/8;d) 7/10.

3. (FCC/Bacen – Analista/2005) Uma pessoa poderá investir seu dinheiro em trêssetores (A, B e C) da economia. Sabe-se que a probabilidade de uma empresaapresentar lucro é de 0,70 sendo empresa do setor A; 0,80 sendo empresa dosetor B e 0,90 sendo empresa do setor C. Tem-se ainda que nesta economiaexistem 750 empresas do setor A, 300 do setor B e 150 do setor C. Escolhendoaleatoriamente uma empresa pertencente a esses três setores e detectando-seque ela não apresenta lucro, a probabilidade de ela pertencer ao setor A é de:

a) 30%;b) 40%;

c) 50%;d) 75%;e) 80%.

4. (FCC/Metro-SP – Analista/2008) Em uma assembléia com 25 participantes,sabe-se que 5 deles são contra a realização de determinado projeto e o restantea favor. Extraindo ao acaso uma amostra de 3 participantes desta assembléia,sem reposição, a probabilidade (P) de todos os 3 participantes serem a favor doprojeto é tal que:

a) P < 50%;b) 50% ≤ P < 60%;c) 60% ≤ P < 70%;d) 70% ≤ P < 80%;e) 80% ≤ P < 90%.

5. (Esaf/Auditor-Fiscal – Previdência Social/2002) Considere um ensaio aleatóriocom espaço amostral {T, U, V, W}. Considere os eventos M = {T}, N = {U, V} eS = {W}. Assinale a opção correta relativamente à probabilidade de M ∩ N ∩ S.

a) Não se pode determinar a probabilidade de intersecção sem maiores informações.b) É o produto das probabilidades de M, N e S, pois os eventos são estatisticamente

independentes.c) A probabilidade é um, pois pelo menos um dos três eventos deve ocorrer.d) A probabilidade da intersecção é 1/3 se os eventos elementares forem igualmente

prováveis.e) A probabilidade da intersecção é nula, pois os eventos são mutuamente exclusivos.

6. (NCE/Anac – Estatística/2007) Avalie as afirmativas a seguir, acerca deprobabilidades de eventos:

I. Se dois eventos, de probabilidades não nulas, não têm interseção, então elessão independentes.

II. Dois eventos independentes, de probabilidades não nulas, podem sermutuamente exclusivos.

III. Se A e B são eventos, 0 < P [B] < 1, e se é o complemento de B, então P[A] = P [A | B] P [B] + P [A | ] P [ ].

IV. Se A e B são eventos de probabilidades não nulas tais que a probabilidade

condicional de A ocorrer dado que B ocorre é igual à probabilidadeincondicional de A ocorrer, então A e B são independentes.

Estão corretas as afirmativas:

a) I e II, apenas;b) III e IV, apenas;c) I, II e IV, apenas;d) II, III e IV, apenas;e) I, II, III e IV.

7. (FCC/TRF/2 – Analista/2007) Sejam A e B dois eventos associados a umexperimento. Supondo que Pa) = 0,4 e P(A ∪ B) = 0,7 e Pb) = p. Os valores dep que fazem com que A e B sejam mutuamente exclusivos e A e B sejamindependentes são, respectivamente:

a) 0,3 e 0,5;b) 0,4 e 0,2;c) 0,5 e 0,2;d) 0,6 e 0,2;e) 0,3 e 0,4.

8. (FCC/TRF/2 – Analista/2007) Uma fábrica de chocolate produz dois tipos decaixas de bombons: com e sem açúcar. Cada caixa contém 10 bombons. Pordescuido, foram misturados 3 bombons sem açúcar em uma caixa de bombonsdoces. A caixa foi oferecida a uma criança que retirou 2 bombons. Aprobabilidade de estes dois bombons serem sem açúcar é:

a) 1/15;b) 1/20;c) 3/20;d) 3/15;e) 1/5.

As informações a seguir referem-se às questões de números 9 e 10.Em um jogo,um participante seleciona sucessivamente ao acaso duas bolas de uma urna quecontém 10 bolas sendo: 4 pretas, 3 vermelhas e 3 brancas. O esquema depremiação do jogo consiste das seguintes regras: para cada bola vermelha

sorteada o participante ganha um real, para cada bola preta sorteada ele perdeum real e para cada bola branca sorteada ele não ganha e nem perde nada.9. (FCC/TRF/2 – Analista/2007) Se a seleção for realizada sem reposição, a

probabilidade de o participante não ganhar nada neste jogo é:

a) 1/6;b) 1/5;c) 1/4;d) 1/3;e) 1/8.

10. (FCC/TRF/2 – Analista/2007) Se a seleção for realizada com reposição, aprobabilidade de o participante ganhar R$ 1,00 neste jogo é:

a) 0,25;b) 0,18;c) 0,15;d) 0,12;e) 0,10.

Gabarito:

1. A2. C3. D4. A5. E6. B7. A8. A9. D10. B

Capítulo 3

Variáveis Aleatórias e Distribuições deProbabilidades

3.1. VARIÁVEIS ALEATÓRIAS

É uma função que associa um único valor real (na reta ℜ) para cada ponto A1, A2, …, An

pertencente ao espaço amostral Ω, como mostrado a seguir.

Assim, podemos definir eventos tendo em vista variáveis aleatórias, como nosexemplos a seguir.

Exemplo 1: Em dois lançamentos sucessivos de uma moeda honesta, sendo a variávelaleatória X o número de caras obtidas, quais são os valores que X pode assumir?

Solução:

É simples ver que o espaço amostral é Ω = {CC, KC, CK, KK}. Assim, X pode assumiros valores 0, 1 ou 2, o que soluciona o exemplo.

No entanto, para cálculos e modelagens mais complexas é importante compreenderque poderíamos passar a fazer referência aos eventos tendo em vista os valores quepodem ser assumidos pelas variáveis aleatórias. Um caso poderia ser: seja o evento E1 aobtenção de uma cara em dois lançamentos de uma moeda honesta. A probabilidadeP(E1), então, é equivalente a P(X = 1). Em outro caso, se for pedida a probabilidade doevento E2 de obtenção de pelo menos uma cara, a mesma será P(E2) = P(X ≥ 1).

Exemplo 2: Lança-se uma moeda honesta 3 vezes seguidas. Seja X a variável aleatóriaassociada ao número de caras. Determine a probabilidade associada aos eventos (a) (X= 0), (b) (X = 1), (c) (X = 2), (d) (X = 3), (e) (X ≥ 2), (f) (X ≥ 0) e (g) (X ≥ 4).

Solução:

Para este caso, o espaço amostral é Ω = {CCC, CCK, CKC, CKK, KKK, KKC, KCK,KCC}, em que C representa cara e K representa coroa.

(a) Nenhuma cara é obtida apenas no evento {KKK}. Então P(X = 0) = 1/8.

(b) Exatamente uma cara é obtida nos eventos {CKK}, {KKC} e {KCK}. Então P(X = 1)= 3/8.

(c) Exatamente duas caras são obtidas nos eventos {CCK}, {CKC} e {KCC}. Então P(X =2) = 3/8.

(d) Exatamente três caras são obtidas no evento {CCC}. Então P(X = 3) = 1/8.(e) Duas caras ou três caras são obtidas nos eventos {CCK}, {CKC}, {KCC} e {CCC}, ou

seja, , ou então .(f) Ou seja, temos total certeza de que obteremos zero ou mais caras em três

lançamentos da moeda.(g) De modo contrário ao caso da letra (f), temos certeza de que não será possível a

obtenção de quatro ou mais caras no lançamento de três moedas, logo (X ≥ 4) = 0.

Variável Aleatória Discreta

Uma variável aleatória discreta é aquela que somente pode assumir valores finitos ediscretos. As variáveis aleatórias associadas à observação do número de caras em dois outrês lançamentos de uma moeda honesta (exemplos 1 e 2, supra) são variáveis aleatóriascontínuas.

Variável Aleatória Contínua

Uma variável aleatória contínua é aquela que pode assumir um número infinito devalores em um dado intervalo. Por exemplo, a variável aleatória associada à mediçãodas alturas dos alunos de uma turma é uma variável aleatória contínua.

3.2. VARIÁVEIS ALEATÓRIAS DISCRETAS

3.2.1 Função de Distribuição de Probabilidades Acumuladas paraVariáveis Aleatórias Discretas

A Função de Distribuição de Probabilidades Acumulada ou somente Função de Distribuiçãode uma variável aleatória discreta X é definida por:

Exemplo 1: Uma variável aleatória discreta X pode assumir os valores x conforme atabela a seguir, que também contém as respectivas probabilidades:

xi P(X = xi)

1 0,1

2 0,2

3 0,4

4 0,2

5 0,1

Determine FX(x).

Solução:

Pela definição, FX(x) = P(X ≤ x), e para solucionar a questão, podemos utilizar

, como mostrado abaixo.

Para x = 1, temos FX(1) = P(X ≤ 1) = P(X = 1) ⇒FX(1) = 0,1.

Para x = 2, temos FX(2) = P(X ≤ 2) = P(X = 1) + P(X = 2) ⇒FX(2) = 0,1 + 0,2 =0,3.

Para x = 3, temos FX(3) = P(X ≤ 3) = P(X = 1) + P(X = 2) + P(X = 3) ⇒FX(3) =0,1 + 0,2 + 0,4 = 0,7.

Para x = 4, temos FX(4) = P(X ≤ 4) = P(X = 1) + P(X = 2) + P(X = 3) + P(X =4) ⇒FX(4) = 0,1 + 0,2 + 0,4 + 0,2 = 0,9.

Para x = 5, temos FX(5) = P(X ≤ 5) = P(X = 1) + P(X = 2) + P(X = 3) + P(X =4) + P(X = 5) ⇒FX(5) = 0,1 + 0,2 + 0,4 + 0,2 + 0,1 = 1,0.

Os valores de FX(x) para valores não inteiros de x deverão ter o mesmo valor que oreferente ao valor inteiro de x mais próximo à esquerda, o que resulta na função dedistribuição

Exemplo 2: Para uma variável aleatória discreta X obteve-se a seguinte função dedistribuição de probabilidades acumulada:

Pede-se:

(a) Calcule a probabilidade para (X ≤ 2).(b) Calcule a probabilidade para (X < 4).(c) Calcule a probabilidade para (X > 3).(d) Calcule a probabilidade para (X = 3).

Solução:

(a) Temos que P(X ≤ 2) = FX(2) = 0,5.(b) Se estivesse sendo pedido P(X ≤ 4), então teríamos P(X ≤ 4) = 1,0, pois FX(4) =

1,0. Mas, em vez disso, estamos determinando P(X < 4) e devemos procurar o valor

da função de distribuição referente ao inteiro mais próximo à esquerda de x = 4,que é x = 3. Ou seja, P(X < 4) = FX(3) = 0,8.

(c) A probabilidade P(X ≤ 3) = FX(3) = 0,8. Como procura-se P(X < 3), podemoscalcular P(X < 3) = 1 – 0,8 = 0,2.

(d) Como mencionado anteriormente, P(X ≤ 3) = FX(3) = 0,8. Mas para P(X < 3)temos P(X < 3) = FX(2) = 0,5 (pois 2 é o maior inteiro à esquerda de 3). Paradeterminarmos exatamente P(X = 3), devemos calcular P(X = 3) = P(X ≤ 3) – P(X< 3) ⇒P(X = 3) = 0,8 – 0,5 = 0,3.

3.2.2 Função de Massa de Probabilidade para Variáveis AleatóriasDiscretas

Os “saltos” (descontinuidades) existentes nas funções de distribuição correspondem avariações para valores específicos das variáveis aleatórias discretas. Como no item (d)do exemplo anterior, ao determinarmos especificamente um valor de probabilidade parauma variável X (no item d do exemplo 2, dado na subseção 3.2.1, para P(X = 3)), naverdade calculamos a subtração entre dois valores de Fx(x) para dois valores de xconsecutivos xi – 1 e xi, ou seja,

A função de massa de probabilidade pX(xi) denota pX(xi) = P(X = xi). No exemplo 1do item 3.2.1, a tabela dada representa os valores de uma função de massa deprobabilidade para uma variável aleatória discreta.

3.3. VARIÁVEIS ALEATÓRIAS CONTÍNUAS

3.3.1 Função Densidade de Probabilidade para Variáveis AleatóriasContínuas

Também chamada de função de probabilidade, a função de densidade de probabilidade serefere a variáveis aleatórias contínuas. Geralmente denotada por fX (X), seu gráfico seráuma curva suave e a área sob a curva será equivalente a 1. Além disso,

Com a função de densidade de probabilidade, pode-se calcular a probabilidade de quea variável aleatória contínua X assuma valores entre a e b por meio da integral

Além disto, pode-se afirmar que:

pois vale lembrar que para uma variável aleatória contínua P(X = x) = 0, embora nãose trate do evento ∅. Para variáveis aleatórias contínuas em geral estaremosinteressados em calcular a probabilidade para intervalos de X, e não para valoresespecíficos, como já foi feito para variáveis aleatórias discretas.

3.4. MÉDIA, MOMENTO E VARIÂNCIA PARA VARIÁVEISALEATÓRIAS

3.4.1 Média

Cálculo da Média para Variáveis Aleatórias Discretas

Cálculo da Média para Variáveis Aleatórias Contínuas

3.4.2 Momento

Cálculo do Momento para Variáveis Aleatórias Discretas

Cálculo do Momento para Variáveis Aleatórias Contínuas

3.4.3 Variância

A variância pode ser calculada como

o que resulta nas fórmulas a seguir para os casos discreto e contínuo.

Cálculo da Variância para Variáveis Aleatórias Discretas

Cálculo da Variância para Variáveis Aleatórias Contínuas

3.5. QUESTÕES RESOLVIDAS

1. (Esaf/Prefeitura de Recife – Auditor do Tesouro/2003) Para uma amostra detamanho 100 de um atributo discreto X, obteve-se a função de distribuiçãoempírica seguinte:

Assinale a opção que corresponde à frequência de observações de X iguais a 3.

a) 55;b) 35;c) 20;d) 30;e) 85.

Solução:

A probabilidade que está sendo pedida é P(X = 3), que é dada por:

Gabarito: letra C.

2. (FCC/Bacen – Analista/2005) Uma variável aleatória contínua X tem a seguintefunção densidade de probabilidade:

Sendo K uma constante, seu valor é igual a:

a)

b) c) ;d) ¾;e) 1.

Solução:

A integração de uma função de densidade de probabilidade de uma variável aleatóriacontínua no intervalo (-∞, +∞) tem como resultado a unidade, ou seja,

E neste caso, como a função é nula para x < 0 e para x > 3, podemos escrever:

Integrando na variável x, obtemos:

E resolvendo a equação supra com os limites de integração, temos:

o que resulta em:

Gabarito: letra A.

3. (FCC/MPE-PE – Analista Ministerial/2006) A função de densidade deprobabilidade do tempo, em segundos, requerido para completar uma operaçãode montagem é:

Sabendo que a segundos é o tempo que é precedido por 25% das montagens, ovalor de a é:

a) 20;b) 18,5;c) 17,8;d) 17,2;e) 16.

Solução:

Sabe-se que a probabilidade para determinado intervalo [a, b] será obtida por meio daintegração da função de densidade de probabilidade com relação à variável em questão.

Dessa forma,

Note que, para este caso, os limites de integração serão x1 (que será substituí do por10) e x2 (que será substituído por a). Assim, a função de probabilidade dependerá de a,que poderia ser qualquer para 10 < x < 50. Ao fazermos a integração, ainda semaplicarmos os limites x0 e x1, obtemos:

(Como exercício, verifique que: (1) a substituição de x1 = 10 e x2 = 10 dá zero, ou

seja, neste intervalo nulo, a probabilidade é de que 0% das montagens seja realizada;(2) a substituição de x1 = 10 e x2 = 50 dá a unidade, o que significa que, nesteintervalo de tempo, a probabilidade é de que 100% das montagens sejam realizadas.)

Então, para determinarmos o tempo a que será precedido por 25% das montagensbasta substituirmos x1 = 10, x2 = a e igualarmos a 25%. Assim,

E desta forma,

Isolando-se a, obtemos a = 20.

Gabarito: letra A.

4. (FCC/Bacen – Analista/2005) O número de televisores modelo M vendidosdiariamente numa loja é uma variável aleatória discreta (X) com a seguintedistribuição de probabilidades:

O preço unitário de venda do televisor modelo M é R$ 1.000,00. Se numdeterminado dia a receita de vendas referente a este modelo for inferior a R$3.000,00, a probabilidade de ela ser positiva é:

a) 20%;b) 30%;c) 50%;d) 60%;e) 75%.

Solução:

Trata-se de um problema de probabilidade condicional, em cuja solução será usado oTeorema de Bayes (ver Capítulo 3).

O que está sendo pedido é a probabilidade de a receita ser positiva, dado que a receitafoi menor do que R$ 3.000,00. Isto colocado em termos de unidades de televisoresvendidos (variável aleatória X) significa que o que está sendo pedido é a probabilidadede que X seja maior do que zero (receita positiva) dado que X é menor que 3 (receitamenor que R$ 3.000,00), ou seja, pede-se P(X > 0 | X < 3). E pelo Teorema de Bayes:

Devemos então calcular as probabilidades P(X > 0) ∩ P(X < 3) e P(X < 3). Noentanto, os valores de probabilidade dados na tabela encontram-se em função de p, e,para resolver o problema, devemos determinar o seu valor. Sabe-se que a soma das

probabilidades P(Xi) da tabela deve totalizar uma unidade, ou seja, . Assim,a soma dos valores de probabilidade descritos na 2ª linha da tabela deve ser 1, ou seja, p+ 1,5p + 1,5p + p = 1 e podemos chegar ao valor p = 0,2.

Desta forma, podemos reescrever a tabela dada.

Voltando às probabilidades P(X > 0) ∩ P(X < 3) e P(X < 3), pela tabela pode serverificado que P(X > 0) ∩ P(X < 3) corresponde à soma P(1)+P(2) = 0,3 + 0,3 = 0,6.A probabilidade de que o número de televisores vendidos seja menor do que 3 é dadapor P(X < 3) = P(0) + P(1) + P(2) = 0,2 + 0,3 + 0,3 = 0,8.

E assim podemos calcular a probabilidade pedida:

Gabarito: letra E.

5. (FCC/Bacen – Analista/2005) Um empresário, investindo em um determinadoempreendimento, espera ter os seguintes lucros em função dos cenários “Bom”,“Médio” e “Ruim”.

Cenário Lucro (R$) Distribuição de Probabilidades do Cenário

Bom R$ 8.000,00 0,25

Médio R$ 5.000,00 0,60

Ruim R$ 2.000,00 0,15

A expectância e a variância do respectivo lucro são, em R$ e (R$)2,respectivamente:

a) 5.000,00 e 3.160.000;b) 5.000,00 e 3.510.000;c) 5.300,00 e 3.160.000;d) 5.000,00 e 3.510.000;e) 5.500,00 e 3.160.000.

Solução:

Para calcularmos a média, utilizaremos , de modo que:

Para calcularmos a variância, utilizaremos , de modo que:

Gabarito: letra E.

3.6. QUESTÕES PROPOSTAS

1. (Esaf/Susep – Analista Técnico/Atuária/2002) A variável aleatória X tem funçãode distribuição de probabilidades dada por:

Assinale a opção que dá o valor da probabilidade de que X assuma o valor 3.

a) 0;b) 1/16;c) 1/8;d) 13/16;e) ¾.

2. (FCC/Bacen – Analista/2005) Uma variável aleatória X tem a seguinte funçãode densidade de probabilidade:

Sendo a uma constante, seu valor é igual a:

a)

b)

c)

d) e) 1.

3. (FCC/Bacen – Analista/2005) O número de automóveis modelo K vendidos

diariamente em uma concessionária de veículos é uma variável aleatóriadiscreta (X) com a seguinte distribuição de probabilidades:

O preço unitário de venda do modelo K é R$ 20.000,00 e somente em 20% dosdias tem-se vendas superiores a duas unidades. Se num determinado dia a receitade vendas referente a este modelo for positiva, a probabilidade de ela ser inferiora R$ 60.000,00 é de:

a) 60%;b) 75%;c) 80%;d) 87,5%;e) 90%.

4. (FCC/Bacen – Analista/2005) Um investidor espera conseguir, com umadeterminada aplicação no mercado financeiro, as seguintes taxas reais de jurosem função dos cenários “Bom”, “Médio” e “Ruim”.

Cenário Taxa Real de Juros (%) Distribuição de Probabilidades do Cenário

Bom +10 0,30

Médio +8 0,50

Ruim +5 0,20

A expectância e a variância da respectiva taxa real de juros são respectivamente:

a) 8% e 0,67%;b) 8% e 0,64%;c) 8% e 0,03%;d) 7,5% e 0,67%;e) 7,5% e 0,09%.

5. (Cespe-UnB/CPCRC-PA – Perito/2007) Considere que X seja uma variávelaleatória definida pela função de densidade de probabilidade a seguir.

Nessa situação, a média de X é igual a:

a) 2,5;c) 3,5;b) 3,0;d) 4,0.

Para responder às questões de números 6 e 7, considere os dados a seguir.Umavariável aleatória X possui a seguinte densidade:

6. (FCC/ANS – Analista/2007) O valor da probabilidade P (2 < X < 3) é:

a) 1/6;b) 2/6;c) 4/6;d) 5/6;e) 6/6.

7. (FCC/ANS – Analista/2007) O valor esperado de X é:

a) 2;b) 5/3;c) 4/3;d) 1;e) 2/3.

8. (NCE/Anac – Estatística/2007) A função de densidade de probabilidade de umavariável aleatória X é dada por:

O valor esperado de X:

a) é negativo;b) é igual a 1;c) é maior do que 1 mas menor do que 10;d) é maior do que 100 mas menor do que 1.000;e) não existe.

9. (Consulplan/IBGE – Sup. Pesq./2009) Seja f(x) = 2x, com 0 ≤ x ≤ 1 a funçãodensidade de probabilidade da variável aleatória X e os eventos A = {x: 0 ≤ x≤ 1/2} e B = {x: 1/3 ≤ x ≤ 2/3}. A probabilidade de ocorrência de A ∪ B éigual a:

a) 1/4;b) 1/3;c) 5/36;d) 21/36;e) 4/9.

10. (FCC/TRF/2 – Analista/2007) Para que a função apresentada a seguir sejafunção densidade de probabilidade da variável aleatória X, o valor de C deveser:

a) 2/10;b) 3/12;c) 3/8;d) 1/8;e) 1/16.

Gabarito:

1. C

2. A3. B4. C5. C6. A7. C8. E9. E10. C

Capítulo 4

Distribuições Teóricas de Probabilidades

4.1 DISTRIBUIÇÃO DE BERNOULLI

Uma variável aleatória de Bernoulli tem sua função de massa de probabilidade dadapor:

com k = 0, 1 e 0 ≤ p ≤ 1. O valor 1 representa um evento em que há sucesso (cujaprobabilidade é p), enquanto o valor 0 representa fracasso (cuja probabilidade é 1-p). Asprobabilidades para tais valores de k serão as indicadas na tabela a seguir.

k pX (k)

0 1 − p

1 p

O valor esperado da distribuição de Bernoulli será dado por E(X) = m = p. Avariância será Var(X) = p(1 – p).

4.2 DISTRIBUIÇÃO BINOMIAL

Seja uma experiência realizada com N tentativas independentes e com dois resultadospossíveis em cada tentativa, sucesso ou fracasso, com as probabilidades p e q,respectivamente, de modo que q = 1 – p. A probabilidade de obtermos k vezes oresultado desejado (função massa de probabilidade) é:

com k = 0, 1, 2, …, N. A função de distribuição de probabilidade acumulada é dada por:

com n ≤ x < n + 1. A média da distribuição binomial é dada por E(X) = m = Np. Avariância é dada por Var(X) = Np(1 – p).

Para N > 30, Np > 5 e N(1 – p) > 5, a distribuição binomial pode ser aproximada àdistribuição normal, que será vista no item 4.9.

4.3 DISTRIBUIÇÃO DE POISSON

A distribuição de Poisson é uma aproximação para a distribuição binomial quando onúmero de tentativas N é grande, com a probabilidade p relativamente pequena (ouseja, q é próximo de 1). Em termos práticos, N ≥ 50, de modo que o produto l = Np ≤5. A função massa de probabilidade para a distribuição de Poisson é dada por:

A média para a distribuição de Poisson é dada por E(X) = μ = l e a variância éVar(X) = l.

4.4 DISTRIBUIÇÃO UNIFORME

A função densidade de probabilidade da distribuição uniforme é dada por:

A função de distribuição de probabilidade acumulada referente à distribuiçãouniforme é:

A média para esta distribuição é dada por . A variância é

.

4.5 DISTRIBUIÇÃO POLINOMIAL

A distribuição polinomial (também chamada multinomial) é uma generalização dadistribuição binomial. Sejam os eventos E1, E2, …, Em respectivamente associados àsvariáveis aleatórias discretas X1, X2, …, Xm. A probabilidade de que X1, X2, …, Xm

ocorram respectivamente k1, k2, …, km vezes em N tentativas (lembrando que N = k1 +k2 + … + km) é dada por:

em que p1, p2, …, pm são as probabilidades dos eventos mencionados em apenas umatentativa.

4.6 DISTRIBUIÇÃO GEOMÉTRICA

Em k tentativas, a probabilidade de que na k-ésima tentativa obtenha-se o primeirosucesso (com p sendo a probabilidade de sucesso em cada tentativa) é descrita peladistribuição geométrica, que é dada por:

A média da distribuição é dada por . A variância é .

4.7 DISTRIBUIÇÃO EXPONENCIAL

É uma distribuição contínua de probabilidade. Pode ser feita uma analogia entre adistribuição geométrica (discreta) e a distribuição exponencial. A função de densidade deprobabilidade da distribuição exponencial é dada por:

em que l é o parâmetro da distribuição. A função de distribuição acumulada é dada por:

A média para esta distribuição é dada por . A variância é .

4.8 DISTRIBUIÇÃO DE PASCAL (BINOMIAL NEGATIVA)

Enquanto a distribuição binomial nos ajuda a calcular a probabilidade associada aonúmero k de sucessos obtidos em N tentativas (N predeterminado no problema), adistribuição binomial negativa vai ser útil para calcularmos a probabilidade associada aonúmero N de tentativas para um número k de sucessos (k predeterminado no problema),mas sendo que a última tentativa tenha como resultado um sucesso.

Em outras palavras, seja a variável aleatória X associada ao número de sucessos kobtidos em N tentativas independentes. A probabilidade de que haja um total de Nlançamentos com um número k de sucessos (incluindo o sucesso obtido na últimatentativa) é dado por:

Como em outros casos, p é a probabilidade de sucesso em uma única tentativa.As distribuições de Pascal e Polya são casos especiais da distribuição binomial

negativa.

4.9 DISTRIBUIÇÃO NORMAL

A distribuição normal também é chamada de gaussiana. É uma distribuição contínua e afunção densidade de probabilidade é dada por:

No entanto, a integração necessária para determinarmos FX(x) não pode ser feitaanaliticamente. Assim, os valores necessários para os cálculos de probabilidadesenvolvendo variáveis aleatórias com distribuição normal são tabelados, dado que taisvalores são obtidos por meio de integrações numéricas.

O teorema do limite central afirma que, em determinadas condições, se somarmosquaisquer variáveis aleatórias independentes, a soma pode ser aproximada a umavariável aleatória com distribuição aproximadamente normal.

A média de uma variável aleatória com distribuição normal é E(X) = m e avariância é Var(X) = σ2.

Distribuição normal padrão

Considerando-se uma variável aleatória X com distribuição normal, pode-se calcular avariável reduzida ou escore z correspondente ao valor específico x da variável aleatória,cuja utilidade prática será observada na solução de diversos problemas, de modo que:

No caso da normal padrão é importante notar que:

a) há simetria em torno de z = 0 (ou seja, no caso em que x = m). A área sob a curvaà direita do eixo de simetria é igual a área sob a curva à sua esquerda, e ambas sãoiguais a 0,5.

b) a área total abaixo da curva é 1.c) os cálculos de probabilidades serão feitos a partir da tabela, de acordo com os

valores calculados de z.

4.10 QUESTÕES RESOLVIDAS

1. (Esaf/TCE-ES – Economista/2001) Lança-se uma moeda honesta até queocorram exatamente duas caras. Suponha que os lançamentos sejamindependentes. Assinale a opção que corresponde à probabilidade de que sejamnecessários exatamente 4 lançamentos.

a) 1/4;b) 1/16;c) 3/16;d) 1/8;e) 5/16.

Solução:Nesta questão, está sendo pedido para calcularmos a probabilidade associada ao

número N de tentativas necessárias para um número k de sucessos (k predeterminado noproblema), de modo que, pelos dados do problema, N = 4 e k = 2. Utilizaremos:

pois se trata da distribuição binomial negativa, sabendo que p = 1/2 (lançamento deuma moeda honesta). Substituindo os valores na equação supra obtém-se:

que resulta em:

Gabarito: letra C.

2. (FCC/ANS – Analista/2007) Sabe-se que 3/5 dos pacientes submetidos a umadeterminada cirurgia sobrevivem. Se 4 pacientes realizarem a cirurgia, aprobabilidade de que pelo menos um não sobreviva é de:

a) 609/625;b) 544/625;c) 96/625;d) 24/625;e) 16/625.

Solução:Trata-se de uma questão que pode ser solucionada pela Distribuição Binomial em

vez de probabilidade simples, pois se trata de probabilidades para eventos repetidos,relacionados não com um único, mas com quatro pacientes, todos com a mesmaprobabilidade, conforme descrito anteriormente.

Como está sendo pedida a probabilidade de que pelo menos um não sobreviva,vamos considerar a probabilidade p como sendo a probabilidade de morte de um

paciente e a probabilidade de sobrevivência .Com base no cálculo de probabilidades para a distribuição binomial:

se estivesse sendo pedida a probabilidade de que, em quatro operações (N = 4), apenasum paciente pudesse morrer (X = 1), calcularíamos:

Se estivesse sendo pedida a probabilidade de que, em quatro operações, exatamentedois pacientes (X = 2) pudessem vir a morrer, calcularíamos:

No caso de três pacientes, teríamos:

E para o caso da morte dos quatro pacientes,

No entanto, está sendo pedida a probabilidade de que pelo menos um venha afalecer. Devemos considerar então, que apenas um paciente morra ou dois pacientesmorram ou três pacientes morram ou quatro pacientes morram. Assim, a probabilidadeque está sendo pedida é . Como taiseventos são mutuamente exclusivos, então:

que resulta em:

Gabarito: letra B.

3. (Esaf/Susep – Analista/2001) Uma firma classifica suas contas a receber em trêstipos A, B e C. Tem-se informação de que 50% das contas a receber são do tipoA, 20% são do tipo B e 30% do tipo C. Para fins de avaliação, toma-se umaamostra ao acaso de 5 dessas contas. Suponha que o processo amostral não

altere as proporções existentes de contas dos tipos A, B e C de modosignificante. Assinale a opção que corresponde à probabilidade de que, naamostra de 5, 2 (duas) das contas sejam do tipo A, 1 (uma) do tipo B e 2 (duas)do tipo C.

a) 15/17;b) 23/221;c) 4/15;d) 3/7;e) 27/200.

Solução:Este problema será resolvido com a distribuição polinomial, de modo que:

em que k1 = 2, k2 = 1 e k3 = 2 (números referentes à obtenção de cada tipo de conta); p1

= 1/2, p2 = 1/5 e p3 = 3/10 (equivalentes aos valores 50%, 20% e 30% dados noproblema); e N = 5. Substituindo, segue que:

que resulta em:

Gabarito: letra E.

4. (Esaf/Auditor-Fiscal – Previdência Social/2002) Sabe-se que a variável aleatóriaX tem distribuição de probabilidades uniforme no intervalo (a, b) com 0 < a <b. Assinale a opção correta.

a) O coeficiente de variação de X é

b) O coeficiente de variação de X é

c) O coeficiente de variação de X é

d) O coeficiente de variação de X é

e) O coeficiente de variação de X é

Solução:

O coeficiente de variação CV é dado por .No caso da distribuição uniforme, o desvio padrão SX é dado por

e a média é . Substituindo na expressão para o CV,obtemos:

o que resulta em:

Gabarito: letra A.

5. (Esaf/Auditor-Fiscal – Previdência Social/2002) O atributo X tem distribuiçãonormal com média 2 e variância 4. Assinale a opção que dá o valor do terceiroquartil de X, sabendo-se que o terceiro quartil da normal padrão é 0,6745.

a) 3,3490;

b) 0,6745;c) 2,6745;d) 2,3373;e) 2,7500.

Solução:Nesta questão, o que está sendo pedido é o valor da variável aleatória X

correspondente ao terceiro quartil levando em conta a distribuição normal padrão. Paraisso utilizaremos

Pelo enunciado, z = 0,6745, μ = 2 e σ = 2 já que σ2 = 4. Logo:

que resulta em x = 3,3490.

Gabarito: letra A.

6. (Esag/TJ-MA – Analista Judiciário/2005) Com base em concursos anterioresobservou-se que o tempo para concluir a prova é normalmente distribuído commédia igual a 80 minutos com desvio padrão de 14,93 minutos.Um novoconcurso será realizado com o mesmo nível de complexidade, admitindo-se umarepetição do padrão anterior.Se o novo concurso envolve 2.000 candidatos, otempo máximo a ser estipulado para a prova, de tal forma que até 1.500candidatos possam concluí-la, é:

a) 90 minutos;b) 100 minutos;c) 84 minutos;d) 95 minutos.

Solução:Para o tempo procurado, a porcentagem referente aos candidatos que terminarão a

prova será de 1500/2000 = 75%.Sabe-se que a área à esquerda da curva normal corresponde a 0,5. Isto quer dizer

que metade dos candidatos termina antes de 80 minutos. Assim, devemos procurar natabela de áreas da distribuição Normal Padrão (Apêndice I) qual a variável reduzida zcorrespondente a uma área de 75% – 50% = 0,25. O valor correspondente a 0,24857,considerado uma aproximação razoável, encontra-se na linha 0,6 e coluna 7, o que nosdá z = 0,67.

Assim, o tempo máximo será t15% = X + zs, onde X é a média dada e s é o desviopadrão dado. Isto resulta em t15% = 80 + (0,67 × 14,93), ⇒ t15% ≅ 90 minutos.

Gabarito: letra A.

4.11 QUESTÕES PROPOSTAS

1. (Esag/TJ-MA – Analista Judiciário/2005) Um grupo de 800 soldados apresenta amassa normalmente distribuída com média igual a 70 kg e desvio padrão iguala 5 kg. Um destacamento especial foi formado com soldados que tinham massaentre 75 e 80 kg. Considerando-se as propriedades do desvio padrão paradistribuições normais, o destacamento especial foi formado por:

a) 273 soldados;b) 109 soldados;c) 17 soldados;d) 126 soldados.

2. (Esaf/Auditor-Fiscal – Previdência Social/2002) O atributo X tem distribuiçãonormal com média 2 e variância 4. Assinale a opção que dá o valor do terceiroquartil de X, sabendo que o terceiro quartil da normal padrão é 0,6745.

a) 3,3490;b) 0,6745;c) 2,6745;d) 2,3373;e) 2,7500.

3. (Esaf/Susep – Analista Técnico/2002) Uma lâmpada tem duração em horas (X)que obedece à lei probabilística definida pela função densidade deprobabilidades:

Assinale a opção que dá o desvio padrão da distribuição de X.

a) 32 horas;b) 500 horas;

c) 900 horas;d) 800 horas;e) 1.000 horas.

4. (Esaf/Susep – Analista/2001) A variável aleatória X tem distribuição normalcom média 2 e variância 4. Seja a o primeiro quartil da distribuição normalpadrão. Assinale a opção que corresponde ao primeiro quartil da distribuiçãode X.

a) 2 + 2,00a;b) 2 + 0,25a;c) 2 + 0,75a;d) 2 + 4,00a;e) 2 + 1,25a.

5. (Esaf/CVM – Plan. Ex. Fin./2000) Acredita-se que o preço de um bem (X) emreais tenha distribuição populacional uniforme no intervalo aberto (1; 7).Assinale a opção que corresponde à probabilidade de se observar na populaçãoum valor de X de pelo menos 3 reais e de no máximo 5 reais.

a) 2/7;b) 1/3;c) 5/6;d) 1/2;e) 3/4.

6. (FCC/Bacen – Analista/2005) As empresas de um determinado setor têm umasituação líquida descrita por uma distribuição normal, com média igual a 2,5milhões de reais e desvio padrão de 2 milhões de reais. Selecionando umaempresa aleatoriamente deste setor, a probabilidade de ela apresentar umasituação líquida negativa ou nula é de:

a) 50%;b) 39%;c) 23%;

d) 16%;e) 11%.

Para responder a questão de número 7, a seguir, utilize, dentre as informaçõesabaixo, as que julgar adequadas.Se Z tem distribuição normal padrão, então:P(0< Z < 1) = 0,341; P(0 < Z < 1,6) = 0,445; P(0 < Z < 2) = 0,477.

7. (FCC/ISS-SP – Auditor-fiscal/2006) Os depósitos efetuados no banco B, numdeterminado mês, têm distribuição normal com média R$ 9.000,00 e desviopadrão R$ 1.500,00. Um depósito é selecionado ao acaso dentre todos osreferentes ao mês em questão. A probabilidade de que o depósito exceda R$6.000,00 é de:

a) 97,7%;b) 94,5%;c) 68,2%;d) 47,7%;e) 34,1%.

8. (FCC/Bacen – Analista/2005) A probabilidade de um associado de um clubepagar sua mensalidade com atraso é de 5%. Entre 5 associados escolhidosaleatoriamente, a probabilidade de pelo menos um pagar sua mensalidade sematraso é:

a) 5 ⋅ (0,95)5;b) 1 – (0,05)5;c) 1 – (0,95)5;d) (0,95)5;e) 4,75 ⋅ (0,95)5.

9. (FCC/Câmara dos Deputados – Analista/2007) Sabe-se que existem inúmerosfornecedores de um material X. Porém, somente 60% deles estão aptos aparticipar de uma licitação para fornecimento do material X para o setorpúblico. Então, a probabilidade de que, numa amostra aleatória simples de 3destes fornecedores, pelo menos um esteja apto a participar de uma licitação

para fornecimento do material X para o setor público é:

a) 60,0%;b) 78,4%;c) 80,4%;d) 90,4%;e) 93,6%.

10. (FCC/Câmara dos Deputados – Analista/2007) Os preços de um equipamentono mercado têm uma distribuição normal com um valor médio igual a R$1.500,00. Verificou-se que 20% dos preços deste equipamento são inferiores aR$ 1.290,00. Utilizando os valores das probabilidades P(Z ≤ z) para adistribuição normal padrão:

z P(Z ≤ z)

0,25 0,60

0,52 0,70

0,67 0,75

0,84 0,80

1,30 0,90

Tem-se que o valor do equipamento em que apenas 10% são superiores a ele éigual a:

a) R$ 1.825,00;b) R$ 1.805,00;c) R$ 1.710,00;d) R$ 1.695,00;e) R$ 1.650,00.

Gabarito:

1. B2. A3. E

4. A5. B6. E7. A8. B9. E10. A

Capítulo 5

Inferência Estatística

5.1. ESTIMAÇÃO

Realizamos estimativas estatísticas quando inferimos parâmetros populacionais combase em estatísticas de amostras retiradas da população em questão.

Estimativa por Pontos e Estimativa por Intervalos

Faz-se estimativa por pontos quando estima-se com base em apenas um número. JÁ com aestimativa por intervalos, consideram-se dois números, indicando-se a precisão de quedeterminado valor esteja compreendido naquele intervalo.

Distribuição Amostral das Médias

Seja uma população de tamanho N, média μ e desvio padrão σ. É possível selecionartodas as amostras de tamanho n, e calcular todas as médias referentes a estas amostras,obtendo a distribuição amostral das médias, que vai possuir média μ e desvio padrão σ .Dois aspectos importantes devem ser levados em conta com relação à distribuiçãoamostral das médias:

1) A média e o desvio padrão da distribuição amostral das médias serão dados por:

, para populações consideradas finitas (n ≥ 5% de N), e

, para populações consideradas infinitas (n < 5% de N).2) Segundo o Teorema do Limite-Central, conforme o tamanho das amostras cresce (n →

∞), a distribuição amostral das médias tende a uma distribuição normal,independente da forma da distribuição da população. Tal aproximação é consideradasuficientemente boa para N ≥ 30.

Levando estes dois pontos em consideração, pode-se calcular a probabilidade de queuma dada média de uma amostra pertença a um dado intervalo. Em outras palavras,estaremos fazendo uma estimativa por intervalos para a média populacional. Para isto,utilizaremos o escore z mencionado no capítulo anterior:

juntamente com a tabela de probabilidades para a distribuição normal. Taisprocedimentos serão vistos no próximo item.

5.1.1 Estimativa do Intervalo de Confiança da MÉdia Populacional

Com relação à distribuição amostral das médias, sendo a média μ e desvio padrão σ ,pode-se esperar que encontre-se a média μ em certos intervalos com uma dadaprobabilidade, dado que a referida distribuição é normal. Os limites de confiança podemser representados por:

em que zc é o valor crítico ou coeficiente de confiança. Na resolução das questões, será

muito comum utilizarmos as relações (para populações finitas) e (parapopulações infinitas).

Em suma, dizer que uma estimativa para uma média populacional se encontra em umintervalo de confiança com uma probabilidade de p (95%, 90% etc.) significa dizer quese está p (95%, 90% etc.) confiante de que a média verdadeira (populacional) estejanaquele intervalo.

A tabela abaixo mostra as probabilidades para alguns intervalos de confiança.

Intervalo zc Limite de confiança

1 68,27%

1,96 95%

2 95,45%

2,58 99%

3 99,73%

5.1.2 Intervalo de Confiança das Proporções

Seja uma distribuição binomial, em que P é a proporção de sucessos em uma amostra detamanho n. Quando n > 30 e np > 5 e n(1 – p) > 5, a distribuição binomial seaproxima da distribuição normal. Sendo assim, a exemplo do cálculo de intervalos deconfiança para médias populacionais, podem-se estimar intervalos de confiança paratais proporções usando-se:

5.2. TESTE DE HIPÓTESES

Testes de hipóteses são realizados quando desejamos determinar se alguma hipótese, emgeral referente a algum parâmetro populacional, deve ser ou não rejeitada.

5.2.1 Tipos de Erro

Erro Tipo I

Em um erro do Tipo I, uma hipótese é rejeitada quando deveria ser aceita.

Erro Tipo II

Em um erro do Tipo II, uma hipótese é aceita quando deveria ser rejeitada.

5.2.2 Testes de Hipótese da Média Populacional

Hipótese Nulas e Hipóteses Alternativas

Para realizar testes de hipóteses com relação à média populacional, deve-se estabelecera hipótese nula, denotada por . As hipóteses alternativas, dependendo do queestá sendo pedido, serão

Nível de Significância

O nível de significância α do teste é o valor que ajudará a definir as regiões de aceitaçãoe rejeição do teste. Em geral, α é 5% ou 1% e corresponde à probabilidade de se cometerum erro do tipo I, ou seja, acabar rejeitando uma hipótese quando a mesma deveria tersido aceita.

Nível de Confiança

O nível de confiança do teste é 1 – α. Obviamente, nos casos em que o nível designificância é α = 5%, o nível de confiança é 95%. Para α = 1%, o nível de confiançaé 99%.

Procedimento de Cálculo nos Testes de Hipóteses para Médias Populacionais

Vale lembrar que usa-se a distribuição normal nos problemas em que o desvio padrão dapopulação σ é conhecido. Assim, dada a amostra de tamanho n e desvio padrão s, emédia amostral , calcula-se o escore z para o teste, segundo:

mas como , então tem-se que:

Compara-se então o valor do teste calculado z com o valor de zα referente ao nível designificância do teste.

O teste será bilateral (quando H1: μ ≠ μ0), unilateral à esquerda (quando H1: μ < μ0),ou unilateral à direita (quando H1: μ > μ0).

5.3. ANÁLISE DE VARIÂNCIA

Quando deseja-se testar a hipótese nula de que duas ou mais populações são iguaiscontra a hipótese alternativa de que pelo menos uma das médias é diferente, usa-se aAnálise de Variância. A aplicação da Análise de Variância a Regressões Estatísticas, emparticular a Análise de Variância para o Modelo Linear Simples, será vista no Capítulo7.

Para a Análise de Variância, considera-se que as populações são distribuídasnormalmente e independentemente, e de igual variância.

Abaixo, damos um exemplo para a Análise de Variância para teste de Média entre 3populações.

Exemplo: Uma empresa vende detergente em três embalagens pelo mesmo preço. Atabela abaixo representa as vendas por 4 meses, com os dados de venda distribuídosnormalmente e independentemente, com igual variância.

Vendas de Detergente Correspondentes a 4 Meses (em milunidades)

Embalagem 1Embalagem

2Embalagem

3

9 10 12

6 11 10

5 9 8

13 8 7

Soma = 33 Soma =38

Soma =37

No nível de significância de 5%, deseja-se testar a hipótese nula de que as médias sãoiguais (H0: μ1 = μ2 = μ3) contra a hipótese alternativa de que pelo menos uma dasmédias é diferente (H1: μ1, μ2 e μ3 não são iguais).

Solução:

O Quadro de Análise de Variância é indicado a seguir.

Em que:

ℓ é o número de linhas (ou número de observações por amostra), e, nesse caso, ℓ = 4;

c é o número de colunas (ou número de amostras), e, nesse caso, c = 3;

é a “grande média”, ou seja, a média entre as médias de cada amostra.Representando j como a média das observações da amostra (ou coluna) j, temos 1 =

33/4 = 8,25; 2 = 38/4 = 9,5 e 3 = 37/4 = 9,25. Assim, .

Agora, podemos fazer os cálculos.

(1) Cálculo de SQE:SQE = 4.[(8,25 – 9)2 + (9,5 – 9)2 + (9,25 – 9)2] ⇒ SQE = 3,5(2) Cálculo de SQR:SQR = (9 – 8,25)2 + (6 – 8,25)2 + (5 – 8,25)2 + (13 – 8,25)2 ++

(10 – 9,5)2 + (11 – 9,5)2 + (9 – 9,5)2 + (8 – 9,5)2 ++ (12 – 9,25)2 + (10 – 9,25)2 +(8 – 9,25)2 + (7 – 9,25)2 ⇒ SQR = 58,5

(3) Cálculo de SQT:Simplesmente SQT = SQE + SQR = 3,5 + 58,5 = 62.No entanto, oseguinte cálculo, que pode ser feito como exercício, fornece o mesmo resultado:SQT =(9 – 9)2 + (6 – 9)2 + (5 – 9)2 + (13 – 9)2 ++ (10 – 9)2 + (11 – 9)2 + (9 – 9)2 + (8– 9)2 ++ (12 – 9)2 + (10 – 9)2 + (8 – 9)2 + (7 – 9)2 ⇒ SQT = 62Obtemos o quadroa seguir com a substituição dos valores no Quadro de Análise de Variância.

De posse do valor da estatística F ≅ 0,26923, consulta-se a tabela da distribuição F noapêndice 4, referente ao nível de significância de 0,05. Como o valor tabelado de F para2 e 9 graus de liberdade neste caso é de 4,26, então podemos considerar que as médiassão iguais.

5.4. QUESTÕES RESOLVIDAS

1. (Esaf/Previdência Social – Auditor-Fiscal/2002) Tem-se uma população normalcom média μ e variância 225. Deseja-se construir, a partir de uma amostra detamanho n desta população, um intervalo de confiança para μ com amplitude 5e confiança de 95%. Assinale a opção que corresponde ao valor de n. Use comoaproximadamente 2 o quantil de ordem 97,5% da distribuição normal padrão.

a) 225;b) 450;c) 500;d) 144;e) 200.

Solução:

Deseja-se calcular n. A amplitude A do intervalo de confiança [ – e, + e], em que

é a diferença entre os limites superior e inferior. Logo A = ( + e) – ( – e) ⇒

A = 2e, de modo que e neste caso,

A manipulação algébrica de

Os valores zc e σ podem ser inferidos a partir do enunciado do problema, comomostrado a seguir.

Para o intervalo de confiança 95%, existe a probabilidade de 5% de encontrarmos ovalor da média populacional fora desse intervalo (2,5% para cada lado da curva normalpadrão). Portanto, o quantil 97,5% marca exatamente (para o lado direito da normal) ovalor de z que será utilizado, já que 100% – 97,5% = 2,5%. Logo zc = 2, de acordo coma aproximação pedida.

Como a variância é σ2 = 225, logo σ = 15. Substituindo zc = 2 e σ = 15 em

Obtemos:

que resulta em n = 144.

Gabarito: letra D.

2. (Esaf/Susep – Analista/2002) Uma variável aleatória X tem distribuição normalcom média desconhecida e variância 1. Assinale a opção que dá a amplitude domenor intervalo de confiança para μ, no nível de 96%, para uma amostra de Xde tamanho 16. Use no cálculo a tabela da função de distribuição da normalpadrão apresentada.

x F(x)

0,0 0,50

0,5 0,69

1,0 0,84

1,5 0,93

2,0 0,98

a) 4,0;b) 1,0;c) 2,2;d) 3,2;e) 5,0.

Solução:

Conforme visto no problema anterior, temos que a Amplitude é A = 2e, logo sedeterminarmos o valor de e, imediatamente teremos a Amplitude pedida no problema.

O intervalo de confiança é do tipo [ – e; + e], em que

Para o intervalo de confiança 96%, existe a probabilidade de 4% de encontrarmos ovalor da média populacional fora desse intervalo (2% para cada lado da curva normal

padrão). Portanto, o quantil 98% (ou 0,98) marca exatamente (para o lado direito danormal) o valor de z que será utilizado, já que 100% – 98% = 2%. Logo zc = 2, deacordo com a última linha da tabela.

Como a variância é σ2 = 1, logo σ = 1. Substituindo zc = 2, σ = 1 e n = 16 em

Obtemos:

Como A = 2e, temos que A = 1.

Gabarito: letra B.

3. (FCC/Bacen – Analista/2005) Os preços de um determinado produto vendido nomercado têm uma distribuição normal com desvio padrão populacional de R$20,00. Por meio de pesquisa realizada com uma amostra aleatória de tamanho100 com um determinado nível de confiança, apurou-se, para a média destespreços, um intervalo de confiança sendo [R$ 61,08; R$ 68,92]. A mesma médiaamostral foi obtida quadruplicando o tamanho da amostra anterior eutilizando o mesmo nível de confiança. Nos dois casos considerou-se infinito otamanho da população. O novo intervalo de confiança encontrado no segundocaso foi:

a) [R$ 61,20; R$ 68,80];b) [R$ 61,33; R$ 68,67];c) [R$ 61,57; R$ 68,43];d) [R$ 62,06; R$ 67,94];e) [R$ 63,04; R$ 66,96].

Solução:

Seja o primeiro caso, com uma amostra aleatória de tamanho n1 = 100. Do intervalode confiança [R$ 61,08; R$ 68,92] podemos calcular a média amostral para este caso.Assim,

Vamos agora calcular o valor da variável reduzida (escore) z, que será usada em

ambos os casos. O intervalo de confiança para a média é do tipo ,

e neste caso (ou seja, o limite superior do intervalo menosa média amostral). Podemos calcular zc, pois

e sabemos que σ = 20 e n1 = 100, de modo que:

De posse do valor de zc e considerando agora o 2o caso, em que quadruplicou-se o

tamanho da amostra (n2 = 400), deseja-se calcular sabendo-se que σ = 20.Assim,

Os limites de confiança serão dados por ± e2 = 65,00 ± 1,96, o que resulta nointervalo [R$ 63,04; R$ 66,96].

Gabarito: letra E.

4. (Esaf/Previdência Social – Auditor-Fiscal/2002) Em um esquema de amostragemaleatória simples deseja-se determinar o tamanho da amostra que permiteestimar a média de um atributo X com erro absoluto não superior a 2 unidadescom probabilidade 95%. Como informação preliminar espera-se que X seja

aproximadamente uniformemente distribuído com amplitude populacional decerca de 100 unidades. Considerando como aproximadamente zero a taxa n/N etomando como 2 o quantil de ordem 97,5% da normal padrão, assinale a opçãoque dá o valor de n.

a) 431;b) 133;c) 400;d) 830;e) 1.000.

Solução:

O intervalo de confiança para a estimativa da média é do tipo [ – e; + e], em que

e é o erro absoluto dado por Manipulando algebricamente esta expressão, aoisolarmos n obtemos:

Pelo enunciado do problema o valor do escore crítico é zc = 2, pois este correspondeao quantil 97,5% da norma padrão (já que se pede 95% de probabilidade, devemosrecordar que esse valor equivale a 47,5% para cada lado do eixo de simetria, levando ovalor pedido a coincidir com o dado zc = 2 referente aos 97,5%).

O valor do erro, também dado, é e = 2.

Para determinarmos σ, devemos lembrar que está sendo pedido que a distribuição de Xseja aproximadamente uniforme, logo o desvio padrão será dado por:

Substituindo a amplitude populacional no valor de 100 unidades, obtém-se:

Finalmente, substituindo os valores para e, zc e σ na expressão para n, obtemos:

que resulta em n ≅ 830.

Gabarito: letra D.

5. (FCC/Bacen – Analista/2005) Uma amostra aleatória de 100 valores de aluguéisem uma cidade forneceu um valor médio de R$ 600,00. O desvio padrão dapopulação, considerada normal e de tamanho infinito, é de R$ 250,00. Deseja-se saber se o valor médio encontrado na amostra é superior ao valor de R$550,00, que se supõe ser a média verdadeira, no nível de significância α. Seja Zα

o escore da curva normal padrão tal que P(Z > Zα) = α, H0 a hipótese nula doteste (μ = 550) e H1 a hipótese alternativa (μ > 550). Sabendo-se que H0 foirejeitada, tem-se que:

a) a um nível de significância β, β > α, H0 não teria sido rejeitada;b) o valor do escore reduzido referente ao valor médio encontrado para a amostra e

necessário para comparação com Zα é igual a 0,2;c) Zα > 2;d) Zα < 2;e) para qualquer nível de significância, H0 seria rejeitada, pois 600 > 550.

Solução:

A estatística Z é calculada para este teste como , o que resulta em

. Ora, se a hipótese foi rejeitada, quer dizer que o valor Z é maiordo que Zα. Assim, Zα < 2.

Gabarito: letra D.

5.5. QUESTÕES PROPOSTAS

1. (Esag/TJ-MA – Analista Judiciário/2005) Para determinação do tamanho daamostra o modelo estatístico deve considerar os seguintes elementos:

– Tamanho da população (se for possível).– Margem de erro desejada.– Probabilidade de que o erro especificado não seja ultrapassado.– Grau de homogeneidade da população (medido pela variância).

Esta questão está associada à forma pela qual esses elementos contribuem paradeterminação de um maior ou menor tamanho da amostra.Analise as seguintesassociações:

I. Quanto menor a margem de erro desejada, maior será o tamanho da amostra.II. Quanto maior a probabilidade, menor será o tamanho da amostra.III. Quanto mais heterogênea for a população, maior será o tamanho da

amostra.IV. Quanto maior a margem de erro, maior será o tamanho da amostra.

Estão corretas as associações:

a) I e III;b) I e II;c) II e III;d) III e IV.

2. (Esaf/Auditor-Fiscal – Previdência Social/2002) A média e o desvio padrãoobtidos num lote de produção de 100 peças mecânicas são respectivamente,16kg e 40g. Uma peça particular do lote pesa 18kg. Assinale a opção que dá ovalor padronizado do peso dessa bola.

a) -50;b) 0,05;c) 50;d) -0,05;

3. (Esag/TJ-MA – Analista Judiciário/2005) O tempo de montagem de umequipamento apresenta uma distribuição normal com média igual a 30 minutos

e desvio padrão igual a 5 minutos.Novas linhas de produção foram idealizadaspara reduzir o tempo de montagem.A montagem de 36 novos equipamentos emcada uma das duas novas linhas de produção apresenta os seguintes resultados:

LINHA DE PRODUÇÃOMÉDIA (MIN)

1 28,5

2 27

Por meio dos Testes Unilaterais de Médias, com nível de significância de 2,5%,constata-se que:

a) a linha 1 tende a aumentar o tempo de montagem;b) as duas novas linhas de produção tendem a reduzir o tempo de montagem;c) nenhuma das duas linhas tendem a reduzir o tempo de montagem;d) apenas a linha 2 tende a reduzir o tempo de montagem.

4. (FCC/Bacen – Analista/2005) A distribuição dos valores dos aluguéis em umacerta localidade é bem representada por uma curva normal com desvio padrãopopulacional de R$ 200,00. Por meio de uma amostra aleatória de 100 imóveisneste local, determinou-se um intervalo de confiança para a média destesvalores, com um determinado nível de confiança, como sendo [R$ 540,00; R$660,00].A mesma média amostral foi obtida com um outro tamanho deamostra, com o mesmo nível de confiança anterior, sendo o novo intervalo [R$560,00; R$ 640,00].Nos dois casos considerou-se infinito o tamanho dapopulação. O tamanho da amostra considerada no segundo caso foi de:

a) 225;b) 256;c) 324;d) 400;e) 625.

5. (FCC/Metro-SP – Analista/2008) O custo mensal de manutenção C de umaparelho é uma variável aleatória normalmente distribuída com variânciapopulacional igual a 900 (R$)2. Para testar a hipótese nula H 0 : μ = R$ 175,00contra a alternativa H 1 : μ ≠ R$ 175,00 será usada uma amostra de 36aparelhos (μ é a média da população). Fixando-se o nível de significância (α)

em 5%, considerando a população de tamanho infinito e sabendo que nadistribuição normal padrão (Z) a probabilidade P(Z > 2) = 2,5%, rejeita-se H 0

caso a média da amostra seja:

a) inferior a R$ 167,00;b) superior a R$ 167,00 e inferior a R$ 187,00;c) igual a R$ 184,00;d) superior a R$ 115,00 e inferior a R$ 235,00;e) inferior a R$ 165,00 ou superior a R$ 185,00.

6. (FCC/ICMS-SP – Fiscal/2006) Seja X uma variável aleatória representando ovalor arrecadado de um determinado tributo. Suponha que X tem distribuiçãonormal (população de tamanho infinito) com média μ e desvio-padrão de 500reais. Desejando-se testar:H0 : μ = 1.000 reais (hipótese nula) H1 : μ ≠ 1.000reais (hipótese alternativa),tomou-se uma amostra aleatória de 400 valores deX, obtendo-se para a média amostral o valor de 1.060 reais. Seja α o nível designificância do teste e suponha que a região de rejeição de H0 é {|Z| > Zα/2},em que Zα/2 representa o escore da curva normal padrão tal que P(|Z| > Zα/2)= α. Tem-se que:

a) Se H0 foi rejeitada, existe um nível de significância β (β > α) tal que H0 não seriarejeitada.

b) Para qualquer nível de significância α, H0 será rejeitada, uma vez que 1.060 ≠1.000.

c) H0 não será rejeitada para Zα/2 < 3.d) H0 será rejeitada para Zα/2 = 2.e) Para Zα/2 > 2, H0 não será rejeitada.

7. (FCC/TRF/2 – Analista/2007) Uma variável aleatória X tem distribuição normalcom média μ e variância σ2. Desejando-se fazer um teste de hipóteses para amédia de X do tipo:H0 : μ = 150 (σ2 = 100) contra Ha: μ = 140 (σ2 = 225),combase numa amostra de 100 observações, a região crítica apropriada ao teste,dada em termos da média amostral X, para que a probabilidade de se cometererro do tipo I seja igual à de se cometer erro do tipo II, é dada por:

a) { X ∈ R | X ≤ 146};b) { X ∈ R | X ≤ 144,5};

c) { X ∈ R | X ≤ 143,5};d) { X ∈ R | X ≤ 142,8};e) { X ∈ R | X ≤ 142,5}.

8. (FCC/MPU – Analista/2007) Uma nova marca de lâmpada está sendo estudada.Baseado em estudos anteriores com outras marcas similares, pode-se admitirque a vida média segue uma distribuição Normal com desvio padrão de 8 meses.Tendo como base estes resultados, o tamanho deamostra necessário para que aamplitude do intervalo de 95% de confiança (utilize a aproximação: P(-2 < Z <2) = 0,95, em que Z é a Normal Padrão) para a vida média seja de 4 meses é de:

a) 8;b) 12;c) 16;d) 64;e) 128.

9. (FCC/TRF/2 – Analista/2008) Em uma cidade, considerada com uma populaçãode tamanho infinito, é feito um estudo objetivando detectar a proporção dehabitantes que preferem a marca do sabonete X. Uma amostra piloto forneceuum valor de 20% para essa proporção. Deseja-se obter um intervalo deconfiança de 95% para a proporção, tendo o intervalo uma amplitude de 10%.Se a distribuição amostral da frequência relativa dos habitantes que preferem amarca do sabonete X é normal e utilizando a informação da distribuiçãonormal padrão (Z) que a probabilidade P(|Z| ≤ 2) = 95%, tem-se que otamanho da amostra deve ser de:

a) 400; d) 289;b) 361; e) 256.c) 324;

10. (FCC/TRF/2 – Analista/2008) A vida das lâmpadas fabricadas por uma empresaapresenta uma distribuição normal com uma variância populacional igual a400 (horas) 2. Extrai-se uma amostra de 64 lâmpadas e verifica-se que arespectiva vida média é igual a 1.200 horas. Considerando a população detamanho infinito e a informação da distribuição normal padrão (Z) que aprobabilidade P(Z > 2) = 2,5%, tem-se que o intervalo de confiança de 95%

para a vida média das lâmpadas é:

a) [1.160, 1.240];b) [1.164, 1.236];c) [1.180, 1.220];d) [1.184, 1.216];e) [1.195, 1.205].

Gabarito:

1. A2. C3. D4. A5. E6. D7. A8. D9. E10. E

Capítulo 6

Teoria das Pequenas Amostras – “t” deStudent e Qui Quadrado

6.1. DISTRIBUIÇÃO T DE STUDENT

6.1.1 Intervalo de Confiança das Médias utilizando a distribuição t deStudent

A distribuição t pode ser usada em substituição à distribuição normal para determinarintervalos de confiança de médias populacionais. Isso se aplica aos casos em que temosuma amostra de tamanho n < 30 e o desvio padrão populacional é desconhecido. Aestimativa do intervalo será dada por:

em que s é o desvio padrão da amostra e t é obtido pela tabela do apêndice 2. Paraobter t, deve-se ter a porcentagem referente ao intervalo de confiança e o número degraus de liberdade (gl), sendo gl = n – 1.

6.1.2 Teste de Hipóteses da Média Populacional utilizando adistribuição t de Student

A distribuição t de Student será usada para teste de hipóteses quando o valor do desviopadrão populacional não for conhecido. A amostra, em geral, possuirá n < 30. Serácalculada, então a estatística t, dada por:

em que s é o desvio padrão amostral.

A exemplo do teste de hipóteses que utiliza a distribuição normal, compara-se o valordo teste calculado t com o valor de tα referente ao nível de significância do teste. Onúmero de graus de liberdade é gl = n – 1.

O teste será bilateral (quando H1: μ ≠ μ0), unilateral à esquerda (quando H1: μ < μ0),ou unilateral à direita (quando H1: μ > μ0).

6.2. DISTRIBUIÇÃO DE QUI QUADRADO

Em um conjunto de dados em que fo representa as frequências observadas e fe, asfrequências esperadas, a estatística qui quadrado χ2 é dada por:

Utilizamos a distribuição χ2 nos casos abaixo.

(a) Seja um conjunto de dados obtidos com mais de dois resultados possíveis. Utiliza-se adistribuição χ2 para testar se as frequências obtidas são significativamente diferentesdas frequências esperadas.

(b) Se a distribuição estudada se ajusta a uma dada distribuição binomial, normal etc.(c) Dado um teste de tabela de contingência, para verificar se duas variáveis são

independentes.

Nos casos dos itens (a) e (b), sendo c o número de categorias e m o número deparâmetros populacionais estimados, o número de graus de liberdade será dado por gl =c – m – 1.

No caso (c), sendo l o número de linhas da tabela de contingência e c, o número decolunas, o número de graus de liberdade será dado por gl = (l – 1)(c – 1).

Ainda no caso das tabelas de contingência, para cada célula da linha l e da coluna c,deverão ser calculadas as frequências esperadas e estas serão dadas por:

6.3. QUESTÕES RESOLVIDAS

1. (FCC/ANS – Analista/2007) O índice de massa corpórea é calculado dividindo opeso da pessoa pelo quadrado de sua altura. Para a população de homens demeia idade que mais tarde desenvolvem a doença de diabetes, a distribuiçãodos índices básicos de massa corpórea é aproximadamente normal com média μe desvio padrão σ desconhecidos. Para uma amostra de 25 homens selecionadosdesse grupo, observou-se um índice médio = 25,2 kg/m2 com desvio padrão s =2,5 kg/m2. Um intervalo de confiança de 95% para a média μ da população édado por:

a) 25,2 ± 2,15;b) 25,2 ± 1,56;c) 25,2 ± 1,03;d) 25,2 ± 0,86;e) 25,2 ± 0,68.

Solução:

Como o desvio padrão populacional não é conhecido, vamos utilizar a distribuição tpara estimar o intervalo de confiança para a média da população. Os intervalos são do

tipo [ – e; + e], em que, para nosso caso, . O valor de t é tabelado,determinado com o auxílio da tabela do apêndice 2, utilizando a entrada em que gl = 25– 1 = 24 e lembrando que, para um intervalo de confiança de 95% para a média, temos2,5% para cada lado da normal. Assim tem-se t95% = 2,064. Sabendo que n = 25 e ques = 2,5, substituindo tais valores na expressão para e, obtemos:

que resulta em e = 1,032.

Gabarito: letra C.

2. (FCC/Bacen – Analista/2005) Uma amostra aleatória de 9 valores de saláriosextraída de uma população considerada normal e de tamanho infinitoapresentou uma média igual a R$ 800,00 com um desvio padrão igual a R$

120,00. Os registros históricos indicam que a média dos salários da população éigual a R$ 740,00. Deseja-se testar a hipótese no nível de significância α, se ovalor da média verificada na amostra difere do valor de R$ 740,00. Seja H0 ahipótese nula do teste (μ = 740) e H1 a hipótese alternativa (μ ≠ 740) e tα/2 oquantil da distribuição t de Student, no nível de significância α, para testesbilaterais com 8 graus de liberdade. Sabendo-se que H0 foi rejeitada, tem-seque:

a) tα/2 < 1,5;b) tα/2 > 1,5;c) para qualquer nível de significância H0 seria rejeitada, pois (800 – 740) ≠ 0;d) o valor da variável do teste (t calculado) obtido por meio da amostra e necessário

para comparação comtα/2 e tα/2 é igual a 0,5;e) a um nível de significância β, β > α, H0 não teria sido rejeitada.

Solução:

Vamos calcular o valor da estatística t segundo:

Temos então, substituindo = 800, μ = 740, s = 120, e n = 9,

Assim, sabendo que a hipótese nula foi rejeitada, para um teste bilateral nascondições do problema, isso significa que t > tα/2, ou seja 1,5 > tα/2.

Gabarito: letra A.

3. (FCC/TRF/2 – Analista/2008) A tabela a seguir corresponde ao resultado de umconcurso aplicado a 100 pessoas. Foram formados dois grupos (A e B) com 50pessoas cada um. O grupo A recebeu um treinamento para participar doconcurso e o grupo B não.

Deseja-se saber se o resultado do concurso depende do treinamento utilizandoo teste qui quadrado no nível de significância de 5%.

Dados: Valores críticos da distribuição qui quadrado [P (qui quadrado com ngraus de liberdade < valor tabelado) = 1 – α]

Graus de liberdade (1 – a) = 90% (1 – a) = 95%

1 2, 706 3,841

2 4,605 5,991

3 6,251 7,845

4 7,779 9,488

O valor do qui quadrado observado e a respectiva conclusão é:

a) 4,167; existe eficácia na aplicação do treinamento;b) 4,167; não existe eficácia na aplicação do treinamento;c) 3,333; existe eficácia na aplicação do treinamento;d) 3,333; não existe eficácia na aplicação do treinamento;e) 2,500; existe eficácia na aplicação do treinamento.

Solução:

Nesta questão temos um exemplo de uma tabela de contingência em que se procuraverificar a independência ou dependência entre o treinamento dado e a aprovação noconcurso.

Para isto, vamos calcular as frequências esperadas de acordo com a fórmula:

Para a célula da linha 1 e coluna 1, temos

Para a célula da linha 1 e coluna 2, temos

Para a célula da linha 2 e coluna 1, temos

Para a célula da linha 2 e coluna 2, temos

Podemos então montar a tabela de frequências esperadas a seguir:

A estatística χ2 é dada por e o desenvolvimento do somatório ficaentão:

O número de graus de liberdade será dado por gl = (2 – 1) (2 – 1) = 1 e para 95%, ovalor tabelado de χ2 é χ2 tab = 3,841. Como o valor calculado excede o valor tabelado,então é possível dizer que o treinamento apresenta eficácia para a aprovação noconcurso.

Gabarito: letra A.

6.4. QUESTÕES PROPOSTAS

1. (FCC/Metrô-SP – Analista/2008) Um grande fabricante de farinha em umacidade alega que cada pacote produzido pela sua fábrica não contém menos que1 kg de farinha. Uma amostra de 16 pacotes apresentou uma média de 0,9 kg edesvio padrão de 0,1 kg. Supondo que a quantidade de farinha em cada pacotetenha uma distribuição normal com média μ e variância desconhecida, deseja-se saber se o fabricante tem razão a um determinado nível de significância α.Seja H 0 a hipótese nula do teste (μ = 1 kg), H 1 a hipótese alternativa (μ < 1kg) e tα < 0 o quantil da distribuição t de Student, no nível de significância α,para teste unicaudal com 15 graus de liberdade. Sabendo-se que pelo teste t deStudent H 0 foi rejeitada, então:

a) tem-se que H0 seria rejeitada para qualquer nível de significância, pois 0,9 < 1;b) para um nível de significância β, tal que β > α, H0 não seria rejeitada;c) o valor da estatística obtido por meio da amostra para comparação com tα é igual a

– 1;d) o número de graus de liberdade, no caso, não interfere na obtenção de tα;e) o valor de tα é superior a – 4.

2. (FCC/Metrô-SP – Analista/2008) Sejam duas populações normalmentedistribuídas de tamanho infinito e com a mesma variância σ 2 desconhecida.Deseja-se testar, no nível de significância de 5%, que não há diferença entre asmédias das duas populações. Para isso, utilizou-se uma amostra aleatória de 15elementos da primeira população e de 12 da segunda, obtendo a seguir asrespectivas médias amostrais. Em um teste t de Student, é correto afirmar:

a) Há 5% de probabilidade do teste indicar uma diferença quando realmente ela nãoexiste.

b) O número de graus de liberdade, no caso, é igual a 26.c) O cálculo que leva à conclusão de rejeitar a hipótese nula, isto é, que as médias são

iguais, independe do tamanho de cada amostra.d) Há 95% de probabilidade do teste mostrar que o procedimento é inadequado para

testar a rejeição da hipótese nula.e) Há 95% de probabilidade do teste revelar que qualquer conclusão é incorreta.

3. (FCC/TRF/2 – Analista/2008) Para uma experiência realizada com referência àmedição do comprimento de determinada peça fabricada por uma grandeindústria, utilizou-se uma amostra aleatória de 16 peças, apurando-se umamédia de 0,9 m e um desvio padrão de 0,2 m. Supondo que os comprimentos daspeças tenham uma distribuição normal, com média μ e variância desconhecida,deseja-se saber, no nível de significância de 5%, se o comprimento da peça nãoé inferior a 1 m. Seja H 0 a hipótese nula do teste (μ = 1 m), H 1 a hipótesealternativa (μ < 1 m) e t 0,05 = −1,75 o quantil da distribuição t de Studenttabelado para teste unicaudal, com 15 graus de liberdade. Então, pelo teste t deStudent:

a) a conclusão obtida seria a mesma para qualquer nível de significância;b) H0 não pode ser aceita, indicando que os comprimentos são inferiores a 1 m;c) o número de graus de liberdade, no caso 15, não interferiu na obtenção de t0,05;d) para um nível de significância superior a 5%, a conclusão poderia não ser a mesma;e) o valor da estatística obtido por meio da amostra para comparação com t0,05 é igual

a −0,5.

4. (Consulplan/Sesap-RN – Técnico Administrativo/2008) Na tabela a seguir, estárelacionado o levantamento em um Hospital do Câncer sobre a incidência decâncer de pulmão entre fumantes passivos e não fumantes em um certo estado.Observe os resultados do levantamento:

Câncer de Pulmão

Fumante passivo Sim Não

Sim 30 20

Não * 20 30

*Excluídos os fumantes ativos

Admitindo o nível de significância de 5%, há diferença significativa entre osexpostos ou não ao cigarro. Com relação ao valor crítico χ 1 2 = 3,841 pode-seafimar que:

a) Não existe associação entre as variáveis pois o χ2 = 1.b) Não existe associação entre as variáveis pois o χ2 = 4.c) Existe associação entre as variáveis pois o χ2 = 4.

d) Existe associação entre as variáveis pois o χ2 = 1.e) Existe associação entre as variáveis pois o χ2 = 16.

Gabarito:

1. E2. A3. B4. C

Capítulo 7

Regressão Estatística

7.1 O MÉTODO DOS MÍNIMOS QUADRADOS

O Método dos Mínimos Quadrados ajusta uma linha reta que minimiza os errosquadráticos da amostra de observações XY em relação ao modelo linear. Desta forma,existindo uma relação linear aproximada

incluem-se em tal relação os termos estocásticos ou erros εi, considerados distribuídosnormalmente, com média zero, variância constante e não correlacionados ou nãorelacionados entre si. Além disto, é considerado que a variável independente Xi assumevalores fixos em repetidas amostragens de modo que Xi e εi não sejam correlacionados.A equação anterior se torna

Busca-se então minimizar o somatório dos desvios quadráticos, ou seja,

Pode-se mostrar, então, que o modelo ajustado pelo Método dos Mínimos Quadradosdados por

terá os valores e dados por

Para o cálculo de também pode ser usada a fórmula:

Coeficiente de Determinação (R2) e Coeficiente de Correlação (r)

A variação total em Y (VT) é dada por:

A variação explicada (VE) é o somatório dos desvios quadráticos entre os valoresestimados i e a média entre os valores observados, de modo que:

Já a variação residual é dada pelo somatório dos desvios quadráticos entre os valores

observados Yi e os valores estimados , ou seja,

A variação total é a soma da variação explicada com a variação residual, o que nos dá

O coeficiente de determinação R 2 é definido como o quociente entre VE e VT eobviamente o valor de R 2 pode variar de 0 a 1. Assim, R 2 é dado por:

O coeficiente de correlação r de Pearson é dado por:

e poderá variar de −1 a +1. O sinal de r será o mesmo de .

O gráfico abaixo representa o coeficiente de determinação relacionado com ocoeficiente de correlação:

Exemplo:

Os dados a seguir referem-se ao volume de precipitações pluviométricas (em mm) e aovolume de produção de leite tipo C (milhões de litros), em determinada região do país.

Anos Produção de leite C (1.000.000 ℓ) Índice pluviométrico (mm)

X0 26 23

X1 25 21

X2 31 28

X3 29 27

X4 27 23

X5 31 28

X6 32 27

X7 28 22

X8 30 26

X9 30 25

a) Ajustar os dados por meio de um modelo linear.

Solução:

De acordo com os dados acima e aplicando-se as fómulas de Regressão Linear, aequação da reta é escrita como:

7.2 ANÁLISE DE VARIÂNCIA PARA O MODELO LINEARSIMPLES

Pode-se aplicar a Análise de Variância para o Modelo Linear Simples, de maneirasemelhante à Análise de Variância para o teste de média entre 3 ou mais populações(Capítulo 7) com as adaptações mostradas no quadro a seguir.

Utilizando-se

pode-se determinar os valores da tabela para cálculo da estatística F, para o teste daexistência da regressão.

Exemplo: (Esaf/AFPS/2002) Uma empresa presta serviços de manutenção deeletrodomésticos em domicílio. Para cada um de 18 atendimentos coletou o tempo gastoem minutos (y) com a manutenção e o número de máquinas servidas (x). Postula-se queo modelo linear Yi = α + βXi + ε i seja adequado, em que α e β são parâmetros

desconhecidos e εi são componentes de erro não diretamente observáveis, nãocorrelacionados, com média nula e variância σ2 desconhecida. As estimativas demínimos quadrados dos parâmetros do modelo linear são dadas por ^ α = 10, = 2 e ^ σ2 = 4. A estimativa do aumento esperado de tempo por máquina adicional servida porchamada é de:

a) 2 minutos;b) 10 minutos;c) 12 minutos;d) 5 minutos;e) 6 minutos.

Solução:

De acordo com o enunciado supra, podemos escrever , logo . Testandopara cada valor de x e começando por x = 1, queremos obter a variação ao longo dotempo, então:

x

1 12

2 14

3 16

Sendo assim, o aumento de tempo y para cada máquina x é de 2 minutos.

Gabarito: letra A.

7.3 Questões Resolvidas

1. (Esag/TJ-MA – Analista Judiciário/2005) Para a série cronológica de consumomensal (em R$): 410, 520, 700 e 930, a previsão para o próximo período peloajustamento linear no método dos mínimos quadrados é:

a) 1103;b) 1075;c) 1006;d) 1228.

Solução:

Organizando e calculando os valores para o ajuste linear pelo método dos mínimosquadrados, obtemos a tabela a seguir.

Sabe-se que , que e que , de formaque :

Desta forma, podemos calcular o valor de , pois

O valor de é dado por:

e já que e

Para fazermos a previsão para o próximo período, utilizamos:

que com X5 = 5, conforme é pedido no problema, resulta em:

Gabarito: letra B.

Considere as informações a seguir para resolver as questões de números 2 e 3, aseguir.

Uma empresa, com a finalidade de determinar a relação entre os gastos anuaiscom propaganda (X), em R$ 1.000,00, e o lucro bruto anual (Y), em R$ 1.000,00,optou por utilizar o modelo linear simples Yi = α + β Xi + εi, em que Yi é o valordo lucro bruto auferido no ano i, Xi é o valor gasto com propaganda no ano i e ε i

o erro aleatório com as respectivas hipóteses consideradas para a regressãolinear simples (α e β são parâmetros desconhecidos).

Considerou, para o estudo, as seguintes informações referentes às observaçõesnos últimos 10 anos da empresa:

2. (FCC/Bacen – Analista/2005) Montando o quadro de análise de variância, tem-se que:

a) a variação total apresenta um valor igual a 62,5;b) a variação explicada, fonte de variação devido à regressão, apresenta um valor

igual a 80;c) dividindo a variação residual pela variação total, obtemos o correspondente

coeficiente de determinação (R2);d) o valor da estatística F necessária para o teste da existência da regressão é igual ao

quociente da divisão da variação explicada pela variação residual;e) a variação residual apresenta um valor igual a 17,5.

Solução:

Cálculos auxiliares para determinação dos valores do Quadro de Análise da Variânciapara o Modelo Linear Simples:

CAMPUS

Cálculo dos valores de soma de quadrados (SQ) da tabela:

(a) SQE = ⋅ SXY = 1,25 × 50 ⇒ SQE = 62,5(b) SQT = SYY = 80(c) SQR = SQT – SQE = 80 – 62,5 ⇒ SQR =17,5 (Neste ponto já se poderia marcar a

alternativa E, no entanto a montagem do quadro de análise de variância serámostrada para fins didáticos.)

Determinando os demais valores, pode-se montar o quadro a seguir.

Gabarito: letra E.

3. (FCC/Bacen – Analista/2005) Utilizando-se a equação da reta obtida pelométodo dos mínimos quadrados, tem-se que, caso haja um gasto anual compropaganda de 80 mil reais, a previsão do lucro bruto anual, em mil reais, seráde:

a) 158;b) 128,4;c) 121;d) 102,5;e) 84.

Solução:

Esta questão será resolvida com o modelo ajustado .

Conforme calculado na resolução da questão anterior, = 1,25.

Como , devemos calcular os valores médios e , que são

Desta forma, .

E poderá ser escrito como . Finalmente podemos substituir

o valor Xprev = 80, de modo que e finalmente mil reais.

Gabarito: letra D.

7.4 QUESTÕES PROPOSTAS

Considere as informações a seguir para resolver as questões de números 1 e 2, aseguir.

Uma empresa, com a finalidade de determinar a relação entre os gastos anuaisem pesquisa e desenvolvimento (X), em milhares de reais, e o acréscimo anualnas vendas (Y), também em milhares de reais, optou por utilizar o modelo linearsimples Yi = α + β Xi + ε i, em que Yi é o acréscimo nas vendas no ano i, Xi é ovalor gasto em pesquisa e desenvolvimento no ano i e εi o erro aleatório com asrespectivas hipóteses consideradas para a regressão linear simples (α e β sãoparâmetros desconhecidos). Considerou, para o estudo, as seguintes informaçõesreferentes às observações nos últimos 10 anos da empresa:

1. (FCC/Bacen – Analista/2005) Montando o quadro de análise de variância, tem-se que:

a) a variação total apresenta um valor igual a 550;b) a variação explicada, fonte de variação devido à regressão, apresenta um valor

igual a 500;c) a variação residual apresenta um valor igual a 100;d) o valor da estatística F necessária para o teste da existência da regressão é igual a

9;e) o valor do correspondente coeficiente de determinação (R2) é igual a 90%.

2. (FCC/Bacen – Analista/2005) Utilizando a equação da reta obtida pelo métododos mínimos quadrados, obteve-se, para um determinado gasto em pesquisa edesenvolvimento, uma previsão de acréscimo nas vendas no valor de 19 milreais. O valor que se considerou para o gasto em pesquisa em desenvolvimento,em mil reais, foi:

a) 14,0;b) 13,75;

c) 13,0;d) 12,4;e) 12,0.

Gabarito:

1. E2. E

Capítulo 8

Provas de Concursos

8.1 ESTATÍSTICA DESCRITIVA

1. (Esaf/MPU – Analista Pericial/2004) A mediana é uma medida de posiçãousualmente utilizada na análise de distribuições de renda porque asdistribuições de renda:

a) têm intervalos de classe distintos;b) sempre são normais;c) tipicamente são do tipo uniforme;d) geralmente se mostram bastante assimétricas;e) sempre são bimodais.

2. (Esaf/MPU – Analista Pericial/2004) A norma euclidiana é mínimaquando A é igual:

a) à média dos valores Xi;b) à mediana dos valores Xi;c) à moda dos valores Xi;d) ao primeiro quartil dos valores Xi;e) ao desvio padrão dos valores Xi.

As questões 3, 4 e 5 dizem respeito ao enunciado seguinte:

A distribuição de frequências de determinado atributo X é dada na tabela aseguir. Não existem observações coincidentes com os extremos das classes.

Classes Frequências

2.000 − 4.000 18

4.000 − 6.000 45

6.000 − 8.000 102

8.000 − 10.000 143

10.000 − 12.000 51

12.000 − 14.000 41

3. (Esaf/MPU – Analista Pericial/2004) Assinale a opção que corresponde àamplitude interquartílica.

a) 4.500,1;b) 6.200,2;c) 3.000,4;d) 3.162,6;e) 2.400,0.

4. (Esaf/MPU – Analista Pericial/2004) Assinale a opção que corresponde aoponto médio da classe modal.

a) 3.000;b) 7.000;c) 10.000;d) 8.000;e) 9.000.

5. (Esaf/MPU – Analista Pericial/2004) Assinale a opção que corresponde àestimativa do valor x que não é superado por aproximadamente 80% dasobservações do atributo X.

a) 12.000;b) 10.000;c) 10.471;d) 9.000;e) 11.700.

Para responder às questões de números 6 a 9 considere o enunciado que segue.

A tabela a seguir apresenta a distribuição de frequências das notas obtidas numteste de matemática, realizado por 50 estudantes.

Notas Frequência Absoluta

0 2 4

2 4 12

4 6 15

6 8 13

8 10 6

6. (FCC/TRF/1 – Analista Judiciário/2001) A nota média desses estudantes é:

a) 5,0;b) 5,2;c) 5,5;d) 5,8;e) 6,0.

7. (FCC/TRF/1 – Analista Judiciário/2001) Se a nota mínima para aprovação noteste é 5,8, a porcentagem de aprovação é de:

a) 51%;b) 48%;c) 45%;d) 41%;e) 38%.

8. (FCC/TRF/1 – Analista Judiciário/2001) A nota mediana desses estudantes é:

a) 4,8;b) 5,0;c) 5,2;d) 5,5;e) 5,8.

9. (FCC/TRF/1 – Analista Judiciário/2001) Selecionando-se ao acaso e semreposição três estudantes dentre esses 50, a probabilidade de pelo menos umter tirado nota igual ou superior a 2 é:

a)

b)

c)

d)

e)

10. (FCC/TRF/1 – Analista Judiciário/2001) Sendo:

O índice agregado de preços de Paasche para 2000, considerando-se os trêsprodutos, usando 1995 como ano base é:

a) 110;b) 112;c) 115;d) 120;e) 130.Texto relativo às questões 11 a 20.Em estudos previdenciários, é importante

avaliar estatisticamente o tempo de sobrevida dos beneficiários. O tempo desobrevida, em geral, depende do perfil do beneficiário, que abrange um conjunto de

características como idade, espécie de benefícios (aposentadoria por idade,invalidez etc.), tipo de clientela (urbana/rural) etc. Para um estudo realizado acercado tempo de sobrevida de beneficiários com um certo perfil, foram obtidos osresultados apresentados na tabela a seguir.

Com base nos resultados obtidos para o estudo apresentado no texto, julgue ositens 11 a 20 que se seguem.

11. (Cespe-UnB/Paranaprevidência – Analista Previdenciário/2002) O tempomédio de sobrevida dos beneficiários participantes do estudo foi inferior a 10anos.

12. (Cespe-UnB/Paranaprevidência – Analista Previdenciário/2002) A variância dotempo de sobrevida dos beneficiários é superior a 50 anos2.

13. (Cespe-UnB/Paranaprevidência – Analista Previdenciário/2002) A mediana dotempo de sobrevida dos beneficiários está entre 5 e 10 anos.

14. (Cespe-UnB/Paranaprevidência – Analista Previdenciário/2002) O percentualde beneficiários com tempo de sobrevida inferior a 15 anos é deaproximadamente 75%.

15. (Cespe-UnB/Paranaprevidência – Analista Previdenciário/2002) O primeiroquartil da distribuição é inferior a 5 anos.

16. (Cespe-UnB/Paranaprevidência – Analista Previdenciário/2002) O intervalointerquartil ou interquartílico é inferior a 10 anos.

17. (Cespe-UnB/Paranaprevidência – Analista Previdenciário/2002) O diagramaem caixa (box-plot) é uma ferramenta exploratória que pode ser utilizada paraa detecção de casos atípicos, dentro de certas suposições. No caso do estudorealizado, se um beneficiário apresentar tempo de sobrevida superior a 30anos, ele será detectado como um possível caso atípico.

18. (Cespe-UnB/Paranaprevidência – Analista Previdenciário/2002) O coeficientede assimetria de Pearson é negativo.

19. (Cespe-UnB/Paranaprevidência – Analista Previdenciário/2002) Ao calcular oquarto momento central da distribuição, pode-se verificar que essa distribuição

é assimétrica.20. (Cespe-UnB/Paranaprevidência – Analista Previdenciário/2002) A distribuição

é multimodal.21. (FCC/MPE-PE – Analista Ministerial/2006) Considere a tabela a seguir.

Salário (em reais) Frequência Relativa

400 600 0,10

600 800 0,20

800 1000 0,40

1000 1200 0,20

1200 1400 0,10

A tabela supra representa a distribuição de frequências relativas do valor dosalário pago aos funcionários da fábrica Y no mês de abril de 2006. A média e amediana do valor do salário pago pela fábrica Y no mês de abril de 2006 sãorespectivamente:

a) R$ 200,00 e R$ 400,00;b) R$ 900,00 e R$ 1.000,00;c) R$ 1.050,00 e R$ 1.000,00;d) R$ 800,00 e R$ 800,00;e) R$ 900,00 e R$ 900,00.

22. (FCC/MPE-PE – Analista Ministerial/2006) A tabela de dupla entrada,apresentada a seguir, mostra a distribuição conjunta das variáveis F e M querepresentam o número de anos para completar o ensino fundamental e médio,respectivamente.

Em uma cidade, esta tabela foi adotada para calcular a média da variável Z, querepresenta o número de anos para completar todo o ciclo básico, isto é, Z = F +M. O valor médio de Z será:

a) 8,1;b) 10,0;c) 12,4;d) 13,4;e) 14,0.

Gabarito – Estatística Descritiva

1. D2. A3. D4. E5. C6. B7. D8. C9. E10. A11. Errado12. Certo13. Certo14. Certo15. Errado16. Certo17. Certo18. Errado19. Errado20. Errado21. E22. C

8.2 PROBABILIDADES

1. (Esaf/MPU – Analista Pericial/2004) Os membros do departamento de vendasde uma cia. aérea sabem que com probabilidade 5% um passageiro com reservaconfirmada não se apresenta para o voo. Nesse contexto a política de vendas dacia. é vender 52 passagens para um voo que acomoda no máximo 50passageiros. Assinale a opção que corresponde à probabilidade de que haja umlugar disponível para todo passageiro que se apresente para o voo. Sabe-se que(0,95)51 = 0,0731 e que (0,95)52 = 0,0694.

a) 0,500;b) 0,738;c) 0,830;d) 0,835;e) 0,741.

2. (FCC/TRF/1 – Analista Judiciário/2001) Numa cidade em que se publicam 2jornais, A e B, sabe-se que entre n famílias: 160, assinam o jornal A, 35 assinamos 2 jornais A e B, 201 não assinam B e 155 assinam apenas 1 jornal. O valor den e a probabilidade de que uma família selecionada ao acaso, dentre as n,assinar A, dado que assina B, são dados, respectivamente, por:

a) 180 e

b) 250 e

c) 266 e

d) 266 e

e) 266 e

3. (FCC/TRF/1 – Analista Judiciário/2001) Duas urnas guardam bolas brancas epretas. Uma das urnas tem 3 bolas brancas e 1 preta enquanto que a outra tem3 bolas brancas e 3 pretas. Escolhendo-se uma urna ao acaso e em seguida,sucessivamente e com reposição duas de suas bolas, a probabilidade de ocorreruma branca e uma preta é:

a)

b)

c)

d)

e)

4. (Esag/TJ-MA – Analista Judiciário/2005) Se a probabilidade de ganhar umcerto jogo é 25%, a probabilidade de um jogador que participa de 3 partidasganhar pelo menos uma vez é:

a) 57,81%;b) 25,00%;c) 75,00%;d) 42,19%.

5. (Esag/TJ-MA – Analista Judiciário/2005) Em um lote de 80 peças, 10 sãodefeituosas. Escolhendo-se 4 peças sem reposição, a probabilidade de se obterpelo menos uma defeituosa é:

a) 12,50%;b) 41,38%;c) 36,75%;

d) 42,03%.

6. (FCC/MPE-PE – Analista Ministerial/2006) Considere, no plano cartesiano, oquadrado com vértices (0, 0), (0,2), (2, 0), (2,2). Suponha que a probabilidadeda região A (evento) seja a área dessa região dividida por quatro. Aprobabilidade do evento A = {(x, y): x > 1,2 ou y < 0,5} é:

a) 0,15;b) 0,30;c) 0,40;d) 0,50;e) 0,55.

7. (FCC/MPE-PE – Analista Ministerial/2006) Um lote contém 20 peças das quais 5são defeituosas. Colhendo-se uma amostra de duas peças, ao acaso e semreposição deste lote, a probabilidade de se obter pelo menos uma peçadefeituosa é:

a)

b)

c)

d)

e)

8. (FCC/MPE-PE – Analista Ministerial/2006) Uma rede local de computadores écomposta de um servidor e 2 clientes (A e B). Registros anteriores indicam que,dos pedidos de certo tipo de processamento, cerca de 30% vêm de A e 70% de B.Se o pedido não for feito de forma adequada, o processamento apresentaráerro. Sabe-se que 2% dos pedidos feitos por A e 5% dos pedidos feitos por Bapresentam erro. Selecionando um pedido ao acaso, a probabilidade dele serproveniente de A, sabendo que ele apresentou erro, é:

a)

b)

c)

d)

e)

Gabarito – Probabilidades

1. E

2. C3. B4. A5. D6. E7. C8. B

8.3 VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÕES DEPROBABILIDADES

As questões 1 e 2 dizem respeito ao enunciado seguinte:A distribuição de probabilidades dada a seguir refere-se aos atributos idade e

violação das leis de trânsito. Represente por Ei os eventos elementares associadosà idade e por Fi os eventos elementares associados à violação das leis de trânsito.

1. (Esaf/MPU – Analista Pericial/2004) Assinale a opção que dá a probabilidade deque um motorista escolhido ao acaso não tenha cometido nenhuma violação detrânsito nos últimos 12 meses, dado que o mesmo tenha mais de 21 anos.

a) 0,75;b) 0,60;c) 0,45;d) 0,66;e) 0,00.

2. (Esaf/MPU – Analista Pericial/2004) Assinale a opção que corresponde àprobabilidade da união de E1 e F2.

a) 0,12;b) 0,26;c) 0,54;d) 0,66;e) 0,37.

3. (Esaf/MPU – Analista Pericial/2004) O preço de determinada ação ficaconstante, aumenta ou diminui R$ 1,00 por dia com probabilidades 0,3, 0,3 e0,4 respectivamente. Assinale a opção que dá o valor esperado do preço da açãoamanhã se seu preço hoje é R$ 8,00.

a) R$ 7,90;

b) R$ 8,00;c) R$ 7,00;d) R$ 9,00;e) R$ 8,50.

4. (Esaf/MPU – Analista Pericial/2004) O tempo em segundos, necessário paraprocessar certo programa é uma variável aleatória com função densidade deprobabilidades:

Assinale a opção que corresponde à probabilidade de que o tempo deprocessamento exceda 7 segundos.

a) 0,20;b) 0,25;c) 0,30;d) 0,35;e) 0,40.

5. (Esaf/MPU – Analista Pericial/2004) Considere a distribuição conjunta abaixode duas variáveis aleatórias discretas X e Y. Assinale a opção que dá o valor dacovariância entre X e Y.

X/Y Y1 Y2

X1 0,25 0,25

X2 0,25 0,25

a) –6,40;b) –0,87;c) –0,05;d) 0,00;e) 0,25.

6. (Esaf/MPU – Analista Pericial/2004) Uma variável aleatória X tem função dedistribuição:

Assinale a opção que corresponde ao valor da função massa de probabilidades (oufunção densidade de probabilidades, se for o caso) de X no ponto x=1.

a) 0,250;b) 0,333;c) 0,083;d) 0,583;e) 0,417.Para responder às questões de números 7 e 8 considere o enunciado a

seguir.Seja X uma variável aleatória cuja distribuição de probabilidade édada por:

7. (FCC/TRF/1 – Analista Judiciário/2001) A média, a moda e a mediana de X sãodadas, respectivamente, por:

a) 1,1,1;b) 1,1,2;c) 2,1,1;d) 2,1,2;e) 2,2,1.

8. (FCC/TRF/1 – Analista Judiciário/2001) Se F(x) é a função de distribuiçãoacumulada de X, então P(X = 1 | X ≤ 2) e F(3) são dadas, respectivamente, por:

a)

b)

c)

d)

e)

9. (FCC/TRF/1 – Analista Judiciário/2001) Seja X uma variável com média 5 evariância 2 e seja V = X – 6 . Nessas condições,

a) o coeficiente de variação de X é

b) se a distribuição de X e assimétrica positiva, a moda de V é maior do que −1;c) o coeficiente de variação de X é ;d) se X tem distribuição simétrica, V terá distribuição assimétrica negativa;e) se a distribuição de X é assimétrica negativa, a mediana de V é maior ou igual a

−1.

10. (FCC/TRF/1 – Analista Judiciário/2001) Sejam (X1, X2, X3) e (Y1, Y2, Y3) duasamostras aleatórias independentes de duas distribuições uniformes contínuascom parâmetros (0, 2) e (0, 4), respectivamente. Sejam, e as médiasamostrais de cada uma dessas amostras. Nessas condições, a média e avariância da variável aleatória ( ) são dadas, respectivamente, por:

a)

b)

c)

d)

e)

11. (FCC/MPE-PE – Analista Ministerial/2006) A trava de segurança de umaparelho industrial deve ser trocada com frequência, de modo a evitar a quebradevido ao fim de sua vida útil. Estudos anteriores admitem que essa vida útilpossa ser representada por uma variável aleatória contínua X assumindovalores entre 0 e 1 ano. Seja:

a função densidade de probabilidade de X.A probabilidade da vida útil sersuperior a 6 meses é:

a)

b)

c)

d)

e)

12. (FCC/MPE-PE – Analista Ministerial/2006) Seja X uma variável aleatória, comdensidade Uniforme no intervalo [–α, α], o valor de α que satisfaz à condição

é:

a) 2;b)

c) 1;d)

e)

13. (Esaf/Bacen – Analista/2001) A variável aleatória X tem função de distribuiçãode probabilidade dada por:

Assinale a opção que dá o valor da probabilidade de X = 2.

a) 7/12;b) 11/12;c) 1/3;d) 3/4;e) 10/12.

Gabarito

1. A2. C3. A4. C5. D6. B7. C8. A9. E10. A11. B12. B13. C

8.4 DISTRIBUIÇÕES TEÓRICAS DE PROBABILIDADES

1. (Esaf/MPU – Analista Pericial/2004) Para uma amostra aleatória de tamanho20 da distribuição de Bernoulli com parâmetro θ ε (0, 1) encontrou- se o valor 8para a soma dos itens amostrais. O parâmetro θ tem distribuição a prioriuniforme. Assinale a opção que dá o valor do estimador bayesiano de θ.

a) 0,51;b) 0,50;c) 0,60;d) 0,41;e) 0,82.

2. (FCC/TRF/1 – Analista Judiciário/2001) A probabilidade de que um itemproduzido por uma máquina seja defeituoso é de 10%. Uma amostra de 30 itensproduzidos por esta máquina é selecionada ao acaso. Use a aproximação peladistribuição de Poisson para determinar a probabilidade de que não mais doque um item defeituoso seja encontrado nesta amostra.

a) 4e-3;b) 4e-2;c) 3e-3;d) 1 – 4e-3;e) 1 – 3e-3.

3. (FCC/MPE-PE – Analista Ministerial/2006) Uma variável aleatória X, comdistribuição Geométrica de parâmetro p, tem média 3 e variância 6. Então P(X= 3) é igual a:

a)

b)

c)

d)

e)

Para responder às questões de números 4 e 5 considere a informação a seguir.Onúmero de falhas de certo tipo de placa térmica tem distribuição de Poisson, comtaxa média de 0,1 defeitos por m2. Na confecção da superfície de um armário énecessário cobrir uma superfície de 2 m × 2 m com essa placa.

4. (FCC/MPE-PE – Analista Ministerial/2006) A probabilidade de que haja pelomenos uma falha nessa superfície é:

a) e-0,1;b) 1 – e-0,1;c) 1 – e-0,4;d) e-0,4;e) 1 – 1,4e-0,4.

5. (FCC/MPE-PE – Analista Ministerial/2006) Na confecção de 3 superfícies destetipo, a probabilidade de que exatamente duas não apresentem defeito é:

a) 3(1 – e-0,4)2 e-0,4;b) 3e-0,1;c) 3(1 – e-0,4);d) 3(1 – e-0,1)2 e-0,1;e) 3(1 – e-0,4) e-0,8.

6. (FCC/MPE-PE – Analista Ministerial/2006) Uma distribuição Gama comparâmetros α (α > −1) e β (β > 0) tem função geratriz de momentos dada por

. Se α = 1, o momento de ordem 2, não centrado, de Xé igual a:

a) β2;b) 2β2;c) 4 β2;d) 6 β2;e) 8 β2.

7. (Esag/TJ-MA – Analista Judiciário/2005) Em um concurso os candidatos foramclassificados segundo uma distribuição normal de escores com média igual a500 e desvio padrão igual a 100. Pelo edital do concurso serão classificados30% dos candidatos que obtiverem maior escore. Um determinado candidato“X” conseguiu escore igual a 560. Com base nos dados anteriores pode-seafirmar que:

a) o candidato “X” não será classificado porque o escore mínimo para a aprovação é584;

b) o candidato “X” não será classificado porque 33% dos candidatos têm escore maiorque o dele;

c) o candidato “X” não será classificado porque o escore mínimo para a aprovação é600;

d) o candidato “X” será classificado.

8. (Esag/TJ-MA – Analista Judiciário/2005) Uma variável x apresenta umadistribuição normal com média μ = 300 e desvio padrão σ = 30.Com base nadistribuição anterior, surge uma distribuição amostral das médias formadas poramostras ( ) com tamanho n = 36. Determinando-se o percentual de valoresde x superiores a 310, e o percentual de valores de superiores a 310, chega-se,respectivamente, aos seguintes resultados.

a) 37,07% e 2,28%;b) 34,72% e 5,22%;c) 12,93% e 47,72%;d) 47,72% e 37,07%.

9. (FCC/TRF/1 – Analista Judiciário/2001) O tempo de vida, em unidades de 1 000horas, de um aparelho eletrônico é uma variável aleatória X com funçãodensidade de probabilidade dada por:

O custo de fabricação de um aparelho é de R$ 100,00 e o preço de venda é de R$200,00. O fabricante garante a devolução do aparelho se x < 0,4. Sabendo quee0,4 = 0,67, o lucro esperado por aparelho é:

a) R$ 67,00;b) R$ 54,00;c) R$ 48,00;d) R$ 34,00;e) R$ 31,00.

10. (Esaf/TCE-ES – Economista/2001) O número de erros encontrados nacontabilidade de uma firma é uma variável aleatória X com distribuiçãodesconhecida, média 5 e desvio padrão 1/10. Assinale a resposta correta.

a) P (4 < X < 6) ≥ 0,99;b) P (4 < X < 6) = 0,95;c) 0,95 < P (4 < X < 6) < 0,99;d) P (4 < X < 6) = 0,90;e) P (4 < X < 6) = 0,70.

11. (FCC/ANS – Analista/2007) Suponha que o peso de crianças de 10 anos, numadeterminada população, tenha distribuição normal com média μ desconhecidae desvio padrão 4 kg. A probabilidade de que o peso médio de uma amostraaleatória simples de 100 crianças, selecionadas desta população, difira pormais de 400 gramas de μ é, aproximadamente, igual a:

a) 0,10;b) 0,16;c) 0,20;d) 0,27;

e) 0,32.

Gabarito – Distribuições Teóricas de Probabilidades

1. D2. A3. D4. C5. E6. D7. D8. A9. D10. A11. E

8.5 INFERÊNCIA ESTATÍSTICA

1. (Esaf/MPU – Analista Pericial/2004) Em um esquema em que se toma umaamostra aleatória simples de tamanho 160 de uma população com 1600indivíduos encontram-se os valores X = 20 e s2 =16 para a variância amostral(fórmula não viezada). Assinale a opção que corresponde a uma estimativa nãoviezada da variância da média amostral.

a) 0,08;b) 0,07;c) 0,10;d) 0,15;e) 0,09.

2. (Esaf/MPU – Analista Pericial/2004) Em um hospital deseja-se estimar os gastosmédios com contas hospitalares. Embora não se tenha informação preliminarsobre a variância dessas contas, sabe-se que a distribuição é não uniforme, coma maioria dos valores situados entre a média mais ou menos dois desvios. Aamplitude das contas é R$ 10.000,00. A população objetivo contém um númerogrande de contas. Assinale a opção que dá o tamanho da amostra necessáriopara estimar o valor médio das contas com erro não superior a R$ 300,00 comprobabilidade 95%. Tome como sendo aproximadamente 2 o quantil de ordem0,975 da distribuição normal padrão.

a) 300;b) 400;c) 278;d) 500;e) 250.

3. (Esaf/MPU – Analista Pericial/2004) Uma revenda de automóveis vende carrosmontados no Brasil. O proprietário está interessado em estimar o valor médio θdos gastos extras com opcionais casados com a compra de carros novos. Umaamostra de 16 vendas produziu um valor médio de R$1.062,00 com desviopadrão de R$ 144,00. Assinale a opção que dá os limites de confiança para θcom coeficiente de 98%. A tabela abaixo dá os quantis x, de ordem γ, P{T ≤ x}

= γ, da distribuição Tr de Student com r graus de liberdade. Despreze centavos.

a) [R$ 955,00; R$ 1.168,00];b) [R$ 968,00; R$ 1.155,00];c) [R$ 990,00; R$ 1.134,00];d) [R$ 997,00; R$ 1.124,00];e) [R$ 938,00; R$ 1.186,00].

4. (Esaf/MPU – Analista Pericial/2004) O resultado de um ensaio destinado ainvestigar a efetividade da vacinação de animais na prevenção de certo tipo dedoença produziu a tabela de contingência seguinte.

Vacina Doença

Sim Não

Sim 14 42

Não 16 28

Deseja-se testar a hipótese de que os perfis (de linha) de vacinados e nãovacinados coincidem. Assinale a opção que dá o valor da contribuição daprimeira célula da tabela para a estatística teste de homogeneidade do quiquadrado.

a) 0,326;b) 0,450;c) 0,400;d) 0,500;e) 0,467.

5. (Esaf/MPU – Analista Pericial/2004) O teste aleatorizado uniformemente maispotente para o problema de testar a hipótese H: λ ≤ 0,03 contra a alternativaA: λ > 0,03, com tamanho α = 0,05, para uma amostra aleatória X1,…, X20 dadistribuição de Poisson com parâmetro λ tem a forma:

em que as constantes c e k devem satisfazer a condição E(ϕ(X1,…, X20)) = 0,05quando λ = 0,03. Sabe-se que se Y tem distribuição de Poisson com parâmetro 0,6então P(Y=0)=0,5488, P(Y=1)=0,3293 e P(Y=2)=0,0988. Assinale a opção quedá os valores das constantes c e k.

a) c = 0,300; k = 1;b) c = 0,400; k = 2;c) c = 0,300; k = 2;d) c = 0,272; k = 1;e) c = 0,272; k = 2.As questões 6 e 7 referem-se ao enunciado seguinte:Em um

estudo controlado em que o interesse concentra-se no desgaste de pneustestaram-se um certo número de marcas obtendo-se os resultados constantesda tabela de análise de variância dada a seguir.

Fonte Graus de Liberdade Soma de Quadrados

Marcas 3 60

Erro 36 72

Total (Corrigido) 39 132

6. (Esaf/MPU – Analista Pericial/2004) Assinale a opção que dá o número demarcas de pneus estudadas.

a) 2;c) 4;b) 3;d) 5;e) 12.

7. (Esaf/MPU – Analista Pericial/2004) Assinale a opção que dá o valor daestatística F utilizada para testar a hipótese de igualdade de médias dasmarcas.

a) 2;b) 10;c) 12;d) 20;e) 72.

8. (FCC/TRF/1 – Analista Judiciário/2001) Deseja-se testar se duas amostrasindependentes provêm de populações idênticas, sem precisar supor que aspopulações originais tenham a forma aproximada da distribuição normal. Oteste estatístico mais apropriado para essa situação é o teste:

a) de Wilcoxon para observações pareadas;b) U de Mann-Whitney.c) de correlação de postos;d) do sinal;e) de Fisher.

9. (FCC/TRF/1 – Analista Judiciário/2001) Cinco porcos foram alimentados comuma dieta experimental desde o seu nascimento até a idade de 2 meses. Osaumentos de pesos verificados em gramas, foram os seguintes: 90, 84, 94, 105,79. Considerando-se a mediana dessa amostra como estimativa pontual damediana populacional dos aumentos de peso, e considerando-se [84,94] umintervalo de confiança para a mediana populacional, o coeficiente de confiançadesse intervalo:

a) é inferior a 75%;b) situa-se entre 75% e 79%;c) situa-se entre 80% e 84%;d) situa-se entre 85% e 90%;e) é superior a 90%.

10. (FCC/TRF/1 – Analista Judiciário/2001) O quadro a seguir resume asinformações associadas a uma população de tamanho N = 500, dividida emtrês estratos.

Estrato Tamanho (Ni) Variância Populacional (σ 2 i)

1 250 100

2 200 20

3 50 20

Selecionando-se uma amostra estratificada, com reposição, de tamanho 20, compartilha proporcional entre os estratos, a variância do estimador emque Xi é a média amostral de cada estrato, é dada por:

a) 7,50;b) 5,48;c) 3,82;d) 3,00;e) 2,54.

11. (FCC/TRF/1 – Analista Judiciário/2001) Uma amostra aleatória simples semreposição de tamanho n é tomada de uma população de tamanho N. Determinea variância da média amostral, sabendo que a variância populacional é σ2.

a)

b)

c) n(N – n);d)

e)

12. (FCC/TRF/1 – Analista Judiciário/2001) Seja X uma variável aleatória comfunção densidade de probabilidade dada por:

Desejando-se testar H0: a = 2 contra H1: a = 1 com base numa só observação,decidiu-se rejeitar H0 se x < . As probabilidades dos erros tipo I e tipo II sãodadas, respectivamente, por:

a)

b)

c)

d)

e)

Para responder às questões de números 18 a 23, considere as tabelas a seguir.Elas fornecem alguns valores da função de distribuição F(x). A Tabela 1 refere-seà variável normal padrão, as Tabelas 2 e 3 referem-se à variável t de Student com

10 e 15 graus de liberdade, respectivamente.

13. (FCC/TRF/1 – Analista Judiciário/2001) Um engenheiro encarregado docontrole de qualidade deseja estimar a proporção p de lâmpadas defeituosas deum lote, com base numa amostra de tamanho suficientemente grande. Sabe-se,com base em experiências anteriores, que p deve estar próxima de 0,5. Quetamanho deve ter a amostra se ele deseja que o erro de estimação seja nomáximo 0,02, com confiança de 90%?

a) 800;b) 1082;c) 1241;d) 1530;e) 1681.

14. (FCC/TRF/1 – Analista Judiciário/2001) O peso de crianças recém-nascidas dosexo feminino numa comunidade tem distribuição normal com média μ e desviopadrão desconhecido. Uma amostra de 16 recém-nascidos indicou um pesomédio de 3,0 kg e desvio padrão amostral igual a 0,8 kg. Um intervalo deconfiança para μ, com coeficiente de confiança de 96% é dado por:

a) 3,0 ± 0,37;b) 3,0 ± 0,41;c) 3,0 ± 0,45;d) 3,0 ± 0,68;e) 3,0 ± 0,73.

15. (FCC/TRF/1 – Analista Judiciário/2001) Uma máquina de empacotar leite empó o faz segundo uma Normal com média μ e desvio padrão 10 g. O peso médioμ deve ser regulado para que apenas 5,5% dos pacotes tenham menos do que1000 g. Com a máquina assim regulada, a probabilidade de que o peso total de4 pacotes escolhidos ao acaso seja inferior a 4040 g é:

a) 0,485;c) 0,195;b) 0,385;d) 0,157;e) 0,115.

16. (FCC/TRF/1 – Analista Judiciário/2001) Seja X: N (μ, 25). Para o teste da médiaμ = 15 contra μ = 12, retirou-se uma amostra aleatória de 16 elementos de X,tendo-se observado para a média amostral o valor 13. Determine o níveldescritivo do teste.

a) 0,065;b) 0,060;c) 0,055;d) 0,010;e) 0,005.Texto para as questões 17 a 21.Parte das atribuições do analista

previdenciário é a participação na elaboração de sistemas de informaçõesprevidenciárias. As informações, em geral, vêm de diversas fontes. É importanteque um sistema de informações forneça com detalhes todo o processo metodológico,desde a obtenção dos dados até a sua disponibilização para o usuário final. Paraassegurar a fidedignidade dos dados, as possíveis fontes de erros devem sermonitoradas e os erros, quando detectados, devem ser corrigidos. Nesse sentido,considere por hipótese, que o departamento DDD de determinada empresa devacoletar e enviar diariamente um conjunto de informações para a previdência. Aolongo do procedimento de envio dessas informações, há várias situaçõesproblemáticas, como dificuldades de transmissão dos dados, perda acidental dedados, atraso na coleta dos dados etc. Suponha que, ocorrendo uma dessas situaçõesproblemáticas, uma nova tentativa seja feita apenas no dia seguinte. Suponhaainda que, em 1.000 dias, um relatório gerencial tenha apresentado os seguintesresultados.

Situaçãoquantidade de ocorrência (em

dias)

impossibilidade de coleta das informaçõesdentro do prazo

300

problema na transmissão dos dados coletados 140

problema na recepção dos dados coletados 56

Julgue os itens 17 a 21 seguintes, com base na situação hipotética descrita supra.

17. (Cespe-UnB/Paranaprevidência – Analista Previdenciário/2002) Umaestimativa da probabilidade de sucesso na coleta das informações dentro doprazo é de 0,7.

18. (Cespe-UnB/Paranaprevidência – Analista Previdenciário/2002) Assumindo-seindependência entre os dias e que as probabilidades permaneçam constantesao longo do tempo, a probabilidade de haver sucesso na coleta das informaçõesnos dois dias seguintes aos 1.000 dias de observação é superior a 0,50.

19. (Cespe-UnB/Paranaprevidência – Analista Previdenciário/2002) A estimativada probabilidade de ocorrer problema de transmissão dos dados coletados éigual a 0,14.

20. (Cespe-UnB/Paranaprevidência – Analista Previdenciário/2002) Aprobabilidade de ocorrência de problema na recepção dos dados transmitidos écondicional.

21. (Cespe-UnB/Paranaprevidência – Analista Previdenciário/2002) Assumindoque as probabilidades permaneçam constantes ao longo do tempo econsiderando que a previdência não tenha, em um determinado dia, recebido oconjunto de informações do departamento DDD, a probabilidade de o DDDainda não haver coletado o conjunto de dados naquele dia é superior a0,50.Julgue os itens 22 a 26 a seguir, relativos a técnicas de amostragem.

22. (Cespe-UnB/Paranaprevidência – Analista Previdenciário/2002) No caso deuma amostra aleatória de tamanho n extraída de uma população de Nelementos, a probabilidade de seleção de cada uma das combinações amostraispossíveis é igual a 1/N.

23. (Cespe-UnB/Paranaprevidência – Analista Previdenciário/2002) Considere aseguinte situação hipotética.Uma determinada população pode ser dividida emsubgrupos com características semelhantes, como sexo, faixa etária,rendimento mensal etc. Os subgrupos formam uma partição da população e oselementos selecionados são resultantes de uma amostra aleatória simplesefetuada em cada subgrupo.Nessa situação, o desenho amostral é conhecidocomo amostragem por conglomerados.

24. (Cespe-UnB/Paranaprevidência – Analista Previdenciário/2002) Considere a

seguinte situação hipotética.Uma empresa quer estudar a renda de empregadosrurais existentes em uma área do interior do estado do Paraná. Devem seraplicados 1.200 questionários, mas a empresa não possui um cadastro contendodados sobre os empregados rurais. A inexistência do cadastro impede o sorteioaleatório de tais empregados. Além disso, o custo de contactar diretamente asfamílias rurais dispersas em uma grande área é muito elevado. Para viabilizar oestudo, a área do interior do estado foi dividida em pequenas subáreasdisjuntas. Foram selecionadas aleatoriamente algumas subáreas e a pesquisaprocurou entrevistar todos os empregados rurais dentro delas.Nessa situação, odesenho amostral é conhecido como amostragem estratificada.

25. (Cespe-UnB/Paranaprevidência – Analista Previdenciário/2002) Considere aseguinte situação hipotética.Uma pesquisa de opinião sobre a qualidade dosserviços prestados por uma empresa coletou opiniões de 500 indivíduos. Poralguma razão, os entrevistadores foram orientados a entrevistar 20 homenscom idade supra de 50 anos, 100 homens com idade entre 30 e 50 anos, 130homens com idade entre 15 e 30 anos, 40 homens com idade supra de 50 anosetc. O critério de escolha dos entrevistados não importava, desde que asquantidades determinadas em cada caso fossem respeitadas.Nessa situação, oprocedimento adotado é chamado de amostragem por quotas.

26. (Cespe-UnB/Paranaprevidência – Analista Previdenciário/2002) Considere aseguinte situação hipotética.Em uma região do Paraná, será realizada umapesquisa sobre o perfil de indivíduos aidéticos em tratamento. Um dado a serlevantado é o tempo médio de tratamento. A população será dividida em trêssubgrupos. O quadro abaixo apresenta a distribuição populacional segundo ossubgrupos considerados.

subgruponúmero de pacientes na

populaçãodesvio padrão do tempo de tratamento

(dias)

1 100 200

2 200 200

3 400 100

O desvio padrão do tempo de tratamento foi obtido por uma meta-análise(mediante estudos anteriores realizados pelo Ministério da Saúde). Devido arestrições orçamentárias, a amostra total será composta por 50 indivíduos.Nessa

situação, utilizando-se a alocação ótima de Neyman, o número de indivíduos dosubgrupo 3 que entrarão na amostra será superior a 30.27. (Esag/TJ-MA – Analista Judiciário/2005) Uma amostra de 64 tijolos

apresentou para a resistência um desvio padrão de 8 kg. Para que a estimativada média populacional, com 95% de probabilidade, tenha metade da margemde erro obtida com a amostra inicial, devem ser adicionados ao teste deresistência:

a) 64 tijolos;b) 192 tijolos;c) 128 tijolos;d) 256 tijolos.

28. (Esag/TJ-MA – Analista Judiciário/2005) Em uma pesquisa prévia eleitoral trêscandidatos conseguiram os seguintes percentuais de intenção de voto, parauma amostra de 400 eleitores:

CANDIDATO %

A 40

B 35

C 25

TOTAL 100

Utilizando-se intervalos de confiança de 95% de probabilidade pode-se afirmarque:

a) o candidato “A” seria o vencedor se a eleição fosse realizada no período dapesquisa;

b) os resultados apontam para um empate técnico entre os candidatos “A” e “B” parao primeiro lugar, e também empate técnico entre os candidatos “B” e “C” para osegundo lugar;

c) o candidato “A” seria o primeiro colocado, mas haveria uma indefinição para osegundo lugar entre os demais candidatos;

d) para primeiro lugar, existe empate técnico entre os candidatos “A” e “B”.

29. (Esag/TJ-MA – Analista Judiciário/2005) Uma pesquisa baseada em 200eleitores revelou que 55% votariam no candidato “A” se a eleição fosse

realizada naquele momento. Com nível de confiança de 95%, qual a margem deerro (e) da pesquisa e qual seria o tamanho da amostra (n) recomendado parauma margem de erro de 5%?

a) e = 5%; n = 250;b) e = 5,5%; n = 400;c) e = 5,8%; n = 266;d) e = 6,9%; n = 380.

30. (Esag/TJ-MA – Analista Judiciário/2005) Uma linha de produção apresenta15% de itens defeituosos. Após a aquisição de novas máquinas, uma amostra de300 peças revelou que 27% eram defeituosas. Por meio de um teste unilateralde proporções, com nível de significância de 5%, chega-se à seguinte conclusão:

a) Houve melhoria na qualidade das peças produzidas com a aquisição das novasmáquinas.

b) O tamanho da amostra é inadequado para a realização do teste de hipótese.c) Houve uma redução na qualidade das peças produzidas.d) Não houve modificação na qualidade das peças produzidas.

31. (FCC/MPE-PE – Analista Ministerial/2006) Seja a média de uma amostraaleatória simples com reposição, de tamanho 64, retirada de uma populaçãoNormal com média 200 e variância 400. Usando o fato que P(Z < 1,64)=0,05,em que Z é a Normal Padrão, o valor de α para que é igual a:

a) 6,4;b) 5,2;c) 4,8;d) 4,1;e) 3,6.

32. (FCC/MPE-PE – Analista Ministerial/2006) Seja X uma variável aleatória comfunção densidade de probabilidade dada por:

Desejando testar H0: α = 1 contra H1: α = 2, com base em uma única observação,

decidiu-se rejeitar H0 se o valor observado para X for superior a . O poder doteste para α = 1 e a probabilidade do erro do tipo II, são dados respectivamentepor:

a)

b)

c)

d)

e)

33. (FCC/MPE-PE – Analista Ministerial/2006) Para a variável aleatória X,observou-se uma amostra aleatória de 6 elementos, a saber: 62, 63, 66, 70, 71 e72. Considerando-se [63, 71] um intervalo de confiança para a mediana de X,esse intervalo tem coeficiente de confiança dado, aproximadamente, por:

a) 0,97;b) 0,95;c) 0,88;d) 0,78;

e) 0,72.

34. (FCC/MPE-PE – Analista Ministerial/2006) Seja X uma variável aleatóriaassumindo os valores −2 e 2, com probabilidades 1/4 e 3/4, respectivamente.Seja μ a média de X. Então o limite superior de , obtido peladesigualdade de Tchebycheff, é dado por:

a) 0,40;b) 0,25;c) 0,20;d) 0,12;e) 0,10.

35. (FCC/MPE-PE – Analista Ministerial/2006) Com relação à teoria geral daamostragem, é incorreto afirmar:

a) Quanto menor o erro padrão da estimativa, menor será a confiabilidade e aprecisão da estimativa;

b) Em uma amostra por conglomerados a população é dividida em subpopulaçõesdistintas;

c) A realização da amostragem aleatória simples só é possível se o pesquisador possuiruma lista completa de cada unidade amostral;

d) Um estimador é considerado não viciado quando sua esperança é igual ao valorpopulacional que está sendo pesquisado;

e) Amostragem estratificada consiste na divisão de uma população em grupos segundoalguma característica conhecida. Os estratos da população devem ser mutuamenteexclusivos.

36. (FCC/MPE-PE – Analista Ministerial/2006) Em uma pesquisa de mercado foiestimado que 50% das pessoas entrevistadas preferem a marca X de umproduto. Se, com base no resultado dessa pesquisa, quisermos fazer outra paraestimar novamente esta preferência, o tamanho de amostra aleatória simplesnecessário, para que tenhamos um erro amostral de 0,02 com probabilidade de95%, deverá ser:(Dado: utilize a aproximação P(-2 ≤ Z ≤ 2) = 0,95, em que Z éa Normal Padrão.)

a) 1000;b) 1024;

c) 2500;d) 1900;e) 2000.

Gabarito – Inferência Estatística

1. B2. C3. A4. E5. E6. C7. B8. B9. E10. D11. A12. D13. E14. C15. E16. C17. Certo18. Errado19. Errado20. Certo21. Certo22. Errado23. Errado24. Errado25. Certo26. Errado27. B28. D29. D

30. A31. D32. C33. D34. B35. A36. C

8.6 TEORIA DAS PEQUENAS AMOSTRAS – “T” DE STUDENTE QUI QUADRADO

1. (FCC/TRF/1 – Analista Judiciário/2001) Uma moeda é lançada duas vezes econsidere a variável aleatória X = número de caras em dois lançamentos. Para100 repetições desse experimento observou-se:

Fazendo-se uso de um teste de aderência para se testar se a distribuição de X ébinomial com parâmetros n = 2 e p = 0,4, o valor observado da estatística quiquadrado apropriada ao teste é:

a)

b)

c)

d)

e)

2. (FCC/MPE-PE – Analista Ministerial/2006) Considere a tabela a seguir para oteste, em que P(qui quadrado ≥ vc) = p.

A opinião sobre o atendimento (entre bom, regular e ruim) aos pacientes em doishospitais públicos foi estudada em duas cidades. Na cidade A sorteou-se 200usuários e destes 50 classificaram como regular, 70 classificaram como ruim e osdemais classificaram como bom o atendimento do hospital A. Na cidade B foramsorteados 200 usuários e 120 classificaram como bom, 50 como regular e osdemais classificaram como ruim o atendimento do hospital B. Utilizou-se o testedo qui quadrado para avaliar se existe diferença no grau de satisfação com oshospitais das duas cidades. O valor observado do qui quadrado e a decisão doteste no nível de 5% de significância são respectivamente:

a) 24, existe diferença significativa de opinião entre as cidades;b) 24, não existe diferença significativa de opinião entre as cidades;c) 25, existe diferença significativa de opinião entre as cidades;d) 26, existe diferença significativa de opinião entre as cidades;e) 26, não existe diferença significativa de opinião entre as cidades.

3. (FCC/MPE-PE – Analista Ministerial/2006) Considerando os testes nãoparamétricos, é incorreto afirmar:

a) Os testes não paramétricos são usados quando as variáveis do estudo não possuemdistribuição normal.

b) Para se utilizar os testes não paramétricos, as variáveis de estudo podem ter escalade medida ordinal.

c) Os testes não paramétricos podem ser chamados também de livre distribuição.d) O teste não paramétrico de Mann-Whitney é baseado nos postos dos valores das

variáveis de estudo envolvidas.e) O teste t é menos poderoso que o teste de Mann-Whitney quando temos populações

normais.

4. (Esag/TJ-MA – Analista Judiciário/2005) Nos problemas de estimativa de média

utiliza-se a variável “t” de Student quando:

a) a distribuição original é normal, o desvio padrão da população é conhecido e otamanho da amostra é inferior a 30;

b) a distribuição original não é normal, o desvio padrão da população é conhecido e otamanho da amostra é inferior a 30;

c) a distribuição original é normal, o desvio padrão da população é desconhecido e otamanho da amostra é inferior a 30;

d) a distribuição original é normal, o desvio padrão da população é conhecido e otamanho da amostra é superior ou igual a 30.

5. (Esaf/MPU – Analista Pericial/2004) Considere o teste da hipótese H: μ = 100contra alternativa A: μ ≠ 100 em uma amostra da normal com média μ evariância σ2. O valor da estatística teste t com distribuição de Student sob ahipótese:H: μ =100 é de –1,7864 e sabe-se que P(t ≥ 1,7864) = 0,0446.Suponha que a probabilidade de erro do tipo I esteja sendo controlada em 5%.Assinale a resposta correta.

a) Como o valor probabilístico do teste é 0,0446 conclua H: μ =100.b) Como o valor probabilístico do teste é 0,0446 conclua A: μ ≠ 100.c) Como o valor probabilístico do teste é 0,0892 não há evidência para rejeitar H: μ =

100.d) Como o valor probabilístico do teste é 0,0223 conclua A: μ ≠ 100.e) Não se pode tirar nenhuma conclusão pois, o tamanho da amostra, a média

amostral e o desvio padrão amostral não foram dados.

Gabarito – Teoria das Pequenas Amostras – “t” de Student e Qui Quadrado

1. B2. A3. E4. C5. C

8.7 CORRELAÇãO E REGRESSÃO ESTATÍSTICA

1. (Esaf/MPU – Analista Pericial/2004) O vetor aleatório (X,Y) tem distribuiçãoconjunta com matriz de variâncias-covariâncias:

Assinale a opção que dá o valor do coeficiente de correlação entre X e Y.

a) 0,85;b) 0,25;c) 0,65;d) 0,95;e) 0,75.

2. (Esaf/MPU – Analista Pericial/2004) Considere as observações (2 2,5) e (3 10)correspondentes aos pares (x y) no modelo de regressão não linear:

em que θ é um parâmetro desconhecido e os εt são independentes com média zeroe variância σ2. Assinale a opção que dá o valor da variância assintótica doestimador de mínimos quadrados de θ.

a) σ2;b)

c)

d)

e)

O enunciado seguinte diz respeito às questões 3, 4, 5 e 6.Considere o modelo deregressão linear yt = α + βxt + εt com t = 1,…, n, em que α e β são parâmetrosdesconhecidos, os y t são observações de uma variável dependente Y, os xt sãorealizações de uma variável exógena X e os erros εt são realizações nãodiretamente observáveis de variáveis aleatórias não correlacionadas com médianula e variância σ2>0.

3. (Esaf/MPU – Analista Pericial/2004) No contexto da distribuição amostral doestimador de mínimos quadrados de β ( ), assinale a opção que não é correta.

a) O valor esperado da distribuição amostral de é β.b) A variância da distribuição amostral de aumenta com σ 2.c) A variância da distribuição amostral de diminui quando aumenta a variabilidade

das observações de X em torno da média.d) Como é constante para uma amostra particular qualquer do modelo de regressão,

não possui uma distribuição amostral.e) A distribuição amostral de é normal se os erros forem normalmente distribuídos.

4. (Esaf/MPU – Analista Pericial/2004) Suponha os erros normais. Se o intervalode confiança calculado para β inclui o zero pode-se concluir que:

a) O erro médio quadrático da regressão é nulo.b) O coeficiente de determinação é nulo.c) Não existe um efeito causal de X em Y mas pode haver um efeito causal de Y em X.d) Y não sofre influência linear de X.e) A função de regressão passa pela origem.

5. (Esaf/MPU – Analista Pericial/2004) No contexto do cálculo do intervalo deconfiança para α quando X=0 é um valor plausível para a regressão, assinale a

opção correta.

a) O intervalo coincide com o intervalo de previsão para uma nova observação de Yquando X=0.

b) O intervalo coincide com o intervalo para E(Y|X=0).c) Geralmente o intervalo terá limites iguais ao intervalo análogo calculado para β.d) O intervalo de confiança só deve ser calculado se o intervalo para β contiver o

zero.e) Tem pouco interesse prático se nenhuma das observações de X for exatamente nula.

6. (Esaf/MPU – Analista Pericial/2004) Os estimadores de mínimos quadrados e tendem a mostrar que tipo de comportamento quando a média das observaçõesde X é positiva?

a) São independentes.b) Variam na mesma direção, pois para uma amostra particular qualquer do modelo

subestima-se ou superestima-se a reta de regressão verdadeira.c) Variam em direções opostas, dado o sinal negativo da covariância entre eles.d) Variam na mesma direção, se o sinal de for positivo.e) Variam na mesma direção, se os sinais de e forem ambos positivos.

7. (Esaf/MPU – Analista Pericial/2004) O ajuste da regressão linear múltipla E(y)= β0 + β1 x1 + β2 x2 com erros normais produziu o plano de regressão:

em que os valores entre parênteses representam desvios padrão. Assinale a opçãocorreta.

a) A variável x1 é a mais importante como preditora de y uma vez que tem ocoeficiente maior.

b) O teste da hipótese β1 = 0 com nível de significância de 5% indica que x1 e y nãosão associadas.

c) O teste da hipótese β1 = 0 com nível de significância de 5% indica que x1 pode serretirada do modelo linear contendo o intercepto, x1 e x1.

d) A resposta esperada de y quando x1 = 4 e x2 = 1 é 35,77.e) O teste da hipótese β1 = 0 com nível de significância 5% indica que x1 não pode ser

retirada do modelo linear.

8. (Esaf/MPU – Analista Pericial/2004) Em um problema de regressão com errosnormais estamos interessados em prever uma observação futura. Quatrovariáveis independentes e um intercepto estão presentes no modelo. Seja Xh ovetor dessas variáveis. Tem-se interesse na observação futura Yh

correspondente a Xh=xh. Para 30 observações a estimativa do desvio padrão doestimador de E(Yh|Xh=xh) vale 1,20, a soma dos quadrados da regressãocorrigida pela média vale 383 e a soma de quadrados residuais vale 117.Assinale a opção que dá o valor da variância do preditor de Yh.

a) 5,94;b) 6,12;c) 1,44;d) 9,13;e) 7,18.

9. (Esaf/MPU – Analista Pericial/2004) Um analista estuda a relação existenteentre uma variável dependente (Y) e uma variável independente (X) para trêstipos de firma A, B e C. Nesse contexto para 18 observações (xt, yt) dessasvariáveis postula o modelo linear com erros normais

em que

são variáveis indicadoras da presença dos tipos de firma A e B, respectivamente.A análise estatística produziu os resultados seguintes:Análise de Variância

Fonte Graus de Liberdade Soma de Quadrados

Regressão 3 62.438

Erro 14 9.502

Total 17 71.940

Variável Estimativa Desvio padrão

Intercepto 6,7620 0,6879

D1 1,6880 0,4967

D2 4,2590 0,4815

X 0,1776 0,0409

Assinale a opção que dá o valor da estatística-teste associada ao teste da hipótesede que os tipos de firma A e C não diferem significativamente.

a) 5,00;b) 9,70;c) 8,85;d) 4,34;e) 3,40.

10. (FCC/TRF/1 – Analista Judiciário/2001) Sejam X e Y variáveis aleatórias com

coeficiente de correlação ρ. Se , os coeficientes de correlaçãode Z e W e de W e Y são dados, respectivamente, por:

a)

b)

c) −ρ e −1;d) ρ e −1;e) ρ e−1.

11. (FCC/MPE-PE – Analista Ministerial/2006) O modelo de regressão linearsimples y = α + βx + e foi ajustado a uma amostra de 12 pares deobservações. A equação de regressão obtida foi:

com coeficiente de explicação de 90% e soma de quadrados residuais igual a 40.Se tγ é o valor da distribuição t de Student, com 10 graus de liberdade tal que P(tγ< t < tγ), um intervalo de confiança para β, com confiança γ, é dado por:

a)

b)

c)

d)

e)

12. (FCC/MPE-PE – Analista Ministerial/2006) O Método de Mínimos QuadradosGeneralizado é:

a) um procedimento adequado para estimar os parâmetros de um modelo de regressãolinear na presença de heterocedasticidade;

b) um caso particular do Método de Mínimos Quadrados Ponderados;c) utilizado para estudar um Sistema de Equações Simultâneas;

d) um procedimento adequado para estimar os parâmetros de um modelo de regressãolinear quando as variáveis explicativas não são linearmente independentes;

e) um procedimento de estimação que deve ser usado quando todas as hipóteses domodelo de regressão linear não são válidas.

13. (FCC/MPE-PE – Analista Ministerial/2006) No modelo de Regressão Múltipla:

em que o termo aleatório é heterocedástico, é correto afirmar:

a) O estimador de mínimos quadrados ordinário de β é viciado.b) O estimador de mínimos quadrados ordinário de β tem variância mínima.c) Para o estimador de mínimos quadrados ordinário de β os testes sobre os

parâmetros, baseados na estatística t de Student, não são válidos.d) Não é possível detectar heterocedasticidade por meio da análise de resíduos.e) O melhor teste para detectar heterocedasticidade é o de Glejser.O enunciado

abaixo refere-se às questões de números 14 e 15.O modelo de regressão linearsimples

foi ajustado a uma amostra de 12 pares de observações. A equação de regressãoobtida foi , com coeficiente de explicação de 80% e soma de quadradosresiduais igual a 40.

14. (FCC/TRF/1 – Analista Judiciário/2001) O intervalo de confiança para β comcoeficiente de confiança de 96% é dado por:

a)

b)

c)

d)

e)

15. (FCC/TRF/1 – Analista Judiciário/2001) O coeficiente de correlação linearentre as variáveis x e u, com base nesta amostra é:

a)

b)

c)

d)

e)

Gabarito – Correlação e Regressão Estatística

1. B2. B3. D4. D5. B6. C7. C8. B9. E10. C11. A12. A13. C14. E15. D

8.8 TÓPICOS DIVERSOS

Texto para as questões 1 a 15

Um analista deseja estudar a relação entre o tempo de profissão e a renda médiamensal bruta de um grupo de 120 indivíduos. O gráfico a seguir permite determinar adispersão entre a renda média mensal bruta e o tempo de profissão.

Considerando Yi a variável que representa a renda média mensal bruta do i-ésimoindivíduo e Ti o seu respectivo tempo de profissão, esse analista evidenciou quatromodelos como possíveis candidatos. O primeiro modelo relaciona linearmente a rendacom o tempo de profissão segundo a equação Yi = β0 + β1 Ti + εi, em que εi representao erro aleatório com média zero e variância σ2, e β0 e β1 são os coeficientes do modelo.O segundo modelo é o modelo linear sem o intercepto, Yi = β2 Ti + εi, em que β2 é ocoeficiente do modelo. O terceiro e quarto modelos são dados, respectivamente, porln(Yi) = β3 + β4ln(Ti) + εi e ln(Yi) = β5 ln(Ti) + εi, em que β3, β4 e β5 são oscoeficientes dos modelos.

O quadro adiante apresenta alguns resultados de um programacomputacional de estatística com uma comparação sintética entre os modelos deacordo com o coeficiente de determinação (R2) e o critério de informação deAkaike (AIC).

Julgue os itens 1 a 15 a seguir, a partir dos dados fornecidos no texto III.

1. (Cespe-UnB/Paranaprevidência – Analista Previdenciário/2002) A renda médiamensal bruta esperada, E(Yi), de acordo com o primeiro modelo, é igual a β0 =β1Ti + εi.

2. (Cespe-UnB/Paranaprevidência – Analista Previdenciário/2002) O terceiro e oquarto modelos são modelos lineares.

3. (Cespe-UnB/Paranaprevidência – Analista Previdenciário/2002) O coeficientede correlação linear de Pearson entre a renda média mensal bruta e o tempo deprofissão é igual a 0,8.

4. (Cespe-UnB/Paranaprevidência – Analista Previdenciário/2002) Definindo-se oi-ésimo resíduo como a diferença entre a renda observada e a renda ajustadapelo modelo, a soma dos resíduos gerados pelo primeiro modelo é igual a zero.

5. (Cespe-UnB/Paranaprevidência – Analista Previdenciário/2002) Definindo-se oi-ésimo resíduo como a diferença entre a renda observada e a renda ajustadapelo modelo, a soma dos resíduos gerados pelo segundo modelo é igual a zero.

6. (Cespe-UnB/Paranaprevidência – Analista Previdenciário/2002) Para asinferências sobre os coeficientes dos modelos candidatos, caso sejam estimadosvia mínimos quadrados ordinários, não é necessário assumir que εi tenhadistribuição aproximadamente normal para grandes amostras.

7. (Cespe-UnB/Paranaprevidência – Analista Previdenciário/2002) Para oprimeiro modelo, o critério R2 é definido como a razão entre a soma dequadrados do modelo (SQM) e a soma de quadrados total (SQT).

8. (Cespe-UnB/Paranaprevidência – Analista Previdenciário/2002) O AIC baseia-sena teoria de decisão e utiliza o logaritmo da função de verossimilhança, compenalização sobre o número de parâmetros lineares utilizados no modelo.

9. (Cespe-UnB/Paranaprevidência – Analista Previdenciário/2002) O AIC é umcritério importante por ser absoluto: o modelo que produz o maior AIC éconsiderado o mais adequado.

10. (Cespe-UnB/Paranaprevidência – Analista Previdenciário/2002) O critério R2

do primeiro modelo não pode ser comparado diretamente com o R2 do segundomodelo.

Ainda considerando o texto (fornecido para a resolução das questões 1 a 15) esupondo que os resultados supra foram produzidos para o primeiro modelo porum programa computacional de estatística, julgue os itens que se seguem.11. (Cespe-UnB/Paranaprevidência – Analista Previdenciário/2002) A estimativa

do desvio padrão dos erros aleatórios é aproximadamente igual a dois saláriosmínimos.

12. (Cespe-UnB/Paranaprevidência – Analista Previdenciário/2002) A estimativado intercepto é estatisticamente significativa.

13. (Cespe-UnB/Paranaprevidência – Analista Previdenciário/2002) A razão treferente à estimativa do coeficiente β1 é aproximadamente igual a 0,005.

14. (Cespe-UnB/Paranaprevidência – Analista Previdenciário/2002) A razão F éuma estatística resultante da divisão entre a variabilidade devida ao modelosobre a variabilidade não explicada pelo modelo.

15. (Cespe-UnB/Paranaprevidência – Analista Previdenciário/2002) O teste F daAnova avalia a aleatoriedade residual do modelo, testando a hipótese nula,segundo a qual os resíduos são aleatórios, versus a alternativa, a qual consideraque os resíduos não são aleatórios.Texto para as questões 16 a 25Uma empresaadotou uma política de contratação de deficientes físicos. Para avaliar se asdeficiências afetam o desempenho desses empregados no trabalho, foi gerado o

seguinte quadro, a partir de uma avaliação dos 400 empregados dessa empresa.

Com relação aos dados apresentados, julgue os itens 16 a 25, a seguir:16. (Cespe-UnB/Paranaprevidência – Analista Previdenciário/2002) Se um

empregado for escolhido ao acaso, a probabilidade de ele ser considerado comotendo bom desempenho será igual a 0,50.

17. (Cespe-UnB/Paranaprevidência – Analista Previdenciário/2002) Se umempregado for escolhido ao acaso entre os empregados considerados comotendo bom desempenho, a probabilidade de ele ser cego será de 0,20.

18. (Cespe-UnB/Paranaprevidência – Analista Previdenciário/2002) Considere A oevento “o empregado é surdo” e B o evento “o empregado tem desempenhoregular”. Se um empregado for escolhido ao acaso entre os 400 avaliados, aprobabilidade de ele ser surdo e ter sido avaliado como tendo desempenhoregular, P(A ∩ B), será igual a Pa) × Pb) = 0,05.

19. (Cespe-UnB/Paranaprevidência – Analista Previdenciário/2002) Considere C oevento “o empregado é cego” e B o evento “o empregado tem desempenhoregular”. Se um empregado for escolhido ao acaso, a probabilidade condicional

será .20. (Cespe-UnB/Paranaprevidência – Analista Previdenciário/2002) Considere B o

evento “o empregado tem desempenho regular” e D o evento “o empregado temdesempenho bom”. Os eventos B e D são independentes, pois P(B ∩ D/) = 0.

21. (Cespe-UnB/Paranaprevidência – Analista Previdenciário/2002) A estatísticaqui quadrado usual para avaliar a associação entre o tipo de deficiência e odesempenho não pode ser empregada na situação descrita no texto.

22. (Cespe-UnB/Paranaprevidência – Analista Previdenciário/2002) O coeficientede correlação de Pearson não pode ser utilizado para avaliar a associação entre

o tipo de deficiência e o desempenho.23. (Cespe-UnB/Paranaprevidência – Analista Previdenciário/2002) Se o

desempenho independesse do tipo de deficiência, seriam esperados 20empregados surdos com desempenho regular.

24. (Cespe-UnB/Paranaprevidência – Analista Previdenciário/2002) Se doisempregados forem escolhidos ao acaso entre os vinte que possuem outrasdeficiências, a probabilidade de ambos terem apresentado bons desempenhos éigual a 0,1.

25. (Cespe-UnB/Paranaprevidência – Analista Previdenciário/2002) O coeficientede contingência é uma medida entre –1 e 1. Um valor negativo representa aexistência de associação negativa e um valor positivo representa a existênciade uma associação positiva.

26. (FCC/MPE-PE – Analista Ministerial/2006) É correto afirmar:

a) O Bootstrap é uma técnica computacional que não pode ser utilizada para estimar oerro padrão de um estimador.

b) São três tipos de Bootstrap: paramétrico, não paramétrico e bayesiano.c) O Bootstrap é uma técnica computacional exclusivamente não paramétrica.d) O Bootstrap é uma técnica computacional exclusivamente paramétrica.e) Se os dados y1, y2, …, yn são identicamente distribuídos com uma função de

distribuição F conhecida, o conjunto de dados bootstrap y1*, y2*, …, yn* é gerado apartir da distribuição empírica, , com uma distribuição discreta que atribuiprobabilidade 1/n para cada yi, i = 1, 2, …, n.Para responder às questões denúmeros 27 a 29, considere as tabelas a seguir.Elas fornecem alguns valoresda função de distribuição F(x). A tabela 1 refere-se à variável normal padrão,as tabelas 2 e 3 referem-se à variável t de Student com 15 e 16 graus deliberdade, respectivamente:

Tabela 1

x F(x)

1,60 0,945

1,64 0,950

2,00 0,977

Tabela 2

x F(x)

1,753 0,95

2,248 0,98

2,583 0,99

Tabela 3

x F(x)

1,746 0,95

2,235 0,98

2,567 0,99

27. (FCC/MPE-PE – Analista Ministerial/2006) Um engenheiro encarregado docontrole de qualidade deseja estimar a proporção p de lâmpadas defeituosasde um lote com base numa amostra de tamanho 400. Sabe-se, com base emexperiências anteriores, que p deve estar próximo de 0,5. Usando o teoremacentral do limite para estimar a amplitude do intervalo de confiança de 90%para p, podemos afirmar que tal amplitude é aproximadamente, igual a:

a) 0,041;b) 0,045;c) 0,058;d) 0,070;e) 0,082.

28. (FCC/MPE-PE – Analista Ministerial/2006) Seja X uma variável aleatória,com distribuição normal, com média μ e desvio padrão 6. Para o teste damédia μ = 11 contra μ = 13, retirou-se uma amostra aleatória de 100elementos de X, tendo-se observado para a média amostral o valor 12,2. Onível descritivo do teste é:

a) 0,012;

b) 0,023;c) 0,055;d) 0,064;e) 0,077;

29. (FCC/MPE-PE – Analista Ministerial/2006) Supondo-se que a porcentagem dareceita investida em educação, dos 600 municípios de uma região, temdistribuição normal com média μ, deseja-se estimar essa média. Para tanto sesorteou dentre esses 600, aleatoriamente e com reposição, 16 municípios e seobservou os percentuais investidos por eles em educação. Os resultadosindicaram uma média amostal de 8% e desvio padrão amostral de 2%. Umintervalo de confiança para μ, com coeficiente de confiança de 96%, é dadopor:

a) (8 ± 1,124)%;b) (8 ± 1,117)%;c) (8 ± 0,877)%;d) (8 ± 0,870)%;e) (8 ± 0,755)%.

30. (FCC/MPE-PE – Analista Ministerial/2006) Considere a tabela a seguir.

A B

Menores de 1 ano 9,6 55,5

1 a 4 0,4 2,2

5 a 14 0,3 0,7

15 a 24 0,7 1,3

25 a 44 1,3 2,8

45 a 64 7,6 11,0

65 e mais 54,6 58,1

Baseando-se na tabela supra, que apresenta o coeficiente de mortalidade poridade das localidades A e B, é correto afirmar:

a) As duas localidades apresentam coeficientes de mortalidade infantil semelhantes.b) A localidade A é mais desenvolvida que a localidade B, pois os coeficientes das

idades mais baixas são baixos enquanto que os coeficientes das idades mais altas sãoaltos.

c) A localidade B é mais desenvolvida que a localidade A, pois os coeficientes dasidades mais baixas são maisores que as idades mais altas.

d) Não existe diferença no padrão de mortalidade por idade entre as duas localidades.e) A localidade B é mais desenvolvida pois seu coeficiente de mortalidade infantil é

menor.

31. (FCC/MPE-PE – Analista Ministerial/2006) Para responder a esta questão,utilize o corpo da tabela a seguir, que fornece os valores fcrítico tais que P(F >fcrítico) = 0,05.

Para testar a hipótese da igualdade de médias da variável X de três grupos A, B eC, cada um contendo 6 observações, foi construída a tabela de análise devariância (Anova) a seguir.Utilizando os dados da tabela de análise de variânciafornecida supra, o valor de a (estatística F calculada) e a conclusão do teste, nonível de 5%, são:

a) a = 32 e a média dos grupos não é igual;

b) a = 32 e a média dos grupos é igual;c) a = 30 e a média dos grupos não é igual;d) a = 16 e a média dos grupos não é igual;e) a = 16 e a média dos grupos é igual.

32. (FCC/MPE-PE – Analista Ministerial/2006) A pirâmide etária de umapopulação é uma importante ferramenta para se ter a noção de váriosaspectos demográficos do país. Com relação à apresentação das pirâmidesetárias, é incorreto afirmar:

a) A pirâmide etária de um país em um dado ano reflete as mudanças anteriores comrelação à mortalidade, natalidade e migração.

b) Uma pirâmide com base larga e topo afinado representa uma população com altocoeficiente de natalidade e alta mortalidade.

c) Uma pirâmide com base e topo de larguras semelhantes (forma de barril ou colmeia)representa países com baixa taxa de natalidade e baixos coeficientes demortalidade.

d) Quanto maior o coeficiente de natalidade, mais larga é a base da pirâmide.e) Quanto maior o coeficiente de mortalidade infantil do país, mais largo é o topo da

pirâmide etária do país.Considere que, em um ambiente de trabalho industrial,as seguintes medições acerca da poluição do ar tenham sido observadas: 1, 6,4, 3, 2, 3, 1, 5, 1, 4. Nessas situação, julgue os itens 33 a 41 que se seguem.

33. (Cespe-UnB/TST – Analista Judiciário/2008) A terceira e a oitava estatísticasde ordem são respectivamente iguais a 4 e 5.

34. (Cespe-UnB/TST – Analista Judiciário/2008) A média podada a 20% (ou20%-trimmed mean) é inferior a 3.

35. (Cespe-UnB/TST – Analista Judiciário/2008) A média winsorizada a 20% éinferior a 3.

36. (Cespe-UnB/TST – Analista Judiciário/2008) A mediana da amostra é igual a2,5 e é uma L-estimativa da média populacional.

37. (Cespe-UnB/TST – Analista Judiciário/2008) As médias harmônica egeométrica são ambas inferiores a 3.

38. (Cespe-UnB/TST – Analista Judiciário/2008) O terceiro quartil é igual a 3.39. (Cespe-UnB/TST – Analista Judiciário/2008) A variância amostral é superior

a 2,8.40. (Cespe-UnB/TST – Analista Judiciário/2008) A estatística definida pela

diferença entre a mediana amostral e a média amostral é uma L-estimativada assimetria da distribuição.

41. (Cespe-UnB/TST – Analista Judiciário/2008) Considere-se que os valoresobservados acerca da poluição do ar sejam realizações independentes de umadistribuição de Poisson com média constante. Nessa situação, pelo método damáxima verossimilhança, a probabilidade de se observar valores nulos na

amostra é estimada igual a .Entre os muitos resultados mensalmenteanalisados a partir da Pesquisa Mensal de Emprego (PME), realizada peloIBGE, a estimativa da população com 50 anos ou mais de idade chamaatenção pela sua crescente participação no total da população em idadeativa. Segundo os dados da pesquisa, comparando os meses de maio de 2002 emaio de 2006, no total das seis regiões metropolitanas investigadas, estecontingente cresceu de 8,15 milhões para 10 milhões de pessoas, ou seja, umavariação de 22,8%. A proporção de pessoas ativas com 50 anos ou mais emrelação ao total de pessoas em idade ativa, nesse mesmo período, passou de22,4% para 25,3%. No universo de pessoas ocupadas, esse comportamento serepete. Em maio de 2002, havia 2,7 milhões de pessoas ocupadas com 50 anosou mais — 15,4% da população ocupada total —, passando, em maio de 2006,para 3,6 milhões — 18,1% da população ocupada total. No período emquestão, a população ocupada com 50 anos ou mais cresceu 34%. A proporçãode pessoas com 50 anos ou mais voltadas para o mercado de trabalhoexpressa pela taxa de atividade foi estimada, em maio de 2002, em 34,8%, eapresentou crescimento ano a ano até atingir, em maio de 2005, 38,6% daspessoas nessa faixa etária; recuou, a seguir, em maio de 2006, para37,5%.IBGE. O trabalho a partir dos 50 anos de idade: pesquisa mensal deemprego (Recife, Salvador, Belo Horizonte, Rio de Janeiro, São Paulo e PortoAlegre). Internet: <www.ibge.gov.br> (com adaptações).Considerando o

texto supra, julgue os itens 42 a 48 subsequentes.42. (Cespe-UnB/TST – Analista Judiciário/2008) Parte do universo de pessoas

ocupadas é formada por pessoas que exerceram trabalho, remunerado ounão, durante pelo menos uma hora completa, na semana imediatamenteanterior à pesquisa.

43. (Cespe-UnB/TST – Analista Judiciário/2008) A população em idade ativa,que pode ser corretamente dividida em três subgrupos, ou subpopulações,mutuamente exclusivos, é formada por pessoas com idades entre 15 e 64anos.

44. (Cespe-UnB/TST – Analista Judiciário/2008) Em maio de 2002, havia mais de35 milhões de pessoas em idade ativa nas seis regiões metropolitanasinvestigadas pela PME.

45. (Cespe-UnB/TST – Analista Judiciário/2008) A população economicamenteativa de pessoas com 50 anos ou mais de idade, em maio de 2006, erasuperior a 3,5 milhões de pessoas.

46. (Cespe-UnB/TST – Analista Judiciário/2008) Em maio de 2006, a taxa deocupação entre as pessoas com 50 anos ou mais de idade foi superior a 93%.

47. (Cespe-UnB/TST – Analista Judiciário/2008) No período de maio de 2002 amaio de 2006, a população ocupada total cresceu mais de 15%.

48. (Cespe-UnB/TST – Analista Judiciário/2008) Em maio de 2006, o contingentede desocupados com 50 anos ou mais de idade era de 6,4 milhões depessoas.Considere que X1, X2, …, Xn seja uma amostra aleatória simples de

uma distribuição X, cuja função de densidade é dada por para 0 ≤x ≤ 2, e f (x) = 0 para x < 0 ou x > θ, em que θ > 0.Com base nessasinformações, julgue os itens 49 a 57 a seguir.

49. (Cespe-UnB/TST – Analista Judiciário/2008) A moda da distribuição de X é

superior a .50. (Cespe-UnB/TST – Analista Judiciário/2008) O primeiro quartil da

distribuição de X é inferior a .51. (Cespe-UnB/TST – Analista Judiciário/2008) O valor da média de X é inferior

ao valor da mediana de X.

52. (Cespe-UnB/TST – Analista Judiciário/2008) é uma estatísticasuficiente minimal para θ.

53. (Cespe-UnB/TST – Analista Judiciário/2008) A média amostral é oestimador de máxima verossimilhança para θ.

54. (Cespe-UnB/TST – Analista Judiciário/2008) A estatística é umestimador não viciado (ou não tendencioso) para θ.

55. (Cespe-UnB/TST – Analista Judiciário/2008) Realizações de X podem serobtidas por meio de , em que U é uma distribuição uniforme nointervalo [0, θ].

56. (Cespe-UnB/TST – Analista Judiciário/2008) A expressão é umestimador de momentos para θ.

57. (Cespe-UnB/TST – Analista Judiciário/2008) A distribuição amostral do 3o

quartil da amostra aleatória X1, X2, …, Xn é assintoticamente normal, com

média e variância .Um estudo sobre a segmentação do mercado detrabalho comparou o salário daquele que trabalha por conta própria (Y, emR$ mil) com o salário daquele que tem a carteira assinada (X, em R$ mil). Foiajustado um modelo de regressão linear na forma Y = ax + b + g, em que ae b são os coeficientes do modelo e g representa um erro aleatório com médiazero e desvio padrão σ. As estimativas de mínimos quadrados ordinários paraos coeficientes a e b foram respectivamente iguais a 0,5 e R$ 6 mil. Aquantidade de observações utilizadas para o ajuste do modelo foi igual a 400,e os desvios padrão amostrais de Y e X foram, respectivamente, iguais a R$ 2mil e R$ 1,5 mil.Com base nessas informações, julgue os itens subsequentes.

58. (Cespe-UnB/TST – Analista Judiciário/2008) A correlação linear de Pearsonentre Y e X é inferior a 0,45.

59. (Cespe-UnB/TST – Analista Judiciário/2008) A estimativa de σ2 é superior a3.

60. (Cespe-UnB/TST – Analista Judiciário/2008) A razão F da Anova para se

testar a hipótese nula H0: a = 0 versus H0: a ≠ 0 é superior a 60.61. (Cespe-UnB/TST – Analista Judiciário/2008) O valor absoluto da estatística t

do teste H0: a = 0 versus H0: a ≠ 0 é superior a 8.62. (Cespe-UnB/TST – Analista Judiciário/2008) A estimativa da variância de ,

em que é o estimador de mínimos quadrados para α, é superior a 0,01.63. (Cespe-UnB/TST – Analista Judiciário/2008) O desvio padrão da reta

ajustada é superior a 0,09.64. (Cespe-UnB/TST – Analista Judiciário/2008) O coeficiente de determinação

ajustado (ou R2 ajustado) é superior a 0,15 (ou 15%).65. (Cespe-UnB/TST – Analista Judiciário/2008) Considere-se a situação em que

seja feito um ajuste na forma invertida X = αy + β + δ, em que δ representaum erro aleatório com média zero e desvio padrão constante, e α e β são oscoeficientes do modelo. Nessa situação, o coeficiente de determinação dessemodelo é inferior a 15% e a estimativa de mínimos quadrados para ocoeficiente α é igual a 2.

66. (Cespe-UnB/TST – Analista Judiciário/2008) Considere-se a reta que passana origem Y = λx + δ, em que δ representa um erro aleatório com médiazero e desvio padrão constante. Nesse caso, se a média de X for igual a R$ 5mil, então a estimativa de mínimos quadrados para o coeficiente δ seráinferior a 0,5.

Gabarito

1. Errado2. Certo3. Certo4. Certo5. Errado6. Certo7. Certo8. Certo9. Errado

10. Certo11. Certo12. Errado13. Errado14. Certo15. Errado16. Certo17. Certo18. Errado19. Errado20. Errado21. Certo22. Certo23. Certo24. Errado25. Errado26. B27. E28. B29. A30. B31. D32. E33. Errado34. Certo35. Certo36. Errado37. Certo38. Errado39. Certo40. Certo

41. Errado42. Certo43. Errado44. Certo45. Certo46. Certo47. Errado48. Errado49. Errado50. Certo51. Errado52. Errado53. Errado54. Certo55. Errado56. Certo57. Certo58. Certo59. Certo60. Certo61. Certo62. Errado63. Certo64. Errado65. Errado66. Errado

Referências Bibliográficas

COSTA NETO, Pedro Luiz de Oliveira. Estatística. São Paulo: Edgard Blücher Ltda, 1977.

FREUND John E, (1967). Modern Elementary Statistics. 30ª ed. Englewood Cliffs, New Jersey: Prentice-Hall;.

HSU, H. Probability, Random Variables & Random Processes. New York: Mc-Graw Hill, 1997.

KMENTA Jan. Elements of Econometrics. New York: Macmillan, 1971.

MOOD Alexander M, Graybill Franklin A, Boes Duane C. Introduction to the Theory of Statistcs. London: Mc-Graw Hill, 30ª

ed., 1974.

MORGADO, Augusto César de de Oliveira CARVALHO, João Bosco Pitombeira de; CARVALHO, Paulo C. Pinto;

FERNANDEZ Pedro, (1991). Análise Combinatória e Probabilidade. Rio de Janeiro: Impa, 1991.

PEREIRA, Wlademir; KIRSTEN, José Tiacci; ALVES, Walter. Estatística para as Ciências Sociais. São Paulo: Saraiva, 1980.

SALVATORE D, e REAGLE, D. Statistics and Econometrics. New York: Mc-Graw Hill, 2ª ed., 2002.

SPIEGEL M.R. Estatística. São Paulo: Mc-Graw Hill do Brasil, 1977.

APÊNDICE 1

TABELA DA DISTRIBUIÇÃO NORMAL-PADRÃO

APÊNDICE 2

TABELA DA DISTRIBUIÇÃO T DE STUDENT

APÊNDICE 3

TABELA DA DISTRIBUIÇÃO DE QUI QUADRADO

APÊNDICE 4

TABELA DA DISTRIBUIÇÃO F