apostila de estatistica

41
UNIVERSIDADE FEDERAL DE CAMPINA GRANDE - Campus de Campina Grande UNIDADE ACADÊMICA DE ESTATÍSTICA Disciplina: Introdução à Estatística Período 2015.1 Professores: Amanda Gomes e Manoel Santos-Neto Aluno(a): NOTAS DE AULA PARA O 1 o ESTÁGIO 1 Introdução à Inferência Estatística 1.1 Introdução A Estatística é uma ciência que tem como objetivo a tomada de decisão em situações de incerteza. Esta ciência divide-se basicamente em duas partes. A primeira parte é conhecida como Estatística Descritiva, e trata da coleta, organização e descrição de dados. A segunda é a Estatística Inferencial, e se preocupa em fazer afirmações e/ou testar hipóteses sobre características numéricas em situações de incerteza. Para iniciar o estudo da Estatística Inferencial é necessário compreender os seguintes conceitos básicos: Definição 1.1 (População). A população é um conjunto formado por todos os ele- mentos que possuem pelo menos uma característica em comum observável. Exemplo 1: Se o problema a ser pesquisado está relacionado com a qualidade de um certo produto produzido numa indústria, a população pode ser composta por todas as peças produzidas numa determinada hora, turno, dia ou mês, dependendo dos objetivos; Exemplo 2: Se o objetivo de um estudo é pesquisar o nível de renda familiar de uma certa cidade, a população seria todas as famílias desta cidade. Mas, se o objetivo fosse pesquisar apenas a renda mensal do chefe da família, a população a ser pesquisada seria composta por todos os chefes de família desta cidade. Definição 1.2 (Amostra). A Amostra é apenas uma parte da população, ou seja, é qualquer subconjunto não vazio da população. Vários motivos levam a necessidade de se observar apenas uma parte da população, como, por exemplo: a falta de tempo, recursos financeiros e/ou humanos. A amostra deve ser obtida através de técnicas de amostragem, as quais tem como objetivo principal garantir a representatividade da população, ou seja, fazer com que a amostra seja um retrato fiel da população. Exemplos de amostra podem ser considerados por conjuntos formados por apenas uma parte dos elementos populacionais descritos nos exemplos 1 e 2. 1

Upload: pedro-simoes

Post on 15-Jan-2016

172 views

Category:

Documents


18 download

DESCRIPTION

Introdução à Inferência Estatística1.1 IntroduçãoA Estatística é uma ciência que tem como objetivo a tomada de decisão em situaçõesde incerteza. Esta ciência divide-se basicamente em duas partes. A primeira parte éconhecida como Estatística Descritiva, e trata da coleta, organização e descrição dedados. A segunda é a Estatística Inferencial, e se preocupa em fazer afirmações e/outestar hipóteses sobre características numéricas em situações de incerteza.Para iniciar o estudo da Estatística Inferencial é necessário compreender os seguintesconceitos básicos:Definição 1.1 (População). A população é um conjunto formado por todos os elementosque possuem pelo menos uma característica em comum observável.Exemplo 1: Se o problema a ser pesquisado está relacionado com a qualidade deum certo produto produzido numa indústria, a população pode ser composta por todas aspeças produzidas numa determinada hora, turno, dia ou mês, dependendo dos objetivos;Exemplo 2: Se o objetivo de um estudo é pesquisar o nível de renda familiar de umacerta cidade, a população seria todas as famílias desta cidade. Mas, se o objetivo fossepesquisar apenas a renda mensal do chefe da família, a população a ser pesquisada seriacomposta por todos os chefes de família desta cidade.Definição 1.2 (Amostra). A Amostra é apenas uma parte da população, ou seja, équalquer subconjunto não vazio

TRANSCRIPT

Page 1: Apostila de Estatistica

UNIVERSIDADE FEDERAL DE CAMPINA GRANDE - Campus de Campina GrandeUNIDADE ACADÊMICA DE ESTATÍSTICADisciplina: Introdução à Estatística Período 2015.1Professores: Amanda Gomes e Manoel Santos-NetoAluno(a):

NOTAS DE AULA PARA O 1o ESTÁGIO

1 Introdução à Inferência Estatística

1.1 Introdução

A Estatística é uma ciência que tem como objetivo a tomada de decisão em situaçõesde incerteza. Esta ciência divide-se basicamente em duas partes. A primeira parte éconhecida como Estatística Descritiva, e trata da coleta, organização e descrição dedados. A segunda é a Estatística Inferencial, e se preocupa em fazer afirmações e/outestar hipóteses sobre características numéricas em situações de incerteza.

Para iniciar o estudo da Estatística Inferencial é necessário compreender os seguintesconceitos básicos:

Definição 1.1 (População). A população é um conjunto formado por todos os ele-

mentos que possuem pelo menos uma característica em comum observável.

Exemplo 1: Se o problema a ser pesquisado está relacionado com a qualidade deum certo produto produzido numa indústria, a população pode ser composta por todas aspeças produzidas numa determinada hora, turno, dia ou mês, dependendo dos objetivos;

Exemplo 2: Se o objetivo de um estudo é pesquisar o nível de renda familiar de umacerta cidade, a população seria todas as famílias desta cidade. Mas, se o objetivo fossepesquisar apenas a renda mensal do chefe da família, a população a ser pesquisada seriacomposta por todos os chefes de família desta cidade.

Definição 1.2 (Amostra). A Amostra é apenas uma parte da população, ou seja, é

qualquer subconjunto não vazio da população.

Vários motivos levam a necessidade de se observar apenas uma parte da população,como, por exemplo: a falta de tempo, recursos financeiros e/ou humanos. A amostra deveser obtida através de técnicas de amostragem, as quais tem como objetivo principal garantira representatividade da população, ou seja, fazer com que a amostra seja um retrato fielda população.

Exemplos de amostra podem ser considerados por conjuntos formados por apenas umaparte dos elementos populacionais descritos nos exemplos 1 e 2.

1

Page 2: Apostila de Estatistica

Dois novos conceitos estreitamente relacionados com os de população e amostra sãoos de Parâmetro e Estatística, tendo em vista que:

Definição 1.3 (Parâmetro). É uma medida numérica que descreve uma caracterís-

tica da população, ou ainda, que é obtida a partir de todos os dados populacionais(através de um censo).

Exemplo 3: Identificando a população pela variável aleatória X, seriam parâmetrosa Média de X (µ) e a sua Variância (σ2).

Definição 1.4 (Estatística). É uma medida que descreve uma característica numérica

da amostra, ou ainda, que é obtida a partir de dados amostrais, e que será usada paraextrair informações sobre a população.

Exemplo 4: média amostral (X), variância amostral (S2), etc.

Os parâmetros não apresentam incerteza sobre seu real valor. Por outro lado, asestatísticas podem apresentar diferentes valores, se obtidas a partir de diversas amostras.

Definição 1.5 (Inferência Estatística). É o ato de generalizar resultados da parte

(amostra) para o todo (população).

Basicamente a inferência estatística trabalha com a estimação de parâmetros e comtestes de hipóteses sobre a população baseados na amostra.

Definição 1.6 (Estimador). Um estimador é uma estatística empregada para estimar

ou inferir o valor de um parâmetro desconhecido.

Um exemplo de estimador é a média amostral X.

Notação: θ

Definição 1.7 (Estimativa). É o valor assumido pelo estimador em uma particular

amostra.

1.2 Amostragem

Definição 1.8 (Amostragem). É a obtenção da amostra.

Para isto, existem várias técnicas de amostragem que podem ser utilizadas, as principaissão:

2

Page 3: Apostila de Estatistica

(i) Amostragem Aleatória Simples

Este tipo de amostragem consiste em selecionar a amostra através de um sorteio,sem restrição. A amostragem aleatória simples tem a seguinte propriedade: qual-quer subconjunto da população, com o mesmo número de elementos, tem a mesmaprobabilidade de fazer parte da amostra.

Exemplo 5: Com o objetivo de estudar algumas características dos alunos de umacerta disciplina, vamos extrair uma amostra aleatória simples de tamanho cinco. Alistagem dos alunos da disciplina é apresentada a seguir.

População: alunos da disciplina

Analigia Anderson Anna Carolina Arthur BrunaCamila Carlos Cesar Carlos Raiff Chrystiano CiceroDaniela Danilo Davi Diego EwertonFabiana Fabiano Felipe Herusca IsabeleJordanye Jose Orlando Kllydevan Lindembergue LuannaLuiz Gustavo Maecio Magna Maira MarciaMaria do Socorro Marina Matheus Nailton NilmanOscar Osnes Patricia Raquel ReinaldoRenato Roberta Rodrigo Azevedo Rodrigo de Brito RonaldoSoter Stella Taise Thiago Ygor

Um procedimento simples seria enumerar todos os elementos da população e atravésde sorteio retirar uma amostra de tamanho 5 desta população. Existem vários meca-nismos de sorteio, o importante é que haja aleatoriedade no processo. (Usar tabelade números aleatórios, considerando valores da quinta coluna, de baixo para cima.)

(ii) Amostragem Sistemática

Em muitas situações podemos realizar uma amostragem através de uma maneirasistemática. Um procedimento simples para determinar a forma como a amostra seráretirada é o seguinte: suponha que de uma população de tamanho N , queremosretirar uma amostra de tamanho n. Assim, podemos retirar, sistematicamente, umelemento a cada N

nelementos da população, considerando a população numerada de

1 à N . Para garantir que cada elemento da população tenha a mesma probabilidadede pertencer à amostra, deve-se sortear o primeiro elemento dentre os N

nelementos.

Observação: Quando o resultado de Nn

não for um número inteiro, recomenda-searredondar o resultado para o menor inteiro mais próximo.

Exemplo 6: No exemplo anterior, utilize uma amostragem sistemática para obteruma amostra de tamanho n = 5. Use a tabela de números aleatórios, considerandoa sétima linha, da esquerda para a direita.

Observação: Se o interesse fosse selecionar uma amostra de tamanho n = 6, ese considerássemos a primeira linha tabela de números aleatórios, da direita para aesquerda, teríamos:

3

Page 4: Apostila de Estatistica

(iii) Amostragem Estratificada

A técnica da amostragem estratificada consiste em dividir a população em subgrupos,que denominaremos estratos. Os estratos possuem as seguintes características: sãointernamente homogêneos e externamente heterogêneos. Podemos ter dois tipos deamostragem estratificada, a proporcional e a uniforme.

(a) Amostragem Estratificada proporcional: neste caso particular de amostragemestratificada, a proporcionalidade do tamanho de cada estrato da população émantida na amostra com o objetivo de torná-la bem significativa, ou seja comas mesmas características da população.Exemplo 7: Com o objetivo de levantar o estilo de liderança preferido pelacomunidade de uma escola, vamos realizar um levantamento por amostragem. Apopulação é composta por 10 servidores técnico-administrativos, 10 professorese 30 alunos, que identificaremos da seguinte maneira:

População

Servidores: S1 S2 S3 S4 S5 S6 S7 S8 S9 S10Professores: P1 P2 P3 P4 P5 P6 P7 P8 P9 P10Alunos: A1 A2 A3 A4 A5 A6 A7 A8 A9 A10

A11 A12 A13 A14 A15 A16 A17 A18 A19 A20A21 A22 A23 A24 A25 A26 A27 A28 A29 A30

Supondo que a preferência quanto ao estilo de liderança possa ser relativamentehomogênea dentro de cada categoria, vamos realizar uma amostragem estrati-ficada, proporcional por categoria, para obter uma amostra global de tamanho10, utilizando para isto a tabela de números aleatórios. Para o estrato SERVI-DORES, comece do início da segunda linha; para o estrato PROFESSORES,comece no início da quinta coluna; e para o estrato ALUNOS, comece no inícioda última coluna. (Percorra a tabela da esquerda para a direita e de cima parabaixo).

(b) Amostragem Estratificada Uniforme: seleciona-se a mesma quantidade de ele-mentos em cada estrato.A amostragem estratificada uniforme costuma ser usada em situações em queo maior interesse é obter estimativas separadas para cada estrato, ou ainda,quando se deseja comparar os diversos estratos. No exemplo anterior, para sele-cionar uma amostra estratificada uniforme de tamanho 12, devemos selecionar4 indivíduos de cada estrato. (Utilize a tabela de números aleatórios, seguindoas mesmas orientações do item (a) para cada estrato.)

4

Page 5: Apostila de Estatistica

1.2.1 Tamanho de uma Amostra Aleatória Simples

Definição 1.9 (Erro Amostral). É a diferença entre o valor que a estatística pode

acusar e o verdadeiro valor do parâmetro que se deseja estimar.

Para determinar o tamanho da amostra, o pesquisador precisa especificar o erro amostraltolerável, ou seja, o quanto ele admite errar na avaliação dos parâmetros de interesse.

A especificação do erro amostral tolerável deve ser feita sob um enfoque probabilístico,pois, por maior que seja a amostra, existe sempre o risco de o sorteio gerar uma amostracom características bem diferentes da população de onde ela está sendo extraída.

Uma fórmula para o cálculo do tamanho mínimo da amostra

Sejam:

N tamanho da população;

n tamanho da amostra;

n0 uma primeira aproximação para o tamanho da amostra;

E0 erro amostral tolerável.

Um primeiro cálculo do tamanho da amostra pode ser feito, mesmo sem conhecer otamanho da população, através da seguinte expressão:

n0 =1

E20

, onde 0 < E0 < 1.

Conhecendo o tamanho N da população, podemos corrigir o cálculo anterior, por

n =Nn0

N + n0

.

Exemplo 8: Planeja-se um levantamento por amostragem para avaliar diversas ca-racterísticas da população das N = 200 famílias moradoras de um certo bairro. Estascaracterísticas (parâmetros) são especialmente do tipo percentagens, tais como, a per-centagem de famílias que usam programas de alimentação popular, a percentagem defamílias que moram em casas próprias, etc. Qual deve ser o tamanho mínimo de umaamostra aleatória simples, tal que possamos admitir, com alta confiança, que os errosamostrais não ultrapassem 4% (E0 = 0, 04)?

Exemplo 9: Considerando os objetivos e os valores fixados no exemplo anterior, qualdeveria ser o tamanho da amostra se a pesquisa fosse estendida para toda a cidade, quecontém 200.000 famílias residentes?

5

Page 6: Apostila de Estatistica

Definição 1.10 (Amostra Aleatória Simples - AAS). Variáveis aleatórias X1, X2, ..., Xn

constituem uma amostra aleatória simples de tamanho n, ou simplesmente amostraaleatória (a.a.) de uma variável aleatória (v.a) X, quando satisfazem as seguintescondições:

1) As variáveis aleatórias X1, X2, ..., Xn são independentes, e

2) Cada uma das variáveis aleatórias Xi, i = 1, 2, ..., n têm a mesma distribuiçãode probabilidade da variável X.

Exemplo 10: Considere uma população formada pelos seguintes elementos {1, 3, 5, 5, 7}.Considere a variável X: valor assumido pelo elemento na população. Assim, a distribuiçãode probabilidade de X é dada por:

X = x 1 3 5 7P (X = x)

Observações:

1) E(X) =

2) V ar(X) =

Considere todas as amostras possíveis de tamanho 2, com reposição, da populaçãocuja distribuição é dada acima. Além disso considere X1 o número selecionado na primeiraextração e X2 o número selecionado na segunda extração. Assim, podemos construir adistribuição de probabilidades conjunta de (X1, X2) e as distribuições marginais de X1 eX2. Observe que X1 e X2 são independentes e têm distribuições iguais à distribuição deX.

6

Page 7: Apostila de Estatistica

1.3 Distribuições Amostrais

Definição 1.11. Dada uma amostra aleatória X1, X2, ..., Xn de uma população X,

definiremos uma estatística T como qualquer função de X1, X2, ..., Xn, ou seja T =f(X1, X2, ..., Xn).

Assim, dada uma amostra aleatória X1, X2, ..., Xn, um exemplo de estatística seria amédia amostral

X =1

n(X1 + X2 + · · ·+ Xn).

Sendo X1, X2, ..., Xn uma amostra aleatória da variável X, uma pergunta naturalseria o que acontece com a estatística T quando retiramos todas as amostras de umapopulação conhecida segundo um plano amostral adotado, ou seja qual a distribuição de Tquando X1, X2, ..., Xn assume todos os valores possíveis. Essa distribuição será chamadade distribuição amostral da estatística T .

Exemplo 11: Considerando o Exemplo 10, podemos construir a distribuição de al-gumas estatísticas, como por exemplo a distribuição de X = 1

n(X1 + X2 + · · · + Xn) e

S2 =∑n

i=1(Xi −X)2/(n− 1), por exemplo.

Assim, teríamos

X = x TotalP (X = x)

S2 = s2 TotalP (S2 = s2)

Observações:

7

Page 8: Apostila de Estatistica

1) Note que E(X) = E(X1) = E(X2) = E(X) = 4, 2, e que V ar(X) = V ar(X)/2 =2, 08;

2) Podemos observar que E(S2) = 4, 16 = σ2.

Seria tudo isso uma coincidência? Resposta: Não!!!! Veremos adiante a justificativadestes fatos.

1.3.1 Distribuição Amostral da Média

Teorema 1.1. Seja X uma variável aleatória com média µ e variância σ2, e seja(X1, X2, ..., Xn) uma amostra aleatória de X. Então, a média amostral (X) terá médiae variância dadas respectivamente por

E(X) = µ

eV ar(X) =

σ2

n.

Um teorema bem mais forte do que este é o que se refere à distribuição de probabilidadeda variável X. Este teorema é conhecido como o Teorema Central do Limite e pode serenunciado da seguinte forma:

Teorema 1.2 (Teorema Central do Limite). Para amostras aleatórias (X1, X2, ..., Xn),retiradas de uma população com média µ e variância σ2 finita, a distribuição amostralda média X aproxima-se, para n suficientemente grande, de uma distribuição normal,com média µ e variância σ2/n.

X ≈ N(µ, σ2/n)

Desta forma, temos que:

Z =X − µ

σ/√

n≈ N(0, 1)

.

Observações:

1) No teorema acima não fizemos nenhuma suposição sobre a natureza das dis-tribuições das variáveis X1, X2, ..., Xn, ou seja, independentemente de como se comportamessas variáveis, sejam elas discretas ou contínuas, o teorema continua válido.

2) Se as variáveis X1, X2, ..., Xn têm distribuição normal, então X terá também dis-tribuição normal e não apenas uma aproximação.

Exemplo 12: Seja X o preço, em reais, de um determinado produto. Admitindo queX segue distribuição Normal, com média 100 e desvio padrão 10, calcule:

8

Page 9: Apostila de Estatistica

a) A probabilidade de, ao entrar em uma loja, observar que este produto está sendovendido por um preço entre 91 e 110 reais;

b) A probabilidade de, pesquisando em 16 lojas distintas, encontrar preço médio entre91 e 110 reais.

Exemplo 13: Em uma certa cidade, a duração de conversas telefônicas, em minutos,originárias de telefones públicos, segue um modelo exponencial com média 3.

a) Qual a probabilidade de uma chamada selecionada aleatoriamente não ultrapassarquatro minutos?

b) Observando-se uma amostra aleatória de 50 dessas chamadas, qual será a probabili-dade delas, em média, não ultrapassar quatro minutos?

1.3.2 Distribuição Amostral da Proporção

Considere uma população em que a proporção de elementos portadores de certa carac-terística é p. Assim, definiremos a variável aleatória X como: X = 1, se o indivíduo forportador da característica, e X = 0, se o indivíduo não possui a característica. Dessaforma, E(X) = p e V ar(X) = p(1− p).

9

Page 10: Apostila de Estatistica

Retira-se uma amostra aleatória de tamanho n, dessa população. Considere a v.a. Sn:

número de indivíduos com a característica na amostra. Seja, p =Sn

n. Então, utilizando o

Teorema Central do Limite para a variável p =Sn

n, temos que:

p ≈ N

(p,

p(1− p)

n

).

Desta forma, temos que:

Z =p− p√

p(1−p)n

≈ N(0, 1)

.

Exemplo 14: Suponha que 30% dos estudantes de uma escola sejam mulheres. Colhe-se uma amostra aleatória de 10 estudantes e calcula-se a proporção amostral de estudantesdo sexo feminino. Qual a probabilidade de que a proporção de estudantes do sexo femininona amostra (p) esteja entre 20% e 50%?

Aplicação: Determinação do Tamanho de uma Amostra

Um dos problemas de se trabalhar com amostragem é a determinação do tamanho daamostra. Uma maneira simples é a seguinte:

Suponha que estejamos estimando a média µ populacional e para isso usaremos amédia amostral, X, baseada numa amostra de tamanho n. Suponha ainda que se queiradeterminar o valor de n de modo que

P (∣∣X − µ

∣∣ ≤ ε) = γ,

com 0 < γ < 1 e sendo ε > 0 o erro amostral máximo que podemos suportar, ambosvalores fixados.

Como X ≈ N(µ, σ2/n), então

P(∣∣X − µ

∣∣ ≤ ε)

= P(−ε ≤ X − µ ≤ ε

)= P

(−√nε

σ≤ Z ≤

√nε

σ

)∼= γ,

onde Z =X − µ

σ/√

n. Logo, podemos obter zγ/2 da N(0, 1), tal que P (−zγ/2 ≤ Z ≤ zγ/2) =

γ, de modo que

zγ/2 =

√nε

σ,

de onde obtemos finalmente

n =σ2z2

γ/2

ε2.

10

Page 11: Apostila de Estatistica

Observação: Na prática, não se conhece o valor da variância populacional σ2. A fimde resolver este problema, utiliza-se uma pequena amostra piloto para estimar o valor davariância populacional ou então baseia-se em alguma informação prévia sobre a mesma.Normalmente, usa-se a estatística

S2 =

∑(Xi −X)2

(n− 1),

que é a variância amostral.

Exemplo 15: Suponha que uma pequena amostra piloto de tamanho 10, extraída deuma população, forneceu os valores X = 15 e S2 = 16. Fixando-se ε = 0, 5 e γ = 0, 95,calcule o valor de n.

No caso do cálculo do tamanho da amostra na estimação da proporção populacional(p), temos que p ≈ N

(p, p(1−p)

n

)e assim, para γ e ε previamente fixados, teremos:

P (|p− p| ≤ ε) = γ.

Daí,

P (|p− p| ≤ ε) = P (−ε ≤ p− p ≤ ε) = P

−ε√

p(1−p)n

≤ Z ≤ ε√p(1−p)

n

∼= γ,

onde Z =p− p√

p(1−p)n

. Logo, podemos obter zγ/2 da N(0, 1), tal que P (−zγ/2 ≤ Z ≤

zγ/2) = γ, de modo quezγ/2 =

ε√p(1−p)

n

,

de onde obtemos finalmente

n =z2

γ/2p(1− p)

ε2.

Observação: Sendo p um valor desconhecido, podemos estimá-lo pela proporçãoamostral (p) ou usar o fato de que

p(1− p) = p− p2 ≤ 1

4.

11

Page 12: Apostila de Estatistica

Assim, temos que

n '=z2

γ/21/4

ε2=

z2γ/2

4ε2.

Exemplo 16: Suponha que quiséssemos encontrar o tamanho necessário da amostra,n, para que a probabilidade de cometer um erro máximo de 10% no Exemplo 14 fosse de94%. Neste caso, teríamos:

1.4 Estimação de Parâmetros

1.4.1 Estimação Pontual de Parâmetros

1.4.1.1 Introdução

Neste capítulo iremos estudar as propriedades de um estimador e a estimação intervalar.Não iremos abordar os métodos de estimação pontual, mas justificaremos porque X e psão bons estimadores para a média e a proporção, respectivamente. Nosso objetivo seráconstruir intervalos de confiança para a média e para a proporção populacional a partir dasdistribuições de X e p, respectivamente.

1.4.1.2 Propriedades de Estimadores

Considere uma amostra aleatória X1, X2, ..., Xn de uma v.a. que descreve algumacaracterística de interesse da população. Seja θ um parâmetro desta população e θ umestimador para θ, ou seja θ = T (X1, X2, ..., Xn). Algumas definições são necessárias:

Definição 1.12 (Estimativa). Estimativa é o valor assumido pelo estimador em uma

particular amostra.

12

Page 13: Apostila de Estatistica

Definição 1.13 (Vício de um Estimador). O vício de um estimador é dado por

B(θ) = E(θ)− θ.

Definição 1.14 (Estimador não Viciado). Um estimador θ é dito ser não viciado

para o parâmetro θ se B(θ) = 0. Ou seja, se E(θ) = θ.

Exemplo 17: Justifique porque X e p são não viciados para µ e p, respectivamente,onde µ = E(X) e p é a proporção populacional.

Observação: Considere uma população com N elementos. Assim, a variância popu-lacional σ2 é definida como:

σ2 =1

N

N∑i=1

(Xi − µ)2,

onde, µ =1

N

N∑i=1

Xi é a média populacional.

Um possível estimador para σ2, baseado numa amostra aleatória de tamanho n extraídadessa população, é

σ2 =1

n

n∑i=1

(Xi −X)2.

Pode-se mostrar que este estimador é viciado para σ2 e E(σ2) =(n− 1)

nσ2. Portanto,

seu vício B(σ2) = −σ2

n. Logo, através de um simples ajuste em σ2 podemos obter um

estimador não viciado para σ2. Este estimador é

S2 =n

n− 1σ2 =

1

n− 1

n∑i=1

(Xi −X)2.

Definição 1.15 (Estimador Consistente). Um estimador θ é consistente se, à me-

dida que o tamanho da amostra aumenta, seu valor esperado converge para o parâmetrode interesse e sua variância converge para zero. Ou seja, θ é consistente se as duaspropriedades abaixo são satisfeitas:

(i) limn→∞ E(θ) = θ;

(ii) limn→∞ V ar(θ) = 0.

13

Page 14: Apostila de Estatistica

Observação: Se o estimador θ é não viciado para θ e deseja-se verificar sua con-sistência, basta observar a segunda condição da definição acima. Ou seja, um estimador θnão viciado é consistente para θ se limn→∞ V ar(θ) = 0.

Definição 1.16 (Eficiência de um Estimador). Dados dois estimadores θ1 e θ2,

não viciados para o parâmetro θ, dizemos que θ1 é mais eficiente que θ2 se V ar(θ1) <V ar(θ2).

Exemplo 18: Considere X1, X2, ..., Xn uma amostra aleatória de uma distribuiçãoN(µ, σ2). Considere os estimadores µ1 = X e µ2 = mediana(X1, X2, ..., Xn). Sendo

E(µ2) = µ e V ar(µ2) =

(πσ2

2n

), verifique:

a) se µ1 e µ2 são estimadores consistentes;

b) quem é mais eficiente para estimar µ: µ1 ou µ2?

1.4.2 Estimação Intervalar

Até aqui discutimos apenas sobre estimadores pontuais, àqueles que fornecem como esti-mativa um único valor numérico para o parâmetro de interesse. Para amostras diferentesde uma mesma população podemos encontrar valores diferentes para a estimativa de umparâmetro levando-se em consideração o mesmo estimador, isto porque o estimador é umavariável aleatória. Assim, em muitas situações gostaríamos de construir uma estimativamais informativa para o parâmetro de interesse que inclua uma medida de precisão do valorobtido. Esse método de estimação, denominado intervalo de confiança, incorpora àestimativa pontual do parâmetro informações a respeito de sua variabilidade. Intervalos deconfiança são obtidos através da distribuição amostral de seus estimadores.

14

Page 15: Apostila de Estatistica

1.4.2.1 Intervalo de Confiança para a Média de uma População com VariânciaConhecida

Considere uma amostra aleatória X1, X2, ..., Xn de uma população X, que tem médiaµ desconhecida e variância σ2 conhecida. Daqui por diante faremos as seguintes considera-ções: 0 < γ < 1 e zγ/2 é um número tal que P (0 < Z < zγ/2) = γ/2 onde Z ∼ N(0, 1).

Pelo Teorema Central do Limite, a média amostral X ≈ N(µ, σ2/n). Assim, temosque

Z =X − µ

σ/√

n≈ N(0, 1).

Portanto, podemos escrever:

P(−zγ/2 < Z < zγ/2

)= γ,

ou seja,

P

(−zγ/2 <

X − µ

σ/√

n< zγ/2

)= γ,

e assim,

P

(−zγ/2

σ√n

< X − µ < zγ/2σ√n

)= γ,

de onde obtemos

P

(X − zγ/2

σ√n

< µ < X + zγ/2σ√n

)= γ.

Portanto, o intervalo de confiança para µ, com coeficiente de confiança γ, é dado por

IC(µ, γ) =

(X − zγ/2

σ√n

; X + zγ/2σ√n

),

Observe que a expressão IC(µ, γ) envolve a quantidade X que é uma variável aleatóriae, portanto, o intervalo obtido também é aleatório. Desta forma, podemos interpretar ointervalo acima da seguinte maneira: se obtivermos várias amostras de mesmo tamanhoe para cada uma calcularmos os correspondentes intervalos de confiança com coeficientede confiança γ, esperamos que a proporção de intervalos que contenham o valor de µ sejaigual a γ.

Exemplo 19: Suponha que os comprimentos de jacarés adultos de uma certa raçasiga o modelo normal com média µ desconhecida e variância igual a 0,01 m2. Uma amostrade dez animais foi sorteada e forneceu média 1,69 m. Encontre um intervalo com 95% deconfiança para o parâmetro desconhecido µ.

15

Page 16: Apostila de Estatistica

Observação: A amplitude do intervalo de confiança é dada pela diferença entre oextremo superior e o extremo inferior, isto é, 2zγ/2

σ√n. O erro envolvido na estimação é

dado pela semi-amplitude, ou seja, zγ/2σ√n.

Exemplo 20: A vida média de baterias automotivas de uma certa marca está sendoestudada. Baseado em estudos similares, com outras marcas, é possível admitir que a vidaútil dessas baterias segue uma distribuição normal com desvio padrão de 4,5 meses. Dequal tamanho deverá ser a amostra, para que a amplitude do intervalo de 90% de confiançapara a vida média seja de 3 meses?

1.4.2.2 Intervalo de Confiança para a Proporção Populacional

De maneira análoga ao caso da média, podemos construir um intervalo de confiançapara a proporção populacional.

Pelo Teorema Central do Limite, sabemos que

p ≈ N

(p,

p(1− p)

n

).

Assim, um intervalo de confiança para p com nível de confiança γ é dado por

IC(p, γ) =

(p− zγ/2

√p(1− p)

n; p + zγ/2

√p(1− p)

n

).

Como p é desconhecido, o intervalo ainda não pode ser calculado diretamente. Uma possívelsolução é substituirmos p(1− p) por p(1− p). Portanto, o intervalo será:

IC1(p, γ) =

(p− zγ/2

√p(1− p)

n; p + zγ/2

√p(1− p)

n

).

Outra solução possível, é baseada no fato que a expressão p(1− p) tem valor máximoigual a 1/4, quando 0 ≤ p ≤ 1. Nesse caso, podemos obter um intervalo de confiançasubstituindo p(1− p) por 1/4:

IC2(p, γ) =

(p− zγ/2

√1

4n; p + zγ/2

√1

4n

).

16

Page 17: Apostila de Estatistica

Observação: Ao aceitarmos IC1, estamos levando em consideração que a variância de

p é bem aproximada porp(1− p)

n. Se preferirmos IC2, estaremos substituindo a variância

por um valor seguramente maior do que o real. Assim, estamos nos assegurando que ocoeficiente de confiança será de, no mínimo, γ. Ao utilizarmos IC2, estamos aceitando umamenor precisão para p, o que se reflete numa maior amplitude do intervalo de confiança,quando comparado ao intervalo IC1.

Exemplo 21: Numa pesquisa de mercado, 400 pessoas foram entrevistadas sobredeterminado produto, e 60% delas preferiram a marca A. Construa um intervalo de confiançapara p com coeficiente de confiança γ = 0, 95.

Exemplo 22: Em uma linha de produção de certa peça mecânica, colheu-se umaamostra de 100 itens, constatando-se que 4 peças eram defeituosas. Construir um IC paraa proporção de itens defeituosos na população com confiança de 90%.

17

Page 18: Apostila de Estatistica

1.4.2.3 Intervalo de Confiança para a Média de uma População com VariânciaDesconhecida

Até aqui consideramos a média de uma população desconhecida e a variância conhecida.Esta situação não é muito realista, pois se não conhecemos a média, como podemos co-nhecer a variância de uma população? Desta forma, uma situação mais próxima da realidadeseria o caso em que, tanto a média como a variância, são desconhecidas. Iremos considerara siuação em que X ∼ N(µ, σ2) com µ e σ desconhecidos.

Para isso, iremos utilizar a distribuição t de Student, que é definida como:

Definição 1.17. Uma v.a. T é dita ter distribuição t de Student com n graus de

liberdade, se sua f.d.p. é da forma

fn(t) =Γ[(n + 1)/2]

Γ(n/2)√

(1 +

t2

n

)−(n+1)/2

, −∞ < t < ∞,

onde Γ (p) =∫∞

0xp−1e−xdx, p > 0, é conhecida como a função gama.

Observações:

(i) Notação: T ∼ t(n);

(ii) Essa distribuição leva este nome em homenagem ao estatístico inglês W.S. Gosset,que publicou sua pesquisa sob o pseudônimo de “Student”;

(iii) O gráfico de fn(t) é simétrico em torno de 0. Ele se assemelha ao gráfico da dis-tribuição normal padrão, em verdade, mostra-se que

limn→∞

fn(t) =1√2π

e−t2/2.

(iv) Em virtude da importância desta distribuição, ela se encontra tabulada. A tabelafornece o valor de tc, tal que P (−tα ≤ Tn ≤ tα) = 1 − α, para alguns valores de0 < α < 1, onde Tn tem distribuição t de Student com n graus de liberdade.

Nosso objetivo agora é estudar a situação em que X : N(µ, σ2) com µ e σ desco-nhecidos. Assim, considerando uma amostra aleatória X1, ..., Xn de X, pode-se mostrarque

(X − µ)

S/√

n∼ t(n−1),

onde S2 =1

n− 1

n∑i=1

(Xi −X)2.

Assim, dado 0 < γ < 1, teremos

P

(∣∣∣∣(X − µ)

S/√

n

∣∣∣∣ ≤ tα

)= γ,

18

Page 19: Apostila de Estatistica

onde γ = 1− α, e tα é um número tal que P (−tα ≤ T(n−1) ≤ tα) = γ.

Logo, o intervalo de confiança para µ com nível de confiança 1− α, é dado por(

X − tαS√n

; X + tαS√n

).

Exemplo 23: Numa grande empresa uma amostra aleatória de 20 empregados forneceua idade média igual a 32,8 anos e desvio padrão 5,3 anos. Estimar a idade média de todosos empregados da empresa com uma confiança de 99%.

Exemplo 24: Por analogia a produtos similares, o tempo de reação de um novomedicamento pode ser considerado como tendo distribuição normal. Vinte pacientes foramsorteados, receberam o medicamento e tiveram seu tempo de reação anotado. Os dadosforam os seguintes (em minutos): 2,9; 3,4; 3,5; 4,1; 4,6; 4,7; 4,5; 3,8; 5,3; 4,9; 4,8; 5,7;5,8; 5,0; 3,4; 5,9; 6,3; 4,6; 5,5 e 6,2. Obtenha um intervalo de confiança para o tempomédio de reação. Use γ = 0, 95.

19

Page 20: Apostila de Estatistica

UNIVERSIDADE FEDERAL DE CAMPINA GRANDE - Campus de Campina GrandeUNIDADE ACADÊMICA DE ESTATÍSTICA - UAEstDisciplina: Introdução à Estatística Período 2015.1Professores: Amanda Gomes e Manoel Santos-Neto

1a LISTA DE EXERCÍCIOS

1 - Considerando a população de alunos do exemplo 5, faça uma amostragem estratifi-cada proporcional de tamanho 8, usando o sexo como variável estratificadora. Utilize,para isto, a tabela de números aleatórios. Para o estrato SEXO FEMININO, utilize asexta coluna; para o estrato SEXO MASCULINO, utilize a segunda linha. (Percorraa tabela da esquerda para a direita e de baixo para cima).

2 - Numa pesquisa para estudar a preferência do eleitorado a uma semana da eleiçãopresidencial, qual o tamanho de uma amostra aleatória simples de eleitores, quegaranta, com alta confiança, um erro amostral não superior a 2%?

3 - Numa empresa com 1000 funcionários, deseja-se estimar a percentagem de fun-cionários favoráveis a um certo programa de treinamento. Qual deve ser o tamanhode uma amostra aleatória simples, que garanta, com alto nível de confiança, um erroamostral não superior a 5%?

4 - Considere as seguintes situações:

a) Em uma pesquisa, feita pela EMPETUR com 1015 pousadas escolhidas aleatoria-mente, 269 (ou 26,5%) possuíam Home-page na Internet para divulgação e prestaçãode serviços ao turista.

b) Outra pesquisa feita entre as 50 Agências de Viagens de uma certa localidademostra que 42 (ou 84%) prestam serviços pela Internet.

Identifique em qual das situações nós temos um exemplo de Parâmetro e outro deEstatística (no sentido de medida). Justifique sua resposta.

5 - Considere a distribuição de probabilidade de uma população apresentada na seguintetabela:

Valor da variável X Probabilidade2 1/33 1/34 1/3

Baseado nesta distribuição populacional:

a) Calcule a distribuição da média amostral (X) de todas as amostras aleatórias detamanho 2 dessa população.

b) Com base na distribuição amostral calcule a média e a variância de X. Resp.: 3e 1/3

20

Page 21: Apostila de Estatistica

6 - Seja X ∼ N(900, 642). retiramos uma amostra de tamanho 30. Determinar:

a) P (X ≤ 894). Resp.: 0,0968

b) P (896 ≤ X ≤ 903). Resp.: 0,54726

7 - Qual deverá ser o tamanho de uma amostra retirada de uma população X ∼ N(200, 350)para que P (|X − 200| < 5) = 0, 95? Resp.: 54

8 - A capacidade máxima de um elevador é de 500 kg. Se a distribuição dos pesos dosusuários é suposta N(70, 100). Qual a probabilidade de 7 passageiros ultrapassaremeste limite? Resp.: 0,352

9 - Uma fábrica de peças especifica em sua embalagens que a proporção de defeitos éde 4%. Um cliente dessa fábrica inspeciona uma amostra de 200 peças. Baseadonesses dados, qual a porcentagem de amostras em que o cliente espera encontraruma proporção de defeitos maior que 5%? Resp.: Em 24% das amostras

10 - Um distribuidor de sementes determina, através de testes, que 5% das sementes nãogerminam. Ele vende pacotes de 200 sementes com garantia de 90% de germinação.Qual a probabilidade de um pacote não satisfazer a garantia? Resp.: 0,06%

11 - O tempo médio para estudantes completarem o processo de matrícula em uma uni-versidade tem sido de 55 minutos com desvio padrão 8,7 minutos. Determine aprobabilidade de que o tempo médio para 25 estudantes selecionados aleatoriamenteseja de, no máximo, 50,2 minutos. Suponha que os tempos de matrícula sejamdistribuídos normalmente. Resp.: 0,289%

12 - Seja X uma população normal com média µ e variância σ2, de que são extraídastodas as amostras possíveis de tamanho 2. Dos estimadores abaixo:

µ1 = 12X1 + 1

2X2

µ2 = 14X1 + 3

4X2.

a) Qual ou quais dos estimadores acima são não-viesados para µ. Resp.: Os dois

b) Qual dos dois estimadores acima é o melhor? Justifique. Resp.: µ1

13 - Suponha um experimento consistindo de n provas de Bernoulli, com probabilidade desucesso p. Seja X o número de sucessos, e considere os estimadores:

(i) p1 = Xn

(ii) p2 =

{1, se a primeira prova resultar sucesso0, c.c.

a) Determine a esperança e a variância de cada estimador. Resp.: E(p1) = p =E(p2), V ar(p1) = p(1− p)/n e V ar(p2) = p(1− p)

b) Verifique se p1 e p2 são consistentes.

c) Por que p2 não é um bom estimador para p?

21

Page 22: Apostila de Estatistica

14 - De uma população normal com variância igual a 16, levantou-se uma amostra,obtendo-se as observações: 10, 5, 10, 15. Determinar, com confiança de 87%,um IC para a média da população.

Resp.: (6,98; 13,02)

15 - A experiência com trabalhadores de uma certa indústria indica que o tempo necessáriopara que um trabalhador, aleatoriamente selecionado, realize uma tarefa é distribuídode maneira aproximadamente normal, com desvio padrão de 12 minutos. Umaamostra de 25 trabalhadores forneceu x = 140 min. Determinar os limites de con-fiança de 95% para a média µ da população de todos os trabalhadores que fazemaquele determinado serviço. Qual o erro cometido ao estimarmos este intervalo deconfiança?

Resp.: (135,3; 144,7)

16 - Em uma pesquisa de opinião, entre 600 pessoas pesquisadas, 240 responderam “sim”a determinada pergunta. Estimar a porcentagem de pessoas com essa mesma opiniãona população, dando um intervalo de 95% de confiabilidade.

Resp.: (36,08%; 43,92%)

17 - Colhida uma amostra de 30 peças, forneceu os seguintes pesos:

250, 265, 267, 269, 271, 275, 277, 281, 283, 284,

287, 289, 291, 293, 293, 298, 301, 303, 306, 307,

307, 309, 311, 315, 319, 322, 324, 328, 335, 339.

Por meio da construção do intervalo de confiança, responder se esta amostra satisfaza espectativa pela qual o peso médio deve ser 300 Kg.

Sugestão: Adote uma confiança de 95%.

Resp.: satisfaz, (288,33; 304,93)

18 - Sendo σ = 0, 5, determinar o número de elementos necessários para construir umintervalo de 95% de confiança para a média adimitindo-se que nossa estimativa tenhaum erro de 10%.

Resp.: 97

19 - Em 50 lances de uma moeda, foram obtidas 30 caras. A partir de um intervalo deconfiança de 96%, pode-se dizer que a moeda é honesta?

Resp.: sim, (0,46; 0,74)

22

Page 23: Apostila de Estatistica

20 - Construa um IC para a média com confiança de 95% considerando a distribuiçãoamostral abaixo:Classes ni

0 – 5 25 – 10 310 – 15 515 – 20 2

Resp.: (7,26; 13,58)

23

Page 24: Apostila de Estatistica

Relação de Exercícios do Livro texto para o 1◦ Estágio

Livro: "Estatística Básica". Wilton O. Bussab e Pedro A. Morettin. 5a. Edicão.

Capítulo 10 (Introdução à Inferência Estatística)

Problema Página7 e 8 2749 275

12 e 13 27617 e 18 281

21, 22, 24, 25, 26 e 28 283

Capítulo 11 (Estimação)

Problema Página15, 16, 17 e 18 308

20 e 21 30923 e 24 317

27, 28, 29 e 30 31844 e 45 322

24

Page 25: Apostila de Estatistica

UNIVERSIDADE FEDERAL DE CAMPINA GRANDE - Campus de Campina GrandeUNIDADE ACADÊMICA DE ESTATÍSTICADisciplina: Introdução à Estatística Período 2015.1Professores: Amanda Gomes e Manoel Santos-NetoAluno(a): .

NOTAS DE AULA PARA O 2o ESTÁGIO

2 Teste de Hipóteses

2.1 Introdução

Até o presente momento consideramos o problema de estimarmos um parâmetro desco-nhecido da população tanto pontualmente como através de um intervalo de confiança.Apresentaremos agora, outra maneira de tratar o problema de fazer uma afirmação sobreum parâmetro desconhecido. Em vez de procurarmos uma estimativa do parâmetro, fre-quentemente nos parecerá conveniente admitir um valor hipotético para ele e, depois, utilizara informação da amostra para confirmar ou rejeitar esse valor hipotético.

A construção de um teste de hipóteses, para um parâmetro populacional, pode sercolocada do seguinte modo: existe uma variável X associada a dada população e tem-seuma hipótese sobre determinado parâmetro θ dessa população. Por exemplo, afirmamosque o verdadeiro valor de θ é θ0. Colhe-se uma amostra aleatória de elementos dessapopulação, e com ela deseja-se comprovar ou não tal hipótese.

Iniciamos a análise explicitando claramente qual a hipótese que está sendo colocada àprova e a chamamos de hipótese nula, e escrevemos

H0 : θ = θ0.

Convém explicitar a hipótese que será considerada aceitável, caso H0 seja rejeitada.A essa hipótese chamamos de hipótese alternativa. Formularemos, então, duas hipótesesbásicas:

H0: hipótese nula

H1: hipótese alternativa

Geralmente, a hipótese H0 é a hipótese a ser testada. Caso rejeitemos H0, a hipótese H1

será considerada aceitável.

2.2 Definições Básicas

2.2.1 Tipos de Testes

Iremos considerar os seguintes tipos de testes:

25

Page 26: Apostila de Estatistica

1. Teste bilteral{H0 : θ = θ0

H1 : θ 6= θ0

2. Teste unilateral à direita{H0 : θ = θ0

H1 : θ > θ0

3. Teste unilateral à esquerda{H0 : θ = θ0

H1 : θ < θ0

2.2.2 Tipos de Erros

Qualquer que seja a decisão tomada, estamos sujeitos a cometer erros. Neste caso, ospossíveis erros serão

Erro de tipo I: rejeitar a hipótese nula quando essa é verdadeira. Chamamos de α aprobabilidade de cometer esse erro, isto é,

α = P (erro do tipo I) = P (rejeitar H0|H0 é verdadeira)

Erro de tipo II: não rejeitar a hipótese nula quando essa é falsa. A probabilidade decometer esse erro é denotada por β, logo

β = P (erro do tipo II) = P (não rejeitar H0|H0 é falsa)

Exemplo 1: Um pesquisador acredita que descobriu uma vacina contra resfriado.Ele irá conduzir uma pesquisa de laboratório para verificar a veracidade da afirmação. Deacordo com o resultado, ele lançará ou não a vacina no mercado. As hipóteses que podetestar são:

1) A vacina não é eficaz;

2) A vacina é eficaz.

Descreva os dois tipos de erro que podem ser cometidos nesta situação.

26

Page 27: Apostila de Estatistica

Exemplo 2: Identifique as hipóteses que estão sendo testadas em cada caso:

a) A força de rompimento de uma fibra têxtil é uma variável aleatória distribuídanormalmente. As especificações exigem que a força média de rompimento seja igual a 150psi. O fabricante gostaria de detectar qualquer afastamento significante desse valor.

b) Sempre que o aumento médio da temperatura da água em uma câmara compressorasuperar 5 ◦C, o processo de resfriamento deve ser recalibrado. Este processo é, entretanto,caro e, portanto, deve ser feito apenas se for realmente necessário.

c) Um criador tem constatado uma proporção de 10% do rebanho com verminose. Oveterinário alterou a dieta dos animais e acredita que a doença diminuiu de intensidade.

2.2.3 Região Crítica do Teste

Nosso interesse ao realizar um teste de hipótese é decidir se a hipótese H0 é ou não aceitável.Tal decisão deve ser baseada em uma estatística θ, que será usada para estabelecer o quechamamos de região crítica do teste.

Região Crítica: é um conjunto de valores para os quais a estatística de teste, θ, levaà rejeição da hipótese H0. Esta região é construída de modo que

P (θ ∈ RC | H0 verdadeira) = α,

onde α é fixado a priori.

A região crítica define o conjunto de valores amostrais para os quais a estatística deteste deixa evidente a não veracidade da hipótese H0, a uma determinada probabilidade, α,de se cometer o Erro Tipo I. Caso o valor observado da estatística pertença a essa região,rejeitamos H0; caso contrário, não rejeitamos H0. Um fato importante a ressaltar é que aregião crítica é sempre construída sob a hipótese de H0 ser verdadeira.

A probabilidade α de se cometer um erro de tipo I é um valor arbitrário e recebe onome de nível de significância do teste. O resultado da amostra é tanto mais significantepara rejeitar H0 quanto menor for esse nível α. Usualmente, o valor de α é fixado em 5%,1% ou 0,1%.

A determinação do valor de β já é mais difícil, pois usualmente não especificamosvalores fixos para o parâmetro sob a hipótese alternativa.

27

Page 28: Apostila de Estatistica

2.2.4 Procedimento Geral para a Construção de um Teste de Hipóteses

Passo 1. Fixe qual a hipótese H0 a ser testada e qual a hipótese alternativa H1.

Passo 2. Use a teoria estatística e as informações disponíveis para decidir qual es-tatística (estimador) será usada para testar a hipótese H0. Obtenha as propriedades dessaestatística (distribuição, média, desvio padrão).

Passo 3. Fixe a probabilidade α de cometer o erro de tipo I e use este valor paraconstruir a região crítica (regra de decisão). Lembre que essa região é construída a partirda estatística definida no passo 2, usando o valor do parâmetro hipotetizado por H0.

Passo 4. Use as observações da amostra para calcular o valor da estatística do teste(valor observado da estatística).

Passo 5. Se o valor da estatística calculado com os dados da amostra não pertencerà região crítica, não rejeite H0; caso contrário, rejeite H0.

2.3 Teste de Hipótese sobre a Média de uma População comVariância Conhecida

Vamos aplicar o procedimento geral para o caso em que queremos testar uma hipótesesobre a média de uma população que tem variância conhecida.

(i) Definição das hipóteses:

a){

H0 : µ = µ0

H1 : µ 6= µ0

b){

H0 : µ = µ0

H1 : µ > µ0

c){

H0 : µ = µ0

H1 : µ < µ0

(ii) Escolha da Estatística para o teste

Neste caso, utilizaremos a estatística X =

∑ni=1 Xi

n. Assim, pelo T.C.L. sabemos

queX − µ

σ/√

n≈ N(0, 1).

(iii) Fixado o nível de significância do teste (α) e supondo H0 verdadeira, podemos cons-truir a região crítica do teste como:

a) RC =

{x; P

(X ≤ µ0 − z 1−α

2

σ√n

ou X ≥ µ0 + z 1−α2

σ√n

)= α

}

=

]−∞; µ0 − z 1−α

2

σ√n

]∪

[µ0 + z 1−α

2

σ√n

;∞[.

28

Page 29: Apostila de Estatistica

A região crítica também pode ser escrita em termos de valores padronizados, ou seja

RCp ={

z; P(|Z| ≥ z 1−α

2

)= α

}=

]−∞;−z 1−α

2

]∪

[z 1−α

2;∞

[.

b) RC =

{x; P

(X ≥ µ0 + z 1−2α

2

σ√n

)= α

}=

[µ0 + z 1−2α

2

σ√n

;∞[. Ou então,

RCp ={

z; P(Z > z 1−2α

2

)= α)

}=

[z 1−2α

2;∞

[.

c) RC =

{x; P

(X ≤ µ0 − z 1−2α

2

σ√n

)= α

}=

]−∞; µ0 − z 1−2α

2

σ√n

]. Ou en-

tão,RCp =

{z; P

(Z ≤ −z 1−2α

2

)= α)

}=

]−∞;−z 1−2α

2

].

(iv) Estatística de teste: dada uma amostra de tamanho n, a estatística de teste será

x0 =

∑ni=1 xi

n, ou então, considerando o intervalo com valores padronizados, a

estatística de teste será:z0 =

x0 − µ0

σ/√

n.

(v) Conclusão: se x0 ∈ RC ou z0 ∈ RCp, rejeitamos H0, caso contrário, não rejeitamosH0.

Exemplo 3: Seja X uma população normal com variância 36. Dessa população,toma-se uma amostra de tamanho 16, obtendo-se x = 43. Ao nível de 10%, testar as

hipóteses:{

H0 : µ = 45H1 : µ 6= 45

Exemplo 4: A associação dos proprietários de indústrias metalúrgicas está muito preo-cupada com o tempo perdido com acidentes de trabalho, cuja média, nos últimos tempos,tem sido da ordem de 60 horas/homem por ano e desvio padrão de 20 horas/homem.Tentou-se um programa de prevenção de acidentes, após o qual foi tomada uma amostrade nove indústrias e medido o número médio de horas/homem perdidas por acidente, quefoi de 50 horas. Você diria, no nível de 1%, que há evidência de melhoria?

29

Page 30: Apostila de Estatistica

2.4 Teste de Hipótese para a Proporção

Consideraremos uma população X onde X = 1 com probabilidade p e X = 0 com pro-babilidade 1 − p. Assim, a estatística de teste será a proporção amostral p. Pelo T.C.L.sabemos que

p ≈ N

(p,

p(1− p)

n

).

Assim, podemos aplicar o teste de hipóteses seguindo os seguintes passos:

1. Retirada uma amostra aleatória de tamanho n dessa população queremos testarhipóteses do tipo:

a){

H0 : p = p0

H1 : p 6= p0

b){

H0 : p = p0

H1 : p > p0

c){

H0 : p = p0

H1 : p < p0

2. Portanto, dado um nível de significância α a região crítica do teste será respectiva-mente:

a) RC =

[0, p0 − z 1−α

2

√p0(1− p0)

n

]∪

[p0 + z 1−α

2

√p0(1− p0)

n, 1

].

b) RC =

[p0 + z 1−2α

2

√p0(1− p0)

n, 1

].

c) RC =

[0, p0 − z 1−2α

2

√p0(1− p0)

n

].

Onde zα é um valor tabelado tal que P (0 ≤ Z ≤ zα) = α e Z ∼ N(0, 1).

3. A estatística de teste é p avaliada em uma amostra particular.

Exemplo 5: Uma firma de semicondutores produz aparelhos lógicos. O contrato como cliente exige uma fração de defeituosos não mais que 5%. Uma amostra de 200 aparelhosresultou em 12 defeituosos. Existe razão para o cliente desconfiar da firma, ao nível de 5%de significância?

30

Page 31: Apostila de Estatistica

2.5 Teste de Hipótese sobre a Média de uma População comVariância Desconhecida

Consideraremos agora, o caso em que queremos testar hipóteses sobre a média de umapopulação com distribuição normal, porém, com variância desconhecida. Para isso, teremosque estimar a variância através da estatística S2. Além disso, utilizaremos o fato de que

(X − µ)

S/√

n∼ t(n−1).

Assim, a estatística do teste será T =(X − µ)

S/√

n.

Assim, podemos aplicar o teste de hipóteses seguindo os seguintes passos:

1. Queremos testar hipóteses do tipo:

a){

H0 : µ = µ0

H1 : µ 6= µ0

b){

H0 : µ = µ0

H1 : µ > µ0

c){

H0 : µ = µ0

H1 : µ < µ0

2. Fixado um nível de significância α, a região crítica do teste será dada respectivamentepor:

a) RC =

]−∞, µ0 − tα

S√n

]∪

[µ0 + tα

S√n

,∞[.

b) RC =

[µ0 + t2α

S√n

,∞[.

c) RC =

]−∞, µ0 − t2α

S√n

].

Onde tα é um valor tabelado tal que P (|T | < tα) = 1− α e T ∼ t(n−1).

3. A estatística de teste é dada por X avaliada em uma amostra particular.

Exemplo 6: Um teste de resistência à ruptura feito em seis cordas acusou resistênciamédia de 3530kg com desvio-padrão de 66kg. O fabricante afirma que seu produto temresistência média de 3650 kg. Pode-se justificar a alegação do fabricante, ao nível de 1%?

Exemplo 7: Um fabricante afirma que seus cigarros contêm não mais que 30 mg denicotina. Uma amostra de 25 cigarros fornece média de 31,5 mg e desvio padrão de 3 mg.Ao nível de 5%, testar a afirmação do fabricante.

31

Page 32: Apostila de Estatistica

2.6 Teste de Hipótese sobre a Igualdade Médias de Duas Popu-lações Normais Independentes com Variâncias Conhecidas

Sejam X e Y duas populações independentes uma da outra e normalmente distribuidas,

X ∼ N(µX , σ2X) e Y ∼ N(µY , σ2

Y ),

onde µX e µY são desconhecidos e σ2X e σ2

Y são conhecidos.

Sejam X1, X2, ..., XnXe Y1, Y2, ..., YnY

amostras de X e de Y , respectivamente.

Desejamos testar hipóteses sobre a igualdade das médias:

H0 : µX = µY versus

H1 : µX 6= µY ouH1 : µX > µY ouH1 : µX < µY ,

ou equivalentemente

H0 : µX − µY = 0 versus

H1 : µX − µY 6= 0 ouH1 : µX − µY > 0 ouH1 : µX − µY < 0.

(i) Definição das hipóteses:

a){

H0 : µX − µY = 0H1 : µX − µY 6= 0

b){

H0 : µX − µY = 0H1 : µX − µY > 0

c){

H0 : µX − µY = 0H1 : µX − µY < 0

(ii) Escolha da Estatística para o teste

Neste caso, utilizaremos a estatística X − Y . Daí, temos que

X − Y ∼ N

(µX − µY ,

σ2X

nX

+σ2

Y

nY

).

Assim, se a hipótese nula H0 : µX = µY for verdadeira, a estatística de teste

Z =(X − Y )− (µX − µY )√

σ2X

nX+

σ2Y

nY

=X − Y√σ2

X

nX+

σ2Y

nY

∼ N(0, 1)

segue distribuição normal padrão.

32

Page 33: Apostila de Estatistica

(iii) Fixado o nível de significância do teste (α) e supondo H0 verdadeira, podemos cons-truir a região crítica do teste como:

a) RC =

{x− y; P

(X − Y ≤ −z 1−α

2

√σ2

X

nX+

σ2Y

nYou X − Y ≥ z 1−α

2

√σ2

X

nX+

σ2Y

nY

)= α

}=

]−∞;−z 1−α

2

√σ2

X

nX+

σ2Y

nY

]∪

[z 1−α

2

√σ2

X

nX+

σ2Y

nY;∞

[.

A região crítica também pode ser escrita em termos de valores padronizados, ou seja

RCp ={

z; P(|Z| ≥ z 1−α

2

)= α

}=

]−∞;−z 1−α

2

]∪

[z 1−α

2;∞

[.

b) RC =

{x− y; P

(X − Y ≥ z 1−2α

2

√σ2

X

nX+

σ2Y

nY

)= α

}=

[z 1−2α

2

√σ2

X

nX+

σ2Y

nY;∞

[.

Ou então,RCp =

{z; P

(Z > z 1−2α

2

)= α)

}=

[z 1−2α

2;∞

[.

c) RC =

{x− y; P

(X − Y ≤ −z 1−2α

2

√σ2

X

nX+

σ2Y

nY

)= α

}=

]−∞;−z 1−2α

2

√σ2

X

nX+

σ2Y

nY

].

Ou então,

RCp ={

z; P(Z ≤ −z 1−2α

2

)= α)

}=

]−∞;−z 1−2α

2

].

(iv) A estatística de teste será x0−y0 = 1nX

∑nX

i=1 xi− 1nY

∑nY

i=1 yi, ou então, considerandoo intervalo com valores padronizados, a estatística de teste será:

z0 =x0 − y0√σ2

X

nX+

σ2Y

nY

.

(v) Conclusão: se x0 − y0 ∈ RC ou z0 ∈ RCp, rejeitamos H0, caso contrário, nãorejeitamos H0.

Exemplo 8: A gerente de uma indústria de suco de laranja enlatado está interessadaem comparar o desempenho de duas linhas de produção diferentes de sua fábrica. Como alinha X é relativamente nova, ela suspeita que sua produção em número de caixas, por dia,seja maior do que o número de caixas produzidas pela linha mais velha, Y . Selecionam-se aleatoriamente 10 dias de dados de cada linha, econtrando-se x = 824, 9 caixas pordia e y = 818, 6 caixas por dia. Devido à experiência com a operação com esse tipo deequipamento, sabe-se que σ2

X = 40 e σ2Y = 50. Verifique se a gerente tem razão, usando

α = 5%.

33

Page 34: Apostila de Estatistica

2.7 Teste de Hipótese sobre a Igualdade Médias de Duas Po-pulações Normais Emparelhadas

Definição 2.1 (Populações Emparelhadas). Dizemos que duas populações são

dependentes (ou emparelhadas) se existir alguma relação de modo que cada valor emuma população estiver emparelhado com um valor correspondente na outra população.

Exemplo 9: A eficácia de uma dieta é testada usando pesos de indivíduos, medidosantes e depois do tratamento. Cada valor “antes” é emparelhado com o valor “depois”, poiscada par de medidas ates/depois se refere à mesma pessoa.

Sejam, então, X e Y duas populações normais emparelhadas,

X ∼ N(µX , σ2X) e Y ∼ N(µY , σ2

Y ),

e sejam X1, X2, ..., Xn e Y1, Y2, ..., Yn amostras aleatórias de X e de Y , respectivamente.

Sejam Di = Xi−Yi, i = 1, 2, ..., n, as diferenças entre cada par de observações, ondeas diferenças Di seguem distribuição aproximadamente normal, com média

µD = E(X − Y ) = E(X)− E(Y ) = µX − µY ,

de modo que um teste sobre a igualdade de µX e µY pode ser obtido realizando-se umteste t de amostra única sobre µD. Especificamente, testar

H0 : µX = µY versus

H1 : µX 6= µY ouH1 : µX > µY ouH1 : µX < µY ,

é equivalentemente a testar

H0 : µD = µX − µY = 0 versus

H1 : µD = µX − µY 6= 0 ouH1 : µD = µX − µY > 0 ouH1 : µD = µX − µY < 0.

(i) Definição das hipóteses:

a){

H0 : µD = 0H1 : µD 6= 0

b){

H0 : µD = 0H1 : µD > 0

c){

H0 : µD = 0H1 : µD < 0

(ii) Escolha da Estatística para o teste

Neste caso, a estatística apropriada é X − Y = D. Daí, temos que

34

Page 35: Apostila de Estatistica

T =(X − Y )− (µX − µY )√

S2d

n

=D − µD

Sd√n

∼ t(n−1),

Assim, se a hipótese nula H0 : µD = 0 for verdadeira, a estatística de teste

T =DSD√

n

,

segue distribuição t-Student com (n− 1) graus de liberdade, onde

SD =√

1n−1

∑ni=1(Di −D)2 ou SD =

√1

n−1

[∑ni=1 D2

i − 1n

(∑n

i=1 Di)2],

e D = 1n

∑ni=1 Di.

(iii) Fixado o nível de significância do teste (α) e supondo H0 verdadeira, podemos cons-truir a região crítica do teste como:

a) RC ={

d; P(D ≤ −tα

SD√n

ou D ≥ tαSD√

n

)= α

}=

]−∞,−tα

SD√n

]∪

[tα

SD√n,∞

[.

A região crítica também pode ser escrita em termos de valores padronizados, ou seja

RCp = {t; P (|T | < tα) = 1− α} = ]−∞;−tα] ∪ [tα;∞[ ;

b) RC ={

d; P(D ≥ t2α

SD√n

)= α

}=

[t2α

SD√n,∞

[. Ou então,

RCp = {t; P (T ≥ t2α) = α} = [t2α;∞[ ;

c) RC ={

d; P(D ≤ −t2α

SD√n

)= α

}=

]−∞,−t2α

SD√n

]. Ou então,

RCp = {t; P (T ≤ −t2α) = α} = ]−∞;−t2α] ;

onde tα é um valor tabelado tal que P (|T | < tα) = 1− α e T ∼ t(n−1).

(iv) A estatística de teste será d0 = 1n

∑ni=1 di, ou então, considerando o intervalo com

valores padronizados, a estatística de teste será:

t0 =d0

Sd√n

.

(v) Conclusão: se d0 ∈ RC ou t0 ∈ RCp, rejeitamos H0, caso contrário, não rejeitamosH0.

35

Page 36: Apostila de Estatistica

Exemplo 9: Quinze homens adultos, com idades entre 35 e 50 anos, participaramde um estudo para avaliar o efeito da dieta e de exercícios no nível de colesterol nosangue. O colesterol total foi medido em cada indivíduo inicialmente e depois de trêsmeses de participação em um programa de exercícios aeróbicos e mudanças para umadieta de baixo teor de gordura. Os dados são apresentados na tabela a seguir.

Nível de Colesterol no SangueIndivíduo Antes Depois

1 265 2292 240 2313 258 2274 295 2405 251 2386 245 2417 287 2348 314 2569 260 24710 279 23911 283 24612 240 21813 238 21914 225 22615 247 233

Os dados justificam a afirmação de que a dieta com baixo teor de gordura e umprograma de exercícios aeróbicos são valiosos para uma redução média nos níveis decolesterol no sangue? Use α = 0, 05.

36

Page 37: Apostila de Estatistica

2a LISTA DE EXERCÍCIOS

1 - A tensão de ruptura de cabos fabricados por uma empresa apresenta distribuiçãonormal, com média 1800 kg e desvio padrão de 100 kg. Mediante uma nova técnicade produção, proclamou-se que a tensão de ruptura teria aumentado. Para testar essadeclaração, ensaiou-se uma amostra de 50 cabos, obtendo-se como tensão média deruptura 1850 kg. Pode-se aceitar a proclamação ao nível de 5%?

2 - Um exame padrão de inteligência tem sido usado por vários anos com média de 80pontos e desvio padrão de 7 pontos. Um grupo de 25 estudantes é ensinado, dando-seênfase à resolução de testes. Se esse grupo obtem média de 83 pontos no exame, hárazões para se acreditar que a ênfase dada melhorou o resultado do teste ao nível de10%?

3 - A força de rompimento de uma fibra têxtil é uma variável aleatória distribuída normal-mente. As especificações exigem que a força média de rompimento seja igual a 150psi. O fabricante gostaria de detectar qualquer afastamento significante desse valor.Uma amostra de 15 espécimes de fibra forneceu força média de rompimento 152, 18psi e variância 16, 63 psi2. O que se pode concluir, ao nível de 5% de significância?

4 - Sempre que o aumento médio da temperatura da água em uma câmara compressorasuperar 5 ◦C, o processo de resfriamento deve ser recalibrado. Este processo é,entretanto, caro e, portanto, deve ser feito apenas se for realmente necessário. Em8 experimentos independentes com a câmara, foi obtida uma média 5, 65 ◦C e umdesvio padrão 0, 81 ◦C. Estes dados sugerem a necessidade de recalibração? (Use α= 0,05)

5 - Estamos desconfiados de que a média das receitas municipais per capita das cidadespequenas (0-20.000 habitantes) é maior do que a das receitas do estado, que é de 1229unidades. Para comprovar ou não essa hipótese, sorteamos dez cidades pequenas,e obtivemos os seguintes resultados: 1230; 582; 576; 2093; 2621; 1045; 1439; 717;1838; 1359.

obs: Para facilitar os cálculos, informamos que a soma das observações é 13500, e asoma dos quadrados das observações é 22335650.

a) Mostre que o teste de hipótese usado, com α = 0, 05, levará à aceitação de quea receita média das cidades pequenas é igual à do estado.

b) Você não acha estranha essa conclusão quando observa que a média da amostraobtida é bem maior do que a média do estado? Como você explicaria isso?

6 - Uma companhia de cigarros anuncia que o índice médio de nicotina dos cigarros quefabrica apresenta-se abaixo de 23 mg por cigarro. Um laboratório realiza seis análisesdesse índice, obtendo: 27, 24, 21, 25, 26, 22. Sabe-se que o índice de nicotina sedistribui normalmente, com variância igual a 4,86 mg2. Pode-se aceitar, ao nível de10%, a afirmação do fabricante?

7 - Um certo tipo de rato apresenta, nos três primeiros meses de vida, um ganho médiode peso de 58g. Uma amostra de 10 ratos foi alimentada desde o nascimento até a

37

Page 38: Apostila de Estatistica

idade de 3 meses com uma ração especial, e o ganho de peso de cada rato foi: 55,58, 60, 62, 65, 67, 54, 64, 62 e 68. Há razões para crer, ao nível de 5%, que a raçãoespecial aumenta o peso nos três primeiros meses de vida?

8 - De uma população normal levantaram-se os seguintes dados:

Classes ni

1 ` 3 13 ` 5 55 ` 7 137 ` 9 149 ` 11 1011 ` 13 513 ` 15 2

Testar, ao nível de 5%, se a média dessa população é igual a 7.

9 - Uma máquina automática que empacota o alimento A é programada para colocar100g de peso. Para verificar a precisão da máquina, uma amostra de 60 pacotes doreferido alimento fornece peso médio de 98g e desvio padrão de 6g. O que se podeconcluir ao nível de 1%?

10 - Lança-se uma moeda 100 vezes e observa-se 40 caras. Baseado nesse resultado,podemos afirmar, ao nível de 5%, que a moeda não é honesta?

11 - Um fabricante de droga medicinal afirma que ela é 90% eficaz na cura de uma alergia,em um determinado período. Em uma amostra de 200 pacientes, a droga curou 150pessoas. Testar ao nível de 1% se a pretensão do fabricante é legítima.

12 - Uma estação de televisão afirma que 60% dos televisores estavam ligados no seuprograma especial da última segunda-feira. Uma rede competidora deseja contestaressa afirmação e decide usar uma amostra de 200 famílias para um teste. Qualdeve ser o procedimento adotado para avaliar a veracidade da afirmação da estação,adimitindo-se que, das 200 famílias pesquisadas, 110 estavam assistindo ao programa?Utilize um nível de 5%.

13 - Estão sendo estudadas as taxas de queima de dois diferentes propelentes sólidosusados no sistema de escapamento das aeronaves. Sabe-se que ambos os propelentestêm aproximadamente o mesmo desvio padrão da taxa de queima, ou seja, σX =σY = 3 cm/s. Duas amostras aleatórias de nX = 20 e nY = 20 espécimes sãotestadas. As taxas médias de queima das amostras são 18,02 cm/s e 24,37 cm/s.Teste a hipótese de que ambos os propelentes têm a mesma taxa média de queima.Use α = 0, 05.

14 - Duas máquinas são usadas para encher garrafas de plástico com detergente paralavagem de pratos. Os desvios padrão do volume de enchimento são conhecidoscomo sendo σX = 0, 1 onça fluida e σY = 0, 15 onça fluida para as duas máquinas,respectivamente. Duas amostras aleatórias de nX = 12 garrafas da máquina 1 enY = 10 garrafas da máquina 2 são selecionadas. Os volumes médios de enchimento

38

Page 39: Apostila de Estatistica

nas amostras são x = 30, 61 onças fluidas e y = 30, 34 onças fluidas. Suponhaa normalidade dos dados, e teste a hipótese de que ambas as máquinas enchem omesmo volume médio. Use α = 0, 05.

15 - O diâmetro de bastões de aço, fabricados em duas máquinas diferentes, está sendoinvestigado. Duas amostras aleatórias de tamanhos nX = 15 e nY = 17 são sele-cionadas, obtendo-se as médias x = 8, 73 e y = 8, 68, respectivamente. Sabendo queσ2

X = 0, 35 e σ2Y = 0, 40, e que os dados sejam retirados de uma população normal,

podemos dizer que há evidência que justifique a afirmação de que as duas máquinasproduzam bastões com diferentes diâmetros médios? Use α = 0, 05.

16 - Dois catalisadores podem ser usados em um processo químico em batelada. Dozebateladas foram preparadas usando o catalisador 1, resultando em um rendimentomédio de 86,20. Quinze bateladas foram preparadas usando o catalisador 2, resul-tando em um rendimento médio de 89,38. Considere que as medidas de rendimentosejam distribuídas aproximadamente de forma normal, com desvios padrão de 2,91 e2,07, respectivamente. Há evidência que justifique a afirmação de que o catalisador2 produza um rendimento maior do que o catalisador 1? Use α = 0, 01.

17 - Na fabricação de semicondutores, o ataque químico por via úmida é frequentementeusado para remover silicone da parte posterior das pastilhas antes da metalização.A taxa de ataque é uma característica importante nesse processo e é sabido que elasegue uma distribuição normal. Duas soluções diferentes para ataque químico têmsido comparadas, usando duas amostras aleatórias de 10 pastilhas para cada solução.As taxas observadas de ataque (10−3polegadas/min) são dadas a seguir:

Solução 1 9,9 9,4 9,3 9,6 10,2 10,6 10,3 10,0 10,3 10,1Solução 2 10,2 10,6 10,7 10,4 10,5 10,0 10,2 10,7 10,4 10,3

Os dados justificam a afirmação de que a taxa média de ataque seja a mesma paraambas as soluções? Considere que ambas as populações tenham variâncias iguais a0, 1(10−3polegadas/min)2 e use α = 0, 05.

18 - Dois fornecedores fabricam uma engrenagem de plástico em uma impressora a laser. Aresistência de impacto (medida em libras-pé) dessas engrenagens é uma característicaimportante. Uma amostra aleatória de 10 engrenagens do fornecedor 1 resulta emx = 289, 3, enquanto a outra amostra aleatória de 16 engrenagens do fornecedor 2resulta em y = 321, 5. Sabendo que σX = 22, 5 e σY = 21, há evidência justificandoa afirmação de que o fornecedor 2 fornece engrenagens com maiores resistênciasmédias de impacto? Use α = 0, 05 e considere que ambas as populações sejamnormalmente distribuídas.

19 - Dez indivíduos participaram de um programa de modificação alimentar para estimar aperda de peso. Seus pesos antes e depois da participação no programa são mostradosna lista a seguir. Há evidência para justificar a afirmação de que esse programaparticular de modificação alimentar seja efetivo na redução do peso médio? Useα = 0, 05.

39

Page 40: Apostila de Estatistica

PesoIndivíduo Antes Depois

1 195 1872 213 1953 247 2214 201 1905 187 1756 210 1977 215 1998 246 2219 294 27810 310 285

20 - Dois diferentes testes analíticos podem ser usados para determinar o nível de impurezaem ligas de aço. Oito espécimes são testados usando ambos os procedimentos, sendoos resultados mostrados na tabela a seguir. Há evidência suficiente para concluir queambos os testes fornecem o mesmo nível médio de impureza? Use α = 0, 01.

Espécime Teste 1 Teste 21 1,2 1,42 1,3 1,73 1,5 1,54 1,4 1,35 1,7 2,06 1,8 2,17 1,4 1,78 1,3 1,6

Gabarito

1) RC = [1823, 19; +∞) 11) RC = [0; 0, 8506]2) RC = [81, 792; +∞) 12) RC = [0; 0, 5432]3) RC = (−∞; 147, 74] ∪ [152, 26; +∞) 13) RC = (−∞;−1, 8594] ∪ [1, 8594; +∞)4) RC = [5, 54; +∞) 14) RC = (−∞;−0, 1088] ∪ [0, 1088; +∞)5) a) RC = [1620, 74; +∞) 15) RC = (−∞;−0, 4243] ∪ [0, 4243; +∞)6) RC = [24, 152; +∞) 16) RC = (−∞;−2, 3199]7) RC = [60, 76; +∞) 17) RC = (−∞;−0, 277] ∪ [0, 277; +∞)8) RC = (−∞; 6, 25] ∪ [7, 75; +∞) 18) RC = (−∞;−14, 501]9) RC = (−∞; 98, 0015] ∪ [101, 9985; +∞) 19) RC = [3, 7166; +∞)10) RC = [0; 0, 402] ∪ [0, 598; 1] 20) RC = (−∞;−0, 2136] ∪ [0, 2136; +∞)

40

Page 41: Apostila de Estatistica

UNIVERSIDADE FEDERAL DE CAMPINA GRANDE - Campus de Campina GrandeUNIDADE ACADÊMICA DE ESTATÍSTICADisciplina: Introdução à Estatística Período 2015.1Professores: Amanda Gomes e Manoel Santos-Neto

Relação de Exercícios para o 2◦ Estágio

Livro: "Estatística Básica". Wilton O. Bussab e Pedro A. Morettin. 5a. Edicão.

Capítulo 12 (Testes de Hipóteses)

Problema Página3 3308 334

10, 12 e 13 33722 350

25 e 27 35135 353

Capítulo 13 (Inferência para Duas Populações)

Problema Página6 365

16 e 19 380

41