sÉrie: estatística básica1.2. distribuição amostral dos estimadores 7 1.2.1. distribuição...

S É R I E : E s t a t í s t i c a B á s i c aT e x t o 3 : A M O S T R A G E M & E S T I M A Ç Ã O

Prof. Lorí Viali - [email protected] - http://www.mat.pucrs.br/~lori/ 2

SUMÁRIO

1. AMOSTRAGEM 3

1.1. Conceitos básicos 3

1.2. Distribuição amostral dos estimadores 71.2.1. Distribuição amostral da média 71.2.2. Distribuição amostral da variância 101.2.3. Distribuição amostral da proporção 11

2. ESTIMAÇÃO 14

2.1. Propriedades dos estimadores 14

2.2. Estimação por ponto 14

2.3. Estimação por intervalo 142.3.1. Da média populacional 152.3.2. Da proporção populacional 172.3.3. Da variância populacional (σ2) 192.3.4. Do desvio padrão populacional (σ) 20

3. EXERCÍCIOS 22

4. RESPOSTAS DOS EXERCÍCIOS 25

5. REFERÊNCIAS 27



1. AMOSTRAGEM1.1. CONCEITOS BÁSICOS

Estatística Indutiva. Muitas vezes, apesar dos recursos computacionais e da boa vontade não épossível estudar todo um conjunto de dados de interesse. Neste caso estuda-se uma parte do conjunto.O principal motivo para se trabalhar com uma parte do conjunto ao invés do conjunto inteiro é o custo.

O conjunto de todos os elementos que se deseja estudar é denominado de população. Note-seque o termo população é usado num sentido amplo e não significa, em geral, conjunto de pessoas.Pode-se definir uma população como sendo:

Uma coleção dos possíveis elementos, objetos ou medidas de interesse.Assim, são exemplos de populações:

• O conjunto das rendas de todos os habitantes de Porto Alegre;

• O conjunto de todas as notas dos alunos de Estatística;

• O conjunto das alturas de todos os alunos da Universidade; etc.

Um levantamento efetuado sobre toda uma população é denominado de levantamento censitá-rio ou Censo.

Fazer levantamentos, estudos, pesquisas, sobre toda uma população (censo) é, em geral, muitodifícil. Isto se deve à vários fatores. O principal é o custo. Um censo custa muito caro e demanda umtempo considerável para ser realizado. Assim, normalmente, se trabalha com partes da população de-nominadas de amostras. Uma amostra pode ser caracterizada como:

Uma porção ou parte de uma população de interesse.Utilizar amostras para se ter conhecimento sobre populações é realizado intensamente na

Agricultura, Política, Negócios, Marketing, Governo, etc., como se pode ver pelos seguintes exemplos:

• Antes da eleição diversos órgãos de pesquisa e imprensa ouvem um conjunto selecionado deeleitores para ter uma idéia do desempenho dos vários candidatos nas futuras eleições.

• Uma empresa metal-mecânica toma uma amostra do produto fabricado em intervalos detempo especificados para verificar se o processo está sob controle e evitar a fabricação de itens defei-tuosos.

• O IBGE faz levantamentos periódicos sobre emprego, desemprego, inflação, etc.

• Redes de rádio e TV se utilizam constantemente dos índices de popularidade dos programaspara fixar valores da propaganda ou então modificar ou eliminar programas com audiência insatisfató-ria.

• Biólogos marcam pássaros, peixes, etc. para tentar prever e estudar seus hábitos.

O processo de escolha de uma amostra da população é denominado de amostragem.

Riscos da amostragem. O processo de amostragem envolve riscos, pois toma-se decisões so-bre toda a população com base em apenas uma parte dela. A teoria da probabilidade pode ser utiliza-da para fornecer uma idéia do risco envolvido, ou seja, do erro cometido ao utilizar uma amostra ao in-



vés de toda a população, desde que, é claro, a amostra seja selecionada através de critérios probabilísti-cos, isto é, ao acaso.

Baseado nos conceitos anteriores pode-se definir Estatística Indutiva ou Inferencial comosendo:

A coleção de métodos e técnicas utilizados para se estudar uma população baseados em amos-tras probabilísticas desta mesma população.

Uma amostra é dita probabilística se todos os elementos da população tive-rem probabilidade conhecida e não zero de pertencer a amostra.

Dentre as várias maneiras de se selecionar uma amostra probabilística ou aleatória de uma po-pulação a mais simples é atribuir a todos os elementos da população a mesma probabilidade de perten-cer a amostra.

Uma amostra que satisfaça tal critério é denominada de amostra aleatória simples (aas).

Uma aas pode ser extraída de uma população de acordo com os critérios:

(a) com reposição e (b) sem reposição.

Se a população for infinita então as retiradas com e sem reposição serão equivalentes, isto é,se a população for infinita (ou então muito grande), o fato de se recolocar o elemento retirado de voltana população. não vai afetar em nada a probabilidade de extração do elemento seguinte.

Se, no entanto, a população for finita (e pequena) será necessário fazer uma distinção entre osdois procedimentos, pois na extração com reposição as diversas retiradas serão independentes, mas noprocesso sem reposição haverá dependência entre as retiradas, isto é, o fato de não recolocar o ele-mento retirado afeta a probabilidade do elemento seguinte ser retirado. A amostragem sem reposição émais eficiente que a amostragem com reposição e reduz a variabilidade uma vez que não é possível re-tirar elementos extremos mais do que uma vez.

Assim se N representa o tamanho da população e n < N o tamanho da amostra, então o núme-ro de amostras possíveis de acordo com os critérios com e sem reposição será:

(a) Com reposiçãok = número de amostras = Nn

(b) Sem reposição

k = número de amostras = N

n

�

��

�

�� = N

n N n!

!( )!−

Exemplo:

Considere a população P = { 1, 3, 5, 6 }. Então o número de amostras possíveis de tamanhosn = 2 e n = 3, de acordo com os critérios com e sem reposição será:

(a) Sem reposição(1) n = 2

Como N = 4 e n = 2, então o número de amostras possíveis será: N

n

�

��

�

�� =

4

2

�

��

�

�� = 4

2 4 2!

!( )!− = 6

Estas amostras serão: (1, 3) (1, 5) (1, 6) (3, 5) (3, 6) (5, 6)



(2) n = 3

Como N = 4 e n = 3, então o número de amostras possíveis será: N

n

�

��

�

�� =

4

3

�

��

�

�� = 4

3 4 3!

!( )!− = 4

Estas amostras serão: (1, 3, 5) (1, 3, 6) (1, 5, 6) (3, 5, 6).

(b) Com reposição(1) n = 2

Como N = 4 e n = 2, então o número de amostras possíveis será Nn = 42 = 16.

Estas amostras serão: (1, 1) (1, 3) (1, 5) (1, 6) (3, 3) (3, 5) (3, 6) (5, 5)

(5, 6) (6, 6) (3, 1) (5, 1) (6, 1) ( 5, 3) (6, 3) (6, 5)

Como pode ser observado neste caso as amostras (a, b) e (b, a) são consideradas diferentes,isto é, na amostragem com reposição as amostras são ordenadas.

(2) n = 3

Como N = 4 e n = 3, então o número de amostras possíveis será Nn = 43 = 64

Algumas destas amostras são:

(1, 1, 1) (1, 1, 3), (1, 3, 1), (3, 1, 1) (1, 3, 5) (1, 5, 3) ( 5, 3, 1) (5, 1, 3)

(1, 3, 6) (3, 3, 3), (5, 5, 5) (5, 5, 6) (1, 5, 6) (3, 5, 6) , etc.

Estimador, estimativas e parâmetros

Uma característica da população é denominada parâmetro.Um parâmetro é uma constante, isto é, é um número que representa uma característica única

da população.

Assim se P é uma população, os principais parâmetros seriam:

(i) A média de P, anotada por µP

(ii) A variância de P, anotada por P2σ

(iii) O desvio padrão de P, anotado por σP

(iv) A proporção de elementos de P que apresentam determinada característica, anotada por:π, entre outros.

Exemplo:Para a população P = { 1, 3, 5, 6 } os parâmetros acima seriam:

(i) µP = (1 + 3 + 5 + 6) / 4 = 15 / 4 = 3,75

(ii) P2σ = (1 + 9 + 25 + 36) / 4 - 3,752 = 71/4 - 3,752 = 17,75 - 14,0625 = 3,6875 = 3,69.

(iv) σP = 1,9203 = 1,92

(v) π = 1 / 4 = 25%, onde o numerador representa o número de elementos pares na população



Estimador

Um estimador é uma característica da amostra.Como a amostra é aleatória um estimador é uma variável aleatória. Assim tudo o que foi visto

em probabilidade sobre variáveis aleatórias, aplica-se aos estimadores. A distribuição de probabilidadede um estimador é denominada de distribuição amostral.

Os principais estimadores são:

(I) A média da amostra, X que é um estimador da média da população: µ

(ii) A variância amostral, S2 que é um estimador da variância populacional: σ2

(iii) A proporção amostral, P, que é um estimador amostral da proporção populacional π.

Estimativa

Uma estimativa é um valor particular de um estimadorAssim x = 2 é uma estimativa. O estimador é a expressão (fórmula) enquanto que a estimati-

va é o valor particular que ele assume (número).

Cálculo dos principais estimadores.Se (X1, X2, ..., Xn) é uma amostra aleatória de tamanho “n” extraída de uma população, então:

(a) X = iX n� / é uma estimativa da média populacional quando a amostra não está agrupadae X = iif X n� / é uma estimativa da média da amostra quando a amostra está agrupada em uma distri-buição de freqüências (por ponto ou por valores).

(b) S2 = �( )2

1iX Xn−−

= iX Xnn

2 2

1−−

� é uma estimativa da variância populacional quando aamostra não está agrupada e

S2 = �( )2

1i if X X

n−− = iif X Xn

n

2 2

1−−� é uma estimativa da variância populacional quando a

amostra está agrupada em uma distribuição de freqüências. Note-se que agora a variância é calculadacom “n - 1” no denominador. Isto se deve ao fato de que a variância for calculada com “n” no denomina-dor, a média de sua distribuição amostral não será igual a variância populacional o que caracterizariaum estimador tendencioso.

Embora a variância seja calculada com “n - 1” no denominador com o objetivo de que as es-timativas variem em torno do parâmetro, isto não irá ocorrer se a amostragem for sem reposição de po-pulação finita. Neste caso é necessário utilizar, ainda, uma correção para a variância que consiste emmultiplicá-la pelo valor (N - 1) / N. Evidentemente esta correção só será necessária se a população forpequena, caso contrário o quociente acima será aproximadamente igual a um e a correção não precisaráser feita.

Assim se a população for finita (e pequena) e a amostragem for realizada sem reposição a va-riância deverá ser calculada por:

�S2 = NN− 1S2



(c) P = f / n, onde f = freqüência de elementos na amostra com determinada característica éuma estimativa da proporção populacional π.

1.2. DISTRIBUIÇÃO AMOSTRAL DOS ESTIMADORES

1.2.1. Distribuição amostral da média(1) Amostragem com reposiçãoConsidere-se a população P = { 1, 3, 5, 6 } e todas as amostras possíveis de tamanho n = 2

extraídas com reposição. Para cada amostra vai-se calcular a média. Ter-se-á assim um conjunto de 16valores que serão dispostos em uma tabela, com as respectivas probabilidades, e que constituirá então adistribuição amostral da média da amostra.

As possíveis amostras com as respectivas médias são:

Amostras (1, 1) (1, 3) (1, 5) (1, 6) (3, 3) (3, 5) (3, 6) (5, 5)1 2 3 3,5 3 4 4,5 5

Amostras (5, 6) (6, 6) (3, 1) (5, 1) (6, 1) ( 5, 3) (6, 3) (6, 5)x 5,5 6 2 3 3,5 4 4,5 5,5

Colocando estes resultados em uma tabela (distribuição amostral da média) vem:

x f( x ) = P( X = x ) x f( x ) x2 f( x )1,0 1/16 1/16 1,0/162,0 2/16 4/16 8,0/163,0 3/16 9/16 27,0/163,5 2/16 7/16 24,5/164,0 2/16 8/16 32,0/164,5 2/16 9/16 40,5/165,0 1/16 5/16 25,0/165,5 2/16 11/16 60,5/166,0 1/16 6/16 36,0/16�� 1 60/16 254,5/16

Pela tabela pode-se verificar que:

E(X) = �x f(x ) = 60/16 = 3,75 = µ, isto é a expectância (média) de todas as médias amostrais,extraídas com reposição da população P, é igual a média populacional (parâmetro populacional média).

V(X) = �� 2x f(x ) - X2µ = 254,5/16 - 3,752 = 1,84375 = σ2/ 2 = 3,6875/2, isto é, a variância en-

tre as médias amostrais é “n” vezes (neste caso 2 vezes) menor que a variância populacional.

O valor Xσ = 1,36 é denominado erro padrão da média. Ele mede a variabilidade entre asmédias amostrais e dá uma idéia do erro que se comete ao se substituir a média da população pela mé-dia da amostra.

De fato, verificando a tabela acima, pode-se ver que se por exemplo, fosse selecionada aamostra (1, 1) seríamos levados a crer que a média da população seria um, quando de fato ela vale3,75, cometendo assim um erro de 2,75 unidades. Felizmente este erro (o maior possível neste caso) sóvai ocorrer com uma probabilidade de 1/16 = 6,25%. Se por exemplo, fosse selecionada a amostra



(1, 6) a média amostral seria 3,5 e o erro cometido (neste caso) seria de 0,25 unidades. Este erro bemmenor que o anterior ocorre com uma probabilidade de 2/16 = 12,5%. O que o desvio padrão da distri-buição amostral da média faz é determinar o erro médio, sendo por isso denominado, então, de erropadrão da amostragem.

(2) Amostragem sem reposiçãoConsidere-se a população P = { 1, 3, 5, 6 } e todas as amostras possíveis de tamanho n = 2

extraídas sem reposição.

As possíveis amostras com as respectivas médias são:

Amostras (1, 3) (1, 5) (1, 6) (3, 5) (3, 6) (5, 6)x 2 3 3,5 4 4,5 5,5

Colocando estes resultados em uma tabela (distribuição amostral da média) vem:

x f(x ) = P(X = x ) x f(x ) 2x f(x )2,0 1 / 6 2,0 / 6 04,00 / 63,0 1 / 6 3,0 / 6 09,00 / 63,5 1 / 6 3,5 / 6 12,25 / 64,0 1 / 6 4,0 / 6 16,00 / 64,5 1 / 6 4,5 / 6 20,25 / 65,5 1 / 6 5,5 / 6 30,25 / 6�� 1 22,5 / 6 91,75 / 6

Da tabela segue:

E(X) = �x f(x ) = 22,5/6 = 3,75 = µ, isto é a expectância (média) de todas as médias amos-trais, extraídas sem reposição da população P, também é igual a média populacional (parâmetro popu-lacional média).

V(X) = �� 2x f(x ) - X2µ = 91,75/6 - 3,752 = 1,2292 =

2

2 1σ .N n

N−− = 1,84375. (2/3), isto é, a variân-

cia entre as médias amostrais é “n” vezes (neste caso 2 vezes) menor que a variância populacionalmultiplicada pelo fator de correção de população finita. Este fator, pode ser considerado como o fatorde eficiência da amostragem sem reposição sobre a amostragem com reposição, que neste caso (N = 4e n =2) vale 2/3. Como na amostragem sem reposição não é possível retirar o mesmo elemento duasvezes, as médias não podem assumir valores tão extremos, como por exemplo, o valor “um” ou “seis”que assumiram na amostragem com reposição. Isto faz com que a erro padrão na amostragem sem re-posição seja menor do que na amostragem com reposição.

O fator de redução da variância na amostragem sem reposição é: (N - n) / (N -1)

Pode-se perceber facilmente que quanto maior for a diferença entre o tamanho da população eo tamanho da amostra mais próximo de “um” será este fator. Então, como regra prática, pode-se admi-tir como necessária a correção para a variância das médias amostrais sempre que o tamanho da amostraexceder a 5% do tamanho da população. Caso isto não ocorra não é necessário fazer-se a distinção en-tre os dois procedimentos (com e sem reposição).

Evidentemente as considerações acima valem para populações pequenas. Se a população ébastante grande ou infinita, não mais será possível pensar em construir tabelas para representar a distri-buição das médias amostrais. Neste caso é necessário procurar por modelos probabilísticos que descre-



vam a distribuição da média amostral. Neste caso, também, como declarado acima a distinção entreamostragem com e sem reposição não será necessário, pois o fator de correção será “aproximadamenteum” e não necessitará ser utilizado.

Os modelos probabilísticos são conhecidos a partir dos dois seguintes resultados:

(a) Se (X1, X2, ..., Xn) é uma amostra aleatória de uma população com distribuição normal demédia µ e desvio padrão σ, então a média da amostra (X) terá uma distribuição também normal com amesma média da população e com desvio padrão (erro padrão) raiz de “n” vezes menor que o desviopadrão da população, isto é:

Se X é N(µ, σ) então X será N(µ, σn

)

(b) Teorema Central do Limite

Se (X1, X2, ..., Xn) é uma amostra aleatória extraída de uma população com qualquer distri-buição de média µ e desvio padrão σ, então a média da amostra (X) terá uma distribuição aproxima-damente normal com a mesma média da população e com desvio padrão (erro padrão) raiz de “n” ve-zes menor que o desvio padrão da população à medida que o tamanho da amostra aumenta.

OBS.: Para amostras de 30 ou mais valores, em geral, a aproximação já será suficiente boa,para se poder utilizar este resultado.

Assim:

Se X tem qualquer distribuição então X terá uma distribuição aproximadamente N(µ, n

σ )

para n grande (n ≥ 30).

Exemplos:(1) Uma população X tem uma distribuição normal de média 100 e desvio padrão 10.

(a) Qual P(95 < X < 105)?

(b) Se X é a média de 16 elementos extraída desta população, qual a P(95 < X < 105) ?

Solução:(a) Como X é uma N(100, 10) vem:

P(95 < X < 105) = P(-0,5 < Z < 0,5) = Φ(0,5) - Φ(-0,5) = 0,6915 - 0,3185 = 38,30%.

Neste caso X é uma N(100; 2,5), então:

(b) P(95 < X < 105) = P(-2,0 < Z < 2,0) = Φ(2,0) - Φ(-2,0) = 0,9772 - 0,0228 = 95,44%.

(2) A renda de um conjunto de pessoas de uma certa região tem média 6 s.m. e desvio padrãode 2 s.m. Se desta população for extraída uma amostra de n = 100 pessoas, qual a probabilidade de amédia desta amostra acuse um valor superior a 6,3 s.m?

Solução:Neste caso, como não foi declarado que a população é normal é necessário aplicar o teorema

central do limite, uma vez que n = 100 > 30, isto é possível. A média da amostra terá uma distribuiçãoaproximadamente normal com média 6 s.m. e desvio padrão de: 2 / 10 = 0,20, uma vez que o erro pa-drão da média é raiz de n vezes menor do que o desvio padrão populacional. Então, a probabilidadepedida será:



P(X > 6,30) = P(Z > (6,30 - 6)/0,20 ) = P (Z > 1,5) = Φ(-1,5) = 6,68%, isto é, apenas 6,68%das médias de amostras de tamanho n = 100 apresentarão um valor superior a 6,30 s.m.

1.2.2. Distribuição amostral da variância(1) Amostragem COM reposiçãoConsidere-se a população P = { 1, 3, 5, 6 } e todas as amostras possíveis de tamanho n = 2

extraídas com reposição. Para cada amostra vai-se calcular a variância. Ter-se-á assim um conjunto de16 valores que serão dispostos em uma tabela, com as respectivas probabilidades, e que constituirá en-tão a distribuição amostral da variância.

As possíveis amostras com as respectivas variâncias são:

Amostras (1, 1) (1, 3) (1, 5) (1, 6) (3, 3) (3, 5) (3, 6) (5, 5)x 1 2 3 3,5 3 4 4,5 5s2 0 2 8 12,5 0 2 4,5 0

Amostras (5, 6) (6, 6) (3, 1) (5, 1) (6, 1) ( 5, 3) (6, 3) (6, 5)x 5,5 6 2 3 3,5 4 4,5 5,5s2 0,5 0 2 8 12,5 2 4,5 0,5

Colocando estes resultados em uma tabela(distribuição amostral da variância) vem:

s2 f(s2) = P(S2 = s2) s2f(s2)0,0 4/16 0/160,5 2/16 1/162,0 4/16 8/164,5 2/16 9/168,0 2/16 16/1612,5 2/16 25/16�� 1 59/16

Pela tabela segue que:

E(S2) = �s2f(s2) = 59/16 = 3,6875 = σ2, isto é a expectância (média) de todas as variâncias dasamostras de tamanho n = 2, extraídas com reposição da população P, é igual a variância populacional(parâmetro populacional variância). Em outras palavras, pode-se dizer que quando a amostragem écom reposição a variância amostral S2 é um estimador não tendencioso da variância populacional σ2.

Desta forma, sempre que se desejar estimar a variância de uma população onde as amostrasforam retiradas com reposição, pode-se usar a variância amostral como estimador.

(2) Amostragem SEM reposiçãoConsidere-se a população P = { 1, 3, 5, 6 } e todas as amostras possíveis de tamanho n = 2

obtidas sem reposição. As possíveis amostras com as respectivas variâncias são:Amostras (1, 3) (1, 5) (1, 6) (3, 5) (3, 6) (5, 6)

x 2 3 3,5 4 4,5 5,5s2 2 8 12,5 2 4,5 0,5



Colocando estes resultados em uma tabela (distribuição amostral da variância) vem:

s2 f(s2) = P(S2 = s2) s2f(s2)0,5 1/6 0,5/62,0 2/6 4,0/64,5 1/6 4,5/68,0 1/6 8,0/612,5 1/6 12,5/6�� 1 29,5/6

Pela tabela pode-se ver que:

E(S2) = �s2f(s2) = 29,5/6 ≠ 3,6875 = σ2, isto é a expectância (média) de todas as variânciasdas amostras de tamanho n = 2, extraídas sem reposição da população finita P, não é igual a variânciapopulacional (parâmetro populacional variância). Neste caso, para que se obtenha um estimador nãotendencioso da variância populacional é necessário corrigir a variância amostral através do fator (N - 1)/ N. Assim se cada variância acima for multiplicada por este fator, que neste caso será, (N - 1) / N = 3 /4 = 0,75, então, se terá:

2�s f( 2

�s ) = P( 2�S = 2�s ) 2

�s f( 2�s )

0,375 1/6 0,375/61,500 2/6 3,000/63,375 1/6 3,375/66,000 1/6 6,000/69,375 1/6 9,375/6�� 1 22,125/6

E( 2�S ) = � 2�s f( 2

�s ) = 22,125 / 6 = 3,6875 = σ2, isto é a expectância (média) de todas as variân-cias corrigidas é igual ao parâmetro populacional σ2. Assim quando a população é pequena e amostra-gem for sem reposição é necessário corrigir a variância da amostra pelo fator (N - 1) / N, para que elaseja um bom estimador da variância populacional. É claro que esta correção só será importante parapopulações pequenas. Se a população for grande, por exemplo, N = 1000, então o fator (N - 1) / N =999 / 1000 = 0,999 o que é aproximadamente 1. Neste caso, não é necessário usar esta correção e aamostragem sem reposição pode ser considerada equivalente a com reposição para efeitos de estimaçãoda variância populacional.

Evidentemente as considerações acima valem para populações pequenas. Se a população ébastante grande ou infinita, não mais será possível pensar em construir tabelas para representar a distri-buição das variâncias amostrais. Neste caso é necessário procurar por modelos probabilísticos (fun-ções) que descrevam a distribuição da variância amostral. Para a variância este modelo existe e é de-nominado de distribuição Qui-quadrado (χ2).

1.2.3. Distribuição amostral da proporção(1) Amostragem COM reposiçãoConsidere-se a população P = { 1, 3, 5, 6 } e todas as amostras possíveis de tamanho n = 2

obtidas com reposição. Para cada amostra vai-se calcular a proporção P de elementos pares na popula-



ção. Ter-se-á assim um conjunto de 16 valores que serão dispostos em uma tabela, com as respectivasprobabilidades, e que formarão então a distribuição amostral da proporção.

As possíveis amostras com as respectivas proporções são:

Amostras (1, 1) (1, 3) (1, 5) (1, 6) (3, 3) (3, 5) (3, 6) (5, 5)p 0 0 0 1/2 0 0 1/2 0

Amostras (5, 6) (6, 6) (3, 1) (5, 1) (6, 1) ( 5, 3) (6, 3) (6, 5)p 1/2 1 0 0 1/2 0 1/2 1/2

Colocando estes resultados em uma tabela (distribuição amostral da proporção) vem:

p f(p) = P(P = p) pf(p) p2f(p)0,0 9/16 0/16 0,0/160,5 6/16 3/16 1,5/161,0 1/16 1/16 1,0/16�� 1 4/16 2,5/16

Pode-se então calcular a expectância e a variância:

E(P) = �pf(p) = 4/16 = 0,25 = π, isto é o valor esperado (média) de todas as proporçõesamostrais, extraídas com reposição da população P, e é igual a proporção populacional (parâmetro po-pulacional π). Isto significa, que o estimador P é um estimador não tendencioso (ou não viciado) daproporção populacional π, quando as amostras são extraídas com reposição da população.

V(P) = ��p2f(p) - P2µ = 2,5/16 - 0,252 = 0,09375 = π(1 - π) / n, isto é, a variância entre as pro-

porções amostrais é “n” vezes (neste caso 2 vezes) menor que a variância populacional. Isto porquequando se está trabalhando com proporções, pode-se mostrar que a variância populacional é igual a π(1 - π).

O valor Pσ = π π( )1−n = 0,09375 é denominado erro padrão da proporção. Ele mede a va-

riabilidade entre as proporções amostrais e dá uma idéia do erro que se comete ao se substituir a pro-porção da população pela proporção da amostra.

(2) Amostragem SEM reposiçãoConsidere-se a população P = { 1, 3, 5, 6 } e todas as amostras possíveis de tamanho n = 2

extraídas sem reposição.

As possíveis amostras com as respectivas proporções são:

Amostras (1, 3) (1, 5) (1, 6) (3, 5) (3, 6) (5, 6)p 0 0 1/2 0 1/2 1/2

Colocando estes resultados em uma tabela (distribuição amostral da proporção) vem:

p f(p) = P(P = p) pf(p) p2f(p)0,0 1/2 0,0/2 0,00/20,5 1/2 0,5/2 0,25/2�� 1 0,5/2 0,25/2



Portanto:

E(P) = �pf(p) = 0,5/2 = 0,25 = π, isto é a expectância (média) de todas as proporções amos-trais, extraídas sem reposição da população P, e é igual a proporção populacional (parâmetro populaci-onal π). Isto significa, que o estimador P é um estimador não tendencioso (ou não viciado) da propor-ção populacional π, quando as amostras são retiradas sem reposição.

V(P) = ��p2f(p) - P2µ = 0,25/2 - 0,252 = 0,0625 = π π( )

.12 1− −

−N nN , isto é, a variância entre as pro-

porções amostrais é “n” vezes (neste caso 2 vezes) menor que a variância populacional multiplicadapelo fator de correção de população finita. Este fator, pode ser considerado como o fator de eficiênciada amostragem sem reposição sobre a amostragem com reposição que, neste exemplo, (N = 4 e n = 2)vale 2/3.

Evidentemente as considerações acima valem para populações pequenas. Se a população ébastante grande ou infinita, não mais será possível pensar em construir tabelas para representar a distri-buição das proporções amostrais. Nesta situação é necessário procurar por modelos probabilísticos quedescrevam a distribuição da proporção amostral. Neste caso, também, como declarado acima a distin-ção entre amostragem com e sem reposição não será necessária, pois o fator de correção será “aproxi-madamente um” e não precisará ser utilizado.

O modelo probabilístico para a proporção amostral é dada pelo seguinte resultado:

(a) Se (X1, X2, ..., Xn) é uma amostra aleatória retirada de uma população com proporção π,então a distribuição da proporção amostral será aproximadamente normal com média µP

= π e desvio

padrão σP = π π( )1−n .

OBS.: Para amostras de 30 ou mais valores, em geral, a aproximação já será suficiente boa,para se poder utilizar este resultado. Para amostras pequenas a distribuição da proporção amostral éBinomial.

Exemplo:A proporção de eleitores do candidato D. M. A. Gogo numa certa região é de 20%. Extraída

uma amostra de 100 eleitores desta região, qual a probabilidade que ela apresente um número de eleito-res do candidato (a) Abaixo de 15% (b) Superior a 30%

Solução:Como n > 30 pode-se usar a distribuição normal com média µ = π = 20% e desvio padrão

σ = π π( )1−n = 0 2 1 0 2

100, ( , )− = 0,04 = 4%, Então:

(a) P(P < 15%) = P(Z < -1,25) = Φ(-1,25) = 10,56%.

(b) P(P > 30) = P(Z > 2,5) = Φ(-2,5) = 0,62%.



2. ESTIMAÇÃOA inferência estatística tem por objetivo fazer generalizações sobre uma população com base

em valores amostrais. A inferência pode ser feita estimando os parâmetros:

(a) Por ponto e

(b) Por intervalo.

A estimação por ponto é feita através de um único valor, enquanto que a estimação por inter-valo fornece um intervalo de valores em torno do valor da estimativa pontual.

Exemplo:Uma amostra aleatória simples de 400 pessoas de uma cidade é extraída e 300 respondem que

acham a administração municipal boa ou ótima. Então o valor p = 300/400 = 75% é uma estimativa porponto do percentual de pessoas da cidade que acham a administração boa ou ótima. Esta mesma esti-mativa poderia ser enunciado como de: 70% a 80% das pessoas da cidade acham a administração boaou ótima. Neste caso, teríamos uma estimativa por intervalo da proporção. Note-se que o centro do in-tervalo é o valor “75%” da estimativa pontual.

2.1. PROPRIEDADES DOS ESTIMADORES

Seja X uma população com um parâmetro de interesse θ e seja (X1, X2, ..., Xn) uma amostraaleatória simples extraída desta população. Seja �θ um estimador do parâmetro θ. Então:

(i) Se E( �θ ) = θ se dirá que �θ é um estimador não-tendencioso ou não viciado do parâmetropopulacional θ. Neste caso, a média do estimador �θ é o parâmetro populacional θ, ou ainda, pode-sedizer que o estimador varia em torno do parâmetro populacional.

(ii) Se �θ é um estimador não tendencioso de um parâmetro θ, se dirá que �θ é consistente se àmedida que o tamanho da amostra aumenta a variabilidade do estimador diminui, isto é, as observa-ções vão ficando cada vez mais concentradas em torno do parâmetro na medida em que a amostra vaificando cada vez maior. Em símbolos:

nV

→∞=lim (�)θ 0

2.2. ESTIMAÇÃO POR PONTO

Seja X uma população com média µ, desvio padrão σ e com uma proporção π e seja(X1, X2, ..., Xn) uma amostra aleatória simples extraída desta população. Então:

(a) X é um estimador não-tendencioso e consistente da média da população µ.

(b) P é um estimador não-tendencioso e consistente da proporção populacional π.

(c) S2 é estimador não-tendencioso e consistente da variância da população σ2, a menos que aextração seja sem reposição de população finita. Neste caso, o estimador é 2�S = NN

−1S2.

2.3. ESTIMAÇÃO POR INTERVALO

O estimador por ponto não permite ter uma idéia do erro cometido ao se fazer a estimativa doparâmetro. Para que se possa associar uma confiança (probabilidade) a uma estimativa é necessário



construir um intervalo em torno da estimativa por ponto. Este intervalo é construído baseado na distri-buição amostral do estimador.

2.3.1. Da média populacional

(a) Desvio padrão populacional (σσσσ) conhecidoO intervalo de confiança para a média (µ) de uma população é construído em torno da estima-

tiva pontual X . Para construir este intervalo fixa-se uma probabilidade “1 - α“ de que o intervaloconstruído contenha o parâmetro populacional. Desta forma, “α“ será a probabilidade de que o inter-valo obtido não contenha o valor do parâmetro, isto é, “α“ será a probabilidade de erro. Sabe-se que amédia da amostra tem distribuição normal de média µ e desvio padrão σ

n se a população de onde

for extraída a amostra for normal (ou se a amostra for superior a 30 e retirada de qualquer população )de média µ e de desvio padrão σ, pode-se então utilizar a curva normal para estabelecer os limites parao intervalo de confiança.

Lembrando que o que se quer é um intervalo que contenha o parâmetro populacional µ comprobabilidade “1 - α“ tem-se então:

P(-zα/2 < Z < zα/2) = 1 - α, onde zα/2 é o valor da normal padrão com área à direita é igual aα/2.

Mas Z = (X - µ) / σn substituindo na expressão acima vem:

P(-zα/2 < (X - µ) / σn < zα/2 ) = 1 - α. Trabalhando esta desigualdade, segue que:

P(X - zα/2σ

n < µ <X + zα/2σ

n ) = 1 - α. Que é o intervalo procurado. Assim o intervalo

de confiança (probabilidade) de “1 - α“ para a média de uma população é dado por:

[X - zα/2σ

n ; X + zα/2σ

n ] onde:

X é a estimativa por ponto da média da população.

σ é o desvio padrão da população e

zα/2 é o valor da distribuição normal padrão cuja área à direita é igual a α/2, isto é, é o valor deZ tal que: P(Z > zα/2) = α/2, ou então: Φ(-zα/2) = α/2.

Exemplo:Uma população tem um desvio padrão igual a 10 e média desconhecida. Uma amostra de ta-

manho n = 100 é retirada e fornece uma média x = 50. Qual o intervalo de 95% de confiança para amédia desta população?

Solução:Tem-se 1 - α = 95%, então α = 5% e α / 2 = 2,5%. O coeficiente de confiança que deve ser

buscado na normal padrão é valor zα/2 de Z tal que:

P(Z > zα/2) = 2,5%, ou então: Φ(-zα/2) = 2,5%.



Este valor vale 1,96. Então o intervalo de confiança de 95% para a média desta populaçãoserá:

[X - zα/2σ

n ; X + zα/2σ

n ] = [50 - 1,96.10/10; 50 + 1,96.10/10] = [50 - 1,96; 50 + 1,96] =

[48,04; 51,96], ou seja, pode-se afirmar com uma certeza de 95% de que este intervalo conteráa média desta população.

Obs.: O valor ε = zα/2σ

n é denominado de erro padrão da estimação. Não confundir com o

valor σn que é o erro padrão da amostragem. O erro padrão da estimação é a semi-amplitude do in-

tervalo de confiança. A amplitude do intervalo de confiança (IC) será; 2ε.

(b) Desvio padrão populacional (σσσσ) desconhecidoQuando o desvio padrão da população (σ) é desconhecido é necessário utilizar sua estimativa

“s”. Só que ao substituir-se o desvio padrão populacional pelo sua estimativa no quociente:

(X - µ) / σn não se terá mais uma normal padrão. De fato, conforme demonstrado pelo es-

tatístico inglês W. S. Gosset, conhecido por “Student” o comportamento do quociente:

(X - µ) /n

S segue uma distribuição simétrica em torno de zero, porém com uma variabili-

dade maior do que a da normal padrão. A distribuição do quociente acima é conhecida como distribui-ção “t” de Student.

Na realidade existem infinitas distribuições “t”, uma para cada tamanho de amostra. Estasdistribuições a exemplo da normal padrão encontram-se tabeladas.

A tabela para a distribuição “t” segue uma metodologia um pouco diferente daquela da normalpadrão. De fato, como existem muitas distribuições de Student não seria possível tabelá-las da mesmaforma que a da normal padrão. Assim cada linha de uma tabela representa uma distribuição diferente ecada coluna representa um valor de confiança que poderá ser “α“ ou “α/2”, isto é, a tabela poderá serunilateral ou bilateral. A linha de cada tabela fornece a distribuição “t” com parâmetro “n - 1” denomi-nado de graus de liberdade, isto é, o grau de liberdade = ν = n - 1 = linha da tabela.

Neste caso, o intervalo de confiança com probabilidade “1 - α“ para a média será:

[X - tα/2 Sn ; X + tα/2 S

n] onde:

X é a estimativa por ponto da média da população;

S é o desvio padrão da amostra e uma estimativa do desvio padrão da população σ e

tα/2 é o valor da distribuição t cuja área à direita é igual a α/2, isto é, é o valor de t tal que:

P(t > tα/2) = α/2, ou então: P(- tα/2 < t < tα/2) = 1 - α.

Exemplo:

Uma amostra de tamanho 25 foi retirada de uma população com o objetivo de estimar a suamédia e forneceu os valores x = 50 e s = 10. Qual o intervalo de 95% de confiança para a média destapopulação?



Solução:Tem-se 1 - α = 95%, então α = 5% e α / 2 = 2,5%. O coeficiente de confiança que deve ser

buscado na distribuição t com ν = n - 1 = 25 - 1 = 24. Esta é a linha da tabela. A coluna poderá ser ovalor α = 5% ou então o valor α / 2 = 2,5%, dependendo do tipo de tabela. Em qualquer caso o que seprocura é o valor “t” com grau de liberdade igual a 24, isto é, o valor t24

tal que:

P(- tα/2 < t24 < tα/2) = 95%

Este valor vale 2,064. (Note-se que na a normal este mesmo valor valia 1,96). Então o inter-valo de confiança de 95% para a média desta população será:

[X - tα/2 Sn ; X + tα/2 S

n] = [50 - 2,064.10/5; 50 + 2,064.10/5] = [50 - 4,13; 50 + 4,13] =

[45,87; 54,13], ou seja, pode-se afirmar com uma certeza de 95% de que este intervalo conterá a médiadesta população.

Convém notar que a última linha da tabela da distribuição “t” apresenta valores coincidentescom aqueles que seriam obtidos se fosse utilizado a distribuição normal padrão. Isto ocorre porque adistribuição “t” tende a distribuição normal à medida que o tamanho da amostra aumenta, isto é, a dis-tribuição normal é o limite da distribuição “t” quando o tamanho da amostra tende ao infinito.

Esta aproximação já será bastante boa para amostras de tamanho n > 30. Assim se a amostrafor superior a 30 pode-se utilizar a distribuição normal ao invés da distribuição “t”, isto é, pode-se leros valores na normal padrão, ou então na última linha da tabela “t”.

2.3.2. Da proporção populacionalSeja P = proporção amostral. Sabe-se que para n > 30 a distribuição amostral de P é aproxi-

madamente normal com média µP = π e desvio padrão (erro padrão) σP = π π( )1−n . Pode-se então utili-

zar a curva normal para estabelecer os limites para o intervalo de confiança.

Lembrando que o que se quer é um intervalo que contenha o parâmetro populacional π comprobabilidade “1 - α“ então tem-se:

P(-zα/2 < Z < zα/2) = 1 - α, onde zα/2 é o valor da normal padrão com área à direita é igual aα/2.

Mas Z = (P- µP) / σP então substituindo na expressão acima vem:

P(-zα/2 < (P - µP) / σP < zα/2 ) = 1 - α. Trabalhando esta desigualdade, segue que:

P(P - zα/2σP < µP <P + zα/2σP) = P(P - zα/2σP < π <P + zα/2σP) = 1 - α. Que é o intervalo procu-rado. Assim o intervalo de confiança (probabilidade) de “1 - α“ para a proporção “P” de uma popula-ção é dado por:

[P- zα/2π π( )1−

n ; P + zα/2π π( )1−

n ].

Observando-se a expressão acima pode-se perceber que o intervalo de confiança para a pro-porção populacional π, depende dele mesmo, isto é, é necessário calcular o erro amostral que está ex-presso em função de π. Como o objetivo é estimar este valor, evidentemente ele não é conhecido. As-



sim é necessário utilizar, sua estimativa P�σ , isto é, é necessário substituir π por P na expressão σP =π π( )1−

n . Desta forma o intervalo acima ficará:

[P- zα/2P P

n( )1−

; P + zα/2P P

n( )1− ], onde:

P é a estimativa por ponto da proporção populacional π.

P�σ = P Pn

( )1− é uma estimativa do erro padrão, isto é, do desvio padrão amostral e

zα/2 é o valor da distribuição normal padrão cuja área à direita é igual a α/2. É o valor de Z talque: P(Z > zα/2) = α/2, ou então: Φ(-zα/2) = α/2.

Exemplo 1:Numa pesquisa de mercado, 400 pessoas foram entrevistadas sobre sua preferência por deter-

minado produto. Destas 400 pessoas, 240 disseram preferir o produto. Determinar um intervalo de con-fiança de 95% de probabilidade para o percentual de preferência dos consumidores em geral para esteproduto.

Solução:

Tem-se 1 - α = 95%, então α = 5% e α / 2 = 2,5%. O coeficiente de confiança que deve serbuscado na normal padrão é valor zα/2 de Z tal que:

P(Z > zα/2) = 2,5%, ou então: Φ(-zα/2) = 2,5%.

Este valor vale 1,96. A estimativa por ponto para a proporção populacional será: p = f/n =240/400 = 0,60 = 60%.

Então o intervalo de confiança de 95% para a proporção populacional será:

[P- zα/2P P

n( )1−

; P + zα/2P P

n( )1− ] = [0,60 - 1,96 0 60 1 0 60

400, ( , )− .; 0,60 + 1,96 0 60 1 0 60

400, ( , )− ]

= [60% - 4,80% ; 60% + 4,80%] = [55,20%; 64,80%], ou seja, pode-se afirmar com uma certeza de95% de que este intervalo conterá a proporção populacional, isto é, a verdadeira percentagem dos con-sumidores que preferem o produto pesquisado.

Exemplo 2:Numa pesquisa de mercado para estudar a preferência da população de uma cidade em relação

ao consumo de um determinado produto, colheu-se uma amostra aleatória de 300 consumidores da ci-dade e observou-se que 180 consumiam o produto. Determinar um IC de 99% para a proporção popu-lacional de consumidores do produto.

Solução:

Tem-se 1 - α = 99%, então α = 1% e α / 2 = 0,5%. O coeficiente de confiança que deve serbuscado na normal padrão é valor zα/2 de Z tal que:

P(Z > zα/2) = 0,5%, ou então: Φ(-zα/2) = 0,5%.

Este valor vale 2,575. A estimativa por ponto para a proporção populacional será: p = f/n =180/300 = 0,60 = 60%.



Então o intervalo de confiança de 99% para a proporção populacional será:

[P- zα/2P P

n( )1−

; P + zα/2P P

n( )1− ] = [0,60 - 2,58 0 60 1 0 60

300, ( , )− .; 0,60 + 2,58 0 60 1 0 60

300, ( , )− ]

= [60% - 7,28% ; 60% + 7,28%] = [52,72%; 67,28%], ou seja, pode-se afirmar com uma certeza de99% de que este intervalo conterá a proporção populacional, isto é, a verdadeira percentagem dos con-sumidores que preferem o produto pesquisado.

2.3.3. Da variância populacional (σσσσ2)Sabe-se que o estimador não-tendencioso de σσσσ2 é S2 e que E(S2) = σσσσ2, enquanto

V (S2) = 2σσσσ2/(n -1). No entanto, para se construir um intervalo de confiança para σσσσ2 é necessário, aindaconhecer qual é o comportamento de S2 , isto é, qual é o modelo teórico (probabilístico) seguido peloestimador. Assim antes de se construir um intervalo de confiança para a variância populacional é ne-cessário se conhecer um novo modelo probabilístico denominado de qui-quadrado e representado porχ2 (c grego).

A distribuição qui-quadradoA distribuição ou modelo qui-quadrado pode ser obtida de uma soma de variáveis normais

padronizadas, isto é, χ2n = �

=

n

1i2iZ .

A distribuição χ2 é assimétrica positiva (possuí uma cauda à direita) e de depende do parâme-tro ν. Sabe-se também que:

E(χ2) = ν e que V(χ2) = 2ν.

A figura 2.1 mostra alguns exemplos de modelos qui-quadrado.

Figura 2.1 - Algumas distribuições qui-quadrado

A comportamento, distribuição de probabilidade, apresentado pela variância amostral (S2) estárelacionado com a distribuição (modelo) χ2 através do seguinte resultado:

0

0,2

0,4

0,6

0,8

1

0,0

0,7

1,4

2,1

2,8

3,5

4,2

4,9

5,6

6,3

7,0

7,7

8,4

9,1

9,8



σ−=χ − 2

22

11 S)n(

n , isto é, a variância segue uma distribuição χ2 com "n - 1" graus de liberdade a

menos de uma constante. Neste caso ν = n -1.

TabelasA distribuição χ2 está tabelada em função do grau de liberdade n - 1 = ν (linha da tabela) e

área à sua direita, isto é, P(χ2 > c) = α. Na realidade o que está tabelado é a função inversa da χ2, isto é,

entrando com o valor do parâmetro (graus de liberdade) e uma determinada probabilidade (área), a ta-

bela fornece um valor da variável (abscissa) tal que a probabilidade à direita (área) deste valor seja

igual a área especificada.

O intervaloSuponha que seja fixado um nível de confiança de “1 - α“ e que χ2

1 e χ22 sejam dois valores

da distribuição χ2 tais que P( χ21 < χ2 < χ2

2 ) = 1 - α.

P( χ21 < χ2 < χ2

2 ) = 1 - α

P( χ21 <

σ−

2

21 S)n( < χ22 ) = 1 - α

P(χ2

2

1 < S)n( 2

2

1−σ <

χ21

1 ) = 1 - α

P(χ−

22

21 S)n( < σ2 < χ−

21

21 S)n( ) = 1 - α

Assim o intervalo de confiança (probabilidade) de “1 - α“ para a variância da população édado por:

��

�

��

�

χ−

χ−

21

2

22

2 11 S)n(;S)n(

2.3.4. Do desvio padrão populacional (σσσσ)Para determinar um intervalo de confiança de "1 - α" de probabilidade para o desvio padrão

populacional basta apenas tomar a raiz quadrada positiva dos termos do intervalo para a variância po-pulacional. Assim o intervalo será:

��

�

��

�

χ−

χ−

21

2

22

2 11 S)n(;S)n(

O significado deste intervalo é:



α−=��

�

�

��

�

�

χ−<σ<

χ− 111

21

2

22

2 S)n(S)n(P .

Exemplo:

Uma amostra extraída de uma população normal forneceu uma variância de s2 = 8,38. Deter-minar um intervalo de confiança de 90% para a variância da população e um intervalo de mesma con-fiabilidade para o desvio padrão da população.

Solução.

Neste caso é necessário inicialmente determinar os valores da distribuição χ2, de modo, queχ2

1 tenha uma área (probabilidade) à direita igual a 95% e χ22 tenha uma área (probabilidade) à direita

igual a 5%. Estes valores são: χ21 = 3,940 e χ2

2 = 18,307.

O intervalo de confiança, para a variância, será:

��

�

��

�

χ−

χ−

21

2

22

2 11 S)n(;S)n(

��

��

� −−9403

38811130718

388111,

,).(;,

,).(

[4,58; 21,27]

O intervalo de confiança, para o desvio padrão, será:

��

�

��

�

χ−

χ−

21

2

22

2 11 S)n(;S)n(

��

��

� −−9403

38811130718

388111,

,).(;,

,).(

;,584 ;,2721 ]

[2,14; 4,61].



3. EXERCÍCIOS(01) De uma população com N = 12 elementos é retirada uma amostra aleatória simples, sem re-

posição, de n = 5.(01.1) Quantas são as possíveis amostras?(01.2) Qual a probabilidade de cada uma destas amostras ser selecionada?

(02) Uma população é composta dos elementos: A, B, C, D e F.(02.1) Liste todas as possíveis amostras aleatórias simples, sem reposição, com n = 2.(02.2) Liste todas as aas, sem reposição, de tamanho n = 3.(02.3) Determine a probabilidade de ser sorteada a amostra BC.(02.4) Determine a probabilidade de ser sorteada a amostra ACD.

(03) A tabela, ao lado, é a distribuição de freqüências de uma amostraproveniente de determinada população.(03.1) Determine o tamanho da amostra.(03.2) Determine uma estimativa da média da população.(03.3) Determine uma estimativa da variância da população.(03.4) Determine uma estimativa da proporção de valores pares na

população.

(04) A tabela ao lado apresenta valores amostrais.(04.1) Qual o tamanho da amostra?(04.2) Determine uma estimativa para a média da população.(04.3) Determine uma estimativa do desvio padrão populaci-

onal.(04.4) Determine uma estimativa dos valores ímpares de X.

(05) Uma população é formada pelos elementos: A = 3, B = 6, C = 9 e D = 12.(05.1) Determine os seguintes parâmetros:

(a) média,(b) variância e(c) proporção de elementos menores que 8.

(05.2) (a) Construa a distribuição amostral da média da amostra utilizando aas, sem reposição, detamanho n = 2.

(b) Determine a expectância e a variância da distribuição amostral em (a)(c) Construa a distribuição amostral da média da amostra utilizando aas, sem reposição, de

tamanho n = 3.(d) Determine a expectância e a variância da distribuição amostral em (c)

(5.3) (a) Construa a distribuição amostral da variância amostral utilizando aas, sem reposição, detamanho n = 2 e determine a sua expectância.

(b) Utilize a correção de população finita para as variâncias obtidas em (a) obtendo a distri-buição amostral da variância corrigida e determine sua expectância.

(c) Construa a distribuição amostral da variância corrigida utilizando aas, sem reposição, detamanho n = 3 e determine sua expectância.

X f1 402 453 84 7

Elementos XA 5B 7C 12D 15E 10



(d) Utilize a correção de população finita para as variâncias obtidas em (c) obtendo a distri-buição amostral da variância corrigida e determine sua expectância.

(5.4) (a) Construa a distribuição amostral para o estimador da “proporção de elementos menoresque 8” utilizando aas, sem reposição, de tamanho n = 2.

(b) Determine a expectância e a variância da distribuição em (a).(c) Construa a distribuição amostral para o estimador da “proporção de elementos menores

que 8” utilizando aas, sem reposição, de tamanho n = 3.(d) Determine a expectância e a variância da distribuição em (c).

(06) Utilize os valores da amostra tabelada ao lado, extraída aleatoriamente esem reposição, de uma população com N = 2000 elementos, para estimar:(06.1) A média da população.(06.2) A variância da população.(06.3) O percentual de elementos menores que 6.(06.4) O erro amostral da média.

(07) De uma população com N = 4000 pessoas de uma região foi obtida umaamostra aleatória, sem reposição, de 400 pessoas que revelou 60 analfabetos. Estime:(07.1) A proporção de analfabetos da região.(07.2) O erro amostral do estimador proporção.

(08) Uma aas de tamanho 900 extraída de uma população bastante grande apresentou 40% de pessoasdo sexo masculino. Estime o erro amostral do estimador proporção de pessoas do sexo masculino.

(09) Uma população tem média 500 e desvio padrão 30.(09.1) Determinar a probabilidade que uma aas de 100 elementos apresentar um valor médio supe-

rior a 504,50.(09.2) Calcule a probabilidade de que uma aas com n = 64 valores apresentar média entre 492,5 e

507,5.(09.3) Se uma aas de n = 144 for extraída desta população, qual o percentual de médias amostrais

que estarão entre 495,5 e 504,5?(10) Uma população é normalmente distribuída com média 800 e desvio padrão 60.

(10.1) Determine a probabilidade de que uma aas de tamanho 9 apresentar média menor que 780.(10.2) Calcule a probabilidade de que uma aas de tamanho n = 16 tenha média entre os valores

781,4 e 818,6.(10.3) Que percentual de médias amostrais de uma amostra de tamanho n = 25 estarão no intervalo

[776; 824]?(11) A proporção de eleitores de um candidato é 20%.

(11.1) Qual a probabilidade de uma amostra aleatória simples de 100 eleitores apresentar uma pro-porção amostral superior a 26%?

(11.2) Qual a probabilidade de uma amostra aleatória simples de 400 eleitores apresentar uma pro-porção de eleitores do candidato entre 17% e 23%?

(11.3) Se a amostra aleatória for de 625 eleitores, qual a percentual de valores do estimador pro-porção amostral que estarão no intervalo [0,16864; 0,23136]?

(12) Admitindo que a probabilidade nascer um menino ou uma menina seja iguais, determine a proba-bilidade de que das próximas 400 crianças a nascerem:

X f0 |-- 2 272 |-- 4 514 |-- 6 496 |-- 8 48

8 |-- 10 25



(12.1) Menos de 45% sejam meninas.(12.2) Mais de 54% sejam meninos.

(13) De uma distribuição normal com variância 2,25, obteve-se a seguinte amostra:

27,5; 25,6; 28,2; 26,1 e 25,0Determinar um intervalo de confiança para a média desta população com confianças de:(13.1) 95% (13.2) 99%

(14) Através de uma aas de 145 profissionais de certa região, verificou-se que o salário médio é de 8salários mínimos (s.m.) com um desvio padrão de 1,8 s.m. A amostra também forneceu a informa-ção de que 70% dos profissionais eram casados.(14.1) Determine e interprete o intervalo de confiança de 95% para o salário médio de todos os

profissionais desta região.(14.2) Determine e interprete o intervalo de confiança de 99% para a proporção de profissionais

casados desta região?(14.3) Determine e interprete um Intervalo de Confiança de 90% para σ2.

(15) A amostra apresenta os valores da variável “tamanho da família” coleta-dos através de uma aas em uma vila popular.(15.1) Determine e interprete o intervalo de confiança de 95% para o pa-

râmetro tamanho familiar médio por domicílio da vila.(15.2) Determine e interprete o intervalo de confiança de 90% para o pa-

râmetro proporção de domicílios da vila com tamanho igual ou su-perior a cinco.

(16) A variância de uma população é 150. Deseja-se obter um intervalo de confiança para a média dapopulação com uma confiabilidade de 95% e um erro máximo de 2. Quantos valores desta popula-ção devem ser retirados aleatoriamente?

(17) Quer-se estimar a média de uma população de variância desconhecida através de um intervalo deconfiança de 95% e com erro de estimação máximo de 5 unidades. Através de uma amostra pilotode 100 valores a variância foi estimada em 400 unidades. Que tamanho deve ter a amostra final?

(18) Uma amostra preliminar de pessoas de uma determinada comunidade apresentou 18% de analfa-betos. Com este resultado quer-se estimar a proporção de analfabetos da população com uma con-fiabilidade de 95% e com um erro de estimação máximo de 2,5%. Qual o tamanho da amostra aser utilizada?

(19) De uma população normalmente distribuída foi extraída uma aas de n = 10 que apresentou os va-lores abaixo:

4 8 12 5 7 9 10 11 6 8(19.1) Determine uma estimativa da variância populacional.(19.2) Determine uma estimativa da média populacional e do correspondente erro amostral?(19.3) Determine um intervalo de confiança de 95% para a média desta população.

(20) A tabela apresenta os valores de uma amostra retirada de uma populaçãonormal. Determine:(20.1) Um intervalo de confiança de 95% para a média desta população.(20.2) Um intervalo de confiança de 99% para a média desta população.

X f3 104 145 196 157 07

X f04 |-- 08 808 |-- 12 812 |-- 16 616 |-- 20 4



4. RESPOSTAS DOS EXERCÍCIOS(01) (1.1) 792 (1.2) 1/792

(02) (2.1) AB AC AD AE BC BD BE CD CE DE(2.2) ABC ABD ABE ACD ACE ADE BCD BCE BDE CDE(2.3) 1/10 (2.4) 1/10

(03) (3.1) 100 (3.2) 1,82 (3.3) 0,73 (3.4) 0,52 = 52%

(04) (4.1) 5 (4.2) 9,80 (4.3) 3,96 (4.4) 0,60 = 60%

(05) (5.1) (a) µ = 7,50 (b) σ2 = 11,25 (c) π = 0,50

(5.2)

(a) x 6 7 8 9f(x ) 1/4 1/4 1/4 1/4

(b) E(X) = 7,50 V(X) = 3,75

(c) x 4,5 6,0 7,5 9,0 10,5f(x ) 1/6 1/6 2/6 1/6 1/6

(d) E(X) = 7,50 V(X) = 1,25

(5.3)

(a) s2 4,5 18,0 40,5f(s2) 3/6 2/6 1/6

E(S2) = 15 ≠ σ2

(b) 2�s 3,375 13,500 30,375

f( 2�s ) 3/6 2/6 1/6

E( 2�S ) = 11,25 = σ2

(c) s2 9 21f(s2) 1/2 1/2

E(S2) = 15 ≠ σ2

(d) 2�s 9 17

f( 2�s ) 1/2 1/2

E( 2�S ) = 11,25 = σ2

(5.4)(a) p 0 0,5 1

f(p) 1/6 4/6 1/6(b) E(P) = 0,50 V(P) = 1/12

(c) p 1/3 2/3f(p) 1/2 1/2



(d) E(P) = 0,50 V(P) = 1/36

(06) (6.1) x = 4,93 (6.2) s2 = 6,1628 (6.3) p = 63,50% (6.4) 0,1666

(07) (7.1) 60/400 = 15% (7.2) 1,69%

(08) 1,63%

(09) (9.1) 6,68% (9.2) 95,44 (9.3) 92,82%

(10) (10.1) 15,87% (10.2) 78,50% (10.3) 95,44%

(11) (11.1) 6,68% (11.2) 86,64% (11.3) 95%

(12) (12.1) 2,28% (12.2) 5,48%

(13) (13.1) [25,17; 27,79] (13,2) [24,75; 28,21]

(14) (14.1) [7,71; 8,29] Tem-se 95% de certeza de que o salário médio de todos os profissionais daárea está entre 7,71 s.m. e 8,29 s.m.

(14.2) [60,20%; 79,80%] Tem-se 99% de confiança de que a percentagem de profissionais da áreaque são casados esteja entre 60,20% e 79,80%.

(14.3) [2,70; 3,98]. Tem-se 90% de confiança de que o valor da variância populacional pertença aeste intervalo.

(15) (15.1) [4,62; 5,22] Tem-se 95% de confiança de que o valor médio do tamanho familiar da vilaesteja entre 4,62 e 5,22 membros.

(15.2) [53,23%; 72,93%] Há 90 de certeza de que o percentual de famílias com 5 ou mais mem-bros esteja entre 53,23% e 72,93%.

(16) n = 145

(17) n = 62, como a amostra piloto utilizada foi de n = 100 é mais confiável ficar com a amostra piloto.

(18) n = 908

(19) (19.1) 6,67 (19.2) 8 e 0,82 (19.3) [6,15; 9,85]

(20) (20.1) [9,19; 12,65] (20.2) [8,58; 13,26]



5. REFERÊNCIAS[BUS86] BUSSAB, Wilton O, MORETTIN, Pedro A. Estatística Básica. 3. ed. São Paulo, Atual,

1986.[HOF80] HOFFMAN, Rodolfo. Estatística para Economistas. São Paulo. Livraria Pioneira Editora,

1980.[NET74] NETO, Pedro Luiz de Oliveira Costa. Estatística. São Paulo, Edgard Blücher, 1977.[NET74] NETO, Pedro Luiz de Oliveira Costa, CYMBALISTA, Melvin. Probabilidades: resumos te-

óricos, exercícios resolvidos, exercícios propostos. São Paulo, Edgard Blücher, 1974.[MAS90] MASON, Robert D., DOUGLAS, Lind A. Statistical Techniques in Business And Econo-

mics. IRWIN, Boston, 1990.[MEY78] MEYER, Paul L. Probabilidade: aplicações à Estatística. Tradução do Prof. Ruy C. B.

Lourenço Filho. Rio de Janeiro, Livros Técnicos e Científicos Editora S.A., 1978[STE81] STEVENSON, William J. Estatística Aplicada à Administração. São Paulo. Editora Harbra,

1981.[WON85] WONNACOTT, Ronald J., WONNACOTT, Thomas. Fundamentos de Estatística. Rio de

Janeiro. Livros Técnicos e Científicos Editora S. A., 1985.



Tabela 2 - Valores críticos da distribuição t de StudentP(|t de Student| ≥≥≥≥ valor tabelado) = αααα ⇔⇔⇔⇔ Valores bilaterais

G. L. 0.5000 0.2000 0.1000 0.0500 0.0400 0.0200 0.0100 0.0050 0.00101 1.000 3.078 6.314 12.706 15.894 31.821 63.656 127.321 636.5782 0.816 1.886 2.920 4.303 4.849 6.965 9.925 14.089 31.6003 0.765 1.638 2.353 3.182 3.482 4.541 5.841 7.453 12.9244 0.741 1.533 2.132 2.776 2.999 3.747 4.604 5.598 8.6105 0.727 1.476 2.015 2.571 2.757 3.365 4.032 4.773 6.8696 0.718 1.440 1.943 2.447 2.612 3.143 3.707 4.317 5.9597 0.711 1.415 1.895 2.365 2.517 2.998 3.499 4.029 5.4088 0.706 1.397 1.860 2.306 2.449 2.896 3.355 3.833 5.0419 0.703 1.383 1.833 2.262 2.398 2.821 3.250 3.690 4.781

10 0.700 1.372 1.812 2.228 2.359 2.764 3.169 3.581 4.58711 0.697 1.363 1.796 2.201 2.328 2.718 3.106 3.497 4.43712 0.695 1.356 1.782 2.179 2.303 2.681 3.055 3.428 4.31813 0.694 1.350 1.771 2.160 2.282 2.650 3.012 3.372 4.22114 0.692 1.345 1.761 2.145 2.264 2.624 2.977 3.326 4.14015 0.691 1.341 1.753 2.131 2.249 2.602 2.947 3.286 4.07316 0.690 1.337 1.746 2.120 2.235 2.583 2.921 3.252 4.01517 0.689 1.333 1.740 2.110 2.224 2.567 2.898 3.222 3.96518 0.688 1.330 1.734 2.101 2.214 2.552 2.878 3.197 3.92219 0.688 1.328 1.729 2.093 2.205 2.539 2.861 3.174 3.88320 0.687 1.325 1.725 2.086 2.197 2.528 2.845 3.153 3.85021 0.686 1.323 1.721 2.080 2.189 2.518 2.831 3.135 3.81922 0.686 1.321 1.717 2.074 2.183 2.508 2.819 3.119 3.79223 0.685 1.319 1.714 2.069 2.177 2.500 2.807 3.104 3.76824 0.685 1.318 1.711 2.064 2.172 2.492 2.797 3.091 3.74525 0.684 1.316 1.708 2.060 2.167 2.485 2.787 3.078 3.72526 0.684 1.315 1.706 2.056 2.162 2.479 2.779 3.067 3.70727 0.684 1.314 1.703 2.052 2.158 2.473 2.771 3.057 3.68928 0.683 1.313 1.701 2.048 2.154 2.467 2.763 3.047 3.67429 0.683 1.311 1.699 2.045 2.150 2.462 2.756 3.038 3.66030 0.683 1.310 1.697 2.042 2.147 2.457 2.750 3.030 3.64631 0.682 1.309 1.696 2.040 2.144 2.453 2.744 3.022 3.63332 0.682 1.309 1.694 2.037 2.141 2.449 2.738 3.015 3.62233 0.682 1.308 1.692 2.035 2.138 2.445 2.733 3.008 3.61134 0.682 1.307 1.691 2.032 2.136 2.441 2.728 3.002 3.60135 0.682 1.306 1.690 2.030 2.133 2.438 2.724 2.996 3.59136 0.681 1.306 1.688 2.028 2.131 2.434 2.719 2.990 3.58237 0.681 1.305 1.687 2.026 2.129 2.431 2.715 2.985 3.57438 0.681 1.304 1.686 2.024 2.127 2.429 2.712 2.980 3.56639 0.681 1.304 1.685 2.023 2.125 2.426 2.708 2.976 3.55840 0.681 1.303 1.684 2.021 2.123 2.423 2.704 2.971 3.55141 0.681 1.303 1.683 2.020 2.121 2.421 2.701 2.967 3.54442 0.680 1.302 1.682 2.018 2.120 2.418 2.698 2.963 3.53843 0.680 1.302 1.681 2.017 2.118 2.416 2.695 2.959 3.53244 0.680 1.301 1.680 2.015 2.116 2.414 2.692 2.956 3.52645 0.680 1.301 1.679 2.014 2.115 2.412 2.690 2.952 3.52046 0.680 1.300 1.679 2.013 2.114 2.410 2.687 2.949 3.51547 0.680 1.300 1.678 2.012 2.112 2.408 2.685 2.946 3.51048 0.680 1.299 1.677 2.011 2.111 2.407 2.682 2.943 3.50549 0.680 1.299 1.677 2.010 2.110 2.405 2.680 2.940 3.50050 0.679 1.299 1.676 2.009 2.109 2.403 2.678 2.937 3.49660 0.679 1.296 1.671 2.000 2.099 2.390 2.660 2.915 3.46070 0.678 1.294 1.667 1.994 2.093 2.381 2.648 2.899 3.43580 0.678 1.292 1.664 1.990 2.088 2.374 2.639 2.887 3.41690 0.677 1.291 1.662 1.987 2.084 2.368 2.632 2.878 3.402

100 0.677 1.290 1.660 1.984 2.081 2.364 2.626 2.871 3.390110 0.677 1.289 1.659 1.982 2.078 2.361 2.621 2.865 3.381120 0.677 1.289 1.658 1.980 2.076 2.358 2.617 2.860 3.373∞∞∞∞ 0.674 1.282 1.645 1.960 2.054 2.326 2.576 2.807 3.290

0,2500 0,1000 0,0500 0,0250 0,0200 0,0100 0,0050 0,0025 0,0005P(t de Student ≥≥≥≥ valor tabelado) = αααα ⇔⇔⇔⇔ Valores unilaterais

OBS.:(1) G. L. = Graus de Liberdade (2) Para valores à esquerda, i. é, teste unilateral à esquerda (ou mesmo bilateral), aosníveis de significância acima, os valores tabelados são obtidos apenas trocando-se o sinal dos valores da tabela, umavez que a distribuição t é simétrica em torno de zero.



Tabela 3 - Valores críticos (unilaterais à esquerda) da distribuição Qui-QuadradoP(χχχχ2 com n graus de liberdade ≥≥≥≥ valor tabelado) = αααα

0,995 0,99 0,975 0,95 0,9 0,1 0,05 0,025 0,01 0,0051 0,000 0,000 0,001 0,004 0,016 2,706 3,841 5,024 6,635 7,8792 0,010 0,020 0,051 0,103 0,211 4,605 5,991 7,378 9,210 10,5973 0,072 0,115 0,216 0,352 0,584 6,251 7,815 9,348 11,345 12,8384 0,207 0,297 0,484 0,711 1,064 7,779 9,488 11,143 13,277 14,8605 0,412 0,554 0,831 1,145 1,610 9,236 11,070 12,832 15,086 16,7506 0,676 0,872 1,237 1,635 2,204 10,645 12,592 14,449 16,812 18,5487 0,989 1,239 1,690 2,167 2,833 12,017 14,067 16,013 18,475 20,2788 1,344 1,647 2,180 2,733 3,490 13,362 15,507 17,535 20,090 21,9559 1,735 2,088 2,700 3,325 4,168 14,684 16,919 19,023 21,666 23,589

10 2,156 2,558 3,247 3,940 4,865 15,987 18,307 20,483 23,209 25,18811 2,603 3,053 3,816 4,575 5,578 17,275 19,675 21,920 24,725 26,75712 3,074 3,571 4,404 5,226 6,304 18,549 21,026 23,337 26,217 28,30013 3,565 4,107 5,009 5,892 7,041 19,812 22,362 24,736 27,688 29,81914 4,075 4,660 5,629 6,571 7,790 21,064 23,685 26,119 29,141 31,31915 4,601 5,229 6,262 7,261 8,547 22,307 24,996 27,488 30,578 32,80116 5,142 5,812 6,908 7,962 9,312 23,542 26,296 28,845 32,000 34,26717 5,697 6,408 7,564 8,672 10,085 24,769 27,587 30,191 33,409 35,71818 6,265 7,015 8,231 9,390 10,865 25,989 28,869 31,526 34,805 37,15619 6,844 7,633 8,907 10,117 11,651 27,204 30,144 32,852 36,191 38,58220 7,434 8,260 9,591 10,851 12,443 28,412 31,410 34,170 37,566 39,99721 8,034 8,897 10,283 11,591 13,240 29,615 32,671 35,479 38,932 41,40122 8,643 9,542 10,982 12,338 14,041 30,813 33,924 36,781 40,289 42,79623 9,260 10,196 11,689 13,091 14,848 32,007 35,172 38,076 41,638 44,18124 9,886 10,856 12,401 13,848 15,659 33,196 36,415 39,364 42,980 45,55825 10,520 11,524 13,120 14,611 16,473 34,382 37,652 40,646 44,314 46,92826 11,160 12,198 13,844 15,379 17,292 35,563 38,885 41,923 45,642 48,29027 11,808 12,878 14,573 16,151 18,114 36,741 40,113 43,195 46,963 49,64528 12,461 13,565 15,308 16,928 18,939 37,916 41,337 44,461 48,278 50,99429 13,121 14,256 16,047 17,708 19,768 39,087 42,557 45,722 49,588 52,33530 13,787 14,953 16,791 18,493 20,599 40,256 43,773 46,979 50,892 53,67231 14,458 15,655 17,539 19,281 21,434 41,422 44,985 48,232 52,191 55,00232 15,134 16,362 18,291 20,072 22,271 42,585 46,194 49,480 53,486 56,32833 15,815 17,073 19,047 20,867 23,110 43,745 47,400 50,725 54,775 57,64834 16,501 17,789 19,806 21,664 23,952 44,903 48,602 51,966 56,061 58,96435 17,192 18,509 20,569 22,465 24,797 46,059 49,802 53,203 57,342 60,27536 17,887 19,233 21,336 23,269 25,643 47,212 50,998 54,437 58,619 61,58137 18,586 19,960 22,106 24,075 26,492 48,363 52,192 55,668 59,893 62,88338 19,289 20,691 22,878 24,884 27,343 49,513 53,384 56,895 61,162 64,18139 19,996 21,426 23,654 25,695 28,196 50,660 54,572 58,120 62,428 65,47540 20,707 22,164 24,433 26,509 29,051 51,805 55,758 59,342 63,691 66,76641 21,421 22,906 25,215 27,326 29,907 52,949 56,942 60,561 64,950 68,05342 22,138 23,650 25,999 28,144 30,765 54,090 58,124 61,777 66,206 69,33643 22,860 24,398 26,785 28,965 31,625 55,230 59,304 62,990 67,459 70,61644 23,584 25,148 27,575 29,787 32,487 56,369 60,481 64,201 68,710 71,89245 24,311 25,901 28,366 30,612 33,350 57,505 61,656 65,410 69,957 73,16646 25,041 26,657 29,160 31,439 34,215 58,641 62,830 66,616 71,201 74,43747 25,775 27,416 29,956 32,268 35,081 59,774 64,001 67,821 72,443 75,70448 26,511 28,177 30,754 33,098 35,949 60,907 65,171 69,023 73,683 76,96949 27,249 28,941 31,555 33,930 36,818 62,038 66,339 70,222 74,919 78,23150 27,991 29,707 32,357 34,764 37,689 63,167 67,505 71,420 76,154 79,490

OBS.: (1) G.L. = Graus de Liberdade (2) Para graus de liberdade que não estão na tabela, isto é acima de 50, use a aproximação:

( )p pz k2 212

2 1χ = + − , onde zp é o valor correspondente na normal padrão.

sÉrie: estatística básica1.2. distribuição amostral dos estimadores 7 1.2.1. distribuição...

Documents