estimacao da media - ime-usprfaria/cursos/verao-2019... · exemplo2: deseja-se estimaro tempo...
TRANSCRIPT
ObjetivoObjetivo
Estimar a média de uma variável aleatória X, que representa uma característica de interesse de uma população, a partir de uma amostra.
Exemplos:Exemplos:: peso médio de homens na faixa etária de 20 a 30
anos, em uma certa localidade;
: salário médio dos empregados da indústria metalúrgica em São Bernardo do Campo, em 2001;
: taxa média de glicose em indivíduos do sexo feminino com idade superior a 60 anos, em determinada localidade;
: comprimento médio de jacarés adultos de uma certa raça.
: idade média dos habitantes do sexo feminino na cidade de Santos, em 1990;
Vamos observar nn elementos, extraídos ao acaso da população;
Para cada elemento selecionado, observamos o valor da variável X de interesse.
Obtemos, então, uma amostra aleatória de tamanho n de X, que representamos por X1, X2, ..., Xn.
sendo o erro amostral (margem de erro) calculado a partir da distribuição de probabilidade de .
. nX n
1i
i
n
nX ...
2X
1X
X
Uma estiestimadormador pontualpontual para é dado pela médiamédia amostralamostral,
, X ; - X
Uma estimaestimadordor intervalarintervalar ou intervalo de intervalo de confiança confiança para tem a forma
X
Teorema do Limite CentralTeorema do Limite Central
Seja X uma v. a. que tem média e variância 2. Para amostras X1, X2, ..., Xn , retiradas ao acaso e com reposição de X, a distribuição de probabilidade da média amostral aproxima-se, para n grande, de uma distribuição normal, com média e variância 2 / n , ou seja,
X
mente.aproximada grande, n para , n
2, N ~X
Comentários:
Se a distribuição de X é normal, então tem distribuição normal exata, para todo npara todo n.
X
O desvio padrão é denominado
erro padrerro padrãão da mo da méédia.dia.
nn
2
Intervalo de ConfiançaIntervalo de Confiança
Pergunta: Como determinar ?
X ; - X
Como vimos, o estimaestimador pordor por intervalintervaloo para a média tem a forma
Seja P( ) = , a probabilidade da média amostral
estar a uma distância de, no máximo , da média populacional (desconhecida), X
, n
Z n
P
n n
- X
n
P
X P - X P
sendo Z ~ N(0,1) .
ou seja,
que temos , zn
Denotando
Assim, conhecendo-se o coeficiente de confiança obtemos z.
. z) Z (-z P
Erro na estimativa intervalarErro na estimativa intervalar
por dado é amostral erro o
que segue , n
z igualdade Da
N(0,1). ~ Z com , z) Z (-z P que tal z sendo
, n
z
O intervalo de confiança intervalo de confiança para a mpara a méédiadia , com com coeficiente de confiança coeficiente de confiança fica, então, dado por
, n
z X ; n
z - X
X. de padrão desvio o sendo
ExemploExemplo 1:1:Não se conhece o consumo médio de combustível de automóveis da marca T. Sabe-se, no entanto, que o desvio padrão do consumo de combustível de automóveis dessa marca é 10 km/l. Na análise de 100 automóveis da marca T, obteve-se consumo médio de combustível de 8 km/l. Encontre um intervalo de confiança para o consumo médio de combustíveldessa marca de carro. Adote um coeficiente de confiança igual a 95%.
n = 100 (média amostral) = 8 km/lx
X: consumo de combustível de automóveis da marca T= 10 km/l
= 0,95 z = 1,96
Observe que o erro amostral é 1,96 km/l.
9,96 ; 6,04
1,96 8 ; 1,96 - 8
Pelo Teorema do Limite Central, o intervalo de confiança de 95% é dado, aproximadamente, por
n z X ;
n z - X
100
10 1,96 8 ;
100
10 1,96 - 8
Exemplo 2:
Deseja-se estimar o tempo médio de estudo (em anos) da população adulta de um município. Sabe-se que o tempo de estudo tem distribuição normal com desvio padrão = 2,6 anos. Foram entrevistados n = 25 indivíduos, obtendo-se para essa amostra, um tempo médio de estudo igual a 10,5 anos. Obter um intervalo de 90% de confiança para o tempo médio de estudo populacional.
n = 25 = 10,5 anos= 0,90 z = 1,65
x
X : tempo de estudo, em anos e X ~ N( ; 2,62)
11,36;9,64
0,8610,5;0,86-10,5
A estimativa intervalar com 90% de confiança é dada por:
n z x ;
n z - x
25
2,5 1,65 10,5 ;
25
2,5 1,65 - ,510
DimensionamentoDimensionamento da da amostraamostra
conhecendo-se o desvio padrão de X, o erroda estimativa e o coeficiente de confiança
do intervalo, sendo z tal que
,z
n 22
,
n z relação da partirA
N(0,1). ~ Z e z) Z (-z P
o tamanho da amostra nn é determinado por
n = ?? tal que = 50 reais,= 0,95 z = 1,96
Exemplo 3:A renda per-capita domiciliar numa certa região tem distribuição normal com desvio padrão = 250 reais e média µ desconhecida. Se desejamos estimar a renda média µ com erro = 50 reais e com uma confiança = 95%, quantos domicílios devemos consultar?
X : renda per-capita domiciliar na regiãoX ~ N( ; 2502)
Aproximadamente 96 domicílios devem ser consultados.
96,04
25050
1,96 22
22
z n
Então,
Exemplo 4:A quantidade de colesterol X no sangue das alunasde uma universidade segue uma distribuição de probabilidades com desvio padrão = 50 mg/dl e média µ desconhecida. Se desejamos estimar a quantidade média µ de colesterol com erro = 20 mg/dl e confiança de 90%, quantas alunas devemrealizar o exame de sangue?
X: quantidade de colesterol no sangue das alunasda universidade
= 50 mg/dl
n = ?? tal que = 20 mg/dl= 0,90 z = 1,65
Assim, aproximadamente 206 alunas devemrealizar o exame de sangue.
206,25
5020
1,65 22
Supondo que o tamanho da amostra a ser selecionada é suficientemente grande, pelo Teorema do Limite Central temos:
22
z n
Na prática, a variância populacional 2 é desconhecida e é substituída por sua estimativa,
A estimativa amostral do desvio padrão é
2ss
2
Se a amostra for selecionada de uma população com distribuição normal com média e variância desconhecidas, a variável aleatória
n
S- X
__
tem distribuição t de Student com n-1 graus de liberdade.
DistribuiDistribuiçãção t de Student o t de Student
tem caudas mais densas do que a distribuição normal;
valores extremos são mais prováveis de ocorrer com a distribuição t do que com a normal padrão;
a forma da distribuição t reflete a variabilidade extra introduzida pelo estimador S;
para cada possível valor dos graus de liberdade, há uma diferente distribuição t;
as distribuições com menores graus de liberdade são mais espalhadas;
conforme g.l. aumenta, a distribuição t se aproxima da distribuição normal padrão;
conforme o tamanho da amostra aumenta, s se torna uma estimativa mais confiável de ; se n é muito grande, conhecer o valor de s é quase equivalente a conhecer .
Assim, uma estimativa intervalar para a média populacional, quando é desconhecido , é
, 1-- ; 1--n
s nt x
n
s nt x
Exemplo Exemplo 5:5:Considere uma a.a. de 10 crianças selecionadas da população de bebês que recebem antiácidos que contém alumínio. Esses antiácidos são freqüentemente usados para tratar problemas digestivos. A distribuição de níveis de alumínio no plasma é conhecida como sendo aproximadamente normal com média e desvio padrão desconhecidos.
O nível médio de alumínio para a amostra de 10 bebês é= 37,2 g/l e o desvio padrão é s = 7,13 g/l.x
. n
s 1-nt- x ;
n
s 1-nt - x
Um intervalo de confiança de 95% para a média da população é
Substituindo os valores correspondentes resulta
42,3). ; (32,1 )10
13,7262,22,37 ;
10
13,7262,22,37(
Se fornecemos a informação adicional de que o nível médio de alumínio no plasma para a população de bebês que não recebem antiácidos é 4,3 g/l, o IC obtido sugere que dar antiácidos aumenta muito os níveis de alumínio no plasma das crianças.
Se o desvio padrão da população é conhecido e é igual ao valor da amostra de 7,13 g/l, o intervalo de confiança de 95% para seria (32,8; 41,6), que é levemente menor.
Para n grande, a distribuição t de Student aproxima-se da distribuição normal.
Assim, uma estimativa intervalar aproximada paraa média populacional , quando o tamanho daamostra é grande e é desconhecido , é
n
s z x
n
s z - x
sendo ss o desvio padrão amostral e z tal que
.N(0,1) ~ com ) (- P ZzZz
Exemplo 6:Exemplo 6:Para estimar a renda semanal média de garçons de restaurantes em uma grande cidade, é colhida uma amostra da renda semanal de 75 garçons. A média e o desvio padrão amostrais encontrados são R$ 227 e R$ 15 respectivamente. Determine um intervalo de confiança, com coeficiente de confiança de 90%, para a renda média semanal.
n = 75 = 227 e s = 15= 0,9 z = 1,65
x
X : renda semanal de garçons da cidade
57
51 1,65 227 ;
57
51 1,65 - 227
229,86 ; 224,14
2,86 227 ; 2,86 - 227
; - n
s zx
n
s zx
O intervalo de 90% de confiança é dado, aproximadamente, por
Exemplo 6:Exemplo 6:Considere que a distribuição de níveis séricos de colesterol para homens que são hipertensos e que fumam é aproximadamente normal com uma média desconhecida e desvio padrão = 46 mg/100ml.
Interesse:Interesse: estimar o nível sérico médio de colesterol dessa população.
Antes de selecionarmos uma a.a., a probabilidade de que o intervalo
) 46
1,96 ; 46
1,96(n
Xn
X
contenha a média verdadeira da população é 0,95.
Suponha que selecionamos uma a.a. de tamanho 12 da população de fumantes hipertensos e que o nívelsérico médio de colesterol é = 217 mg/100ml. x
Baseado nessa amostra, um intervalo de confiança de 95% para é
) 12
461,9617 ;
12
461,9617( 22 (191 ; 243)
O intervalo de 191 a 243 fornece um intervalo de valores razoáveis para .
Não podemos dizer que há uma probabilidade de 95% de que se encontre entre esses valores; éfixo e está entre 191 e 243 ou não.
e o comprimento é 243 - 191 = 52 g/100ml.
InterpretaInterpretaçãçãoo freqfreqüüentistaentista:: Se extrairmos 100 a.a. de tamanho 12 dessa população e para cada uma delas construirmos um intervalo de confiança de 95%, esperamos que 95 dos intervalos contenham a média
verdadeira da população e 5 não.
Intervalo de confiança de 99% para :
) 12
462,5817 ;
12
462,5817( 22 (183 ; 251)
O comprimento desse intervalo é maior do que o correspondente intervalo de confiança de 95%.
comprimento do IC de 99% é 251-183 = 68 g/100ml.
Como o intervalo está centrado ao redor da média da amostra = 217 mg/100ml, estamos interessados no tamanho de amostra necessário para produzir o intervalo (217-10 ; 217+10) = (207 ; 227).
x
Que tamanho deve ter a amostra para se reduzir o comprimento do intervalo para 20 mg/100ml?
Para encontrar o tamanho n da amostra requerido, precisamos resolver a equação
140,8 10 46
2,58 nn
É necessária uma amostra de 141 homens para reduzir o comprimento do IC de 99% para 20 g/100ml.
This document was created with Win2PDF available at http://www.daneprairie.com.The unregistered version of Win2PDF is for evaluation or non-commercial use only.