intervalos de confiança - bem vindo - ufsmw3.ufsm.br/adriano/aulas/ic/tintconf.pdf ·  ·...

65
20/9/2008 1 Prof. Adriano Mendonça Souza, Dr. Departamento de Estatística - PPGEMQ / PPGEP - UFSM - Intervalos de Confiança

Upload: truongthuan

Post on 17-May-2018

217 views

Category:

Documents


2 download

TRANSCRIPT

  • 20/9/2008 1

    Prof. Adriano Mendona Souza, Dr.Departamento de Estatstica- PPGEMQ / PPGEP - UFSM -

    Intervalos de Confiana

  • Estimao de Parmetros

    O objetivo da Estatstica a realizao de inferncias

    acerca de uma populao, baseadas nas informaes

    amostrais. Como as populaes so caracterizadas por

    medidas numricas descritivas, denominadas

    parmetros, a inferncia estatstica diz respeito

    realizao de inferncias sobre esses

    parmetros populacionais.

  • Os mtodos de realizar inferncias a respeito dos

    parmetros pertencem a duas categorias.

    Pode-se tomar decises relativas ao valor do parmetro, atravs de um teste de hiptese;

    Pode-se estimar ou prever o valor do parmetro.

  • A estimao o processo que consiste em utilizar dados amostrais

    para estimar os valores de parmetros populacionais

    desconhecidos.

    Qualquer caracterstica de uma populao pode ser estimada a

    partir de uma amostra aleatria.

    Entre as mais comuns, esto a mdia e o desvio padro de uma populao

    e a proporo populacional.

  • Estimao Pontual

    As estatsticas amostrais so utilizadas como estimadores de

    parmetros populacionais.

    Assim uma mdia amostral usada como estimativa de uma

    mdia populacional.

    Tais estimativas chamam-se estimativas pontuais, porque originam

    uma nica estimativa do parmetro.

  • Mdia e varincia de uma populao normal N(; )

    O melhor estimador da mdia populacional a mdia

    amostral :

    sendo Xi variveis aleatrias independentes tem-se:

    , i = 1, 2, ... n.

    ( )X

    E X i( )

    Var X i( ) 2

    )...(1

    21 nXXXnX

  • Assim,

    n

    n

    n

    XEXEXEn

    XXXEn

    XE nn

    ...1

    )(...)()(1

    )...(1

    )( 2121

    nn

    n

    n

    XVarXVarXVarn

    XXXVarn

    XVar nn

    2

    2

    2222

    2

    212212

    ...1

    )(...)()(1

    )...(1

    )(

  • revela que um estimador no tendencioso de

    . revela que quanto maior o valor de n, menor a sua

    variabilidade. Assim, neste caso, sendo , adotaremos

    A varincia populacional ( ) o estimador S2, com

    , no tendencioso, conforme j foi exemplificado.

    Adotaremos assim, para .

    E X( ) X

    Var X n( ) 2

    2 S n X Xiin

    2 2

    1

    1

    1

    ( )

    2

    X

    2 S

  • Se de uma populao normal extramos amostras cujos valores so: 1.1; 0.9; 0.3; -0.2; -3.1; 1.5; -2.7; 0.5; -1.5; 2.1, obtenha estimativas pontuais da ; e P(X > 2.5).

    Estimativa de :

    Estimativa de :

    2

    Exemplo:

    2

    11.01.2...3.09.01.110

    1X

    17.3)11.01.2(...)11.09.0()11.01.1(9

    1 2222 S

  • Estimativa de P(X > 2.5):

    Sendo

    Assim para

    e

    2 317 178~ . .

    X zX

    252 5 011

    1781466.

    . ( . )

    ..

    P X P Z P Z( . ) ( . ) ( . ) . . 25 1466 1 1466 1 0 9286 714%

  • Mdia e varincia de uma proporo (p)

    Consideremos agora o caso em que , de uma

    populao que apresenta certa caracterstica. Extrai-se

    da populao uma amostra de tamanho n. X ser o nmero de elementos da amostra que apresentam a

    caracterstica em estudo.

    intuitivo que um estimador da proporo p seja a proporo amostral :

    p

    n

    XP

    p

  • As observaes dos n elementos podem ser considerados como nprovas de Bernoulli com probabilidade de sucesso p, ou seja, X tem distribuio binomial com mdia np e varincia npq, temos:

    Assim no tendencioso.

    pnpnn

    XEpE

    )(

    1)(

    n

    pqnpq

    nn

    XVarpVar

    2

    1)(

    p

  • O desvio padro de tambm denominado de Erro-Padro de ,

    representado por sendo

    p p

    n

    pqpEP )( .1 pqqepp

  • Para se avaliar a taxa de desemprego em determinado Estado, escolhe-se uma amostra aleatria de 1000 habitantes em idade de trabalho e contam-se os desempregados: 87. Estimar a proporo de desempregados em todo o Estado (populao). Avaliar o erro padro de estimativa.

    ~ . 0 009

    %7.8087.0100

    87

    n

    Xp %7.8 pp

    913.01 pq

    009.01000

    )913.0)(087.0()(

    n

    qppEP

  • Estimao Intervalar

    Sabemos que a estimao por ponto em geral

    insuficiente, pois a probabilidade, de que a estimativa

    adotada venha a coincidir com o verdadeiro valor do

    parmetro praticamente nula.

    Isso decorre dos estimadores serem muitas vezes VA contnuas,

    logo as estimativas sero diferentes do valor do parmetro,

    ento temos um erro de estimao.

  • Em virtude da variabilidade amostral, usual incluir uma estimativa

    intervalar, com certo nvel de confiana (1-) ou de

    significncia , para acompanhar a estimativa pontual.

    Essa nova estimativa proporciona um intervalo, de possveis

    valores do parmetro populacional.

    Constroe-se um intervalo em torno da estimativa por ponto, de modo que este intervalo contenha o

    verdadeiro parmetro populacional.

  • Seja ento uma amostra aleatria de uma

    populao e o parmetro de interesse. Sejam

    e estatsticas tais que:

    Ento chamado intervalo de confiana de nvel 100( 1 - )% para o parmetro . Usualmente toma-

    se 1 - = 0.95 ou 0.99.

    nXXX ...21

    0

    1

    1)( 10P

    10 ;

  • 1 - o nvel ou grau de confiana e fornece a probabilidade de conter o verdadeiro parmetro.

    o nvel de significncia, representa o erro que se estcometendo ao afirmar que a probabilidade do intervalo

    [ i s ] conter o verdadeiro valor do parmetro

    populacional ( 1 - ).

  • Valores Crticos de Z para e / 2.

    Muitos estatsticos consideram a construo de intervalos de confiana

    como o principal mtodo de estudo de um parmetro populacional

    atravs de uma amostra.

    Z / 2 1,64 1,96 2,58 2,81 3,06

    Z 1,28 1,64 2,36 2,58 2,88

    10% 5% 1% 0,5% 0,2%

  • Como o IC construdo com base na estimativa por

    ponto, aleatrio, ao passo que o parmetro

    suposto uma constante da populao.

    Assim, o IC conter ou no o parmetro, com probabilidades 1 - e .

    incorreto dizer " probabilidade do parmetro CAIR no intervalo".

  • Consideremos uma populao normal com mdia

    e desvio padro e uma amostra dessa populao.

    Sabemos pelos resultados do Teorema Central do

    Limite que a mdia desta amostra tem distribuio

    normal com mdia e desvio padro , ou

    seja:

    X n

    X u

    n

    ~ N : (0,1)

  • Fixando em 0.05, ou seja, , vemos pela

    tabela de distribuio normal padronizada z, que:

    1 0 95 .

    z

    X

    -1.96 0 1.96

    0.0250.025

    0.95

    P Z( . . ) . 196 196 095

  • isto :

    Reescrevendo as desigualdades entre parnteses, temos:

    PX

    n

    1 9 6 1 9 6 0 9 5. . .

    P X n X n 196 196 0 95. ( ) . ( ) . Neste caso: o parmetro

    o IC de 95% para , ( :IC 95%)

    nXnX /96.1,/96.1; 10

  • importante observar que o nvel de confiana (1 - )

    se aplica ao processo de construo de intervalos,

    e no a um intervalo especfico.

    Para explicitar o conceito de IC, suponha que retiremos

    um grande nmero de amostras de tamanho n, fixo,

    da populao em estudo e, para cada amostra,

    construamos um intervalo.

    Os limites dos intervalos resultantes sero diferentes.

  • O verdadeiro valor do parmetro estar contido, em mdia, em 100(1 - )% desses intervalos.

    100(1 - )% dos intervalos construdos abrangero o verdadeiro valor do parmetro.

    No caso , conforme ilustrado na figura, mas cada valor contm, ou no contm, o parmetro.

  • A expresso

    deve ser interpretada muito cuidadosamente.

    Ela no significa que a probabilidade do parmetro cair

    dentro de um intervalo especificado seja igual a 0.95.

    sendo o parmetro, est ou no est dentro do intervalo acima. De

    preferncia a expresso acima deve ser interpretada assim:

    0.95 a probabilidade de que um intervalo aleatrio contenha .

    P X n X n 1 96 1 96 0 95. . .

    X n X n 196 196. ; .

  • Para uma amostra de 50 observaes de uma

    populao normal com mdia desconhecida e

    desvio padro , seja 20,5 a mdia amostral .

    Construir um intervalo de 95% de confiana para a

    mdia populacional.

    Temos, de imediato que:

    Assim, tal intervalo [18.84; 22.16].

    6 X

    P X n X n 196 196 0 95. . .

  • A figura seguinte representa a curva N(0,1) e a notao

    que iremos utilizar, onde P Z Z 2 1

    -z /2 0 +z /2

    /2 /2

    1-

  • Na situao aqui apresentada, com conhecido, sabemos que:

    logo o intervalo de confiana para ser:

    N ( ; )

    X

    nN

    ~ ( ; )0 1

    e

    P ZX

    nZ

    2 2 1

    P X Z n X Z n 2 2 1

    IC X Z n X Z n : ( ) ;1 1 0 0 2 2

  • Intervalo de Confiana para a mdia da populao conhecido = mdia da populao

    = mdia da amostra

    = desvio-padro da populao

    S = desvio-padro da amostra

    n = tamanho da amostra

    eo = Semi-amplitude do intervalo de confiana

    x

  • Seja uma populao X ~ N (, 2), sabe-se que:

    Pela figura anterior temos:

    )1,0(,~2

    Nn

    xZe

    nNx

    1][ 22 ZZZP

    1][ 22 Z

    n

    xZP

    1].[ 22n

    Zxn

    ZP

  • Multiplicando-se por (-1):

    Ordenando, temos:

    1]..[ 22n

    Zxn

    ZxP

    1]..[ 22n

    Zxn

    ZxP

    1]..[ 22 Zn

    xZn

    xP

  • Como a distribuio normal simtrica

    Z/2 = Z1 - /2

    Se for desconhecido e n 30, pode-se usar S, resultando em um intervalo aproximado.

    , podendo o IC ser escrito como:n

    Ze

    .20

    1)( 00 exexP

  • Feito um ensaio de corroso com 64 peas de um lote de produo, verificou-se que o tempo que a pea suportou nesse teste apresentou uma mdia igual a 200 horas. Calcular o IC de 95% para a verdadeira mdia, sabendo que = 16 horas.

    Sabe-se que os comprimentos das barras produzidas por uma siderrgica tem uma distribuio normal de varincia 1,69 m2. Numa amostra de cinco barras encontrou-se: 20,1; 21,0; 21,4; 22,1; 23,3 m. Determinar o IC para a mdia, com:

    a) = 0,10 Z/2 = 1,645b) = 0,06 Z/2 = 1, 881

    Exemplo:

  • desconhecidoEm geral nos problemas prticos desconhecido e

    devemos estim-lo:

    Quanto menor a amostra, mais necessria se torna a

    introduo de uma correo, a qual consiste em a

    varivel t de Student ao invs de Z.

    1

    )(1

    2

    n

    xxiS

    n

    i

    n

    Sx

    t

  • P [ - t /2 t t /2 ] = 1 -

    P [ - t /2 t /2 ] = 1 -

    ..........................

    xS

    n

    P [ . t /2 . t /2 ] = 1 - xS

    n x

    S

    n

  • "t" possui n - 1 graus de liberdade => t ( n - 1 ); / 2

    Convm ressaltar que, quanto maior for o nvel de confiana (isto , quanto menor for o nvel de significncia); mais amplo ser o intervalo

    e0 = t /2 .

    1

    . 22

    n

    xnxS i

    n fxii iifxnS

    2.2.

    1

    1

  • A seguinte amostra foi extrada de uma populao normal:

    6, 6, 7, 8, 9, 9, 9, 10, 11, 12. Construir um intervalo para

    , ao nvel de significncia de 10%.

    Construir um I.C. de 95%, para a mdia populacional, a

    partir da seguinte distribuio amostral:

    Classe 0 | 5 5 | 10 10 | 15 15 | 20

    Freqncia 2 3 5 2

    Exemplo:

  • Suponha que x tenha uma distribuio N ( , 2 ).

    Uma amostra de tamanho 25 fornece os seguintes

    valores: xi = 70,8 ; xi2 = 3546,8. Determine um

    IC de 95% para .

    Exemplo:

  • IC para a 2 de uma populao normal

    Seja X uma populao com mdia e varincia 2. Sabe-

    se pelo Teorema de Fisher, que: ;

    P [ 12 2 22 ] = 1 -

    P [ 12 S2 (n - 1) 22 ] = 1 - 2

    2

    22

    1

    )1(

    nSX n

  • P [ 12___ 1_ 22_ ] = 1 - (n-1).S2 2 (n-1).S2

    P [ S2 (n-1) 2 S2 (n-1) ] = 1 - 2sup 2inf

    2inf = x21 = x21 - /22sup = x22 = x2 /2 ambos com = n 1

  • Quando > 30 graus de liberdade comum usar a

    seguinte aproximao:

    2 = 1_ ( Z . )2

    2 a abscissa normal reduzida

    Como a tabela 2 unicaudal a direita e o I.C. deve

    ser central, deve-se entrar na tabela com /2 e

    ( 1 - /2), para encontrar 2inf e 2sup.

    2 1

  • Exemplo:

    Para 6, 6, 7, 8, 9, 9, 9, 10, 11, 12, calcular o IC para 2, ao nvel de 90%.

    De uma populao normal foi retirada uma amostra de 15 elementos e calculou-se:xi = 8,7 e xi2 = 27,3. Determinar um IC de 80% para a varincia dessa populao.

    Calcular um IC de 96% para a varincia da distribuio mostrada a seguir (suposta como normal):

    Classe 2,2 | 6,2 6,2 | 10,2 10,2 | 14,2 14,2 | 18,3 Freq. 3 4 5 3

  • IC para desvio-padro de uma populao normal

    Se estimador justo de 2, mas S no

    estimador de , pois E[S] = , tem-se:

    V(S2) = E(S2) - E2(S2), logo V(S2) = 2 - 2 = 0, o que

    no tem sentido. O vcio de S com estimador de ,

    tende a zero quando n .

    Deveramos adotar um coeficiente de correo, mas calcularemos um

    IC aproximado para , bastando

    extrair a raiz quadrada do IC da 2.

    1

    )( 22

    n

    xxS i

  • Fazer EX.1, EX.2, EX.3 anteriores.

  • I.C. para a proporo populacional p

    Sabemos que f N ( p , )e que, para n > 30, a

    distribuio binomial tende a uma normal, ento

    pq

    n

    npq

    pfZ

  • P [-Z /2 Z Z /2 ] = 1 -

    . . . . . . . . .

    1][ 22 Znpq

    pfZP

    1].[ 22 npqZfpnpqZfP

  • amostradatotal

    eresseintdecasos

    n

    xf

    1])1(

    .)1(

    .[ 22 n

    ffZfp

    n

    ffZfP

  • Retirada uma amostra de 1.000 peas da produo de uma mquina, verificou-se que 35 eram defeituosas. Construir um IC, ao nvel de 95%, para a proporo real de peas defeituosas fornecidas por essa mquina.

    Uma a.a. de 400 domiclios de uma cidade mostra que 25% so casas de aluguel. Qual o IC que podemos supor que seja o nmero de casas de aluguel dessa cidade, usando = 2%, supondo que tal cidade tem 20.000 casas?

    Exemplo:

  • IC para a soma e para a diferena entre duas mdias (1 e 2) de duas populaes normais, conhecidas suas varincias 12 e 22 .

    Se X1 = N ( 1 , 12) e X2 = N (2 , 22), sendo X1 e X2independentes. Como = N(1, )

    = N (2, )

    ( ) = N [(1 2); + ] para amostras

    a.a. independentes, temos:

    x1 12

    1nx2

    22

    2n

    x2x11

    2

    1n2

    2

    2n

    2

    22

    1

    21

    2121

    nn

    xxZ

  • Uma empresa tem duas filiais ( A e B ), para os quais os desvios-padres de vendas dirias so de 5 e 3 peas, respectivamente. Uma amostra de 20 dias fornecem uma venda mdia diria de 40 peas para a filial A e 30 peas para a filial B. Supondo que a distribuio diria de vendas seja normal, construir um I.C. de 92% para a venda diria das duas filiais.

    1].)(.)[(2

    22

    1

    21

    221212

    22

    1

    21

    221 nnZxx

    nnZxxP

  • I.C. para a Soma e para a Diferena entre duas mdias (1 e 2) de duas populaes normais, de mesma varincia 2 desconhecida.

    Sendo X1 = N (1 , 2) e X2 = N ( 2 , 2), com X1 e X2

    independentes, logo e ,

    tem-se que( ) = N [(1 2); 2 . ( )] e:x1 x21 1

    1 2n n

    x x

    n n

    1 2 1 2

    1 2

    1 1

    .Z =

    ),(1

    2

    11 nNx

    ),(2

    2

    22 nNx

  • P[( ) - t/2. S 1 2 ( ) + t/2. S' ] = 1 -

    Como no se conhece 2, deve-se estim-lo por S'2 , onde:

    = (n1 + n2 - 2) graus de liberdade

    t (n1 + n2 - 2 ), = t,

    n S n Sn n

    1 12

    2 22

    1 2

    1 1

    2

    . .S'2 =

    x1 x21 1

    1 2n n

    1 1

    1 2n n x1 x2

  • Duas populaes normais: X1 e X2 tem a mesma

    varincia. Da populao 1 foi extrada uma amostra

    de tamanho 10, obtendo-se X=15 e S=8. Da

    populao 2 foi extrada uma amostra de 12

    elementos, obtendo-se X=12 e S=2. Construir o I.C.

    de 95% para a diferena de mdias.

  • P[( ) - t/2 1 2 ( ) + t/2] = 1 -

    I.C. para a Soma e para a Diferena entre duas mdias (1 e 2) de duas populaes normais, de varincias desconhecidas e 12 22 .

    Se X1 = N ( 1 , 12 ) e X2 = ( 2 , 22 ), com X1 e X2

    independentes, ento

    . Como 12 e 22 so

    desconhecidos, temos que estim-las.

    x1 x2 Sn

    S

    n12

    1

    22

    2

    x1 x2 Sn

    S

    n12

    1

    22

    2

    )](;)[()(2

    22

    1

    21

    2121 nnNxx

  • = onde V1 = e V2 =

    - t, /2 onde o gl. dado pelo mtodo de Aspin-

    Welch, com arredondamento para menos.

    V VV

    n

    V

    n

    1 2

    2

    12

    1

    22

    21 1

    2

    S

    n12

    1

    S

    n22

    2

  • Duas mquinas de embalar de embalar arroz esto

    sendo usadas por uma empresa, sendo uma nova e

    outra velha; pegas duas amostras de sacos

    embalados, encontramos os eguintes pesos, em Kg.

    Mquina Nova: 82, 83, 79, 81, 81, 80

    Mquina Velha: 79, 82, 78, 74, 80, 77, 75, 84, 78

    Construir o I.C. para a diferena dos pesos mdios

    populacionais, ao nvel de significncia de 5%.

  • I.C. para a Soma e para a Diferena de duas propores populacionais p1 e p2 .

    Se f1 = N ( p1 , ) e f2 = N ( p2 , ); logo,

    ( f1 f2 ) = N [( p1 p2 ); + ] e,

    , logo o intervalo de confiana

    ser:

    p q

    n1 1

    1

    . p q

    n2 2

    2

    .

    p q

    n1 1

    1

    . p qn2 2

    2

    .

    2

    22

    1

    11

    2121

    11.n

    ppn

    pp

    ppffZ

  • P [ - Z/2 Z Z/2 ] = 1 -

    P [- Z/2 Z/2 ] = 1 -

    f f p p

    p p

    n

    p p

    n

    1 2 1 2

    1 1

    1

    2 2

    2

    1 1

    .

    P [( f1 f2 ) - Z/2 . p1 p2

    ( f1 f2 ) + Z/2 . ] = 1 -

    p pn

    p p

    n1 1

    1

    2 2

    2

    1 1.

    p pn

    p p

    n1 1

    1

    2 2

    2

    1 1.

  • Como p1 e p2 so valores populacionais desconhecidos,

    eles podem ser estimados por f1 e f2, desde que os

    tamanhos das amostras sejam maiores do que 30,

    da temos:

    P [( f1 f2 ) - Z/2 p1 p2

    ( f1 f2 ) + Z/2 ] = 1 -

    f fn

    f f

    n1 1

    1

    2 2

    2

    1 1.

    f fn

    f f

    n1 1

    1

    2 2

    2

    1 1.

  • Exemplo:

    Um levantamento estatstico mostrou que 80

    pessoas, das 200 consultadas, numa cidade, vo

    votar no candidato A na prxima eleio; uma outra

    amostra de 500 pessoas, dessa mesma cidade,

    mostrou que 150 delas vo votar no candidato B.

    Construir um IC de 93% para a diferena das

    propores de pessoas que vo votar em A e B.

  • IC para o quociente das varincias populacionais

    Seja: F(1 , 2 ) = =

    para duas populaes normais de varincias descontinuas,

    pelo Teorema de Fischer: 2n-1 = (n- 1) . S2 ou

    2 = . S2

    1

    1

    2

    2

    2

    2

    1

    2

    2

    22

    1

    .

    2

    2

  • Portanto

    logo o intervalo ser:

    P[ F1 - /2 F F /2 ] = 1 -

    21

    22

    22

    21

    211

    2

    22

    222

    21

    211

    21 .),(..

    .

    ),(

    S

    SF

    S

    S

    F

    1].[ 221

    22

    22

    21

    21 FS

    SFP

  • ou:

    1]),(;.

    ),(,

    1.[ 21

    22

    1

    22

    21

    22

    12

    2

    21

    22 F

    S

    S

    FS

    SP

    1)],(;.

    ),(,

    1.[ 21

    222

    21

    21

    22

    21

    2

    22

    21 F

    S

    S

    FS

    SP

  • Exemplo:

    Construir um IC, para = 2%, para o quociente de

    varincias de duas populaes normais, das quais

    foram extradas as amostras seguintes: 41 elementos

    da primeira, obtendo-se S12 = 43,8 e 31 elementos

    da segunda, obtendo-se S22 = 29,5.

    Intervalos de Confiana

    Prof. Adriano Mendona Souza, Dr.

    Departamento de Estatstica

    - PPGEMQ / PPGEP - UFSM -

    Estimao de Parmetros

    O objetivo da Estatstica a realizao de inferncias acerca de uma populao, baseadas nas informaes amostrais. Como as populaes so caracterizadas por medidas numricas descritivas, denominadas parmetros, a inferncia estatstica diz respeito realizao de inferncias sobre esses

    parmetros populacionais.

    Os mtodos de realizar inferncias a respeito dos parmetros pertencem a duas categorias.

    Pode-se tomar decises relativas ao valor do parmetro, atravs de um teste de hiptese;

    Pode-se estimar ou prever o valor do parmetro.

    A estimao o processo que consiste em utilizar dados amostrais para estimar os valores de parmetros populacionais desconhecidos.

    Qualquer caracterstica de uma populao pode ser estimada a partir de uma amostra aleatria.

    Entre as mais comuns, esto a mdia e o desvio padro de uma populao e a proporo populacional.

    Estimao Pontual

    As estatsticas amostrais so utilizadas como estimadores de parmetros populacionais.

    Assim uma mdia amostral usada como estimativa de uma

    mdia populacional.

    Tais estimativas chamam-se estimativas pontuais, porque originam uma nica estimativa do parmetro.

    Mdia e varincia de uma populao normal N(m; s)

    O melhor estimador da mdia populacional a mdia amostral :

    sendo Xi variveis aleatrias independentes tem-se: , i = 1, 2, ... n.

    Assim,

    revela que um estimador no tendencioso de . revela que quanto maior o valor de n, menor a sua variabilidade. Assim, neste caso, sendo , adotaremos

    A varincia populacional ( ) o estimador S2, com

    , no tendencioso, conforme j foi exemplificado.

    Adotaremos assim, para .

    Se de uma populao normal extramos amostras cujos valores so: 1.1; 0.9; 0.3; -0.2; -3.1; 1.5; -2.7; 0.5; -1.5; 2.1, obtenha estimativas pontuais da ; e P(X > 2.5).

    Estimativa de :

    Estimativa de :

    Exemplo:

    Estimativa de P(X > 2.5):

    Sendo

    Assim para

    e

    Mdia e varincia de uma proporo (p)

    Consideremos agora o caso em que , de uma populao que apresenta certa caracterstica. Extrai-se da populao uma amostra de tamanho n. X ser o nmero de elementos da amostra que apresentam a caracterstica em estudo.

    intuitivo que um estimador da proporo p seja a proporo amostral :

    As observaes dos n elementos podem ser considerados como n provas de Bernoulli com probabilidade de sucesso p, ou seja, X tem distribuio binomial com mdia np e varincia npq, temos:

    Assim no tendencioso.

    O desvio padro de tambm denominado de Erro-Padro de , representado por sendo

    Para se avaliar a taxa de desemprego em determinado Estado, escolhe-se uma amostra aleatria de 1000 habitantes em idade de trabalho e contam-se os desempregados: 87. Estimar a proporo de desempregados em todo o Estado (populao). Avaliar o erro padro de estimativa.

    Estimao Intervalar

    Sabemos que a estimao por ponto em geral insuficiente, pois a probabilidade, de que a estimativa adotada venha a coincidir com o verdadeiro valor do parmetro praticamente nula.

    Isso decorre dos estimadores serem muitas vezes VA contnuas, logo as estimativas sero diferentes do valor do parmetro, ento temos um erro de estimao.

    Em virtude da variabilidade amostral, usual incluir uma estimativa intervalar, com certo nvel de confiana (1-) ou de significncia , para acompanhar a estimativa pontual.

    Essa nova estimativa proporciona um intervalo, de possveis valores do parmetro populacional.

    Constroe-se um intervalo em torno da estimativa por ponto, de modo que este intervalo contenha o

    verdadeiro parmetro populacional.

    Seja ento uma amostra aleatria de uma populao e o parmetro de interesse. Sejam

    e estatsticas tais que:

    Ento chamado intervalo de confiana de nvel 100( 1 - )% para o parmetro . Usualmente toma-se 1 - = 0.95 ou 0.99.

    1 - o nvel ou grau de confiana e fornece a probabilidade de conter o verdadeiro parmetro.

    o nvel de significncia, representa o erro que se est cometendo ao afirmar que a probabilidade do intervalo [ i s ] conter o verdadeiro valor do parmetro populacional ( 1 - ).

    Valores Crticos de Z para e / 2.

    Muitos estatsticos consideram a construo de intervalos de confiana como o principal mtodo de estudo de um parmetro populacional atravs de uma amostra.

    10% 5% 1% 0,5% 0,2%

    Z 1,28 1,64 2,36 2,58 2,88

    Z / 2 1,64 1,96 2,58 2,81 3,06

    Como o IC construdo com base na estimativa por ponto, aleatrio, ao passo que o parmetro suposto uma constante da populao.

    Assim, o IC conter ou no o parmetro, com probabilidades 1 - e .

    incorreto dizer " probabilidade do parmetro CAIR no intervalo".

    Consideremos uma populao normal com mdia

    e desvio padro e uma amostra dessa populao. Sabemos pelos resultados do Teorema Central do Limite que a mdia desta amostra tem distribuio normal com mdia e desvio padro , ou seja:

    ~ N : (0,1)

    Fixando em 0.05, ou seja, , vemos pela tabela de distribuio normal padronizada z, que:

    0.95

    0.025

    0.025

    -1.96 0 1.96

    INCORPORAR Equation.2

    z

    isto :

    Reescrevendo as desigualdades entre parnteses, temos:

    Neste caso: o parmetro

    o IC de 95% para

    importante observar que o nvel de confiana (1 - ) se aplica ao processo de construo de intervalos, e no a um intervalo especfico.

    Para explicitar o conceito de IC, suponha que retiremos um grande nmero de amostras de tamanho n, fixo, da populao em estudo e, para cada amostra, construamos um intervalo.

    Os limites dos intervalos resultantes sero diferentes.

    O verdadeiro valor do parmetro estar contido, em mdia, em 100(1 - )% desses intervalos.

    100(1 - )% dos intervalos construdos abrangero o verdadeiro valor do parmetro.

    No caso , conforme ilustrado na figura, mas cada valor contm, ou no contm, o parmetro.

    (

    A expresso

    deve ser interpretada muito cuidadosamente.

    Ela no significa que a probabilidade do parmetro cair dentro de um intervalo especificado seja igual a 0.95.

    sendo o parmetro, est ou no est dentro do intervalo acima. De preferncia a expresso acima deve ser interpretada assim:

    0.95 a probabilidade de que um intervalo aleatrio contenha .

    Para uma amostra de 50 observaes de uma populao normal com mdia desconhecida e desvio padro , seja 20,5 a mdia amostral . Construir um intervalo de 95% de confiana para a mdia populacional.

    Temos, de imediato que:

    Assim, tal intervalo [18.84; 22.16].

    A figura seguinte representa a curva N(0,1) e a notao que iremos utilizar, onde

    -za/2 0 +za/2

    1-a

    a/2

    a/2

    Na situao aqui apresentada, com conhecido, sabemos que:

    logo o intervalo de confiana para ser:

    e

    Intervalo de Confiana para a mdia da populao conhecido

    = mdia da populao

    = mdia da amostra

    = desvio-padro da populao

    S = desvio-padro da amostra

    n = tamanho da amostra

    eo = Semi-amplitude do intervalo de confiana

    Seja uma populao X ~ N (, 2), sabe-se que:

    Pela figura anterior temos:

    Multiplicando-se por (-1):

    Ordenando, temos:

    Como a distribuio normal simtrica

    Z/2 = Z1 - /2

    Se for desconhecido e n 30, pode-se usar S, resultando em um intervalo aproximado.

    , podendo o IC ser escrito como:

    Feito um ensaio de corroso com 64 peas de um lote de produo, verificou-se que o tempo que a pea suportou nesse teste apresentou uma mdia igual a 200 horas. Calcular o IC de 95% para a verdadeira mdia, sabendo que = 16 horas.

    Sabe-se que os comprimentos das barras produzidas por uma siderrgica tem uma distribuio normal de varincia 1,69 m2. Numa amostra de cinco barras encontrou-se: 20,1; 21,0; 21,4; 22,1; 23,3 m. Determinar o IC para a mdia, com:

    a) = 0,10 Z/2 = 1,645

    b) = 0,06 Z/2 = 1, 881

    Exemplo:

    desconhecido

    Em geral nos problemas prticos desconhecido e devemos estim-lo:

    Quanto menor a amostra, mais necessria se torna a introduo de uma correo, a qual consiste em a varivel t de Student ao invs de Z.

    P [ - t /2 t t /2 ] = 1 -

    P [ - t /2 t /2 ] = 1 -

    ..........................

    P [ . t /2 . t /2 ] = 1 -

    "t" possui n - 1 graus de liberdade => t ( n - 1 ); / 2

    Convm ressaltar que, quanto maior for o nvel de confiana (isto , quanto menor for o nvel de significncia); mais amplo ser o intervalo

    e0 = t /2 .

    A seguinte amostra foi extrada de uma populao normal: 6, 6, 7, 8, 9, 9, 9, 10, 11, 12. Construir um intervalo para , ao nvel de significncia de 10%.

    Construir um I.C. de 95%, para a mdia populacional, a partir da seguinte distribuio amostral:

    Classe 0 | 5 5 | 10 10 | 15 15 | 20 Freqncia 2 3 5 2

    Exemplo:

    Suponha que x tenha uma distribuio N ( , 2 ). Uma amostra de tamanho 25 fornece os seguintes valores: xi = 70,8 ; xi2 = 3546,8. Determine um IC de 95% para .

    Exemplo:

    IC para a 2 de uma populao normal

    Seja X uma populao com mdia e varincia 2. Sabe-se pelo Teorema de Fisher, que: ;

    P [ 12 2 22 ] = 1 -

    P [ 12 S2 (n - 1) 22 ] = 1 -

    2

    P [ 12___ 1_ 22_ ] = 1 -

    (n-1).S2 2 (n-1).S2

    P [ S2 (n-1) 2 S2 (n-1) ] = 1 -

    2sup 2inf

    2inf = x21 = x21 - /2

    2sup = x22 = x2 /2 ambos com = n 1

    Quando > 30 graus de liberdade comum usar a seguinte aproximao:

    2 = 1_ ( Z . )2

    2 a abscissa normal reduzida

    Como a tabela 2 unicaudal a direita e o I.C. deve ser central, deve-se entrar na tabela com /2 e

    ( 1 - /2), para encontrar 2inf e 2sup.

    Exemplo:

    Para 6, 6, 7, 8, 9, 9, 9, 10, 11, 12, calcular o IC para 2, ao nvel de 90%.

    De uma populao normal foi retirada uma amostra de 15 elementos e calculou-se:

    xi = 8,7 e xi2 = 27,3. Determinar um IC de 80% para a varincia dessa populao.

    Calcular um IC de 96% para a varincia da distribuio mostrada a seguir (suposta como normal):

    Classe 2,2 | 6,2 6,2 | 10,2 10,2 | 14,2 14,2 | 18,3

    Freq. 3 4 5 3

    IC para desvio-padro de uma populao normal

    Se estimador justo de 2, mas S no estimador de , pois E[S] = , tem-se:

    V(S2) = E(S2) - E2(S2), logo V(S2) = 2 - 2 = 0, o que no tem sentido. O vcio de S com estimador de , tende a zero quando n .

    Deveramos adotar um coeficiente de correo, mas calcularemos um IC aproximado para , bastando

    extrair a raiz quadrada do IC da 2.

    Fazer EX.1, EX.2, EX.3 anteriores.

    I.C. para a proporo populacional p

    Sabemos que f N ( p , )e que, para n > 30, a distribuio binomial tende a uma normal, ento

    P [-Z /2 Z Z /2 ] = 1 -

    . . . . . . . . .

    Retirada uma amostra de 1.000 peas da produo de uma mquina, verificou-se que 35 eram defeituosas. Construir um IC, ao nvel de 95%, para a proporo real de peas defeituosas fornecidas por essa mquina.

    Uma a.a. de 400 domiclios de uma cidade mostra que 25% so casas de aluguel. Qual o IC que podemos supor que seja o nmero de casas de aluguel dessa cidade, usando = 2%, supondo que tal cidade tem 20.000 casas?

    Exemplo:

    IC para a soma e para a diferena entre duas mdias (1 e 2) de duas populaes normais, conhecidas suas varincias 12 e 22 .

    Se X1 = N ( 1 , 12) e X2 = N (2 , 22), sendo X1 e X2 independentes. Como = N(1, )

    = N (2, )

    ( ) = N [(1 2); + ] para amostras a.a. independentes, temos:

    Uma empresa tem duas filiais ( A e B ), para os quais os

    desvios-padres de vendas dirias so de 5 e 3 peas, respectivamente. Uma amostra de 20 dias fornecem uma venda mdia diria de 40 peas para a filial A e 30 peas para a filial B. Supondo que a distribuio diria de vendas seja normal, construir um I.C. de 92% para a venda diria das duas filiais.

    I.C. para a Soma e para a Diferena entre duas mdias (1 e 2) de duas populaes normais, de mesma varincia 2 desconhecida.

    Sendo X1 = N (1 , 2) e X2 = N ( 2 , 2), com X1 e X2 independentes, logo e ,

    tem-se que( ) = N [(1 2); 2 . ( )] e:

    Z =

    Como no se conhece 2, deve-se estim-lo por S'2 , onde:

    = (n1 + n2 - 2) graus de liberdade

    t (n1 + n2 - 2 ), = t,

    P[( ) - t/2. S 1 2 ( ) + t/2. S' ] = 1 -

    S'2 =

    Duas populaes normais: X1 e X2 tem a mesma varincia. Da populao 1 foi extrada uma amostra de tamanho 10, obtendo-se X=15 e S=8. Da populao 2 foi extrada uma amostra de 12 elementos, obtendo-se X=12 e S=2. Construir o I.C. de 95% para a diferena de mdias.

    I.C. para a Soma e para a Diferena entre duas mdias (1 e 2) de duas populaes normais, de varincias desconhecidas e 12 22 .

    Se X1 = N ( 1 , 12 ) e X2 = ( 2 , 22 ), com X1 e X2 independentes, ento

    . Como 12 e 22 so desconhecidos, temos que estim-las.

    P[( ) - t/2 1 2 ( ) + t/2] = 1 -

    - t, /2 onde o gl. dado pelo mtodo de Aspin-Welch, com arredondamento para menos.

    = onde V1 = e V2 =

    Duas mquinas de embalar de embalar arroz esto sendo usadas por uma empresa, sendo uma nova e outra velha; pegas duas amostras de sacos embalados, encontramos os eguintes pesos, em Kg.

    Mquina Nova: 82, 83, 79, 81, 81, 80

    Mquina Velha: 79, 82, 78, 74, 80, 77, 75, 84, 78

    Construir o I.C. para a diferena dos pesos mdios populacionais, ao nvel de significncia de 5%.

    I.C. para a Soma e para a Diferena de duas propores populacionais p1 e p2 .

    Se f1 = N ( p1 , ) e f2 = N ( p2 , ); logo, ( f1 f2 ) = N [( p1 p2 ); + ] e,

    , logo o intervalo de confiana ser:

    P [ - Z/2 Z Z/2 ] = 1 -

    P [- Z/2 Z/2 ] = 1 -

    P [( f1 f2 ) - Z/2 . p1 p2

    ( f1 f2 ) + Z/2 . ] = 1 -

    Como p1 e p2 so valores populacionais desconhecidos, eles podem ser estimados por f1 e f2, desde que os tamanhos das amostras sejam maiores do que 30, da temos:

    P [( f1 f2 ) - Z/2 p1 p2

    ( f1 f2 ) + Z/2 ] = 1 -

    Exemplo:

    Um levantamento estatstico mostrou que 80 pessoas, das 200 consultadas, numa cidade, vo votar no candidato A na prxima eleio; uma outra amostra de 500 pessoas, dessa mesma cidade, mostrou que 150 delas vo votar no candidato B. Construir um IC de 93% para a diferena das propores de pessoas que vo votar em A e B.

    IC para o quociente das varincias populacionais

    Seja: F(1 , 2 ) = =

    para duas populaes normais de varincias descontinuas, pelo Teorema de Fischer: 2n-1 = (n- 1) . S2 ou

    2 = . S2

    2

    2

    Portanto

    logo o intervalo ser:

    P[ F1 - /2 F F /2 ] = 1 -

    ou:

    Exemplo:

    Construir um IC, para = 2%, para o quociente de varincias de duas populaes normais, das quais foram extradas as amostras seguintes: 41 elementos da primeira, obtendo-se S12 = 43,8 e 31 elementos da segunda, obtendo-se S22 = 29,5.

    (

    )

    X

    [

    ]

    [

    ]

    n

    n

    n

    n

    X

    Var

    X

    Var

    X

    Var

    n

    X

    X

    X

    Var

    n

    X

    Var

    n

    n

    2

    2

    2

    2

    2

    2

    2

    2

    1

    2

    2

    1

    2

    ...

    1

    )

    (

    ...

    )

    (

    )

    (

    1

    )

    ...

    (

    1

    )

    (

    s

    s

    s

    s

    s

    =

    =

    +

    +

    +

    =

    +

    +

    +

    =

    +

    +

    +

    =

    E

    X

    i

    (

    )

    =

    m

    Var

    X

    i

    (

    )

    =

    s

    2

    1

    )

    (

    1

    2

    -

    -

    =

    =

    n

    x

    xi

    S

    n

    i

    [

    ]

    17

    .

    3

    )

    11

    .

    0

    1

    .

    2

    (

    ...

    )

    11

    .

    0

    9

    .

    0

    (

    )

    11

    .

    0

    1

    .

    1

    (

    9

    1

    2

    2

    2

    2

    =

    +

    +

    +

    +

    +

    +

    =

    S

    E

    X

    (

    )

    =

    m

    X

    m

    Var

    X

    n

    (

    )

    =

    s

    2

    q

    m

    =

    913

    .

    0

    1

    =

    -

    =

    p

    q

    s

    2

    S

    n

    X

    X

    i

    i

    n

    2

    2

    1

    1

    1

    =

    -

    -

    =

    (

    )

    q

    s

    =

    2

    p

    np

    n

    n

    X

    E

    p

    E

    =

    =

    =

    )

    (

    1

    )

    (

    n

    X

    P

    =

    s

    2

    m

    %

    7

    .

    8

    087

    .

    0

    100

    87

    =

    =

    =

    =

    n

    X

    p

    s

    s

    2

    3

    17

    1

    78

    ~

    .

    .

    -

    =

    X

    z

    X

    =

    =

    -

    =

    -

    -

    =

    2

    5

    2

    5

    0

    11

    1

    78

    1

    466

    .

    .

    (

    .

    )

    .

    .

    m

    s

    P

    X

    P

    Z

    P

    Z

    (

    .

    )

    (

    .

    )

    (

    .

    )

    .

    .

    >

    =

    >

    =

    -