84958247 tecnicas de amostragem apostila zelia

193
Técnicas de Amostragem (parte 2) (2 a versão) Zélia Magalhães Bianchini Agosto/2003

Upload: katiuscia-hasegawa

Post on 19-Oct-2015

63 views

Category:

Documents


34 download

TRANSCRIPT

  • Tcnicas de Amostragem (parte 2)(2averso)

    Zlia Magalhes Bianchini

    Agosto/2003

  • 2

  • Contedo

    1 Estimadores Especiais 11.1 Informaes auxiliares em amostragem . . . . . . . . . . . . . 11.2 Estimao de uma razo . . . . . . . . . . . . . . . . . . . . . 1

    1.2.1 Propriedades do estimador de uma razo . . . . . . . . 31.2.2 Varincia do estimador de uma razo . . . . . . . . . . 91.2.3 Estimao da varincia do estimador de uma razo . . 141.2.4 Preciso do estimador de uma razo . . . . . . . . . . . 14

    1.3 Estimadores de razo para o total e a mdia . . . . . . . . . . 161.3.1 Varincias dos estimadores de razo para o total e a

    mdia . . . . . . . . . . . . . . . . . . . . . . . . . . . 181.3.2 Estimao das varincias dos estimadores de razo para

    o total e a mdia . . . . . . . . . . . . . . . . . . . . . 191.3.3 Comparao da preciso do estimador de razo com a

    do estimador simples em amostragem aleatria simples 191.4 Estimadores de razo em amostragem estratificada . . . . . . 20

    1.4.1 Estimador de razo combinada . . . . . . . . . . . . . 201.4.2 Estimador de razo separada . . . . . . . . . . . . . . . 261.4.3 Comparao dos estimadores de razo separada e com-

    binada . . . . . . . . . . . . . . . . . . . . . . . . . . . 281.4.4 O uso de estimadores de razo . . . . . . . . . . . . . . 32

    1.5 Estimadores de Regresso . . . . . . . . . . . . . . . . . . . . 331.5.1 Comparao dos estimadores de regresso, razo e sim-

    ples da mdia sob amostragem aleatria simples . . . . 361.5.2 O uso de estimadores de regresso . . . . . . . . . . . . 37

    1.6 Ps-estratificao . . . . . . . . . . . . . . . . . . . . . . . . . 381.6.1 Estimao do total e da mdia . . . . . . . . . . . . . . 391.6.2 Preciso dos estimadores com ps-estratificao . . . . 40

    1.7 O uso de informaes auxiliares na estimao . . . . . . . . . . 431.8 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47

    3

  • 4 CONTEDO

    2 Amostragem de Conglomerados 532.1 Conceituao Bsica . . . . . . . . . . . . . . . . . . . . . . . 532.2 Amostragem de reas . . . . . . . . . . . . . . . . . . . . . . 552.3 Conglomerados em 1 estgio . . . . . . . . . . . . . . . . . . 56

    2.3.1 Probabilidades iguais de seleo . . . . . . . . . . . . . 562.3.2 Estimao de propores na Ac1 . . . . . . . . . . . . 652.3.3 Coeficiente de Correlao Intraclasse . . . . . . . . . . 692.3.4 Estimao do coeficiente de correlao intraclasse . . . 752.3.5 Eficincia da Ac1 em relao AAS com conglomera-

    dos de tamanhos iguais . . . . . . . . . . . . . . . . . . 772.4 Controle na variao de tamanho . . . . . . . . . . . . . . . . 822.5 Probabilidades desiguais de seleo . . . . . . . . . . . . . . . 83

    2.5.1 Seleo dos conglomerados com probabilidades desiguaise com reposio . . . . . . . . . . . . . . . . . . . . . . 83

    2.6 Estratificao de conglomerados . . . . . . . . . . . . . . . . . 932.6.1 Estimadores e respectivas precises . . . . . . . . . . . 94

    2.7 Estimador de razo . . . . . . . . . . . . . . . . . . . . . . . . 972.7.1 Estimador de razo baseado no tamanho dos conglom-

    erados . . . . . . . . . . . . . . . . . . . . . . . . . . . 982.7.2 Estimador de razo baseado em uma caracterstica que

    no seja o tamanho do conglomerado . . . . . . . . . . 1012.8 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102

    3 Conglomerados em 2 estgios 1093.1 Probabilidades iguais de seleo . . . . . . . . . . . . . . . . . 109

    3.1.1 Introduo e definies bsicas . . . . . . . . . . . . . . 1093.1.2 Parmetros da caracterstica y . . . . . . . . . . . . . . 1123.1.3 Estatsticas da amostra em cada estgio . . . . . . . . 1133.1.4 Estimadores de total e mdias e respectivas varincias . 1143.1.5 Estimadores das varincias dos estimadores de total e

    mdias . . . . . . . . . . . . . . . . . . . . . . . . . . 1193.1.6 Amostra autoponderada . . . . . . . . . . . . . . . . . 1233.1.7 Dimensionamento da amostra de conglomerados em 2

    estgios . . . . . . . . . . . . . . . . . . . . . . . . . . 1273.1.8 Efeito de conglomerao . . . . . . . . . . . . . . . . . 135

    3.2 Controle de variao de tamanho das UPAs . . . . . . . . . . 1373.2.1 Probabilidades desiguais de seleo das unidades primrias1383.2.2 Estratificao das unidades primrias e seleo com

    probabilidades desiguais de seleo . . . . . . . . . . . 1473.2.3 Estimador de razo . . . . . . . . . . . . . . . . . . . . 149

    3.3 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153

  • CONTEDO i

    4 Conglomerados em 3 estgios 1614.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1614.2 Seleo com probabilidades desiguais . . . . . . . . . . . . . . 161

    4.2.1 Estimador no viciado de Y . . . . . . . . . . . . . . . 1624.3 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163

    5 Estimao de varincias 1655.1 Porque importante estimar varincias? . . . . . . . . . . . . 1655.2 Problemas para estimar varincias . . . . . . . . . . . . . . . 1655.3 Mtodos para estimar varincias . . . . . . . . . . . . . . . . . 166

    5.3.1 Mtodo de Linearizao de Taylor ou -mtodo . . . . 1665.3.2 Mtodo do Conglomerado Primrio (Ultimate Cluster

    - Hansen et al, 1953) . . . . . . . . . . . . . . . . . . . 1685.3.3 Mtodos de Replicao . . . . . . . . . . . . . . . . . . 170

    5.4 Sistemas para estimao de varincias . . . . . . . . . . . . . . 172

    6 Dupla amostragem 1756.1 Descrio da tcnica . . . . . . . . . . . . . . . . . . . . . . . 1756.2 Consideraes sobre o custo . . . . . . . . . . . . . . . . . . . 1766.3 Dupla amostragem para estratificao . . . . . . . . . . . . . . 177

    6.3.1 Estimador no viciado para Vyd,est

    . . . . . . . . . . 180

    6.3.2 Estimao de uma proporo na dupla amostragempara estratificao . . . . . . . . . . . . . . . . . . . . 180

    6.4 Dupla amostragem para estimadores de razo . . . . . . . . . 1816.5 Dupla amostragem para probabilidades desiguais . . . . . . . 183

    Prefcio

    Estas notas de aula vm sendo ministradas na disciplina de Tecnologia daAmostragem II do Curso de Graduao em Estatstica da Escola Nacionalde Cincias Estatsticas - ENCE. Trata-se da apresentao da teoria e apli-cao de estimadores especiais e das tcnicas de seleo e de estimao emamostras de conglomerados em um ou mais estgios e de dupla amostragem.As notas de aula preparadas por Pedro Luis do Nascimento Silva quandode sua atuao como professor no referido curso, bem como as refernciasbibilogrficas bsicas, serviram como base para a elaborao deste material.

  • ii CONTEDO

    Cabe esclarecer que inteno incorporar num mesmo volume o contedoda disciplina de Tecnologia de Amostragem I, que corresponde aos funda-mentos e tcnicas bsicas para selecionar amostras e realizar estimao empesquisas por amostragem: conceitos bsicos de amostragem, amostragemaleatria simples com e sem reposio, distribuies amostrais e erro amostral,estimao de propores e domnios, clculo de tamanhos de amostra, amostra-gem sistemtica, amostragem estratificada e amostragem com probabilidadesdesiguais.A realizao deste trabalho deve-se em grande parte ao incentivo de Pedro

    Luis do Nascimento Silva para a preparao de um livro de amostragem emportugus com o objetivo de facilitar o aprendizado dos alunos de graduaoem Estatstica na aplicao de tcnicas para selecionar amostras e realizarestimao em pesquisas por amostragem.Uma primeira verso dessas notas vinha sendo utilizada no curso de Gra-

    duao da ENCE no 6o perodo, desde o 2o semestre de 1999. Agradeo aosalunos pelas indicaes de correes efetuadas, em especial a Adrian HeringerPizzinga, Ralph dos Santos Silva e Rodrigo Lage de Sousa, do 6operodo do2o semestre de 1999.Agradeo a Waldecir Bianchini pela colaborao no aprendizado para a

    utilizao do processador de texto Scientific Workplace e pela sua compreen-so e de nossos filhos (Renata, Fernanda e Henrique) das inmeras horasextraordinrias de trabalho desviadas do convvio familiar para a realizaodesta empreitada para a primeira verso.Esta verso ainda passar por outras revises e quaisquer sugestes sobre

    eventuais falhas e omisses e sobre a incorporao de novos temas so bemvindas em busca do aprimoramento do texto, do uso adequado da teoria eaplicaes em amostragem e da prepararao do profissional de Estatsticapara os desafios que a carreira certamente lhe proporcionar.

    Zlia Magalhes Bianchini

    Rio de Janeiro, agosto de 2003.

  • Captulo 1

    Estimadores Especiais

    1.1 Informaes auxiliares em amostragem

    Alm da varivel de interesse yi, uma ou mais variveis xi podem estarassociadas com a i-sima unidade da populao. Por exemplo, se a varivelde interesse o nmero de cabeas de gado em uma determinada fazenda,variveis auxiliares pode incluir a rea da fazenda, o tipo de vegetao, etc.Em algumas situaes, os valores para a caracterstica x so conhecidos

    para toda a populao, enquanto que em outras situaes os valores de x soconhecidos s para as unidades da amostra. Em muitas pesquisas, o valorda varivel de interesse de um censo anterior pode servir como uma varivelauxiliar.Informaes auxiliares podem ser usadas no desenho amostral ou na es-

    timao. Variveis usadas na estratificao, ou como medidas de tamanhopara a seleo com probabilidades proporcional ao tamanho, representam ouso de informaes auxiliares no desenho amostral.Na estimao de total ou de mdia de uma caracterstica y, a relao entre

    yi e xi pode muitas vezes ser aproveitada para produzir estimativas maisprecisas do que estimativas que utilizam apenas as informaes dos dados dacaracterstica y. Estimadores de razo, de regresso e de ps-estratificaoso exemplos do uso de informaes auxiliares na estimao.

    1.2 Estimao de uma razo

    Freqentemente na prtica de pesquisas por amostragem, o valor a ser esti-mado com a amostra uma razo entre duas variveis que varia de unidadepara unidade da populao.Um exemplo, que pode ser citado, a necessidade de se estimar a razo

    1

  • 2 CAPTULO 1. ESTIMADORES ESPECIAIS

    entre os gastos das famlias com alimentao e a renda das famlias. Outroexemplo seria a razo entre a quantidade colhida de certo produto pela reaplantada, medindo a produtividade da lavoura. Ainda outro exemplo se-ria a razo entre o salrio dos trabalhadores da indstria e o nmero detrabalhadores da indstria, medindo o salrio mdio dos trabalhadores daindstria.Em todos estes exemplos, o que se procura conhecer o valor de uma

    razo R onde R =YX.

    Considere-se a populao PN = {U1, U2, , UN}, onde sero investigadasduas caractersticas, x e y, gerando uma populao-matriz bivariada

    PN(x, y) = {(X1, Y1), (X2, Y2), , (XN , YN)} ,onde:

    XI = x(UI)

    YI = y(UI)I {1, 2, , N}

    Pode-se ento definir o parmetro razo na populao, R, de formaque:

    R =YX=

    NPI=1

    YI

    NPI=1

    XI

    =Y

    X

    Ponha-se ento, o problema de estimar a razo R a partir de uma amostraaleatria simples sem reposio de n unidades de PN ,{u1, u2, , un}, ondesero investigadas as caractersticas x e y, fornecendo

    {(x1, y1), (x2, y2), , (xn, yn)} .Note-se que:

    P [(xi, yi) = (XI , YI)] =1

    N i {1, 2, , n} e I {1, 2, , N} .

    Conclui-se que os vetores (xi, yi), i {1, 2, , n}, so identicamentedistribudos e que no so independentes, devido se tratar de amostragemsem reposio.Como R = Y /X = Y /X , um estimador intuitivamente razovel para

    R dado por:

    bR = yx

    onde y =1

    n

    nXi=1

    yi e x =1

    n

    nXi=1

    xi.

  • 1.2. ESTIMAO DE UMA RAZO 3

    1.2.1 Propriedades do estimador de uma razo

    Como verificar se bR um estimador razovel? Em primeiro lugar, nota-se que bR deve ser um estimador viciado de R, porm se pode mostrar quebR assintoticamente no viciado; pode-se mostrar tambm que bR umestimador consistente de R.Para provar que bR um estimador consistente de R, necessrio intro-

    duzir a definio de consistncia.Diz-se que um estimador bn baseado numa amostra sem reposio de

    tamanho n da populao consistente para o parmetro se e somente sebN = , isto , se P hbN = i = 1.Assim, a prova de que bR consistente para R imediata devido x se

    igualar aX e y a Y quando a amostra cobrir todas as unidades da populao.

    Alm disto,

    y =1

    n

    nXi=1

    yi =1

    n

    nXi=1

    Y + i

    = Y +

    1

    n

    nXi=1

    i = Y +

    onde:

    =1

    n

    nXi=1

    i

    De modo anlogo se tem que:

    x = X + onde =1

    n

    nXi=1

    i.

    Sabe-se ainda que:

    N nN

    S2yn= V ( y ) = V (Y + ) = V ( ) = E(

    2)

    E()

    2= E(

    2)

    pois, E() = 0.

    Analogamente,

    E(2) = V ( ) =

    N nN

    S2xn

    Note-se que:

    S2x =1

    N 1

    NXI=1

    XI X

    2e S2y =

    1

    N 1

    NXI=1

    YI Y

    2.

  • 4 CAPTULO 1. ESTIMADORES ESPECIAIS

    Desta forma, se pode escrever:

    bR = yx=

    Y +

    X + =

    Y1 +

    Y

    X1 +

    X

    = R 1 + Y

    1 +

    X

    1

    Suponha-se que Y 6= 0 e X 6= 0. Suponha-se, ainda que

    X

    < 1, isto ,

    que a amostra foi dimensionada de forma que se pode esperar que< X

    ouxX

    < X.

    Ento, desenvolvendo-se o fator1 +

    X

    1como srie de potncias de

    , vem:

    bR = R 1 + Y

    1 +

    X

    1= R

    1 +

    Y

    1

    X+

    2

    X2

    3

    X3 +

    !

    bR = R (1 X+

    2

    X2

    3

    X3 +

    !+

    Y Y X

    +

    2

    Y X2

    !)Desprezando-se na expresso entre parnteses todos os termos com grau

    superior a 2, obtm-se uma aproximao para o valor de bR.bR = R 1

    X+

    2

    X2 +

    Y Y X

    !Agora calculando-se o valor esperado de bR vem:E( bR) = ER 1

    X+

    Y+

    2

    X2

    Y X

    !!

    = R

    E

    1

    X+

    Y+

    2

    X2

    Y X

    !!

    = R

    1E

    X

    +E

    Y

    +E

    2

    X2

    !E

    Y X

    !

    = R1 +

    1

    X2E

    2 1Y X

    E

    No entanto:

    E2= V ( ) =

    N nN

    S2xn

  • 1.2. ESTIMAO DE UMA RAZO 5

    Por outro lado:

    E = E

    y Y

    xX

    = COV (x, y) =

    N nN

    Sxyn

    onde:

    Sxy =1

    N 1

    NXI=1

    XI X

    YI Y

    De qualquer forma, a tendenciosidade do estimador bR dada aproximada-mente por:

    T ( bR) = E( bR)R = R 1 + 1X2E

    2 1Y X

    E

    R

    = R1

    X2V

    1Y X

    COV (x, y)

    ou ainda:

    T ( bR) = R 1X2

    N nN

    S2xn 1Y X

    N nN

    Sxyn

    = R

    N nN

    1

    n

    S2xX2

    SxyY X

    Agora note-se que a correlao entre x e y na populao, (x, y), definida por:

    (x, y) =Exi X

    yi Y

    pV (xi)V (yi)

    =

  • 6 CAPTULO 1. ESTIMADORES ESPECIAIS

    (x, y) =

    1

    N

    NPI=1

    XI X

    YI Y

    s

    1

    N

    NPI=1

    XI X

    2 1N

    NPI=1

    YI Y

    2

    =

    NPI=1

    XI X

    YI Y

    s

    NPI=1

    XI X

    2 NPI=1

    YI Y

    2

    =

    1

    N 1NPI=1

    XI X

    YI Y

    s

    1

    N 1NPI=1

    XI X

    2 1N 1

    NPI=1

    YI Y

    2 (x, y) =

    SxypS2x S2y

    =Sxy

    Sx Sy

    Denotando-se ento (x, y) simplesmente por , vem:

    Sxy = Sx Sy

    Ento:

    T ( bR) = R N nN

    1

    n

    S2xX2

    1

    Y X Sx Sy

    = R

    N nN

    1

    n

    C2x CxCy

    onde C2x a varincia relativa de caracterstica x na populao.Agora, imediato provar que lim

    nNT ( bR) = 0

    No entanto, uma anlise de expresso de T ( bR) nos mostra que T ( bR) seanula exatamente quando:

    C2x CxCy = 0

    Isto , quando:S2xX2 =

    SxX

    SyY

  • 1.2. ESTIMAO DE UMA RAZO 7

    Ou melhor, quando:

    Y =SxSyXS2xX2

    = SySx

    X

    Assim, a condio para que bR seja um estimador no viciado de R queY = (Sy/Sx) X, que a condio para a reta de regresso entre y e xpassar pela origem, com coeficiente angular (Sy/Sx) .Foi verificado que, quando a condio anterior no satisfeita, bR um

    estimador tendencioso, embora com tendncia que tende a se anular quandoo tamanho n da amostra for grande.Com o objetivo de calcular uma medida da preciso do estimador bR, ser

    estabelecida uma cota superior a tendenciosidade de bR que permitir tambma determinao do tamanho de amostra necessrio para tomar desprezvel atendenciosidade.Inicialmente, quando se trata de um estimador viciado, a medida de sua

    preciso deve ser o seu erro quadrtico mdio, dado por:

    EQM( bR) = E( bRR)2 = EbRE( bR) +E( bR)R2= E

    bRE( bR)2+ E bRR22E( bR)R E bRE( bR)

    = V ( bR) + hT ( bR)i2 .Note-se que se a tendenciosidade se anula, isto , se o estimador for no

    viciado, ento o erro quadrtico mdio igual varincia do estimador.Note-se, ainda, que a expresso de EQM pode ser escrita como:

    EQM( bR) = V ( bR) + hT ( bR)i2 = V ( bR)1 +

    hT ( bR)i2V ( bR)

    Analisando-se a expresso acima, note-se que:

    V ( bR) = EQM( bR)quando: h

    T ( bR)i2V ( bR) = 0

  • 8 CAPTULO 1. ESTIMADORES ESPECIAIS

    Um critrio prtico para avaliar quo prximos esto V ( bR) e EQM( bR)consiste em verificar se: h

    T ( bR)i2V ( bR) 0, 01

    Ora. isto eqivale a verificar se:T ( bR)qV ( bR) 0, 10 ou

    E( bR)Rq

    V ( bR) 0, 10Por outro lado, note-se que:

    COV ( bR, x) = E( bRx)E( bR )E(x)= E( y) E( bR )X= Y E( bR )X

    Donde:COV ( bR, x)

    X=

    Y

    XE( bR )

    ou seja:

    E( bR ) = YX COV (

    bR, x)X

    = R COV (bR, x)

    Xou ainda:

    T ( bR ) = E( bR )R = COV ( bR, x)X

    Seja ( bR, x) = o coeficiente de correlao entre bR e x. Logo:COV ( bR, x) = qV ( bR)pV (x)

    Substituindo na expresso anterior, segue-se que:

    T ( bR ) = qV ( bR)pV (x)X

    T ( bR )qV ( bR) =

    pV (x)

    X

    ou ainda: T ( bR )q

    V ( bR) = || CV (x)

  • 1.2. ESTIMAO DE UMA RAZO 9

    Lembrando a condio de || 1 segue-se que: T ( bR )q

    V ( bR) CV (x).

    Considere a expresso do tamanho de uma amostra aleatria simplesdada por:

    n =N z2/2

    S2xX2

    N d2r + z2/2

    S2xX2

    =N z2/2C

    2x

    N z2/2 (CV (x))2 + z2/2C

    2x

    =C2x

    (CV (x))2 +C2xN

    j que a preciso relativa da mdia amostral pode ser escrita como:dr = z/2CV (x) e C2x = S

    2x/X

    2 a varincia relativa da caracterstica x

    na populao (ou coeficiente de variao da populao ao quadrado da car-acterstica x).Assim, para se ter tendenciosidade desprezvel no estimador de razo bR,

    deve-se ter:CV (x) 0, 10

    Sendo assim, basta tomar n tal que:

    n C2x

    0, 01 +C2xN

    Por exemplo, se Cx = 0, 4 e N = 5.000, ento n 16 bastaria para tornardesprezvel a tendenciosidade do estimador de razo bR.1.2.2 Varincia do estimador de uma razo

    Agora o objetivo obter uma expresso para a varincia do estimador derazo bR, que seja adequada para medir sua preciso. De fato, isto s temsentido quando se puder admitir que T ( bR) /qV ( bR) < 0, 10, isto , quandoo vcio de bR for pequeno.Ora, j foi visto na demonstrao anterior que:

    bR = R +R Y X

    +R

    2

    X2

    Y X

    !

  • 10 CAPTULO 1. ESTIMADORES ESPECIAIS

    e que:

    E( bR) = R +R E 2X2

    Y X

    !logo,

    bR E( bR) = R Y X

    +R

    2

    X2

    Y X

    !R E

    2

    X2

    Y X

    !

    Da, a varincia de bR dada por:V ( bR) = E bRE( bR)2

    = E"R

    Y X

    +R

    2

    X2

    Y X

    !R E

    2

    X2

    Y X

    !#2Nesta ltima expresso, desprezar todos os termos com grau superior a

    2. Ento:

    V ( bR) = R2E Y X

    2!

    = R2E

    2

    Y2

    !+E

    2

    X2

    ! 2E

    Y X

    !

    = R21

    Y2V (y) +

    1

    X2V (x)

    2

    Y XCov(x, y)

    = R2

    N nN

    1

    n

    S2y

    Y2 +

    S2xX2 2

    SxyY X

    =

    N nN

    1

    n

    R2

    S2y

    Y2 +R

    2 S2x

    X2 2R

    2 SxyY X

    =

    N nN

    1

    nX2

    S2y +R

    2S2x 2RSxy

    ou ainda:V ( bR) = N n

    N1

    nX2

    S2y +R

    2S2x 2RSxSy

    H outra maneira de escrever a expresso da varincia de bR, certas vezesmais conveniente para fins de clculo que as expresses j apresentadas:

    V ( bR) = N nN

    1

    nX2

    1

    N 1

    NXI=1

    (YI RXI)2

  • 1.2. ESTIMAO DE UMA RAZO 11

    Exemplo 1.1O vcio e erro quadrtico mdio do estimador de uma razo, sob amostragem

    aleatria simples, pode ser ilustrado imaginando a aplicao de amostragemem uma populao muito pequena e examinando o espao amostral, isto ,o conjunto de todas as possveis amostras. Suponha que os valores de duasvariveis x e y nas 4 unidades da populao so:

    Ui Yi XiU1 1 1U2 2 3U3 3 4U4 4 6

    (a) Calcule o valor da razo populacional YX , obtenha todas as possveisamostras de tamanho 2, a serem selecionadas aleatoriamente e semreposio e estime essa razo para cada possvel amostra.

    (b) Calcule os valores exatos do vcio, do erro quadrtico mdio e da var-incia desse estimador.

    (c) Calcule os valores aproximados do vcio e da varincia desse estimador.

    (d) Compare os resultados obtidos em (b) com os resultados obtidos em(c).

    Soluo:a) A razo populacional dada por:

    R =YX=

    NPi=1

    Yi

    NPi=1

    Xi

    =10

    14=5

    7

    O nmero de possveis amostras dado por:

    Nn

    =

    4

    2

    =

    4!

    2!(4 2)! = 6

  • 12 CAPTULO 1. ESTIMADORES ESPECIAIS

    Amostras possveis Probabilidades y =nPi=1

    yi x =nPi=1

    xi bR = yxU1U2 16 3 4

    34

    U1U3 16 4 545

    U1U4 16 5 757

    U2U3 16 5 757

    U2U4 16 6 969

    U3U4 16 7 10710

    b) Os valores exatos do vcio e do erro quadrtico mdio deste estimadorpodem ser obtidos a partir da distribuio de todas as possveis amostras:

    E( bR) = 16

    3

    4+4

    5+5

    7+5

    7+6

    9+7

    10

    =365

    504

    o valor exato do vcio de bR dado por:T ( bR) = E( bR)R = 365

    504 57=

    5

    504= 0, 0099

    O erro quadrtico mdio dado por:

    E( bRR)2 = 16

    (3

    4 57)2 + (

    4

    5 57)2 + (

    6

    9 57)2 + (

    7

    10 57)2= 0, 00185

    e a varincia dada por:

    V ( bR) = E( bRR)2 hT ( bR)i2 = 0, 00185 0, 0000009 = 0, 0018491c) O vcio aproximado dado por:

    T ( bR) = R N nN

    1

    n

    S2xX2

    SxyY X

    =1 fnX

    2

    RS2x Sxy

  • 1.2. ESTIMAO DE UMA RAZO 13

    sendo: f =1

    2n = 2 X =

    7

    2

    S2x =

    NPI=1

    X2i N X2

    N 1 =62 493

    =13

    3

    Sxy =

    NPI=1

    XiYi N X Y

    N 1 =43 353

    =8

    3

    T ( bR) = 1 fnX

    2

    RS2x Sxy

    =

    1

    2

    2

    7

    2

    2 5713

    3

    83

    =

    3

    343= 0, 0087

    com respeito varincia aproximada tem-se:

    V ( bR) = N nN

    1

    nX2

    S2y +R

    2S2x 2R Sxy

    =1 fnX

    2

    S2y +R

    2S2x 2R Sxy

    sendo:

    S2y =

    NPI=1

    Y 2i N Y2

    N 1 =30 253

    =5

    3

    portanto:

    V ( bR) = 1 fnX

    2

    S2y +R

    2S2x 2R Sxy

    =

    1

    2

    2

    7

    2

    25

    3+

    5

    7

    213

    3

    2

    5

    7

    8

    3

    != 0, 00139

    d) Observe que o vcio aproximado subestima ligeiramente o valor ver-dadeiro do vcio e a varincia aproximada subestima ligeiramente o valorverdadeiro da varincia.

  • 14 CAPTULO 1. ESTIMADORES ESPECIAIS

    1.2.3 Estimao da varincia do estimador de uma razo

    Um estimador consistente para V ( bR), quando X for conhecido, dado por:v1( bR) = N nN 1nX2

    s2y + bR2s2x 2 bR sxy

    onde:

    s2y =1

    n 1

    nXi=1

    (yi y)2

    s2x =1

    n 1

    nXi=1

    (xi x)2

    sxy =1

    n 1

    nXi=1

    (xi x)(yi y)

    que so estimadores no viciados de S2y , S2x e Sxy, respectivamente.

    Um estimador para V ( bR), quando X for conhecido, expresso de outraforma dado por:

    v1( bR) = N nN 1nX2 1n 1nXi=1

    (yi bRxi)2Quando X no for conhecido, um estimador alternativo para V ( bR)

    dado por:

    v2( bR) = N nN 1nx2 s2y + bR2s2x 2 bR sxyou

    v2( bR) = N nN 1nx2 1n 1nXi=1

    (yi bRxi)2.1.2.4 Preciso do estimador de uma razo

    A preciso do estimador de uma razo depende da distribuio de probabil-idades do estimador bR, que se verificou ser bastante intratvel e intrincada,devido ao fato de tanto os xi como os yi variarem de amostra para amostra.Os resultados tericos conhecidos se distanciam muito do que seria desejvele necessrio possuir nas aplicaes prticas.Assim, os principais resultados sero aqui apresentados sem demonstrao.

  • 1.2. ESTIMAO DE UMA RAZO 15

    Inicialmente, j foi demonstrado que o estimador de razo consistente.Alm disso, se viu tambm que ele viciado, exceto para certos tipos especiaisde populao, embora o vcio seja desprezvel para amostras grandes.Outro aspecto que a distribuio assinttica do estimador de razo

    normal para amostras bastantes grandes, sujeito apenas a restries muitofracas quanto ao tipo de populao de que se esteja selecionando a amostra.Em amostras de tamanhos moderados, a distribuio de bR mostra certatendncia a uma assimetria positiva para os tipos de populao para as quaiso mtodo comumente usado.Estes resultados indicam que no h problemas para calcular a preciso

    ou a preciso relativa do estimador de razo quando:a) a distribuio de bR for aproximadamente normal;b) a frmula para estimao da varincia de bR possa ser utilizada.Em termos prticos, as hipteses a) e b) podem ser assumidas sem risco

    aprecivel para amostras de no mnimo 30 unidades, suficientemente grandespara que se tenha CV (x) < 0, 10 e CV (y) < 0, 10, isto , o tamanho n daamostra deve ser tal que:

    n max

    30;

    C2x

    0, 01 +C2xN

    ;C2y

    0, 01 +C2yN

    Nestas condies, se pode afirmar que:bRRqV ( bR) = N(0, 1)

    Da segue-se que:

    P

    bRRq

    V ( bR) z/2

    = 1 = P

    bRR z/2qV ( bR) = 1 onde:

    z/2 a abscissa da distribuio Normal padro tal que

    P

    bRRq

    V ( bR) > z/2 =

    2

    e o nvel de significncia.

  • 16 CAPTULO 1. ESTIMADORES ESPECIAIS

    Portanto,

    D( bR) = z/2qV ( bR) a preciso do estimador bR; eDr( bR) = z/2V ( eR)R = z/2CV ( bR) a preciso relativa do estimador bR;Pode-se utilizar como estimador da preciso do estimador de bR, o valor

    d( bR) tal que:d( bR) = z/2qv( bR)

    com v( bR) dado por v1( bR) ou v2( bR) conforme a convenincia.O estimador da preciso relativa do estimador de bR, o valor dr( bR) tal

    que:

    dr( bR) = z/2qv( bR)bR = z/2 cv( bR)

    Estas informaes podem ser utilizadas para a construo de intervalosde confiana para R.A esse respeito, consultar Fieller (1932) e Paulson (1942), caso as condies

    para aproximao pela normal no sejam satisfeitas.

    1.3 Estimadores de razo para o total e a m-dia

    Uma forma usualmente eficaz de aproveitar o conhecimento de informaesexistentes sobre a populao, com o objetivo de melhorar a qualidade dasestimativas de uma amostra, a utilizao de estimadores de razo.Se para determinada caracterstica x, correlacionada com a caracterstica

    de interesse y so conhecidos:i) o valor verdadeiro da mdia ou total da populao; eii) os valores observados na amostra.Ento possvel construir estimadores cuja preciso deve ser melhor que

    a dos estimadores simples ou naturais j apresentados. A dia bsica aproveitar a interdependncia de x e y e a existncia de informaes sobre xlivres de erro de amostragem para conseguir estimativas mais precisas.Muitas vezes, desejvel incorporar informao de fontes externas in-

    dependentes para aumentar a confiabilidade das estimativas da pesquisa etambm para promover consistncia nos resultados publicados por diferentespesquisas.

  • 1.3. ESTIMADORES DE RAZO PARA O TOTAL E A MDIA 17

    As tcnicas que foram apresentadas para estimao de uma razo podemser adaptadas e utilizadas para melhorar as estimativas da mdia e totalde uma dada caracterstica y, bastando que seja conhecido o total popula-cional (X) ou a mdia (X) da caracterstica x na populao, sem erro deamostragem.Ora, se X for conhecido, tem-se:

    R =YX

    e bR = yx

    Y =YX

    X = R X = bYR = bRXY =

    Y

    XX = R X = yR = bR X = bYRN

    sendo:bYR o estimador de razo para estimar o total da caracterstica y; eyR o estimador de razo para estimar a mdia da caracterstica y.

    Em pesquisas domiciliares, por exemplo, prtica corrente no IBGE o usode estimadores de razo para estimar o total, utilizando como varivel auxil-iar a estimativa da populao residente, obtida pela projeo de populao.Neste caso feito um ajuste das estimativas provenientes da amostra de talmodo que os totais da populao estimados coincidam com os resultados dapopulao projetada que o IBGE elabora e divulga. O estimador do totalde uma caracterstica y qualquer, para uma determinada rea da PesquisaNacional por Amostra de Domiclios (PNAD) pode ser escrito genericamentecomo um estimador de razo da forma:

    bYPNAD = bRXp = bYbX Xp =nPi=1

    wiyi

    nPi=1

    wixiXp =

    nXi=1

    wiyi =nXi=1

    (wi) yi =nXi=1

    i yi

    onde:bYPNAD o estimador de razo para o total da caracterstica y ajustadopela projeo de populao, utilizado na PNAD, para a rea em questo;bY o estimador de total da caracterstica y, obtido considerando os pesossimples da amostra;bX o estimador de total da populao residente, obtido considerando ospesos simples da amostra;

    Xp a estimativa da populao residente, obtida pela projeo de popu-lao.

  • 18 CAPTULO 1. ESTIMADORES ESPECIAIS

    wi o peso amostral associado ao i-simo domiclio da amostra, obtidoconsiderando os pesos simples da amostra;

    n o nmero de domiclios na amostra da PNAD, para a rea em questo;yi o valor da caracterstica y associado ao i-simo domiclio da amostra,

    para a rea em questo;xi o total de pessoas associado ao i-simo domiclio da amostra, para a

    rea em questo;

    =XpbX o fator de ajuste dos pesos simples wi;

    i = i o peso final ajustado associado ao i-simo domiclio daamostra.A ttulo de ilustrao, o valor do fator de ajuste dos pesos da PNAD

    95 para Sergipe de = 1, 05, que corresponde razo entre a populaoresidente projetada para a data da pesquisa (1.611.711) e o valor da estima-tiva do total da populao residente obtida considerando os pesos simples daamostra para a rea em questo (1.535.111).

    1.3.1 Varincias dos estimadores de razo para o totale a mdia

    Todas as tcnicas para estimao da preciso anteriormente apresentadasforam feitas supondo que o desenho da amostra era com seleo aleatriasimples sem reposio. Para esse mesmo desenho amostral, as expresses soadaptadas e utilizadas, bastando notar que bYR igual a bR vezes a constanteX.Dessa forma, tem-se:

    E(bYR) bYR = X E( bR) bR

    V (bYR) = X2 V ( bR) = X2N nN 1nX2 S2y +R2S2x 2RSxy= N

    N nn

    S2y +R

    2S2x 2RSxy

    ou

    V (bYR) = NN nn 1N 1NXI=1

    (YI RXI)2

    De modo anlogo, para a mdia yR tem-se:

    E(yR) yR = XE( bR) bR

  • 1.3. ESTIMADORES DE RAZO PARA O TOTAL E A MDIA 19

    V (yR) = V (bYRN) =

    N nN

    1

    n

    S2y +R

    2S2x 2RSxy

    ou

    V (yR) =N nN

    1

    n1

    N 1

    NXI=1

    (YI RXI)2

    1.3.2 Estimao das varincias dos estimadores de razopara o total e a mdia

    Um estimador para V (bYR) dado por:v(bYR) = X2v( bR) = NN nn hs2y + bR2s2x 2 bR sxyi

    ou

    v(bYR) = X2v( bR) = NN nn 1n 1nXi=1

    (yi bRxi)2e um estimador para V (yR) dado por:

    v(yR) = X2v( bR) = N n

    N1

    n

    hs2y + bR2s2x 2 bR sxyi

    ou

    v(yR) =N nN

    1

    n1

    n 1

    nXi=1

    (yi bRxi)21.3.3 Comparao da preciso do estimador de razo

    com a do estimador simples em amostragem aleatriasimples

    A partir de uma amostra aleatria simples sem reposio de n unidades seconhece expresses para as varincias do estimador simples e do estimadorde razo para estimar o total (ou a mdia). Portanto, possvel comparar apreciso alcanada com cada um atravs da comparao entre suas varincias.Sendo assim, para o caso do estimador de total, sabe-se que:

    V (bY ) = N2 N nN

    S2yn

    V (bYR) = X2 N nN 1nX2 S2y +R2S2x 2RSxy= N2

    N nN

    1

    n

    S2y +R

    2S2x 2RSxy

  • 20 CAPTULO 1. ESTIMADORES ESPECIAIS

    Note-se que:

    V (bYR) < V (bY ) S2y +R2S2x 2RSxSy < S2y R2S2x < 2RSxSy >

    RSx2Sy

    > Y Sx2X Sy

    > Sx/X2 Sy/Y

    = > 12

    CxCy

    Na prtica, esta relao pode ser utilizada para verificar, quando conve-niente o uso do estimador de razo ao invs do estimador simples do total ouda mdia, j que muitas vezes possvel conhecer aproximadamente o valorde = (x, y) e tambm a relao entre Cx e Cy.

    1.4 Estimadores de razo em amostragem es-tratificada

    Nas seo 1.3 foi tratado o caso de utilizao do estimador de razo paraestimar o total populacional (Y ) a partir de uma amostra aleatria simplessem reposio de tamanho n. No caso de uma amostra estratificada, h doisestimadores de razo para estimar o total populacional (Y ):

    estimador de razo combinada; e estimador de razo separada.

    1.4.1 Estimador de razo combinada

    Considere ento, o problema de estimar o total Y a partir de uma amostraaleatria estratificada selecionada de uma populao comL estratos de tamanhoNh (h = 1, 2, , L), tendo sido selecionadas nh unidades e investigadas ascaractersticas x e y em cada unidade da amostra de cada estrato. Suponhaque seja tambm conhecido o total populacional para a caracterstica x. Oestimador de razo combinada bYRC para estimar o total populacional (Y ) definido por: bYRC = bYestbXest X = yestxest Xonde:bYest = LP

    h=1Nhyh o estimador simples do total da caracterstica y na

    amostra estratificada;

  • 1.4. ESTIMADORESDERAZOEMAMOSTRAGEMESTRATIFICADA21

    bXest = LPh=1

    Nhxh o estimador simples do total da caracterstica x na

    amostra estratificada;X o total da caracterstica x, conhecido de alguma fonte externa a

    amostra, livre de erros de amostragem;1

    yest =bYestN

    o estimador simples da mdia da caracterstica y na amostra

    estratificada; e

    xest =bXestN

    o estimador simples da mdia da caracterstica x na amostra

    estratificada.

    O estimador de razo combinada bYRC consistente para o total Y .Isto , bYRC |n=N = Y

    Prova: se n = N com nh = Nh h = 1, 2, , L vem:

    bYest = LXh=1

    Nhyh =LXh=1

    NhY h = Y

    bXest = LXh=1

    Nhxh =LXh=1

    NhXh = X

    donde: bYRC |n=N = YX X = Y sabido que os estimadores de razo so viciados exceto se a populao

    for de um tipo muito especial em termos de relao entre x e y.Apesar disso, temse afirmado que emmuitos casos o estimador de razo

    prefervel ao estimador natural (simples) por que d melhor preciso. Entre-tanto, esta afirmao s verdadeira, quando se consegue tornar desprezvelo vcio ou tendenciosidade do estimador de razo.Acontece que, como YRC um estimador de razo se pode demonstrar

    que:| E(bYRC Y |q

    V (bYRC) CV ( bXest) = CV (xest)1O estimador bYRC depende apenas do conhecimento do total X, e no dos totais Xh

    dos estratos.

  • 22 CAPTULO 1. ESTIMADORES ESPECIAIS

    usual considerar a tendensiosidade desprezvel quando

    CV ( bXest) = CV (xest) 0, 10.Assim ao dimensionar a amostra para estimar Y indispensvel garantir

    um tamanho mnimo tal que se tenha CV (xest) 0, 10Isto significa em:

    V (xest)

    X2 0, 01

    1

    X2

    LXh=1

    N2hN2

    S2h(x)nh

    LXh=1

    N2hN2

    S2h(x)Nh

    ! 0, 01

    LXh=1

    N2hN2

    S2h(x)nh

    0, 01X2 +LXh=1

    N2hN2

    Sh(x)Nh

    n

    LPh=1

    S2h(x)h

    N2hN2

    0, 01X2+

    LPh=1

    N2hN2

    S2h(x)Nh

    onde:h =

    nhndepende do critrio de alocao da amostra em cada estrato;

    S2h(x) =1

    Nh 1NhPj=1

    Xhj Xh

    2Xhj o valor da caracterstica x associada unidade j do estrato h.Esta condio quanto preciso na estimao deX ser tambm usada no

    estabelecimento de uma expresso aproximada para a varincia do estimadorde razo combinada.Alm disto, h que notar a equivalncia de fixar um coeficiente de variao

    de 10% para xest e de admitir um erro mximo de 20% na estimao de Xcom 95% de confiana.No se dispe de uma expresso exata para a varincia do estimador de

    razo combinada. Porm, se a amostra de tamanho suficientemente grandepara tornar desprezvel a tendenciosidade do estimador, podese obter umaexpresso aproximada para a varincia:

    V (bYRC) = E bYRC Y 2 = Eyestxest X Y2!

    = E

    yestxest

    X YX

    Xxest

    xest

    2!= E

    X2

    x2est(yest Rxest)2

    = N2E

    X2

    x2est(yest R xest)2

    !

  • 1.4. ESTIMADORESDERAZOEMAMOSTRAGEMESTRATIFICADA23

    supondose n grande, tem se

    Xxest

    = 1

    Da

    V (bYRC) = N2E (yest Rxest)2 = N2E y2est +R2 x2est 2Ryest xestPorm:

    E(y2est) = V (yest) + [E(yest)]2 = V (yest) + Y

    2

    E(x2est) = V (xest) +X2

    E(xestyest) = COV (xest, yest) +E(xest)E(yest) = COV (xest , yest) +X Y

    Da

    V (bYRC) = N2[V (yest) +R2V (xest) 2RCOV (xest, yest)]+N2[Y

    2+R2X

    2 2RX Y ]

    como:

    Y2+R2X

    2 2RX Y = (Y RX)2 = 02 = 0

    V (bYRC) = N2[V (yest) +R2V (xest) 2RCOV (xest, yest)]agora:

    V (yest) =LXh=1

    N2hN2

    Nh nhNh

    S2h(y)nh

    V (xest) =LXh=1

    N2hNh

    Nh nhNh

    S2h(x)nh

    onde:

    S2h(y) =1

    Nh 1

    NhXj=1

    (Yhj Y h)2

    S2h(x) =1

    Nh 1

    NhXj=1

    (Xhj Xh)2

  • 24 CAPTULO 1. ESTIMADORES ESPECIAIS

    e finalmente:

    COV (xest, yest) = E[xest X)(yest Y )]

    = E

    "LXh=1

    NhNxh

    LXh=1

    NhNXh

    !LXh=1

    NhNyh

    LXh=1

    NhNY h

    !#

    = E

    ("LXh=1

    NhN(xh Xh)

    #"LXh=1

    NhN(yh Y h)

    #)

    = E

    "LXh=1

    N2hN2(xh Xh)(yh Y h)

    #

    +E

    LXh=1

    LXk=1k 6=h

    NhN

    NkN(xh Xh)(yk Y k)

    =LXh=1

    N2hN2

    E(xh Xh)(yh Y h) + 0

    =LXh=1

    N2hN2

    COV (xh, yh)

    Lembrandose que a amostra dentro de cada estrato aleatria simples,vem:

    COV (xh, yh) =Nh nhNh

    Sh(x, y)nh

    onde

    Sh(x, y) =1

    Nh 1

    NhXj=1

    (Xhj Xh)(Yhj Y h)

    Ento finalmente:

    COV (xest, yest) =LXh=1

    N2hN2

    Nh nhNh

    Sh(x, y)nh

    Da, obtm-se:

    V (bYRC) = N2 LXh=1

    N2hN2

    Nh nhNh

    1

    nh[S2h(y) +R

    2S2h(x) 2RSh(x, y)]

  • 1.4. ESTIMADORESDERAZOEMAMOSTRAGEMESTRATIFICADA25

    Substituindo-se nesta expresso os valores de S2h(y), S2h(x) e Sh(x, y) vem:

    V (bYRC) = LXh=1

    N2hNh 1

    Nh nhNh

    1

    nh"NhXj=1

    (Yhj Y h)2 +R2(Xhj Xh)2 2R(Xhj Xh)(Yhj Y h)#

    V (bYRC) = LXh=1

    NhNh 1

    Nh nhnh

    (NhXj=1

    [(Yhj Y h)R(Xhj Xh)]2)

    Um estimador de V (bYRC) dado por:v(bYRC) = LX

    h=1

    Nh(Nh nh)

    nh

    hs2h(y) + bR2est s2h(x) 2 bRest sh(x, y)i

    onde: bRest = yestxeste s2h(y), s

    2h(x) e sh(x, y) so estimadores no viciados de S

    2h(y), S

    2h(x) e

    Sh(x, y), respectivamente, ou seja:

    s2h(y) =1

    nh 1

    nhXj=1

    (yhj yh)2

    s2h(x) =1

    nh 1

    nhXj=1

    (xhj xh)2

    sh(x, y) =1

    nh 1

    nhXj=1

    (xhj xh)(yhj yh)

    O estimador de razo combinada para estimar a mdia Y dado por:

    yRC =bYRCN

    Neste caso a varincia V (yRC) dada por:

    V (yRC) =1

    N2V (bYRC)

    e um estimador de V (yRC) dado por:

    v(yRC) =1

    N2v(bYRC)

  • 26 CAPTULO 1. ESTIMADORES ESPECIAIS

    1.4.2 Estimador de razo separada

    Uma outra forma de utilizar estimadores de razo para conseguir maior pre-ciso na amostragem estratificada o chamado estimador de razo separada.

    bYRS = LXh=1

    yhxhXh =

    LXh=1

    yhxh

    Xh =LXh=1

    bR hXhNotese que necessrio conhecer os totais por estrato Xh da caractersticaauxiliar x.A principal diferena do estimador de razo separada para o estimador

    de razo combinada est no nvel em que se faz uso da estimao por razo:no estimador de razo separada so feitas razes em cada um dos estratos,enquanto que no estimador de razo combinada uma nica razo feita paraos estimadores de total disponveis.O estimador de razo separada bYRS consistente para o total Y . Isto

    :YRS |n=N = Y

    Prova: se n = N com nh = Nh = yh = Y h

    bYRS |n=N = LXh=1

    yhxh

    Xh =LXh=1

    Y hXh

    Xh =LXh=1

    Nh Y h = Y

    Quanto tendendiosidade, este estimador precisa ser analisado commaior cuidado, porque depende de razes constudas em cada um dos es-tratos.Definindo bYhR = yhxh XhVem: bYRS = LX

    h=1

    bYhREm cada estrato, sabese que:

    | E(bYhR) Yh |qV (bYhR) CV (xh) h = 1, 2, , L

    Se os nh forem todos suficientemente grandes, podese admitir que ovcio de bYRS desprezvel. Caso isto no acontea o uso deste estimadorno aconselhvel, pois o vcio do estimador pode ser significativo impedindomesmo o clculo de uma estimativa da preciso como ser visto mais adiantePara ver porque isto ocorre, basta um raciocnio intuitivo:

  • 1.4. ESTIMADORESDERAZOEMAMOSTRAGEMESTRATIFICADA27

    Suponha que o vcio tenha o mesmo nvel em todos os estratos, comopode ocorrer, e ento o vcio de bYRS ser aproximadamente L vezes ovcio em bYhR. Porm, o erro padro de YRS apenas da ordem de Lvezes o erro padro de bYhR. Logo:

    | E(bYRS) Y |qV AR(bYRS)

    poderia ser to grande quantoLCV (xh)

    Exemplo: Se tivermos 50 estratos com CV (xh) = 0, 1 em cada estrato,o vcio de bYRS poderia ser da ordem de 0,7 vezes seu erro padro.Uma regra prtica a adotar contra-indica o uso do estimador de razo

    separada a menos que:L(CV (xh) < 0, 20 L = 1, 2, , L.

    Talvez esta regra seja conservadora demais pois o vcio pode ser bemmenor que o limite superior conhecido; mas a menos que haja forte evidnciadisso no se deve usar o estimador de razo separada.Tambm no existe uma expresso exata para a varincia de bYRS. Ser

    obtida uma expresso aproximada no caso em que os nh so suficientementegrandes para tornar desprezvel o vcio em cada um dos estratos. Caso estacondio no se verifique, a expresso obtida para a varincia no confivel,e o estimador de razo separada no deve ser usado.Supondo os nh suficientemente grandes, vem:

    V (bYRS) = E[(bYRS Y )2] = E

    LXh=1

    bYhR LXh=1

    Yh

    !2

    = E

    LXh=1

    (yhxhXh Yh)

    !2

    =LXh=1

    E

    "yhxhXh Yh

    2#+

    +LX

    h=1

    LXk=1k 6=h

    EyhxhXh Yh

    ykxkXk Yk

    =LXh=1

    V (bYhR) + 0=

    LXh=1

    N2hNh nhNh

    1

    nh

    S2h(y) +R

    2hS

    2h(x) 2RhSh(x, y)

  • 28 CAPTULO 1. ESTIMADORES ESPECIAIS

    onde: Rh =YhXh

    e S2h(y), S2h(x) e Sh(x, y) so como definidos anteriormente.

    Esta varincia pode ainda ser escrita:

    V (bYRS) = LXh=1

    N2hNh1

    Nh nhNh

    1

    nh

    (NhXj=1

    [(Yhj Y h)Rh(Xhj Xh)]2)

    Um estimador de V (bYRS) dado por:v(bYRS) = LX

    h=1

    Nh(Nh nh)

    nh

    hs2h(y) + bR2h s2h(x) 2 bRh sh(x, y)i

    onde: bRh = yhxh = yhxh e s2h(y), s2h(x) e sh(x, y) so como definidos anterior-mente.

    O estimador de razo separada para estimar a mdia Y dado por:

    yRS =bYRSN

    Neste caso a varincia V (yRS) dada por:

    V (yRS) =1

    N2V (bYRS)

    e um estimador de V (yRS) dado por:

    v(yRS) =1

    N2v(bYRS)

    v(yRS) =X Nh

    N2(Nh nh)

    nh[s2h(y) + bR2h s2h(x) 2 bRh sh(x, y)]

    1.4.3 Comparao dos estimadores de razo separadae combinada

    Em geral, para amostras de tamanho idntico, o estimador de razo combi-nada deve ter vcio bem menor que o estimador de razo separada.No uso do estimador de razo separada, h que verificar sempre se

    LCV (xh) 0, 20 h

  • 1.4. ESTIMADORESDERAZOEMAMOSTRAGEMESTRATIFICADA29

    Em ambos os casos, os tamanhos de amostra que garantem uma tendenciosi-dade desprezvel podem ser determinados.Atravs da comparao das varincias feita a avaliao da melhor pre-

    ciso alcanada entre os estimadores de razo em amostragem estratificada:

    V (bYRC) V (bYRS) = LXh=1

    N2hNh nhNh

    1

    nh[S2h(y) +R

    2S2h(x) 2RSh(x, y)]

    LXh=1

    N2hNh nhNh

    1

    nh[S2h(y) +R

    2hS

    2h(x) 2RhSh(x, y)]

    =LXh=1

    NhNh nh

    nh[(R2 R2h)S2h(x) 2(RRh)Sh(x, y)]

    Os dois estimadores sero igualmente precisos se Rh = R ou Yh/Xh =Y/X para todos os estratos.A medida que os Rh sejam mais distantes de R, o estimador da razo

    separada tende a dar maior preciso, inclusive por se basear num conheci-mento mais detalhado dos dados do universo da caracterstica x.

    Exemplo 1.2 (Cochran (1977), pg.167)Os dados so provenientes do Censo Agropecurio de todas as fazendas

    do municpio de Jeerson em Iowa. A varivel y investigada em cada fazenda a rea (em acres) com plantao de milho e a varivel x a rea de cadafazenda. A populao dividida em 2 estratos, sendo que o primeiro contmas fazenda com menos de 160 acres. Suponha que se deseja selecionar umaamostra de 100 fazendas, sendo que 70 sero selecionadas do estrato 1 e 30do estrato 2. A idia comparar a preciso de estimadores alternativos paraestimar a mdia da rea com plantao de milho por fazenda.Calcule a varincia do estimador da mdia segundo cada uma das 5 es-

    tratgias:1 - estimador simples, supondo que a amostra ser aleatria simples sem

    considerar a estratificao;2 - estimador de razo, supondo que a amostra ser aleatria simples sem

    considerar a estratificao;3 - estimador simples da amostragem estratificada, supondo que em cada

    estrato a amostra ser aleatria simples;4 - estimador de razo combinada da amostragem estratificada, supondo

    que em cada estrato a amostra ser aleatria simples;5 - estimador de razo separada da amostragem estratificada, supondo

    que em cada estrato a amostra ser aleatria simples;.

  • 30 CAPTULO 1. ESTIMADORES ESPECIAIS

    Os dados so apresentados na tabela a seguir:

    Estratos Tamanho(acres) Nh Y h Xh S

    2h(y) S

    2h(x) Sh(x, y) Rh

    1 160 1580 19,40 82,56 312 2055 494 0,2350

    2 > 160 430 51,63 244,85 922 7357 858 0,2109

    Total - 2010 26,30 117,28 620 7619 1453 0,2242

    Os fatores de correo de populao finita podem ser ignorados, ou seja,

    considerarN nN

    = 1 eNh nhNh

    = 1, h = 1 e 2.

    Considere Qh =N2hN2

    1

    nhe que Q1 = 0,008828 e Q2 =0,001525.

    Compare os resultados e comente.

    Soluo:

    1 - Amostra aleatria simples (AAS): y =1

    n

    nPi=1

    yi o estimador simples

    da mdia da rea com plantao de milho por fazenda

    V (y) =N nN

    S2yn=S2yn=620

    100= 6, 20

    2 - Amostra aleatria simples (AAS): yR =yxX o estimador de razo

    da mdia da rea com plantao de milho por fazenda

    V (yR) =N nN

    1

    n

    S2y +R

    2S2x 2RSxy = 1

    n

    S2y +R

    2S2x 2RSxy

    =1

    100[620 + (0, 2242)2(7619) 2(0, 2242)(1453)] = 3, 51

    3 - Amostra aleatria estratificada (AAE): yest =LPh=1

    NhNyh o estimador

    simples da mdia da rea com plantao de milho por fazenda

    V (yest) =LXh=1

    N2hN2

    Nh nhNh

    S2h(Y )nh

    =LXh=1

    N2hN2

    S2h(y)nh

    =LXh=1

    QhS2h(y) = (0, 008828)(312) + (0, 001525)(922) = 4, 16

  • 1.4. ESTIMADORESDERAZOEMAMOSTRAGEMESTRATIFICADA31

    4 - Amostra aleatria estratificada (AAE): yRC =yestxest

    X o estimador

    de razo combinada da mdia da rea com plantao de milho por fazenda

    V ( yRC) =LXh=1

    N2hN2

    Nh nhNh

    1

    nh

    S2h(y) +R

    2S2h(x) 2RSh(x, y)

    =LXh=1

    QhS2h(y) +R

    2S2h(x) 2RSh(x, y)

    = (0, 008828)(312) + (0, 001525)(922) + (0, 008828)(0, 2242)2(2055) +

    +(0, 001525)(0, 2242)2(7357) 2(0, 008828)(0, 2242)(494) +2(0, 001525)(0, 2242)(858)

    = 3, 10

    5 - Amostra aleatria estratificada (AAE): yRS =1

    N

    LPh=1

    yhxh

    Xh o es-

    timador de razo separada da mdia da rea com plantao de milho porfazenda

    V ( yRS) =LXh=1

    N2hN2

    Nh nhNh

    1

    nh

    S2h(y) +R

    2hS

    2h(x) 2RhSh(x, y)

    =

    LXh=1

    QhS2h(y) +R

    2hS

    2h(x) 2RhSh(x, y)

    = (0, 008828)(312) + (0, 001525)(922) + (0, 008828)(0, 2350)2(2055) +

    +(0, 001525)(0, 2109)2(7357) 2(0, 008828)(0, 2350)(494) +2(0, 001525)(0, 2109)(858)

    = 3, 06

  • 32 CAPTULO 1. ESTIMADORES ESPECIAIS

    Resumo e comentrios:

    Estrategia DesenhoamostralMetodo deestimaao V ariancias

    Ganhos deprecisao

    1 AAS simples V (y) = 6, 20 -

    2 AAS razo V (yR) = 3, 51V (y)V (yR)

    = 1, 77

    3 AAE simples V (yest) = 4, 16V (y)

    V (yest)= 1, 49

    4 AAE razo combinada V ( yRC) = 3, 10V (y)

    V ( yRC)= 2, 00

    5 AAE razo separada V ( yRS) = 3, 06V (y)

    V ( yRS)= 2, 03

    Os resultados mostram que h ganhos de preciso com as estratgias 2 a5 quando comparadas com a estratgia 1. Verifica-se que o ganho de precisoquando utilizar o estimador de razo com amostragem aleatria simples de77%, enquanto que ao utilizar o estimador de razo separada em relao aoestimador simples da amostragem aleatria simples de 103%. Porm, pode-se verificar que ao se adotar amostragem estratificada, o ganho de precisoao utilizar o estimador de razo separada em relao ao estimador simplesda amostragem estratificada de apenas 36%, pois: V (yest) / V ( yRS) =4, 16 / 3, 06 = 1, 36. Isto ocorre porque a varivel de estratificao (tamanhoda rea) a mesma varivel auxiliar utilizada no estimador de razo.

    1.4.4 O uso de estimadores de razo

    No planejamento das pesquisas a deciso entre utilizar uma determinadavarivel na estratificao ou na estimao depende de uma srie de circuns-tncias. Alguns pontos relevantes so:

    Fatores como localizao geogrfica, so mais fceis de serem introduzi-dos na estratificao do que no mtodo de estimao.

    A deciso depende da natureza da relao entre x e y.Todos os mtodosde estimao de razo estudados dependem da efetividade da propor-cionalidade da relao entre os xi e yi. Com relaes complexas oudiscontnuas, a estratificao pode ser mais eficiente.

    Se para algumas variveis da pesquisa existir uma relao proporcionalcom a varivel xi e para outras variveis existir uma relap propor-cional a uma outra varivel zi , ento, melhor utilizar xi e zi como

  • 1.5. ESTIMADORES DE REGRESSO 33

    variveis auxiliares em estimadores de razo do que estratificar por umadelas.

    Algumas restries devem ser consideradas ao tomar a deciso de usarestimadores de razo:

    Os tamanhos de amostra devem satisfazer s condies para tornardesprezvel o vcio do estimador empregado.

    Quanto maior a associao entre a caractertica auxiliar x e a car-acterstica de interresse y maior o ganho de preciso no uso de esti-madores de razo.

    No existem frmulas exatas para o vcio nem para a varincia dos es-timadores, embora as aproximaes da varincia existentes sejam sat-isfatrias para amostras cujo tamanho satisfaz a condio de tornardesprezvel o vcio.

    1.5 Estimadores de Regresso

    O estimador de regresso tem sua definio baseada nummodelo de regressousado para representar a distribuio condicional da varivel de interesse ydada a varivel auxiliar x.Assim como o estimador de razo, o estimador de regresso utilizado

    para melhorar a preciso atravs do uso de uma varivel auxiliar x que correlacionada com y. Quando a relao entre y e x examinada, pode sernotado que embora haja uma relao linear, a reta no necessariamente passapela origem. Neste caso sugere-se a utilizao de um estimador baseado naregresso linear de y e x.O papel do modelo o de descrever a disperso condicional da varivel

    de interesse y dada a varivel auxiliar x na populao finita. Espera-se queo modelo represente bem a relao de y e x. A idia pensar que os valorespopulacionais poderiam ter sido gerados pelo modelo. Entretanto, no necessrio supor que os valores populacionais foram de fato gerados pelomodelo.Suponha que seja selecionada uma amostra aleatria simples de tamanho

    n, que sejam investigados os valores da caracterstica de interesse y e dacaracterstica x, cuja mdia populacional (X) seja conhecida. O estimadorde regresso linear de Y definido por:

    yreg = y + b(X x)

  • 34 CAPTULO 1. ESTIMADORES ESPECIAIS

    onde:b o estimador usual de mnimos quadrados baseado na amostra.

    b =sxys2x=

    nPi=1(yi y)(xi x)nPi=1(xi x)2

    O papel desempenhado pelo modelo ser essencialmente de sugerir umestimador adequado b para usar no estimador de regresso. possvel demonstrar que o estimador de regresso yreg consistente e

    tem vcio de ordem1

    n.

    Sua varincia pode ser aproximada por:

    V (yreg) =N nN

    1

    nS2y(1 2xy)

    onde: xy = (x, y) a correlao entre as variveis x e y na populao.Esta varincia pode ser estimada usando:

    v(yreg) =N nN

    1

    nn 1n 2

    s2y + b

    2s2x 2bsxy

    =N nN

    1

    n1

    n 2

    nXi=1

    [(yi y) b(xi x)]2

    Outros estimadores de varincia podem ser usados, oferecendo melhordesempenho.O estimador de regresso para estimar o total Y dado por:bYreg = N yreg

    Neste caso, a varincia aproximada por:

    V (bYreg) = N2N nN 1nS2y(1 2xy)e a varincia pode ser estimada por:

    v(bYreg) = N2N nN 1n 1n 2nXi=1

    [(yi y) b(xi x)]2

    Exemplo 1.3 (Thompson (1992), pg. 80)

  • 1.5. ESTIMADORES DE REGRESSO 35

    Para estimar a produo total de uma plantao numa regio com N =100 reas, foram selecionadas aleatoriamente 4 reas e medida a quantidadeyi da produo de cada rea da amostra. A produo de uma rea dependeda quantidade xi de fertilizante aplicada na rea, que conhecida para cadarea da regio, resultando numa mdia populacional 100.Os 4 pares de valores (xi, yi) da amostra so: (50, 1410), (100, 1690),

    (150, 1680) e (200, 1850).As mdias amostrais so: y = 1657, 5 e x = 125 eb o estimador usual de mnimos quadrados baseado na amostra:

    b =

    nPi=1(yi y)(xi x)nPi=1(xi x)2

    =(50 125)(1410 1657, 5) + + (200 125)(1850 1657, 5)

    (50 125)2 + + (2200 125)2

    =32750

    12500= 2, 62

    A estimativa da produo total da referida plantao, obtida atravs doestimador de regresso, dada por:

    bYreg = N yreg = N y + b(X x)= 100 (1657, 5 + 2, 62 (100 125))= 100 (1592) = 159 200

    Para obter a estimativa da varincia, vamos considerar o valor da linhade regresso ajustada para a i-sima unidade da amostra estimada por:

    byi = a+ bxionde: a = y bx = 1675, 5 2, 62 (125) = 1330.Neste caso, tem-se:

    by1 = 1330 + 2, 62 (50) = 1461by2 = 1330 + 2, 62 (100) = 1592by3 = 1330 + 2, 62 (150) = 1723by4 = 1330 + 2, 62 (200) = 1854

  • 36 CAPTULO 1. ESTIMADORES ESPECIAIS

    v(bYreg) = N2v(yreg) = N (N n)n 1n 2nXi=1

    [(yi y) b(xi x)]2

    =N (N n)n (n 2)

    nXi=1

    (yi byi)2=

    100 (100 4)4 (4 2)

    (1410 1461)2 + + (1850 1854)2

    =100 (96)

    4(7035) = 16 884 000

    cujo desvio padro estimado por:qv(bYreg) = 4 109.

    Por outro lado, a estimativa da produo total da referida plantao,obtida atravs do estimador simples da amostragem aleatria simples, dadapor:

    bY = N y = 100 (1657, 5) = 165 750e a respectiva estimativa da varincia dada por:

    v(bY ) = N2v(y) = N (N n)n

    4Xi=1

    (yi y)2

    =100 (96)

    4(33292) = 79 900 000

    cujo desvio padro estimado por:qv(bY ) = 8 939.

    Portanto, o estimador de regresso mais preciso que o estimador simplesno exemplo com essa pequena amostra. Isto ocorre em funo da pequenavariao dos resduos sobre a reta de regresso ajustada.

    1.5.1 Comparao dos estimadores de regresso, razoe simples da mdia sob amostragem aleatriasimples

    V (yreg) =N nN

    1

    nS2y(1 2xy)

    V (yR) =N nN

    1

    n

    S2y +R

    2S2x 2RSxy

  • 1.5. ESTIMADORES DE REGRESSO 37

    V (y) =N nN

    1

    nS2y

    Examinando as expresses acima, imediato notar que o estimador deregresso mais preciso que o estimador simples da mdia a no ser xy = 0,caso em que os estimadores so igualmente precisos.O estimador de regresso prefervel ao estimador de razo quando:

    2xyS2y < R2S2x 2RSxy

    ou, equivalentemente quando:

    2xyS2y < R2S2x 2RxySySx

    xySy RSx

    2> 0 =

    xySySxS2x

    R2

    > 0

    isto , quando: SxyS2x

    R2

    > 0 = (B R)2 > 0

    B corresponde ao ajuste populacional (hipottico) do modelo aos dados dapopulao.Logo, o estimador de regresso mais preciso que o estimador de razo

    a menos que B = R, o que ocorre somente quando a regresso entre y e x linear passando pela origem.

    1.5.2 O uso de estimadores de regresso

    O estimador de regresso til por pelo menos trs motivos:

    oferece calibrao na varivel auxiliar, isto , se aplicado a varivelauxiliar replica exatamente seu total conhecido na populao;

    oferece ganhos de eficincia em relao ao estimador simples; tem grande flexibilidade, podendo ser utilizado com um vetor de var-iveis auxiliares e ser facilmente generalizado para o uso em desenhosamostrais complexos.

    Algumas desvantagens e problemas devem ser consideradas ao tomar adeciso de usar estimadores de regresso:

    o vcio pode ser no desprezvel com pequenas amostras;

  • 38 CAPTULO 1. ESTIMADORES ESPECIAIS

    os pesos podem ser negativos ou menores que 1, o que indesejvel.

    a preciso pode no ser boa caso o modelo linear no se ajuste bem.

    maior complicao na estimao da varincia.

    quando h mais de uma varivel auxiliar, necessrio usar mtodopara escolha das que vo ser incorporadas na estimao. Acrescentarvariveis auxiliares nem sempre traz bom resultado.

    usar pesos diferentes para diferentes variveis de interesse da pesquisa uma tentao, mas aumenta a complexidade e cria dificuldades prticas.

    1.6 Ps-estratificao

    muito comum na prtica a ocorrncia de situaes onde a tcnica de estrat-ificao poderia ser aplicada para melhorar a qualidade da amostra, pormno se dispe de uma lista completa das unidades da populao com os re-spectivos valores da caracterstica a ser usada na estratificao, ou seja, oestrato para o qual a unidade pertence no conhecido at que os dados daamostra sejam coletados. Caractersticas de pessoas, tais como: idade, sexo,raa e nvel educacional so exemplos prticos dessa aplicao.Nestes casos, quando forem conhecidos os limites dos estratos, e os seus

    respectivos tamanhos (atravs de um censo anterior, por exemplo), possvelfazer uso da estratificao para melhorar a qualidade das estimativas, atravsda tcnica de ps-estratificao que consiste no seguinte:i) selecionase uma amostra aleatria simples sem reposio de tamanho

    n da populao N (sem considerar a estratificao);ii) observase para cada unidade selecionada o valor da caracterstica de

    estratificao x;iii) de acordo com os valores observados de x, distribui-se a amostra em

    L estratos previamente delimitados;iv) considera-se a parte da amostra em cada um dos estratos como uma

    amostra aleatria simples sem reposio do estrato (vide estimao em sub-populaes), de tal forma que n1 + n2 + + nL = nNeste caso n1, n2, nL so variveis aleatrias. A amostra em cada

    estrato considerada como uma amostra aleatria simples sem reposio dasubpopulao formada pelas unidades pertencentes ao estrato.Assim sendo, a maneira de estimar ser derivada da teoria apresentada

    para estimao em subpopulaes.

  • 1.6. PS-ESTRATIFICAO 39

    1.6.1 Estimao do total e da mdia

    De acordo com o que foi visto no estudo de estimao em subpopulaes umestimador no tendencioso para o total y da populao com ps-estratificao dado por: bYpos = LX

    h=1

    Nhyh =LXh=1

    Nhnh

    nhXj=1

    yhj

    Note que em termos de expresso, o estimador bYpos idntico ao esti-mador bYest. A diferena existente entre ambos que no caso de bYest asmdias amostrais nos estratos (yh) so calculadas com amostras de taman-hos nh conhecidos a priori, enquanto que no caso de bYpos estes tamanhosso variveis aleatrias dependendo da particular amostra selecionada.A seguir, ser demonstrada a afirmao de que bYpos estimador no

    viciado para Y .Inicialmente, devese recordar que, se Z e T so variveis aleatrias,

    ento:E(Z) = ET [E(Z/T )]

    Neste caso conveniente considerar internamente a esperana condi-cionada quando se fixa uma dada seleo de amostra de tamanhos n1, n2, , nL,e depois a esperana sobre todas as possveis selees de amostra. Verificaseque:

    E(yh) = E

    1

    nh

    nhXj=1

    yhj

    !

    = En1,n2, ,nL[E1

    nh

    nhXj=1

    yhj |n1, n2, , nL ]

    = En1,n2, ,nL[Y h] = Y h h = 1, 2, , L

    Seguindose imediatamente que:

    E(bYpos) = E " LXh=1

    Nhyh

    #=

    LXh=1

    NhE(yh) =LXh=1

    NhY h = Y

    Uma consequncia imediata disto que um estimador no tendencioso damdia y dado por :

    ypos =1

    NbYpos = LX

    h=1

    NhNyh

  • 40 CAPTULO 1. ESTIMADORES ESPECIAIS

    Na psestratificao, concluise ento que, os estimadores do total e damdia so obtidos da mesma forma que na estratificao comum, uma vezselecionada a amostra. O que ser diferente a preciso resultante desteprocesso de estimao, como ser visto adiante.

    1.6.2 Preciso dos estimadores com ps-estratificao

    Nosso objetivo aqui o clculo das medidas da preciso dos estimadores compsestratificao, e a comparao dessa preciso com aquela resultante daaplicao convencional da estratificao.Inicialmente vale notar que no se dispe de expresso exata para a var-

    incia de bYpos ou de ypos. Isto se deve ao fato de ambas dependerem darazo 1nh onde agora nh varivel aleatria. Mas vamos ao problema,calculando uma aproximao para V (ypos).Varincia aproximada de ypos.Se Z e T so variveis aleatrias pode se escrever:

    V (Z) = ET (V (Z/T )) + VT [E(Z/T )]

    Ento:

    V (ypos) = En1,n2, ,nLV (ypos |n1, n2, , nL

    +

    +Vn1,n2, ,nL[E(ypos |n1, n2, , nL ]

    Mas:E(ypos |n1, n2, , nL ) = Y

    Donde:

    Vn1,n2, ,nL[E(ypos |n1, n2, , nL ] = Vn1,n2, ,nL(Y ) = 0

    Logo:

    V (ypos) = En1,n2, ,nLV (ypos |n1, n2, , nL

    = En1,n2, ,nL

    LXh=1

    N2hN2(1

    nh 1Nh)S2h

    !

    Da:

    V (ypos) =LXh=1

    N2hN2

    E(1

    nh)S2h

    LXh=1

    N2hN2

    S2hNh

  • 1.6. PS-ESTRATIFICAO 41

    Para calcular E( 1nh ) vamos usar a aproximao em srie de Taylor emtorno do ponto E(nh) da funo 1nh . Esta funo pode ser escrita como:

    1

    nh=

    1

    E(nh)E(nh)nh

    =1

    E(nh)1nh

    E(nh)

    =1

    E(nh)1

    1 +nh E(nh)E(nh)

    agora sabese que:

    1

    1 += 1+2 .= 1+2

    Para

    =nh E(nh)E(nh)

    vem:1

    1 +nh E(nh)E(nh)

    = 1nh E(nh)E(nh)

    +

    nh E(nh)E(nh)

    2

    Donde:1

    nh=

    1

    E(nh)

    "1 nh E(nh)

    E(nh)+

    nh E(nh)E(nh)

    2#Tomando expectncias nos 2 membros vem:

    E(1

    nh) =

    1

    E(nh)

    1 E(nh E(nh))

    E(nh)+E[(nh E(nh))2]

    [E(nh)]2

    =

    1

    E(nh)

    1 +

    V (nh)[E(nh)]2

    Agora nh/n um estimador no viciado da proporo Nh/N de unidades

    pertencentes ao estrato h.Logo:

    Vnhn

    =

    N nN

    1

    n

    N

    N 1NhN

    1 Nh

    N

    =

    N nN

    1

    n

    NhN

    1 Nh

    N

    Tambm:

    Ehnhn

    i=NhN

  • 42 CAPTULO 1. ESTIMADORES ESPECIAIS

    Logo:

    E(nh) = nNhN

    V (nh) = n2N nN

    1

    n

    NhN

    1 Nh

    N

    Isto :

    E(nh) = nNhN

    V (nh) = n(N n)

    N

    NhN

    1 Nh

    N

    Levando na expresso de E(

    1

    nh) vem:

    E(1

    nh) =

    1

    nNhN

    1 +

    n(N n)

    NNhN

    1 Nh

    N

    n2N2hN2

    =1

    nNhN

    1 + (N n)

    N1

    n

    1Nh

    N

    1

    =1

    nNhN

    1 +

    (N n)N

    1

    n

    NhN 1

    Substituindo, finalmente, na expresso de V (ypos), vem:

    V (ypos) =LXh=1

    N2hN2

    NnNh

    1 +

    N nN

    1

    n

    NNh

    1

    S2h LXh=1

    N2hN2

    S2hNh

    =LXh=1

    N2hN2

    NnNh

    1Nh

    S2h +

    LXh=1

    N2hN2

    NnNh

    N nN

    1

    n

    NNh

    1S2h

    =N nN

    1

    n

    LXh=1

    NhNS2h +

    N nN

    1

    n2

    LXh=1

    (1 NhN)S2h

    Da:

    V (ypos) = V (y(p)est) +

    N nN

    1

    n2

    LXh=1

    (1 NhN)S2h

  • 1.7. O USO DE INFORMAES AUXILIARES NA ESTIMAO 43

    onde: V (y(p)est) a varincia do estimador da mdia no desenho de amostragemestratificada com alocao proporcional. medida que n cresce, a segunda parcela de V (ypos) tende a zero.

    V (ypos) V (y(p)est)

    Seguese que, para amostras grandes, a eficincia da ps-estratificao emrelao amostragem aleatria simples equivale alocao proporcional. Umcritrio habitualmente empregado na prtica para ter uma ps estratificaoefeciente tornar cada nh 20, este pode ser obtido de 2 maneiras, a saber:i) dimensionar a amostra aleatria simples de tal sorte que esta condio

    ocorra com elevada probabilidade;ii) utilizar um esquema de amostragem por cotas, onde os tamanhos de

    amostra em cada um dos estratos seriam previamente fixados por alocaoproporcional e as unidades de populao iriam sendo selecionadas por AASe alocadas nos estratos respectivos, at preencher a cota de cada estrato;cada nova unidade selecionada um estrato j com a cota preenchida seria re-jeitada, e uma nova unidade deveria ser selecionada, repetindose o processoat satisfazer as cotas fixadas para todos os estratos.A desvantagem deste esquema de amostragem por cotas o aumento do

    custo da pesquisa, em funo da seleo, investigao e posterior rejeio deunidades pertencentes a estratos j completos.Devese enfatizar que a adoo deste esquema s vlida se o proced-

    imento da seleo das unidades da amostra for realmente o de uma AASsem reposio.

    1.7 O uso de informaes auxiliares na esti-mao

    Silva (1996a) nos aponta que o aproveitamento de informaes populacionaisauxiliares para estimao em pesquisas por amostragem uma das partesda teoria de amostragem que mais progrediu desde os anos 70. O livro querepresentava o estado da arte da amostragem at ento (Cochran (1977))contempla o uso de informaes auxiliares atravs de estimadores de razoou de regresso simples (ambos incorporando apenas uma varivel auxiliar)ou de ps-estratificao. Entretanto, essas tcnicas eram apresentadas comoferramentas separadas, sem uma ligao comum.O livro que corresponde ao estado da arte da amostragem no incio

    dos anos 90 (Srndal, Swensson e Wretman (1992)) apresenta as tcnicas deps-estratificao, estimao de razo e de regresso como casos particulares

  • 44 CAPTULO 1. ESTIMADORES ESPECIAIS

    do estimador de regresso generalizado, o qual fornece uma estrutura flexvele eficiente para incorporar informaes auxiliares na etapa de estimao.Neste livro enfatizada uma abordagem model assisted, em que o modelode regresso usado para motivar o estimador, mas em que as propriedadesdo mesmo so avaliadas com respeito distribuio gerada por repetidasaplicaes do processo de seleo da amostra.Tambm recentemente, Deville e Srndal (1992) identificaram o estimador

    de regresso como um dos membros de uma famlias de estimadores de cali-brao, em que os pesos so ajustados, cujos os fatores de ajuste so obtidosde forma a minimizar uma funo de distncia sujeita a restries que sofunes das variveis auxiliares. Empregando-se distintas funes de dis-tncia se gera uma ampla famlia de estimadores que inclui raking ratioestimators, estimadores de regresso, de razo, de ps-estratificao e out-ros.O IBGE j adquiriu larga experincia e tem feito uso efetivo dos desen-

    volvimentos recentes da teoria. Para corroborar essa afirmao apresentadaa aplicao de estimadores especiais para a obteno dos fatores de expansodas amostras utilizadas na coleta de Censos Demogrficos brasileiros.O IBGE, desde 1960, tem usado dois modelos de questinrios na coleta

    das informaes dos Censos Demogrficos: um questionrio bsico, que con-tm os quesitos necessrios ao conhecimento de certas caractersticas bsi-cas da populao e dos domiclios, referentes a 100% da populao, e umquestionrio de amostra (ampliado) que contm, alm dos quesitos bsicosque tambm constam do questionrio bsico, outos quesitos mais detalhadossobre caractersticas dos domiclios e das pessoas, tais como religio, cor,migrao, escolaridade, fecundidade, mo-de-obra, rendimento, etc.O conhecimento de totais da populao para um subconjunto de car-

    actersticas investigadas (as quais so pesquisadas a 100%) torna vivel aaplicao de estimadores especiais.Nos censos demogrficos de 1960 e 1970 foram utilizados estimadores

    de ps-estratificao, com 46 ps-estratos em 1970, aplicado separadamentepara cada municpio. Cada ps-estrato era formado por combinaes devalores das variveis auxiliares, as quais foram investigadas a 100% atravsdo questionrio bsico.Na expanso da amostra do Censo Demogrfico de 1980 foi adotado raking

    ratio estimator aqui denominado Processo Iterativo de Estimao por TotaisMarginais - PIETOM (IBGE (1983)) aplicado separadamente para cada umadas 4219 reas de ponderao.2 Esse mtodo consistia em definir uma tabela

    2rea de ponderao a menor rea para a qual se calculava estimativas, e coincidiana maior parte das vezes com um municpio, podendo ser subdiviso deste nos de maior

  • 1.7. O USO DE INFORMAES AUXILIARES NA ESTIMAO 45

    (ou matriz) de ps-estratificao de dupla entrada, cujas linhas e colunaseram dadas por combinaes de valores das variveis auxiliares, as quaisforam investigadas a 100% atravs do questionrio bsico. Eram portantoconhecidos os totais populacionais das celas, linhas e colunas dessa tabela.Os pesos amostrais para unidades em cada cela eram calculados por umprocesso iterativo de ajuste dos pesos iniciais, de tal forma que as estimativasamostrais eram sucessivamente calibradas nos totais das linhas e depois dascolunas, at que fosse observada convergncia dos pesos.O uso dese mtodo permitiu ampliar bastante o nmero de variveis aux-

    iliares consideradas para a calibrao das estimativas amostrais: a tabela deps-estratificao empregada no censo de 1980 tinha 720 celas, em compara-o com os 46 ps-estratos adotados no Censo de 70.A metodologia adotada para a expanso da amostra do Censo de 1991 foi

    baseada no ajuste de um modelo linear generalizado sujeito a restries, en-tendidas como condies que buscam igualar estimativas dos valores conheci-dos do universo para um conjunto de variveis auxiliares comuns amostrae toda populao de cada rea de ponderao. Essa metodologia baseadanum dos membros da famlia de estimadores de calibrao identificada porDeville e Srndal (1992), identificada por estimao de mnimos quadradosgeneralizados em duas etapas - MQG2 (Silva, Bianchini e Albieri (1993);Albieri e Dias (1994)).Essa metodologia foi desenvolvida por tcnicos do Statistics Canada e

    aplicada na expanso da amostra do Censo de Populao canadense de 91e 96,que parecido com o Censo Demogrfico brasileiro. Foi possvel contar comprogramas cedidos ao IBGE pelo Statistics Canada para a implementao domtodo para uso no censo brasileiro.A metodologia MQG2 adotada para expandir a amostra do Censo De-

    mogrfico de 1991 permite incorporar grande nmero de variveis auxiliares,mas no oferece uma teoria para a escolha tima das mesmas. Esse um dosaspectos do emprego de estimadores de regresso que tem merecido atenoda comunidade de pesquisa recentemente. Em particular, Silva e Skinner(1996) apresentam um mtodo para seleo de variveis auxiliares quando seutiliza estimadores de regresso cuja eficincia para estimar a mdia de umavarivel resposta especificada foi maior que a de vrios competidores. Silvae Skinner (1996) apontam ainda uma perda de preciso deo estimador deregresso quando o nmero de variveis auxiliares cresce demasiadamente,alertando para a necessidade de establecer um compromisso entre a cali-brao no maior nmero possvel de variveis auxiliares sem impor grandeperda de eficincia no estimador.

    populao.

  • 46 CAPTULO 1. ESTIMADORES ESPECIAIS

    Na rea de estimao em amostragem h hoje em dia vrias opes desistemas genricos: SUDAAN - SUrvey DAta ANalysis (Shah et al. (1992)),GES -Generalized Estimation System (Estevao, Hidiroglou e Srndal (1995)),CLAN (Andersson e Nordberg (1994)), WESVARPC (Westat (1995)). Todosesses sistemas so capazes de calcular estimativas de totais e mdias, e re-spectivas medidas de preciso para uma ampla gama de desenhos amostraise tipos de estimadores. Em particular, o sistema GES desenvolvido peloStatistics Canada implementa a metodologia de estimadores de regressogeneralizados tal como descrita no livro de Srndal, Swensson e Wretman(1992).

  • 1.8. EXERCCIOS 47

    1.8 Exerccios

    1.8.1 (Thompson (1992), pg. 76) Numa cidade com 75.000 habitantes,uma amostra aleatria simples de 4 domiclios selecionada dos 25.000domiclios da cidade para estimar o custo mdio de alimentao pordomiclio em uma semana. O primeiro domiclio selecionado tinha 4pessoas e gastou R$150,00 com alimentao naquela semana. O se-gundo domiclio tinha 2 pessoas e gastou R$100,00. O terceiro, com 4pessoas, gastou R$200,00. O quarto, com 3 pessoas, gastou R$140,00.

    Considere:N nN

    = 1 s2y = 1691, 70 s2x = 0, 9166 sxy = 37, 5

    a) Identifique as unidades de amostragem, a varivel de interesse, ealguma informao auxiliar associada com as unidades.

    b) Descreva dois tipos de estimadores para estimar a despesa m-dia por domiclio para a alimentao por uma semana na cidade.Sumarize algumas propriedades de cada estimador.

    c) Estime a despesa mdia por domiclio usando o primeiro estimadore estime a varincia do estimador.

    d) Estime a despesa mdia por domiclio usando o segundo estimadore estime a varincia do estimador.

    e) Baseado nos dados, qual estimador prefervel nesta situao?

    1.8.2 Seja {u1, u2, , un}uma amostra aleatria simples sem reposio dapopulao N , onde so observadas as caractersticas x e y. Mostreque a covarincia amostral

    sxy =1

    n 1

    nXi=2

    (xi x)2

    um estimador no viciado para a covarincia populacional

    Sxy =1

    N 1

    NXI=1

    (XI X)(YI Y )

    1.8.3 De uma populao com 40 domiclios foi selecionada uma amostraaleatria simples sem reposio de tamanho n = 4 que proporciona

  • 48 CAPTULO 1. ESTIMADORES ESPECIAIS

    os seguintes valores semanais expressos em reais.

    Gastos com alimentao Gastos total(yi) (xi)125 250135 30070 200158 350

    4Pi=1

    yi = 4884Pi=1

    xi = 1.100

    4Pi=1

    y2i = 63.7144Pi=1

    x2i = 315.0004Pi=1

    xi yi = 141.050

    Estime a porcentagem de gasto com alimentao e o respectivo erroamostral medido pelo coeficiente de variao.

    1.8.4 O objetivo estimar o total de despesa com gastos sociais das prefeiturasde uma regio que abrange 281municpios. Foi selecionada uma amostraaleatria sem reposio de 50 municpios. Sabe-se que a populao to-tal da regio de 6.818 (em milhares). Calcule a estimativa de totalda caracterstica y, que representa a despesa com gastos sociais, e o re-spectivo intervalo com 95% de confiana para essa estimativa de totalbaseada em cada um dos seguintes estimadores:

    a) Estimador simples.

    b) Estimador de razo, utilizando como varivel auxiliar a populao,representada pela caracterstica x.

    c) Comente os resultados.

    So dadas as seguintes informaes provenientes da amostra:

    50Pi=1

    yi = 128.08050Pi=1

    xi = 1.067

    s2y = 6.244.516 s2x = 454, 51 sxy = 45.399

    Obs: Tanto os valores de x com de y esto representados em milhares.

  • 1.8. EXERCCIOS 49

    1.8.5 Defina estimadores consistentes e suas respectivas varincias aproxi-madas para a mdia de Y baseados em:

    a) estimador de razo simples;

    b) estimador de razo combinada;

    c) estimador de razo separada.

    Quando razovel a utilizao de estimadores de razo, luz das re-stries existentes para esse tipo de estimador? e

    A partir das frmulas aproximadas para as varincias dos estimadoresde (a), (b) e (c), obtenha estimadores consistentes que possam ser cal-culados a partir da amostra.

    1.8.6 Uma pesquisa piloto, onde foram selecionados aleatoriamente 21 domi-clios (di i = 1, 2, , 21), forneceu os seguintes dados para o nmerode pessoas no domiclio (x), nmero de crianas (y1), nmero de carros(y2) e nmero de televisores (y3).

    di x y1 y2 y3 di x y1 y2 y3 di x y1 y2 y3d1 5 3 1 3 d8 2 0 0 1 d15 6 3 2 0d2 2 0 1 1 d9 3 1 1 1 d16 4 2 1 1d3 4 1 2 0 d10 2 0 2 0 d17 4 2 1 1d4 4 2 1 1 d11 6 4 2 1 d18 3 1 0 1d5 6 4 1 1 d12 3 1 0 0 d19 2 0 2 1d6 3 1 1 2 d13 4 2 1 1 d20 4 2 1 1d7 5 3 1 1 d14 5 3 1 1 d21 3 1 1 1

    Assumindo que a populao total X conhecida, voc recomendariaque os estimadores de razo fossem utilizados ao invs do estimadorsimples para estimar o total de crianas, carros e televisores?

    1.8.7 Em uma determinada localidade de 500 famlias se deseja fazer umestudo sobre o hbito de fumar entre as pessoas maiores de 16 anos.A populao foi estratificada em 2 estratos: famlias com renda alta(estrato 1), onde foram classificadas 200 famlias; e famlias com rendamais baixa (estrato 2), onde foram classificadas as outras 300 famlias. conhecido que o nmero de pessoas commais de 16 anos no estrato 1 520 e no estrato 2 1230. De cada um dos estratos foi selecionada umaamostra aleatria de 5 famlias, apresentando os seguintes resultados:

  • 50 CAPTULO 1. ESTIMADORES ESPECIAIS

    Estrato 1

    Famlias na amostra 1 2 4 4 5Pessoas com mais de 16 anos 4 3 2 1 2Fumantes com mais de 16 anos 1 1 0 1 1

    Estrato 2

    Famlias na amostra 1 2 4 4 5Pessoas com mais de 16 anos 5 6 4 4 3Fumantes com mais de 16 anos 3 3 1 2 2

    Estimar o total de fumantes entre as pessoas maiores de 16 anos nalocalidade, utilizando:

    a) o estimador simples da amostragem estratificada;

    b) o estimador de razo combinada; e

    c) o estimador de razo separada.

    Calcule os intervalos com 95% de confiana para estimar os totais de fu-mantes entre as pessoas maiores de 16 anos na localidade, considerandoos estimadores utilizados em (a), (b) e (c).

    Comente os resultados.

    1.8.8 Considere uma populao de pomares de plantio de pssegos. A var-ivel y a produo de pssegos e a varivel auxiliar x o nmero deps de pssego do pomar.

    A idia comparar a preciso dos estimadores alternativos da produototal de pssegos na populao, que tem 256 pomares, com base numaamostra aleatria de 100 pomares.

    Os dados bsicos obtidos de um censo anterior so:

    S2y = 6.409 S2x = 3.898 Sxy = 3.898 e R = 1, 270

    Calcule a varincia do estimador de total segundo cada uma das es-tratgias: estimador simples, razo e regresso. Comente o resultado.

    1.8.9 De um Censo Agropecurio foram obtidas 1 200000 fazendas e a rea(x) de cada fazenda foi investigada fornecendo uma mdia de 31,25acres por fazenda. Uma amostra aleatria simples de 2055 fazendas foiselecionda e foram obtidas as seguintes informaes sobre o nmero decabeas de gado (y) em cada fazenda e a rea de cada fazenda.

  • 1.8. EXERCCIOS 51

    2.055Pi=1

    yi = 25. 7512.055Pi=1

    xi = 62. 989

    s2y = 1.334, 470 s2x = 490, 4300 b = 0, 354585

    (ConsidereN nN

    = 1)

    a) Calcule as estimativas do total de cabeas de gado utilizando oestimador simples, de razo e de regresso.

    b) Calcule a estimativa da varincia de cada estimativa obtida em(a).

    c) Obtenha o intervalo com 95% de confiana para cada uma dasestimativas obtida em (a).

    d) Comente os resultados.

    1.8.10 Para estimar o total de cabeas de gado em uma determinada regio, foiselecionada aleatoriamente uma amostra de 24 fazendas dentre as 1.238fazendas daquela regio. O nmero de cabeas de gado de cada fazendada amostra foi coletado (caracterstica y) e alm disso dispunha-se docorrespondente nmero de cabeas de gado obtido no ltimo CensoAgropecurio. Usando como varivel auxiliar (x) a informao donmero de cabeas de gado coletado no ltimo censo e sabendo-se que:

    24Pi=1

    yi = 13.64624Pi=1

    xi = 13.638 s2y = 256.154, 86

    s2x = 278.836, 89 sxy = 256.262, 02

    a) Compare a eficincia do estimador de regresso em relao aoestimador simples.

    b) Compare a eficincia do estimador de regresso em relao aoestimador de razo.

    1.8.11 Uma amostra aleatria simples de 546 domiclios foi selecionada deuma rea que continha 2097 domiclios. As caractersticas tamanhodo domiclio e idade do chefe foram investigadas em todo universo ea varivel sexo do chefe do domiclio foi investigada apenas atravs daamostra, fornecendo os seguintes resultados.

  • 52 CAPTULO 1. ESTIMADORES ESPECIAIS

    Nmero de domiclios no universo

    Tamanho do Idade do chefedomiclio 0 a 39 anos 40 e mais Total

    1 a 3 moradores 303 464 7674 e 5 moradores 426 339 7656 e mais moradores 171 394 565

    Total 900 1197 2097

    Nmero de domiclios na amostra

    Tamanho do Idade do chefedomiclio 0 a 39 anos 40 e mais Total

    1 a 3 moradores 103 154 2574 e 5 moradores 120 80 2006 e mais moradores 32 57 89

    Total 255 291 546

    Nmero de domiclios na amostra, cujo chefe mulher

    Tamanho do Idade do chefedomiclio 0 a 39 anos 40 e mais Total

    1 a 3 moradores 1 8 94 e 5 moradores 1 3 46 e mais moradores 0 3 3

    Total 2 14 16

    Estimar o nmero de domiclios cujo chefe mulher

    a) usando o estimador simples.

    b) usando o estimador de ps-estratificao, considerando como ps-estrato a varivel idade do chefe.

    c) usando o estimador de ps-estratificao, considerando como ps-estrato o tamanho do domiclio.

    d) usando o estimador de ps-estratificao, considerando como ps-estrato a varivel idade do chefe cruzada com o tamanho do domiclio.

  • Captulo 2

    Amostragem de Conglomerados

    2.1 Conceituao Bsica

    O objetivo pretendido com a aplicao da tcnica de amostragem a obtenode estimativas para certos parmetros da populao a partir de uma amostrade unidades dessa populao, cuja preciso seja conhecida e satisfatria.As unidades dessa amostra podem ser obtidas selecionando-se direta-

    mente unidades na populao com probabilidades conhecidas. Elas podemainda ser obtidas por um outro esquema de amostragem onde grupos deunidades so selecionados com probabilidades conhecidas.A amostragem de conglomerados (cluster sampling) consiste num es-

    quema de amostragem em estgios, sendo que em cada estgio a unidadeamostral, para a qual atribuda a probabilidade de seleo, grupada emum subconjunto (CONGLOMERADO) de unidades populacionais.O termo unidade populacional usado para denotar um membro de uma

    particular populao para a qual as anlises dos resultados do levantamentoso feitas.1

    A formao dos conglomerados pode ser:- natural (exemplos: um cacho de uvas, uma turma de alunos, um edifcio,

    um quarteiro, um municpio); ou- artificial, construdo pelo estatstico de acordo com o objetivo da pesquisa

    (exemplos: conglomerados de seis pessoas, de dez peas industriais do mesmotipo, de cinco domiclios do mesmo edifcio).

    1Nos esquemas de amostragem at ento apresentados (amostragem aleatria simp-ples, amostragem estratificada e amostragem sistemtica) a unidade amostral era igual aunidade de anlise.

    53

  • 54CAPTULO 2. AMOSTRAGEM DE CONGLOMERADOS

    A unidade populacional depende da anlise que est sendo feita e de-terminada pelo propsito do levantamento e no pelo plano amostral. Podeacontecer de mais de uma unidade populacional estar envolvida no levanta-mento, quando por exemplo, caractersticas de domiclios e de pessoas soinvestigadas no mesmo levantamento.No h uma nica definio possvel para os conglomerados. Por exemplo,

    a turma tanto pode ser uma unidade populacional (se estivermos interessadosem investigar o nmero de alunos por turma), como pode ser um conglom-erado de alunos (se estivermos interessados em investigar o aproveitamentodos alunos).A fim de exemplificar, seguem-se algumas ilustraes de possveis con-

    glomerados associados com a populao, a varivel de interesse e a unidadede referncia para anlise.

    Populao Variveis de Unidade de Conglome-Interesse Referncia rados

    Turmas de Alunos por turma Turma Escolasalunos

    Estudantes de Aproveitamento Estudante Turmasescolas de 2o grau dos estudantes

    Visitantes de Facilidades do Visitante de Veculos queparques parque parque entram nonacionais nacional parque

    Passageiros Propsito da Passageiro de Lotaes dede avio Viagem avio passageiros

    Domiclios Caractersticas Domiclio Setoresde domiclios

    Moradores Caractersticas Morador de Domicliosem favelas de pessoas favela em favelasdo Rio do Rio do Rio

    Cabe lembrar que os vrios esquemas de amostragem: amostragem aleat-ria simples (AAS), amostragem estratificada e amostragem sistemtica dis-cutidos anteriormente podem ser aplicados a amostragem de conglomerados,onde os conglomerados so as unidades amostrais.

  • 2.2. AMOSTRAGEM DE REAS 55

    2.2 Amostragem de reas

    O cadastro ou marco de referncia a fonte de materiais que serve de guia epermite identificar a populao a ser coberta para a seleo de amostras.Os esquemas probabilsticos propostos para seleo de amostras pres-

    supem a existncia de uma lista completa das unidades da populao a serpesquisada. Porm, uma lista pode no estar disponvel, ou estar desatual-izada, ou o custo de preparar uma lista atualizada pode ser proibitivo. Almdisso, uma amostra selecionada de uma populao dispersa geograficamenteprovavelmente ser muito dispersa tambm.Para reduzir custos muito freqente o uso de amostragem de conglom-

    erados definidos por reas geogrficas com limites naturais ou artificiais bemdefinidos, Neste caso a amostra resultante pode ser concentrada dentro deum nmero de reas geogrficas.Portanto, a utilizao de amostras de reas se d quando no existe um

    cadastro de boa qualidade disponvel e/ou quando a populao for muitodispersa e o fator custo de deslocamento for preponderante. Neste caso anecessidade de uma lista atualizada das unidades para as quais se requer ainformao restrita s reas que forem selecionadas para a amostra.A grande vantagem da amostra de conglomerados a sua convenincia

    operacional vinculada a possveis redues no custo.Num levantamento de populao, por exemplo, operacionalmente mais

    conveniente pesquisar todas as pessoas numa amostra de domiclios do queselecionar o mesmo nmero de pessoas espalhadas por toda a populao oumesmo pesquisar todos os domiclios de uma amostra de reas (por exemplo,setores) do que selecionar uma amostra do mesmo nmero de domicliosselecionados aleatoriamente de uma lista de todos os domiclios. Tal listanem sempre disponvel e o seu preparo torna a pesquisa bem mais cara.Suponha-se que uma AAS de n=400 domiclios deva ser selecionada de

    uma populao de N=10.000 domiclios de uma cidade. Como no dispomosde uma lista atualizada com todos os domiclios, optamos por uma amostrade domiclios localizados dentro de uma amostra de quarteires. Isto podeser feito dividindo a rea toda da cidade em quarteires e selecionando 1/25quarteires. A probabilidade de selecionar um domiclio na cidade a prob-abilidade de selecionar um quarteiro, ou seja, 1/25=400/10.000.Portanto, as unidades amostrais so quarteires selecionados de uma lista

    completa. A seleo da amostra de quarteires determina a seleo dosdomiclios que esto localizados nos quarteires.Mesmo se a lista de todos os domiclios fosse disponvel, consideraes na

    reduo do custo pode ser observada na amostra de conglomerados. Pois a

  • 56CAPTULO 2. AMOSTRAGEM DE CONGLOMERADOS

    localizao e identificao dos 400 domiclios espalhados aumentaria o custocom gastos com transporte, bem como um maior tempo para a coleta emcomparao com a localizao dos quarteires e visita a todos os domicliosnestes quarteires.Mas para um dado tamanho de amostra, uma unidade menor em geral

    d resultados mais precisos do que uma unidade maior.Portanto, se compararmos uma amostra de conglomerados com uma amostra

    de unida