intervalo de confianÇa e testes de ... - sinop. ?· como fazer para aumentar tanto a precisão do...

Download INTERVALO DE CONFIANÇA E TESTES DE ... - sinop. ?· Como fazer para aumentar tanto a precisão do intervalo…

Post on 09-Nov-2018

212 views

Category:

Documents

0 download

Embed Size (px)

TRANSCRIPT

  • 158

    CAPTULO 7 INTERVALO DE CONFIANA E TESTES DE HIPTESES 7.1 Intervalo de confiana A cada 2 anos (normalmente), nos acostumamos a acompanhar as pesquisas eleitorais. Geralmente elas so mostradas assim: Candidato Inteno de voto Joo da Silva 35% Maria Aparecida 32% Jos Severino 16% E, normalmente, temos uma afirmao adicional: a famosa margem de erro da pesquisa. Suponhamos que, para o caso da pesquisa acima, ela seja de 2 pontos percentuais para cima ou para baixo, o que vale dizer que o candidato Joo da Silva tem entre 33% e 37% das intenes de voto, enquanto Maria Aparecida tem entre 30% e 34%. Portanto, embora o mais provvel que o candidato Joo da Silva esteja ganhando, possvel que ele tenha 33% dos votos enquanto sua adversria direta tenha 34%, estando assim ela, e no ele, na frente da corrida eleitoral. Em resumo, no d para afirmar quem est na frente, o famoso empate tcnico entre os candidatos. Mas d para ter certeza que Joo da Silva tem no mnimo 33% dos votos e no mximo 37%? Ora, essa informao foi obtida atravs de uma amostra que, ainda que grande, pequena em relao ao total da populao. Mesmo que a amostragem tenha sido feita de maneira correta, possvel (por mais que seja pouco provvel) que a amostra contenha, por coincidncia, um nmero exageradamente grande (ou pequeno) de eleitores do referido candidato. Assim, falta uma informao referente ao quanto estes valores, mesmo que incluindo a margem de erro, so confiveis71. Construir um intervalo de confiana nada mais do que estabelecer uma margem de erro para um estimador e calcular o grau de confiana correspondente a esta margem. Ou, como mais comum, estabelecido um grau de confiana, calcular a margem de erro que corresponda a esta confiana. Como se faz isso? necessrio que se conhea a distribuio de probabilidade do estimador. Exemplo 7.1.1 Numa amostra de 100 estudantes foi encontrada uma idade mdia de 23,2 anos. Sabendo-se que a varincia das idades 25, construa um intervalo de 95% de confiana para a mdia. Pelo Teorema do Limite Central visto no captulo anterior, sabemos que a mdia segue uma distribuio que se aproxima da normal (e 100 um tamanho de amostra suficientemente grande). A varincia da mdia amostral, como tambm sabemos do captulo anterior, dada por:

    var( X ) = n

    var(X)

    71 Nem sempre esta informao omitida quando da divulgao das pesquisas. Por vezes, esta informao pode ser encontrada na imprensa escrita (embora dificilmente na manchete).

  • 159

    Ou, se quisermos abreviar mais a notao:

    2X

    = n

    2

    E o desvio padro da mdia amostral pode ser calculado diretamente por :

    X

    = n

    2

    = n

    Cujo valor, neste caso ser dado por72:

    X

    = 100

    5= 0,5

    Queremos um intervalo com 95% de confiana. Como a distribuio de probabilidade a normal (que simtrica), temos que encontrar o valor na tabela correspondente rea de 47,5%.

    O valor (para z) de 1,96 na tabela de distribuio normal 0,475002, portanto bem prximo dos 47,5%. Lembrando que a tabela representa uma normal padronizada, isto , com mdia zero e desvio padro igual a um, para que os valores da mdia amostral fiquem compatveis com os da tabela devemos subtrair a mdia e dividir pelo desvio padro. Como sabemos, a mdia da mdia amostral a prpria mdia populacional ( ) e o seu desvio padro j calculamos, igual a 0,5. Portanto, temos que:

    X

    -X = 1,96

    A diferena em mdulo porque o valor encontrado para a mdia amostral pode estar tanto abaixo como acima da mdia populacional. O valor encontrado para a mdia amostral foi 23,2. Substituindo, temos:

    5,0

    2,23 = 1,96

    |23,2 | = 0,5 1,96

    72 Lembrando que, se a varincia populacional 25, o desvio padro populacional 5.

  • 160

    |23,2 | = 0,98 Como em mdulo, isto , a mdia pode ser acima ou abaixo de 23,2, temos duas possibilidades: 23,2 = 0,98 ou 23,2 = 0,98 = 0,98 23,2 = 0,98 23,2 = 23,2 0,98 = 23,2 + 0,98 = 22,22 = 24,18 Ou seja, a mdia populacional pode estar entre 22,22 e 24,18. Repare que estes valores foram obtidos somando-se e subtraindo-se 0,98 da mdia amostral inicialmente obtida (23,2). Vale dizer que 0,98 a tal da margem de erro, e foi obtida multiplicando-se o desvio padro pelo valor encontrado na tabela. Portanto, o intervalo de confiana dado por: IC95% = [22,22; 24,18] Com 95% de confiana, como assinalado. Mas o que significa isso, afinal? Significa que, se repetssemos a experincia (calcular a mdia de idade a partir de uma amostra de 100 pessoas) um nmero muito grande (infinito) de vezes, em 95% delas o intervalo conter o valor verdadeiro da mdia populacional. No , a rigor, a probabilidade de que o intervalo, uma vez construdo, contenha a verdadeira mdia populacional pois, se ele j foi construdo, ou ele contm ou no contm o valor verdadeiro (seja ele qual for), a probabilidade seria um ou zero, respectivamente. Exemplo 7.1.2 Aps entrevistar 49 membros de uma categoria profissional, um pesquisador encontrou um salrio mdio de R$ 820. O desvio padro dos salrios desta categoria, conhecido, R$ 140. Construa um intervalo para a mdia: a) com 80% de confiana. Com 80% de confiana, temos que procurar na tabela metade, isto , 40%. O valor mais prximo 0,399727 que corresponde ao valor de z de 1,28. Como a mdia amostral tem distribuio aproximadamente normal, temos que;

    X

    -X = 1,28

    onde:

    X = 820 e

    X =

    49

    140 = 20

    20

    -820 = 1,28

    |820 - | = 25,6

  • 161

    A chamada margem de erro 25,6. Os pontos extremos do intervalo de confiana podem ser encontrados somando-se e subtraindo 25,6 da mdia amostral. IC80% = [794,4; 845,6] b) com 90% de confiana. Agora temos que procurar na tabela o valor correspondente a 45%. Este valor est entre 1,64 e 1,65. De fato, o valor de z aproximadamente 1,645.

    20

    -820 = 1,645

    |820 - | = 32,9 E, portanto, o intervalo de confiana : IC90% = [787,1; 852,9] Acontece aqui um problema de cobertor curto (quando se cobre o pescoo, descobrem-se os ps): se aumentamos o grau de confiana, a preciso do intervalo cai (a margem de erro aumenta). Como fazer para aumentar tanto a preciso do intervalo como a sua confiana (ou, pelo menos, aumentar uma sem diminuir a outra) preciso aumentar o pano do cobertor, isto , aumentar a amostra. Vejamos no exemplo seguinte. Exemplo 7.1.3 Do exemplo anterior, qual o tamanho de amostra necessrio para que, mantidos os 90% de confiana, a margem de erro seja de, no mximo, 20? Temos que, para 90% de confiana:

    X

    -X = 1,645

    Onde:

    X

    = n

    Substituindo, temos:

    n

    -X = 1,645

    A margem de erro ser dada por:

    n

    1,645 = 20

    n

    140 1,645 = 20

    n

    3,230 = 20

  • 162

    n = 20

    3,230

    n = 11,515 Elevando ao quadrado os dois lados da equao:

    2

    n = (11,515)2

    n = 132,59 Como a pergunta qual o tamanho mnimo da amostra (e este deve ser um nmero inteiro), a resposta 133 elementos. Exemplo 7.1.4 (pesquisa eleitoral) Em uma pesquisa eleitoral, entre 1000 eleitores, 240 declararam que pretendem votar no candidato A. Construa um intervalo de 95% de confiana para as intenes de voto para este candidato. Neste exemplo a resposta pedida exatamente o que apresentado pelos meios de comunicao quando divulgam uma pesquisa eleitoral. O valor (amostral) para a proporo de eleitores que desejam votar neste candidato :

    p = 1000

    240= 0,24 = 24%

    Mas preciso calcular a margem de erro para que o resultado (o intervalo de confiana) seja

    completo. Para isso precisamos calcular a varincia deste estimador. Como faz-lo? Suponha que 24% o valor correto das intenes de voto. Isto significa que,

    para cada eleitor entrevistado, como se fosse um jogo onde h 24% deste eleitor votar no candidato A e 76% de votar em outros candidatos (incluindo a votos brancos e nulos). Da mesma forma que quando jogamos uma moeda, h 50% de chance de dar cara e 50% de no dar cara (dar coroa); ou de quando jogamos um dado, h 1/6 de chances de cair um certo nmero desejado e 5/6 de chances de no cair.

    Portanto, como se, cada eleitor entrevistado fosse uma distribuio de Bernouilli, cuja

    varincia calculada, como j vimos, por: 2 = p(1-p)

    Onde p a probabilidade de ocorrncia de sucesso (dar cara na moeda, dar 6 no dado ou...

    encontrar um eleitor que vote no candidato A) e (1-p) a probabilidade de ocorrncia do fracasso. Como temos n eleitores, a proporo encontrada , na verdade, uma proporo mdia, cuja

    varincia ser dada, a exemplo da mdia amostral comum, por73:

    var( p ) = n

    )p-(1p

    Que, neste caso, ser dada por:

    73 Note que, tambm a exemplo da mdia amostral, esta varincia estimada, j no conhecemos o valor correto de p.

  • 163

    var( p ) = 1000

    0,760,24 = 0,0001824

    E o desvio padro:

    dp( p ) = 0001824,0 0,0135 = 1,35%

    J temos o valor do estimador e seu desvio padro, podemos, portanto calcular o intervalo de

    confiana da proporo verdadeira (populacional) p (o valor tabelado para 95% 1,96):

    )pdp(

    p-p= 1,96

    1,35

    p-24= 1,96

    |24 p| 2,6% Portanto, o intervalo de 95% de confiana para as intenes de voto para o candidato A : IC95% = [21,4%; 26,6%] Ou, como preferem os meios de comunicao, o candidato A tem 24% das intenes de voto

    com margem de erro de 2,6 pontos percentuais, para cima ou para b