hipotese unesp

16
Testes de hipóteses Aqui estudaremos outro aspecto da inferência estatística: o teste de hipóteses, cujo o objetivo é decidir se uma afirmação, em geral, sobre parâmetros de uma ou mais populações é, ou não, apoiado pela evidência obtida de dados amostrais. Tal afirmação é o que se chama Hipótese Estatística e a regra usada para decidir se ela é verdadeira ou não, é o Teste de Hipóteses. Iremos ilustrá-lo por meio de um exemplo. Exemplo 1. Uma suinocultura usa uma ração A que propicia, da desmama até a idade de abate, um ganho em peso de 500 g/dia/suíno ( = 25 g). O fabricante de uma ração B afirma que nas mesmas condições, sua ração propicia um ganho de 510 g/dia ( = 25 g). É evidente que em termos financeiros, se for verídica a afirmação do fabricante da ração do tipo B, esta deve ser usada em substituição à do tipo A. Se o criador tem de decidir com base em uma amostra, se o ganho em peso dos suínos dando a nova ração é 510 g/dia, o problema pode ser expresso na linguagem de teste estatístico de hipóteses. 1. Hipóteses estatísticas Em experimentos comparativos, nos quais um novo produto ou nova técnica é comparado com o padrão, para determinar se sua superioridade pode ser corroborada pela evidência experimental, é necessário formular a: Hipótese nula (H0), cujo termo é aplicado para a hipótese a ser testada, e a Hipótese alternativa (H1) A hipótese nula (H 0 ) é a hipótese de igualdade entre o novo e o produto padrão, ou seja, a designação “hipótese nula” decorre da suposição que a diferença entre eles é nula ou zero. A análise de cada situação indicará qual deve ser considerada a hipótese nula e qual a hipótese alternativa. Uma especificação de H 0 e H 1 no exemplo seria:

Upload: lucas-ferreira-da-silva

Post on 17-Sep-2015

32 views

Category:

Documents


0 download

DESCRIPTION

Estatistica teste de hipotese

TRANSCRIPT

  • Testes de hipteses

    Aqui estudaremos outro aspecto da inferncia estatstica: o teste de hipteses,

    cujo o objetivo decidir se uma afirmao, em geral, sobre parmetros de

    uma ou mais populaes , ou no, apoiado pela evidncia obtida de dados

    amostrais. Tal afirmao o que se chama Hiptese Estatstica e a regra

    usada para decidir se ela verdadeira ou no, o Teste de Hipteses. Iremos

    ilustr-lo por meio de um exemplo.

    Exemplo 1. Uma suinocultura usa uma rao A que propicia, da desmama at

    a idade de abate, um ganho em peso de 500 g/dia/suno ( = 25 g). O fabricante de uma rao B afirma que nas mesmas condies, sua rao

    propicia um ganho de 510 g/dia ( = 25 g). evidente que em termos financeiros, se for verdica a afirmao do fabricante da rao do tipo B, esta

    deve ser usada em substituio do tipo A.

    Se o criador tem de decidir com base em uma amostra, se o ganho em peso

    dos sunos dando a nova rao 510 g/dia, o problema pode ser expresso na

    linguagem de teste estatstico de hipteses.

    1. Hipteses estatsticas

    Em experimentos comparativos, nos quais um novo produto ou nova tcnica

    comparado com o padro, para determinar se sua superioridade pode ser

    corroborada pela evidncia experimental, necessrio formular a:

    Hiptese nula (H0), cujo termo aplicado para a hiptese a ser testada, e a

    Hiptese alternativa (H1)

    A hiptese nula (H0) a hiptese de igualdade entre o novo e o produto

    padro, ou seja, a designao hiptese nula decorre da suposio que a diferena entre eles nula ou zero.

    A anlise de cada situao indicar qual deve ser considerada a hiptese nula e

    qual a hiptese alternativa. Uma especificao de H0 e H1 no exemplo seria:

  • H0 : = 500 g/dia (a rao B no melhor)

    H1 : = 510 g/dia (a rao B melhor) ou

    H0 : = 0

    H1 : = 1

    onde: 1 > 0 e = 25

    Se uma hiptese estatstica especifica o valor do parmetro, ela referida

    como hiptese simples; se no, referida como composta. Assim, no

    exemplo, a hiptese alternativa = 510 simples. Seria composta, por

    exemplo, se > 500, visto que no fixa um valor especfico para o parmetro

    . Em H0, o valor do parmetro tem de ser especificado.

    A hiptese preferencial H0 e sustentada como verdadeira, a menos que os

    dados se coloquem firmemente contra ela. Em tal caso, H0 seria rejeitada a

    favor de H1. Rejeitar erradamente H0 visto como um erro mais grave do que

    no rejeitar H0 quando H1 verdadeira.

    2. Erros tipos I e II

    O problema proposto consiste em verificar se com a utilizao da nova rao,

    a mdia de ganho em peso seria estatisticamente maior que 500 g e caso isto

    se verifique, a suinocultura passaria a utiliz-la. Caso contrrio, continuaria

    com a rao do tipo A, que j foi testada (conhecida a priori).

    Para a tomada de deciso, deve-se extrair uma amostra aleatria (por exemplo,

    n = 50) de sunos, fornecendo mesma, da desmama at a idade de abate, a

    rao B, e aps o trmino da prova, calcula-se a mdia amostral ( x a) do ganho

    dirio em peso no perodo, que , no caso, a estatstica teste. A estatstica

    teste o valor amostral da estatstica utilizada para testar um parmetro no

    teste de hipteses.

    Parece razovel estabelecer que se x a estiver prxima de 500 g, no se deve

    rejeitar H0, e a concluso que a rao do tipo B estatisticamente igual a do

    tipo A. Por outro lado, se x a estiver prxima ou for superior 510 g, a tomada

    de deciso que a rao do tipo B superior do tipo A (rejeitar H0) e que a

    suinocultura passe a utiliz-la. A mdia amostral ( x a) , no entanto, uma varivel aleatria que pode assumir qualquer valor entre 500 e 510 g. Assim,

    deve-se estabelecer um critrio de deciso para aceitar ou rejeitar H0. Isto

  • feito determinando um valor k (ponto) entre 500 e 510 g, chamado valor

    crtico )x( c , e adotando a seguinte regra de deciso:

    Se a mdia amostral ( x a) estiver direita de k, rejeita-se H0, caso contrrio no se rejeita

    Graficamente tem-se a seguinte situao:

    Figura 1. Regio de rejeio de H0 para o teste = 0 vs. = 1

    Um teste de hipteses completamente especificado pela estatstica teste e

    regio de rejeio. A regio de rejeio ou regio crtica (RC) o conjunto de

    valores da estatstica teste para os quais H0 rejeitada.

    O procedimento do teste, ento, divide os possveis valores da estatstica teste

    em dois subconjuntos: uma regio de aceitao e uma de rejeio para H0, o

    que pode levar a dois tipos de erros. Por exemplo, se o verdadeiro valor do

    parmetro 500 g e incorretamente conclumos que = 510 g, cometeremos

    um erro referido como erro tipo I. Por outro lado, se o verdadeiro valor de

    510 g e incorretamente conclumos que = 500 g, cometeremos uma segunda espcie de erro, referido como erro tipo II.

    O quadro abaixo resume a natureza dos erros envolvidos no processo de

    deciso, por meio dos testes de significncia:

    Concluso do teste

    Situao especfica na populao

    H0 verdadeira H0 falsa

    No rejeitar H0 Deciso correta Erro tipo II (perdas

    potenciais para o criador)

    Rejeitar H0 Erro tipo I (perdas reais

    para o criador)

    Deciso correta

    k = cx

    Regio de rejeio para H0 Regio de aceitao para H0

    500 510

  • Denota-se por:

    = P (erro tipo I) = P (rejeitar H0/H0 verdadeira)

    = P (erro tipo II) = P (no rejeitar H0/H0 falsa)

    Assim, o tamanho da regio crtica exatamente a probabilidade de cometer o erro tipo I . Essa probabilidade tambm chamada de nvel de significncia

    do teste. O nvel de significncia do teste () , portanto, a probabilidade com

    que desejamos correr o risco de cometer o erro tipo I, ou seja, em % dos casos de rejeio de H0, estaremos tomando deciso errada.

    Escolhendo um valor para cx , pode-se determinar as probabilidades e de

    cometer cada tipo de erro. Mas, o procedimento que se usa na prtica para

    construir a regra de deciso fixar , a probabilidade do erro tipo I (rejeitar H0 quando ela for verdadeira). O valor arbitrrio e o resultado da amostra

    tanto mais significante para rejeitar H0 quanto menor for esse nvel.

    Geralmente, o valor fixado em 5%, 1% ou 0,1%.

    Por exemplo, fixemos em 5%, ou seja, P(erro I) = P( 0c H/xX

    verdadeira) = 5%, e vejamos qual a regra de deciso correspondente.

    Quando H0 verdadeira ( = 500 g), sabe-se do Teorema Limite Central, que

    X , a mdia de amostras de tamanho 50, ter distribuio aproximadamente

    ])50(n

    )g625(;)500([N

    22

    ou seja, )g5,12;g500(N 2 . Assim,

    %5)]g5,12;g500(N:X/xX[P)Ierro(P 2c

    %5]5,3

    500xZ[P]

    n

    xZ[P c0c

    65,1

    5,3

    500xc

    ou seja, g78,505500)65,1.5,3(kxc

  • Ento, RC = { X R/ X 505,78 g} e a regra de deciso : se x a RC,

    rejeita-se H0 e a concluso que a rao B superior A; se , no se rejeita H0, e a concluso que as raes so estatisticamente iguais.

    Convm observar que a RC sempre construda usando os valores

    hipotetizados por H0 ou seja, sob a hiptese H0 ser verdadeira.

    Com essa regra de deciso:

    = P(erro II) = P[ X < 505,78/ X : N(510 g, 12,3 g2)]

    = P [Z < 5,3

    51078,505 ] = P[Z < -1,21] = 11,31 %

    H uma relao inversa entre e , ou seja, se a probabilidade de um tipo de erro reduzida, aquela do outro tipo aumentada (Verifique na Figura 1). No

    caso da escolha de um valor para cx , por exemplo, 505 kg (o ponto mdio

    entre 500 e 510 kg), podem-se reduzir as probabilidades de ambos os tipos de

    erros, aumentando o tamanho da amostra (n). Este resultado tambm pode ser

    facilmente verificado a partir da Figura 1, considerando que, da transformao

    para a normal reduzida,

    n

    cc

    xz

    .

    A probabilidade com que o teste de significncia, com fixado, rejeita H0, quando o particular valor alternativo do parmetro verdadeiro, chamada

    poder do teste. O poder do teste um menos a probabilidade do erro tipo II

    ou seja, (1 - ). No exemplo, o poder do teste : 1 - = 1 0,1131 = 0,8869 (88,7%). Freqentemente, no entanto, no so especificados valores fixos para o

    parmetro em H1. Ento, sua caracterizao depender do grau de

    conhecimento que se tem do problema. A alternativa mais geral :

    H1: 0 (teste bilateral)

    Neste caso, a regra de deciso dever indicar dois pontos 1c

    x e 2c

    x , tais que,

    H1 ser sustentada se a mdia da amostra for muito grande ou muito pequena.

    Ento, a estrutura apropriada da regio de rejeio ou crtica (RC) :

    rejeita-se H0 se 2c1c xXouxX

  • Com esta regra de deciso, no podemos encontrar , consequentemente, no podemos controlar o erro tipo II, pois o valor do parmetro sob a hiptese

    alternativa no especificado.

    Voltando ao problema proposto, e testando

    H0: = 500 g vs. H1: 500 g

    tem-se, fixando = 5%,

    P(erro I) = P[ X 1cx ou X 2cx / X : N (500 g, 12,3 g2)] = 5%

    = P[Z -1,96 ou Z 1,96) = 5%

    5,3

    500x96,1 1c

    1,493x

    1c g

    5,3

    500x96,1 2c

    9,506x

    2c g

    Assim,

    RC = { X R/ X 493,1g ou X 506,9 g}

    A extenso para testes unilaterais das formas:

    H1: > 0 (teste unilateral direita) e

    H1: < 0 (teste unilateral esquerda), imediata.

    Exemplo 2. No caso da suinocultura, considerando a amostra de 50 leites

    (n = 50), aos quais foi fornecida a nova rao (B), deve-se ou no adotar essa

    /2 /2

    1cx 2cx

    RC RC

    0

  • rao, admitindo-se como resultado um ganho em peso mdio dirio de 504 g

    ( g504xa ), fixando = 5%?

    Soluo:

    H0: = 500 g

    H1: = 510 g

    g504xa n = 50 = 0,05 = 25 g

    n/

    xz 0cc

    1,65 =

    50/25

    500x c x c = 505,78 g

    RC = { X 505,78 g}

    Concluso:

    Como a

    x RC, no se rejeita H0 ao nvel de significncia de 5%, ou seja, a

    rao B no melhor do que a A. Portanto, a suinocultura no deve adot-la.

    Equivalentemente, os testes descritos podem ser baseados na estatstica:

    n/

    XZ 0

    , obtendo-se as regies crticas na distribuio N (0,1).

    Esta expresso corresponde seguinte frmula geral:

    parmetrodoestimativadapadroerro

    HpordohipotetizaparmetrodovalorparmetrodoestimativatesteaEstatstic 0

    ,

    que ser aplicada daqui em diante em testes de hipteses.

    Assim procedendo na resoluo do Exemplo 2, o valor observado da

    estatstica teste (Zobs) dado por:

    n/

    xz 0aobs

    =

    50/25

    500504 = 1,14

  • RC = {Z 1,65}

    Como zobs < zc, no se rejeita H0 ao nvel de 5%.

    3. Passos para a construo de um teste de hipteses

    Nos itens anteriores foram introduzidos os conceitos bsicos e as

    terminologias que so aplicados em testes de hipteses. Um sumrio dos

    principais passos que podem ser usados sistematicamente para qualquer teste

    de hipteses apresentado aqui, ou seja:

    (a) Fixe a hiptese H0 a ser testada e a alternativa H1; (b) Use a teoria estatstica e as informaes disponveis para decidir qual

    estatstica (estimador) ser usada para testar a hiptese H0, obtendo-se

    suas propriedades (distribuio, estimativa, erro padro);

    (c) Fixe a probabilidade de cometer o erro tipo I e use este valor para construir a RC (regio crtica). Lembre-se que a RC construda para a

    estatstica definida no passo (a), usando os valores hipotetizados por H0;

    (d) Use as informaes da amostra para calcular o valor da estatstica do teste; e

    (e) Se o valor da estatstica calculado com os dados da amostra no pertencer RC, no rejeite H0; caso contrrio, rejeite H0.

    4. Teste sobre a mdia de uma populao com varincia conhecida

    Descreveremos agora, de modo sucinto, os passos bsicos definidos na seo

    anterior, para testar a hiptese de que a mdia de uma populao igual a

    um nmero fixado 0, supondo que a populao tem distribuio normal, cuja

    varincia (2), embora seja uma condio irreal, conhecida.

    = 5%

    zc = 1,65 0 Z

    RC

  • 4.1 . Hiptese simples vs. alternativa simples

    (a) Teste unilateral direita

    H0 : = 0

    H1 : = 1 (1 > 0)

    Com fixado,

    RC = { X R/ X x c}, onde: x c obtido a partir de n/

    xz 0cc

    ,

    sendo zc: N(0,1), tal que P(Z zc) =

    Equivalentemente,

    RC = {Z zc}, onde: n/

    XZ 0

    (b) Teste unilateral esquerda

    H0 : = 0 H1 : = 1 (1 < 0)

    0

    xc

    x

    0 zc Z

    xx

    0 x c

  • RC = {Z - zc }

    4.2. Hiptese simples vs. alternativa composta

    (i) H0 : = 0 RC idntica de (a) H1 : > 0

    (ii) H0 : = 0

    RC idntica de (b) H1 : < 0

    (iii) H0 : = 0

    H1 : 0

    Teste bilateral da forma:

    RC = {Z zc ou Z - zc}

    Exemplo 3. Usando os dados do Exemplo 1, testar a hiptese de = 500 g

    contra a hiptese alternativa 500 g, ao nvel de significncia de 5%.

    Soluo:

    -zc Z

    /2 /2 1 -

    -zc zc Z

  • H0: = 500 g g504x a = 5%

    H1: 500 g

    RC = {Z 1,96 ou Z - 1,96} n/

    xz 0aobs

    =

    50/25

    500504 = 1,14

    Concluso:

    Como zobs RC, no se rejeita H0 ao nvel de 5%, ou seja, a rao B no estatisticamente melhor do que a A.

    5. Probabilidade de significncia (valor-p)

    Existem duas opes para expressar a concluso final de um teste de

    hipteses:

    - Comparar, como descrito anteriormente, o valor da estatstica teste com o

    valor obtido a partir da distribuio terica, especfica para o teste, para um

    valor pr-fixado do nvel de significncia )( ;

    - Quantificar a chance do que foi observado ou resultados mais extremos, sob

    a hiptese nula (H0) ser verdadeira. Essa opo baseia-se na probabilidade de

    ocorrncia de valores iguais ou superiores ao assumido pela estatstica teste,

    dado que a hiptese H0 verdadeira. Este nmero chamado de probabilidade

    de significncia ou valor-p e freqentemente indicado apenas por p.

    Obs. Valor-p e nvel de significncia )( no so sinnimos. O valor-p

    sempre obtido de uma amostra, enquanto o nvel de significncia geralmente

    fixado antes da coleta dos dados.

    Definio: valor-p, tambm denotado como nvel descritivo do teste, o nome

    que se d probabilidade de se observar um resultado to ou mais extremo

    que o da amostra, supondo que a hiptese nula seja verdadeira. No caso de um

    teste de hipteses no qual o valor da estatstica teste Zobs, o valor-p dado

    por:

    p = P(Z Zobs| H0).

    Em outras palavras, o valor-p corresponde ao menor nvel de significncia que

    pode ser assumido para rejeitar a hiptese nula. Dizemos ento que h

  • significncia estatstica quando o valor-p menor que o nvel de significncia

    adotado )( .

    Para exemplificar a definio de valor-p, consideremos primeiro o caso de um

    teste de hipteses monocaudal para a mdia. Vide Exemplo 2, onde 05,0 e

    Zobs = 1,14. Assim,

    p = P(Z Zobs) = P(Z 1,14) = 0,12714

    Portanto, podemos concluir que, para qualquer nvel de significncia maior

    que 0,12714, temos evidncias para rejeitar a hiptese nula. Observe que o

    valor-p maior que o nvel de significncia proposto )p( , assim, como

    concludo, no rejeitamos a hiptese nula (H0: = 500 g). Alm disso, quanto maior (ou menor) for o valor-p, mais prximo (ou distante) estamos da hiptese nula (H0). Do que se deduz que o valor-p tem mais informaes sobre

    a evidncia contra hiptese H0 e deste modo o experimentador tem mais

    informaes para decidir sobre ela, com o nvel de significncia apropriado.

    Ao contrrio, se o valor-p for menor que o nvel de significncia proposto

    )p( , rejeita-se H0.

    Considerando agora o teste para a mdia como bicaudal (vide Exemplo 3),

    segue que o valor-p dado por:

    p = P(Z Zobs) + P(Z -Zobs) = P(Z 1,14) + P(Z -1,14) = 0,2542

    donde podemos concluir que, para qualquer nvel de significncia menor que

    0,2542, temos evidncias, como no caso do exemplo, para no rejeitar a

    hiptese nula.

    Em geral, os resultados podem ser interpretados como:

    Valor-p prximo de 0 - Um indicador de que a hiptese nula falsa.

    Valor-p prximo de 1 - No h evidncia suficiente para rejeitar a hiptese

    nula.

    Normalmente considera-se um valor-p de 0,05 como o patamar para avaliar a

    hiptese nula (H0). Se o valor-p for inferior a 0,05 podemos rejeitar H0. Em

    caso contrrio, no temos evidncia que nos permita rejeit-la (o que no

    significa automaticamente que seja verdadeira). Em situaes de maior

    exigncia usado um valor-p inferior a 0,05.

    Na maioria dos softwares, a significncia estatstica expressa pelo nvel

    descritivo (valor-p).

  • 6. Teste para proporo

    Considere uma populao e uma hiptese sobre uma proporo p dessa

    populao:

    H0 : p = p0

    O problema fornece informaes sobre H1, que pode ser:

    (a) H1 : p = p1 p1 > p0 (teste monocaudal direita)

    (b) H1 : p = p1 p1 < p0 (teste monocaudal esquerda)

    (c) H1 : p > p0 (teste monocaudal direita)

    (d) H1 : p < p0 (teste monocaudal esquerda)

    (e) H1 : p p0 (teste bicaudal)

    Quando n (tamanho da amostra) grande,

    n/)p1(p

    ppZ

    ~ N(0,1)

    onde: p a proporo da amostra

    Sob H0 verdadeira,

    n/)p1(p

    ppZ

    00

    0

    ~ N(0,1)

    e para todas as formas de H1

    n/)p1(p

    ppz

    00

    0obs

    ~ N (0,1)

    As regies crticas so idnticas s mostradas em (3) e os valores de zc,

    fixando-se , so obtidos na distribuio N (0,1).

    Exemplo 4. Um laboratrio de vacinas contra febre aftosa reinvidicou que ela

    imuniza 90% dos animais. Em uma amostra de 200 animais, nos quais foram

  • aplicados a vacina, 160 foram imunizados. Verificar se a declarao do

    fabricante verdadeira ao nvel de 5%.

    Soluo:

    H0 : p = 0,90 (p0)

    H1 : p < 0,90

    n = 200 200

    160p = 0,80 = 0,05

    n/)p1(p

    ppz

    00

    0obs

    =

    200/)10,0.90,0(

    90,080,0 = - 4,72

    RC = {Z -1,65}

    Deciso :

    Como zobs < zc, rejeita-se H0 ao nvel de 5%, ou seja, a proporo de

    imunizao menor do que 90%.

    Concluso:

    A declarao do laboratrio falsa ao nvel de 5%.

    7. Teste para a mdia de uma populao N( , 2), 2 desconhecido

    Hipteses:

    H0: = 0

    H1: 0 [ ou > 0 ou < 0 ], onde 0 um valor conhecido.

  • Estatstica teste: Neste caso, a exemplo do que foi feito na construo de

    intervalos de confiana, a estatstica a ser usada para testar a hiptese H0 :

    t = n/s

    X0

    que tem distribuio t de Student com n 1 graus de liberdade (tn-1).

    Regio crtica: Fixado , a regio crtica (RC) :

    1n,2/1n1n,2/1n ttoutt:RC

    ou 1n,2/1n tt:RC .

    Os valores de t/2, n-1 podem ser obtidos na Tabela 4, apresentada no captulo

    anterior.

    Resultado da amostra: Colhida uma amostra aleatria de tamanho n, calculada

    sua mdia )x( a e desvio padro ),s( a calcula-se:

    tobs = n/s

    x

    a

    0a

    Anlise do resultado: Se tobs RC, rejeita-se H0; caso contrrio, no se rejeita

    Esse teste chamado teste t de Student ou, simplesmente, teste t.

    Se n for grande (n 30), x , como j visto, pode ser tratada como uma varivel

    aproximadamente normal ),(N n2 , em virtude da aplicao do teorema limite

    central. Alm disso, pode ser substitudo por s sem afetar consideravelmente a

    distribuio. Assim, um teste aproximado de H0: = 0 pode ser executado usando-se a estatstica Z, consultando a tabela normal para a regio de rejeio.

    Exemplo 5. As especificaes de uma dada droga veterinria exigem 23,2g de

    lcool etlico. Uma amostra de 10 anlises do produto apresentou um teor

    mdio de lcool de 23,5g com desvio padro de 0,24g. Pode-se concluir ao

    nvel de significncia de 1% que o produto satisfaz as condies exigidas

    ( 23,2g)?

  • Soluo:

    H0: = 23,2 g

    H1: 23,2 g

    = 0,01 g523xa , sa = 0,24 n = 10

    Consultando a Tabela 4, tc(0,01; 9) = 3,25, de modo que

    RC = t > -3,25 ou t > 3,25

    953g223g523

    n

    s

    xt

    10240

    a

    0aobs ,

    ,,

    ,

    Concluso: como tobs RC, rejeita-se H0 ao nvel de 1%, ou seja, o teste indica que o produto no satisfaz as condies exigidas.