capítulo sobre testes de hipóteses - estatística

Upload: rgalate

Post on 04-Mar-2016

224 views

Category:

Documents


4 download

DESCRIPTION

Capítulo sobre teste de hipótese utilizado na matéria de estatística ministrada.

TRANSCRIPT

  • INFERNCIA ESTATSTICA

    ___________________________________________________________________ ISEL DEETC

    1

    3. TESTES DE HIPTESES

    3.1 INTRODUO Os testes de hiptese so uma metodologia de inferncia estatstica diferente da

    que foi abordada na estimao de parmetros (estimao pontual e por

    intervalos). Trata-se de um processo estatstico que, a partir de dados amostrais,

    permite obter uma de duas respostas (afirmativa ou negativa), sobre uma

    determinada conjectura previamente realizada sobre a populao (nos testes de

    hipteses paramtricos essa conjectura sobre os parmetros da populao).1

    Ao realizar um teste de hipteses o objectivo validar ou no determinadas

    hipteses sobre a populao, com base na informao amostral. No caso

    particular dos testes de hipteses paramtricos, a validao diz respeito aos

    parmetros da populao.

    Em diversas reas da cincia, colocam-se questes inerentes s quais esto

    opes alternativas. A deciso, qualquer que ela seja, comporta um risco, o risco

    de errar. A metodologia de realizao dum teste de hipteses permite controlar

    e at minimizar o risco de errar. Vejamos o seguinte exemplo:

    Exemplo 3.1: O director de uma loja dos CTT dimensionou o nmero de balces

    de atendimento de modo a garantir que o tempo mdio de espera por cliente

    no ultrapassa-se cinco minutos. No entanto, a zona urbana em que a loja est

    inserida tem crescido e o director tem dvidas se na realidade os clientes

    continuam em mdia a esperar no mximo cinco minutos. Caso verifique que

    esperam mais tempo, o director ir proceder abertura de um novo balco.

    1 Existem os testes de hiptese no paramtricos que se utilizam quando os pressupostos de utilizao dos testes paramtricos no se verificam. Por exemplo, no caso de populaes no normais e amostras de pequena dimenso os testes no paramtricos so uma opo possvel. Tambm no caso dos dados estarem na escala de intervalos ou rcios e no terem distribuio especificada, ou sendo esta conhecida a menos de um nmero infinito de parmetros desconhecidos e tambm quando os dados esto na escala nominal ou ordinal.

    INFERNCIA ESTATSTICA

    ___________________________________________________________________ ISEL DEETC

    2

    Assim, pretende avaliar a necessidade de investir num novo balco, recorrendo

    a uma amostra que permita estimar a verdadeira mdia do tempo de espera por

    cliente.

    A hiptese que se pretende testar designada por hiptese nula (a designao

    de nula, indica que se trata de uma hiptese que no difere da situao real).

    Neste exemplo, a hiptese nula, 0H , revela a informao detida pelo director at

    ao momento (o tempo mdio de espera inferior ou no mximo igual a 5

    minutos). A hiptese alternativa, aH , coloca-se em contraposio hiptese

    nula: caso o tempo mdio de espera no verifique a condio definida em 0H ,

    ento a alternativa que este seja superior a 5 minutos. A observao de uma

    amostra vai fornecer informao que torna possvel a deciso por uma das duas

    hipteses. Se a amostra for favorvel hiptese nula, decide-se no rejeitar 0H ,

    o que, neste caso, corresponde a decidir no abrir um novo balco de

    atendimento. Caso a amostra contenha evidncia factual no favorvel a 0H ,

    rejeitamos esta hiptese, o que quer dizer que estamos a optar pela hiptese

    alternativa - vamos decidir abrir um novo balco para fazer face ao aumento

    indesejado do tempo mdio de espera por cliente. Mas no esqueamos que a

    inferncia probabilstica, o que nos obriga a considerar o risco de tomar

    decises erradas. De facto, dependendo da situao realmente verdadeira,

    assim a deciso de abrir/no abrir um novo balco pode estar errada.

    3.2 HIPTESES E DECISES

    Uma hiptese estatstica uma conjectura que caracteriza a distribuio duma

    ou mais populaes. Num teste estatstico temos duas hipteses em alternativa,

    relativas a um parmetro desconhecido da populao:

    0H : Hiptese nula

    aH : Hiptese alternativa

  • INFERNCIA ESTATSTICA

    ___________________________________________________________________ ISEL DEETC

    3

    A hiptese nula geralmente aquela que revela a informao que detemos no

    momento em que se decide realizar o teste estatstico. O teste servir para se

    concluir se a conjectura dada pela hiptese nula ou no correcta. A hiptese

    nula considerada verdadeira ao longo do procedimento do teste, at ao

    momento em que haja evidncia estatstica clara apontando em sentido

    contrrio.

    A hiptese nula:

    reflecte a situao em que no h mudana (pode ser resultado de uma experincia passada);

    o que se aceita por defeito;

    contm sempre uma igualdade e deve ser formulada por forma a ser possvel conhecer a distribuio da estatstica amostral a utilizar

    (designada por estatstica de teste), no pressuposto de que 0H

    verdadeira.

    Voltando ao exemplo dos CTT, s ser aberto um novo balco se a amostra

    evidenciar essa necessidade, at l damos crdito hiptese nula.

    A hiptese alternativa a hiptese que contm a informao relativa dvida

    que suscitou a realizao do teste. Vai reflectir o conjunto de valores que o

    parmetro poder assumir, caso a hiptese nula seja rejeitada. Contm sempre

    uma desigualdade (>, ; unilateral esquerdo quando aH tiver a desigualdade

    A Deciso

    Num teste de hipteses o objectivo o de tomar uma deciso, em consequncia

    da existncia de razes para rejeitar ou no a hiptese nula. Esta deciso

    baseada na informao disponvel, obtida a partir da amostra recolhida da

    populao. No caso de se rejeitar 0H , aceita-se como vlida a hiptese

    alternativa.

    3.3 ERROS NOS TESTES DE HIPTESES

    A uma deciso (rejeitar ou no 0H ) est sempre associado um risco, o risco de

    tomar uma deciso errada. No caso dos testes de hipteses a tomada de deciso,

    para a populao, baseada na informao amostral, pelo que se podem

    cometer erros. Uma caracterstica favorvel dos testes de hipteses a

    possibilidade de controlar ou minimizar o risco associado s decises erradas.

    Vamos supor que o parmetro populacional a testar . Para nos referirmos ao domnio do parmetro proposto pela hiptese nula utilizamos 0 e pela hiptese alternativa a . Na figura 3.1 apresentam-se, de modo resumido, as situaes possveis relativas tomada de deciso, quando se realiza um teste de

    hipteses.

  • INFERNCIA ESTATSTICA

    ___________________________________________________________________ ISEL DEETC

    5

    Tipos de erros associados deciso tomada

    Situao Real Deciso

    0H verdadeira 0H falsa

    Rejeitar 0H Deciso incorrecta

    P (rejeitar 0H | 0H verdadeira) Erro Tipo I

    Deciso correcta P (Rejeitar 0H | 0H falsa) = 1-

    No rejeitar 0H

    Deciso correcta P (No rejeitar 0H | 0H verdadeira)>

    1

    Deciso incorrecta P (No rejeitar 0H | 0H falsa) =

    Erro Tipo II

    Erro do Tipo I ou erro de 1 espcie

    O erro de Tipo I ocorre quando se decide rejeitar 0H , sendo 0H verdadeira, ou

    seja, rejeita-se indevidamente a hiptese nula. A probabilidade de ocorrncia do

    erro de Tipo I chama-se nvel de significncia do teste e representa-se por . [ ] [ ]Errode ipo I rejeitar | verdadeirao oP T P H H =

    Ao fixarmos o valor mximo de , estamos a limitar os custos incorridos ao poder tomar a deciso errada associada a este tipo de erro.

    Erro do Tipo II ou erro de 2 espcie

    O erro de Tipo II ocorre quando se decide no rejeitar 0H , sendo 0H falsa. A

    probabilidade de ocorrncia do erro de Tipo II representa-se por . Se 0H falsa, o verdadeiro valor do parmetro ser compatvel com a hiptese alternativa e

    como tal o valor de calculado em funo dos valores ( a ) que o parmetro toma, segundo a hiptese alternativa.

    [ ] [ ] [ ]( ) Errode tipoII no rejeitar | falsa no rejeitar |a o o o aP P H H P H = = = = O valor desta probabilidade diminui medida que o verdadeiro valor do

    parmetro , neste caso a se afasta de 0 . Voltando ao exemplo, vamos ver o significado dos erros possveis. Recordemos

    as hipteses a testar:

    0 : 5H : 5aH >

    INFERNCIA ESTATSTICA

    ___________________________________________________________________ ISEL DEETC

    6

    Erro de Tipo I: Decide-se abrir um novo balco, no entanto a realidade no o

    justifica.

    Erro de Tipo II: No se abre um novo balco, mantm-se tudo como est e no

    entanto as pessoas esperam em mdia mais do que cinco minutos. Deveria ter-

    se decidido abrir um novo balco.

    importante notar que, em geral, se atribui mais importncia ao erro de Tipo I,

    uma vez que em 0H que acreditamos, at que exista evidncia estatstica em

    contrrio. Rejeitar a hiptese nula como abandonar um hbito, e

    consequentemente a possibilidade de cometer um erro do Tipo I (rejeitar 0H

    incorrectamente) encarada com preocupao. Consideramos mais grave abrir

    um novo balco de forma injustificada (fazer um investimento desnecessrio),

    do que no realizar o investimento quando o deveramos ter feito.

    Potncia do Teste A potncia do teste, 1 = , com 0 1< < , a probabilidade ou risco de rejeitar a hiptese nula 0H , quando esta falsa, decidindo de forma acertada.

    [ ] [ ]( ) 1 ( ) rejeitar | falsa rejeitar |a a o o o aP H H P H = = = = . Quanto mais prximo a estiver de 0 , menos potente o teste, pois esta proximidade dificulta a distino entre os verdadeiros e os falsos valores.

    3.4 ESTATSTICA DE TESTE E REGIES CRTICAS A Estatstica de Teste uma funo das observaes amostrais cujo valor vai

    determinar a deciso a tomar, rejeitar ou no 0H . A estatstica de teste tem que

    ter distribuio conhecida, quando a hiptese nula verdadeira, e o seu valor

    calculado nesse pressuposto.

  • INFERNCIA ESTATSTICA

    ___________________________________________________________________ ISEL DEETC

    7

    Regra de Deciso Estatstica uma regra que nos indica a deciso a tomar (rejeitar ou no 0H ), a partir da

    comparao do valor da estatstica de teste com um ou mais valores crticos

    (ser um valor critico para os testes unilaterais e dois para os testes bilaterais).

    Regio crtica ou de rejeio (R.C. ou R.R.)

    constituda por um conjunto de valores tomados pela estatstica de teste, que

    conduzem rejeio da hiptese nula.

    Regio de aceitao (R.A.)

    constituda por um conjunto de valores tomados pela estatstica de teste, que

    conduzem no rejeio da hiptese nula.

    Valor de prova - p ou p-value

    O valor de prova, p, define-se como o menor nvel de significncia, , a partir do qual se rejeita a hiptese nula. Calcular o valor de prova p, calcular a

    probabilidade do erro de 1 espcie, correspondente a rejeitar a hiptese nula

    para a amostra observada, ou seja, para o valor da estatstica de teste que foi

    observado. Fixado o nvel de significncia , a deciso de rejeitar a hiptese nula verifica-se se e s se p .

    3.5 METODOLOGIA A metodologia a utilizar na realizao de um teste de hipteses, envolve as

    seguintes etapas:

    1) Formulao das hipteses 0H e aH ;

    Consoante as hipteses formuladas, identificar o teste como:

    Unilateral direito, quando aH contiver a desigualdade>;

    Unilateral esquerdo quando aH contiver a desigualdade

  • INFERNCIA ESTATSTICA

    ___________________________________________________________________ ISEL DEETC

    9

    Para que seja mais acessvel entender como se realiza um teste de hipteses,

    vamos comear por dar um exemplo que retrata o caso mais simples A

    populao tem distribuio normal de parmetros e . A partir da populao que se caracteriza por ( , )X N , obteve-se uma amostra aleatria de dimenso n, composta por variveis i.i.d. 1,..., nX X , da qual se obtm uma

    realizao concreta, 1( ,..., )nx x .

    Exemplo 3.2: Uma empresa apresentou uma nova mquina para

    empacotamento automtico de bolachas e divulgou que garantia o

    empacotamento de uma mdia de 60 pacotes por minuto, com um desvio

    padro de 3 pacotes. O nmero de pacotes embalados por minuto segue uma

    distribuio aproximadamente normal.

    Uma fbrica de bolachas ps a mquina experincia nas suas instalaes e,

    registando o nmero de pacotes embalados em 25 perodos de um minuto,

    constatou uma mdia de 58 pacotes embalados.

    O comprador potencial diz que a mquina no garante atingir a mdia de 60

    pacotes por minuto. Por seu lado, o vendedor garante que a diferena

    encontrada se deve apenas ao acaso e que de modo nenhum pe em causa a

    mdia publicitada.

    1) Formulao das hipteses;

    : 60oH = vs : 60aH <

    Pretende-se verificar se a diferena encontrada mesmo devido ao acaso, isto ,

    se no h evidncia estatstica para rejeitar a hiptese de que a mdia seja igual

    a 60. A hiptese nula reflecte a posio do vendedor. At prova em contrrio, o

    comprador deposita confiana na informao dada pelo vendedor. A

    metodologia do teste procurar validar oH . Se a evidncia da amostra fornecer

    informao (mdia amostral) significativamente inferior a 60, ento rejeita-se

    oH .

    A hiptese alternativa consistir naquilo que se considera razovel aceitar, no

    INFERNCIA ESTATSTICA

    ___________________________________________________________________ ISEL DEETC

    10

    caso de rejeitar oH . A hiptese alternativa reflecte a posio do comprador.

    2) Fixar o nvel de significncia do teste;

    Nvel de significncia do teste: 0,05 = (valor fixado partida) Na ausncia de informao sobre o valor de , os valores geralmente utilizados so 5%, 2,5% e 1%.

    3) Escolha da estatstica de teste e identificao da respectiva distribuio

    amostral;

    Neste caso estamos a realizar inferncia sobre a mdia populacional , numa populao com distribuio normal, com desvio padro conhecido. Recordando

    as distribuies amostrais abordadas, sabemos que a estatstica amostral a

    utilizar para inferir sobre o parmetro populacional a mdia amostral, X . Na condio da hiptese nula ser verdadeira, sabemos tambm que a

    distribuio amostral da estatstica :

    0,X N n o que, procedendo estandardizao equivalente a

    ( )0 0,1XZ Nn

    = .

    Atendendo aos dados fornecidos neste exemplo, e considerando verdadeira a

    hiptese nula, temos 360,5

    X N . Por outro lado, o valor observado de X , para a amostra dada 58x = . O que se pretende averiguar se de facto o valor mdio da amostra de 58

    pacotes por minuto compatvel com a veracidade da hiptese nula.

    Como a hiptese alternativa, : 60aH < , aponta para valores que se encontram esquerda do valor dado pela hiptese nula, tendo fixado a probabilidade de

    rejeitar indevidamente 0H em 0,05 (nvel de significncia de 5%), a regio crtica

    vai situar-se na aba esquerda.

    4) Determinar a regio de rejeio de acordo com o valor fixado para , e definir a regra de deciso;

  • INFERNCIA ESTATSTICA

    ___________________________________________________________________ ISEL DEETC

    11

    A regra de deciso consiste em definir a aco a tomar (rejeio ou no da

    hiptese nula) face ao resultado da amostra. Vamos determinar duas regies

    complementares: regio crtica ou de rejeio e regio de no rejeio ou de

    aceitao.

    Com ( )0 0,1XZ Nn

    = , por consulta da tabela da funo de distribuio da

    Normal reduzida, obtemos o valor de z para o qual a probabilidade acumulada

    igual a 0,05, ou seja, por inverso:

    1 1 1(0,05) (1 0,05) (0,95) 1,645 = = = , logo 0,05 1,645.z =

    Na figura 3.1 identificamos a tracejado a regio crtica deste teste unilateral

    esquerdo.

    Temos assim . . :] , 1,645] e . . :] 1,645, [RR R A + .

    Figura 3.1

    A deciso tem origem na comparao do valor da estatstica de teste (o valor da

    abcissa dado por 0x

    n

    ) com o quantil da funo de distribuio da normal

    reduzida. Vamos rejeitar a hiptese nula se o valor observado da estatstica de

    teste pertencer regio crtica. O facto de utilizarmos o valor da abcissa

    estandardizada facilita, dado assim ser possvel consultar os valores crticos da

    tabela da distribuio normal.

    Regra de deciso em funo da varivel Z:

    Se z -1.645, rejeitar 0H

    densidade da (0,1)N

    INFERNCIA ESTATSTICA

    ___________________________________________________________________ ISEL DEETC

    12

    Se z > -1.645, no rejeitar 0H

    Com os dados deste exemplo obtemos o valor observado da estatstica de teste: = = < 58 60 3,333 1,645

    3 / 5obsZ , pelo que se decide rejeitar 0H , dado que o

    valor observado pertence regio critica. Na tomada de deciso, em alternativa ao processo anterior, podemos definir a

    regra de deciso em funo de X , determinando o valor crtico cx , que por

    comparao com o valor observado de X , permite tomar a deciso de rejeitar

    ou no a hiptese nula.

    Regra de deciso em funo da mdia amostral X : Na figura 3.2 apresenta-se esquerda a regio crtica (a tracejado) e direita a

    regio de aceitao, agora em funo do valor crtico cx .

    Figura 3.2

    Vamos ver como proceder para calcular cx : Fixar o nvel de significncia em 5% ( 0,05 = ), quer dizer que a probabilidade de rejeitar a hiptese nula quando ela verdadeira de 0,05.

    [ ]0 0 0

    10

    rejeitar | verdadeira 0,05 | 60 0,05

    60 60 600,05 0,05 (0,05)0,6 0,6 0,6

    60 1,645 59,01.0,6

    c

    c c c

    cc

    P H H P X x

    X x x xP P Z

    nx x

    = = = = = = = = =

    Com x o valor observado de X , temos as seguintes possibilidades: - se x 59.01, deve rejeitar-se 0H ;

  • INFERNCIA ESTATSTICA

    ___________________________________________________________________ ISEL DEETC

    13

    - se x > 59.01, no se deve rejeitar 0H . O valor fornecido pela amostra, x = 58 = = = > = = =

    Com 0,05 = , a potncia do teste, para este valor da hiptese alternativa ser dada por:

    0 0[rejeitar | falsa] 1 0,493 0,507.P H H = = Se 58a = temos:

    0( 58) [norejeitar | 58] [ 59,01| 58]

    59,01 58 1 ( 1,683) 1 (1,683) 1 0,953 0,046.0,6

    a a a

    a

    P H P X

    XP P Z

    n

    = = = = > = = = > = = = =

    Com 0,05 = , a potncia do teste, para este valor da hiptese alternativa ser o completar desta probabilidade, ou seja:

    0 0[rejeitar | falsa] 1 0,0462 0,9538.P H H = = Se 57a = temos:

  • INFERNCIA ESTATSTICA

    ___________________________________________________________________ ISEL DEETC

    15

    0( 57) [norejeitar | 57] [ 59,01| 57]

    59,01 57 1 ( 3,35) 1 (3,35) 0,0004.0,6

    a a a

    a

    P H P X

    XP P Z

    n

    = = = = > = = = > = = =

    A potncia do teste vai por consequncia aumentar. Para este valor da hiptese

    alternativa temos:

    0 0[rejeitar | falsa] 1 0,0004 0,9996.P H H = =

    Concluses para o teste unilateral esquerdo:

    Verifica-se que o valor de diminuiu medida que o verdadeiro valor de se afasta de 0 . Realmente torna-se mais difcil errar medida que o valor verdadeiro do parmetro se afasta do valor proposto pela hiptese nula.

    Ao contrrio do que foi observado para , quanto mais prximo do valor de 0 estiver o valor de a , menos potente o teste, o que quer dizer que tem

    menos capacidade para decidir de modo acertado.

    Nota: Se realizarmos este tipo de estudo para um teste unilateral direito ou para um

    teste bilateral constatamos que o tipo de hiptese alternativa condiciona a forma

    da funo potncia.

    3.7 TESTES DE HIPTESE PARA UMA POPULAO

    Vamos agora apresentar e caracterizar os testes de hiptese para um parmetro

    de uma populao. A estatstica de teste que vamos utilizar e a sua distribuio amostral depende da distribuio da populao, do conhecimento

    ou no do parmetro de escala e da dimenso da amostra.

    3.7.1 Teste de Hiptese para a mdia

    Vamos supor uma populao a partir da qual se obteve uma amostra aleatria

    INFERNCIA ESTATSTICA

    ___________________________________________________________________ ISEL DEETC

    16

    de dimenso n, composta por variveis i.i.d. 1,..., nX X , da qual resultou uma

    realizao concreta 1( ,..., )nx x . Pretende-se realizar um teste de hipteses para a

    mdia da populao .

    Se a varincia for conhecida (caso do exemplo tratado), e a distribuio da

    populao normal, a estatstica de teste a utilizar :

    ( )0 0,1XZ Nn

    =

    (Note-se que neste caso a estatstica de teste e a sua distribuio independente da dimenso

    amostral.)

    Se a distribuio da populao no for conhecida, com a varincia conhecida e

    a amostra grande, 30n > , a estatstica de teste a utilizar :

    ( )0 0,1XZ Nn

    = (esta distribuio amostral um resultado do Teorema do

    Limite Central)

    Apresentam-se esquematicamente na figura 3.3 as regies crticas, definidas em

    termos da varivel Z, para o teste de hipteses para a mdia, 0 0:H = , considerando os trs tipos de teste: bilateral e unilateral direito e esquerdo.

    Tipo de Teste aH : 0 Bilateral

    aH : 0 > Unilateral direito

    aH : 0 < Unilateral esquerdo

    Teste Z Quando a estatstica de teste tem distribuio exacta ou aproximadamente normal reduzida.

    Figura 3.3

    Se a varincia for desconhecida, que o caso que mais prximo est da

  • INFERNCIA ESTATSTICA

    ___________________________________________________________________ ISEL DEETC

    17

    realidade, teremos de estimar o desvio padro da populao pois necessitamos

    dele para calcular o valor do desvio padro do estimador X . Um processo

    bastante intuitivo ser utilizar como estimador de 2 , no caso de amostras pequenas, a varincia amostral corrigida

    2 2 2

    2 2'1 1

    ( )

    1 1

    n n

    i ii i

    X X X nXS S

    n n= =

    = =

    e respectivo desvio padro amostral corrigido ' 2'S S= . No caso de amostras grandes utilizamos a varincia amostral

    2 2 2

    2 21 1

    ( )n n

    i ii i

    X X X nXS S

    n n= =

    = =

    e respectivo desvio padro amostral 2S S= .

    Neste caso a estatstica de teste que se utiliza, j no tem a mesma distribuio

    amostral, sob a veracidade da hiptese nula, ver Pestana, D. (2006). Temos

    agora uma outra varivel aleatria cuja distribuio amostral a T-Student,

    (Student 1908).

    Assim, para pequenas amostras ( 30n ), utiliza-se a estatstica de teste 0

    1,nXT tS

    n

    =

    e para amostras grandes, 30n > , utiliza-se a distribuio amostral limite da T-Student que aproximadamente normal,

    0 (0,1)XT NSn

    = .

    A figura 3.4 apresenta esquematicamente as regies crticas definidas em

    termos da varivel T, para o teste de hipteses mdia 0 0:H = , considerando os trs tipos de teste: bilateral e unilateral direito e esquerdo.

    INFERNCIA ESTATSTICA

    ___________________________________________________________________ ISEL DEETC

    18

    Tipo de Teste aH : 0

    Bilateral

    aH : 0 > Unilateral direito

    aH : 0 < Unilateral esquerdo

    Teste T Quando a estatstica de teste tem distribuio T-Student.

    Figura 3.4

    Exemplo 3.3: Teste de Hipteses para a mdia de uma populao normal com

    varincia desconhecida ( 30n ) Foram medidos em quilogramas os aumentos de peso (da nascena aos seis

    meses) de 7 crianas do sexo feminino escolhidas ao acaso entre um grupo de

    crianas com seis meses de idade.

    3,6 2,8 3,6 4,1 4,1 4,5 3,2

    (a) Ao nvel de significncia de 5%, poder dizer-se que o aumento mdio

    de peso superior a 3,1Kg?

    (b) A partir de que nvel de significncia a hiptese testada na alnea

    anterior rejeitada?

    (c) Calcula a potncia do teste para 3,4a = .

    Resoluo:

    Seja a varivel X : aumento de peso, em Kg, numa criana do sexo feminino

    com seis meses de idade.

    ( , ) 0,05X N = Sobre a amostra: 27 3,7 0,34 0,34 0,5831n x s s = = = = = (a) Vamos testar 0 : 3,1 : 3,1aH vs H > Trata-se de um teste unilateral direito

  • INFERNCIA ESTATSTICA

    ___________________________________________________________________ ISEL DEETC

    19

    Estatstica de teste: 0 1nXT tS

    n

    =

    Regio de aceitao (R.A.): 6;0,95] , [ ] ,1,943[t = Regio de rejeio ou crtica (R.R.): 6;0,95[ , [ [1,943, [t + = + Valor observado para a estatstica de teste no pressuposto da veracidade da

    hiptese nula: 3,7 3,1 2,7225 R.R.0,5831/ 7obs

    T = =

    Deve rejeitar-se a hiptese nula, ao nvel de significncia de 5%, o que quer

    dizer que a amostra contm evidncia estatstica de que o aumento mdio de

    peso nas crianas do sexo feminino com seis meses de idade de facto superior

    a 3,1Kg.

    (b) O que se pede o valor de prova p.

    ( ) ( 2,7225) 1 ( 2,7225) 1 0,9827 0,0173.obsP T T P T P T> = > = = =

    Para valores do nvel de significncia superiores a 1,73% a hiptese nula

    rejeitada, o que quer dizer que valor-p 0,0173.

    (c) 0 0(3,4) 1 (3,4) (rejeitar | ser falsa)P H H = = . Como o teste unilateral direito, rejeita-se a hiptese nula quando

    01;1

    0,58311,9432 1,9432 3,1 3,528/ 7obs n

    xT t x xs n

    > > > + > , logo

    3,528cx = , vindo para a potncia correspondente a 3,4a = , 3,528 3,4(3,4) ( 3,528 | 3,4) 1 ( ) 1 ( 0,580786) 1 0,2910,5831/ 7

    0,7087.

    aP X P T P T = > = = = = ==

    A potncia do teste de aproximadamente 71%, ou seja, de 71% a

    probabilidade de tomar uma deciso acertada, rejeitar a hiptese nula quando

    esta falsa.

    INFERNCIA ESTATSTICA

    ___________________________________________________________________ ISEL DEETC

    20

    3.7.2 Teste de Hiptese para a varincia Considerando uma populao normal podemos estar interessados em realizar

    um teste de hipteses varincia da populao. Sendo 2S um estimador no enviesado de 2 , e conhecida a distribuio amostral da estatstica

    22

    120

    ( 1).n

    n SQ = , esta a estatstica a utilizar.

    A figura 3.5 apresenta esquematicamente as regies crticas definidas em

    termos da varivel Q, para o teste de hipteses varincia 2 20 0:H = , considerando os trs tipos de teste: bilateral e unilateral direito e esquerdo.

    Tipo de Teste aH : 2 2

    0 Bilateral

    aH : 2 2

    0 > Unilateral direito

    aH : 2 2

    0 < Unilateral esquerdo

    Teste 2 Quando a estatstica de teste tem distribuio do Qui-quadrado.

    Figura 3.5

    Exemplo 3.4: Teste de Hipteses para a varincia

    Para verificar se um determinado aparelho de medio de alta preciso ainda

    funciona com as caractersticas exigidas foram observadas 20 medies e

    calculado o desvio padro amostral corrigido, = 0,013s mm . Admitindo que as referidas medies se podem considerar gaussianas, ao nvel de significncia de

    5%, poder-se- concluir que o verdadeiro desvio padro populacional de

    0,01mm?

    Resoluo:

    Seja a varivel X : medies efectuadas pelo aparelho em mm.

    ( , ) 0,05X N =

  • INFERNCIA ESTATSTICA

    ___________________________________________________________________ ISEL DEETC

    21

    Sobre a amostra: 20 0,013n s= = (a) Vamos testar 0 : 0,01 : 0,01aH vs H = Trata-se de um teste bilateral

    Estatstica de teste: 2

    212

    0

    ( 1).n

    n SQ =

    Regio de aceitao (R.A.): ]8,907,32,85[

    Regio crtica (R.R.): [0,8.907] [32.85, [ + , onde 2 219;0,025 19;0,9758,907 32,85e = = .

    Valor observado para a estatstica de teste no pressuposto da veracidade da

    hiptese nula: 2 2

    2 20

    ( 1). 0,01319 32,110,01obs

    n SQ = = =

    Como 32,11 se encontra na regio de aceitao, conclui-se ao nvel de

    significncia de 5%, que o verdadeiro desvio padro de 0,01 mm.

    Para calcular o valor de prova p, como temos um teste bilateral, procede-se da

    seguinte forma:

    { }0 0 0(rejeitar | verdadeira) ( . . | )

    2 min ( 32,11), ( 32,11) 2 min{0,9696;0,0304} 0,0607.obsp value P H H P Q RC

    P Q P Q = = = =

    = < > = =

    Para este teste a hiptese nula rejeitada para nveis de significncia superiores

    a 6,07%.

    3.7.3 Teste de Hiptese para a proporo Considerando agora uma populao de Bernoulli, a partir da qual se obteve

    uma amostra aleatria de dimenso grande (n> 30), composta por variveis

    i.i.d. 1,..., nX X , da qual resultou uma realizao concreta 1( ,..., )nx x . Pretende-se

    realizar um teste de hipteses para a mdia da populao, que neste caso a

    proporo populacional p, o parmetro da distribuio de Bernoulli que

    representa a probabilidade de sucesso numa prova de Bernoulli.

    Assim, para amostras grandes, a distribuio amostral do estimador de p,

    = X p ,

    INFERNCIA ESTATSTICA

    ___________________________________________________________________ ISEL DEETC

    22

    ( ) ( )0

    00 0

    0;1 .

    1p pZ Np p

    n

    =

    Como a estatstica de teste tem distribuio aproximadamente normal, temos

    um teste Z tal como se verificou no teste de hipteses para a mdia com

    varincia conhecida.

    A figura 3.6 apresenta esquematicamente as regies crticas definidas em

    termos da varivel Z, para o teste de hipteses proporo populacional,

    0 0:H p p= , considerando os trs tipos de teste: bilateral e unilateral direito e esquerdo.

    Tipo de Teste aH : 0p p Bilateral

    aH : 0p p> Unilateral direito

    aH : 0p p< Unilateral esquerdo

    Teste Z Quando a estatstica de teste tem distribuio exacta ou aproximadamente normal reduzida.

    Figura 3.6

    3.8 TESTES DE HIPTESE PARA DUAS POPULAES

    Vamos, no que se segue, apresentar o teste de hipteses a utilizar quando o

    objectivo comparar duas populaes.

    3.8.1 Teste de Hiptese para a diferena de duas mdias

    Vamos considerar duas populaes 1 2eX X , cujas mdias so respectivamente

    1 2e . Destas populaes so retiradas de forma aleatria duas amostras independentes de dimenso 1 2en n , cujas mdias amostrais so 1 2X e X

    respectivamente.

  • INFERNCIA ESTATSTICA

    ___________________________________________________________________ ISEL DEETC

    23

    Pretende-se realizar um teste de hipteses para comparar as duas mdias

    populacionais, portanto vamos realizar um teste relativo diferena 1 2 . As nossas hipteses, tendo em conta os trs tipos de teste so:

    0 1 2 0

    1 2 0

    1 2 0

    1 2 0

    :

    : teste bilateral

    teste unilateral direito

    teste unilateral esquerdo

    a

    H vs

    H

    = > 30 e n > 30 ),

    usam-se as varincias amostrais, e a estatstica

    ( ) ( ) ( )1 2 1 2 00 2 21 2

    1 2

    0;1X X

    Z NS Sn n

    =+

    ).

    Deve ter-se conscincia que frequentemente, as varincias 2 21 2e no so conhecidas. Nesse caso, temos de ter um teste que nos permita testar a

    igualdade das mdias populacionais sem conhecer os verdadeiros valores 2 21 2e . bastante mais simples desenvolver este teste, quando, embora

    desconhecidas, as varincias se podem admitir iguais (caso em que se diz existir

    homocedasticidade 2 2 21 2 = = ). No caso em que as varincias so desconhecidas, parece mais lgico

    primeiramente testar a igualdade das varincias e num segundo passo optar

    com racionalidade pela estatstica de teste mais favorvel para testar a hiptese

    nula de igualdade das mdias.

    3.8.2 Teste de Hiptese para a igualdade de duas varincias em Populaes

    Normais

    Vamos considerar duas populaes normais 1 2eX X , cujas mdias so

    respectivamente 1 2e . Destas populaes so retiradas de forma aleatria duas amostras independentes de dimenso 1 2en n , respectivamente. Vamos

    realizar um teste que permita comparar as duas varincias.

    Dado que conhecemos os estimadores amostrais das varincias populacionais 2 21 2e :

  • INFERNCIA ESTATSTICA

    ___________________________________________________________________ ISEL DEETC

    25

    1 1

    2 2

    2 2 21 1 1 1

    2 21 11 1

    1 1

    2 2 22 2 2 2

    2 21 12 2

    2 2

    ( )

    1 1

    ( )

    1 1

    n n

    i ii i

    n n

    i ii i

    X X X nXS S

    n n

    X X X nXS S

    n n

    = =

    = =

    = =

    = =

    bem como a distribuio amostral da estatstica 2

    12

    2

    SS , que sob a veracidade da

    hiptese nula vem:

    ( ) =

    2 21 2

    1 22 22 1 0

    1; 1SF F n nS

    .

    A figura 3.7 apresenta esquematicamente as regies crticas definidas em

    termos da varivel F, para o teste igualdade das varincias, 2 20 1 2:H = considerando os trs tipos de teste: bilateral e unilateral direito e esquerdo.

    Tipo de Teste aH :

    2 21 2 Bilateral aH :

    2 21 2 >

    Unilateral direito aH :

    2 21 2 <

    Unilateral esquerdo

    Teste F Quando a estatstica de teste tem distribuio F-Snedcor.

    Figura 3.7

    Exemplo 3.5: Teste de Hipteses para o quociente de duas varincias

    No primeiro ano de vida dois grupos aleatrios de crianas foram sujeitos a

    diferentes suplementos vitamnicos designados por suplemento A e suplemento

    B. Os dados que se seguem representam duas amostras dos ganhos de peso, em

    INFERNCIA ESTATSTICA

    ___________________________________________________________________ ISEL DEETC

    26

    Kg, dessas crianas.

    Sup. A 2,7 3,2 3,6 4,1 2,7 3,2 4,5 3,6 2,7

    Sup. B 4,1 4,5 3,6 2,7 3,6 3,2 4,1

    Supondo que as referidas crianas tinham nascena pesos idnticos e que os

    seus pesos se podem considerar normais, pretende-se:

    (a) Ao nvel de significncia de 5%, concluir se a variabilidade populacional

    dos dois grupos igual;

    (b) Determinar o valor de prova - p e a sua interpretao;

    Resoluo:

    (a) Considerem-se as variveis:

    1X : ganho em peso medido em Kg das crianas sujeitas ao suplemento A

    2X : ganho em peso medido em Kg das crianas sujeitas ao suplemento B

    1 1 1 2 2 2( , ) e ( , )X N X N Sobre as amostras temos:

    21 1 1

    22 2 2

    9 3,3667 0,4150

    7 3,6857 0,3714

    n x s

    n x s

    = = == = =

    Vamos testar as hipteses:

    = = 2 2

    2 2 2 2 1 10 1 1 1 2 0 2 2

    2 2

    : : : 1 : 1a aH vs H H vs H (temos um teste bilateral)

    Estatstica de teste:

    ( ) = = =

    2 2

    1 21 2 1 22 2

    2 1 0

    1; 1 , com 1 15 e 1 20SF F n n n nS

    Regio de aceitao (R.A.): ] [8;6;0,025 8;6;0,975] ; [ 0,215;5,6F F = Regio de rejeio (R.R.): 8;6;0,025 8;6;0,975[0; ] [ , [ [0;0,215] [5,6; [F F + = + Valor observado para a estatstica de teste no pressuposto da veracidade da

    hiptese nula: 00,4150 1 1,1173 R.A.0,3714bs

    F = =

  • INFERNCIA ESTATSTICA

    ___________________________________________________________________ ISEL DEETC

    27

    Como 1,1173 se encontra na regio de aceitao, conclui-se ao nvel de

    significncia de 5%, que a verdadeira variabilidade nos pesos no diferente

    quando se utiliza o suplemento A ou B.

    (b) valor de prova p:

    { }

    21

    0 0 22

    (rejeitar | verdadeira) ( . . | 1)

    2 min ( 1,1173);1 ( 1,1173) 2 min{0,5409;0,4591} 0,9181.

    obsp value P H H P F RC

    P F P F

    = = = =

    = < < = =

    A hiptese nula s rejeitada para nveis de significncia superiores a 91,81%.

    3.8.3 Teste de Hiptese para a igualdade de mdias em Populaes normais

    com varincias desconhecidas

    3.8.3.1 Varincias desconhecidas mas iguais 2 2 21 2 = = Vamos considerar duas populaes normais 1 2eX X , cujas mdias so

    respectivamente 1 2e . Destas populaes so retiradas de forma aleatria duas amostras independentes cujas mdias so 1 2X e X e as dimenses

    1 230 e 30n n , respectivamente. Pretende-se realizar um teste de hipteses para comparar as duas mdias

    populacionais, portanto vamos realizar um teste relativo diferena 1 2 . As nossas hipteses, tendo em conta os trs tipos de teste so:

    0 1 2 0

    1 2 0

    1 2 0

    1 2 0

    :

    : teste bilateral

    teste unilateral direito

    teste unilateral esquerdo

    a

    H vs

    H

    = >