inferência estatística: inferência básica introdução à ...edna/bionutri/nut-aula10.pdfa ps x...

20
Inferência Básica Inferência Estatística: decidindo na presença de incerteza Universidade Federal de Minas Gerais Instituto de Ciências Exatas Departamento de Estatística Aula 10 : Testes de Hipóteses para Duas Médias em Amostras Emparelhadas e Independentes Introdução à Bioestatística Turma Nutrição

Upload: others

Post on 30-Jan-2021

8 views

Category:

Documents


0 download

TRANSCRIPT

  • Inferência BásicaInferência Estatística: decidindo na presença de incerteza

    Universidade Federal de Minas Gerais

    Instituto de Ciências Exatas

    Departamento de Estatística

    Aula 10:

    Testes de Hipóteses para Duas Médias em

    Amostras Emparelhadas e Independentes

    Introdução à Bioestatística – Turma Nutrição

  • Comparação de Dois Grupos

    Comparação de duas drogas, dietas, terapias, etc...

    • Dois Novos Tratamentos

    • Tratamento Novo com um Tratamento Padrão

    • Tratamento com a Ausência de Tratamento

    • Antes e Depois do Tratamento.

    O melhor dentre dois tratamentos é aquele que:

    • produz melhores resultados para a maioria da população,

    ou seja, fornece os melhores resultados na média.

  • Tipos de Planejamento

    Amostras Independentes:

    Temos duas amostras separadas, uma de cada população:

    • Tratamento 1 é aos n1 indivíduos da primeira amostra;

    • Tratamento 2 é aos n2 indivíduos da segunda amostra.

    Amostras Dependentes (ou Emparelhadas ou Pareadas):

    A amostra é constituída de n pares de indivíduos:

    • Tratamento 1 é aplicado a um elemento do par;

    • Tratamento 2 é aplicado ao outro elemento do par.

  • Exemplo 1: amostras independentes

    Um clínico suspeita que o fato de a mãe ter menos de 20 anos

    de idade está associado com o nascimento de bebês com

    baixo peso ao nascer (< 2500 gramas).

    Ele selecionou aleatoriamente alguns registros de uma grande

    maternidade e os dividiu em dois grupos:

    Grupo 1: bebês de mães com menos de 20 anos e

    Grupo 2: bebês de mães com mais de 20 anos.

    Para cada bebê em cada grupo, observou a variável:

    X: peso ao nascer (em gramas).

  • Exemplo 2: amostra emparelhadas

    Para comparar dois tipos de colírio (A e B) quanto à variável

    “tempo para dilatar a pupila para o exame oftalmológico”,20 pacientes receberam um colírio em cada olho

    n = 20 pares cada paciente é um par: (Olho D ; Olho E).

    Par Colirio A

    Tempo

    Colírio B

    Tempo

    Diferenças

    d = x - y

    1 x1 y1 d1 = x1 - y12 x2 y2 d2 = x2 - y2M M M M

    20 xn yn dn = xn - yn

  • Exemplo 3: amostradas emparelhadas

    Um pesquisador deseja verificar se o Captopril reduz a pressão sanguínea.

    A PS X foi aferida antes e depois da aplicação da droga em 12 pacientes.

    Tratamento 1: Ausência da droga (“Antes”)

    Tratamento 2: Presença da droga (“Depois”)

    n = 12 pares cada paciente um par: (Xantes, Xdepois).

  • Consumo de chocolate amargo e redução na pressão arterial

    Taubert, D. et al. (2007) Effects of Low Habitual Cocoa Intake on Blood Pressure and Bioactive Nitric

    Oxide: A Randomized Controlled Trial, JAMA, July 4, 2007—Vol 298, No. 1

    44 adultos com

    hipertensão

    arterial leve

    Antes

    Depois

    18 semanas

    Antes

    Depois

    18 semanas

    22 - Chocolate

    amargo

    22 - Chocolate

    branco

    Exemplo 5: Múltiplos Planejamentos

    Amostras

    Pareadas

    Amostras

    Pareadas

    Amostras

    independentes

  • Comparação de Duas Médias em Amostras Emparelhadas

    Amostra com n pares de indivíduos:

    • Tratamento 1 é aplicado a um elemento do par (medida x)

    • Tratamento 2 é aplicado ao outro elemento do par (medida y)

    Par Tratamento 1

    x

    Tratamento 2

    Y

    Diferenças

    d = x - y

    1 x1 y1 d1 = x1 - y12 x2 y2 d2 = x2 - y2M M M M

    n xn yn dn = xn - yn

    Médias populacionais (desconhecidas): μ1 e μ2 , μd = μ1 - μ2

    Hipótese nula:

    H0: μ1 = μ2

    H0: μd = 0

    sd = desvio-padrão das diferenças d = média das diferenças

  • Hipótese Alternativa Valor-p

    H1: μ1 < μ2 H1: md < 0 P(T(gl) < Tobs )

    H1: μ1 > μ2 H1: md > 0 P(T(gl) > Tobs )

    H1: μ1 μ2 H1: md 0 2xP(T(gl) >|Tobs|)

    Comparação de Duas Médias em Amostras Emparelhadas

    Estatística de Teste:

    gl = n-1

    Hipótese nula: H0: μ1 = μ2 H0: μ1 - μ2 = 0 H0: μd = 0

    Rejeita-se a hipótese nula se valor-p < .

    ns

    dTd

    obs

    sd = desvio-padrão das diferenças

    d = média das diferenças

    n: número de pares na amostra

  • Pressão sistólica (mmHg) em 12 pacientes antes e depois do Captopril.

    O Captopril reduz a PS?

    H0: μAntes = μDepoisH1: μAntes > μDepois

    Valor-p = P(t11 > 6.4) < 0.0005.

    Rejeita H0 ao n.s de 1%.

    Conclui-se que o

    Captopril reduz a PS.

  • Exemplo: Capacidade Vital Forçada (litros) nas posições sentada e deitada.

    A medição da CVF se

    altera com a posição?

    H0: μSenta = μDeitaH1: μSenta μDeita

    Valor-p = 2P(t9 > 1,17) está entre 0.20 e 0.30.

    Não se rejeita H0 ao n.s de 5%.

    Conclui-se que não há diferença

    na medição da CVF entre as

    posições sentado e deitado.

    Valor-p > 0.05.

  • Consumo de chocolate amargo e

    redução na pressão arterial*

  • 2.9 0-8.50

    1.6 22obsT

    Grupo “chocolate amargo”

    Valor-p = 2.P(t21 > |-8.50|) < 2.(0.0005) ou seja, valor-p< 0.001.

    A pressão sistólica média antes e 18 semanas depois do consumo

    de chocolate amargo são diferentes.

    μ: média da pressão sistólica

    H0: μDepois – μAntes = 0

    H1: μDepois – μAntes ≠ 0

    = 0.05

    Rejeita H0 ao nível de significância de 5% (valor-p < 0.05).

  • 0.1 0 0.29

    1.6 22obsT

    Valor-p = 2.P(t21 > |0.29|) > 2.(0.30) ou seja, valor-p > 0.60.

    Grupo “chocolate “branco”

    μ: média da pressão sistólica

    H0: μDepois – μAntes = 0

    H1: μDepois – μAntes ≠ 0

    = 0.05

    A pressão sistólica média antes e 18 semanas depois do consumo

    de chocolate branco são iguais.

    Não se rejeita H0 ao nível de significância de 5% (valor-p > 0.05).

  • μ1 ≠ μ2

    σ1=σ2=σ

    Comparação de duas Médias

    Amostras Independentes

    Médias Populacionais (desconhecidas): μ1 e μ2 , μd = μ1 - μ2

    Hipótese nula: H0: μ1 = μ2 H0: μ1 - μ2 = 0 H0: μd = 0

    Suposição: as amostras dos

    grupos 1 e 2 vêm de populações

    com distribuição Normal com

    desvios-padrão iguais.

  • Amostras Grupo 1 Grupo 2

    Tamanho n1 n2

    Média

    Desvio-Padrão s1 s2

    s1 e s2 são combinados para estimar o desvio-padrão comum σ:

    x y

    snsns

    nncomb2112222

    12

    11

    2

    ()()

    Hipótese nula: H0: μ1 = μ2 H0: μ1 - μ2 = 0 H0: μd = 0

    Hipótese alternativa: H1: μ1 ≠ μ2 H1: μ1 - μ2 ≠ 0 H1: μd ≠ 0

    ou H1: μ1 < μ2 H1: μ1 - μ2 < 0 H1: μd < 0

    ou H1: μ1 > μ2 H1: μ1 - μ2 > 0 H1: μd > 0

  • Hipótese Alternativa Valor-p

    H1: μ1 < μ2 H1: md < 0 P(T(gl) < Tobs )

    H1: μ1 > μ2 H1: md > 0 P(T(gl) > Tobs )

    H1: μ1 μ2 H1: md 0 2xP(T(gl) >|Tobs|)

    Comparação de Duas Médias em Amostras Independentes

    Estatística de Teste:

    ,11

    21

    2

    nns

    yxT

    comb

    obs

    2

    )1()1(

    21

    2

    22

    2

    112

    nn

    snsnscomb

    com

    gl = n1 + n2 - 2

    Hipótese nula: H0: μ1 = μ2 H0: μ1 - μ2 = 0 H0: μd = 0

    Rejeita-se a hipótese nula se valor-p < .

  • Tabela 2 do artigo

    (Taubert et al, 2007)

  • H0: μB = μA

    H1: μB ≠ μA

    = 0.05

    Não se rejeita H0 ao nível de significância de 5% (valor-p > 0.05).

    As taxas médias de colesterol total no início do estudo são iguais

    nos dois grupos (chocolante amargo e branco).

    Valor-p = 2 x P(t42 > |Tobs|) = 2 x P(t42 > 0.23) [Vide próximo slide]

    P(t42 > 0.23) P(t40 > 0.23) > 0.40

    Valor-p > 2(0.40) = 0.80.

    As médias de colesterol total

    são iguais nos dois grupos?

    μB: média de colesterol total na população do grupo chocolate branco

    μA: média de colesterol total na população do grupo chocolate amargo

  • P(t42 > 0.23) P(t40 > 0.23) > 0.40