Inferência BásicaInferência Estatística: decidindo na presença de incerteza
Universidade Federal de Minas Gerais
Instituto de Ciências Exatas
Departamento de Estatística
Aula 10:
Testes de Hipóteses para Duas Médias em
Amostras Emparelhadas e Independentes
Princípios de Bioestatística
Comparação de Dois Grupos
Comparação de drogas, dietas, terapias, métodos cirúrgicos,
fertilizantes, condições experimentais, características físicas ...
• Dois Novos Tratamentos,
• Tratamento Novo com um Tratamento Padrão ou
• Tratamento com a Ausência de Tratamento.
O melhor dentre dois tratamentos é aquele que:
• produz melhores resultados para a maioria da população,
ou seja, fornece os melhores resultados na média.
• produz o efeito desejado em maior proporção de indivíduos
da população.
Tipos de Planejamento
Amostras Independentes:
Temos duas amostras separadas, uma de cada população:
• Tratamento 1 é aos n1 indivíduos da primeira amostra;
• Tratamento 2 é aos n2 indivíduos da segunda amostra.
Amostras Dependentes (ou Emparelhadas ou Pareadas):
A amostra é constituída de n pares de indivíduos:
• Tratamento 1 é aplicado a um elemento do par;
• Tratamento 2 é aplicado ao outro elemento do par.
Exemplo 1: amostras independentes
Um clínico suspeita que o fato de a mãe ter menos de 20 anos
de idade está associado com o nascimento de bebês com
baixo peso ao nascer (< 2500 gramas).
Ele selecionou aleatoriamente alguns registros de uma grande
maternidade e os dividiu em dois grupos:
Grupo 1: bebês de mães com menos de 20 anos e
Grupo 2: bebês de mães com mais de 20 anos.
Para cada bebê em cada grupo, observou a variável:
X: peso ao nascer (em gramas).
Exemplo 2: amostra emparelhadas
Para comparar dois tipos de colírio (A e B) quanto à variável
“tempo para dilatar a pupila para o exame oftalmológico”,20 pacientes receberam um colírio em cada olho
n = 20 pares cada paciente é um par: (Olho D ; Olho E).
Exemplo 3: amostradas emparelhadas
Um pesquisador deseja verificar se uma droga reduz a pressão
sanguínea. A pressão sanguínea foi registrada antes e depois
da aplicação da droga em 15 animais.
Tratamento 1: Ausência da droga (“Antes”)
Tratamento 2: Presença da droga (“Depois”)
n = 15 pares cada animal é um par: (Xantes, Xdepois).
Exemplo 4: amostras independentes
Na fase inicial da pesquisa sobre a eficiência do AZT no
tratamento da AIDS, dois grupos de pacientes soropositivos
em fase terminal foram formados:
Grupo 1: pacientes que receberam o AZT e,
Grupo 2: pacientes que receberam um placebo.
Consumo de chocolate amargo e redução na pressão arterial
Taubert, D. et al. (2007) Effects of Low Habitual Cocoa Intake on Blood Pressure and Bioactive Nitric
Oxide: A Randomized Controlled Trial, JAMA, July 4, 2007—Vol 298, No. 1
44 adultos com
hipertensão
arterial leve
Antes
Depois
18 semanas
Antes
Depois
18 semanas
Chocolate
amargo
Chocolate
branco
Exemplo 5: Múltiplos Planejamentos
Amostras
Pareadas
Amostras
Pareadas
Amostras
independentes
Comparação de Duas Médias em
Amostras Emparelhadas
Amostra com n pares de indivíduos:
• Tratamento 1 é aplicado a um elemento do par (medida x)
• Tratamento 2 é aplicado ao outro elemento do par (medida y)
Par Tratamento 1
x
Tratamento 2
y
Diferenças
d = x - y
1 x1 y1 d1 = x1 - y1
2 x2 y2 d2 = x2 - y2
M M M M
n xn yn dn = xn - yn
Médias populacionais (desconhecidas): μ1 e μ2 , μd = μ1 - μ2
Hipótese nula:
H0: μ1 = μ2
H0: μd = 0
sd = desvio-padrão das diferenças
d = média das diferenças
Hipótese nula: H0: μd = 0
Hipótese alternativa: H1: μd < 0 ou H1: μd > 0 ou H1: μd ≠ 0
sd = desvio-padrão das diferenças
d = média das diferenças
Estatística de Teste:0
obs
d d
d dT
s n s n
n: tamanho da amostra (número de pares)
Distribuição de referência: t com n-1 graus de liberdade
Consumo de chocolate amargo e
redução na pressão arterial*
2.9 0-8.50
1.6 22obsT
Grupo “chocolate amargo”
2.9 e 1.6dd s
Valor P = 2.P(t21< -8.50)
= 2.P(t21> 8.50)
< 2.(0.0005)
Valor P < 0.001
“Ao nível de significância de 5%, foram encontradas evidências
estatisticamente significantes de que a pressão sistólica média
antes e 18 semanas depois do consumo de chocolate amargo
são diferentes (valor p < 0.001)”
μ: média da pressão sistólica
0.025 0.025
0 2.082.08
H0: μDepois – μAntes= 0
HA: μDepois – μAntes ≠ 0
a = 0.05
t21
0.1 0 0.29
1.6 22obsT
Grupo “chocolate branco”
0.1 e 1.6dd s
Valor P > 0.60
“Ao nível de significância de 5%, não foram encontradas
evidências estatisticamente significantes contra a hipótese de
que a pressão sistólica média antes e depois do consumo de
chocolate branco são iguais (valor p > 0.60)”
μ: média da pressão sistólica
0.025 0.025
0 2.082.08
H0: μDepois – μAntes= 0
HA: μDepois – μAntes ≠ 0
a = 0.05
t21
Valor P = 2.P(t21 > 0.29)
> 2.(0.30)
Pela nossa tabela
Hipóteses Região de Rejeição de H0 Valor P
H0: mD = 0
H1: mD < 0P(T(n-1) < Tobs )
H0: mD = 0
H1: mD > 0P(T(n-1) > Tobs )
H0: mD = 0
H1: mD 0 ou 2xP(T(n-1) >|Tobs|)
ns
dTd
obs
);1( a
ntTobs
);1( a
ntTobs
)2
;1( a
ntTobs )
2;1( a
n
tTobs
RESUMO:
Comparação de Duas Médias em Amostras Emparelhadas
Estatística de Teste:
Hipótese nula: H0: μd = 0
μ1 ≠ μ2
σ1=σ2=σ
Comparação de duas Médias
Amostras Independentes
Médias Populacionais (desconhecidas): μ1 e μ2 , μd = μ1 - μ2
Hipótese nula: H0: μ1 = μ2 H0: μ1 - μ2 = 0 H0: μd = 0
Suposição: as amostras dos
grupos 1 e 2 vêm de populações
com distribuição Normal com
desvios-padrão iguais.
Amostras Grupo 1 Grupo 2
Tamanho n1 n2
Média
Desvio-Padrão s1 s2
s1 e s2 são estimativas do desvio-padrão comum σ.
x y
Hipótese nula: H0: μ1 = μ2 H0: μ1 - μ2 = 0 H0: μd = 0
Hipótese alternativa: H1: μ1 ≠ μ2 H1: μ1 - μ2 ≠ 0 H1: μd ≠ 0
ou H1: μ1 < μ2 H1: μ1 - μ2 < 0 H1: μd < 0
ou H1: μ1 > μ2 H1: μ1 - μ2 > 0 H1: μd > 0
Estatística de Teste:
Distribuição de referência: T com gl = n1 + n2 - 2
Supondo que as amostras dos Grupos 1 e 2 tenham vindo de
populações com distribuição Normal e desvios-padrão iguais:
snsns
nncomb2112222
12
11
2
()()
Hipótese nula: H0: μ1 = μ2 H0: μ1 - μ2 = 0 H0: μd = 0
Tabela 2 do artigo
(Taubert et al, 2007)
H0: μCA = μCB
HA: μCA ≠ μCB
0.025 0.025
0 2.022.02
42;0.025 40;0.025 2.02t t
a = 0.05
“Ao nível de significância de 5%, não foram encontradas
evidências estatisticamente significantes contra a hipótese nula
de que as taxas médias de colesterol total são iguais nos dois
grupos de estudo (valor p = 0.83)”
valor p = 0.83 (do artigo)
H0: μCA = μCB
HA: μCA ≠ μCA
valor p = 2.P(t42 > 0.23) 2.P(t40 > 0.23) > 2(0.40) = 0.80
Valor p > 0.80.
Hipóteses Região de Rejeição de H0 Valor P
H0: μ1 = μ2
H1: μ1 < μ2P(T(gl) < Tobs )
H0: μ1 = μ2
H1: μ1 > μ2P(T(gl) > Tobs )
H0: μ1 = μ2
H1: μ1 μ2
ou 2xP(T(gl) >|Tobs|)
);( agltTobs
);( agltTobs
)2
;( agltTobs
)2
;( agltTobs
RESUMO:
Comparação de Duas Médias em Amostras Independentes
Estatística de Teste:
Tx y
sn n
obs
comb
2
1 2
1 1s
n s n s
n ncomb2 1 1
22 2
2
1 2
1 1
2
( ) ( )
gl = n1 + n2 - 2
Hipótese nula: H0: μ1 = μ2
Intervalos de Confiança e Testes de Hipóteses
Intervalos de Confiança podem ser usados
para se fazer Testes de Hipóteses Bilaterais.
H0: μd = 0
HA: μd ≠ 0
A região de não-rejeição de um teste bilateral sobre μd
é o intervalo de confiança para μd.
Se um intervalo com 100(1-α)% de confiança é
usado para se fazer um teste bilateral,
o nível de significância associado ao teste é α%.
H0: μd = m0
HA: μd ≠ m0
Hipótese nula: H0: μ1 = μ2 H0: μ1 - μ2 = 0 H0: μd = 0
Intervalos de Confiança para a diferença de médias
n
stdICd
n)2;1(
)%1(100
21aamm
ICxyt snnnn combmma a12 12
100122
2
12
11
()%( ;/)()
Amostras dependentes:
Amostras independentes:
Como usar um Intervalo de Confiança para fazer um
Teste de Hipóteses Bilateral ?
H0: μd = μ0
HA: μd ≠ μ0
O intervalo de 100(1-α)%
de confiança para μd
contém o valor μ0 ?
NÃO
SIM
rejeitamos H0 ao nível de α% de significância
não rejeitamos H0
ao nível de α% de significância
Exemplo
Num estudo sobre os efeitos da suplementação de vitamina A,
crianças de 4 a 24 meses de idade, com sarampo e complicações
(pneumonia e diarréia grave) foram divididas em dois grupos:
um grupo recebeu vitamina A nas doses recomendadas pela OMS
e
outro grupo recebeu um placebo.
Durante o acompanhamento, foram medidas as seguintes variáveis:
PC – duração da pneumonia clínica (dias),
DI – duração da diarréia (dias) e
GP – ganho de peso após 6 semanas (g).
H0: μA - μP = 0
HA: μA - μP ≠ 0
Média e desvio-padrão (entre parênteses) para as três
características dos grupos de Placebo e Vitamina A
Placebo Vitamina AIntervalo de 99% de
Confiança para (μA – μP)
PC (dias) 4,50 (0,79) 4,10 (0,40) -0,82 a 0,02
DI (dias) 3,60 (0,35) 3,30 (0,71) -0,67 a 0,07
GP (g) 900 (140) 1150 (310) 70 a 430
(não rejeitar H0 a 1% de sig.)
(não rejeitar H0 a 1% de sig.)
(rejeitar H0 a 1% de sig.)