introdução à bioestatística · estest de hipóteses para dados numéricos introdução à...

25

Upload: others

Post on 12-Feb-2020

8 views

Category:

Documents


0 download

TRANSCRIPT

Testes de hipóteses para dados numéricos

Introdução à Bioestatística

Marcelo Goulart Correia

Instituto Nacional de Cardiologia

May 11, 2015

Marcelo Goulart Correia Introdução à Bioestatística

Testes de hipóteses para dados numéricos

1 Testes de hipóteses para dados numéricos

Marcelo Goulart Correia Introdução à Bioestatística

Testes de hipóteses para dados numéricos

É importante veri�car qual a distribuição dos dados

Os testes paramétricos precisam atender ao requisito denormalidade

Marcelo Goulart Correia Introdução à Bioestatística

Testes de hipóteses para dados numéricos

Teste de Shapiro WilkSurge em 1965É baseado na estatística W

H0: A amostra provem de uma distribuição normalHA: A amostra não provem de uma distribuição normal

W =b2

n∑i=1

(xi − x̄)2(1)

b =

n∑

i=1

/2an−i+1 ∗ (xn−i+1 − xi ), se n é par

n∑i=1

+1/2an−i+1 ∗ (xn−i+1 − xi ), se n é impar(2)

Marcelo Goulart Correia Introdução à Bioestatística

Testes de hipóteses para dados numéricos

Teste de Kolmogorov-SmirnovAlternativa ao teste de Shapiro-WilkÉ baseado na função distribuição acumulada

H0: A amostra provém de uma distribuição normalHA: A amostra não provém de uma distribuição normal

Dn = max(D+n ,D

−n ) (3)

D+n = max(Fn(x)− F (x)) (4)

D−n = max(F (x)− Fn(x)) (5)

Marcelo Goulart Correia Introdução à Bioestatística

Testes de hipóteses para dados numéricos

CuidadosAlguns testes tem limitação de tamanho amostralCom amostras grandes qualquer desvio resulta numa rejeiçãoda hipótese nulaVeri�que outros aspectos da variável (média, mediana, IQR,intervalo de con�ança, histograma)

Marcelo Goulart Correia Introdução à Bioestatística

Testes de hipóteses para dados numéricos

Marcelo Goulart Correia Introdução à Bioestatística

Testes de hipóteses para dados numéricos

Marcelo Goulart Correia Introdução à Bioestatística

Testes de hipóteses para dados numéricos

Teste do t emparelhadoUtilizada para a comparação de médias entre dois gruposemparelhadosH0: Não existem diferenças entre as médias observadas nosdois gruposHA: Existem diferenças entre as médias observadas nos doisgrupos

T =D̄ − µDsD/√n

(6)

s2D =

n∑i=1

(Di − D̄)2

n − 1(7)

Marcelo Goulart Correia Introdução à Bioestatística

Testes de hipóteses para dados numéricos

ExemploPara determinar a e�ciência de um antitérmico, forammensuradas as temperaturas de 20 indivíduos antes e após oconsumo do medicamento

Indivíduo Antes Depois Indivíduo Antes Depois1 37,5 37,8 11 39,3 382 36 36,3 12 37,5 37,13 39 37,6 13 38,5 36,64 38 37,2 14 39 37,55 37,8 36,9 15 36,9 376 38,5 37,7 16 37 36,27 36,9 36,8 17 38,5 37,68 39,4 38,1 18 39 36,89 37,2 36,7 19 36,2 36,410 38,1 37,3 20 36,8 36,8

Marcelo Goulart Correia Introdução à Bioestatística

Testes de hipóteses para dados numéricos

Exemplo

Indivíduo Diferença Indivíduo Diferença1 -0,3 11 1,32 -0,4 12 0,43 1,4 13 1,94 0,8 14 1,55 0,9 15 -0,16 0,8 16 0,87 0,1 17 0,98 1,3 18 2,29 0,5 19 -0,210 0,8 20 0

Marcelo Goulart Correia Introdução à Bioestatística

Testes de hipóteses para dados numéricos

ExemploD̄ = 0, 73 // sD = 0, 7356Tobs = 0,73−0

0,7356/√20

= 4, 438

Valor crítico de T (α = 0, 05) = 2,093 (Bicaudal)Existe diferença entre os pares para um nível de signi�cânciade 5%

Marcelo Goulart Correia Introdução à Bioestatística

Testes de hipóteses para dados numéricos

Exercício

Marcelo Goulart Correia Introdução à Bioestatística

Testes de hipóteses para dados numéricos

Teste do tUtilizada para a comparação de médias entre dois gruposindependentesH0: Não existem diferenças entre as médias observadas nosdois gruposHA: Existem diferenças entre as médias observadas nos doisgrupos

O método consiste em:Calcular a média dos dois grupos (x̄1 e x̄2)Calcular a variância dos dois grupos (s2

1e s2

2)

Calcular a variância ponderada

s2 =

(n1 − 1)s21

+ (n2 − 1)s22

n1 + n2 − 2(8)

Calcular o valor de t

t =x̄2 − x̄1√

s2(1/n1 + 1/n2)(9)

Marcelo Goulart Correia Introdução à Bioestatística

Testes de hipóteses para dados numéricos

ExemploComo forma de veri�car se duas dietas são igualmentee�cientes, foram criados dois grupos de paciente para duasdietas distintas. As perdas de peso foram coletadas conformedescrito abaixo

Dieta 1 Dieta 212 158 1915 1513 1210 1312 1614 15111213

Marcelo Goulart Correia Introdução à Bioestatística

Testes de hipóteses para dados numéricos

Exemplo

x̄1 = 12 + 8 + ...+ 13/10 = 12 // x̄2 = 15 + 19 + ...+ 15/7 = 15s21 = (1476− 1202/10)/9 = 4 // s22 = (1605− 1052/7)/6 = 5

s2 = 9 ∗ 4 + 6 ∗ 5/9 + 6 = 4, 4t = 15− 12/

√4, 4 ∗ (1/10 + 1/7) = 2, 902

Valor crítico de T (α = 0, 05) = 2,131 (Bicaudal)

Existe diferença entre as dietas para um nível de signi�cânciade 5%

Marcelo Goulart Correia Introdução à Bioestatística

Testes de hipóteses para dados numéricos

ANOVA One-Way (Um fator)Utilizada para a comparação de médias entre mais de doisgruposH0: Não existem diferenças entre as médias observadas nosgruposHA: Existem diferenças entre as médias observadas nos grupos

Marcelo Goulart Correia Introdução à Bioestatística

Testes de hipóteses para dados numéricos

ExemploTrês tratamentos são utilizados para uma determinadaenfermidade, deseja-se veri�car se existem diferenças entre osresultados obtidos em cada tratamento

A B C15 23 1910 16 1513 19 2118 18 1415 1613� � �84 76 85

Marcelo Goulart Correia Introdução à Bioestatística

Testes de hipóteses para dados numéricos

ExemploGraus de liberdade

Total �> 15− 1 = 14Tratamentos �> 3− 1 = 2Resíduos �> 14− 2 = 12

Média do quadrado da soma dos valores

C = (84 + 76 + 85)/15 = 4001, 67

Soma dos quadrados

SQT = 152 + 102 + ...+ 162 − 4001, 67 = 159, 33SQE = 84

2

6+ 76

2

4+ 85

2

5− 4001, 67 = 63, 33

SQD = 159, 33− 63, 33 = 96

Quase variâncias

QVE = 63, 33/2 = 31, 67QVD = 96/12 = 8

Estatística F

F = 31, 37/8 = 3, 96

Marcelo Goulart Correia Introdução à Bioestatística

Testes de hipóteses para dados numéricos

ExemploValor crítico de F (α = 0, 05, GLE = 2, GLD = 12) = 3,89Existe diferença entre os tratamentos para um nível designi�cância de 5%

Marcelo Goulart Correia Introdução à Bioestatística

Testes de hipóteses para dados numéricos

Exercício

Marcelo Goulart Correia Introdução à Bioestatística

Testes de hipóteses para dados numéricos

ANOVA One-Way (Um fator) de medida repetidaUtilizada para a comparação de médias entre mais de doisgrupos pareadosH0: Não existem diferenças entre as médias observadas nosgruposHA: Existem diferenças entre as médias observadas nos grupos

A tabela conterá:A interação entre variável e gruposErros de medidas dessa interação

Marcelo Goulart Correia Introdução à Bioestatística

Testes de hipóteses para dados numéricos

ExemploÉ obtida a medida de proteína c-reativa em três momentos(Pré-treinamento, duas semanas de treinamento, �m dotreinamento) num grupo de pacientes.

Marcelo Goulart Correia Introdução à Bioestatística

Testes de hipóteses para dados numéricos

Exemplo

Marcelo Goulart Correia Introdução à Bioestatística

Testes de hipóteses para dados numéricos

Exercício

Marcelo Goulart Correia Introdução à Bioestatística