a escolha do método estatístico

47
1 Profa. Dra. Livia M. A. Tenuta [email protected] Universidade Estadual de Campinas Faculdade de Odontologia de Piracicaba A escolha do método estatístico Universidade Estadual de Campinas Faculdade de Odontologia de Piracicaba A escolha do método estatístico - Probabilidades, hipóteses e delineamentos -

Upload: nguyenduong

Post on 31-Dec-2016

215 views

Category:

Documents


1 download

TRANSCRIPT

1

Profa. Dra. Livia M. A. Tenuta

[email protected]

Universidade Estadual de CampinasFaculdade de Odontologia de Piracicaba

A escolha do método

estatístico

Universidade Estadual de CampinasFaculdade de Odontologia de Piracicaba

A escolha do método

estatístico

- Probabilidades, hipóteses e

delineamentos -

2

“A notícia boa é que a estatística

está se tornando mais fácil e

acessível.

A notícia ruim é que a estatística

está se tornando mais fácil e

acessível.”

Hofacker, 1983

Para muitos, estatística é...

3

Figueira CV, 2006

“Estatística é a arte de torturar

os dados até que eles digam o

que se quer ouvir”

Mills, 1993,

Susin & Rösing, 1999

Para outros...

4

Jim Borgman, New York Times, 27 April 1997

5

Testes estatísticos mais comuns

Número e tipo de grupos Paramétrico Não paramétrico

2 grupos

Independentes (não pareados)

Teste t para amostras

independentes

Teste de Mann-Whitney

Dependentes (pareados)

Teste t para amostras

dependentes

Teste de Wilcoxon

3 ou mais grupos

Independentes (não pareados)

ANOVA Teste de Kruskal-Wallis

Dependentes (pareados)

ANOVA medidas repetidas

Teste de Friedman

Susin C. Basic statistical analysis for dental rese arch.

In: Rode SM, Dias KRHC, França CM. Handbook of scie ntific methodology. IADR latinoamericana, 2009

Métodos de regressão mais comuns

Tipo de observações Dados contínuos Dados categóricos

Independentes Regressão linearRegressão logística

dicotômica, multinomial e ordenada

Dependentes

Regressão linear com erro padrão ajustado para o

agrupamento das observações

Regressão logística condicional e extensões

Susin C. Basic statistical analysis for dental rese arch.

In: Rode SM, Dias KRHC, França CM. Handbook of scie ntific methodology. IADR latinoamericana, 2009

6

Estudo cruzado duplo-cego

• Controle negativo : H2O

• Controle positivo : 1.5% Sacarose

• Controle ativo : 1.5% Lactose

• Experimental : Zero Cal R

• Controle negativo: sem dentifrício

• Controle ativo : MFP/SiO2

• Experimental : MFP/CaCO3

Pergunta (???) – curiosidade científica!

Delineamento experimental adequado

para testar a pergunta

Variáveis resposta que ajudem a

explicar o fenômeno

Pesquisa científica

7

Tratamento A:

21,5%

23,6%

39,7%

29,5%

32,7%

Média 29,4%

Estatística experimentalDesmineralização dental (% perda de dureza)

Tratamento B:

18,9%

24,4%

26,7%

19,4%

17,8%

Média 21,4%

Diferença estimada entre A e B: 8%

Estatística experimental

Existe uma real diferença entre os

tratamentos A e B?

Para descobrir, o experimento deveria

ser repetido infinitas vezes!

8

Inferência estatística: determina a

probabilidade de estimar se uma real

diferença entre tratamentos existe

Estatística experimental

Nível de significância (p): probabilidade

de erro ao afirmar que há diferença entre

os tratamentos

Tratamento A:

21,5%

23,6%

39,7%

29,5%

32,7%

Média 29,4%

DP 7,3%

Estatística experimentalDesmineralização dental (% perda de dureza)

Tratamento B:

18,9%

24,4%

26,7%

19,4%

17,8%

Média 21,4%

DP 3,9%

9

Variação do acaso: toda variação devido a fatores

não controláveis. Pode ser medida através do

desvio em relação a média

ANOVA

Análise da variância

Quanto da variabilidade observada

é devido ao acaso ou a um real

efeito do tratamento

10

Efeito de 2 dentifrícios na concentração de

F no fluido do biofilme

(µM F, média, n=56)

Dentifrício A Dentifrício B

5,5 11,4

Efeito de 2 dentifrícios na concentração de

F no fluido do biofilme

(µM F, média ± DP, n=56)

Dentifrício A Dentifrício B

5,5 ± 4,5 11,4 ± 21,0

11

Concentração de F no fluido do

biofilme dental exposto a 2 dentifrícios

12

Eliminando o outlier…

13

Transformação sugerida pelo pacote

estatístico: inversa

14

Esquema da análise de variância:

Delineamento inteiramente aleatorizado

Fonte de variação

Graus de liberdade

Soma de Quadrados Quadrado médio F

Tratamento I – 1Variabilidade devido

ao tratamentoSQ tratamento

GL trat.QM tratamento

QM resíduo

Resíduo I (J – 1) Por diferençaSQ resíduoGL resíduo

-

Total IJ – 1 Variabilidade total - -

I = número de níveis do tratamento

J = número de repetições

Modelo matemático:

Yij = µ + t i + eij

Delineamento inteiramente aleatorizado

Onde:

Yij = valor da variável testada sob o i-ésimo nível de tratamento

µ = média geral do experimento para a variável

t i = efeito do i-ésimo nível de tratamento

eij = erro aleatório

15

280 ppm F140 ppm F

70 ppm FControle

Teste de hipóteses: regra de decisão para

rejeitar ou não uma hipótese estatística

com base nos elementos amostrais

Estatística experimental

H0 (hipótese nula): hipótese que será testada

estatisticamente

Ha (hipótese alternativa): suposição que o

pesquisador quer estudar

16

Hipóteses:

H0 = t1 = t2 = ... = t I = 0

Ha = t i ≠ 0

Delineamento inteiramente aleatorizado

Ao rejeitar H 0, com nível de significância

de 5%, por exemplo, o pesquisador

automaticamente aceita sua hipótese

alternativa

Estatística experimental

17

“In relation to any experiment we may speak of…

the “null hypothesis,” and it should be noted that

the null hypothesis is never proved or established,

but is possibly disproved, in the course of

experimentation. Every experiment may be said to

exist only in order to give the facts a chance of

disproving the null hypothesis. ”

Fisher RA

Tratamento A:

21,5%

23,6%

39,7%

29,5%

32,7%

Média 29,4%

Estatística experimentalDesmineralização dental (% perda de dureza)

Tratamento B:

18,9%

24,4%

26,7%

19,4%

17,8%

Média 21,4%

Erro tipo I ( α): probabilidade de erro ao se rejeitar a

hipótese de nulidade quando ela é verdadeira, ou

seja, probabilidade de apontar um falso positivo

Diferem ao

nível de

significância

de 5%

18

Nível de significância de 5% significa que

aceitamos errar em 1 a cada 20 casos

Trabalhando com probabilidades...

Correlação entre variáveis: se eu tiver 10 variávei s

e for estudar a correlação entre elas, tenho 45

comparações (10*(10-1)/2 = 45)

Em 5% delas, posso ver uma correlação

significativa por mero acaso! 0,05* 45 = 2,25!Hofacker CS, 1983

Erro tipo II ( β): probabilidade de erro ao não

rejeitar a hipótese de nulidade quando ela é de

fato falsa, ou seja, probabilidade de apontar um

falso negativo

É função do:

a) número de repetições

b) variabilidade dos dados

c) real diferença entre os grupos

19

Proporciona uma estimativa do erro

experimental (variabilidade), permitindo a

estimativa do efeito dos tratamentos.

Repetição

Repetiçãon=3

Tratamento A:

20

24

25

Média 23

Tratamento B:

17

22

24

Média 21

Teste t comparando A e B: p=0,48

20

Repetiçãon=30

Tratamento A:

20, 24, 25, 21, 23, 20, 24, 25, 21, 23, 25, 20, 23, 26, 20, 25, 20, 23, 26, 20, 24, 25, 20, 24, 25, 24, 25, 20, 24, 25, 22, 24, 23, 21, 23, 22, 24, 23, 21, 23, 26, 19, 24, 25, 20, 26, 19, 24, 25, 20, 24, 25, 19, 25, 2524, 25, 19, 25, 25

Média 23

Tratamento B:

15, 22, 26, 16, 23, 15, 22, 26, 16, 23, 24, 15, 24, 24, 17, 24, 15, 24, 24, 17, 22, 24, 17, 22, 24, 22, 24, 17, 22, 24, 17, 16, 22, 24, 23, 17, 16, 22, 24, 23, 24, 17, 22, 24, 17, 24, 17, 22, 24, 17, 22, 24, 14, 24, 2522, 24, 14, 24, 25

Média 21

Teste t comparando A e B: p=0,0137

Repetiçãon=3

Tratamento A:

20

24

25

Média 23

Tratamento B:

10

13

16

Média 13

Teste t comparando A e B: p=0,0123

Diferença entre A e B = 10

21

Repetiçãon=3

Tratamento A:

20

24

25

Média 23

DP 2,6

Tratamento B:

10

13

16

Média 13

DP 3,0

Repetiçãon=3

Tratamento A:

13

21

35

Média 23

DP 11,1

Tratamento B:

5

10

24

Média 13

DP 9,9

Teste t comparando A e B: p=0,31

22

Poder estatístico

Erro tipo II ( β): probabilidade de erro ao não

rejeitar a hipótese de nulidade quando ela é de

fato falsa, ou seja, probabilidade de apontar um

falso negativo

Poder do teste estatístico : Capacidade do teste em

apontar diferenças quando elas realmente existem

Erro tipo II ( β) = 10%

Poder = 1 – β = 90%

23

Esquema da análise de variância:

Delineamento inteiramente aleatorizado

Fonte de variação

Graus de liberdade

Soma de Quadrados Quadrado médio F

Tratamento I – 1Variabilidade devido

ao tratamentoSQ tratamento

GL trat.QM tratamento

QM resíduo

Resíduo I (J – 1) Por diferençaSQ resíduoGL resíduo

-

Total IJ – 1 Variabilidade total - -

I = número de níveis do tratamento

J = número de repetições

Poder estatístico

The sample size selection was based on a pilot study , made with 3 volunteers,

who ingested the 550 µg F/g dentifrice, on fasting, after breakfast or after

lunch, and we used the AUC of salivary F concentration as the r esponse

variable. In fact, we intended to determine the number of vol unteers necessary

to detect differences between the gastric content situatio ns using the low F

dentifrice, with 80% power . From this pilot study, a low standard deviation was

observed between volunteers for each gastric content condi tion. Using the

SAS System 8.01, considering the differences obtained from the mean of these

treatments, we could reach 80% power if we used nine voluntee rs . For 11

volunteers, the power would increase to 90% . Considering that volunteers

could be lost during the 9-phase study, we opted to select 11 v olunteers.

Actually, we could significantly reject H 0 in the experiment , and therefore we

haven’t worried in mention this in the text, but we added the p ower

information in the text.

Reviewer: What were criteria for sample size selection? Was it to reach estimated power (80%)?

24

1. Repetição

2. Aleatorização

3. Cegamento

4. Controle local (blocos estatísticos)

Princípios básicos da experimentação

Proporciona a todos os tratamentos a

mesma probabilidade de serem

designados a qualquer das unidades

experimentais

Aleatorização

25

Aleatorização = sorteio!

Exemplo:

Dividir 16 espécimes em 4 tratamentos

(cada um com 4 espécimes)

Aleatorização no Excel

26

Classificar pela coluna Classificar pela coluna “Aleatório”“Aleatório”

ATENÇÃO: Para que o sorteio seja ATENÇÃO: Para que o sorteio seja feito corretamente, apenas as feito corretamente, apenas as colunas “Tratamento” e colunas “Tratamento” e “Aleatório” devem ser “Aleatório” devem ser selecionadas!selecionadas!

27

Ao classificar por um Ao classificar por um número aleatório,número aleatório,automaticamente o automaticamente o tratamento ficará tratamento ficará aleatorizado!aleatorizado!

Portanto, os espécimes Portanto, os espécimes 1, 6, 7 e 8 devem receber 1, 6, 7 e 8 devem receber o tratamento 1, e assim o tratamento 1, e assim sucessivamente...sucessivamente...

28

A distribuição dos espécimes entre os

tratamentos é feita de modo restrito, para

evitar que algum tratamento seja

favorecido pela aleatorização.

Exemplo: quando se conhece a dureza inicial de bloco s

dentais, é possível sorteá-los aos tratamentos de a cordo

com sua dureza

Aleatorização com restrição

E a média de dureza entre E a média de dureza entre os grupos apresentaos grupos apresenta--se se homogênea.homogênea.

29

RealizandoRealizando--se a se a aleatorizaçãoaleatorização sem restrição, sem restrição, as diferenças entre durezas as diferenças entre durezas dos espécimes distribuídos dos espécimes distribuídos aos 4 níveis de tratamento aos 4 níveis de tratamento são mais evidentes.são mais evidentes.

Estudo cego : o pesquisador não tem acesso

à identificação de qual nível de tratamento se

trata.

Cegamento

30

Vieira, S. Estatística experimental. 2.ed. 1999

Estudo cego: o pesquisador não tem acesso

à identificação de qual nível de tratamento se

trata.

Quando voluntários estão envolvidos, estes

também não devem saber de qual tratamento

estão participando – estudo duplo cego

Cegamento

31

Utiliza os princípios da repetição,

aleatorização e controle local

Exemplo: avaliar o efeito do dentifrício fluoretado ,

em 2 níveis, na concentração de F na saliva,

utilizando 14 voluntários como blocos estatísticos

Delineamento aleatorizado em blocos

Modelo matemático:

Yij = µ + t i + b j + eijk

Delineamento aleatorizado em blocos

Onde:

Yij = valor da variável testada sob o i-ésimo nível de tratamento e

no j-ésimo bloco

µ = média geral do experimento para a variável

t i = efeito do i-ésimo nível de tratamento

b j = efeito do j-ésimo nível de voluntário

eij = erro aleatório

32

Hipóteses:

H0 = t1 = t2 = ... = t I = 0

Ha = t i ≠ 0

Delineamento aleatorizado em blocos

Esquema da análise de variância:

Fonte de variação

Graus de liberdade

Soma de Quadrados Quadrado médio F

Tratamento I – 1Variabilidade devido

ao tratamentoSQ tratamento

GL trat.QM tratamento

QM resíduo

Blocos J – 1 Variabilidade devido

aos blocosSQ blocosGL blocos

QM blocosQM resíduo

Resíduo (I – 1)(J – 1) Por diferençaSQ resíduoGL resíduo

-

Total IJ – 1 Variabilidade total - -

I = número de níveis do tratamento

J = número de blocos

Delineamento aleatorizado em blocos

33

A variabilidade devido aos blocos

(voluntários, p.ex.) pode ser estimada,

diminuindo a variabilidade devido ao

acaso (erro experimental)

Delineamento aleatorizado em blocos

34

Fase 1

Delineamento cruzado

Fase 2 Fase 3

Voluntários grupo 1

Voluntários grupo 2

Voluntários grupo 3

Tratamento ATratamento A Tratamento BTratamento B Tratamento CTratamento C

1. Fatorial

2. Parcelas subdivididas

Delineamentos de tratamentos

35

Derivam do interesse em testar o efeito de

dois ou mais tipos de tratamentos no

mesmo experimento. Cada tipo de

tratamento é referido como um fator.

Experimentos fatoriais

Exemplo: avaliar o efeito do dentifrício

fluoretado, em 2 níveis, e da freqüência de

exposição do biofilme dental a sacarose,

em 4 níveis, na desmineralização dental.

Experimentos fatoriais

Fatorial 2 x 4

36

A combinação de tratamentos resultantes é o resulta do

da interação dos fatores a serem testados. No exemp lo,

há 8 combinações possíveis de tratamentos:

500 500 ppmppm FF, exposição ao açúcar 2x/dia

500 500 ppmppm FF, exposição ao açúcar 4x/dia

500 500 ppmppm FF, exposição ao açúcar 6x/dia

500 500 ppmppm FF, exposição ao açúcar 8x/dia

1100 1100 ppmppm FF, exposição ao açúcar 2x/dia

1100 1100 ppmppm FF, exposição ao açúcar 4x/dia

1100 1100 ppmppm FF, exposição ao açúcar 6x/dia

1100 1100 ppmppm FF, exposição ao açúcar 8x/dia

Experimentos fatoriais

Modelo matemático:

Yij = µ + A i + B j + Ai*B j + eijk

Delineamento fatorial

Onde:

Yij = valor da variável testada sob o i-ésimo nível do fator A e j-

ésimo nível do fator B

µ = média geral do experimento para a variável

Ai = efeito do i-ésimo nível do fator A

B j = efeito do j-ésimo nível do fator B

Ai*B j = efeito da interação A e B

eij = erro aleatório

37

Hipóteses:

Delineamento fatorial

(1) H0 = A1 = A2 = ... = AI = 0Ha = Ai ≠ 0

(2) H0 = B1 = B2 = ... = BJ = 0Ha = B j ≠ 0

(3) H0 = (A*B) ij = 0Ha = (A*B) ij ≠ 0

Esquema da análise de variância:

Fonte de variação

Graus de liberdade

Soma de Quadrados Quadrado médio F

A I – 1Variabilidade devido

ao fator ASQ trat. AGL trat. A

QM trat. AQM resíduo

B J – 1 Variabilidade devido

ao fator BSQ trat. BGL trat. B

QM trat. BQM resíduo

A*B (I – 1)(J – 1)Variabilidade devido

a interação A*BSQ (A*B)GL (A*B)

QM trat. A*BQM resíduo

Resíduo IJ (K– 1) Por diferençaSQ resíduoGL resíduo

-

Total IJ – 1 Variabilidade total - -

I = número de níveis do fator AJ = número de níveis do fator BK = número de repetições

Delineamento fatorial

38

A1 A2

Var

iáve

l res

post

a

B2

B1Não há efeito significativo

de A (A1 = A2)

Não há efeito significativo

de B (B1 = B2)

Não há efeito da interação

A1 A2

Var

iáve

l res

post

a

B2

B1

Há efeito significativo de A (A2 > A1)

Não há efeito significativo

de B (B1 = B2)

Não há efeito da interação

A1 A2

Var

iáve

l res

post

a

B2

B1 Há efeito significativo de A (A2 > A1)

Há efeito significativo de B(B1 > B2)

Não há efeito da interação

A1 A2

Var

iáve

l res

post

a

B2

B1Não há efeito significativo

de A (A1 = A2)

Há efeito significativo de B

(B1 > B2)

Não há efeito da interação

39

A1 A2

Var

iáve

l res

post

a

B2B1 Interação devido a

diferença na direção da

resposta

A1 A2

Var

iáve

l res

post

a

B2

B1 Interação devido a

diferença na grandeza da

resposta

40

Efeito de 2 dentifrícios na concentração de F no

fluido do biofilme em função da freqüência de

exposição a sacarose

(µM F, média ± DP, n=14)

Frequênciaexposição do

biofilme à sacaroseDentifrício A Dentifrício B

2 x 5,6 ± 4,7 7,2 ± 4,8

4 x 4,4 ± 1,3 10,1 ± 12,8

6 x 5,1 ± 2,3 8,2 ± 6,2

8 x 6,8 ± 7,2 8,0 ± 6,4

Houve efeito significativo do fator dentifrício na concent ração de F nofluido do biofilme dental (p<0,05)

Experimentos em parcelas subdivididas

Vieira, S. Estatística experimental. 2.ed. 1999

41

Ocorrem quando os tratamentos não são distribuídos

nas unidades experimentais da mesma forma,

caracterizando tratamentos primários (parcelas) e

secundários (subparcelas).

Após o sorteio do tratamento principal às unidades

experimentais de forma usual, o tratamento secundár io

é sorteado dentro de cada tratamento primário.

Experimentos em parcelas subdivididas

Baseline surface microhardness

42

Modelo matemático:

Yij = µ + A i + b j + Bk + Ai*Bk + eijkl

Delineamento em parcelas subdivididas

Onde:

Yij = valor da variável testada sob o i-ésimo nível do fator A, j-

ésimo bloco e k-ésimo nível do fator B

µ = média geral do experimento para a variável

Ai = efeito do i-ésimo nível do fator A

b j = efeito do j-ésimo bloco estatístico

B j = efeito do k-ésimo nível do fator B

Ai*Bk = efeito da interação A e B

eij = erro aleatório

Hipóteses:

Delineamento fatorial

(1) H0 = A1 = A2 = ... = AI = 0Ha = Ai ≠ 0

(2) H0 = B1 = B2 = ... = BJ = 0Ha = B j ≠ 0

(3) H0 = (A*B) ij = 0Ha = (A*B) ij ≠ 0

43

Esquema da análise de variância:

Fonte de variação

Graus de liberdade

Soma de Quadrados Quadrado médio F

A I – 1Variabilidade devido

ao fator ASQ trat. AGL trat. A

QM trat. AQM resíduo a

Blocos J – 1 Variabilidade devido

aos blocosSQ blocosGL blocos

QM blocosQM resíduo a

Resíduo a(A*bloco)

(I – 1)(J – 1)Variabilidade da

parcelaSQ resíduo aGL resíduo a

Delineamento fatorial

Esquema da análise de variância:

Fonte de variação

Graus de liberdade

Soma de Quadrados Quadrado médio F

A I – 1Variabilidade devido

ao fator ASQ trat. AGL trat. A

QM trat. AQM resíduo a

Blocos J – 1 Variabilidade devido

aos blocosSQ blocosGL blocos

QM blocosQM resíduo a

Resíduo a(A*bloco)

(I – 1)(J – 1)Variabilidade da

parcelaSQ resíduo aGL resíduo a

B K – 1 Variabilidade devido

ao fator BSQ trat. BGL trat. B

QM trat. BQM resíduo b

A*B (I – 1)(K – 1)Variabilidade devido

a interação A*BSQ (A*B)GL (A*B)

QM trat. A*BQM resíduo b

Resíduo b I(J – 1)(K– 1) Por diferençaSQ resíduo b GL resíduo b

-

Total IJK – 1 Variabilidade total - -

Delineamento fatorial

44

45

46

“We have discussed the practice of using different data

transformations within a 2-way ANOVA with our statistical adviser and

he stated that this is not valid , since the comparisons are not then

between data of the same type. Transformation is performed t o deal

with 1 or more of 3 problems: non-normality, non-homogeneit y of

variance and non-additivity . To my understanding, in a 2-way analysis,

'individualized' transformations, while solving the firs t two problems,

would work against the third requirement of ANOVA, that trea tment

effects are additive. For instance, data in which treatment effect was

multiplicative rather than additive are appropriately tra nsformed to

logs, since the treatment effects then become additive. But these

could not then be compared with data that had not been transfo rmed

because they already fulfilled the ANOVA requirements. You would be

comparing oranges and bananas .”

“Sorry about the confusion induced by my last set of comments on

the statistics. I think there might be still some sort of prob lem there, in

that your comparison of the 30-min plaque solid data is on a

somewhat different basis from the other comparisons. But I w ill

discuss it when I next see our statistical advisor. I suspect that I put

the question to him in a misleading way, combined with a mis-

interpretation of your analysis.”

47

Obrigadapela atenção!!!

[email protected]