a escolha do mÉtodo estatÍstico - profa. dra. lívia maria andaló tenuta (unicamp)

Upload: gisele-tobias

Post on 19-Jul-2015

45 views

Category:

Documents


0 download

TRANSCRIPT

Universidade Estadual de CampinasFaculdade de Odontologia de Piracicaba

A escolha do mtodo estatstico

Profa. Dra. Livia M. A. Tenuta [email protected]

Universidade Estadual de CampinasFaculdade de Odontologia de Piracicaba

A escolha do mtodo estatstico- Probabilidades, hipteses e delineamentos -

1

A notcia boa que a estatstica est se tornando mais fcil e acessvel. A notcia ruim que a estatstica est se tornando mais fcil e acessvel.Hofacker, 1983

Para muitos, estatstica ...

2

Figueira CV, 2006

Para outros...

Estatstica a arte de torturar os dados at que eles digam o que se quer ouvirMills, 1993, Susin & Rsing, 1999

3

Jim Borgman, New York Times, 27 April 1997

4

Testes estatsticos mais comunsNmero e tipo de grupos Independentes (no pareados) 2 grupos Dependentes (pareados) Independentes (no pareados) 3 ou mais grupos Dependentes (pareados) Paramtrico Teste t para amostras independentes Teste t para amostras dependentes ANOVA ANOVA medidas repetidas No paramtrico Teste de MannWhitney Teste de Wilcoxon

Teste de KruskalWallis Teste de Friedman

Susin C. Basic statistical analysis for dental research.In: Rode SM, Dias KRHC, Frana CM. Handbook of scientific methodology. IADR latinoamericana, 2009

Mtodos de regresso mais comunsTipo de observaes Independentes Dados contnuos Regresso linear Regresso linear com erro padro ajustado para o agrupamento das observaes Dados categricos Regresso logstica dicotmica, multinomial e ordenada Regresso logstica condicional e extenses

Dependentes

Susin C. Basic statistical analysis for dental research.In: Rode SM, Dias KRHC, Frana CM. Handbook of scientific methodology. IADR latinoamericana, 2009

5

Estudo cruzado duplo-cego Controle negativo: H2O Controle positivo: 1.5% Sacarose Controle ativo: 1.5% Lactose Experimental: Zero CalR Controle negativo: sem dentifrcio Controle ativo: MFP/SiO2 Experimental: MFP/CaCO3

Pesquisa cientficaPergunta (???) curiosidade cientfica! Delineamento experimental adequado para testar a pergunta Variveis resposta que ajudem a explicar o fenmeno

6

Estatstica experimentalDesmineralizao dental (% perda de dureza)Tratamento A: 21,5% 23,6% 39,7% 29,5% 32,7% Mdia 29,4% Mdia Tratamento B: 18,9% 24,4% 26,7% 19,4% 17,8% 21,4%

Diferena estimada entre A e B: 8%

Estatstica experimentalExiste uma real diferena entre os tratamentos A e B? Para descobrir, o experimento deveria ser repetido infinitas vezes!

7

Estatstica experimentalInferncia estatstica: determina a probabilidade de estimar se uma real diferena entre tratamentos existeNvel de significncia (p): probabilidade de erro ao afirmar que h diferena entre os tratamentos

Estatstica experimentalDesmineralizao dental (% perda de dureza)Tratamento A: 21,5% 23,6% 39,7% 29,5% 32,7% Mdia DP 29,4% 7,3% Mdia DP Tratamento B: 18,9% 24,4% 26,7% 19,4% 17,8% 21,4% 3,9%

8

Variao do acaso: toda variao devido a fatores no controlveis. Pode ser medida atravs do desvio em relao a mdia

ANOVA Anlise da varinciaQuanto da variabilidade observada devido ao acaso ou a um real efeito do tratamento

9

Efeito de 2 dentifrcios na concentrao de F no fluido do biofilme(M F, mdia, n=56)

Dentifrcio A 5,5

Dentifrcio B 11,4

Efeito de 2 dentifrcios na concentrao de F no fluido do biofilme(M F, mdia DP, n=56)

Dentifrcio A 5,5 4,5

Dentifrcio B 11,4 21,0

10

Concentrao de F no fluido do biofilme dental exposto a 2 dentifrcios

11

Eliminando o outlier

12

Transformao sugerida pelo pacote estatstico: inversa

13

Delineamento inteiramente aleatorizado

Esquema da anlise de varincia:Fonte de variao Tratamento Resduo Total Graus de liberdade I1 I (J 1) IJ 1 Soma de Quadrados Variabilidade devido ao tratamento Por diferena Variabilidade total Quadrado mdio SQ tratamento GL trat. SQ resduo GL resduo F QM tratamento QM resduo -

I = nmero de nveis do tratamento J = nmero de repeties

Delineamento inteiramente aleatorizadoModelo matemtico:Yij = + ti + eijOnde: Yij = valor da varivel testada sob o i-simo nvel de tratamento = mdia geral do experimento para a varivel ti = efeito do i-simo nvel de tratamento eij = erro aleatrio

14

Controle

70 ppm F

140 ppm F

280 ppm F

Estatstica experimentalTeste de hipteses: regra de deciso para rejeitar ou no uma hiptese estatstica com base nos elementos amostraisH0 (hiptese nula): hiptese que ser testada estatisticamente Ha (hiptese alternativa): suposio que o pesquisador quer estudar

15

Delineamento inteiramente aleatorizado

Hipteses:H0 = t1 = t2 = ... = tI = 0 Ha = ti 0

Estatstica experimental

Ao rejeitar H0, com nvel de significncia de 5%, por exemplo, o pesquisador automaticamente aceita sua hiptese alternativa

16

In relation to any experiment we may speak of the null hypothesis, and it should be noted that the null hypothesis is never proved or established, but is possibly disproved, in the course of experimentation. Every experiment may be said to exist only in order to give the facts a chance of disproving the null hypothesis.

Fisher RA

Estatstica experimentalDesmineralizao dental (% perda de dureza)Tratamento A: 21,5% 23,6% 39,7% 29,5% 32,7% Mdia 29,4% Mdia Tratamento B: 18,9% 24,4% 26,7% 19,4% 17,8% 21,4%

Diferem ao nvel de significncia de 5%

Erro tipo I (): probabilidade de erro ao se rejeitar a hiptese de nulidade quando ela verdadeira, ou seja, probabilidade de apontar um falso positivo

17

Trabalhando com probabilidades...Nvel de significncia de 5% significa que aceitamos errar em 1 a cada 20 casosCorrelao entre variveis: se eu tiver 10 variveis e for estudar a correlao entre elas, tenho 45 comparaes (10*(10-1)/2 = 45) Em 5% delas, posso ver uma correlao significativa por mero acaso! 0,05* 45 = 2,25!Hofacker CS, 1983

Erro tipo II (): probabilidade de erro ao no rejeitar a hiptese de nulidade quando ela de fato falsa, ou seja, probabilidade de apontar um falso negativo

funo do: a) nmero de repeties b) variabilidade dos dados c) real diferena entre os grupos

18

Repetio

Proporciona uma estimativa do erro experimental (variabilidade), permitindo a estimativa do efeito dos tratamentos.

Repetion=3Tratamento A: 20 24 25 Mdia 23 Mdia Tratamento B: 17 22 24 21

Teste t comparando A e B: p=0,48

19

Repetion=30Tratamento A: 20, 24, 25, 21, 23, 25, 20, 23, 26, 20, 24, 25, 20, 24, 25, 22, 24, 23, 21, 23, 26, 19, 24, 25, 20, 24, 25, 19, 25, 25 Mdia 23 Tratamento B: 15, 22, 26, 16, 23, 24, 15, 24, 24, 17, 22, 24, 17, 22, 24, 17, 16, 22, 24, 23, 24, 17, 22, 24, 17, 22, 24, 14, 24, 25 Mdia 21

Teste t comparando A e B: p=0,0137

Repetion=3Tratamento A: 20 24 25 Mdia 23 Mdia Tratamento B: 10 13 16 13

Diferena entre A e B = 10

Teste t comparando A e B: p=0,0123

20

Repetion=3Tratamento A: 20 24 25 Mdia DP 23 2,6 Mdia DP Tratamento B: 10 13 16 13 3,0

Repetion=3Tratamento A: 13 21 35 Mdia DP 23 11,1 Mdia DP Tratamento B: 5 10 24 13 9,9

Teste t comparando A e B: p=0,31

21

Poder estatsticoErro tipo II (): probabilidade de erro ao no rejeitar a hiptese de nulidade quando ela de fato falsa, ou seja, probabilidade de apontar um falso negativoPoder do teste estatstico: Capacidade do teste em apontar diferenas quando elas realmente existem Erro tipo II () = 10% Poder = 1 = 90%

22

Delineamento inteiramente aleatorizado

Esquema da anlise de varincia:Fonte de variao Tratamento Resduo Total Graus de liberdade I1 I (J 1) IJ 1 Soma de Quadrados Variabilidade devido ao tratamento Por diferena Variabilidade total Quadrado mdio SQ tratamento GL trat. SQ resduo GL resduo F QM tratamento QM resduo -

I = nmero de nveis do tratamento J = nmero de repeties

Poder estatsticoReviewer: What were criteria for sample size selection? Was it to reach estimated power (80%)?The sample size selection was based on a pilot study, made with 3 volunteers, who ingested the 550 g F/g dentifrice, on fasting, after breakfast or after lunch, and we used the AUC of salivary F concentration as the response variable. In fact, we intended to determine the number of volunteers necessary to detect differences between the gastric content situations using the low F dentifrice, with 80% power. From this pilot study, a low standard deviation was observed between volunteers for each gastric content condition. Using the SAS System 8.01, considering the differences obtained from the mean of these treatments, we could reach 80% power if we used nine volunteers. For 11 volunteers, the power would increase to 90%. Considering that volunteers could be lost during the 9-phase study, we opted to select 11 volunteers. Actually, we could significantly reject H0 in the experiment, and therefore we havent worried in mention this in the text, but we added the power information in the text.

23

Princpios bsicos da experimentao1. Repetio 2. Aleatorizao 3. Cegamento 4. Controle local (blocos estatsticos)

Aleatorizao

Proporciona a todos os tratamentos a mesma probabilidade de serem designados a qualquer das unidades experimentais

24

Aleatorizao = sorteio!

Aleatorizao no Excel

Exemplo: Dividir 16 espcimes em 4 tratamentos (cada um com 4 espcimes)

25

Classificar pela coluna Aleatrio

ATENO: Para que o sorteio seja feito corretamente, apenas as colunas Tratamento e Aleatrio devem ser selecionadas!

26

Ao classificar por um nmero aleatrio, automaticamente o tratamento ficar aleatorizado!

Portanto, os espcimes 1, 6, 7 e 8 devem receber o tratamento 1, e assim sucessivamente...

27

Aleatorizao com restrioA distribuio dos espcimes entre os tratamentos feita de modo restrito, para evitar que algum tratamento seja favorecido pela aleatorizao.Exemplo: quando se conhece a dureza inicial de blocos dentais, possvel sorte-los aos tratamentos de acordo com sua dureza

E a mdia de dureza entre os grupos apresenta-se apresentahomognea.

28

RealizandoRealizando-se a aleatorizao sem restrio, as diferenas entre durezas dos espcimes distribudos aos 4 nveis de tratamento so mais evidentes.

CegamentoEstudo cego: o pesquisador no tem acesso identificao de qual nvel de tratamento se trata.

29

Vieira, S. Estatstica experimental. 2.ed. 1999

CegamentoEstudo cego: o pesquisador no tem acesso identificao de qual nvel de tratamento se trata. Quando voluntrios esto envolvidos, estes tambm no devem saber de qual tratamento esto participando estudo duplo cego

30

Delineamento aleatorizado em blocosUtiliza os princpios da repetio, aleatorizao e controle localExemplo: avaliar o efeito do dentifrcio fluoretado, em 2 nveis, na concentrao de F na saliva, utilizando 14 voluntrios como blocos estatsticos

Delineamento aleatorizado em blocosModelo matemtico:Yij = + ti + bj + eijkOnde: Yij = valor da varivel testada sob o i-simo nvel de tratamento e no j-simo bloco = mdia geral do experimento para a varivel ti = efeito do i-simo nvel de tratamento bj = efeito do j-simo nvel de voluntrio eij = erro aleatrio

31

Delineamento aleatorizado em blocos

Hipteses:H0 = t1 = t2 = ... = tI = 0 Ha = ti 0

Delineamento aleatorizado em blocosEsquema da anlise de varincia:Fonte de variao Tratamento Blocos Resduo Total Graus de liberdade I1 J1 (I 1)(J 1) IJ 1 Soma de Quadrados Variabilidade devido ao tratamento Variabilidade devido aos blocos Por diferena Variabilidade total Quadrado mdio SQ tratamento GL trat. SQ blocos GL blocos SQ resduo GL resduo F QM tratamento QM resduo QM blocos QM resduo -

I = nmero de nveis do tratamento J = nmero de blocos

32

Delineamento aleatorizado em blocos

A variabilidade devido aos blocos (voluntrios, p.ex.) pode ser estimada, diminuindo a variabilidade devido ao acaso (erro experimental)

33

Delineamento cruzadoFase 1 Voluntrios grupo 1 Voluntrios grupo 2 Voluntrios grupo 3 Tratamento A Tratamento B Tratamento C Fase 2 Fase 3

Delineamentos de tratamentos1. Fatorial 2. Parcelas subdivididas

34

Experimentos fatoriaisDerivam do interesse em testar o efeito de dois ou mais tipos de tratamentos no mesmo experimento. Cada tipo de tratamento referido como um fator.

Experimentos fatoriaisExemplo: avaliar o efeito do dentifrcio fluoretado, em 2 nveis, e da freqncia de exposio do biofilme dental a sacarose, em 4 nveis, na desmineralizao dental.Fatorial 2 x 4

35

Experimentos fatoriaisA combinao de tratamentos resultantes o resultado da interao dos fatores a serem testados. No exemplo, h 8 combinaes possveis de tratamentos:500 ppm F, exposio ao acar 2x/dia 500 ppm F, exposio ao acar 4x/dia 500 ppm F, exposio ao acar 6x/dia 500 ppm F, exposio ao acar 8x/dia 1100 ppm F, exposio ao acar 2x/dia 1100 ppm F, exposio ao acar 4x/dia 1100 ppm F, exposio ao acar 6x/dia 1100 ppm F, exposio ao acar 8x/dia

Delineamento fatorialModelo matemtico:Yij = + Ai + Bj + Ai*Bj + eijkOnde: Yij = valor da varivel testada sob o i-simo nvel do fator A e jsimo nvel do fator B = mdia geral do experimento para a varivel Ai = efeito do i-simo nvel do fator A Bj = efeito do j-simo nvel do fator B Ai*Bj = efeito da interao A e B eij = erro aleatrio

36

Delineamento fatorialHipteses:(1) H0 = A1 = A2 = ... = AI = 0 Ha = Ai 0 (2) H0 = B1 = B2 = ... = BJ = 0 Ha = Bj 0 (3) H0 = (A*B)ij = 0 Ha = (A*B)ij 0

Delineamento fatorialEsquema da anlise de varincia:Fonte de variao A B A*B Resduo Total Graus de liberdade I1 J1 (I 1)(J 1) IJ (K 1) IJ 1 Soma de Quadrados Variabilidade devido ao fator A Variabilidade devido ao fator B Variabilidade devido a interao A*B Por diferena Variabilidade total Quadrado mdio SQ trat. A GL trat. A SQ trat. B GL trat. B SQ (A*B) GL (A*B) SQ resduo GL resduo F QM trat. A QM resduo QM trat. B QM resduo QM trat. A*B QM resduo -

I = nmero de nveis do fator A J = nmero de nveis do fator B K = nmero de repeties

37

Varivel resposta

No h efeito significativo B1 B2 de A (A1 = A2) No h efeito significativo de B (B1 = B2) No h efeito da interao A1 A2

Varivel resposta

H efeito significativo de A (A2 > A1) B1 B2 No h efeito significativo de B (B1 = B2) No h efeito da interao A1 A2

Varivel resposta

B1

No h efeito significativo de A (A1 = A2)

B2

H efeito significativo de B (B1 > B2) No h efeito da interao A2

A1 Varivel resposta

B1

H efeito significativo de A (A2 > A1) H efeito significativo de B (B1 > B2) No h efeito da interao

B2

A1

A2

38

Varivel resposta

B1

Interao devido a diferena na grandeza da

B2

resposta

A1 Varivel resposta

A2

B1 B2

Interao devido a diferena na direo da resposta

A1

A2

39

Efeito de 2 dentifrcios na concentrao de F no fluido do biofilme em funo da freqncia de exposio a sacarose(M F, mdia DP, n=14) Frequncia exposio do biofilme sacarose 2x 4x 6x 8x

Dentifrcio A 5,6 4,7 4,4 1,3 5,1 2,3 6,8 7,2

Dentifrcio B 7,2 4,8 10,1 12,8 8,2 6,2 8,0 6,4

Houve efeito significativo do fator dentifrcio na concentrao de F no fluido do biofilme dental (p