a escolha do mÉtodo estatÍstico - profa. dra. lívia maria andaló tenuta (unicamp)
TRANSCRIPT
Universidade Estadual de CampinasFaculdade de Odontologia de Piracicaba
A escolha do mtodo estatstico
Profa. Dra. Livia M. A. Tenuta [email protected]
Universidade Estadual de CampinasFaculdade de Odontologia de Piracicaba
A escolha do mtodo estatstico- Probabilidades, hipteses e delineamentos -
1
A notcia boa que a estatstica est se tornando mais fcil e acessvel. A notcia ruim que a estatstica est se tornando mais fcil e acessvel.Hofacker, 1983
Para muitos, estatstica ...
2
Figueira CV, 2006
Para outros...
Estatstica a arte de torturar os dados at que eles digam o que se quer ouvirMills, 1993, Susin & Rsing, 1999
3
Jim Borgman, New York Times, 27 April 1997
4
Testes estatsticos mais comunsNmero e tipo de grupos Independentes (no pareados) 2 grupos Dependentes (pareados) Independentes (no pareados) 3 ou mais grupos Dependentes (pareados) Paramtrico Teste t para amostras independentes Teste t para amostras dependentes ANOVA ANOVA medidas repetidas No paramtrico Teste de MannWhitney Teste de Wilcoxon
Teste de KruskalWallis Teste de Friedman
Susin C. Basic statistical analysis for dental research.In: Rode SM, Dias KRHC, Frana CM. Handbook of scientific methodology. IADR latinoamericana, 2009
Mtodos de regresso mais comunsTipo de observaes Independentes Dados contnuos Regresso linear Regresso linear com erro padro ajustado para o agrupamento das observaes Dados categricos Regresso logstica dicotmica, multinomial e ordenada Regresso logstica condicional e extenses
Dependentes
Susin C. Basic statistical analysis for dental research.In: Rode SM, Dias KRHC, Frana CM. Handbook of scientific methodology. IADR latinoamericana, 2009
5
Estudo cruzado duplo-cego Controle negativo: H2O Controle positivo: 1.5% Sacarose Controle ativo: 1.5% Lactose Experimental: Zero CalR Controle negativo: sem dentifrcio Controle ativo: MFP/SiO2 Experimental: MFP/CaCO3
Pesquisa cientficaPergunta (???) curiosidade cientfica! Delineamento experimental adequado para testar a pergunta Variveis resposta que ajudem a explicar o fenmeno
6
Estatstica experimentalDesmineralizao dental (% perda de dureza)Tratamento A: 21,5% 23,6% 39,7% 29,5% 32,7% Mdia 29,4% Mdia Tratamento B: 18,9% 24,4% 26,7% 19,4% 17,8% 21,4%
Diferena estimada entre A e B: 8%
Estatstica experimentalExiste uma real diferena entre os tratamentos A e B? Para descobrir, o experimento deveria ser repetido infinitas vezes!
7
Estatstica experimentalInferncia estatstica: determina a probabilidade de estimar se uma real diferena entre tratamentos existeNvel de significncia (p): probabilidade de erro ao afirmar que h diferena entre os tratamentos
Estatstica experimentalDesmineralizao dental (% perda de dureza)Tratamento A: 21,5% 23,6% 39,7% 29,5% 32,7% Mdia DP 29,4% 7,3% Mdia DP Tratamento B: 18,9% 24,4% 26,7% 19,4% 17,8% 21,4% 3,9%
8
Variao do acaso: toda variao devido a fatores no controlveis. Pode ser medida atravs do desvio em relao a mdia
ANOVA Anlise da varinciaQuanto da variabilidade observada devido ao acaso ou a um real efeito do tratamento
9
Efeito de 2 dentifrcios na concentrao de F no fluido do biofilme(M F, mdia, n=56)
Dentifrcio A 5,5
Dentifrcio B 11,4
Efeito de 2 dentifrcios na concentrao de F no fluido do biofilme(M F, mdia DP, n=56)
Dentifrcio A 5,5 4,5
Dentifrcio B 11,4 21,0
10
Concentrao de F no fluido do biofilme dental exposto a 2 dentifrcios
11
Eliminando o outlier
12
Transformao sugerida pelo pacote estatstico: inversa
13
Delineamento inteiramente aleatorizado
Esquema da anlise de varincia:Fonte de variao Tratamento Resduo Total Graus de liberdade I1 I (J 1) IJ 1 Soma de Quadrados Variabilidade devido ao tratamento Por diferena Variabilidade total Quadrado mdio SQ tratamento GL trat. SQ resduo GL resduo F QM tratamento QM resduo -
I = nmero de nveis do tratamento J = nmero de repeties
Delineamento inteiramente aleatorizadoModelo matemtico:Yij = + ti + eijOnde: Yij = valor da varivel testada sob o i-simo nvel de tratamento = mdia geral do experimento para a varivel ti = efeito do i-simo nvel de tratamento eij = erro aleatrio
14
Controle
70 ppm F
140 ppm F
280 ppm F
Estatstica experimentalTeste de hipteses: regra de deciso para rejeitar ou no uma hiptese estatstica com base nos elementos amostraisH0 (hiptese nula): hiptese que ser testada estatisticamente Ha (hiptese alternativa): suposio que o pesquisador quer estudar
15
Delineamento inteiramente aleatorizado
Hipteses:H0 = t1 = t2 = ... = tI = 0 Ha = ti 0
Estatstica experimental
Ao rejeitar H0, com nvel de significncia de 5%, por exemplo, o pesquisador automaticamente aceita sua hiptese alternativa
16
In relation to any experiment we may speak of the null hypothesis, and it should be noted that the null hypothesis is never proved or established, but is possibly disproved, in the course of experimentation. Every experiment may be said to exist only in order to give the facts a chance of disproving the null hypothesis.
Fisher RA
Estatstica experimentalDesmineralizao dental (% perda de dureza)Tratamento A: 21,5% 23,6% 39,7% 29,5% 32,7% Mdia 29,4% Mdia Tratamento B: 18,9% 24,4% 26,7% 19,4% 17,8% 21,4%
Diferem ao nvel de significncia de 5%
Erro tipo I (): probabilidade de erro ao se rejeitar a hiptese de nulidade quando ela verdadeira, ou seja, probabilidade de apontar um falso positivo
17
Trabalhando com probabilidades...Nvel de significncia de 5% significa que aceitamos errar em 1 a cada 20 casosCorrelao entre variveis: se eu tiver 10 variveis e for estudar a correlao entre elas, tenho 45 comparaes (10*(10-1)/2 = 45) Em 5% delas, posso ver uma correlao significativa por mero acaso! 0,05* 45 = 2,25!Hofacker CS, 1983
Erro tipo II (): probabilidade de erro ao no rejeitar a hiptese de nulidade quando ela de fato falsa, ou seja, probabilidade de apontar um falso negativo
funo do: a) nmero de repeties b) variabilidade dos dados c) real diferena entre os grupos
18
Repetio
Proporciona uma estimativa do erro experimental (variabilidade), permitindo a estimativa do efeito dos tratamentos.
Repetion=3Tratamento A: 20 24 25 Mdia 23 Mdia Tratamento B: 17 22 24 21
Teste t comparando A e B: p=0,48
19
Repetion=30Tratamento A: 20, 24, 25, 21, 23, 25, 20, 23, 26, 20, 24, 25, 20, 24, 25, 22, 24, 23, 21, 23, 26, 19, 24, 25, 20, 24, 25, 19, 25, 25 Mdia 23 Tratamento B: 15, 22, 26, 16, 23, 24, 15, 24, 24, 17, 22, 24, 17, 22, 24, 17, 16, 22, 24, 23, 24, 17, 22, 24, 17, 22, 24, 14, 24, 25 Mdia 21
Teste t comparando A e B: p=0,0137
Repetion=3Tratamento A: 20 24 25 Mdia 23 Mdia Tratamento B: 10 13 16 13
Diferena entre A e B = 10
Teste t comparando A e B: p=0,0123
20
Repetion=3Tratamento A: 20 24 25 Mdia DP 23 2,6 Mdia DP Tratamento B: 10 13 16 13 3,0
Repetion=3Tratamento A: 13 21 35 Mdia DP 23 11,1 Mdia DP Tratamento B: 5 10 24 13 9,9
Teste t comparando A e B: p=0,31
21
Poder estatsticoErro tipo II (): probabilidade de erro ao no rejeitar a hiptese de nulidade quando ela de fato falsa, ou seja, probabilidade de apontar um falso negativoPoder do teste estatstico: Capacidade do teste em apontar diferenas quando elas realmente existem Erro tipo II () = 10% Poder = 1 = 90%
22
Delineamento inteiramente aleatorizado
Esquema da anlise de varincia:Fonte de variao Tratamento Resduo Total Graus de liberdade I1 I (J 1) IJ 1 Soma de Quadrados Variabilidade devido ao tratamento Por diferena Variabilidade total Quadrado mdio SQ tratamento GL trat. SQ resduo GL resduo F QM tratamento QM resduo -
I = nmero de nveis do tratamento J = nmero de repeties
Poder estatsticoReviewer: What were criteria for sample size selection? Was it to reach estimated power (80%)?The sample size selection was based on a pilot study, made with 3 volunteers, who ingested the 550 g F/g dentifrice, on fasting, after breakfast or after lunch, and we used the AUC of salivary F concentration as the response variable. In fact, we intended to determine the number of volunteers necessary to detect differences between the gastric content situations using the low F dentifrice, with 80% power. From this pilot study, a low standard deviation was observed between volunteers for each gastric content condition. Using the SAS System 8.01, considering the differences obtained from the mean of these treatments, we could reach 80% power if we used nine volunteers. For 11 volunteers, the power would increase to 90%. Considering that volunteers could be lost during the 9-phase study, we opted to select 11 volunteers. Actually, we could significantly reject H0 in the experiment, and therefore we havent worried in mention this in the text, but we added the power information in the text.
23
Princpios bsicos da experimentao1. Repetio 2. Aleatorizao 3. Cegamento 4. Controle local (blocos estatsticos)
Aleatorizao
Proporciona a todos os tratamentos a mesma probabilidade de serem designados a qualquer das unidades experimentais
24
Aleatorizao = sorteio!
Aleatorizao no Excel
Exemplo: Dividir 16 espcimes em 4 tratamentos (cada um com 4 espcimes)
25
Classificar pela coluna Aleatrio
ATENO: Para que o sorteio seja feito corretamente, apenas as colunas Tratamento e Aleatrio devem ser selecionadas!
26
Ao classificar por um nmero aleatrio, automaticamente o tratamento ficar aleatorizado!
Portanto, os espcimes 1, 6, 7 e 8 devem receber o tratamento 1, e assim sucessivamente...
27
Aleatorizao com restrioA distribuio dos espcimes entre os tratamentos feita de modo restrito, para evitar que algum tratamento seja favorecido pela aleatorizao.Exemplo: quando se conhece a dureza inicial de blocos dentais, possvel sorte-los aos tratamentos de acordo com sua dureza
E a mdia de dureza entre os grupos apresenta-se apresentahomognea.
28
RealizandoRealizando-se a aleatorizao sem restrio, as diferenas entre durezas dos espcimes distribudos aos 4 nveis de tratamento so mais evidentes.
CegamentoEstudo cego: o pesquisador no tem acesso identificao de qual nvel de tratamento se trata.
29
Vieira, S. Estatstica experimental. 2.ed. 1999
CegamentoEstudo cego: o pesquisador no tem acesso identificao de qual nvel de tratamento se trata. Quando voluntrios esto envolvidos, estes tambm no devem saber de qual tratamento esto participando estudo duplo cego
30
Delineamento aleatorizado em blocosUtiliza os princpios da repetio, aleatorizao e controle localExemplo: avaliar o efeito do dentifrcio fluoretado, em 2 nveis, na concentrao de F na saliva, utilizando 14 voluntrios como blocos estatsticos
Delineamento aleatorizado em blocosModelo matemtico:Yij = + ti + bj + eijkOnde: Yij = valor da varivel testada sob o i-simo nvel de tratamento e no j-simo bloco = mdia geral do experimento para a varivel ti = efeito do i-simo nvel de tratamento bj = efeito do j-simo nvel de voluntrio eij = erro aleatrio
31
Delineamento aleatorizado em blocos
Hipteses:H0 = t1 = t2 = ... = tI = 0 Ha = ti 0
Delineamento aleatorizado em blocosEsquema da anlise de varincia:Fonte de variao Tratamento Blocos Resduo Total Graus de liberdade I1 J1 (I 1)(J 1) IJ 1 Soma de Quadrados Variabilidade devido ao tratamento Variabilidade devido aos blocos Por diferena Variabilidade total Quadrado mdio SQ tratamento GL trat. SQ blocos GL blocos SQ resduo GL resduo F QM tratamento QM resduo QM blocos QM resduo -
I = nmero de nveis do tratamento J = nmero de blocos
32
Delineamento aleatorizado em blocos
A variabilidade devido aos blocos (voluntrios, p.ex.) pode ser estimada, diminuindo a variabilidade devido ao acaso (erro experimental)
33
Delineamento cruzadoFase 1 Voluntrios grupo 1 Voluntrios grupo 2 Voluntrios grupo 3 Tratamento A Tratamento B Tratamento C Fase 2 Fase 3
Delineamentos de tratamentos1. Fatorial 2. Parcelas subdivididas
34
Experimentos fatoriaisDerivam do interesse em testar o efeito de dois ou mais tipos de tratamentos no mesmo experimento. Cada tipo de tratamento referido como um fator.
Experimentos fatoriaisExemplo: avaliar o efeito do dentifrcio fluoretado, em 2 nveis, e da freqncia de exposio do biofilme dental a sacarose, em 4 nveis, na desmineralizao dental.Fatorial 2 x 4
35
Experimentos fatoriaisA combinao de tratamentos resultantes o resultado da interao dos fatores a serem testados. No exemplo, h 8 combinaes possveis de tratamentos:500 ppm F, exposio ao acar 2x/dia 500 ppm F, exposio ao acar 4x/dia 500 ppm F, exposio ao acar 6x/dia 500 ppm F, exposio ao acar 8x/dia 1100 ppm F, exposio ao acar 2x/dia 1100 ppm F, exposio ao acar 4x/dia 1100 ppm F, exposio ao acar 6x/dia 1100 ppm F, exposio ao acar 8x/dia
Delineamento fatorialModelo matemtico:Yij = + Ai + Bj + Ai*Bj + eijkOnde: Yij = valor da varivel testada sob o i-simo nvel do fator A e jsimo nvel do fator B = mdia geral do experimento para a varivel Ai = efeito do i-simo nvel do fator A Bj = efeito do j-simo nvel do fator B Ai*Bj = efeito da interao A e B eij = erro aleatrio
36
Delineamento fatorialHipteses:(1) H0 = A1 = A2 = ... = AI = 0 Ha = Ai 0 (2) H0 = B1 = B2 = ... = BJ = 0 Ha = Bj 0 (3) H0 = (A*B)ij = 0 Ha = (A*B)ij 0
Delineamento fatorialEsquema da anlise de varincia:Fonte de variao A B A*B Resduo Total Graus de liberdade I1 J1 (I 1)(J 1) IJ (K 1) IJ 1 Soma de Quadrados Variabilidade devido ao fator A Variabilidade devido ao fator B Variabilidade devido a interao A*B Por diferena Variabilidade total Quadrado mdio SQ trat. A GL trat. A SQ trat. B GL trat. B SQ (A*B) GL (A*B) SQ resduo GL resduo F QM trat. A QM resduo QM trat. B QM resduo QM trat. A*B QM resduo -
I = nmero de nveis do fator A J = nmero de nveis do fator B K = nmero de repeties
37
Varivel resposta
No h efeito significativo B1 B2 de A (A1 = A2) No h efeito significativo de B (B1 = B2) No h efeito da interao A1 A2
Varivel resposta
H efeito significativo de A (A2 > A1) B1 B2 No h efeito significativo de B (B1 = B2) No h efeito da interao A1 A2
Varivel resposta
B1
No h efeito significativo de A (A1 = A2)
B2
H efeito significativo de B (B1 > B2) No h efeito da interao A2
A1 Varivel resposta
B1
H efeito significativo de A (A2 > A1) H efeito significativo de B (B1 > B2) No h efeito da interao
B2
A1
A2
38
Varivel resposta
B1
Interao devido a diferena na grandeza da
B2
resposta
A1 Varivel resposta
A2
B1 B2
Interao devido a diferena na direo da resposta
A1
A2
39
Efeito de 2 dentifrcios na concentrao de F no fluido do biofilme em funo da freqncia de exposio a sacarose(M F, mdia DP, n=14) Frequncia exposio do biofilme sacarose 2x 4x 6x 8x
Dentifrcio A 5,6 4,7 4,4 1,3 5,1 2,3 6,8 7,2
Dentifrcio B 7,2 4,8 10,1 12,8 8,2 6,2 8,0 6,4
Houve efeito significativo do fator dentifrcio na concentrao de F no fluido do biofilme dental (p