anova 2 fatores - prof. ivan balducci

Upload: lucas-franco

Post on 11-Jul-2015

82 views

Category:

Documents


0 download

TRANSCRIPT

Introduo

ANOVA 2 fatores (two-way)

Em muitos trabalhos que envolvem a realizao de experimentos, comum os pesquisadores se depararem com a questo: como avaliar se os resultados obtidos so confiveis? Sabemos que qualquer medida realizada sempre afetada por erros. Erros muito pequenos no traro grandes implicaes. Contudo, se forem significativos, podero prejudicar seriamente os resultados levando a falsas concluses. Portanto conhecer a natureza dos erros e preparar planejamentos que possam minimiz-los uma estratgia que deve estar presente no dia-a-dia de todo pesquisador. Existem dois tipos de erros, o erro sistemtico e o erro aleatrio. O primeiro tem como caracterstica afetar os resultados dos experimentos sempre na mesma direo, seja para mais ou para menos. Um exemplo simples deste tipo de situao o caso de uma balana descalibrada que pode indicar sempre massas maiores que as reais. Mas vale notar que os erros sistemticos podem ser identificados e, portanto, evitados. Por outro lado, h um tipo de erro que afeta as medidas sem nenhuma tendncia clara. As medidas podem oscilar, ora para mais, ora para menos. Este tipo e erro chamado de erro aleatrio e, infelizmente, sempre estar presente em maior ou menor grau. Ao fazer um estudo sempre interessante fazer replicatas, repeties, pois permite que o erro presente nas medidas seja investigado. Alm disso, com a realizao de vrias replicatas aumentam as chances de se aproximar mais do valor exato. Isto evidenciado por um importante princpio da estatstica: o teorema do limite central, que comprova que o erro no valor mdio menor que o erro de uma observao individual (referncia: Barros Neto, B,Scarminio, I.S., Bruns, R.E. Como fazer experimentos: pesquisa e desenvolvimento na cincia e na indstria. Ed. da Unicamp; Campinas, 2001).

Muitas vezes as caractersticas do procedimento experimental dificultam muito a execuo de replicatas autnticas. No correto simplesmente realizar duas medidas do mesmo experimento de forma seqencial, pois um erro que afetar a primeira medida certamente ir, de forma sistemtica, afetar a seguinte. No so raros os casos em que o ajuste das condies experimentais extremamente trabalhoso ou lento. Portanto, parece haver um dilema, realizar medidas com duplicatas e arcarI

nessa introduo as idias expostas foram copiadas do artigo: Conseqncias da anlise incorreta de experimentos blocados, sob autoria de Joo Alexandre Bortoloti e Roy Edward Bruns. Artigo publicado na revista Qumica Nova, vol. 30, n 2, pgs. 436-440, 2007.

2

com o custo do trabalho envolvido, mas garantir a qualidade das medidas, ou evitar um grande esforo no laboratrio, mas correr o risco de ter todo o seu trabalho prejudicado. neste contexto que surge uma interessante possibilidade, a blocagem dos experimentos.continuao da aula sobre Anova 1 fator

Ao analisar os dados classificados em dupla-entrada, temos de aplicar o mtodo da classificao 1 fator duas vezes: - uma vez para cada sistema de classificao. Em resumo, a anova 1 fator duas vezes (uma vez para o fator na coluna e uma vez para o fator na linha). Veremos a aplicao desse mtodo (anova 2 fatores) em dois tipos de delineamentos: CRD e CRBD sob presena ou ausncia de repeties, replicatas. Por repetio (replicata) se entende um teste completo de todos os tratamentos no experimento (a replication is a complete run for all treatments to be tested in the experiment). 1) experimento inteiramente ao acaso (completely randomized design, CRD) sem repeties; 2) experimento em blocos ao acaso (randomized complete block design (CRBD) sem repeties;

3) experimento em blocos ao acaso (CRBD) com repeties; 4) experimento inteiramente casualizado (CRD) com repeties.

3

1) CRD. Experimento inteiramente ao acaso , sem repeties. Exemplo 1. Por exemplo, 12 jovens foram classificados em trs grupos de acordo com a idade deles. Ao mesmo tempo eles foram classificados de acordo com o sexo em dois grupos: masculino e feminino. Assim, cada jovem esteve sujeito a dois sistemas de classificao simultaneamente, Tabela 1. Tabela 1. Dados obtidos no experimento tipo CRD. colunas linhas 1 2 3 total coluna mdia coluna efeito coluna

1 6 8 4 18 6 -1

2 2 9 4 15 5 -2

3 9 11 10 30 10 +3

4 3 12 6 21 7 0

total linha 20 40 24 84

mdia linha 5 10 6 7

efeito linha -2 +3 -1 0

(-1) = efeito coluna = mdia coluna 1(=6) mdia geral (=7) (+3) = efeito linha = mdia linha 2(=10) mdia geral (=7)

Anlise dos dados segundo a classificao do fator linha. anova 1 fator. SQ linha = 4{(-2)2 + (3)2+ (-1)2} = 56 Anlise dos dados segundo a classificao do fator coluna. anova 1 fator. SQ coluna = 3{(-1)2 + (-2)2+ (3)2+(0)2} = 42 Clculo da Soma de Quadrados Total SQ Total*= x2 (X)2 / n =* deduo dessa frmula = SQ = (x-)2 = (x2-2x +2) = (x2)-2x +(2)= x2-22n +n 2 =x2- n2 = x2- n(x)2/ n2 = x2 (x)2 / n que a forma usual do clculo da soma de quadrados total.

{(52+22+92+32+82+92+112+122+42+42+102+62)-(5+2+9+3+8+9+11+12+4+4+10+6)2 / 12 }= SQTotal = 120 Clculo da Soma de Quadrados Resduo (h dois mtodos)a) por meio da diferena (mtodo mais fcil)

SQ Total = SQ LINHA + SQ COLUNA + SQ RESDUOI

Denomina-se experimento inteiramente ao acaso quando os tratamentos (fatores) so designados s unidades experimentais sem qualquer restrio. Esse tipo de delineamento s pode ser conduzido quando as unidades experimentais (corpos-de-prova, pessoas, etc...) so similares. Por similares deve-se entender: no no sentido de igualdade, mas no sentido de que essas unidades respondem ao tratamento da mesma forma.

4

assim, SQ RESDUO = SQ Total (SQ LINHA + SQ COLUNA) SQ RESDUO = 120 (56+42) = 120 98 = 22b) por meio do clculo direto (mtodo mais trabalhoso) 22+(-1) 2+12+(-2)2+(-1)2+12+(-2)2+22+(-1)2+02+12+02 = 4+1+1+4+1+1+4+4+1+0+1+0 = 22

Clculo dos Graus de Liberdade (gl) Fator Linha = Blocos = b-1 e no nosso exemplo 3 1 = 2 Fator Coluna = G-1 e no nosso exemplo 4 1 = 3 Total N-1 e no nosso exemplo 12 1 = 11 Resduo ( N-1 ) - [ (B-1) +(G-1) ] = ( BK-1 ) - [ (B-1) +(G-1) ] = (B-1)(G-1) e no nosso exemplo o gl resduo igual a 11-(2+3) = 6 = (3-1)(4-1) = (2)(3)

Tabela 2. ANOVA 2 fatores para os dados da Tabela 1. Efeito(ou fonte de variao)

gl3-1= 2 4-1=3

SQ 56 42 22 120

QM56/2= 28 42/3= 14 22/6= 3,67

razo F28/3,67= 7,64 14/3,67= 3,82

p-valor0,0224150* 0,0764059

Linhas Colunas Resduo Total*p F tabelado .resduo

= SQ

res

res

; assim, quanto menor gl

res

implica aumento de QM

resduo

que traz como conseqncia uma diminuio de Fcalc.

8

Exemplo 1. Experimento em blocos (CBRD), sem repeties. Numa pesquisa sobre o efeito do leo de milho no teor de colesterol do sangue, o mdico Dr. Bem Hur obteve os seguintes dados, de 7 pacientes, Tabela 3. Tabela 3. Teor de colesterol no sangue, em mg por 100g, de sete pacientes. Pacientes 1 2 3 4 5 6 7Totais de Tratamentos Mdias de Tratamentos

Tratamentos (dois tipos de dietas) A B 270 410 350 360 350 430 2682438 348,286

Totais dos blocos 445 718 598 591 546 620 520

Mdias dos blocos 222,5 359,0 299,0 295,5 273,0 310,0 260,0

175 308 248 231 196 190 2521600 228,571

A anlise feita tomando-se os pacientes como blocos. Para casos desse tipo, pode-se dizer em termos gerais, que a mesma anlise dos delineamentos tipo ANOVA de medidas repetidas e, nesse especial caso, a mesma anlise que se obtm com o teste t-Student de amostras pareadas (estatstica t = 4,66; vale a relao estatstica F da anova igual ao valor da estatstica t-Student ao quadrado, ou seja, F = t2 = 4,662 = 21,71). Pelo mesmo procedimento do caso anterior obtm-se o seguinte resultado do teste ANOVA 2 fatores, Tabela 4. Tabela 4. ANOVA 2 fatores pata os dados da Tabela 3.Efeito (ou fonte de variao) Blocos Tratamentos Resduo Total *p Command Line Editor (ou Ctrl+L) digitamos cdf 11.60 k1; F 4 8. let k2 = 1-k1 print k2K2 0.00206337

clicar no (X) Submit Commands Tabela 8. ANOVA 2 fatores para os dados da Tabela 7. Efeito gl SQ QM F Presso 4 11,600 2,900 11,60 Temperatura 2 23,333 11,667 Erro 8 2,000 0,250 Total 14 36,933*p0,05). Ento, podemos desconsiderar o valor

18 Soma da Soma de Quadrados correspondente ao efeito interao (no caso foi de 108) e, assim, obtemos uma outra tabela ANOVA, a usual em experimento em blocos ao acaso, que desconsidera o efeito interao, Tabela Z mostrada a seguir. Tabela Z. ANOVA dois fatores para os dados do exemplo 3, terceira situao. Efeito gl SQ QM F P BLOCOS 1 600,00 600,000 TRATAM 3 912,00 304,000 15,96 0,0001 Erro 19 362,00 19,053 Total 23 1874,00

19

4) experimento inteiramente casualizado (CRD) com repeties.Nesse item vamos considerar os experimentos que seguem um delineamento fatorial. No vamos considerar fatores como blocos. Blocagem, agora, no nos interessa por um motivo de didtica, apenas. Vamos considerar dois fatores, duas variveis experimentais, cujos efeitos sobre a unidade experimental so avaliados pela varivel resposta. Esses efeitos, dessas duas variveis, nos interessam. Queremos avali-los isoladamente, efeitos principais e, tambm, se houver repeties (caso mais freqente, comum) vamos ter de nos enfrentar com o efeito interao. Que significa saber se h ou no diferena entre as diferenas. O termo interao no apresenta, no jargo da estatstica, o mesmo significado quando empregado na cincia biolgica. A Farmacologia, por exemplo, que considera a interao entre as drogas, o efeito da mistura, da ao conjunta entre vrios medicamentos sobre a pessoa em comparao com a ao individual desses medicamentos sobre a pessoa. Considera-se, agora, como exemplo de um delineamento fatorial o mesmo exemplo anterior, mas com uma alterao apenas. Dessa vez, no houve blocagem. No h o fator blocos. A casualizao dos tratamentos no foi restrita aos blocos. No houve restrio alguma quanto ao sorteio dos tratamentos s unidades experimentais. Porm, a forma de anlise dos dados anloga, ou seja, o mesmo procedimento. O novo fator ser denominado de Termociclagem Mecnica, por exemplo, indicado por TCM que apresentar dois nveis. O nvel I como ausncia e o nvel II como presena de TCM. O outro fator, tratamentos, pode ser considerado como Tratamentos Superficiais apresentando quatro diferentes nveis: Controle, Alumina, Rocatec e New. A varivel resposta o resultado do teste de trao (em megapascal, MPa) obtido numa mquina de ensaio universal. A unidade experimental o corpo de prova em forma de cilindro.

20

Exemplo 1. Dados de resistncia a trao (MPa) de um experimento fatorial (tipo 4 x 2) com trs repeties. Tratamentos Superficiais TCM A: controle 22I: ausncia mdias dos nveis Total das linhas Mdia dos nveis do fator TCM

B: alumina 31 38 3635 e 51 difere de 16

C: rocatec 30 31 3833 e 45 difere de 12

D: new 39 42 4542 e 48 difere de 6

26 3026 e 32 difere de 6

408

34

27II: presena Total das colunas

47 50 56258Tratamentos A B C D

42 45 48234N 6 6 6 6 Mdia 29.00 43.00 39.00 45.00

44 47 53270DP 4.98 9.51 7.38 4.77

34 35174

528 Total geral: 936

44 Mdia geral: 39

Nesse caso, com repeties, vlida a seguinte relao entre as somas de quadrados:

SQ Total = SQ COLUNA + SQ LINHA + SQ Interao + SQ RESDUO. 1874,00 = 912,00 + 600,00 + 254,00 + SQ InteraoAssim SQ interao = 108. Com o mesmo procedimento dos casos anteriores obtm-se a Tabela Y referente ao teste ANOVA (2 fatores) dos dados.

Clculo dos Graus de Liberdade (gl) Fator Linha = TCM = L-1 e no nosso exemplo 2 1 = 1 Fator Coluna = Tratamentos = G-1 e no nosso exemplo 4 1 = 3

21

Total N-1 e no nosso exemplo 24 1 = 23 = (LCR) 1onde R o nmero de repeties

Fator Interao determinado pelo produto dos graus de liberdade do fator na linha pelo fator coluna = (L-1)(G-1) = (2-1)(4-1) = 3. O gl resduo dado pela diferena entre o gl do total em relao aos outros fatores, ou seja, (24-1)-{(2-1)+(4-1)+(2-1)(4-1)) = 23- (1+3+3) = 23-7 = 16. Ou o gl resduo dado pela frmula gl resduo = (LC)(R 1) onde R o nmero derepeties; assim gl resduo = (2 x 4)(3-1) = 8 (2) = 16. Tabela Y. ANOVA (2 fatores) dos dados de resistncia a trao (MPa) de um experimento fatorial (tipo 4 x 2) com trs repeties. Efeito gl SQ QM F P Tratamento 3 912,00 304,000 19,15 0,0001* TCM 1 600,00 600,000 37,80 0,0001* Interao 3 108,00 36,000 2,27 0,1198 Erro 16 254,00 15,875 Total 23 1874,00* p