estatística anova análise de variância (anova) 1 -metodologia -cálculo de “within sample sum...

20
Estatística ANOVA Análise de Variância (ANOVA) 1 -metodologia -cálculo de “within sample sum of square”, SS W -cálculo de “between samples sum of square”, SS B -comparação de SS w e SS B -tabela de ANOVA -ANOVA é um modelo aditivo Pontos mais importantes:

Upload: internet

Post on 21-Apr-2015

107 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: Estatística ANOVA Análise de Variância (ANOVA) 1 -metodologia -cálculo de “within sample sum of square”, SS W -cálculo de “between samples sum of square”,

EstatísticaANOVA

Análise de Variância (ANOVA)

1

-metodologia

-cálculo de “within sample sum of square”, SSW

-cálculo de “between samples sum of square”, SSB

-comparação de SSw e SSB

-tabela de ANOVA

-ANOVA é um modelo aditivo

Pontos mais importantes:

Page 2: Estatística ANOVA Análise de Variância (ANOVA) 1 -metodologia -cálculo de “within sample sum of square”, SS W -cálculo de “between samples sum of square”,

EstatísticaANOVA

2

Já tínhamos visto como se construi um teste para a igualdade das médias de duas populações:

H0 : XYHipótese nula:

Hipótese alternativa: H1 : X Y

O que acontece, quando temos mais do que duas médias (tratamentos) para comparar?

Page 3: Estatística ANOVA Análise de Variância (ANOVA) 1 -metodologia -cálculo de “within sample sum of square”, SS W -cálculo de “between samples sum of square”,

EstatísticaANOVA

3

O tempo de coagulação da sangue (segundo) em animais sujeitos à quatro dietas diferentes

[X]=

A 62 60 63 59

B 63 67 71 64 65 66

C 68 66 71 67 68 68

D 56 62 60 61 63 64 63 59

i/j

Page 4: Estatística ANOVA Análise de Variância (ANOVA) 1 -metodologia -cálculo de “within sample sum of square”, SS W -cálculo de “between samples sum of square”,

EstatísticaANOVA

4

Questão: Os dados observados indicam qualquer evidência que existe uma diferença entre os (valor médio) tratamentos?

H0 : A=B =C=DHipótese nula:

Hipótese alternativa: H1 : A B C D

Conceito: avaliar, se a dispersão do valor médio entre tratamentos estivesse maior do que podia ser esperado (provável) baseado no cálculo de dispersão dos dados dentro dos tratamentos.

Metodologia: -cálculo da estimativa da 2, só válida quando H0 é verdadeira

-cálculo da estimativa da 2, sempre válida

-comparação de estas duas

Page 5: Estatística ANOVA Análise de Variância (ANOVA) 1 -metodologia -cálculo de “within sample sum of square”, SS W -cálculo de “between samples sum of square”,

EstatísticaANOVA

5

Cálculo de estimativa da 2, sempre válida- “within sample sum of squares” (soma dos quadrados dentro da amostra), SSW

A média amostral de tratamento “i” obtenha-se:

i

n

1jij

i n

X

X

i

61

4

X

X .g.e

4

1jj1

A

Variância amostral de tratamento i:

in

1j i

2iij2

i 1n

)XX(S

4

1j

21j12

A 3.33

)XX(S g.e

i=1, 2, ...,m

i=1, 2, ...,m

Page 6: Estatística ANOVA Análise de Variância (ANOVA) 1 -metodologia -cálculo de “within sample sum of square”, SS W -cálculo de “between samples sum of square”,

EstatísticaANOVA

6

21n2

2i

i i~

S)1n(

como

aplicando independência, a distribuição conjunta da soma de estas variâncias amostrais tem:

2

)1n(2

m

1i

2ii

m

1ii

~S)1n(

2Emn)1n(

S)1n(E

m

1ii

m

1ii2

m

1i

2ii

2m

1ii

Wm

1ii

m

1i

2ii

mn

SSE

mn

S)1n(E

Page 7: Estatística ANOVA Análise de Variância (ANOVA) 1 -metodologia -cálculo de “within sample sum of square”, SS W -cálculo de “between samples sum of square”,

EstatísticaANOVA

7

Xi S2i

A 62 60 63 59 61 3.3

B 63 67 71 64 65 66 66 8

C 68 66 71 67 68 68 68 2.8

D 56 62 60 61 63 64 63 59 61 6.8

SSw =112

-Exemplo

SSW=33.3 + 58 + 52.8 + 76.8 = 112

Page 8: Estatística ANOVA Análise de Variância (ANOVA) 1 -metodologia -cálculo de “within sample sum of square”, SS W -cálculo de “between samples sum of square”,

EstatísticaANOVA

8

Cálculo de estimativa da 2, só válida quando H0 é verdadeira - “between sample sum of squares” (soma dos quadrados entre as amostras), SSB

Se H0 for verdadeira, cada Xij tem uma distribuição normal com e 2. Uma estimativa para o valor médio pode ser calculada:

m

1ii

m

1i

n

1jij

n21

mn21n11211

n

X

n...nn

X...XX...XXX

i

m1

Se H0 for verdadeira, Xi também tem uma distr. com valor médio mas com variância igual à 2/ni. Uma estimativa da variância do valor médio é dada pela:

1m

SS

1m

)XX(nS B

m

1i

2ii

2

Page 9: Estatística ANOVA Análise de Variância (ANOVA) 1 -metodologia -cálculo de “within sample sum of square”, SS W -cálculo de “between samples sum of square”,

EstatísticaANOVA

9

Considerando o facto que: s2/2 ~2

21m2

m

1i

2ii

2

m

1i

2ii

~)XX(n

1m

)XX(n

)1m(

Temos:

2B2B

2

m

1i

2ii

1m

SSE1m

SSE

)XX(nE

Por isso

Nota: pode-se mostrar que quando H0 é falso, SSB/(m-1) sobre estima a variância (2)

Page 10: Estatística ANOVA Análise de Variância (ANOVA) 1 -metodologia -cálculo de “within sample sum of square”, SS W -cálculo de “between samples sum of square”,

EstatísticaANOVA

10

Xi S2i

A 62 60 63 59 61 3.3

B 63 67 71 64 65 66 66 8

C 68 66 71 67 68 68 68 2.8

D 56 62 60 61 63 64 63 59 61 6.8

X=

SSB=

64

228

-Exemplo

SSB=4(61-64)2 + 6(66-64)2 + 6(68-64)2 + 8(61-64)2 = 228

Page 11: Estatística ANOVA Análise de Variância (ANOVA) 1 -metodologia -cálculo de “within sample sum of square”, SS W -cálculo de “between samples sum of square”,

EstatísticaANOVA

11

Comparação de SSw e SSB

A divisão de duas v.a.s 2k e 2

l resulta uma v.a. de distribuição F com k e l graus de liberdade a forma seguinte:

l,k2l

2k F~

l

k

Aplicando isto para as duas estimativas da variância temos quando H0 é verdade:

2

)1n(2W

2

m

1i

2ii

m

1ii

~SS

S)1n(

21m2

B2

m

1i

2ii

~SS

)XX(n

m

1ii )1n(),1m(m

1iiW

Bm

1ii2

W

2B

F~)1n(SS

)1m(SS

)1n(SS

)1m(SS

Page 12: Estatística ANOVA Análise de Variância (ANOVA) 1 -metodologia -cálculo de “within sample sum of square”, SS W -cálculo de “between samples sum of square”,

EstatísticaANOVA

12

Assim, já é relativamente fácil avaliar o teste de hipótese:

H0 : A=B =C=DHipótese nula:

Hipótese alternativa: H1 : A B C D

porque -aceita H0 se

-rejeita H0 se

m

1ii )1n(),1m(,m

1ii2

W

2B

F)1n(

SS

)1m(SS

m

1ii )1n(),1m(,m

1ii2

W

2B

F)1n(

SS

)1m(SS

Page 13: Estatística ANOVA Análise de Variância (ANOVA) 1 -metodologia -cálculo de “within sample sum of square”, SS W -cálculo de “between samples sum of square”,

EstatísticaANOVA

13

Tabela de analise de variância (ANOVA)

Para simplificar o cálculo e visualização dos resultados da ANOVA, é costumo apresentar a tabela ANOVA

Fonte de variabilidade

Soma quadrada Grau de liberdade

F

Entre das amostras m-1

dentro da amostra

m

1i

2iiB )XX(nSS

m

1i

n

1j

2iijW

i

)XX(SS

m

1ii )1n(

m

1iiW

B

)1n(,1m

)1n(SS

)1m(SS

F m

1ii

Page 14: Estatística ANOVA Análise de Variância (ANOVA) 1 -metodologia -cálculo de “within sample sum of square”, SS W -cálculo de “between samples sum of square”,

EstatísticaANOVA

14

-Exemplo

Fonte de variabilidade

Soma quadrada

Grau de liberdade

F

Entre das amostras SSB=228 3

F3,20= (228/3)/(112/20)=13.6

dentro da amostra SSW=112 20

Page 15: Estatística ANOVA Análise de Variância (ANOVA) 1 -metodologia -cálculo de “within sample sum of square”, SS W -cálculo de “between samples sum of square”,

EstatísticaANOVA

15

Page 16: Estatística ANOVA Análise de Variância (ANOVA) 1 -metodologia -cálculo de “within sample sum of square”, SS W -cálculo de “between samples sum of square”,

EstatísticaANOVA

ANOVA

VAR00001

228.000 3 76.000 13.571 .000

112.000 20 5.600

340.000 23

Between Groups

Within Groups

Total

Sum ofSquares df Mean Square F Sig.

-Output de programa SPSS10.0

8664N =

VAR00002

4321

95

% C

I V

AR

00

00

1

72

70

68

66

64

62

60

58

56

16

Page 17: Estatística ANOVA Análise de Variância (ANOVA) 1 -metodologia -cálculo de “within sample sum of square”, SS W -cálculo de “between samples sum of square”,

EstatísticaANOVA

17

Caso especial: o número de dados em cada tratamento e igual, n1= n2=...= nm

Fonte de variabilidade

Soma quadrada Grau de liberdade

F

Entre das amostras m-1

dentro da amostra m(n-1)

m

1i

2iB )XX(nSS

m

1i

n

1j

2iijW )XX(SS

)1n(mSS

)1m(SS

F

W

B

)1n(m,1m

Page 18: Estatística ANOVA Análise de Variância (ANOVA) 1 -metodologia -cálculo de “within sample sum of square”, SS W -cálculo de “between samples sum of square”,

EstatísticaANOVA

18

Analogia entre o conceito de analise de variância (ANOVA) e um modelo aditivo

Modelo linear: y=X+

Dados experimentais: )(0,y)(0,baXy 22

Suponha que a=1, a equação anterior pode ser escrita após de aplicar a uma amostra:

)(0,XXXXXXX 2iiijiij

valor médioamostral

incremento delinha (tratamento)

resíduo

Page 19: Estatística ANOVA Análise de Variância (ANOVA) 1 -metodologia -cálculo de “within sample sum of square”, SS W -cálculo de “between samples sum of square”,

EstatísticaANOVA

19

A equação anterior pode ser apresentada em forma matricial:

[X]=[A]+[T]+[R]

Exemplo:

Xji X Xi-X Xji-Xi

valor médioamostral

incremento decoluna (tratamento)

resíduo

Page 20: Estatística ANOVA Análise de Variância (ANOVA) 1 -metodologia -cálculo de “within sample sum of square”, SS W -cálculo de “between samples sum of square”,

EstatísticaANOVA

20

Questão: [T] pode ser considerada 0 ou não?

Para dar a resposta, determina-se o “tamanho” da matrizes utilizando a norma.

e.g. {v}={a b c} ||v||=a2+b2+c2

Assim:

m

1i

n

1j

2

iij

m

1i

2

ii

m

1i

n

1j

2

ij

ii

XXXXnXX

SSB SSW

O teste de ANOVA é a avaliação de SSB em relação de SSW. Se for pequeno, aceita H0, se for grande, rejeita H0.