estatística anova análise de variância (anova) 1 -metodologia -cálculo de “within sample sum...
TRANSCRIPT
EstatísticaANOVA
Análise de Variância (ANOVA)
1
-metodologia
-cálculo de “within sample sum of square”, SSW
-cálculo de “between samples sum of square”, SSB
-comparação de SSw e SSB
-tabela de ANOVA
-ANOVA é um modelo aditivo
Pontos mais importantes:
EstatísticaANOVA
2
Já tínhamos visto como se construi um teste para a igualdade das médias de duas populações:
H0 : XYHipótese nula:
Hipótese alternativa: H1 : X Y
O que acontece, quando temos mais do que duas médias (tratamentos) para comparar?
EstatísticaANOVA
3
O tempo de coagulação da sangue (segundo) em animais sujeitos à quatro dietas diferentes
[X]=
A 62 60 63 59
B 63 67 71 64 65 66
C 68 66 71 67 68 68
D 56 62 60 61 63 64 63 59
i/j
EstatísticaANOVA
4
Questão: Os dados observados indicam qualquer evidência que existe uma diferença entre os (valor médio) tratamentos?
H0 : A=B =C=DHipótese nula:
Hipótese alternativa: H1 : A B C D
Conceito: avaliar, se a dispersão do valor médio entre tratamentos estivesse maior do que podia ser esperado (provável) baseado no cálculo de dispersão dos dados dentro dos tratamentos.
Metodologia: -cálculo da estimativa da 2, só válida quando H0 é verdadeira
-cálculo da estimativa da 2, sempre válida
-comparação de estas duas
EstatísticaANOVA
5
Cálculo de estimativa da 2, sempre válida- “within sample sum of squares” (soma dos quadrados dentro da amostra), SSW
A média amostral de tratamento “i” obtenha-se:
i
n
1jij
i n
X
X
i
61
4
X
X .g.e
4
1jj1
A
Variância amostral de tratamento i:
in
1j i
2iij2
i 1n
)XX(S
4
1j
21j12
A 3.33
)XX(S g.e
i=1, 2, ...,m
i=1, 2, ...,m
EstatísticaANOVA
6
21n2
2i
i i~
S)1n(
como
aplicando independência, a distribuição conjunta da soma de estas variâncias amostrais tem:
2
)1n(2
m
1i
2ii
m
1ii
~S)1n(
2Emn)1n(
S)1n(E
m
1ii
m
1ii2
m
1i
2ii
2m
1ii
Wm
1ii
m
1i
2ii
mn
SSE
mn
S)1n(E
EstatísticaANOVA
7
Xi S2i
A 62 60 63 59 61 3.3
B 63 67 71 64 65 66 66 8
C 68 66 71 67 68 68 68 2.8
D 56 62 60 61 63 64 63 59 61 6.8
SSw =112
-Exemplo
SSW=33.3 + 58 + 52.8 + 76.8 = 112
EstatísticaANOVA
8
Cálculo de estimativa da 2, só válida quando H0 é verdadeira - “between sample sum of squares” (soma dos quadrados entre as amostras), SSB
Se H0 for verdadeira, cada Xij tem uma distribuição normal com e 2. Uma estimativa para o valor médio pode ser calculada:
m
1ii
m
1i
n
1jij
n21
mn21n11211
n
X
n...nn
X...XX...XXX
i
m1
Se H0 for verdadeira, Xi também tem uma distr. com valor médio mas com variância igual à 2/ni. Uma estimativa da variância do valor médio é dada pela:
1m
SS
1m
)XX(nS B
m
1i
2ii
2
EstatísticaANOVA
9
Considerando o facto que: s2/2 ~2
21m2
m
1i
2ii
2
m
1i
2ii
~)XX(n
1m
)XX(n
)1m(
Temos:
2B2B
2
m
1i
2ii
1m
SSE1m
SSE
)XX(nE
Por isso
Nota: pode-se mostrar que quando H0 é falso, SSB/(m-1) sobre estima a variância (2)
EstatísticaANOVA
10
Xi S2i
A 62 60 63 59 61 3.3
B 63 67 71 64 65 66 66 8
C 68 66 71 67 68 68 68 2.8
D 56 62 60 61 63 64 63 59 61 6.8
X=
SSB=
64
228
-Exemplo
SSB=4(61-64)2 + 6(66-64)2 + 6(68-64)2 + 8(61-64)2 = 228
EstatísticaANOVA
11
Comparação de SSw e SSB
A divisão de duas v.a.s 2k e 2
l resulta uma v.a. de distribuição F com k e l graus de liberdade a forma seguinte:
l,k2l
2k F~
l
k
Aplicando isto para as duas estimativas da variância temos quando H0 é verdade:
2
)1n(2W
2
m
1i
2ii
m
1ii
~SS
S)1n(
21m2
B2
m
1i
2ii
~SS
)XX(n
m
1ii )1n(),1m(m
1iiW
Bm
1ii2
W
2B
F~)1n(SS
)1m(SS
)1n(SS
)1m(SS
EstatísticaANOVA
12
Assim, já é relativamente fácil avaliar o teste de hipótese:
H0 : A=B =C=DHipótese nula:
Hipótese alternativa: H1 : A B C D
porque -aceita H0 se
-rejeita H0 se
m
1ii )1n(),1m(,m
1ii2
W
2B
F)1n(
SS
)1m(SS
m
1ii )1n(),1m(,m
1ii2
W
2B
F)1n(
SS
)1m(SS
EstatísticaANOVA
13
Tabela de analise de variância (ANOVA)
Para simplificar o cálculo e visualização dos resultados da ANOVA, é costumo apresentar a tabela ANOVA
Fonte de variabilidade
Soma quadrada Grau de liberdade
F
Entre das amostras m-1
dentro da amostra
m
1i
2iiB )XX(nSS
m
1i
n
1j
2iijW
i
)XX(SS
m
1ii )1n(
m
1iiW
B
)1n(,1m
)1n(SS
)1m(SS
F m
1ii
EstatísticaANOVA
14
-Exemplo
Fonte de variabilidade
Soma quadrada
Grau de liberdade
F
Entre das amostras SSB=228 3
F3,20= (228/3)/(112/20)=13.6
dentro da amostra SSW=112 20
EstatísticaANOVA
15
EstatísticaANOVA
ANOVA
VAR00001
228.000 3 76.000 13.571 .000
112.000 20 5.600
340.000 23
Between Groups
Within Groups
Total
Sum ofSquares df Mean Square F Sig.
-Output de programa SPSS10.0
8664N =
VAR00002
4321
95
% C
I V
AR
00
00
1
72
70
68
66
64
62
60
58
56
16
EstatísticaANOVA
17
Caso especial: o número de dados em cada tratamento e igual, n1= n2=...= nm
Fonte de variabilidade
Soma quadrada Grau de liberdade
F
Entre das amostras m-1
dentro da amostra m(n-1)
m
1i
2iB )XX(nSS
m
1i
n
1j
2iijW )XX(SS
)1n(mSS
)1m(SS
F
W
B
)1n(m,1m
EstatísticaANOVA
18
Analogia entre o conceito de analise de variância (ANOVA) e um modelo aditivo
Modelo linear: y=X+
Dados experimentais: )(0,y)(0,baXy 22
Suponha que a=1, a equação anterior pode ser escrita após de aplicar a uma amostra:
)(0,XXXXXXX 2iiijiij
valor médioamostral
incremento delinha (tratamento)
resíduo
EstatísticaANOVA
19
A equação anterior pode ser apresentada em forma matricial:
[X]=[A]+[T]+[R]
Exemplo:
Xji X Xi-X Xji-Xi
valor médioamostral
incremento decoluna (tratamento)
resíduo
EstatísticaANOVA
20
Questão: [T] pode ser considerada 0 ou não?
Para dar a resposta, determina-se o “tamanho” da matrizes utilizando a norma.
e.g. {v}={a b c} ||v||=a2+b2+c2
Assim:
m
1i
n
1j
2
iij
m
1i
2
ii
m
1i
n
1j
2
ij
ii
XXXXnXX
SSB SSW
O teste de ANOVA é a avaliação de SSB em relação de SSW. Se for pequeno, aceita H0, se for grande, rejeita H0.