exercÃcio resolvido mcd - wordpress institucional · 2020. 12. 14. · 3 3 0 0 * * $% (ihlwr...

28
Análise de dados de classificação simples e dupla

Upload: others

Post on 05-Mar-2021

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: ExercÃcio resolvido MCD - WordPress Institucional · 2020. 12. 14. · 3 3 0 0 * * $% (ihlwr vljqlilfdwlyr gd lqwhudomr grv idwruhv $ h % m5hmhlwd vh + &rqfoxvmr &rqfoxtprv dr qtyho

Análise de dados de classificação simples e dupla

Page 2: ExercÃcio resolvido MCD - WordPress Institucional · 2020. 12. 14. · 3 3 0 0 * * $% (ihlwr vljqlilfdwlyr gd lqwhudomr grv idwruhv $ h % m5hmhlwd vh + &rqfoxvmr &rqfoxtprv dr qtyho

ijiij ey

Modelo de classificação simples: uma variável explanatória

ijkijjiijk ey

Variável resposta

Efeito da variável

explanatória

Efeito das características

estranhas

Modelo de classificação dupla: duas variáveis explanatórias

Variável resposta

Efeito da variável

explanatória A

Efeito das características

estranhas

Efeito da variável

explanatória B

Efeito da interação de

A e B

Page 3: ExercÃcio resolvido MCD - WordPress Institucional · 2020. 12. 14. · 3 3 0 0 * * $% (ihlwr vljqlilfdwlyr gd lqwhudomr grv idwruhv $ h % m5hmhlwd vh + &rqfoxvmr &rqfoxtprv dr qtyho

Modelos de classificação dupla

Page 4: ExercÃcio resolvido MCD - WordPress Institucional · 2020. 12. 14. · 3 3 0 0 * * $% (ihlwr vljqlilfdwlyr gd lqwhudomr grv idwruhv $ h % m5hmhlwd vh + &rqfoxvmr &rqfoxtprv dr qtyho

Os experimentos com dois ou mais fatores de tratamentos são denominados fatoriais e usualmente são assim representados:

Fatorial 2 X 2 experimento com dois fatores, cada um com 2 níveis (mais simples)

Fatorial 2 X 3 experimento com dois fatores, um com 2 e outro com 3 níveis

Fatorial 2 X 3 X 4 experimento com três fatores, um com 2, outro com 3 e outro com 4 níveis

Modelos de classificação dupla são aqueles que exprimem a relação entre uma variável resposta e dois fatores de tratamento.

Por que incluir mais um fator no experimento?- aumentar a amplitude das conclusões- estudar a influência de um fator sobre o outro (interação)

Page 5: ExercÃcio resolvido MCD - WordPress Institucional · 2020. 12. 14. · 3 3 0 0 * * $% (ihlwr vljqlilfdwlyr gd lqwhudomr grv idwruhv $ h % m5hmhlwd vh + &rqfoxvmr &rqfoxtprv dr qtyho

Exemplo resolvido

Page 6: ExercÃcio resolvido MCD - WordPress Institucional · 2020. 12. 14. · 3 3 0 0 * * $% (ihlwr vljqlilfdwlyr gd lqwhudomr grv idwruhv $ h % m5hmhlwd vh + &rqfoxvmr &rqfoxtprv dr qtyho

Programas de computador modernos requerem capacidade de acesso rápido aos dados.Uma pesquisa foi conduzida para estudar o efeito do tamanho do arquivo de dados(Pequeno; Médio e Grande) e do tamanho do buffer (20 kb e 40 kb) sobre o tempo deacesso aos arquivos, medido através do tempo de leitura (em milissegundos).

Tamanho do arquivo

Tamanho do buffer

20 40

Pequeno 2,05; 2,04; 2,21; 2,12 2,32; 2,31; 2,48; 2,42

Médio 2,24; 2,21; 2,23; 2,09 2,52; 2,62; 2,57; 2,61

Grande 2,08; 2,34; 2,33; 2,24 2,71; 2,73; 2,90; 2,72

Experimento com dois fatores

Buffer: área de memória intermediária que serve para acelerar o acesso a dados que estão sendo transferidos entre dispositivos - memória de disco e memória RAM - que operam com velocidades diferentes.

Fatores de tratamento: A - tamanho do arquivo e B - Tamanho de buffer

Variável resposta (y): tempo de leitura (ms)

Tratamentos: 3 x 2 = 6 {P2, P4, M2, M4, G2, G4}

Unidade de pesquisa: computador Total de unidades (n): 24

Número de repetições por tratamento (r): 4

Page 7: ExercÃcio resolvido MCD - WordPress Institucional · 2020. 12. 14. · 3 3 0 0 * * $% (ihlwr vljqlilfdwlyr gd lqwhudomr grv idwruhv $ h % m5hmhlwd vh + &rqfoxvmr &rqfoxtprv dr qtyho

Populações estatísticas

y: variável resposta

Tratamentos distintos geram populações de valores de y distintas?

P2 P4

y

M2 G2 G4

y~N(, )

M4

Modelo de médias

) de difere média uma menos pelo:H

:H

ijT1

G4G2M4M2P4P2T0

Page 8: ExercÃcio resolvido MCD - WordPress Institucional · 2020. 12. 14. · 3 3 0 0 * * $% (ihlwr vljqlilfdwlyr gd lqwhudomr grv idwruhv $ h % m5hmhlwd vh + &rqfoxvmr &rqfoxtprv dr qtyho

Populações estatísticas

y: variável resposta

Se a hipótese de nulidade não é rejeitada, ostratamentos distintos não geram populações de valores de y distintas. Temos apenas umapopulação com média .

Y ~ N(, )

) de difere média uma menos pelo:H

:H

ijT1

G4G2M4M2P4P2T0

Page 9: ExercÃcio resolvido MCD - WordPress Institucional · 2020. 12. 14. · 3 3 0 0 * * $% (ihlwr vljqlilfdwlyr gd lqwhudomr grv idwruhv $ h % m5hmhlwd vh + &rqfoxvmr &rqfoxtprv dr qtyho

Fonte de variação SQ S2 F

Tratamento T= t - 1 ij

2ij yyr

T

T2T

QSs

2

2T

Ts

sf

Resíduo =(r-1) t ijk

2ijijk yy

sRe2 QS

s -

Total n-1 2ijk

ijk yy

ij

2ijTrat yyrSQ

2ijk

ijkTotal yySQ

Modelo de médias

) de difere média uma menos pelo:H

:H

ijT1

G4G2M4M2P4P2T0

Hipóteses estatísticas

Desviototal

Desvio tratamento

Desvioresíduo

Tabela da análise da variância

Page 10: ExercÃcio resolvido MCD - WordPress Institucional · 2020. 12. 14. · 3 3 0 0 * * $% (ihlwr vljqlilfdwlyr gd lqwhudomr grv idwruhv $ h % m5hmhlwd vh + &rqfoxvmr &rqfoxtprv dr qtyho

Tamanho do arquivo

Tamanho do buffer Médias marginais 2 4

P 2,105 2,383 2,244

M 2,193 2,580 2,386

G 2,248 2,765 2,506 Médias

marginais 2,182 2,576 2,379

Tabela de média

Page 11: ExercÃcio resolvido MCD - WordPress Institucional · 2020. 12. 14. · 3 3 0 0 * * $% (ihlwr vljqlilfdwlyr gd lqwhudomr grv idwruhv $ h % m5hmhlwd vh + &rqfoxvmr &rqfoxtprv dr qtyho

Tabela dos dados

Tamanho do arquivo

Tamanho do buffer

20 40

Pequeno 2,05; 2,04; 2,21; 2,12 2,32; 2,31; 2,48; 2,42

Médio 2,24; 2,21; 2,23; 2,09 2,52; 2,62; 2,57; 2,61

Grande 2,08; 2,34; 2,33; 2,24 2,71; 2,73; 2,90; 2,72

Tamanho do arquivo

Tamanho do buffer Médias marginais 2 4

P 2,105 2,383 2,244

M 2,193 2,580 2,386

G 2,248 2,765 2,506 Médias

marginais 2,182 2,576 2,379

Tabela de médias observadas

(por diferença )

Page 12: ExercÃcio resolvido MCD - WordPress Institucional · 2020. 12. 14. · 3 3 0 0 * * $% (ihlwr vljqlilfdwlyr gd lqwhudomr grv idwruhv $ h % m5hmhlwd vh + &rqfoxvmr &rqfoxtprv dr qtyho

Fonte de variação GL SQ S2 F f

Tratamento 5 1,265 0,253 35,63 2,77

Resíduo 18 0,128 0,0071 - -

Total 23 1,393 - - -

Rejeita-se H0

Conclusão: Concluímos ao nível de 5% de significância, que existe efeito das combinações de níveis dos fatores tamanho do buffer e tamanho do arquivo sobre o tempo de acesso ao arquivo.

ijT1

G4G2M4M2P4P2T0

:H

:H

Tabela da análise da variância

Page 13: ExercÃcio resolvido MCD - WordPress Institucional · 2020. 12. 14. · 3 3 0 0 * * $% (ihlwr vljqlilfdwlyr gd lqwhudomr grv idwruhv $ h % m5hmhlwd vh + &rqfoxvmr &rqfoxtprv dr qtyho

Prosseguimento da análise: decomposição da SQTrat

A variação de tratamento pode ser decomposta em três partes:

- efeito do fator A

- efeito do fator B

- efeito da interação A.B

Page 14: ExercÃcio resolvido MCD - WordPress Institucional · 2020. 12. 14. · 3 3 0 0 * * $% (ihlwr vljqlilfdwlyr gd lqwhudomr grv idwruhv $ h % m5hmhlwd vh + &rqfoxvmr &rqfoxtprv dr qtyho

Modelos estatísticos

,ey ijkijijk

ij é a média esperada da combinação de níveis ij (parâmetro) eijk é o erro aleatório da repetição k da combinação de níveis ij

Modelo de médias:

onde:

,ey ijkijjiijk

é a média sem efeito ou efeito constante (parâmetro)i é o efeito do nível i do fator A (parâmetro)j é o efeito do nível j do fator B (parâmetro)ij é o efeito da interação dos níveis i e j (parâmetro)eijk é o erro aleatório da repetição k da combinação de níveis ij

onde:

Modelo de efeitos:ij

Page 15: ExercÃcio resolvido MCD - WordPress Institucional · 2020. 12. 14. · 3 3 0 0 * * $% (ihlwr vljqlilfdwlyr gd lqwhudomr grv idwruhv $ h % m5hmhlwd vh + &rqfoxvmr &rqfoxtprv dr qtyho

jiijij

ii

jj

Efeito da interação dos níveis ij

Efeito do nível j do fator B

Efeito do nível i do fator A

P2 = P2 - P - 2 + P4 = P4 - P - 4 + M2 = M2 - M - 2 + M4 = M4 - M - 4 +

P = P - M = M - G = G -

2 = 2 - 4 = 4 -

G2 = G2 - G - 2 + G4 = G4 - G - 4 +

yyyyˆ jiijij

yyˆ ii Estimador

yyˆ jj

Estimador

Estimador

Fator A: tamanho de arquivo

Fator B: tamanho de buffer

Page 16: ExercÃcio resolvido MCD - WordPress Institucional · 2020. 12. 14. · 3 3 0 0 * * $% (ihlwr vljqlilfdwlyr gd lqwhudomr grv idwruhv $ h % m5hmhlwd vh + &rqfoxvmr &rqfoxtprv dr qtyho

jB1

42B0

:H

:H

iA1

GMPA0

:H

:H

)0 de diferente efeito tem combinação uma menos pelo0:H

0:H

ijAB1

G4G2M4M2P4P2AB0

Hipóteses de interesse

0:H

0:H

iA1

GMPA0

Efeito da interação dos fatores A e B

Efeito principal do fator A

Efeito principal do fator B

0:H

0:H

jB1

42B0

Page 17: ExercÃcio resolvido MCD - WordPress Institucional · 2020. 12. 14. · 3 3 0 0 * * $% (ihlwr vljqlilfdwlyr gd lqwhudomr grv idwruhv $ h % m5hmhlwd vh + &rqfoxvmr &rqfoxtprv dr qtyho

Populações estatísticas

y: variável resposta

Sim A.B: interação significativa?

0:H

0:H

ijAB1

G4G2M4M2P4P2AB0

P2 P4

y

M2 G2 G4M4

Tratamentos distintos geram populaçõesde valores de y distintas?

Page 18: ExercÃcio resolvido MCD - WordPress Institucional · 2020. 12. 14. · 3 3 0 0 * * $% (ihlwr vljqlilfdwlyr gd lqwhudomr grv idwruhv $ h % m5hmhlwd vh + &rqfoxvmr &rqfoxtprv dr qtyho

y: variável resposta Tratamentos distintos geram populaçõesde valores de y distintas?

P G

y

M

Sim A.B : interação não significativaA: efeito principal significativo

Considera-se o fator A

iA1

GMPA0

:H

:H

Populações estatísticas

Page 19: ExercÃcio resolvido MCD - WordPress Institucional · 2020. 12. 14. · 3 3 0 0 * * $% (ihlwr vljqlilfdwlyr gd lqwhudomr grv idwruhv $ h % m5hmhlwd vh + &rqfoxvmr &rqfoxtprv dr qtyho

Estrutura cruzada: populações estatísticas

y: variável resposta

2

y

4

Tratamentos distintos geram populações de valores de y distintas?

Sim A.B : interação não significativaB: efeito principal significativo

42B1

42B0

:H

:H

Considera-se o fator B

Page 20: ExercÃcio resolvido MCD - WordPress Institucional · 2020. 12. 14. · 3 3 0 0 * * $% (ihlwr vljqlilfdwlyr gd lqwhudomr grv idwruhv $ h % m5hmhlwd vh + &rqfoxvmr &rqfoxtprv dr qtyho

Populações estatísticas

y: variável respostaTratamentos distintos geram populações de valores de y distintas?

Não

Y ~ N(, )

A.B: interação não significativaA: efeito principal não significativoB: efeito principal não significativo

Page 21: ExercÃcio resolvido MCD - WordPress Institucional · 2020. 12. 14. · 3 3 0 0 * * $% (ihlwr vljqlilfdwlyr gd lqwhudomr grv idwruhv $ h % m5hmhlwd vh + &rqfoxvmr &rqfoxtprv dr qtyho

jB1

42B0

:H

:H

iA1

GMPA0

:H

:H

Hipóteses estatísticas

Modelo de efeitos A variação de tratamento é decomposta em três partes:- efeito principal do fator A- efeito principal do fator B - efeito da interação A.B

Tabela da análise da variância

Page 22: ExercÃcio resolvido MCD - WordPress Institucional · 2020. 12. 14. · 3 3 0 0 * * $% (ihlwr vljqlilfdwlyr gd lqwhudomr grv idwruhv $ h % m5hmhlwd vh + &rqfoxvmr &rqfoxtprv dr qtyho

Tamanho do arquivo

Tamanho do buffer Médias marginais 2 4

P 2,105 2,383 2,244

M 2,193 2,580 2,386

G 2,248 2,765 2,506 Médias

marginais 2,182 2,576 2,379

Obtenção das somas de quadrados

Tabela de médias

= 8 (2,244 - 2,379)2 + 8 (2,244 - 2,379)2 + 8 (2,244 - 2,379)2 = 0,276

= 12 (2,182 - 2,379)2 + 12 (2,576 - 2,379)2 = 0,932

na = 3

nb = 2

r = 4

BATAB SQSQSQSQ (por diferença )

Page 23: ExercÃcio resolvido MCD - WordPress Institucional · 2020. 12. 14. · 3 3 0 0 * * $% (ihlwr vljqlilfdwlyr gd lqwhudomr grv idwruhv $ h % m5hmhlwd vh + &rqfoxvmr &rqfoxtprv dr qtyho

Fonte de variação GL SQ S2 F f

Tratamento 5 1,265 0,2532 35,63

Arquivo (A) 2 0,276 0,1382 19,46

Buffer (B) 1 0,932 0,932 131,27

Arquivo x Buffer (AB) 2 0,057 0,0285 4,01

Resíduo 18 0,123 0,0071 - -

Total 23 1,393 - - -

BATAB SQSQSQSQ

2j

jaB yyrnSQ

= 0,276

= 0,932

= 1,265 - 0,276 - 0,932 = 0,057 (por diferença )

Tabela da análise da variância

Page 24: ExercÃcio resolvido MCD - WordPress Institucional · 2020. 12. 14. · 3 3 0 0 * * $% (ihlwr vljqlilfdwlyr gd lqwhudomr grv idwruhv $ h % m5hmhlwd vh + &rqfoxvmr &rqfoxtprv dr qtyho

Fonte de variação GL SQ S2 F f

Tratamento 5 1,265 0,2532 35,63

Arquivo (A) 2 0,276 0,1382 19,46

Buffer (B) 1 0,932 0,932 131,27

Arquivo x Buffer (AB) 2 0,057 0,0285 4,01 3,55

Resíduo 18 0,123 0,0071 - -

Total 23 1,393 - - -

0:H

0:H

ijAB1

G4G2M4M2P4P2AB0

Efeito significativo da interação dos fatores A e B

Rejeita-se H0

Conclusão: Concluímos ao nível de 5% de significância, que existe interação entre tamanho do arquivo e tamanho do buffer. Isso significa que a mudança nos níveis de tamanho do arquivo irá modificar a forma como os níveis de tamanho do buffer afetam a variável resposta (e vice-versa).

Se a interação é significativa devemos

desconsiderar os efeitos principais dos

fatores A e B.

Tabela da análise da variância

Page 25: ExercÃcio resolvido MCD - WordPress Institucional · 2020. 12. 14. · 3 3 0 0 * * $% (ihlwr vljqlilfdwlyr gd lqwhudomr grv idwruhv $ h % m5hmhlwd vh + &rqfoxvmr &rqfoxtprv dr qtyho

iA1

n21A0

:H

...:Ha

- Testar o efeito principal do fator A

- Testar o efeito principal do fator B

jB1

n21B0

:H

...:Hb

Se a interação não é significativa, devemos:

Page 26: ExercÃcio resolvido MCD - WordPress Institucional · 2020. 12. 14. · 3 3 0 0 * * $% (ihlwr vljqlilfdwlyr gd lqwhudomr grv idwruhv $ h % m5hmhlwd vh + &rqfoxvmr &rqfoxtprv dr qtyho

0:H

0...:H

j

j

jajj

j

B|iBA|

1

B|nB|2B|1BA|

0

- Testar o efeito simples de A dentro de cada nível de B

0:H

0...:H

i

i

ibii

i

|Aj|AB

1

|An|A2|AB|AB

0

- Testar o efeito simples de B dentro de cada nível de A

Se a interação é significativa, devemos desconsiderar os efeitos principais e:

Page 27: ExercÃcio resolvido MCD - WordPress Institucional · 2020. 12. 14. · 3 3 0 0 * * $% (ihlwr vljqlilfdwlyr gd lqwhudomr grv idwruhv $ h % m5hmhlwd vh + &rqfoxvmr &rqfoxtprv dr qtyho

22|i2|A

1

22|G2|M2|P2|A

0

:H

:H

- Testar o efeito simples de Tamanho de arquivo dentro de cada nível de Tamanho de buffer

4|4i|4A

1

4|4G|4M|4P|4A

0

:H

:H

MM|jM|B

1

MM|4M|2M|B

0

:H

:H

GG|jG|B

1

GG|4G|2G|B

0

:H

:H

No exemplo:

- Testar o efeito simples de Tamanho de buffer dentro de cada nível de Tamanho de arquivo

Page 28: ExercÃcio resolvido MCD - WordPress Institucional · 2020. 12. 14. · 3 3 0 0 * * $% (ihlwr vljqlilfdwlyr gd lqwhudomr grv idwruhv $ h % m5hmhlwd vh + &rqfoxvmr &rqfoxtprv dr qtyho

Tamanho do arquivo

Tamanho do buffer Médias marginais 2 4

P 2,105 2,383 2,244

M 2,193 2,580 2,386

G 2,248 2,765 2,506

Médias marginais 2,182 2,576 2,379

Tabela de médias

Gráficos de médias: podem indicar a presença ou não de interação

Gráficos com linhas paralelas indicam fortemente a ausência de interação entre os fatores.

Gráficos com linhas que se cruzam indicam fortemente a presença de interação entre os fatores.

Gráficos da interação