experimentos com um Único fator e a anÁlise de … · experimentos com um Único fator e a...

20
PROJETO E ANÁLISES DE EXPERIMENTOS (PAE) EXPERIMENTOS COM UM ÚNICO FATOR E A ANÁLISE DE VARIÂNCIA Dr. Sivaldo Leite Correia

Upload: ledan

Post on 02-Dec-2018

226 views

Category:

Documents


0 download

TRANSCRIPT

PROJETO E ANÁLISES DE EXPERIMENTOS (PAE)

EXPERIMENTOS COM UM ÚNICO FATOR E A ANÁLISE

DE VARIÂNCIA

Dr. Sivaldo Leite Correia

EXEMPLO DE UM PROBLEMA COM UM ÚNICO FATOR

Uma empresa do ramo textil deseja desenvolver um novo tecido

com uma tensão de ruptura superior ao produto existente, o qual é

usado para a confecção de camisas

A resistência do tecido é infuenciada pelas características técnicas

de uma fibra que compõe o tecido

Pesquisadores do departamento de pesquisa e desenvolvimento

da empresa conhecem, pela experiência, que a tensão de ruptura

da fibra é afetada pela quantidade de algodão nas misturas de

materiais que entram na composição da fibra

O grupo suspeita que, aumentando o teor de algodão, aumentará a

resistência da fibra, pelo menos inicialmente

Após uma discussão de idéias, a equipe decide testar amostras

em 5 níveis de algodão, em teores (massa) de 15, 20, 25, 30 e 35 %

e utilizar 5 corpos-de-provas em cada nível de teor de algodão

Um projeto de experimento (NÃO ALEATÓRIO) é apresentado,

conforme Tabela 1

EXEMPLO DE UM PROBLEMA COM UM ÚNICO FATOR

Tabela 1. Projeto de experimentos para o problema o estudo do

efeito do teor de algodão na resistência de uma fibra

A ordem dos experimentos apresentada não é ALEATÓRIA. Os 25

ensaios devem ser aleatórios

Uma ordem aleatória é necessária para prevenir efeitos de

váriáveis desconhecidas e incontroláveis (ruídos), que podem

influenciar a resposta (Tabela 2)

EXEMPLO DE UM PROBLEMA COM UM ÚNICO FATOR

Tabela 2. Sequência aleatória dos experimentos

Ensaio

Número do

Experimento

Teor de Algodão (%)

1 8 20

2 18 30

3 10 20

4 23 35

5 17 30

6 5 15

7 14 25

8 6 20

9 15 25

10 20 30

11 9 20

12 4 15

13 12 25

14 7 20

15 1 15

16 24 35

17 21 35

18 11 25

19 2 15

20 13 25

21 22 35

22 16 30

23 25 35

24 19 30

25 3 15

EXEMPLO DE UM PROBLEMA COM UM ÚNICO FATOR

Tabela 3. Resultados obtidos para a resistência à tração da

fibra (lff/in2) para cada teor

Uma análise gráfica (diagrama de caixa) permite ter uma idéia

inicial à cerca dos dados da amostra

Na maioria das situações, é necessário ter um conhecimento

mais completo dos dados da amostra

Por exemplo, podemos estar interessados em avaliar se o fator

A afeta a variável resposta (propriedade) e comparar a

diferença das médias para cada tratamento

O procedimento mais adequado utiliza como ferramenta

estatística a ANÁLISE DE VARIÂNCIA, a qual permite obter uma

análise mais completa dos dados

Teor algodão Ensaios

(%) 1 2 3 4 5

15 7 7 15 11 9

20 12 17 12 18 18

25 14 18 18 19 19

30 19 25 22 19 23

35 7 10 11 15 11

ANÁLISE DE VARIÂNCIA

Suponhamos que a tratamentos ou níveis diferentes ( n réplicas) de

um fator sejam comparados

As observações para a resposta de cada a nível é uma variável

ALEATÓRIA

Tabela 4. Análise de variância de experimentos com um único fator

As somatórias e médias são definidas abaixo:

Tratamento

(nível)

Ensaio

s Totais Médias

1 y11 y12 ... y1n y1. ȳ1.

2 y21 y22 ... y2n y2. ȳ2.

. . . . . .

. . . . . .

a ya1 ya2 ... yan ya. ȳa.

y.. ȳ..

𝑦𝑖. = 𝑦𝑖𝑗

𝑛

𝑗=1

𝑦 𝑖. = 𝑦𝑖.

𝑛 , 𝑖 = 1, 2, … , 𝑎

𝑦.. = 𝑦𝑖𝑗

𝑛

𝑗=1

𝑎

𝑖=1

𝑦 .. = 𝑦..𝑁

𝑁 = 𝑎. 𝑛

ANÁLISE DE VARIÂNCIA

Tabela 5. Resultados para as somas e médias da resistência à tração

para a fibra (lbf/in2)

O procedimento para a análise de variância parte do princípio que as

observações seguem um MODELO LINEAR do tipo:

Onde yij é a ij-ésima observação; µ é parâmetro comum a todos os

tratamentos, isto é, a média global; τi é o efeito para o tratamento i,

e ϵij é o componente relacionado com o ERRO ALEATÓRIO

𝑦𝑖𝑗 = 𝜇 + 𝜏𝑖 + 𝜖𝑖𝑗 𝑖 = 1, 2, … , 𝑎𝑗 = 1, 2, … , 𝑛

Teor algodão Ensaios Totais Médias

(%) 1 2 3 4 5 yi. ȳi.

15 7 7 15 11 9 49 9,8

20 12 17 12 18 18 77 15,4

25 14 18 18 19 19 88 17,6

30 19 25 22 19 23 108 21,6

35 7 10 11 15 11 54 10,8

y.. = 376 ȳ..= 15,04

ANÁLISE DE VARIÂNCIA

O objetivo da análise estatística é realizar teste de hipótesis a cerca

do efeito dos tratamentos e estimação dos mesmos

Devemos assumir que os erros são variáveis aleatórias,

independentes e com distribuição normal, com média zero e

variância constante σ2

O teste de hipóteses pode ser definido da forma:

H0: µ1 = µ2 = . . . = µa

H1: µi ≠ µj para pelo menos um par (i, j)

Se H0 é verdadeira, todos os tratamentos tem a mesma média µ

comum

Alternativamente podemos escrever

H0: τ1 = τ 2 = . . . = τ a = 0

H1: τi ≠ 0 para pelo menos um i

ANÁLISE DE VARIÂNCIA

A variabilidade total nos dados é dada pela Soma dos Quadrados

Totais, SST

Podese-se demonstrar que a variabilidade total pode ser dividida em

duas partes:

𝑆𝑆𝑇 = 𝑦𝑖𝑗 − 𝑦 ..2

𝑛

𝑗=1

𝑎

𝑖=1

𝑦𝑖𝑗 − 𝑦 ..2

𝑛

𝑗=1

𝑎

𝑖=1

= 𝑛 𝑦 𝑖. − 𝑦 ..2

𝑎

𝑖=1

+ 𝑦𝑖𝑗 − 𝑦 𝑖.2

𝑛

𝑗=1

𝑎

𝑖=1

ANÁLISE DE VARIÂNCIA

(1) a soma dos quadrados entre as diferenças das médias dos

tratamentos e a média global

(2) a soma dos quadrados entre as diferenças dos valores

observados e a média do tratamento

A primeira grandeza está relacionada com o efeito dos tratamentos

(SSL), enquanto a segunda representa o erro aleatório (SSE)

Portanto,

𝑆𝑆𝑇 = 𝑆𝑆𝐿 + 𝑆𝑆𝐸

𝑆𝑆𝐸 = 𝑦𝑖𝑗 − 𝑦 𝑖.2

𝑛

𝑗=1

𝑎

𝑖=1

𝑆𝑆𝐿 = 𝑛 𝑦 𝑖. − 𝑦 ..2

𝑎

𝑖=1

ANÁLISE DE VARIÂNCIA

Média dos quadrados dos tratamentos (MSL) e média dos quadrados

dos erros (MSE)

O teste é baseado no cálculo da estatística F0 (parâmetro estatístico

da distribuição F), com (a-1) graus de liberdade (MSL) e (N-a) graus

de liberdade (MSE)

H0 será rejeitada se F0 > Fα, a – 1, N – a (ou p ≤ α)

Tabela 6. Análise de variância para um único fator

𝑀𝑆𝐿 = 𝑆𝑆𝐿

𝑎 − 1 𝑀𝑆𝐸 =

𝑆𝑆𝐸

𝑁 − 𝑎

𝐹0 = 𝑀𝑆𝐿

𝑀𝑆𝐸

Fonte de variação Soma dos Quadrados

Graus de liberdade

Média dos Quadrados

F0

Tratamentos SSL a - 1 MSL

E

L

MS

MSF 0

Erros SSE N - a MSE

Total SST N - 1

EXEMPLO DO ESTUDO DO TEOR DE ALGODÃO NA

RESISTÊNCIA DA FIBRA

Retomando ao exemplo do efeito do teor de algodão na resistência

da fibra

H0: µ1 = µ2 = µ3 = µ4 = µ5

H1: algumas médias são diferentes

Teor algodão Ensaios Totais Médias

(%) 1 2 3 4 5 yi. ȳi.

15 7 7 15 11 9 49 9,8

20 12 17 12 18 18 77 15,4

25 14 18 18 19 19 88 17,6

30 19 25 22 19 23 108 21,6

35 7 10 11 15 11 54 10,8

y.. = 376 ȳ..= 15,04

𝑆𝑆𝑇 = 𝑦𝑖𝑗 − 𝑦 ..2

𝑛

𝑗=1

𝑎

𝑖=1

= 𝑦𝑖𝑗2

𝑛

𝑗=1

𝑎

𝑖=1

−𝑦..

2

𝑁

= 7 2 + 7 2 + 15 2+. . . + 11 2 − 376 2

25= 636,96

EXEMPLO DO ESTUDO DO TEOR DE ALGODÃO NA

RESISTÊNCIA DA FIBRA

Cálculo de SSL

Cálculo de SSE

Cálculo das médias MSL, MSE e F0

𝑆𝑆𝐸 = 𝑆𝑆𝑇 − 𝑆𝑆𝐿 = 636,96 − 475,76 = 161,20

𝑀𝑆𝐿 = 𝑆𝑆𝐿

𝑎 − 1=

475,76

4= 118,94 𝑀𝑆𝐸 =

𝑆𝑆𝐸

𝑁 − 𝑎=

161,20

20= 8,06

𝐹0 = 𝑀𝑆𝐿

𝑀𝑆𝐸=

118,94

8,06= 14,76

𝑆𝑆𝐿 = 𝑛 𝑦 𝑖. − 𝑦 ..2

𝑎

𝑖=1

= 1

𝑛 𝑦𝑖.

2

𝑎

𝑖=1

−𝑦..

2

𝑁

= 1

549 2 + 77 2 +. . . + 54 2 −

376 2

25= 475,76

EXEMPLO DO ESTUDO DO TEOR DE ALGODÃO NA

RESISTÊNCIA DA FIBRA

Tabela 7. Resultados para a análise de variância do exemplo da

resistência da fibra

O valor Fα, a-1, N-a pode ser obtido usando a Tabela de Distribuição F

Para α = 0,05, F0,05, 4, 20 = 2,87

Como F0,05, 4, 20 < F0 (2,87 < 4,76 ou p < 0,05), Rejeita-se H0 a um nível

menor que 0,01 (valor exato é de 9,11 x 10-6)

Conclusão: O teor de algodão na fibra afeta significativamente a

tensão média de ruptura do material

Fonte de

variação

Soma

Quadrados

Graus

liberdade

Média

Quadrados

F0 p

Teor de

algodão

475,76

4

118,94

14,76

< 0,01

Erros

161,20 20 8,06

Total 636,96 24

ANÁLISE COM DADOS NÃO BALANCEADOS

Se os dados não são balanceados, o procedimento é o mesmo,

porém com ligeiras modificações nos cálculos de SST e SSL

Entretanto, mesmo sendo possível usar a análise de variância em

dados não balanceados, recomenda-se sempre que for possível usar

dados balanceados

𝑁 = 𝑛𝑖

𝑎

𝑖=1

𝑆𝑆𝑇 = 𝑦𝑖𝑗2

𝑛𝑖

𝑗=1

𝑎

𝑖=1

−𝑦..

2

𝑁 𝑆𝑆𝐿 =

𝑦𝑖.2

𝑛𝑖

𝑎

𝑖=1

−𝑦..

2

𝑁

INTERVALO DE CONFIANÇA PARA AS MÉDIAS

POPULACIONAIS EM CADA TRATAMENTO

Um intervalo de confiança de 100 (1-α) % da média no i-ésimo

tratamento, ou seja, µi é

Um intervalo de confiança de 95 % para a média do tratamento 4

(30 % de algodão) é

𝜇4 = 21,60 ± 2,0868,06

5= 21,60 ± 2,65 𝑜𝑢 18,95 ≤ 𝜇4 ≤ 25,25

𝜇𝑖 = ȳ𝑖. ± 𝑡(𝛼 2 , 𝑁−𝑎)

𝑀𝑆𝐸

𝑛

COEFICIENTE DE DETERMINAÇÃO

A quantidade chamada coeficiente de determinação, R2, é uma

medida da proporção da variabilidade nos dados explicada pelo

modelo de análise de variância (neste caso os tratamentos)

Para o exemplo do efeito do teor de algodão na resistência da fibra

O fator teor de algodão na fibra explica 74,69 % da variabilidade na

resistência à tração da fibra

𝑅2 = 636,96 − 161,20

636,96= 1 −

161,20

636,96= 0,7469 𝑜𝑢 74,69 %

𝑅2 = 𝑆𝑆𝑒𝑥𝑝𝑙𝑖𝑐𝑎𝑑𝑎

𝑆𝑆𝑇=

𝑆𝑆𝑇 − 𝑆𝑆𝐸

𝑆𝑆𝑇= 1 −

𝑆𝑆𝐸

𝑆𝑆𝑇=

𝑆𝑆𝐿

𝑆𝑆𝑇

VERIFICAÇÃO DA ADEQUAÇÃO DO MODELO

Para que a análise de variância seja uma ferramenta viável para o

teste de hipóteses, as considerações a cerca da normalidade devem

ser satisfeitas:

Os erros são independentes e normalmente distribuídos com média

zero e variância desconhecida, mas constante σ2

Na prática, entretanto, tais considerações geralmente não são

levadas a sério e, nesse caso, as conclusões da análise de variância

não podem ser confiáveis até que as considerações sejam checadas

Violações nas considerações básicas e adequação do modelo

podem ser investigadas pela avaliação dos RESÍDUOS

Define-se resíduo (eij), para a observação j no tratamento i, a

grandeza

Onde ȳi. é uma estimativa da correspondente observação yij

𝑒𝑖𝑗 = 𝑦𝑖𝑗 − 𝑦 𝑖𝑗 = 𝑦𝑖𝑗 − ȳ𝑖.

VERIFICAÇÃO DA ADEQUAÇÃO DO MODELO

A avaliação dos resíduos deve ser parte da análise de variância

Se as considerações estão sendo obedecidas, os resíduos NÃO

DEVEM APRESENTAR NENHUMA TENDÊNCIA PADRÃO, OU SEJA,

DEVEM SER DESORGANIZADOS, NÃO APRESENTANDO

CORRELAÇÕES ÓBVIAS

A checagem da adequação é feita pela análise gráfica dos resíduos

As técnicas mais usadas englobam

(1) Comprovação gráfica da normalidade

(2) Gráfico dos resíduos versus a sequência dos experimentos

(3) Gráfico dos resíduos versus valor predito ou ajustado para as

medidas

Para checar a normalidade, calcula-se a grandeza Pk, onde k é a

ordem do resíduo

𝑃𝑘 = (𝑘 −

12)

𝑁

VERIFICAÇÃO DA ADEQUAÇÃO DO MODELO

Os resíduos são colocados em ordem crescente e a grandeza Pk é

plotada versus os resíduos em PAPEL de PROBABILIDADE NORMAL

Se os resíduos seguem uma distribuição normal os mesmos devem

seguir uma linha reta, a qual representa a curva normal

Pequenos devios são aceitáveis, desde que a tendência seja

verificada

Para a verificação nos gráficos dos resíduos, não devem ser

observados resíduos:

(1) com tendências positivas e negativas consecutivas, pois tais

comportamentos indicam correlação

(2) tendência de afunilamento no caso do gráfico dos resíduos

versus valor predito, pois tal tendência indica uma variação na

variância