controle estatístico de processos: a questão da ... · controle estatístico de processos: ... 54...

57
1 João Pessoa, 2 a 5 de Setembro 2008 Controle Estatístico de Processos: a questão da autocorrelação, dos erros de mensuração e do monitoramento de mais de uma característica de qualidade Docentes: Maysa S. de Magalhães; Linda Lee Ho; Antonio Fernando B. Costa.

Upload: vothien

Post on 10-Nov-2018

223 views

Category:

Documents


0 download

TRANSCRIPT

1 João Pessoa, 2 a 5 de Setembro 2008

Controle Estatístico de Processos: a questão da autocorrelação, dos erros de mensuração

e do monitoramento de mais de uma característica de qualidade

Docentes: Maysa S. de Magalhães; Linda Lee Ho; Antonio Fernando B. Costa.

2 João Pessoa, 2 a 5 de Setembro 2008

PrefácioPrefácioPrefácioPrefácio

O monitoramento de um processo é feito com base nas informações de uma, ou de

mais de uma característica de qualidade, que são selecionadas de acordo com as especificações

do produto. Por exemplo, saquinhos de leite devem conter entre 985 ml e 1015 ml; um

saquinho de leite com menos de 985 ml gera multa a empresa, e com mais de 1015 ml tem risco

de estourar durante o manuseio e transporte. Neste caso, a característica de qualidade de

interesse X é a quantidade de leite dentro do saquinho e a missão do monitoramento é manter

as variações de X dentro de níveis que não comprometam as especificações. A variável X é

também chamada de variável de monitoramento. Pois bem, para obter os valores de X,

defronta-se primeiro com a questão da precisão do sistema de medição e, em seguida, com a

questão da correlação entre Xi e Xi+1, onde o sub índice (i) é o número do item, de acordo com a

seqüência de produção. As notas deste mini-curso são constituídas de cinco seções, a primeira

parte destas notas é uma revisão das propriedades dos gráficos de Shewhart; a segunda parte é

dedicada ao estudo dos gráficos de Shewhart, mais especificamente do gráfico de X , na

presença de erros de mensuração e da autocorrelação entre valores de X. A terceira e quarta

seções são dedicadas ao monitoramento de processos multivariados; são distintas uma da

outra, por tratarem de variáveis contínuas e discretas, respectivamente e por fim comentários

finais são feitas na última seção. Este mini-curso trata, portanto, de pesquisas recentes na área

de Controle Estatístico de Processos, que abordam a questão da autocorrelação dos dados, do

erro de mensuração e do monitoramento simultâneo de várias características de qualidade.

Maysa Sacramento de Magalhães; Linda Lee Ho;

Antonio Fernando Branco Costa. Setembro 2008

3 João Pessoa, 2 a 5 de Setembro 2008

Conteúdo

SEÇÃO UM: .............................................................................................. 5

REVISÃO DAS PROPRIEDADES DOS GRÁFICOS DE SHEWHART ................ 5

1. INTRODUÇÃO .......................................................................................... 5 1.1 - ALARME FALSO NO GRÁFICO DE X .......................................................... 7 1.2 PODER DO GRÁFICO DE X .................................................................... 10 REFERÊNCIA .............................................................................................. 12

SEÇÃO DOIS ........................................................................................... 13

ERRO DE MENSURAÇÃO E DADOS AUTOCORRELACIONADOS .............. 13

2 . INTRODUÇÃO ........................................................................................ 13 2.1 ERRO DE MENSURAÇÃO ........................................................................ 13 2.2 DADOS AUTO CORRELACIONADOS ........................................................... 17 2.3. ERRO DE MENSURAÇÃO COM DADOS AUTOCORRELACIONADOS .................... 25 REFERÊNCIAS ............................................................................................ 27

SEÇÃO TRÊS: .......................................................................................... 28

PROCESSOS MULTIVARIADOS - VARIÁVEIS CONTÍNUAS ........................ 28

3. INTRODUÇÃO ........................................................................................ 28 3.1 O VETOR DE MÉDIAS E A MATRIZ DE COVARIÂNCIAS AMOSTRAIS .................... 28 3.2 GRÁFICOS DE CONTROLE PARA O MONITORAMENTO DO VETOR DE MÉDIAS ...... 31 3.3. GRÁFICOS DE CONTROLE PARA O MONITORAMENTO DA MATRIZ DE

COVARIÂNCIAS .......................................................................................... 33

4 João Pessoa, 2 a 5 de Setembro 2008

REFERÊNCIAS ............................................................................................ 36

SEÇÃO QUATRO..................................................................................... 38

PROCESSOS MULTIVARIADOS-VARIÁVEIS DISCRETAS ........................... 38

4 - INTRODUÇÃO ....................................................................................... 38 4.1 – DISTRIBUIÇÃO POISSON BIVARIADA – UMA BREVE REVISÃO ........................ 39 4.2 – GRÁFICOS DE CONTROLE PARA OBSERVAÇÕES INDIVIDUAIS DE UM PROCESSO DE

POISSON BIVARIADO ................................................................................... 43 4.3 – EXEMPLO NUMÉRICO ......................................................................... 50 4.4- CONSIDERAÇÕES FINAIS ........................................................................ 53 REFERÊNCIAS ............................................................................................ 54 APÊNDICE ................................................................................................. 55

SEÇÃO CINCO: ....................................................................................... 57

COMENTÁRIOS FINAIS ........................................................................... 57

5 João Pessoa, 2 a 5 de Setembro 2008

Seção USeção USeção USeção UM:M:M:M:

Revisão das propriedades dos gráficos de ShewhartRevisão das propriedades dos gráficos de ShewhartRevisão das propriedades dos gráficos de ShewhartRevisão das propriedades dos gráficos de Shewhart

1. Introdução

Antes de se pensar em controlar um processo é preciso primeiro estudar o

comportamento da característica de qualidade X a ser monitorada; para isto é preciso que o

sistema de medição seja confiável. Erros de mensuração bem como a correlação em série entre

valores da variável X, que compõem os subgrupos racionais, comprometem o desempenho dos

gráficos de controle. Para ilustrar o efeito do erro de mensuração e da autocorrelação das

observações no desempenho dos gráficos de controle, seja o gráfico de X . Nesta seção é feita

uma revisão das propriedades dos gráficos de X para dados independentes e sem erros de

mensuração. A próxima seção estende os resultados, incorporando os erros de mensuração e a

autocorrelação.

Quando o gráfico de X está em uso, monitorando um processo, amostras de tamanho

n são retiradas a cada h horas, e o valor calculado da estatística X para cada amostra é plotado

no gráfico de controle. Este dispositivo estatístico pode ser visto como uma seqüência de testes

de hipóteses, onde, a cada h horas, testamos sempre as mesmas hipóteses:

0H : Processo em controle

1H : Processo fora de controle

Outras maneiras de descrever as hipóteses 0H e 1H são:

0H : Processo ajustado

1H : Processo desajustado

6 João Pessoa, 2 a 5 de Setembro 2008

ou

0H : Processo centrado no valor-alvo

1H : Processo não centrado no valor-alvo

ou

0H : Processo livre de causas especiais

1H : Processo sob a influência de causas especiais

ou, ainda,

0H : 0µµ =

1H : 0µµ ≠

onde 0µ é o valor-alvo ou o valor médio em controle da variável aleatória X.

A hipótese 0H é aceita como verdadeira todas as vezes que o valor de X cair dentro

dos limites de controle. Já a hipótese 1H é aceita como verdadeira sempre que o valor de X

cair fora dos limites de controle.

Se o processo estiver em controle ( 0H verdadeira), α representa o risco

(probabilidade) de erroneamente se considerar o processo fora de controle (“alarme falso”). Se

o processo estiver fora de controle ( 1H verdadeira), β representa o risco (probabilidade) de

erroneamente se considerar o processo em controle (“não-detecção”).

A conseqüência de ordem prática associada ao erro do tipo I (alarme falso) é intervir no

processo na hora errada, quando o mesmo está isento de causas especiais (o que em si já

acarreta um custo — de interrupção do processo, de mão de obra — além de um risco de

desajustar um processo que estava ajustado); e a conseqüência de ordem prática associada ao

erro do tipo II (não detecção) é não intervir no processo na hora certa, quanto o mesmo está

sob a influência de causas especiais.

7 João Pessoa, 2 a 5 de Setembro 2008

Dado que o processo é considerado em controle (“ 0H verdadeira”) quando X cai

dentro dos limites do gráfico e fora de controle (“ 0H falsa”) quando X está fora dos limites do

gráfico, as probabilidades de alarme falso (α ) e de não-detecção ( β ) são dadas por:

]Xou Pr[ 0µµα =<>=XX

LICLSCX

] Pr[ 0µµβ ≠<<=XX

LSCXLIC

ondeX

LIC e X

LSC são respectivamente os limites inferior e superior de controle do gráfico de

controle. O poder do gráfico de controle, Pd, é definido como sendo a probabilidade de

detecção (Pd=1-β). Assume-se que as causas especiais não alteram o desvio padrão σ da

variável aleatória X.

1.1 - Alarme Falso no Gráfico de X

Quando a hipótese 0H é a hipótese verdadeira (processo isento de causas especiais) o

ideal é que todos os pontos X caiam dentro dos limites de controle do gráfico. Contudo, por

tratar-se de um teste estatístico, existe o risco αααα de um deles cair fora dos limites. Quando isto

acontece, tem-se alarme falso: um sinal indevido de que o processo está sob a influência de

alguma causa especial, portanto demandando ajustes. Devido a esse sinal, interfere-se no

processo na hora errada, ou seja, quando o mesmo se encontra no mais perfeito estado de

controle (com a distribuição da característica de qualidade X estável e ajustada no alvo,

0µµ = ). A Figura 1 retrata a ocorrência de um alarme falso. Nessa figura, a hipótese 0H é

verdadeira, pois a média X

µ da variável aleatória X é igual ao valor-alvo 0µ .

Para se calcular o risco α — probabilidade de alarme falso — é necessário conhecer a

distribuição da variável aleatória X . Na verdade, graças ao Teorema do Limite Central, para

8 João Pessoa, 2 a 5 de Setembro 2008

uma grande variedade de distribuições de X, a distribuição de X tenderá, com boa precisão, a

uma distribuição normal, mesmo para amostras pequenas. Definindo a variável aleatória Z

como:

X

XX

µ−=

esta terá distribuição normal com média 0=Zµ e desvio padrão 1=Zσ . Quando o processo

está em controle, 0µµ =X e

X n

σσ = .

15 30 45 60 75 90 105 Minutos

)/;(~);(~X 0 nNNXX

σµσµ

LM = µ0

nLSC /30 σµ +=

Alarme falso

nLIC /30 σµ −=

Figura 1: Gráfico de X – ocorrência de um alarme falso

(Extraída da Figura 3.7 do livro de Costa, Epprecht e Carpinetti, 2005)

9 João Pessoa, 2 a 5 de Setembro 2008

Tradicionalmente, os limites de controle do gráfico de X são estabelecidos — usando

os valores em controle dos parâmetros do processo, µ0 e σ — a ± 3 desvios padrão amostrais

da linha média (LM= 0µ ), ou seja, em 0 3n

σµ ± ; ver Figura 1. Se o processo estiver em

controle, a probabilidade de um ponto X cair fora dos limites de controle assim localizados é

igual a

=<+>= ] Pr[]Pr[XX

LICXLSCXα

−<+

−>=

X

XX

X

XXLIC

ZLSC

µσ

µPrPr

Substituindo XLSC por X

σµ 30 + , XLIC por X

σµ 30 − , e (já que está supondo o

processo em controle) Xµ por 0µ e Xσ por X n

σσ = , chega-se, após simplificações

imediatas, a

]3|Pr[| >= Zα

Para z=3, o risco α é igual a 0,0027. Então, durante o período em que o processo

permanece estável e ajustado, portanto sob controle, essa é a probabilidade de o valor de X

cair na região de ação do gráfico (acima do X

LSC ou então, abaixo do X

LIC ); ou seja, é a

probabilidade que cada amostra tem de gerar um alarme falso. A distribuição do número de

amostras, L, que antecedem um alarme falso (incluindo a amostra que gera o alarme falso)

segue uma distribuição geométrica de parâmetro p=α cuja função de probabilidade é dada por

1)1(]Pr[ −−== dppdL , d=1, 2, 3,…

10 João Pessoa, 2 a 5 de Setembro 2008

Por exemplo, na Figura 1 temos L=7. A média da distribuição geométrica é igual a 1/p,

portanto o número médio de amostras (NMA) até um alarme falso é igual a α/1 . Em outras

palavras, com limites de 3 desvios padrão, tem em média um alarme falso a cada (1/0,0027) =

370,4 pontos plotados. Caso o usuário considere esta freqüência de alarmes falsos inaceitável,

uma alternativa consiste em alargar os limites de controle, por exemplo, aumentar k de 3,00

para 3,10 (k é o fator de abertura dos limites de controle, ou seja, 0LIC kn

σµ= − e

0LSC kn

σµ= + ). Com k=3,10, o risco de alarme falso diminui para 0,0019 e o NMA aumenta

para 516,7. O risco α é função apenas do fator de abertura dos limites de controle, k.

]Pr[ kZ >=α

1.2 Poder do Gráfico de X

Quando a hipótese 1H é a hipótese verdadeira (processo sob a influência de causas

especiais), o ideal seria que o primeiro ponto plotado já caísse fora dos limites de controle

(sinalizando o estado de falta de controle). Contudo, isto nem sempre ocorre, em especial se o

deslocamento sofrido pela média do processo for pequeno. É usual expressar este

deslocamento em unidades iguais ao desvio padrão da variável X, de forma que o novo valor da

média, µ1, pode ser escrito como =1µ δσµ +0 , portanto

σµµδ 01 −= .

De um modo geral, se 5,1≥δ , então rapidamente um valor de X cairá fora dos limites

de controle. Caso contrário, existirá uma certa inércia. Por exemplo, na Figura 2, o sinal só

11 João Pessoa, 2 a 5 de Setembro 2008

ocorre quando o 5º valor de X é plotado. Nessa figura, a hipótese 1H é verdadeira porque a

média X

µ da variável X é diferente de 0µ ; na verdade, ela é igual a δσµ +0 .

A probabilidade de um valor de X cair acima do Limite Superior de Controle é dada

por:

]Pr[]Pr[ LSCZZLSCX >=> ,

onde ( )

XLSC

X

LSCZ

µσ

−= = 0 0[ ( )]

X

X

kµ σ µ δσσ

+ − += nk δ− , e a probabilidade de um valor de

X cair abaixo do Limite Inferior de Controle (LIC) é dada por:

=< ]Pr[ LICX ]Pr[ LICZZ < ,

onde ( )

XLIC

X

LICZ

µσ

−= = 0 0[ ( )]

X

X

kµ σ µ δσσ

− − += nk δ−− . Como Pr[Z>z]=Pr[Z<-z], (e

portanto Pr[Z>LSC]=Pr[Z<-LSC]), tem-se

]Pr[]Pr[ nkZnkZPd δδ −−<++−<= .

A distribuição do número de amostras, M, que antecede um alarme verdadeiro

(incluindo a amostra que gerou o sinal, ou seja, a amostra cujo valor X não pertence ao

intervalo delimitado pelos limites de controle) segue uma distribuição geométrica de parâmetro

p=(Pd), cuja função de probabilidade é dada por

1)1(]Pr[ −−== mppmM , m=1, 2, 3,…

12 João Pessoa, 2 a 5 de Setembro 2008

15 30 45 60 75 90 Minutos

nLSC /30 σµ +=

)n/;(N~);(N~XX

σδσµσµ +0X

LM = µ0

Alarme verdadeiro

δσµµ += 0

nLIC /30 σµ −=

δσ

Figura 2: Gráfico de X – ocorrência de um alarme verdadeiro

(Extraída da Figura 3.10 do livro de Costa, Epprecht e Carpinetti, 2005)

Por exemplo, na Figura 2, temos M=5. A média da distribuição geométrica de parâmetro p é

igual a 1/p, portanto o número médio de amostras (NMA) que antecedem um alarme

verdadeiro é igual a 1/(Pd).

Referência

COSTA, A.F.B.; EPPRECHT E.K.; CARPINETTI, L.C.R. Controle Estatístico de Qualidade. 2. ed. São

Paulo: Editora Atlas, 2005. 334 p.

13 João Pessoa, 2 a 5 de Setembro 2008

Seção DOISSeção DOISSeção DOISSeção DOIS

Erro de mensuração e dados autocorrelacionadosErro de mensuração e dados autocorrelacionadosErro de mensuração e dados autocorrelacionadosErro de mensuração e dados autocorrelacionados

2 . Introdução

Os gráficos de controle foram introduzidos por Shewhart que, em um primeiro

momento, supôs um sistema de medição isento de erros e uma variável de monitoramento

gerando observações independentes. Nesta seção, os efeitos do erro de mensuração e/ou da

autocorrelação no desempenho do gráfico de controle serão investigados.

2.1 Erro de Mensuração

É importante salientar que estudos de Repetibilidade e Reprodutibilidade devem

anteceder até mesmo as investigações preliminares do comportamento da variável de

monitoramento X. Nesta seção, alguns comentários sobre o efeito do erro de mensuração no

desempenho do gráfico de controle serão feitos. Para tanto, considere uma amostra de

tamanho n em que cada item é medido m vezes formando o seguinte conjunto de observações:

X1 + e11 X2 + e21 ... Xn + en1

X1 + e12 X2 + e22 ... Xn + en2

... ... ...

X1 + e1m X2 + e2m ... Xn + enm

14 João Pessoa, 2 a 5 de Setembro 2008

Devido ao erro de medição, o valor exato, iX , da característica de qualidade é

acompanhado de um erro ije . Deste modo, a característica de qualidade de um mesmo item

pode ter m diferentes valores: 1ii eX + , 2ii eX + ,.., imi eX + .

A média amostral é dada por

nm

e)X...XX(mX

m

j

n

iijn ∑∑+++

= = =1 121

Sejam σ o desvio padrão do processo e σm o desvio padrão do erro de mensuração. Se

as observações de X não forem autocorrelacionadas e os erros de mensuração ije forem

independentes de X, então:

22

( )

m

mXn

σσσ

+=

Neste caso, os limites de controle do gráfico da média são dados por

mn

kLC m /1 22

0 σσµ +±=

Para );(N~ σµX e );0(N~ me σ o poder de detecção é dado por:

( ) ( )dP k C n k C nδ δ= Φ − − + Φ − +

onde 21

2 Cm

m

)/(m

mC

m +=

+=

σσ e (.)Φ denota a função acumulada de distribuição

normal padrão.

15 João Pessoa, 2 a 5 de Setembro 2008

A constante C assume valores entre 0 e 1. Quando C =1, não se tem erro de

mensuração. O gráfico de controle perde poder de detecção à medida que C diminui. Na

Tabela 1, estão valores de C para m= 1 e 4 e 1mC

σσ

= = 0; 0,1; 0,3; 0,5 e 1,0. Quando m=1, cada

item é medido uma única vez, e quando =1C 0, não existe erro de mensuração.

Tabela 1. Valores de C

1C

C

m=1 m=4

0 1 1

0,1 0,9950 0,9988

0,3 0,9578 0,9889

0,5 0,8944 0,9701

1,0 0,7071 0,8944

O erro de mensuração pode ser minimizado pela repetição da medida de um mesmo

item (m>1). Por exemplo, quando o erro de mensuração corresponde a 30% da variabilidade

do processo ( mσσ

=0,3), tem-se para m=1 um valor de C =0,9578 e para m=4 um valor de

C =0,9889, isto é, medindo um mesmo item quatro vezes o valor de C fica mais próximo da

unidade, que é quando o erro de mensuração deixa de existir.

O gráfico da Figura 3 ilustra o efeito do erro de mensuração no desempenho do gráfico

da média. Por exemplo, quando a causa especial desloca a média de um desvio padrão, sem o

erro de mensuração o NMA= 6,3; já supondo que a variabilidade do instrumento de medida seja

da mesma ordem da variabilidade do processo ( mσσ

=1,0), o NMA aumenta assustadoramente,

NMA=17,7. Este aumento é minimizado quando o mesmo item é medido várias vezes. De

acordo com a Figura 4, se um mesmo item é medido quatro vezes (m=4), o NMA se reduz de

17,7 para 8,9.

16 João Pessoa, 2 a 5 de Setembro 2008

Nos estudos de Repetibilidade e Reprodutibilidade, um instrumento de medida é

considerado apropriado quando a sua variabilidade não exceder de 30% da variabilidade do

processo ( 1C <0,3). Nestes casos, o efeito do erro de mensuração no desempenho do gráfico é

pequeno (isto é percebido nas Figuras 3 e 4, pela proximidade das linhas correspondentes a

1C =0 e 1C =0,3).

1

10

100

0,5 0,75 1 1,25 1,5 1,75 2

δδδδ

NMA

C1=0

C1=0,3

C1=1,0

Esc

ala

loga

rítm

ica

Figura 3. Efeito do erro de mensuração no NMA, m=1, n=4.

17 João Pessoa, 2 a 5 de Setembro 2008

1

10

100

0,5 0,75 1 1,25 1,5 1,75 2

δδδδ

NMA

C1=0

C1=0,3

C1=1,0

Esc

ala

loga

rítm

ica

Figura 4. Efeito do erro de mensuração no NMA, m=4, n=4.

2.2 Dados Auto correlacionados

Para se utilizar um gráfico de controle convencional (de Shewhart) é necessário que as

observações da característica de qualidade de interesse sejam independentes e normalmente

distribuídas. Satisfeitas estas condições, então é possível fazer uso destes dispositivos

estatísticos para tomar decisões sobre o estado do processo: se em controle ou se fora de

controle.

Se a hipótese de normalidade for ligeira ou moderadamente violada, ainda assim os

gráficos convencionais funcionam razoavelmente bem; entretanto, quando os valores da

característica de qualidade possuem alguma interdependência, ou autocorrelação, mesmo que

18 João Pessoa, 2 a 5 de Setembro 2008

em grau relativamente pequeno, o risco α — probabilidade de uma observação cair fora dos

limites do gráfico, com o processo em controle — aumenta, e compromete a credibilidade deste

dispositivo pela ocorrência de um número elevado de alarmes falsos.

De fato, Shewhart, ao criar os gráficos de controle, estava destinando-os à indústria de

partes discretas, com quase ou nenhum grau de automação. Em tais processos, a condição de

independência das observações geralmente era satisfeita. Hoje em dia, porém, processos

contínuos e por batelada são extremamente freqüentes, principalmente (embora não

exclusivamente) na indústria química e na indústria metalúrgica. Tais processos raramente

produzem observações independentes, de modo que não podem ser monitorados pelos

gráficos de controle convencionais.

Esse problema não se restringe a processos contínuos e por batelada: processos

discretos altamente automatizados, freqüentes hoje em dia, também costumam produzir dados

autocorrelacionados. É, portanto importante antes de iniciar o monitoramento de um processo,

identificar se ele produz observações independentes ou se é autocorrelacionado, pois um

gráfico de controle inadequado, que produza alarmes falsos em excesso, acabará sendo

descartado, ou pior, mantido apenas para cumprir alguma exigência formal; os alarmes são

simplesmente ignorados pelo pessoal envolvido com o processo.

O exemplo a seguir foi extraído do livro de Costa, Epprecht e Carpinetti (2005). A coluna

“Xi” da Tabela 2 registra os valores de 150 medições sucessivas (espaçadas de 3 minutos) da

temperatura de um banho químico, cujo valor-alvo é 225°C. A primeira medida foi efetuada às

8:00h, a segunda, às 8:03h, e assim por diante. Para melhor visualização, a Figura 5 apresenta o

gráfico da temperatura do banho químico em função do tempo. As demais colunas da Tabela 2

foram construídas deslocando as observações da 1o coluna: o 1º elemento da 2ª coluna é o 2º

elemento da 1ª coluna, o 1º elemento da 3ª coluna é o 2º elemento da 2ª coluna, que por sua

vez é o 3º elemento da 1ª coluna, e assim por diante.

19 João Pessoa, 2 a 5 de Setembro 2008

Tabela 2. Série de Medidas da Temperatura de um Banho Químico.

i xi xi+1 xi+2 xi+3 xi+4 xi+5 xi+6 xi+7

1 237,59 234,40 233,66 237,42 232,54 233,70 235,20 232,36 2 234,40 233,66 237,42 232,54 233,70 235,20 232,36 229,21 3 233,66 237,42 232,54 233,70 235,20 232,36 229,21 231,97 4 237,42 232,54 233,70 235,20 232,36 229,21 231,97 227,02 5 232,54 233,70 235,20 232,36 229,21 231,97 227,02 229,42 6 233,70 235,20 232,36 229,21 231,97 227,02 229,42 227,65 7 235,20 232,36 229,21 231,97 227,02 229,42 227,65 226,88 ... ... ... ... ... ... ... ... ...

141 233,25 229,59 228,78 226,59 226,19 225,98 225,12 229,09 142 229,59 228,78 226,59 226,19 225,98 225,12 229,09 229,95 143 228,78 226,59 226,19 225,98 225,12 229,09 229,95 223,64 144 226,59 226,19 225,98 225,12 229,09 229,95 223,64 145 226,19 225,98 225,12 229,09 229,95 223,64 146 225,98 225,12 229,09 229,95 223,64 147 225,12 229,09 229,95 223,64 148 229,09 229,95 223,64 149 229,95 223,64 150 223,64

Temperatura

200

210

220

230

240

250

0 10 20 30 40 50 60 70 80 90 100 110 120 130 140 150

Número da Medida

Figura 5. Série de Medidas da Temperatura do Banho Químico.

A Tabela 3 apresenta os coeficientes de autocorrelação amostral kr para a defasagem

k=1, 2,... Observe que existe uma correlação positiva muito alta entre os valores das colunas Xi

20 João Pessoa, 2 a 5 de Setembro 2008

e Xi+1 ( r1 = 0,893). Este nível de correlação é alto, o suficiente para comprometer o desempenho

do gráfico de controle de Shewhart; uma alta autocorrelação positiva provoca freqüentes

alarmes falsos.

Tabela 3. Coeficientes de autocorrelação amostral

k rk k rk

1 0,893 7 0,465

2 0,793 M M

3 0,714 15 0,217

4 0,638 16 0,194

5 0,588 M M

6 0,527 M M

Costa, Epprecht e Carpinetti (2005) apresentam maneiras de se controlar processos

quando os valores da variável de monitoramento X são autocorrelacionados. Nenhuma delas,

contudo, é estabelecida com base em uma expressão matemática da forma como as

observações se relacionam como, por exemplo, a que segue:

iii eXX +−=− − )( 1 µφµ , i=1, 2, .. , µ=0X , e )0N(~ ei ,e σ

A expressão acima representa o modelo autoregressivo de primeira ordem AR (1). Em

muitos processos industriais os valores da característica de qualidade X, medidas no tempo, se

ajustam a um modelo AR (1). Nesta seção, investiga-se como é o desempenho do gráfico de

controle de médias quando os valores de X não são independentes, mas descritos por um

modelo AR (1). Para o modelo AR(1), a variância do processo e do erro tem a seguinte relação:

)1/( 222 φσσ −= e . Aqui, assume-se que o intervalo entre retirada de amostras é suficientemente

espaçado para garantir que os valores de X de uma amostra são independentes dos valores de X

da amostra anterior. Para exemplificar considere o caso em que n=3:

21 João Pessoa, 2 a 5 de Setembro 2008

11 eX += µ

212 )( eXX +−+= µφµ

323 )( eXX +−+= µφµ

Segue que

A Tabela 4 apresenta as expressões de 22−nC para n=2, 3, 4, 5, 6. A constante C2 assume

valores entre 0 e 1. Para φ=0 as observações de X tornam-se independentes e C2=1.

Tabela 4. Expressões de 22−nC

n 2

2−nC

2 φ22 +

3 2243 φφ ++

4 32 2464 φφφ +++

5 432 24685 φφφφ ++++

6 5432 2468106 φφφφφ +++++

Os limites de controle do gráfico da média são dados por

nCkLC

2

0

σµ ±=

e o poder de detecção por:

)()( 22 nCknCkPd δδ +−Φ+−−Φ=

22

22

22

39

243

C)X(

σσφφσ =++=

22 João Pessoa, 2 a 5 de Setembro 2008

O gráfico de controle perde poder de detecção à medida que C2 diminui. Na Tabela

5 estão os valores de C2 para n=4, 5 e φ=0; 0,2; 0,5; 0,7.

Tabela 5. Valores de C2.

φ C2

n=4 n=5

0 1 1

0,2 0,86258 0,85279

0,5 0,69631 0,67040

0,7 0,60729 0,56995

O gráfico da Figura 6 ilustra o efeito da autocorrelação no desempenho do gráfico da

média. Por exemplo, quando a causa especial desloca a média de um desvio padrão e as

observações são independentes, o NMA= 6,3. Supondo agora que as observações de X são

descritas por um modelo autoregressivo de primeira ordem AR (1) com φ=0,5, o NMA aumenta

assustadoramente, NMA=18,5.

Uma maneira de se reduzir o efeito da autocorrelação no desempenho do gráfico de

controle consiste em se espaçar as observações. Por exemplo, ao invés de formar a amostra

com quatro itens produzidos na seqüência, selecionam-se sete itens, e forma-se a amostra com

o primeiro, o terceiro, o quinto, e o sétimo itens. Suponha, por exemplo, que a cada meia hora

uma amostra é extraída do processo, então o primeiro item produzido na meia hora irá fazer

parte da amostra, o segundo não, o terceiro sim, o quarto não, o quinto sim, o sexto não e o

sétimo sim. Esta forma de composição da amostra será denominada de composição C1. Com

isto tem-se um novo valor para a autocorrelação 2C1 φφ = . Caso sejam selecionados dez itens, e

a amostra seja constituída pelo primeiro, quarto, sétimo e décimo itens, o novo valor da

autocorrelação será 3C2 φφ = . Esta forma de composição da amostra será denominada de

23 João Pessoa, 2 a 5 de Setembro 2008

composição C2. A composição amostral C0 é a usual em que os itens da amostra são itens que

foram produzidos um após o outro, na seqüência, portanto a autocorrelação é dada por φ .

1

10

100

0,5 0,75 1 1,25 1,5 1,75 2

δ

NMA

φ= 0φ = 0,2φ = 0,5φ= 0,7

Esc

ala

loga

rítm

ica

Figura 6. Efeito da autocorrelação no NMA, n=4.

O gráfico da Figura 7 ilustra a melhora no desempenho do gráfico de controle quando a

composição C0 é substituída pelas composições C1 ou C2. O NMA se reduz de 18,5 para 11,0 e

8,4 respectivamente.

24 João Pessoa, 2 a 5 de Setembro 2008

1

10

100

0,5 0,75 1 1,25 1,5 1,75 2

δ

NMA

Dados independentes,sem correlação

composição C2,correlação=0,125

Composição C1,correlação=0,25

Composição C0,correlação=0,5

Esc

ala

loga

rítm

ica

Figura 7. Efeito da composição da amostra no NMA, n=4.

Artigos recentes de Costa e Claro (2008); Claro, Costa e Machado (2007) tratam do

monitoramento de processos autocorrelacionados.

25 João Pessoa, 2 a 5 de Setembro 2008

2.3. Erro de mensuração com dados autocorrelacionados

Para ilustrar o efeito da autocorrelação, combinado com o erro de mensuração, no

desempenho do gráfico de X , considere novamente o modelo autoregressivo de primeira

ordem AR(1).

iii eXX +−=− − )( 1 µφµ , i=1, 2, ..; µ=0X , e )0N(~ ei ,e σ .

Neste caso, como já visto, a variância de X é dada por:

22

22 )(

nCX

σσ =

Na Tabela 4 estão as expressões de 22−nC para n=2, 3, 4, 5, 6. Com a adição do erro de

mensuração a expressão da variância de X passa a ser

23

221

22

22 1

)(nCm

C

CnX

σσσ =

+=

com 1mC

σσ

= . Portanto

)()( 33 nCknCkPd δδ +−Φ+−−Φ= .

A constante C3 assume valores entre 0 e 1. Quando C3=1, não se tem erro de

mensuração e as observações de X são independentes. O gráfico de controle perde poder de

detecção à medida que C3 diminui.

Na Tabela 6 estão os valores de C3 para m=1 , n=4, φ=0,2; 0,5 e 0,7 e 1C = 0,3; 0,5 e 1,0.

E o gráfico da Figura 8 ilustra o efeito no desempenho do gráfico de controle da média da

autocorrelação combinada com o erro de mensuração. Por exemplo, quando a causa especial

26 João Pessoa, 2 a 5 de Setembro 2008

desloca a média de um desvio padrão, sem o erro de mensuração e observações independentes

o NMA= 6,3; por outro lado quando a variabilidade do instrumento de medida é equivalente a

30% da variabilidade do processo ( 1C =0,3), o NMA para dados autocorrelacionados (φ=0,5) e

sem replicações (m=1) aumenta assustadoramente, NMA=19,7.

Tabela 6. Valores de C3.

φ C1

0,3 0,5 1,0

0,2 0,8351 0,7921 0,6532

0,5 0,6816 0,6576 0,5714

0,7 0,5975 0,5811 0,5191

1

10

100

0,5 0,75 1 1,25 1,5 1,75 2

δδδδ

NMA

C1=0

C1=0,3

C1=1,0

Esc

ala

loga

rítm

ica

Figura 8. Efeito da autocorrelação e do erro de mensuração no NMA. (n=4, m=1 e φ=0,5)

27 João Pessoa, 2 a 5 de Setembro 2008

Referências

CLARO, F. A. E.; COSTA, A.F.B.; MACHADO, M. A. G. Gráficos de controle de EWMA e X para

monitoramento de processos autocorrelacionados. Produção, v. 17, p. 536-546, 2007.

COSTA, A. F. B.; CLARO, F. A. E. Double sampling X control chart for a first-order autoregressive

and moving average process model. The International Journal of Advanced Manufacturing

Technology, in press, 2008.

COSTA, A.F.B.; EPPRECHT E.K.; CARPINETTI, L.C.R. Controle Estatístico de Qualidade. 2. ed. São

Paulo: Editora Atlas, 2005. 334 p.

28 João Pessoa, 2 a 5 de Setembro 2008

Seção TRÊS:Seção TRÊS:Seção TRÊS:Seção TRÊS:

Processos multivariados - Variáveis contínuas

3. Introdução

Até agora foram discutidos os gráficos de controle univariados. Porém, o aumento da

complexidade e dos níveis de automação dos processos industriais e a crescente disponibilidade

de suporte computacional, têm aumentado o interesse pelo monitoramento simultâneo de

várias características de qualidade, também chamadas de variáveis do processo. Pouco a pouco

as novas estratégias de monitoramento para processos univariados estão sendo estendidas ao

monitoramento de processos multivariados.

Antes de discutir as estratégias de monitoramento para processos multivariados, algumas

notações e definições de vetores aleatórios, matrizes de covariância e de correlação utilizados

no controle estatístico de processos multivariados serão apresentados.

3.1 O vetor de médias e a matriz de covariâncias amostrais

Seja X um vetor contendo p componentes, onde cada componente é uma variável

aleatória, isto é, Xi é uma variável aleatória onde i = 1, 2, ..., p. Então, X é chamado de vetor

aleatório e é denotado por:

1

2

p

X

X

X

=

XM

29 João Pessoa, 2 a 5 de Setembro 2008

O vetor transposto de vetor aleatório X é denotado por 1 2 3[ ... ]pX X X X′ =X .

O vetor ( )E=µ X é chamado de vetor de médias do vetor 1 2 3[ ... ]pX X X X′ =X , sendo

11

22

( )

( )

( )

( ) p

p

E X

E X

E

E X

µµ

µ

⋅ = = = ⋅⋅ ⋅⋅

µ X

onde )( ii XE=µ denota a média, ou esperança, da variável aleatória Xi, i = 1, 2, ..., p.

A variância do i-ésimo componente do vetor X é denotada por iiiiXVar σσ == 2)( . O

desvio-padrão é denotado por iσ ou iiσ e fornece a informação sobre a dispersão dos valores

das variáveis Xi em relação a iµ , isto é, indica se os valores de Xi estão próximos ou distantes da

média iµ . Assim, valores grandes de iσ indicam uma maior dispersão de valores de Xi em

relação à média iµ .

A covariância entre os valores da i-ésima e j-ésima variáveis do vetor X é definida por:

)])([(),( jjiiijji XXEXXCov µµσ −−==

A covariância serve para medir o grau de relacionamento linear entre duas variáveis

aleatórias. De acordo com a expressão acima, quando os valores de Xi acima (abaixo) da média

iµ tendem a estar associados aos valores de Xj acima (abaixo) da média jµ , a covariância

ijσ tende a ser positiva. Portanto, à medida que a variável Xi cresce (decresce) numericamente,

a variável Xj também cresce (decresce) linearmente. Quando os valores de Xi acima da média iµ

tendem a estar associados com valores de Xj abaixo da média jµ , ou vice-versa, a covariância

ijσ tende a ser negativa. Neste caso, à medida que a variável Xi cresce (decresce)

numericamente, a variável Xj decresce (cresce) linearmente. Embora a covariância tenha

informação sobre o relacionamento linear entre duas variáveis, é difícil julgar se a relação é

30 João Pessoa, 2 a 5 de Setembro 2008

forte ou não, observando-se apenas os seus valores numéricos uma vez que não se tem um

valor de referência mínimo ou máximo para comparação dos valores ijσ . Assim, uma medida

mais útil na prática é a correlação. (Mingoti, 2005).

É prática comum apresentar os valores de ijσ em uma matriz chamada matriz de

covariâncias. A matriz de variâncias e covariâncias do vetor aleatório X é denotada por:

11 12 1

21 22 2

1 2

( )

p

p

p x p

p p pp

Cov

σ σ σσ σ σ

σ σ σ

= =

X Σ

L

L

M M O M

L

.

A título de ilustração, a matriz 2 2

8 2

2 5x

− = −

Σ representa a matriz de covariâncias de

um vetor aleatório [ ]1 2 X X′ =X , tal que 11σ = 21σ = 8; 22σ = 2

2σ = 5; 12σ = 21σ = -2.

O coeficiente de correlação entre a i-ésima e j-ésima variáveis do vetor X é definido por:

ji

ij

jjii

ijij σσ

σσσ

σρ ==

onde 11 ≤≤− ijρ , i = 1, 2, ..., p. A correlação é uma medida mais adequada para avaliar o

grau de relacionamento linear entre duas variáveis quantitativas do que a covariância, pois seus

valores estão sempre entre -1 e 1. Assim quanto mais próximo de 1, maior é o relacionamento

linear positivo entre as variáveis Xi e Xj e quanto mais próximo de -1, maior o relacionamento

linear negativo entre as variáveis. Uma correlação próxima de zero é uma indicação numérica

de um não-relacionamento linear entre as variáveis em questão. Quando se têm muitas

variáveis, o procedimento mais comum é apresentar os valores de ijρ em uma matriz chamada

de matriz de correlação.

31 João Pessoa, 2 a 5 de Setembro 2008

3.2 Gráficos de controle para o monitoramento do vetor de médias

Desde que foi criado, o gráfico de controle baseado na estatística 2T para o

monitoramento de processos multivariados (Hotelling, 1947) passou a ser o dispositivo

estatístico mais usual no monitoramento do vetor de médias de duas ou mais características de

qualidade.

O gráfico de controle 2T é utilizado no monitoramento simultâneo de p variáveis de

interesse. Quando o vetor das médias e a matriz de covariâncias, 0µ e 0Σ , de um processo p-

variado distribuído normalmente são conhecidos, a estatística 2T de Hotelling para a i-ésima

amostra é dada por:

( ) ( )2 10 0 0 ,i iiT n −′

= − −X µ Σ X µ

onde n é o tamanho da i-ésima amostra e iX é o vetor das médias amostrais dos p parâmetros

para a amostra i. Quando o processo está sob controle, 2iT segue uma distribuição de qui-

quadrado com p graus de liberdade.

Uma dificuldade encontrada ao se lidar com qualquer gráfico de controle multivariado é a

interpretação prática de um sinal de fora de controle. Especificamente, não se sabe ao certo

qual das p variáveis (ou qual subconjunto delas) é responsável pelo sinal. A prática padrão

consiste em ter gráficos de X univariados para as variáveis 1 2 3, , ,..., pX X X X .

Durante o período fora de controle, a causa especial gera alterações de magnitude d nos

parâmetros do processo, sendo ( ) ( )01

0 µµµµ −∑′−= −d , onde µ é o vetor de médias das p

características de qualidade após a ocorrência da causa especial. Após a ocorrência da causa

especial, 2iT tem distribuição de qui-quadrado não-central com parâmetro de não-centralidade

2ndd =λ , sendo n o tamanho da amostra, isto é, ( )dpiT λχ 22 ~ .

32 João Pessoa, 2 a 5 de Setembro 2008

O gráfico de Hotelling foi proposto com o intuito de se reduzir o número de gráficos de

controle. Por exemplo, se cinco características de qualidade precisam ser monitoradas, há duas

opções, ou utilizar cinco gráficos de controle de X , um para cada característica, ou apenas um

gráfico de Hotelling. A questão que não se pode esquecer é o desempenho do gráfico ou do

conjunto de gráficos de controle em sinalizar alterações no processo. A título de ilustração, na

Tabela 7, são comparados os valores do NMA do gráfico de Hotelling com os valores do NMA

que se obtém com o uso conjunto de dois gráficos de X (notação sX ) , para o caso bivariado.

O que se observa da Tabela 7 é que quando as variáveis não são independentes e a causa

especial altera a média de ambas variáveis, os dois gráficos de X , em uso conjunto, sinalizam

com maior rapidez. Detalhes deste estudo estão em Machado e Costa (2008).

Tabela 7. Valores de NMA para o gráfico de Hotelling e para os gráficos sX

ρ 0,0 0,3 0,5 0,7

sX 2T sX 2T sX 2T sX 2T LSC 3,023 10,597 3,021 10,597 3,015 10,597 2,996 10,597 LIC -3,023 - -3,021 - -3,015 - -2,996 -

1δ 2δ

0,0 0,0 200,0 200,0 200,0 200,0 200,0 200,0 200,0 200,0 0,0 0,5 117,4 115,6 117,4 110,5 117,5 99,7 115,8 78,0

0,0 1,0 41,6 41,9 41,6 38,0 41,5 30,6 40,3 19,0

0,0 1,5 15,1 15,8 15,1 13,9 15,0 10,5 14,5 5,94

0,5 0,5 83,2 76,9 84,0 91,7 85,4 99,7 87,0 106,7 0,5 1,0 36,4 33,0 36,9 40,1 37,5 41,9 37,8 38,7 0,5 1,5 14,4 13,6 14,5 15,8 14,6 15,0 14,5 11,4

1,0 1,0 23,44 18,5 24,1 25,8 24,93 30,60 25,96 35,25 1,0 1,5 11,89 9,36 12,3 13,0 12,65 15,01 13,01 15,73

1,5 1,5 8,09 5,76 8,50 8,53 8,91 10,51 9,42 12,58

33 João Pessoa, 2 a 5 de Setembro 2008

Artigos recentes de Costa e Machado (2007 e 2008) consideram a estatística de Hotelling

como a estatística de monitoramento do vetor de médias.

3.3. Gráficos de controle para o monitoramento da matriz de covariâncias

Assim como é importante monitorar o vetor de médias de um processo, é também

importante monitorar a sua matriz de covariâncias. O primeiro gráfico de controle utilizado no

monitoramento da matriz de covariâncias Σ se baseou na estatística obtida do teste da razão

de máxima verossimilhança generalizada (Alt, 1985):

( )SΣΣ

S⋅+

−+−= −1

00

1 lnln trnnpnpnA

onde

11 12 1

21 22 2

1 2

p

p

p p pp

s s s

s s s

s s s

=

S

L

L

M M L M

L

é a matriz de covariâncias, sendo iis a variância amostral da i-

ésima variável e ijs a covariância amostral entre a i-ésima e a j-ésima variáveis. S é o

determinante da matriz S e tr(S) é o traço da matriz S (a soma dos elementos da diagonal).

Quando o processo está sob controle, isto éΣ = 0Σ , 1A é assintoticamente distribuído

como uma qui-quadrado com ( ) 21+pp graus de liberdade.

Para o caso bivariado, Alt (1985) propôs o uso da variância amostral generalizada S para

controlar a matriz de covariâncias Σ .

=

2212

1211

ss

ssS é a matriz de covariâncias amostral.

Quando o processo está sob controle, ( )

210

2112

Σ

S⋅−⋅ n tem distribuição de qui-quadrado

com 42 −n graus de liberdade (Alt, 1985).

34 João Pessoa, 2 a 5 de Setembro 2008

Estudos recentes têm mostrado que é possível trabalhar com estatísticas de

monitoramento mais simples que a da variância amostral generalizada S . Por exemplo, a

estatística VMAX que é dada simplesmente pelo maior valor das variâncias amostrais

padronizadas. No caso de duas características de qualidade 1X e 2X , VMAX= },max{ 22

21 SS

onde n

xS

n

jj∑

= =1

21

21 e

n

xS

n

jj∑

= =1

22

22 ,

( )1 1

11

j

j

Xx

µσ

−= e

( )2 2

22

j

j

Xx

µσ

−= .

Com o processo em controle, a matriz de covariâncias é dada por

=

2221

12110 σσ

σσΣ , sendo

11σ e 22σ as variâncias de 1X e 2X e 2112 σσ = , as covariâncias entre 1X e 2X , sendo

21

12

σσσρ = a correlação entre 1X e 2X . Existem duas maneiras de uma causa especial alterar a

matriz de covariâncias, resultando na matriz

⋅⋅⋅⋅

⋅⋅⋅⋅=

22222121

12211111

1σσ

σσ

aaaa

aaaaΣ . A primeira

possibilidade (caso I) supõe que a causa especial afeta somente a variância da variável aleatória

1X , isto é, γ=1a e 12 =a , ou somente a variância da variável aleatória 2X , neste caso

γ=2a e 11 =a . A segunda possibilidade (caso II) supõe que a causa especial altera tanto a

variância de 1X quanto a de 2X , isto é, γ== 21 aa , sendo γ >1 a magnitude da

perturbação. Em ambos os casos, a correlação21

12

σσσρ = entre 1X e 2X não é afetada pela

causa especial. Se 121 == σσ , então 2112 σσρ == .

Quando o gráfico de VMAX está em uso, amostras de tamanho n são retiradas do

processo em intervalos de tempo regulares. As duas características de qualidade 1X e 2X das n

unidades da amostra são medidas e a estatística VMAX é calculada. Se a estatística VMAX for

maior do que o limite de controle LC , o gráfico sinaliza um desajuste do processo. Após a

ocorrência do sinal, o usuário pode imediatamente examinar as variâncias amostrais de 1X e

35 João Pessoa, 2 a 5 de Setembro 2008

2X para descobrir quais variáveis foram afetadas pela causa especial, ou seja, aquelas cujas

variâncias amostrais são maiores que LC. O limite de controle LC do gráfico de VMAX pode ser

obtido pela expressão (a seguir) do poder do gráfico de VMAX, bastando fazer 121 == aa e

α=dp .

( ) ( )( ) t

aLC

dtena

nLC

t,nPrp

n

ntnd ∫ −−

Γ

−<

−−=

21

22

2

22

1

111

0

1222

222 ρρρ

χ

A Figura 9 apresenta o gráfico de VMAX.

VMAX

Número da amostra (i)

1 2 3 4 5 6 7 8 9 10 11 12 13

LC

Figura 9. Gráfico de controle de VMAX.

A título de ilustração, na Tabela 8 comparam-se os valores do NMA dos gráficos de VMAX

e de S para o caso em que ρ =0,5. O que se pode concluir desta tabela é que o gráfico de

VMAX é sempre mais ágil na sinalização da causa especial. Este resultado se mantém para

outros valores de ρ .

36 João Pessoa, 2 a 5 de Setembro 2008

Tabela 8. Valores do NMA dos gráficos de VMAX e de S (p=2, ρ =0,5)

Artigos recentes de Costa e Machado (2008a e 2008b), Machado e Costa (2008a) e

Machado, De Magalhães e Costa (2008) consideram a estatística de VMAX como a estatística de

monitoramento da matriz de covariâncias.

Referências

ALT, F. B. Multivariate control charts. Encyclopedia of Statistical Sciences. Kotz, S., Johnson, N.

L., Eds.; Wiley, 1985.

HOTELLING, H. Multivariate quality control, illustrated by the air testing of sample bombsights.

Techniques of Statistical Analysis, p. 111-184, New York, McGraw Hill, 1947.

COSTA, A. F. B.; MACHADO, M. A. G. Synthetic control chart with two-stage sampling for

monitoring bivariate processes. Pesquisa Operacional, v. 27, p. 117-130 , 2007.

n

4 5 |S| VMAX |S| VMAX

caso I caso II caso I caso II 2γ LC 6,134 4,094 4,094 5,375 3,668 3,668

1,0 200,0 200,0 200,0 200,0 200,0 200,0 1,1 146,8 136,6 143,0 141,4 132,5 139,7 1,2 112,5 92,4 107,0 104,6 86,8 102,4 1,3 89,1 63,9 82,9 80,5 58,3 78,0 1,4 73,3 45,7 66,1 64,1 40,7 61,4 1,5 60,4 33,9 54,1 51,9 29,6 49,6 2,0 30,2 11,6 25,4 24,1 9,62 22,3 3,0 13,6 4,09 10,7 10,2 3,38 9,09 5,0 6,37 1,95 4,77 4,58 1,67 3,98

37 João Pessoa, 2 a 5 de Setembro 2008

COSTA, A. F. B.; MACHADO, M. A. G. Bivariate control charts with double sampling. Journal of

Applied Statistics, aceito, 2008.

COSTA, A. F. B.; MACHADO, M. A. G. A new chart for monitoring the covariance matrix of

bivariate processes. Communications in Statistics – Simulation and Computation, aceito,

2008a.

COSTA, A. F. B.; MACHADO, M. A. G. A new chart based on the sample variances for monitoring

the covariance matrix of multivariate processes. International Journal of Advanced

Manufacturing Technology, aceito, 2008b.

MACHADO, M. A. G; COSTA, A. F. B. The use of principal components and simultaneous

univariate charts to control multivariate processes. Pesquisa Operacional, v. 28, p. 173-196,

2008.

MACHADO, M. A. G; COSTA, A. F. B. The double sampling and the EWMA charts based on the

sample variances. International Journal of Production Economics, v. 114, p. 134-148, 2008a.

MACHADO, M. A. G.; De MAGALHÃES, M.S; COSTA, A. F. B. Gráfico de controle de VMAX para o

monitoramento da matriz de covariâncias, Revista Produção, v. 18, p. 222-239, 2008.

MINGOTI, S. A. Análise de dados através de métodos de estatística multivariada: uma

abordagem aplicada. 1. ed. Belo Horizonte: Editora UFMG, 2005. 297 p.

38 João Pessoa, 2 a 5 de Setembro 2008

Seção QUATROSeção QUATROSeção QUATROSeção QUATRO

Processos multivariados-Variáveis discretas

4 - Introdução

Na seção 3 foram apresentados alguns gráficos de controle considerando processos

multivariados cujas variáveis de processos eram variáveis contínuas. Dando prosseguimento aos

processos multivariados, nesta seção serão abordados gráficos de controle para o caso de

variáveis discretas (será considerado apenas o caso bivariado).

Monitorar o número de defeitos ou o de não conformidades ao invés da fração de não

conformidade é preferível em muitos processos de produção como os de placas de circuito

impresso, de tecido ou papel. Neste caso, geralmente assume-se que o número de defeitos

obedece a uma distribuição Poisson e em controle de qualidade os gráficos de controles c ou u

têm sido usados para fim.

Para assegurar a qualidade dos produtos, em muitas situações práticas mais de um tipo

de defeito é monitorado na mesma unidade inspecionada. Por exemplo, dois tipos de defeitos

podem ser observados na mesma placa de circuito impresso se o processo de solda não estiver

bem calibrado: defeitos por excesso de solda e defeitos de superfície.

É comum sugerir que sejam utilizados dois gráficos de controle (gráficos de controle c ou

u), um para cada tipo de controle. Esta pode ser uma boa solução para eventos independentes,

contudo, se os defeitos forem positivamente correlacionados (conforme o número de defeitos

por excesso de solda aumenta, o mesmo pode ser observado no número de defeitos de

superfície também), dois gráficos de controle (separados) podem não levar em consideração

esta possibilidade. Portanto, o processo descrito é um caso de controle multivariado de

processo. E esta é uma das seções do controle estatístico de processo que tem apresentado um

39 João Pessoa, 2 a 5 de Setembro 2008

dos mais rápidos desenvolvimentos. No entanto a maioria dos trabalhos é voltada para variáveis

contínuas (e normalmente distribuídas).

Poucas contribuições relativas ao controle de qualidade para variáveis discretas como as

distribuições binomial e Poisson multivariadas podem ser encontradas na literatura. Patel

(1973) apresentou um esquema para monitorar processos binomiais e Poisson multivariados

como uma extensão da proposta do Hotelling e recentemente Skinner, Montgomery & Runger

(2003) consideraram um modelo linear generalizado para monitorar dados de contagens

multivariadas. Portanto existe uma carência de gráficos de controle para este tipo de

distribuições multivariadas.

Antes de discutir as estratégias de monitoramento para este tipo de processo, a

distribuição de Poisson bivariada e suas propriedades serão apresentadas.

4.1 – Distribuição Poisson bivariada – uma breve revisão

A distribuição Poisson bivariada foi primeiramente apresentada por Holgate (1964) como

uma soma de três variáveis aleatórias independentes com distribuição Poisson. Sejam Y1, Y2 e

Y3 variáveis aleatórias independentes de parâmetros (a-d); (b-d) e d respectivamente. Deste

modo o vetor 1 1 3 2 2 3; ;X Y Y X Y Y= + = + segue uma distribuição bivariada Poisson cuja

função de probabilidade é dada por

1 21 2min( , )31 2

1 1 2 2 1 2 31 20

( , ) exp[ ( )]( )!( )! !

x i x i ix x

i

P X x X xx i x i i

λ λ λλ λ λ

− −

== = = − + +

− −∑

(1)

onde 1 a dλ = − ; 2 b dλ = − e 3 dλ = . Manipulando a expressão (1), ela pode ser escrita como

1 2 1 2min( , )1 2 31 2

1 1 2 2 1 2 31 2 1 20

( , ) exp[ ( )] !! ! (

ix x x x

i

x xP X x X x i

i ix x

λ λ λλ λ λλ λ=

= = = − + +

(2)

As expressões de recorrência em (3)

40 João Pessoa, 2 a 5 de Setembro 2008

1 1 2 1 1 2 3 1 2

2 1 2 2 1 2 3 1 2

( , ) ( 1, ) ( 1, 1)

( , ) ( , 1) ( 1, 1)

x P x x P x x P x x

x P x x P x x P x x

λ λλ λ

= − + − −= − + − −

(3)

facilitam o cálculo dos valores das probabilidades em (2). Alguns parâmetros importantes como

média, variância, covariância e correlação estão dadas em (4)

1 1 1 3

2 2 2 3

1 2 3

0.531 2 3 3 1 2

1 3 2 3

( ) ( )

( ) ( )

( , )

0 ( , ) [ min( , )]( )( )

E X Var X

E X Var X

Cov X X

Corr X X

λ λλ λ

λλ λ λ λ λ

λ λ λ λ−

= = += = +

=

≤ = ≤ ++ +

(4)

Note que a correlação assume somente valores positivos. A distribuição de

probabilidade condicional de X1|X2 é expressa como

211 2min( , )

2 3 2 11 1 2 2 1

3 2 3 2 10

( | ) exp( ) !( )!

x ii x ix x

i

xP X x X x i

i x i

λλ λλλ λ λ λ

− −

=

= = = − + + − ∑

(5)

Pode-se notar que a expressão (5) é uma convolução de duas variáveis independentes:

uma variável Poisson com parâmetro 1λ e uma binomial de parâmetros 32

3 2,x

λλ λ

+

. A média e

a variância da distribuição condicional são respectivamente

31 2 1 2

3 2

3 21 2 1 22

3 2

( | )

( | )( )

E X X x

Var X X x

λλλ λ

λ λλλ λ

= ++

= ++

Se 3 2λ λ+ → ∞ , 3 1λ λ+ → ∞ ,e 3

1 3 2 3( )( )

λ ρλ λ λ λ

→+ +

, então

41 João Pessoa, 2 a 5 de Setembro 2008

( )1 2,Z Z = 1 1 3 2 2 3

1 3 2 3

( ) ( ),

( ) ( )

X Xλ λ λ λλ λ λ λ

− + − + + +

segue uma distribuição normal bivariada padrão e assintoticamente ( )2 2

1 1 2 2

2

2

1

Z Z Z Zρ

ρ

− +

− é uma

variável aleatória com uma distribuição qui-quadrado com dois graus de liberdade. De acordo

com Rayner & Best (1995), esta aproximação não fornece bons resultados no caso de alta

correlação. Outros modelos de contagem Poisson bivariada usando probabilidades condicionais

foram introduzidos por Berkhout & Plug (2004).

Os parâmetros da distribuição Poisson bivariada podem ser estimados por diferentes

métodos como os mais conhecidos: Métodos dos Momentos e da Máxima Verossimilhança.

Alguns métodos foram especificamente desenvolvidos para estimar o parâmetro da covariância

como o Método do double-zero proportion e even point (maiores detalhes ver, Kocherlakota &

Kocherlakota (1992)). O uso do algoritmo EM para estimação de máxima verossimilhança dos

parâmetros da distribuição Poisson multivariada está descrito em Karlis (2003). E recentemente

Karlis & Ntzoufras (2005) incluíram uma função denominada bivpois no pacote estatístico R

para estimar os parâmetros de modelos de regressão Poisson bivariada pelo método da máxima

verossimilhança. Para maiores detalhes sobre distribuição Poisson bivariada ver Johnson; Kotz &

Balakrishnan (1997); Kocherlakota & Kocherlakota (1992).

Outras distribuições interessantes podem ser derivadas a partir da distribuição Poisson

bivariada. Por exemplo: a distribuição de DF=X1-X2, a distribuição de SM=X1+X2 e a distribuição

de MX=Max(X1, X2). A função de probabilidade de DF=X1-X2 pode ser obtida calculando

1 20

( ) ( , )j

P DF y P X j X j y∞

=

= = = = −∑ = 1 2( ) 2 1e!( )!

j y j

j y j j yλ λ λ λ−∞

− +

= −∑ (6)

Note que (6) não depende do parâmetro da covariância. Média e variância são respectivamente

42 João Pessoa, 2 a 5 de Setembro 2008

1 2

1 2

( )

( )

E DF

Var DF

λ λλ λ

= −= +

A função de distribuição de SM=X1+X2 é dada por

1 20

( ) ( , )y

j

P SM y P X j X y j=

= = = = −∑

( ) min( , )31 2

1 2 30 0 1 2

exp[ ( )] !! ( )! (

ij y jy j y j

j i

j y ji

i ij y j

λλ λλ λ λλ λ

− −

= =

− = − + + − ∑ ∑ .

(7)

Sua média e variância são respectivamente

1 2 3

1 2 3

( ) 2

( ) 4

E SM

Var SM

λ λ λλ λ λ

= + += + +

E a função da distribuição de MX=Max(X1,X2) é igual a

1

1 2 1 2 1 20

( ) ( , ) ( , ) ( , )y

j

P MX y P X y X y P X j X y P X y X j−

=

= = = = + = = + = =∑ =

211 2 3 3 31 2 1 2 1 2

0 0 01 2 1 2

[ ( )] ( )! !

! ! !

i ij y y j yy j y

j i i

j y yei i

i i iy j y

λ λ λ λ λλ λ λ λ λ λλ λ λ λ

= = =

− + + + = +

∑ ∑ ∑

(8)

As expressões de E(MX) e Var(MX) são um tanto complicadas e foram deixadas no

Apêndice. Para qualquer uma das três variáveis aleatórias derivadas da distribuição Poisson

bivariada, valem os seguintes resultados

1 2 3

1 2 3

( ) ( , , )

( ) ( , , )

E Y f

Var Y g

λ λ λλ λ λ

==

(9)

Y=MX, SM ou DF. Assim as estimativas de (9) são disponíveis substituindo os parâmetros pelas

suas estimativas (como os estimadores de máxima verossimilhança, por exemplo)

43 João Pessoa, 2 a 5 de Setembro 2008

1 2 3

1 2 3

ˆ ˆ ˆˆ ( ) ( , , )

ˆ ˆ ˆˆ ( ) ( , , )

E Y f

Var Y g

λ λ λ

λ λ λ

=

=

(10)

E assintoticamente ( )

~ ( );Var Y

Y N E Yn

, n é o tamanho da amostra.

4.2 – Gráficos de controle para observações individuais de um processo de

Poisson bivariado

Nesta seção, os gráficos de controle para observações individuais de um processo de

Poisson bivariado serão introduzidos. Especificamente gráficos de controle baseados nas

simples estatísticas descritivas:

1 2

1 2

1 2

;

max( , );

;

SM X X

MX X X

DF X X

= +== −

e dois gráficos (separados) de controle (um para X1 e o outro para X2 – que doravante serão

referidos como 2C) serão considerados. Fixado um nível do erro tipo I (α), os limites dos

gráficos de controle foram determinados tal que

( )P C c α< = ou ( )L U

P c C c α< < =

onde C é uma estatística monitorada (no caso: SM, MX, DF ou X1 e X2), c é o limite de controle

para gráficos de controle unilaterais (especificamente para os gráficos de controle SM; MX; X1 e

X2) e cL e cU são respectivamente os limites de controle inferior e superior para o gráfico de

controle bilateral (no caso DF).

Tabela 1 apresenta para doze combinações de valores dos parâmetros λ1, λ2 e λ3, as

médias (sob controle) de X1 e X2, a respectiva correlação e os limites de controle para os

gráficos SM, MX, DF e 2C (para um fixado valor do erro tipo I < 0.0027). Devido à natureza da

44 João Pessoa, 2 a 5 de Setembro 2008

variável em questão (variáveis discretas), os limites de controle foram ajustados ou

determinados de modo a ter NMA o mais próximo possível do nível escolhido

( 1(0.0027) 370.4− ≈ ) para poder comparar os desempenhos dos diferentes gráficos de controle.

Para exemplificar considere o caso 1 (λ1= λ2= λ3=1). Se utilizasse estatística SM, um sinal de

que o processo está fora de controle será dado se X1+X2 > 12; caso fosse utilizado MX, um sinal

seria se Max (X1, X2) > 7 e caso empregasse DF, um sinal seria com (X1-X2) <-5 ou ( X1-X2) > 4. E

caso utilizasse dois gráficos separados, um sinal seria dado se X1> 7 e/ou X2>7.

Na Tabela 1, os casos simétricos isto é, quando E(X1) = E(X2) estão marcados com “s” e

os assimétricos por “a”. Limite de controle que forneceu o maior valor NMA0 está em negrito.

Os primeiros oito casos seguem o planejamento de um experimento fatorial; os quatros últimos

casos foram incluídos para analisar casos quando |E(X1)-E(X2)| > 1. Um total de sessenta e

quatro mudanças nos diversos parâmetros (dada pelas combinações de kλ1; kλ2, kλ3; com

k=1,…, 4 ) foi considerado para comparar os desempenhos dos gráficos de controle.

Tabela 1 – Descrição dos parâmetros e limites de controle

45 João Pessoa, 2 a 5 de Setembro 2008

Os valores de NMA´s dos gráficos de controle SM, MX, DF e 2C cujos parâmetros são

λ1=λ2=λ3=1 e (λ1=λ3=1 e λ2=2) quando o processo está sob controle estão respectivamente,

nas Tabelas 2 e 3. O primeiro é um caso simétrico uma vez que E(X1) = E(X2) com coeficiente de

correlação ρ=0.50 e o segundo é um caso assimétrico com E(X1) =2 e E(X2) =3 e um coeficiente

de correlação de ρ=0.41. Tabelas semelhantes para outros conjuntos de parâmetros foram

construídas, porém elas não serão reproduzidas aqui. O menor valor de NMA para cada caso de

mudança nos parâmetros está em negrito. Adicionalmente nas duas tabelas, os valores de

NMA’s dos gráficos de controle 2C (denotados por 2C*) foram calculados assumindo

(erroneamente) que as variáveis X1 e X2 fossem independentes (ver as últimas colunas das

Tabelas 2 e 3).

Por exemplo, na Tabela 2, quando λ1 quadruplica (λ1=4) e os demais parâmetros

permanecem inalterados (λ2=λ3=1), o menor valor de NMA é 4.18 (quinta linha da Tabela 2) e o

gráfico de controle DF é o mais rápido para detectar este tipo de distúrbio. Nos casos onde o

gráfico de controle DF é a melhor opção (ver Tabela 2 – da segunda a sexta linha), observa-se

que o valor de λ3permaneceu inalterado.

As próximas linhas da Tabela 2 estão os casos de distúrbios (de diferentes tamanhos em

todos os parâmetros) que os gráficos de controle MX e 2C detectam mais rapidamente (com

igual desempenho). Valores médios dos parâmetros (λ1, λ2 e λ3, quando processo fora do

controle) destes casos foram calculados para descrever o perfil, obtendo-se respectivamente

2.62; 2.81; 2.10 que corresponde aos seguintes valores esperados E(X1) =4.71; E(X2) =4.90 e

ρ=0.43 (estes valores estão no segundo bloco de colunas da Tabela 4). Note que este valor

médio de correlação é menor que o valor quando o processo está sob controle. E finalmente os

distúrbios (para diferentes tamanhos em todos os parâmetros) que o gráfico de controle SM

detecta rapidamente. Os valores médios de λ1, λ2 e λ3 são respectivamente 2.50; 2.50 e 3.12

fornecendo E(X1) = 5.62; E(X2) =5.62 e ρ=0.56 (maior que o valor quando o processo está sob

controle).

46 João Pessoa, 2 a 5 de Setembro 2008

Tabela 2 – Valores de NMA dos gráficos de controle (caso 1: λ1=λ2=λ3=1)

47 João Pessoa, 2 a 5 de Setembro 2008

48 João Pessoa, 2 a 5 de Setembro 2008

Tabela 4 – O melhor gráfico de controle

Leitura similar pode ser feita com os resultados da Tabela 3. Por exemplo, quando λ1

permanece inalterado (λ1=1), mas se λ2 triplica (λ2=6) e λ3 duplica (λ3=2), os gráficos de

controle MX e 2C são mais rápidos para detectar este tipo de distúrbio com o menor NMA igual

49 João Pessoa, 2 a 5 de Setembro 2008

a 3.53. Valores médios de λ1, λ2 e λ3 (fora de controle), quando os gráficos de controle MX e

2C são as melhores opções, são respectivamente 1.36; 7.27 e 2.64 que resultam valores de

E(X1) =4.00; E(X2)=9.91 e ρ=0.41. Note que a correlação (fora de controle) é igual ao seu valor

se o processo estivesse sob controle, mas grandes mudanças foram observados em λ2 e

conseqüentemente grandes mudanças no valor de E(X2).

Para identificar um apropriado gráfico de controle para detectar rapidamente algum tipo

de distúrbio específico, Tabela 4 foi construída. Os valores dos parâmetros sob controle de

processo estão colocados no primeiro de bloco de colunas. Os valores dos principais parâmetros

quando o processo está fora de controle estão no segundo bloco de colunas e no último bloco

de colunas um mosaico foi construído para identificar qual gráfico de controle é mais adequado

para detectar mais rapidamente algum distúrbio específico. As entradas deste último bloco de

colunas são as razões entre os valores dos parâmetros fora de controle e sob controle

denotados como 0i

i

λλ

=1, 2, 3, 4 e i=1, 2, 3.

Analisando a Tabela 4, algumas observações podem ser feitas:

• Note que o gráfico de controle DF aparece como a melhor opção apenas na coluna

303

λλ

=1 e na maioria das vezes quando 101

λλ

=1 ou 202

λλ

=1. Em outras palavras, o

parâmetro da covariância permaneceu inalterado e distúrbios somente em uma das

médias ou E(X1) ou E(X2), tendo como conseqüência uma diminuição da correlação,

conforme pode-se observar os valores médios dos parâmetros relativos ao gráfico DF no

segundo bloco de colunas.

• Os gráficos MX e 2C (doravante denominados como gráficos M2) são as melhores opções

quando os valores sob controle de λ1 e λ2 são iguais (os casos simétricos 1, 2, 7 e 8).

Observam-se causas especiais provocando grandes ou moderados aumentos

simultaneamente em λ1 e λ3 mantendo-se λ2inalterado; ou simetricamente, aumentos

grandes ou moderados simultâneos em λ2 e λ3 mantendo λ1 inalterado. Nestes casos

50 João Pessoa, 2 a 5 de Setembro 2008

ocorrem mudanças (aumentos) nas médias de X1 ou de X2. De modo geral, a correlação

sofre poucas mudanças.

• Ainda considerando os casos simétricos, quando 303

λλ

>1, 101

λλ

≤ 2 e 202

λλ

≤ 2, o gráfico SM

tem tido o melhor desempenho.

• Considerando os casos assimétricos, quando pouca ou quase nenhuma correlação

ocorreu (porém alterações nas médias) devido às causas especiais, o gráfico de controle

MX e 2C são as melhores opções. No entanto, as causas especiais provam um aumento

(decréscimo) na correlação, o gráfico SM (DF) é a melhor opção.

4.3 – Exemplo numérico

Nesta seção considere os dados extraídos de Ho & Singer (2001) onde dois tipos de

defeitos são contados em 230 amostras de 100 g de fibras têxteis produzidas por duas máquinas

de um fabricante (os dados estão reproduzidos na Tabela 5).

Tabela 5 – Freqüência de defeitos em 100 g de fibras têxteis.

# de defeitos do # de defeitos do tipo 2

Máquina Tipo 1 0 1 2 3 4 5 6 7 Total

A1

0 13 26 22 16 3 2 . . 82

1 3 9 12 7 5 2 1 . 39

2 . 3 1 . . 1 . . 5

3 . . 1 1 . . . 1 5

Total 16 38 36 25 8 5 1 1 130

A2

0 15 14 11 10 3 1 . . 54

1 2 12 6 7 5 3 1 . 36

2 . 1 2 1 . 2 . . 6

3 . . . 1 1 1 1 . 4

Total 17 27 19 19 9 7 2 . 100

51 João Pessoa, 2 a 5 de Setembro 2008

Neste contexto, cada maquina define um estrato e após a comparação das taxas médias de

defeitos entre os estratos e avaliação da intensidade e homogeneidade da associação entre as

freqüências dos dois tipos de defeitos, os parâmetros relevantes foram estimados (pelo método

da máxima verossimilhança) e reproduzidos na Tabela 6.

Tabela 6 – Estimativa dos parâmetros do exemplo numérico

Parâmetro Estimativa Erro padrão

Taxa média de defeito tipo I 0.5243 0.0476

Taxa média de defeito do tipo II 1.9914 0.0928

Covariância entre os números de

defeitos do tipo I e II

0.3013 0.0629

Note que a correlação entre os dois tipos de defeitos nas fibras têxteis é positiva

(correlação de 0.295). Este fato sugere que o aumento de incidência num tipo de defeito pode

levar a aumentar ocorrências do outro tipo de defeito. Limites de controle e valores de NMA0

estão resumidos na Tabela 7. Os gráficos de controle SM e MX identificam uma observação

como fora de controle ((X1=3; X2=7, da máquina A1).

Tabela 7 – Limites de controle do exemplo numérico Gráfico de Controle Limites de Controle NMA0

SM [0;8] 282.05

MX [0;6] 229.5

DF [-7;1] 209.1

2C [0;3];[0;7] 334.9

Figura 1 ilustra os gráficos de controle propostos considerando um conjunto de dados

simulados. As dez primeiras amostras foram tomadas de modo a ter taxas médias iguais aos

valores estimados da Tabela 6 (ou seja, com λ1=0.2230; λ2=1.6901 e λ3=0.3013) e as dez

52 João Pessoa, 2 a 5 de Setembro 2008

últimas observações foram simuladas alterando λ3 para 4.3013 e mantendo inalterados os

parâmetros λ1 e λ2.

Empregando os limites de controle da Tabela 7, um sinal de que processo pode estar

fora de controle é dada na décima terceira amostra (três amostra após o ponto de mudança)

através do gráfico de controle SM. Caso empregue o gráfico de controle MX, um sinal é dado

apenas na décima sexta amostra. No gráfico DF um sinal é dado apenas na décima nona

observação e caso dois gráficos individuais fossem empregados apenas um sinal em X1 seria

dado também na décima nona observação.

Amostra

SM

2018161412108642

14

12

10

8

6

4

2

0

88

Amostra

MX

2018161412108642

9

8

7

6

5

4

3

2

1

0

66

Gráfico de controle SM Gráfico de controle MX

Amostra

DF

2018161412108642

2

1

0

-1

-2

-3

-4

-5

-6

-7 -7-7

11

Amostra

X1;X2

2018161412108642

9

8

7

6

5

4

3

2

1

0

33

77

Variable

X1

X2

Gráfico de controle DF Gráfico de controle 2C

Figura 1 – Gráficos de controle para processo de Poisson bivariada – dados simulados

Estes resultados de certo modo são coerentes visto que mudança somente em λ3 de

0.3013 para 4.3013 mantendo os demais parâmetros irá causar aumentos nas duas médias,

assim como na correlação, alterando a correlação de 0.295 (sob controle) para 0.826 (fora de

53 João Pessoa, 2 a 5 de Setembro 2008

controle). E neste caso, o gráfico de controle SM é mais rápido para detectar este tipo de

mudança.

4.4- Considerações finais

Nesta seção, gráficos de controle utilizando simples estatísticas descritivas para

monitorar dois tipos de defeitos em unidades produzidos sob uma distribuição de Poisson

bivariada foram apresentados.

Os três gráficos foram baseados no monitoramento das estatísticas SM=X1+ X2;

MX=max(X1, X2); DF=X1-X2 além de dois gráficos de controle separados (uma para X1 e a outra

para X2, no texto referenciados como gráficos de controle 2C). Os gráficos de controle foram

planejados adotando-se como risco de alarme falso ≤0.0027. Devido à natureza da variável em

questão (variáveis discretas), os limites de controle foram ajustados ou determinados de modo

a ter risco de alarme falso o mais próximo possível do nível escolhido.

Outra conclusão é que não existe um único gráfico de controle que sempre ofereça uma

rápida detecção de qualquer tamanho e natureza. O principal ganho nos gráficos propostos SM,

DF, ou MX é a simplicidade em julgar se o processo está sob controle ou não através de

monitoramento de estatísticas simples com um gráfico de controle ao invés de dois gráficos de

controle separadamente.

A principal dificuldade em aplicar os gráficos propostos pode ser a escolha correta ou a

melhor escolha de um gráfico adequado. Algumas recomendações podem ser feitos: se

aumento for observado somente em um dos tipos de defeitos, o gráfico DF parece ser a melhor

opção. Contudo se aumentos forem observados nos dois tipos defeitos, a regra é dada através

da correlação; se a correlação aumentar, o gráfico SM é a melhor opção; se a correlação

permanecer estável, gráficos MX ou 2C são as melhores opções.

54 João Pessoa, 2 a 5 de Setembro 2008

Referências

BERKHOUT P. & PLUG E. A bivariate Poisson count data model using conditional probabilities.

Statistica Neerlandica, v. 58, #3, p. 349-364, 2004.

HO L.L. & SINGER J.M. Generalized least squares methods for bivariate Poisson regression.

Communications in Statistics: Theory and Methods, v. 30, p. 263-277, 2001.

HOLGATE P. Estimation for the bivariate Poisson distribution. Biometrika, v. 51, p. 241-245,

1964.

JOHNSON N., KOTZ S. & BALAKRISHNAN N. Discrete multivariate distributions. Wiley, New

York, 1997.

KARLIS D. & NTZOUFRAS I. Bivariate Poisson and diagonal inflated bivariate Poisson regression

models in R. Journal of Statistical Software vol. 14 #10. http://www.jstatsoft.org/, 2005

KARLIS D. An EM algorithm for multivariate Poisson distribution and related models. Journal of

Applied Statistics, vol. 30(1), p. 63-77, 2003.

KOCHERLAKOTA S. & KOCHERLAKOTA K. Bivariate discrete distributions. New York: Marcel

Dekker, 1992.

KOCHERLAKOTA S. & KOCHERLAKOTA K. Regression in the bivariate Poisson distribution.

Communication in Statistics: Theory and Methods, vol. 30, p. 381-393, 2001.

PATEL H.I. Quality control methods for multivariate binomial and Poisson distribution.

Technometrics, vol. 15, p. 103-112, 1973.

RAYNER J.C.W. & BEST D.J. Smooth tests for the bivariate Poisson distribution. Australian

Journal of Statistics. Vol. 37(2), p. 233-45, 1995.

55 João Pessoa, 2 a 5 de Setembro 2008

SKINNER K.R.; MONTGOMERY D.C. & RUNGER G.C. Process monitoring for multiple count data

using generalized linear model-based control charts. International Journal of Production

Research. Vol. 41(6), p. 1167-1180, 2003.

Apêndice

A.1 – Função de probabilidade de MX=Max(X1,X2)

− −

= =

= = = = + = = + = =∑ ∑1 1

1 2 1 2 1 20 0

( ) ( , ) ( , ) ( , )y y

j j

P MX y P X j X y P X y X j P X y X y

211 2 3 3 31 2 1 2 1 2

0 0 01 2 1 2

[ ( )] ( )! !

! ! !

i ij y y j yy j y

j i i

j y yei i

i i iy j y

λ λ λ λ λλ λ λ λ λ λλ λ λ λ

= = =

− + + + = +

∑ ∑ ∑

A.2 – Calculando E(MX)

1 1

1 2 1 2 1 20 0 0

( ) ( , ) ( , ) ( , )y y

y j j

E MX y P X j X y P X y X j P X y X y− −∞

= = =

= = = + = = + = =

∑ ∑ ∑

1 1

1 2 1 2 1 20 0 0

( , ) ( , ) ( , )y y

y j j

yP X j X y yP X y X j yP X y X y− −∞

= = =

= = = + = = + = =

∑ ∑ ∑

(A.1) Utilizando as relações de recorrência (3) em (A.1) as igualdades podem ser escritas:

(

( ) )]

1

2 1 2 1 1 20 0

3 1 2 1 2

1 1 2 3 1 2

( ) ( , 1) ( 1, )

( 1, 1) ( 1, 1)

( 1, ) ( 1, 1)

y

y j

E MX P X j X y P X y X j

P X y X j P X j X y

P X y X y P X y X y

λ λ

λλ λ

−∞

= =

= = = − + = − =

+ = − = − + = − = −

+ = − = + = − = −

∑ ∑

(A.2) Após manipulações algébricas, a equação (A.2) pode ser expressa como

56 João Pessoa, 2 a 5 de Setembro 2008

[ ]

[ ]

1 2 3 1 2 1 20

1 3 1 2 2 3 1 20 0

( ) ( ) ( , ) ( 1, )

( ) ( , ) ( )[ ( , 1)]

y

y y

E MX P X y X y P X y X y

P X y X y P X y X y

λ λ λ

λ λ λ λ

=

∞ ∞

= =

= + + = = + = + =

+ + > = + + = > +

∑ ∑

(A.3) A.3 - Calculando E(MX

2)

1 12 2

1 2 1 2 1 20 0 0

1 12 2 2

1 2 1 2 1 20 0 0

( ) ( , ) ( , ) ( , )

( , ) ( , ) ( , )

y y

y j j

y y

y j j

E MX y P X j X y P X y X j P X y X y

y P X j X y y P X y X j y P X y X y

− −∞

= = =

− −∞

= = =

= = = + = = + = =

= = = + = = + = =

∑ ∑ ∑

∑ ∑ ∑

(A.4) Novamente empregando as relações de recorrência em (A.4), E(MX2) pode ser expressa como

12

2 1 2 3 1 2 2 1 20 0

22 3 1 2 3 1 2

( , 1) ( 1, 1) ( , 2)

2 ( 1, 2) ( 2, 2)

y

y j

P X j X y P X j X y P X j X y

P X j X y P X j X y

λ λ λ

λ λ λ

−∞

= =

= = = − + = − = − + = = −

+ = − = − + = − = −

∑ ∑

12

1 1 2 3 1 2 1 1 20 0

21 3 1 2 3 1 2

( 1, ) ( 1, 1) ( 2, )

2 ( 2, 1) ( 2, 2)

y

y j

P X y X j P X y X j P X y X j

P X y X j P X y X j

λ λ λ

λ λ λ

−∞

= =

+ = − = + = − = − + = − =

+ = − = − + = − = −

∑ ∑

1 2 1 2 1 3 1 2

23 1 2 3 1 2

( 1, 1) 2 ( 2, 1)

( 1, 1) ( 2, 2)

P X y X y P X y X y

P X y X y P X y X y

λ λ λ λλ λ

+ = − = − + = − = −

+ = − = − + = − = −

(A.5) Após manipulações algébricas, a expressão (A.5) resultou em

2 23 3 2 3 1 2 2 1 2

0

1 1 2 1 3 1 2 1 2 1 2

( ) (1 ) (1 ) ( , ) ( 1, )

( , ) (1 ) ( , 1) ( , )y

E MX P X y X y P X y X y

P X y X y P X y X y P X y X y

λ λ λ λ λ

λ λ λ λ λ

=

= + + + ≤ = + ≤ + =

+ = ≤ + + = = + + = =

(A.6) A.4 – Var(MX)

Com as expressões (A.3) e (A.6), Var(MX) pode ser obtida.

57 João Pessoa, 2 a 5 de Setembro 2008

Seção Cinco:Seção Cinco:Seção Cinco:Seção Cinco:

COMENTÁRIOS FINAIS

Nestas notas foram trabalhadas algumas questões do monitoramento de processos,

que embora pontuais, têm sido as responsáveis pela frustração de muitos adeptos dos gráficos

de Shewhart. As questões do erro de mensuração e da autocorrelação das observações, se não

tratadas de forma adequada comprometem a eficiência do gráfico.

Na seção dois destas notas, as curvas do Número Médio de Amostras (NMA) que o

gráfico de controle requer para sinalizar uma causa especial foram construídas. Basta olhá-las

para perceber o “estrago” que a autocorrelação e o erro de mensuração causam na

performance dos gráficos de controle. Para minimizar o efeito do erro de mensuração só

mesmo inspecionando um mesmo item várias vezes; quanto à questão da autocorrelação, uma

forma simples de minimizar o seu efeito consiste em não se formar os subgrupos racionais com

itens “vizinhos”.

Nas seções três e quatro a questão do monitoramento simultâneo de muitas

características de qualidade foi abordada. O mais importante a salientar é que, o que está

disponível hoje na literatura, sobre estatísticas de monitoramento multivariadas para o caso de

atributos é quase nada, e para o caso de variáveis, as estatísticas ainda são muito complicadas e

pouco eficientes.

Para finalizar, cumpre salientar que existem ainda outros pontos importantíssimos a

serem pesquisados em monitoramento de processos, tais como a questão da estimação dos

parâmetros após a Fase I, onde as causas especiais que atuam no processo são eliminadas,

tornando-o monitorável.