aplicação do modelo t-student par a análise dos ... · agradeço a deus e à virgem ... da...

64
SERVIÇO DE PÓS-GRADUAÇÃO DC Data de Depósito: 18.05.200 Assinatura: ICMC-USP 4 Aplicação do modelo t-student para análise dos resultados de ensaios de proficiência Flávia Maria Ravagnani Neves Orientador: Prof. Dr. Dorival Leão Pinto Júnior Dissertação apresentada ao Instituto de Ciências Matemáticas e S o - ICMC-USP, como parte dos ^ obtenção do título de Mestre em Ciências de Computaçao Matemática Computacional. USP - São Carlos Maio/2004 'Este trabalho contou com o apoio financeiro do CNPq.

Upload: danganh

Post on 20-Jan-2019

213 views

Category:

Documents


0 download

TRANSCRIPT

SERVIÇO DE PÓS-GRADUAÇÃO DC

Data de Depósito: 18.05.200

Assinatura:

ICMC-USP

4

Aplicação do modelo t-student para análise dos resultados de ensaios de proficiência

Flávia Maria Ravagnani Neves

Orientador: Prof. Dr. Dorival Leão Pinto Júnior

Dissertação apresentada ao Instituto de Ciências Matemáticas e S o - ICMC-USP, como parte dos ^

obtenção do título de Mestre em Ciências de Computaçao Matemática Computacional.

USP - São Carlos Maio/2004

'Este trabalho contou com o apoio financeiro do CNPq.

A minha mãe, Luzia

Teresa Ravagnam Ne-

ves, por ensinar-me a

aprender sempre e ao

meu pai, João Ferreira

Neves, pelo exemplo de

dedicação.

Agradecimentos

Agradeço a Deus e à Virgem Santíssima, que me acompanharam durante todos estes anos

através das orações diárias de minha mãe.

Não posso deixar de destacar o constante apoio e compreensão da minha família. Agradeço,

em especial, aos meus pais João e Luzia, por incentivarem e estimularem meus estudos e aos

meus irmãos, Antônio de Pádua e Cíntia, pela amizade e pelo carinho. Agradeço a todos os

meus tios e tias, primos e primas que torceram para que eu conquistasse mais esta etapa.

Agradeço, em particular, ao meu noivo Fabrício, pelo amor e apoio, por confiar no meu

caráter, na minha competência e no nosso futuro.

Agradeço ao meu orientador Prof. Dr. Dorival Leão Pinto Júnior pela orientação

deste trabalho e pelos seus ensinamentos, que foram fundamentais para o término desta

dissertação.

Quero manifestar aqui que me sinto muito orgulhosa de ter encontrado durante este

período grandes amigos, como o Alex, o Fábio (Patão), a Mariana, o Mário (Ronaldinho), a

Grazielle e a Kelly. Em especial gostaria de destacar o carinho e a cumplicidade das minhas

companheiras de sempre, Aline e Luci.

Agradeço aos meus colegas do mestrado, Gecirlei. Fabrizio, Paulo, Ricardo, Juliana, pelas

contribuições incondicionais e por tornarem descontraídas, as tardes no laboratório.

Agradeço também às minhas grandes amigas: Aline, Gisele e Jerusa que, apesar da

distância e do tempo, não se esqueceram de mim

A todos os professores e funcionários do Instituto de Ciências Matemáticas e de Com-

putação pela gentileza e atenção diariamente prestadas.

Agradeço ao CNPq pelo auxílio financeiro.

Enfim, a todos aqueles que colaboraram de alguma forma para a realização deste trabalho.

Muito Obrigada!

"De tudo ficam três coisas:

A certeza de que estamos sempre começando,

A certeza de que é preciso continuar,

E a certeza de que podemos ser interrompidos antes de terminarmos.

Fazer da interrupção um caminho novo,

Da queda um passo de dança,

Do medo uma escada,

Do sonho uma ponte,

Da procura um encontro."

E assim, terá valido a pena existir...

Fernando Sabino

Resumo

Os Ensaios de Proficiência por comparação interlaboratorial têm sido um importante

mecanismo para controlar a consistência dos laboratórios. Instituições do governo, como o

INMETRO, têm utilizado tais mecanismos para monitorar a qualidade dos serviços presta-

dos pelos laboratórios da Rede Brasileira de Laboratórios (RBL) e da Rede Brasileira de

Calibração (RBC).

Atualmente, os métodos estatísticos utilizados para analisar os resultados dos Ensaios de

Proficiência estão escritos em normas técnicas, como o ISO/IEC Guide 43 — 1. Recentemente,

Leão, Aoki e Silva (2002) propuseram um método de regressão para testar a competência

dos laboratórios, utilizando a distribuição normal multivariada para modelar os dados e

estabelecer testes estatísticos.

Como em medições a presença de valores extremos é constante, vamos modelar os dados

utilizando a distribuição t-student, para acomodar tais valores extremos. Neste modelo, esta-

mos interessados em estimar o grau de liberdade e o parâmetro de tendência da medição do

laboratório com respeito ao valor de referência, já que os laboratórios vão utilizar sistemas de

medições similares para medir o mesmo item, com incertezas determinadas por um processo

de calibração. Encontraremos os estimadores de máxima verossimilhança e de momentos

para estes dois parâmetros e vamos desenvolver um teste para avaliarmos a consistência das

medições dos laboratórios. No final, a título de aplicação, vamos analisar os dados obtidos

pela REMESP (Rede de Metrologia de São Paulo) na área de eletricidade, onde vamos medir

a tensão DC de um multímetro digital.

Abstract

The proficiency essavs by interlaboratorial comparison have been an important

mechanism to control the consistency of the measurements of the laboratories.

Government institutions, such as INMETRO, have nsed snch mechanisms to monitor the

quality of the laboratories services supplied by the Laboratories Brazilian Network (RBL)

and by the Calibration Brazilian Network (RBC).

Currently. the statistical methods nsed to analyze the results of the Proficiency Essays are

described in technical norrris, like the ISO/IEC Guide 43-1. Recently, Leão, Aoki and Silva

(2002) proposed a regression method to test the laboratories ability, using the multivariate

normal distribution to fit the data and to establish statistical tests.

Like in measurements the presence of extreme values is constant, we are modelling the

data using the multivariate t-student distribution, to accommodate such extreme values. In

this model, we are interested in estimating the degrees of freedom and the

tendency parameter of the laboratory measurement relating to the reference value, since

the laboratories are using similar measurements systems to measure the same item, with

standard deviation determined by a calibration process. We are finding the maximum

likelihood and moments estimators for these two parameters and are developing a test to

evaluate the laboratories measurements consistency. At the end, we are analyzing the ob-

tained data for the REMESP (São Paulo Metrology Network) in the electrical area, where

we are measuring the digital multimeter DC tension.

VI

Sumário

1 In t rodução 1

1.1 Objetivo 5

1.2 Organização do trabalho 5

2 Apresentação dos dados e Aval iação da Incerteza de M e d i ç ã o 7

2.1 Apresentação dos dados 7

2.2 Avaliação da Incerteza de Medição 11

2.2.1 Equação de Medição 13

2.2.2 Avaliação da Incerteza Padrão de Medição das Estimativas de Entrada 15

2.2.3 Avaliação da Incerteza Padrão Combinada 18

2.2.4 Incerteza Expandida de Medição 19

3 A distr ibuição t -student 23

3.1 Introdução 24

3.2 A distribuição t-student multivariada 25

3.2.1 Propriedades da t-student 25

3.3 Distribuições relacionadas 26 «

4 M o d e l o Estatíst ico e Est imação 28

4.1 Modelo proposto 28

4.2 Estimador para os Parâmetros do Modelo 33

4.2.1 Estimador de Momentos 34

4.2.2 Estimador de Máxima Verossimilhança (EMV) 34

4.3 Consistência dos estimadores de 37

Sumário _ vn

5 Testes de hipóteses 39

5.1 Teste individual para os laboratórios 39

5.1.1 Poder do Teste 40

5.2 Testando o grupo de laboratórios 40

6 Apl icações 42

6.1 Teste de Grubbs 43

6.2 Análise da compatibilidade dos laboratórios 44

7 Considerações finais 48

7.1 Conclusão 48

7.2 Propostas futuras 49

A Est imador de M o m e n t o s para o parâmetro v 50

Referências Bibliográficas

Vlll

Lista de Figuras

2.1 Malha 8

2.2 Artefato 8

2.3 Box-plot dos dados 10

6.1 Gráfico da Função Poder para o Lab 1 47

6.2 Gráfico da Função Poder para o Lab 6 47

c

ix

Lista de Tabelas

2.1 Roteiro seguido pelo artefato 9

2.2 Medições dos laboratórios 9

2.3 Dados do laboratório 5 16

2.4 Cálculo de incertezas para o laboratório 5 22

6.1 Teste de Grubbs 43

6.2 Teste para avaliar a competência dos 7 laboratórios 45

6.3 Cálculo da Função poder para o Lab 1 46

1

Capítulo 1

Introdução j»

Um ponto importante no controle de qualidade na indústria é a confiança nos dados

obtidos por meio de sistemas de medição. Um sistema de medição é um processo que envolve

instrumentos, operadores e métodos para obter o valor de uma grandeza a ser medida, isto é,

o mensurado. Em geral, o valor resultante de uma medição é somente uma aproximação ou

estimativa do valor do mensurado, logo, deve estar acompanhada da incerteza. A incerteza

da medição indica quão correto é o resultado declarado, isto é, quão corretamente o resultado

da medição representa o valor da grandeza que está sendo medida. Para mais detalhes sobre

medição e incerteza, ver ISO GUM (1998). Como consequência, é importante monitorar a

consistência dos laboratórios para realizarem medições específicas.

A REMESP (Rede de Metrologia do Estado de São Paulo) é uma entidade que representa,

de fornia organizada, os laboratórios de calibrações e ensaios junto aos órgãos públicos e

privados, promovendo a integração, o desenvolvimento da competência técnica e da gestão

dos laboratórios, visando a credibilidade dos produtos e serviços na busca permanente da

competitividade.

A REMESP organizou diversos comités técnicos para a realização de ensaios de pro-

ficiência, Dentre os comités já instalados, podemos citar: temperatura, eletricidade, massa

e pressão. Os laboratórios participantes de cada comité, medem o mesmo padrão e expõem

suas medições para análise. Aqui, analisaremos os resultados do comité de eletricidade, cujo

mensurando é a tensão DC.

Ensaios de Proficiência (EP) é o uso de ensaios de comparações interlaboratoriais para

1. Introdução 2

determinar o desempenho dos laboratórios para ensaios (ou calibrações) específicos e para

monitorar a consistência e comparabilidade dos dados dos laboratórios. Ensaios de com-

parações interlaboratoriais são conduzidos não somente para analisar laboratórios, como

também para avaliar métodos e padrões. Os métodos de EP dependem da natureza do item

ou material sob teste, do método de ensaio em uso e do número de laboratórios participantes.

Existem seis tipos de EP, discutidos no ISO/IEC Guide 43-1 (1997), como descritos abaixo:

a. Esquemas de comparação de medição : E onde um único objeto de teste é distribuído

sequencialmente entre os laboratórios participantes. Cada laboratório envia o objeto

para o próximo participante ou para o coordenador para manutenção. E comum para

comparar padrões de calibração. Os participantes devem apresentar suas medições e

as incertezas padrões associadas;

b. Esquemas de ensaios interlaboratoriais : É onde vários objetos de teste com ca-

racterísticas idênticas (supostamente) são produzidos, misturados, embrulhados, e dis-

tribuídos para vários participantes. Podem ser distribuídos objetos em duplicata para

testar a precisão e exatidão dos laboratórios;

c. Esquemas de divisão de amostras : E onde amostras de um produto ou material são

divididos em duas, ou mais, partes com cada laboratório participante testando uma

parte de cada amostra;

d. Esquemas qualitativos : E onde os objetos de teste têm características conhecidas e

categóricas. Os resultados podem ser avaliados independente de outros participantes;

e. Esquemas de valor conhec ido : E onde os objetos de teste têm características

conhecidas e quantitativas. Isso também ocorre quando o objeto de teste é fabri-

cado para produzir uma resposta desejada ou conter uma quantidade conhecida de

uma substância. Como no esquema qualitativo, não existe necessidade de se comparar

os resultados com outros participantes;

f. Esquemas de processo parcial : É onde o teste envolve somente partes definidas de um

ensaio ou processo de medição. Isso pode ser feito para testar conformidades em certas

1. Introdução 3

ações em um laboratório, tais como ajustar uma curva de calibração ou interpretar

quantidades radiológicas.

Neste trabalho, nos consideramos o primeiro tipo de ensaio, onde um único objeto de

teste é distribuído sequencialmente entre os laboratórios participantes e cada laboratório

envia o objeto para o próximo participante, apresentando os resultados de suas medições

e suas respectivas incertezas expandidas para serem submetidas à análise. O artefato que

circulou entre os laboratórios é um multímetro digital (Figura 2.2).

As técnicas estatísticas usadas para analisar os resultados dos EP precisam seguir três

passos básicos, que é comum para todos os programas de EP :

a. Determinar o valor de referência;

b. Fazer a comparação dos resultados;

c. Determinar uma estatística de performance.

Os resultados dos participantes devem ser comparados com os valores ou respostas

que melhor demonstrarem competência com o método. Valores de referência podem ser

escolhidos para avaliar com justiça os participantes e ainda para estimular o acordo entre

os laboratórios. Existem uma variedade de métodos comuns para determinar o valor de

referência.

Aqui, nós iremos determinar o valor de referência pelo valor de consenso dos participantes,

pois este procedimento é muito usado em programas de acreditação com EP de rotina. Neste

caso, é importante fazermos uma análise de valores extremos.

Valores extremos podem ter profunda influência nos resultados. Quando a média e desvio

padrão de consenso são usados para estimar a média e desvio padrão do valor de referência,

devemos utilizar procedimentos para controlar os efeitos dos valores extremos. Aqui aplicare-

mos o método de Grubbs (1969) para identificar valores extremos. Somente os laboratórios

em que as medições não são consideradas como valor extremo continuam em nossa análise.

Os resultados dos participantes tal que as medições não são consideradas valor extremo,

podem ser transformadas em estatísticas de desempenho. O objetivo é medir a diferença

entre o valor de referência e o valor do laboratório de tal forma que possa ser comparada

1. Introdução 4

com um critério. Atualmente, as análises são feitas via estatísticas que fornecem uma com-

paração direta entre o resultado do participante e o valor de referência. Uma estatística de

desempenho comum em programas de comparação de medição, proposta no ISO/IEC Guide

43-1 (1997), é o Erro Normalizado (ENhahi):

= z = (1.1) \jUiabi + Uref

onde y7 é a média do laboratório i e //,T é a média do valor de referência, Uiain e Uref corre-

spondem às incertezas expandidas do laboratório i e do valor de referência, respectivamente.

Na seção 2.2 apresentamos um estudo sobre incertezas.

Esta estatística de performance, descreve a diferença entre o resultado do laboratório e

o valor de referência, relativo às incertezas dos valores envolvidos na diferença. Neste caso,

cada laboratório é comparado com o valor de referência via teste de hipóteses individuais.

No entanto, também é interessante estabelecer um teste conjunto para avaliar a performance

do grupo de laboratórios participantes. A avaliação conjunta dos participantes tem um peso

significativo no conceito do grupo em relação aos orgãos credenciadores.

O erro normalizado testa as seguintes hipóteses:

Ho : Laboratório compatível

IIi : Laboratório não compatível

ou seja, ao fazer o teste individual, se o valor do erro normalizado cair na região de rejeição

(£ArLabi > 1 ) , podemos concluir que ternos evidências para rejeitar H0j com nível de confiança

de aproximadamente 5%.

Para analisar os resultados do comité de eletricidade, vamos propor :

a. Um modelo para explicar os dados;

b. Encontrar os estimadores de máxima verossimilhança e de momentos para os parâmetros do modelo proposto;

c. Desenvolver testes para verificar a compatibilidade entre os laboratórios e a competência

de cada laboratório individualmente.

1. Introdução 5

Como em medições a presença de valores extremos é constante, vamos modelar os dados

utilizando a distribuição t-student, para acomodar tais valores extremos. Neste modelo,

estamos interessados em estimar o grau de liberdade e o parâmetro de tendência da medição

Oíj do laboratório com respeito ao valor de referência, já que os laboratórios vão utilizar

sistemas de medições similares para medir o mesmo item, com incertezas determinadas por

um processo de calibração. Encontraremos os estimadores da máxima verossimilhança e

de momentos para estes dois parâmetros e vamos desenvolver um teste para avaliarmos a

consistência das medições dos laboratórios. No final, vamos analisar os dados obtidos pela

REMESP (Rede de Metrologia de São Paulo) na área de eletricidade, cujo mensurado é a

tensão DC.

1.1 Objetivo

Considere um programa de comparação inteiiaboratorial com um grupo de N labo-

ratórios. Estes laboratórios vão medir um mesmo equipamento padrão, devidamente ca-

librado por um laboratório reconhecido internacionalmente. Os laboratórios participantes

realizam as medições do equipamento padrão e emitem um certificado com os valores medidos

e a incerteza associada.

Em nossa análise iremos comparar os resultados dos laboratórios em relação a um valor

de referência e determinar se o grupo de laboratórios está com problemas na medição. Estes

problemas são devido a falhas nos equipamentos utilizados na medição, operadores que não

seguem corretarnente os procedimentos de medição entre outros.

Aqui, propomos um modelo estatístico para os dados provenientes do ensaio de pro-

ficiência conduzido na área de eletricidade pela REMESP. Baseado neste modelo, vamos

avaliar o grupo de laboratórios participantes.

1.2 Organização do trabalho

No próximo capítulo, apresentaremos os dados referentes ao programa de EP (labo-

ratórios participantes com suas medições e o percurso seguido pelo Multímetro Digital) e a

metodologia utilizada para avaliarmos a incerteza da medição.

1. Introdução 6

No Capítulo 3, citaremos algumas características da distribuição t-student e os resulta-

dos mais importantes.

No Capítulo 4, vamos definir um modelo para explicar os dados e calcular o Estimador

de Momentos e Máxima Verossimilhança para o parâmetro de tendência em relação ao valor

de referência e para o grau de liberdade.

No Capítulo 5 desenvolveremos um teste de hipótese para testar a competência e con-

sistência do grupo de laboratórios e individualmente.

No Capítulo 6 aplicaremos os dados apresentados no Capítulo 2 aos resultados obtidos

neste trabalho.

No Capítulo 7 apresentaremos algumas conclusões e as possibilidades de trabalhos fu-

turos.

7

Capítulo 2

Apresentação dos dados e Avaliação

da Incerteza de Medição

Neste capítulo, apresentaremos os laboratórios participantes, o roteiro seguido pelo arte-

fato e os dados relativos ao programa de EP conduzido pela REMESP na área de eletricidade.

Além disso, vamos fazer uma análise descritiva dos dados via um gráfico de "Box-Plot".

Vamos conceituar incerteza e mostrar como os laboratórios aplicam este conceito na medição

da tensão DC, por um multímetro digital, para estimar a variância de suas medições.

2.1 Apresentação dos dados

Buscando a comprovação da competência técnica em medições, vários laboratórios do

Estado de São Paulo se comprometeram a participar do programa de comparação inter-

laboratorial por ensaios de proficiência, conduzido pela REMESP. Em uma comparação

interlaboratorial, os diversos laboratórios medem o mesmo equipamento. No nosso caso, os

laboratórios mediram a tensão DC por um Multímetro Digital.

Essas medições foram realizadas utilizando um multímetro do próprio laboratório (multímetro

padrão) e um multímetro que circula entre os participantes do EP (artefato).

Para a coleta dos dados, o experimento foi realizado seguindo os seguintes procedimentos:

• Foi montado uma malha, onde instalamos o multímetro do laboratório, o artefato e

uma fonte geradora de tensão;

2. Apresentação dos dados e Avaliação da Incerteza de Medição 8

Fonte

Multímetro

Artefato

Figura 2.1: Malha

A fonte foi ajustada para 1 volt, utilizando o multímetro do laboratório;

A tensão gerada foi medida pelo artefato.

M • „

' J L . • *

T ir •

• i f C U K J l ã

m a * t

Figura 2.2: Artefato

Os laboratórios participantes do programa e o percurso seguido pelo artefato estão des-

critos na Tabela 2.1:

2. Apresentação dos dados e Avaliação da Incerteza de Medição 9

Rote i ro Laboratór io Cidade

1 STAVALE Vila Formosa

2 CPDIA Guarulhos

3 BALITEK Ipiranga

4 MEC-Q Santo André

5 SOCINTEC Ipiranga

6 ESFERA Santa Bárbara

7 QUALIBRÁS Campinas

8 GERO São Bernardo

Tabela 2.1: Roteiro seguido pelo artefato

Leituras Labl Lab2 Lab3 Lab4 Lab5 Lab6 Lab7 Lab8

1 1,00005 0.999!) 0,9996 1,0000 1,0000 0,9999 0,9999992 1

2 1,00011 0,9999 0,9996 0,9999 1,0000 0,9999 1,0000000 1

3 1,00005 1.0000 0,9996 0,9999 1,0000 0,9999 1,0000002 1

4 1,00012 0,9999 0,9996 1,0000 1,0000 0,9999 1,0000011 1

5 1,00005 0,9999 0,9996 1,0000 1,0000 0,9999 1,0000012 1

6 1,00011 0,9999 0,9996 1,0000 1,0000 0,9999 1,000002 1

7 1,00006 0,9999 0,9996 1.0000 1,0000 0,9999 1,0000021 1

8 1,00011 0,9999 0,9996 1,0000 1,0000 0,9999 1,0000023 1

9 1,00006 0,9999 0,9996 1,0000 1,0000 0,9999 1,0000061 1

10 1,00011 0,9999 0,9996 1,0000 1,0000 0,9999 1,0000074 1

Média 1,00008 0,99991 0,99960 0,99998 1,00000 0,99990 1,00000 1,00000

Incerteza

Combinada 0,000010 0,000037 0,000120 0,000740 0,000041 0,000008 0,000029 0,000120

Fat,or de

Abrangência 2 2 2 2 2 2 2 2

Tabela 2.2: Medições dos laboratórios

Obs.: A sequência dos laboratórios na Tabela 2.2, não está seguindo a mesma sequência da

Tabela 2.1, ou seja, por questão de ética, não vamos identificar as medições dos laboratórios.

2. Apresentação dos dados e Avaliação da Incerteza de Medição 10

A incerteza combinada (desvio padrão) apresentada na Tabela 2.2, é o parâmetro que

caracteriza a dispersão dos valores que podem ser razoavelmente atribuídos à tensão DC no

artefato (ver seção 2.2.3). O fator de abrangência é uma constante que multiplicada pela

incerteza combinada, fornece um intervalo com 95% de confiança (ver seção 2.2.4).

Na prática, os laboratórios utilizam características físicas do método de calibração para

estimarem o desvio padrão das medições (incerteza combinada). Com o objetivo de esta-

belecer um intervalo com 95% de confiança para o resultado da medição, os laboratórios

multiplicam a incerteza combinada (Uc) pelo fator de abrangência k. Com isso, o resultado

da medição é interpretado por

HM — Média das medições ± UE,

onde UE = k- Uc é denominada incerteza expandida que possibilita identificar uma extensa

fração (95%) da distribuição de valores que poderiam ser razoavelmente atribuídos ao men-

surado. Em geral, a distribuição normal é utilizada para determinar o fator de abrangência.

Maiores detalhes serão discutidos nas seções seguintes.

1 , 0 0 0 1

1,0000 s 0,9999

o 'S 0.9998 c= <13

0,9997

0,9996

Comparação Iriterlaboratorial : R E M E S P Área : Elétrica padrão : Multímetro Digital 3465A

Laboratórios

Figura 2.3: Box-plot dos dados

Através do Box-Plot, Figura 2.3, notamos que o laboratório 3 apresenta medições bem

abaixo dos demais laboratórios. Pelo teste de Grubbs (1969), ele foi considerado valor

extremo e por isso será excluído da análise. O teste de Grubbs (1969) será discutido no

Capítulo 6.

2. Apresentação dos dados e Avaliação da Incerteza de Medição 11

2.2 Avaliaçao da Incerteza de Medição

O objetivo de unia medição é determinar o valor do mensurado, isto é, o valor da grandeza

específica a ser medida. Uma medição começa, portanto, com uma especificação apropriada

do mensurado, do método de medição o do procedimento de medição.

Em geral, o resultado de uma medição 6 somente uma aproximação ou estimativa do valor

do mensurado e. assim, só é completa quando acompanhada pela declaração da incerteza

dessa estimativa.

Na prática, a especificação ou definição do mensurado é ditada pela exatidão requerida da

medição (grau de concordância entre o resultado de uma medição e um valor de referência

para o mensurado). O mensurado deve ser definido com totalidade suficiente relativa à

exatidão requerida, de modo que, para todos os fins práticos associados com a medição, seu

valor seja único.

A operação de medição é realizada, genericamente, por um sitema de medição (SM). O

SM é um conjunto completo de instrumentos de medição e outros equipamentos acoplados

para executar uma medição específica, ou seja, é um processo que combina instrumentos,

operadores e métodos para obter o valor de uma quantidade a ser medida. Nenhum sistema

de medição é perfeito, ou seja, na realização de medições existem várias influências que geram

erros nos resultados obtidos, de modo que não existe unia medição perfeita (sem erros).

Aspectos tecnológicos forçam que qualquer sistema de medição construído resulte imper-

feito: suas dimensões, forma geométrica, material, propriedades elétrica, óptica, pneumática,

etc. não correspondem exatamente ao ideal. As leis e princípios físicos que regem o funcio-

namento de alguns sistemas de medição nem sempre são perfeitamente lineares, como uma

análise simplista poderia supor. A existência de desgaste e deterioração de partes agravam

ainda mais esta condição. Em todos os casos, o SM gera erros de medição.

O erro de medição é impossível de ser eliminado, porém podemos ao menos delimitá-

lo com confiança apropriada. Mesmo sabendo da sua existência, ainda é possível obter

informações confiáveis de uma medição, desde que a ordem de grandeza e a natureza deste

erro sejam conhecidas. O erro é um conceito idealizado e não pode ser exatamente conhecido.

Geralmente ocorrem erros de vários tipos em uma mesma medida. Entretanto, esses

diferentes tipos de erros podem ser separados em três grandes grupos:

2. Apresentação dos dados e Avaliação da Incerteza de Medição 12

1 Erros Aleatórios ou Erros Estatísticos: Resultam de variações aleatórias no valor

medido de uma grandeza, devido a fatores que não podem ser controlados ou que por

qualquer motivo não são controlados. Geralmente, essas variações se devem somente

ao sistema e processo de medição, mas em alguns casos, as variações aleatórias também

ocorrem na própria grandeza. Diversos fatores contribuem para o surgimento dos erros

aleatórios, por exemplo, existência de folgas, vibrações, flutuações de tensão elétrica,

instabilidades internas ou das condições ambientais, etc...

2 Erros Sistemáticos: E a parcela de erro sempre presente nas medições realizadas

sob condições de repetitividade. Da mesma forma que os erros aleatórios, os erros

sistemáticos não podem ser totalmente eliminados, mas podem ser reduzidos através

de correções para compensar os seus efeitos. Os erros sistemáticos mais aplicados são:

2.1 Erros Sistemáticos IvMmm.ent.ais: E o erro que resulta da calibração de um ins-

trumento de medição.

2.2 Erros Sistemáticos Teóricos: E encontrado no uso de fórmulas teóricas aproxi-

madas ou uso de valores aproximados para eventuais constantes físicas que sejam

utilizadas.

2.3 Erros Sistemáticos Ambientais: E o erro causado devido a efeitos do ambiente

sobre a medição, tais como, temperatura, pressão, umidade, aceleração da gravi-

dade, etc...

2.4 Erros Sistemáticos Observacionais: E o erro devido a falhas ou limitação do

próprio operador.

2.5 Erros Sistemáticos Residuais: São os erros que não podem ser reduzidos a um

valor baixo ou para os quais não seja possível fazer correções.

3 Erros Grosseiros: Consiste de enganos que, eventualmente podem ocorrer no proce-

dimento de medida ou na realização de cálculos.

Na grande maioria dos casos, o resultado da medição é determinado através de uma série

de leituras obtidas sob condições de repetitividade. Variações obtidas nas leituras repetidas

são consequências de fatores que afetam os resultados das leituras. Além disso, o modelo

2. Apresentação dos dados e Avaliação da Incerteza de Medição 13

matemático da medição, que transforma as leituras repetidas no resultado da medição é

crítico, pois inclui fatores que não são totalmente conhecidos. Assim, a variação obtida nas

leituras repetidas e a falta de informação do modelo matemático, contribuem para a incerteza

do resultado da medição.

A declaração do resultado de uma medição somente é completa se ela contiver tanto

o valor atribuído ao mensurado quanto a incerteza de medição associada a este valor. A

incerteza de medição 6 um parâmetro associado ao resultado de uma medição, que ca-

racteriza a dispersão dos valores que podem ser razoavelmente atribuídos ao mensurado

(ISO/GUM(1998)). O mensurado é a grandeza física a ser medida. Em geral, os passos para

estimar a incerteza são:

a. Definir a equação de medição;

b. Identificar as componentes de incerteza;

c. Calcular a incerteza padrão das componentes;

d. Calcular a incerteza combinada;

e. Calcular os graus de liberdade efetivo;

f. Calcular a incerteza expandida.

Nas subseções seguintes, abordaremos cada passo mencionado acima.

2.2.1 Equação de Medição

Na maioria dos casos o mensurado Y não é medido diretamente, mas é determinado a

partir de N outras grandezas X\, X2, • • • X^ através de uma relação funcional f:

Y = f(Xl, X2,...XN)

As grandezas de entrada X\, X2 XN, das quais a grandeza de saída Y depende, podem

ser consideradas como:

2. Apresentação dos dados e Avaliação da Incerteza de Medição 14

1 Grandezas cujos valores e incertezas podem ser diretamente determinadas na medição

em curso. Estes valores ou incertezas podem ser obtidos, por exemplo, de uma única

observação, de observações repetidas ou de julgamento baseado na experiência, e podem

envolver a determinação de correções a leituras de instrumentos e correções por conta

de grandeza de influência, tais como temperatura ambiente, pressão barométrica e

umidade;

2 Grandezas cujos valores e incertezas são incorporados à medição a partir de fontes

externas, tais como grandezas associadas com padrões de medição calibrados, materiais

de referência certificados e dados de referência obtidos de manuais técnicos.

No programa do eletricidade. como método do medição, cada laboratório utilizou a se-

guinte relação:

MA = A + MP + Rrs(A) + Res(P)

onde,

• MA'- Representa a tensão no artefato;

• A: Repetitividade;

• Mp\ Representa a tensão 110 equipamento padrão do laboratório;

• Res(A): Resolução do artefato;

• Res(P): Resolução do equipamento padrão do laboratório.

MA é a grandeza de saída e os demais itens dados acima são as grandezas de entrada.

A incerteza combinada do medição associada, à estimativa de saída, designado por u(y), é

o desvio padrão do mensurado Y e deve ser determinado a partir das estimativas xt das

grandezas de entrada Xt, e suas incertezas padrão associadas u(xt). Abaixo, descreveremos

métodos para calcular a incerteza de cada grandeza de entrada.

2. Apresentação dos dados e Avaliação da Incerteza de Medição 15

2.2.2 Avaliaçao da Incerteza Padrão de Medição das Estimativas

de Entrada

A incerteza padrão de unia grandeza de entrada é dividida em dois grupos, de acordo

com o método utilizado para. estimar seus valores numéricos:

• Tipo A: Aquelas que são avaliadas por métodos estatísticos;

• Tipo B: Aquelas que são avaliadas por outros métodos.

Independente de suas classificações, todos os componentes de incerteza são modelados

por unia distribuição de probabilidade e quantificados pela variância ou desvio padrão. A

incerteza padrão do Tipo A é obtida a partir de unia função densidade de probabilidade

derivada das observações (leituras) de uma distribuição de frequência, enquanto que uma

incerteza padrão do Tipo B c obtida de uma suposta função de probabilidade, previamente

assumida para. esta fonte de incerteza, tais como: grandezas associadas aos padrões de

medição calibrados, materiais de referência com certificados e outros.

E importante ressaltar que toda incerteza padrão é um desvio padrão. Assim, se consi-

derarmos a incerteza do tipo A. temos o desvio padrão da média da série de observações da

medição. Por outro lado, se considerarmos as incertezas do tipo B, temos o desvio padrão

da distribuição de probabilidade associada.

A incerteza padrão das grandezas de entrada A é avaliada pelo tipo A enquanto que ML,

Res(P) e Res(L) são avaliadas pelo tipo B. Como fonte de incerteza do tipo A, consideramos

a repetitividade das medições. No nosso caso, cada laboratório realizou dez leituras da tensão

DC. Para exemplificar os cálculos, vamos tomar os dados do laboratório 5.

2. Apresentação dos dados e Avaliação da Incerteza de Medição 16

Leituras Tensão DC (V)

1 1,0000

2 1,0000

3 1,0000

4 1,0000

5 1.0000

6 1,0000

7 1,0000

8 1,0000

9 1,0000

10 1,0000

Média 1,0000

DPM 0

Tabela 2.3: Dados do laboratório 5

A incerteza padrão das grandezas de entrada é estimada da seguinte fornia:

• Incertezas Avaliadas pelo t ipo A: Aqui. a incerteza padrão é dada pelo desvio

padrão da média da série de observações da medição de tensão. Sejam t í : t 2 , . . . , íio as

dez medições da tensão (ver tabela 2.3). O desvio padrão da média é

onde S(T) = SJLZLUH - T )

da repetitividade é

• Incertezas Avaliadas pelo t ipo B: Aqui, a incerteza padrão de uma grandeza

de entrada que não tenha sido obt ida através de observações repetidas é avaliada por

julgamento científico, baseando-se em todas as informações disponíveis sobre a possível

variabilidade dessa grandeza. 0 conjunto de informações pode incluir:

= 0 e t = ]CÃ-=i tf- = 1. Portanto, a incerteza padrão

u(A) = 0.

2. Apresentação dos dados e Avaliação da Incerteza de Medição 17

1. ciados de medições prévias;

2. a experiência ou o conhecimento geral do comportamento e propriedades de ma-

teriais e instrumentos relevantes;

3. especificações do fabricante;

4. dados fornecidos em certificados de calibração e outros certificados;

5. incertezas relacionadas a dados de referência extraídos de manuais.

A partir disso, e considerando a grandezas de entrada para a medição da tensão, as

incertezas padrão são quantificadas da seguinte fornia:

• Incerteza Padrão para Mp\ O desvio padrão da tensão no padrão do laboratório

não é estimado da variabilidade associada diretamente às medições mas via a incer-

teza expandida herdada do multímetro. Como veremos na seção 2.2.4, a incerteza

expandida é um múltiplo do desvio padrão que abrange o semi-intervalo de 95% de

probabilidade. Assim, utilizando os dados da tabela 2.3, obtemos que:

Portanto, a incerteza padrão do padrao do laboratório é n(Mp) = 0,0000065.

A incerteza expandida do equipamento padrão do laboratório está declarada no certi-

ficado de calibração do respectivo equipamento.

• Incerteza Padrão para Res(A): Para esta grandeza temos a informação que o

multímetro tom uma resolução de 0, 0001V, ou seja. a escala de medição está dividida

em intervalos de 0, 0001V. Sendo assim, vamos considerar que Res(A) tem distribuição

uniforme entre estes intervalos. Portanto, a incerteza padrão da Res(A) é:

sj YL

• Incerteza Padrão para Res(P): Assim como Res(A). Res(P) também é considerada

uma variável aleatória com dist ribuição uniforme, com a mesma resolução de 0, 0001V,

logo,

0, 000013 - 2 * u(Mp) => u(Mp) = 0, 0000065.

2. Apresentação dos dados e Avaliação da Incerteza de Medição 18

u(Res(P)) 0. 0001

0, 0000289.

Na próxima seção, faremos a combinaçao de t odas as incertezas padrão calculadas nessa

seção.

2.2.3 Avaliação da Incerteza Padrão Combinada

A incerteza combinada é a combinação entre todas as incertezas padrão das componen-

tes relacionadas pela equação de medição, ou seja, uc{y) corresponde ao desvio padrão da

estimativa da grandeza de saída.

Ern alguns estudos de calibração, podemos ter que duas ou mais grandezas de entrada

sejam correlacionadas, e essa correlação é de certa forma uma contribuição à incerteza combi-

nada. Para julgar se existe ou não essa correlação, é preciso conhecer o processo de medição

e ter conhecimento de cansa dessa dependência mútua entre as grandezas de entrada. Não

tomar conhecimento dessas correlações pode levar a avaliações incorretas da incerteza padrão

do mensurado.

Em alguns casos, essa correlação pode ser eliminada pela escolha apropriada da relação

funcional, mas na prática, algumas grandezas são frequentemente relacionadas pois, na ava-

liação de seus valores ê utilizado o mesmo padrão de referencia, instrumento de medição,

dados de referencia, ou até, o método de medição.

Nos casos onde existe a correlação, o quadrado da incerteza padrão combinada (ISO

GUM, 1998, pg. 21. item 5.2.2) pode ser aproximado por

onde a e q, são os coeficientes de sensibilidade associados com as estimativas de entrada

Ti e :;:/,. respectivamente, isto é, as derivadas parciais da relação funcional / com relação às

variáveis X j e Xh, avaliadas para as estimativas xt e Xh,

mesmo raciocínio para c.f,. Temos ainda que zifa) é a incerteza padrão associada à estimativa

da grandeza de entrada X t (avaliada conforme seção anterior) e ufa,.?:/,) é a covariâneia

N JV-1 N

(y) = Y/cfa2(.r,) + 2]T £ c„chufa,xh) ? : = i / ) . = » + 1

df df i)x, DX, ' LYí=X-,V ,XN=:RN

2. Apresentação dos dados e Avaliação da Incerteza de Medição 19

associada às duas estimativas x% e x/, dada por

•u(xu xh) = •u,{x1)u(xh)r{xl, xh) (i ± h)

onde, r(.?'./, .77, ) é o coeficiente de correlação (i ^ h e jr| < 1). Em alguns casos, a covariância

pode ser estimada por

1

I - ) j = ]

onde x,jj é a j-ésima observação da grandeza X,, e é a estimativa da grandeza X t , mesmo

raciocínio para Xhj, (i, h = 1, • • • ,N).

Para grandezas de entrada não correlacionadas, como é o caso do grupo da área de

temperatura, a incerteza combinada é dada por :

N N N

u2c(y) = £<M.rO = £ ?;=1 ?:=i ?=i

O coeficiente de sensibilidade c, descreve o quanto a estimativa de saída y é influenciada

por variações da estimativa de entrada xt. Como em nossa equação de medição a grandeza

de saída c uma função linear das grandezas de entrada, temos que, para todas as grandezas

de entrada, c-, — 1.

Logo, utilizando os cálculos das incertezas das grandezas de entrada da seção anterior,

obtemos que:

u(2(y) = (O)2 + (0, 0000065)2 + 2 * (0, 0000289)2.

Assim,

;./,.(//) = 0, 00004138.

2.2.4 Incerteza Expandida de Medição

Embora a incerteza combinada uc(y) possa ser universalmente usada para expressar a

incerteza de um resultado de medição, em algumas aplicações comerciais, indústrias e regu-

lamentadoras, e quando a saúde e a segurança estão em questão, é muitas vezes necessário

2. Apresentação dos dados e Avaliação da Incerteza de Medição 20

dar uma medida de incerteza, que defina um intervalo em torno do resultado da medição

com o qual se espera abranger uma extensa fração da distribuição de valores que poderiam

ser razoavelmente atribuídos ao mensurado.

A medida de incerteza que satisfaz o requesito de fornecer tal intervalo é denominada

incerteza expandida e é representada por ue(y). Assim, o resultado de uma medição é

representada por

y±ue{-y).

A incerteza expandida -ue(y) é obtida niultipicando-se a incerteza padrão combinada uc(y)

por um fator k de abrangência, correspondente a uma probabilidade de cobertura especificada

(ISO/GUM recomenda 95%). Logo, a expressão acima pode ser reescrita como sendo

A combinação entre as grandezas de entrada estabelece, pelo Teorema Central do Limite,

que a distribuição do mensurado Y será aproximadamente normal. No entanto, podemos

ter em alguns casos, que a incerteza padrão combinada pode estar sendo dominada por

componentes de incertezas padrão avaliadas pelo tipo A, baseada em poucas observações,

ou por componentes de incertezas padrão avaliadas pelo tipo B, baseadas em uma suposta

distribuição não normal. Com isso , ao invés de usarmos o valor de k da distribuição normal,

podemos melhorar a aproximação observando a distribuição da estatística

onde uc{y) é a estimativa para o desvio padrão da grandeza de saída Y.

Pelo método de Satterthwaite, a estatística T tem distribuição aproximadamente

t-Student com i/eff graus de liberdade. O método utilizado estima os graus de liberdade

baseado nos graus de liberdade de cada fonte de incerteza (ISO/GUM, 1998 , pg 64), na

forma

y±k* uc(y).

T y-Y y-Y y-Y

2. Apresentação dos dados e Avaliação da Incerteza de Medição 21

onde os u,(y) = c, -</.,• (.r,-) com i = 1, • • • ,N. são as contribuições para a incerteza padrão

associada a estimativa de saída y. resultante da incerteza padrão associada à estimativa de

entrada ,r7, e v, são os graus de liberdade efetivo da contribuição da incerteza padrão Ui(y).

Como a estatística T tem distribuição aproximadamente t-Student, o intervalo com nível

de confiança (1 — 7) para o mensurado Y é dado por

P(~ti < T < ti) = (I-7)

ou seja,

-ti < < ti y ± ti uc(y) 2 Mv) 2

onde ti é o quantil (1 — ?) * 100% da distribuição t-Student, que depende dos graus de 2 ^ liberdade dados por (2.1). Em geral, se denota k (Fator de Abrangência) ao invés de ti.

Para os dados da tabela 2.3, temos que o grau de liberdade é dado por

,fi n A n n / 1 0 0 , 4 / 0 " 0 (0, 0000289)71 (0, 0000065)4 \ 1 uefí = (0. 00004138) * — + 2 * — — — + — — ' - « 62, 966.

\ 9 30 30 J

Obs.: Para o cálculo de ue[\ temos que os graus de liberdade com relação à repetitividade

é igual a 9 (já que foram realizadas 10 medições em cada patamar de temperatura). Para

as outras grandezas de entrada da equação de medição foi assumido que todas possuem 30

graus de liberdade, conforme recomendação do INMETRO.

Arredondando para baixo (sempre), temos = 62. Considerando um nível de confiança

de 95%, obtemos da distribuição t-student que k « 1,999 e então, a incerteza expandida é

dada por

ue(y) — k . uc(y) = 1,999 * 0,00004138 = 0,00008271K

Resumiremos os cálculos de incerteza apresentados para o laboratório 5 em forma de

tabela.

2. Apresentação dos dados e Avaliação da Incerteza de Medição 22

Cálculo d(i Incerteza

Fonte cki Incerteza Estimativa Tipo Distribuição Divisor Incerteza G.L

Repetit.ividade 0 A Normal 1 0 9

Resolução do artefato 0,0001 li Rctangular 3/1041 0,0000289 30

Resolução do eq. padrão do laboratório 0,0001 13 Rei,angular 3.4041 0,0000289 30

Incerteza do eq. padrão do laboratório 0,000013 13 Normal 2 0,0000005 30

Incerteza Combinada 0,00004138

Grau d(i Liberdade Efctivo 02,906

Fator d(i Abrangência 1,999

Incerteza Expandida 0,00008271

Tabela 2.4: Cálculo de incertezas para o laboratório 5

23

Capítulo 3

A distribuição t-student

As boas propriedades da distribuição normal (univariada e multivariada) juntamente

com o fato de que a normalidade pode ser habitualmente justificada apelando ao Teorema

Central do Limite, têm sido as fundamentações básicas da aplicação do modelo normal na

análise estatística de dados contínuos. Assim, como é bem sabido, a maior parte da teoria

de inferência estatística para variáveis reais contínuas está desenvolvida em torno deste mo-

delo. Este desenvolvimento encontra-se particularmente enfatizado no contexto dos modelos

lineares. Contudo, em muitas situações este modelo é claramente impróprio, por exemplo,

quando os dados provém de uma distribuição com caudas mais pesadas que a distribuição

normal. De fato, a vulnerabilidade da inferência baseada 110 modelo normal com respeito a

valores extremos ("otitliers") têm sido motivo de vários estudos de robustez. Em particu-

lar, a detecção e tratamento de valores extremos têm representado uma importante área de

pesquisa, da estatística robusta. Neste sentido, alguns modelos alternativos ao normal e que

são baseados em distribuições simétricas que permitem reduzir a influência dos valores ex-

tremos têm sido sugerido por diterent.es autores. Por exemplo, Taylor, Little e Lange (1989)

propõem o modelo t-student. com v > 0 graus de liberdade como uma extensão paramétrica

robusta do modelo normal e ilustram o desempenho do novo modelo em várias aplicações.

Como nossos dados são obtidos de sistemas de medição, que estão sujeitos a erros, a

presença de valores extremos "é natural". Desta forma vamos modelar os dados utilizando

esta distribuição, encontrar os estimadores de momentos e máxima verossimilhança para os

parâmetros (ver Capí tu lo 4) e desenvolver testes de hipóteses (ver Capí tu lo 5). Neste

3. A distribuição t-studcnt 24

capítulo vamos listar suas propriedades e alguns resultados importantes que serão usados

posteriormente.

3.1 Introdução

Nas três últimas décadas, tem sido observado um crescente interesse pela distribuição

t-student n-variada na literatura estatística, tanto em teoria como em aplicações. Este

interesse, como já foi dito anteriormente, é devido ao fato de que a distribuição t-student

n-variada têm caudas mais pesadas que a distribuição normal. Além disso, a distribuição

t-student aproxima-se da distribuição normal quando seu grau de liberdade tende ao infinito

(is —> oc).

A distribuição t-student. multivariada é um membro particular dentro da classe das dis-

tribuições elípticas. De forma, geral, dizemos que a distribuição elíptica é uma extensão da

normal n-variada com vetor de médias // e matriz de covariâncias E, denotada por A„(/i , E)

e a distribuição esférica, uma sub-classe da distribuição elíptica, é uma classe geral de dis-

tribuições com a mesma simetria da distribuição normal padrão n-variada Nn(0,/). Em

síntese, a distribuição elíptica é uma transformação linear de locação e escala da distribuição

esférica.

Definição 3.1 Seja Ori o conjunto das matrizes T(n x n) que são ortogonais, ou seja, T T =

I. O vetor aleatório X_(v x 1) é dito ter uma, distribuição esférica n-variada se para cada

matriz T em On, tem-se que

x = TA.

O exemplo mais simples de distribuição esférica é a N.n(0,1).

Sabemos que a distribuição Nn(fi, E) pode ser escrita em termos da normal Nn(0,1) da

seguinte maneira:

X = (i + A'Y

onde X - An( / / , E), Y - JV„(0,1) e E = A!A.

3. A distribuição t-studcnt 25

De maneira análoga, um vetor X (u x 1) é dito ter uma distribuição elíptica com

parâmetros //. (n x 1) e E (n x n) se

X = IJ. + A'Y,

onde Y_ tem distribuição esférica corri média 0 e matriz de dispersão I, A : k x n e A!A = E

com posto r(E) = k. Denotaremos Y_ ~ Esn{0,I) e X ~ £7n( / / ,E). [Ver Fang, Kotz e Ng

(1990), Definição 2.2, pg. 31]

3.2 A distribuição t-student multivariada

Sejam Z_ ^ Nd (O. ^ com posto coniploto, 011 sojíi, / — c V ^ z - 2 independentes. ' ' Xis

Notemos que Z_ pode ser expresso corno Z_ = A'Z}-k\ onde A'A = E, r(A) = k e ~

A^(0, 7). Seguindo esta notação, a distribuição t-student n-variada será definida e as suas

propriedades listadas.

Definição 3.2 Um vetor aleatório X (•/?. x 1) é dito ter distribuição t-student n-variada com,

parâmetros //. (n x 1) e E (n x n) e v > 0 graus de. Uberdade, isto é, X ~ tn([r, E;z/), se

X = ij. + V}ÍZ.

O parâmetro //. r denominado vetor de locação e o parâmetro E é denominado matriz de

dispersão.

A função densidade da distribuição t-student multivariada í„(/í; E; u) é dada por:

+ ,3.1) ("71") 2 F (2 y|Ej

Ver Valle (1994, pg. 01).

3.2.1 Propriedades da t-student

Considere X um vetor aleatório com distribuição t-student n-variada com vetor de

locação //., matriz de dispersão E e v > 0 graus de liberdade, segundo Valle (1994, Proprie-

dades 3.2.2, pgs. 66 à 72) o vetor aleatório X verifica as seguintes propriedades:

3. A distribuição t-studcnt 26

(a) E(X) e Cov(X) = E(XX) - E(X)E(X!) são dadas por:

E{X) = //., .se > 1

e

Cov(X) = ^ - E . seu >2. z/ — 2

(b) Desde que A Z ~ A,, (0, AEA') 6 independente de V ~ v/xl temos:

V + AX = rj + A/í + V^AZ_ ~ t m ( / / + A//,; AEA'; z/) (3.2)

onde A é uma matriz (rn x /;) e // um vetor (r??. x 1). Como E é definida positiva, tem-se

que

onde Xj, e //. sao vetores rn x 1 e E L1 é unia matriz m. x •/??.. Da Equaçao 3.2 segue

que

onde ~ AV„(0, Eu) é independente de V ~ z/ • ^ • A distribuição marginal de X_2

obtida analogamente.

(c) Se X_ ó particionado como 110 item anterior, tem-se que a distribuição condicional de

X,, dado X-2 = £2 t-student m-variada.

(d) X ~ tn(fi\ E: u) se e somente se para todo a (n x 1), a'X ~ íi(a'//; a'Sa; 1/).

3.3 Distribuições relacionadas

Aqui, vamos relacionar alguns resultados importantes que serão usados nos próximos

capítulos.

Considerando a partição

2íi = l±l + V*Z 1 ~ t m ( ^ ; En; t>) (3.3)

3. A distribuição t-studcnt 27

Definição 3.3 Sejam Si ~ \'f,/" p S2 ~ 'y/\f/ independentes. Então, F = SjS^ ~ Fn v e

tem. densidade dada por:

r + i/)l / n \ è « i,.. ,, r n i 1 + -x . x > 0.

v . f ( r ) = L2V ' - 2

Teorema 3.1 Seja, X_ ~ Então, a forma quadrática

{X-oL)'{Y,)-í(X-a)~n-FniV.

Prova: Temos que

A ~ tn(a\E; u) A - « - (0; E; /y)

e queremos encontrar a distribuição de (A — o;) ' (E)"1 (A — o). Utilizando a Definição 3.2

podemos escrever

X-a = 0 + V*Z,

onde Z_ ~ Nn (0, E), com r(E) = •/?. e Va ~ v • • ^ U

Então:

( x - a y c r E r o - ^ x - t t ) = (v^Z)'(T,)-\V^Z)

= V /Z'(E) ' 'Z .

Podemos observar que a forma quadrática tem distribuição qui-qtiadrado, ou seja,

Z'(E)~lZ ~ o n d e r ( ( E ) _ i ) 6 0 P o s t o d a m a t r i z ( S ) " ' e A = |0'(E)~'0 é o

parâmetro de não centralidade pois (E ) - 1 (E ) = I é idenipotente (ver Teorema 4.4.3 em

Graybill (1976), pg. 135). Temos por hipótese que Z ~ N„(0, são indepen-

dentes.

Logo, (X - ^ ' ( E ) - 1 (X-a) ~ ?i • FU]I/. •

28

Capítulo 4

Modelo Estatístico e Estimação j»

Neste capítulo, vamos apresentar um modelo estatístico adequado para explicar os dados

e obter o estimador de momentos e de máxima verossiniilhança para a tendência das medições

de cada laboratório em relação ao valor de referência.

4.1 Modelo proposto

Considere um programa de comparação interlaboratorial com uni grupo de N laboratórios

onde cada laboratório realiza um grupo de medições de um mesmo padrão, tal que:

Vi, = + X + l 1 ' " " " " ' (4-1) { i !.••• ,N,

onde X é uma variável aleatória com média //,x. e desvio padrão <rx, a% 6 R o e,(J são variáveis

aleatórias com média 0 e desvio padrão cr, > 0 para todo j = 1, • • • , /?, e i = 1, • • • , N. O

equipamento padrão é representado pela variável aleatória X e as medições do i-ésimo labo-

ratório participante são representadas pelas variáveis aleatórias • • • , YhVí. E importante

destacarmos que a média //,T e a variância a2r são conhecidas e as variâncias dos erros de

medições dos laboratórios a? também são conhecidas.

Desde que cada laboratório tem equipamentos de medição, condições ambientais e opera-

dores distintos, e as réplicas, em cada laboratório, são obtidas em condições de repetitividade,

vamos assumir, conforme Jaech (1985, pg. 43), que:

• c%j ° f-kj não correlacionados para todo k = !,••• , N e j = 1, • • • ,

Modelo Estatístico e Estimação 29

• e eu sao não correlacionados para todo i = 1, • • • . N e j, l = 1, • • • , m;

• f j j e X são não correlacionados para todo / = 1, • • • , TV e j = 1, • • • ,

Com isso, temos que:

Eif-ijn-j) = 0 , E 0 ,^; , ) = 0 e E^jX) = 0

para todo i, k = 1, • • • , jV e j, I = 1, • • • , nt.

Além disso, vamos assumir que

/ vn \

V21

y2„.

Yn 1

\ yNi,n /

onde v > 0 é o grau de liberdade, £ a matriz de dispersão e m o vetor de locação.

Aqui,

rn

í ('>!+/'.,-) \

(«i •+ /<.,•) ("2 + í'.r)

(«2 + /'.,-)

(<>,V t

\ (njv+/'.r) /

Modelo Estatístico e Estimação 30

/ "l ^ \

E =

<7~ + (7 7

<7.r +

\ /

No nosso caso, a matriz de dispersão 6 conhecida, porém, o grau de liberdade e as

tendências o., de cada laboratório são parâmetros desconhecidos. Para simplificar nossa

análise, vamos denotar o vetor de medições por

Y =

/ Y ^

Y,

V ^ v /

( y , ^

onde Y, =

\ Y*n, )

para ? = , N. Seja 1, um vetor nr x 1 com elementos unitários. Com isso

F a, \ ( n \ «1

Modelo Estatístico e Estimação 31

onde i = 1, • • • , N. Além disso,

fl,:{i) = 1, Ih:

( „

V /',:

Í / ' , ( ! )

/',,:( 2)

logo,

V / ' , :(A)

onde i = 1, • • • , N. A partir disso, temos que m = a* + //,*.

Portanto, temos que V ~ tm+...+nN(a* + /^*;E;z/) ou seja, Y_ tem distribuição t-

student L variada, onde L = nx + ... + nN. Além disso, vamos denotar E como uma matriz

particionada, na forma:

(

E =

EU S12 X , ,

^22 S23 S2 N

E32 S3 N

\

tal que

Sa/1 SjV2 Syv3

/ CTx + a'Í

a + <T

^NN J

\

\ "i "i ••• "í + ai ) para / = j com dimensão ?>,• x //.,. Agora., para i ± y, temos qu(

/ <rf. ... \

E,j — fT CT

V ^ ó /

com dimensão nr x nj. Além disso,E,:j = E - para. i,j = 1,..., N.

Modelo Estatístico e Estimação 32

A fim de encontrarmos a inversa de £ , verificamos que a mesma pode ser expressa da seguinte maneira

onde é um vetor L x 1 de uns, aj a variância de A e

! "i ••• 0 <> ••• 0 ... o ... o \ 0 0 0 0 0 0

0 • 0 0 0 0

o ... o

A

0 0 0 0 0 0

0 0 0 <T.) 0

0 0 0 0 "ii 0

0 0 0 0 0

0 0 0 0 .. <T% / V « Utilizando resultados para inversas de matrizes, apresentados por Graybill (1983, Teo-

rema 8.3.3, pg. 189), temos que:

XT1 = A'1 + y.t/.tf'

onde A~] c a inversa da matriz diagonal A..

í \

N

7 = + e b* =

\b_kj

com b* = 1,-V, para i = 1, ..., N.

Modelo Estatístico e Estimação 33

Vamos particionar esta inversa da seguinte maneira:

/ A n A12 A,3 ... A]N \

A2I A22 A23 ... A-2 N

A 3 1 A32 A , , ... A, 3 N

\ A/vi A/V2 A/V;Í ... A w w

onde Au é uma matriz simétrica n, x n,, com elementos da diagonal iguais a

|E| -crZ(<T2 lTK..(*tr ' -\. . (a%r»

e o restante 2 í 2 Víij í 2 VÍI, —2 f'2 \n

-Vx^l, [O. ... (T N )

|E|

para i = No caso de i ^ /, para i,l = 1,..., A , temos que Au = A/?:, com elementos

iguais a r2(rrh'" (rr2)'"'-1 (n?Y»-\ (nl^N

E onde

| S | = (7 . . . (T + a1l}ialo\ol...o1N + + ...+ nNalcl...a2N_l})

é o determinante de E [ver Teorema 8.4.3 em Graybill (1983), pg. 203].

A seguir vamos estimar os parâmetros de tendência (a,:) em relação ao valor de referência

(A ) e o parâmetro u.

4.2 Estimador para os Parâmetros do Modelo

Do acordo com o modelo proposto na seção anterior, vamos apresentar os estimadores

para o parâmetro de tendência o, e para o parâmetro u.

Modelo Estatístico e Estimação 34

4.2.1 Estimador de Momentos

Estimador de M o m e n t o s para o parâmetro de tendência a,

Nosso modelo é

Yij = Oíj + X + €íj-; j = 1,...,-/?,,; e i = 1,..., N

onde X uma variável aleatória com média /i,x e desvio padrão ax , a t ç R e €tJ são variáveis

aleatórias com média 0 e desvio padrão aj > 0. Sabemos que E{Yi:j) — ar + fix e vamos

definir Yt = J Í J e yL = ' 'J. Utilizando o método de momentos, temos que

Portanto, ô , = Yt — /ix é o estimador de momentos para a-,;.

Est imador de M o m e n t o s para o parâmetro v

Utilizando o método de momentos, onde igualamos o segundo momento amostrai com o

segundo momento populacional, encontramos que o estimador para o parâmetro v será nulo

(ver Apênd i ce A ). Desta forma, vamos trabalhar e estudar as propriedades do estimador

de máxima verossimilhança deste parâmetro.

4.2.2 Estimador de Máxima Verossimilhança (EMV)

E M V para o parâmetro a,

Para o modelo proposto, a função de verossimilhança é dada por :

E(YU) = y,.

n,j

n, ài = Vi. ~ /Ar-

f{y\°L,v) r [ f r + L)] í

n ^ + L)} 1 ^L+v) (4.2)

(Tr)ir(ii/) y M

Modelo Estatístico e Estimação 35

Tomamos y — a* — //,T* da seguinte forma:

/ y.i \ / ("O \ / (,,) \

(«i) ( < > 2 )

( « 2 )

(<*N)

i/l :V2

/ U) \ /',(2)

nW /

2 \

\ 2

a =

o ... 1,

\ yN,,N / \ • ../ \ ( M x ) /

= (y ~ ih?) - Jql,

onde 0 é um vetor m x 1 de elementos nulos e ,/ e uma matriz com dimensão L x N dada

por:

1| o ... 0 o i2 ... o

\

,J =

V o 0 ... IN J

Assim, obtemos que a* = Ja. Portanto, a verosimilhança é dada por:

r lUv + L)} 1 i , f{y;a,v) = (Tr)fr a») v / M

V2v \y+((y - fh*) - Jay^dy - - Ja UL+U)

(4.3)

Denotamos por l(y; a, v) = \nf(y;a, u), temos

%£»,") = ln R— — (L + u) In {// + (y — (y — y^*) - 2(y - y^Y^Ja + (Ja)'Y>~1 Ja} ,

(4.4)

onde R = nè^+L)] 1 (7r)Tr(.» x/isi

1/2'

Derivando l(y,a, u) em relação a a, temos:

dl(y; a, u) (L + v){J'Y.~\y - yT*) - Ja) da ;/ + (y - yx*YZ-l(y - / v" ) - 2(y - fi2L*)'T,~'1 Ja + (Ja)'T,"A Ja

Modelo Estatístico e Estimação 36

. dl(y,a.f) Ao tomarmos — ^ — = U, obtemos que

à={J'Trlj) 1 ./'E-1^-/^*)

Através de manipulações algébricas, temos que

( l i '

( . / 'E - 1 . / ) - 1 , 7 'E - 1 = ^ 1 2 '

\ o 0

Portanto,

1 1 ' tjV / njv

ô = r(y - [ix*).

Com isso, o estimador de máxima verossimilhança é dado por

à = r { Y - t i x * )

= r .

ou seja,

( « i \

n 2

( \ Y'2. ~ /',,:

\ OrN ) \YN.- /tx /

onde Yj„ = ,J, i = 1, • • • ,K. Observe que o Estimador de Máxima Verossimilhança

(EMV) para a tendência das medições coincide com o estimador de momentos. (Observe que o

EMV para o parâmetro a não depende1 do grau de liberdade.)

Podemos observar que o estimador é não viciado. Para o modelo proposto temos que o estimador

é dado por:

= a, + X + f,. - //,.,;

= aj + (X - /ix) + êj... (4.5)

Modelo Estatístico e Estimação 37

I

onde f,. = f'J, ?: = 1, • • • , K. Logo, E[ã,] = a,,.

Na seqiiência, vamos encontrar a distribuição do EMV do parâmetro de tendência a,-. Para

isto, utilizamos a propriedade (b) do Capítulo 3. subseção 3.2.

Sabemos que Y ~ tL(g* /) logo. F - /.t* ~ í L (a* ;£ ; ; / ) e â = r ( V -

/ O - / . 7 v ( r « * ; r E r » .

Portanto,

à ~ f^ferEr';//). (4.6) Seguindo a mesma notação, vamos agora encontrar o EMV para o parâmetro //.

E M V para o p a r â m e t r o v

Derivando a expressão (4.4) em relação a u, obtemos

dl(y;a,v) <9[lnP Q(/y + L))] 0 [ l n r (± i / ) ] 1 1 ~du = to to + 2llU/+2

- \ H" + ((y ~ / O - ((y - . / « ) } + + ^ 1

2 7

Logo,

_ r'(i(^ + L)) 1 + õ í 1 + lnf du T^u + L)) r ( l y ) 2 Ja ) j

^ 1 (4 7)

0 estimador í> é a solução não explícita da equação = (). No Capítulo 6, encontraremos

uma aproximação para a estimativa de máxima verossimilhança para o nosso conjunto de dados,

usando um algoritmo de solução numérica.

4.3 Consistência dos estimadores de a%

Através da expressão (4.5), temos que

fív = a.,-+ (X - / / „• )+ f ,\ ,

para todo /' = 1,. .. ,N. Utilizando a lei forte dos grandes números (Rao, 1987, pg.14), concluímos

que

Modelo Estatístico e Estimação 38

f,. -> O, P-q.c. n, } oo

Com isso, obtemos que

di —> + (X - //,,.), P-q.c. a% | oo

Assim, o estimador de máxima verossimilhança é não consistente. Porém ao analisarmos o

experimento do EP e o modelo proposto para descrever os dados, podemos concluir que a não

consistência é esperada.

Na prática, o valor de referência é determinado por consenso ou calibração por um laboratório

da RBC. Porém, o valor de referência é uma variável aleatória, cujos parâmetros são conhecidos,

conforme proposto pelo ISO/IEC Guide 43-1 (1997). Como o valor de referência "varia" durante a

realização do programa de EP, mesmo que o número de medições do laboratório tenda ao infinito,

não temos como garantir a consistência do estimador

39

Capítulo 5

Testes de hipóteses

Neste capítulo desenvolveremos testes com o propósito de verificar a consistência do grupo de

laboratórios participantes do programa de EP e a competência de cada laboratório individualmente.

5.1 Teste individual para os laboratórios.

A competência de cada laboratório será testada utilizando as seguintes hipóteses:

HQ : AI = 0

Hi : ai / 0.

Observando o resultado (4.6), verificamos que:

ô ~ r s r ' ; v).

Pela distribuição dada em (3.3) temos que:

ât ~ ti (q,;; (FEF')„:; V) ,

onde ( r s r ' ) , , representa o elemento da i-ésirna linha e i-ésima coluna da matriz de dispersão rET'.

Logo,

â, I ar , ~ t I — : ; i\u

Vamos testar cada laboratório individualmente utilizando a equação (5.1) encontrada anterior-

mente e usar a estimativa de máxima verossimilhança u para encontrar uma distribuição aproxi-

mada, ou seja,

(5.1)

5. Testes de hipóteses 40

v / ( f Ê f % y v / T f s r 7 ) " J V / ( f Ê f ' y '

ondo (rEr')?:,: representa o elemento da i-ésima linha e i-ésima colima da matriz de dispersão r£r " .

Sob a hipótese Hq, temos que:

Wi = , w í ] (0:1: z>),

onde (PEr'),, representa o elemento da i-ésima linha e i-ésima coluna da matriz de dispersão TEr'.

Neste caso, a Região Crítica será dada por:

RC = {\V. G R : 11', < :rci ou W, > xc,2},

e para um valor fixado 0 < r/ < 1, determinamos os números :rc, e xc,, de modo que

P(Wi < xCl ou Wi > xC2) = //.

5.1.1 Poder do Teste

O desempenho de um teste é medido pela frequência com a qual este executa julgamentos

corrctos. Esse desempenho é medido pela função poder. O poder do teste é dado por:

7r(a) = P(rcjcitarIlQ/a)

ou seja,

f(x)dx+ / f(x)dx (5.2) o .' :rc.,

onde xCl é o pereent.il (|)100% e xC2 é o percent.il (1— |)100% da distribuição t-student, cuja função

densidade de probabilidade está dada na expressão (6.2) do Capítulo 6.

Fornecendo alguns valores iniciais para a,;, e usando a expressão (5.2) vamos analisar o desem-

penho do teste pelo gráfico da função poder no Capítulo 6.

5.2 Testando o grupo de laboratórios.

Para avaliar a consistência do grupo de laboratórios propomos o seguinte teste

5. Testes de hipóteses 41

I H0 : a = O

} Hi : a ± 0.

Sabemos que (â - a) ^ /jv(0; TSr' ; u). Assim, pelo Teorema 3.1 temos que

(â- a)'(rsr')_1(à~a) - N • FNI„.

Mais uma vez, tomamos a aproximação

(ã - ^'(rsr')"1 (à - a) RS N • FN)í),

onde z> representa a estimativa de máxima verossimilhança. Sob Ho, temos que

W = ( ò ) ' ( r s r / ) _ 1 ( ô ) « N • FNf j . (5.3)

Neste caso, a Região Crítica será dada por:

RC = {W E R : W > xC},

e para um valor fixado 0 < q < 1, determinamos o número xc de modo que

P(W > xc) = //.

No próximo capítulo, vamos desenvolver estes testes utilizando os dados provenientes do pro-

grama de EP conduzido pela REMESP na área de eletricidade e avaliar se o grupo de laboratórios

é consistente e se os laboratórios são competentes.

42

Capítulo 6

Aplicações

Neste capítulo, vamos analisar os ciados cio programa do EP conduzido pela REMESP apre-

sentados 110 Capítulo 2. Como os parâmeros do valor do referência (/ix o serão obtidos por

valor de consenso pela média entre os participantes, vamos detectar a presença de valores extremos,

aplicando o teste de Grubbs (1969), para evitar que estes valores extremos vicie nossas estimativas.

O erro normalizado testa as seguintes hipóteses:

Ho : Laboratório compatível

H1 : Laboratório não compatível

ou seja, ao fazer o teste individual, se o valor do erro normalizado cair na região de rejeição

(ENiabi > 1), podemos concluir que temos evidências para rejeitar Hq, com nível de confiança de

aproximadamente 5%.

Propomos ainda as seguintes hipóteses para avaliar a performance individual de cada laboratório

com respeito ao valor de referência,

' H0 : a , = 0

Hi : ca / 0

para i = 1,.. ., N. Se não rejeitamos Ho, temos evidências para dizer que o laboratório está consis-

tente com relação ao valor de referência.

Finalmente, avaliaremos a consistência do grupo do laboratórios, tostando as seguintes hipóteses,

H0 : = a 2 — ... — a:N = 0

H1 : pelo monos um diferente.

Se rejeitarmos H0, temos evidências para dizer que o grupo de laboratórios não é consistente.

6. Aplicações _43

6.1 Teste de Grubbs

Como vamos estimar os parâmetros do valor de referência, /ít e utilizando o proce-

dimento do valor do consenso, a presença de valores extremos pode viciar nossas estimativas. Para

detectar a presença do valores extremos, vamos aplicar o toste do Grubbs (1969).

Considere yi., • • • , ÍJN. as médias das medições dos laboratórios participantes. Para detectar a

presença de valores extremos, Grubbs (1969) propõe a seguinte estatística de teste

T = ijA:- ~ i = 1,... ,N , s

onde = ^ e s o desvio padrão amostrai das médias fj\„, jj2., ..., yjv.. Vamos testar as

seguintes hipóteses

H0 : A observação i não é um valor extremo

Hi : A observação i é uni valor extremo.

Se Ti > tt, temos evidência para rejeitar Hq, onde tt é um valor que depende da quantidade de

observações na amostra, e se encontra tabelado em Grubbs (1969), com nível de confiança de 5%

o 1%. Para os dados do programa da área de eletricidado, usamos o nível de confiança de 5% e

encontramos

Laboratórios Observações Média ,s T h Situação

1 1.00008 0,999934 0,0001469 1,01193 2,13 não é valor extremo

2 0,99991 0,999934 0,0001469 0,16612 2,13 não é valor extremo

3 0,99960 0,999934 0,0001469 2.27707 2,13 é valor extremo

4 0,99998 0,999934 0,0001469 0,31055 2,13 não é valor extremo

5 1,00000 0,999934 0,0001469 0,44674 2,13 não é valor extremo

tí 0,99990 0,999934 0,0001469 0/23421 2,13 não 6 valor extremo

7 1.00000 0,999934 0,0001469 0,46145 2,13 não é valor extremo

8 1,00000 0,999934 0,0001 169 0,44674 2,13 não é valor extremo

Tabela tí.l: Teste de Grubbs

Pela Tabela 6.1 verificamos que a tensão DC estimada pelo laboratório 3 foi considerado valor

extremo, com isso, será excluído da nossa análise.

6. Aplicações _44

6.2 Análise da compatibilidade dos laboratórios

O valor do consenso pela Média é um dos procedimentos mais comuns em programas de acre-

ditação com EP do rotina. A experiência do colégio Americano do Patologia concluiu que a média

de consenso dos laboratórios participantes é consistente com relação ao valor de referência, e é mais

confiávol do que o consenso de laboratórios do referência , ver Tholen (1993). Os parâmetros do

valor de referência são determinados conformo abaixo

= S: = ^ ^ e al = (6.1)

Portanto, //,,• é determinado pela média das médias encontradas pelos laboratórios, e será

determinado pela média do quadrado da incerteza combinada associada às medições dos laboratórios

(variância agrupada). Para os nossos dados encontramos os seguintes resultados:

/ix = 0,999982 o alx = 0,0000001.

O erro normalizado, como visto anteriormente, é dado por:

ENL.AU IVi. -

ULT+UÍ + Ulj i = 1 ,...,K

'labi t ^ref \/ u labi

onde Uiatí e Uref correspondem às incertezas expandidas do laboratório í e do valor do referência,

respectivamente. A incerteza expandida para o valor do referência foi estimada como descrito na

seção 2.2.4,

UREF = 2 • ax = 0,000632.

O vetor â é dado por: / 0,0001008 \

-0,0000722

-0,0000022

Q: = 0, 0000178

-0,0000822

0,0000200

\ 0,0000178 /

Os cálculos dos erros normalizados e as conclusões em relação a performance de cada laboratório

estão descritos na tabela 6.2 110 final deste capítulo.

6. Aplicações _45

Outra forma do tostarmos a performance individual dos laboratórios é usando a seguinte

estatística:

Wi = . « t i (0; 1; />),

onde ( r Z F ) H representa o elemento da i-ésima linha o i-ésima coluna da matriz de dispersão r s r ' .

Para os dados provenientes da REMESP, temos que a matriz de dispersão é dada por:

( 0, 0000001001 0,0000001000 0,0000001000 0,0000001000 0,0000001000 0,0000001000 0,0000001000 ^

0 , 0 0 0 0 0 0 1 0 0 0 0 , 0 0 0 0 0 0 1 0 0 2 0 , 0 0 0 0 0 0 1 0 0 0 0 , 0 0 0 0 0 0 1 0 0 0 0 , 0 0 0 0 0 0 1 0 0 0 0 , 0 0 0 0 0 0 1 0 0 0 0 , 0 0 0 0 0 0 1 0 0 0

0 , 0 0 0 0 0 0 1 0 0 0 0 , 0 0 0 0 0 0 1 0 0 0 0 , 0 0 0 0 0 0 1 5 4 7 0 , 0 0 0 0 0 0 1 0 0 0 0 , 0 0 0 0 0 0 1 0 0 0 0 , 0 0 0 0 0 0 1 0 0 0 0 , 0 0 0 0 0 0 1 0 0 0

( P E F ' ) = 0 , 0 0 0 0 0 0 1 0 0 0 0 , 0 0 0 0 0 0 1 0 0 0 0 , 0 0 0 0 0 0 1 0 0 0 0 , 0 0 0 0 0 0 1 0 0 3 0 , 0 0 0 0 0 0 1 0 0 0 0 , 0 0 0 0 0 0 1 0 0 0 0 , 0 0 0 0 0 0 1 0 0 0

0 , 0 0 0 0 0 0 1 0 0 0 0 , 0 0 0 0 0 0 1 0 0 0 0 , 0 0 0 0 0 0 1 0 0 0 0 , 0 0 0 0 0 0 1 0 0 0 0 , 0 0 0 0 0 0 0 9 9 5 0 , 0 0 0 0 0 0 1 0 0 0 0 , 0 0 0 0 0 0 1 0 0 0

0 , 0 0 0 0 0 0 1 0 0 0 0 , 0 0 0 0 0 0 1 0 0 0 0 , 0 0 0 0 0 0 1 0 0 0 0 , 0 0 0 0 0 0 1 0 0 0 0 . 0 0 0 0 0 0 1 0 0 0 0 , 0 0 0 0 0 0 0 9 9 0 0 , 0 0 0 0 0 0 1 0 0 0

\ 0 . 0 0 0 0 0 0 1 0 0 0 0 , 0 0 0 0 0 0 1 0 0 0 0 , 0 0 0 0 0 0 1 0 0 0 0 , 0 0 0 0 0 0 1 0 0 0 0 . 0 0 0 0 0 0 1 0 0 0 0 , 0 0 0 0 0 0 1 0 0 0 0 , 0 0 0 0 0 0 1 0 1 4 j

A estimativa de máxima verossimilhança v é a solução não explícita da equação

= 0 conforme apresentado no C a p í t u l o 4, subseção 4.2.2. Aplicando o algoritmo

de Newton-Raphson obtemos £> = 2,72478. Os cálculos das estatísticas Wi estão descritos

na tabela 6.2 no final deste capítulo.

Por último vamos testar a consistência do grupo de laboratórios usando a seguinte

estatística:

W = ô^íTEr')"1» « N • F, N.í/ •

Na próxima tabela, apresentaremos os resultados dos testes individuais e do conjunto de

laboratórios e os erros normalizados.

Teste d, Estatística Região

Crítica

Ulabi ENL.áhl

Todos x Ref. 9,809634 W >10,3725

Lab 1 x Ref. 0,0001008 0,318707 Wi < - 3 , 3723 ou Wi > 3, 3723 0,000020 0,159414

Lab 2 x Ref. -0,0000722 0,227980 Wi < - 3 , 3723 ou Wi > 3, 3723 0,000074 0,113926

Lab 4 x Ref. -0,0000022 0,005506 Wi < - 3 , 3723 ou Wi > 3, 3723 0,001480 0,001367

Lab 5 x Ref. 0,0000178 0,056313 Wi < - 3 , 3723 ou Wi > 3, 3723 0,000082 0,027878

Lab 6 x Ref. -0,0000822 0,260483 Wi < -3,3723 ou Wi > 3,3723 0,000016 0,130022

Lab 7 x Ref. 0,0000200 0,063546 Wi < - 3 , 3723 ou Wi > 3,3723 0,000058 0,031513

Lab 8 x Ref. 0,0000178 0,056006 Wi < -3,3723 ou Wi > 3,3723 0,000240 0,026330

Tabela 6.2: Teste para avaliar a competência dos 7 laboratórios

6. Aplicações _46

Na tabela 6.2, observando os erros normalizados e as estatísticas individuais dos labo-

ratórios, temos evidências para concluir que eles são competentes. Em relação ao grupo de

laboratórios, temos evidências para concluir que o grupo é consistente com relação ao valor

de referência.

Apresentamos na seqiiência o gráfico da função poder para os testes relativos aos labo-

ratórios 1 e 6. Observando a função densidade da distribuição t-student multivariada (3.1),

notamos que a função densidade da distribuição t-student t,\ , ; 1; u ê dada por:

Fornecemos alguns valores iniciais para o, (eixo das abeissas) e substituímos estes valores

na densidade. Aplicamos a função poder dada em (5.2) e encontramos os seguintes valores

para o Poder do Teste do Laboratório 1 (eixo das ordenadas).

o:,; (V,;

L^3723 fi-'')^ + J3~723 f(X)él:

-0,00250 -7,905694 0,988836

-0,00200 -6,324555 0,967974

-0,00150 -4,743416 0,866590

-0,00f00 -3,162278 0,429045

-0,00050 -1,581139 0,100070

0 0 0,049998

0,00050 1,581139 0,100070

0,00100 3,162278 0,429045

0,00150 4,743416 0,866590

0,00200 6,324555 0,967974

0,00250 7,905694 0,988836

Tabela 6.3: Cálculo da Função poder para o Lab 1

6. Aplicações _47

Poder do Teste para o Laboratóriol

-0,003 -0.002 -0.001 0,000 0,001 0,002 0,003 Possíveis valores para alpha_1

Figura 6.1: Gráfico da Função Poder para o Lab 1

De maneira análoga, calculamos o Poder do Teste do Laboratório 6.

Poder do Teste para o Laboratório 6

O) - f f i

o Q_

-0.001 0.000 0.001 0,002 0.003 Possíveis valores para alpha_6

Figura 6.2: Gráfico da Função Poder para o Lab 6

Observando os gráfico da função poder, concluímos que o teste é sensível para uma

pequena variação nos valores de a8-.

48

Capítulo 7

Considerações finais

7.1 Conclusão

0 objetivo do programa de EP é qualificar ou não os laboratórios para realizarem as

medições desejadas. Analisamos os dados obtidos pela REMESP (Rede de Metrologia de

São Paulo) na área de eletricidade, cujo mensurado 6 a tensão DC medida por um multímetro

digital. Neste sentido, testamos a consistência do grupo de laboratórios participantes e de

cada laboratório individualmente.

Como em medições a presença de valores extremos ê constante, modelamos os dados

utilizando a distribuição t-student, para acomodar tais valores extremos. Consideramos

ainda, um modelo com erro de medição, variável explicativa aleatória e diferente de outros

modelos, estamos interessados em analisar a tendência dos laboratórios participantes do

programa em relação a uni valor de referencia.

O valor de referência pode ser obtido de diversas maneiras, neste trabalho apresentamos

o valor de referência por consenso entre os participantes e neste sentido, foi preciso uma

análise de valores extremos. Usamos o método de Grubbs (1969) para identificar valores

extremos e somente os laboratórios em que as medições não foram consideradas como valor

extremo continuaram em nossa análise.

Neste modelo, estávamos interessados em estimar o grau de liberdade e o parâmetro

de tendência da medição a, do laboratório com respeito ao valor de referência, já que os

laboratórios utilizaram sistemas de medições similares para medir o mesmo item, com incer-

7. Considerações finais 49

tezas determinadas por um processo de calibração. Encontramos os estimadores da máxima

verossimilhança e de momentos para estes dois parâmetros

Em geral, os resultados dos EP são analisados via a estatíatica EN^m, descrito 11a ex-

pressão (1.1) 110 Capítulo 1. Desenvolvemos outras estatísticas e avaliamos a compatibili-

dade entre os laboratórios e a competência de cada laboratório individualmente. Verificamos

a eficácia do teste individual pelo gráfico da função poder. Os resultados estão resumidos

na Tabela 6.2.

7.2 Propostas futuras

• Generalizar o modelo para a distribuição elíptica;

• Avaliar a consistência do estimador de máxima verossimilhança para o parâmetro v\

• Determinar a distribuição assintótiea do estimador de máxima verossimilhança para o

parâmetro u.

50

Apêndice A

Estimador de Momentos para o

parâmetro v

Considero o modelo como anteriormente. Sabemos que E(Y7J) = at + //,T o vamos definir — /J y • ~ ^ y

Y? = ———- e yf = ' . Utilizando o método de momentos, temos que:

Sabemos que:

EiXrò = Vt

Então,

- i-j

v - 2 + + («i +

iV

E ?=i

// - 2

z/

+ <r-) + (<», + = y1

v — 2

— 2 ?:=i

JV

+ £<»< i=\

N

E< ?:=i

E: • t = l

vi.

Logo,

8lh!So;<:c.J '-J,

A. Estimador de Momentos para o parâmetro u 51

N

u-2

7/

V

i=l N

N N

E»?.-E' a, i=í

.1=1 ' N

= ~ 2)

i=i JV /V

Portanto,

N

?=i ?:=i N N N

U =

) = 7'

- 2

i=l 1=1 - 2

/ O 2 '

E«*-E<<* í=i ?:=i

- 2 -

- 2

f - 2 ) - E t i í 2 + Ef= i [Yi. - //-x -f / O 2

0. E ^ + ^ - E ^ + E L ^ . ) 2

f / O 2

0.

ó o estimador de niomontos para v.

52

Referências Bibliográficas

[1] ISO/IEC Guide 43-1 (1997) - Proficiency testing by interlaboratory comparisons - Part

I: Development and operation of proficiency testing schemes.

[2]

[3]

[4

[6

[8

[9

[10

ISO GUM (1998) - Guia para expressão da incerteza em medição, 2a edição brasileira.

Fang, K.-T. k Kotz, S. k Ng, K. W., Symetric Multivariate and Related Distributions,

Chapman and Hall, 1990.

Graybill, F. A., Theory and Application on tbe Linear Model, Duxbury Press, 1976.

Graybill, F. A., Matrices With Applications in Statistics, 2nd edition, 1983.

Grubbs, F. E. (1969) - Procedures for Detecting Outlying Observations in Samples,

Technometrics, 11(1) , 1-21.

Jaecli, J. L., Statistical analysis of nieasurement erros, Exxon Monograph, John Wiley

k Sons, 1985.

Leão, D. P. J. k Aoki, R. k Silva, G. F., Statistical Analysis of Proficiency Testing

Resulta, Notas de estatística do ICMC - USP, 2002.

Rao, B. L. S. P., Asymptotic Theory of Statistical Inference, , John Wiley k sons, 1987.

Taylor, ,J. M. G. k Little, R. J. A. k Lange, K. L. (1989) - Robust Statistical Modeling

Using the t Distribution, Journal of the American Statistical Association, 84(408) ,

881-896.

[11] Tliolen, D. W. (1993) - Reference values and Participant means as Targets in Proficiency

Testing, Archives of Pathology and Laboratory Medicine, 117, 885-889.

Referências Bibliográficas 53

[12] Valle, R. B. A., Distribuições Elípticas: Propriedades, Inferência e Aplicações a Modelos

de Regressão, Tese. IME-USP, 1994.